安全性・評価 A
326 件中 1〜30 件目を表示
-
米大企業の7割が導入する「Databricks」とは何者か? 評価額20兆円の「AI向けデータ基盤」Databricks、評価額20兆円のAI向けデータ基盤、米大企業の7割が導入Apache Sparkの開発者らが2013年に創業したDatabricksは、評価額約20兆円、Fortune 500の約7割が利用するデータ・AI基盤企業へと成長した。本記事は同社の軌跡と最新動向を解説する。
-
How Transparent is DiffusionGemma?DiffusionGemmaの推論透明性を2軸に分解して検証する研究連続潜在空間で計算の多くを担うDiffusionGemmaの推論が不透明になるかを検証。透明性を、中間状態を理解できるかという変数透明性と、それを用いて推論過程を再構成できるかというアルゴリズム透明性に分解して分析する。
-
Optimal Deterministic Multicalibration and Omnipredictionランダム性不要、決定的予測器で最適なマルチキャリブレーションを実現本研究は、決定的な予測器を出力するミニマックス最適なマルチキャリブレーション手法を提案する。最適なサンプル複雑度の達成にランダム化が必要かという未解決問題を解決し、結果を結果識別不能性(OI)やオムニ予測を満たす決定的予測器へと一般化する。
-
Multi-Task Bayesian In-Context Learningインコンテキスト学習でマルチタスクのベイズ推論を行う手法を提案本論文は、インコンテキスト学習を用いてタスク横断的にベイズ予測推論を行うマルチタスク・ベイズ・インコンテキスト学習を提案する。厳密推論の計算困難性や、近似手法のコスト・制約という課題に取り組み、不確実性の定量化とデータ効率の両立を目指す。
-
StylisticBias: A Few Human Visual Cues Drive Most Social Biases in MLLMs少数の視覚的手がかりがMLLMの社会的バイアスの大半を生むと解明本研究StylisticBiasは、マルチモーダル大規模言語モデル(MLLM)が人物をどう判断するかを左右する視覚的手がかりを分析する。ごく少数の人間的な視覚的手がかりが、MLLMが示す社会的バイアスの大半を駆動していることを示し、影響の大きい応用での懸念を指摘する。
-
DeepSWIP: Quotient-WMC Counterfactuals for Neural Probabilistic Logic Programsニューラル確率論理プログラムの反事実推論手法DeepSWIPDeepProbLogのようなニューロシンボリック系はニューラル知覚と確率論理を組み合わせる。DeepSWIPはQuotient-WMCに基づく反事実推論を導入し、標準的推論の限界に対処する。
-
SARLO-80: Worldwide Slant SAR Language Optic Dataset 80cm80cm解像度の世界規模スラントSAR・光学データセットSARLO-80マルチモーダル基盤モデルは大規模な光学ベンチマークで急速に進歩した一方、SAR向けの資源は不足している。SARLO-80は80cm解像度の世界規模スラントSAR・光学データセットを提供する。
-
Multi-LCB: Extending LiveCodeBench to Multiple Programming LanguagesLiveCodeBを多言語に拡張したコード評価ベンチMulti-LCBLiveCodeBenchはLLMのコード能力評価で広く採用されている。Multi-LCBはこれを複数のプログラミング言語へ拡張し、多言語でのコード生成能力を評価する。
-
What Do Safety-Aligned LLMs Learn From Mixed Compliance Demonstrations?安全整合LLMが混在コンプライアンス実例から何を学ぶか文脈内の実例がLLMをジェイルブレイクし得ることは知られているが、順守と違反が混在する実例から安全整合モデルが何を学ぶかは不明だった。本研究はその挙動を分析する。
-
FreeStyle: Free Control of Style-Content Dual-Reference Generation from Community LoRA MiningコミュニティLoRA採掘でスタイルと内容を二重制御するFreeStyleスタイルと内容の二重参照生成は、構造を保ちつつ別の様式で画像を合成する課題。FreeStyleはコミュニティのLoRA採掘を活用し、スタイルと内容を自由に制御する。
-
Entropy Estimation in Multi-Qutrit Systems via Variational and Classical Neural Networks変分量子アルゴリズムとCNNでマルチqutritのエントロピー推定本論文は、マルチqutrit量子系におけるフォン・ノイマンエントロピーの推定を、変分量子アルゴリズム(VQA)と古典的な畳み込みニューラルネット(CNN)という二つの手法で体系的に比較する。理想的なノイズなしシミュレータ上で、最大3 qutritの系を対象に評価する。
-
Calibration Without Comprehension: Diagnosing the Limits of Fine-Tuning LLMs for Vulnerability Detection in Systems Software脆弱性検出のLLM微調整は理解か暗記かを診断する研究脆弱性ベンチで高得点のLLMが本当にセキュリティを推論しているのか、それとも単にパターン照合かを検証。微調整による脆弱性検出の限界を診断する。
-
Contagion Networks: Evaluator Bias Propagation in Multi-Agent LLM SystemsマルチエージェントLLMで評価者バイアスが伝播する現象を分析LLMがマルチエージェント系で評価者として働く際、その系統的な評価バイアスがどのように伝播するかを研究。Contagion Networksとして拡散の仕組みを分析する。
-
Beyond Global Replanning: Hierarchical Recovery for Cross-Device Agent Systems複数端末にまたがるエージェントの階層的な障害回復手法を提案本論文は、複数のアプリや端末にまたがる実世界のコンピュータ操作タスク向けに、粗い全体再計画にとどまらない階層的な障害回復機構を提案する。動的な実行時障害の下で、異種環境を協調させながらきめ細かく復旧することを目指す。
-
Your Mouse and Eyes Secretly Leak Your Preference: LLM Alignment using Implicit Feedback from Usersマウスや視線の暗黙的フィードバックでLLMを整合する手法を提案本論文は、明示的な人間のフィードバックの代わりに、マウス操作や視線などユーザーの暗黙的なシグナルを用いて大規模言語モデルを整合(アライメント)する手法を提案する。ユーザーが明示的な評価をほとんど与えず、高品質な選好データが得にくいという課題に対処する。
-
Marginal Advantage Accumulation for Memory-Driven Agent Self-Evolution記憶駆動エージェントの自己進化へ操作単位の優位性蓄積を提案本論文は、記憶駆動エージェントの自己進化に向け、バッチを横断して操作単位で証拠を蓄積する「限界優位性蓄積」を提案する。トレース蒸留で同じ記憶操作がバッチ間で矛盾するフィードバックを受ける問題に対処し、安定して有効な操作と偶然の当たりを区別することを狙う。
-
Analyzing Defensive Misdirection Against Model-Guided Automated Attacks on Agentic AI SystemsエージェントAIへのモデル誘導自動攻撃に対する防御的かく乱の分析エージェントAIは指示解釈にLLM部品を多用するため攻撃対象となる。本研究はモデル誘導の自動攻撃に対する防御的かく乱(misdirection)の効果を分析する。
-
Fisher-Geometric Sharpness and the Implicit Bias of SGD toward Flat Minimaフィッシャー幾何に基づく平坦性とSGDの平坦解への暗黙バイアス本論文は、SGDが平坦な極小へ向かう暗黙のバイアスを調べるため、フィッシャー幾何に基づくシャープネス(鋭さ)の指標を導入する。損失ヘッシアンのトレースや最大固有値といった従来のユークリッド的な平坦性指標が、ネットワーク関数を保つ再パラメータ化の下で不変でない問題に対処する。
-
Agentic Symbolic Search: Characterizing PDEs Beyond Hand-crafted Expressions, Meshes, and Neural Networks偏微分方程式の解を数式構造で捉えるエージェント的記号探索を提案本論文は、偏微分方程式(PDE)の解を、計算値の表ではなく数学的構造として特徴づける「エージェント的記号探索」を提案する。数値シミュレーションもニューラルネットも直接は生み出さず、従来は人手の解析で得ていた構造的理解の自動化を狙う。
-
Data Bias Mitigation under Coverage Constraints & The Price of Fairness被覆制約の下でのデータバイアス緩和と公平性のコストを分析本論文は、被覆(カバレッジ)制約の下でのデータバイアス緩和と、そこで生じる「公平性の代償」を検討する。人種や性別など複数の機微属性が交差する個人に対する差別的な結果に着目し、交差的バイアスを定量化する原理的な指標の不在という課題に取り組む。
-
Multi-View Decompilation for LLM-Based Malware Classification逆コンパイルの多視点を用いたLLMによるマルウェア分類マルウェア解析者はソース不在時に逆コンパイルされた疑似Cを調べる。本研究は複数視点の逆コンパイル情報を用いてLLMでマルウェアを分類する。
-
LLM agent safety, multi-turn red-teaming, jailbreak benchmarks, adversarial robustness, safety-critical systems安全重要系を監督するLLMエージェントの多ターン・レッドチーミング評価LLMエージェントが安全重要系の監督部品として提案されるなか、多ターンのレッドチーミングやジェイルブレイク・ベンチで頑健性を評価する研究。
-
DataMagic: Transforming Tabular Data into Data Insight Video表データをデータ洞察動画に変換するDataMagicデータ動画は動的チャート・音声ナレーション・同期アニメーションを統合して洞察を伝える。DataMagicは表形式データをこうしたデータ洞察動画へ自動変換する。
-
Towards Modality-imbalanced Federated Graph Learning: A Data Synthesis-based Approach連合グラフ学習のモダリティ不均衡をデータ合成で緩和する手法本論文は、マルチモーダル連合グラフ学習(MM-FGL)におけるモダリティ不均衡を、データ合成に基づく手法で緩和する。クライアントが特定モダリティを丸ごと欠くクライアントレベルと、個々のノードでモダリティが欠けるノードレベルという、二つの粒度の不均衡に対処する。
-
CRAX: Fast Safe Reinforcement Learning Benchmarking安全な強化学習を高速にベンチマークするCRAX実世界領域でRLエージェントを展開する上で安全は中核的関心事。CRAXは安全な強化学習を高速にベンチマークするための枠組みを提供する。
-
AutoPass: Evidence-Guided LLM Agents for Compiler Performance Tuningコンパイラ性能調整を担う証拠誘導LLMエージェントAutoPassLLMはコードコンパイル作業に有望だが、実行時性能調整への適用は難しい。AutoPassは証拠誘導のLLMエージェントによりコンパイラ性能調整を行う。
-
CATCH-ME if you RAG: a dataset of Contextually Annotated multi-Turn Counterspeech against Hate and Misinformation Exchangesヘイトと誤情報への対抗発話データセットCATCH-MEを提案本論文は、しばしば重なり合うヘイトスピーチと誤情報に対する、文脈注釈付きの複数ターン対抗発話(counterspeech)データセット「CATCH-ME」を提案する。両者を切り離して扱いがちなNLP研究の傾向や、ゼロショットLLMが反復的で曖昧な応答を生む問題に対処する。
-
Judging to Improve: A De-biased VLM-as-3D-Judge Protocol for Single-Image 3D Generation脱バイアスのVLM3D判定器で単一画像からの3D生成を専門化本論文は、単一画像からの3D生成に向けた、脱バイアスの「VLMを3D判定器として使う」プロトコルを提案する。幾何やCLIPの代理指標では捉えきれない単一画像→3Dメッシュ品質をランク付けする判定器を活かし、その選好で強力なオープン生成器TRELLISを、人手なしに家具など特定資産クラスへ安価に専門化できるかを問う。
-
Automating SKILL.md Generation for Computer-Using Agents via Interaction Trajectory Mining相互作用軌跡採掘でコンピュータ操作エージェントのSKILL.md生成を自動化明示的なスキルライブラリはコンピュータ操作エージェントの検査を容易にする。本研究は相互作用軌跡の採掘によりSKILL.mdの生成を自動化する。
-
Train, Retrieve, or Both? A Four-Arm Head-to-Head for Correct Statutory Citation on the Ontario Residential Tenancies Act条文引用タスクで微調整・検索・併用を比較する4アーム評価本論文は、オンタリオ州住宅賃貸借法(RTA)とその主要規則を対象に、正しい条文引用を返すタスクで微調整・検索(retrieval)・両者の併用を四つの構成で直接比較する。借主・貸主・窓口担当が、問いを実際に規定する条文へ正しく導かれる必要性に応える。