安全性・評価 A
307 件中 151〜180 件目を表示
-
Kolmogorov Regression for Robust Diffusion Policiesコルモゴロフ回帰で頑健な拡散方策を学習有限次元の拡散方策は離散化由来の時間ドリフトで長期性能が劣化する。本研究は後退コルモゴロフ方程式により拡散方策をキャメロン・マルティン空間へ引き上げ、確率的要素を扱い頑健化する手法を提案する。
-
A Diffusion Approximation for Temporal-Difference Learning with Linear Features under Markovian Noiseマルコフ雑音下のTD学習に拡散近似を導入線形関数近似による時間差分(TD)学習の古典的連続時間記述は常微分方程式で、漸近平均は捉えるが確率性を無視する。本論文はマルコフ雑音下のTD学習に対し、その揺らぎを捉える拡散近似を与える。
-
A Convex Quasilinearization Method for Solving Nonlinear PDEs with Physics-Informed Neural Networks凸準線形化でPINNによる非線形PDE求解を高速化非線形偏微分方程式の前進解法として、ベルマン・カラバ準線形化により非線形問題を線形部分問題列へ縮約し、各々を選点法で離散化してPhysics-Informed Neural Networksで解く凸的手法を提示する。
-
Evaluating Open-Source LLMs for Multi-Label ATT&CK Technique Classification on CTI ReportsCTIのATT&CK多ラベル分類にオープンLLMを評価サイバー脅威インテリジェンス(CTI)報告をMITRE ATT&CK技術で多ラベル分類する課題に対し、オープンソースLLMの性能を評価する研究。タイトルベースの中立要約で、詳細・数値は原論文ベース・第三者検証は未確認と明記。
-
The Measurement Gap in the Automation of EU Law: Benchmarking Doctrinal Legal Reasoning under the EU AI ActEU AI法下の法的推論を測る測定ギャップを指摘LLMは中位品質の法文を生成できるが、法務の解釈的中核である教義的法的推論を評価できるベンチマークは無いと指摘。本研究はEU AI法の下で教義的法的推論をベンチマークし、自動化における測定ギャップを論じる。
-
WEQA: Wearable hEalth Question Answering with Query-Adaptive Agentic Reasoning装着型健康データのQAを行うエージェント推論手法WEQAを提案連続的で高次元な装着型センサーの健康データに対する質問応答が難しい点に着目し、クエリ適応的なエージェント推論を行う枠組みWEQAを提案する論文。多様なセンサー様式や利用者意図を固定の推論手順では扱えないと論じる。
-
Your AI Travel Agent Would Book You a Bullfight: An Agentic Benchmark for Implicit Animal Welfare in Frontier AI Models動物福祉の暗黙的配慮を測るエージェント型ベンチマークAIエージェントは助言者から旅行予約等を代行する実行者へ移行している。既存の動物福祉ベンチマークはテキスト応答のみを評価するため、本研究はエージェント的展開で暗黙の動物福祉配慮が行動に転移するかを測る基準を提案する。
-
Towards Understanding and Measuring COGNITIVE ATROPHY in LLM BehaviourLLM対話の認知萎縮を測る過程指標を定式化した研究メンタルヘルス支援に使われるLLMで、表層的な安全スコアが時間的な相互作用の質を捉えない評価ギャップを指摘する論文。利用者が自ら省察・対処・意思決定を続けられるかという過程レベルの指標を「認知萎縮(COGNITIVE ATROPHY)」として定式化すると述べる。
-
Unintended Effects of Geographic Conditioning in Large Language Models地理条件付けがLLMに生む意図せぬ地域バイアス対話型AIは応答の現地化にユーザのメタデータを使うが、この隠れた文脈が生む地域バイアスは十分理解されていない。本研究は地理的条件付けがLLM応答に与える意図せぬ影響を分析する。
-
Embedded Machine Learning for Microcontroller-Class Edge Devices: Data, Feature, Evaluation, and Deployment Pipelinesマイコン級エッジ向け組込み機械学習のパイプライン総説組込み機械学習は推論をクラウドから資源制約デバイスへ移す。本稿はマイコン級プラットフォーム向けに、データ取得・特徴量・評価・展開までの一連のワークフローを体系的に整理した実務志向の総説を示す。
-
Structural Role Injection in Handlebars-Templated LLM Prompts: Triple-Brace Interpolation, Delimiter Family, and the Limits of HTML Auto-EscapingHandlebarsテンプレのLLMプロンプトに潜む役割注入LLMアプリはテンプレートからプロンプトを組み立て、Handlebars(Semantic Kernel既定)を広く使う。本研究は二重括弧のHTMLエスケープに対し三重括弧補間が値をそのまま挿入する点に着目し、構造的な役割注入の危険と自動エスケープの限界を分析する。
-
HistoRAG: Embedding Historical Methodology in Retrieval-Augmented Generation Through Critical Technical PracticeHistoRAG、歴史方法論をRAGに組み込む批判的実践RAGは言語モデル出力を外部根拠に接地するが、評価や既定設定は事実QA志向に偏る。HistoRAGは解釈的な歴史研究向けに、批判的技術実践を通じて歴史方法論をRAGへ組み込む枠組みを示す。
-
IsabeLLM: Automated Theorem Proving Applied to Formally Verifying Consensus自動定理証明でコンセンサスを形式検証するIsabeLLMを提案AIによる定理証明がコンピュータシステムの形式検証を自動化し得る点に着目し、ブロックチェーンのコンセンサスを形式検証するIsabeLLMを提案する論文。専門知識と労力を要する検証作業をAIで大幅に自動化し、より利用しやすくすると述べる。
-
How to Optimize Transformer-Based Models for Low-Precision TrainingNVIDIA、Transformer モデルの低精度学習を最適化する解説記事を公開NVIDIA の技術記事が、Transformer ベースのモデルを低精度(low-precision)で学習する際の最適化手法を解説。本要約は export の raw_excerpt が cookie/query データで blocked のため、タイトルと NVIDIA という発信元から中立に記述しており、具体的な手法・数値は未確認。
-
S4oP: Operator-level Pruning of Structured State Space Models for Resource-Constrained DevicesS4oP、状態空間モデルを演算子単位で枝刈り軽量化S4などの構造化状態空間モデル(SSM)は長距離依存に強いが資源制約環境への展開は難しい。S4oPは演算子レベルの枝刈りにより、時間・資源が限られたデバイスでの効率的な展開を狙う。
-
EAGG: Embodiment-Aligned Grasp Generation via Geometry-Aware Graph Conditioning身体性に整合した把持生成手法EAGGを提案平行グリッパから多指ハンドまで多様な身体性に汎化する把持生成を目指し、各エンドエフェクタを位相考慮グラフで表現する身体性整合型生成器EAGGを提案する論文。固定身体性向けや静的記述子では転移が弱まる課題に対処すると述べる。
-
Securing the future of AI agentsGoogle DeepMind、AI エージェントを守る AI Control Roadmap を提示Google DeepMind は、AI エージェントの安全性を高めるための「AI Control Roadmap」を示した。従来型のセキュリティ対策とリアルタイム監視を組み合わせ、内部システムをエージェントの誤用や逸脱から守る方針。エージェント時代に向けた多層防御の枠組みを提案する。
-
Edge Flow: A Tractable and Predictive Continuous-Time Model for Gradient Descent at the Edge of StabilityEdge Flow、安定境界の勾配降下を連続時間で予測モデル化深層学習の勾配降下は損失ヘッセ行列の最大固有値が安定閾値付近に留まる安定境界(EoS)で動くことがある。Edge Flowはこの領域を扱える、扱いやすく予測的な連続時間モデルを提案する。
-
Agentic AI-based Framework for Mitigating Premature Diagnostic Handoff and Silent Hallucination in Healthcare Applications医療AIの早期診断委譲と静かな幻覚を抑える多エージェント枠組み医療推論に用いるエージェント型AIが、早期の診断委譲と検知されにくい臨床幻覚という二つの失敗様式に陥りやすい点に着目する論文。LLM審判型のルーティングを決定論的な統制制約に置き換え、二つの安全機構を備えた多エージェント枠組みを提案すると述べる。
-
NoiseTilt: Noise-Tilted Reverse Kernels for Diffusion Reward AlignmentNoiseTilt、雑音項に報酬勾配を注入する拡散整合NoiseTilt(NTRK)は報酬誘導の拡散サンプラーで、逆カーネルの雑音項を通じて報酬勾配を注入し、スコアカーネルを変えず1ステップ1サンプルで済む。事前学習済み拡散モデルの報酬整合を効率化する。
-
PseudoBench: Measuring How Agentic Auto-Research Fuels PseudosciencePseudoBench、自律研究エージェントが擬似科学を助長する度合いを測定LLMベースのエージェントが自律的な科学研究に入る中、擬似科学への耐性が重要になる。PseudoBenchは、もっともらしいが誤った研究を生み学術文献を汚染し得る挙動を測る敵対的ベンチマークを提案する。
-
Compositional Skill Routing for LLM Agents: Decompose, Retrieve, and ComposeLLMエージェント向け合成的スキルルーティングLLMエージェントは再利用可能なツール仕様(スキル)に依存するが、現実の課題は複数スキルの合成を要する。本研究を合成的スキルルーティング問題として定式化し、複雑な要求を原子的サブタスクへ分解・検索・合成する。
-
Uncertainty Quantification for Flow-Based Vision-Language-Action ModelsフローベースVLAモデルの不確実性定量化視覚言語行動(VLA)モデルは視覚言語基盤に、フローマッチングで訓練した表現力ある行動ヘッドを組み合わせる。強い実績を持つ一方、本研究はフローベースVLAに対する不確実性定量化の手法を検討する。
-
NVIDIA Blackwell Tops MLPerf Training 6.0 with Industry-Leading Scale and PerformanceNVIDIA、Blackwell が MLPerf Training 6.0 で首位と発表NVIDIA が、GPU アーキテクチャ Blackwell が MLPerf Training 6.0 ベンチマークで業界最高水準の規模と性能を達成し首位になったと発表した。export の raw_excerpt は cookie/query データで blocked のため、タイトルと発表ベースで中立に要約。数値は発表側の主張で第三者検証は未確認。
-
ProvenanceGuard: Source-Aware Factuality Verification for MCP-Based LLM AgentsProvenanceGuard、MCPエージェント向け出所考慮の事実検証ツール利用のLLMエージェントはMCPで検索・API・DB・臨床記録など多様な根拠から回答する。ProvenanceGuardは、根拠の出所に敏感な失敗モードに対処する、出所を考慮した事実性検証を提案する。
-
LoopCoder-v2: Only Loop Once for Efficient Test-Time Computation ScalingLoopCoder-v2、一度のループで効率的テスト時計算スケールループ型Transformerは共有ブロック反復で潜在計算を拡張するが、逐次ループは遅延とKVキャッシュを増やす。並列ループ手法を踏まえ、LoopCoder-v2はループ回数を実用的設計変数として効率的なテスト時計算スケーリングを狙う。
-
LegalHalluLens: Typed Hallucination Auditing and Calibrated Multi-Agent Debate for Trustworthy Legal AILegalHalluLens、法務AIの型付き幻覚を監査し多者討論で較正法務に使うAIは平均で約52%幻覚するとされるが、平均は誤りの偏りや方向を隠す。LegalHalluLensは型付きの幻覚監査と較正された多エージェント討論を組み合わせ、信頼できる法務AIへ向けた実用的シグナルを与える枠組みを提案する。
-
Fast Nonparametric Conditional Independence Testing via Two-Stage Regression二段階回帰による高速なノンパラ条件付き独立性検定条件付き独立性検定は統計・因果推論の基本課題である。本研究は二段階回帰に基づく高速なノンパラメトリック条件付き独立性検定を提案し、計算効率と検出力の改善を狙う。
-
LLM Consumer Behavior Theory: Foundations of a Novel Research Fieldエージェント市場の消費行動を扱う新研究領域LLM消費行動論を提唱LLMが利用者に代わり消費判断を行う自律エージェントとして普及する流れを受け、人間を主たる意思決定者としてきた消費者理論に問いを投げかける論文。古典・行動経済学とNLPの知見を踏まえ、エージェント市場の消費行動を分析する新領域を提唱すると述べる。
-
VoidPadding: Let [VOID] Handle Padding in Masked Diffusion Language Models so that [EOS] Can Focus on Semantic TerminationVoidPadding、マスク拡散LMで[VOID]がパディングを担当マスク拡散言語モデルでパディングと意味的終端の役割が混ざる問題に対し、[VOID]トークンにパディングを担わせ[EOS]が意味的終端に集中できるようにする手法VoidPaddingを提案する。