安全性・評価 (6 / 11 ページ)｜AI/Tech動向まとめ

arXiv cs.LG (Machine Learning) · 2026-06-16 EN 新モデル・リリース抜粋

Kolmogorov Regression for Robust Diffusion Policies

コルモゴロフ回帰で頑健な拡散方策を学習

推論 (Inference) ニューラルネットワーク強化学習

有限次元の拡散方策は離散化由来の時間ドリフトで長期性能が劣化する。本研究は後退コルモゴロフ方程式により拡散方策をキャメロン・マルティン空間へ引き上げ、確率的要素を扱い頑健化する手法を提案する。

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.LG (Machine Learning) · 2026-06-16 EN 新モデル・リリース抜粋

A Diffusion Approximation for Temporal-Difference Learning with Linear Features under Markovian Noise

マルコフ雑音下のTD学習に拡散近似を導入

線形関数近似による時間差分(TD)学習の古典的連続時間記述は常微分方程式で、漸近平均は捉えるが確率性を無視する。本論文はマルコフ雑音下のTD学習に対し、その揺らぎを捉える拡散近似を与える。

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.LG (Machine Learning) · 2026-06-16 EN 安全性・評価抜粋

A Convex Quasilinearization Method for Solving Nonlinear PDEs with Physics-Informed Neural Networks

凸準線形化でPINNによる非線形PDE求解を高速化

ニューラルネットワーク強化学習

非線形偏微分方程式の前進解法として、ベルマン・カラバ準線形化により非線形問題を線形部分問題列へ縮約し、各々を選点法で離散化してPhysics-Informed Neural Networksで解く凸的手法を提示する。

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.LG (Machine Learning) · 2026-06-16 EN 安全性・評価抜粋

Evaluating Open-Source LLMs for Multi-Label ATT&CK Technique Classification on CTI Reports

CTIのATT&CK多ラベル分類にオープンLLMを評価

ニューラルネットワーク検索拡張生成 (RAG) 強化学習

サイバー脅威インテリジェンス(CTI)報告をMITRE ATT&CK技術で多ラベル分類する課題に対し、オープンソースLLMの性能を評価する研究。タイトルベースの中立要約で、詳細・数値は原論文ベース・第三者検証は未確認と明記。

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.CL (Computation and Language) · 2026-06-16 EN 安全性・評価抜粋

The Measurement Gap in the Automation of EU Law: Benchmarking Doctrinal Legal Reasoning under the EU AI Act

EU AI法下の法的推論を測る測定ギャップを指摘

ニューラルネットワーク

LLMは中位品質の法文を生成できるが、法務の解釈的中核である教義的法的推論を評価できるベンチマークは無いと指摘。本研究はEU AI法の下で教義的法的推論をベンチマークし、自動化における測定ギャップを論じる。

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-06-16 EN 学習・ファインチューニング抜粋

WEQA: Wearable hEalth Question Answering with Query-Adaptive Agentic Reasoning

装着型健康データのQAを行うエージェント推論手法WEQAを提案

深層学習ニューラルネットワークソフトウェア工学

連続的で高次元な装着型センサーの健康データに対する質問応答が難しい点に着目し、クエリ適応的なエージェント推論を行う枠組みWEQAを提案する論文。多様なセンサー様式や利用者意図を固定の推論手順では扱えないと論じる。

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.CL (Computation and Language) · 2026-06-16 EN 新モデル・リリース抜粋

Your AI Travel Agent Would Book You a Bullfight: An Agentic Benchmark for Implicit Animal Welfare in Frontier AI Models

動物福祉の暗黙的配慮を測るエージェント型ベンチマーク

AI エージェント Claude DeepSeek Gemini GPT

AIエージェントは助言者から旅行予約等を代行する実行者へ移行している。既存の動物福祉ベンチマークはテキスト応答のみを評価するため、本研究はエージェント的展開で暗黙の動物福祉配慮が行動に転移するかを測る基準を提案する。

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-06-16 EN 安全性・評価抜粋

Towards Understanding and Measuring COGNITIVE ATROPHY in LLM Behaviour

LLM対話の認知萎縮を測る過程指標を定式化した研究

ニューラルネットワーク

メンタルヘルス支援に使われるLLMで、表層的な安全スコアが時間的な相互作用の質を捉えない評価ギャップを指摘する論文。利用者が自ら省察・対処・意思決定を続けられるかという過程レベルの指標を「認知萎縮(COGNITIVE ATROPHY)」として定式化すると述べる。

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.CL (Computation and Language) · 2026-06-16 EN 新モデル・リリース抜粋

Unintended Effects of Geographic Conditioning in Large Language Models

地理条件付けがLLMに生む意図せぬ地域バイアス

Claude Llama Meta ニューラルネットワーク強化学習

対話型AIは応答の現地化にユーザのメタデータを使うが、この隠れた文脈が生む地域バイアスは十分理解されていない。本研究は地理的条件付けがLLM応答に与える意図せぬ影響を分析する。

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.LG (Machine Learning) · 2026-06-16 EN 推論・効率化抜粋

Embedded Machine Learning for Microcontroller-Class Edge Devices: Data, Feature, Evaluation, and Deployment Pipelines

マイコン級エッジ向け組込み機械学習のパイプライン総説

推論 (Inference) 機械学習量子化

組込み機械学習は推論をクラウドから資源制約デバイスへ移す。本稿はマイコン級プラットフォーム向けに、データ取得・特徴量・評価・展開までの一連のワークフローを体系的に整理した実務志向の総説を示す。

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.CL (Computation and Language) · 2026-06-16 EN 開発者ツール抜粋

Structural Role Injection in Handlebars-Templated LLM Prompts: Triple-Brace Interpolation, Delimiter Family, and the Limits of HTML Auto-Escaping

HandlebarsテンプレのLLMプロンプトに潜む役割注入

Claude GPT Llama 機械学習 Microsoft

LLMアプリはテンプレートからプロンプトを組み立て、Handlebars(Semantic Kernel既定)を広く使う。本研究は二重括弧のHTMLエスケープに対し三重括弧補間が値をそのまま挿入する点に着目し、構造的な役割注入の危険と自動エスケープの限界を分析する。

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.CL (Computation and Language) · 2026-06-16 EN 新モデル・リリース抜粋

HistoRAG: Embedding Historical Methodology in Retrieval-Augmented Generation Through Critical Technical Practice

HistoRAG、歴史方法論をRAGに組み込む批判的実践

埋め込み (Embeddings) 検索拡張生成 (RAG) 強化学習ソフトウェア工学

RAGは言語モデル出力を外部根拠に接地するが、評価や既定設定は事実QA志向に偏る。HistoRAGは解釈的な歴史研究向けに、批判的技術実践を通じて歴史方法論をRAGへ組み込む枠組みを示す。

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-06-16 EN 安全性・評価抜粋

IsabeLLM: Automated Theorem Proving Applied to Formally Verifying Consensus

自動定理証明でコンセンサスを形式検証するIsabeLLMを提案

検索拡張生成 (RAG)

AIによる定理証明がコンピュータシステムの形式検証を自動化し得る点に着目し、ブロックチェーンのコンセンサスを形式検証するIsabeLLMを提案する論文。専門知識と労力を要する検証作業をAIで大幅に自動化し、より利用しやすくすると述べる。

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

NVIDIA Developer Blog · 2026-06-16 EN インフラ・ハードウェア抜粋

How to Optimize Transformer-Based Models for Low-Precision Training

NVIDIA、Transformer モデルの低精度学習を最適化する解説記事を公開

生成 AI NVIDIA Transformer

NVIDIA の技術記事が、Transformer ベースのモデルを低精度(low-precision)で学習する際の最適化手法を解説。本要約は export の raw_excerpt が cookie/query データで blocked のため、タイトルと NVIDIA という発信元から中立に記述しており、具体的な手法・数値は未確認。

元記事を読む (NVIDIA Developer Blog) ↗

arXiv cs.LG (Machine Learning) · 2026-06-16 EN 推論・効率化抜粋

S4oP: Operator-level Pruning of Structured State Space Models for Resource-Constrained Devices

S4oP、状態空間モデルを演算子単位で枝刈り軽量化

ファインチューニング推論 (Inference) 強化学習

S4などの構造化状態空間モデル(SSM)は長距離依存に強いが資源制約環境への展開は難しい。S4oPは演算子レベルの枝刈りにより、時間・資源が限られたデバイスでの効率的な展開を狙う。

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-06-16 EN 学習・ファインチューニング抜粋

EAGG: Embodiment-Aligned Grasp Generation via Geometry-Aware Graph Conditioning

身体性に整合した把持生成手法EAGGを提案

ファインチューニング検索拡張生成 (RAG)

平行グリッパから多指ハンドまで多様な身体性に汎化する把持生成を目指し、各エンドエフェクタを位相考慮グラフで表現する身体性整合型生成器EAGGを提案する論文。固定身体性向けや静的記述子では転移が弱まる課題に対処すると述べる。

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

Google DeepMind Blog · 2026-06-16 EN エージェント・ツール使用抜粋

Securing the future of AI agents

Google DeepMind、AI エージェントを守る AI Control Roadmap を提示

AI エージェント

Google DeepMind は、AI エージェントの安全性を高めるための「AI Control Roadmap」を示した。従来型のセキュリティ対策とリアルタイム監視を組み合わせ、内部システムをエージェントの誤用や逸脱から守る方針。エージェント時代に向けた多層防御の枠組みを提案する。

元記事を読む (Google DeepMind Blog) ↗

arXiv cs.LG (Machine Learning) · 2026-06-16 EN 安全性・評価抜粋

Edge Flow: A Tractable and Predictive Continuous-Time Model for Gradient Descent at the Edge of Stability

Edge Flow、安定境界の勾配降下を連続時間で予測モデル化

深層学習

深層学習の勾配降下は損失ヘッセ行列の最大固有値が安定閾値付近に留まる安定境界(EoS)で動くことがある。Edge Flowはこの領域を扱える、扱いやすく予測的な連続時間モデルを提案する。

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-06-16 EN 安全性・評価抜粋

Agentic AI-based Framework for Mitigating Premature Diagnostic Handoff and Silent Hallucination in Healthcare Applications

医療AIの早期診断委譲と静かな幻覚を抑える多エージェント枠組み

AI エージェント Llama

医療推論に用いるエージェント型AIが、早期の診断委譲と検知されにくい臨床幻覚という二つの失敗様式に陥りやすい点に着目する論文。LLM審判型のルーティングを決定論的な統制制約に置き換え、二つの安全機構を備えた多エージェント枠組みを提案すると述べる。

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.LG (Machine Learning) · 2026-06-16 EN 安全性・評価抜粋

NoiseTilt: Noise-Tilted Reverse Kernels for Diffusion Reward Alignment

NoiseTilt、雑音項に報酬勾配を注入する拡散整合

推論 (Inference)

NoiseTilt(NTRK)は報酬誘導の拡散サンプラーで、逆カーネルの雑音項を通じて報酬勾配を注入し、スコアカーネルを変えず1ステップ1サンプルで済む。事前学習済み拡散モデルの報酬整合を効率化する。

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.CL (Computation and Language) · 2026-06-16 EN 安全性・評価抜粋

PseudoBench: Measuring How Agentic Auto-Research Fuels Pseudoscience

PseudoBench、自律研究エージェントが擬似科学を助長する度合いを測定

AI エージェント深層学習

LLMベースのエージェントが自律的な科学研究に入る中、擬似科学への耐性が重要になる。PseudoBenchは、もっともらしいが誤った研究を生み学術文献を汚染し得る挙動を測る敵対的ベンチマークを提案する。

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.CL (Computation and Language) · 2026-06-16 EN 安全性・評価抜粋

Compositional Skill Routing for LLM Agents: Decompose, Retrieve, and Compose

LLMエージェント向け合成的スキルルーティング

AI エージェント Model Context Protocol (MCP) ニューラルネットワーク強化学習

LLMエージェントは再利用可能なツール仕様(スキル)に依存するが、現実の課題は複数スキルの合成を要する。本研究を合成的スキルルーティング問題として定式化し、複雑な要求を原子的サブタスクへ分解・検索・合成する。

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.LG (Machine Learning) · 2026-06-16 EN 学習・ファインチューニング抜粋

Uncertainty Quantification for Flow-Based Vision-Language-Action Models

フローベースVLAモデルの不確実性定量化

コンピュータビジョンファインチューニング検索拡張生成 (RAG) 強化学習

視覚言語行動(VLA)モデルは視覚言語基盤に、フローマッチングで訓練した表現力ある行動ヘッドを組み合わせる。強い実績を持つ一方、本研究はフローベースVLAに対する不確実性定量化の手法を検討する。

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

NVIDIA Developer Blog · 2026-06-16 EN インフラ・ハードウェア抜粋

NVIDIA Blackwell Tops MLPerf Training 6.0 with Industry-Leading Scale and Performance

NVIDIA、Blackwell が MLPerf Training 6.0 で首位と発表

生成 AI 機械学習 NVIDIA ソフトウェア工学

NVIDIA が、GPU アーキテクチャ Blackwell が MLPerf Training 6.0 ベンチマークで業界最高水準の規模と性能を達成し首位になったと発表した。export の raw_excerpt は cookie/query データで blocked のため、タイトルと発表ベースで中立に要約。数値は発表側の主張で第三者検証は未確認。

元記事を読む (NVIDIA Developer Blog) ↗

arXiv cs.CL (Computation and Language) · 2026-06-16 EN エージェント・ツール使用抜粋

ProvenanceGuard: Source-Aware Factuality Verification for MCP-Based LLM Agents

ProvenanceGuard、MCPエージェント向け出所考慮の事実検証

AI エージェント Model Context Protocol (MCP) ソフトウェア工学

ツール利用のLLMエージェントはMCPで検索・API・DB・臨床記録など多様な根拠から回答する。ProvenanceGuardは、根拠の出所に敏感な失敗モードに対処する、出所を考慮した事実性検証を提案する。

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.LG (Machine Learning) · 2026-06-16 EN 安全性・評価抜粋

LoopCoder-v2: Only Loop Once for Efficient Test-Time Computation Scaling

LoopCoder-v2、一度のループで効率的テスト時計算スケール

深層学習ソフトウェア工学 Transformer

ループ型Transformerは共有ブロック反復で潜在計算を拡張するが、逐次ループは遅延とKVキャッシュを増やす。並列ループ手法を踏まえ、LoopCoder-v2はループ回数を実用的設計変数として効率的なテスト時計算スケーリングを狙う。

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.CL (Computation and Language) · 2026-06-16 EN 安全性・評価抜粋

LegalHalluLens: Typed Hallucination Auditing and Calibrated Multi-Agent Debate for Trustworthy Legal AI

LegalHalluLens、法務AIの型付き幻覚を監査し多者討論で較正

検索拡張生成 (RAG)

法務に使うAIは平均で約52%幻覚するとされるが、平均は誤りの偏りや方向を隠す。LegalHalluLensは型付きの幻覚監査と較正された多エージェント討論を組み合わせ、信頼できる法務AIへ向けた実用的シグナルを与える枠組みを提案する。

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.LG (Machine Learning) · 2026-06-16 EN 新モデル・リリース抜粋

Fast Nonparametric Conditional Independence Testing via Two-Stage Regression

二段階回帰による高速なノンパラ条件付き独立性検定

アルゴリズム・理論人間のフィードバックによる強化学習 (RLHF)

条件付き独立性検定は統計・因果推論の基本課題である。本研究は二段階回帰に基づく高速なノンパラメトリック条件付き独立性検定を提案し、計算効率と検出力の改善を狙う。

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-06-16 EN 新モデル・リリース抜粋

LLM Consumer Behavior Theory: Foundations of a Novel Research Field

エージェント市場の消費行動を扱う新研究領域LLM消費行動論を提唱

AI エージェント自然言語処理 (NLP) 検索拡張生成 (RAG)

LLMが利用者に代わり消費判断を行う自律エージェントとして普及する流れを受け、人間を主たる意思決定者としてきた消費者理論に問いを投げかける論文。古典・行動経済学とNLPの知見を踏まえ、エージェント市場の消費行動を分析する新領域を提唱すると述べる。

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.CL (Computation and Language) · 2026-06-16 EN 新モデル・リリース抜粋

VoidPadding: Let [VOID] Handle Padding in Masked Diffusion Language Models so that [EOS] Can Focus on Semantic Termination

VoidPadding、マスク拡散LMで[VOID]がパディングを担当

深層学習推論 (Inference) 検索拡張生成 (RAG) 強化学習

マスク拡散言語モデルでパディングと意味的終端の役割が混ざる問題に対し、[VOID]トークンにパディングを担わせ[EOS]が意味的終端に集中できるようにする手法VoidPaddingを提案する。

元記事を読む (arXiv cs.CL (Computation and Language)) ↗