安全性・評価 A

307 件中 151〜180 件目を表示
  • arXiv cs.LG (Machine Learning) · EN 新モデル・リリース 抜粋
    Kolmogorov Regression for Robust Diffusion Policies
    コルモゴロフ回帰で頑健な拡散方策を学習
    推論 (Inference) ニューラルネットワーク 強化学習
    有限次元の拡散方策は離散化由来の時間ドリフトで長期性能が劣化する。本研究は後退コルモゴロフ方程式により拡散方策をキャメロン・マルティン空間へ引き上げ、確率的要素を扱い頑健化する手法を提案する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN 新モデル・リリース 抜粋
    A Diffusion Approximation for Temporal-Difference Learning with Linear Features under Markovian Noise
    マルコフ雑音下のTD学習に拡散近似を導入
    線形関数近似による時間差分(TD)学習の古典的連続時間記述は常微分方程式で、漸近平均は捉えるが確率性を無視する。本論文はマルコフ雑音下のTD学習に対し、その揺らぎを捉える拡散近似を与える。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN 安全性・評価 抜粋
    A Convex Quasilinearization Method for Solving Nonlinear PDEs with Physics-Informed Neural Networks
    凸準線形化でPINNによる非線形PDE求解を高速化
    ニューラルネットワーク 強化学習
    非線形偏微分方程式の前進解法として、ベルマン・カラバ準線形化により非線形問題を線形部分問題列へ縮約し、各々を選点法で離散化してPhysics-Informed Neural Networksで解く凸的手法を提示する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN 安全性・評価 抜粋
    Evaluating Open-Source LLMs for Multi-Label ATT&CK Technique Classification on CTI Reports
    CTIのATT&CK多ラベル分類にオープンLLMを評価
    ニューラルネットワーク 検索拡張生成 (RAG) 強化学習
    サイバー脅威インテリジェンス(CTI)報告をMITRE ATT&CK技術で多ラベル分類する課題に対し、オープンソースLLMの性能を評価する研究。タイトルベースの中立要約で、詳細・数値は原論文ベース・第三者検証は未確認と明記。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.CL (Computation and Language) · EN 安全性・評価 抜粋
    The Measurement Gap in the Automation of EU Law: Benchmarking Doctrinal Legal Reasoning under the EU AI Act
    EU AI法下の法的推論を測る測定ギャップを指摘
    ニューラルネットワーク
    LLMは中位品質の法文を生成できるが、法務の解釈的中核である教義的法的推論を評価できるベンチマークは無いと指摘。本研究はEU AI法の下で教義的法的推論をベンチマークし、自動化における測定ギャップを論じる。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 学習・ファインチューニング 抜粋
    WEQA: Wearable hEalth Question Answering with Query-Adaptive Agentic Reasoning
    装着型健康データのQAを行うエージェント推論手法WEQAを提案
    深層学習 ニューラルネットワーク ソフトウェア工学
    連続的で高次元な装着型センサーの健康データに対する質問応答が難しい点に着目し、クエリ適応的なエージェント推論を行う枠組みWEQAを提案する論文。多様なセンサー様式や利用者意図を固定の推論手順では扱えないと論じる。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.CL (Computation and Language) · EN 新モデル・リリース 抜粋
    Your AI Travel Agent Would Book You a Bullfight: An Agentic Benchmark for Implicit Animal Welfare in Frontier AI Models
    動物福祉の暗黙的配慮を測るエージェント型ベンチマーク
    AI エージェント Claude DeepSeek Gemini GPT
    AIエージェントは助言者から旅行予約等を代行する実行者へ移行している。既存の動物福祉ベンチマークはテキスト応答のみを評価するため、本研究はエージェント的展開で暗黙の動物福祉配慮が行動に転移するかを測る基準を提案する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 安全性・評価 抜粋
    Towards Understanding and Measuring COGNITIVE ATROPHY in LLM Behaviour
    LLM対話の認知萎縮を測る過程指標を定式化した研究
    ニューラルネットワーク
    メンタルヘルス支援に使われるLLMで、表層的な安全スコアが時間的な相互作用の質を捉えない評価ギャップを指摘する論文。利用者が自ら省察・対処・意思決定を続けられるかという過程レベルの指標を「認知萎縮(COGNITIVE ATROPHY)」として定式化すると述べる。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.CL (Computation and Language) · EN 新モデル・リリース 抜粋
    Unintended Effects of Geographic Conditioning in Large Language Models
    地理条件付けがLLMに生む意図せぬ地域バイアス
    Claude Llama Meta ニューラルネットワーク 強化学習
    対話型AIは応答の現地化にユーザのメタデータを使うが、この隠れた文脈が生む地域バイアスは十分理解されていない。本研究は地理的条件付けがLLM応答に与える意図せぬ影響を分析する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.LG (Machine Learning) · EN 推論・効率化 抜粋
    Embedded Machine Learning for Microcontroller-Class Edge Devices: Data, Feature, Evaluation, and Deployment Pipelines
    マイコン級エッジ向け組込み機械学習のパイプライン総説
    推論 (Inference) 機械学習 量子化
    組込み機械学習は推論をクラウドから資源制約デバイスへ移す。本稿はマイコン級プラットフォーム向けに、データ取得・特徴量・評価・展開までの一連のワークフローを体系的に整理した実務志向の総説を示す。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.CL (Computation and Language) · EN 開発者ツール 抜粋
    Structural Role Injection in Handlebars-Templated LLM Prompts: Triple-Brace Interpolation, Delimiter Family, and the Limits of HTML Auto-Escaping
    HandlebarsテンプレのLLMプロンプトに潜む役割注入
    Claude GPT Llama 機械学習 Microsoft
    LLMアプリはテンプレートからプロンプトを組み立て、Handlebars(Semantic Kernel既定)を広く使う。本研究は二重括弧のHTMLエスケープに対し三重括弧補間が値をそのまま挿入する点に着目し、構造的な役割注入の危険と自動エスケープの限界を分析する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 新モデル・リリース 抜粋
    HistoRAG: Embedding Historical Methodology in Retrieval-Augmented Generation Through Critical Technical Practice
    HistoRAG、歴史方法論をRAGに組み込む批判的実践
    埋め込み (Embeddings) 検索拡張生成 (RAG) 強化学習 ソフトウェア工学
    RAGは言語モデル出力を外部根拠に接地するが、評価や既定設定は事実QA志向に偏る。HistoRAGは解釈的な歴史研究向けに、批判的技術実践を通じて歴史方法論をRAGへ組み込む枠組みを示す。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 安全性・評価 抜粋
    IsabeLLM: Automated Theorem Proving Applied to Formally Verifying Consensus
    自動定理証明でコンセンサスを形式検証するIsabeLLMを提案
    検索拡張生成 (RAG)
    AIによる定理証明がコンピュータシステムの形式検証を自動化し得る点に着目し、ブロックチェーンのコンセンサスを形式検証するIsabeLLMを提案する論文。専門知識と労力を要する検証作業をAIで大幅に自動化し、より利用しやすくすると述べる。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • NVIDIA Developer Blog · EN インフラ・ハードウェア 抜粋
    How to Optimize Transformer-Based Models for Low-Precision Training
    NVIDIA、Transformer モデルの低精度学習を最適化する解説記事を公開
    生成 AI NVIDIA Transformer
    NVIDIA の技術記事が、Transformer ベースのモデルを低精度(low-precision)で学習する際の最適化手法を解説。本要約は export の raw_excerpt が cookie/query データで blocked のため、タイトルと NVIDIA という発信元から中立に記述しており、具体的な手法・数値は未確認。
    元記事を読む (NVIDIA Developer Blog) ↗
  • arXiv cs.LG (Machine Learning) · EN 推論・効率化 抜粋
    S4oP: Operator-level Pruning of Structured State Space Models for Resource-Constrained Devices
    S4oP、状態空間モデルを演算子単位で枝刈り軽量化
    ファインチューニング 推論 (Inference) 強化学習
    S4などの構造化状態空間モデル(SSM)は長距離依存に強いが資源制約環境への展開は難しい。S4oPは演算子レベルの枝刈りにより、時間・資源が限られたデバイスでの効率的な展開を狙う。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 学習・ファインチューニング 抜粋
    EAGG: Embodiment-Aligned Grasp Generation via Geometry-Aware Graph Conditioning
    身体性に整合した把持生成手法EAGGを提案
    ファインチューニング 検索拡張生成 (RAG)
    平行グリッパから多指ハンドまで多様な身体性に汎化する把持生成を目指し、各エンドエフェクタを位相考慮グラフで表現する身体性整合型生成器EAGGを提案する論文。固定身体性向けや静的記述子では転移が弱まる課題に対処すると述べる。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • Google DeepMind Blog · EN エージェント・ツール使用 抜粋
    Securing the future of AI agents
    Google DeepMind、AI エージェントを守る AI Control Roadmap を提示
    AI エージェント
    Google DeepMind は、AI エージェントの安全性を高めるための「AI Control Roadmap」を示した。従来型のセキュリティ対策とリアルタイム監視を組み合わせ、内部システムをエージェントの誤用や逸脱から守る方針。エージェント時代に向けた多層防御の枠組みを提案する。
    元記事を読む (Google DeepMind Blog) ↗
  • arXiv cs.LG (Machine Learning) · EN 安全性・評価 抜粋
    Edge Flow: A Tractable and Predictive Continuous-Time Model for Gradient Descent at the Edge of Stability
    Edge Flow、安定境界の勾配降下を連続時間で予測モデル化
    深層学習
    深層学習の勾配降下は損失ヘッセ行列の最大固有値が安定閾値付近に留まる安定境界(EoS)で動くことがある。Edge Flowはこの領域を扱える、扱いやすく予測的な連続時間モデルを提案する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 安全性・評価 抜粋
    Agentic AI-based Framework for Mitigating Premature Diagnostic Handoff and Silent Hallucination in Healthcare Applications
    医療AIの早期診断委譲と静かな幻覚を抑える多エージェント枠組み
    AI エージェント Llama
    医療推論に用いるエージェント型AIが、早期の診断委譲と検知されにくい臨床幻覚という二つの失敗様式に陥りやすい点に着目する論文。LLM審判型のルーティングを決定論的な統制制約に置き換え、二つの安全機構を備えた多エージェント枠組みを提案すると述べる。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.LG (Machine Learning) · EN 安全性・評価 抜粋
    NoiseTilt: Noise-Tilted Reverse Kernels for Diffusion Reward Alignment
    NoiseTilt、雑音項に報酬勾配を注入する拡散整合
    推論 (Inference)
    NoiseTilt(NTRK)は報酬誘導の拡散サンプラーで、逆カーネルの雑音項を通じて報酬勾配を注入し、スコアカーネルを変えず1ステップ1サンプルで済む。事前学習済み拡散モデルの報酬整合を効率化する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.CL (Computation and Language) · EN 安全性・評価 抜粋
    PseudoBench: Measuring How Agentic Auto-Research Fuels Pseudoscience
    PseudoBench、自律研究エージェントが擬似科学を助長する度合いを測定
    AI エージェント 深層学習
    LLMベースのエージェントが自律的な科学研究に入る中、擬似科学への耐性が重要になる。PseudoBenchは、もっともらしいが誤った研究を生み学術文献を汚染し得る挙動を測る敵対的ベンチマークを提案する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 安全性・評価 抜粋
    Compositional Skill Routing for LLM Agents: Decompose, Retrieve, and Compose
    LLMエージェント向け合成的スキルルーティング
    AI エージェント Model Context Protocol (MCP) ニューラルネットワーク 強化学習
    LLMエージェントは再利用可能なツール仕様(スキル)に依存するが、現実の課題は複数スキルの合成を要する。本研究を合成的スキルルーティング問題として定式化し、複雑な要求を原子的サブタスクへ分解・検索・合成する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.LG (Machine Learning) · EN 学習・ファインチューニング 抜粋
    Uncertainty Quantification for Flow-Based Vision-Language-Action Models
    フローベースVLAモデルの不確実性定量化
    コンピュータビジョン ファインチューニング 検索拡張生成 (RAG) 強化学習
    視覚言語行動(VLA)モデルは視覚言語基盤に、フローマッチングで訓練した表現力ある行動ヘッドを組み合わせる。強い実績を持つ一方、本研究はフローベースVLAに対する不確実性定量化の手法を検討する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • NVIDIA Developer Blog · EN インフラ・ハードウェア 抜粋
    NVIDIA Blackwell Tops MLPerf Training 6.0 with Industry-Leading Scale and Performance
    NVIDIA、Blackwell が MLPerf Training 6.0 で首位と発表
    生成 AI 機械学習 NVIDIA ソフトウェア工学
    NVIDIA が、GPU アーキテクチャ Blackwell が MLPerf Training 6.0 ベンチマークで業界最高水準の規模と性能を達成し首位になったと発表した。export の raw_excerpt は cookie/query データで blocked のため、タイトルと発表ベースで中立に要約。数値は発表側の主張で第三者検証は未確認。
    元記事を読む (NVIDIA Developer Blog) ↗
  • arXiv cs.CL (Computation and Language) · EN エージェント・ツール使用 抜粋
    ProvenanceGuard: Source-Aware Factuality Verification for MCP-Based LLM Agents
    ProvenanceGuard、MCPエージェント向け出所考慮の事実検証
    AI エージェント Model Context Protocol (MCP) ソフトウェア工学
    ツール利用のLLMエージェントはMCPで検索・API・DB・臨床記録など多様な根拠から回答する。ProvenanceGuardは、根拠の出所に敏感な失敗モードに対処する、出所を考慮した事実性検証を提案する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.LG (Machine Learning) · EN 安全性・評価 抜粋
    LoopCoder-v2: Only Loop Once for Efficient Test-Time Computation Scaling
    LoopCoder-v2、一度のループで効率的テスト時計算スケール
    深層学習 ソフトウェア工学 Transformer
    ループ型Transformerは共有ブロック反復で潜在計算を拡張するが、逐次ループは遅延とKVキャッシュを増やす。並列ループ手法を踏まえ、LoopCoder-v2はループ回数を実用的設計変数として効率的なテスト時計算スケーリングを狙う。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.CL (Computation and Language) · EN 安全性・評価 抜粋
    LegalHalluLens: Typed Hallucination Auditing and Calibrated Multi-Agent Debate for Trustworthy Legal AI
    LegalHalluLens、法務AIの型付き幻覚を監査し多者討論で較正
    検索拡張生成 (RAG)
    法務に使うAIは平均で約52%幻覚するとされるが、平均は誤りの偏りや方向を隠す。LegalHalluLensは型付きの幻覚監査と較正された多エージェント討論を組み合わせ、信頼できる法務AIへ向けた実用的シグナルを与える枠組みを提案する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.LG (Machine Learning) · EN 新モデル・リリース 抜粋
    Fast Nonparametric Conditional Independence Testing via Two-Stage Regression
    二段階回帰による高速なノンパラ条件付き独立性検定
    アルゴリズム・理論 人間のフィードバックによる強化学習 (RLHF)
    条件付き独立性検定は統計・因果推論の基本課題である。本研究は二段階回帰に基づく高速なノンパラメトリック条件付き独立性検定を提案し、計算効率と検出力の改善を狙う。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 新モデル・リリース 抜粋
    LLM Consumer Behavior Theory: Foundations of a Novel Research Field
    エージェント市場の消費行動を扱う新研究領域LLM消費行動論を提唱
    AI エージェント 自然言語処理 (NLP) 検索拡張生成 (RAG)
    LLMが利用者に代わり消費判断を行う自律エージェントとして普及する流れを受け、人間を主たる意思決定者としてきた消費者理論に問いを投げかける論文。古典・行動経済学とNLPの知見を踏まえ、エージェント市場の消費行動を分析する新領域を提唱すると述べる。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.CL (Computation and Language) · EN 新モデル・リリース 抜粋
    VoidPadding: Let [VOID] Handle Padding in Masked Diffusion Language Models so that [EOS] Can Focus on Semantic Termination
    VoidPadding、マスク拡散LMで[VOID]がパディングを担当
    深層学習 推論 (Inference) 検索拡張生成 (RAG) 強化学習
    マスク拡散言語モデルでパディングと意味的終端の役割が混ざる問題に対し、[VOID]トークンにパディングを担わせ[EOS]が意味的終端に集中できるようにする手法VoidPaddingを提案する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗