新モデル・リリース A

268 件中 241〜268 件目を表示
  • arXiv cs.CL (Computation and Language) · EN 安全性・評価 抜粋
    CORA: Analyzing and bridging thinking-answer gap in Multimodal RLVR via Consistency-Oriented Reasoning Alignment
    CORA、マルチモーダルRLVRの「思考と回答のずれ」を是正
    コンピュータビジョン 推論 (Inference) 検索拡張生成 (RAG) 強化学習 ソフトウェア工学
    検証可能報酬による強化学習(RLVR)をマルチモーダルへ拡張する際の、推論内容と最終回答の不一致に着目。一貫性志向の推論整合(CORA)でそのギャップを分析・橋渡しする手法を提案する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.LG (Machine Learning) · EN 新モデル・リリース 抜粋
    A Complexity Measure for Active Learning in Multi-group Mean Estimation
    多群平均推定の能動学習に複雑性尺度を提案
    複数グループの平均を推定する能動学習を多腕バンディットとして定式化し、最悪リスクを最小化する予算配分を研究。問題の難しさを測る複雑性尺度を導入する理論研究。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN 新モデル・リリース 抜粋
    Optimal Hidden-Target Learning for Online Inventory Optimization on General Convex Sets
    凸集合上のオンライン在庫最適化に最適な学習法を提示
    在庫の繰り越しで実行可能領域が過去に依存するオンライン在庫最適化を、オンライン凸最適化として扱う。一般の凸集合上で隠れた目標を学習する最適手法を理論的に示す。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.CL (Computation and Language) · EN 新モデル・リリース 抜粋
    AgentSpec: Understanding Embodied Agent Scaffolds Through Controlled Composition
    AgentSpec、エージェント足場を統制的に分解し検証
    AI エージェント 機械学習 強化学習
    推論・記憶・反省・行動などを組み合わせた「足場(scaffold)」型LLMエージェントを、統制された構成で分析するAgentSpecを提案。各構成要素の寄与を切り分けて理解する枠組み。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 新モデル・リリース 抜粋
    Towards Direct Latent-Space Synthesis for Parallel Branches in LLM-Agent Workflows
    LLMエージェントの並列分岐を潜在空間で直接合成する手法を検討
    AI エージェント ニューラルネットワーク
    LLMはエージェント実行エンジンとして使われる一方、依然として逐次的なテキスト interface で文脈を消費する。独立タスクを並列処理する近年の構造化エージェント workflow との不整合を指摘し、並列分岐を潜在空間で直接合成するアプローチを検討する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.LG (Machine Learning) · EN 安全性・評価 抜粋
    When to Write and When to Suppress: Route-Specialized Dual Adapters for Memory-Assisted Knowledge Editing
    知識編集の書込/抑制を切替える二重アダプタを提案
    埋め込み (Embeddings) 推論 (Inference) Llama
    編集対象の事実のみ更新し周辺挙動を保つ知識編集を、編集メモリ参照型の設定で研究。書込と抑制を経路別に担う特化型のデュアルアダプタを提案する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 新モデル・リリース 抜粋
    Giving AI a Headache: Acoustic Adversarial Attacks to Computer Vision Applications
    音響による敵対的攻撃でコンピュータビジョンを誤動作させる脅威を提示
    コンピュータビジョン 深層学習 強化学習
    自動運転制御など実世界のコンピュータビジョン応用がAIで自動化される中、本論文は音響(acoustic)を用いた敵対的攻撃でCVシステムを誤動作させられることを示し、物理的・音響的な攻撃面の新たな脅威を提示する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 新モデル・リリース 抜粋
    Abstracting Cross-Domain Action Sequences into Interpretable Workflows
    操作ログを解釈可能なワークフローへ抽象化する手法を提案
    深層学習 推論 (Inference) Microsoft 強化学習
    時系列の操作ログはアプリ利用の客観的記録だが、粒度の細かさとノイズのため作業の意味ある洞察を得にくい。本論文はクロスドメインの行動系列を、解釈可能なワークフローへ抽象化する手法を提案する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.LG (Machine Learning) · EN 新モデル・リリース 抜粋
    Online Convex Optimization with Sublinear Noisy Probes
    雑音つき探索を抑えたオンライン凸最適化を研究
    機械学習
    各ラウンドで点を選び凸損失を観測するオンライン凸最適化を、雑音つき探索(probe)を劣線形回数に抑えた設定で研究する理論的成果。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 新モデル・リリース 抜粋
    Expert-Driven Survival Machines: Improving Stratification and Interpretability in Multiple Clinical Cohorts
    臨床コホートの生存予測を層別化・解釈可能にする「Survival Machines」
    Mixture of Experts (MoE) ニューラルネットワーク 強化学習
    生存予測は医療提供者や臨床研究で中心的な役割を持つ。本論文は専門知識を取り込んだ「Expert-Driven Survival Machines」により、複数の臨床コホートでリスク層別化と解釈可能性を改善する手法を提案する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.CL (Computation and Language) · EN 新モデル・リリース 抜粋
    LoSoNA: A Benchmark for Local Social Norm Adaptation in Group Conversations
    LoSoNA、集団会話の局所規範への適応を評価する基準
    AI エージェント Claude Gemini ソフトウェア工学
    オンライン集団会話には明示されない局所的な会話規範がある。LLMエージェントがそれを認識し適応できるかを測るベンチマーク「LoSoNA」を提案する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.LG (Machine Learning) · EN 新モデル・リリース 抜粋
    Cluster LOCO: Feature Importance For Interpreting Clusters
    Cluster LOCO、クラスタ解釈のための特徴重要度
    アルゴリズム・理論
    探索的分析や科学的発見に使われるクラスタリングは出力の解釈が難しい。特徴重要度に基づきクラスタを解釈・監査する手法「Cluster LOCO」を提案する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 新モデル・リリース 抜粋
    Sensitivity Shaping for Latent Modeling
    生成動力学モデルの分布外遷移を検知する「Sensitivity Shaping」
    ニューラルネットワーク
    生成的な動力学モデルはロボット系の計画を可能にするが、安全な運用には方策が誘発する分布外(OOD)遷移の検知が要る。本論文は感度を整形(Sensitivity Shaping)する潜在モデリング手法でOOD遷移をより確実に検知する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 安全性・評価 抜粋
    A Temporal Planning Framework for Disruption Aware Dynamic Route Optimization in Heterogeneous Railway Systems
    異種鉄道網の遅延対応・動的経路最適化の時間計画フレームワーク
    深層学習 Meta ニューラルネットワーク 強化学習
    経路最適化は鉄道運行の安全と定時性に不可欠で、特に異種・多軌間の鉄道網で重要となる。本論文は混乱(disruption)を考慮した動的経路最適化のための時間計画(temporal planning)フレームワークを提案する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 安全性・評価 抜粋
    CARE: Controlling LLM-Generated Policies through Auditable Review of Evidence in Scientific Experimentation
    科学実験でLLM提案方策を証拠の監査で制御する「CARE」
    機械学習
    高コストで不可逆な科学実験をLLMに直接制御させると危険だが、創造性を捨てると最適化の余地も失う。本論文はLLMが生成する方策を、証拠の監査可能なレビュー(CARE)で制御し、安全性と性能を両立する枠組みを提案する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 新モデル・リリース 抜粋
    SIMMER: Benchmarking Latent Failures in LLM Executable Planning with a World Model
    世界モデルでLLM実行計画の潜在的失敗を測る「SIMMER」
    AI エージェント ニューラルネットワーク 検索拡張生成 (RAG) 強化学習
    LLMは家庭環境などで自律エージェントのプランナーとして使われる。既存ベンチが生成計画の実行可否のみを評価するのに対し、本論文は世界モデルを用いて潜在的な失敗を測るベンチマーク「SIMMER」を提案する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 安全性・評価 抜粋
    StreamMemBench: Streaming Evaluation of Agent Memory for Future-Oriented Assistance
    未来志向支援のためのエージェント記憶を評価する「StreamMemBench」
    個人エージェントの記憶は、蓄積情報と過去の対話を未来志向の支援へ転換することが役割となる。本論文は観測やユーザ操作から得られる手がかりを活かす能力を、ストリーミング評価するベンチマーク「StreamMemBench」を提案する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 新モデル・リリース 抜粋
    Regional Climate Model Emulation with Diffusion Approaches: What is the Added Value of Generative Machine Learning?
    拡散モデルによる地域気候モデルのエミュレーションの付加価値を検証
    深層学習 機械学習 ニューラルネットワーク 強化学習
    エミュレータは地域気候モデル(RCM)の力学的ダウンスケーリングを安価に再現する手段。本論文は拡散(diffusion)による生成的機械学習が、GCM予測子からRCM相当の高解像度場を生む際に持つ付加価値を検証する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.LG (Machine Learning) · EN 新モデル・リリース 抜粋
    ORCA: A Platform for Open-Source Dexterity Research
    ORCA、オープンソースの器用さ研究プラットフォーム
    ニューラルネットワーク 検索拡張生成 (RAG) ロボティクス
    ロボット操作研究で多用される二指グリッパは形状の制約で能力が限られる。より器用な操作の研究を支えるオープンソースのプラットフォーム「ORCA」を提案する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 新モデル・リリース 抜粋
    TRACE: Trajectory-Routed Causal Memory for Delayed-Evidence Visuomotor Imitation
    遅延証拠の模倣学習向け因果記憶「TRACE」
    強化学習
    自律運用のロボットは、もはや見えない証拠に基づく判断を迫られることがある。本論文は早期の手がかりが後の判断時点までに消える「遅延証拠」課題に対し、軌跡で経路付けた因果記憶「TRACE」による視覚運動模倣学習を提案する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.LG (Machine Learning) · EN 新モデル・リリース 抜粋
    The Risk Shadow of Principal Component Analysis: When 99.9999% Variance Preservation Causes Catastrophic Decision Errors
    PCAの分散保存が稀な破滅的誤判断を招く「リスクの影」
    強化学習
    主成分分析は分散を保存するが、稀な破滅的事象の検出に必要な情報は保たない。高い分散保存率でも重大な判断誤りを生む「リスクの影」の存在を証明する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.CL (Computation and Language) · EN 学習・ファインチューニング 抜粋
    BayLing-Duplex: Native Full-Duplex Speech Dialogue with a Single Autoregressive LLM
    BayLing-Duplex、単一LLMで全二重の音声対話を実現
    深層学習 ファインチューニング Llama 人間のフィードバックによる強化学習 (RLHF) 音声処理
    次世代音声チャットボットに重要な全二重対話を、単一の自己回帰LLMでネイティブに実現するBayLing-Duplexを提案。割り込みや言いよどみなど自然な現象に対応する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 安全性・評価 抜粋
    From Shield to Target: Denial-of-Service Attacks on LLM-Based Agent Guardrails
    LLMエージェントのガードレールを狙うサービス妨害攻撃を提示
    AI エージェント Claude DeepSeek Gemini GPT
    LLMベースのガードレールはプロンプトインジェクションやジェイルブレイクへの有力な防御となっている。本論文は、その防御を支える推論・指示追従能力そのものを突くサービス妨害(DoS)攻撃が可能であることを明らかにする。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 安全性・評価 抜粋
    Every Eval Ever: A Unifying Schema and Community Repository for AI Evaluation Results
    AI評価結果を統一するスキーマと共有レポジトリ「Every Eval Ever」
    Meta ニューラルネットワーク
    AI評価は進捗の把握に広く使われるが、評価者ごとの不整合が分析・比較を妨げる。本論文は評価結果を統一するスキーマと、コミュニティで共有するレポジトリ「Every Eval Ever」を提案する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.LG (Machine Learning) · EN 新モデル・リリース 抜粋
    PepALD: Macrocyclic Peptide Generation via Autoregressive Latent Diffusion
    PepALD、自己回帰潜在拡散で大環状ペプチドを生成
    埋め込み (Embeddings) ニューラルネットワーク
    細胞内標的の有望な治療候補である大環状ペプチドは、非天然モノマーや環構造、膜透過性の同時制御が必要。自己回帰的な潜在拡散による生成手法PepALDを提案する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 新モデル・リリース 抜粋
    GitOfThoughts: Version-Controlled Reasoning and Agent Memory You Can Replay, Diff, and Merge
    再生・差分・統合できる版管理つき推論記憶「GitOfThoughts」
    AI エージェント ニューラルネットワーク 強化学習 ソフトウェア工学
    LLMの思考は文脈窓とともに消え、枝刈りされた探索や記憶は差分・統合・監査ができない。本論文は推論とエージェント記憶を版管理し、再生・差分・マージ可能にする「GitOfThoughts」を提案する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 新モデル・リリース 抜粋
    The Perceived Fragility of Explanations in Audio Models: Manipulation of Attribution with Unchanged Predictions
    音声モデルの説明は予測を変えず操作できるその脆弱性を検証
    検索拡張生成 (RAG)
    本論文は音声ディープフェイク検知における事後説明手法の脆弱性を調べる。従来は画像で標準的なLpノルムを用いた説明操作が中心だったのに対し、心理音響(psychoacoustic)の枠組みを導入し、予測を変えずに帰属を操作できることを示す。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 資金・M&A 抜粋
    MoDiCoL: A Modular Diagnostic Continual Learning Dataset for Robust Speech Recognition
    頑健な音声認識向けモジュラー診断的継続学習データセット「MoDiCoL」
    強化学習 音声処理
    近年のASRは標準ベンチで著しく進歩したが、条件によって性能差が残る。本論文は頑健な音声認識のための、モジュラーで診断的な継続学習(continual learning)データセット「MoDiCoL」を提案する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗