新モデル・リリース A
269 件中 241〜269 件目を表示
-
CORA: Analyzing and bridging thinking-answer gap in Multimodal RLVR via Consistency-Oriented Reasoning AlignmentCORA、マルチモーダルRLVRの「思考と回答のずれ」を是正検証可能報酬による強化学習(RLVR)をマルチモーダルへ拡張する際の、推論内容と最終回答の不一致に着目。一貫性志向の推論整合(CORA)でそのギャップを分析・橋渡しする手法を提案する。
-
A Complexity Measure for Active Learning in Multi-group Mean Estimation多群平均推定の能動学習に複雑性尺度を提案複数グループの平均を推定する能動学習を多腕バンディットとして定式化し、最悪リスクを最小化する予算配分を研究。問題の難しさを測る複雑性尺度を導入する理論研究。
-
Optimal Hidden-Target Learning for Online Inventory Optimization on General Convex Sets凸集合上のオンライン在庫最適化に最適な学習法を提示在庫の繰り越しで実行可能領域が過去に依存するオンライン在庫最適化を、オンライン凸最適化として扱う。一般の凸集合上で隠れた目標を学習する最適手法を理論的に示す。
-
AgentSpec: Understanding Embodied Agent Scaffolds Through Controlled CompositionAgentSpec、エージェント足場を統制的に分解し検証推論・記憶・反省・行動などを組み合わせた「足場(scaffold)」型LLMエージェントを、統制された構成で分析するAgentSpecを提案。各構成要素の寄与を切り分けて理解する枠組み。
-
Towards Direct Latent-Space Synthesis for Parallel Branches in LLM-Agent WorkflowsLLMエージェントの並列分岐を潜在空間で直接合成する手法を検討LLMはエージェント実行エンジンとして使われる一方、依然として逐次的なテキスト interface で文脈を消費する。独立タスクを並列処理する近年の構造化エージェント workflow との不整合を指摘し、並列分岐を潜在空間で直接合成するアプローチを検討する。
-
When to Write and When to Suppress: Route-Specialized Dual Adapters for Memory-Assisted Knowledge Editing知識編集の書込/抑制を切替える二重アダプタを提案編集対象の事実のみ更新し周辺挙動を保つ知識編集を、編集メモリ参照型の設定で研究。書込と抑制を経路別に担う特化型のデュアルアダプタを提案する。
-
Giving AI a Headache: Acoustic Adversarial Attacks to Computer Vision Applications音響による敵対的攻撃でコンピュータビジョンを誤動作させる脅威を提示自動運転制御など実世界のコンピュータビジョン応用がAIで自動化される中、本論文は音響(acoustic)を用いた敵対的攻撃でCVシステムを誤動作させられることを示し、物理的・音響的な攻撃面の新たな脅威を提示する。
-
Abstracting Cross-Domain Action Sequences into Interpretable Workflows操作ログを解釈可能なワークフローへ抽象化する手法を提案時系列の操作ログはアプリ利用の客観的記録だが、粒度の細かさとノイズのため作業の意味ある洞察を得にくい。本論文はクロスドメインの行動系列を、解釈可能なワークフローへ抽象化する手法を提案する。
-
Online Convex Optimization with Sublinear Noisy Probes雑音つき探索を抑えたオンライン凸最適化を研究各ラウンドで点を選び凸損失を観測するオンライン凸最適化を、雑音つき探索(probe)を劣線形回数に抑えた設定で研究する理論的成果。
-
Expert-Driven Survival Machines: Improving Stratification and Interpretability in Multiple Clinical Cohorts臨床コホートの生存予測を層別化・解釈可能にする「Survival Machines」生存予測は医療提供者や臨床研究で中心的な役割を持つ。本論文は専門知識を取り込んだ「Expert-Driven Survival Machines」により、複数の臨床コホートでリスク層別化と解釈可能性を改善する手法を提案する。
-
LoSoNA: A Benchmark for Local Social Norm Adaptation in Group ConversationsLoSoNA、集団会話の局所規範への適応を評価する基準オンライン集団会話には明示されない局所的な会話規範がある。LLMエージェントがそれを認識し適応できるかを測るベンチマーク「LoSoNA」を提案する。
-
Cluster LOCO: Feature Importance For Interpreting ClustersCluster LOCO、クラスタ解釈のための特徴重要度探索的分析や科学的発見に使われるクラスタリングは出力の解釈が難しい。特徴重要度に基づきクラスタを解釈・監査する手法「Cluster LOCO」を提案する。
-
Sensitivity Shaping for Latent Modeling生成動力学モデルの分布外遷移を検知する「Sensitivity Shaping」生成的な動力学モデルはロボット系の計画を可能にするが、安全な運用には方策が誘発する分布外(OOD)遷移の検知が要る。本論文は感度を整形(Sensitivity Shaping)する潜在モデリング手法でOOD遷移をより確実に検知する。
-
A Temporal Planning Framework for Disruption Aware Dynamic Route Optimization in Heterogeneous Railway Systems異種鉄道網の遅延対応・動的経路最適化の時間計画フレームワーク経路最適化は鉄道運行の安全と定時性に不可欠で、特に異種・多軌間の鉄道網で重要となる。本論文は混乱(disruption)を考慮した動的経路最適化のための時間計画(temporal planning)フレームワークを提案する。
-
CARE: Controlling LLM-Generated Policies through Auditable Review of Evidence in Scientific Experimentation科学実験でLLM提案方策を証拠の監査で制御する「CARE」高コストで不可逆な科学実験をLLMに直接制御させると危険だが、創造性を捨てると最適化の余地も失う。本論文はLLMが生成する方策を、証拠の監査可能なレビュー(CARE)で制御し、安全性と性能を両立する枠組みを提案する。
-
SIMMER: Benchmarking Latent Failures in LLM Executable Planning with a World Model世界モデルでLLM実行計画の潜在的失敗を測る「SIMMER」LLMは家庭環境などで自律エージェントのプランナーとして使われる。既存ベンチが生成計画の実行可否のみを評価するのに対し、本論文は世界モデルを用いて潜在的な失敗を測るベンチマーク「SIMMER」を提案する。
-
StreamMemBench: Streaming Evaluation of Agent Memory for Future-Oriented Assistance未来志向支援のためのエージェント記憶を評価する「StreamMemBench」個人エージェントの記憶は、蓄積情報と過去の対話を未来志向の支援へ転換することが役割となる。本論文は観測やユーザ操作から得られる手がかりを活かす能力を、ストリーミング評価するベンチマーク「StreamMemBench」を提案する。
-
Regional Climate Model Emulation with Diffusion Approaches: What is the Added Value of Generative Machine Learning?拡散モデルによる地域気候モデルのエミュレーションの付加価値を検証エミュレータは地域気候モデル(RCM)の力学的ダウンスケーリングを安価に再現する手段。本論文は拡散(diffusion)による生成的機械学習が、GCM予測子からRCM相当の高解像度場を生む際に持つ付加価値を検証する。
-
ORCA: A Platform for Open-Source Dexterity ResearchORCA、オープンソースの器用さ研究プラットフォームロボット操作研究で多用される二指グリッパは形状の制約で能力が限られる。より器用な操作の研究を支えるオープンソースのプラットフォーム「ORCA」を提案する。
-
TRACE: Trajectory-Routed Causal Memory for Delayed-Evidence Visuomotor Imitation遅延証拠の模倣学習向け因果記憶「TRACE」自律運用のロボットは、もはや見えない証拠に基づく判断を迫られることがある。本論文は早期の手がかりが後の判断時点までに消える「遅延証拠」課題に対し、軌跡で経路付けた因果記憶「TRACE」による視覚運動模倣学習を提案する。
-
The Risk Shadow of Principal Component Analysis: When 99.9999% Variance Preservation Causes Catastrophic Decision ErrorsPCAの分散保存が稀な破滅的誤判断を招く「リスクの影」主成分分析は分散を保存するが、稀な破滅的事象の検出に必要な情報は保たない。高い分散保存率でも重大な判断誤りを生む「リスクの影」の存在を証明する。
-
BayLing-Duplex: Native Full-Duplex Speech Dialogue with a Single Autoregressive LLMBayLing-Duplex、単一LLMで全二重の音声対話を実現次世代音声チャットボットに重要な全二重対話を、単一の自己回帰LLMでネイティブに実現するBayLing-Duplexを提案。割り込みや言いよどみなど自然な現象に対応する。
-
From Shield to Target: Denial-of-Service Attacks on LLM-Based Agent GuardrailsLLMエージェントのガードレールを狙うサービス妨害攻撃を提示LLMベースのガードレールはプロンプトインジェクションやジェイルブレイクへの有力な防御となっている。本論文は、その防御を支える推論・指示追従能力そのものを突くサービス妨害(DoS)攻撃が可能であることを明らかにする。
-
Every Eval Ever: A Unifying Schema and Community Repository for AI Evaluation ResultsAI評価結果を統一するスキーマと共有レポジトリ「Every Eval Ever」AI評価は進捗の把握に広く使われるが、評価者ごとの不整合が分析・比較を妨げる。本論文は評価結果を統一するスキーマと、コミュニティで共有するレポジトリ「Every Eval Ever」を提案する。
-
PepALD: Macrocyclic Peptide Generation via Autoregressive Latent DiffusionPepALD、自己回帰潜在拡散で大環状ペプチドを生成細胞内標的の有望な治療候補である大環状ペプチドは、非天然モノマーや環構造、膜透過性の同時制御が必要。自己回帰的な潜在拡散による生成手法PepALDを提案する。
-
GitOfThoughts: Version-Controlled Reasoning and Agent Memory You Can Replay, Diff, and Merge再生・差分・統合できる版管理つき推論記憶「GitOfThoughts」LLMの思考は文脈窓とともに消え、枝刈りされた探索や記憶は差分・統合・監査ができない。本論文は推論とエージェント記憶を版管理し、再生・差分・マージ可能にする「GitOfThoughts」を提案する。
-
The Perceived Fragility of Explanations in Audio Models: Manipulation of Attribution with Unchanged Predictions音声モデルの説明は予測を変えず操作できるその脆弱性を検証本論文は音声ディープフェイク検知における事後説明手法の脆弱性を調べる。従来は画像で標準的なLpノルムを用いた説明操作が中心だったのに対し、心理音響(psychoacoustic)の枠組みを導入し、予測を変えずに帰属を操作できることを示す。
-
MoDiCoL: A Modular Diagnostic Continual Learning Dataset for Robust Speech Recognition頑健な音声認識向けモジュラー診断的継続学習データセット「MoDiCoL」近年のASRは標準ベンチで著しく進歩したが、条件によって性能差が残る。本論文は頑健な音声認識のための、モジュラーで診断的な継続学習(continual learning)データセット「MoDiCoL」を提案する。
-
Causal Object-Centric Models for Planning with Monte Carlo Tree Searchスロット構造の潜在空間でMCTS計画する因果モデル「COMET」本論文はモデルベース強化学習アルゴリズム「COMET」を提案する。スロット構造の潜在空間でモンテカルロ木探索(MCTS)を行う物体中心(object-centric)の因果モデルにより、効率的な計画を実現する。