開発者ツール B
315 件中 301〜315 件目を表示
-
Free Heavy-Tailed Lunch for Muon: A Theoretical Justification of Empirical SuccessMuon最適化の経験的成功を理論的に裏付け行列値更新を行う非ユークリッド最適化手法MuonやScionはTransformer訓練で高性能を示すが理論的裏付けは乏しい。重い裾の構造に着目し、その成功を理論的に正当化する。
-
Rethinking Global Average Pooling: Your Classifier Is Secretly a Multi-Instance Learner大域平均プーリングの分類器は実は多重インスタンス学習器と指摘近年の画像分類器は大域平均プーリング(GAP)と線形ヘッドを多用する。本論文はこの線形性ゆえに、GAP付き分類器が実質的に多重インスタンス学習(MIL)器として振る舞うことを示し、GAPの再考を促す。
-
TRACE: Trajectory-Routed Causal Memory for Delayed-Evidence Visuomotor Imitation遅延証拠の模倣学習向け因果記憶「TRACE」自律運用のロボットは、もはや見えない証拠に基づく判断を迫られることがある。本論文は早期の手がかりが後の判断時点までに消える「遅延証拠」課題に対し、軌跡で経路付けた因果記憶「TRACE」による視覚運動模倣学習を提案する。
-
Provably Safe, Yet Scalable Reinforcement Learning証明可能な安全性とスケール性を両立する強化学習制約を満たしつつ報酬を最適化する安全強化学習は、多くがソフト制約に依存する。証明可能な安全性を保ちつつスケール可能な手法を提案する。
-
BayLing-Duplex: Native Full-Duplex Speech Dialogue with a Single Autoregressive LLMBayLing-Duplex、単一LLMで全二重の音声対話を実現次世代音声チャットボットに重要な全二重対話を、単一の自己回帰LLMでネイティブに実現するBayLing-Duplexを提案。割り込みや言いよどみなど自然な現象に対応する。
-
Behavioral Audit of Machine Unlearning Has a Privacy Cost機械的アンラーニングの挙動監査にプライバシー代償機械学習モデルから学習データを除去する機械的アンラーニングの挙動監査が、かえってプライバシー上の代償を伴うことを示す研究。
-
PepALD: Macrocyclic Peptide Generation via Autoregressive Latent DiffusionPepALD、自己回帰潜在拡散で大環状ペプチドを生成細胞内標的の有望な治療候補である大環状ペプチドは、非天然モノマーや環構造、膜透過性の同時制御が必要。自己回帰的な潜在拡散による生成手法PepALDを提案する。
-
Beyond the Training Distribution: Evaluating Predictions Under Distribution Shift and Selection Bias分布シフトと選択バイアス下の予測性能を事前評価配備前に新環境での予測性能を理解することは被害防止に重要。分布シフトと選択バイアスという二つの劣化要因の下で予測を評価する枠組みを扱う。
-
Nonlinear Two-Time-Scale Stochastic Approximation: A Sharp Phase Transition and How to Beat It非線形2時間尺度確率近似の鋭い相転移を解明非線形な2時間尺度確率近似の有限時間解析で、縮小性の仮定下に現れる鋭い相転移を示し、それを打開する方法を提案する理論研究。
-
When the Tool Decides: LLM Agents Defer Blindly to Graph Neural Network Tools, and Stronger Backbones Defer MoreLLMエージェントはGNNツールに盲目的に委ね、強いほど委ねると指摘グラフニューラルネット(GNN)を呼び出し可能なツールとしてLLMエージェントに与える研究が増えている。本論文は、エージェントがツール出力を盲目的に受け入れて委ね、しかもバックボーンが強いほど委ねる傾向が強まることを示す。
-
The Perceived Fragility of Explanations in Audio Models: Manipulation of Attribution with Unchanged Predictions音声モデルの説明は予測を変えず操作できるその脆弱性を検証本論文は音声ディープフェイク検知における事後説明手法の脆弱性を調べる。従来は画像で標準的なLpノルムを用いた説明操作が中心だったのに対し、心理音響(psychoacoustic)の枠組みを導入し、予測を変えずに帰属を操作できることを示す。
-
A Computational Audit of Demographic Association Encoding in ClinicalBERT Language PredictionsClinicalBERTの人口統計関連の符号化を計算論的に監査臨床言語モデルが高リスクな意思決定支援に組み込まれる中、人口統計的な関連がどう符号化されるかを計算論的に監査。予測に与える影響を分析する。
-
tap: A File-Based Protocol for Heterogeneous LLM Agent Collaboration異種LLMエージェント協調のファイルベースプロトコル「tap」既存の多エージェント開発系は役割分担やコードレビューなど多様な協調を提案するが、共通の runtime や中央会話を前提とすることが多い。本論文は異種のLLMエージェントが協調するためのファイルベースのプロトコル「tap」を提案する。
-
CADET: Physics-Grounded Causal Auditing and Training-Free Deconfounding of End-to-End Driving Planners自動運転プランナーの近道学習を因果監査で除去する「CADET」模倣学習で訓練された end-to-end 自動運転プランナーは、専門家の行動と単に共起する要素を運転判断に結び付ける統計的近道に陥りやすい。本論文は物理に基づく因果監査と学習不要の交絡除去を行う「CADET」を提案する。
-
Coping in Crisis: Computational Modeling of Coping Styles in Digital Crisis Discourse During the 2023 Turkiye Earthquake災害時の対処スタイルをSNS言説から大規模に検出災害時に人々がどう対処するかを、書かれた言葉からリアルタイムに検出できるか検証。2023年トルコ地震の100万件超の言説から対処スタイルを計算論的にモデル化する。