開発者ツール B

315 件中 301〜315 件目を表示
  • arXiv cs.LG (Machine Learning) · EN 開発者ツール 抜粋
    Free Heavy-Tailed Lunch for Muon: A Theoretical Justification of Empirical Success
    Muon最適化の経験的成功を理論的に裏付け
    強化学習 Transformer
    行列値更新を行う非ユークリッド最適化手法MuonやScionはTransformer訓練で高性能を示すが理論的裏付けは乏しい。重い裾の構造に着目し、その成功を理論的に正当化する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 安全性・評価 抜粋
    Rethinking Global Average Pooling: Your Classifier Is Secretly a Multi-Instance Learner
    大域平均プーリングの分類器は実は多重インスタンス学習器と指摘
    検索拡張生成 (RAG)
    近年の画像分類器は大域平均プーリング(GAP)と線形ヘッドを多用する。本論文はこの線形性ゆえに、GAP付き分類器が実質的に多重インスタンス学習(MIL)器として振る舞うことを示し、GAPの再考を促す。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 新モデル・リリース 抜粋
    TRACE: Trajectory-Routed Causal Memory for Delayed-Evidence Visuomotor Imitation
    遅延証拠の模倣学習向け因果記憶「TRACE」
    強化学習
    自律運用のロボットは、もはや見えない証拠に基づく判断を迫られることがある。本論文は早期の手がかりが後の判断時点までに消える「遅延証拠」課題に対し、軌跡で経路付けた因果記憶「TRACE」による視覚運動模倣学習を提案する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.LG (Machine Learning) · EN 安全性・評価 抜粋
    Provably Safe, Yet Scalable Reinforcement Learning
    証明可能な安全性とスケール性を両立する強化学習
    ニューラルネットワーク 検索拡張生成 (RAG) 強化学習
    制約を満たしつつ報酬を最適化する安全強化学習は、多くがソフト制約に依存する。証明可能な安全性を保ちつつスケール可能な手法を提案する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.CL (Computation and Language) · EN 学習・ファインチューニング 抜粋
    BayLing-Duplex: Native Full-Duplex Speech Dialogue with a Single Autoregressive LLM
    BayLing-Duplex、単一LLMで全二重の音声対話を実現
    深層学習 ファインチューニング Llama 人間のフィードバックによる強化学習 (RLHF) 音声処理
    次世代音声チャットボットに重要な全二重対話を、単一の自己回帰LLMでネイティブに実現するBayLing-Duplexを提案。割り込みや言いよどみなど自然な現象に対応する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.LG (Machine Learning) · EN 開発者ツール 抜粋
    Behavioral Audit of Machine Unlearning Has a Privacy Cost
    機械的アンラーニングの挙動監査にプライバシー代償
    機械学習 ニューラルネットワーク
    機械学習モデルから学習データを除去する機械的アンラーニングの挙動監査が、かえってプライバシー上の代償を伴うことを示す研究。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN 新モデル・リリース 抜粋
    PepALD: Macrocyclic Peptide Generation via Autoregressive Latent Diffusion
    PepALD、自己回帰潜在拡散で大環状ペプチドを生成
    埋め込み (Embeddings) ニューラルネットワーク
    細胞内標的の有望な治療候補である大環状ペプチドは、非天然モノマーや環構造、膜透過性の同時制御が必要。自己回帰的な潜在拡散による生成手法PepALDを提案する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN 安全性・評価 抜粋
    Beyond the Training Distribution: Evaluating Predictions Under Distribution Shift and Selection Bias
    分布シフトと選択バイアス下の予測性能を事前評価
    アルゴリズム・理論 機械学習
    配備前に新環境での予測性能を理解することは被害防止に重要。分布シフトと選択バイアスという二つの劣化要因の下で予測を評価する枠組みを扱う。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN 安全性・評価 抜粋
    Nonlinear Two-Time-Scale Stochastic Approximation: A Sharp Phase Transition and How to Beat It
    非線形2時間尺度確率近似の鋭い相転移を解明
    音声処理
    非線形な2時間尺度確率近似の有限時間解析で、縮小性の仮定下に現れる鋭い相転移を示し、それを打開する方法を提案する理論研究。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN インフラ・ハードウェア 抜粋
    When the Tool Decides: LLM Agents Defer Blindly to Graph Neural Network Tools, and Stronger Backbones Defer More
    LLMエージェントはGNNツールに盲目的に委ね、強いほど委ねると指摘
    AI エージェント 深層学習 ニューラルネットワーク ソフトウェア工学
    グラフニューラルネット(GNN)を呼び出し可能なツールとしてLLMエージェントに与える研究が増えている。本論文は、エージェントがツール出力を盲目的に受け入れて委ね、しかもバックボーンが強いほど委ねる傾向が強まることを示す。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 新モデル・リリース 抜粋
    The Perceived Fragility of Explanations in Audio Models: Manipulation of Attribution with Unchanged Predictions
    音声モデルの説明は予測を変えず操作できるその脆弱性を検証
    検索拡張生成 (RAG)
    本論文は音声ディープフェイク検知における事後説明手法の脆弱性を調べる。従来は画像で標準的なLpノルムを用いた説明操作が中心だったのに対し、心理音響(psychoacoustic)の枠組みを導入し、予測を変えずに帰属を操作できることを示す。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.CL (Computation and Language) · EN 安全性・評価 抜粋
    A Computational Audit of Demographic Association Encoding in ClinicalBERT Language Predictions
    ClinicalBERTの人口統計関連の符号化を計算論的に監査
    機械学習 Transformer
    臨床言語モデルが高リスクな意思決定支援に組み込まれる中、人口統計的な関連がどう符号化されるかを計算論的に監査。予測に与える影響を分析する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 開発者ツール 抜粋
    tap: A File-Based Protocol for Heterogeneous LLM Agent Collaboration
    異種LLMエージェント協調のファイルベースプロトコル「tap」
    AI エージェント Anthropic Claude Meta OpenAI
    既存の多エージェント開発系は役割分担やコードレビューなど多様な協調を提案するが、共通の runtime や中央会話を前提とすることが多い。本論文は異種のLLMエージェントが協調するためのファイルベースのプロトコル「tap」を提案する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 安全性・評価 抜粋
    CADET: Physics-Grounded Causal Auditing and Training-Free Deconfounding of End-to-End Driving Planners
    自動運転プランナーの近道学習を因果監査で除去する「CADET」
    ニューラルネットワーク
    模倣学習で訓練された end-to-end 自動運転プランナーは、専門家の行動と単に共起する要素を運転判断に結び付ける統計的近道に陥りやすい。本論文は物理に基づく因果監査と学習不要の交絡除去を行う「CADET」を提案する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.CL (Computation and Language) · EN 開発者ツール 抜粋
    Coping in Crisis: Computational Modeling of Coping Styles in Digital Crisis Discourse During the 2023 Turkiye Earthquake
    災害時の対処スタイルをSNS言説から大規模に検出
    強化学習
    災害時に人々がどう対処するかを、書かれた言葉からリアルタイムに検出できるか検証。2023年トルコ地震の100万件超の言説から対処スタイルを計算論的にモデル化する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗