推論・効率化 A
121 件中 91〜120 件目を表示
-
Beyond the Smile: A Hybrid Convolutional VAE for Crypto Volatility Surfaces暗号資産のボラティリティ曲面を補完する畳み込みVAE手法を提案本研究は、暗号資産のインプライド・ボラティリティ曲面向けに畳み込み変分オートエンコーダ(VAE)を提案し、テナーごとの決定論的ルーティングで二次スマイル再フィットと組み合わせた予測器を構築した。2023年5〜10月のBTC・ETHの時間足オプション曲面6,034件で学習し、欠損セル補完のRMSEは0.94〜1.56ボラティリティポイント。50%マスク時、ハイブリッド予測器は0.83ポイントとスマイル再フィット単独の7.00から約8分の1へ改善したとする。
-
Boosting MoE Training Throughput with Advanced Fusion KernelsNVIDIA、融合カーネルでMoE学習スループットを向上NVIDIAが開発者ブログで、Mixture-of-Experts(MoE)モデルの学習スループットを高める高度な融合カーネル(fusion kernels)の手法を解説した。MoEは大規模AIシステムの基盤的構成要素として急速に普及しており、本記事は学習処理の効率化に向けたカーネルレベルの最適化アプローチを紹介する内容とみられる。
-
A Causal Model of Theory of Mind in Conflict for Artificial Intelligence対立場面で心の理論をいつ働かせるべきかを定式化する構造的因果モデルを提案心の理論(ToM)は他者に心的状態を帰属し予測・推論に用いる能力で、人と機械の統合に不可欠とされる。既存の AI-ToM モデルは「どう」心を読むかを扱うが、「いつ」働かせるべきかはほぼ未解明だった。本論文は、対立においてどの状況・エージェント条件下で ToM の関与が因果的に正当化されるかを問い、ToM を常時稼働ではなく状況・エージェント条件で起動する機構として有向非巡回グラフ(DAG)による構造的因果モデルで定式化すると述べる。
-
Exploring Extrinsic and Intrinsic Properties for Effective Reasoning with Code Interpreterコードインタープリタ推論を支える内在・外在特性を分析した論文コードインタープリタ(CI)を用いた LLM 推論について、外在特性(重要トークン)と内在特性(コード固有の認知的振る舞い)の二つの観点から分析した論文。著者らは、より強い CI 推論モデルほど重要トークンや、検証・バックトラッキング・後ろ向き連鎖といった認知的振る舞いが多く現れると報告し、これらを推論時・学習時に活用する方法を検討したと論じる。abstract ベースの中立要約。
-
RAID: Semantic Graph Diffusion for True Cold-Start and Cross-Lingual Forecastingコールドスタート・多言語予測向け検索拡張拡散フレームワーク RAID を提案時系列基盤モデルは履歴窓があれば高い転移性能を示すが、新規アイテムに過去観測が無い真のコールドスタートではその前提が崩れる。本研究は履歴ベースの相関学習に代えて、メタデータ駆動の意味検索とグラフ条件付き拡散を用いる RAID(Retrieval-Augmented Iterative Diffusion)を提案。凍結した多言語埋め込みでテキストメタデータを共有意味空間へ写像し、未見アイテムにも拡張する帰納的検索グラフを構築。意味的に近い近傍から基礎予測を作り反復的に精緻化すると述べる。
-
MA-SBI: Misspecification-Aware Simulation-Based Inference via Side-Channel Guidanceシミュレータ誤設定に頑健な推論 MA-SBI を提案、副次情報で較正不要にシミュレーションベース推論(SBI)は、モデル簡略化に起因するシミュレータの誤設定(実観測との乖離)に悩まされる。頑健 SBI の最新手法 RoPE は実・模擬観測の表現間の最適輸送で対処するが、SBI が必要な場面では入手困難な真値パラメータの較正ペアを要する。実務者が持つのは体制ラベルや指示テキスト、政策公報など非構造の副次情報である。本研究はこれを活用する誤設定考慮型推論 MA-SBI を提案すると述べる。
-
LESS Is More: Mutual-Stability Sampling for Diffusion Language Models拡散言語モデル向け学習不要の適応サンプラ『LESS』を提案拡散大規模言語モデル(dLLM)の効率を高める、学習不要・モデル非依存の適応的サンプラ『LESS』を提案した論文。トークン確定を逐次的な停止問題として扱い、top-1 予測の確信度・持続性・分布安定性を組み合わせた相互安定性ルールで、未確定位置の解除可否を判断するとする。Dream-7B や LLaDA-8B などで評価したと述べる。abstract ベースの中立要約。
-
Binary Tracking for Spatial QA and Navigation with Open Vision-Language Modelsオープン VLM で動く空間質問応答・ナビ手法 Binary Tracking を提案サービスロボットが長い一人称視点の経路を移動する際の空間質問応答を扱う。「帰り道でクリーニング店はどこか」といった問いに対し、後段のナビが利用できる距離座標を返す。従来は GPT-4o 等のクローズドモデルに依存する検索拡張エージェントが主流だが、ネットワーク不安定・遅延・コストの面で実環境では信頼しにくい。本研究はロボット搭載で動作するオープンソースベースの空間質問応答を目指し、Binary Tracking を提案すると述べる。
-
Follow the Latent Roadmap: Navigating Revocable Decoding for Diffusion LLMs with Anchor Tokens拡散 LLM のリボーカブル復号をアンカートークンで誘導し誤り伝播を抑制並列生成が可能な拡散大規模言語モデル(dLLM)で、復号速度と品質のトレードオフや誤り伝播・remask の課題に対し、アンカートークンで潜在的な「ロードマップ」をたどるリボーカブル復号手法を提案する arxiv 論文。混在品質コンテキストでの 2 つの失敗様式を緩和すると論じる(abstract ベースの中立要約)。
-
Tying the Loop -- Tied Expert Layers in Mixture-of-Experts Language ModelsMoE で専門家パラメータを層間共有する手法を提案する論文Mixture-of-Experts のメモリ負荷を抑えるため、連続する transformer 層で専門家パラメータを共有しつつ層ごとのルーティングと注意を保つ Expert Tying を提案する arxiv 論文。abstract ベースの中立要約。
-
GIST-CMTF: Goal-State Inference for Causal Minimal Tool Filtering in LLM Agentsツール選択の誤目標実行を抑えるエージェント手法GIST-CMTFを提案ツール拡張型LLMエージェントの実行時ツール絞り込みで、曖昧な要求が複数の目標に対応し「誤目標実行」を招く課題を指摘する論文。因果的に必要なツールのみを提示するCMTFに目標状態の推論を加えたGIST-CMTFを提案し、要求が単一の記号的目標に対応済みという前提を緩めるとしている。
-
LLM-based Visual Code Completion for Aerospace Geometric Design航空宇宙設計向け LLM コード補助 copilot を提案する論文安全性と説明可能性を重視する航空宇宙業界向けに、ReAct 手法のビジュアルプログラミング変種と GPT 系モデルを用いた幾何設計支援 copilot を提案する arxiv 論文。abstract ベースの中立要約で、性能の優劣や固有名の評価は差し控える。
-
Progressive Knowledge-Guided Large Language Model Framework for Bearing Fault Diagnosis物理ガイド型の多スケール振動解析で軸受故障診断を行う枠組みを提案振動ベースの軸受故障診断における特徴効率と局所信号忠実度のトレードオフ等の課題に対し、物理理論に基づく多スケール信号処理の統合パイプラインを提案する論文とされる。軸受運動理論由来の記述子で実時間スクリーニングを行い、故障適応的な信号分割を用いると報告。数値は原論文の記載に基づく中立要約。
-
DoubtProbe: Black-Box Jailbreak Defense via Structural Verification and Semantic AuditingLLM の脱獄攻撃を推論時に防ぐ二分岐手法 DoubtProbe を提案ユーザー向けに展開される大規模言語モデル (LLM) への black-box 脱獄攻撃に対し、推論時の防御枠組み DoubtProbe を提案する論文。多くの脱獄は有害な目的を消すのではなく、表現や構造を組み替えて安全整合を回避していると観察し、構造的検証と意味的監査の二分岐で防御する手法を示す。既存防御が prompt の言い換えや構造操作で不安定になる課題への対処を狙う。
-
Sakana AI、初の商用プロダクト「Sakana Marlin」を提供開始Sakana AI、初の商用プロダクト「Marlin」提供開始、最大8時間の自律リサーチSakana AI が同社初の商用プロダクトとなる自律型リサーチアシスタント「Sakana Marlin」を提供開始した。調査テーマを指示するだけで最大約8時間にわたり自律的に仮説立案・情報収集・検証を繰り返し、構造化されたサマリースライドと数十ページの調査レポートを生成する。独自の長期推論技術に基づき、CSO(最高戦略責任者)が担うような重厚な戦略調査をAIが代替することを狙う。セルフサーブで即日利用でき、無料のPay per useからPro・Team・Enterpriseまで複数プランを用意する。
-
The future of Siri, or: why private inference isn’t private enoughSiriの未来:なぜ「プライベート推論」でも不十分なのかオンデバイスやプライベート推論を掲げる音声アシスタント(Siri等)の将来を論じる記事。暗号化や端末内処理だけではプライバシー保護として不十分だと指摘し、より強い保証の必要性を論じている。
-
NVIDIA Achieves Leading Agentic Coding Performance on First Agentic AI BenchmarkNVIDIA、初のエージェント型AIベンチマークでコーディング性能首位を達成NVIDIAは、エージェント型AIを対象とした初のベンチマークでエージェント型コーディング性能の首位を達成したと開発者ブログで報告した。推論基盤やGPUインフラの最適化を通じ、コード生成・修正を自律的に行うAIエージェントの実行性能を高めた成果とみられ、エージェント開発分野での同社プラットフォームの優位性を示す内容となっている。
-
AdaSR: Adaptive Streaming Reasoning with Hierarchical Relative Policy OptimizationAdaSR、入力を逐次処理する「ストリーミング推論」を提案大規模推論モデルが入力全体を読んでから考える従来手法に対し、入力到着に合わせて逐次推論する「AdaSR」を提案。階層的な相対方策最適化で、ストリーミング環境での推論を学習する。
-
HumP-KD: A Hybrid Uncertainty-Aware Multi-Stage Progressive Knowledge Distillation Framework for Efficient Fire ClassificationHumP-KD、不確実性考慮の蒸留で火災分類を効率化リアルタイム火災分類向けに、不確実性を考慮した多段階の漸進的知識蒸留フレームワーク「HumP-KD」を提案。精度と効率を両立する軽量モデルの構築を狙う。
-
Towards Direct Latent-Space Synthesis for Parallel Branches in LLM-Agent WorkflowsLLMエージェントの並列分岐を潜在空間で直接合成する手法を検討LLMはエージェント実行エンジンとして使われる一方、依然として逐次的なテキスト interface で文脈を消費する。独立タスクを並列処理する近年の構造化エージェント workflow との不整合を指摘し、並列分岐を潜在空間で直接合成するアプローチを検討する。
-
When to Write and When to Suppress: Route-Specialized Dual Adapters for Memory-Assisted Knowledge Editing知識編集の書込/抑制を切替える二重アダプタを提案編集対象の事実のみ更新し周辺挙動を保つ知識編集を、編集メモリ参照型の設定で研究。書込と抑制を経路別に担う特化型のデュアルアダプタを提案する。
-
Abstracting Cross-Domain Action Sequences into Interpretable Workflows操作ログを解釈可能なワークフローへ抽象化する手法を提案時系列の操作ログはアプリ利用の客観的記録だが、粒度の細かさとノイズのため作業の意味ある洞察を得にくい。本論文はクロスドメインの行動系列を、解釈可能なワークフローへ抽象化する手法を提案する。
-
Moonlight in Latent Space: Chirality and Structural Correspondence Between Beethoven's Op. 27 No. 2 and Machine Learning Mechanismsベートーヴェン「月光」と機械学習機構の構造的対応を分析ベートーヴェンの「月光ソナタ」(Op.27 No.2)の三つの楽章が、比喩ではなく構造的対応として三種の異なる機械学習アーキテクチャを体現していることを、計算分析を通じて示す学際的研究。
-
Realizing Native INT8 Compute for Diffusion Transformers on Consumer GPUs: A Fused INT8 GEMM Kernel for Ideogram 4.0民生GPUで拡散Transformerの真のINT8演算を実現拡散Transformerの訓練後INT8量子化は、民生Ampere GPUではFP8/NF4より遅いことが多い。Ideogram 4.0向けに融合INT8 GEMMカーネルを実装し、真のINT8高速化を実現する。
-
Zero-shot generalization of transformer neural operators to larger domainsTransformerニューラル演算子の大領域へのゼロショット汎化偏微分方程式の解作用素を近似するTransformer型ニューラル演算子が、訓練時より大きな計算領域へゼロショットで汎化できるかを検証する研究。
-
CARE: Controlling LLM-Generated Policies through Auditable Review of Evidence in Scientific Experimentation科学実験でLLM提案方策を証拠の監査で制御する「CARE」高コストで不可逆な科学実験をLLMに直接制御させると危険だが、創造性を捨てると最適化の余地も失う。本論文はLLMが生成する方策を、証拠の監査可能なレビュー(CARE)で制御し、安全性と性能を両立する枠組みを提案する。
-
From Shield to Target: Denial-of-Service Attacks on LLM-Based Agent GuardrailsLLMエージェントのガードレールを狙うサービス妨害攻撃を提示LLMベースのガードレールはプロンプトインジェクションやジェイルブレイクへの有力な防御となっている。本論文は、その防御を支える推論・指示追従能力そのものを突くサービス妨害(DoS)攻撃が可能であることを明らかにする。
-
Securing the Future of IoMT in the Post-Quantum Era: An Edge-Native Federated Learning Approachポスト量子時代の医療IoTをエッジ連合学習で守る手法医療IoT(IoMT)機器は厳しい資源制約下で機微な健康データを扱い、セキュリティとプライバシーが重要課題となる。連合学習はこれをさらに複雑化させる。本論文はポスト量子時代に向け、エッジネイティブな連合学習で安全性を確保する手法を提案する。
-
From Chatbot to Digital Colleague: The Paradigm Shift Toward Persistent Autonomous AILLMが「チャットボット」から永続自律AIへ移行する転換を概念化LLMは会話生成器から、推論・行動・記憶・自己改善を備えた統合AIへと根本的に変化しつつある。本論文はこの移行を「チャットボットからデジタルな同僚へ」という持続的自律AIへのパラダイムシフトとして概念化する。
-
A Fixed-Point Neural Operator for Size- and Functional-Transferable Hamiltonian Predictionサイズ・汎関数転移可能なハミルトニアン予測の固定点ニューラル演算子Kohn-Shamハミルトニアンを機械学習で予測できれば密度汎関数理論を加速しつつ分子軌道などの観測量も保てる。本論文は系のサイズや汎関数をまたいで転移可能な、固定点ニューラル演算子によるハミルトニアン予測手法を提案する。