推論・効率化 A
125 件中 1〜30 件目を表示
-
UNIEGO: Proxies as Mediators for Unified Egocentric Video Representation LearningUNIEGO、複数視点・モダリティを統合する自己中心視点動画エンコーダUNIEGOは、階層的なマルチティーチャー蒸留で学習する統合的な自己中心視点動画エンコーダ。複数の視点・モダリティ・基盤モデルにまたがる教師の知識を、表現ごとのプロキシモデルを介して均質な自己中心空間へ変換し、自己中心視点の動画のみから利用可能にする設計を提案する。
-
Multi-Task Bayesian In-Context Learningインコンテキスト学習でマルチタスクのベイズ推論を行う手法を提案本論文は、インコンテキスト学習を用いてタスク横断的にベイズ予測推論を行うマルチタスク・ベイズ・インコンテキスト学習を提案する。厳密推論の計算困難性や、近似手法のコスト・制約という課題に取り組み、不確実性の定量化とデータ効率の両立を目指す。
-
Execution-State Capsules: Graph-Bound Execution-State Checkpoint and Restore for Low-Latency, Small-Batch, On-Device Physical-AI Serving小バッチ・低遅延なオンデバイスAI推論向けの実行状態保存復元機構本論文は、低遅延・小バッチ・オンデバイスの物理AIサービング向けに、グラフに束縛した実行状態のチェックポイントと復元を行う「Execution-State Capsules」を提案する。ページド/基数KVキャッシュが主に担う高スループット・高並列とは異なる領域を狙う。
-
LedgerAgent: Structured State for Policy-Adherent Tool-Calling Agents方針順守のツール呼び出しエージェントに構造化状態を与えるLedgerAgent顧客対応領域で方針を順守するツール呼び出しエージェントは、複数ターンにわたりタスク状態を保持する必要がある。LedgerAgentは構造化された状態管理によりこの課題に取り組む。
-
DeepSWIP: Quotient-WMC Counterfactuals for Neural Probabilistic Logic Programsニューラル確率論理プログラムの反事実推論手法DeepSWIPDeepProbLogのようなニューロシンボリック系はニューラル知覚と確率論理を組み合わせる。DeepSWIPはQuotient-WMCに基づく反事実推論を導入し、標準的推論の限界に対処する。
-
FlowEdit: Associative Memory for Lifelong Pronunciation Adaptation in Flow-Matching TTSフローマッチングTTSに生涯発音適応を与えるFlowEditフローマッチング音声合成は高いゼロショット品質を実現するが、展開後は静的になる。FlowEditは連想メモリを用いて生涯にわたる発音適応を可能にする。
-
Efficient and Sound Probabilistic Verification for AI AgentsAIエージェント向けの効率的で健全な確率的検証手法複雑なデジタル環境で動作するAIエージェントの安全確保が重要課題となるなか、実行時検証が求められる。本研究は効率的かつ健全な確率的検証の手法を提案する。
-
Marginal Advantage Accumulation for Memory-Driven Agent Self-Evolution記憶駆動エージェントの自己進化へ操作単位の優位性蓄積を提案本論文は、記憶駆動エージェントの自己進化に向け、バッチを横断して操作単位で証拠を蓄積する「限界優位性蓄積」を提案する。トレース蒸留で同じ記憶操作がバッチ間で矛盾するフィードバックを受ける問題に対処し、安定して有効な操作と偶然の当たりを区別することを狙う。
-
UltraQuant: 4-bit KV Caching for Context-Heavy Agents文脈の重いエージェント向け4ビットKVキャッシュUltraQuant文脈の重いエージェントはKVキャッシュに大きな負荷をかけ、長いプレフィックスが再利用される。UltraQuantは4ビット量子化によりKVキャッシュを圧縮する。
-
HEPTv2: End-to-End Efficient Point Transformer for Charged Particle Reconstruction荷電粒子の軌跡再構成に向けた効率的点群TransformerのHEPTv2本論文は、荷電粒子の飛跡再構成に向けたエンドツーエンドで効率的な点群Transformer「HEPTv2」を提案する。疎な検出器計測から軌跡を復元する高エネルギー物理の推論課題を扱い、高輝度LHC(HL-LHC)でも高精度と効率を両立することを目指す。
-
Neural network surrogates with uncertainty quantification for inverse problems in partial differential equationsPDE逆問題向けに不確実性を定量化するニューラル代理モデルを提案本論文は、偏微分方程式の逆問題に向けて、不確実性の定量化を備えたニューラルネットワーク代理モデルを構築する。ノイズや欠損を含む観測から未知のモデルパラメータを推定する課題を扱い、従来の数値計算がベイズ設定などで高コストになる問題への対処を狙う。
-
Rethinking Shrinkage Bias in LLM FP4 Pretraining: Geometric Origin, Systemic Impact, and UFP4 RecipeLLMのFP4事前学習の縮小バイアスを解明しUFP4レシピを提案FP4学習はLLM事前学習のメモリと計算を大幅に削減するが縮小バイアスが課題。その幾何学的起源と系全体への影響を解析し、UFP4レシピを示す。
-
AutoPass: Evidence-Guided LLM Agents for Compiler Performance Tuningコンパイラ性能調整を担う証拠誘導LLMエージェントAutoPassLLMはコードコンパイル作業に有望だが、実行時性能調整への適用は難しい。AutoPassは証拠誘導のLLMエージェントによりコンパイラ性能調整を行う。
-
Robust $Q$-learning for mean-field control under Wasserstein uncertainty in common noise共通ノイズ下の平均場制御に対する頑健Q学習本論文は共通ノイズを伴う離散時間の平均場制御問題に対し、ワッサースタイン不確実性の下で頑健なQ学習アルゴリズムを提案する。
-
SoftSkill: Behavioral Compression for Contextual Adaptation文脈適応のための行動圧縮手法SoftSkillエージェントのスキルは回答方針を符号化した自然言語のMarkdownとして配布されることが多い。SoftSkillは行動を圧縮し文脈適応を効率化する。
-
Token-Operations-Oriented Inference Optimization Techniques for Large Models大規模モデル推論を最適化するトークン操作指向の4層構成を提案本論文は、大規模モデルのサービスを拡張性・低コスト・高安定に支える推論最適化技術として、トークン操作を中心に据えた四層の技術アーキテクチャを初めて提案する。マルチモデル融合などの要素を層として組み込み、推論最適化を体系化する。
-
Navigating Unreliable Parametric and Contextual Knowledge: Explicit Knowledge Conflict Resolution for LLM InferenceLLM推論で信頼できない知識の衝突を明示的に解消する手法LLMは多様な言語課題で高性能だが、パラメトリック知識と文脈知識が矛盾し得る。本研究はその知識衝突を明示的に解消する手法を提案する。
-
HilDA: Hierarchical Distillation with Diffusion for Advancing Self-Supervised LiDAR Pre-trainin自己教師ありLiDAR事前学習を進める階層蒸留HilDA視覚基盤モデルを用いたカメラからLiDARへの知識蒸留は有望。HilDAは拡散を伴う階層蒸留により自己教師ありLiDAR事前学習を前進させる。
-
When Does Streaming Tool Use Help? Characterizing Tool-Intent Stabilization in Streaming Retrieval-Augmented GenerationストリーミングRAGでツール先行実行が効く条件を特徴づける本論文は、ユーザー入力の途中で並行してツール照会を発行し体感遅延を減らすストリーミングRAGにおいて、ツールの先行利用がいつ有効かを特徴づける。その利点は本質的にクエリ依存だと論じ、発話が完了する前にツールの意図がどう安定化するかを分析する。
-
HydraHead: From Head-Level Functional Heterogeneity to Specialized Attention Hybridizationヘッド単位で線形・フルアテンションを融合するHydraHead本論文は、ヘッド単位の機能的な異質性を活かして線形アテンションとフルアテンションを融合するハイブリッド設計「HydraHead」を提案する。多くのオープンソースのハイブリッドモデルが採る層単位の戦略を超え、長文脈処理に向けて両者を統合する難しさに対処する。
-
GEMS: Geometric Constraints Enable Multi-Semantic Superposition in LLMs幾何制約で複数意味の重ね合わせを可能にする操作手法GEMS本論文は、再学習なしに推論時の隠れ状態を操作するアクティベーション・ステアリングにおいて、幾何的な制約により複数の意味方向を重ね合わせ可能にする手法「GEMS」を提案する。単一方向の注入しか扱えない既存手法が、制約なしで複数方向を重ねると崩壊する問題に対処する。
-
Light-weight Pronunciation Assessment via Discrete Speech Token Surprisal離散音声トークンのサプライザルで軽量に発音評価を行う手法本論文は、離散音声トークンのサプライザル(予測のしにくさ)に基づく軽量な自動発音評価の枠組みを提案する。母語話者の音声資源のみで学習し、教師なし、または少数の採点済み発話による軽い較正で動作させることで、収集コストの高い学習者誤りや非母語コーパスへの依存を避ける。
-
Closing the Calibration Gap in Semantic Caching意味的キャッシュの較正ギャップを埋め配備判断を改善本論文は、意味的に類似するクエリにキャッシュ済み応答を返してLLMの推論コストを削減する「意味キャッシュ」における較正(calibration)のギャップに取り組む。スコアの順位付けのみを測り、固定しきい値での使用可否を無視するPR-AUCでの評価が、配備判断を体系的に誤らせることを示す。
-
Rethinking Reward Supervision: Rubric-Conditioned Self-Distillationルーブリック条件付き自己蒸留で推論モデルの報酬監督を見直す推論言語モデルの事後学習は、教師蒸留や検証可能報酬による強化学習で進められるが、蒸留は高価な思考過程の注釈に依存しがち。本研究は採点基準(ルーブリック)を条件とする自己蒸留を提案し、コストを抑えつつ報酬監督を再構築する手法を示す。
-
Diffusion-Proof: Recipe for Formal Theorem Proving Beyond Auto-Regressive Generation拡散モデルで形式定理証明、自己回帰生成を超える手法を提案大規模言語モデルの形式数学推論の強化は近年の重要テーマだが、多くは自己回帰生成に基づく。本研究は拡散モデルを用いた形式定理証明の手法「Diffusion-Proof」を提案し、従来の逐次生成とは異なる枠組みで証明探索を行う設計と学習レシピを示す。
-
Structured Inference with Large Language GibbsLLM の知識を Gibbs サンプリングで構造的推論に活用LLM に蓄えられた知識は、複雑な世界を表す変数に対する構造的推論の土台になり得るが、その知識を確率的に取り出すのは難しい。本研究は Gibbs サンプリングを用いて LLM 上で構造化推論を行う手法を提案し、変数間の関係を確率的に推論する枠組みを示す。
-
DreamReasoner-8B: Block-Size Curriculum Learning for Diffusion Reasoning ModelsDreamReasoner-8B、ブロックサイズ漸進学習で拡散推論を強化ブロック拡散言語モデルは並列なブロック単位のノイズ除去で復号を高速化するが、長い思考過程(CoT)推論へ安定に拡張できるかは未解決だった。本研究は DreamReasoner-8B を開発し、ブロックサイズのカリキュラム学習で拡散型推論モデルの長鎖推論を強化する。
-
Hardware- and Vision-in-the-Loop Validation of Deep Monocular Pose Estimation for Autonomous Maritime UAV Flight単眼姿勢推定を HIL/VIL 検証、艦上 UAV の自律飛行へ艦船上での UAV 自律運用には信頼できる視覚ベースの相対姿勢推定が要るが、洋上検証は高コストで天候依存・危険を伴う。本研究は深層単眼姿勢推定を、ハードウェアおよびビジョンを組み込んだループ(HIL/VIL)で検証する手法を提示し、安全な開発を支援する。
-
Essential Subspace Merging for Multi-Task Learning本質部分空間のマージでマルチタスク学習を実現するモデル統合モデルマージは、同一の事前学習チェックポイントから微調整した複数モデルの能力を一つに統合し、マルチタスク学習を可能にする。本研究は各タスクに本質的な部分空間を抽出して統合する「Essential Subspace Merging」を提案し、干渉を抑えつつ多タスク性能を引き出す。
-
The Reward Was in Your Data All Along: Correcting Flow Matching with Discriminator-Guided RL識別器誘導 RL で Flow Matching を補正、報酬はデータ内にスコアマッチングやフローマッチングのモデルは、主観的な選好への整合と、意外にも特定の性質の回復のために、選好ベース強化学習に頼ることが多い。本研究は「報酬は最初からデータの中にあった」とし、識別器(discriminator)誘導の RL でフローマッチングを補正する手法を提案する。