推論・効率化 A
121 件中 31〜60 件目を表示
-
Equivariant Graph Neural Networks Improve Optical Spectra Prediction for Materials Screening等変 GNN で材料スクリーニングの光学スペクトル予測を改善光学スペクトルの大規模予測は、太陽電池など光電子応用の高スループット材料探索で重要だ。既存の代理モデルは低精度の計算で得たスペクトルで学習されがち。本研究は等変(equivariant)グラフニューラルネットワークを用い、材料スクリーニング向けの光学スペクトル予測を改善する。
-
Seeing Before Reasoning: Decoupling Perception and Reasoning for Shortcut-Resilient Multimodal On-Policy Self-Distillation知覚と推論を分離し、近道に強い多モーダル自己蒸留を実現オンポリシー自己蒸留(OPSD)は、モデル自身のロールアウトで学習し、凍結した複製が参照目標に条件づけた密なトークン目標を与える。本研究は知覚と推論を分離する「Seeing Before Reasoning」を提案し、ショートカット(近道学習)に頑健な多モーダル OPSD を実現する。
-
Wasserstein Policy Learning for Distributional Outcomes分布的アウトカム向けの Wasserstein 方策学習を提案オフライン方策学習は因果推論で注目され、共変量から治療への写像(個別化治療規則)として経験的な成果を最大化する方策を学ぶ。本研究は分布的アウトカム(distributional outcomes)を対象に、Wasserstein 距離に基づく方策学習を提案し、結果の分布全体を考慮した意思決定を可能にする。
-
JourneyFormer: Encoding Airbnb Guest Journey with Sequence ModelingJourneyFormer、系列モデリングで Airbnb 宿泊客の行動を符号化系列モデリングは、利用者の過去の行動を捉え意図を推定できることから推薦・ランキングで普及している。本研究は Airbnb のゲストの一連の行動(ゲストジャーニー)を系列モデルで符号化する「JourneyFormer」を提案し、予約に至る行動理解と推薦の改善を図る。
-
ARIADNE: Agnostic Routing for Inference-time Adapter DyNamic sElectionARIADNE、推論時にアダプタを動的選択する汎用ルーティングパラメータ効率の良い微調整(PEFT)の普及で、単一のバックボーンに多数のタスク特化アダプタを組み合わせるモデル生態系が生まれている。本研究は「ARIADNE」を提案し、推論時に入力へ応じて適切なアダプタを動的に選ぶ、モデル非依存(agnostic)なルーティング機構を実現する。
-
RODS: Reward-Driven Online Data Synthesis for Multi-Turn Tool-Use AgentsRODS、報酬駆動のオンラインデータ合成で多ターンツール利用を強化多ターンのツール利用 RL は、静的データセットで有益なサンプルが急速に枯渇することが律速となる。本研究は GRPO の勾配信号が特定タスクに集中する観察に基づき、報酬駆動でオンラインにデータを合成する「RODS」を提案。学習に効くサンプルを継続的に供給する。
-
FoMoE: Breaking the Full-Replica Barrier with a Federation of MoEsFoMoE、MoE の連邦化で完全複製の壁を破る LLM 事前学習LLM の事前学習は通常、密結合したアクセラレータからなる大規模インフラを要する。モデルとデータの規模拡大が進む中、本研究は「FoMoE」を提案し、Mixture-of-Experts を連邦(federation)として連携させることで、全パラメータの完全複製を不要にし学習基盤の制約を緩和する。
-
Decoupling Search from Reasoning: A Vendor-Agnostic Grounding Architecture for LLM Agents検索と推論を分離するベンダー非依存のLLMエージェント基盤本番のLLMエージェントはリアルタイム検索に依存するが、各社固有のグラウンディングに縛られやすい。本研究は検索と推論を分離し、ベンダーに依存しないグラウンディング基盤を提案することで、検索基盤を差し替え可能にしつつ推論の質を保つ。
-
Graph-ESBMC-PLC: Formal Verification of Graphical PLCopen XML Ladder Diagram Programs Using SMT-Based Model CheckingPLCopen XMLラダー図をSMTで形式検証する手法PLCopen XMLはIEC 61131-3のラダー図に二つの符号化形式を定める。本研究はSMTに基づくモデル検査を用い、グラフィカルなPLCopen XMLラダー図プログラムを形式的に検証する手法Graph-ESBMC-PLCを提案し、産業制御ソフトの正当性検証を支援する。
-
REVES: REvision and VErification--Augmented Training for Test-Time Scaling逐次修正によるテスト時スケーリングを強化する「REVES」逐次的に出力を修正するテスト時スケーリングは有力な手法として注目される。REVESは修正と検証を組み込んだ訓練法を提案し、モデルが自らの出力を見直し検証する能力を高めることで、テスト時の追加計算をより効果的に性能向上へ結び付ける。
-
Learning Robust Pair Confidence for Multimodal Emotion-Cause Pair Extractionマルチモーダル感情原因対抽出の対の信頼度を頑健に学習マルチモーダル感情原因対抽出(MECPE)は、感情とその原因の対を信頼性高く特定する必要がある。本研究は対の信頼度を頑健に学習する手法を提案し、ノイズや曖昧さに強い感情原因対の抽出を実現する。
-
Improving Medical Communication using Rubric-Guided Counterfactual Recommendationsルーブリック指針の反実仮想提案で医療コミュニケーション改善テキストベースの遠隔医療は軽量な患者フィードバックに依存することが増えている。本研究はルーブリックに沿った反実仮想的な推奨を提示することで、より良い医療コミュニケーションを支援し、患者と医療者のやり取りの質を高める手法を提案する。
-
Efficient Financial Language Understanding via Distillation with Synthetic Data合成データ蒸留で効率的な金融言語理解を実現指示追従型の大規模モデルは強力だが運用コストが高く、特に金融分野での展開は負担が大きい。本研究は合成データを用いた蒸留により、軽量でも金融言語を効率的に理解できるモデルを構築する手法を提案する。
-
Approximate Structured Diffusion for Sequence Labelling系列ラベリング向け近似構造化拡散モデル系列ラベリングは自然言語処理の中核的なタスクである。本研究は構造化された拡散モデルを近似的に適用する手法を提案し、ラベル間の依存関係を考慮しながら効率的に系列ラベリングを行うことを目指す。
-
Beyond Scalar Scores: Exploring LLM-based Metrics for Clinical Significance Evaluation in Radiology Reports放射線レポートの臨床的意義をLLM指標で評価生成された放射線レポートの信頼できる評価には厳密な臨床的妥当性が求められる。本研究は単純なスカラースコアを超え、臨床的意義を評価するLLMベースの指標を検討し、レポート生成の品質をより臨床に即して測ることを目指す。
-
Lost in a Single Vector: Improving Long-Document Retrieval with Chunk Evidence Aggregationチャンク証拠集約で長文書検索を改善密ベクトル検索は一つのクエリベクトルと一つの文書ベクトルを照合するが、長文書では情報が単一ベクトルに埋もれてしまう。本研究は文書をチャンクに分け、各チャンクの証拠を集約することで長文書検索の精度を高める手法を提案する。
-
Morpheus: A Morphology-Aware Neural Tokenizer and Word Embedder for Turkishトルコ語向け形態素対応トークナイザ「Morpheus」トルコ語は膠着語で、意味は形態素によって担われるが、一般的なサブワード分割はこれを十分に捉えられない。Morpheusは形態素を意識したニューラルなトークナイザと単語埋め込みを提案し、トルコ語処理の精度向上を図る。
-
LLM Serving Fairness: No more noisy neighboursCohere、マルチテナント LLM 提供で計算資源の公平配分を実現Cohere は、LLM 提供基盤で各テナントが計算資源を公平に得られるようにする仕組みを解説した。特定利用者が資源を占有する「ノイジーネイバー」問題を抑え、全テナントに公平な処理能力を割り当てる設計を紹介。安定したマルチテナント運用の実現を狙う。
-
東芝の組み込み向け量子インスパイアード技術が進化、高速化と安定性を両立東芝、組み合わせ最適化を高速・安定に解く組み込み向け量子インスパイアード技術を開発東芝は、状況が刻々と変化する現実環境でも組み合わせ最適化問題を高速かつ安定して解ける「量子インスパイアード最適化フレームワーク」を開発したと発表した。組み込み用途を想定し、従来手法に対する高速化と安定性の両立を図るという。具体的な性能数値や効果は東芝の発表に基づくもので、第三者による検証は未確認。
-
Visual Verification Enables Inference-time Steering and Autonomous Policy Improvement汎用ロボット方策を推論時に検証・自己改善する枠組みVERITASを提案汎用ロボット方策を生成器とし、勾配を使わない視覚検証器が推論時に各行動を評価する生成器・検証器フレームワークVERITASを提案する論文。追加学習なしで推論時に方策を誘導して性能を高め、自律的な方策改善も可能になると論じる。
-
Variable-Width Transformers幅可変Transformer、層ごとに幅を変え22%省FLOPs層ごとの計算的役割の違いに着目し、序盤と終盤を広く中盤を狭める×字型のTransformerを提案。パラメータ不要の残差リサイズ機構を用い、200M〜2BおよびMoE 3Bで幅一定のベースラインを上回り、同等性能で約22%のFLOPs削減とKVキャッシュ縮小を実現したと報告する。
-
Zone of Proximal Policy Optimization: Teacher in Prompts, Not Gradients勾配でなくプロンプトで教師を使う近接方策最適化知識蒸留は小さな生徒モデルで脆く、大教師のロジット模倣は鋭いモードに集中し汎化を損なう。本研究は教師を勾配ではなくプロンプト内で活用する近接方策最適化(ZPPO)を提案し、小生徒域での汎化改善を狙う。
-
Rethinking Dataset Distillation for Classification: Do Distilled Sets Outperform Coresets?分類のデータセット蒸留はコアセットを超えるか検証データセット蒸留はコンパクトな訓練集合を合成しデータ中心の機械学習を効率化する。本論文は分類タスクで蒸留集合が実データ部分集合(コアセット)を本当に上回るのかを再検討し、その条件を問う。
-
RubricsTree: Scalable and Evolving Open-Ended Evaluation of Personal Health Agents across Health Memory and Medical SkillsRubricsTree、個人健康エージェントの開放型評価を拡張センサ指標を伴うLLMの個人健康エージェントは医療格差緩和に期待されるが、開放型評価のボトルネックが大規模臨床展開を妨げる。RubricsTreeは健康メモリと医療スキルにまたがるスケーラブルで進化的な開放型評価を提案する。
-
Learning from the Self-future: On-policy Self-distillation for dLLMs拡散LLM向けのオンポリシー自己蒸留OPSDを探究オンポリシー自己蒸留(OPSD)はLLMの事後訓練に有効だが拡散LLM(dLLM)への応用は未開拓。既存OPSDは自己回帰中心で左から右への接頭辞条件付けに依存しており、拡散LLMに適した自己蒸留の在り方を検討する。
-
Kolmogorov Regression for Robust Diffusion Policiesコルモゴロフ回帰で頑健な拡散方策を学習有限次元の拡散方策は離散化由来の時間ドリフトで長期性能が劣化する。本研究は後退コルモゴロフ方程式により拡散方策をキャメロン・マルティン空間へ引き上げ、確率的要素を扱い頑健化する手法を提案する。
-
Knowledge Reutilization in Meta-Reinforcement Learningメタ強化学習で知識を再利用する転移フレームワークを提案既存のメタ強化学習が課題推論と身体固有の制御を結合しがちな点に着目し、簡略化したエージェントで課題レベルの知識を学び異種エージェントへ転移する枠組みを提案する論文。ベイズ非パラメトリック事前分布で潜在課題モードを整理すると述べる。
-
Embedded Machine Learning for Microcontroller-Class Edge Devices: Data, Feature, Evaluation, and Deployment Pipelinesマイコン級エッジ向け組込み機械学習のパイプライン総説組込み機械学習は推論をクラウドから資源制約デバイスへ移す。本稿はマイコン級プラットフォーム向けに、データ取得・特徴量・評価・展開までの一連のワークフローを体系的に整理した実務志向の総説を示す。
-
Ternary Mamba: Grouped Quantization-Aware Training of W1.58A16 State Space ModelsTernary Mamba、1.58ビット重みのQATで状態空間を量子化状態空間モデルMambaに対し、重みを三値(W1.58)・活性を16ビットとする量子化認識訓練(QAT)をグループ単位で行うTernary Mambaを提案。低ビットでの効率的な系列モデルの学習・推論を狙う。
-
Querying an astronomical database using large language models: the ALeRCE text-to-SQL systemLLMで天文DBを問い合わせるtext-to-SQLシステムを開発LLMと文脈内学習に基づくtext-to-SQLシステムを開発し、天文ブローカーALeRCEのデータベースに適用した論文。自然言語の問い合わせから実行可能なSQLを生成し、110組の自然言語・SQL対データで段階的生成手法を評価すると述べる。