推論・効率化 A

121 件中 31〜60 件目を表示
  • arXiv cs.AI (Artificial Intelligence) · EN 推論・効率化 抜粋
    Equivariant Graph Neural Networks Improve Optical Spectra Prediction for Materials Screening
    等変 GNN で材料スクリーニングの光学スペクトル予測を改善
    ニューラルネットワーク
    光学スペクトルの大規模予測は、太陽電池など光電子応用の高スループット材料探索で重要だ。既存の代理モデルは低精度の計算で得たスペクトルで学習されがち。本研究は等変(equivariant)グラフニューラルネットワークを用い、材料スクリーニング向けの光学スペクトル予測を改善する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.LG (Machine Learning) · EN マルチモーダル 抜粋
    Seeing Before Reasoning: Decoupling Perception and Reasoning for Shortcut-Resilient Multimodal On-Policy Self-Distillation
    知覚と推論を分離し、近道に強い多モーダル自己蒸留を実現
    コンピュータビジョン 機械学習 ソフトウェア工学
    オンポリシー自己蒸留(OPSD)は、モデル自身のロールアウトで学習し、凍結した複製が参照目標に条件づけた密なトークン目標を与える。本研究は知覚と推論を分離する「Seeing Before Reasoning」を提案し、ショートカット(近道学習)に頑健な多モーダル OPSD を実現する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN 推論・効率化 抜粋
    Wasserstein Policy Learning for Distributional Outcomes
    分布的アウトカム向けの Wasserstein 方策学習を提案
    深層学習 推論 (Inference)
    オフライン方策学習は因果推論で注目され、共変量から治療への写像(個別化治療規則)として経験的な成果を最大化する方策を学ぶ。本研究は分布的アウトカム(distributional outcomes)を対象に、Wasserstein 距離に基づく方策学習を提案し、結果の分布全体を考慮した意思決定を可能にする。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN 業界導入・応用 抜粋
    JourneyFormer: Encoding Airbnb Guest Journey with Sequence Modeling
    JourneyFormer、系列モデリングで Airbnb 宿泊客の行動を符号化
    アルゴリズム・理論 埋め込み (Embeddings) 推論 (Inference)
    系列モデリングは、利用者の過去の行動を捉え意図を推定できることから推薦・ランキングで普及している。本研究は Airbnb のゲストの一連の行動(ゲストジャーニー)を系列モデルで符号化する「JourneyFormer」を提案し、予約に至る行動理解と推薦の改善を図る。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 新モデル・リリース 抜粋
    ARIADNE: Agnostic Routing for Inference-time Adapter DyNamic sElection
    ARIADNE、推論時にアダプタを動的選択する汎用ルーティング
    埋め込み (Embeddings) ファインチューニング 推論 (Inference) Llama 検索拡張生成 (RAG)
    パラメータ効率の良い微調整(PEFT)の普及で、単一のバックボーンに多数のタスク特化アダプタを組み合わせるモデル生態系が生まれている。本研究は「ARIADNE」を提案し、推論時に入力へ応じて適切なアダプタを動的に選ぶ、モデル非依存(agnostic)なルーティング機構を実現する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 開発者ツール 抜粋
    RODS: Reward-Driven Online Data Synthesis for Multi-Turn Tool-Use Agents
    RODS、報酬駆動のオンラインデータ合成で多ターンツール利用を強化
    AI エージェント 推論 (Inference) 強化学習
    多ターンのツール利用 RL は、静的データセットで有益なサンプルが急速に枯渇することが律速となる。本研究は GRPO の勾配信号が特定タスクに集中する観察に基づき、報酬駆動でオンラインにデータを合成する「RODS」を提案。学習に効くサンプルを継続的に供給する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN インフラ・ハードウェア 抜粋
    FoMoE: Breaking the Full-Replica Barrier with a Federation of MoEs
    FoMoE、MoE の連邦化で完全複製の壁を破る LLM 事前学習
    Mixture of Experts (MoE) ニューラルネットワーク
    LLM の事前学習は通常、密結合したアクセラレータからなる大規模インフラを要する。モデルとデータの規模拡大が進む中、本研究は「FoMoE」を提案し、Mixture-of-Experts を連邦(federation)として連携させることで、全パラメータの完全複製を不要にし学習基盤の制約を緩和する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 推論・効率化 抜粋
    Decoupling Search from Reasoning: A Vendor-Agnostic Grounding Architecture for LLM Agents
    検索と推論を分離するベンダー非依存のLLMエージェント基盤
    AI エージェント 深層学習 Model Context Protocol (MCP) 強化学習 ソフトウェア工学
    本番のLLMエージェントはリアルタイム検索に依存するが、各社固有のグラウンディングに縛られやすい。本研究は検索と推論を分離し、ベンダーに依存しないグラウンディング基盤を提案することで、検索基盤を差し替え可能にしつつ推論の質を保つ。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.CL (Computation and Language) · EN 安全性・評価 抜粋
    Graph-ESBMC-PLC: Formal Verification of Graphical PLCopen XML Ladder Diagram Programs Using SMT-Based Model Checking
    PLCopen XMLラダー図をSMTで形式検証する手法
    推論 (Inference) 機械学習 ニューラルネットワーク
    PLCopen XMLはIEC 61131-3のラダー図に二つの符号化形式を定める。本研究はSMTに基づくモデル検査を用い、グラフィカルなPLCopen XMLラダー図プログラムを形式的に検証する手法Graph-ESBMC-PLCを提案し、産業制御ソフトの正当性検証を支援する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 推論・効率化 抜粋
    REVES: REvision and VErification--Augmented Training for Test-Time Scaling
    逐次修正によるテスト時スケーリングを強化する「REVES」
    推論 (Inference) 強化学習 ソフトウェア工学
    逐次的に出力を修正するテスト時スケーリングは有力な手法として注目される。REVESは修正と検証を組み込んだ訓練法を提案し、モデルが自らの出力を見直し検証する能力を高めることで、テスト時の追加計算をより効果的に性能向上へ結び付ける。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 開発者ツール 抜粋
    Learning Robust Pair Confidence for Multimodal Emotion-Cause Pair Extraction
    マルチモーダル感情原因対抽出の対の信頼度を頑健に学習
    推論 (Inference) 検索拡張生成 (RAG)
    マルチモーダル感情原因対抽出(MECPE)は、感情とその原因の対を信頼性高く特定する必要がある。本研究は対の信頼度を頑健に学習する手法を提案し、ノイズや曖昧さに強い感情原因対の抽出を実現する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 新モデル・リリース 抜粋
    Improving Medical Communication using Rubric-Guided Counterfactual Recommendations
    ルーブリック指針の反実仮想提案で医療コミュニケーション改善
    推論 (Inference) Meta
    テキストベースの遠隔医療は軽量な患者フィードバックに依存することが増えている。本研究はルーブリックに沿った反実仮想的な推奨を提示することで、より良い医療コミュニケーションを支援し、患者と医療者のやり取りの質を高める手法を提案する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 推論・効率化 抜粋
    Efficient Financial Language Understanding via Distillation with Synthetic Data
    合成データ蒸留で効率的な金融言語理解を実現
    ニューラルネットワーク 自然言語処理 (NLP) 強化学習
    指示追従型の大規模モデルは強力だが運用コストが高く、特に金融分野での展開は負担が大きい。本研究は合成データを用いた蒸留により、軽量でも金融言語を効率的に理解できるモデルを構築する手法を提案する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 推論・効率化 抜粋
    Approximate Structured Diffusion for Sequence Labelling
    系列ラベリング向け近似構造化拡散モデル
    推論 (Inference) 機械学習 ニューラルネットワーク 自然言語処理 (NLP) 検索拡張生成 (RAG)
    系列ラベリングは自然言語処理の中核的なタスクである。本研究は構造化された拡散モデルを近似的に適用する手法を提案し、ラベル間の依存関係を考慮しながら効率的に系列ラベリングを行うことを目指す。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 安全性・評価 抜粋
    Beyond Scalar Scores: Exploring LLM-based Metrics for Clinical Significance Evaluation in Radiology Reports
    放射線レポートの臨床的意義をLLM指標で評価
    推論 (Inference) 機械学習
    生成された放射線レポートの信頼できる評価には厳密な臨床的妥当性が求められる。本研究は単純なスカラースコアを超え、臨床的意義を評価するLLMベースの指標を検討し、レポート生成の品質をより臨床に即して測ることを目指す。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 新モデル・リリース 抜粋
    Lost in a Single Vector: Improving Long-Document Retrieval with Chunk Evidence Aggregation
    チャンク証拠集約で長文書検索を改善
    深層学習 推論 (Inference) 強化学習
    密ベクトル検索は一つのクエリベクトルと一つの文書ベクトルを照合するが、長文書では情報が単一ベクトルに埋もれてしまう。本研究は文書をチャンクに分け、各チャンクの証拠を集約することで長文書検索の精度を高める手法を提案する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN インフラ・ハードウェア 抜粋
    Morpheus: A Morphology-Aware Neural Tokenizer and Word Embedder for Turkish
    トルコ語向け形態素対応トークナイザ「Morpheus」
    埋め込み (Embeddings) 推論 (Inference) 検索拡張生成 (RAG)
    トルコ語は膠着語で、意味は形態素によって担われるが、一般的なサブワード分割はこれを十分に捉えられない。Morpheusは形態素を意識したニューラルなトークナイザと単語埋め込みを提案し、トルコ語処理の精度向上を図る。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • Cohere Blog · EN 推論・効率化 抜粋
    LLM Serving Fairness: No more noisy neighbours
    Cohere、マルチテナント LLM 提供で計算資源の公平配分を実現
    深層学習 推論 (Inference) Meta ニューラルネットワーク 強化学習
    Cohere は、LLM 提供基盤で各テナントが計算資源を公平に得られるようにする仕組みを解説した。特定利用者が資源を占有する「ノイジーネイバー」問題を抑え、全テナントに公平な処理能力を割り当てる設計を紹介。安定したマルチテナント運用の実現を狙う。
    元記事を読む (Cohere Blog) ↗
  • ITmedia AI+ · JA 推論・効率化 抜粋
    東芝の組み込み向け量子インスパイアード技術が進化、高速化と安定性を両立
    東芝、組み合わせ最適化を高速・安定に解く組み込み向け量子インスパイアード技術を開発
    東芝は、状況が刻々と変化する現実環境でも組み合わせ最適化問題を高速かつ安定して解ける「量子インスパイアード最適化フレームワーク」を開発したと発表した。組み込み用途を想定し、従来手法に対する高速化と安定性の両立を図るという。具体的な性能数値や効果は東芝の発表に基づくもので、第三者による検証は未確認。
    元記事を読む (ITmedia AI+) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 業界導入・応用 抜粋
    Visual Verification Enables Inference-time Steering and Autonomous Policy Improvement
    汎用ロボット方策を推論時に検証・自己改善する枠組みVERITASを提案
    推論 (Inference) 強化学習
    汎用ロボット方策を生成器とし、勾配を使わない視覚検証器が推論時に各行動を評価する生成器・検証器フレームワークVERITASを提案する論文。追加学習なしで推論時に方策を誘導して性能を高め、自律的な方策改善も可能になると論じる。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.CL (Computation and Language) · EN 推論・効率化 抜粋
    Variable-Width Transformers
    幅可変Transformer、層ごとに幅を変え22%省FLOPs
    深層学習 Mixture of Experts (MoE) 検索拡張生成 (RAG) 強化学習 Transformer
    層ごとの計算的役割の違いに着目し、序盤と終盤を広く中盤を狭める×字型のTransformerを提案。パラメータ不要の残差リサイズ機構を用い、200M〜2BおよびMoE 3Bで幅一定のベースラインを上回り、同等性能で約22%のFLOPs削減とKVキャッシュ縮小を実現したと報告する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 新モデル・リリース 抜粋
    Zone of Proximal Policy Optimization: Teacher in Prompts, Not Gradients
    勾配でなくプロンプトで教師を使う近接方策最適化
    強化学習
    知識蒸留は小さな生徒モデルで脆く、大教師のロジット模倣は鋭いモードに集中し汎化を損なう。本研究は教師を勾配ではなくプロンプト内で活用する近接方策最適化(ZPPO)を提案し、小生徒域での汎化改善を狙う。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.LG (Machine Learning) · EN 推論・効率化 抜粋
    Rethinking Dataset Distillation for Classification: Do Distilled Sets Outperform Coresets?
    分類のデータセット蒸留はコアセットを超えるか検証
    機械学習 検索拡張生成 (RAG)
    データセット蒸留はコンパクトな訓練集合を合成しデータ中心の機械学習を効率化する。本論文は分類タスクで蒸留集合が実データ部分集合(コアセット)を本当に上回るのかを再検討し、その条件を問う。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.CL (Computation and Language) · EN 安全性・評価 抜粋
    RubricsTree: Scalable and Evolving Open-Ended Evaluation of Personal Health Agents across Health Memory and Medical Skills
    RubricsTree、個人健康エージェントの開放型評価を拡張
    AI エージェント Gemini GPT Meta ニューラルネットワーク
    センサ指標を伴うLLMの個人健康エージェントは医療格差緩和に期待されるが、開放型評価のボトルネックが大規模臨床展開を妨げる。RubricsTreeは健康メモリと医療スキルにまたがるスケーラブルで進化的な開放型評価を提案する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 新モデル・リリース 抜粋
    Learning from the Self-future: On-policy Self-distillation for dLLMs
    拡散LLM向けのオンポリシー自己蒸留OPSDを探究
    深層学習 ファインチューニング 強化学習 ソフトウェア工学
    オンポリシー自己蒸留(OPSD)はLLMの事後訓練に有効だが拡散LLM(dLLM)への応用は未開拓。既存OPSDは自己回帰中心で左から右への接頭辞条件付けに依存しており、拡散LLMに適した自己蒸留の在り方を検討する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.LG (Machine Learning) · EN 新モデル・リリース 抜粋
    Kolmogorov Regression for Robust Diffusion Policies
    コルモゴロフ回帰で頑健な拡散方策を学習
    推論 (Inference) ニューラルネットワーク 強化学習
    有限次元の拡散方策は離散化由来の時間ドリフトで長期性能が劣化する。本研究は後退コルモゴロフ方程式により拡散方策をキャメロン・マルティン空間へ引き上げ、確率的要素を扱い頑健化する手法を提案する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 新モデル・リリース 抜粋
    Knowledge Reutilization in Meta-Reinforcement Learning
    メタ強化学習で知識を再利用する転移フレームワークを提案
    AI エージェント 推論 (Inference) Meta 強化学習
    既存のメタ強化学習が課題推論と身体固有の制御を結合しがちな点に着目し、簡略化したエージェントで課題レベルの知識を学び異種エージェントへ転移する枠組みを提案する論文。ベイズ非パラメトリック事前分布で潜在課題モードを整理すると述べる。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.LG (Machine Learning) · EN 推論・効率化 抜粋
    Embedded Machine Learning for Microcontroller-Class Edge Devices: Data, Feature, Evaluation, and Deployment Pipelines
    マイコン級エッジ向け組込み機械学習のパイプライン総説
    推論 (Inference) 機械学習 量子化
    組込み機械学習は推論をクラウドから資源制約デバイスへ移す。本稿はマイコン級プラットフォーム向けに、データ取得・特徴量・評価・展開までの一連のワークフローを体系的に整理した実務志向の総説を示す。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN 推論・効率化 抜粋
    Ternary Mamba: Grouped Quantization-Aware Training of W1.58A16 State Space Models
    Ternary Mamba、1.58ビット重みのQATで状態空間を量子化
    推論 (Inference) 量子化 検索拡張生成 (RAG) Transformer
    状態空間モデルMambaに対し、重みを三値(W1.58)・活性を16ビットとする量子化認識訓練(QAT)をグループ単位で行うTernary Mambaを提案。低ビットでの効率的な系列モデルの学習・推論を狙う。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 新モデル・リリース 抜粋
    Querying an astronomical database using large language models: the ALeRCE text-to-SQL system
    LLMで天文DBを問い合わせるtext-to-SQLシステムを開発
    Claude Gemini GPT 推論 (Inference)
    LLMと文脈内学習に基づくtext-to-SQLシステムを開発し、天文ブローカーALeRCEのデータベースに適用した論文。自然言語の問い合わせから実行可能なSQLを生成し、110組の自然言語・SQL対データで段階的生成手法を評価すると述べる。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗