推論・効率化 A

121 件中 91〜120 件目を表示
  • arXiv cs.LG (Machine Learning) · EN 推論・効率化 抜粋
    Beyond the Smile: A Hybrid Convolutional VAE for Crypto Volatility Surfaces
    暗号資産のボラティリティ曲面を補完する畳み込みVAE手法を提案
    推論 (Inference) ニューラルネットワーク 検索拡張生成 (RAG) 強化学習
    本研究は、暗号資産のインプライド・ボラティリティ曲面向けに畳み込み変分オートエンコーダ(VAE)を提案し、テナーごとの決定論的ルーティングで二次スマイル再フィットと組み合わせた予測器を構築した。2023年5〜10月のBTC・ETHの時間足オプション曲面6,034件で学習し、欠損セル補完のRMSEは0.94〜1.56ボラティリティポイント。50%マスク時、ハイブリッド予測器は0.83ポイントとスマイル再フィット単独の7.00から約8分の1へ改善したとする。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • NVIDIA Developer Blog · EN 開発者ツール 抜粋
    Boosting MoE Training Throughput with Advanced Fusion Kernels
    NVIDIA、融合カーネルでMoE学習スループットを向上
    深層学習 生成 AI 機械学習 Mixture of Experts (MoE) NVIDIA
    NVIDIAが開発者ブログで、Mixture-of-Experts(MoE)モデルの学習スループットを高める高度な融合カーネル(fusion kernels)の手法を解説した。MoEは大規模AIシステムの基盤的構成要素として急速に普及しており、本記事は学習処理の効率化に向けたカーネルレベルの最適化アプローチを紹介する内容とみられる。
    元記事を読む (NVIDIA Developer Blog) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 推論・効率化 抜粋
    A Causal Model of Theory of Mind in Conflict for Artificial Intelligence
    対立場面で心の理論をいつ働かせるべきかを定式化する構造的因果モデルを提案
    推論 (Inference)
    心の理論(ToM)は他者に心的状態を帰属し予測・推論に用いる能力で、人と機械の統合に不可欠とされる。既存の AI-ToM モデルは「どう」心を読むかを扱うが、「いつ」働かせるべきかはほぼ未解明だった。本論文は、対立においてどの状況・エージェント条件下で ToM の関与が因果的に正当化されるかを問い、ToM を常時稼働ではなく状況・エージェント条件で起動する機構として有向非巡回グラフ(DAG)による構造的因果モデルで定式化すると述べる。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.CL (Computation and Language) · EN 推論・効率化 抜粋
    Exploring Extrinsic and Intrinsic Properties for Effective Reasoning with Code Interpreter
    コードインタープリタ推論を支える内在・外在特性を分析した論文
    ファインチューニング 推論 (Inference) 検索拡張生成 (RAG) 強化学習
    コードインタープリタ(CI)を用いた LLM 推論について、外在特性(重要トークン)と内在特性(コード固有の認知的振る舞い)の二つの観点から分析した論文。著者らは、より強い CI 推論モデルほど重要トークンや、検証・バックトラッキング・後ろ向き連鎖といった認知的振る舞いが多く現れると報告し、これらを推論時・学習時に活用する方法を検討したと論じる。abstract ベースの中立要約。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 推論・効率化 抜粋
    RAID: Semantic Graph Diffusion for True Cold-Start and Cross-Lingual Forecasting
    コールドスタート・多言語予測向け検索拡張拡散フレームワーク RAID を提案
    埋め込み (Embeddings) 推論 (Inference) Meta 検索拡張生成 (RAG)
    時系列基盤モデルは履歴窓があれば高い転移性能を示すが、新規アイテムに過去観測が無い真のコールドスタートではその前提が崩れる。本研究は履歴ベースの相関学習に代えて、メタデータ駆動の意味検索とグラフ条件付き拡散を用いる RAID(Retrieval-Augmented Iterative Diffusion)を提案。凍結した多言語埋め込みでテキストメタデータを共有意味空間へ写像し、未見アイテムにも拡張する帰納的検索グラフを構築。意味的に近い近傍から基礎予測を作り反復的に精緻化すると述べる。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 安全性・評価 抜粋
    MA-SBI: Misspecification-Aware Simulation-Based Inference via Side-Channel Guidance
    シミュレータ誤設定に頑健な推論 MA-SBI を提案、副次情報で較正不要に
    推論 (Inference) ニューラルネットワーク 強化学習
    シミュレーションベース推論(SBI)は、モデル簡略化に起因するシミュレータの誤設定(実観測との乖離)に悩まされる。頑健 SBI の最新手法 RoPE は実・模擬観測の表現間の最適輸送で対処するが、SBI が必要な場面では入手困難な真値パラメータの較正ペアを要する。実務者が持つのは体制ラベルや指示テキスト、政策公報など非構造の副次情報である。本研究はこれを活用する誤設定考慮型推論 MA-SBI を提案すると述べる。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.CL (Computation and Language) · EN 推論・効率化 抜粋
    LESS Is More: Mutual-Stability Sampling for Diffusion Language Models
    拡散言語モデル向け学習不要の適応サンプラ『LESS』を提案
    深層学習 推論 (Inference) ニューラルネットワーク 検索拡張生成 (RAG) Transformer
    拡散大規模言語モデル(dLLM)の効率を高める、学習不要・モデル非依存の適応的サンプラ『LESS』を提案した論文。トークン確定を逐次的な停止問題として扱い、top-1 予測の確信度・持続性・分布安定性を組み合わせた相互安定性ルールで、未確定位置の解除可否を判断するとする。Dream-7B や LLaDA-8B などで評価したと述べる。abstract ベースの中立要約。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 推論・効率化 抜粋
    Binary Tracking for Spatial QA and Navigation with Open Vision-Language Models
    オープン VLM で動く空間質問応答・ナビ手法 Binary Tracking を提案
    AI エージェント コンピュータビジョン GPT 推論 (Inference) 検索拡張生成 (RAG)
    サービスロボットが長い一人称視点の経路を移動する際の空間質問応答を扱う。「帰り道でクリーニング店はどこか」といった問いに対し、後段のナビが利用できる距離座標を返す。従来は GPT-4o 等のクローズドモデルに依存する検索拡張エージェントが主流だが、ネットワーク不安定・遅延・コストの面で実環境では信頼しにくい。本研究はロボット搭載で動作するオープンソースベースの空間質問応答を目指し、Binary Tracking を提案すると述べる。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.CL (Computation and Language) · EN 推論・効率化 抜粋
    Follow the Latent Roadmap: Navigating Revocable Decoding for Diffusion LLMs with Anchor Tokens
    拡散 LLM のリボーカブル復号をアンカートークンで誘導し誤り伝播を抑制
    深層学習 埋め込み (Embeddings) 推論 (Inference) 検索拡張生成 (RAG) 音声処理
    並列生成が可能な拡散大規模言語モデル(dLLM)で、復号速度と品質のトレードオフや誤り伝播・remask の課題に対し、アンカートークンで潜在的な「ロードマップ」をたどるリボーカブル復号手法を提案する arxiv 論文。混在品質コンテキストでの 2 つの失敗様式を緩和すると論じる(abstract ベースの中立要約)。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 新モデル・リリース 抜粋
    Tying the Loop -- Tied Expert Layers in Mixture-of-Experts Language Models
    MoE で専門家パラメータを層間共有する手法を提案する論文
    DeepSeek 推論 (Inference) Mixture of Experts (MoE) Transformer
    Mixture-of-Experts のメモリ負荷を抑えるため、連続する transformer 層で専門家パラメータを共有しつつ層ごとのルーティングと注意を保つ Expert Tying を提案する arxiv 論文。abstract ベースの中立要約。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 新モデル・リリース 抜粋
    GIST-CMTF: Goal-State Inference for Causal Minimal Tool Filtering in LLM Agents
    ツール選択の誤目標実行を抑えるエージェント手法GIST-CMTFを提案
    AI エージェント 深層学習 推論 (Inference)
    ツール拡張型LLMエージェントの実行時ツール絞り込みで、曖昧な要求が複数の目標に対応し「誤目標実行」を招く課題を指摘する論文。因果的に必要なツールのみを提示するCMTFに目標状態の推論を加えたGIST-CMTFを提案し、要求が単一の記号的目標に対応済みという前提を緩めるとしている。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.CL (Computation and Language) · EN 開発者ツール 抜粋
    LLM-based Visual Code Completion for Aerospace Geometric Design
    航空宇宙設計向け LLM コード補助 copilot を提案する論文
    GPT 推論 (Inference) ニューラルネットワーク
    安全性と説明可能性を重視する航空宇宙業界向けに、ReAct 手法のビジュアルプログラミング変種と GPT 系モデルを用いた幾何設計支援 copilot を提案する arxiv 論文。abstract ベースの中立要約で、性能の優劣や固有名の評価は差し控える。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 推論・効率化 抜粋
    Progressive Knowledge-Guided Large Language Model Framework for Bearing Fault Diagnosis
    物理ガイド型の多スケール振動解析で軸受故障診断を行う枠組みを提案
    推論 (Inference) 強化学習
    振動ベースの軸受故障診断における特徴効率と局所信号忠実度のトレードオフ等の課題に対し、物理理論に基づく多スケール信号処理の統合パイプラインを提案する論文とされる。軸受運動理論由来の記述子で実時間スクリーニングを行い、故障適応的な信号分割を用いると報告。数値は原論文の記載に基づく中立要約。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 安全性・評価 抜粋
    DoubtProbe: Black-Box Jailbreak Defense via Structural Verification and Semantic Auditing
    LLM の脱獄攻撃を推論時に防ぐ二分岐手法 DoubtProbe を提案
    推論 (Inference) Llama 検索拡張生成 (RAG)
    ユーザー向けに展開される大規模言語モデル (LLM) への black-box 脱獄攻撃に対し、推論時の防御枠組み DoubtProbe を提案する論文。多くの脱獄は有害な目的を消すのではなく、表現や構造を組み替えて安全整合を回避していると観察し、構造的検証と意味的監査の二分岐で防御する手法を示す。既存防御が prompt の言い換えや構造操作で不安定になる課題への対処を狙う。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • Sakana AI Blog (ja) · JA 新モデル・リリース 抜粋
    Sakana AI、初の商用プロダクト「Sakana Marlin」を提供開始
    Sakana AI、初の商用プロダクト「Marlin」提供開始、最大8時間の自律リサーチ
    AI エージェント アルゴリズム・理論 推論 (Inference) ニューラルネットワーク 強化学習
    Sakana AI が同社初の商用プロダクトとなる自律型リサーチアシスタント「Sakana Marlin」を提供開始した。調査テーマを指示するだけで最大約8時間にわたり自律的に仮説立案・情報収集・検証を繰り返し、構造化されたサマリースライドと数十ページの調査レポートを生成する。独自の長期推論技術に基づき、CSO(最高戦略責任者)が担うような重厚な戦略調査をAIが代替することを狙う。セルフサーブで即日利用でき、無料のPay per useからPro・Team・Enterpriseまで複数プランを用意する。
    元記事を読む (Sakana AI Blog (ja)) ↗
  • Lobste.rs (AI tagged) · EN 推論・効率化 抜粋
    The future of Siri, or: why private inference isn’t private enough
    Siriの未来:なぜ「プライベート推論」でも不十分なのか
    推論 (Inference)
    オンデバイスやプライベート推論を掲げる音声アシスタント(Siri等)の将来を論じる記事。暗号化や端末内処理だけではプライバシー保護として不十分だと指摘し、より強い保証の必要性を論じている。
    元記事を読む (Lobste.rs (AI tagged)) ↗
  • NVIDIA Developer Blog · EN エージェント・ツール使用 抜粋
    NVIDIA Achieves Leading Agentic Coding Performance on First Agentic AI Benchmark
    NVIDIA、初のエージェント型AIベンチマークでコーディング性能首位を達成
    AI エージェント 生成 AI 推論 (Inference) NVIDIA
    NVIDIAは、エージェント型AIを対象とした初のベンチマークでエージェント型コーディング性能の首位を達成したと開発者ブログで報告した。推論基盤やGPUインフラの最適化を通じ、コード生成・修正を自律的に行うAIエージェントの実行性能を高めた成果とみられ、エージェント開発分野での同社プラットフォームの優位性を示す内容となっている。
    元記事を読む (NVIDIA Developer Blog) ↗
  • arXiv cs.CL (Computation and Language) · EN 新モデル・リリース 抜粋
    AdaSR: Adaptive Streaming Reasoning with Hierarchical Relative Policy Optimization
    AdaSR、入力を逐次処理する「ストリーミング推論」を提案
    機械学習 検索拡張生成 (RAG) 強化学習 ソフトウェア工学 音声処理
    大規模推論モデルが入力全体を読んでから考える従来手法に対し、入力到着に合わせて逐次推論する「AdaSR」を提案。階層的な相対方策最適化で、ストリーミング環境での推論を学習する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.LG (Machine Learning) · EN 推論・効率化 抜粋
    HumP-KD: A Hybrid Uncertainty-Aware Multi-Stage Progressive Knowledge Distillation Framework for Efficient Fire Classification
    HumP-KD、不確実性考慮の蒸留で火災分類を効率化
    機械学習 Meta ニューラルネットワーク Transformer
    リアルタイム火災分類向けに、不確実性を考慮した多段階の漸進的知識蒸留フレームワーク「HumP-KD」を提案。精度と効率を両立する軽量モデルの構築を狙う。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 新モデル・リリース 抜粋
    Towards Direct Latent-Space Synthesis for Parallel Branches in LLM-Agent Workflows
    LLMエージェントの並列分岐を潜在空間で直接合成する手法を検討
    AI エージェント ニューラルネットワーク
    LLMはエージェント実行エンジンとして使われる一方、依然として逐次的なテキスト interface で文脈を消費する。独立タスクを並列処理する近年の構造化エージェント workflow との不整合を指摘し、並列分岐を潜在空間で直接合成するアプローチを検討する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.LG (Machine Learning) · EN 安全性・評価 抜粋
    When to Write and When to Suppress: Route-Specialized Dual Adapters for Memory-Assisted Knowledge Editing
    知識編集の書込/抑制を切替える二重アダプタを提案
    埋め込み (Embeddings) 推論 (Inference) Llama
    編集対象の事実のみ更新し周辺挙動を保つ知識編集を、編集メモリ参照型の設定で研究。書込と抑制を経路別に担う特化型のデュアルアダプタを提案する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 新モデル・リリース 抜粋
    Abstracting Cross-Domain Action Sequences into Interpretable Workflows
    操作ログを解釈可能なワークフローへ抽象化する手法を提案
    深層学習 推論 (Inference) Microsoft 強化学習
    時系列の操作ログはアプリ利用の客観的記録だが、粒度の細かさとノイズのため作業の意味ある洞察を得にくい。本論文はクロスドメインの行動系列を、解釈可能なワークフローへ抽象化する手法を提案する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 推論・効率化 抜粋
    Moonlight in Latent Space: Chirality and Structural Correspondence Between Beethoven's Op. 27 No. 2 and Machine Learning Mechanisms
    ベートーヴェン「月光」と機械学習機構の構造的対応を分析
    埋め込み (Embeddings) 機械学習 ニューラルネットワーク 自然言語処理 (NLP) 強化学習
    ベートーヴェンの「月光ソナタ」(Op.27 No.2)の三つの楽章が、比喩ではなく構造的対応として三種の異なる機械学習アーキテクチャを体現していることを、計算分析を通じて示す学際的研究。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.LG (Machine Learning) · EN 推論・効率化 抜粋
    Realizing Native INT8 Compute for Diffusion Transformers on Consumer GPUs: A Fused INT8 GEMM Kernel for Ideogram 4.0
    民生GPUで拡散Transformerの真のINT8演算を実現
    ニューラルネットワーク 量子化 Transformer
    拡散Transformerの訓練後INT8量子化は、民生Ampere GPUではFP8/NF4より遅いことが多い。Ideogram 4.0向けに融合INT8 GEMMカーネルを実装し、真のINT8高速化を実現する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN 安全性・評価 抜粋
    Zero-shot generalization of transformer neural operators to larger domains
    Transformerニューラル演算子の大領域へのゼロショット汎化
    埋め込み (Embeddings) 推論 (Inference) 機械学習 ニューラルネットワーク Transformer
    偏微分方程式の解作用素を近似するTransformer型ニューラル演算子が、訓練時より大きな計算領域へゼロショットで汎化できるかを検証する研究。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 安全性・評価 抜粋
    CARE: Controlling LLM-Generated Policies through Auditable Review of Evidence in Scientific Experimentation
    科学実験でLLM提案方策を証拠の監査で制御する「CARE」
    機械学習
    高コストで不可逆な科学実験をLLMに直接制御させると危険だが、創造性を捨てると最適化の余地も失う。本論文はLLMが生成する方策を、証拠の監査可能なレビュー(CARE)で制御し、安全性と性能を両立する枠組みを提案する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 安全性・評価 抜粋
    From Shield to Target: Denial-of-Service Attacks on LLM-Based Agent Guardrails
    LLMエージェントのガードレールを狙うサービス妨害攻撃を提示
    AI エージェント Claude DeepSeek Gemini GPT
    LLMベースのガードレールはプロンプトインジェクションやジェイルブレイクへの有力な防御となっている。本論文は、その防御を支える推論・指示追従能力そのものを突くサービス妨害(DoS)攻撃が可能であることを明らかにする。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 推論・効率化 抜粋
    Securing the Future of IoMT in the Post-Quantum Era: An Edge-Native Federated Learning Approach
    ポスト量子時代の医療IoTをエッジ連合学習で守る手法
    深層学習
    医療IoT(IoMT)機器は厳しい資源制約下で機微な健康データを扱い、セキュリティとプライバシーが重要課題となる。連合学習はこれをさらに複雑化させる。本論文はポスト量子時代に向け、エッジネイティブな連合学習で安全性を確保する手法を提案する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 安全性・評価 抜粋
    From Chatbot to Digital Colleague: The Paradigm Shift Toward Persistent Autonomous AI
    LLMが「チャットボット」から永続自律AIへ移行する転換を概念化
    AI エージェント 推論 (Inference) ニューラルネットワーク 検索拡張生成 (RAG) ソフトウェア工学
    LLMは会話生成器から、推論・行動・記憶・自己改善を備えた統合AIへと根本的に変化しつつある。本論文はこの移行を「チャットボットからデジタルな同僚へ」という持続的自律AIへのパラダイムシフトとして概念化する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 学習・ファインチューニング 抜粋
    A Fixed-Point Neural Operator for Size- and Functional-Transferable Hamiltonian Prediction
    サイズ・汎関数転移可能なハミルトニアン予測の固定点ニューラル演算子
    ファインチューニング 推論 (Inference) 機械学習 ニューラルネットワーク
    Kohn-Shamハミルトニアンを機械学習で予測できれば密度汎関数理論を加速しつつ分子軌道などの観測量も保てる。本論文は系のサイズや汎関数をまたいで転移可能な、固定点ニューラル演算子によるハミルトニアン予測手法を提案する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗