インフラ・ハードウェア B
111 件中 31〜60 件目を表示
-
Essential Subspace Merging for Multi-Task Learning本質部分空間のマージでマルチタスク学習を実現するモデル統合モデルマージは、同一の事前学習チェックポイントから微調整した複数モデルの能力を一つに統合し、マルチタスク学習を可能にする。本研究は各タスクに本質的な部分空間を抽出して統合する「Essential Subspace Merging」を提案し、干渉を抑えつつ多タスク性能を引き出す。
-
How Musicians Can Get Paid for Training AIIEEE Spectrum、AI学習に楽曲を使われた音楽家への報酬の仕組みを解説IEEE Spectrumが、AIの学習データに音楽が使われる際にミュージシャンが報酬を得る方法について解説した。AI学習での楽曲利用とアトリビューション(帰属)・対価の論点を扱う内容。本要約はraw_excerptがCookie/クエリ文字列でブロックされ未取得のため、タイトルベースの中立要約。具体的な仕組み・制度の詳細は記事ベースで第三者検証は未確認。
-
AdsMind: A Physics-Grounded Multi-Agent System for Self-Correcting Discovery of Adsorption Configurations on Heterogeneous Catalyst SurfacesAdsMind、物理基盤のマルチエージェントで触媒の吸着配置を探索不均一系触媒のモデル化では、表面と吸着種の最低エネルギー配置の特定が重要だが、第一原理計算による網羅探索は計算的に困難だ。本研究は物理に基づくマルチエージェント系「AdsMind」を提案し、自己訂正しながら吸着配置を効率的に発見する。
-
Written by AI, Managed by AI: Semantic Space Control and Index Sickness Elimination Across 391 Consecutive Sessions391 連続セッションで意味空間を制御し概念ドリフトを抑制長期にわたる LLM 協働の概念ドリフトに対し、より多くの形式的制約と引き換えに出力の信頼性を高めるのが通説だ。本研究は 391 回の連続セッションを通じ、意味空間(semantic space)の制御と「インデックス病」の解消により、AI が執筆と管理を担う長期協働の安定性を検証する。
-
Quantifying and Auditing LLM Evaluation via Positive--Unlabeled Learning正例-未ラベル学習で LLM 評価の偏りを定量化・監査LLM はスケーラブルな評価の「審判」として使われるが、冗長性バイアスなど意味的品質と無関係な系統的偏りを示す。本研究は正例-未ラベル(Positive-Unlabeled)学習を用い、LLM-as-a-Judge の評価を定量化・監査する手法を提案し、バイアスの検出と是正を支える。
-
Adaptive Speech-to-Spike Encoding for Spiking Neural Networksスパイキング NN 向けに適応的な音声-スパイク符号化を提案連続的な音響信号と離散的なイベント駆動処理の不一致は、ニューロモルフィック音声処理の根本的なボトルネックだ。現行システムは固定のスパイクエンコーダに頼り、後段に負担を強いる。本研究は入力に応じて適応する音声-スパイク符号化を提案し、スパイキングニューラルネットの性能を高める。
-
FoMoE: Breaking the Full-Replica Barrier with a Federation of MoEsFoMoE、MoE の連邦化で完全複製の壁を破る LLM 事前学習LLM の事前学習は通常、密結合したアクセラレータからなる大規模インフラを要する。モデルとデータの規模拡大が進む中、本研究は「FoMoE」を提案し、Mixture-of-Experts を連邦(federation)として連携させることで、全パラメータの完全複製を不要にし学習基盤の制約を緩和する。
-
Spotlight: Synergizing Seed Exploration and Spot GPUs for DiT RL Post-TrainingSpotlight、シード探索とスポット GPU で DiT の RL 事後学習を低コスト化拡散トランスフォーマー(DiT)の RL 事後学習は数千台の高性能 GPU を要し非常に高価だ。本研究は「Spotlight」を提案し、シード探索の工夫と安価なスポット GPU の活用を組み合わせることで、DiT の RL 事後学習を大幅に低コスト化する。
-
Enhancing Multilingual Reasoning via Steerable Model Merging操作可能なモデルマージで多言語推論を強化モデルマージは、多言語モデルと推論モデルの能力を合成する有効な手法で、異なるモデルの特徴空間を整合させて多言語推論で有望な汎化を示してきた。本研究は操作可能(steerable)なモデルマージを提案し、合成の度合いを制御して多言語推論性能をさらに高める。
-
TRAP: Benchmark for Task-completion and Resistance to Active Privacy-extractionTRAP、課題遂行とプライバシー抽出耐性を測るエージェント評価エージェントは機密情報が日常的な入力となる文書集約的な業務に投入されつつある(例:航空券予約にパスポート番号が必要)。本研究はベンチマーク「TRAP」を提案し、課題遂行能力と、能動的なプライバシー抽出(聞き出し)への耐性の両面からエージェントを評価する。
-
G-IdiomAlign: A Gloss-Pivoted Benchmark for Cross-Lingual Idiom Alignment慣用句の言語間対応を測る新ベンチマーク「G-IdiomAlign」慣用句は非構成的で直訳が効かず、言語間の対応付けが難しい。本研究はWiktionaryの英語注釈を軸に各慣用句を固定した評価基盤G-IdiomAlignを提案。多肢選択式の慣用句等価判定と、注釈の有無を比較する生成タスクの2プロトコルで、注釈がもたらす効果を切り分けて評価できる。
-
Decoupling Search from Reasoning: A Vendor-Agnostic Grounding Architecture for LLM Agents検索と推論を分離するベンダー非依存のLLMエージェント基盤本番のLLMエージェントはリアルタイム検索に依存するが、各社固有のグラウンディングに縛られやすい。本研究は検索と推論を分離し、ベンダーに依存しないグラウンディング基盤を提案することで、検索基盤を差し替え可能にしつつ推論の質を保つ。
-
Graph-ESBMC-PLC: Formal Verification of Graphical PLCopen XML Ladder Diagram Programs Using SMT-Based Model CheckingPLCopen XMLラダー図をSMTで形式検証する手法PLCopen XMLはIEC 61131-3のラダー図に二つの符号化形式を定める。本研究はSMTに基づくモデル検査を用い、グラフィカルなPLCopen XMLラダー図プログラムを形式的に検証する手法Graph-ESBMC-PLCを提案し、産業制御ソフトの正当性検証を支援する。
-
Approximate Structured Diffusion for Sequence Labelling系列ラベリング向け近似構造化拡散モデル系列ラベリングは自然言語処理の中核的なタスクである。本研究は構造化された拡散モデルを近似的に適用する手法を提案し、ラベル間の依存関係を考慮しながら効率的に系列ラベリングを行うことを目指す。
-
Morpheus: A Morphology-Aware Neural Tokenizer and Word Embedder for Turkishトルコ語向け形態素対応トークナイザ「Morpheus」トルコ語は膠着語で、意味は形態素によって担われるが、一般的なサブワード分割はこれを十分に捉えられない。Morpheusは形態素を意識したニューラルなトークナイザと単語埋め込みを提案し、トルコ語処理の精度向上を図る。
-
LLM Serving Fairness: No more noisy neighboursCohere、マルチテナント LLM 提供で計算資源の公平配分を実現Cohere は、LLM 提供基盤で各テナントが計算資源を公平に得られるようにする仕組みを解説した。特定利用者が資源を占有する「ノイジーネイバー」問題を抑え、全テナントに公平な処理能力を割り当てる設計を紹介。安定したマルチテナント運用の実現を狙う。
-
Building AI Agents for AR Glasses and XR Devices with NVIDIA XR AINVIDIA、ARグラス/XR向けAIエージェント構築基盤「XR AI」を発表NVIDIAは、ARグラスやウェアラブル端末向けにAIエージェントを構築するための基盤「NVIDIA XR AI」を発表した。ハードウェアは整いつつある一方、リアルタイムなAI体験の統合には依然として課題があるとし、開発者向けにその橋渡しを図る狙いだという。具体的な機能・性能はNVIDIA側の発表に基づくもので、第三者検証は未確認。
-
Build Your Own Transaction Foundation Model for Financial IntelligenceNVIDIA、金融分析向け「取引基盤モデル」の自作手法を解説NVIDIAは開発者向けブログで、取引データを用いた「取引基盤モデル(Transaction Foundation Model)」を自前で構築する手法を解説した。不正検知やリスク分析といった金融インテリジェンスへの応用を想定した内容とされる。手法や効果はNVIDIA自身の解説に基づくもので、第三者検証は未確認(export の raw_excerpt が取得できずタイトル・発信元ベースに中立要約)。
-
生成AI×自動運転で注目のTesla・Waymo・NVIDIA 各社が目指す「フィジカルAI」は何が違うのかTesla・Waymo・NVIDIA、自動運転で目指す「フィジカルAI」の違いを整理日本政府が戦略的強化分野に掲げる「フィジカルAI」の社会実装の一例として自動運転が注目されている。ITmediaは、生成AIの進化が各社の開発競争にもたらす変化を踏まえ、Tesla・Waymo・NVIDIA各社の最新動向と、それぞれが目指すアプローチの違いを整理した記事を公開した。
-
Adaptive Volumetric Mechanical Property Fields Invariant to ResolutionAdaVoMP、3D物体の力学特性場を解像度不変に予測信頼できる物理シミュレーションには弾性率・ポアソン比・密度が必要だが多くの3Dアセットは欠く。AdaVoMPは入力3D物体に対しこれらの密な空間変動値を解像度に不変な形で予測する手法を提案する。
-
Finite-Time Queue Peak Laws in Stochastic Networks: Logarithmic Scaling After Geometric Thresholds確率ネットの有限時間キュー尖頭の対数スケール則多数のキューが限られた資源を共有する一般化スイッチを対象に、有限期間でのキュー尖頭を解析。一様内部スラックの負荷条件下で、幾何的閾値の後に対数的スケーリングが現れる法則を導く。
-
Build On-Device AI Companions with the NVIDIA ACE Game Agent SDK and Unreal Engine 5 PluginsNVIDIA、オンデバイス AI 向け ACE Game Agent SDK と UE5 プラグインを発表NVIDIA が、ゲーム内のオンデバイス AI コンパニオン(AI エージェント)を構築するための『ACE Game Agent SDK』と Unreal Engine 5 向けプラグインを開発者向けに公開したと発表した。クラウドに依存せず端末上で動作する AI キャラクター実装を狙うとされる。export の raw_excerpt が cookie/query データで blocked のため、タイトルと公開元(NVIDIA developer blog)ベースで中立に要約し、具体的な数値・性能は未確認。
-
Towards Understanding and Measuring COGNITIVE ATROPHY in LLM BehaviourLLM対話の認知萎縮を測る過程指標を定式化した研究メンタルヘルス支援に使われるLLMで、表層的な安全スコアが時間的な相互作用の質を捉えない評価ギャップを指摘する論文。利用者が自ら省察・対処・意思決定を続けられるかという過程レベルの指標を「認知萎縮(COGNITIVE ATROPHY)」として定式化すると述べる。
-
Unintended Effects of Geographic Conditioning in Large Language Models地理条件付けがLLMに生む意図せぬ地域バイアス対話型AIは応答の現地化にユーザのメタデータを使うが、この隠れた文脈が生む地域バイアスは十分理解されていない。本研究は地理的条件付けがLLM応答に与える意図せぬ影響を分析する。
-
Ternary Mamba: Grouped Quantization-Aware Training of W1.58A16 State Space ModelsTernary Mamba、1.58ビット重みのQATで状態空間を量子化状態空間モデルMambaに対し、重みを三値(W1.58)・活性を16ビットとする量子化認識訓練(QAT)をグループ単位で行うTernary Mambaを提案。低ビットでの効率的な系列モデルの学習・推論を狙う。
-
HistoRAG: Embedding Historical Methodology in Retrieval-Augmented Generation Through Critical Technical PracticeHistoRAG、歴史方法論をRAGに組み込む批判的実践RAGは言語モデル出力を外部根拠に接地するが、評価や既定設定は事実QA志向に偏る。HistoRAGは解釈的な歴史研究向けに、批判的技術実践を通じて歴史方法論をRAGへ組み込む枠組みを示す。
-
How to Optimize Transformer-Based Models for Low-Precision TrainingNVIDIA、Transformer モデルの低精度学習を最適化する解説記事を公開NVIDIA の技術記事が、Transformer ベースのモデルを低精度(low-precision)で学習する際の最適化手法を解説。本要約は export の raw_excerpt が cookie/query データで blocked のため、タイトルと NVIDIA という発信元から中立に記述しており、具体的な手法・数値は未確認。
-
Tensor-based second-order causal discoveryテンソルに基づく二次の因果探索手法TSCDを提案変数間の因果依存を明らかにする因果探索に対し、観測データと介入データの共分散行列から得たテンソルを入力とする二次の手法TSCDを提案。線形構造方程式に従う因果依存を仮定して推定する。
-
Agentic AI-based Framework for Mitigating Premature Diagnostic Handoff and Silent Hallucination in Healthcare Applications医療AIの早期診断委譲と静かな幻覚を抑える多エージェント枠組み医療推論に用いるエージェント型AIが、早期の診断委譲と検知されにくい臨床幻覚という二つの失敗様式に陥りやすい点に着目する論文。LLM審判型のルーティングを決定論的な統制制約に置き換え、二つの安全機構を備えた多エージェント枠組みを提案すると述べる。
-
ConTex: Reformulating Counterfactual Generation For Time Series ForecastingConTex、時系列予測の反事実生成を再定式化深層学習による時系列予測は正確さに加え行動可能な示唆を要するが、現行構造はそれを内在的に与えない。ConTexは、予測結果を望む将来へ移すために現状をどう変えるべきかを示す反事実生成を再定式化する。