インフラ・ハードウェア B

111 件中 31〜60 件目を表示
  • arXiv cs.AI (Artificial Intelligence) · EN 新モデル・リリース 抜粋
    Essential Subspace Merging for Multi-Task Learning
    本質部分空間のマージでマルチタスク学習を実現するモデル統合
    推論 (Inference) ニューラルネットワーク
    モデルマージは、同一の事前学習チェックポイントから微調整した複数モデルの能力を一つに統合し、マルチタスク学習を可能にする。本研究は各タスクに本質的な部分空間を抽出して統合する「Essential Subspace Merging」を提案し、干渉を抑えつつ多タスク性能を引き出す。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • IEEE Spectrum (AI section) · EN インフラ・ハードウェア 抜粋
    How Musicians Can Get Paid for Training AI
    IEEE Spectrum、AI学習に楽曲を使われた音楽家への報酬の仕組みを解説
    生成 AI 強化学習
    IEEE Spectrumが、AIの学習データに音楽が使われる際にミュージシャンが報酬を得る方法について解説した。AI学習での楽曲利用とアトリビューション(帰属)・対価の論点を扱う内容。本要約はraw_excerptがCookie/クエリ文字列でブロックされ未取得のため、タイトルベースの中立要約。具体的な仕組み・制度の詳細は記事ベースで第三者検証は未確認。
    元記事を読む (IEEE Spectrum (AI section)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 学習・ファインチューニング 抜粋
    AdsMind: A Physics-Grounded Multi-Agent System for Self-Correcting Discovery of Adsorption Configurations on Heterogeneous Catalyst Surfaces
    AdsMind、物理基盤のマルチエージェントで触媒の吸着配置を探索
    AI エージェント 機械知能 機械学習
    不均一系触媒のモデル化では、表面と吸着種の最低エネルギー配置の特定が重要だが、第一原理計算による網羅探索は計算的に困難だ。本研究は物理に基づくマルチエージェント系「AdsMind」を提案し、自己訂正しながら吸着配置を効率的に発見する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.CL (Computation and Language) · EN インフラ・ハードウェア 抜粋
    Written by AI, Managed by AI: Semantic Space Control and Index Sickness Elimination Across 391 Consecutive Sessions
    391 連続セッションで意味空間を制御し概念ドリフトを抑制
    ニューラルネットワーク 強化学習
    長期にわたる LLM 協働の概念ドリフトに対し、より多くの形式的制約と引き換えに出力の信頼性を高めるのが通説だ。本研究は 391 回の連続セッションを通じ、意味空間(semantic space)の制御と「インデックス病」の解消により、AI が執筆と管理を担う長期協働の安定性を検証する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.LG (Machine Learning) · EN 安全性・評価 抜粋
    Quantifying and Auditing LLM Evaluation via Positive--Unlabeled Learning
    正例-未ラベル学習で LLM 評価の偏りを定量化・監査
    埋め込み (Embeddings)
    LLM はスケーラブルな評価の「審判」として使われるが、冗長性バイアスなど意味的品質と無関係な系統的偏りを示す。本研究は正例-未ラベル(Positive-Unlabeled)学習を用い、LLM-as-a-Judge の評価を定量化・監査する手法を提案し、バイアスの検出と是正を支える。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN 安全性・評価 抜粋
    Adaptive Speech-to-Spike Encoding for Spiking Neural Networks
    スパイキング NN 向けに適応的な音声-スパイク符号化を提案
    深層学習 Google ニューラルネットワーク 音声処理
    連続的な音響信号と離散的なイベント駆動処理の不一致は、ニューロモルフィック音声処理の根本的なボトルネックだ。現行システムは固定のスパイクエンコーダに頼り、後段に負担を強いる。本研究は入力に応じて適応する音声-スパイク符号化を提案し、スパイキングニューラルネットの性能を高める。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN インフラ・ハードウェア 抜粋
    FoMoE: Breaking the Full-Replica Barrier with a Federation of MoEs
    FoMoE、MoE の連邦化で完全複製の壁を破る LLM 事前学習
    Mixture of Experts (MoE) ニューラルネットワーク
    LLM の事前学習は通常、密結合したアクセラレータからなる大規模インフラを要する。モデルとデータの規模拡大が進む中、本研究は「FoMoE」を提案し、Mixture-of-Experts を連邦(federation)として連携させることで、全パラメータの完全複製を不要にし学習基盤の制約を緩和する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 新モデル・リリース 抜粋
    Spotlight: Synergizing Seed Exploration and Spot GPUs for DiT RL Post-Training
    Spotlight、シード探索とスポット GPU で DiT の RL 事後学習を低コスト化
    深層学習 ニューラルネットワーク 検索拡張生成 (RAG) 強化学習 Transformer
    拡散トランスフォーマー(DiT)の RL 事後学習は数千台の高性能 GPU を要し非常に高価だ。本研究は「Spotlight」を提案し、シード探索の工夫と安価なスポット GPU の活用を組み合わせることで、DiT の RL 事後学習を大幅に低コスト化する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.CL (Computation and Language) · EN 新モデル・リリース 抜粋
    Enhancing Multilingual Reasoning via Steerable Model Merging
    操作可能なモデルマージで多言語推論を強化
    ニューラルネットワーク
    モデルマージは、多言語モデルと推論モデルの能力を合成する有効な手法で、異なるモデルの特徴空間を整合させて多言語推論で有望な汎化を示してきた。本研究は操作可能(steerable)なモデルマージを提案し、合成の度合いを制御して多言語推論性能をさらに高める。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 新モデル・リリース 抜粋
    TRAP: Benchmark for Task-completion and Resistance to Active Privacy-extraction
    TRAP、課題遂行とプライバシー抽出耐性を測るエージェント評価
    AI エージェント ニューラルネットワーク
    エージェントは機密情報が日常的な入力となる文書集約的な業務に投入されつつある(例:航空券予約にパスポート番号が必要)。本研究はベンチマーク「TRAP」を提案し、課題遂行能力と、能動的なプライバシー抽出(聞き出し)への耐性の両面からエージェントを評価する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 安全性・評価 抜粋
    G-IdiomAlign: A Gloss-Pivoted Benchmark for Cross-Lingual Idiom Alignment
    慣用句の言語間対応を測る新ベンチマーク「G-IdiomAlign」
    埋め込み (Embeddings)
    慣用句は非構成的で直訳が効かず、言語間の対応付けが難しい。本研究はWiktionaryの英語注釈を軸に各慣用句を固定した評価基盤G-IdiomAlignを提案。多肢選択式の慣用句等価判定と、注釈の有無を比較する生成タスクの2プロトコルで、注釈がもたらす効果を切り分けて評価できる。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 推論・効率化 抜粋
    Decoupling Search from Reasoning: A Vendor-Agnostic Grounding Architecture for LLM Agents
    検索と推論を分離するベンダー非依存のLLMエージェント基盤
    AI エージェント 深層学習 Model Context Protocol (MCP) 強化学習 ソフトウェア工学
    本番のLLMエージェントはリアルタイム検索に依存するが、各社固有のグラウンディングに縛られやすい。本研究は検索と推論を分離し、ベンダーに依存しないグラウンディング基盤を提案することで、検索基盤を差し替え可能にしつつ推論の質を保つ。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.CL (Computation and Language) · EN 安全性・評価 抜粋
    Graph-ESBMC-PLC: Formal Verification of Graphical PLCopen XML Ladder Diagram Programs Using SMT-Based Model Checking
    PLCopen XMLラダー図をSMTで形式検証する手法
    推論 (Inference) 機械学習 ニューラルネットワーク
    PLCopen XMLはIEC 61131-3のラダー図に二つの符号化形式を定める。本研究はSMTに基づくモデル検査を用い、グラフィカルなPLCopen XMLラダー図プログラムを形式的に検証する手法Graph-ESBMC-PLCを提案し、産業制御ソフトの正当性検証を支援する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 推論・効率化 抜粋
    Approximate Structured Diffusion for Sequence Labelling
    系列ラベリング向け近似構造化拡散モデル
    推論 (Inference) 機械学習 ニューラルネットワーク 自然言語処理 (NLP) 検索拡張生成 (RAG)
    系列ラベリングは自然言語処理の中核的なタスクである。本研究は構造化された拡散モデルを近似的に適用する手法を提案し、ラベル間の依存関係を考慮しながら効率的に系列ラベリングを行うことを目指す。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN インフラ・ハードウェア 抜粋
    Morpheus: A Morphology-Aware Neural Tokenizer and Word Embedder for Turkish
    トルコ語向け形態素対応トークナイザ「Morpheus」
    埋め込み (Embeddings) 推論 (Inference) 検索拡張生成 (RAG)
    トルコ語は膠着語で、意味は形態素によって担われるが、一般的なサブワード分割はこれを十分に捉えられない。Morpheusは形態素を意識したニューラルなトークナイザと単語埋め込みを提案し、トルコ語処理の精度向上を図る。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • Cohere Blog · EN 推論・効率化 抜粋
    LLM Serving Fairness: No more noisy neighbours
    Cohere、マルチテナント LLM 提供で計算資源の公平配分を実現
    深層学習 推論 (Inference) Meta ニューラルネットワーク 強化学習
    Cohere は、LLM 提供基盤で各テナントが計算資源を公平に得られるようにする仕組みを解説した。特定利用者が資源を占有する「ノイジーネイバー」問題を抑え、全テナントに公平な処理能力を割り当てる設計を紹介。安定したマルチテナント運用の実現を狙う。
    元記事を読む (Cohere Blog) ↗
  • NVIDIA Developer Blog · EN エージェント・ツール使用 抜粋
    Building AI Agents for AR Glasses and XR Devices with NVIDIA XR AI
    NVIDIA、ARグラス/XR向けAIエージェント構築基盤「XR AI」を発表
    AI エージェント コンピュータビジョン 生成 AI NVIDIA
    NVIDIAは、ARグラスやウェアラブル端末向けにAIエージェントを構築するための基盤「NVIDIA XR AI」を発表した。ハードウェアは整いつつある一方、リアルタイムなAI体験の統合には依然として課題があるとし、開発者向けにその橋渡しを図る狙いだという。具体的な機能・性能はNVIDIA側の発表に基づくもので、第三者検証は未確認。
    元記事を読む (NVIDIA Developer Blog) ↗
  • NVIDIA Developer Blog · EN インフラ・ハードウェア 抜粋
    Build Your Own Transaction Foundation Model for Financial Intelligence
    NVIDIA、金融分析向け「取引基盤モデル」の自作手法を解説
    NVIDIA
    NVIDIAは開発者向けブログで、取引データを用いた「取引基盤モデル(Transaction Foundation Model)」を自前で構築する手法を解説した。不正検知やリスク分析といった金融インテリジェンスへの応用を想定した内容とされる。手法や効果はNVIDIA自身の解説に基づくもので、第三者検証は未確認(export の raw_excerpt が取得できずタイトル・発信元ベースに中立要約)。
    元記事を読む (NVIDIA Developer Blog) ↗
  • ITmedia AI+ · JA インフラ・ハードウェア 抜粋
    生成AI×自動運転で注目のTesla・Waymo・NVIDIA 各社が目指す「フィジカルAI」は何が違うのか
    Tesla・Waymo・NVIDIA、自動運転で目指す「フィジカルAI」の違いを整理
    NVIDIA
    日本政府が戦略的強化分野に掲げる「フィジカルAI」の社会実装の一例として自動運転が注目されている。ITmediaは、生成AIの進化が各社の開発競争にもたらす変化を踏まえ、Tesla・Waymo・NVIDIA各社の最新動向と、それぞれが目指すアプローチの違いを整理した記事を公開した。
    元記事を読む (ITmedia AI+) ↗
  • arXiv cs.LG (Machine Learning) · EN インフラ・ハードウェア 抜粋
    Adaptive Volumetric Mechanical Property Fields Invariant to Resolution
    AdaVoMP、3D物体の力学特性場を解像度不変に予測
    強化学習 Transformer
    信頼できる物理シミュレーションには弾性率・ポアソン比・密度が必要だが多くの3Dアセットは欠く。AdaVoMPは入力3D物体に対しこれらの密な空間変動値を解像度に不変な形で予測する手法を提案する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN インフラ・ハードウェア 抜粋
    Finite-Time Queue Peak Laws in Stochastic Networks: Logarithmic Scaling After Geometric Thresholds
    確率ネットの有限時間キュー尖頭の対数スケール則
    ニューラルネットワーク
    多数のキューが限られた資源を共有する一般化スイッチを対象に、有限期間でのキュー尖頭を解析。一様内部スラックの負荷条件下で、幾何的閾値の後に対数的スケーリングが現れる法則を導く。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • NVIDIA Developer Blog · EN インフラ・ハードウェア 抜粋
    Build On-Device AI Companions with the NVIDIA ACE Game Agent SDK and Unreal Engine 5 Plugins
    NVIDIA、オンデバイス AI 向け ACE Game Agent SDK と UE5 プラグインを発表
    深層学習 NVIDIA
    NVIDIA が、ゲーム内のオンデバイス AI コンパニオン(AI エージェント)を構築するための『ACE Game Agent SDK』と Unreal Engine 5 向けプラグインを開発者向けに公開したと発表した。クラウドに依存せず端末上で動作する AI キャラクター実装を狙うとされる。export の raw_excerpt が cookie/query データで blocked のため、タイトルと公開元(NVIDIA developer blog)ベースで中立に要約し、具体的な数値・性能は未確認。
    元記事を読む (NVIDIA Developer Blog) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 安全性・評価 抜粋
    Towards Understanding and Measuring COGNITIVE ATROPHY in LLM Behaviour
    LLM対話の認知萎縮を測る過程指標を定式化した研究
    ニューラルネットワーク
    メンタルヘルス支援に使われるLLMで、表層的な安全スコアが時間的な相互作用の質を捉えない評価ギャップを指摘する論文。利用者が自ら省察・対処・意思決定を続けられるかという過程レベルの指標を「認知萎縮(COGNITIVE ATROPHY)」として定式化すると述べる。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.CL (Computation and Language) · EN 新モデル・リリース 抜粋
    Unintended Effects of Geographic Conditioning in Large Language Models
    地理条件付けがLLMに生む意図せぬ地域バイアス
    Claude Llama Meta ニューラルネットワーク 強化学習
    対話型AIは応答の現地化にユーザのメタデータを使うが、この隠れた文脈が生む地域バイアスは十分理解されていない。本研究は地理的条件付けがLLM応答に与える意図せぬ影響を分析する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.LG (Machine Learning) · EN 推論・効率化 抜粋
    Ternary Mamba: Grouped Quantization-Aware Training of W1.58A16 State Space Models
    Ternary Mamba、1.58ビット重みのQATで状態空間を量子化
    推論 (Inference) 量子化 検索拡張生成 (RAG) Transformer
    状態空間モデルMambaに対し、重みを三値(W1.58)・活性を16ビットとする量子化認識訓練(QAT)をグループ単位で行うTernary Mambaを提案。低ビットでの効率的な系列モデルの学習・推論を狙う。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.CL (Computation and Language) · EN 新モデル・リリース 抜粋
    HistoRAG: Embedding Historical Methodology in Retrieval-Augmented Generation Through Critical Technical Practice
    HistoRAG、歴史方法論をRAGに組み込む批判的実践
    埋め込み (Embeddings) 検索拡張生成 (RAG) 強化学習 ソフトウェア工学
    RAGは言語モデル出力を外部根拠に接地するが、評価や既定設定は事実QA志向に偏る。HistoRAGは解釈的な歴史研究向けに、批判的技術実践を通じて歴史方法論をRAGへ組み込む枠組みを示す。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • NVIDIA Developer Blog · EN インフラ・ハードウェア 抜粋
    How to Optimize Transformer-Based Models for Low-Precision Training
    NVIDIA、Transformer モデルの低精度学習を最適化する解説記事を公開
    生成 AI NVIDIA Transformer
    NVIDIA の技術記事が、Transformer ベースのモデルを低精度(low-precision)で学習する際の最適化手法を解説。本要約は export の raw_excerpt が cookie/query データで blocked のため、タイトルと NVIDIA という発信元から中立に記述しており、具体的な手法・数値は未確認。
    元記事を読む (NVIDIA Developer Blog) ↗
  • arXiv cs.LG (Machine Learning) · EN インフラ・ハードウェア 抜粋
    Tensor-based second-order causal discovery
    テンソルに基づく二次の因果探索手法TSCDを提案
    深層学習
    変数間の因果依存を明らかにする因果探索に対し、観測データと介入データの共分散行列から得たテンソルを入力とする二次の手法TSCDを提案。線形構造方程式に従う因果依存を仮定して推定する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 安全性・評価 抜粋
    Agentic AI-based Framework for Mitigating Premature Diagnostic Handoff and Silent Hallucination in Healthcare Applications
    医療AIの早期診断委譲と静かな幻覚を抑える多エージェント枠組み
    AI エージェント Llama
    医療推論に用いるエージェント型AIが、早期の診断委譲と検知されにくい臨床幻覚という二つの失敗様式に陥りやすい点に着目する論文。LLM審判型のルーティングを決定論的な統制制約に置き換え、二つの安全機構を備えた多エージェント枠組みを提案すると述べる。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.LG (Machine Learning) · EN インフラ・ハードウェア 抜粋
    ConTex: Reformulating Counterfactual Generation For Time Series Forecasting
    ConTex、時系列予測の反事実生成を再定式化
    深層学習
    深層学習による時系列予測は正確さに加え行動可能な示唆を要するが、現行構造はそれを内在的に与えない。ConTexは、予測結果を望む将来へ移すために現状をどう変えるべきかを示す反事実生成を再定式化する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗