インフラ・ハードウェア B
111 件中 61〜90 件目を表示
-
NVIDIA Blackwell Tops MLPerf Training 6.0 with Industry-Leading Scale and PerformanceNVIDIA、Blackwell が MLPerf Training 6.0 で首位と発表NVIDIA が、GPU アーキテクチャ Blackwell が MLPerf Training 6.0 ベンチマークで業界最高水準の規模と性能を達成し首位になったと発表した。export の raw_excerpt は cookie/query データで blocked のため、タイトルと発表ベースで中立に要約。数値は発表側の主張で第三者検証は未確認。
-
Catastrophic Forgetting is Low-Rank: A Function-Space Theory for Continual Adaptation破滅的忘却は低ランク、継続適応の関数空間理論継続適応における破滅的忘却は通常パラメータのドリフトや再生で論じられるが、どの出力方向が脆弱かは分からない。本研究はNTK領域で関数空間の説明を与え、新課題訓練が交差課題カーネルを介し旧課題予測を低ランクにずらすことを示す。
-
Recursive Scaling in Masked Diffusion Modelsマスク拡散モデルにおける再帰的スケーリングを検討マスク拡散モデル(MDM)は近年注目される生成手法である。本研究はMDMにおける再帰的スケーリングを検討し、その挙動や効率に関する知見を示す。
-
LegalHalluLens: Typed Hallucination Auditing and Calibrated Multi-Agent Debate for Trustworthy Legal AILegalHalluLens、法務AIの型付き幻覚を監査し多者討論で較正法務に使うAIは平均で約52%幻覚するとされるが、平均は誤りの偏りや方向を隠す。LegalHalluLensは型付きの幻覚監査と較正された多エージェント討論を組み合わせ、信頼できる法務AIへ向けた実用的シグナルを与える枠組みを提案する。
-
Multiple cyclicity and Wavelet Decomposition with Channel Correlation for Long-term Time Series Forecasting多重周期性とウェーブレット分解で長期時系列予測周期性とトレンドは時系列の重要要素だが、既存研究は実世界のチャネル間相関の影響を軽視しがちと指摘。本研究は多重周期性とチャネル相関を伴うウェーブレット分解により長期時系列予測の精度向上を図る。
-
SoftMoE: Soft Differentiable Routing for Mixture-of-Experts in LLMsSoftMoE、LLMの専門家混合に微分可能なソフトルーティング疎な専門家混合(MoE)はLLMのパラメータ拡張を可能にするが離散的ルーティングが学習を難しくする。SoftMoEは微分可能なソフトルーティングを導入し、MoEの安定した学習と効率を狙う。
-
Predictive Analytics in E-Commerce for CustomerBehavior Forecasting using hybrid Ret-DNN withXGBoost ModelEC顧客行動予測にRet-DNNとXGBoostのハイブリッドEC事業者は顧客行動の理解と将来購買の予測に苦戦している。本研究は予測分析として、Ret-DNNとXGBoostを組み合わせたハイブリッドモデルにより顧客行動予測を行う手法を提案する。
-
Monotonic Kolmogorov-Arnold Networks: A Theoretical and Empirical Study of Monotonicity as an Inductive Bias単調KAN、帰納バイアスとしての単調性を理論・実験で検討単調性は表形式・科学・経済の設定で有用な構造的帰納バイアスである。本研究はエッジ単位の関数的透明性を持つ単調なコルモゴロフ・アーノルドネットワークを提案し、単調性を帰納バイアスとして理論と実験で検討する。
-
Meta-classification of one-class classification models using ranking correlation and nearest neighbor順位相関と最近傍で一クラス分類モデルをメタ分類機械学習は多様な問題に適用されてきたが、MLモデル自体へのML適用は未開拓。本研究は全MLモデルを一クラス分類(OCC)で近似できるとみなし、順位相関と最近傍を用いてOCCモデルをメタ分類する手法を提案する。
-
Perceptual compensation for tonal context in self-supervised speech models自己教師あり音声モデルにおける声調文脈の知覚補償を検討本研究は自己教師あり音声モデルが声調(トーン)の文脈に対し知覚補償を行う程度を検討し、人間の音声知覚に見られる文脈効果がモデル表現にどの程度現れるかを分析する。
-
EComAgentBench: Benchmarking Shopping Agents on Long-Horizon Tasks with Distributed Hidden IntentEComAgentBench、隠れた意図を含む長期課題で買い物エージェント評価LLMベースの買い物エージェントが実用化する中、既存ベンチは要求が暗黙・プロフィール記録・適切な質問で初めて明らかになる形を捉えられない。EComAgentBenchは分散した隠れ意図を含む長期課題で買い物エージェントを評価する。
-
The Fable 5 Export Controls Harm US Cyber DefenseSimon Willison、Fable 5の輸出規制は米サイバー防衛を損なうと批判Simon WillisonがKate Moussourisの見解を引用し、Claude Fable 5を輸出規制対象にした「脱獄」の実体は単に「このコードを修正して」という指示だったと指摘。既知CVEや意図的に埋め込んだ脆弱性を含むコードの修正依頼であり、バグ修正は本来コーディングモデルの役割で、規制はむしろ米国のサイバー防衛を弱めると論じる。
-
急拡大するAIインフラの電力需要……光明は「ワットビット連携」に? さくら田中社長と東電が対談AIインフラの電力需要急増、さくら田中社長と東電が「ワットビット連携」を議論AIインフラの拡大で急増する電力需要に、データセンターと電力網はどう向き合うべきか。幕張メッセで開催されたInterop Tokyo 2026の基調講演で、東京電力ホールディングスの岡本浩氏とさくらインターネットの田中邦裕社長が対談し、計算資源と電力をつなぐ「ワットビット連携」の可能性を巡って議論を交わした。
-
Fine-Tuning Biological Foundation Models with LoRA Using NVIDIA BioNeMo RecipesNVIDIA、BioNeMo Recipes で生物基盤モデルの LoRA fine-tuning 手法を解説NVIDIA の開発者ブログが、タンパク質やゲノム配列の大規模コーパスで事前学習された生物基盤モデル(ESM2 等のタンパク質言語モデルを含む)を、LoRA を用いて効率的に fine-tuning する手法を、同社の BioNeMo Recipes を例に解説する。計算生物学における基盤モデル活用を扱った技術記事。
-
Exact Posterior Score Estimation for Solving Linear Inverse Problems線形逆問題の厳密な事後スコアを閉形式で導出拡散・フローモデルを線形逆問題に用いる際の事後スコアを、一般的なガウス補間の下で閉形式により厳密に導出した研究。事後サンプリングが、異方性ノイズ下での演算子依存のシフト点におけるデノイジング問題に帰着することを示す。これを学習目的EPSとして定式化し、既存の事前学習構造を保ったままゼロからの学習や微調整が可能だとする。
-
Hierarchical Advantage Weighting for Online RL Fine-Tuning of VLAs from Sparse Episode OutcomesVLAのオンラインRL微調整に階層的優位重み付けHABCを提案事前学習済みVLA方策をオンライン強化学習で微調整する際、各エピソードの二値結果だけでは到達可能性と効率を区別できず、自律区間と介入区間の混在が誤った信用割当を招く課題を指摘。これに対し、二つの目的それぞれに別個のクリティックヘッドを異なるデータ部分集合で学習する階層的優位重み付け行動クローニング(HABC)を提案する。
-
Selection Without Signal, Recovery Through Expression: A Measurement Study of Post-Hoc Falsification Operators for Frozen Small Code Models凍結された小型コードモデル向け事後反証演算子の測定的研究論文タイトルによれば、追加学習を行わない凍結された小型コードモデルに対する「事後反証演算子(post-hoc falsification operators)」の測定的研究で、信号なしでの選択と表現を通じた回復という観点を扱うとされる。なおexportの本文抜粋はcontent filterによりブロックされたため、タイトルに基づく中立的な要約にとどめる。
-
Stable Menus of Public Goods: AI-Enabled Progress経済学の未解決問題でAI研究ワークフローの有効性を検証経済設計(EconCS)の未解決問題を題材に、AIを用いた研究ワークフローの有効性を実験した論文。プロンプトへの人間の直観の付与や多ターン対話が有効か、LLMが博士1年生を上回るかを検討。直観の付与と「野心的」な手順を促す多ターンが有効な一方、LLMは博士学生よりわずかに劣ったと報告する。
-
Decoupling Inference from State Updates in Low-Latency Feature Engines via Probabilistic ThinningストリーミングML向けに推論と状態更新を分離する確率的間引きを提案ストリーミングデータ系は、継続的に更新される多数の集約を保持する機械学習ワークフローを支える。本番環境では各イベントが永続ストレージへの読み書きを誘発し、高頻度の状態更新がレイテンシ・競合・運用コストの主因となる。本研究は確率的間引きにより推論と状態の永続化を分離し、全イベントをスコアリングしつつ情報量の多いイベントだけが永続更新を起こす設計を提案する。ディスク上の近似統計のみに依拠し、高頻度の制御面やワーカー間協調を不要とするという。
-
Phantoms and Disclosures: a Causal Framework for Auditing Synthetic Data合成データの情報漏洩を監査する因果フレームワークを提案生成AI・LLMの普及で、機微な実データの代替として合成データが注目される一方、訓練データの私的情報を記憶・再生するリスクが伴う。本研究は、システムが利用者情報を直接再生する「真の漏洩」と偶発的に生成する「幻影漏洩」を区別する、カスタマイズ可能な実証監査フレームワークを提案する。入力を訓練用とホールドアウトに分割し統計的仮説検定を適用することで、観測された漏洩がゼロ学習などの厳格なプライバシー基準と整合するかを判定するという。
-
Boosting MoE Training Throughput with Advanced Fusion KernelsNVIDIA、融合カーネルでMoE学習スループットを向上NVIDIAが開発者ブログで、Mixture-of-Experts(MoE)モデルの学習スループットを高める高度な融合カーネル(fusion kernels)の手法を解説した。MoEは大規模AIシステムの基盤的構成要素として急速に普及しており、本記事は学習処理の効率化に向けたカーネルレベルの最適化アプローチを紹介する内容とみられる。
-
Upper Bounds on the Generalization Error of Deep Learning Models via Local Robustness and Stability局所頑健性と安定性で深層学習の汎化誤差上界を精緻化する手法を提案頑健性に基づく汎化上界が実用設定で緩く無意味になりがちな問題を、不確実性項だけでなく頑健性項自体に起因すると分析。入力空間の部分領域ごとの安定・不安定サンプル数に応じて頑健性項をスケールする汎化上界を提案し、より締まった評価を与えると報告する。
-
Revisiting the Systematicity in Negation in the Era of In-Context LearningLLM の否定理解における体系性を行動・表現の両面から再検証大規模言語モデルにとって依然難しい否定文の意味理解について、行動的体系性と表現的体系性の 2 つの観点から分析する arxiv 論文。デモンストレーションと in-context learning を通じて LLM が否定をある程度扱えることを確認したと報告し、その体系性の限界を論じる(abstract ベースの中立要約)。
-
Deep Q-Learning on Hölder Spaces連続時間制御のBellman更新の正則性を解析しDeepONet構成を導出連続状態・行動の連続時間確率制御におけるQ学習の作用素論的な核を解析。一様楕円性とHölder正則性の下でBellman更新が状態を平滑化し行動にはLipschitz依存を残す異方的な正則性を持つことを示し、テンソル積DeepONet構成と近似・資源限界、剛性-複雑性のトレードオフを導く。
-
How Much Can We Trust LLM Search Agents? Measuring Endorsement Vulnerability to Web Content ManipulationLLM 検索エージェントの推薦汚染耐性を測る枠組みを提案攻撃者が公開したページが LLM 検索エージェントによって推薦として承認されるリスクを測る評価枠組み SearchGEO を提案する arxiv 論文。複数の LLM バックエンドを攻撃類型で評価する。abstract ベースの中立要約で、固有名・数値の断定は回避。
-
Scaling LLM Reasoning from Minimal Labels: A Semi-Supervised Framework with a Lightweight Verifier少量ラベルで LLM 推論を拡張する半教師あり枠組みを提案少数のラベル付きサンプルだけで推論の正しさを判定する軽量分類器を用い、推論検証自体をデータ生成機構に変える半教師あり枠組みを提案する arxiv 論文。abstract ベースの中立要約で、数値や優劣の断定は回避。
-
Multi-Turn Reflective Masking Elicits Reasoning in Mask Diffusion Modelsマスク拡散モデルに反復的な局所修正の推論力を引き出す手法を提案自己回帰モデルの逐次生成に対し、マスク拡散モデル(MDM)が持つ局所編集特性を活かす「Reflective Masking」を提案する論文とされる。軽量な後段学習で多ターンのマスク・再生成を可能にし、文脈に応じて出力を反復改良すると報告。手法・主張は原論文に基づく中立要約。
-
FraudSMSWalker: Benchmarking Agentic Large Language Models for SMS-to-Webpage Fraud DetectionSMS経由の詐欺判定を測るベンチマークFraudSMSWalkerを提案メッセージからWebページへ誘導するクロスチャネルなSMS詐欺の判定を対象に、URLを隠した条件で評価するベンチマークFraudSMSWalkerを提案する論文。10種のシナリオにわたる699件の二言語チェーン(詐欺332・正常367)を含み、ドメインや評判の手がかりに頼れない設定でエージェント型LLMを評価するとする。
-
Pretrained to Imagine, Fine-Tuned to Act: The Rise of World-Action ModelsNVIDIA、ロボット制御の新潮流「World-Action Model」を解説NVIDIA が技術ブログで、事前学習で世界を「想像」し微調整で「行動」する World-Action Model (WAM) の台頭を紹介。視覚言語モデルを基盤に動作方策を学ぶ Vision-Language-Action (VLA) モデルとの関係を整理し、ロボティクスにおける生成 AI や強化学習の応用を概観する。
-
VeriGraph: Towards Verifiable Data-Analytic Agentsデータ分析エージェントの推論を検証可能にする VeriGraph を提案LLM ベースのエージェントはデータ集約的な分析に強い一方、線形なテキストの推論過程は監査が難しく出力を検証しにくい。生データ上の決定的計算と自然言語の主張に対する意味的推論が非構造的に絡み合い、数値結論の再現も質的判断の精査も困難になる。本論文は、実行中に異種の証拠を明示的な有向非巡回グラフ (DAG) として構築する追跡可能なニューロシンボリック推論枠組み VeriGraph を提案する。