インフラ・ハードウェア B

111 件中 61〜90 件目を表示
  • NVIDIA Developer Blog · EN インフラ・ハードウェア 抜粋
    NVIDIA Blackwell Tops MLPerf Training 6.0 with Industry-Leading Scale and Performance
    NVIDIA、Blackwell が MLPerf Training 6.0 で首位と発表
    生成 AI 機械学習 NVIDIA ソフトウェア工学
    NVIDIA が、GPU アーキテクチャ Blackwell が MLPerf Training 6.0 ベンチマークで業界最高水準の規模と性能を達成し首位になったと発表した。export の raw_excerpt は cookie/query データで blocked のため、タイトルと発表ベースで中立に要約。数値は発表側の主張で第三者検証は未確認。
    元記事を読む (NVIDIA Developer Blog) ↗
  • arXiv cs.LG (Machine Learning) · EN 学習・ファインチューニング 抜粋
    Catastrophic Forgetting is Low-Rank: A Function-Space Theory for Continual Adaptation
    破滅的忘却は低ランク、継続適応の関数空間理論
    ファインチューニング 強化学習
    継続適応における破滅的忘却は通常パラメータのドリフトや再生で論じられるが、どの出力方向が脆弱かは分からない。本研究はNTK領域で関数空間の説明を与え、新課題訓練が交差課題カーネルを介し旧課題予測を低ランクにずらすことを示す。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN 新モデル・リリース 抜粋
    Recursive Scaling in Masked Diffusion Models
    マスク拡散モデルにおける再帰的スケーリングを検討
    深層学習 推論 (Inference) Transformer
    マスク拡散モデル(MDM)は近年注目される生成手法である。本研究はMDMにおける再帰的スケーリングを検討し、その挙動や効率に関する知見を示す。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.CL (Computation and Language) · EN 安全性・評価 抜粋
    LegalHalluLens: Typed Hallucination Auditing and Calibrated Multi-Agent Debate for Trustworthy Legal AI
    LegalHalluLens、法務AIの型付き幻覚を監査し多者討論で較正
    検索拡張生成 (RAG)
    法務に使うAIは平均で約52%幻覚するとされるが、平均は誤りの偏りや方向を隠す。LegalHalluLensは型付きの幻覚監査と較正された多エージェント討論を組み合わせ、信頼できる法務AIへ向けた実用的シグナルを与える枠組みを提案する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.LG (Machine Learning) · EN インフラ・ハードウェア 抜粋
    Multiple cyclicity and Wavelet Decomposition with Channel Correlation for Long-term Time Series Forecasting
    多重周期性とウェーブレット分解で長期時系列予測
    ニューラルネットワーク 強化学習
    周期性とトレンドは時系列の重要要素だが、既存研究は実世界のチャネル間相関の影響を軽視しがちと指摘。本研究は多重周期性とチャネル相関を伴うウェーブレット分解により長期時系列予測の精度向上を図る。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN 推論・効率化 抜粋
    SoftMoE: Soft Differentiable Routing for Mixture-of-Experts in LLMs
    SoftMoE、LLMの専門家混合に微分可能なソフトルーティング
    推論 (Inference) Mixture of Experts (MoE)
    疎な専門家混合(MoE)はLLMのパラメータ拡張を可能にするが離散的ルーティングが学習を難しくする。SoftMoEは微分可能なソフトルーティングを導入し、MoEの安定した学習と効率を狙う。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN インフラ・ハードウェア 抜粋
    Predictive Analytics in E-Commerce for CustomerBehavior Forecasting using hybrid Ret-DNN withXGBoost Model
    EC顧客行動予測にRet-DNNとXGBoostのハイブリッド
    深層学習 ニューラルネットワーク
    EC事業者は顧客行動の理解と将来購買の予測に苦戦している。本研究は予測分析として、Ret-DNNとXGBoostを組み合わせたハイブリッドモデルにより顧客行動予測を行う手法を提案する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN 安全性・評価 抜粋
    Monotonic Kolmogorov-Arnold Networks: A Theoretical and Empirical Study of Monotonicity as an Inductive Bias
    単調KAN、帰納バイアスとしての単調性を理論・実験で検討
    深層学習 機械学習 ニューラルネットワーク ソフトウェア工学
    単調性は表形式・科学・経済の設定で有用な構造的帰納バイアスである。本研究はエッジ単位の関数的透明性を持つ単調なコルモゴロフ・アーノルドネットワークを提案し、単調性を帰納バイアスとして理論と実験で検討する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN インフラ・ハードウェア 抜粋
    Meta-classification of one-class classification models using ranking correlation and nearest neighbor
    順位相関と最近傍で一クラス分類モデルをメタ分類
    アルゴリズム・理論 機械学習 Meta
    機械学習は多様な問題に適用されてきたが、MLモデル自体へのML適用は未開拓。本研究は全MLモデルを一クラス分類(OCC)で近似できるとみなし、順位相関と最近傍を用いてOCCモデルをメタ分類する手法を提案する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.CL (Computation and Language) · EN 学習・ファインチューニング 抜粋
    Perceptual compensation for tonal context in self-supervised speech models
    自己教師あり音声モデルにおける声調文脈の知覚補償を検討
    埋め込み (Embeddings) 検索拡張生成 (RAG) 音声処理
    本研究は自己教師あり音声モデルが声調(トーン)の文脈に対し知覚補償を行う程度を検討し、人間の音声知覚に見られる文脈効果がモデル表現にどの程度現れるかを分析する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 安全性・評価 抜粋
    EComAgentBench: Benchmarking Shopping Agents on Long-Horizon Tasks with Distributed Hidden Intent
    EComAgentBench、隠れた意図を含む長期課題で買い物エージェント評価
    AI エージェント ソフトウェア工学
    LLMベースの買い物エージェントが実用化する中、既存ベンチは要求が暗黙・プロフィール記録・適切な質問で初めて明らかになる形を捉えられない。EComAgentBenchは分散した隠れ意図を含む長期課題で買い物エージェントを評価する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • Simon Willison's Weblog · EN 安全性・評価 抜粋
    The Fable 5 Export Controls Harm US Cyber Defense
    Simon Willison、Fable 5の輸出規制は米サイバー防衛を損なうと批判
    Anthropic Claude コンピュータビジョン ニューラルネットワーク 強化学習
    Simon WillisonがKate Moussourisの見解を引用し、Claude Fable 5を輸出規制対象にした「脱獄」の実体は単に「このコードを修正して」という指示だったと指摘。既知CVEや意図的に埋め込んだ脆弱性を含むコードの修正依頼であり、バグ修正は本来コーディングモデルの役割で、規制はむしろ米国のサイバー防衛を弱めると論じる。
    元記事を読む (Simon Willison's Weblog) ↗
  • ITmedia AI+ · JA インフラ・ハードウェア 抜粋
    急拡大するAIインフラの電力需要……光明は「ワットビット連携」に? さくら田中社長と東電が対談
    AIインフラの電力需要急増、さくら田中社長と東電が「ワットビット連携」を議論
    AIインフラの拡大で急増する電力需要に、データセンターと電力網はどう向き合うべきか。幕張メッセで開催されたInterop Tokyo 2026の基調講演で、東京電力ホールディングスの岡本浩氏とさくらインターネットの田中邦裕社長が対談し、計算資源と電力をつなぐ「ワットビット連携」の可能性を巡って議論を交わした。
    元記事を読む (ITmedia AI+) ↗
  • NVIDIA Developer Blog · EN 学習・ファインチューニング 抜粋
    Fine-Tuning Biological Foundation Models with LoRA Using NVIDIA BioNeMo Recipes
    NVIDIA、BioNeMo Recipes で生物基盤モデルの LoRA fine-tuning 手法を解説
    ファインチューニング NVIDIA
    NVIDIA の開発者ブログが、タンパク質やゲノム配列の大規模コーパスで事前学習された生物基盤モデル(ESM2 等のタンパク質言語モデルを含む)を、LoRA を用いて効率的に fine-tuning する手法を、同社の BioNeMo Recipes を例に解説する。計算生物学における基盤モデル活用を扱った技術記事。
    元記事を読む (NVIDIA Developer Blog) ↗
  • arXiv cs.LG (Machine Learning) · EN インフラ・ハードウェア 抜粋
    Exact Posterior Score Estimation for Solving Linear Inverse Problems
    線形逆問題の厳密な事後スコアを閉形式で導出
    推論 (Inference) 強化学習
    拡散・フローモデルを線形逆問題に用いる際の事後スコアを、一般的なガウス補間の下で閉形式により厳密に導出した研究。事後サンプリングが、異方性ノイズ下での演算子依存のシフト点におけるデノイジング問題に帰着することを示す。これを学習目的EPSとして定式化し、既存の事前学習構造を保ったままゼロからの学習や微調整が可能だとする。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN インフラ・ハードウェア 抜粋
    Hierarchical Advantage Weighting for Online RL Fine-Tuning of VLAs from Sparse Episode Outcomes
    VLAのオンラインRL微調整に階層的優位重み付けHABCを提案
    ファインチューニング 強化学習
    事前学習済みVLA方策をオンライン強化学習で微調整する際、各エピソードの二値結果だけでは到達可能性と効率を区別できず、自律区間と介入区間の混在が誤った信用割当を招く課題を指摘。これに対し、二つの目的それぞれに別個のクリティックヘッドを異なるデータ部分集合で学習する階層的優位重み付け行動クローニング(HABC)を提案する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.CL (Computation and Language) · EN 安全性・評価 抜粋
    Selection Without Signal, Recovery Through Expression: A Measurement Study of Post-Hoc Falsification Operators for Frozen Small Code Models
    凍結された小型コードモデル向け事後反証演算子の測定的研究
    ファインチューニング ニューラルネットワーク 検索拡張生成 (RAG)
    論文タイトルによれば、追加学習を行わない凍結された小型コードモデルに対する「事後反証演算子(post-hoc falsification operators)」の測定的研究で、信号なしでの選択と表現を通じた回復という観点を扱うとされる。なおexportの本文抜粋はcontent filterによりブロックされたため、タイトルに基づく中立的な要約にとどめる。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN インフラ・ハードウェア 抜粋
    Stable Menus of Public Goods: AI-Enabled Progress
    経済学の未解決問題でAI研究ワークフローの有効性を検証
    検索拡張生成 (RAG)
    経済設計(EconCS)の未解決問題を題材に、AIを用いた研究ワークフローの有効性を実験した論文。プロンプトへの人間の直観の付与や多ターン対話が有効か、LLMが博士1年生を上回るかを検討。直観の付与と「野心的」な手順を促す多ターンが有効な一方、LLMは博士学生よりわずかに劣ったと報告する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.LG (Machine Learning) · EN 推論・効率化 抜粋
    Decoupling Inference from State Updates in Low-Latency Feature Engines via Probabilistic Thinning
    ストリーミングML向けに推論と状態更新を分離する確率的間引きを提案
    推論 (Inference) 機械学習 ニューラルネットワーク 検索拡張生成 (RAG)
    ストリーミングデータ系は、継続的に更新される多数の集約を保持する機械学習ワークフローを支える。本番環境では各イベントが永続ストレージへの読み書きを誘発し、高頻度の状態更新がレイテンシ・競合・運用コストの主因となる。本研究は確率的間引きにより推論と状態の永続化を分離し、全イベントをスコアリングしつつ情報量の多いイベントだけが永続更新を起こす設計を提案する。ディスク上の近似統計のみに依拠し、高頻度の制御面やワーカー間協調を不要とするという。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN インフラ・ハードウェア 抜粋
    Phantoms and Disclosures: a Causal Framework for Auditing Synthetic Data
    合成データの情報漏洩を監査する因果フレームワークを提案
    生成 AI 推論 (Inference) 強化学習
    生成AI・LLMの普及で、機微な実データの代替として合成データが注目される一方、訓練データの私的情報を記憶・再生するリスクが伴う。本研究は、システムが利用者情報を直接再生する「真の漏洩」と偶発的に生成する「幻影漏洩」を区別する、カスタマイズ可能な実証監査フレームワークを提案する。入力を訓練用とホールドアウトに分割し統計的仮説検定を適用することで、観測された漏洩がゼロ学習などの厳格なプライバシー基準と整合するかを判定するという。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • NVIDIA Developer Blog · EN 開発者ツール 抜粋
    Boosting MoE Training Throughput with Advanced Fusion Kernels
    NVIDIA、融合カーネルでMoE学習スループットを向上
    深層学習 生成 AI 機械学習 Mixture of Experts (MoE) NVIDIA
    NVIDIAが開発者ブログで、Mixture-of-Experts(MoE)モデルの学習スループットを高める高度な融合カーネル(fusion kernels)の手法を解説した。MoEは大規模AIシステムの基盤的構成要素として急速に普及しており、本記事は学習処理の効率化に向けたカーネルレベルの最適化アプローチを紹介する内容とみられる。
    元記事を読む (NVIDIA Developer Blog) ↗
  • arXiv cs.LG (Machine Learning) · EN 安全性・評価 抜粋
    Upper Bounds on the Generalization Error of Deep Learning Models via Local Robustness and Stability
    局所頑健性と安定性で深層学習の汎化誤差上界を精緻化する手法を提案
    深層学習 ニューラルネットワーク 強化学習
    頑健性に基づく汎化上界が実用設定で緩く無意味になりがちな問題を、不確実性項だけでなく頑健性項自体に起因すると分析。入力空間の部分領域ごとの安定・不安定サンプル数に応じて頑健性項をスケールする汎化上界を提案し、より締まった評価を与えると報告する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.CL (Computation and Language) · EN インフラ・ハードウェア 抜粋
    Revisiting the Systematicity in Negation in the Era of In-Context Learning
    LLM の否定理解における体系性を行動・表現の両面から再検証
    大規模言語モデルにとって依然難しい否定文の意味理解について、行動的体系性と表現的体系性の 2 つの観点から分析する arxiv 論文。デモンストレーションと in-context learning を通じて LLM が否定をある程度扱えることを確認したと報告し、その体系性の限界を論じる(abstract ベースの中立要約)。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.LG (Machine Learning) · EN 学習・ファインチューニング 抜粋
    Deep Q-Learning on Hölder Spaces
    連続時間制御のBellman更新の正則性を解析しDeepONet構成を導出
    強化学習
    連続状態・行動の連続時間確率制御におけるQ学習の作用素論的な核を解析。一様楕円性とHölder正則性の下でBellman更新が状態を平滑化し行動にはLipschitz依存を残す異方的な正則性を持つことを示し、テンソル積DeepONet構成と近似・資源限界、剛性-複雑性のトレードオフを導く。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.CL (Computation and Language) · EN 安全性・評価 抜粋
    How Much Can We Trust LLM Search Agents? Measuring Endorsement Vulnerability to Web Content Manipulation
    LLM 検索エージェントの推薦汚染耐性を測る枠組みを提案
    AI エージェント Claude Gemini GPT 音声処理
    攻撃者が公開したページが LLM 検索エージェントによって推薦として承認されるリスクを測る評価枠組み SearchGEO を提案する arxiv 論文。複数の LLM バックエンドを攻撃類型で評価する。abstract ベースの中立要約で、固有名・数値の断定は回避。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN マルチモーダル 抜粋
    Scaling LLM Reasoning from Minimal Labels: A Semi-Supervised Framework with a Lightweight Verifier
    少量ラベルで LLM 推論を拡張する半教師あり枠組みを提案
    ニューラルネットワーク ソフトウェア工学
    少数のラベル付きサンプルだけで推論の正しさを判定する軽量分類器を用い、推論検証自体をデータ生成機構に変える半教師あり枠組みを提案する arxiv 論文。abstract ベースの中立要約で、数値や優劣の断定は回避。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 新モデル・リリース 抜粋
    Multi-Turn Reflective Masking Elicits Reasoning in Mask Diffusion Models
    マスク拡散モデルに反復的な局所修正の推論力を引き出す手法を提案
    検索拡張生成 (RAG) ソフトウェア工学
    自己回帰モデルの逐次生成に対し、マスク拡散モデル(MDM)が持つ局所編集特性を活かす「Reflective Masking」を提案する論文とされる。軽量な後段学習で多ターンのマスク・再生成を可能にし、文脈に応じて出力を反復改良すると報告。手法・主張は原論文に基づく中立要約。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 安全性・評価 抜粋
    FraudSMSWalker: Benchmarking Agentic Large Language Models for SMS-to-Webpage Fraud Detection
    SMS経由の詐欺判定を測るベンチマークFraudSMSWalkerを提案
    AI エージェント Meta ニューラルネットワーク 強化学習
    メッセージからWebページへ誘導するクロスチャネルなSMS詐欺の判定を対象に、URLを隠した条件で評価するベンチマークFraudSMSWalkerを提案する論文。10種のシナリオにわたる699件の二言語チェーン(詐欺332・正常367)を含み、ドメインや評判の手がかりに頼れない設定でエージェント型LLMを評価するとする。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • NVIDIA Developer Blog · EN マルチモーダル 抜粋
    Pretrained to Imagine, Fine-Tuned to Act: The Rise of World-Action Models
    NVIDIA、ロボット制御の新潮流「World-Action Model」を解説
    コンピュータビジョン 生成 AI NVIDIA 強化学習 ロボティクス
    NVIDIA が技術ブログで、事前学習で世界を「想像」し微調整で「行動」する World-Action Model (WAM) の台頭を紹介。視覚言語モデルを基盤に動作方策を学ぶ Vision-Language-Action (VLA) モデルとの関係を整理し、ロボティクスにおける生成 AI や強化学習の応用を概観する。
    元記事を読む (NVIDIA Developer Blog) ↗
  • arXiv cs.CL (Computation and Language) · EN 安全性・評価 抜粋
    VeriGraph: Towards Verifiable Data-Analytic Agents
    データ分析エージェントの推論を検証可能にする VeriGraph を提案
    AI エージェント ニューラルネットワーク ソフトウェア工学
    LLM ベースのエージェントはデータ集約的な分析に強い一方、線形なテキストの推論過程は監査が難しく出力を検証しにくい。生データ上の決定的計算と自然言語の主張に対する意味的推論が非構造的に絡み合い、数値結論の再現も質的判断の精査も困難になる。本論文は、実行中に異種の証拠を明示的な有向非巡回グラフ (DAG) として構築する追跡可能なニューロシンボリック推論枠組み VeriGraph を提案する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗