推論・効率化｜AI/Tech動向まとめ

Sakana AI Blog (ja) · 2026-08-02 JA 新モデル・リリース抜粋

Sakana AI、日本語特化のLLM API「Sakana Namazu」を提供開始

Sakana AI、日本語特化LLM「Namazu」をOpenAI互換APIで提供開始

AI エージェント推論 (Inference) 機械学習 Meta OpenAI

Sakana AIが、日本語と日本の商習慣に特化したLLM API「Sakana Namazu」の提供を開始した。Sakana Chat搭載モデルを更新したもので、Moonshot AIのオープンモデル「Kimi K2.6」をベースに社内データで日本語・業務文脈への適合を進めた。Web検索とコード実行のビルトインツールを備え、OpenAI互換のためbase_urlの変更だけで既存コードから利用できる。高コストなフロンティアモデルと素のオープンモデルの中間を埋める選択肢として位置づける。

元記事を読む (Sakana AI Blog (ja)) ↗

ITmedia AI+ · 2026-08-01 JA 新モデル・リリース抜粋

OpenAI、アクティブユーザー10億人超に　導入企業は200万社超

OpenAI、アクティブユーザー10億人・導入企業200万社を突破

GPT 推論 (Inference) OpenAI

OpenAIは、アクティブユーザーが10億人、導入企業が200万社を超えたと公表した。推論の保持やコンテキスト管理の改善、本番ソフトウェアの最適化によりコスト削減とトークン生成効率の向上を実現し、GPT-5.6の一部モデルは値下げした。

元記事を読む (ITmedia AI+) ↗

NVIDIA Developer Blog · 2026-07-31 EN インフラ・ハードウェア抜粋

Co-Designing AI Model Attention for Fast, Interactive Long-Context Inference

NVIDIA、長文脈推論を高速化するattention協調設計手法を解説

生成 AI 推論 (Inference) NVIDIA

NVIDIAは、エージェント型・長文脈ワークロードの増加でattentionが推論時間の大きな割合を占める課題に対し、モデルのattention機構をハードウェアと協調設計して高速かつ対話的な長文脈推論を実現する手法を紹介した。

元記事を読む (NVIDIA Developer Blog) ↗

arXiv cs.LG (Machine Learning) · 2026-07-31 EN 推論・効率化

GQ-FSL: Green Quantized Federated Split Learning

ニューラルネットワーク量子化

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-31 EN 新モデル・リリース

When Does On-Policy Interaction Help? Representational Tradeoffs in Value-Based Imitation Learning

ニューラルネットワーク強化学習ロボティクス

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-31 EN 新モデル・リリース

QASP: Query-Adaptive Robust Vector Search Policy

推論 (Inference) 検索拡張生成 (RAG)

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-31 EN 新モデル・リリース

FriendBench: Benchmarking Dyadic Familiarity Inference in Humans and Multimodal Large Language Models

推論 (Inference) ニューラルネットワークソフトウェア工学音声処理

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-31 EN 学習・ファインチューニング

The Parts Are Greater Than the Sum: Automated Task Sequencing for Efficient Training of Multi-Policy LLMs

ファインチューニング量子化

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-31 EN 推論・効率化

ResKV: Reconstructing Omitted Attention Contributions for Fixed-Budget KV Cache Compression

推論 (Inference)

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-31 EN 推論・効率化

Adaptive FastOPD: Progress-Aware Rollout Horizon Expansion for Efficient On-Policy Distillation

検索拡張生成 (RAG) 強化学習

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-31 EN 新モデル・リリース

Evidence-Type Competition: When Can Interventional Data Teach Language Models Causal Direction?

推論 (Inference) 強化学習

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-31 EN 推論・効率化

Self-Play Meets Skill Evolution: Self-Evolving Search Agents that Pose, Solve, and Remember

AI エージェント推論 (Inference) 検索拡張生成 (RAG) 強化学習ソフトウェア工学

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-31 EN 推論・効率化

TFGformer: Multivariate Time Series Forecasting via Time-Frequency Graph Learning and Covariate Fusion

推論 (Inference) 検索拡張生成 (RAG)

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-31 EN 推論・効率化

Analytical and Bootstrap Confidence Intervals of Double Machine Learning: Simulation studies and an application to rural-urban difference in obesity prevalence

アルゴリズム・理論推論 (Inference) 機械学習ニューラルネットワーク検索拡張生成 (RAG)

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-31 EN 推論・効率化

Beyond Retrieval: Analytic Memory for Multimodal Agents

AI エージェント推論 (Inference) Meta ニューラルネットワーク強化学習

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-31 EN 新モデル・リリース

Bridging the Question-Answer Gap in Retrieval-Augmented Generation: Hypothetical Prompt Embeddings

埋め込み (Embeddings) 検索拡張生成 (RAG) ソフトウェア工学

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-31 EN 推論・効率化

OnlineCache: Learning Dynamic Caching Policies with Error Correction for Efficient Diffusion Inference

推論 (Inference) 検索拡張生成 (RAG) 強化学習

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-31 EN 推論・効率化

Studying quantization trade-offs for efficient inference deployment in machine translation

深層学習推論 (Inference) 量子化

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-31 EN 推論・効率化

Versatile On-device Adaptation at the Edge by Unifying Few-shot, Zero-shot, Continual, and In-context Learning

アルゴリズム・理論推論 (Inference) ニューラルネットワーク検索拡張生成 (RAG) 強化学習

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-31 EN 新モデル・リリース

MAGA: Multi-Platform Self-Fusion of GUI Agents via Structured Action Distillation

AI エージェントニューラルネットワーク検索拡張生成 (RAG)

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-31 EN 推論・効率化

Translation with Thought: Difficulty-Adaptive Reasoning via Reinforcement Learning for Multi-Domain Machine Translation

DeepSeek ファインチューニング GPT 推論 (Inference) ニューラルネットワーク

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-31 EN 新モデル・リリース

OsteoCAD: A Human-in-the-Loop Cloud-Edge Framework for Bone Tumor Segmentation

深層学習推論 (Inference) ニューラルネットワーク強化学習

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-31 EN エージェント・ツール使用

Tool Specifications Matter: Uncovering and Mitigating Safety Risks in AI Agents

AI エージェント深層学習推論 (Inference) 検索拡張生成 (RAG) 強化学習

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-31 EN エージェント・ツール使用

Data Turnstile: A Scalable Open Framework for Function-Calling Data Generation

ニューラルネットワーク

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-31 EN 安全性・評価

Don't Mix Rewards, Mix Policies: Policy Decomposition and Optimization for Multi-Reward RL

推論 (Inference) 強化学習ソフトウェア工学

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-31 EN インフラ・ハードウェア

Small Is Enough: Per-User Style Rewriting of AI-Edited Text via LoRA Adapters

推論 (Inference)

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-31 EN 推論・効率化

FBFM: A Training-Free Asynchronous Feedback Mechanism for Flow-Matching in World-Action Models Execution

推論 (Inference) 検索拡張生成 (RAG) 強化学習

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-31 EN 推論・効率化

MOSAIC: Masked Outsourcing of Secure AI Computations

推論 (Inference) 量子化 Transformer

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-31 EN 推論・効率化

SAF-OPD: Stable Advantage Fusion for On-Policy Distillation

ニューラルネットワーク検索拡張生成 (RAG) 強化学習

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-31 EN 推論・効率化

SERUM: State Extraction and Refinement for User Modeling

埋め込み (Embeddings) 推論 (Inference) ニューラルネットワーク

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗