推論・効率化 (3 / 6 ページ)｜AI/Tech動向まとめ

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 推論・効率化

WIDE: Boosting Adaptive LLM Inference via Token-level Dynamic Width Pruning

深層学習推論 (Inference) ニューラルネットワーク強化学習

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 業界導入・応用

QuantWAMs: Calibrating at the Right Granularity for World Action Models

量子化強化学習

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-30 EN 推論・効率化

Why Are GUI Agents Correct but Late? Decode on the Decision-Time Critical Path, Tested with Pre-Compiled Policy Trees

AI エージェント深層学習ニューラルネットワーク人間のフィードバックによる強化学習 (RLHF) ソフトウェア工学

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN マルチモーダル

Correcting What You Cannot See: Credit Assignment for Perception Distillation in Multimodal Reasoners

ニューラルネットワーク検索拡張生成 (RAG) ソフトウェア工学

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-30 EN 資金・M&A

Fairness Pruning: Locating Demographic Bias in GLU-MLP Layers via Differential Activations

推論 (Inference) Llama 機械学習 Meta

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-30 EN 推論・効率化

Fully Inductive Cardinality Estimation

埋め込み (Embeddings) ニューラルネットワーク強化学習

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-30 EN 推論・効率化

Semi-Supervised Learning for Molecular Graphs via Ensemble Consensus

機械学習ニューラルネットワーク

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 推論・効率化

CACHE-UK: A Stability-Aware Memory Editor for Sequentially Updated Quantized LLMs in Finance

Llama 量子化

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 新モデル・リリース

Tycho: Active Abstraction with Programmatic World Models for ARC-AGI-3

Claude GPT 推論 (Inference) 強化学習

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN マルチモーダル

Theia: Large-Scale Multimodal Captioning and Automated Validation of the Incidents1M Dataset for Data-Free Distillation

コンピュータビジョン Mixture of Experts (MoE) ニューラルネットワーク検索拡張生成 (RAG) 強化学習

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-30 EN 推論・効率化

Understanding Is Done Early: A Depth Division of Labor in Large Language Models and Its Use for Unbounded-Context Memory

深層学習機械学習 NVIDIA ソフトウェア工学 Transformer

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 推論・効率化

Operationally Guided Placement-Aware Learning for Industrial Online 3D Bin Packing

埋め込み (Embeddings) 推論 (Inference)

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

IEEE Spectrum (AI section) · 2026-07-30 EN 推論・効率化抜粋

Are AI Models Working Harder Than They Need to?

AIモデルは必要以上に働いているのか？乗算依存の効率を問う

深層学習 Google 推論 (Inference) ニューラルネットワークソフトウェア工学

IEEE Spectrumは、現代のAIの多くが膨大な乗算処理に依存している点に着目した記事を掲載した。生成回答から写真整理まで支えるニューラルネットワークが本当に必要な計算量で動いているのかを問い、AI推論の効率化の余地を論じている。

元記事を読む (IEEE Spectrum (AI section)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 推論・効率化

AgenticASR: Refining Speech Recognition in Real-World Scenarios via an Agentic Approach

深層学習推論 (Inference) ニューラルネットワーク強化学習音声処理

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 推論・効率化

OPLD: On-Policy Latent Distillation for Multimodal Reasoning

強化学習

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 推論・効率化

Information Bottleneck Learning for Faithful Time Series Forecasting Explanations

推論 (Inference) 強化学習

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 推論・効率化

MIND: Lightweight and Effective Memory Injection Defense for LLM Agents via Intent-Aware Information Bottleneck

AI エージェント推論 (Inference) 検索拡張生成 (RAG) 音声処理

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-30 EN 推論・効率化

From Expert Reduction to Behavioral Divergence: Tracing Numerical State through Sparse MoE Inference

DeepSeek 推論 (Inference) Mixture of Experts (MoE) 人間のフィードバックによる強化学習 (RLHF)

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 新モデル・リリース

Distilling Answer Set Programming Theories from Large Language Models

Claude DeepSeek GPT ニューラルネットワークソフトウェア工学

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-30 EN インフラ・ハードウェア

GGC: Selective Query Correction for Reliable Text-to-SPARQL Generation

推論 (Inference) ニューラルネットワーク

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 推論・効率化

Group-Reflective Self-Distillation for Agentic Reinforcement Learning

AI エージェント強化学習

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 推論・効率化

SemPIC: Learning Semantic Position-Independent KV Caches

深層学習ニューラルネットワーク

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 推論・効率化

Stimulus-Evoked Network Dynamics in Human Cortical Organoids: From a Graph-Computational Framework to Repeated-Stimulation Depression

ニューラルネットワーク強化学習

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-30 EN 推論・効率化

A Query-Efficient Stochastic Volume Rendering Framework for Time-Varying Implicit Neural Volumes

推論 (Inference)

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-30 EN 新モデル・リリース

Contrastive Reinforced Policy Optimization via Privileged Self-Distillation

検索拡張生成 (RAG) 強化学習

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-30 EN 推論・効率化

Flux-OPD: On-Policy Distillation with Evolving Contexts

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-30 EN 新モデル・リリース

Driving up Inference Energy on SNNs: Per-Sample and Universal Sponge Attacks

推論 (Inference) ニューラルネットワーク

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-30 EN 推論・効率化

Generalization Bounds on Optimal Control for Transformer Training and Wasserstein Distributional Robustness

ニューラルネットワーク量子化 Transformer

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-30 EN 推論・効率化

TAPO: Transition-Aware Policy Optimization for LLM Agents

AI エージェントアルゴリズム・理論推論 (Inference) 強化学習

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-30 EN インフラ・ハードウェア

Gradient-free Task-Conditioned Retrieval for On-Device In-Context Learning

推論 (Inference) Llama

元記事を読む (arXiv cs.CL (Computation and Language)) ↗