推論・効率化 (2 / 6 ページ)｜AI/Tech動向まとめ

Lobste.rs (AI tagged) · 2026-07-31 EN 推論・効率化抜粋

vLLM for Baidu Kunlun

Baidu、AIチップKunlun向けvLLM実装をGitHubで公開

推論 (Inference)

Baiduが自社AIアクセラレータKunlun向けのvLLM実装「vLLM-Kunlun」をGitHubで公開した。高速なLLM推論エンジンvLLMをKunlunハードウェア上で動かせるようにするもので、NVIDIA以外の推論基盤の選択肢を広げる取り組み。

元記事を読む (Lobste.rs (AI tagged)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-31 EN 推論・効率化

Can Zero-Shot LLMs Predict Child Malnutrition? A Fairness and Temporal Robustness Study

深層学習 GPT 推論 (Inference) Meta 強化学習

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-31 EN 推論・効率化

TransMem: Transforming Hidden States into Memory for Large Language Models

AI エージェント深層学習推論 (Inference) 検索拡張生成 (RAG)

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-31 EN 新モデル・リリース

GoldenRetriever: Non-Interactive Homomorphic Encrypted Retrieval for Privacy-Preserving RAG

検索拡張生成 (RAG)

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-31 EN 推論・効率化

Adjudicated Captioning: Multi-Agent Alignment Scoring and Consensus-Distilled Beam Arbitration for Strict Zero-Shot Image Captioning

深層学習推論 (Inference) Transformer

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-31 EN 新モデル・リリース

Mixture-of-Translators: Translating KV Caches Across Heterogeneous Large Language Models

深層学習 GPT ニューラルネットワーク検索拡張生成 (RAG) 強化学習

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-31 EN 推論・効率化

BLADE: Boundary-Expanded and Layer-Adaptive Dynamic Exit for Efficient LLM Reasoning

推論 (Inference) 検索拡張生成 (RAG) 強化学習ソフトウェア工学

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

ITmedia AI+ · 2026-07-31 JA 学習・ファインチューニング抜粋

Thinking Machines、軽量モデル「Inkling-Small」正式公開　サイズ4分の1で「Inkling」に匹敵する性能

Thinking Machines、軽量モデル「Inkling-Small」公開、1/4サイズで同等性能

強化学習

Thinking Machines Labは、オープンウェイトのAIモデル「Inkling-Small」正式版を公開した。従来モデルの4分の1のサイズながら、データ改良や強化学習によりコード生成などで「Inkling」に匹敵する性能を実現したとしている。

元記事を読む (ITmedia AI+) ↗

ITmedia AI+ · 2026-07-31 JA 推論・効率化抜粋

Chromeに13年以上潜んでいた脆弱性、AIで発見　直近2回のアプデで過去23回分を上回るバグ修正

Google、Chromeの13年潜伏の脆弱性をAIで発見、週2回更新も試行

AI エージェント Gemini Google

Googleは公式ブログで、ChromeのセキュリティへのAI活用を解説した。Geminiベースのエージェントが13年以上潜んでいた脆弱性を発見し、直近2回の更新で過去23回分を上回るバグを修正したという。AIによる攻撃の高速化に対応し、セキュリティ更新の「週2回」配信も試行する。

元記事を読む (ITmedia AI+) ↗

ITmedia AI+ · 2026-07-31 JA 新モデル・リリース抜粋

Google、ロボット向けAI「Gemini Robotics 2」発表　ヒューマノイドの全身制御や指先作業を実現

Google、ロボット向けAI「Gemini Robotics 2」発表、全身制御や指先作業に対応

Gemini Google 推論 (Inference) ロボティクス

GoogleとGoogle DeepMindは、ロボット向けAIモデル群「Gemini Robotics 2」を発表した。ヒューマノイドの全身制御や指先での微細な作業、複数ロボットの連携に対応する。高次の「脳」として機能する推論モデル「ER 2」や軽量版を含む構成となっている。

元記事を読む (ITmedia AI+) ↗

arXiv cs.CL (Computation and Language) · 2026-07-31 EN 新モデル・リリース

Token-Level Diagnosis of Sycophancy in LLMs with Attribution-Guided Steering

推論 (Inference) ニューラルネットワーク

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 推論・効率化

ReToken: One Token to Improve Vision-Language Models for Visual Retrieval

コンピュータビジョン埋め込み (Embeddings) 推論 (Inference)

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-30 EN マルチモーダル

VAD: Attributing Visual Evidence for Target Reconstruction in Multimodal On-Policy Distillation

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-30 EN 推論・効率化

MixFrag: Fragility-Guided Mixed-Precision Post-Training Quantization for Vision Transformers

コンピュータビジョン量子化検索拡張生成 (RAG) 強化学習 Transformer

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-30 EN 新モデル・リリース

$β$-OPSD: Deriving with Policy Optimization, Training with Self-Distillation

強化学習

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 新モデル・リリース

Rethinking Inference-Time Scaling in Local Computer-Use Agents: Failure Modes and Compute Tradeoffs

AI エージェント推論 (Inference) ニューラルネットワーク強化学習

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-30 EN 新モデル・リリース

Frontis-MA1: Training an AI4AI Model towards Recursive Self-Improvement in Machine Learning Engineering

ファインチューニング GPT 機械学習 Meta 検索拡張生成 (RAG)

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-30 EN 推論・効率化

Doubly Robust Functional Representation Learning for Longitudinal Causal Inference with Irregular Histories

推論 (Inference) 検索拡張生成 (RAG) 強化学習

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 推論・効率化

APO: Unsupervised Atomic Policy Optimization for 3D Structure Prediction of Atomic Systems

推論 (Inference) 人間のフィードバックによる強化学習 (RLHF)

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 新モデル・リリース

MANTA: Multi-Agent Network Topology Adaptation for Self-Evolving Multi-Agent Systems

推論 (Inference) ニューラルネットワーク検索拡張生成 (RAG)

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-30 EN 推論・効率化

Stage-Replay Divergence Follows the KV Cache: Fixed-Prefix Precision Controls and Bidirectional Cache Transplantation

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 新モデル・リリース

A Fuzzy Rule-based Neuro-Symbolic Approach for Pipe Severity Prediction in Sewer Networks

推論 (Inference) ニューラルネットワーク Transformer

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-30 EN 推論・効率化

Would You Walk to the Car Wash? Revealing the Salience Bias of Large Language Models in Commonsense Reasoning

推論 (Inference) ニューラルネットワーク

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-30 EN 新モデル・リリース

Improving Mental Health Screening and Early Risk Detection in Spanish

強化学習

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 推論・効率化

Towards Autonomous Aircraft Surveillance from Nanosatellites through On-Board Inference and Generative Data Augmentation

推論 (Inference) ニューラルネットワーク検索拡張生成 (RAG)

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 新モデル・リリース

SVR: Self-Verifying Refinement via Joint Verdict-Confidence Reinforcement Learning for Adaptive Test-Time Compute

推論 (Inference) 検索拡張生成 (RAG) 強化学習ソフトウェア工学

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 新モデル・リリース

Machines that know they are aging: a framework for hardware-aware autonomous intelligence

推論 (Inference) ニューラルネットワークロボティクス

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-30 EN 学習・ファインチューニング

Lightning OPD 2.0: Mitigating Style Bias in Cross-Teacher On-Policy Distillation for Large Reasoning Models

ファインチューニング

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-30 EN 開発者ツール

QAdapt: A Noise-Adaptive Neural Pre-Decoding Framework for Quantum Error Correction

深層学習ファインチューニング Google

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 推論・効率化

When Derived Measurements Mislead: Quantifying and Mitigating LLM Over-Trust with Privileged-Modality Reliability Evidence

推論 (Inference) ニューラルネットワーク人間のフィードバックによる強化学習 (RLHF)

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗