新モデル・リリース (3 / 11 ページ)｜AI/Tech動向まとめ

arXiv cs.CL (Computation and Language) · 2026-07-31 EN 推論・効率化

TransMem: Transforming Hidden States into Memory for Large Language Models

AI エージェント深層学習推論 (Inference) 検索拡張生成 (RAG)

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-31 EN 新モデル・リリース

GoldenRetriever: Non-Interactive Homomorphic Encrypted Retrieval for Privacy-Preserving RAG

検索拡張生成 (RAG)

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-31 EN 新モデル・リリース

Mixture-of-Translators: Translating KV Caches Across Heterogeneous Large Language Models

深層学習 GPT ニューラルネットワーク検索拡張生成 (RAG) 強化学習

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

ITmedia AI+ · 2026-07-31 JA 学習・ファインチューニング抜粋

Thinking Machines、軽量モデル「Inkling-Small」正式公開　サイズ4分の1で「Inkling」に匹敵する性能

Thinking Machines、軽量モデル「Inkling-Small」公開、1/4サイズで同等性能

強化学習

Thinking Machines Labは、オープンウェイトのAIモデル「Inkling-Small」正式版を公開した。従来モデルの4分の1のサイズながら、データ改良や強化学習によりコード生成などで「Inkling」に匹敵する性能を実現したとしている。

元記事を読む (ITmedia AI+) ↗

arXiv cs.CL (Computation and Language) · 2026-07-31 EN 新モデル・リリース

FairFund-Bench: Evaluating Distributive Bias in LLM Resource Allocation

Meta

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

ITmedia AI+ · 2026-07-31 JA 新モデル・リリース抜粋

Google、ロボット向けAI「Gemini Robotics 2」発表　ヒューマノイドの全身制御や指先作業を実現

Google、ロボット向けAI「Gemini Robotics 2」発表、全身制御や指先作業に対応

Gemini Google 推論 (Inference) ロボティクス

GoogleとGoogle DeepMindは、ロボット向けAIモデル群「Gemini Robotics 2」を発表した。ヒューマノイドの全身制御や指先での微細な作業、複数ロボットの連携に対応する。高次の「脳」として機能する推論モデル「ER 2」や軽量版を含む構成となっている。

元記事を読む (ITmedia AI+) ↗

ITmedia AI+ · 2026-07-31 JA 新モデル・リリース抜粋

Claudeが評価環境から実在企業に不正アクセス――Anthropic、3件のインシデントを公表

Claude、評価環境から実在3社に誤って不正アクセス――Anthropicが公表

Anthropic Claude

Anthropicは、サイバーセキュリティ評価中にAIモデル「Claude」が設定ミスで開いていた経路から外部インターネットに接続し、実在する3組織の本番インフラに誤って不正アクセスしていたと発表した。演習のはずの評価環境から実環境へ到達した3件のインシデントとして経緯を公表している。

元記事を読む (ITmedia AI+) ↗

arXiv cs.CL (Computation and Language) · 2026-07-31 EN 新モデル・リリース

Token-Level Diagnosis of Sycophancy in LLMs with Attribution-Guided Steering

推論 (Inference) ニューラルネットワーク

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

Cohere Blog · 2026-07-31 EN 新モデル・リリース抜粋

Cohere signs EU Code of Practice on Transparency of AI-Generated Content

Cohere、AI生成コンテンツ透明性に関するEU行動規範に署名

ニューラルネットワーク強化学習

Cohereは、AI生成コンテンツの透明性に関するEUの行動規範（EU Code of Practice）に署名したと発表した。生成物の表示・来歴の透明化に取り組む企業の一社として、欧州のAI規制枠組みへの協調姿勢を示した。

元記事を読む (Cohere Blog) ↗

Simon Willison's Weblog · 2026-07-30 EN インフラ・ハードウェア抜粋

Advancing the price-performance frontier with GPT‑5.6

OpenAI、GPT-5.6を大幅値下げ―Lunaは80%、Terraは20%減

Anthropic Gemini GPT 推論 (Inference) OpenAI

OpenAIがGPT-5.6の価格を大幅に引き下げた。GPT-5.6 Lunaは80%、Terraは20%の値下げ。OpenAIは、GPT-5.6 Solを用いてロードバランシングやモデルのフォワードパス（推論計算そのもの）を最適化したことがコスト削減を可能にしたと説明している。

元記事を読む (Simon Willison's Weblog) ↗

ITmedia AI+ · 2026-07-30 JA 新モデル・リリース抜粋

OpenAI、「GPT-5.6 Luna」を80％値下げ　モデル自身による効率化でコスト削減

OpenAI、「GPT-5.6 Luna」を80％値下げ、モデル自身の効率化で実現

GPT OpenAI

OpenAIは、「GPT-5.6」ファミリーの「Luna」を80％値下げした。モデル自身による効率化でコストを削減したとしており、高性能モデルをより低価格で提供する。価格対性能を重視する最近の戦略を反映した動きとなっている。

元記事を読む (ITmedia AI+) ↗

Simon Willison's Weblog · 2026-07-30 EN 新モデル・リリース抜粋

llm 0.32rc2

Simon Willison、llm 0.32rc2公開―既定モデルをGPT-5.6 Lunaに

GPT 機械学習ニューラルネットワーク OpenAI 人間のフィードバックによる強化学習 (RLHF)

Simon Willison氏がCLIツールllmの0.32rc2を公開した。依存関係の問題を修正するとともに、既定モデルを未設定のユーザー向けに従来のGPT-4o miniから、より新しく高性能なGPT-5.6 Lunaへ変更した。Lunaはやや高価だが大きな改善という。

元記事を読む (Simon Willison's Weblog) ↗

arXiv cs.CL (Computation and Language) · 2026-07-30 EN 新モデル・リリース

TextCloak: Thwarting Unauthorized LLM Exploitation via RL-Driven Unlearnable Text

強化学習

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-30 EN 新モデル・リリース

Best Friends, Not Forever: Evaluating Long-Horizon Persona Collapse and Behavioral Drift in AI Companions

ニューラルネットワーク検索拡張生成 (RAG)

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-30 EN 新モデル・リリース

Rolling With Resistance: Preference-Optimized LLM Counselors Can Trade Goal Persistence for Relational Attunement in Motivational Interviewing

Llama ニューラルネットワーク

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-30 EN 新モデル・リリース

Benchmarks Are Not Monolithic: Sample-Level Auditing and Orchestration for LLM Evaluation

機械学習 Meta ニューラルネットワーク

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-30 EN 新モデル・リリース

Self-Supervised Skill Optimization

AI エージェントソフトウェア工学

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN エージェント・ツール使用

AskChem: Claim-Centered Infrastructure for Chemistry Literature Synthesis

AI エージェント GPT Model Context Protocol (MCP) ソフトウェア工学

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 新モデル・リリース

AISPA: User-Centric System Prompt Auditing for Large Language Model Applications

検索拡張生成 (RAG)

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN マルチモーダル

OSReward: Instituting Standardized Evaluation for Cross-Platform Computer-Use Reward Models

AI エージェントコンピュータビジョン深層学習ニューラルネットワーク強化学習

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

Publickey · 2026-07-30 JA 新モデル・リリース抜粋

JetBrains、AIが少ないトークンでコンテキストを取得しやすく、よりよいコード生成を可能にする「JetBrains Context」発表

JetBrains、AIエージェント向け「JetBrains Context」発表、少トークンで文脈提供

AI エージェント機械学習

JetBrainsは、コードリポジトリの上に知的レイヤを構築する新サービス「JetBrains Context」を発表した。AIエージェントに対して適切なコードのコンテキストを少ないトークンで提供することで、より良いコード生成を可能にするという。

元記事を読む (Publickey) ↗

arXiv cs.CL (Computation and Language) · 2026-07-30 EN マルチモーダル

VAD: Attributing Visual Evidence for Target Reconstruction in Multimodal On-Policy Distillation

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-30 EN 新モデル・リリース

$β$-OPSD: Deriving with Policy Optimization, Training with Self-Distillation

強化学習

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 開発者ツール

DualG-MRAG: Decoupling Macro-Reasoning and Micro-Matching for Multimodal Retrieval-Augmented Generation

ニューラルネットワーク検索拡張生成 (RAG)

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 新モデル・リリース

Rethinking Inference-Time Scaling in Local Computer-Use Agents: Failure Modes and Compute Tradeoffs

AI エージェント推論 (Inference) ニューラルネットワーク強化学習

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-30 EN 新モデル・リリース

Frontis-MA1: Training an AI4AI Model towards Recursive Self-Improvement in Machine Learning Engineering

ファインチューニング GPT 機械学習 Meta 検索拡張生成 (RAG)

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 新モデル・リリース

ORCA-bench: How Ready Are Language Model Agents for Oncall?

AI エージェント Claude

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-30 EN マルチモーダル

ScaFE: Data-Efficient Scar Classification with LLM-Generated Clinical Feature Programs

コンピュータビジョン

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-30 EN 新モデル・リリース

Graph Neural Network Force Fields for Spin Dynamics in Metallic Magnets

Meta ニューラルネットワーク強化学習

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 新モデル・リリース

MANTA: Multi-Agent Network Topology Adaptation for Self-Evolving Multi-Agent Systems

推論 (Inference) ニューラルネットワーク検索拡張生成 (RAG)

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗