エージェント・ツール使用｜AI/Tech動向まとめ

ITmedia AI+ · 2026-08-02 JA エージェント・ツール使用抜粋

「AI、結局使えないじゃん」問題　セールスフォースが431万件対応で導いた正解

セールスフォース、自社実践431万件対応でAI活用のROIを実証

AI エージェント

セールスフォースは自社実践（カスタマーゼロ）で431万件の顧客対応を完了し、商談数を4～5割増やした。田中遼太COOは、データやKPIが整う領域を選ぶこと、シンプルで高頻度な業務から任せることなどを鉄則に挙げ、AI投資を明快な成果につなげる運用方法論を語った。

元記事を読む (ITmedia AI+) ↗

ITmedia AI+ · 2026-08-02 JA エージェント・ツール使用抜粋

賞金1000万のAIコンテスト、でも「実現性は問わず」　サイバーエージェントのAI推進策

サイバーエージェント、賞金1000万・実現性不問のAIコンテストで意識改革

AI エージェント

サイバーエージェントは賞金1000万円のAIコンテストを開催し、あえて実現性を問わない仕掛けで社員の生成AI活用意識を変えた。導入しても使われなければ成果に結びつかないという課題に対し、参加のハードルを下げて全社的な利用を促す狙いがある。

元記事を読む (ITmedia AI+) ↗

Sakana AI Blog (ja) · 2026-08-02 JA 新モデル・リリース抜粋

Sakana AI、日本語特化のLLM API「Sakana Namazu」を提供開始

Sakana AI、日本語特化LLM「Namazu」をOpenAI互換APIで提供開始

AI エージェント推論 (Inference) 機械学習 Meta OpenAI

Sakana AIが、日本語と日本の商習慣に特化したLLM API「Sakana Namazu」の提供を開始した。Sakana Chat搭載モデルを更新したもので、Moonshot AIのオープンモデル「Kimi K2.6」をベースに社内データで日本語・業務文脈への適合を進めた。Web検索とコード実行のビルトインツールを備え、OpenAI互換のためbase_urlの変更だけで既存コードから利用できる。高コストなフロンティアモデルと素のオープンモデルの中間を埋める選択肢として位置づける。

元記事を読む (Sakana AI Blog (ja)) ↗

Simon Willison's Weblog · 2026-08-02 EN 新モデル・リリース抜粋

July 2026 newsletter

Simon Willison、月刊ニュースレター最新号を公開

Anthropic Claude DeepSeek GPT Model Context Protocol (MCP)

開発者Simon Willison氏が、スポンサー向けの月刊ニュースレター最新号を公開した。GPTやClaude、DeepSeek、Anthropic、MCPなど、最近のAIモデルやツールを巡る動向をまとめている。個人によるAI業界ウォッチとして注目される内容だ。

元記事を読む (Simon Willison's Weblog) ↗

ITmedia AI+ · 2026-08-02 JA 新モデル・リリース抜粋

Google、パーソナルAI「Gemini Spark」を日本でも利用可能に　Chrome統合は米国から

Google、パーソナルAI「Gemini Spark」を日本含む160カ国以上に拡大

AI エージェント Gemini Google

Googleは、パーソナルAIエージェント「Gemini Spark」の提供を日本を含む160カ国以上に拡大した。PC停止時やスマホのロック時もGoogleのクラウド基盤上で動作し、トリガーに応じてタスクを自動処理する。Chrome統合は米国から先行提供される。

元記事を読む (ITmedia AI+) ↗

Simon Willison's Weblog · 2026-07-31 EN 新モデル・リリース抜粋

Stateless MCP has recaptured my interest (and inspired mcp-explorer and datasette-mcp)

Simon Willison、ステートレスMCP（MCP 2.0）への関心を再燃と語る

Anthropic Claude Model Context Protocol (MCP) OpenAI 強化学習

Simon Willison氏は、2026年7月28日に公開されたModel Context Protocolの新仕様、いわゆるステートレスMCP（MCP 2.0）のロールアウトに関心を再び高めたと述べた。これに触発され、mcp-explorerやdatasette-mcpといったツールの開発にも取り組んでいるという。

元記事を読む (Simon Willison's Weblog) ↗

Simon Willison's Weblog · 2026-07-31 EN 新モデル・リリース抜粋

llm-mcp-client 0.1a0

Simon Willison、llm-mcp-client 0.1a0をリリース

Model Context Protocol (MCP)

Simon Willison氏は、LLMツールからModel Context Protocol（MCP）サーバーを利用するための「llm-mcp-client」バージョン0.1a0をリリースした。ブログで詳細を紹介しており、MCPエコシステムに対応するツールの整備が進んでいる。

元記事を読む (Simon Willison's Weblog) ↗

Simon Willison's Weblog · 2026-07-31 EN 新モデル・リリース抜粋

datasette-agent 0.4a0

Datasette Agent 0.4a0公開、ツールがブラウザ内でコード実行可能に

Simon Willison氏がDatasette Agent 0.4a0を公開した。新しいawait context.browser_task()機構により、エージェントのツールがユーザーのブラウザ内で直接JavaScriptを実行できるようになる。プラグインがクライアント側で動く独自ツールを提供しやすくなる新機能。

元記事を読む (Simon Willison's Weblog) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-31 EN インフラ・ハードウェア

Beyond Component Testing: Validating Agentic AI Systems

ニューラルネットワーク検索拡張生成 (RAG)

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-31 EN エージェント・ツール使用

Tool Specifications Matter: Uncovering and Mitigating Safety Risks in AI Agents

AI エージェント深層学習推論 (Inference) 検索拡張生成 (RAG) 強化学習

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-31 EN エージェント・ツール使用

Data Turnstile: A Scalable Open Framework for Function-Calling Data Generation

ニューラルネットワーク

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-31 EN 安全性・評価

Don't Mix Rewards, Mix Policies: Policy Decomposition and Optimization for Multi-Reward RL

推論 (Inference) 強化学習ソフトウェア工学

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

ITmedia AI+ · 2026-07-31 JA 開発者ツール抜粋

PerplexityがAIエージェントの“暴走”対策ツールをオープンソースに　Claude CodeやCodexを監視

Perplexity、AIエージェント暴走対策ツール「Numbat」をOSS公開

AI エージェント Claude

Perplexityは、AIエージェントの危険な挙動を検知・防止するツール群「Numbat」をオープンソース化した。Claude CodeやCodexに組み込むことで、タスクに執着したエージェントの「暴走」を実行前に阻止できるという。エージェント安全対策の一環となる。

元記事を読む (ITmedia AI+) ↗

ITmedia AI+ · 2026-07-31 JA 推論・効率化抜粋

Chromeに13年以上潜んでいた脆弱性、AIで発見　直近2回のアプデで過去23回分を上回るバグ修正

Google、Chromeの13年潜伏の脆弱性をAIで発見、週2回更新も試行

AI エージェント Gemini Google

Googleは公式ブログで、ChromeのセキュリティへのAI活用を解説した。Geminiベースのエージェントが13年以上潜んでいた脆弱性を発見し、直近2回の更新で過去23回分を上回るバグを修正したという。AIによる攻撃の高速化に対応し、セキュリティ更新の「週2回」配信も試行する。

元記事を読む (ITmedia AI+) ↗

NVIDIA Developer Blog · 2026-07-30 EN エージェント・ツール使用抜粋

Four Ways to Deploy More Secure AI Agents

NVIDIA、より安全なAIエージェント導入の4つの方法を提示

AI エージェント生成 AI NVIDIA

NVIDIAは、AIエージェントをより安全に本番導入するための4つのアプローチを解説した。権限管理やガードレール、監視など、エージェント運用時のセキュリティリスクを抑える実践的な指針を示している。

元記事を読む (NVIDIA Developer Blog) ↗

arXiv cs.CL (Computation and Language) · 2026-07-30 EN エージェント・ツール使用

Benchmarks Are Not Validation: A System-Level View of Financial LLM Applications

生成 AI 強化学習

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN エージェント・ツール使用

AskChem: Claim-Centered Infrastructure for Chemistry Literature Synthesis

AI エージェント GPT Model Context Protocol (MCP) ソフトウェア工学

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

Publickey · 2026-07-30 JA 新モデル・リリース抜粋

JetBrains、AIが少ないトークンでコンテキストを取得しやすく、よりよいコード生成を可能にする「JetBrains Context」発表

JetBrains、AIエージェント向け「JetBrains Context」発表、少トークンで文脈提供

AI エージェント機械学習

JetBrainsは、コードリポジトリの上に知的レイヤを構築する新サービス「JetBrains Context」を発表した。AIエージェントに対して適切なコードのコンテキストを少ないトークンで提供することで、より良いコード生成を可能にするという。

元記事を読む (Publickey) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 新モデル・リリース

MANTA: Multi-Agent Network Topology Adaptation for Self-Evolving Multi-Agent Systems

推論 (Inference) ニューラルネットワーク検索拡張生成 (RAG)

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

Microsoft Research Blog · 2026-07-30 EN エージェント・ツール使用抜粋

Echoverse: Deep, evolving environments for computer-use agents

Microsoft Research、PC操作エージェント訓練環境Echoverseを公開

AI エージェント Microsoft

Microsoft Researchは、メールや顧客対応のような多段階ワークフローを苦手とするコンピュータ操作エージェント向けに、深く進化する訓練環境Echoverseを発表した。現実的な環境でエージェントを鍛え、複雑な業務の遂行能力を高める。

元記事を読む (Microsoft Research Blog) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 新モデル・リリース

EMBL AI Librarian: Life-Sciences Knowledge Layer for AI Agents

AI エージェント GPT ソフトウェア工学

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-30 EN エージェント・ツール使用

ClawTrack: Towards Trace-Level Evaluation and Improvement of Real-World Autonomous Agents

AI エージェント強化学習

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-30 EN 学習・ファインチューニング

FinanceHarness: Autonomous Financial Deep Research Framework

AI エージェント

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-29 EN エージェント・ツール使用

Can AI agents conduct open-ended AI research? Early evidence from two case studies

AI エージェント強化学習ソフトウェア工学

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-29 EN 新モデル・リリース

Partner Capability Estimation for Task-Agnostic Adaptation in Ad-Hoc Teamwork

AI エージェント深層学習ニューラルネットワーク

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

NVIDIA Developer Blog · 2026-07-29 EN エージェント・ツール使用抜粋

How to Self-Host a Validated AI Coding Assistant with NVIDIA NeMo Guardrails

NVIDIA、NeMo Guardrailsで検証済みAIコーディング支援をセルフホストする手法を解説

AI エージェント生成 AI NVIDIA

NVIDIAの開発者ブログが、NeMo Guardrailsを用いて検証済み(ガードレール付き)のAIコーディングアシスタントを自前環境でセルフホストする構成手順を紹介する記事。エージェント運用・インフラ・安全性(categories: agents/infra_hw/safety)の観点で扱われる。※本文はcontent-guardによりraw_excerptが取得できず(BLOCKED表示)、具体的な構成要素・対応モデル・検証ルールの詳細はタイトルとURLからの推定にとどまり本文未確認。

元記事を読む (NVIDIA Developer Blog) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-29 EN エージェント・ツール使用

Scores Are Not Decisions: Cost-Aware Stopping for Tool Acquisition in LLM Agents

AI エージェントニューラルネットワーク

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

Sakana AI Blog (ja) · 2026-07-29 JA 新モデル・リリース抜粋

Sakana AI防衛・インテリジェンスチーム、「DIVER OSINT CTF 2026」で5位入賞　Fuguを活用したOSINTエージェントの可能性

Sakana AI防衛チーム、DIVER OSINT CTF 2026で5位入賞

AI エージェント

Sakana AIの防衛・インテリジェンスチームは、OSINT（公開情報調査）の競技会「DIVER OSINT CTF 2026」で5位に入賞した。自社ツールFuguを活用したOSINTエージェントの可能性を示し、情報分析分野でのAIエージェント応用の手応えを報告した。

元記事を読む (Sakana AI Blog (ja)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-29 EN エージェント・ツール使用