ServiceNow は、リサーチエージェントが与えられた機密情報を保持できるかを評価するベンチマーク「MosaicLeaks」を発表した。複数の断片情報を組み合わせて秘密を推測・漏洩してしまう挙動を検証し、エージェントの情報管理能力の弱点を明らかにする狙い。
個別ニュースの濁流から、AI / TECH 界隈の本流を読み解く。
📊 直近 7 日
1150
件
▲ +62%
🔥 急上昇 1
今週の動向
2026年6月第2週は新モデルと開発ツールがともに前週比+200%超と急増。Claude Fable 5がMythos級で一般提供、DiffusionGemmaが生成4倍速、Cohere・NVIDIAがエージェント型コーディングを競った。米政府指示でFable 5が一時停止・早期復旧し、最上位モデルの実用化と統制が同時に進んだ。
最新の 5 トピック
1
安全性・評価
#強化学習
強化学習エージェント開発が NVIDIA 軸で深化
NVIDIA JetPack 7.2 を皮切りにエッジ向け強化学習エージェントの軽量化と Memory Efficiency 改善が集中。Agentic-Ready AI の実装フェーズに移行し、学術論文も実装と並走している。学術 49 件中心に Reward Modeling や継続学習最適化の提案がディベロッパー向けに整備、週間 57 件で TOP1 ホット。エッジ推論と長期 RL の融合が今週の主軸テーマで、Code 言語モデルとの統合も視野に入る。
SAMPLEAnthropic opens Seoul office and announces new partnerships across the Korean AI ecosystem
▲ 261件 +63%
発生元
公式 8
学術 242
専門 4
コミュニティ 7
2
安全性・評価
#ニューラルネットワーク
Nemotron 系で推論ニューラルネットワーク基盤が再加速
NVIDIA Nemotron 3 Ultra が long-running agent 向け推論基盤として登場、ニューラルネットワーク領域は『より速く、より効率的』方向に再集約。codex / agent workflow との統合が進む。
SAMPLEAnthropic opens Seoul office and announces new partnerships across the Korean AI ecosystem
▲ 240件 +67%
公式 8
学術 215
専門 2
コミュニティ 15
3
安全性・評価
#検索拡張生成 (RAG)
Agentic RAG のインフラ層が DOCA で強化
Agentic AI 時代の RAG infrastructure として NVIDIA DOCA In-Silicon Security が発表。新モデル発表が続く中、ハードウェア層からの RAG 強化が技術トピックの中心軸に。
SAMPLEResults from the first Anthropic Public Record
▲ 143件 +38%
公式 2
学術 139
コミュニティ 2
4
安全性・評価
#AI エージェント
自律 AI エージェントの長期推論実装が進展
公式・学術が拮抗、Nemotron 3 Ultra による long-running agent 実装が代表例。AI エージェントは『実運用フェーズ』に深化し、推論コストと信頼性の両立が論点に。
SAMPLEFrom the Hugging Face Hub to robot hardware with Strands Agents and LeRobot
▲ 115件 +58%
公式 6
学術 98
専門 9
コミュニティ 2
5
開発者ツール
#深層学習
深層学習
SAMPLEPLaMo-3.0-Prime-β を LLM 開発の現場で使う
▲ 96件 +50%
公式 5
学術 88
コミュニティ 3
A. 技術トピック
B. 環境・運用
C. 業界・社会
開発者ツール
SpaceX、Cursor 買収し Origin 発表
327 件
↑ +47%
安全性・評価
Fable 5 の安全性に米当局が懸念
326 件
↑ +61%
新モデル・リリース
GLM-5.2、オープン最強モデルに
274 件
↑ +45%
推論・効率化
DiffusionGemma、拡散型で生成 4 倍速
128 件
↑ +35%
インフラ・ハードウェア
NVIDIA Blackwell、MLPerf 6.0 首位
113 件
↑ +41%
学習・ファインチューニング
学習タイミング調整で電力 14% 削減
105 件
↑ +36%
マルチモーダル
Runway 日本進出 + Video2GUI、応用拡大
105 件
↑ +54%
業界導入・応用
日立、OpenAI Codex で基幹刷新へ
85 件
↑ +49%
資金・M&A
SpaceX、Cursor を 9.6兆円で買収
75 件
— ベース確立中
エージェント・ツール使用
NVIDIA、エージェント基準で首位獲得
33 件
— ベース確立中
政策・規制
31 件
— ベース確立中
AI / TECH 界隈の動き(話題量=記事数 × 言及度の重み付き指標)
- ▲ 2026-06-16 — machine_intelligence (z=3.30)
- ▲ 2026-06-16 — openai (z=2.77)
- ▲ 2026-06-17 — openai (z=2.68)
- ▲ 2026-06-18 — openai (z=2.60)
- ▲ 2026-06-18 — gpt (z=2.40)
📰 注目の個別記事
-
1MosaicLeaks: Can your research agent keep a secret?ServiceNow、研究エージェントの機密保持を測る MosaicLeaks を公開
-
2New usage analytics and updated spend controls for enterprisesOpenAI、ChatGPT Enterprise に利用分析と支出管理機能を追加OpenAI は ChatGPT Enterprise 向けに、新たな利用状況分析と支出管理機能を導入した。組織が AI 利用のコストを可視化・抑制しつつ、安心して導入規模を拡大できるよう支援する。管理者はチームごとの消費を把握し、上限設定などで運用を最適化できる。
-
3Improving health intelligence in ChatGPTOpenAI、GPT-5.5 Instant で ChatGPT の健康相談の品質を向上OpenAI は GPT-5.5 Instant により、ChatGPT の健康・ウェルネス分野の応答品質を改善したと発表した。より強力な推論と文脈理解、明確な説明に加え、医師の知見を反映した評価を導入。利用者がより信頼できる健康情報を得られるようにする。
-
4Using AI to help physicians diagnose rare genetic diseases affecting childrenOpenAI 推論モデル、未解明の小児希少疾患で 18 件の新診断に貢献研究者らは OpenAI の推論モデルを用い、これまで原因を特定できなかった小児の希少遺伝性疾患の診断を支援した。未解決症例の中から 18 件の新たな診断を特定し、AI が複雑な臨床推論を補助して希少疾患の診断精度向上に役立つ可能性を示した。
-
5Is it agentic enough? Benchmarking open models on your own toolingHugging Face、自前ツールで開放モデルのエージェント性能を検証Hugging Face は、オープンモデルが実際の自前ツール環境でどれだけエージェントとして機能するかを測る手法を紹介した。汎用ベンチマークではなく利用者独自のツール群でモデルを評価する考え方を示し、実運用に近い条件でエージェント能力を見極める方法を提案する。
-
6Beyond LoRA: Can you beat the most popular fine-tuning technique?Hugging Face、LoRA を超える微調整手法の可能性を検証Hugging Face は、最も普及した微調整手法である LoRA を上回る方法があるかを検討した記事を公開した。代替の効率的ファインチューニング手法を比較し、性能やコストの面で LoRA に挑戦できるかを実験的に探る内容で、実務者の手法選択の指針を示す。
-
7Anthropic opens Seoul office and announces new partnerships across the Korean AI ecosystemAnthropic、ソウルオフィス開設と韓国AI各社との新提携を発表Anthropicがソウルにオフィスを開設し、韓国のAIエコシステムを担う企業・スタートアップ・研究者との新たなパートナーシップを発表した。同社は韓国を、技術革新と安全性を「表裏一体」と捉えるチームが集まる地域と位置づける。具体的な提携先や規模は発表ベースで、第三者検証は未確認。
-
8MolmoMotion: Language-guided 3D motion forecastingMolmoMotion、言語ガイドによる3Dモーション予測手法を公開Allen Institute for AI(AI2)がHugging Faceブログで、自然言語の指示に基づいて3次元の動きを予測する手法「MolmoMotion」を紹介した。言語ガイドによる3Dモーション予測のアプローチを示す内容。本要約はraw_excerpt未取得のためタイトルベースの中立要約で、手法の詳細・性能数値は記事ベース・第三者検証は未確認。