開発者ツール (5 / 15 ページ)｜AI/Tech動向まとめ

arXiv cs.CL (Computation and Language) · 2026-07-30 EN 推論・効率化

Would You Walk to the Car Wash? Revealing the Salience Bias of Large Language Models in Commonsense Reasoning

推論 (Inference) ニューラルネットワーク

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-30 EN 学習・ファインチューニング

Cybersecurity Detection Classification with Reasoning-enabled Language Models

強化学習人間のフィードバックによる強化学習 (RLHF)

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-30 EN 開発者ツール

Beyond a Single Judge: Simulating Social Persona Panels for Generative UI Evaluation

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-30 EN 新モデル・リリース

Oracle-Budgeted Molecular Optimization with Short-Term Graph Memory

深層学習検索拡張生成 (RAG)

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 開発者ツール

Metaphor Tracer: A Theory-Informed Analysis of Hidden States

Meta ニューラルネットワーク

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-30 EN 新モデル・リリース

Kohn-Sham Spectral Embedding on Sparse Graphs at the Nishimori Temperature for Image Classification

埋め込み (Embeddings) ニューラルネットワーク検索拡張生成 (RAG)

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-30 EN 新モデル・リリース

Negative controls reveal volume-driven confounding in radiomics and imaging foundation model features

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-30 EN 開発者ツール

QAdapt: A Noise-Adaptive Neural Pre-Decoding Framework for Quantum Error Correction

深層学習ファインチューニング Google

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 推論・効率化

WIDE: Boosting Adaptive LLM Inference via Token-level Dynamic Width Pruning

深層学習推論 (Inference) ニューラルネットワーク強化学習

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 安全性・評価

QQWorld: Quantile-Quantile Matching for World Model Regularization

深層学習ニューラルネットワーク検索拡張生成 (RAG) 強化学習

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

NVIDIA Developer Blog · 2026-07-30 EN インフラ・ハードウェア抜粋

NVIDIA Exemplar Cloud: Lessons for Unlocking Full Performance on AI Infrastructure

NVIDIA、AI基盤の性能を引き出すExemplar Cloudの知見を公開

NVIDIA

NVIDIAは、H100やGB200 NVL72、GB300 NVL72など同一構成のAIクラスタでも性能が大きく異なりうる点に着目し、Exemplar Cloudの取り組みからインフラの実力を最大限引き出すための知見を紹介した。

元記事を読む (NVIDIA Developer Blog) ↗

arXiv cs.LG (Machine Learning) · 2026-07-30 EN 開発者ツール

Windowed thinning and query complexity for the bouncy particle and Zigzag samplers

ニューラルネットワーク

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-30 EN 開発者ツール

Can Large Language Models Execute Parent Orders?

深層学習ニューラルネットワーク強化学習

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-30 EN 新モデル・リリース

Hierarchical Multilevel Monte Carlo for Order-Optimal Neural Actor-Critic in Average-Reward CMDPs

AI エージェント機械学習検索拡張生成 (RAG) 強化学習

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN インフラ・ハードウェア

When Specifications Conflict: A Symmetry-Based Framework for Measuring LLM Preferences

ニューラルネットワーク

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN マルチモーダル

HyperClaim: Fine-Grained Cross-Modal Hypergraph Reasoning for Video Misinformation Detection

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN インフラ・ハードウェア

How Benchmarks Mis-Score Computer-Use Agents

AI エージェントニューラルネットワーク

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 学習・ファインチューニング

ShadowDancer: Teaching Video World Models Any Action by Learning Unified Dynamics Representations from a Video and Its Shadow

ファインチューニングニューラルネットワーク強化学習

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 開発者ツール

Teffic-Audio: Tell Fact from Fiction

ニューラルネットワーク音声処理

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-30 EN 新モデル・リリース

LLMs struggle to simulate human belief updates in controlled environments

GPT

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-30 EN 開発者ツール

Reflected diffusion, no-flux continuity equations and confined Lagrangian flows in bounded domains

ニューラルネットワーク

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

Google DeepMind Blog · 2026-07-30 EN マルチモーダル抜粋

Gemini Robotics ER 2: powering robotics with video understanding, task orchestration, and multi-robot collaboration

DeepMind、映像理解と多ロボット連携のGemini Robotics ER 2を発表

Gemini 強化学習ロボティクス

DeepMindは、ロボット向けモデルGemini Robotics ER 2を発表した。映像理解、タスクの分解・調整、複数ロボットの協調を強化し、ロボットが現実世界の課題を推論しながら協力して解決できるようにする段階的な進歩と位置づける。

元記事を読む (Google DeepMind Blog) ↗

Sakana AI Blog (ja) · 2026-07-30 EN 開発者ツール抜粋

From Japan, Products the World Will Use: An Interview with Sakana AI's Head of Product Development

Sakana AI製品開発責任者、世界で使われる日本発プロダクトを語る

ニューラルネットワーク強化学習

Sakana AIの製品開発責任者へのインタビュー記事。日本発で世界に使われるプロダクトを生み出す狙いや、同社の製品開発の考え方が語られている。国内AIスタートアップの製品戦略を示す内容となっている。

元記事を読む (Sakana AI Blog (ja)) ↗

Anthropic News · 2026-07-30 EN 安全性・評価抜粋

Investigating three real-world incidents in our cybersecurity evaluations

Anthropic、サイバーセキュリティ評価で実世界3件の事例を調査

Claude 機械学習 OpenAI 検索拡張生成 (RAG) 強化学習

AnthropicのFrontier Red Teamは、自社のサイバーセキュリティ評価に関連する実世界の3件のインシデントを調査した結果を公表した。モデルの悪用リスクや評価手法の妥当性を検証し、フロンティアモデルの安全性向上に役立てる。

元記事を読む (Anthropic News) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 開発者ツール

Paying for Honesty Without Knowing the Truth: Reputation-Penalty Design for LLM Marketplace Agents

AI エージェント

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-30 EN 新モデル・リリース

Measuring Distortion in the Empty Regions of Dimensionality Reduction Scatterplots with the Gap Index

強化学習

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN マルチモーダル

PathView-Bench: Can Multimodal Large Language Models Achieve Fine-grained Multiscale Understanding of Pathology Images?

機械学習ニューラルネットワークソフトウェア工学

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 開発者ツール

One Human, $N$ Agents: Audit-Budget Allocation for LLM Agent Fleets under Miscalibrated, Correlated Confidence

AI エージェント深層学習

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-30 EN 開発者ツール

Beyond Geometric Complementarity: Coherent Overlap in Sparse Mixture-of-Experts Routing

DeepSeek Mistral Mixture of Experts (MoE) 強化学習

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 開発者ツール

From Textual Requirements to Microservice Architectures - A Comprehensive Evaluation of LLM-Based Design Synthesis

OpenAI 強化学習

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗