安全性・評価 (2 / 4 ページ)｜AI/Tech動向まとめ

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 新モデル・リリース

EgoGenesis: Egocentric World-Action Modeling with Online Anchored Projective Memory and Action-3D RoPE

埋め込み (Embeddings) 強化学習

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 安全性・評価

AI and Authenticity in Islamic Research: A Critical Evaluation of Generative AI Reliability, Hallucination, and Source Fidelity in Quranic, Hadith, and Fiqh Knowledge

深層学習生成 AI 強化学習

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 安全性・評価

Security of World-Model-Based Embodied AI: A Lifecycle of Threats, Defenses, and Evaluation

ニューラルネットワーク強化学習

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-30 EN インフラ・ハードウェア

Fidelity Is Not Safety: Gently-Compressed LLMs Pass Every Data-Free Quality Guard Yet Invent Procedure Steps in Agentic Execution

機械学習ニューラルネットワーク

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 開発者ツール

Integrating AI into Requirements Quality Learning in Software Engineering Education: A TPACK-Guided Empirical Study

ソフトウェア工学

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 推論・効率化

OPLD: On-Policy Latent Distillation for Multimodal Reasoning

強化学習

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 新モデル・リリース

Can Agents Deceive? Evaluating Reasoning and Deception in ParliamentBench using a Social Deduction Game

AI エージェント DeepSeek GPT 強化学習

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 安全性・評価

Asymmetric Communication: Large Language Models and Language Games

ニューラルネットワーク

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 政策・規制

An Instrument to Evaluate Governance Proposals: AI Policy Analysis at Scale

強化学習

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-30 EN 安全性・評価

Diversifying Personalized Research Ideation against AI-Induced Homogenization

深層学習検索拡張生成 (RAG)

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-30 EN エージェント・ツール使用

ClawTrack: Towards Trace-Level Evaluation and Improvement of Real-World Autonomous Agents

AI エージェント強化学習

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-30 EN 安全性・評価

Measuring Alignment With Reader Highlights Net of Position and Length

深層学習強化学習

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-30 EN マルチモーダル

DualAnchor: Preserving Language Priors and Improving Lexical Fidelity in Gloss-Free Sign Language Translation

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-29 EN 安全性・評価

Cost-Sensitive Conformal Prediction and Human-in-the-Loop Abstention for Imbalanced High-Stakes Decision Support: A Multi-Domain Benchmark

検索拡張生成 (RAG) 強化学習

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

NVIDIA Developer Blog · 2026-07-29 EN エージェント・ツール使用抜粋

How to Self-Host a Validated AI Coding Assistant with NVIDIA NeMo Guardrails

NVIDIA、NeMo Guardrailsで検証済みAIコーディング支援をセルフホストする手法を解説

AI エージェント生成 AI NVIDIA

NVIDIAの開発者ブログが、NeMo Guardrailsを用いて検証済み(ガードレール付き)のAIコーディングアシスタントを自前環境でセルフホストする構成手順を紹介する記事。エージェント運用・インフラ・安全性(categories: agents/infra_hw/safety)の観点で扱われる。※本文はcontent-guardによりraw_excerptが取得できず(BLOCKED表示)、具体的な構成要素・対応モデル・検証ルールの詳細はタイトルとURLからの推定にとどまり本文未確認。

元記事を読む (NVIDIA Developer Blog) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-29 EN 新モデル・リリース

SciFigQual-Bench: A Benchmark for Scientific Figure Quality Assessment with Full-Manuscript Context

GPT ニューラルネットワーク検索拡張生成 (RAG) 強化学習

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-29 EN 安全性・評価

On-Policy Distillation for LLM Safety: A Routing Approach to Template-Robust Realignment

ファインチューニングニューラルネットワーク

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-29 EN マルチモーダル

Visual Credit Audit for Multimodal Spatial Reasoning

機械学習ニューラルネットワークソフトウェア工学

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-29 EN 新モデル・リリース

SciFigAlign: Scoring Scientific Figures by Fine-tuned Alignment of Visuals with Manuscript Evidence

機械学習ニューラルネットワーク検索拡張生成 (RAG) 強化学習

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-29 EN 新モデル・リリース

OptimismBench: Forecasting Bias and the Alignment Effect in Language Model Judgment

Anthropic

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-29 EN 新モデル・リリース

TREK: A Travel Reasoning and Evaluation Kit for LLM Agents in Complex Trip Planning

AI エージェントニューラルネットワーク

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-29 EN 新モデル・リリース

Progressive Multimodal Alignment for Continual Instruction Tuning

深層学習埋め込み (Embeddings) 機械学習強化学習

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-29 EN 新モデル・リリース

Belief-Guided Decision Making with Uncertainty Gating in the Game of Go

深層学習推論 (Inference) ニューラルネットワーク強化学習 Transformer

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-29 EN 新モデル・リリース

Defending Against Backdoor Attacks via Alignment Checking in Model-Contrastive Federated Learning

強化学習

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-29 EN 新モデル・リリース

BioVLN: A Simulation Platform for Visual Language Navigation in Biomedical Laboratories

AI エージェント

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-29 EN 新モデル・リリース

Dual-Path LLM Reasoning for Multimodal Few-Shot Knowledge Graph Completion

強化学習

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-29 EN 新モデル・リリース

From Found to Designed: Concepts as a Design Axis for Large Language Models

推論 (Inference)

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-29 EN 推論・効率化

FedTopo: Relation-Level Topology Sharing for Model-Heterogeneous Federated Learning

推論 (Inference) ニューラルネットワーク

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-29 EN マルチモーダル

Dual Inversion for Text-to-Image Diffusion Models: From Both Prompt and Noise Perspectives

コンピュータビジョン

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-29 EN 安全性・評価

MPEcho: A Melody and Phoneme-Aware Generative Framework for Controllable Cover Song Generation

ニューラルネットワーク

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗