安全性・評価 (9 / 11 ページ)｜AI/Tech動向まとめ

arXiv cs.CL (Computation and Language) · 2026-06-15 EN 新モデル・リリース抜粋

Compositional Reasoning Depth Predicts Clinical AI Failure: Empirical Evidence Consistent with Transformer Compositionality Limits in Electronic Health Record Question Answering

推論ホップ数が臨床 AI の誤りを予測、Transformer の合成性限界を示唆

Claude GPT OpenAI ソフトウェア工学 Transformer

電子カルテ(EHR)質問応答で、必要な推論ステップ(ホップ)が多い質問ほど LLM の誤りが不釣り合いに増える構造を、事前定義したホップ数分類で示す arxiv 論文。集約精度では隠れる失敗構造を、Transformer の合成性(compositionality)限界に関する理論と整合的に論じる(abstract ベースの中立要約)。

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.LG (Machine Learning) · 2026-06-15 EN 安全性・評価抜粋

Upper Bounds on the Generalization Error of Deep Learning Models via Local Robustness and Stability

局所頑健性と安定性で深層学習の汎化誤差上界を精緻化する手法を提案

深層学習ニューラルネットワーク強化学習

頑健性に基づく汎化上界が実用設定で緩く無意味になりがちな問題を、不確実性項だけでなく頑健性項自体に起因すると分析。入力空間の部分領域ごとの安定・不安定サンプル数に応じて頑健性項をスケールする汎化上界を提案し、より締まった評価を与えると報告する。

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.LG (Machine Learning) · 2026-06-15 EN 安全性・評価抜粋

Integrated Marketing Attribution: A Bayesian Framework for Privacy-Safe Granular Measurement Anchored in MMM

IMA: MMMとベイズ帰属を統合したプライバシー安全な広告効果測定枠組み

ニューラルネットワーク検索拡張生成 (RAG)

ユーザー単位の追跡に頼らず細粒度の広告効果を測る需要に対し、チャネル計画向きだが粗いMMMと、粒度は高いがプライバシー制約に弱いMTAの長所を統合するIntegrated Marketing Attribution(IMA)を提案。MMM由来の事前分布でキャンペーン単位の効果を集約データから導く。

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-06-15 EN 安全性・評価抜粋

Federated Medical Image Segmentation under Real-World Label Noise: A Benchmark Suite for Noisy Label Learning Method Selection

実環境ラベルノイズ下の連合医療画像セグメンテーション用ベンチマークを提案

Meta 強化学習

連合学習は機密データを集約せず医療画像のセグメンテーションを可能にするが、実運用ではサイト間の輪郭不一致や欠損・過剰な構造、ラベル混同といった不完全さが課題となる。既存の連合ノイズラベル学習(FNLL)研究は人工ノイズや簡略設定に偏ると指摘し、本研究は多様な実世界ノイズデータセット、配備想定のクライアントノイズ条件、ノイズ標的型の評価を組み合わせたベンチマーク群を導入し、手法選択を支援すると述べる。

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.LG (Machine Learning) · 2026-06-15 EN 安全性・評価抜粋

HawkesNest: A Multi-Axis Synthetic Benchmark for Spatiotemporal Pattern Complexity

HawkesNest: 時空間点過程モデル評価の合成ベンチマークを提案

強化学習ソフトウェア工学

時空間点過程(STPP)モデルの評価が不透明な実データに依存し失敗の原因特定が難しい問題に対し、多変量Hawkes基盤で複雑性を制御する合成ベンチマークHawkesNestを提案。時空間の絡みや背景の不均一性など4軸を潜在機構から決定論的に指標化し、診断的なストレステストを可能にすると報告する。

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.CL (Computation and Language) · 2026-06-15 EN 推論・効率化抜粋

Follow the Latent Roadmap: Navigating Revocable Decoding for Diffusion LLMs with Anchor Tokens

拡散 LLM のリボーカブル復号をアンカートークンで誘導し誤り伝播を抑制

深層学習埋め込み (Embeddings) 推論 (Inference) 検索拡張生成 (RAG) 音声処理

並列生成が可能な拡散大規模言語モデル(dLLM)で、復号速度と品質のトレードオフや誤り伝播・remask の課題に対し、アンカートークンで潜在的な「ロードマップ」をたどるリボーカブル復号手法を提案する arxiv 論文。混在品質コンテキストでの 2 つの失敗様式を緩和すると論じる(abstract ベースの中立要約)。

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.CL (Computation and Language) · 2026-06-15 EN 学習・ファインチューニング抜粋

Robust Dual-Signal Fusion: Hybrid Neuro-Symbolic Gating with Compressed Chain-of-Thought Refinement for Irony Detection in Social Media Texts

圧縮 CoT の神経記号ハイブリッドでゼロショット皮肉検出を強化

ファインチューニング Transformer

LLM が字義通りの意味解釈に偏りゼロショットの皮肉検出が難しい課題に対し、教師ありファインチューニング(SFT)なしで Chain-of-Thought 推論を圧縮する神経記号ハイブリッド枠組み「RDS Fusion」を提案する arxiv 論文。TweetEval の held-out テスト集合(N=734)で評価したと報告(abstract ベースの中立要約、数値は論文側の主張)。

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.CL (Computation and Language) · 2026-06-15 EN マルチモーダル抜粋

Data-Driven Decoding of Russell's Circumplex Model of Affect

Transformer 埋め込みが感情の Russell 円環モデル幾何を再現するか検証

深層学習埋め込み (Embeddings) 音声処理 Transformer

テキストと音声で学習した Transformer の潜在空間が、感情を表す Russell の円環(circumplex)モデルの幾何的規則性を回復するかを、2 つの相補的実験を統合して検証する arxiv 論文。感情表現の深層学習が不透明な高次元ブラックボックスになりがちな点に対し、埋め込み構造の解釈可能性を論じる(abstract ベースの中立要約)。

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-06-15 EN 業界導入・応用抜粋

Beyond Models: Reflections on Engineering AI-enabled Systems in a Project-Based Course

AI搭載システムの工学教育を扱うプロジェクト型講義の実践を報告

アルゴリズム・理論機械学習ニューラルネットワーク強化学習ソフトウェア工学

AI搭載システムの工学教育が、現実的な制約下でAI部品を本格的なソフトウェアアーキテクチャへ統合する課題を扱う必要がある点に着目する論文。機械学習の講義がモデル開発に偏り学生が設計・配備・監視の経験を欠きがちな現状を踏まえ、ブレーメン大学の修士向けプロジェクト型講義の設計と実施を振り返り報告するとしている。

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-06-15 EN 安全性・評価抜粋

Robust Spoofed Speech Detection via Temporal Pyramid Modeling

なりすまし音声検出へ多スケールのTemporal Pyramid Adapterを提案

ニューラルネットワーク音声処理

合成音声や声質変換、リプレイ攻撃の高度化でなりすまし音声検出が難しく、データセット間の汎化が大きな制約となる点に着目する論文。受容野の異なる並列の時間的畳み込みで局所的痕跡から大域的な韻律の乱れまで多スケールに捉えるTemporal Pyramid Adapterを提案し、自己教師ありXLS-R表現と組み合わせるとしている。

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-06-15 EN 資金・M&A 抜粋

ATOM-Bench: A Real-World Benchmark for Atomic Skills and Compositional Generalization in Manipulation Policies

ロボット操作方策の原子的技能と合成的汎化を測るATOM-Benchを提案

ファインチューニング強化学習

汎用的な操作方策がロボット制御の基盤モデルとして注目される一方、実世界での汎化の診断が難しい課題に着目する論文。提示済みタスクで成功しても細かな原子的技能の実行や新たな構成での再結合に失敗しうる点を踏まえ、原子的技能と合成的汎化の双方を評価する実世界ベンチATOM-Benchを提案するとしている。

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.CL (Computation and Language) · 2026-06-15 EN 安全性・評価抜粋

How Much Can We Trust LLM Search Agents? Measuring Endorsement Vulnerability to Web Content Manipulation

LLM 検索エージェントの推薦汚染耐性を測る枠組みを提案

AI エージェント Claude Gemini GPT 音声処理

攻撃者が公開したページが LLM 検索エージェントによって推薦として承認されるリスクを測る評価枠組み SearchGEO を提案する arxiv 論文。複数の LLM バックエンドを攻撃類型で評価する。abstract ベースの中立要約で、固有名・数値の断定は回避。

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

Simon Willison's Weblog · 2026-06-15 EN 安全性・評価抜粋

"They screwed us": Personality clashes sent Anthropic's models offline

Simon Willison、Anthropicと米政府の舞台裏報道を紹介

Anthropic Claude 深層学習強化学習

開発者Simon Willisonがブログで、Anthropicのモデルを巡る舞台裏を報じたAxiosの記事を紹介。米政府関係者やAnthropic近傍の匿名筋の証言を集めた内容で、Commerce Departmentとの面会や、モデルのjailbreak耐性・姿勢を巡る議論に触れると伝える。伝聞に基づく報道の紹介であり、内容の確度には留保を付けている。

元記事を読む (Simon Willison's Weblog) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-06-15 EN 安全性・評価抜粋

Adaptive and Explicit safe: Triggering Latent Safety Awareness in Large Reasoning Models

推論モデルの潜在的な安全認識を引き出し脱獄耐性を高める手法を提案

DeepSeek ファインチューニング Llama 検索拡張生成 (RAG) 人間のフィードバックによる強化学習 (RLHF)

大規模推論モデルが高度な脱獄や有害クエリに脆弱な課題に対し、外部の手動アノテーションへの依存を避け、モデル自身が元のクエリと自らの推論過程を再提示されると安全リスクを認識できる「潜在的安全認識」を活用する論文。教師ありファインチューニングで安全タグを誘発し安全分析を起動するとしている。

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.CL (Computation and Language) · 2026-06-15 EN 開発者ツール抜粋

LLM-based Visual Code Completion for Aerospace Geometric Design

航空宇宙設計向け LLM コード補助 copilot を提案する論文

GPT 推論 (Inference) ニューラルネットワーク

安全性と説明可能性を重視する航空宇宙業界向けに、ReAct 手法のビジュアルプログラミング変種と GPT 系モデルを用いた幾何設計支援 copilot を提案する arxiv 論文。abstract ベースの中立要約で、性能の優劣や固有名の評価は差し控える。

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-06-15 EN 安全性・評価抜粋

LabOSBench: Benchmarking Computer Use Agents for Scientific Instrument Control

科学機器を操作するエージェント評価へ、模擬ベンチLabOSBenchを提案

AI エージェントコンピュータビジョン

既存のcomputer-useベンチが仮想環境のソフト操作に偏る一方、科学機器の操作は複雑な界面の協調制御やフィードバックに基づくパラメータ調整を要する点に着目する論文。実機評価のコストや安全性、再現性の制約を避けつつ現実的な操作課題を保つ模擬テスト環境LabOSBenchを提案するとしている。

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-06-15 EN 安全性・評価抜粋

Decoupling Semantics from Distortions: Multi-Scale Two-Stream Vision-Language Alignment for AI-Generated Image Quality Assessment

AI生成画像の品質評価へ、意味と歪みを分離する二系統手法MST-CLIPIQAを提案

コンピュータビジョン機械学習検索拡張生成 (RAG)

視覚言語モデルを用いたAI生成画像の品質評価で、意味理解と低次の知覚的感度が単一表現に絡み合い微細な劣化を見落とす課題を指摘し、両者を明示的に分離する多スケール二系統枠組みMST-CLIPIQAを提案する論文。二つのCLIPエンコーダによる階層的な視覚言語アライメントを行うとしている。

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.LG (Machine Learning) · 2026-06-15 EN 学習・ファインチューニング抜粋

Decision-Weighted Flow Matching for Contextual Stochastic Optimization

DW-FM: 下流の意思決定の後悔に整合する重み付きフローマッチングを提案

コンピュータビジョンニューラルネットワーク人間のフィードバックによる強化学習 (RLHF)

生成モデルをシナリオ生成器に使う確率的最適化で、一様な分布適合より下流の意思決定が重要との観点から、決定に敏感な終点情報で速度回帰目的を再重み付けするDecision-Weighted Flow Matching(DW-FM)を提案。後悔との理論的接続と保証を示すと報告する。

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.LG (Machine Learning) · 2026-06-15 EN マルチモーダル抜粋

Gen-VCoT: Generative Visual Chain-of-Thought Reasoning via Diffusion-Based RGB Intermediate Representations

Gen-VCoT: 視覚的思考連鎖をRGB中間表現で生成する多モーダル推論枠組み

機械学習

テキスト依存のCoTに代え、SAMセグメンテーション・Marigold深度・Qwen2-VLを段階的に用いてRGB画像を推論の中間表現として生成するGen-VCoTを提案。空間25%・深度50%の質問で改善する一方、単純な事実問では精度が下がり、CLEVRではテキストCoTが優位と報告する。

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-06-15 EN 学習・ファインチューニング抜粋

Skill-to-LoRA: From Using Skills to Learning Behaviors for Token-Efficient LLM Agents

SKILL.md文書をLoRAに置換しトークン効率を高める手法S2Lを提案

AI エージェント深層学習ソフトウェア工学

エージェントのスキルがSKILL.md形式で配布され実行時に繰り返し文脈へ注入される非効率を踏まえ、実行時のスキル文書をスキル固有のLoRAアダプタへ置き換える行動中心の表現S2L（Skill-to-LoRA）を提案する論文。文書自体を圧縮するのではなく、スキル文が誘発する振る舞いの変化をモデル化するとしている。

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.CL (Computation and Language) · 2026-06-15 EN 安全性・評価抜粋

P3B3: A Multi-Turn Conversational Benchmark for Measuring European and Brazilian Portuguese Variety Bias in LLMs

ポルトガル語の地域変種バイアスを測る基準P3B3を提案

欧州・ブラジルのポルトガル語変種に対するLLMの偏りを測る、専門家編纂の基準 P3B3 と評価枠組みを提案する論文とされる。多くのモデルがブラジル変種へ強く偏ると報告し、より均衡した多言語表現の必要性を指摘。中立要約。

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-06-15 EN 安全性・評価抜粋

Automated jailbreak attack targeting multiple defense strategies

LLMへの黒箱攻撃を体系化する敵対的テスト枠組みUNIATTACKを提案

検索拡張生成 (RAG) 音声処理

大規模言語モデルが敵対的プロンプト攻撃に脆弱な点を踏まえ、防御側の視点から効果的な黒箱攻撃プロンプトを体系的に構築する敵対的テスト枠組みUNIATTACKを提案する論文。静的テンプレートやモデル個別調整に依存する従来手法と異なり、多様な既存攻撃から最小限かつ高影響な特徴を抽出し最適化するとしている。

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.CL (Computation and Language) · 2026-06-15 EN 新モデル・リリース抜粋

MyPCBench: A Benchmark for Personally Intelligent Computer-Use Agents

個人秘書としてのPC操作エージェントを測る基準MyPCBenchを提案

AI エージェント Claude ニューラルネットワーク強化学習

個人のPC環境やログイン済みアカウントを横断する「個人秘書」としてのPC操作エージェントを評価する基準 MyPCBench を提案する論文とされる。17の模擬Webアプリを含むLinux環境で184タスクを定義し、複数のクローズド/オープンモデルを評価したと報告。数値は原論文に基づく。

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.CL (Computation and Language) · 2026-06-15 EN 新モデル・リリース抜粋

Misinformation Propagation in Benign Multi-Agent Systems

多エージェント系で誤情報が伝播し性能を低下させる現象を分析

AI エージェント強化学習ソフトウェア工学

複数のLLMエージェントが対話で問題解決する系に意図的な誤情報を注入し、その伝播を調べた研究とされる。誤情報は単体性能を下げ討論を通じて残存するが、多くのエージェントが未汚染なら多エージェント討論が劣化を緩和すると報告。頑健性は構成や決定手順に依存するとする。

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.CL (Computation and Language) · 2026-06-15 EN 推論・効率化抜粋

Progressive Knowledge-Guided Large Language Model Framework for Bearing Fault Diagnosis

物理ガイド型の多スケール振動解析で軸受故障診断を行う枠組みを提案

推論 (Inference) 強化学習

振動ベースの軸受故障診断における特徴効率と局所信号忠実度のトレードオフ等の課題に対し、物理理論に基づく多スケール信号処理の統合パイプラインを提案する論文とされる。軸受運動理論由来の記述子で実時間スクリーニングを行い、故障適応的な信号分割を用いると報告。数値は原論文の記載に基づく中立要約。

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.CL (Computation and Language) · 2026-06-15 EN 資金・M&A 抜粋

Multimodal Evaluator Preference Collapse: Cross-Modal Contagion in Self-Evolving Agents

自己進化エージェントの評価選好崩壊と跨モーダル伝播を扱う論文

AI エージェント DeepSeek GPT

自己進化型エージェントにおける「評価者の選好崩壊」と、それがモーダル間で伝播する現象を扱う研究とされる。本記事は raw_excerpt が content filter で取得不可のため、タイトルのみから中立的に要約しており、手法や結果の詳細は原論文の確認が必要。

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.CL (Computation and Language) · 2026-06-15 EN 資金・M&A 抜粋

SCAR: Semantic Continuity-Aware Retrieval for Efficient Context Expansion in RAG

RAGの文脈拡張を効率化する検索手法SCARを提案(本文取得不可)

埋め込み (Embeddings) 検索拡張生成 (RAG)

本記事は本文(abstract)が取得できず、表題のみから中立に要約する。検索拡張生成(RAG)における文脈拡張を効率化するため、意味的な連続性を考慮した検索手法「SCAR」を提案する論文とされる。具体的な仕組みや評価結果はタイトルからは確認できない。

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.CL (Computation and Language) · 2026-06-15 EN 安全性・評価抜粋

FraudSMSWalker: Benchmarking Agentic Large Language Models for SMS-to-Webpage Fraud Detection

SMS経由の詐欺判定を測るベンチマークFraudSMSWalkerを提案

AI エージェント Meta ニューラルネットワーク強化学習

メッセージからWebページへ誘導するクロスチャネルなSMS詐欺の判定を対象に、URLを隠した条件で評価するベンチマークFraudSMSWalkerを提案する論文。10種のシナリオにわたる699件の二言語チェーン(詐欺332・正常367)を含み、ドメインや評判の手がかりに頼れない設定でエージェント型LLMを評価するとする。

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.CL (Computation and Language) · 2026-06-15 EN 安全性・評価抜粋

Islamic Large Language Models: From Knowledge Acquisition to Trustworthy and Hallucination-Resistant AI

イスラム知識を扱う信頼性の高いLLMの研究動向を概観する論文

自然言語処理 (NLP) 検索拡張生成 (RAG) 強化学習ソフトウェア工学

宗教・法に関する知識集約的な質問応答でLLM利用が広がる中、イスラム知識を扱う「Islamic LLM」と信頼できるイスラムAIの新興分野を概観するサーベイ論文。アラビア語の流暢さだけでは不十分とし、厳選された出典、検索・検証モジュール、引用に基づく生成、幻覚評価などが必要だと論じる。

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.CL (Computation and Language) · 2026-06-15 EN 安全性・評価抜粋

VeriGraph: Towards Verifiable Data-Analytic Agents

データ分析エージェントの推論を検証可能にする VeriGraph を提案

AI エージェントニューラルネットワークソフトウェア工学

LLM ベースのエージェントはデータ集約的な分析に強い一方、線形なテキストの推論過程は監査が難しく出力を検証しにくい。生データ上の決定的計算と自然言語の主張に対する意味的推論が非構造的に絡み合い、数値結論の再現も質的判断の精査も困難になる。本論文は、実行中に異種の証拠を明示的な有向非巡回グラフ (DAG) として構築する追跡可能なニューロシンボリック推論枠組み VeriGraph を提案する。

元記事を読む (arXiv cs.CL (Computation and Language)) ↗