安全性・評価 A
317 件中 241〜270 件目を表示
-
Compositional Reasoning Depth Predicts Clinical AI Failure: Empirical Evidence Consistent with Transformer Compositionality Limits in Electronic Health Record Question Answering推論ホップ数が臨床 AI の誤りを予測、Transformer の合成性限界を示唆電子カルテ(EHR)質問応答で、必要な推論ステップ(ホップ)が多い質問ほど LLM の誤りが不釣り合いに増える構造を、事前定義したホップ数分類で示す arxiv 論文。集約精度では隠れる失敗構造を、Transformer の合成性(compositionality)限界に関する理論と整合的に論じる(abstract ベースの中立要約)。
-
Upper Bounds on the Generalization Error of Deep Learning Models via Local Robustness and Stability局所頑健性と安定性で深層学習の汎化誤差上界を精緻化する手法を提案頑健性に基づく汎化上界が実用設定で緩く無意味になりがちな問題を、不確実性項だけでなく頑健性項自体に起因すると分析。入力空間の部分領域ごとの安定・不安定サンプル数に応じて頑健性項をスケールする汎化上界を提案し、より締まった評価を与えると報告する。
-
Integrated Marketing Attribution: A Bayesian Framework for Privacy-Safe Granular Measurement Anchored in MMMIMA: MMMとベイズ帰属を統合したプライバシー安全な広告効果測定枠組みユーザー単位の追跡に頼らず細粒度の広告効果を測る需要に対し、チャネル計画向きだが粗いMMMと、粒度は高いがプライバシー制約に弱いMTAの長所を統合するIntegrated Marketing Attribution(IMA)を提案。MMM由来の事前分布でキャンペーン単位の効果を集約データから導く。
-
Federated Medical Image Segmentation under Real-World Label Noise: A Benchmark Suite for Noisy Label Learning Method Selection実環境ラベルノイズ下の連合医療画像セグメンテーション用ベンチマークを提案連合学習は機密データを集約せず医療画像のセグメンテーションを可能にするが、実運用ではサイト間の輪郭不一致や欠損・過剰な構造、ラベル混同といった不完全さが課題となる。既存の連合ノイズラベル学習(FNLL)研究は人工ノイズや簡略設定に偏ると指摘し、本研究は多様な実世界ノイズデータセット、配備想定のクライアントノイズ条件、ノイズ標的型の評価を組み合わせたベンチマーク群を導入し、手法選択を支援すると述べる。
-
HawkesNest: A Multi-Axis Synthetic Benchmark for Spatiotemporal Pattern ComplexityHawkesNest: 時空間点過程モデル評価の合成ベンチマークを提案時空間点過程(STPP)モデルの評価が不透明な実データに依存し失敗の原因特定が難しい問題に対し、多変量Hawkes基盤で複雑性を制御する合成ベンチマークHawkesNestを提案。時空間の絡みや背景の不均一性など4軸を潜在機構から決定論的に指標化し、診断的なストレステストを可能にすると報告する。
-
Follow the Latent Roadmap: Navigating Revocable Decoding for Diffusion LLMs with Anchor Tokens拡散 LLM のリボーカブル復号をアンカートークンで誘導し誤り伝播を抑制並列生成が可能な拡散大規模言語モデル(dLLM)で、復号速度と品質のトレードオフや誤り伝播・remask の課題に対し、アンカートークンで潜在的な「ロードマップ」をたどるリボーカブル復号手法を提案する arxiv 論文。混在品質コンテキストでの 2 つの失敗様式を緩和すると論じる(abstract ベースの中立要約)。
-
Robust Dual-Signal Fusion: Hybrid Neuro-Symbolic Gating with Compressed Chain-of-Thought Refinement for Irony Detection in Social Media Texts圧縮 CoT の神経記号ハイブリッドでゼロショット皮肉検出を強化LLM が字義通りの意味解釈に偏りゼロショットの皮肉検出が難しい課題に対し、教師ありファインチューニング(SFT)なしで Chain-of-Thought 推論を圧縮する神経記号ハイブリッド枠組み「RDS Fusion」を提案する arxiv 論文。TweetEval の held-out テスト集合(N=734)で評価したと報告(abstract ベースの中立要約、数値は論文側の主張)。
-
Data-Driven Decoding of Russell's Circumplex Model of AffectTransformer 埋め込みが感情の Russell 円環モデル幾何を再現するか検証テキストと音声で学習した Transformer の潜在空間が、感情を表す Russell の円環(circumplex)モデルの幾何的規則性を回復するかを、2 つの相補的実験を統合して検証する arxiv 論文。感情表現の深層学習が不透明な高次元ブラックボックスになりがちな点に対し、埋め込み構造の解釈可能性を論じる(abstract ベースの中立要約)。
-
Beyond Models: Reflections on Engineering AI-enabled Systems in a Project-Based CourseAI搭載システムの工学教育を扱うプロジェクト型講義の実践を報告AI搭載システムの工学教育が、現実的な制約下でAI部品を本格的なソフトウェアアーキテクチャへ統合する課題を扱う必要がある点に着目する論文。機械学習の講義がモデル開発に偏り学生が設計・配備・監視の経験を欠きがちな現状を踏まえ、ブレーメン大学の修士向けプロジェクト型講義の設計と実施を振り返り報告するとしている。
-
Robust Spoofed Speech Detection via Temporal Pyramid Modelingなりすまし音声検出へ多スケールのTemporal Pyramid Adapterを提案合成音声や声質変換、リプレイ攻撃の高度化でなりすまし音声検出が難しく、データセット間の汎化が大きな制約となる点に着目する論文。受容野の異なる並列の時間的畳み込みで局所的痕跡から大域的な韻律の乱れまで多スケールに捉えるTemporal Pyramid Adapterを提案し、自己教師ありXLS-R表現と組み合わせるとしている。
-
ATOM-Bench: A Real-World Benchmark for Atomic Skills and Compositional Generalization in Manipulation Policiesロボット操作方策の原子的技能と合成的汎化を測るATOM-Benchを提案汎用的な操作方策がロボット制御の基盤モデルとして注目される一方、実世界での汎化の診断が難しい課題に着目する論文。提示済みタスクで成功しても細かな原子的技能の実行や新たな構成での再結合に失敗しうる点を踏まえ、原子的技能と合成的汎化の双方を評価する実世界ベンチATOM-Benchを提案するとしている。
-
How Much Can We Trust LLM Search Agents? Measuring Endorsement Vulnerability to Web Content ManipulationLLM 検索エージェントの推薦汚染耐性を測る枠組みを提案攻撃者が公開したページが LLM 検索エージェントによって推薦として承認されるリスクを測る評価枠組み SearchGEO を提案する arxiv 論文。複数の LLM バックエンドを攻撃類型で評価する。abstract ベースの中立要約で、固有名・数値の断定は回避。
-
"They screwed us": Personality clashes sent Anthropic's models offlineSimon Willison、Anthropicと米政府の舞台裏報道を紹介開発者Simon Willisonがブログで、Anthropicのモデルを巡る舞台裏を報じたAxiosの記事を紹介。米政府関係者やAnthropic近傍の匿名筋の証言を集めた内容で、Commerce Departmentとの面会や、モデルのjailbreak耐性・姿勢を巡る議論に触れると伝える。伝聞に基づく報道の紹介であり、内容の確度には留保を付けている。
-
Adaptive and Explicit safe: Triggering Latent Safety Awareness in Large Reasoning Models推論モデルの潜在的な安全認識を引き出し脱獄耐性を高める手法を提案大規模推論モデルが高度な脱獄や有害クエリに脆弱な課題に対し、外部の手動アノテーションへの依存を避け、モデル自身が元のクエリと自らの推論過程を再提示されると安全リスクを認識できる「潜在的安全認識」を活用する論文。教師ありファインチューニングで安全タグを誘発し安全分析を起動するとしている。
-
LLM-based Visual Code Completion for Aerospace Geometric Design航空宇宙設計向け LLM コード補助 copilot を提案する論文安全性と説明可能性を重視する航空宇宙業界向けに、ReAct 手法のビジュアルプログラミング変種と GPT 系モデルを用いた幾何設計支援 copilot を提案する arxiv 論文。abstract ベースの中立要約で、性能の優劣や固有名の評価は差し控える。
-
LabOSBench: Benchmarking Computer Use Agents for Scientific Instrument Control科学機器を操作するエージェント評価へ、模擬ベンチLabOSBenchを提案既存のcomputer-useベンチが仮想環境のソフト操作に偏る一方、科学機器の操作は複雑な界面の協調制御やフィードバックに基づくパラメータ調整を要する点に着目する論文。実機評価のコストや安全性、再現性の制約を避けつつ現実的な操作課題を保つ模擬テスト環境LabOSBenchを提案するとしている。
-
Decoupling Semantics from Distortions: Multi-Scale Two-Stream Vision-Language Alignment for AI-Generated Image Quality AssessmentAI生成画像の品質評価へ、意味と歪みを分離する二系統手法MST-CLIPIQAを提案視覚言語モデルを用いたAI生成画像の品質評価で、意味理解と低次の知覚的感度が単一表現に絡み合い微細な劣化を見落とす課題を指摘し、両者を明示的に分離する多スケール二系統枠組みMST-CLIPIQAを提案する論文。二つのCLIPエンコーダによる階層的な視覚言語アライメントを行うとしている。
-
Decision-Weighted Flow Matching for Contextual Stochastic OptimizationDW-FM: 下流の意思決定の後悔に整合する重み付きフローマッチングを提案生成モデルをシナリオ生成器に使う確率的最適化で、一様な分布適合より下流の意思決定が重要との観点から、決定に敏感な終点情報で速度回帰目的を再重み付けするDecision-Weighted Flow Matching(DW-FM)を提案。後悔との理論的接続と保証を示すと報告する。
-
Gen-VCoT: Generative Visual Chain-of-Thought Reasoning via Diffusion-Based RGB Intermediate RepresentationsGen-VCoT: 視覚的思考連鎖をRGB中間表現で生成する多モーダル推論枠組みテキスト依存のCoTに代え、SAMセグメンテーション・Marigold深度・Qwen2-VLを段階的に用いてRGB画像を推論の中間表現として生成するGen-VCoTを提案。空間25%・深度50%の質問で改善する一方、単純な事実問では精度が下がり、CLEVRではテキストCoTが優位と報告する。
-
Skill-to-LoRA: From Using Skills to Learning Behaviors for Token-Efficient LLM AgentsSKILL.md文書をLoRAに置換しトークン効率を高める手法S2Lを提案エージェントのスキルがSKILL.md形式で配布され実行時に繰り返し文脈へ注入される非効率を踏まえ、実行時のスキル文書をスキル固有のLoRAアダプタへ置き換える行動中心の表現S2L(Skill-to-LoRA)を提案する論文。文書自体を圧縮するのではなく、スキル文が誘発する振る舞いの変化をモデル化するとしている。
-
P3B3: A Multi-Turn Conversational Benchmark for Measuring European and Brazilian Portuguese Variety Bias in LLMsポルトガル語の地域変種バイアスを測る基準P3B3を提案欧州・ブラジルのポルトガル語変種に対するLLMの偏りを測る、専門家編纂の基準 P3B3 と評価枠組みを提案する論文とされる。多くのモデルがブラジル変種へ強く偏ると報告し、より均衡した多言語表現の必要性を指摘。中立要約。
-
Automated jailbreak attack targeting multiple defense strategiesLLMへの黒箱攻撃を体系化する敵対的テスト枠組みUNIATTACKを提案大規模言語モデルが敵対的プロンプト攻撃に脆弱な点を踏まえ、防御側の視点から効果的な黒箱攻撃プロンプトを体系的に構築する敵対的テスト枠組みUNIATTACKを提案する論文。静的テンプレートやモデル個別調整に依存する従来手法と異なり、多様な既存攻撃から最小限かつ高影響な特徴を抽出し最適化するとしている。
-
MyPCBench: A Benchmark for Personally Intelligent Computer-Use Agents個人秘書としてのPC操作エージェントを測る基準MyPCBenchを提案個人のPC環境やログイン済みアカウントを横断する「個人秘書」としてのPC操作エージェントを評価する基準 MyPCBench を提案する論文とされる。17の模擬Webアプリを含むLinux環境で184タスクを定義し、複数のクローズド/オープンモデルを評価したと報告。数値は原論文に基づく。
-
Misinformation Propagation in Benign Multi-Agent Systems多エージェント系で誤情報が伝播し性能を低下させる現象を分析複数のLLMエージェントが対話で問題解決する系に意図的な誤情報を注入し、その伝播を調べた研究とされる。誤情報は単体性能を下げ討論を通じて残存するが、多くのエージェントが未汚染なら多エージェント討論が劣化を緩和すると報告。頑健性は構成や決定手順に依存するとする。
-
Progressive Knowledge-Guided Large Language Model Framework for Bearing Fault Diagnosis物理ガイド型の多スケール振動解析で軸受故障診断を行う枠組みを提案振動ベースの軸受故障診断における特徴効率と局所信号忠実度のトレードオフ等の課題に対し、物理理論に基づく多スケール信号処理の統合パイプラインを提案する論文とされる。軸受運動理論由来の記述子で実時間スクリーニングを行い、故障適応的な信号分割を用いると報告。数値は原論文の記載に基づく中立要約。
-
Multimodal Evaluator Preference Collapse: Cross-Modal Contagion in Self-Evolving Agents自己進化エージェントの評価選好崩壊と跨モーダル伝播を扱う論文自己進化型エージェントにおける「評価者の選好崩壊」と、それがモーダル間で伝播する現象を扱う研究とされる。本記事は raw_excerpt が content filter で取得不可のため、タイトルのみから中立的に要約しており、手法や結果の詳細は原論文の確認が必要。
-
SCAR: Semantic Continuity-Aware Retrieval for Efficient Context Expansion in RAGRAGの文脈拡張を効率化する検索手法SCARを提案(本文取得不可)本記事は本文(abstract)が取得できず、表題のみから中立に要約する。検索拡張生成(RAG)における文脈拡張を効率化するため、意味的な連続性を考慮した検索手法「SCAR」を提案する論文とされる。具体的な仕組みや評価結果はタイトルからは確認できない。
-
FraudSMSWalker: Benchmarking Agentic Large Language Models for SMS-to-Webpage Fraud DetectionSMS経由の詐欺判定を測るベンチマークFraudSMSWalkerを提案メッセージからWebページへ誘導するクロスチャネルなSMS詐欺の判定を対象に、URLを隠した条件で評価するベンチマークFraudSMSWalkerを提案する論文。10種のシナリオにわたる699件の二言語チェーン(詐欺332・正常367)を含み、ドメインや評判の手がかりに頼れない設定でエージェント型LLMを評価するとする。
-
Islamic Large Language Models: From Knowledge Acquisition to Trustworthy and Hallucination-Resistant AIイスラム知識を扱う信頼性の高いLLMの研究動向を概観する論文宗教・法に関する知識集約的な質問応答でLLM利用が広がる中、イスラム知識を扱う「Islamic LLM」と信頼できるイスラムAIの新興分野を概観するサーベイ論文。アラビア語の流暢さだけでは不十分とし、厳選された出典、検索・検証モジュール、引用に基づく生成、幻覚評価などが必要だと論じる。
-
VeriGraph: Towards Verifiable Data-Analytic Agentsデータ分析エージェントの推論を検証可能にする VeriGraph を提案LLM ベースのエージェントはデータ集約的な分析に強い一方、線形なテキストの推論過程は監査が難しく出力を検証しにくい。生データ上の決定的計算と自然言語の主張に対する意味的推論が非構造的に絡み合い、数値結論の再現も質的判断の精査も困難になる。本論文は、実行中に異種の証拠を明示的な有向非巡回グラフ (DAG) として構築する追跡可能なニューロシンボリック推論枠組み VeriGraph を提案する。