安全性・評価 A
322 件中 61〜90 件目を表示
-
REDACT: A Systematically Controlled Multilingual Benchmark for Personal Information DetectionPII検出向けの体系的に統制された多言語ベンチマークREDACT本論文は、個人を特定できる情報(PII)の検出に向けた、体系的に統制された多言語ベンチマーク「REDACT」を提案する。対象エンティティが少なく、生成条件が場当たり的で、どの表層条件が検出失敗を招くかを示せない既存コーパスの限界に対処する。
-
The Almost Intelligent Revolution: Options for Scaling Up Deliberation and Empowering People with AIAIで民主的熟議を拡大し人々を力づける選択肢を論じる本論文は、大規模言語モデルが公共の言説で存在感を増すなか、民主的な熟議を拡大し人々を力づけるための選択肢を論じる。レッドチーミングが個別リスクを抑える一方で、言語的制約、バイアス、迎合的(sycophantic)傾向といった、より広い懸念が残ることを踏まえて検討する。
-
Large Language Models Do Not Always Need Readable LanguageLLMには常に人間可読な言語が必要ではないと示す本論文は、人間にとっての可読性を犠牲にしつつもモデルが利用可能な、コンパクトで非標準的なテキスト形式に意味情報を符号化できるかを検証する。読み手が別のモデルである場合などには、大規模言語モデルが必ずしも人間可読な言語を必要としないことを示す。
-
Prompt, Plan, Extract: Zero-Shot Agentic LLMs Workflows for Lung Pathology Extraction from Clinical Narratives病理記述から肺病理を抽出するゼロショットのエージェントLLM本論文は、臨床の病理記述から肺病理の情報を抽出する、ゼロショットのエージェント的LLMワークフロー「Prompt, Plan, Extract」を提案する。がん病期判定や腫瘍登録に必要な、手作業では労力がかかり誤りやすい抽出を、教師ありNLPパイプラインに頼らず行うことを狙う。
-
AtomMem: Building Simple and Effective Memory System for LLM Agents via Atomic Facts原子的事実でLLMエージェントの記憶システムを構築するAtomMem本論文は、原子的な事実(atomic facts)を単位として、LLMエージェント向けのシンプルで効果的な記憶システム「AtomMem」を構築する。固定された文脈窓が、複数セッションをまたいだ長期的な情報の蓄積と再利用を妨げる問題や、既存の記憶拡張手法が粗く不安定である問題に対処する。
-
Leverage Is Not Reach: A Control-Window Law for Single-Neuron Steering in Language Models言語モデルの単一ニューロン操作に関する制御窓の法則を提示本論文は、言語モデルにおける単一ニューロンによる操作(ステアリング)について、予算正規化した「制御窓(control window)」の枠組みを構築する。拒否や言語の振り分けなど、疎なフィードフォワードニューロンが制御する挙動を、出力を崩さずに一貫して制御できるのはいつかを予測しようとする。
-
JAMER: Project-Level Code Framework Dataset and Benchmark on Professional Game Enginesプロ向けゲームエンジンのプロジェクト級コードデータセットJAMER本論文は、プロ向けゲームエンジンを対象としたプロジェクト規模のコードフレームワーク・データセットおよびベンチマーク「JAMER」を提案する。アセット生成やゲームプレイ設計、Webゲームのコーディングは進展する一方、大規模データセットと決定的な評価法の不在で手つかずだったプロジェクト級のコード工学に取り組む。
-
CREDENCE: Claim Reduction for Decomposition & Enhanced Credibility -- Semantic Metrics and Convergence Analysisファクトチェック向け主張分解の意味的指標CREDENCEを提案本論文は、複合文を原子的で検証可能な主張に分解する手法「CREDENCE」を提案する。言い換えを含む主張で分解品質を過小評価するトークン重複(Jaccard)指標に代わる意味的な評価指標を導入し、形式的な収束・終了解析を加えて、信頼できる自動ファクトチェックを支える。
-
CombEval: A Framework for Evaluating Combinatorial Counting in Large Language ModelsLLMの組合せ計数能力を評価する枠組みCombEvalを提案本論文は、大規模言語モデルの組合せ計数(combinatorial counting)能力を評価する動的ベンチマーク「CombEval」を提案する。各問題を、実体・組合せ対象・依存関係・制約にわたる型付きのCofola仕様として表現し、自然言語の計数問題を統制的に生成できるようにする。
-
AgentFinVQA: A Deployable Multi-Agent Pipeline for Auditable Financial Chart QA監査可能な金融チャートQA向け多エージェントAgentFinVQA本論文は、監査可能な金融チャート質問応答に向けた、実運用可能なマルチエージェント・パイプライン「AgentFinVQA」を提案する。規制下で、どの回答を信頼できるかを把握する必要があり、顧客データを外部のモデル提供者に送れない現場を想定し、精度偏重で不透明な既存のチャートQAエージェントの課題に対処する。
-
Manifold Bandits: Bayesian Curriculum Learning over the Latent Geometry of Large Language ModelsLLMの潜在幾何上でベイズ的カリキュラム学習を行うManifold Bandits本論文は、大規模言語モデルの潜在的な幾何構造の上で訓練問題をサンプリングする、ベイズ的なカリキュラム学習手法「Manifold Bandits」を提案する。推論能力向上のための強化学習では、最適化中にどのようにプロンプトを選ぶかが訓練効率を大きく左右する点に着目する。
-
Benchmarking Agentic Review Systemsエージェント的な査読システムを評価するベンチマーク本論文は、AI支援研究が査読制度にかける負荷を和らげる手段として登場しつつある「エージェント的な査読システム」を評価する。オープンソース2種、プロプライエタリ1種、ゼロショットのベースラインを比較し、こうしたシステムをどう評価すべきかという未解決の問いに取り組む。
-
Beyond Uniform Forgetting: A Study of Sequential Direct Preference Optimization Across Preference Settings逐次的DPOにおける選好設定をまたいだ忘却を分析本論文は、複数の整合目的を順番に適用する逐次的な直接選好最適化(DPO)を、さまざまな選好設定にわたって研究する。後段の学習が先に学んだ選好をどのように干渉・忘却させるかを、一様な忘却という見方を超えて分析する。
-
NRITYAM: Language Models Meet Art and Heritage of Dance世界の舞踊文化でLMの文化理解を測るベンチマークNRITYAM本論文は、世界各地の舞踊(ダンス)の伝統を題材に、言語モデルの文化的理解力を評価する包括的ベンチマーク「NRITYAM」を提案する。言語モデルが世界規模で有効であるには、地域固有の社会文化的文脈を細やかに理解する必要があるという課題に取り組む。
-
Is it agentic enough? Benchmarking open models on your own toolingHugging Face、自前ツールで開放モデルのエージェント性能を検証Hugging Face は、オープンモデルが実際の自前ツール環境でどれだけエージェントとして機能するかを測る手法を紹介した。汎用ベンチマークではなく利用者独自のツール群でモデルを評価する考え方を示し、実運用に近い条件でエージェント能力を見極める方法を提案する。
-
Anthropic opens Seoul office and announces new partnerships across the Korean AI ecosystemAnthropic、ソウルオフィス開設と韓国AI各社との新提携を発表Anthropicがソウルにオフィスを開設し、韓国のAIエコシステムを担う企業・スタートアップ・研究者との新たなパートナーシップを発表した。同社は韓国を、技術革新と安全性を「表裏一体」と捉えるチームが集まる地域と位置づける。具体的な提携先や規模は発表ベースで、第三者検証は未確認。
-
Learning User Simulators with Turing RewardsTuring 報酬で人間ユーザーを模擬するシミュレータ学習を提案対話的な場面で人間ユーザーを模擬できれば、エージェント補助の学習や個人化システムの評価、社会科学研究などが前進する。本研究は「Turing 報酬」を用いてユーザーシミュレータを学習する手法を提案し、より現実的な利用者挙動の再現を目指す。
-
UBP2: Uncertainty-Balanced Preference Planning for Efficient Preference-based Reinforcement Learning不確実性を考慮し選好ベース強化学習を効率化する UBP2 を提案選好ベース強化学習は、行動の対比較から報酬モデルを学び、明示的な報酬設計を不要にする。しかし既存手法は受動的なデータ収集に依存しがち。本研究は不確実性を均衡させて比較対象を選ぶ「UBP2」を提案し、より少ない選好データで効率的に学習する。
-
Rethinking Reward Supervision: Rubric-Conditioned Self-Distillationルーブリック条件付き自己蒸留で推論モデルの報酬監督を見直す推論言語モデルの事後学習は、教師蒸留や検証可能報酬による強化学習で進められるが、蒸留は高価な思考過程の注釈に依存しがち。本研究は採点基準(ルーブリック)を条件とする自己蒸留を提案し、コストを抑えつつ報酬監督を再構築する手法を示す。
-
Reference-Driven Multi-Speaker Audio Scene Generation from In-the-Wild Priors実環境の事前情報から多話者の音声シーンを生成する手法既存の多話者対話システムは、発話タグや多ストリーム転写、話者埋め込みなど構造的な教師情報で話者と発話を結び付ける。本研究は実環境(in-the-wild)の事前情報を参照して多話者の音声シーンを生成する手法を提案し、より自然な対話音声の合成を目指す。
-
Data Intelligence Agents: Interpreting, Modeling, and Querying Enterprise Data via Autonomous Coding Agents自律コーディングエージェントで企業データを解釈・問い合わせ本番のデータ統合は、データ所有者・エンジニア・アナリスト間の反復的で損失の多い受け渡しが律速となる。本研究は自律的なコーディングエージェント群「Data Intelligence Agents(DIA)」を提案し、企業データの発見・構造化・問い合わせを自動化して統合作業を効率化する。
-
Explaining Attention with Program Synthesisプログラム合成で注意機構を説明し解釈可能性を追求解釈可能な深層学習の長年の目標は、不透明なニューラル計算を人間が理解できる記号的記述に置き換えることだ。本研究は Transformer の注意機構の挙動を、合成した記号プログラムで近似・説明する手法を提案し、内部動作の理解可能性を高める。
-
Confidence is Not Reliability: Rethinking MC Dropout in Brain Tumour Segmentation脳腫瘍セグメンテーションで MC Dropout の信頼性を問い直す多パラメトリック MRI でのグリオーマ(脳腫瘍)領域分割は治療計画の要だが、重要部位で静かに失敗するモデルは患者安全のリスクとなる。本研究は MC Dropout による不確実性が必ずしも信頼性を意味しないことを示し、重なり指標では見えない弱点を再検討する。
-
Does VLA Even Know the Basics? Measuring Commonsense and World Knowledge Retention in Vision-Language-Action ModelsVLA モデルは常識を保持しているか、知識保持度を測る研究身体化された Vision-Language-Action(VLA)モデルは、強力な事前学習 VLM をロボットデータで微調整して得られるが、常識や事実知識をどれだけ保持しているかは不明だった。本研究はその知識保持度を測定し、微調整による忘却の程度と課題を明らかにする。
-
NeSyCat Torch: A Differentiable Tensor Implementation of Categorical Semantics for Neurosymbolic Learning圏論的意味論で神経記号学習を統一する NeSyCat Torch神経記号(ニューロシンボリック)の意味論は、古典・ファジィ・確率・ニューラルが各々の規則で真偽を定義し分断されている。本研究は ULLER を拡張した NeSyCat により、これらを単一の帰納的な真理定義に統合し、微分可能なテンソル実装として提供する。
-
Beyond Algorithms: Conceptual Innovation in Medical Imaging AI医療画像 AI に必要なのはアルゴリズムを超えた概念的革新AI は医療画像研究を急速に進展させ、高度なアルゴリズムとベンチマーク改善を生んできた。しかしアルゴリズム中心の路線は限界も露呈している。本研究はアルゴリズムを超えた概念的革新の必要性を論じ、臨床的に意味のある進歩へ向けた方向性を提案する。
-
Trade-offs in Medical LLM Adaptation: An Empirical Study in French QA医療 LLM のドメイン適応、仏語 QA で利点と代償を実証研究LLM の専門分野・言語への適応が注目される中、ドメイン適応戦略の有効性は依然不明な点が多い。本研究はフランス語の医療 QA を題材に、各種適応手法のトレードオフを実証的に分析し、性能と汎用性の間で生じる得失を明らかにする。
-
Structured Inference with Large Language GibbsLLM の知識を Gibbs サンプリングで構造的推論に活用LLM に蓄えられた知識は、複雑な世界を表す変数に対する構造的推論の土台になり得るが、その知識を確率的に取り出すのは難しい。本研究は Gibbs サンプリングを用いて LLM 上で構造化推論を行う手法を提案し、変数間の関係を確率的に推論する枠組みを示す。
-
A Multi-Domain Benchmark for Detecting AI-Generated Text-Rich Images from GPT-Image-2GPT-Image-2 生成の文字入り画像を見抜く多分野ベンチマーク文字を多く含む画像は、個人情報や取引・意思決定に関わる情報を含むことが多い。マルチモーダル生成モデルがリアルな文字や構造を合成できるようになる中、本研究は GPT-Image-2 による生成画像を検出する多分野ベンチマークを構築し、偽造画像の識別能力を評価する。
-
DreamReasoner-8B: Block-Size Curriculum Learning for Diffusion Reasoning ModelsDreamReasoner-8B、ブロックサイズ漸進学習で拡散推論を強化ブロック拡散言語モデルは並列なブロック単位のノイズ除去で復号を高速化するが、長い思考過程(CoT)推論へ安定に拡張できるかは未解決だった。本研究は DreamReasoner-8B を開発し、ブロックサイズのカリキュラム学習で拡散型推論モデルの長鎖推論を強化する。