安全性・評価 A

322 件中 61〜90 件目を表示
  • arXiv cs.CL (Computation and Language) · EN 安全性・評価 抜粋
    REDACT: A Systematically Controlled Multilingual Benchmark for Personal Information Detection
    PII検出向けの体系的に統制された多言語ベンチマークREDACT
    Claude GPT Meta ニューラルネットワーク OpenAI
    本論文は、個人を特定できる情報(PII)の検出に向けた、体系的に統制された多言語ベンチマーク「REDACT」を提案する。対象エンティティが少なく、生成条件が場当たり的で、どの表層条件が検出失敗を招くかを示せない既存コーパスの限界に対処する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 安全性・評価 抜粋
    The Almost Intelligent Revolution: Options for Scaling Up Deliberation and Empowering People with AI
    AIで民主的熟議を拡大し人々を力づける選択肢を論じる
    埋め込み (Embeddings) 強化学習
    本論文は、大規模言語モデルが公共の言説で存在感を増すなか、民主的な熟議を拡大し人々を力づけるための選択肢を論じる。レッドチーミングが個別リスクを抑える一方で、言語的制約、バイアス、迎合的(sycophantic)傾向といった、より広い懸念が残ることを踏まえて検討する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 安全性・評価 抜粋
    Large Language Models Do Not Always Need Readable Language
    LLMには常に人間可読な言語が必要ではないと示す
    ニューラルネットワーク
    本論文は、人間にとっての可読性を犠牲にしつつもモデルが利用可能な、コンパクトで非標準的なテキスト形式に意味情報を符号化できるかを検証する。読み手が別のモデルである場合などには、大規模言語モデルが必ずしも人間可読な言語を必要としないことを示す。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 安全性・評価 抜粋
    Prompt, Plan, Extract: Zero-Shot Agentic LLMs Workflows for Lung Pathology Extraction from Clinical Narratives
    病理記述から肺病理を抽出するゼロショットのエージェントLLM
    GPT ニューラルネットワーク 自然言語処理 (NLP)
    本論文は、臨床の病理記述から肺病理の情報を抽出する、ゼロショットのエージェント的LLMワークフロー「Prompt, Plan, Extract」を提案する。がん病期判定や腫瘍登録に必要な、手作業では労力がかかり誤りやすい抽出を、教師ありNLPパイプラインに頼らず行うことを狙う。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 新モデル・リリース 抜粋
    AtomMem: Building Simple and Effective Memory System for LLM Agents via Atomic Facts
    原子的事実でLLMエージェントの記憶システムを構築するAtomMem
    AI エージェント ニューラルネットワーク 検索拡張生成 (RAG)
    本論文は、原子的な事実(atomic facts)を単位として、LLMエージェント向けのシンプルで効果的な記憶システム「AtomMem」を構築する。固定された文脈窓が、複数セッションをまたいだ長期的な情報の蓄積と再利用を妨げる問題や、既存の記憶拡張手法が粗く不安定である問題に対処する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 安全性・評価 抜粋
    Leverage Is Not Reach: A Control-Window Law for Single-Neuron Steering in Language Models
    言語モデルの単一ニューロン操作に関する制御窓の法則を提示
    検索拡張生成 (RAG)
    本論文は、言語モデルにおける単一ニューロンによる操作(ステアリング)について、予算正規化した「制御窓(control window)」の枠組みを構築する。拒否や言語の振り分けなど、疎なフィードフォワードニューロンが制御する挙動を、出力を崩さずに一貫して制御できるのはいつかを予測しようとする。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 安全性・評価 抜粋
    JAMER: Project-Level Code Framework Dataset and Benchmark on Professional Game Engines
    プロ向けゲームエンジンのプロジェクト級コードデータセットJAMER
    AI エージェント 深層学習
    本論文は、プロ向けゲームエンジンを対象としたプロジェクト規模のコードフレームワーク・データセットおよびベンチマーク「JAMER」を提案する。アセット生成やゲームプレイ設計、Webゲームのコーディングは進展する一方、大規模データセットと決定的な評価法の不在で手つかずだったプロジェクト級のコード工学に取り組む。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 安全性・評価 抜粋
    CREDENCE: Claim Reduction for Decomposition & Enhanced Credibility -- Semantic Metrics and Convergence Analysis
    ファクトチェック向け主張分解の意味的指標CREDENCEを提案
    ニューラルネットワーク 強化学習
    本論文は、複合文を原子的で検証可能な主張に分解する手法「CREDENCE」を提案する。言い換えを含む主張で分解品質を過小評価するトークン重複(Jaccard)指標に代わる意味的な評価指標を導入し、形式的な収束・終了解析を加えて、信頼できる自動ファクトチェックを支える。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 安全性・評価 抜粋
    CombEval: A Framework for Evaluating Combinatorial Counting in Large Language Models
    LLMの組合せ計数能力を評価する枠組みCombEvalを提案
    強化学習 ソフトウェア工学
    本論文は、大規模言語モデルの組合せ計数(combinatorial counting)能力を評価する動的ベンチマーク「CombEval」を提案する。各問題を、実体・組合せ対象・依存関係・制約にわたる型付きのCofola仕様として表現し、自然言語の計数問題を統制的に生成できるようにする。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 開発者ツール 抜粋
    AgentFinVQA: A Deployable Multi-Agent Pipeline for Auditable Financial Chart QA
    監査可能な金融チャートQA向け多エージェントAgentFinVQA
    AI エージェント Gemini ニューラルネットワーク 強化学習 ソフトウェア工学
    本論文は、監査可能な金融チャート質問応答に向けた、実運用可能なマルチエージェント・パイプライン「AgentFinVQA」を提案する。規制下で、どの回答を信頼できるかを把握する必要があり、顧客データを外部のモデル提供者に送れない現場を想定し、精度偏重で不透明な既存のチャートQAエージェントの課題に対処する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 新モデル・リリース 抜粋
    Manifold Bandits: Bayesian Curriculum Learning over the Latent Geometry of Large Language Models
    LLMの潜在幾何上でベイズ的カリキュラム学習を行うManifold Bandits
    検索拡張生成 (RAG) 強化学習
    本論文は、大規模言語モデルの潜在的な幾何構造の上で訓練問題をサンプリングする、ベイズ的なカリキュラム学習手法「Manifold Bandits」を提案する。推論能力向上のための強化学習では、最適化中にどのようにプロンプトを選ぶかが訓練効率を大きく左右する点に着目する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 新モデル・リリース 抜粋
    Benchmarking Agentic Review Systems
    エージェント的な査読システムを評価するベンチマーク
    GPT ニューラルネットワーク OpenAI
    本論文は、AI支援研究が査読制度にかける負荷を和らげる手段として登場しつつある「エージェント的な査読システム」を評価する。オープンソース2種、プロプライエタリ1種、ゼロショットのベースラインを比較し、こうしたシステムをどう評価すべきかという未解決の問いに取り組む。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 学習・ファインチューニング 抜粋
    Beyond Uniform Forgetting: A Study of Sequential Direct Preference Optimization Across Preference Settings
    逐次的DPOにおける選好設定をまたいだ忘却を分析
    Llama 機械学習 強化学習 人間のフィードバックによる強化学習 (RLHF)
    本論文は、複数の整合目的を順番に適用する逐次的な直接選好最適化(DPO)を、さまざまな選好設定にわたって研究する。後段の学習が先に学んだ選好をどのように干渉・忘却させるかを、一様な忘却という見方を超えて分析する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN マルチモーダル 抜粋
    NRITYAM: Language Models Meet Art and Heritage of Dance
    世界の舞踊文化でLMの文化理解を測るベンチマークNRITYAM
    ニューラルネットワーク 強化学習 ソフトウェア工学
    本論文は、世界各地の舞踊(ダンス)の伝統を題材に、言語モデルの文化的理解力を評価する包括的ベンチマーク「NRITYAM」を提案する。言語モデルが世界規模で有効であるには、地域固有の社会文化的文脈を細やかに理解する必要があるという課題に取り組む。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • Hugging Face Blog · EN 安全性・評価 抜粋
    Is it agentic enough? Benchmarking open models on your own tooling
    Hugging Face、自前ツールで開放モデルのエージェント性能を検証
    Hugging Face は、オープンモデルが実際の自前ツール環境でどれだけエージェントとして機能するかを測る手法を紹介した。汎用ベンチマークではなく利用者独自のツール群でモデルを評価する考え方を示し、実運用に近い条件でエージェント能力を見極める方法を提案する。
    元記事を読む (Hugging Face Blog) ↗
  • Anthropic News · EN 業界導入・応用 抜粋
    Anthropic opens Seoul office and announces new partnerships across the Korean AI ecosystem
    Anthropic、ソウルオフィス開設と韓国AI各社との新提携を発表
    Anthropic Claude ニューラルネットワーク 強化学習
    Anthropicがソウルにオフィスを開設し、韓国のAIエコシステムを担う企業・スタートアップ・研究者との新たなパートナーシップを発表した。同社は韓国を、技術革新と安全性を「表裏一体」と捉えるチームが集まる地域と位置づける。具体的な提携先や規模は発表ベースで、第三者検証は未確認。
    元記事を読む (Anthropic News) ↗
  • arXiv cs.CL (Computation and Language) · EN 安全性・評価 抜粋
    Learning User Simulators with Turing Rewards
    Turing 報酬で人間ユーザーを模擬するシミュレータ学習を提案
    強化学習
    対話的な場面で人間ユーザーを模擬できれば、エージェント補助の学習や個人化システムの評価、社会科学研究などが前進する。本研究は「Turing 報酬」を用いてユーザーシミュレータを学習する手法を提案し、より現実的な利用者挙動の再現を目指す。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 学習・ファインチューニング 抜粋
    UBP2: Uncertainty-Balanced Preference Planning for Efficient Preference-based Reinforcement Learning
    不確実性を考慮し選好ベース強化学習を効率化する UBP2 を提案
    Meta ニューラルネットワーク 強化学習
    選好ベース強化学習は、行動の対比較から報酬モデルを学び、明示的な報酬設計を不要にする。しかし既存手法は受動的なデータ収集に依存しがち。本研究は不確実性を均衡させて比較対象を選ぶ「UBP2」を提案し、より少ない選好データで効率的に学習する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 推論・効率化 抜粋
    Rethinking Reward Supervision: Rubric-Conditioned Self-Distillation
    ルーブリック条件付き自己蒸留で推論モデルの報酬監督を見直す
    ニューラルネットワーク 強化学習
    推論言語モデルの事後学習は、教師蒸留や検証可能報酬による強化学習で進められるが、蒸留は高価な思考過程の注釈に依存しがち。本研究は採点基準(ルーブリック)を条件とする自己蒸留を提案し、コストを抑えつつ報酬監督を再構築する手法を示す。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 安全性・評価 抜粋
    Reference-Driven Multi-Speaker Audio Scene Generation from In-the-Wild Priors
    実環境の事前情報から多話者の音声シーンを生成する手法
    埋め込み (Embeddings) 検索拡張生成 (RAG) 強化学習 音声処理
    既存の多話者対話システムは、発話タグや多ストリーム転写、話者埋め込みなど構造的な教師情報で話者と発話を結び付ける。本研究は実環境(in-the-wild)の事前情報を参照して多話者の音声シーンを生成する手法を提案し、より自然な対話音声の合成を目指す。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 業界導入・応用 抜粋
    Data Intelligence Agents: Interpreting, Modeling, and Querying Enterprise Data via Autonomous Coding Agents
    自律コーディングエージェントで企業データを解釈・問い合わせ
    AI エージェント ニューラルネットワーク
    本番のデータ統合は、データ所有者・エンジニア・アナリスト間の反復的で損失の多い受け渡しが律速となる。本研究は自律的なコーディングエージェント群「Data Intelligence Agents(DIA)」を提案し、企業データの発見・構造化・問い合わせを自動化して統合作業を効率化する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 安全性・評価 抜粋
    Explaining Attention with Program Synthesis
    プログラム合成で注意機構を説明し解釈可能性を追求
    GPT Llama 検索拡張生成 (RAG) ソフトウェア工学 Transformer
    解釈可能な深層学習の長年の目標は、不透明なニューラル計算を人間が理解できる記号的記述に置き換えることだ。本研究は Transformer の注意機構の挙動を、合成した記号プログラムで近似・説明する手法を提案し、内部動作の理解可能性を高める。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.LG (Machine Learning) · EN 安全性・評価 抜粋
    Confidence is Not Reliability: Rethinking MC Dropout in Brain Tumour Segmentation
    脳腫瘍セグメンテーションで MC Dropout の信頼性を問い直す
    ニューラルネットワーク 強化学習
    多パラメトリック MRI でのグリオーマ(脳腫瘍)領域分割は治療計画の要だが、重要部位で静かに失敗するモデルは患者安全のリスクとなる。本研究は MC Dropout による不確実性が必ずしも信頼性を意味しないことを示し、重なり指標では見えない弱点を再検討する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN マルチモーダル 抜粋
    Does VLA Even Know the Basics? Measuring Commonsense and World Knowledge Retention in Vision-Language-Action Models
    VLA モデルは常識を保持しているか、知識保持度を測る研究
    AI エージェント コンピュータビジョン ファインチューニング ロボティクス ソフトウェア工学
    身体化された Vision-Language-Action(VLA)モデルは、強力な事前学習 VLM をロボットデータで微調整して得られるが、常識や事実知識をどれだけ保持しているかは不明だった。本研究はその知識保持度を測定し、微調整による忘却の程度と課題を明らかにする。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 安全性・評価 抜粋
    NeSyCat Torch: A Differentiable Tensor Implementation of Categorical Semantics for Neurosymbolic Learning
    圏論的意味論で神経記号学習を統一する NeSyCat Torch
    ニューラルネットワーク 検索拡張生成 (RAG) 強化学習
    神経記号(ニューロシンボリック)の意味論は、古典・ファジィ・確率・ニューラルが各々の規則で真偽を定義し分断されている。本研究は ULLER を拡張した NeSyCat により、これらを単一の帰納的な真理定義に統合し、微分可能なテンソル実装として提供する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.LG (Machine Learning) · EN 安全性・評価 抜粋
    Beyond Algorithms: Conceptual Innovation in Medical Imaging AI
    医療画像 AI に必要なのはアルゴリズムを超えた概念的革新
    アルゴリズム・理論 深層学習 ニューラルネットワーク 検索拡張生成 (RAG) 強化学習
    AI は医療画像研究を急速に進展させ、高度なアルゴリズムとベンチマーク改善を生んできた。しかしアルゴリズム中心の路線は限界も露呈している。本研究はアルゴリズムを超えた概念的革新の必要性を論じ、臨床的に意味のある進歩へ向けた方向性を提案する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 学習・ファインチューニング 抜粋
    Trade-offs in Medical LLM Adaptation: An Empirical Study in French QA
    医療 LLM のドメイン適応、仏語 QA で利点と代償を実証研究
    ファインチューニング 強化学習 ソフトウェア工学
    LLM の専門分野・言語への適応が注目される中、ドメイン適応戦略の有効性は依然不明な点が多い。本研究はフランス語の医療 QA を題材に、各種適応手法のトレードオフを実証的に分析し、性能と汎用性の間で生じる得失を明らかにする。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.CL (Computation and Language) · EN 推論・効率化 抜粋
    Structured Inference with Large Language Gibbs
    LLM の知識を Gibbs サンプリングで構造的推論に活用
    推論 (Inference) ニューラルネットワーク 強化学習
    LLM に蓄えられた知識は、複雑な世界を表す変数に対する構造的推論の土台になり得るが、その知識を確率的に取り出すのは難しい。本研究は Gibbs サンプリングを用いて LLM 上で構造化推論を行う手法を提案し、変数間の関係を確率的に推論する枠組みを示す。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN マルチモーダル 抜粋
    A Multi-Domain Benchmark for Detecting AI-Generated Text-Rich Images from GPT-Image-2
    GPT-Image-2 生成の文字入り画像を見抜く多分野ベンチマーク
    コンピュータビジョン GPT OpenAI 検索拡張生成 (RAG)
    文字を多く含む画像は、個人情報や取引・意思決定に関わる情報を含むことが多い。マルチモーダル生成モデルがリアルな文字や構造を合成できるようになる中、本研究は GPT-Image-2 による生成画像を検出する多分野ベンチマークを構築し、偽造画像の識別能力を評価する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.CL (Computation and Language) · EN 推論・効率化 抜粋
    DreamReasoner-8B: Block-Size Curriculum Learning for Diffusion Reasoning Models
    DreamReasoner-8B、ブロックサイズ漸進学習で拡散推論を強化
    推論 (Inference) 機械学習
    ブロック拡散言語モデルは並列なブロック単位のノイズ除去で復号を高速化するが、長い思考過程(CoT)推論へ安定に拡張できるかは未解決だった。本研究は DreamReasoner-8B を開発し、ブロックサイズのカリキュラム学習で拡散型推論モデルの長鎖推論を強化する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗