安全性・評価 A

326 件中 1〜30 件目を表示
  • ITmedia AI+ · JA 安全性・評価 抜粋
    米大企業の7割が導入する「Databricks」とは何者か? 評価額20兆円の「AI向けデータ基盤」
    Databricks、評価額20兆円のAI向けデータ基盤、米大企業の7割が導入
    Apache Sparkの開発者らが2013年に創業したDatabricksは、評価額約20兆円、Fortune 500の約7割が利用するデータ・AI基盤企業へと成長した。本記事は同社の軌跡と最新動向を解説する。
    元記事を読む (ITmedia AI+) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 安全性・評価 抜粋
    How Transparent is DiffusionGemma?
    DiffusionGemmaの推論透明性を2軸に分解して検証する研究
    アルゴリズム・理論
    連続潜在空間で計算の多くを担うDiffusionGemmaの推論が不透明になるかを検証。透明性を、中間状態を理解できるかという変数透明性と、それを用いて推論過程を再構成できるかというアルゴリズム透明性に分解して分析する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.LG (Machine Learning) · EN インフラ・ハードウェア 抜粋
    Optimal Deterministic Multicalibration and Omniprediction
    ランダム性不要、決定的予測器で最適なマルチキャリブレーションを実現
    機械学習
    本研究は、決定的な予測器を出力するミニマックス最適なマルチキャリブレーション手法を提案する。最適なサンプル複雑度の達成にランダム化が必要かという未解決問題を解決し、結果を結果識別不能性(OI)やオムニ予測を満たす決定的予測器へと一般化する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN 安全性・評価 抜粋
    Multi-Task Bayesian In-Context Learning
    インコンテキスト学習でマルチタスクのベイズ推論を行う手法を提案
    推論 (Inference) Meta 強化学習 Transformer
    本論文は、インコンテキスト学習を用いてタスク横断的にベイズ予測推論を行うマルチタスク・ベイズ・インコンテキスト学習を提案する。厳密推論の計算困難性や、近似手法のコスト・制約という課題に取り組み、不確実性の定量化とデータ効率の両立を目指す。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.CL (Computation and Language) · EN 安全性・評価 抜粋
    StylisticBias: A Few Human Visual Cues Drive Most Social Biases in MLLMs
    少数の視覚的手がかりがMLLMの社会的バイアスの大半を生むと解明
    機械学習 強化学習
    本研究StylisticBiasは、マルチモーダル大規模言語モデル(MLLM)が人物をどう判断するかを左右する視覚的手がかりを分析する。ごく少数の人間的な視覚的手がかりが、MLLMが示す社会的バイアスの大半を駆動していることを示し、影響の大きい応用での懸念を指摘する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 新モデル・リリース 抜粋
    DeepSWIP: Quotient-WMC Counterfactuals for Neural Probabilistic Logic Programs
    ニューラル確率論理プログラムの反事実推論手法DeepSWIP
    推論 (Inference) 強化学習
    DeepProbLogのようなニューロシンボリック系はニューラル知覚と確率論理を組み合わせる。DeepSWIPはQuotient-WMCに基づく反事実推論を導入し、標準的推論の限界に対処する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 安全性・評価 抜粋
    SARLO-80: Worldwide Slant SAR Language Optic Dataset 80cm
    80cm解像度の世界規模スラントSAR・光学データセットSARLO-80
    深層学習 強化学習
    マルチモーダル基盤モデルは大規模な光学ベンチマークで急速に進歩した一方、SAR向けの資源は不足している。SARLO-80は80cm解像度の世界規模スラントSAR・光学データセットを提供する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 安全性・評価 抜粋
    Multi-LCB: Extending LiveCodeBench to Multiple Programming Languages
    LiveCodeBを多言語に拡張したコード評価ベンチMulti-LCB
    強化学習 ソフトウェア工学
    LiveCodeBenchはLLMのコード能力評価で広く採用されている。Multi-LCBはこれを複数のプログラミング言語へ拡張し、多言語でのコード生成能力を評価する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 安全性・評価 抜粋
    What Do Safety-Aligned LLMs Learn From Mixed Compliance Demonstrations?
    安全整合LLMが混在コンプライアンス実例から何を学ぶか
    文脈内の実例がLLMをジェイルブレイクし得ることは知られているが、順守と違反が混在する実例から安全整合モデルが何を学ぶかは不明だった。本研究はその挙動を分析する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 安全性・評価 抜粋
    FreeStyle: Free Control of Style-Content Dual-Reference Generation from Community LoRA Mining
    コミュニティLoRA採掘でスタイルと内容を二重制御するFreeStyle
    検索拡張生成 (RAG)
    スタイルと内容の二重参照生成は、構造を保ちつつ別の様式で画像を合成する課題。FreeStyleはコミュニティのLoRA採掘を活用し、スタイルと内容を自由に制御する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.LG (Machine Learning) · EN 安全性・評価 抜粋
    Entropy Estimation in Multi-Qutrit Systems via Variational and Classical Neural Networks
    変分量子アルゴリズムとCNNでマルチqutritのエントロピー推定
    アルゴリズム・理論 ニューラルネットワーク ソフトウェア工学
    本論文は、マルチqutrit量子系におけるフォン・ノイマンエントロピーの推定を、変分量子アルゴリズム(VQA)と古典的な畳み込みニューラルネット(CNN)という二つの手法で体系的に比較する。理想的なノイズなしシミュレータ上で、最大3 qutritの系を対象に評価する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 学習・ファインチューニング 抜粋
    Calibration Without Comprehension: Diagnosing the Limits of Fine-Tuning LLMs for Vulnerability Detection in Systems Software
    脆弱性検出のLLM微調整は理解か暗記かを診断する研究
    ファインチューニング ニューラルネットワーク 強化学習
    脆弱性ベンチで高得点のLLMが本当にセキュリティを推論しているのか、それとも単にパターン照合かを検証。微調整による脆弱性検出の限界を診断する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 安全性・評価 抜粋
    Contagion Networks: Evaluator Bias Propagation in Multi-Agent LLM Systems
    マルチエージェントLLMで評価者バイアスが伝播する現象を分析
    AI エージェント DeepSeek 強化学習
    LLMがマルチエージェント系で評価者として働く際、その系統的な評価バイアスがどのように伝播するかを研究。Contagion Networksとして拡散の仕組みを分析する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.CL (Computation and Language) · EN 新モデル・リリース 抜粋
    Beyond Global Replanning: Hierarchical Recovery for Cross-Device Agent Systems
    複数端末にまたがるエージェントの階層的な障害回復手法を提案
    AI エージェント ニューラルネットワーク 強化学習
    本論文は、複数のアプリや端末にまたがる実世界のコンピュータ操作タスク向けに、粗い全体再計画にとどまらない階層的な障害回復機構を提案する。動的な実行時障害の下で、異種環境を協調させながらきめ細かく復旧することを目指す。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 学習・ファインチューニング 抜粋
    Your Mouse and Eyes Secretly Leak Your Preference: LLM Alignment using Implicit Feedback from Users
    マウスや視線の暗黙的フィードバックでLLMを整合する手法を提案
    ニューラルネットワーク 検索拡張生成 (RAG) 強化学習 人間のフィードバックによる強化学習 (RLHF)
    本論文は、明示的な人間のフィードバックの代わりに、マウス操作や視線などユーザーの暗黙的なシグナルを用いて大規模言語モデルを整合(アライメント)する手法を提案する。ユーザーが明示的な評価をほとんど与えず、高品質な選好データが得にくいという課題に対処する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.LG (Machine Learning) · EN 推論・効率化 抜粋
    Marginal Advantage Accumulation for Memory-Driven Agent Self-Evolution
    記憶駆動エージェントの自己進化へ操作単位の優位性蓄積を提案
    本論文は、記憶駆動エージェントの自己進化に向け、バッチを横断して操作単位で証拠を蓄積する「限界優位性蓄積」を提案する。トレース蒸留で同じ記憶操作がバッチ間で矛盾するフィードバックを受ける問題に対処し、安定して有効な操作と偶然の当たりを区別することを狙う。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 安全性・評価 抜粋
    Analyzing Defensive Misdirection Against Model-Guided Automated Attacks on Agentic AI Systems
    エージェントAIへのモデル誘導自動攻撃に対する防御的かく乱の分析
    AI エージェント 強化学習 音声処理
    エージェントAIは指示解釈にLLM部品を多用するため攻撃対象となる。本研究はモデル誘導の自動攻撃に対する防御的かく乱(misdirection)の効果を分析する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.LG (Machine Learning) · EN 安全性・評価 抜粋
    Fisher-Geometric Sharpness and the Implicit Bias of SGD toward Flat Minima
    フィッシャー幾何に基づく平坦性とSGDの平坦解への暗黙バイアス
    深層学習 ニューラルネットワーク
    本論文は、SGDが平坦な極小へ向かう暗黙のバイアスを調べるため、フィッシャー幾何に基づくシャープネス(鋭さ)の指標を導入する。損失ヘッシアンのトレースや最大固有値といった従来のユークリッド的な平坦性指標が、ネットワーク関数を保つ再パラメータ化の下で不変でない問題に対処する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN 安全性・評価 抜粋
    Agentic Symbolic Search: Characterizing PDEs Beyond Hand-crafted Expressions, Meshes, and Neural Networks
    偏微分方程式の解を数式構造で捉えるエージェント的記号探索を提案
    ニューラルネットワーク
    本論文は、偏微分方程式(PDE)の解を、計算値の表ではなく数学的構造として特徴づける「エージェント的記号探索」を提案する。数値シミュレーションもニューラルネットも直接は生み出さず、従来は人手の解析で得ていた構造的理解の自動化を狙う。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN 安全性・評価 抜粋
    Data Bias Mitigation under Coverage Constraints & The Price of Fairness
    被覆制約の下でのデータバイアス緩和と公平性のコストを分析
    機械学習 Meta 検索拡張生成 (RAG) 強化学習
    本論文は、被覆(カバレッジ)制約の下でのデータバイアス緩和と、そこで生じる「公平性の代償」を検討する。人種や性別など複数の機微属性が交差する個人に対する差別的な結果に着目し、交差的バイアスを定量化する原理的な指標の不在という課題に取り組む。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 安全性・評価 抜粋
    Multi-View Decompilation for LLM-Based Malware Classification
    逆コンパイルの多視点を用いたLLMによるマルウェア分類
    ニューラルネットワーク 検索拡張生成 (RAG)
    マルウェア解析者はソース不在時に逆コンパイルされた疑似Cを調べる。本研究は複数視点の逆コンパイル情報を用いてLLMでマルウェアを分類する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 安全性・評価 抜粋
    LLM agent safety, multi-turn red-teaming, jailbreak benchmarks, adversarial robustness, safety-critical systems
    安全重要系を監督するLLMエージェントの多ターン・レッドチーミング評価
    AI エージェント ニューラルネットワーク 強化学習
    LLMエージェントが安全重要系の監督部品として提案されるなか、多ターンのレッドチーミングやジェイルブレイク・ベンチで頑健性を評価する研究。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 新モデル・リリース 抜粋
    DataMagic: Transforming Tabular Data into Data Insight Video
    表データをデータ洞察動画に変換するDataMagic
    ニューラルネットワーク 検索拡張生成 (RAG) 強化学習
    データ動画は動的チャート・音声ナレーション・同期アニメーションを統合して洞察を伝える。DataMagicは表形式データをこうしたデータ洞察動画へ自動変換する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.LG (Machine Learning) · EN マルチモーダル 抜粋
    Towards Modality-imbalanced Federated Graph Learning: A Data Synthesis-based Approach
    連合グラフ学習のモダリティ不均衡をデータ合成で緩和する手法
    本論文は、マルチモーダル連合グラフ学習(MM-FGL)におけるモダリティ不均衡を、データ合成に基づく手法で緩和する。クライアントが特定モダリティを丸ごと欠くクライアントレベルと、個々のノードでモダリティが欠けるノードレベルという、二つの粒度の不均衡に対処する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 安全性・評価 抜粋
    CRAX: Fast Safe Reinforcement Learning Benchmarking
    安全な強化学習を高速にベンチマークするCRAX
    AI エージェント ニューラルネットワーク 検索拡張生成 (RAG) 強化学習 ロボティクス
    実世界領域でRLエージェントを展開する上で安全は中核的関心事。CRAXは安全な強化学習を高速にベンチマークするための枠組みを提供する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 推論・効率化 抜粋
    AutoPass: Evidence-Guided LLM Agents for Compiler Performance Tuning
    コンパイラ性能調整を担う証拠誘導LLMエージェントAutoPass
    AI エージェント ファインチューニング 推論 (Inference)
    LLMはコードコンパイル作業に有望だが、実行時性能調整への適用は難しい。AutoPassは証拠誘導のLLMエージェントによりコンパイラ性能調整を行う。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.CL (Computation and Language) · EN 新モデル・リリース 抜粋
    CATCH-ME if you RAG: a dataset of Contextually Annotated multi-Turn Counterspeech against Hate and Misinformation Exchanges
    ヘイトと誤情報への対抗発話データセットCATCH-MEを提案
    ニューラルネットワーク 自然言語処理 (NLP) 検索拡張生成 (RAG) 強化学習 音声処理
    本論文は、しばしば重なり合うヘイトスピーチと誤情報に対する、文脈注釈付きの複数ターン対抗発話(counterspeech)データセット「CATCH-ME」を提案する。両者を切り離して扱いがちなNLP研究の傾向や、ゼロショットLLMが反復的で曖昧な応答を生む問題に対処する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.LG (Machine Learning) · EN 安全性・評価 抜粋
    Judging to Improve: A De-biased VLM-as-3D-Judge Protocol for Single-Image 3D Generation
    脱バイアスのVLM3D判定器で単一画像からの3D生成を専門化
    強化学習 ソフトウェア工学
    本論文は、単一画像からの3D生成に向けた、脱バイアスの「VLMを3D判定器として使う」プロトコルを提案する。幾何やCLIPの代理指標では捉えきれない単一画像→3Dメッシュ品質をランク付けする判定器を活かし、その選好で強力なオープン生成器TRELLISを、人手なしに家具など特定資産クラスへ安価に専門化できるかを問う。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 学習・ファインチューニング 抜粋
    Automating SKILL.md Generation for Computer-Using Agents via Interaction Trajectory Mining
    相互作用軌跡採掘でコンピュータ操作エージェントのSKILL.md生成を自動化
    AI エージェント ニューラルネットワーク 強化学習
    明示的なスキルライブラリはコンピュータ操作エージェントの検査を容易にする。本研究は相互作用軌跡の採掘によりSKILL.mdの生成を自動化する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.LG (Machine Learning) · EN 学習・ファインチューニング 抜粋
    Train, Retrieve, or Both? A Four-Arm Head-to-Head for Correct Statutory Citation on the Ontario Residential Tenancies Act
    条文引用タスクで微調整・検索・併用を比較する4アーム評価
    深層学習 ファインチューニング ニューラルネットワーク 検索拡張生成 (RAG)
    本論文は、オンタリオ州住宅賃貸借法(RTA)とその主要規則を対象に、正しい条文引用を返すタスクで微調整・検索(retrieval)・両者の併用を四つの構成で直接比較する。借主・貸主・窓口担当が、問いを実際に規定する条文へ正しく導かれる必要性に応える。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗