開発者ツール B

315 件中 61〜90 件目を表示
  • arXiv cs.CL (Computation and Language) · EN 開発者ツール 抜粋
    Segment-Level Mandarin Chinese Speech-Based Cognitive Impairment Detection via an Autoencoder with Contrastive Learning
    中国語音声から認知機能障害を検出する対照学習自己符号化器
    強化学習 音声処理
    本論文は、標準中国語の音声からセグメント単位で認知機能障害を検出する手法を提案し、対照学習を備えた自己符号化器(オートエンコーダ)を用いる。低コストで非侵襲な生体マーカーとしての音声を活かしつつ、ラベル付きデータの不足やデータセット間のばらつきという課題に対処する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN マルチモーダル 抜粋
    Investigating Human-Model Discrepancies in Speech Quality Assessment via Acoustic and Prosodic Perturbations
    音響・韻律摂動で音声品質評価の人間とモデルの乖離を調査
    音声処理
    本論文は、音響的・韻律的な制御された摂動を用いて、音声品質評価における人間の判断とMOS予測モデルとの乖離を調査する。TTS研究で代理指標として広く使われるこれらのモデルが、音響的忠実度を超えた品質差を捉えられるかを検証する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 推論・効率化 抜粋
    GEMS: Geometric Constraints Enable Multi-Semantic Superposition in LLMs
    幾何制約で複数意味の重ね合わせを可能にする操作手法GEMS
    深層学習 推論 (Inference)
    本論文は、再学習なしに推論時の隠れ状態を操作するアクティベーション・ステアリングにおいて、幾何的な制約により複数の意味方向を重ね合わせ可能にする手法「GEMS」を提案する。単一方向の注入しか扱えない既存手法が、制約なしで複数方向を重ねると崩壊する問題に対処する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 安全性・評価 抜粋
    Light-weight Pronunciation Assessment via Discrete Speech Token Surprisal
    離散音声トークンのサプライザルで軽量に発音評価を行う手法
    推論 (Inference) 音声処理
    本論文は、離散音声トークンのサプライザル(予測のしにくさ)に基づく軽量な自動発音評価の枠組みを提案する。母語話者の音声資源のみで学習し、教師なし、または少数の採点済み発話による軽い較正で動作させることで、収集コストの高い学習者誤りや非母語コーパスへの依存を避ける。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • OpenAI Blog · EN 開発者ツール 抜粋
    Using AI to help physicians diagnose rare genetic diseases affecting children
    OpenAI 推論モデル、未解明の小児希少疾患で 18 件の新診断に貢献
    OpenAI
    研究者らは OpenAI の推論モデルを用い、これまで原因を特定できなかった小児の希少遺伝性疾患の診断を支援した。未解決症例の中から 18 件の新たな診断を特定し、AI が複雑な臨床推論を補助して希少疾患の診断精度向上に役立つ可能性を示した。
    元記事を読む (OpenAI Blog) ↗
  • arXiv cs.CL (Computation and Language) · EN 安全性・評価 抜粋
    The Almost Intelligent Revolution: Options for Scaling Up Deliberation and Empowering People with AI
    AIで民主的熟議を拡大し人々を力づける選択肢を論じる
    埋め込み (Embeddings) 強化学習
    本論文は、大規模言語モデルが公共の言説で存在感を増すなか、民主的な熟議を拡大し人々を力づけるための選択肢を論じる。レッドチーミングが個別リスクを抑える一方で、言語的制約、バイアス、迎合的(sycophantic)傾向といった、より広い懸念が残ることを踏まえて検討する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 安全性・評価 抜粋
    Large Language Models Do Not Always Need Readable Language
    LLMには常に人間可読な言語が必要ではないと示す
    ニューラルネットワーク
    本論文は、人間にとっての可読性を犠牲にしつつもモデルが利用可能な、コンパクトで非標準的なテキスト形式に意味情報を符号化できるかを検証する。読み手が別のモデルである場合などには、大規模言語モデルが必ずしも人間可読な言語を必要としないことを示す。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 安全性・評価 抜粋
    Leverage Is Not Reach: A Control-Window Law for Single-Neuron Steering in Language Models
    言語モデルの単一ニューロン操作に関する制御窓の法則を提示
    検索拡張生成 (RAG)
    本論文は、言語モデルにおける単一ニューロンによる操作(ステアリング)について、予算正規化した「制御窓(control window)」の枠組みを構築する。拒否や言語の振り分けなど、疎なフィードフォワードニューロンが制御する挙動を、出力を崩さずに一貫して制御できるのはいつかを予測しようとする。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 安全性・評価 抜粋
    CREDENCE: Claim Reduction for Decomposition & Enhanced Credibility -- Semantic Metrics and Convergence Analysis
    ファクトチェック向け主張分解の意味的指標CREDENCEを提案
    ニューラルネットワーク 強化学習
    本論文は、複合文を原子的で検証可能な主張に分解する手法「CREDENCE」を提案する。言い換えを含む主張で分解品質を過小評価するトークン重複(Jaccard)指標に代わる意味的な評価指標を導入し、形式的な収束・終了解析を加えて、信頼できる自動ファクトチェックを支える。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 新モデル・リリース 抜粋
    Think Again or Think Longer? Selective Verification for Budget-Aware Reasoning
    予算を意識した推論に向けた選択的な検証手法を提案
    機械学習 ソフトウェア工学
    本論文は、推論時の追加思考を「やり直す」か「長く考える」かという観点で、予算を意識した割り当て問題として捉え、選択的な検証手法を提案する。追加の推論は一様に有益ではなく、失敗の修復に役立つ一方、正解への計算の浪費や有害な答えの変更を招きうる点に着目する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 安全性・評価 抜粋
    CombEval: A Framework for Evaluating Combinatorial Counting in Large Language Models
    LLMの組合せ計数能力を評価する枠組みCombEvalを提案
    強化学習 ソフトウェア工学
    本論文は、大規模言語モデルの組合せ計数(combinatorial counting)能力を評価する動的ベンチマーク「CombEval」を提案する。各問題を、実体・組合せ対象・依存関係・制約にわたる型付きのCofola仕様として表現し、自然言語の計数問題を統制的に生成できるようにする。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 開発者ツール 抜粋
    AgentFinVQA: A Deployable Multi-Agent Pipeline for Auditable Financial Chart QA
    監査可能な金融チャートQA向け多エージェントAgentFinVQA
    AI エージェント Gemini ニューラルネットワーク 強化学習 ソフトウェア工学
    本論文は、監査可能な金融チャート質問応答に向けた、実運用可能なマルチエージェント・パイプライン「AgentFinVQA」を提案する。規制下で、どの回答を信頼できるかを把握する必要があり、顧客データを外部のモデル提供者に送れない現場を想定し、精度偏重で不透明な既存のチャートQAエージェントの課題に対処する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 新モデル・リリース 抜粋
    Manifold Bandits: Bayesian Curriculum Learning over the Latent Geometry of Large Language Models
    LLMの潜在幾何上でベイズ的カリキュラム学習を行うManifold Bandits
    検索拡張生成 (RAG) 強化学習
    本論文は、大規模言語モデルの潜在的な幾何構造の上で訓練問題をサンプリングする、ベイズ的なカリキュラム学習手法「Manifold Bandits」を提案する。推論能力向上のための強化学習では、最適化中にどのようにプロンプトを選ぶかが訓練効率を大きく左右する点に着目する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 学習・ファインチューニング 抜粋
    Beyond Uniform Forgetting: A Study of Sequential Direct Preference Optimization Across Preference Settings
    逐次的DPOにおける選好設定をまたいだ忘却を分析
    Llama 機械学習 強化学習 人間のフィードバックによる強化学習 (RLHF)
    本論文は、複数の整合目的を順番に適用する逐次的な直接選好最適化(DPO)を、さまざまな選好設定にわたって研究する。後段の学習が先に学んだ選好をどのように干渉・忘却させるかを、一様な忘却という見方を超えて分析する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN マルチモーダル 抜粋
    NRITYAM: Language Models Meet Art and Heritage of Dance
    世界の舞踊文化でLMの文化理解を測るベンチマークNRITYAM
    ニューラルネットワーク 強化学習 ソフトウェア工学
    本論文は、世界各地の舞踊(ダンス)の伝統を題材に、言語モデルの文化的理解力を評価する包括的ベンチマーク「NRITYAM」を提案する。言語モデルが世界規模で有効であるには、地域固有の社会文化的文脈を細やかに理解する必要があるという課題に取り組む。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • Hacker News (Front Page) · EN マルチモーダル 抜粋
    Midjourney Medical
    Midjourney、医療向け「Midjourney Medical」を提示
    画像生成で知られるMidjourneyが、医療分野に向けた「Midjourney Medical」を打ち出したことを伝える記事。デモ動画とともに、画像生成技術を医療領域に応用しようとする新たな取り組みとして紹介されている。
    元記事を読む (Hacker News (Front Page)) ↗
  • ITmedia AI+ · JA 開発者ツール 抜粋
    Anthropic、デザインツール「Claude Design」を強化 Codeとの双方向連携やCanvaなどへの出力をサポート
    Anthropic、「Claude Design」強化 Code連携やCanva出力対応
    Anthropic Claude
    Anthropicはデザイン制作ツール「Claude Design」のβ機能を大幅に強化した。複数のデザインシステムを取り込みプロジェクト横断で維持できるほか、「Claude Code」とのシームレスな双方向連携を実現。AdobeやCanvaなど外部ツールへの書き出しコネクタも拡充した。
    元記事を読む (ITmedia AI+) ↗
  • Anthropic News · EN 業界導入・応用 抜粋
    Anthropic opens Seoul office and announces new partnerships across the Korean AI ecosystem
    Anthropic、ソウルオフィス開設と韓国AI各社との新提携を発表
    Anthropic Claude ニューラルネットワーク 強化学習
    Anthropicがソウルにオフィスを開設し、韓国のAIエコシステムを担う企業・スタートアップ・研究者との新たなパートナーシップを発表した。同社は韓国を、技術革新と安全性を「表裏一体」と捉えるチームが集まる地域と位置づける。具体的な提携先や規模は発表ベースで、第三者検証は未確認。
    元記事を読む (Anthropic News) ↗
  • arXiv cs.CL (Computation and Language) · EN 新モデル・リリース 抜粋
    Freeing the Law with LOCUS: A Local Ordinance Corpus for the United States
    米地方条例を集約、法務 AI 向けコーパス LOCUS を公開
    深層学習 Meta 検索拡張生成 (RAG) 強化学習
    法務 AI の進展には大規模で信頼できる法文へのアクセスが不可欠だが、米国法で重要な層である地方条例は機械可読コーパスにほとんど存在しなかった。本研究は全米の地方条例を集めたコーパス「LOCUS」を構築し、法務 AI 研究の基盤データを拡充する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.LG (Machine Learning) · EN 開発者ツール 抜粋
    The Chandra-Gaia Catalog of Counterparts: Resolving ambiguous Gaia matches to X-ray sources in the Chandra Source Catalog using Machine Learning
    機械学習で Chandra の X 線源と Gaia 天体を高精度に対応付け
    機械学習
    研究チームは、Chandra X 線源カタログ(CSC v2.1)と Gaia DR3 の光学天体を対応付ける枠組みを提案した。単純な位置照合ではなく、等級・色・距離などの天体特性を機械学習で活用し、曖昧な対応関係を解消。X 線源の正確な同定を支援する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 安全性・評価 抜粋
    Reference-Driven Multi-Speaker Audio Scene Generation from In-the-Wild Priors
    実環境の事前情報から多話者の音声シーンを生成する手法
    埋め込み (Embeddings) 検索拡張生成 (RAG) 強化学習 音声処理
    既存の多話者対話システムは、発話タグや多ストリーム転写、話者埋め込みなど構造的な教師情報で話者と発話を結び付ける。本研究は実環境(in-the-wild)の事前情報を参照して多話者の音声シーンを生成する手法を提案し、より自然な対話音声の合成を目指す。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.CL (Computation and Language) · EN 開発者ツール 抜粋
    Enhancing Decision-Making with Large Language Models through Multi-Agent Fictitious Play
    マルチエージェントの架空プレイで LLM の意思決定を強化
    AI エージェント ニューラルネットワーク 強化学習
    LLM ベースのマルチエージェントシステムは、サブタスクを協調的に分担し複雑な課題を解く可能性を示してきた。本研究はゲーム理論の「架空プレイ(fictitious play)」を取り入れ、エージェント間の相互作用を通じて意思決定の質を高める手法を提案する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.LG (Machine Learning) · EN インフラ・ハードウェア 抜粋
    P-K-GCN: Physics-augmented Koopman-enhanced Graph Convolutional Network for Deep Spatiotemporal Super-resolution
    物理と Koopman を組み込んだ GCN で時空間超解像を高精度化
    時空間ダイナミクスの高精度シミュレーションは計算負荷が大きく、効率的な超解像が求められる。本研究は物理制約と Koopman 作用素理論をグラフ畳み込みネットワークに統合した「P-K-GCN」を提案し、低解像度データから高精度な時空間場を再構成する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN 安全性・評価 抜粋
    Confidence is Not Reliability: Rethinking MC Dropout in Brain Tumour Segmentation
    脳腫瘍セグメンテーションで MC Dropout の信頼性を問い直す
    ニューラルネットワーク 強化学習
    多パラメトリック MRI でのグリオーマ(脳腫瘍)領域分割は治療計画の要だが、重要部位で静かに失敗するモデルは患者安全のリスクとなる。本研究は MC Dropout による不確実性が必ずしも信頼性を意味しないことを示し、重なり指標では見えない弱点を再検討する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • Simon Willison's Weblog · EN 開発者ツール 抜粋
    Quoting Charity Majors
    Simon Willison、Charity Majorsを引用しAIは規律をより要すと指摘
    Simon WillisonがCharity Majorsの言葉を引用し、2025年にコード生成の経済性が一変してコードが事実上無償・即時で『使い捨て』になった一方、AI活用はより少ないどころかより多くのエンジニアリング規律を要求すると論じる。論者見解ベースで第三者検証は未確認。
    元記事を読む (Simon Willison's Weblog) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 安全性・評価 抜粋
    NeSyCat Torch: A Differentiable Tensor Implementation of Categorical Semantics for Neurosymbolic Learning
    圏論的意味論で神経記号学習を統一する NeSyCat Torch
    ニューラルネットワーク 検索拡張生成 (RAG) 強化学習
    神経記号(ニューロシンボリック)の意味論は、古典・ファジィ・確率・ニューラルが各々の規則で真偽を定義し分断されている。本研究は ULLER を拡張した NeSyCat により、これらを単一の帰納的な真理定義に統合し、微分可能なテンソル実装として提供する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.LG (Machine Learning) · EN 安全性・評価 抜粋
    Beyond Algorithms: Conceptual Innovation in Medical Imaging AI
    医療画像 AI に必要なのはアルゴリズムを超えた概念的革新
    アルゴリズム・理論 深層学習 ニューラルネットワーク 検索拡張生成 (RAG) 強化学習
    AI は医療画像研究を急速に進展させ、高度なアルゴリズムとベンチマーク改善を生んできた。しかしアルゴリズム中心の路線は限界も露呈している。本研究はアルゴリズムを超えた概念的革新の必要性を論じ、臨床的に意味のある進歩へ向けた方向性を提案する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 学習・ファインチューニング 抜粋
    Trade-offs in Medical LLM Adaptation: An Empirical Study in French QA
    医療 LLM のドメイン適応、仏語 QA で利点と代償を実証研究
    ファインチューニング 強化学習 ソフトウェア工学
    LLM の専門分野・言語への適応が注目される中、ドメイン適応戦略の有効性は依然不明な点が多い。本研究はフランス語の医療 QA を題材に、各種適応手法のトレードオフを実証的に分析し、性能と汎用性の間で生じる得失を明らかにする。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.LG (Machine Learning) · EN インフラ・ハードウェア 抜粋
    Detecting Hidden ML Training With Zero-Overhead Telemetry
    ゼロ負荷テレメトリで隠れた ML 学習を検出し計算統治を支援
    機械学習 ニューラルネットワーク
    GPU 負荷のハードウェア監視は AI の計算ガバナンス提案の基盤だが、開発者が監視を回避できれば機能しない。本研究はオーバーヘッドのないテレメトリで隠れた機械学習の学習を検出できるかを評価し、計算資源の統治を実効的にするための監視耐性を検証する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 安全性・評価 抜粋
    X+Slides: Benchmarking Audience-Conditioned Slide Generation
    X+Slides、聴衆に合わせたスライド生成を評価するベンチマーク
    ニューラルネットワーク 検索拡張生成 (RAG) 強化学習
    文書からスライドを自動生成することは LLM の重要な応用だが、既存ベンチマークは主に網羅性や技術的深さを測るにとどまる。本研究は聴衆に条件づけたスライド生成を評価する「X+Slides」を提案し、対象読者に応じた適切さを測る観点を導入する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗