開発者ツール B
315 件中 61〜90 件目を表示
-
Segment-Level Mandarin Chinese Speech-Based Cognitive Impairment Detection via an Autoencoder with Contrastive Learning中国語音声から認知機能障害を検出する対照学習自己符号化器本論文は、標準中国語の音声からセグメント単位で認知機能障害を検出する手法を提案し、対照学習を備えた自己符号化器(オートエンコーダ)を用いる。低コストで非侵襲な生体マーカーとしての音声を活かしつつ、ラベル付きデータの不足やデータセット間のばらつきという課題に対処する。
-
Investigating Human-Model Discrepancies in Speech Quality Assessment via Acoustic and Prosodic Perturbations音響・韻律摂動で音声品質評価の人間とモデルの乖離を調査本論文は、音響的・韻律的な制御された摂動を用いて、音声品質評価における人間の判断とMOS予測モデルとの乖離を調査する。TTS研究で代理指標として広く使われるこれらのモデルが、音響的忠実度を超えた品質差を捉えられるかを検証する。
-
GEMS: Geometric Constraints Enable Multi-Semantic Superposition in LLMs幾何制約で複数意味の重ね合わせを可能にする操作手法GEMS本論文は、再学習なしに推論時の隠れ状態を操作するアクティベーション・ステアリングにおいて、幾何的な制約により複数の意味方向を重ね合わせ可能にする手法「GEMS」を提案する。単一方向の注入しか扱えない既存手法が、制約なしで複数方向を重ねると崩壊する問題に対処する。
-
Light-weight Pronunciation Assessment via Discrete Speech Token Surprisal離散音声トークンのサプライザルで軽量に発音評価を行う手法本論文は、離散音声トークンのサプライザル(予測のしにくさ)に基づく軽量な自動発音評価の枠組みを提案する。母語話者の音声資源のみで学習し、教師なし、または少数の採点済み発話による軽い較正で動作させることで、収集コストの高い学習者誤りや非母語コーパスへの依存を避ける。
-
Using AI to help physicians diagnose rare genetic diseases affecting childrenOpenAI 推論モデル、未解明の小児希少疾患で 18 件の新診断に貢献研究者らは OpenAI の推論モデルを用い、これまで原因を特定できなかった小児の希少遺伝性疾患の診断を支援した。未解決症例の中から 18 件の新たな診断を特定し、AI が複雑な臨床推論を補助して希少疾患の診断精度向上に役立つ可能性を示した。
-
The Almost Intelligent Revolution: Options for Scaling Up Deliberation and Empowering People with AIAIで民主的熟議を拡大し人々を力づける選択肢を論じる本論文は、大規模言語モデルが公共の言説で存在感を増すなか、民主的な熟議を拡大し人々を力づけるための選択肢を論じる。レッドチーミングが個別リスクを抑える一方で、言語的制約、バイアス、迎合的(sycophantic)傾向といった、より広い懸念が残ることを踏まえて検討する。
-
Large Language Models Do Not Always Need Readable LanguageLLMには常に人間可読な言語が必要ではないと示す本論文は、人間にとっての可読性を犠牲にしつつもモデルが利用可能な、コンパクトで非標準的なテキスト形式に意味情報を符号化できるかを検証する。読み手が別のモデルである場合などには、大規模言語モデルが必ずしも人間可読な言語を必要としないことを示す。
-
Leverage Is Not Reach: A Control-Window Law for Single-Neuron Steering in Language Models言語モデルの単一ニューロン操作に関する制御窓の法則を提示本論文は、言語モデルにおける単一ニューロンによる操作(ステアリング)について、予算正規化した「制御窓(control window)」の枠組みを構築する。拒否や言語の振り分けなど、疎なフィードフォワードニューロンが制御する挙動を、出力を崩さずに一貫して制御できるのはいつかを予測しようとする。
-
CREDENCE: Claim Reduction for Decomposition & Enhanced Credibility -- Semantic Metrics and Convergence Analysisファクトチェック向け主張分解の意味的指標CREDENCEを提案本論文は、複合文を原子的で検証可能な主張に分解する手法「CREDENCE」を提案する。言い換えを含む主張で分解品質を過小評価するトークン重複(Jaccard)指標に代わる意味的な評価指標を導入し、形式的な収束・終了解析を加えて、信頼できる自動ファクトチェックを支える。
-
Think Again or Think Longer? Selective Verification for Budget-Aware Reasoning予算を意識した推論に向けた選択的な検証手法を提案本論文は、推論時の追加思考を「やり直す」か「長く考える」かという観点で、予算を意識した割り当て問題として捉え、選択的な検証手法を提案する。追加の推論は一様に有益ではなく、失敗の修復に役立つ一方、正解への計算の浪費や有害な答えの変更を招きうる点に着目する。
-
CombEval: A Framework for Evaluating Combinatorial Counting in Large Language ModelsLLMの組合せ計数能力を評価する枠組みCombEvalを提案本論文は、大規模言語モデルの組合せ計数(combinatorial counting)能力を評価する動的ベンチマーク「CombEval」を提案する。各問題を、実体・組合せ対象・依存関係・制約にわたる型付きのCofola仕様として表現し、自然言語の計数問題を統制的に生成できるようにする。
-
AgentFinVQA: A Deployable Multi-Agent Pipeline for Auditable Financial Chart QA監査可能な金融チャートQA向け多エージェントAgentFinVQA本論文は、監査可能な金融チャート質問応答に向けた、実運用可能なマルチエージェント・パイプライン「AgentFinVQA」を提案する。規制下で、どの回答を信頼できるかを把握する必要があり、顧客データを外部のモデル提供者に送れない現場を想定し、精度偏重で不透明な既存のチャートQAエージェントの課題に対処する。
-
Manifold Bandits: Bayesian Curriculum Learning over the Latent Geometry of Large Language ModelsLLMの潜在幾何上でベイズ的カリキュラム学習を行うManifold Bandits本論文は、大規模言語モデルの潜在的な幾何構造の上で訓練問題をサンプリングする、ベイズ的なカリキュラム学習手法「Manifold Bandits」を提案する。推論能力向上のための強化学習では、最適化中にどのようにプロンプトを選ぶかが訓練効率を大きく左右する点に着目する。
-
Beyond Uniform Forgetting: A Study of Sequential Direct Preference Optimization Across Preference Settings逐次的DPOにおける選好設定をまたいだ忘却を分析本論文は、複数の整合目的を順番に適用する逐次的な直接選好最適化(DPO)を、さまざまな選好設定にわたって研究する。後段の学習が先に学んだ選好をどのように干渉・忘却させるかを、一様な忘却という見方を超えて分析する。
-
NRITYAM: Language Models Meet Art and Heritage of Dance世界の舞踊文化でLMの文化理解を測るベンチマークNRITYAM本論文は、世界各地の舞踊(ダンス)の伝統を題材に、言語モデルの文化的理解力を評価する包括的ベンチマーク「NRITYAM」を提案する。言語モデルが世界規模で有効であるには、地域固有の社会文化的文脈を細やかに理解する必要があるという課題に取り組む。
-
Midjourney MedicalMidjourney、医療向け「Midjourney Medical」を提示画像生成で知られるMidjourneyが、医療分野に向けた「Midjourney Medical」を打ち出したことを伝える記事。デモ動画とともに、画像生成技術を医療領域に応用しようとする新たな取り組みとして紹介されている。
-
Anthropic、デザインツール「Claude Design」を強化 Codeとの双方向連携やCanvaなどへの出力をサポートAnthropic、「Claude Design」強化 Code連携やCanva出力対応Anthropicはデザイン制作ツール「Claude Design」のβ機能を大幅に強化した。複数のデザインシステムを取り込みプロジェクト横断で維持できるほか、「Claude Code」とのシームレスな双方向連携を実現。AdobeやCanvaなど外部ツールへの書き出しコネクタも拡充した。
-
Anthropic opens Seoul office and announces new partnerships across the Korean AI ecosystemAnthropic、ソウルオフィス開設と韓国AI各社との新提携を発表Anthropicがソウルにオフィスを開設し、韓国のAIエコシステムを担う企業・スタートアップ・研究者との新たなパートナーシップを発表した。同社は韓国を、技術革新と安全性を「表裏一体」と捉えるチームが集まる地域と位置づける。具体的な提携先や規模は発表ベースで、第三者検証は未確認。
-
Freeing the Law with LOCUS: A Local Ordinance Corpus for the United States米地方条例を集約、法務 AI 向けコーパス LOCUS を公開法務 AI の進展には大規模で信頼できる法文へのアクセスが不可欠だが、米国法で重要な層である地方条例は機械可読コーパスにほとんど存在しなかった。本研究は全米の地方条例を集めたコーパス「LOCUS」を構築し、法務 AI 研究の基盤データを拡充する。
-
The Chandra-Gaia Catalog of Counterparts: Resolving ambiguous Gaia matches to X-ray sources in the Chandra Source Catalog using Machine Learning機械学習で Chandra の X 線源と Gaia 天体を高精度に対応付け研究チームは、Chandra X 線源カタログ(CSC v2.1)と Gaia DR3 の光学天体を対応付ける枠組みを提案した。単純な位置照合ではなく、等級・色・距離などの天体特性を機械学習で活用し、曖昧な対応関係を解消。X 線源の正確な同定を支援する。
-
Reference-Driven Multi-Speaker Audio Scene Generation from In-the-Wild Priors実環境の事前情報から多話者の音声シーンを生成する手法既存の多話者対話システムは、発話タグや多ストリーム転写、話者埋め込みなど構造的な教師情報で話者と発話を結び付ける。本研究は実環境(in-the-wild)の事前情報を参照して多話者の音声シーンを生成する手法を提案し、より自然な対話音声の合成を目指す。
-
Enhancing Decision-Making with Large Language Models through Multi-Agent Fictitious Playマルチエージェントの架空プレイで LLM の意思決定を強化LLM ベースのマルチエージェントシステムは、サブタスクを協調的に分担し複雑な課題を解く可能性を示してきた。本研究はゲーム理論の「架空プレイ(fictitious play)」を取り入れ、エージェント間の相互作用を通じて意思決定の質を高める手法を提案する。
-
P-K-GCN: Physics-augmented Koopman-enhanced Graph Convolutional Network for Deep Spatiotemporal Super-resolution物理と Koopman を組み込んだ GCN で時空間超解像を高精度化時空間ダイナミクスの高精度シミュレーションは計算負荷が大きく、効率的な超解像が求められる。本研究は物理制約と Koopman 作用素理論をグラフ畳み込みネットワークに統合した「P-K-GCN」を提案し、低解像度データから高精度な時空間場を再構成する。
-
Confidence is Not Reliability: Rethinking MC Dropout in Brain Tumour Segmentation脳腫瘍セグメンテーションで MC Dropout の信頼性を問い直す多パラメトリック MRI でのグリオーマ(脳腫瘍)領域分割は治療計画の要だが、重要部位で静かに失敗するモデルは患者安全のリスクとなる。本研究は MC Dropout による不確実性が必ずしも信頼性を意味しないことを示し、重なり指標では見えない弱点を再検討する。
-
Quoting Charity MajorsSimon Willison、Charity Majorsを引用しAIは規律をより要すと指摘Simon WillisonがCharity Majorsの言葉を引用し、2025年にコード生成の経済性が一変してコードが事実上無償・即時で『使い捨て』になった一方、AI活用はより少ないどころかより多くのエンジニアリング規律を要求すると論じる。論者見解ベースで第三者検証は未確認。
-
NeSyCat Torch: A Differentiable Tensor Implementation of Categorical Semantics for Neurosymbolic Learning圏論的意味論で神経記号学習を統一する NeSyCat Torch神経記号(ニューロシンボリック)の意味論は、古典・ファジィ・確率・ニューラルが各々の規則で真偽を定義し分断されている。本研究は ULLER を拡張した NeSyCat により、これらを単一の帰納的な真理定義に統合し、微分可能なテンソル実装として提供する。
-
Beyond Algorithms: Conceptual Innovation in Medical Imaging AI医療画像 AI に必要なのはアルゴリズムを超えた概念的革新AI は医療画像研究を急速に進展させ、高度なアルゴリズムとベンチマーク改善を生んできた。しかしアルゴリズム中心の路線は限界も露呈している。本研究はアルゴリズムを超えた概念的革新の必要性を論じ、臨床的に意味のある進歩へ向けた方向性を提案する。
-
Trade-offs in Medical LLM Adaptation: An Empirical Study in French QA医療 LLM のドメイン適応、仏語 QA で利点と代償を実証研究LLM の専門分野・言語への適応が注目される中、ドメイン適応戦略の有効性は依然不明な点が多い。本研究はフランス語の医療 QA を題材に、各種適応手法のトレードオフを実証的に分析し、性能と汎用性の間で生じる得失を明らかにする。
-
Detecting Hidden ML Training With Zero-Overhead Telemetryゼロ負荷テレメトリで隠れた ML 学習を検出し計算統治を支援GPU 負荷のハードウェア監視は AI の計算ガバナンス提案の基盤だが、開発者が監視を回避できれば機能しない。本研究はオーバーヘッドのないテレメトリで隠れた機械学習の学習を検出できるかを評価し、計算資源の統治を実効的にするための監視耐性を検証する。
-
X+Slides: Benchmarking Audience-Conditioned Slide GenerationX+Slides、聴衆に合わせたスライド生成を評価するベンチマーク文書からスライドを自動生成することは LLM の重要な応用だが、既存ベンチマークは主に網羅性や技術的深さを測るにとどまる。本研究は聴衆に条件づけたスライド生成を評価する「X+Slides」を提案し、対象読者に応じた適切さを測る観点を導入する。