学習・ファインチューニング A
99 件中 91〜99 件目を表示
-
ClinHallu: A Benchmark for Diagnosing Stage-Wise Hallucinations in Medical MLLM Reasoning医療MLLMの段階別ハルシネーションを診断するベンチマーク「ClinHallu」医療マルチモーダルLLMの推論で生じるハルシネーションを、視覚認識・知識想起・推論統合の段階別に切り分けて診断するベンチマーク「ClinHallu」を提案。7,031件の検証済みインスタンスに構造化推論トレースを付与し、段階置換介入で誤りの発生源を特定する。
-
Graph Structured Combinatorial Semi-Bandit with Nonlinear Reward Associations through Separable Signalsグラフ構造の組合せ半バンディットを分離信号で解く相互接続データから最適構造を特定する組合せ半バンディット問題を、非線形な報酬関係の下で研究。分離可能な信号を用いてサンプリングと計算の効率化を図る。
-
From Self-Supervised Speech Models to Mixture-of-Experts for Robust Anti-Spoofing自己教師あり音声モデルとMoEで頑健な音声なりすまし検知音声生成の進歩で合成音声が自然になり、なりすまし(spoofing)検知が難化している。本論文は自己教師あり音声モデルとMixture-of-Experts(MoE)を組み合わせ、より頑健なアンチスプーフィング手法を提案する。
-
When Good Verifiers Go Bad: Self-Improving VLMs Can Regress on New Tasks自己改善するVLMが検証器の悪化で新タスク性能を退行させる現象凍結した検証器で候補生成を採点し選好例を作る verifier 駆動の自己DPOは、自己改善型VLMで一般的な手法。本論文は、この設定で検証器が不適切だとモデルが新タスクで性能を退行させ得ること(Good Verifiers Go Bad)を示す。
-
A Comparative Study of Deep Learning Architectures for Multi-Horizon Behavioural Forecasting for Mobile Healthモバイルヘルスの多期間行動予測で深層学習を比較検証ウェアラブルやスマホが生む行動時系列は予防的な健康介入を支え得るが、近年の予測アーキテクチャの体系的比較は不足している。本論文はモバイルヘルス向けに多期間(multi-horizon)行動予測の深層学習アーキテクチャを比較研究する。
-
Cluster LOCO: Feature Importance For Interpreting ClustersCluster LOCO、クラスタ解釈のための特徴重要度探索的分析や科学的発見に使われるクラスタリングは出力の解釈が難しい。特徴重要度に基づきクラスタを解釈・監査する手法「Cluster LOCO」を提案する。
-
BayLing-Duplex: Native Full-Duplex Speech Dialogue with a Single Autoregressive LLMBayLing-Duplex、単一LLMで全二重の音声対話を実現次世代音声チャットボットに重要な全二重対話を、単一の自己回帰LLMでネイティブに実現するBayLing-Duplexを提案。割り込みや言いよどみなど自然な現象に対応する。
-
Dense Coordinate-List Fine-Tuning Induces a Controllable Interference Surface in Vision-Language Models座標列の微調整がVLMに制御可能な干渉面を生むと報告視覚言語モデル(VLM)を密な座標列の出力に微調整すると視覚接地は向上するが、構造化出力の直列化・反復・終了の仕方も変わる。本論文はこの微調整が制御可能な「干渉面(interference surface)」を誘発することを示す。
-
A Fixed-Point Neural Operator for Size- and Functional-Transferable Hamiltonian Predictionサイズ・汎関数転移可能なハミルトニアン予測の固定点ニューラル演算子Kohn-Shamハミルトニアンを機械学習で予測できれば密度汎関数理論を加速しつつ分子軌道などの観測量も保てる。本論文は系のサイズや汎関数をまたいで転移可能な、固定点ニューラル演算子によるハミルトニアン予測手法を提案する。