マルチモーダル A
101 件中 91〜101 件目を表示
-
CottonLeafVision: An Explainable and Robust Deep Learning Framework for Cotton Leaf Disease Classification綿の葉病害を分類する説明可能で頑健な深層学習「CottonLeafVision」綿花は繊維産業を支える経済的に重要な作物で、葉の病害を正確に検出することが安定生産の鍵となる。本論文は綿の葉の病害分類向けに、説明可能性と頑健性を備えた深層学習フレームワーク「CottonLeafVision」を提案する。
-
HumP-KD: A Hybrid Uncertainty-Aware Multi-Stage Progressive Knowledge Distillation Framework for Efficient Fire ClassificationHumP-KD、不確実性考慮の蒸留で火災分類を効率化リアルタイム火災分類向けに、不確実性を考慮した多段階の漸進的知識蒸留フレームワーク「HumP-KD」を提案。精度と効率を両立する軽量モデルの構築を狙う。
-
Giving AI a Headache: Acoustic Adversarial Attacks to Computer Vision Applications音響による敵対的攻撃でコンピュータビジョンを誤動作させる脅威を提示自動運転制御など実世界のコンピュータビジョン応用がAIで自動化される中、本論文は音響(acoustic)を用いた敵対的攻撃でCVシステムを誤動作させられることを示し、物理的・音響的な攻撃面の新たな脅威を提示する。
-
Regulating the Machine Contributor: Governance and Policy Alignment in Open SourceオープンソースへのAIエージェント貢献を統治する枠組みを論じるAI支援開発は行単位の補完から、計画・編集・PR提出まで限定的監督で行うエージェントへ進化した。一方OSSは人手のプロセスで発展してきた。本論文はこの「機械の貢献者」を統治・政策面で整合させるガバナンスを論じる。
-
AudioDER: A Deduplication-Enhanced Reasoning Dataset for Post-Training Large Audio-Language Models音声言語モデルの事後学習向け推論データセット「AudioDER」大規模音声言語モデル(LALM)は音声理解で高性能だが依然課題を残す。本論文は重複除去で強化した推論用データセット「AudioDER」を提案し、LALMの事後学習(post-training)による推論能力向上を狙う。
-
Sensitivity Shaping for Latent Modeling生成動力学モデルの分布外遷移を検知する「Sensitivity Shaping」生成的な動力学モデルはロボット系の計画を可能にするが、安全な運用には方策が誘発する分布外(OOD)遷移の検知が要る。本論文は感度を整形(Sensitivity Shaping)する潜在モデリング手法でOOD遷移をより確実に検知する。
-
NEST3D: A High-Resolution Multimodal Dataset of Sociable Weaver Tree NestsNEST3D、シャカイハタオリの巣の高解像度マルチモーダルデータシャカイハタオリの巣は微気候を提供する複雑な生態構造。その高解像度なマルチモーダルデータセット「NEST3D」を公開し、生態・構造研究を支援する。
-
Deploy Long-Context Reasoning and Agentic Workflows with MiniMax M3 on NVIDIA Accelerated InfrastructureNVIDIA、MiniMax M3の長文脈推論とagenticワークフロー展開手法を解説NVIDIAが開発者ブログで、MiniMax M3をNVIDIAアクセラレーテッドインフラ上に展開し、長文脈推論やagenticワークフローを実行する手法を解説した。テキストや画像などで分断されがちな企業AIパイプラインの統合を狙いとし、RAGを含む生成AI活用を視野に入れた内容となっている。
-
Dense Coordinate-List Fine-Tuning Induces a Controllable Interference Surface in Vision-Language Models座標列の微調整がVLMに制御可能な干渉面を生むと報告視覚言語モデル(VLM)を密な座標列の出力に微調整すると視覚接地は向上するが、構造化出力の直列化・反復・終了の仕方も変わる。本論文はこの微調整が制御可能な「干渉面(interference surface)」を誘発することを示す。
-
From Chatbot to Digital Colleague: The Paradigm Shift Toward Persistent Autonomous AILLMが「チャットボット」から永続自律AIへ移行する転換を概念化LLMは会話生成器から、推論・行動・記憶・自己改善を備えた統合AIへと根本的に変化しつつある。本論文はこの移行を「チャットボットからデジタルな同僚へ」という持続的自律AIへのパラダイムシフトとして概念化する。
-
A Fixed-Point Neural Operator for Size- and Functional-Transferable Hamiltonian Predictionサイズ・汎関数転移可能なハミルトニアン予測の固定点ニューラル演算子Kohn-Shamハミルトニアンを機械学習で予測できれば密度汎関数理論を加速しつつ分子軌道などの観測量も保てる。本論文は系のサイズや汎関数をまたいで転移可能な、固定点ニューラル演算子によるハミルトニアン予測手法を提案する。