マルチモーダル A

101 件中 91〜101 件目を表示
  • arXiv cs.AI (Artificial Intelligence) · EN マルチモーダル 抜粋
    CottonLeafVision: An Explainable and Robust Deep Learning Framework for Cotton Leaf Disease Classification
    綿の葉病害を分類する説明可能で頑健な深層学習「CottonLeafVision」
    深層学習 ニューラルネットワーク 強化学習
    綿花は繊維産業を支える経済的に重要な作物で、葉の病害を正確に検出することが安定生産の鍵となる。本論文は綿の葉の病害分類向けに、説明可能性と頑健性を備えた深層学習フレームワーク「CottonLeafVision」を提案する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.LG (Machine Learning) · EN 推論・効率化 抜粋
    HumP-KD: A Hybrid Uncertainty-Aware Multi-Stage Progressive Knowledge Distillation Framework for Efficient Fire Classification
    HumP-KD、不確実性考慮の蒸留で火災分類を効率化
    機械学習 Meta ニューラルネットワーク Transformer
    リアルタイム火災分類向けに、不確実性を考慮した多段階の漸進的知識蒸留フレームワーク「HumP-KD」を提案。精度と効率を両立する軽量モデルの構築を狙う。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 新モデル・リリース 抜粋
    Giving AI a Headache: Acoustic Adversarial Attacks to Computer Vision Applications
    音響による敵対的攻撃でコンピュータビジョンを誤動作させる脅威を提示
    コンピュータビジョン 深層学習 強化学習
    自動運転制御など実世界のコンピュータビジョン応用がAIで自動化される中、本論文は音響(acoustic)を用いた敵対的攻撃でCVシステムを誤動作させられることを示し、物理的・音響的な攻撃面の新たな脅威を提示する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 政策・規制 抜粋
    Regulating the Machine Contributor: Governance and Policy Alignment in Open Source
    オープンソースへのAIエージェント貢献を統治する枠組みを論じる
    AI エージェント 検索拡張生成 (RAG) ソフトウェア工学
    AI支援開発は行単位の補完から、計画・編集・PR提出まで限定的監督で行うエージェントへ進化した。一方OSSは人手のプロセスで発展してきた。本論文はこの「機械の貢献者」を統治・政策面で整合させるガバナンスを論じる。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN マルチモーダル 抜粋
    AudioDER: A Deduplication-Enhanced Reasoning Dataset for Post-Training Large Audio-Language Models
    音声言語モデルの事後学習向け推論データセット「AudioDER」
    ニューラルネットワーク 検索拡張生成 (RAG) 強化学習 ソフトウェア工学 音声処理
    大規模音声言語モデル(LALM)は音声理解で高性能だが依然課題を残す。本論文は重複除去で強化した推論用データセット「AudioDER」を提案し、LALMの事後学習(post-training)による推論能力向上を狙う。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 新モデル・リリース 抜粋
    Sensitivity Shaping for Latent Modeling
    生成動力学モデルの分布外遷移を検知する「Sensitivity Shaping」
    ニューラルネットワーク
    生成的な動力学モデルはロボット系の計画を可能にするが、安全な運用には方策が誘発する分布外(OOD)遷移の検知が要る。本論文は感度を整形(Sensitivity Shaping)する潜在モデリング手法でOOD遷移をより確実に検知する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.LG (Machine Learning) · EN 政策・規制 抜粋
    NEST3D: A High-Resolution Multimodal Dataset of Sociable Weaver Tree Nests
    NEST3D、シャカイハタオリの巣の高解像度マルチモーダルデータ
    アルゴリズム・理論 深層学習 ニューラルネットワーク 強化学習 Transformer
    シャカイハタオリの巣は微気候を提供する複雑な生態構造。その高解像度なマルチモーダルデータセット「NEST3D」を公開し、生態・構造研究を支援する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • NVIDIA Developer Blog · EN 業界導入・応用 抜粋
    Deploy Long-Context Reasoning and Agentic Workflows with MiniMax M3 on NVIDIA Accelerated Infrastructure
    NVIDIA、MiniMax M3の長文脈推論とagenticワークフロー展開手法を解説
    生成 AI NVIDIA 検索拡張生成 (RAG)
    NVIDIAが開発者ブログで、MiniMax M3をNVIDIAアクセラレーテッドインフラ上に展開し、長文脈推論やagenticワークフローを実行する手法を解説した。テキストや画像などで分断されがちな企業AIパイプラインの統合を狙いとし、RAGを含む生成AI活用を視野に入れた内容となっている。
    元記事を読む (NVIDIA Developer Blog) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 学習・ファインチューニング 抜粋
    Dense Coordinate-List Fine-Tuning Induces a Controllable Interference Surface in Vision-Language Models
    座標列の微調整がVLMに制御可能な干渉面を生むと報告
    コンピュータビジョン ファインチューニング 人間のフィードバックによる強化学習 (RLHF) ソフトウェア工学
    視覚言語モデル(VLM)を密な座標列の出力に微調整すると視覚接地は向上するが、構造化出力の直列化・反復・終了の仕方も変わる。本論文はこの微調整が制御可能な「干渉面(interference surface)」を誘発することを示す。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 安全性・評価 抜粋
    From Chatbot to Digital Colleague: The Paradigm Shift Toward Persistent Autonomous AI
    LLMが「チャットボット」から永続自律AIへ移行する転換を概念化
    AI エージェント 推論 (Inference) ニューラルネットワーク 検索拡張生成 (RAG) ソフトウェア工学
    LLMは会話生成器から、推論・行動・記憶・自己改善を備えた統合AIへと根本的に変化しつつある。本論文はこの移行を「チャットボットからデジタルな同僚へ」という持続的自律AIへのパラダイムシフトとして概念化する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 学習・ファインチューニング 抜粋
    A Fixed-Point Neural Operator for Size- and Functional-Transferable Hamiltonian Prediction
    サイズ・汎関数転移可能なハミルトニアン予測の固定点ニューラル演算子
    ファインチューニング 推論 (Inference) 機械学習 ニューラルネットワーク
    Kohn-Shamハミルトニアンを機械学習で予測できれば密度汎関数理論を加速しつつ分子軌道などの観測量も保てる。本論文は系のサイズや汎関数をまたいで転移可能な、固定点ニューラル演算子によるハミルトニアン予測手法を提案する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗