開発者ツール B

312 件中 91〜120 件目を表示
  • arXiv cs.LG (Machine Learning) · EN 新モデル・リリース 抜粋
    SCAN: Enhance Time Series Anomaly Detection via Multi-Scale Neighborhood-Centered Clustering
    SCAN、多スケール近傍クラスタリングで時系列異常検知を強化
    強化学習
    時系列異常検知は多くの実応用で重要で、再構成ベース手法が主流だが、過度な一般化により異常まで正常に復元してしまう弱点がある。本研究は多スケールの近傍中心クラスタリングを用いる「SCAN」を提案し、再構成手法の過一般化を抑えて検知性能を高める。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN 新モデル・リリース 抜粋
    Transformer Geometry Observatory TGO-I: Spectral Geometry Observatory
    TGO-I、スペクトル幾何で Vision Transformer の内部構造を解析
    コンピュータビジョン 強化学習 Transformer
    Vision Transformer(ViT)は広く普及し多くの画像課題で成功している一方、その次元的・表現的な幾何構造の基礎的理解は乏しい。本研究は「Transformer Geometry Observatory(TGO-I)」を提案し、スペクトル幾何の観点から ViT の表現空間を観測・解析する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 開発者ツール 抜粋
    A Taxonomy of Mental Health and Technology Needs for Alzheimer's and Dementia Caregivers
    認知症介護者のメンタルヘルスと技術ニーズの分類体系を提示
    深層学習 強化学習
    アルツハイマー病や関連認知症(AD/ADRD)の人を介護する家族は、世界の長期ケアの基盤を支えている。2023 年には米国で 1,100 万人超が無償介護を担った。本研究は介護者のメンタルヘルスと技術的ニーズを体系化した分類を提示し、支援設計の指針を示す。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 学習・ファインチューニング 抜粋
    STARE: Surprisal-Guided Token-Level Advantage Reweighting for Policy Entropy Stability
    STARE、サプライザル基準の再重み付けで方策エントロピーを安定化
    アルゴリズム・理論 検索拡張生成 (RAG) 強化学習
    GRPO のような検証可能報酬による強化学習は LLM の複雑推論の主流だが、方策エントロピーの崩壊に陥りやすい。本研究は驚き(サプライザル)に基づきトークン単位でアドバンテージを再重み付けする「STARE」を提案し、エントロピーの安定化と探索性の維持を図る。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.LG (Machine Learning) · EN インフラ・ハードウェア 抜粋
    A Human-in-the-Loop Bayesian Optimization Framework for Constraint-Aware Bioprocess Development
    人間参加型ベイズ最適化で制約を考慮したバイオプロセス開発
    強化学習
    本研究は、人間参加型(HitL)ベイズ最適化の枠組み Pareto Front Guided Sampling(PFGS)を拡張する。ガウス過程の代理モデルから得る量を目的関数として再定式化し、制約を考慮したバイオプロセス開発を支援。専門家の知見を取り入れつつ効率的に最適条件を探索する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 学習・ファインチューニング 抜粋
    Mechanism-Guided Selective Unlearning for RLVR-Induced Reasoning
    MAST、RLVR 由来の推論を巻き添えを抑えて選択的に忘却
    ファインチューニング 強化学習
    本研究は、検証可能報酬による強化学習(RLVR)で獲得した推論を選択的に巻き戻す手法「MAST(Mechanism-Aligned Selective Targeting)」を提案する。機構に整合した狙い撃ちにより、全パラメータ更新に比べて巻き添えの被害を大幅に抑えつつ不要な推論を忘却させる。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.LG (Machine Learning) · EN 開発者ツール 抜粋
    Generalised Eigenvalue Geometry of Semantic Adversarial Attacks
    意味的敵対攻撃を一般化固有値の幾何で解析、金融分類器を検証
    アルゴリズム・理論 埋め込み (Embeddings) ニューラルネットワーク
    近年の研究は、意味的に等価な言い換えが金融の感情分類器を欺けることを示した。言い換えは強力な参照埋め込みでは原文に近いままなのに誤分類を招く。本研究は一般化固有値の幾何の観点から意味的敵対攻撃を解析し、脆弱性の構造を明らかにする。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 新モデル・リリース 抜粋
    The More the Merrier: Combining Properties for ABox Abduction under Repair Semantics for ELbot
    修復意味論下の ABox アブダクション、性質併合で説明を強化
    アブダクションは、知識ベースに加えれば欠落した含意を成り立たせる仮説を与えて説明する中心的手法だ。本研究は記述論理 EL 系の修復意味論の下での ABox アブダクションを扱い、複数の性質を組み合わせることでより良い説明仮説を導く手法を提案する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.LG (Machine Learning) · EN 開発者ツール 抜粋
    Learning to Annotate Delayed and False AEB Events: A Practical System for Extreme Class Imbalance and Asymmetric Label Noise
    遅延・誤作動 AEB 事象を学習注釈、極端な不均衡に対応する実用系
    AI エージェント ニューラルネットワーク 強化学習
    自動緊急ブレーキ(AEB)の最適化には、まれだが重要な遅延・誤作動トリガーを正確に注釈した実走行データが要る。本研究は極端なクラス不均衡と非対称なラベルに対応し、これら稀少事象を学習的に注釈する実用的システムを提案。AEB の弱点露見と改善を支える。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • Hugging Face Blog · EN 開発者ツール 抜粋
    MolmoMotion: Language-guided 3D motion forecasting
    MolmoMotion、言語ガイドによる3Dモーション予測手法を公開
    Allen Institute for AI(AI2)がHugging Faceブログで、自然言語の指示に基づいて3次元の動きを予測する手法「MolmoMotion」を紹介した。言語ガイドによる3Dモーション予測のアプローチを示す内容。本要約はraw_excerpt未取得のためタイトルベースの中立要約で、手法の詳細・性能数値は記事ベース・第三者検証は未確認。
    元記事を読む (Hugging Face Blog) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 開発者ツール 抜粋
    Compute Efficiency and Serial Runtime Tradeoffs for Stochastic Momentum Methods
    確率的モメンタム法の計算効率と直列実行時間のトレードオフ
    深層学習 強化学習
    ヘビーボールや Nesterov モメンタム、加速 SGD(ASGD)などの確率的モメンタム法は現代の学習で広く使われるが、その確率的な利点は二つの異なる量に依存する。本研究は計算効率と直列実行時間(シリアルランタイム)の間のトレードオフを解析し、実用的な指針を示す。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 学習・ファインチューニング 抜粋
    User as Engram: Internalizing Per-User Memory as Local Parametric Edits
    ユーザー記憶を局所的なパラメータ編集として内在化する手法
    検索拡張生成 (RAG) ソフトウェア工学
    言語モデルの個人記憶は、内容と推論能力という二つの問題からなる。脳は両者を分離し、各エピソードを海馬の疎で局所的なエングラムに、技能を緩やかな新皮質に保つ。本研究はこれに倣い、ユーザーごとの記憶を局所的なパラメータ編集として内在化する手法を提案する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.LG (Machine Learning) · EN 推論・効率化 抜粋
    The Reward Was in Your Data All Along: Correcting Flow Matching with Discriminator-Guided RL
    識別器誘導 RL で Flow Matching を補正、報酬はデータ内に
    推論 (Inference) ニューラルネットワーク 強化学習
    スコアマッチングやフローマッチングのモデルは、主観的な選好への整合と、意外にも特定の性質の回復のために、選好ベース強化学習に頼ることが多い。本研究は「報酬は最初からデータの中にあった」とし、識別器(discriminator)誘導の RL でフローマッチングを補正する手法を提案する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN 安全性・評価 抜粋
    Complementary Attention Head Pruning for Efficient Transformers
    相補的な注意ヘッド剪定で Transformer を効率化
    自然言語処理 (NLP) 強化学習 Transformer
    Transformer モデルの成功は構造的スケーリングに支えられるが、パラメータが増大し資源制約下での展開が難しくなる。本研究は相補的(complementary)な注意ヘッドの剪定(プルーニング)手法を提案し、重複の少ないヘッドを選んで取り除くことで精度を保ちつつ効率化する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN 開発者ツール 抜粋
    OpenAnt: LLM-Powered Vulnerability Discovery Through Code Decomposition, Adversarial Verification, and Dynamic Testing
    OpenAnt、コード分解と動的検証で LLM が脆弱性を発見
    大規模コードベースの脆弱性自動発見は難しく、静的解析は誤検知が多く、ファジングなど動的手法は網羅性に課題がある。本研究は LLM を活用し、コード分解・敵対的検証・動的テストを組み合わせる「OpenAnt」を提案。誤検知を抑えつつ実在の脆弱性発見を狙う。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN 学習・ファインチューニング 抜粋
    On Local Population-Risk Certificates
    現モデル周りの母集団リスク増分に局所証明書を与える理論
    人間のフィードバックによる強化学習 (RLHF)
    本論文は、現在のモデルの近傍における母集団リスク(population risk)の増分に対する局所的な証明書(certificate)を構築する。局所的な候補集合に対し、両側の信頼限界としてリスク変化を保証する枠組みを示し、モデル更新の安全性を理論的に裏付ける。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN マルチモーダル 抜粋
    ChronoSurv: A Clinical Pathway-Guided Graph Framework for Multimodal Survival Analysis
    ChronoSurv、臨床経路を導入したグラフで多モーダル生存解析
    ニューラルネットワーク
    頭頸部がんの個別化治療には正確な生存予測が不可欠だが、多モーダルな臨床データは異種で高次元なため難しい。本研究は臨床経路(クリニカルパス)に導かれるグラフ枠組み「ChronoSurv」を提案し、多モーダル情報を統合して生存予測の精度を高める。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.CL (Computation and Language) · EN 安全性・評価 抜粋
    Urdu Katib Handwritten Dataset: A Historical Document Dataset for Offline Urdu Handwritten Text Recognition with CRNN-Based Baseline Evaluation
    Urdu Katib、歴史文書のウルドゥー語手書き認識データセットを公開
    ニューラルネットワーク 検索拡張生成 (RAG)
    手書き文字認識(HTR)は本質的に難しく、続け字(筆記体)ではさらに複雑になる。本研究は、オフラインのウルドゥー語手書き認識のための歴史文書データセット「Urdu Katib」を構築した。続け字スクリプトの認識研究を進める基盤データを提供する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.LG (Machine Learning) · EN 新モデル・リリース 抜粋
    INDEQS: Informed Neural controlled Differential EQuationS
    INDEQS、情報付き Neural CDE で時系列予測を強化
    ニューラルネットワーク 強化学習
    ニューラル制御微分方程式(NCDE)は時系列予測の強力な連続時間枠組みだが、標準的なグラフ拡張は空間構造の学習に課題がある。本研究は情報を取り込んだ「INDEQS(Informed Neural controlled Differential Equations)」を提案し、構造を捉えて予測性能を高める。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN 開発者ツール 抜粋
    Giskard : Byzantine Robust and Confidential Aggregation for Large-Scale Decentralized Learning
    Giskard、大規模分散学習でビザンチン耐性と秘匿集約を両立
    深層学習 機械学習
    分散学習で秘匿性(confidentiality)とビザンチン的な悪意挙動の両方に同時対処するのは難しい。本研究は「Giskard」を提案し、各クライアントがモデルを学習する大規模分散学習において、ビザンチン耐性を備えた秘匿集約(aggregation)を実現する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.CL (Computation and Language) · EN インフラ・ハードウェア 抜粋
    Written by AI, Managed by AI: Semantic Space Control and Index Sickness Elimination Across 391 Consecutive Sessions
    391 連続セッションで意味空間を制御し概念ドリフトを抑制
    ニューラルネットワーク 強化学習
    長期にわたる LLM 協働の概念ドリフトに対し、より多くの形式的制約と引き換えに出力の信頼性を高めるのが通説だ。本研究は 391 回の連続セッションを通じ、意味空間(semantic space)の制御と「インデックス病」の解消により、AI が執筆と管理を担う長期協働の安定性を検証する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 開発者ツール 抜粋
    Analysing drivers and interdependencies in European electricity markets using XAI
    XAI で欧州電力市場の駆動要因と相互依存を分析
    ニューラルネットワーク 強化学習
    電力市場は強い非線形性、高次元の相互作用、地域間の相互依存の高まりを特徴とする複雑系だ。深層ニューラルネットは予測力を示すが不透明でもある。本研究は説明可能 AI(XAI)を用い、欧州電力市場の価格駆動要因と地域間の相互依存関係を解析する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.LG (Machine Learning) · EN 推論・効率化 抜粋
    Wasserstein Policy Learning for Distributional Outcomes
    分布的アウトカム向けの Wasserstein 方策学習を提案
    深層学習 推論 (Inference)
    オフライン方策学習は因果推論で注目され、共変量から治療への写像(個別化治療規則)として経験的な成果を最大化する方策を学ぶ。本研究は分布的アウトカム(distributional outcomes)を対象に、Wasserstein 距離に基づく方策学習を提案し、結果の分布全体を考慮した意思決定を可能にする。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN エージェント・ツール使用 抜粋
    Towards an Agent-First Web: Redesigning the Web for AI Agents
    エージェント優先の Web へ、AI 向けに Web を再設計する提案
    AI エージェント Meta 強化学習
    World Wide Web は「コンテンツの主要な消費者は人間」という 30 年来の前提の上に築かれ、アクセスモデルの隅々に人間中心の設計が染み込んでいる。本研究は AI エージェントを第一に据えた「エージェント優先 Web」への再設計を提案し、エージェント時代の Web 基盤を構想する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.LG (Machine Learning) · EN 新モデル・リリース 抜粋
    Structure Over Nonlinearity: Explicit Interaction Architectures for Dynamical Learning
    非線形性より構造、力学学習に明示的な相互作用構造を導入
    力学系の学習構造の多くは汎用の非線形関数近似に頼り、構造化された挙動を捉えるのに高いモデル複雑度を要しがちだ。本研究は非線形性よりも構造を重視し、変数間の相互作用を明示的に組み込んだアーキテクチャを提案。少ない複雑度で力学系を効率的に学習する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN 新モデル・リリース 抜粋
    Context-Aware Optimization of Follow-Up Intervals for Type 2 Diabetes Care Using Markov Decision Processes
    マルコフ決定過程で 2 型糖尿病の最適な再診間隔を文脈最適化
    強化学習
    慢性疾患の管理は、進行と制御を確認する定期的な患者-医療者間のやり取りに依存する。2 型糖尿病では現行ガイドラインが画一的な再診間隔を定める。本研究はマルコフ決定過程(MDP)を用い、患者の状況に応じて再診(フォローアップ)間隔を文脈的に最適化する手法を示す。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN 開発者ツール 抜粋
    Model-Free Reinforcement Learning Control for Resilient Cyber-Physical Systems
    サイバー攻撃に強い制御へ、モデルフリー強化学習を比較検証
    強化学習
    本論文は、偽データ注入やサービス拒否(DoS)などのサイバー攻撃下にある非線形システムで、モデルフリー制御器の性能を比較する。4 種類の RL 報酬を精度・コスト・頑健性の観点で分析し、サイバー物理システムを強靭(レジリエント)にする制御設計の指針を示す。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.CL (Computation and Language) · EN 開発者ツール 抜粋
    Which Sections of a Research Paper Best Reveal Its Research Methods? Evidence from Library and Information Science
    論文のどの章が研究手法を最もよく示すか、図書館情報学で検証
    深層学習 Meta ニューラルネットワーク
    研究手法は学術論文の知識的貢献を担う重要な要素で、その多ラベル自動分類は知識サービスを支え得る。本研究は図書館情報学分野を題材に、論文のどの章(セクション)が研究手法を最もよく明らかにするかを実証的に検証し、自動分類に有効な手がかりを示す。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 開発者ツール 抜粋
    RODS: Reward-Driven Online Data Synthesis for Multi-Turn Tool-Use Agents
    RODS、報酬駆動のオンラインデータ合成で多ターンツール利用を強化
    AI エージェント 推論 (Inference) 強化学習
    多ターンのツール利用 RL は、静的データセットで有益なサンプルが急速に枯渇することが律速となる。本研究は GRPO の勾配信号が特定タスクに集中する観察に基づき、報酬駆動でオンラインにデータを合成する「RODS」を提案。学習に効くサンプルを継続的に供給する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.LG (Machine Learning) · EN 安全性・評価 抜粋
    Adaptive Speech-to-Spike Encoding for Spiking Neural Networks
    スパイキング NN 向けに適応的な音声-スパイク符号化を提案
    深層学習 Google ニューラルネットワーク 音声処理
    連続的な音響信号と離散的なイベント駆動処理の不一致は、ニューロモルフィック音声処理の根本的なボトルネックだ。現行システムは固定のスパイクエンコーダに頼り、後段に負担を強いる。本研究は入力に応じて適応する音声-スパイク符号化を提案し、スパイキングニューラルネットの性能を高める。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗