開発者ツール B

312 件中 271〜300 件目を表示
  • Hacker News (Front Page) · EN 開発者ツール 抜粋
    Arch Linux Now Believes Malware Incident Under Control: More Than 1,500 Packages
    Arch Linux、1500超パッケージのマルウェア混入は制御下と表明
    Arch Linuxが、1,500を超えるパッケージに影響したマルウェア混入インシデントについて「制御下にある」との見解を示した。パッケージ供給網(サプライチェーン)のセキュリティリスクを改めて浮き彫りにした事案。
    元記事を読む (Hacker News (Front Page)) ↗
  • Simon Willison's Weblog · EN 開発者ツール 抜粋
    Statement on the US government directive to suspend access to Fable 5 and Mythos 5
    Willison、Fable 5/Mythos 5停止指令を「正気でない」と論評
    Anthropic Claude
    米政府が安全保障を理由に、外国籍者によるFable 5・Mythos 5へのアクセスを全面停止する輸出規制指令を出した件について、Simon Willisonが「正気とは思えない」と批判的に論評。指令の異例さと影響を指摘している。
    元記事を読む (Simon Willison's Weblog) ↗
  • Simon Willison's Weblog · EN 新モデル・リリース 抜粋
    OpenAI WebRTC Audio Session, now with document context
    Simon Willison、OpenAI WebRTC音声ツールに文書コンテキスト機能を追加
    GPT OpenAI
    Simon Willisonが、OpenAIのWebRTC realtime audio APIを使う自作の音声会話ツールを更新したと報告。「GPT-5級の推論を備えた初の音声モデル」を謳う新realtimeモデルへの切り替えに対応したほか、文書テキストを貼り付けてその内容についてブラウザ上で音声対話できるdocument context機能を追加した。
    元記事を読む (Simon Willison's Weblog) ↗
  • Microsoft Research Blog · EN 開発者ツール 抜粋
    Ire identifies another LOTUSLITE specimen
    Microsoft、AIエージェントIreがEDR未検出のLOTUSLITE検体を特定
    Microsoft
    Microsoft Researchは、マルウェア解析AIエージェント「Project Ire」が新たなLOTUSLITE検体を特定したと報告。検体をリバースエンジニアリングして意図を解明し、主要EDR製品の多くが検知できない中でLOTUSLITEの特徴を識別した。AIによる自律的なマルウェア解析の実用性を示す事例。
    元記事を読む (Microsoft Research Blog) ↗
  • arXiv cs.CL (Computation and Language) · EN マルチモーダル 抜粋
    Gaze Heads: How VLMs Look at What They Describe
    VLMの「視線ヘッド」発見、注目領域の制御で説明を誘導
    コンピュータビジョン 深層学習 ソフトウェア工学
    視覚言語モデルが画像説明時に、説明中の領域を追跡する少数の注意ヘッド「gaze heads」を持つことを発見。上位約100ヘッドへの介入だけで、モデルの説明対象を任意の領域へ誘導できると示した。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 開発者ツール 抜粋
    Persona-Pruner: Sculpting Lightweight Models for Role-Playing
    Persona-Pruner、ロールプレイ向け軽量モデルを刈り込みで構築
    強化学習
    ロールプレイ用途で大規模言語モデルを軽量化する手法「Persona-Pruner」を提案。ペルソナ仕様に基づきモデルを刈り込み、一貫した役割演技を保ちつつ軽量モデルの生成を目指す。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.LG (Machine Learning) · EN 新モデル・リリース 抜粋
    A Complexity Measure for Active Learning in Multi-group Mean Estimation
    多群平均推定の能動学習に複雑性尺度を提案
    複数グループの平均を推定する能動学習を多腕バンディットとして定式化し、最悪リスクを最小化する予算配分を研究。問題の難しさを測る複雑性尺度を導入する理論研究。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN マルチモーダル 抜粋
    CottonLeafVision: An Explainable and Robust Deep Learning Framework for Cotton Leaf Disease Classification
    綿の葉病害を分類する説明可能で頑健な深層学習「CottonLeafVision」
    深層学習 ニューラルネットワーク 強化学習
    綿花は繊維産業を支える経済的に重要な作物で、葉の病害を正確に検出することが安定生産の鍵となる。本論文は綿の葉の病害分類向けに、説明可能性と頑健性を備えた深層学習フレームワーク「CottonLeafVision」を提案する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.LG (Machine Learning) · EN 推論・効率化 抜粋
    HumP-KD: A Hybrid Uncertainty-Aware Multi-Stage Progressive Knowledge Distillation Framework for Efficient Fire Classification
    HumP-KD、不確実性考慮の蒸留で火災分類を効率化
    機械学習 Meta ニューラルネットワーク Transformer
    リアルタイム火災分類向けに、不確実性を考慮した多段階の漸進的知識蒸留フレームワーク「HumP-KD」を提案。精度と効率を両立する軽量モデルの構築を狙う。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN 新モデル・リリース 抜粋
    Optimal Hidden-Target Learning for Online Inventory Optimization on General Convex Sets
    凸集合上のオンライン在庫最適化に最適な学習法を提示
    在庫の繰り越しで実行可能領域が過去に依存するオンライン在庫最適化を、オンライン凸最適化として扱う。一般の凸集合上で隠れた目標を学習する最適手法を理論的に示す。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.CL (Computation and Language) · EN 新モデル・リリース 抜粋
    AgentSpec: Understanding Embodied Agent Scaffolds Through Controlled Composition
    AgentSpec、エージェント足場を統制的に分解し検証
    AI エージェント 機械学習 強化学習
    推論・記憶・反省・行動などを組み合わせた「足場(scaffold)」型LLMエージェントを、統制された構成で分析するAgentSpecを提案。各構成要素の寄与を切り分けて理解する枠組み。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 新モデル・リリース 抜粋
    Giving AI a Headache: Acoustic Adversarial Attacks to Computer Vision Applications
    音響による敵対的攻撃でコンピュータビジョンを誤動作させる脅威を提示
    コンピュータビジョン 深層学習 強化学習
    自動運転制御など実世界のコンピュータビジョン応用がAIで自動化される中、本論文は音響(acoustic)を用いた敵対的攻撃でCVシステムを誤動作させられることを示し、物理的・音響的な攻撃面の新たな脅威を提示する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 新モデル・リリース 抜粋
    Abstracting Cross-Domain Action Sequences into Interpretable Workflows
    操作ログを解釈可能なワークフローへ抽象化する手法を提案
    深層学習 推論 (Inference) Microsoft 強化学習
    時系列の操作ログはアプリ利用の客観的記録だが、粒度の細かさとノイズのため作業の意味ある洞察を得にくい。本論文はクロスドメインの行動系列を、解釈可能なワークフローへ抽象化する手法を提案する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.LG (Machine Learning) · EN 学習・ファインチューニング 抜粋
    Graph Structured Combinatorial Semi-Bandit with Nonlinear Reward Associations through Separable Signals
    グラフ構造の組合せ半バンディットを分離信号で解く
    ニューラルネットワーク 検索拡張生成 (RAG) 強化学習
    相互接続データから最適構造を特定する組合せ半バンディット問題を、非線形な報酬関係の下で研究。分離可能な信号を用いてサンプリングと計算の効率化を図る。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN 安全性・評価 抜粋
    Which Directions Matter? Sparse Design for Affine Robust Optimization
    アフィンロバスト最適化で重要な不確実性方向を疎に選択
    機械学習 検索拡張生成 (RAG)
    ロバスト最適化で、有限辞書と予算制約で定義される不確実性のうち、モデルがカバーすべき方向を検討。重要な方向を疎に選ぶ設計手法を提案する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 開発者ツール 抜粋
    Listening with Attention: Entropy-Guided Explainability for Transformer-Based Audio Models
    Transformer音声モデルをエントロピー基準で説明可能にする手法
    音声処理 Transformer
    WhisperなどTransformerベースの音声認識(ASR)は高精度だが予測の解釈が難しい。既存の説明可能AI手法は忠実性や時間的精度に欠けると指摘し、エントロピーを手がかりに注意を可視化する説明手法を提案する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 業界導入・応用 抜粋
    When Good Verifiers Go Bad: Self-Improving VLMs Can Regress on New Tasks
    自己改善するVLMが検証器の悪化で新タスク性能を退行させる現象
    ニューラルネットワーク 人間のフィードバックによる強化学習 (RLHF)
    凍結した検証器で候補生成を採点し選好例を作る verifier 駆動の自己DPOは、自己改善型VLMで一般的な手法。本論文は、この設定で検証器が不適切だとモデルが新タスクで性能を退行させ得ること(Good Verifiers Go Bad)を示す。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.CL (Computation and Language) · EN 開発者ツール 抜粋
    Characterizing Cultural Localization in AI-Generated Stories
    AI生成の物語における文化的ローカライズを分析
    検索拡張生成 (RAG)
    AIが文化に根ざした物語をどの程度生成できるかを評価。物語に現れる文化的ローカライズの様態を特徴づけ、生成能力を測る研究。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.LG (Machine Learning) · EN 安全性・評価 抜粋
    Neither Parallel Nor Sequential: How DiffusionGemma Actually Commits Tokens
    DiffusionGemmaの実際のトークン確定順序を計測
    深層学習 Mixture of Experts (MoE)
    拡散型言語モデルは並列・非自己回帰とされるが、実際の確定順序はほぼ計測されていない。DiffusionGemmaを計装し、並列でも逐次でもない実態を明らかにする。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 推論・効率化 抜粋
    Moonlight in Latent Space: Chirality and Structural Correspondence Between Beethoven's Op. 27 No. 2 and Machine Learning Mechanisms
    ベートーヴェン「月光」と機械学習機構の構造的対応を分析
    埋め込み (Embeddings) 機械学習 ニューラルネットワーク 自然言語処理 (NLP) 強化学習
    ベートーヴェンの「月光ソナタ」(Op.27 No.2)の三つの楽章が、比喩ではなく構造的対応として三種の異なる機械学習アーキテクチャを体現していることを、計算分析を通じて示す学際的研究。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 新モデル・リリース 抜粋
    Expert-Driven Survival Machines: Improving Stratification and Interpretability in Multiple Clinical Cohorts
    臨床コホートの生存予測を層別化・解釈可能にする「Survival Machines」
    Mixture of Experts (MoE) ニューラルネットワーク 強化学習
    生存予測は医療提供者や臨床研究で中心的な役割を持つ。本論文は専門知識を取り込んだ「Expert-Driven Survival Machines」により、複数の臨床コホートでリスク層別化と解釈可能性を改善する手法を提案する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 学習・ファインチューニング 抜粋
    A Comparative Study of Deep Learning Architectures for Multi-Horizon Behavioural Forecasting for Mobile Health
    モバイルヘルスの多期間行動予測で深層学習を比較検証
    深層学習 ファインチューニング 機械学習 ニューラルネットワーク Transformer
    ウェアラブルやスマホが生む行動時系列は予防的な健康介入を支え得るが、近年の予測アーキテクチャの体系的比較は不足している。本論文はモバイルヘルス向けに多期間(multi-horizon)行動予測の深層学習アーキテクチャを比較研究する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.CL (Computation and Language) · EN 新モデル・リリース 抜粋
    LoSoNA: A Benchmark for Local Social Norm Adaptation in Group Conversations
    LoSoNA、集団会話の局所規範への適応を評価する基準
    AI エージェント Claude Gemini ソフトウェア工学
    オンライン集団会話には明示されない局所的な会話規範がある。LLMエージェントがそれを認識し適応できるかを測るベンチマーク「LoSoNA」を提案する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN マルチモーダル 抜粋
    AudioDER: A Deduplication-Enhanced Reasoning Dataset for Post-Training Large Audio-Language Models
    音声言語モデルの事後学習向け推論データセット「AudioDER」
    ニューラルネットワーク 検索拡張生成 (RAG) 強化学習 ソフトウェア工学 音声処理
    大規模音声言語モデル(LALM)は音声理解で高性能だが依然課題を残す。本論文は重複除去で強化した推論用データセット「AudioDER」を提案し、LALMの事後学習(post-training)による推論能力向上を狙う。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 安全性・評価 抜粋
    When Errors Become Narratives: A Longitudinal Taxonomy of Silent Failures in a Production LLM Agent Runtime
    本番LLMエージェント runtime の「静かな障害」を縦断分類
    Meta
    LLMエージェントはジョブ実行・ツール呼び出し・記憶保持・結果送信を担う長寿命の自律 runtime として稼働しつつある。本論文はある永続システムを縦断的に調べ、見えにくい「静かな障害(silent failures)」の分類体系を提示する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.CL (Computation and Language) · EN 安全性・評価 抜粋
    Persuasion Index: A Theory-Guided Framework for Persuasion Analysis
    Persuasion Index、説得の理論枠組みで修辞を分析
    情報操作の検出やAI安全、公衆衛生の発信に重要な説得的修辞の手がかりを同定。理論に基づく分析枠組み「Persuasion Index」を提案する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 安全性・評価 抜粋
    StreamMemBench: Streaming Evaluation of Agent Memory for Future-Oriented Assistance
    未来志向支援のためのエージェント記憶を評価する「StreamMemBench」
    個人エージェントの記憶は、蓄積情報と過去の対話を未来志向の支援へ転換することが役割となる。本論文は観測やユーザ操作から得られる手がかりを活かす能力を、ストリーミング評価するベンチマーク「StreamMemBench」を提案する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 新モデル・リリース 抜粋
    Regional Climate Model Emulation with Diffusion Approaches: What is the Added Value of Generative Machine Learning?
    拡散モデルによる地域気候モデルのエミュレーションの付加価値を検証
    深層学習 機械学習 ニューラルネットワーク 強化学習
    エミュレータは地域気候モデル(RCM)の力学的ダウンスケーリングを安価に再現する手段。本論文は拡散(diffusion)による生成的機械学習が、GCM予測子からRCM相当の高解像度場を生む際に持つ付加価値を検証する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.LG (Machine Learning) · EN 安全性・評価 抜粋
    CANN-EUCLID: unsupervised constitutive artificial neural network model discovery from full-field data
    CANN-EUCLID、全視野データから構成則を教師なし発見
    ニューラルネットワーク
    解釈可能な材料モデルを発見する構成則ニューラルネット(CANN)を、見かけの応力ひずみに頼らず全視野データから教師なしで学習。応力監督なしのモデル発見を実現する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN 新モデル・リリース 抜粋
    ORCA: A Platform for Open-Source Dexterity Research
    ORCA、オープンソースの器用さ研究プラットフォーム
    ニューラルネットワーク 検索拡張生成 (RAG) ロボティクス
    ロボット操作研究で多用される二指グリッパは形状の制約で能力が限られる。より器用な操作の研究を支えるオープンソースのプラットフォーム「ORCA」を提案する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗