開発者ツール B
312 件中 271〜300 件目を表示
-
Arch Linux Now Believes Malware Incident Under Control: More Than 1,500 PackagesArch Linux、1500超パッケージのマルウェア混入は制御下と表明Arch Linuxが、1,500を超えるパッケージに影響したマルウェア混入インシデントについて「制御下にある」との見解を示した。パッケージ供給網(サプライチェーン)のセキュリティリスクを改めて浮き彫りにした事案。
-
Statement on the US government directive to suspend access to Fable 5 and Mythos 5Willison、Fable 5/Mythos 5停止指令を「正気でない」と論評米政府が安全保障を理由に、外国籍者によるFable 5・Mythos 5へのアクセスを全面停止する輸出規制指令を出した件について、Simon Willisonが「正気とは思えない」と批判的に論評。指令の異例さと影響を指摘している。
-
OpenAI WebRTC Audio Session, now with document contextSimon Willison、OpenAI WebRTC音声ツールに文書コンテキスト機能を追加Simon Willisonが、OpenAIのWebRTC realtime audio APIを使う自作の音声会話ツールを更新したと報告。「GPT-5級の推論を備えた初の音声モデル」を謳う新realtimeモデルへの切り替えに対応したほか、文書テキストを貼り付けてその内容についてブラウザ上で音声対話できるdocument context機能を追加した。
-
Ire identifies another LOTUSLITE specimenMicrosoft、AIエージェントIreがEDR未検出のLOTUSLITE検体を特定Microsoft Researchは、マルウェア解析AIエージェント「Project Ire」が新たなLOTUSLITE検体を特定したと報告。検体をリバースエンジニアリングして意図を解明し、主要EDR製品の多くが検知できない中でLOTUSLITEの特徴を識別した。AIによる自律的なマルウェア解析の実用性を示す事例。
-
Gaze Heads: How VLMs Look at What They DescribeVLMの「視線ヘッド」発見、注目領域の制御で説明を誘導視覚言語モデルが画像説明時に、説明中の領域を追跡する少数の注意ヘッド「gaze heads」を持つことを発見。上位約100ヘッドへの介入だけで、モデルの説明対象を任意の領域へ誘導できると示した。
-
Persona-Pruner: Sculpting Lightweight Models for Role-PlayingPersona-Pruner、ロールプレイ向け軽量モデルを刈り込みで構築ロールプレイ用途で大規模言語モデルを軽量化する手法「Persona-Pruner」を提案。ペルソナ仕様に基づきモデルを刈り込み、一貫した役割演技を保ちつつ軽量モデルの生成を目指す。
-
A Complexity Measure for Active Learning in Multi-group Mean Estimation多群平均推定の能動学習に複雑性尺度を提案複数グループの平均を推定する能動学習を多腕バンディットとして定式化し、最悪リスクを最小化する予算配分を研究。問題の難しさを測る複雑性尺度を導入する理論研究。
-
CottonLeafVision: An Explainable and Robust Deep Learning Framework for Cotton Leaf Disease Classification綿の葉病害を分類する説明可能で頑健な深層学習「CottonLeafVision」綿花は繊維産業を支える経済的に重要な作物で、葉の病害を正確に検出することが安定生産の鍵となる。本論文は綿の葉の病害分類向けに、説明可能性と頑健性を備えた深層学習フレームワーク「CottonLeafVision」を提案する。
-
HumP-KD: A Hybrid Uncertainty-Aware Multi-Stage Progressive Knowledge Distillation Framework for Efficient Fire ClassificationHumP-KD、不確実性考慮の蒸留で火災分類を効率化リアルタイム火災分類向けに、不確実性を考慮した多段階の漸進的知識蒸留フレームワーク「HumP-KD」を提案。精度と効率を両立する軽量モデルの構築を狙う。
-
Optimal Hidden-Target Learning for Online Inventory Optimization on General Convex Sets凸集合上のオンライン在庫最適化に最適な学習法を提示在庫の繰り越しで実行可能領域が過去に依存するオンライン在庫最適化を、オンライン凸最適化として扱う。一般の凸集合上で隠れた目標を学習する最適手法を理論的に示す。
-
AgentSpec: Understanding Embodied Agent Scaffolds Through Controlled CompositionAgentSpec、エージェント足場を統制的に分解し検証推論・記憶・反省・行動などを組み合わせた「足場(scaffold)」型LLMエージェントを、統制された構成で分析するAgentSpecを提案。各構成要素の寄与を切り分けて理解する枠組み。
-
Giving AI a Headache: Acoustic Adversarial Attacks to Computer Vision Applications音響による敵対的攻撃でコンピュータビジョンを誤動作させる脅威を提示自動運転制御など実世界のコンピュータビジョン応用がAIで自動化される中、本論文は音響(acoustic)を用いた敵対的攻撃でCVシステムを誤動作させられることを示し、物理的・音響的な攻撃面の新たな脅威を提示する。
-
Abstracting Cross-Domain Action Sequences into Interpretable Workflows操作ログを解釈可能なワークフローへ抽象化する手法を提案時系列の操作ログはアプリ利用の客観的記録だが、粒度の細かさとノイズのため作業の意味ある洞察を得にくい。本論文はクロスドメインの行動系列を、解釈可能なワークフローへ抽象化する手法を提案する。
-
Graph Structured Combinatorial Semi-Bandit with Nonlinear Reward Associations through Separable Signalsグラフ構造の組合せ半バンディットを分離信号で解く相互接続データから最適構造を特定する組合せ半バンディット問題を、非線形な報酬関係の下で研究。分離可能な信号を用いてサンプリングと計算の効率化を図る。
-
Which Directions Matter? Sparse Design for Affine Robust Optimizationアフィンロバスト最適化で重要な不確実性方向を疎に選択ロバスト最適化で、有限辞書と予算制約で定義される不確実性のうち、モデルがカバーすべき方向を検討。重要な方向を疎に選ぶ設計手法を提案する。
-
Listening with Attention: Entropy-Guided Explainability for Transformer-Based Audio ModelsTransformer音声モデルをエントロピー基準で説明可能にする手法WhisperなどTransformerベースの音声認識(ASR)は高精度だが予測の解釈が難しい。既存の説明可能AI手法は忠実性や時間的精度に欠けると指摘し、エントロピーを手がかりに注意を可視化する説明手法を提案する。
-
When Good Verifiers Go Bad: Self-Improving VLMs Can Regress on New Tasks自己改善するVLMが検証器の悪化で新タスク性能を退行させる現象凍結した検証器で候補生成を採点し選好例を作る verifier 駆動の自己DPOは、自己改善型VLMで一般的な手法。本論文は、この設定で検証器が不適切だとモデルが新タスクで性能を退行させ得ること(Good Verifiers Go Bad)を示す。
-
Characterizing Cultural Localization in AI-Generated StoriesAI生成の物語における文化的ローカライズを分析AIが文化に根ざした物語をどの程度生成できるかを評価。物語に現れる文化的ローカライズの様態を特徴づけ、生成能力を測る研究。
-
Neither Parallel Nor Sequential: How DiffusionGemma Actually Commits TokensDiffusionGemmaの実際のトークン確定順序を計測拡散型言語モデルは並列・非自己回帰とされるが、実際の確定順序はほぼ計測されていない。DiffusionGemmaを計装し、並列でも逐次でもない実態を明らかにする。
-
Moonlight in Latent Space: Chirality and Structural Correspondence Between Beethoven's Op. 27 No. 2 and Machine Learning Mechanismsベートーヴェン「月光」と機械学習機構の構造的対応を分析ベートーヴェンの「月光ソナタ」(Op.27 No.2)の三つの楽章が、比喩ではなく構造的対応として三種の異なる機械学習アーキテクチャを体現していることを、計算分析を通じて示す学際的研究。
-
Expert-Driven Survival Machines: Improving Stratification and Interpretability in Multiple Clinical Cohorts臨床コホートの生存予測を層別化・解釈可能にする「Survival Machines」生存予測は医療提供者や臨床研究で中心的な役割を持つ。本論文は専門知識を取り込んだ「Expert-Driven Survival Machines」により、複数の臨床コホートでリスク層別化と解釈可能性を改善する手法を提案する。
-
A Comparative Study of Deep Learning Architectures for Multi-Horizon Behavioural Forecasting for Mobile Healthモバイルヘルスの多期間行動予測で深層学習を比較検証ウェアラブルやスマホが生む行動時系列は予防的な健康介入を支え得るが、近年の予測アーキテクチャの体系的比較は不足している。本論文はモバイルヘルス向けに多期間(multi-horizon)行動予測の深層学習アーキテクチャを比較研究する。
-
LoSoNA: A Benchmark for Local Social Norm Adaptation in Group ConversationsLoSoNA、集団会話の局所規範への適応を評価する基準オンライン集団会話には明示されない局所的な会話規範がある。LLMエージェントがそれを認識し適応できるかを測るベンチマーク「LoSoNA」を提案する。
-
AudioDER: A Deduplication-Enhanced Reasoning Dataset for Post-Training Large Audio-Language Models音声言語モデルの事後学習向け推論データセット「AudioDER」大規模音声言語モデル(LALM)は音声理解で高性能だが依然課題を残す。本論文は重複除去で強化した推論用データセット「AudioDER」を提案し、LALMの事後学習(post-training)による推論能力向上を狙う。
-
When Errors Become Narratives: A Longitudinal Taxonomy of Silent Failures in a Production LLM Agent Runtime本番LLMエージェント runtime の「静かな障害」を縦断分類LLMエージェントはジョブ実行・ツール呼び出し・記憶保持・結果送信を担う長寿命の自律 runtime として稼働しつつある。本論文はある永続システムを縦断的に調べ、見えにくい「静かな障害(silent failures)」の分類体系を提示する。
-
Persuasion Index: A Theory-Guided Framework for Persuasion AnalysisPersuasion Index、説得の理論枠組みで修辞を分析情報操作の検出やAI安全、公衆衛生の発信に重要な説得的修辞の手がかりを同定。理論に基づく分析枠組み「Persuasion Index」を提案する。
-
StreamMemBench: Streaming Evaluation of Agent Memory for Future-Oriented Assistance未来志向支援のためのエージェント記憶を評価する「StreamMemBench」個人エージェントの記憶は、蓄積情報と過去の対話を未来志向の支援へ転換することが役割となる。本論文は観測やユーザ操作から得られる手がかりを活かす能力を、ストリーミング評価するベンチマーク「StreamMemBench」を提案する。
-
Regional Climate Model Emulation with Diffusion Approaches: What is the Added Value of Generative Machine Learning?拡散モデルによる地域気候モデルのエミュレーションの付加価値を検証エミュレータは地域気候モデル(RCM)の力学的ダウンスケーリングを安価に再現する手段。本論文は拡散(diffusion)による生成的機械学習が、GCM予測子からRCM相当の高解像度場を生む際に持つ付加価値を検証する。
-
CANN-EUCLID: unsupervised constitutive artificial neural network model discovery from full-field dataCANN-EUCLID、全視野データから構成則を教師なし発見解釈可能な材料モデルを発見する構成則ニューラルネット(CANN)を、見かけの応力ひずみに頼らず全視野データから教師なしで学習。応力監督なしのモデル発見を実現する。
-
ORCA: A Platform for Open-Source Dexterity ResearchORCA、オープンソースの器用さ研究プラットフォームロボット操作研究で多用される二指グリッパは形状の制約で能力が限られる。より器用な操作の研究を支えるオープンソースのプラットフォーム「ORCA」を提案する。