開発者ツール B

304 件中 151〜180 件目を表示
  • arXiv cs.AI (Artificial Intelligence) · EN 安全性・評価 抜粋
    Fixed-Point Reasoners: Stable and Adaptive Deep Looped Transformers
    ループ型Transformerの信号伝播問題を改善する手法FPRMを提案
    Transformer
    段階的推論に適したループ型アーキテクチャが、深さに起因する信号伝播問題を抱える点に着目し、pre-norm層と残差スケーリングで対処する論文。これらの改良に基づくTransformerモデルFPRMを提案すると述べる。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.CL (Computation and Language) · EN 安全性・評価 抜粋
    Analyzing and Encoding the Al-Mawrid Arabic-English Dictionary with the ISO Language Markup Framework and TEI Lex-0
    Al-Mawrid辞書をISO LMF・TEI Lex-0で計算機可読化
    レガシーな印刷辞書Al-Mawrid(アラビア語-英語)をISO言語マークアップ枠組みとTEI Lex-0で体系的にデジタル化・符号化する手法を提示。アラビア語の語彙基盤の不足を埋め、標準化された計算機用辞書へ変換する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 新モデル・リリース 抜粋
    DRFLOW: A Deep Research Benchmark for Personalized Workflow Prediction
    個別化ワークフロー予測を測るDeep Researchベンチマークを提案
    AI エージェント 検索拡張生成 (RAG) ソフトウェア工学
    Deep Researchシステムの多くが報告書や要約の生成に偏る一方、企業業務は具体的な行動手順の特定を要すると指摘し、個別化ワークフロー予測を評価するベンチマークDRFLOWを導入する論文。手順列としてのワークフロー予測能力を測ると述べる。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.LG (Machine Learning) · EN 学習・ファインチューニング 抜粋
    Multi-Source Cybersecurity Logs: An ATT&CK-Labeled Dataset and SLM Evaluation
    ATT&CK注釈付き多源セキュリティログ集と小型LM評価
    ファインチューニング Llama 機械学習 ニューラルネットワーク 人間のフィードバックによる強化学習 (RLHF)
    複数ソースのサイバーセキュリティログにMITRE ATT&CKラベルを付与したデータセットを構築し、小型言語モデル(SLM)での評価を行う研究。タイトルベースの中立要約で、詳細・数値は原論文発表ベース・第三者検証は未確認と明記。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 開発者ツール 抜粋
    IUU+DB: Tracking Illegal, Unreported, and Unregulated Fishing, Seafood Fraud, and Labor Abuse through LLM-driven Information Extraction
    LLM抽出でIUU漁業・水産不正・労働搾取を追跡するIUU+DBを提案
    検索拡張生成 (RAG)
    違法・無報告・無規制(IUU)漁業をより広い水産関連犯罪へ拡張したIUU+概念を提唱し、LLMによる情報抽出でその発生頻度や地理、関与者などを定量化する枠組みIUU+DBを提案する論文。海洋生態系や市場、労働への脅威の理解を狙うと述べる。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 開発者ツール 抜粋
    All Smoke, No Alarm: Oracle Signals in Agent-Authored Test Code
    AIエージェント生成テストコードの検証力の弱さを分析した研究
    AI エージェント Claude OpenAI
    AIコーディングエージェントが生成するテストコードに着目し、アサーションを欠くテストファイルは挙動を検証しないため、テスト存在を前提とする品質ゲートが検証強度を過大評価すると論じる論文。エージェント作成PRのテスト検証力を評価すると述べる。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • NVIDIA Developer Blog · EN インフラ・ハードウェア 抜粋
    Build On-Device AI Companions with the NVIDIA ACE Game Agent SDK and Unreal Engine 5 Plugins
    NVIDIA、オンデバイス AI 向け ACE Game Agent SDK と UE5 プラグインを発表
    深層学習 NVIDIA
    NVIDIA が、ゲーム内のオンデバイス AI コンパニオン(AI エージェント)を構築するための『ACE Game Agent SDK』と Unreal Engine 5 向けプラグインを開発者向けに公開したと発表した。クラウドに依存せず端末上で動作する AI キャラクター実装を狙うとされる。export の raw_excerpt が cookie/query データで blocked のため、タイトルと公開元(NVIDIA developer blog)ベースで中立に要約し、具体的な数値・性能は未確認。
    元記事を読む (NVIDIA Developer Blog) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 新モデル・リリース 抜粋
    ReAge3D: Re-Aging 3D Faces with View Consistency
    視点整合性を保つ3D顔の加齢編集フレームワークReAge3Dを提案
    検索拡張生成 (RAG)
    同一性を保ちつつ詳細な3D顔の加齢・若返り編集を行う枠組みReAge3Dを提案する論文。合成画像ペアで学習した2D拡散モデルDiffReagingと中心から外側へ広げる手法により、視点間の不整合による細部の平滑化を抑えると述べる。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 開発者ツール 抜粋
    Learning Cardiac Electrophysiology Digital Twins Through Agentic Discovery of Hybrid Structure
    心臓電気生理のデジタルツインを生成する構造探索手法を提案
    深層学習
    患者ごとに適切なモデル構造を特定する必要がある心臓電気生理(EP)のデジタルツインに着目し、ハイブリッド物理・ニューラル構造をエージェント的に探索する手法を提案する論文。専門家の手作業や転移性の課題を緩和すると述べる。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.LG (Machine Learning) · EN 開発者ツール 抜粋
    Memory as a Wasting Asset: Pricing Flash Endurance for Embodied Agents, and the Limits of Doing So
    フラッシュ耐久を消耗資産として価格付けする実体エージェント論
    AI エージェント
    ロボットのフラッシュ耐久は再生不能な在庫で、書き込みごとに数千回の消去サイクルを消費し回復しない。本論文は実体エージェントのフラッシュ耐久を価格付けする枠組みと、その限界を論じる。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 新モデル・リリース 抜粋
    Descriptor: Certus Caliber Classification Gunshot Dataset (C3GD)
    銃口爆音を集めた公開データセットC3GDを構築
    Meta 強化学習
    銃口の爆発音を解析するための公開データセットCertus Caliber Classification Gunshot Dataset(C3GD)を構築した論文。28種の銃器・16口径から現地収集した8000点超を含み、銃器や口径、マイク位置などの詳細なメタデータを備えると述べる。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.CL (Computation and Language) · EN 開発者ツール 抜粋
    Structural Role Injection in Handlebars-Templated LLM Prompts: Triple-Brace Interpolation, Delimiter Family, and the Limits of HTML Auto-Escaping
    HandlebarsテンプレのLLMプロンプトに潜む役割注入
    Claude GPT Llama 機械学習 Microsoft
    LLMアプリはテンプレートからプロンプトを組み立て、Handlebars(Semantic Kernel既定)を広く使う。本研究は二重括弧のHTMLエスケープに対し三重括弧補間が値をそのまま挿入する点に着目し、構造的な役割注入の危険と自動エスケープの限界を分析する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 開発者ツール 抜粋
    First Proof Second Batch
    研究レベルの数学10問でAIを検証した報告 First Proof Second Batch
    ニューラルネットワーク
    現行のAIシステムが研究レベルの数学問題を正しく解けるかを検証するため、寄稿者の研究過程で生じた幅広い分野の10問でテストした報告書。問題・手法・結果に加え、人間解・AI生成解・査読ログへのリンクを提供すると述べる。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • Simon Willison's Weblog · EN 新モデル・リリース 抜粋
    datasette-tailscale 0.1a0
    Simon Willison、Datasetteをtailscaleに繋ぐ実験的プラグインを公開
    ニューラルネットワーク
    Simon Willison氏が、ローカルのDatasetteサーバーをTailscale経由で自身のTailnetに接続できる実験的なアルファ版プラグイン「datasette-tailscale 0.1a0」を公開した。認証キーとホスト名を指定して起動すると、Tailnet内から該当ホスト名でDatasetteにアクセスできるようになる。実装には実験的なtailscale-rsライブラリのPythonバインディングを利用しており、本人もプロキシ設定のより良い方法を問うissueを立てたと述べている。
    元記事を読む (Simon Willison's Weblog) ↗
  • arXiv cs.LG (Machine Learning) · EN 開発者ツール 抜粋
    Learning Fair Pareto-Optimal Policies in Multi-Objective Reinforcement Learning
    多目的強化学習で公平なパレート最適方策を学習
    アルゴリズム・理論 Meta 検索拡張生成 (RAG) 強化学習
    多目的強化学習(MORL)では相反し得る複数目的にわたり最適性と公平性の両立が求められる。本研究は一般化された厚生関数を用い、公平でパレート最適な方策を学習する手法を提案する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 新モデル・リリース 抜粋
    Querying an astronomical database using large language models: the ALeRCE text-to-SQL system
    LLMで天文DBを問い合わせるtext-to-SQLシステムを開発
    Claude Gemini GPT 推論 (Inference)
    LLMと文脈内学習に基づくtext-to-SQLシステムを開発し、天文ブローカーALeRCEのデータベースに適用した論文。自然言語の問い合わせから実行可能なSQLを生成し、110組の自然言語・SQL対データで段階的生成手法を評価すると述べる。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.LG (Machine Learning) · EN 開発者ツール 抜粋
    Deep Reinforcement Learning for Minimum Zero-Forcing Sets
    深層強化学習で最小ゼロ強制集合を求解
    強化学習
    無向グラフ上の最小ゼロ強制集合問題に対し、初期集合の色がネットワーク全体へ伝播するグラフ彩色問題として定式化し、適応的な機械学習枠組みで解くアプローチを提案する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN マルチモーダル 抜粋
    Trust the Right Teacher: Quality-Aware Self-Distillation for GUI Grounding
    GUI接地向けの品質考慮型自己蒸留手法を提案
    コンピュータビジョン
    高解像度画面で小さな対象要素の座標を予測するGUI接地で、密な教師信号を与えるオンポリシー自己蒸留(OPSD)に着目する論文。素朴なOPSDが座標トークンの教師信号劣化を招く課題に対し、品質を考慮した自己蒸留を提案すると述べる。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 学習・ファインチューニング 抜粋
    EAGG: Embodiment-Aligned Grasp Generation via Geometry-Aware Graph Conditioning
    身体性に整合した把持生成手法EAGGを提案
    ファインチューニング 検索拡張生成 (RAG)
    平行グリッパから多指ハンドまで多様な身体性に汎化する把持生成を目指し、各エンドエフェクタを位相考慮グラフで表現する身体性整合型生成器EAGGを提案する論文。固定身体性向けや静的記述子では転移が弱まる課題に対処すると述べる。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.LG (Machine Learning) · EN 学習・ファインチューニング 抜粋
    From Reasoning Traces to Reusable Modules: Understanding Compositional Generalization in Language Model Reasoning
    推論トレースを再利用モジュール化し合成的汎化を解明
    ファインチューニング 検索拡張生成 (RAG) 強化学習
    教師ありファインチューニングと強化学習を組み合わせる事後訓練はLLMを頑健な推論器にする鍵となっている。本研究は推論トレースを再利用可能なモジュールへ変換する観点から、言語モデル推論の合成的汎化を理解する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN 安全性・評価 抜粋
    Edge Flow: A Tractable and Predictive Continuous-Time Model for Gradient Descent at the Edge of Stability
    Edge Flow、安定境界の勾配降下を連続時間で予測モデル化
    深層学習
    深層学習の勾配降下は損失ヘッセ行列の最大固有値が安定閾値付近に留まる安定境界(EoS)で動くことがある。Edge Flowはこの領域を扱える、扱いやすく予測的な連続時間モデルを提案する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN インフラ・ハードウェア 抜粋
    Tensor-based second-order causal discovery
    テンソルに基づく二次の因果探索手法TSCDを提案
    深層学習
    変数間の因果依存を明らかにする因果探索に対し、観測データと介入データの共分散行列から得たテンソルを入力とする二次の手法TSCDを提案。線形構造方程式に従う因果依存を仮定して推定する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN 新モデル・リリース 抜粋
    Volterra Generative Models
    Volterra生成モデル、記憶を持つ摂動で拡散を一般化
    深層学習
    スコアベース拡散モデルは扱いやすい逆時間ダイナミクスを与えるブラウン摂動を使うが記憶を持たない。Volterra生成モデルは記憶のある連続時間摂動を導入し、拡散生成を一般化する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 安全性・評価 抜粋
    Agentic AI-based Framework for Mitigating Premature Diagnostic Handoff and Silent Hallucination in Healthcare Applications
    医療AIの早期診断委譲と静かな幻覚を抑える多エージェント枠組み
    AI エージェント Llama
    医療推論に用いるエージェント型AIが、早期の診断委譲と検知されにくい臨床幻覚という二つの失敗様式に陥りやすい点に着目する論文。LLM審判型のルーティングを決定論的な統制制約に置き換え、二つの安全機構を備えた多エージェント枠組みを提案すると述べる。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.CL (Computation and Language) · EN 新モデル・リリース 抜粋
    Security and Privacy Prompts in the Wild: What Users Ask LLMs and How LLMs Respond
    実世界でユーザがLLMに尋ねる安全・プライバシー質問を分析
    GPT Llama 検索拡張生成 (RAG) 強化学習
    LLMは多くの用途で使われる。本研究は実世界でユーザがセキュリティやプライバシーについて何をLLMに尋ね、LLMがどう応答するかを分析し、その傾向と課題を明らかにする。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 安全性・評価 抜粋
    PseudoBench: Measuring How Agentic Auto-Research Fuels Pseudoscience
    PseudoBench、自律研究エージェントが擬似科学を助長する度合いを測定
    AI エージェント 深層学習
    LLMベースのエージェントが自律的な科学研究に入る中、擬似科学への耐性が重要になる。PseudoBenchは、もっともらしいが誤った研究を生み学術文献を汚染し得る挙動を測る敵対的ベンチマークを提案する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 新モデル・リリース 抜粋
    When AI Says "I have been in similar situations": Synthetic Lived Experience in Peer-Like Caregiver Support
    AIの合成的な実体験表現、介護者ピア支援での緊張を検討
    GPT Llama ニューラルネットワーク
    介護者はオンラインの仲間から情報的・感情的支援を得る。LLMが仲間的支援者として設計される中、AIが個人的経験を語ることが生む緊張を、介護者支援の文脈で検討する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.LG (Machine Learning) · EN インフラ・ハードウェア 抜粋
    ConTex: Reformulating Counterfactual Generation For Time Series Forecasting
    ConTex、時系列予測の反事実生成を再定式化
    深層学習
    深層学習による時系列予測は正確さに加え行動可能な示唆を要するが、現行構造はそれを内在的に与えない。ConTexは、予測結果を望む将来へ移すために現状をどう変えるべきかを示す反事実生成を再定式化する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.CL (Computation and Language) · EN エージェント・ツール使用 抜粋
    ProvenanceGuard: Source-Aware Factuality Verification for MCP-Based LLM Agents
    ProvenanceGuard、MCPエージェント向け出所考慮の事実検証
    AI エージェント Model Context Protocol (MCP) ソフトウェア工学
    ツール利用のLLMエージェントはMCPで検索・API・DB・臨床記録など多様な根拠から回答する。ProvenanceGuardは、根拠の出所に敏感な失敗モードに対処する、出所を考慮した事実性検証を提案する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 学習・ファインチューニング 抜粋
    When English Isn't the Best Teacher: Source Language Effects in Cross-Lingual In-Context Learning
    言語間文脈内学習で英語が最良の教師とは限らない
    ファインチューニング ニューラルネットワーク 自然言語処理 (NLP)
    多言語NLPの言語間転移は教師ありFTで広く研究され、データ量や言語的近さが質を左右する。few-shotの文脈内学習(ICL)へ移る中、本研究はソース言語の効果を検証し、英語が常に最良の教師ではないことを示す。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗