開発者ツール B

315 件中 31〜60 件目を表示
  • arXiv cs.AI (Artificial Intelligence) · EN 推論・効率化 抜粋
    Robust $Q$-learning for mean-field control under Wasserstein uncertainty in common noise
    共通ノイズ下の平均場制御に対する頑健Q学習
    量子化
    本論文は共通ノイズを伴う離散時間の平均場制御問題に対し、ワッサースタイン不確実性の下で頑健なQ学習アルゴリズムを提案する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.LG (Machine Learning) · EN 安全性・評価 抜粋
    Quantum ring all-reduce: communication and privacy advantages for distributed learning
    量子通信による分散学習向けのリングAll-Reduceを提案
    深層学習 機械学習
    本論文は、分散学習向けに量子通信を用いたリングAll-Reduce方式を提案する。量子通信により分散学習を通信効率の面でも情報理論的なプライバシーの面でも改善できると論じ、古典・量子いずれの設定についても検討する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 推論・効率化 抜粋
    SoftSkill: Behavioral Compression for Contextual Adaptation
    文脈適応のための行動圧縮手法SoftSkill
    コンピュータビジョン 深層学習 推論 (Inference) ソフトウェア工学
    エージェントのスキルは回答方針を符号化した自然言語のMarkdownとして配布されることが多い。SoftSkillは行動を圧縮し文脈適応を効率化する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.LG (Machine Learning) · EN 開発者ツール 抜粋
    Quantum-classical physics-informed Kolmogorov-Arnold networks for PDEs
    PDEを解く量子古典ハイブリッドの物理情報KAN「QCPIKAN」
    ニューラルネットワーク
    本論文は、偏微分方程式を解くための量子・古典ハイブリッドの物理情報Kolmogorov-Arnoldネットワーク「QCPIKAN」を提案する。チェビシェフ多項式によるKAN層とパラメータ化量子回路を組み合わせ、物理的制約を学習損失に埋め込んで物理法則を満たすよう促す。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 開発者ツール 抜粋
    Leveraging systems' non-linearity to tackle the scarcity of data in the design of Intelligent Fault Diagnosis Systems
    系の非線形性を活かしデータ不足下で知的故障診断を設計
    ニューラルネットワーク 検索拡張生成 (RAG) 強化学習
    深層転移学習は知的故障診断システムを効率的に構築できる。本研究は系の非線形性を活用し、データ不足の課題に対処する手法を提案する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.CL (Computation and Language) · EN 推論・効率化 抜粋
    Token-Operations-Oriented Inference Optimization Techniques for Large Models
    大規模モデル推論を最適化するトークン操作指向の4層構成を提案
    推論 (Inference) 強化学習
    本論文は、大規模モデルのサービスを拡張性・低コスト・高安定に支える推論最適化技術として、トークン操作を中心に据えた四層の技術アーキテクチャを初めて提案する。マルチモデル融合などの要素を層として組み込み、推論最適化を体系化する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.LG (Machine Learning) · EN 安全性・評価 抜粋
    Shifting-based Optimizable Linear Relaxations for General Activation Functions
    一般の活性化関数に使えるシフトベースの最適化可能な線形緩和
    深層学習 ニューラルネットワーク
    本論文は、ニューラルネットワークの形式検証に用いる、一般の活性化関数向けの最適化可能な線形緩和を、シフトに基づいて構成する手法を提案する。活性化関数ごとに手作りの緩和を要する既存手法の制約を解消し、安全性・セキュリティが重要な場面での形式保証を支える。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN 新モデル・リリース 抜粋
    Integrating national forest inventory, airborne lidar, and satellite imagery for wall-to-wall mapping of forest structure with computer vision
    森林調査・LiDAR・衛星画像を統合した全域の森林構造マッピング
    コンピュータビジョン ニューラルネットワーク
    本論文は、国家森林資源調査・航空機LiDAR・衛星画像をコンピュータビジョンで統合し、森林構造を隙間なく(wall-to-wall)地図化する手法を提案する。森林・山火事リスク管理に必要な、広域かつ毎年更新される地図を継続的に得ることを狙う。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.CL (Computation and Language) · EN マルチモーダル 抜粋
    PsyScore: A Psychometrically-Aware Framework for Trait-Adaptive Essay Scoring and ZPD-Scaffolded Feedback
    心理測定を取り入れた特性適応型の作文採点・足場かけ手法PsyScore
    検索拡張生成 (RAG)
    本論文は、心理測定(psychometrics)を意識した自動作文採点の枠組み「PsyScore」を提案する。書き手の特性に適応して採点し、最近接発達領域(ZPD)に基づく足場かけ型フィードバックを与える。採点とフィードバックを別個に扱ってきた従来手法を統合し、信頼できる評価と解釈可能な指導の両立を狙う。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 開発者ツール 抜粋
    Boundary Embedding Shaping with Adaptive Contrastive Learning for Graph Structural Disentanglement
    適応的対照学習でグラフ構造を分離する境界埋め込み整形
    埋め込み (Embeddings) 機械学習 ニューラルネットワーク 検索拡張生成 (RAG)
    GNNは分類のため近傍情報を集約するが構造の絡まりが課題。適応的対照学習による境界埋め込み整形でグラフの構造的分離を図る。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN マルチモーダル 抜粋
    Confidence-Aware Automated Assessment of Student-Drawn Scientific Models
    生徒の描いた科学モデルを確信度考慮で自動評価
    深層学習 検索拡張生成 (RAG) Transformer
    生徒の描画は理科教育で概念理解の評価に広く使われる。本研究は確信度を考慮して、生徒が描いた科学モデルを自動評価する手法を示す。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 新モデル・リリース 抜粋
    Editorial Alignment: A Participatory Approach to Engaging Editorial Expertise in LLM-mediated Knowledge Dissemination
    LLM媒介の知識普及に編集者の専門性を取り込む参加型手法
    LLM駆動の情報サービスは公共知識の生成条件を変えつつある。本研究は編集者の専門性を参加型に取り込み、LLM媒介の知識普及を整合させる枠組みを示す。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 新モデル・リリース 抜粋
    The Register Gap: A Meaning Intelligence Framework for Nigerian Public Discourse
    ナイジェリア公共言説向けの意味知能枠組みThe Register Gap
    深層学習 Gemini ニューラルネットワーク 検索拡張生成 (RAG)
    本研究は9次元の注釈・評価体系である意味知能枠組み(MIF)を導入し、ナイジェリアの公共言説における言語使用域の差(レジスターギャップ)を分析する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN マルチモーダル 抜粋
    SPOT-E: Test-Time Entropy Shaping with Visual Spotlights for Frozen VLMs
    凍結VLM向けの視覚スポットライトによるテスト時エントロピー整形SPOT-E
    コンピュータビジョン 推論 (Inference) 強化学習 ソフトウェア工学
    VLMは証拠の多い課題で決定的な視覚手がかりを見落とし性能が落ちる。SPOT-Eは視覚スポットライトを用いたテスト時のエントロピー整形でこれを改善する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 開発者ツール 抜粋
    A Multi-Agent system for Multi-Objective constrained optimization
    多目的制約付き最適化のためのマルチエージェント系
    埋め込み (Embeddings) 強化学習
    計算・ネットワーク系の意思決定の多くは制約付き最適化として定式化できる。本研究は多目的の制約付き最適化を扱うマルチエージェント系を提案する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 安全性・評価 抜粋
    ScholarQuest: A Taxonomy-Guided Benchmark for Agentic Academic Paper Search in Open Literature Environments
    開かれた文献環境でのエージェント論文探索ベンチScholarQuest
    AI エージェント ソフトウェア工学
    学術論文探索は研究の中核段階であり、LLMベースの探索エージェントが台頭している。ScholarQuestは分類体系に基づくエージェント論文探索のベンチマークを提供する。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 開発者ツール 抜粋
    Thermodynamic Measure of Intelligence
    知能を熱力学的に測る試み
    ニューラルネットワーク 強化学習
    知能は測れるのか。本研究は知能を法則的な増幅として定義できると提案し、その熱力学的な測度を構築する理論的試みを示す。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.CL (Computation and Language) · EN 学習・ファインチューニング 抜粋
    Actionable Activation Directions for Detecting and Mitigating Emergent Misalignment Across Language Model Families
    活性化方向で言語モデルの創発的ミスアラインメントを検知・緩和
    ファインチューニング Llama 強化学習
    本論文は、安全でないコードでの微調整によって生じる言語モデルの創発的ミスアラインメントが、アーキテクチャを越えて共有される因果的に操作可能な活性化空間の方向に対応するかを検証する。四つの命令調整済みモデル系列で、この方向を用いた検知と緩和を検討する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 安全性・評価 抜粋
    CzechDocs: A Multiway Parallel Dataset of Formatted Documents for Minority Languages in Czechia
    チェコの少数言語向け整形文書の多言語並行データセットCzechDocs
    機械学習
    本論文は、チェコ語とチェコ国内で使われる少数言語(主にウクライナ語・英語、少量のベトナム語・ロシア語など)を対象に、HTML・DOCX・PDFといった整形済み文書の多方向並行データセット「CzechDocs」を提案する。機械翻訳の評価を支えることを目的とする。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 業界導入・応用 抜粋
    Augmenting Game AI with Deep Reinforcement Learning
    深層強化学習でゲームAIを強化する研究
    AI エージェント 機械学習 強化学習
    ゲームへの没入はグラフィックや音、機構だけでなくゲームAIの質にも依存する。本研究は深層強化学習によりゲームAIを強化する手法を扱う。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.LG (Machine Learning) · EN 安全性・評価 抜粋
    Off-Policy Evaluation for Missingness-Aware Policies in MDPs with Rewards Missing Not at Random
    報酬が非ランダムに欠損するMDPでのオフ方策評価を扱う
    強化学習
    本論文は、報酬がランダムでない形で欠損する(missing not at random)有限ホライズンMDPにおけるオフ方策評価(OPE)を研究する。オフライン強化学習で、記録の疎・不規則さや一定値以上の打ち切りにより即時報酬が観測されない、医療やマーケティングなどの状況を想定し、欠損を考慮した方策を扱う。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 安全性・評価 抜粋
    Apparent Psychological Profiles of Large Language Models are Largely a Measurement Artifact
    LLMの心理プロファイルは多くが測定アーティファクト
    深層学習 ニューラルネットワーク
    人間向けの心理尺度がLLMの性格付けに使われている。本研究は、見かけ上のLLMの心理プロファイルの多くが測定上のアーティファクトに過ぎないことを示す。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.CL (Computation and Language) · EN 安全性・評価 抜粋
    Pitch Spelling Jazz Lead Sheets, Solo Transcriptions, Classical Piano and Monophonic Scores
    MIDI入力から音名・調号・音階を推定するピッチスペリング
    本論文は、ジャズのリードシート、ソロの採譜、クラシックピアノ、単旋律譜にわたるピッチスペリングと調推定のアルゴリズムを提案する。音高(半音単位)と小節境界を含むMIDI様の入力から、適切な音名、全体の調号、局所的な音階を推定する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • IEEE Spectrum (AI section) · EN 開発者ツール 抜粋
    Sound Waves Give Neuromorphic Chips a Brain-Simulating Edge
    音波がニューロモーフィックチップに脳模倣の強みを与える
    ニューラルネットワーク
    脳の動作を模倣するニューロモーフィック計算は、従来のAIチップより大幅に省電力で動作できる。だが現状の素子は単純なものが多い。本記事は音波(音響波)を活用することで、より脳に近い情報処理をニューロモーフィックチップで実現する研究の進展を紹介する。
    元記事を読む (IEEE Spectrum (AI section)) ↗
  • arXiv cs.CL (Computation and Language) · EN 新モデル・リリース 抜粋
    MedRLM: Recursive Multimodal Health Intelligence for Long-Context Clinical Reasoning, Sensor-Guided Screening, Evidence-Grounded Decision Support, and Community-to-Tertiary Referral Optimization
    長文脈の臨床推論に向けた再帰的マルチモーダル医療AI「MedRLM」
    AI エージェント ニューラルネットワーク 検索拡張生成 (RAG) 強化学習 ソフトウェア工学
    本論文は、長文脈の臨床推論・センサー誘導スクリーニング・根拠に基づく意思決定支援・地域から高次医療への紹介最適化を担う、再帰的マルチモーダルの医療知能システム「MedRLM」を提案する。単発のプロンプトや検索にとどまる既存の医療LLMやRAGを超え、異種かつ縦断的な患者情報を横断して推論することを狙う。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 開発者ツール 抜粋
    From Texts to Scores: Tracing the Emergence of Essay Quality Representations in Large Language Models
    大規模言語モデル内部で作文品質の表現が生じる過程を追跡
    強化学習
    本論文は、自動作文採点に用いる大規模言語モデル(LLM)の内部で、作文の品質を表す表現がどのように生じるかを追跡する。二つの英語作文データセットを対象に八つのLLMの隠れ表現を体系的に分析し、LLMによる採点の内部機構の理解を深める。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN マルチモーダル 抜粋
    Self-Preference Is Weak or Absent in Verifiable Instruction-Following Revision: A Four-Model Test Under Genuine Authorship
    検証可能な指示追従の修正で自己選好が弱い/不在と報告
    ニューラルネットワーク
    本論文は、大規模言語モデルが、検証可能な指示追従の修正において自分の文章への妥当な訂正を拒むかどうかを検証する。実際に自分が書いた文章を対象に四つのモデルで検証し、判定者として自作を好む「自己選好バイアス」が、この修正設定では弱いか存在しないことを示す。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • Hacker News (Front Page) · EN 開発者ツール 抜粋
    CS 6120: Advanced Compilers: The Self-Guided Online Course (2020)
    独学できる上級コンパイラ講座「CS 6120」
    コーネル大学の上級コンパイラ講座「CS 6120」を、自習用にオンライン公開した教材を紹介する。講義動画や課題を通じて、最適化やプログラム解析などコンパイラの高度なトピックを独学で学べる無料コースとなっている。
    元記事を読む (Hacker News (Front Page)) ↗
  • arXiv cs.CL (Computation and Language) · EN 新モデル・リリース 抜粋
    What Makes Effective Supervision in Latent Chain-of-Thought: An Information-Theoretic Analysis
    潜在的なChain-of-Thoughtの有効な監督を情報理論で分析
    本論文は、推論を連続的な隠れ状態の中で内在化する潜在的な思考連鎖(latent CoT)について、どのような教師信号が有効かを情報理論的に分析する。結果のみに基づく監督が弱い学習信号しか与えず、頑健な潜在推論が難しくなる理由を考察する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 開発者ツール 抜粋
    Generative Engine Optimization at Scale: Measuring Brand Visibility Across AI Search Engines
    AI検索エンジン全体でブランド可視性を測る生成エンジン最適化
    Claude Gemini GPT 検索拡張生成 (RAG) ソフトウェア工学
    本論文は、ChatGPT・Claude・Perplexity・GeminiなどのAI検索エンジンにおいて、ブランドがどのように表現・引用・推薦されるかを大規模に測定する「生成エンジン最適化(GEO)」を研究する。利用者が検索結果をたどらずAIから直接答えを得るようになり、従来のSEOから移行する状況を捉える。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗