開発者ツール B
315 件中 31〜60 件目を表示
-
Robust $Q$-learning for mean-field control under Wasserstein uncertainty in common noise共通ノイズ下の平均場制御に対する頑健Q学習本論文は共通ノイズを伴う離散時間の平均場制御問題に対し、ワッサースタイン不確実性の下で頑健なQ学習アルゴリズムを提案する。
-
Quantum ring all-reduce: communication and privacy advantages for distributed learning量子通信による分散学習向けのリングAll-Reduceを提案本論文は、分散学習向けに量子通信を用いたリングAll-Reduce方式を提案する。量子通信により分散学習を通信効率の面でも情報理論的なプライバシーの面でも改善できると論じ、古典・量子いずれの設定についても検討する。
-
SoftSkill: Behavioral Compression for Contextual Adaptation文脈適応のための行動圧縮手法SoftSkillエージェントのスキルは回答方針を符号化した自然言語のMarkdownとして配布されることが多い。SoftSkillは行動を圧縮し文脈適応を効率化する。
-
Quantum-classical physics-informed Kolmogorov-Arnold networks for PDEsPDEを解く量子古典ハイブリッドの物理情報KAN「QCPIKAN」本論文は、偏微分方程式を解くための量子・古典ハイブリッドの物理情報Kolmogorov-Arnoldネットワーク「QCPIKAN」を提案する。チェビシェフ多項式によるKAN層とパラメータ化量子回路を組み合わせ、物理的制約を学習損失に埋め込んで物理法則を満たすよう促す。
-
Leveraging systems' non-linearity to tackle the scarcity of data in the design of Intelligent Fault Diagnosis Systems系の非線形性を活かしデータ不足下で知的故障診断を設計深層転移学習は知的故障診断システムを効率的に構築できる。本研究は系の非線形性を活用し、データ不足の課題に対処する手法を提案する。
-
Token-Operations-Oriented Inference Optimization Techniques for Large Models大規模モデル推論を最適化するトークン操作指向の4層構成を提案本論文は、大規模モデルのサービスを拡張性・低コスト・高安定に支える推論最適化技術として、トークン操作を中心に据えた四層の技術アーキテクチャを初めて提案する。マルチモデル融合などの要素を層として組み込み、推論最適化を体系化する。
-
Shifting-based Optimizable Linear Relaxations for General Activation Functions一般の活性化関数に使えるシフトベースの最適化可能な線形緩和本論文は、ニューラルネットワークの形式検証に用いる、一般の活性化関数向けの最適化可能な線形緩和を、シフトに基づいて構成する手法を提案する。活性化関数ごとに手作りの緩和を要する既存手法の制約を解消し、安全性・セキュリティが重要な場面での形式保証を支える。
-
Integrating national forest inventory, airborne lidar, and satellite imagery for wall-to-wall mapping of forest structure with computer vision森林調査・LiDAR・衛星画像を統合した全域の森林構造マッピング本論文は、国家森林資源調査・航空機LiDAR・衛星画像をコンピュータビジョンで統合し、森林構造を隙間なく(wall-to-wall)地図化する手法を提案する。森林・山火事リスク管理に必要な、広域かつ毎年更新される地図を継続的に得ることを狙う。
-
PsyScore: A Psychometrically-Aware Framework for Trait-Adaptive Essay Scoring and ZPD-Scaffolded Feedback心理測定を取り入れた特性適応型の作文採点・足場かけ手法PsyScore本論文は、心理測定(psychometrics)を意識した自動作文採点の枠組み「PsyScore」を提案する。書き手の特性に適応して採点し、最近接発達領域(ZPD)に基づく足場かけ型フィードバックを与える。採点とフィードバックを別個に扱ってきた従来手法を統合し、信頼できる評価と解釈可能な指導の両立を狙う。
-
Boundary Embedding Shaping with Adaptive Contrastive Learning for Graph Structural Disentanglement適応的対照学習でグラフ構造を分離する境界埋め込み整形GNNは分類のため近傍情報を集約するが構造の絡まりが課題。適応的対照学習による境界埋め込み整形でグラフの構造的分離を図る。
-
Confidence-Aware Automated Assessment of Student-Drawn Scientific Models生徒の描いた科学モデルを確信度考慮で自動評価生徒の描画は理科教育で概念理解の評価に広く使われる。本研究は確信度を考慮して、生徒が描いた科学モデルを自動評価する手法を示す。
-
Editorial Alignment: A Participatory Approach to Engaging Editorial Expertise in LLM-mediated Knowledge DisseminationLLM媒介の知識普及に編集者の専門性を取り込む参加型手法LLM駆動の情報サービスは公共知識の生成条件を変えつつある。本研究は編集者の専門性を参加型に取り込み、LLM媒介の知識普及を整合させる枠組みを示す。
-
The Register Gap: A Meaning Intelligence Framework for Nigerian Public Discourseナイジェリア公共言説向けの意味知能枠組みThe Register Gap本研究は9次元の注釈・評価体系である意味知能枠組み(MIF)を導入し、ナイジェリアの公共言説における言語使用域の差(レジスターギャップ)を分析する。
-
SPOT-E: Test-Time Entropy Shaping with Visual Spotlights for Frozen VLMs凍結VLM向けの視覚スポットライトによるテスト時エントロピー整形SPOT-EVLMは証拠の多い課題で決定的な視覚手がかりを見落とし性能が落ちる。SPOT-Eは視覚スポットライトを用いたテスト時のエントロピー整形でこれを改善する。
-
A Multi-Agent system for Multi-Objective constrained optimization多目的制約付き最適化のためのマルチエージェント系計算・ネットワーク系の意思決定の多くは制約付き最適化として定式化できる。本研究は多目的の制約付き最適化を扱うマルチエージェント系を提案する。
-
ScholarQuest: A Taxonomy-Guided Benchmark for Agentic Academic Paper Search in Open Literature Environments開かれた文献環境でのエージェント論文探索ベンチScholarQuest学術論文探索は研究の中核段階であり、LLMベースの探索エージェントが台頭している。ScholarQuestは分類体系に基づくエージェント論文探索のベンチマークを提供する。
-
Thermodynamic Measure of Intelligence知能を熱力学的に測る試み知能は測れるのか。本研究は知能を法則的な増幅として定義できると提案し、その熱力学的な測度を構築する理論的試みを示す。
-
Actionable Activation Directions for Detecting and Mitigating Emergent Misalignment Across Language Model Families活性化方向で言語モデルの創発的ミスアラインメントを検知・緩和本論文は、安全でないコードでの微調整によって生じる言語モデルの創発的ミスアラインメントが、アーキテクチャを越えて共有される因果的に操作可能な活性化空間の方向に対応するかを検証する。四つの命令調整済みモデル系列で、この方向を用いた検知と緩和を検討する。
-
CzechDocs: A Multiway Parallel Dataset of Formatted Documents for Minority Languages in Czechiaチェコの少数言語向け整形文書の多言語並行データセットCzechDocs本論文は、チェコ語とチェコ国内で使われる少数言語(主にウクライナ語・英語、少量のベトナム語・ロシア語など)を対象に、HTML・DOCX・PDFといった整形済み文書の多方向並行データセット「CzechDocs」を提案する。機械翻訳の評価を支えることを目的とする。
-
Augmenting Game AI with Deep Reinforcement Learning深層強化学習でゲームAIを強化する研究ゲームへの没入はグラフィックや音、機構だけでなくゲームAIの質にも依存する。本研究は深層強化学習によりゲームAIを強化する手法を扱う。
-
Off-Policy Evaluation for Missingness-Aware Policies in MDPs with Rewards Missing Not at Random報酬が非ランダムに欠損するMDPでのオフ方策評価を扱う本論文は、報酬がランダムでない形で欠損する(missing not at random)有限ホライズンMDPにおけるオフ方策評価(OPE)を研究する。オフライン強化学習で、記録の疎・不規則さや一定値以上の打ち切りにより即時報酬が観測されない、医療やマーケティングなどの状況を想定し、欠損を考慮した方策を扱う。
-
Apparent Psychological Profiles of Large Language Models are Largely a Measurement ArtifactLLMの心理プロファイルは多くが測定アーティファクト人間向けの心理尺度がLLMの性格付けに使われている。本研究は、見かけ上のLLMの心理プロファイルの多くが測定上のアーティファクトに過ぎないことを示す。
-
Pitch Spelling Jazz Lead Sheets, Solo Transcriptions, Classical Piano and Monophonic ScoresMIDI入力から音名・調号・音階を推定するピッチスペリング本論文は、ジャズのリードシート、ソロの採譜、クラシックピアノ、単旋律譜にわたるピッチスペリングと調推定のアルゴリズムを提案する。音高(半音単位)と小節境界を含むMIDI様の入力から、適切な音名、全体の調号、局所的な音階を推定する。
-
Sound Waves Give Neuromorphic Chips a Brain-Simulating Edge音波がニューロモーフィックチップに脳模倣の強みを与える脳の動作を模倣するニューロモーフィック計算は、従来のAIチップより大幅に省電力で動作できる。だが現状の素子は単純なものが多い。本記事は音波(音響波)を活用することで、より脳に近い情報処理をニューロモーフィックチップで実現する研究の進展を紹介する。
-
MedRLM: Recursive Multimodal Health Intelligence for Long-Context Clinical Reasoning, Sensor-Guided Screening, Evidence-Grounded Decision Support, and Community-to-Tertiary Referral Optimization長文脈の臨床推論に向けた再帰的マルチモーダル医療AI「MedRLM」本論文は、長文脈の臨床推論・センサー誘導スクリーニング・根拠に基づく意思決定支援・地域から高次医療への紹介最適化を担う、再帰的マルチモーダルの医療知能システム「MedRLM」を提案する。単発のプロンプトや検索にとどまる既存の医療LLMやRAGを超え、異種かつ縦断的な患者情報を横断して推論することを狙う。
-
From Texts to Scores: Tracing the Emergence of Essay Quality Representations in Large Language Models大規模言語モデル内部で作文品質の表現が生じる過程を追跡本論文は、自動作文採点に用いる大規模言語モデル(LLM)の内部で、作文の品質を表す表現がどのように生じるかを追跡する。二つの英語作文データセットを対象に八つのLLMの隠れ表現を体系的に分析し、LLMによる採点の内部機構の理解を深める。
-
Self-Preference Is Weak or Absent in Verifiable Instruction-Following Revision: A Four-Model Test Under Genuine Authorship検証可能な指示追従の修正で自己選好が弱い/不在と報告本論文は、大規模言語モデルが、検証可能な指示追従の修正において自分の文章への妥当な訂正を拒むかどうかを検証する。実際に自分が書いた文章を対象に四つのモデルで検証し、判定者として自作を好む「自己選好バイアス」が、この修正設定では弱いか存在しないことを示す。
-
CS 6120: Advanced Compilers: The Self-Guided Online Course (2020)独学できる上級コンパイラ講座「CS 6120」コーネル大学の上級コンパイラ講座「CS 6120」を、自習用にオンライン公開した教材を紹介する。講義動画や課題を通じて、最適化やプログラム解析などコンパイラの高度なトピックを独学で学べる無料コースとなっている。
-
What Makes Effective Supervision in Latent Chain-of-Thought: An Information-Theoretic Analysis潜在的なChain-of-Thoughtの有効な監督を情報理論で分析本論文は、推論を連続的な隠れ状態の中で内在化する潜在的な思考連鎖(latent CoT)について、どのような教師信号が有効かを情報理論的に分析する。結果のみに基づく監督が弱い学習信号しか与えず、頑健な潜在推論が難しくなる理由を考察する。
-
Generative Engine Optimization at Scale: Measuring Brand Visibility Across AI Search EnginesAI検索エンジン全体でブランド可視性を測る生成エンジン最適化本論文は、ChatGPT・Claude・Perplexity・GeminiなどのAI検索エンジンにおいて、ブランドがどのように表現・引用・推薦されるかを大規模に測定する「生成エンジン最適化(GEO)」を研究する。利用者が検索結果をたどらずAIから直接答えを得るようになり、従来のSEOから移行する状況を捉える。