インフラ・ハードウェア B
112 件中 1〜30 件目を表示
-
How Transparent is DiffusionGemma?DiffusionGemmaの推論透明性を2軸に分解して検証する研究連続潜在空間で計算の多くを担うDiffusionGemmaの推論が不透明になるかを検証。透明性を、中間状態を理解できるかという変数透明性と、それを用いて推論過程を再構成できるかというアルゴリズム透明性に分解して分析する。
-
Optimal Deterministic Multicalibration and Omnipredictionランダム性不要、決定的予測器で最適なマルチキャリブレーションを実現本研究は、決定的な予測器を出力するミニマックス最適なマルチキャリブレーション手法を提案する。最適なサンプル複雑度の達成にランダム化が必要かという未解決問題を解決し、結果を結果識別不能性(OI)やオムニ予測を満たす決定的予測器へと一般化する。
-
Predictability as a Fine-Grained Measure for Privacy予測可能性に着目した、きめ細かな新しいプライバシー指標を提案本論文は、攻撃者の中核的な事前知識を明示的に取り込む「予測可能性によるプライバシー」という、きめ細かな枠組みを提案する。差分プライバシーの最悪ケース保証が招くプライバシーと精度のトレードオフの緩和を狙う。
-
Execution-State Capsules: Graph-Bound Execution-State Checkpoint and Restore for Low-Latency, Small-Batch, On-Device Physical-AI Serving小バッチ・低遅延なオンデバイスAI推論向けの実行状態保存復元機構本論文は、低遅延・小バッチ・オンデバイスの物理AIサービング向けに、グラフに束縛した実行状態のチェックポイントと復元を行う「Execution-State Capsules」を提案する。ページド/基数KVキャッシュが主に担う高スループット・高並列とは異なる領域を狙う。
-
How Do Instructions Shape Speech? Cross-Attention Attribution for Style-Captioned Text-to-Speechスタイル指定音声合成で指示が音声に与える影響を注意機構で帰属分析自然言語で声の特徴を制御するスタイルキャプション型音声合成について、個々の指示語がどのように音声へ反映されるかをクロスアテンション帰属で分析する研究。
-
Optimal Order of Multi-Agent and General Many-Body Systemsフィードバックを持つマルチエージェント・多体系の最適次数の枠組み本論文はエージェント間のフィードバックループを持つマルチエージェント系や一般の多体系を解析する一般的枠組みを構築し、その最適な次数を論じる。
-
UltraQuant: 4-bit KV Caching for Context-Heavy Agents文脈の重いエージェント向け4ビットKVキャッシュUltraQuant文脈の重いエージェントはKVキャッシュに大きな負荷をかけ、長いプレフィックスが再利用される。UltraQuantは4ビット量子化によりKVキャッシュを圧縮する。
-
SSH-Net: A Deep Neural Network for Predicting Failure Time Distribution Functions under Competing Risks with Application to GPU Data競合リスク下の故障時間分布を予測する深層モデルSSH-Netを提案本論文は、競合リスク下での故障時間分布関数を予測する深層ニューラルネットワークSSH-Netを提案する。複雑な工学的場面における事象発生時間(time-to-event)のモデル化を狙い、GPUの故障データへの適用で有効性を示す。
-
HEPTv2: End-to-End Efficient Point Transformer for Charged Particle Reconstruction荷電粒子の軌跡再構成に向けた効率的点群TransformerのHEPTv2本論文は、荷電粒子の飛跡再構成に向けたエンドツーエンドで効率的な点群Transformer「HEPTv2」を提案する。疎な検出器計測から軌跡を復元する高エネルギー物理の推論課題を扱い、高輝度LHC(HL-LHC)でも高精度と効率を両立することを目指す。
-
Multi-View Decompilation for LLM-Based Malware Classification逆コンパイルの多視点を用いたLLMによるマルウェア分類マルウェア解析者はソース不在時に逆コンパイルされた疑似Cを調べる。本研究は複数視点の逆コンパイル情報を用いてLLMでマルウェアを分類する。
-
Pseudo-Feature Padding: A Lightweight Defense Against False Data Injection in Power Grids電力網の虚偽データ注入攻撃に対する軽量防御Pseudo-Feature Padding本論文は、電力網における虚偽データ注入攻撃(FDIA)への軽量な防御手法「Pseudo-Feature Padding」を提案する。サイバーフィジカルシステムで攻撃検知に用いる深層ニューラルネットが、検知回避を狙う攻撃に対して脆弱になりやすい問題への対処を狙う。
-
On the Redundancy of Timestep Embeddings in Diffusion Models拡散モデルにおけるタイムステップ埋め込みの必要性を再検討本論文は、ノイズスケールに応じて除去過程を調整するために用いられる拡散モデルの明示的なタイムステップ埋め込みについて、その必要性を問い直す。U-NetやDiffusion Transformerへの影響を実験的に分析し、理論的根拠も与えて、この時間的シグナルが冗長かどうかを検証する。
-
Rethinking Shrinkage Bias in LLM FP4 Pretraining: Geometric Origin, Systemic Impact, and UFP4 RecipeLLMのFP4事前学習の縮小バイアスを解明しUFP4レシピを提案FP4学習はLLM事前学習のメモリと計算を大幅に削減するが縮小バイアスが課題。その幾何学的起源と系全体への影響を解析し、UFP4レシピを示す。
-
Judging to Improve: A De-biased VLM-as-3D-Judge Protocol for Single-Image 3D Generation脱バイアスのVLM3D判定器で単一画像からの3D生成を専門化本論文は、単一画像からの3D生成に向けた、脱バイアスの「VLMを3D判定器として使う」プロトコルを提案する。幾何やCLIPの代理指標では捉えきれない単一画像→3Dメッシュ品質をランク付けする判定器を活かし、その選好で強力なオープン生成器TRELLISを、人手なしに家具など特定資産クラスへ安価に専門化できるかを問う。
-
Shifting-based Optimizable Linear Relaxations for General Activation Functions一般の活性化関数に使えるシフトベースの最適化可能な線形緩和本論文は、ニューラルネットワークの形式検証に用いる、一般の活性化関数向けの最適化可能な線形緩和を、シフトに基づいて構成する手法を提案する。活性化関数ごとに手作りの緩和を要する既存手法の制約を解消し、安全性・セキュリティが重要な場面での形式保証を支える。
-
Navigating Unreliable Parametric and Contextual Knowledge: Explicit Knowledge Conflict Resolution for LLM InferenceLLM推論で信頼できない知識の衝突を明示的に解消する手法LLMは多様な言語課題で高性能だが、パラメトリック知識と文脈知識が矛盾し得る。本研究はその知識衝突を明示的に解消する手法を提案する。
-
Beyond Accuracy: Measuring Logical Compliance of Predictive Models予測モデルの論理的整合性を精度を超えて測る研究MLモデルは主に予測性能の指標で評価されるが、それだけでは不十分。本研究は精度を超えて、予測モデルの論理的整合性を測る方法を提案する。
-
Pitch Spelling Jazz Lead Sheets, Solo Transcriptions, Classical Piano and Monophonic ScoresMIDI入力から音名・調号・音階を推定するピッチスペリング本論文は、ジャズのリードシート、ソロの採譜、クラシックピアノ、単旋律譜にわたるピッチスペリングと調推定のアルゴリズムを提案する。音高(半音単位)と小節境界を含むMIDI様の入力から、適切な音名、全体の調号、局所的な音階を推定する。
-
HydraHead: From Head-Level Functional Heterogeneity to Specialized Attention Hybridizationヘッド単位で線形・フルアテンションを融合するHydraHead本論文は、ヘッド単位の機能的な異質性を活かして線形アテンションとフルアテンションを融合するハイブリッド設計「HydraHead」を提案する。多くのオープンソースのハイブリッドモデルが採る層単位の戦略を超え、長文脈処理に向けて両者を統合する難しさに対処する。
-
GEMS: Geometric Constraints Enable Multi-Semantic Superposition in LLMs幾何制約で複数意味の重ね合わせを可能にする操作手法GEMS本論文は、再学習なしに推論時の隠れ状態を操作するアクティベーション・ステアリングにおいて、幾何的な制約により複数の意味方向を重ね合わせ可能にする手法「GEMS」を提案する。単一方向の注入しか扱えない既存手法が、制約なしで複数方向を重ねると崩壊する問題に対処する。
-
AMD silently removes memory encryption from consumer Ryzen CPUsAMD、消費者向けRyzenからメモリ暗号化を静かに削除AMDが、消費者向けRyzen CPUからメモリ暗号化機能を告知なく削除したと報じる記事。物理的な攻撃からデータを守る機能が外れたことへの懸念や、セキュリティを重視するユーザーへの影響を取り上げている。
-
Leverage Is Not Reach: A Control-Window Law for Single-Neuron Steering in Language Models言語モデルの単一ニューロン操作に関する制御窓の法則を提示本論文は、言語モデルにおける単一ニューロンによる操作(ステアリング)について、予算正規化した「制御窓(control window)」の枠組みを構築する。拒否や言語の振り分けなど、疎なフィードフォワードニューロンが制御する挙動を、出力を崩さずに一貫して制御できるのはいつかを予測しようとする。
-
GLM-5.2 is probably the most powerful text-only open weights LLMGLM-5.2、テキスト特化の最強級オープンウェイトLLMか中国のAIラボZ.aiが、コーディングプラン向けに6月13日公開したGLM-5.2を、6月16日にMITライセンスで完全なオープンウェイトとして公開した。従来のGLM-5やGLM-5.1と同規模ながら、テキスト専用では最も強力なオープンウェイトLLMの可能性があるとサイモン・ウィリソン氏は評している。
-
Explaining Attention with Program Synthesisプログラム合成で注意機構を説明し解釈可能性を追求解釈可能な深層学習の長年の目標は、不透明なニューラル計算を人間が理解できる記号的記述に置き換えることだ。本研究は Transformer の注意機構の挙動を、合成した記号プログラムで近似・説明する手法を提案し、内部動作の理解可能性を高める。
-
P-K-GCN: Physics-augmented Koopman-enhanced Graph Convolutional Network for Deep Spatiotemporal Super-resolution物理と Koopman を組み込んだ GCN で時空間超解像を高精度化時空間ダイナミクスの高精度シミュレーションは計算負荷が大きく、効率的な超解像が求められる。本研究は物理制約と Koopman 作用素理論をグラフ畳み込みネットワークに統合した「P-K-GCN」を提案し、低解像度データから高精度な時空間場を再構成する。
-
Optimal scenario design for climate emulation気候エミュレーションの精度を高める最適シナリオ設計を提案物理系への深層学習で汎化性能の向上は、主に物理制約を組み込む構造設計で図られてきた。本研究は機械学習の代理モデル(サロゲート)による気候エミュレーションに着目し、学習に用いるシナリオの最適設計を通じて汎化と予測精度を高める手法を提案する。
-
Detecting Hidden ML Training With Zero-Overhead Telemetryゼロ負荷テレメトリで隠れた ML 学習を検出し計算統治を支援GPU 負荷のハードウェア監視は AI の計算ガバナンス提案の基盤だが、開発者が監視を回避できれば機能しない。本研究はオーバーヘッドのないテレメトリで隠れた機械学習の学習を検出できるかを評価し、計算資源の統治を実効的にするための監視耐性を検証する。
-
A Human-in-the-Loop Bayesian Optimization Framework for Constraint-Aware Bioprocess Development人間参加型ベイズ最適化で制約を考慮したバイオプロセス開発本研究は、人間参加型(HitL)ベイズ最適化の枠組み Pareto Front Guided Sampling(PFGS)を拡張する。ガウス過程の代理モデルから得る量を目的関数として再定式化し、制約を考慮したバイオプロセス開発を支援。専門家の知見を取り入れつつ効率的に最適条件を探索する。
-
RECOM: A Validity Discrimination Tradeoff in Automatic Metrics for Open Ended Reddit Question AnsweringRECOM、自動評価指標の妥当性と識別性のトレードオフを分析自動評価指標は LLM 生成文の評価で既定の手段だが、内容の真の一致(妥当性)と表層的偶然の見分け、さらに品質の識別という二役を暗に担わされている。本研究は Reddit の自由回答 QA を題材に、妥当性と識別性のトレードオフ「RECOM」を分析する。
-
Language Models as Interfaces, Not Oracles: A Hybrid LLM-ML System for Pediatric AppendicitisLLM は神託でなく接点、小児虫垂炎を診る LLM-ML 融合系LLM は自由記述の文書を解釈して臨床判断支援を身近にするが、プロンプトや情報順序への敏感さから診断エンジンとして直接使うのは限界がある。本研究は LLM を「神託」ではなく「接点(インターフェース)」と位置づけ、小児虫垂炎の診断で LLM と ML を組み合わせる手法を示す。