新モデル・リリース A
272 件中 1〜30 件目を表示
-
理研、AI for Science向けスパコンの名前を「理究」(りきゅう)に決定 由来は?理研、AI for Science向けスパコンの名称を「理究」(りきゅう)に決定理化学研究所(理研)が、AI for Science 向けに開発するスーパーコンピュータの名称を「理究(りきゅう)」に決定したと発表した。記事では名称の由来や選定の背景についても触れている。
-
GMO傘下、Unitreeの国内正規代理店に 人型ロボの導入から保守まで一気通貫で支援GMO AI&ロボティクス商事、Unitreeの国内正規代理店にGMOインターネットグループ傘下のGMO AI&ロボティクス商事が、中国の人型ロボット開発企業Unitree Roboticsと日本国内の正規代理店契約を締結したと発表。ロボットの導入から保守までを一気通貫で支援する体制を整え、国内での人型ロボット普及を後押しする。
-
画面操作を“録画”→AIが作業代行 Codexに新機能「Record & Replay」OpenAI、Codexに操作録画でAI代行する新機能『Record & Replay』OpenAIが、コーディング支援エージェントCodexに新機能『Record & Replay』を追加した。画面上の操作を録画すると、その手順をAIが再現して作業を代行するという。ITmediaが報じた。
-
Gartnerが警鐘 プライバシー法執行が本格化、CISOは何を見直すべきか?Gartner、米プライバシー法の罰金が2025年に34億ドル超と警鐘Gartnerは、2025年に米国の州当局が科したプライバシー法違反の罰金が総額34億2500万ドル(約5380億円)に達し、過去5年間の合計を上回ったと発表した。執行強化を背景に2028年まで加速する見通しを示し、CISOが対応の見直しを迫られると警鐘を鳴らす。
-
ChatGPTで広告テスト、日本でも開始 非表示にする方法は?OpenAI、ChatGPTの広告表示テストを日本でも開始米OpenAIの日本法人は、ChatGPT上での広告表示テストを日本でも開始したと発表した。記事は広告が表示される仕組みと、広告を非表示にする方法を解説している。
-
Datasette Apps: Host custom HTML applications inside DatasetteSimon Willison氏、Datasette内でカスタムHTMLアプリを動かす「Datasette Apps」を公開Simon Willison氏が、データ探索・公開ツール「Datasette」の内部にカスタムHTMLアプリケーションをホストできる新機能「Datasette Apps」を発表した。Datasetteのデータベースにアクセスする独自のHTML/JSアプリを、同インスタンス上で直接配信できる。データ基盤と一体化した軽量アプリ構築を可能にする開発者向け機能。
-
UNIEGO: Proxies as Mediators for Unified Egocentric Video Representation LearningUNIEGO、複数視点・モダリティを統合する自己中心視点動画エンコーダUNIEGOは、階層的なマルチティーチャー蒸留で学習する統合的な自己中心視点動画エンコーダ。複数の視点・モダリティ・基盤モデルにまたがる教師の知識を、表現ごとのプロキシモデルを介して均質な自己中心空間へ変換し、自己中心視点の動画のみから利用可能にする設計を提案する。
-
Predictability as a Fine-Grained Measure for Privacy予測可能性に着目した、きめ細かな新しいプライバシー指標を提案本論文は、攻撃者の中核的な事前知識を明示的に取り込む「予測可能性によるプライバシー」という、きめ細かな枠組みを提案する。差分プライバシーの最悪ケース保証が招くプライバシーと精度のトレードオフの緩和を狙う。
-
Multi-Task Bayesian In-Context Learningインコンテキスト学習でマルチタスクのベイズ推論を行う手法を提案本論文は、インコンテキスト学習を用いてタスク横断的にベイズ予測推論を行うマルチタスク・ベイズ・インコンテキスト学習を提案する。厳密推論の計算困難性や、近似手法のコスト・制約という課題に取り組み、不確実性の定量化とデータ効率の両立を目指す。
-
Execution-State Capsules: Graph-Bound Execution-State Checkpoint and Restore for Low-Latency, Small-Batch, On-Device Physical-AI Serving小バッチ・低遅延なオンデバイスAI推論向けの実行状態保存復元機構本論文は、低遅延・小バッチ・オンデバイスの物理AIサービング向けに、グラフに束縛した実行状態のチェックポイントと復元を行う「Execution-State Capsules」を提案する。ページド/基数KVキャッシュが主に担う高スループット・高並列とは異なる領域を狙う。
-
LedgerAgent: Structured State for Policy-Adherent Tool-Calling Agents方針順守のツール呼び出しエージェントに構造化状態を与えるLedgerAgent顧客対応領域で方針を順守するツール呼び出しエージェントは、複数ターンにわたりタスク状態を保持する必要がある。LedgerAgentは構造化された状態管理によりこの課題に取り組む。
-
StylisticBias: A Few Human Visual Cues Drive Most Social Biases in MLLMs少数の視覚的手がかりがMLLMの社会的バイアスの大半を生むと解明本研究StylisticBiasは、マルチモーダル大規模言語モデル(MLLM)が人物をどう判断するかを左右する視覚的手がかりを分析する。ごく少数の人間的な視覚的手がかりが、MLLMが示す社会的バイアスの大半を駆動していることを示し、影響の大きい応用での懸念を指摘する。
-
DeepSWIP: Quotient-WMC Counterfactuals for Neural Probabilistic Logic Programsニューラル確率論理プログラムの反事実推論手法DeepSWIPDeepProbLogのようなニューロシンボリック系はニューラル知覚と確率論理を組み合わせる。DeepSWIPはQuotient-WMCに基づく反事実推論を導入し、標準的推論の限界に対処する。
-
Sovereign Execution Brokers: Enforcing Certificate-Bound Authority in Agentic Control Planesエージェント制御基盤で証明書束縛の権限を強制するSovereign Execution Brokers自律エージェントがクラウドや展開、データ制御のワークフローに接続されるなか、本番環境のセキュリティが課題となる。証明書に束縛された権限を制御基盤で強制する仕組みを提案する。
-
FlowEdit: Associative Memory for Lifelong Pronunciation Adaptation in Flow-Matching TTSフローマッチングTTSに生涯発音適応を与えるFlowEditフローマッチング音声合成は高いゼロショット品質を実現するが、展開後は静的になる。FlowEditは連想メモリを用いて生涯にわたる発音適応を可能にする。
-
Multi-LCB: Extending LiveCodeBench to Multiple Programming LanguagesLiveCodeBを多言語に拡張したコード評価ベンチMulti-LCBLiveCodeBenchはLLMのコード能力評価で広く採用されている。Multi-LCBはこれを複数のプログラミング言語へ拡張し、多言語でのコード生成能力を評価する。
-
Probe-and-Refine Tuning of Repository Guidance for Coding Agentsコーディングエージェント向けにリポジトリ指示文を調整する手法本論文は、LLMベースのコーディングエージェントが依存するリポジトリ指示(AGENTS.mdなど)を調整する手法Probe-and-Refineを提案する。ファイル構成・テスト実行方法・誤修正を招きやすいワークフローなど、コード自体には存在しない高レベルの運用知識の提供を狙う。
-
Efficient and Sound Probabilistic Verification for AI AgentsAIエージェント向けの効率的で健全な確率的検証手法複雑なデジタル環境で動作するAIエージェントの安全確保が重要課題となるなか、実行時検証が求められる。本研究は効率的かつ健全な確率的検証の手法を提案する。
-
FreeStyle: Free Control of Style-Content Dual-Reference Generation from Community LoRA MiningコミュニティLoRA採掘でスタイルと内容を二重制御するFreeStyleスタイルと内容の二重参照生成は、構造を保ちつつ別の様式で画像を合成する課題。FreeStyleはコミュニティのLoRA採掘を活用し、スタイルと内容を自由に制御する。
-
Calibration Without Comprehension: Diagnosing the Limits of Fine-Tuning LLMs for Vulnerability Detection in Systems Software脆弱性検出のLLM微調整は理解か暗記かを診断する研究脆弱性ベンチで高得点のLLMが本当にセキュリティを推論しているのか、それとも単にパターン照合かを検証。微調整による脆弱性検出の限界を診断する。
-
Contagion Networks: Evaluator Bias Propagation in Multi-Agent LLM SystemsマルチエージェントLLMで評価者バイアスが伝播する現象を分析LLMがマルチエージェント系で評価者として働く際、その系統的な評価バイアスがどのように伝播するかを研究。Contagion Networksとして拡散の仕組みを分析する。
-
Beyond Global Replanning: Hierarchical Recovery for Cross-Device Agent Systems複数端末にまたがるエージェントの階層的な障害回復手法を提案本論文は、複数のアプリや端末にまたがる実世界のコンピュータ操作タスク向けに、粗い全体再計画にとどまらない階層的な障害回復機構を提案する。動的な実行時障害の下で、異種環境を協調させながらきめ細かく復旧することを目指す。
-
Optimal Order of Multi-Agent and General Many-Body Systemsフィードバックを持つマルチエージェント・多体系の最適次数の枠組み本論文はエージェント間のフィードバックループを持つマルチエージェント系や一般の多体系を解析する一般的枠組みを構築し、その最適な次数を論じる。
-
New usage analytics and updated spend controls for enterprisesOpenAI、ChatGPT Enterprise に利用分析と支出管理機能を追加OpenAI は ChatGPT Enterprise 向けに、新たな利用状況分析と支出管理機能を導入した。組織が AI 利用のコストを可視化・抑制しつつ、安心して導入規模を拡大できるよう支援する。管理者はチームごとの消費を把握し、上限設定などで運用を最適化できる。
-
Scalable Training of Spatially Grounded 2D Vision-Language Models for Radiology放射線科向け空間接地VLMの大規模学習とデータセットRefRad2D本論文は、手動の空間アノテーションなしに放射線科向けの空間接地済み視覚言語モデル(VLM)を学習する方法を研究する。臨床由来のCT・MR画像とテキストの対120万組からなる大規模な独英バイリンガルデータセットRefRad2Dを提案し、VQAや空間接地のサブセットを備える。
-
Sparsity, Superposition, and Forgetting: A Mechanistic Study of Representation Retention in Continual Learning継続学習の表現保持と忘却の機構を制御環境で機構的に解明本論文は、継続学習における表現の保持を機構的に分析し、制御された玩具的(toy-world)枠組みを用いて忘却を引き起こす要因を観測・検証可能にする。スパース性や重ね合わせ(superposition)が忘却とどう関係するかを調べ、実データでは絡み合う機構を切り分ける。
-
Neural network surrogates with uncertainty quantification for inverse problems in partial differential equationsPDE逆問題向けに不確実性を定量化するニューラル代理モデルを提案本論文は、偏微分方程式の逆問題に向けて、不確実性の定量化を備えたニューラルネットワーク代理モデルを構築する。ノイズや欠損を含む観測から未知のモデルパラメータを推定する課題を扱い、従来の数値計算がベイズ設定などで高コストになる問題への対処を狙う。
-
Pseudo-Feature Padding: A Lightweight Defense Against False Data Injection in Power Grids電力網の虚偽データ注入攻撃に対する軽量防御Pseudo-Feature Padding本論文は、電力網における虚偽データ注入攻撃(FDIA)への軽量な防御手法「Pseudo-Feature Padding」を提案する。サイバーフィジカルシステムで攻撃検知に用いる深層ニューラルネットが、検知回避を狙う攻撃に対して脆弱になりやすい問題への対処を狙う。
-
Direct Advantage Estimation for Scalable and Sample-efficient Deep Reinforcement Learning深層強化学習向けに拡張性と標本効率を高めた直接優位推定を提案本論文は、深層強化学習の標本効率と拡張性を高める直接優位推定(DAE)の改良を提案する。完全な環境観測可能性への依存や、遷移確率のモデル化に伴う計算コストといった、現実的な設定での適用を妨げる制約への対処を狙う。
-
DataMagic: Transforming Tabular Data into Data Insight Video表データをデータ洞察動画に変換するDataMagicデータ動画は動的チャート・音声ナレーション・同期アニメーションを統合して洞察を伝える。DataMagicは表形式データをこうしたデータ洞察動画へ自動変換する。