資金・M&A C

74 件中 31〜60 件目を表示
  • Stratechery (free posts) · EN 安全性・評価 抜粋
    The State of Fable, The Jailbreak Problem, SpaceX Acquires Cursor
    Stratechery、Fableの現状・ジェイルブレイク問題・SpaceXのCursor買収を論じる
    Anthropic
    Ben ThompsonのStratecheryが3つの話題を取り上げる週次論考。AnthropicのモデルFableの現状、AIのジェイルブレイク(脱獄)問題、そしてSpaceXによるCursorの買収を論じる。筆者は「行政当局のFableに対する見方はおそらく誤りだが、最終的にはAnthropicの責任だ」と指摘する。各論点は筆者の見解ベースで、買収の詳細・数値は第三者検証は未確認。
    元記事を読む (Stratechery (free posts)) ↗
  • arXiv cs.CL (Computation and Language) · EN 安全性・評価 抜粋
    Aligning Implied Statements for Implicit Hate Speech Generalizability with Context-Bounded Semi-hard Negative Mining
    含意の整合と半硬負例採掘で暗黙的ヘイト検出を一般化
    音声処理
    暗黙的なヘイトスピーチの分類は、意図が明示されないため難しい。本研究は文が含意する内容を整合させ、文脈を限定した半硬い負例の採掘を組み合わせることで、暗黙的ヘイト検出の汎化性能を高める手法を提案する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • ITmedia AI+ · JA 新モデル・リリース 抜粋
    Cursor、Gitホスティング「Origin」発表 SpaceXによる買収発表直後に
    Cursor、Gitホスティング「Origin」発表 GitHub対抗か
    AIコーディングツール「Cursor」が、Gitホスティングサービス「Origin」を発表した。記事は「GitHub」に対抗する狙いがありそうだとしている。発表は SpaceX による Cursor 買収報道の直後とされる。買収額・詳細や Origin の機能は記事ベースで、第三者検証は未確認。
    元記事を読む (ITmedia AI+) ↗
  • arXiv cs.CL (Computation and Language) · EN 安全性・評価 抜粋
    LegalWorld: A Life-Cycle Interactive Environment for Legal Agents
    法務エージェント向けライフサイクル型環境「LegalWorld」
    AI エージェント ニューラルネットワーク 強化学習
    民事訴訟は本質的にライフサイクルを伴うプロセスで、弁護士が作成する書面は段階ごとに連関する。LegalWorldはこうした訴訟の全工程を対象とする対話的な環境を提供し、法務エージェントを一連の流れの中で評価・訓練できるようにする。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.CL (Computation and Language) · EN 安全性・評価 抜粋
    LLMs Struggle to Measure What Distinguishes Students of Different Proficiency Levels: A Study of Item Discrimination in Reading Comprehension Assessment
    LLMは読解問題の識別力指標の測定に苦戦
    ソフトウェア工学
    識別力は教育的評価における基本的な心理測定特性で、習熟度の異なる学習者を見分ける力を表す。本研究は読解問題において、大規模言語モデルがこの項目識別力を測ることが難しいことを示し、自動評価の限界を指摘する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • ITmedia AI+ · JA 開発者ツール 抜粋
    SpaceX、AIコーディング「Cursor」を9.6兆円で買収 「近く大幅な改善」へ
    SpaceX、AIコーディング「Cursor」を9.6兆円で買収と報道
    SpaceXがAIコーディングツール「Cursor」を9.6兆円で買収すると報じられた。Cursor側は公式Xで「近く大幅な改善が行われる予定だ」と述べたとされる。買収の詳細や金額の裏付けは記事ベースで、第三者検証は未確認。
    元記事を読む (ITmedia AI+) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 安全性・評価 抜粋
    The Stanford EDGAR Filings Dataset: Reconstructing U.S. Corporate and Financial Disclosures into Layout-Faithful and Token-Efficient Pretraining Data
    SEC開示文書を再構成した金融向け事前学習データSEFDを公開
    強化学習
    高品質な長文コーパスが枯渇する中、SEC提出書類をレイアウト忠実なMultiMarkdownへ再構成したオープンデータセットStanford EDGAR Filings Dataset(SEFD)を提示する論文。金融言語モデルの学習・評価用に監査済み財務諸表などを提供すると述べる。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.LG (Machine Learning) · EN 新モデル・リリース 抜粋
    A Diffusion Approximation for Temporal-Difference Learning with Linear Features under Markovian Noise
    マルコフ雑音下のTD学習に拡散近似を導入
    線形関数近似による時間差分(TD)学習の古典的連続時間記述は常微分方程式で、漸近平均は捉えるが確率性を無視する。本論文はマルコフ雑音下のTD学習に対し、その揺らぎを捉える拡散近似を与える。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN 安全性・評価 抜粋
    Evaluating Open-Source LLMs for Multi-Label ATT&CK Technique Classification on CTI Reports
    CTIのATT&CK多ラベル分類にオープンLLMを評価
    ニューラルネットワーク 検索拡張生成 (RAG) 強化学習
    サイバー脅威インテリジェンス(CTI)報告をMITRE ATT&CK技術で多ラベル分類する課題に対し、オープンソースLLMの性能を評価する研究。タイトルベースの中立要約で、詳細・数値は原論文ベース・第三者検証は未確認と明記。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.CL (Computation and Language) · EN 安全性・評価 抜粋
    The Measurement Gap in the Automation of EU Law: Benchmarking Doctrinal Legal Reasoning under the EU AI Act
    EU AI法下の法的推論を測る測定ギャップを指摘
    ニューラルネットワーク
    LLMは中位品質の法文を生成できるが、法務の解釈的中核である教義的法的推論を評価できるベンチマークは無いと指摘。本研究はEU AI法の下で教義的法的推論をベンチマークし、自動化における測定ギャップを論じる。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.LG (Machine Learning) · EN 推論・効率化 抜粋
    Embedded Machine Learning for Microcontroller-Class Edge Devices: Data, Feature, Evaluation, and Deployment Pipelines
    マイコン級エッジ向け組込み機械学習のパイプライン総説
    推論 (Inference) 機械学習 量子化
    組込み機械学習は推論をクラウドから資源制約デバイスへ移す。本稿はマイコン級プラットフォーム向けに、データ取得・特徴量・評価・展開までの一連のワークフローを体系的に整理した実務志向の総説を示す。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN 安全性・評価 抜粋
    Edge Flow: A Tractable and Predictive Continuous-Time Model for Gradient Descent at the Edge of Stability
    Edge Flow、安定境界の勾配降下を連続時間で予測モデル化
    深層学習
    深層学習の勾配降下は損失ヘッセ行列の最大固有値が安定閾値付近に留まる安定境界(EoS)で動くことがある。Edge Flowはこの領域を扱える、扱いやすく予測的な連続時間モデルを提案する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN 政策・規制 抜粋
    When LLMs Analyze Scars: From Images to Clinically-Meaningful Features
    LLMで瘢痕画像を臨床的特徴へ、データ希少下の医療分類
    深層学習 ニューラルネットワーク 強化学習
    医療画像分類は大規模では高性能だが、注釈コストやプライバシー、疾患の稀少性でデータが乏しい現場が課題。本研究は瘢痕分類を題材に、LLMを用い画像から臨床的に意味ある特徴を引き出す手法を検討する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN 資金・M&A 抜粋
    C2FL: Clustered Continual Federated Learning under Spatial and Temporal Drift
    C2FL、空間・時間ドリフト下のクラスタ型継続連合学習
    機械学習 検索拡張生成 (RAG)
    集合適応システム(CAS)は各ノードが局所データから学習するが、データのプライバシー、ノードの移動性などが規模拡大を阻む。C2FLは空間的・時間的ドリフト下でのクラスタ化された継続的連合学習を提案する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN インフラ・ハードウェア 抜粋
    Multiple cyclicity and Wavelet Decomposition with Channel Correlation for Long-term Time Series Forecasting
    多重周期性とウェーブレット分解で長期時系列予測
    ニューラルネットワーク 強化学習
    周期性とトレンドは時系列の重要要素だが、既存研究は実世界のチャネル間相関の影響を軽視しがちと指摘。本研究は多重周期性とチャネル相関を伴うウェーブレット分解により長期時系列予測の精度向上を図る。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN 安全性・評価 抜粋
    Dimensionality Controls When Modularity Helps in Continual Learning
    継続学習でモジュール性が効く条件は次元が左右する
    強化学習
    合成的学習系は可塑性と安定性の均衡を保つ必要がある。本研究は継続学習においてモジュール性が有益となる条件を分析し、表現の次元がその効果を左右することを示す。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.CL (Computation and Language) · EN 開発者ツール 抜粋
    A Framework for Evaluating Agentic Skills at Scale
    エージェントのスキルを大規模に評価する枠組み
    AI エージェント 深層学習 強化学習
    LLMエージェントを拡張する構造化・再利用可能なスキルは産業で急速に普及したが、領域横断の効果や個々のスキル評価の再利用可能な方法論が不足している。本研究はスキルを大規模に評価する枠組みを提案する。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • Stratechery (free posts) · EN 資金・M&A 抜粋
    Fox Buys Roku, The Problem With Fox’s Smart Strategy, Streaming That Works
    Stratechery、Fox の Roku 買収の戦略的狙いを論評
    検索拡張生成 (RAG)
    テック分析ニュースレター Stratechery が、Fox による Roku 買収を取り上げた。市場の評価は否定的だが、Fox は権利保有者からの収益抽出を、配信プラットフォームの「賃借人」としての交渉力に転換していると論じる。ストリーミング配信のビジネスモデルとメディア企業の戦略的ポジショニングを考察する内容。
    元記事を読む (Stratechery (free posts)) ↗
  • arXiv cs.LG (Machine Learning) · EN 安全性・評価 抜粋
    Your Privacy My Cloak: Backdoor Attacks on Differentially Private Federated Learning
    差分プライバシーが連合学習のバックドア防御を弱めると指摘
    深層学習 検索拡張生成 (RAG) 強化学習
    差分プライバシー(DP)が連合学習をバックドア攻撃に強くするという通説に反証した研究。DPの遵守が悪性更新の統計的特徴を覆い隠し、既存防御を無力化することを実証的に示す。さらにこのマスキング効果を逆手に取り、DPを利用して悪性寄与を隠しつつ攻撃効果を最大化する手法RINGを提案。RINGは基盤となるバックドア手法に依存しない摂動層として機能するとする。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN 開発者ツール 抜粋
    Learning the Geometry of Data: A Mathematical Review of Shape Space Analysis
    データの幾何学を学ぶ ─ 形状空間解析の数理を体系的にレビュー
    コンピュータビジョン 深層学習 機械学習 ニューラルネットワーク 強化学習
    観測データが豊かな幾何形状を持つ「形状空間」を扱う研究を体系化した総説。生物・医療・人類学・CVなど多分野で重要となる微妙な幾何差を従来の機械学習が扱いにくい点を指摘し、微分幾何・統計・機械学習の知見を統合。形状の表現とパラメータ化や距離の構成など、共通の解析パイプラインに沿って急成長中の文献を整理する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN 安全性・評価 抜粋
    A Multi-Center Benchmark for Abdominal Disease Diagnosis and Report Generation from Non-Contrast CT
    非造影CTから腹部疾患診断と読影レポート生成を行うベンチマークを提案
    深層学習 検索拡張生成 (RAG)
    論文は、単相の非造影CT(NCCT)から造影所見を合成し、多臓器の腹部疾患診断と読影レポート自動生成を学習する多施設ベンチマークを提案。造影剤のリスクや撮影負担、読影医の負荷の軽減を狙う。2施設のNCCT–CECT対データを整備し、胸部特化・腹部特化・汎用マルチモーダルの5つの深層学習構成を統一プロトコルで評価したと述べる。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN 安全性・評価 抜粋
    Latent space mapping of interpretable structural coordinates from stochastic single-molecule signals
    ナノポア信号を対照学習で解釈可能な分子座標へ写像する手法を提案
    ナノポアは万能な単一分子センサだが、確率的な通過動態が符号化情報を歪めるため有用性が制約される。本研究は時間領域解析から、物理情報モデルのシミュレーション信号のみで訓練した対照学習エンコーダによる潜在空間写像へ移行。設計したDNAバーコードの固体ナノポア信号を解釈可能な分子座標系へ写像し、取得条件には不変で構造パラメータには応答する表現を学習するとする。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN 安全性・評価 抜粋
    A Unified Causal-Origin Taxonomy of Distributional Shifts in Reinforcement Learning
    強化学習の分布シフトを因果起源から統一的に分類する枠組みを提案
    強化学習
    強化学習は運用条件が学習時と異なると性能が劣化し、これはデータ生成過程の分布シフトを反映する。シフトは学習と評価の間(ID/OOD汎化)や環境動態が時間変化する非定常設定で生じうるが、両者の形式的関係は不明確で、既存研究は原因より緩和に偏っていた。本研究はエージェントと環境の相互作用内でシフトの因果起源を統一的に分類する分類体系を提案するとする。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.CL (Computation and Language) · EN 安全性・評価 抜粋
    IMPACTeen: Intentions, Manipulation, Persuasion, Annotations, and Consequences in Teen Communication Dataset
    思春期の社会的影響を扱うデータセット『IMPACTeen』を提案
    ニューラルネットワーク
    青少年を文脈とした対人・メディア・デジタル上の社会的影響シナリオを集めたデータセット『IMPACTeen』を提案した論文。1,021 テキストと 5,100 件の注釈レコードを含み、各テキストを10代・親・心理士・コミュニケーション専門家・教師の5視点から注釈したとする。制約付き LLM 生成と2段階の人手編集で構築し、ポーランド語と英語版を提供すると述べる。abstract ベースの中立要約。
    元記事を読む (arXiv cs.CL (Computation and Language)) ↗
  • arXiv cs.LG (Machine Learning) · EN 安全性・評価 抜粋
    Upper Bounds on the Generalization Error of Deep Learning Models via Local Robustness and Stability
    局所頑健性と安定性で深層学習の汎化誤差上界を精緻化する手法を提案
    深層学習 ニューラルネットワーク 強化学習
    頑健性に基づく汎化上界が実用設定で緩く無意味になりがちな問題を、不確実性項だけでなく頑健性項自体に起因すると分析。入力空間の部分領域ごとの安定・不安定サンプル数に応じて頑健性項をスケールする汎化上界を提案し、より締まった評価を与えると報告する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.LG (Machine Learning) · EN 安全性・評価 抜粋
    HawkesNest: A Multi-Axis Synthetic Benchmark for Spatiotemporal Pattern Complexity
    HawkesNest: 時空間点過程モデル評価の合成ベンチマークを提案
    強化学習 ソフトウェア工学
    時空間点過程(STPP)モデルの評価が不透明な実データに依存し失敗の原因特定が難しい問題に対し、多変量Hawkes基盤で複雑性を制御する合成ベンチマークHawkesNestを提案。時空間の絡みや背景の不均一性など4軸を潜在機構から決定論的に指標化し、診断的なストレステストを可能にすると報告する。
    元記事を読む (arXiv cs.LG (Machine Learning)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 業界導入・応用 抜粋
    Beyond Models: Reflections on Engineering AI-enabled Systems in a Project-Based Course
    AI搭載システムの工学教育を扱うプロジェクト型講義の実践を報告
    アルゴリズム・理論 機械学習 ニューラルネットワーク 強化学習 ソフトウェア工学
    AI搭載システムの工学教育が、現実的な制約下でAI部品を本格的なソフトウェアアーキテクチャへ統合する課題を扱う必要がある点に着目する論文。機械学習の講義がモデル開発に偏り学生が設計・配備・監視の経験を欠きがちな現状を踏まえ、ブレーメン大学の修士向けプロジェクト型講義の設計と実施を振り返り報告するとしている。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 安全性・評価 抜粋
    Robust Spoofed Speech Detection via Temporal Pyramid Modeling
    なりすまし音声検出へ多スケールのTemporal Pyramid Adapterを提案
    ニューラルネットワーク 音声処理
    合成音声や声質変換、リプレイ攻撃の高度化でなりすまし音声検出が難しく、データセット間の汎化が大きな制約となる点に着目する論文。受容野の異なる並列の時間的畳み込みで局所的痕跡から大域的な韻律の乱れまで多スケールに捉えるTemporal Pyramid Adapterを提案し、自己教師ありXLS-R表現と組み合わせるとしている。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 資金・M&A 抜粋
    ATOM-Bench: A Real-World Benchmark for Atomic Skills and Compositional Generalization in Manipulation Policies
    ロボット操作方策の原子的技能と合成的汎化を測るATOM-Benchを提案
    ファインチューニング 強化学習
    汎用的な操作方策がロボット制御の基盤モデルとして注目される一方、実世界での汎化の診断が難しい課題に着目する論文。提示済みタスクで成功しても細かな原子的技能の実行や新たな構成での再結合に失敗しうる点を踏まえ、原子的技能と合成的汎化の双方を評価する実世界ベンチATOM-Benchを提案するとしている。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗
  • arXiv cs.AI (Artificial Intelligence) · EN 安全性・評価 抜粋
    LabOSBench: Benchmarking Computer Use Agents for Scientific Instrument Control
    科学機器を操作するエージェント評価へ、模擬ベンチLabOSBenchを提案
    AI エージェント コンピュータビジョン
    既存のcomputer-useベンチが仮想環境のソフト操作に偏る一方、科学機器の操作は複雑な界面の協調制御やフィードバックに基づくパラメータ調整を要する点に着目する論文。実機評価のコストや安全性、再現性の制約を避けつつ現実的な操作課題を保つ模擬テスト環境LabOSBenchを提案するとしている。
    元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗