学習・ファインチューニング (3 / 4 ページ)｜AI/Tech動向まとめ

arXiv cs.CL (Computation and Language) · 2026-07-29 EN 開発者ツール

SpecFirst: Behavioral Specification Elicitation as a First-Class Step in Agent-Based Program Synthesis from Scratch

AI エージェントニューラルネットワーク強化学習ソフトウェア工学

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-29 EN マルチモーダル

Anatomy Contextualized Adaption of CT Foundation Models

コンピュータビジョン埋め込み (Embeddings) 強化学習 Transformer

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-29 EN 新モデル・リリース

MindForge: Teaching Small Language Models Whole-Life-Cycle Software Engineering via Source-Free Program Synthesis

AI エージェントファインチューニングニューラルネットワーク検索拡張生成 (RAG) ソフトウェア工学

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-29 EN 新モデル・リリース

InferScale: GPU-Native KV Injection for Personalized LLM Serving

深層学習埋め込み (Embeddings) ファインチューニング GPT 推論 (Inference)

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-29 EN 安全性・評価

On-Policy Distillation for LLM Safety: A Routing Approach to Template-Robust Realignment

ファインチューニングニューラルネットワーク

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-29 EN 学習・ファインチューニング

ScratchSim: A Procedural Synthetic Data Pipeline for Surface Scratch Detection

ファインチューニングニューラルネットワーク Transformer

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-29 EN 業界導入・応用

Lottery Tickets Are Not Deployment Tickets

深層学習ニューラルネットワーク人間のフィードバックによる強化学習 (RLHF)

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

Publickey · 2026-07-29 JA 学習・ファインチューニング抜粋

KubernetesはAIを動かすプラットフォームに。横浜でKubeCon＋CloudNativeCon Japan 2026が開幕

KubeCon Japan 2026 が横浜で開幕、K8s が AI 基盤に

機械学習

クラウドネイティブ技術の国内最大級イベント『KubeCon＋CloudNativeCon Japan 2026』が2026年7月29日、パシフィコ横浜で開幕した。KubernetesをAIワークロードを動かす基盤と位置づける潮流が主題として掲げられている。※抜粋は冒頭で途切れており、基調講演やセッションの具体的内容・登壇者は確認できない。

元記事を読む (Publickey) ↗

arXiv cs.LG (Machine Learning) · 2026-07-29 EN マルチモーダル

Foundation Models for Face Presentation Attack Detection: A Unified Linear-Probing Benchmark

コンピュータビジョンニューラルネットワーク Transformer

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-29 EN 新モデル・リリース

Latent-IM: Latent Interaction Management for Speech LLMs

ファインチューニング検索拡張生成 (RAG) 音声処理

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-29 EN 新モデル・リリース

Temporally Centered SIGReg Improves Multi-Task LeWorldModel Learning: From Analysis to Method

検索拡張生成 (RAG) 強化学習

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-29 EN 新モデル・リリース

BioVLN: A Simulation Platform for Visual Language Navigation in Biomedical Laboratories

AI エージェント

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-29 EN 推論・効率化

DIRECT: Direct Decoding for Efficient and Aligned Sequence Labeling with Large Language Models

ファインチューニング推論 (Inference) 人間のフィードバックによる強化学習 (RLHF)

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-29 EN 新モデル・リリース

SERPO: Self-Evolving Rubric Policy Optimization for Open-Ended Test-Time Reinforcement Learning

推論 (Inference) ニューラルネットワーク検索拡張生成 (RAG) 強化学習ソフトウェア工学

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-29 EN マルチモーダル

Amortized Moment Matching for Visual Generation

ニューラルネットワーク

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-29 EN 新モデル・リリース

Budget-Aware LLM Discovery via Cost-Calibrated Frontier Utility

GPT 推論 (Inference)

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-29 EN インフラ・ハードウェア

When Does Span-Guided Detoxification Help? Human Preferences and Evaluator Diagnostics in a Controlled Comparison

機械学習ニューラルネットワーク強化学習

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-29 EN 新モデル・リリース

Enhancing Generative Information Extraction with Two-step Validation: A Product Attribute Use Case

ファインチューニング Llama 検索拡張生成 (RAG) 強化学習

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-29 EN 学習・ファインチューニング

FARI: Robust One-Step Inversion for Watermarking in Diffusion Models

深層学習ファインチューニングニューラルネットワーク

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-29 EN 学習・ファインチューニング

Constitutional Midtraining: Content Presence Drives Alignment Gains

Anthropic ファインチューニング機械学習検索拡張生成 (RAG)

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-29 EN 推論・効率化

Filesystem-Based Memory for LLM Agents: Organization, Evolution, and Sustainability

AI エージェントソフトウェア工学

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-29 EN 学習・ファインチューニング

FedWeave: Rethinking the Unit of Specialization in Heterogeneous Federated MoE-LoRA

推論 (Inference) Mixture of Experts (MoE) 検索拡張生成 (RAG) 強化学習

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-29 EN 安全性・評価

Prosody-driven Jailbreaks in Audio LLMs: A Controlled Study and Mechanistic Analysis

GPT 音声処理

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-29 EN 学習・ファインチューニング

Misalignment Has a Personality: A Big Five Account of Emergent Misalignment

深層学習ファインチューニング強化学習ソフトウェア工学

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-29 EN 新モデル・リリース

Diagnosing Fine-Grained Inconsistency Classification in Financial Disclosure Text

埋め込み (Embeddings) GPT

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-28 EN 学習・ファインチューニング

Dissecting Sensitivity to Training Language in Self-Supervised Speech Learning Using Neural Audio Codec Tokens

検索拡張生成 (RAG) 音声処理

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

Simon Willison's Weblog · 2026-07-28 EN 学習・ファインチューニング抜粋

Quoting Akshat Bubna

Modal CTO、顧客の無認証エンドポイント悪用を証言――基盤は無侵害と強調

OpenAI 人間のフィードバックによる強化学習 (RLHF)

Simon Willison氏がModalのCTO、Akshat Bubna氏のReutersでの発言を引用。あるModal顧客が無認証のエンドポイントを公開しており、誰でもそのサンドボックスでコード実行できる状態だったため、これが「rogue agent（暴走エージェント）」に悪用されたと説明。ただしModalのプラットフォームや分離機構自体が侵害されたわけではないと強調している。事案の詳細な背景はexcerpt外。

元記事を読む (Simon Willison's Weblog) ↗

arXiv cs.LG (Machine Learning) · 2026-07-28 EN 新モデル・リリース

Spend Experts Where You Are Unsure: Confidence-Adaptive Routing for Mixture-of-Experts LoRA

Llama Mixture of Experts (MoE) 検索拡張生成 (RAG)

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-28 EN 新モデル・リリース

Falling Behind Drives Unsafe Development in an Idealised AI Race Experiment

深層学習

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-28 EN マルチモーダル

CHARM: A Multimodal Graph Foundation Model with Hierarchical Context Modeling for Zero-Shot Transfer

ファインチューニングニューラルネットワーク強化学習