学習・ファインチューニング (4 / 4 ページ)｜AI/Tech動向まとめ

arXiv cs.CL (Computation and Language) · 2026-07-28 EN 学習・ファインチューニング

Instruction-Tuned Models Locally Reuse Human Syntax More Than Humans Do

Llama 強化学習

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-28 EN 業界導入・応用

Empirical Evaluation of Out-Of-Distribution Performance of Tabular Foundation Models

深層学習ニューラルネットワーク強化学習

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-28 EN 学習・ファインチューニング

Physics-Aware End-to-End Deep Reinforcement Learning for Quadcopter Control with Actuator Dynamics

アルゴリズム・理論ニューラルネットワーク検索拡張生成 (RAG) 強化学習

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-28 EN 新モデル・リリース

Schrödinger's Cat: Probabilistic Representation and Prediction of Potential Scene Kinematics

ニューラルネットワーク強化学習

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-28 EN 新モデル・リリース

Detecting Knowledge Inconsistencies Across Text, Tables, and Knowledge Graphs

ニューラルネットワーク検索拡張生成 (RAG) ソフトウェア工学

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-28 EN 学習・ファインチューニング

Large Language Model for Operations Research Formulation Selection in Multi-Warehouse Inventory Allocation

ファインチューニング Meta

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-28 EN マルチモーダル

Evaluating VLMs for Autonomous Agent-Driven Geometry Clipping Detection in Video Game QA

AI エージェントコンピュータビジョン Gemini GPT Llama

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

Publickey · 2026-07-28 JA 新モデル・リリース抜粋

Google Cloud、AIが自律的にコードの脆弱性検出からサンドボックス内でのリスク検証、修正までを自動実行。「CodeMender」プレビュー公開

Google Cloud、脆弱性を自律検出・修正するAIエージェント「CodeMender」公開

AI エージェント Google 機械学習

Google Cloudは、コードの脆弱性を自律的に検出し、サンドボックス内でリスクを検証・報告した上で修正まで実行するAIエージェント「CodeMender」のプレビュー版を公開した。複雑な脆弱性の発見にも対応するとしており、セキュリティ対応の自動化を狙う。

元記事を読む (Publickey) ↗

arXiv cs.LG (Machine Learning) · 2026-07-28 EN マルチモーダル

HiFi-UMI: Learning Deployable Manipulation Policies from High-Fidelity UMI Data Alone

コンピュータビジョンニューラルネットワーク強化学習

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-28 EN 新モデル・リリース

DRIFT: Direct-Recursive Intervention-Conditioned Forecasting of ICU Physiological Trajectories

検索拡張生成 (RAG) 人間のフィードバックによる強化学習 (RLHF) Transformer

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-28 EN 学習・ファインチューニング

WALoMA: A Multitask Wireless Foundation Model via Adaptive Low-Rank Masked Autoencoders

深層学習ファインチューニングニューラルネットワーク検索拡張生成 (RAG)

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-28 EN 学習・ファインチューニング

Detecting CSAM Text-to-Image LoRAs From Weights

ファインチューニング推論 (Inference) Meta

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-28 EN 学習・ファインチューニング

Shared Voxel-Map-Based Cooperative Indoor UAV Guidance with a Multi-Agent Soft Actor-Critic Controller

ファインチューニングニューラルネットワーク強化学習

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-28 EN 新モデル・リリース

Localized Adaptation Reveals Distinct Learning Signatures in Transformers

深層学習ニューラルネットワーク強化学習 Transformer

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-28 EN 学習・ファインチューニング

MemSFT: Mitigating Alignment Tax with an External Parametric Memory

ファインチューニング

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-28 EN 新モデル・リリース

AMPBench-MT: A Homology-Controlled Benchmark for Antimicrobial Peptide Potency, Spectrum, and Safety Prediction

埋め込み (Embeddings) ニューラルネットワーク人間のフィードバックによる強化学習 (RLHF)

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-27 EN 学習・ファインチューニング

Towards Robust Reinforcement Learning for Small-Scale Language Model Agents

AI エージェントファインチューニングニューラルネットワーク強化学習

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-27 EN 学習・ファインチューニング

DS@GT ARC at CheckThat! 2026: LLM-Based Trace Ranking and Grouped Reward Modeling for Multilingual Numerical Claim Verification

強化学習

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-27 EN 学習・ファインチューニング

DataOrchestra: Learning to Orchestrate Per-Example Curation of Pretraining Data

機械学習ニューラルネットワーク検索拡張生成 (RAG)

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-27 EN 学習・ファインチューニング

Beyond Scale and Generation: Understanding Language Model-based Entity Matching

埋め込み (Embeddings) ファインチューニングニューラルネットワーク強化学習

元記事を読む (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-27 EN 業界導入・応用

Artificial Intelligence and Innovation Ecosystem: Evolutionary Developments, Challenges, and Future Directions

ニューラルネットワーク検索拡張生成 (RAG)

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-27 EN 推論・効率化

Evaluating Fuzz Testing for Reinforcement Learning Agents

AI エージェント検索拡張生成 (RAG) 強化学習ロボティクス

元記事を読む (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-27 EN 学習・ファインチューニング

The Visual Bottleneck: Sparse-Frame Adaptation of MLLMs for Joint Spatial-Temporal Video Grounding

ファインチューニング機械学習強化学習

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-27 EN 新モデル・リリース

EgoPlay: Event-Triggered Video Editing for Egocentric Streams

深層学習ファインチューニング推論 (Inference) ニューラルネットワーク Transformer

元記事を読む (arXiv cs.AI (Artificial Intelligence)) ↗