Developer Tools (Page 9 of 14)｜AI/Tech News Trends

arXiv cs.AI (Artificial Intelligence) · 2026-07-29 EN Safety & Evaluation

Cost-Sensitive Conformal Prediction and Human-in-the-Loop Abstention for Imbalanced High-Stakes Decision Support: A Multi-Domain Benchmark

Retrieval-Augmented Generation (RAG) Reinforcement Learning

Read original (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-29 EN Multimodal

DLAM: Distributional Latent Actions with Temporal Constraints

Computer Vision Deep Learning

Read original (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-29 EN Infrastructure & Hardware

Linguistic Monoculture in LLM-Assisted Language Use

Read original (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-29 EN Inference & Efficiency

Minimal Markovization via Stable Quotients in Holonomy-Cover Decision Processes

Inference Reinforcement Learning

Read original (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-29 EN New Model Releases

AgentMap: Joint Equivalence and Subsumption Discovery for Ontology Matching

Neural Network

Read original (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-29 EN New Model Releases

Hierarchical Spatio-Temporal Transformer for Coherent Emergency Department Forecasting

Neural Network Retrieval-Augmented Generation (RAG) Transformer

Read original (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-29 EN Developer Tools

Detecting seizure onset and offset times using human intelligence: A critical-transitions-based approach

Algorithms & Theory Machine Learning Neural Network

Read original (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-29 EN Developer Tools

Sky sphere representation in language models

Read original (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-29 EN New Model Releases

SciFigQual-Bench: A Benchmark for Scientific Figure Quality Assessment with Full-Manuscript Context

GPT Neural Network Retrieval-Augmented Generation (RAG) Reinforcement Learning

Read original (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-29 EN New Model Releases

MemSecBench: Tracking Agent Memory Poisoning from Persistence to Consequence and Repair

AI Agents

Read original (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-29 EN Infrastructure & Hardware

Field Codes for Distributed Coupling Samplers and Certified Empirical Transport

Embeddings

Read original (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-29 EN New Model Releases

Equilibrium Training of Energy-Based Models with Parallel Trajectory Tempering

Neural Network Reinforcement Learning

Read original (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-29 EN New Model Releases

Single-Beat Cuffless Blood Pressure Estimation Using Ear-PPG and ECG with a Lightweight Hybrid Learning Framework

Embeddings Neural Network Reinforcement Learning

Read original (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-29 EN Developer Tools

Parameter-Free Dynamic Regret for Online Convex Optimization under Heavy-Tailed Noise

Meta Neural Network

Read original (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-29 EN Multimodal

Visual Credit Audit for Multimodal Spatial Reasoning

Machine Learning Neural Network Software Engineering

Read original (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-29 EN Developer Tools

Setoka: A Benchmark for Hierarchical User Understanding in Personalized Agents over Heterogeneous Data

AI Agents Retrieval-Augmented Generation (RAG)

Read original (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-29 EN Inference & Efficiency

CoCaRS: Correlation Calibration-Based Redundancy Suppression for Heterogeneous Knowledge Distillation

Read original (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-29 EN Developer Tools

GPTQ-2D: Cubic-Time Two-Sided Adaptive Rounding

GPT

Read original (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-29 EN Inference & Efficiency

Mitigating Compounding Error via Video Representation Regularization

Inference Neural Network Reinforcement Learning Robotics

Read original (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-29 EN Industry Adoption

Lottery Tickets Are Not Deployment Tickets

Deep Learning Neural Network Reinforcement Learning from Human Feedback (RLHF)

Read original (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-29 EN New Model Releases

HoF-Bench: Rediscovering Real AI-Discovered CVEs Without Frontier Models

Computer Vision Neural Network Reinforcement Learning

Read original (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-29 EN New Model Releases

Evaluating Regional Bias in LLMs From Abstract Stereotype to Concrete Social Decision-Making

Deep Learning Reinforcement Learning

Read original (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-29 EN Multimodal

What Can Latent World Models Know? Physical Parameter Identifiability in Multimodal Predictive Representations

Retrieval-Augmented Generation (RAG) Reinforcement Learning Software Engineering

Read original (arXiv cs.LG (Machine Learning)) ↗

OpenAI Blog · 2026-07-29 EN New Model Releases extract

How enabling two settings tripled our scores on the ARC-AGI-3 benchmark

OpenAI triples ARC-AGI-3 scores by enabling two API settings

GPT

OpenAI reported that enabling two API settings tripled GPT-5.6's scores on the ARC-AGI-3 benchmark. By retaining reasoning across calls and tuning configuration, the setup improved both accuracy and efficiency, which the post breaks down in detail.

Read original (OpenAI Blog) ↗

arXiv cs.LG (Machine Learning) · 2026-07-29 EN Developer Tools

On the robustness of noisy solutions in non-convex neural networks

Neural Network Reinforcement Learning

Read original (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-29 EN New Model Releases

AgentSnare: Learning to Delay, Divert, and Defuse Autonomous Penetration Agents

AI Agents Computer Vision

Read original (arXiv cs.CL (Computation and Language)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-29 EN Infrastructure & Hardware

A Compositional Theory of Causally Masked Transformers

Embeddings Software Engineering Transformer

Read original (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.AI (Artificial Intelligence) · 2026-07-29 EN Developer Tools

SymmGrid: Super-Scaling On-Robot Learning with Parallelized Symmetries and Egocentric-Exocentric Visual Perception

Robotics

Read original (arXiv cs.AI (Artificial Intelligence)) ↗

arXiv cs.LG (Machine Learning) · 2026-07-29 EN Developer Tools

Using large language models to probe the limits of atom-centered structural descriptors

Read original (arXiv cs.LG (Machine Learning)) ↗

arXiv cs.CL (Computation and Language) · 2026-07-29 EN New Model Releases

OptimismBench: Forecasting Bias and the Alignment Effect in Language Model Judgment

Anthropic

Read original (arXiv cs.CL (Computation and Language)) ↗