Best AI papers explained

Podcast tekijän mukaan Enoch H. Kang

kokeile Podimo ilmaiseksi 90!!! päivän ajan

universumia joka on täynnä satoja podcasteja ja äänikirjoja, klikkaa tätä kokeillaksesi

525 Jaksot

The Coverage Principle: How Pre-Training Enables Post-Training
Julkaistiin: 24.10.2025
The Era of Real-World Human Interaction: RL from User Conversations
Julkaistiin: 24.10.2025
Agent Learning via Early Experience
Julkaistiin: 24.10.2025
Demystifying the Mechanisms Behind Emergent Exploration in Goal-conditioned RL
Julkaistiin: 22.10.2025
Rewriting History: A Recipe for Interventional Analyses to Study Data Effects on Model Behavior
Julkaistiin: 22.10.2025
A Definition of AGI
Julkaistiin: 22.10.2025
Provably Learning from Language Feedback
Julkaistiin: 21.10.2025
In-Context Learning for Pure Exploration
Julkaistiin: 21.10.2025
On the Role of Preference Variance in Preference Optimization
Julkaistiin: 20.10.2025
Training LLM Agents to Empower Humans
Julkaistiin: 20.10.2025
Richard Sutton Declares LLMs a Dead End
Julkaistiin: 20.10.2025
Demystifying Reinforcement Learning in Agentic Reasoning
Julkaistiin: 19.10.2025
Emergent coordination in multi-agent language models
Julkaistiin: 19.10.2025
Learning-to-measure: in-context active feature acquisition
Julkaistiin: 19.10.2025
Andrej Karpathy's insights: AGI, Intelligence, and Evolution
Julkaistiin: 19.10.2025
Front-Loading Reasoning: The Synergy between Pretraining and Post-Training Data
Julkaistiin: 18.10.2025
Representation-Based Exploration for Language Models: From Test-Time to Post-Training
Julkaistiin: 18.10.2025
The attacker moves second: stronger adaptive attacks bypass defenses against LLM jail- Breaks and prompt injections
Julkaistiin: 18.10.2025
When can in-context learning generalize out of task distribution?
Julkaistiin: 16.10.2025
The Art of Scaling Reinforcement Learning Compute for LLMs
Julkaistiin: 16.10.2025

2 / 27

Cut through the noise. We curate and break down the most important AI papers so you don’t have to.

Visit the podcast's native language site

525 Jaksot

The Coverage Principle: How Pre-Training Enables Post-Training

The Era of Real-World Human Interaction: RL from User Conversations

Agent Learning via Early Experience

Demystifying the Mechanisms Behind Emergent Exploration in Goal-conditioned RL

Rewriting History: A Recipe for Interventional Analyses to Study Data Effects on Model Behavior

A Definition of AGI

Provably Learning from Language Feedback

In-Context Learning for Pure Exploration

On the Role of Preference Variance in Preference Optimization

Training LLM Agents to Empower Humans

Richard Sutton Declares LLMs a Dead End

Demystifying Reinforcement Learning in Agentic Reasoning

Emergent coordination in multi-agent language models

Learning-to-measure: in-context active feature acquisition

Andrej Karpathy's insights: AGI, Intelligence, and Evolution

Front-Loading Reasoning: The Synergy between Pretraining and Post-Training Data

Representation-Based Exploration for Language Models: From Test-Time to Post-Training

The attacker moves second: stronger adaptive attacks bypass defenses against LLM jail- Breaks and prompt injections

When can in-context learning generalize out of task distribution?

The Art of Scaling Reinforcement Learning Compute for LLMs