AI Safety Fundamentals: Alignment

Podcast tekijän mukaan BlueDot Impact

kokeile Podimo ilmaiseksi 90!!! päivän ajan

universumia joka on täynnä satoja podcasteja ja äänikirjoja, klikkaa tätä kokeillaksesi

83 Jaksot

Public by Default: How We Manage Information Visibility at Get on Board
Julkaistiin: 12.5.2024
Writing, Briefly
Julkaistiin: 12.5.2024
Being the (Pareto) Best in the World
Julkaistiin: 4.5.2024
How to Succeed as an Early-Stage Researcher: The “Lean Startup” Approach
Julkaistiin: 23.4.2024
Become a Person who Actually Does Things
Julkaistiin: 17.4.2024
Planning a High-Impact Career: A Summary of Everything You Need to Know in 7 Points
Julkaistiin: 16.4.2024
Working in AI Alignment
Julkaistiin: 14.4.2024
Computing Power and the Governance of AI
Julkaistiin: 7.4.2024
AI Control: Improving Safety Despite Intentional Subversion
Julkaistiin: 7.4.2024
Emerging Processes for Frontier AI Safety
Julkaistiin: 7.4.2024
AI Watermarking Won’t Curb Disinformation
Julkaistiin: 7.4.2024
Challenges in Evaluating AI Systems
Julkaistiin: 7.4.2024
Interpretability in the Wild: A Circuit for Indirect Object Identification in GPT-2 Small
Julkaistiin: 1.4.2024
Towards Monosemanticity: Decomposing Language Models With Dictionary Learning
Julkaistiin: 31.3.2024
Zoom In: An Introduction to Circuits
Julkaistiin: 31.3.2024
Weak-To-Strong Generalization: Eliciting Strong Capabilities With Weak Supervision
Julkaistiin: 26.3.2024
Can We Scale Human Feedback for Complex AI Tasks?
Julkaistiin: 26.3.2024
Machine Learning for Humans: Supervised Learning
Julkaistiin: 13.5.2023
Visualizing the Deep Learning Revolution
Julkaistiin: 13.5.2023
Four Background Claims
Julkaistiin: 13.5.2023

2 / 5

Listen to resources from the AI Safety Fundamentals: Alignment course!https://aisafetyfundamentals.com/alignment