Nieuws
Gray Swan-oprichters Zico Kolter en Matt Fredrikson over AI red-teaming na Mythos
In een aflevering van de Latent Space-podcast bespreken Gray Swan-oprichters Zico Kolter en Matt Fredrikson de staat van AI red-teaming na de Amerikaanse exportcontrole op Mythos. Ze introduceren Shade, een geautomatiseerd red-teamingmodel dat beter is dan mensen in het kraken van AI-systemen. Ook waarschuwen ze voor een nieuwe kwetsbaarheidsklasse voor agenten zoals Codex en Claude Code door indirecte prompt-injectie. De volgende grote AI-incident kan een 'grijze zwaan' zijn: onwaarschijnlijk maar duidelijk zichtbaar voordat het gebeurt.