Nieuws

AI-nieuws 4-5 juni 2026: nieuwe modellen, agent-benchmarks en RSI-ontwikkelingen

Anthropic's Claude Mythos en Opus 4.8 domineerden de discussie, terwijl Sakana AI een RSI Lab opende in Tokio. Nieuwe benchmarks zoals Agents' Last Exam en SWE-Marathon testen agenten op langdurige taken. Google bracht Gemma 4 QAT uit voor efficiënte lokale inferentie, en Ideogram 4 verscheen als open-weight diffusiemodel. Onderzoek van Princeton toont aan dat frontier modellen nog niet betrouwbaar genoeg zijn voor productie.

Bron: Latent Space

Originele taal: [en]

Lees hier het originele artikel

Dossiers:

Anthropic Claude Mythos / Fable 5 Ai Safety / veiligheid Open models, lokale AI en privacy