Nieuws
AI-nieuws 4-5 juni 2026: nieuwe modellen, agent-benchmarks en RSI-ontwikkelingen
Anthropic's Claude Mythos en Opus 4.8 domineerden de discussie, terwijl Sakana AI een RSI Lab opende in Tokio. Nieuwe benchmarks zoals Agents' Last Exam en SWE-Marathon testen agenten op langdurige taken. Google bracht Gemma 4 QAT uit voor efficiënte lokale inferentie, en Ideogram 4 verscheen als open-weight diffusiemodel. Onderzoek van Princeton toont aan dat frontier modellen nog niet betrouwbaar genoeg zijn voor productie.