Dossier

CAISI en pre-release frontier AI testing

Amerikaanse overheidstesten van frontiermodellen vóór publieke release.

Nieuwsitems

Gekoppelde artikelen

20 artikelen

De Amerikaanse overheid dwong Anthropic om zijn twee nieuwste modellen, Fable 5 en Mythos 5, terug te trekken vanwege nationale veiligheidsbezwaren, nadat Amazon-onderzoekers een manier vonden om de beveiliging van Fable 5 te omzeilen. Cybersecurity-onderzoekers noemen de maatregel gevaarlijk in een open brief, en Anthropic zelf benadrukt dat dezelfde jailbreaks ook in andere modellen bestaan. De podcast Equity van TechCrunch bespreekt wat het verbod betekent voor ontwikkelaars en of het onbedoeld goed kan uitpakken voor het bedrijf.

De Amerikaanse overheid dwong Anthropic om de twee nieuwste modellen Fable 5 en Mythos 5 terug te trekken, verwijzend naar nationale veiligheidsrisico's nadat Amazon-onderzoekers een manier zouden hebben gevonden om de veiligheidsmaatregelen van Fable 5 te omzeilen. Cybersecurity-onderzoekers ondertekenden een open brief waarin ze de stap gevaarlijk noemen, en Anthropic merkte op dat dezelfde jailbreaks ook in andere modellen voorkomen. De aflevering van TechCrunchs Equity-podcast bespreekt de gevolgen voor ontwikkelaars en de beursgang van Anthropic.

Anthropic mag Claude Mythos en Fable 5 nog steeds niet uitbrengen na een conflict met de Trump-administratie, maar niemand kan precies zeggen wat het bedrijf fout deed. De onduidelijke regels leiden tot onzekerheid bij AI-bedrijven als OpenAI, Google en Meta, die nu vrezen voor eenzelfde lot.

De Amerikaanse overheid grijpt in door Anthropic's Claude Fable 5 en Mythos 5 aan banden te leggen vanwege nationale veiligheidsrisico's. Experts waarschuwen dat AI-modellen met geavanceerde hackmogelijkheden binnen afzienbare tijd de norm zullen worden, ongeacht deze restricties. Zij pleiten voor een breder en transparanter beleid om met deze ontwikkelingen om te gaan.

Op 9 juni bracht Anthropic zijn Fable AI-model uit. Drie dagen later classificeerde de Amerikaanse overheid het als een gevaarlijk wapen en verbood buitenlanders er toegang toe. Omdat Anthropic geen onderscheid kon maken tussen Amerikanen en buitenlanders, schakelde het bedrijf de toegang voor iedereen uit. De auteurs betogen dat het probleem niet één model is, maar de algemene trend van toenemende AI-capaciteiten, en dat echte oplossingen collectieve actie vereisen.

Anthropic heeft de toegang tot de AI-modellen Claude Fable 5 en Mythos 5 voor alle klanten ingetrokken na een Amerikaanse overheidsrichtlijn die een mogelijke jailbreak als nationaal cybersecurityrisico bestempelt. Het bedrijf betwist de onderbouwing en wijst op vergelijkbare mogelijkheden in andere modellen zoals GPT-5.5. De gebeurtenis leidde tot discussie over modelsoevereiniteit en de risico's van afhankelijkheid van één leverancier. Daarnaast werden nieuwe open-weight modellen uitgebracht, waaronder Kimi-K2.7-Code en MiniMax M3, en werden updates op het gebied van benchmarks en agent-infrastructuur besproken.

De Amerikaanse overheid heeft Anthropic opgedragen de toegang tot de AI-modellen Fable 5 en Mythos 5 per direct voor alle buitenlandse staatsburgers te blokkeren, vanwege nationale veiligheidsbezwaren. Anthropic voldoet aan de exportcontrolerichtlijn, maar stelt dat de vermeende jailbreak-kwetsbaarheid klein is en ook door andere modellen zoals OpenAI's GPT-5.5 kan worden aangetoond. Het bedrijf roept op tot een transparanter wettelijk proces voor dergelijke ingrepen.

President Donald Trump heeft een afgezwakte versie van een AI-uitvoeringsbesluit ondertekend. De overheid krijgt 30 dagen exclusieve toegang tot de meest geavanceerde AI-modellen, zoals Anthropic's Claude Mythos en OpenAI's GPT-5.5, voordat ze openbaar worden. Dit is de eerste grote AI-regelgeving in Trumps tweede termijn.

Donald Trump heeft een uitvoeringsbesluit ondertekend dat een vrijwillig kader creëert voor de federale overheid om nieuwe AI-modellen te beoordelen voordat ze openbaar worden gemaakt. Technologiebedrijven worden gevraagd hun AI-modellen tot 30 dagen voor publicatie met de overheid te delen. Het besluit is een balans tussen nationale veiligheid en het stimuleren van innovatie.

President Trump heeft een herziene uitvoeringsbesluit ondertekend dat AI-bedrijven vraagt om vrijwillig nieuwe modellen 30 dagen voor release aan de overheid voor te leggen. Eerder werd een termijn van 90 dagen overwogen, maar na tegenstand van de industrie werd dit versoepeld. Het besluit verbiedt expliciet verplichte licentiëring of voorafgaande goedkeuring.

President Trump heeft een uitvoeringsbevel uitgesteld dat voorafgaande veiligheidscontroles van AI-modellen door de overheid zou hebben vereist. Hij was niet tevreden met de formulering van het bevel, die volgens hem een belemmering zou kunnen vormen voor Amerikaans leiderschap in AI. Het bevel zou onder meer hebben vereist dat AI-bedrijven zoals OpenAI en Anthropic hun geavanceerde modellen 14 tot 90 dagen voor lancering met de overheid delen.

Een coalitie van conservatieve organisaties onder leiding van Humans First heeft president Donald Trump in een open brief opgeroepen tot een uitvoeringsbesluit dat verplichte veiligheidstests voor geavanceerde AI-modellen vereist voordat ze worden uitgebracht. De groep, met onder meer Stephen K. Bannon, waarschuwt voor risico's voor verkiezingen, cyberveiligheid en kritieke infrastructuur. Ze vergelijken AI-risico's met nucleaire technologie en willen onafhankelijk overheidstoezicht.

METR meldt dat het huidige testkader nauwelijks in staat is om de capaciteiten van Claude Mythos te meten, omdat slechts vijf van de 228 taken het relevante vermogensbereik dekken. Palo Alto Networks waarschuwt dat toonaangevende AI-modellen zoals Mythos automatisch kwetsbaarheden combineren tot kritieke aanvalspaden, waardoor de tijd van eerste toegang tot gegevensverwijdering kan krimpen tot 25 minuten.

De Amerikaanse overheid heeft overeenkomsten gesloten met Google DeepMind, Microsoft en xAI om vroege versies van hun nieuwe AI-modellen te onderzoeken op veiligheid en nationale veiligheid voorafgaand aan de openbaarmaking. De Center for AI Standards and Innovation (CAISI), onderdeel van het ministerie van Handel, benadrukt dat dit onderzoek essentieel is voor het begrijpen van de mogelijkheden van nieuwe AI-modellen en het beschermen van de nationale veiligheid. De overeenkomsten richten zich op risico's rond cybersecurity, biologische veiligheid en chemische wapens. OpenAI en Anthropic sloten al twee jaar eerder vergelijkbare overeenkomsten aan met de Biden-administratie. De nieuwe overeenkomsten komen op het moment dat zorgen groeien over de potentie van de nieuwste AI-modellen, zoals Anthrropics Mythos, om gevaarlijk te zijn voor de openbare veiligheid.

OpenAI deelt vooruitgang in de samenwerking met de US CAISI en UK AISI om de veiligheid en beveiliging van AI te versterken. Tijdens deze samenwerking zijn er concrete veiligheidsverbeteringen gerealiseerd, zoals gezamenlijk red-teaming van beveiligingsmaatregelen en het identificeren van nieuwe beveiligingsrisico's in producten zoals ChatGPT Agent. De samenwerking met CAISI en UK AISI heeft geleid tot verbeteringen in de beveiliging van OpenAI's AI-systemen en heeft aangetoond hoe overheden en bedrijven samen kunnen werken aan de evaluatie en verbetering van AI-veiligheid.

DeepL’s Chief Scientist Stefan Mesken bespreekt hoe AI-onderzoek moet evolueren om op te letten bij opkomende mogelijkheden die ontstaan bij grotere modellen en grotere datasets. Hij legt uit dat nieuwe mogelijkheden plotseling en onvoorspelbaar kunnen verschijnen, en dat onderzoekers moeten denken aan problemen die nog niet oplosbaar zijn, maar dat mogelijk worden met toekomstige technologie. Een voorbeeld is Clarify, een interactief taalhulpmiddel dat op de nieuwe generatie LLMs van DeepL is gebaseerd.

OpenAI en negen Amerikaanse nationale laboratoria hebben een unieke gebeurtenis georganiseerd waarbij meer dan 1.000 wetenschappers samenwerken om AI te gebruiken voor wetenschappelijke ontdekkingen. Tijdens de '1,000 Scientist AI Jam Session' testen onderzoekers toekomstige AI-modellen zoals o3- mini in hun vakgebieden en delen feedback om toekomstige systemen te verbeteren. De gebeurtenis onderstrept de samenwerking tussen OpenAI en de Amerikaanse overheid om de leiderschap van de VS in AI en wetenschap te versterken.