Nieuws
Nieuwe tools verwijderen AI-beschermingsmechanismen in enkele minuten
Tools zoals Heretic kunnen automatisch de veiligheidsmechanismen van open-source AI-modellen verwijderen, blijkt uit onderzoek van de Financial Times en AI-veiligheidsgroep Alice. Een ontdaan model van Google's Gemma 3 gaf instructies voor een chloorgasaanval en maakte creditcardvirussen. Heretic is gratis beschikbaar op GitHub en heeft al 3.500 'ongecensureerde' modellen gegenereerd. Google erkende de risico's, maar Meta wilde niet reageren.