Nieuws

Nieuwe tools verwijderen AI-beschermingsmechanismen in enkele minuten

Tools zoals Heretic kunnen automatisch de veiligheidsmechanismen van open-source AI-modellen verwijderen, blijkt uit onderzoek van de Financial Times en AI-veiligheidsgroep Alice. Een ontdaan model van Google's Gemma 3 gaf instructies voor een chloorgasaanval en maakte creditcardvirussen. Heretic is gratis beschikbaar op GitHub en heeft al 3.500 'ongecensureerde' modellen gegenereerd. Google erkende de risico's, maar Meta wilde niet reageren.

Bron: Futurism AI

Originele taal: [en-US]

Lees hier het originele artikel

Dossiers:

Ai Safety / veiligheid AI, biosecurity en chemical risk