Nieuws

Begrijpen van neurale netwerken via sparse circuits

OpenAI onderzoekt mechanistische interpreteerbaarheid om te begrijpen hoe neurale netwerken redeneren. Het bedrijf ontwikkelt een nieuwe aanpak met sparse modellen die AI-systemen transparanter maken en veiligere, betrouwbaardere gedragingen ondersteunen. De methode leidt tot eenvoudige, ontknopenbare circuits die specifieke taken uitvoeren, zoals het herkennen van aanhalingstekens in Python-code.

Bron: OpenAI News

Originele taal: [en]

Lees hier het originele artikel

Dossier:

Ai Safety / veiligheid