Nieuws

Onvoorspelbaarheid van probabilistische AI-veiligheid getest met nieuw deterministisch systeem HERE

Een artikel op Towards AI presenteert testresultaten van HERE, een prototype voor een nieuwe deterministische AI-veiligheidsarchitectuur. HERE evalueert uitwisselingen tussen mens en AI-model onafhankelijk en geeft elke keer dezelfde beoordeelbare uitslag, in tegenstelling tot probabilistische systemen zoals Claude en Gemini. De auteur voerde 294 prompts uit en slechts één systeem gaf consequent hetzelfde oordeel.

Bron: Towards AI

Originele taal: [en]

Lees hier het originele artikel

Dossier:

Ai Safety / veiligheid