Nieuws

Google DeepMind lanceert verbeterde benchmark voor AI-ontwikkeling

Google DeepMind introduceert SimpleQA Verified, een verbeterde benchmark om Large Language Models (LLMs) beter te evalueren op feitelijke kennis en kwaliteit. De benchmark richt zich op het opsporen van beperkingen zoals onnauwkeurige labels en topische bias, om zo betrouwbaardere AI-systemen te bevorderen.

Bron: Google DeepMind

Originele taal: [en]

Lees hier het originele artikel

Dossier:

Ai Safety / veiligheid