Nieuws
Google DeepMind lanceert verbeterde benchmark voor AI-ontwikkeling
Google DeepMind introduceert SimpleQA Verified, een verbeterde benchmark om Large Language Models (LLMs) beter te evalueren op feitelijke kennis en kwaliteit. De benchmark richt zich op het opsporen van beperkingen zoals onnauwkeurige labels en topische bias, om zo betrouwbaardere AI-systemen te bevorderen.