Nieuws

Introducing SimpleQA

OpenAI introduceert SimpleQA, een nieuw openbaar beschikbaar feitelijkheidstestset dat de capaciteit van taalmodellen beoordeelt om korte, feitzoekende vragen correct te beantwoorden. Het testset is ontworpen om hallucinaties te meten en is uitgebreid getest met meerdere AI-trainers om de kwaliteit te garanderen. De resultaten laten zien dat grotere modellen beter zijn in feitelijkheid en kalibratie, maar er blijft ruimte voor verbetering.

Bron: OpenAI News

Originele taal: [en]

Lees hier het originele artikel

Dossier:

Ai Safety / veiligheid