Nieuws

CriticGPT helpt trainers bij het herkennen van fouten in ChatGPT-antwoorden

OpenAI heeft een model genaamd CriticGPT ontwikkeld, gebaseerd op GPT-4, dat fouten in ChatGPT-antwoorden herkent en opmerkingen geeft om trainers te helpen bij het verbeteren van de modellen via RLHF. In experimenten bleek dat trainers met hulp van CriticGPT 60% van de tijd betere resultaten behaalden dan zonder hulp. Het model wordt onderzocht voor integratie in de RLHF-labeling-pijplijn van OpenAI.

Bron: OpenAI News

Originele taal: [en]

Lees hier het originele artikel

Dossier:

Ai Safety / veiligheid