Nieuws
MIT ontwikkelt methode om AI-modellen te leren ‘ik ben niet zeker’ te zeggen
Onderzoekers van MIT hebben een nieuwe methode ontwikkeld genaamd RLCR (Reinforcement Learning with Calibration Rewards), die AI-modellen leert om bij hun antwoorden een mate van zekerheid te geven. De methode verbetert de kalibratie van AI-modellen met tot 90 procent zonder de accuraatheid te verliezen. De techniek maakt gebruik van een Brier-score om de afstand tussen de verklaarde zekerheid en de werkelijke accuraatheid te beoordelen. De methode wordt gepresenteerd op de International Conference on Learning Representations.