Nieuws
OpenAI onderzoekt beperkte controle over redeneerprocessen van AI-modellen
OpenAI introduceert CoT-Control, een open-source evaluatie-tool om te meten hoe goed modellen hun redeneerprocessen kunnen beheersen. Het onderzoek toont aan dat huidige modellen moeite hebben om hun redeneerstappen te beheersen, wat goed nieuws is voor de veiligheid van AI-systemen. De resultaten suggereren dat de controle over redeneerprocessen momenteel geen groot risico vormt voor de monitoren van AI.