Nieuws
ConvApparel: Realism gap in user simulators meten en overbruggen
Google introduceert ConvApparel, een nieuw dataset en evaluatieframework om de 'realism gap' in LLM-gebaseerde user simulators te meten en te verbeteren. Het dataset bevat 4.000 mens-AI conversaties in de kledingsector en maakt gebruik van een dual-agent protocol om realistische gebruikersgedrag te simuleren. Met een drie-pillar validatiestrategie wordt de realistische aanpassingsvermogen van simulators getest, met als doel betere conversatieagenten te ontwikkelen die werkelijk gebruikers kunnen imiteren.