Nieuws

ConvApparel: Realism gap in user simulators meten en overbruggen

Google introduceert ConvApparel, een nieuw dataset en evaluatieframework om de 'realism gap' in LLM-gebaseerde user simulators te meten en te verbeteren. Het dataset bevat 4.000 mens-AI conversaties in de kledingsector en maakt gebruik van een dual-agent protocol om realistische gebruikersgedrag te simuleren. Met een drie-pillar validatiestrategie wordt de realistische aanpassingsvermogen van simulators getest, met als doel betere conversatieagenten te ontwikkelen die werkelijk gebruikers kunnen imiteren.

Bron: Google Research Blog

Originele taal: [en-us]

Lees hier het originele artikel