Nieuws

Normering van meervoudige keuze-evaluatie bij taalmodellen

Verschillende methoden om meervoudige keuze-taken te evalueren bij autoregressieve taalmodellen zoals GPT-3. Het legt uit hoe ongenormaliseerde, token-lengte genormaliseerde, byte-lengte genormaliseerde en onvoorwaardelijke waarschijnlijkheid genormaliseerde scores worden berekend en waar ze worden toegepast.

Bron: EleutherAI Blog

Originele taal: [en-us]

Lees hier het originele artikel