Nieuws

HELM Arabic Enterprise

Stanford CRFM lanceert HELM Arabic Enterprise, een leaderboard voor transparante en reproduceerbare evaluatie van grote taalmodellen op Arabische benchmarks voor zakelijke toepassingen. Het leaderboard is ontwikkeld in samenwerking met Arabic.AI en bouwt voort op de HELM-methodologie. Het evalueert modellen op contentgeneratie, financieel redeneren en juridische vraagbeantwoording. Arabic.AI LLM-X behaalde de hoogste gemiddelde score, gevolgd door Gemma 4 31B Instruct.

Bron: Stanford CRFM

Originele taal: [en]

Lees hier het originele artikel