Nieuws
HELM Arabic Enterprise
Stanford CRFM lanceert HELM Arabic Enterprise, een leaderboard voor transparante en reproduceerbare evaluatie van grote taalmodellen op Arabische benchmarks voor zakelijke toepassingen. Het leaderboard is ontwikkeld in samenwerking met Arabic.AI en bouwt voort op de HELM-methodologie. Het evalueert modellen op contentgeneratie, financieel redeneren en juridische vraagbeantwoording. Arabic.AI LLM-X behaalde de hoogste gemiddelde score, gevolgd door Gemma 4 31B Instruct.