Nieuws

HELM Arabic: een nieuw leaderboard voor het evalueren van grote taalmodellen op het Arabisch

Stanford introduceert HELM Arabic, een leaderboard voor het transparante en herhaalbare evalueren van grote taalmodellen (LLMs) op Arabisch. Het leaderboard is samengesteld in samenwerking met Arabic.AI en bevat zeven benchmarks, waaronder AlGhafa en ArabicMMLU. De evaluatie toont aan dat modellen zoals Arabic.AI LLM-X en Qwen3 235B A22B Instruct 2507 FP8 uitstekend presteren op Arabisch.

Bron: Stanford CRFM

Originele taal: [en]

Lees hier het originele artikel