Nieuws
HELM Arabic: een nieuw leaderboard voor het evalueren van grote taalmodellen op het Arabisch
Stanford introduceert HELM Arabic, een leaderboard voor het transparante en herhaalbare evalueren van grote taalmodellen (LLMs) op Arabisch. Het leaderboard is samengesteld in samenwerking met Arabic.AI en bevat zeven benchmarks, waaronder AlGhafa en ArabicMMLU. De evaluatie toont aan dat modellen zoals Arabic.AI LLM-X en Qwen3 235B A22B Instruct 2507 FP8 uitstekend presteren op Arabisch.