Nieuws
Mijn workflow voor het begrijpen van LLM-architecturen
De auteur deelt zijn workflow voor het begrijpen van de architectuur van open-weigh models, waarbij hij begint met technische rapporten en gebruik maakt van Hugging Face en de Python-transformers-bibliotheek. De methode is vooral gericht op open-weigh modellen en is handmatig, hoewel delen automatiserbaar zijn. De workflow helpt bij het leren van de interne werking van deze modellen.