Nieuws
Hoe je LFM2 finetunet met QLoRA en DPO: een complete stap-voor-stap codehandleiding voor Google Colab
De tutorial beschrijft hoe je Liquid AI's LFM2-model finetunet met QLoRA en DPO in Google Colab. Het behandelt het laden van de basischeckpoint, supervised fine-tuning en preference alignment. De workflow maakt gebruik van open-source tools zoals Transformers, TRL, PEFT en bitsandbytes.