Nieuws
Het Bouwen van Supervised Fine-Tuning Data uit NVIDIA Open-SWE-Traces: Trajectory Parsing, Patch Analysis, Token Budgets en Tool-Use Metrics
In deze tutorial wordt de Open-SWE-Traces dataset van NVIDIA gebruikt om agentische software-engineering trajecten te analyseren en voor te bereiden voor fine-tuning. De dataset wordt gestreamd vanaf Hugging Face en er worden analyse DataFrames gemaakt om trajectlengte, toolgebruik, patchgrootte en taalverdeling te begrijpen. Op basis van deze inzichten wordt een samengestelde supervised fine-tuning subset gecreëerd door alleen hoge kwaliteit trajecten te selecteren op basis van succescriteria, tokenlimieten en beschikbaarheid van patches.