Nieuws

Het Bouwen van Supervised Fine-Tuning Data uit NVIDIA Open-SWE-Traces: Trajectory Parsing, Patch Analysis, Token Budgets en Tool-Use Metrics

In deze tutorial wordt de Open-SWE-Traces dataset van NVIDIA gebruikt om agentische software-engineering trajecten te analyseren en voor te bereiden voor fine-tuning. De dataset wordt gestreamd vanaf Hugging Face en er worden analyse DataFrames gemaakt om trajectlengte, toolgebruik, patchgrootte en taalverdeling te begrijpen. Op basis van deze inzichten wordt een samengestelde supervised fine-tuning subset gecreëerd door alleen hoge kwaliteit trajecten te selecteren op basis van succescriteria, tokenlimieten en beschikbaarheid van patches.

Bron: MarkTechPost

Originele taal: [en-US]

Lees hier het originele artikel

Dossier: