Nieuws

Verbeter de tool-calling nauwkeurigheid van uw AI-agent met SFT en DPO op Amazon SageMaker AI

Een nieuwe blogpost van AWS laat zien hoe Supervised Fine-Tuning (SFT) en Direct Preference Optimization (DPO) de tool-calling nauwkeurigheid van kleine taalmodellen kunnen verbeteren. De methode maakt gebruik van Amazon SageMaker AI training jobs om Qwen3 1.7B te finetunen. Evaluatie toont een nauwkeurigheidswinst van 30% ten opzichte van het basismodel en prestaties die beter zijn dan Llama-3.2-3B.

Bron: AWS Machine Learning Blog

Originele taal: [en-US]

Lees hier het originele artikel

Dossier:

AI-coding agents: Cursor, Claude Code, Copilot