Nieuws
Verbeter de tool-calling nauwkeurigheid van uw AI-agent met SFT en DPO op Amazon SageMaker AI
Een nieuwe blogpost van AWS laat zien hoe Supervised Fine-Tuning (SFT) en Direct Preference Optimization (DPO) de tool-calling nauwkeurigheid van kleine taalmodellen kunnen verbeteren. De methode maakt gebruik van Amazon SageMaker AI training jobs om Qwen3 1.7B te finetunen. Evaluatie toont een nauwkeurigheidswinst van 30% ten opzichte van het basismodel en prestaties die beter zijn dan Llama-3.2-3B.