Nieuws
Diepgaande blik op kalibratie van taalmodellen: Platt Scaling, Isotone Regressie en Temperatuur Scaling
Drie post-hoc methoden om de kloof tussen vertrouwen en nauwkeurigheid in taalmodellen te dichten: temperatuur scaling, Platt scaling en isotone regressie. Het legt uit hoe deze methoden werken, hun voor- en nadelen in de context van LLM's, en geeft praktische aanbevelingen voor toepassing. Onderwerpen zijn onder meer de impact van RLHF op kalibratie en het gebruik van Expected Calibration Error (ECE) als evaluatiemetriek.