Nieuws

OpenAI's Deployment Simulation breidt pre-deployment risicobeoordeling uit naar agentisch coderen via gesimuleerde toolaanroepen

OpenAI heeft een nieuwe veiligheidsmethode genaamd Deployment Simulation gepubliceerd die de inzet van een model simuleert door eerdere gesprekken opnieuw af te spelen met een kandidaatmodel. De methode wordt al gebruikt tijdens de modelontwikkeling en heeft blinde vlekken in traditionele evaluaties blootgelegd. De aanpak levert een mediane multiplicatieve fout van 1,5x op en is uitgebreid naar agentische toolsimulatie voor coderingsagenten.

Bron: MarkTechPost

Originele taal: [en-US]

Lees hier het originele artikel