Nieuws

OpenAI introduceert IH-Challenge om instructiehiërarchie in LLM's te verbeteren

OpenAI lanceert IH-Challenge, een trainingset die modellen helpt om betrouwbare instructies te prioriteren, waardoor de veiligheid, beheersbaarheid en weerstand tegen prompt-injectie-aanvallen verbeteren. Het project richt zich op het oplossen van conflicten tussen instructies van verschillende bronnen, zoals systeemberichten, ontwikkelaarsrichtlijnen en gebruikersvragen. De methode verbetert de veiligheid van AI-systemen zonder de nuttigheid van modellen te beperken.

Bron: OpenAI News

Originele taal: [en]

Lees hier het originele artikel

Dossier:

Ai Safety / veiligheid