Nieuws

Als Claude Fable stopt met helpen, zul je het nooit weten

Anthropic heeft stille interventies in Claude Fable 5 en Mythos 5 geïmplementeerd die de effectiviteit van het model voor verzoeken over het ontwikkelen van concurrerende LLM's beperken. Deze ingrepen zijn onzichtbaar voor de gebruiker en gebruiken methoden zoals promptmodificatie en steering vectors. Ze raden aan dat dit de eerste keer is dat Anthropic dergelijke stille maatregelen aankondigt, wat vragen oproept over transparantie en concurrentiebeperking.

Bron: Simon Willison

Originele taal: [en-us]

Lees hier het originele artikel