Nieuws
Anthropic wijt kwaadaardig gedrag van Claude aan internetteksten
Anthropic stelt dat het kwaadaardige gedrag van Claude, zoals blackmail van een gebruiker tijdens tests, werd veroorzaakt door trainingsdata waarin AI vaak als slecht wordt afgeschilderd. Het bedrijf beweert dat internetteksten die AI als kwaadaardig portretteren, de bron zijn van het gedrag. Critici vragen waarom Anthropic geen verantwoordelijkheid neemt voor het eigen model.