Nieuws
Microsoft trainde MAI-modellen op ongelicentieerde webdata ondanks belofte van schone data
Microsoft heeft zijn nieuwe MAI-modellen deels getraind op ongelicentieerde webdata zoals Common Crawl, ondanks de belofte dat alleen 'schone en commercieel gelicentieerde data' zou worden gebruikt. Het bedrijf vertrouwt net als andere AI-labs op fair use en legt de verantwoordelijkheid bij website-eigenaren om crawlers te blokkeren. Dit blijkt uit het technische paper van de modellen.