Nieuws
Algemene algoritmen verslaan gespecialiseerde in speltheorie, blijkt uit MIT-onderzoek
MIT-onderzoekers toonden aan dat policy gradient-methoden, algemene algoritmen voor neurale netwerken, beter presteren dan gespecialiseerde speltheoretische algoritmen in onvolledige-informatiespellen. De studie, gepresenteerd op de International Conference on Learning Representations, introduceert een benchmark om algoritmen eerlijk te vergelijken. De resultaten laten zien dat generalisten soms winnen van specialisten.