Nieuws
De eerste New England RLHF Hackers Hackathon
Op 10 september 2023 hield New England RLHF Hackers (NERH) een hackathon op Brown University met als doel plannen te ontwikkelen voor het oplossen van openstaande problemen in reinforcement learning via menselijke feedback. Veel leden van NERH zijn medewerkers of samenwerkers van EleutherAI. Tijdens de hackathon werden onderzoeksprojecten gepresenteerd, waaronder een kader voor directe evaluatie van beloningsmodellen en een feitengebaseerd beloningsmodel voor taalmodellen.