Nieuws
Het tweede New England RLHF Hackers Hackathon
Het New England RLHF Hackers (NERH) organiseerde op 8 oktober 2023 hun tweede hackathon aan de Brown University. Het evenement richtte zich op het oplossen van uitdagingen in het gebied van reinforcement learning from human feedback. De NERH groep bestaat voornamelijk uit medewerkers en bijdragers van EleutherAI. Tijdens de hackathon werden onderzoeksresultaten gedeeld, waaronder het gebruik van Sparse Autoencoders om kenmerken in beloningsmodellen te identificeren en het toepassen van Monte Carlo tree search voor het genereren van synthetische voorkeursdata.