Nieuws

Het tweede New England RLHF Hackers Hackathon

Het New England RLHF Hackers (NERH) organiseerde op 8 oktober 2023 hun tweede hackathon aan de Brown University. Het evenement richtte zich op het oplossen van uitdagingen in het gebied van reinforcement learning from human feedback. De NERH groep bestaat voornamelijk uit medewerkers en bijdragers van EleutherAI. Tijdens de hackathon werden onderzoeksresultaten gedeeld, waaronder het gebruik van Sparse Autoencoders om kenmerken in beloningsmodellen te identificeren en het toepassen van Monte Carlo tree search voor het genereren van synthetische voorkeursdata.

Bron: EleutherAI Blog

Originele taal: [en-us]

Lees hier het originele artikel