Nieuws

Product Key Memory Sparse Coders

EleutherAI onderzoekt de prestaties van Product Key Memory (PKM) transcoders en vergelijkt ze met TopK transcoders. De resultaten tonen aan dat PKM transcoders sneller kunnen worden getraind voor bepaalde modellengroottes, maar bij grotere expansiefactoren presteren baseline modellen beter. De onderzoekers ontdekten ook dat PKM transcoders iets beter interpreteerbaar zijn dan TopK transcoders. Code en modellen zijn beschikbaar op GitHub en Hugging Face.

Bron: EleutherAI Blog

Originele taal: [en-us]

Lees hier het originele artikel