Nieuws

Evaluatie van Rotary Position Embeddings in vergelijking met GPT-stijl positie-embeddings

Een vergelijking tussen Rotary Position Embeddings en GPT-stijl geleerde positie-embeddings toont geen duidelijke trend, maar biedt inzicht in de prestaties van beide methoden bij het trainen van 1,3B-modellen op het Pile-dataset met Mesh Transformer JAX.

Bron: EleutherAI Blog

Originele taal: [en-us]

Lees hier het originele artikel