Nieuws

Llemma: een open taalmodel voor wiskunde

EleutherAI introduceert Llemma, twee grote taalmodellen met 7 en 34 miljard parameters die speciaal zijn ontwikkeld voor wiskunde. De modellen zijn getraind op de Proof-Pile II, een dataset van 55 miljard tokens met wiskundige en wetenschappelijke documenten. Llemma toont verbeterde wiskundige vaardigheden en kan worden aangepast aan verschillende taken via prompting of aanvullende fijnafstemming.

Bron: EleutherAI Blog

Originele taal: [en-us]

Lees hier het originele artikel