Nieuws

Nieuwe methode maakt grote taalmodellen nauwkeuriger door alle lagen te gebruiken

Google introduceert SLED, een nieuwe techniek die de feitelijkheid van grote taalmodellen (LLMs) verbetert door alle lagen van het model te gebruiken in plaats van alleen de laatste. De methode verbetert de nauwkeurigheid van LLMs zonder externe data of extra fijning, en werkt met modellen zoals Mistral en Gemma. De resultaten tonen aan dat SLED de feitelijkheid aanzienlijk verbetert, met een minimale toename van de verwerkingstijd.

Bron: Google Research Blog

Originele taal: [en-us]

Lees hier het originele artikel