Nieuws

MEMO: een modulair raamwerk voor het trainen van een dedicated geheugenmodel zonder LLM-parameters aan te passen

Onderzoekers van National University of Singapore, MIT CSAIL, A*STAR en SMART introduceren MEMO, een modulair raamwerk dat een apart geheugenmodel traint op nieuwe kennis terwijl het hoofd-LLM bevroren blijft. Het geheugenmodel wordt getraind via een pijplijn van vijf stappen en gebruikt een gestructureerd multi-turn protocol tijdens inferentie. MEMO presteert beter dan RAG en andere methoden op benchmarks als BrowseComp-Plus, NarrativeQA en MuSiQue, en ondersteunt incrementele kennisintegratie via model merging.

Bron: MarkTechPost

Originele taal: [en-US]

Lees hier het originele artikel