Nieuws
Baidu brengt Unlimited OCR uit: een 3B-model met constante KV-cache voor het parseren van lange documenten
Baidu heeft Unlimited OCR gepubliceerd, een 3B-parameter Mixture-of-Experts-model dat een constante KV-cache gebruikt via Reference Sliding Window Attention (R-SWA). Het model activeert slechts 500M parameters en behaalt een score van 93,23 op OmniDocBench v1.5, waarmee het de DeepSeek OCR-baseline met 6,22 punten verslaat. Unlimited OCR is getraind door continu training vanuit DeepSeek OCR en ondersteunt het parseren van tientallen pagina's in één doorgang.