Nieuws
Maak afbeeldingen in pdf's doorzoekbaar voor RAG zonder te betalen voor allemaal
Een nieuwe methode maakt afbeeldingen in PDF's doorzoekbaar voor RAG zonder dat alle afbeeldingen met een duur vision-model hoeven te worden geanalyseerd. De cascade gebruikt eerst goedkope filters en classificatie om irrelevante afbeeldingen te verwijderen. Alleen tekstafbeeldingen worden met OCR verwerkt en visuele afbeeldingen met een vision-model, waardoor kosten worden bespaard.