Nieuws

Maak afbeeldingen in pdf's doorzoekbaar voor RAG zonder te betalen voor allemaal

Een nieuwe methode maakt afbeeldingen in PDF's doorzoekbaar voor RAG zonder dat alle afbeeldingen met een duur vision-model hoeven te worden geanalyseerd. De cascade gebruikt eerst goedkope filters en classificatie om irrelevante afbeeldingen te verwijderen. Alleen tekstafbeeldingen worden met OCR verwerkt en visuele afbeeldingen met een vision-model, waardoor kosten worden bespaard.

Bron: Towards Data Science

Originele taal: [en-US]

Lees hier het originele artikel