Nieuws

Documentbegrip met visiemodellen: objectdetectie in technische documenten trainen

In het vierde deel van een serie over het bouwen van domeinspecifieke AI-modellen wordt het probleem besproken dat visuele elementen zoals diagrammen vaak verloren gaan bij tekstextractie uit PDF's. De auteur beschrijft hoe het detectiemodel YOLO werd gebruikt om blokdiagrammen te herkennen en te classificeren, wat leidde tot een nauwkeurigheidsverbetering van 72% naar 91%.

Bron: Towards AI

Originele taal: [en]

Lees hier het originele artikel