Nieuws

TinyFish lanceert BigSet: open-source multi-agent systeem voor gestructureerde datasets uit natuurlijke taal

TinyFish heeft BigSet uitgebracht, een open-source multi-agent systeem dat op basis van een beschrijving in natuurlijke taal gestructureerde, actuele datasets genereert uit webdata. Het systeem gebruikt een tweetraps architectuur met Claude Sonnet voor schema-inferentie en Qwen als orchestrator, waarna sub-agents parallel gegevens verzamelen. BigSet ondersteunt automatische schema-inferentie, parallele gegevensextractie, deduplicatie en geplande verversingen, en exporteert naar CSV of XLSX. De code is beschikbaar op GitHub onder AGPL-3.0.

Bron: MarkTechPost

Originele taal: [en-US]

Lees hier het originele artikel