Nieuws

Harness-1: een 20B retrieval-subagent getraind met versterkend leren in een stateful zoekharnas

Onderzoekers van University of Illinois Urbana-Champaign, UC Berkeley en Chroma hebben Harness-1 ontwikkeld, een 20B retrieval-subagent gebouwd op gpt-oss-20b. Het model is getraind met reinforcement learning in een stateful zoekharnas dat de boekhouding overneemt. Harness-1 behaalt een gemiddelde curated recall van 0,730 op acht benchmarks. De gewichten en code zijn openbaar beschikbaar.

Bron: MarkTechPost

Originele taal: [en-US]

Lees hier het originele artikel

Dossier: