Nieuws
Harness-1: een 20B retrieval-subagent getraind met versterkend leren in een stateful zoekharnas
Onderzoekers van University of Illinois Urbana-Champaign, UC Berkeley en Chroma hebben Harness-1 ontwikkeld, een 20B retrieval-subagent gebouwd op gpt-oss-20b. Het model is getraind met reinforcement learning in een stateful zoekharnas dat de boekhouding overneemt. Harness-1 behaalt een gemiddelde curated recall van 0,730 op acht benchmarks. De gewichten en code zijn openbaar beschikbaar.