Dossier

Browser- en computer-use agents

AI-assistenten die websites, browsers en computers zelfstandig bedienen.

Nieuwsitems

Gekoppelde artikelen

90 artikelen

Je coding agents zoals Claude Code en OpenAI's Codex kunt inzetten om via de browser werk te verifiëren. Het behandelt de werking met screenshots, klikacties en het gebruik van de Playwright MCP voor betere prestaties. Ook wordt gewaarschuwd dat sommige toepassingen de servicevoorwaarden kunnen schenden.

OpenAI voegt een nieuwe 'Scheduled'-pagina toe aan ChatGPT, waar gebruikers alle actieve taken op één plek kunnen bekijken, pauzeren, bewerken of verwijderen. Researchtaken doorzoeken het web en verbonden apps en sturen alleen meldingen bij daadwerkelijke wijzigingen. De vorige 'Pulse'-functie wordt uitgefaseerd en geïntegreerd in de geplande taken.

Sean Lynch stelt dat de belangrijkste waarde van MCP boven skills/CLI het isoleren van de authenticatiestroom buiten de contextvenster van de agent is. Hij suggereert dat de geïdealiseerde vorm van MCP slechts een auth-gateway voor de API kan zijn.

Amazon introduceert Web Search op Amazon Bedrock AgentCore, een beheerde webzoekmogelijkheid voor AI-agenten. Het stelt agenten in staat om realtime informatie van het web op te halen zonder infrastructuurlasten. De functionaliteit is compatibel met het Model Context Protocol (MCP) en gebruikt een door Amazon beheerde webindex met miljarden documenten die elke minuut wordt bijgewerkt. Queries blijven binnen AWS voor privacy.

Amazon Quick lanceert autonome agenten die continu taken uitvoeren namens gebruikers, zoals het opvolgen van deals en samenvatten van compliance-wijzigingen. De AI-assistent kan worden ingesteld via natuurlijke taal en leert van gebruikersgedrag. Daarnaast introduceert Quick een activiteitenfeed en 16 nieuwe integraties, waaronder Google Chat en Microsoft OneNote.

AWS introduceert een aanpak om AI-onderzoeksworkflows te verbeteren door gebruik te maken van LangChain Deep Agents en Amazon Bedrock AgentCore. De architectuur maakt gebruik van geïsoleerde subagenten voor taken zoals browsen, data-analyse en geheugen, waardoor de context van de coördinerende LLM niet overstroomt. De tutorial laat zien hoe je een competitieve onderzoeksagent bouwt die parallel meerdere websites kan raadplegen en resultaten kan synthetiseren.

Uit Accenture's 2026 Consumer Pulse Research onder 25.590 consumenten in 16 landen blijkt dat 74% een persoonlijke AI-agent meer vertrouwt dan hun beste vriend voor aankopen. Het rapport beschrijft een verschuiving voorbij chatbots, waarbij consumenten routinetaken willen delegeren maar controle houden bij persoonlijke keuzes. 32% staat gedelegeerde besluitvorming toe binnen gestelde grenzen, terwijl slechts 9% volledige autonomie accepteert.

Huawei heeft HarmonyOS 7 aangekondigd, de nieuwste versie van zijn besturingssysteem. De grootste vernieuwing is een AI-assistent die zelfstandig taken kan uitvoeren over meerdere apparaten, zoals het opzoeken van bestanden of het opstellen van schema's. Het systeem is nu beschikbaar als bèta en krijgt later dit jaar een bredere uitrol.

Visa heeft aangekondigd dat het zijn betalingsnetwerk integreert in ChatGPT, waardoor de AI-chatbot zelfstandig aankopen kan doen namens gebruikers. De AI kan producten selecteren en definitief bestellen, een stap die volgens Visa vraagt om een ander niveau van vertrouwen. Er zijn zorgen over misbruik, omdat ChatGPT eerder frauduleuze winkelclonen aanbeval.

Coinbase lanceert Coinbase for Agents, waarmee AI-agenten zelfstandig transacties kunnen uitvoeren en portefeuilles kunnen beheren. Het systeem ondersteunt terminal-gebaseerde integraties met Claude Code, Codex of OpenClaw, en web-gebaseerde integraties via het Model Context Protocol voor ChatGPT of Claude Web. Gebruikers kunnen automatische handelsstrategieën instellen, zoals dollar-cost averaging, en de agenten werken binnen geïsoleerde portefeuilles met ingebouwde beveiligings- en compliancecontroles.

Visa heeft zijn betalingsinfrastructuur gekoppeld aan ChatGPT, waardoor AI-agenten retailproducten kunnen aanbevelen en financiële transacties kunnen uitvoeren. Deze integratie omzeilt gesloten architecturen en stelt gebruikers in staat om via een eenvoudige opdracht producten te laten selecteren en betalen zonder menselijke tussenkomst. Retailers moeten hun data aanpassen voor AI-agenten en overstappen op machine-leesbare inventarisgegevens.

Nous Research heeft een Profile Builder uitgebracht voor Hermes Agent, waarmee gebruikers via een webdashboard eenvoudig AI-agenten kunnen configureren. De tool combineert identiteit, model, vaardigheden en MCP-servers in één begeleide flow, zonder dat CLI-commando's nodig zijn. Hermes Agent is een open-source, zelfverbeterende agent die draait op CLI, desktop en berichtenplatforms.

AI verandert de manier waarop consumenten online zoeken en producten vergelijken, van klassiek zoekmachineverkeer naar een gesprek met AI-agents. Bedrijven moeten investeren in gestructureerde, consistente productdata, omdat AI anders onbetrouwbare informatie niet zal aanbevelen. Volgens een Shopify-directeur worden best practices zoals datakwaliteit en merkautoriteit nog belangrijker in het tijdperk van agentic commerce.

AWS demonstreert een systeem dat Strands Agents en Amazon Bedrock AgentCore Browser Tool combineert om de eerste schademelding (FNOL) te automatiseren. Het systeem gebruikt browsergestuurde automatisering met domeinredenering om multimodale bewijsmaterialen te taggen en te analyseren, waardoor experts contextrijke, vooraf geanalyseerde claims ontvangen. De oplossing maakt gebruik van Amazon Nova Act voor browserinteractie en Strands Agents voor verzekeringsspecifieke bedrijfsregels.

De auteur legt uit hoe je een dagelijkse webautomatiseringspijplijn kunt bouwen met gratis LLM's. Het gebruikt OpenClaw met OpenRouter's gratis owl-alpha model als coördinator en MediaUse voor stabiele browseracties via siteplugins. De pijplijn haalt topverhalen van Hacker News, verzamelt gebruikersreacties van Reddit en stelt met behulp van ChatGPT een Medium-concept op. Dit aanpak vermindert de belasting van het gratis model door het alleen te laten dispatchen.

Meta ontwikkelt een betaalde AI-agent genaamd Hatch die tot 200 dollar per maand kan kosten. Gebruikers omschrijven in eenvoudige taal wat ze nodig hebben, waarna Hatch werkende tools bouwt, afspraken inplant of e-mails verstuurt. CEO Mark Zuckerberg ziet het product als een manier om nieuwe inkomstenbronnen buiten advertenties aan te boren en de grote AI-investeringen van Meta te financieren. Hatch zal ook de geplande AI-hardware van Meta aandrijven, zoals nieuwe slimme brillen met 'supersensing' en een AI-hanger. De bredere lancering in de VS staat gepland voor juli.

Alibaba's Qwen-team heeft Qwen3.7-Plus uitgebracht, een multimodaal agentmodel dat visuele perceptie, GUI-bediening en coderen combineert in één agent-loop. In een demo ontwikkelde een agent op basis van dit model autonoom een app voor het leren van woordenschat, met meer dan 10.000 regels code. Het model presteert goed in GUI-taken, maar scoort minder op pure logica. Qwen3.7-Plus is eigendom en prijstechnisch gunstig vergeleken met westerse modellen.

Een ontwikkelaar bouwde een pure Python MCP-server die AI-tools zoals Claude en ChatGPT direct toegang geeft tot lokale projectbestanden, zonder afhankelijkheden. De server ondersteunt zowel stdio voor lokaal gebruik als HTTP/SSE voor gelijktijdige clients. De implementatie gebruikt alleen de Python-standaardbibliotheek en behaalt reactietijden onder 50ms met 5 clients.

In deze tutorial zetten we Microsoft Fara op in Google Colab en doorlopen we een browser-use workflow. We clonen de repository, installeren het pakket, bereiden Playwright voor en verifiëren de installatie. We maken een mock OpenAI-compatibel endpoint dat geldige browseracties retourneert, zodat we de agent-loop kunnen testen zonder een zware Fara-7B-implementatie. Het notebook is ontworpen om later verbinding te maken met echte endpoints zoals Azure Foundry, vLLM of Ollama.

NVIDIA heeft Nemotron 3 Ultra gelanceerd, een open Mixture-of-Experts-model met 550 miljard parameters waarvan er 55 miljard actief zijn per token. Het model gebruikt een hybride Mamba-Attention-architectuur voor efficiënte verwerking van lange sequenties en is ontworpen voor langlopende agenten die plannen, tools gebruiken en redeneren. Volgens NVIDIA behaalt het tot 6x hogere inferentiedoorvoer dan vergelijkbare open LLM's bij gelijkwaardige nauwkeurigheid. Het model ondersteunt een context tot 1 miljoen tokens en wordt geleverd met open gewichten, trainingsdata en recepten.

Microsoft heeft op Build een nieuwe categorie AI-agenten genaamd Autopilot aangekondigd, met Scout als eerste agent. Scout werkt op de achtergrond en kan zonder tussenkomst van de gebruiker acties uitvoeren, zoals vergaderingen plannen en deadlines bewaken. De agent heeft eigen identiteiten binnen Entra en is onderworpen aan organisatiecontroles, maar er zijn zorgen over de veiligheid van het onderliggende OpenClaw-platform.

Tijdens Microsoft Build 2026 introduceerde Microsoft Project Solara, een platform voor een nieuwe generatie AI-apparaten die verder gaan dan smartphones. Het stelt AI-agenten in staat om verzoeken te begrijpen en acties uit te voeren. Microsoft toonde twee conceptapparaten: een slim bureaublad en een draagbare badge voor werk. Grote organisaties zoals Best Buy en CVS Health zijn van plan het platform te testen.

Microsoft heeft op 2 juni Microsoft Scout geïntroduceerd, een altijd-actieve AI-agent die autonoom taken uitvoert voor gebruikers in Microsoft 365. Scout werkt op de achtergrond en kan agenda's beheren, vergaderingen plannen en risico's signaleren. De agent is gebouwd op OpenClaw en maakt deel uit van een nieuw type agenten dat Microsoft Autopilots noemt.

Microsoft heeft op de Build-conferentie Scout aangekondigd, een altijd actieve AI-agent die in Microsoft Teams werkt als een virtuele collega. Scout kan berichten, e-mails en agenda's doorzoeken om taken te automatiseren en vergaderingen te herplannen. De agent is gebaseerd op OpenClaw en maakt deel uit van Microsofts agent-first strategie. Gebruikers kunnen Scout commando's geven via Teams, en de AI kan proactief taken uitvoeren zoals het blokkeren van etenstijd op de agenda. De tool wordt eerst beperkt uitgerold en vereist een GitHub Copilot-abonnement.

Baz heeft een AI-agent genaamd Spec Review gebouwd met Amazon Bedrock en Bedrock AgentCore om code reviews te automatiseren. De agent valideert niet alleen code, maar ook of de implementatie voldoet aan functionele en visuele specificaties uit Figma en Jira. Door gebruik te maken van serverless browsersessies en grote taalmodellen wordt de kloof tussen code en productintentie overbrugd. Het resultaat is een reductie van bugs tot 50% en een snellere merge-tijd.

Zoom Communications heeft ZoomMate gelanceerd, een AI-gestuurde werkplekassistent die gesprekken kan omzetten in afgeronde taken zonder dat er meerdere applicaties nodig zijn. De assistent kan onder meer CRM-gegevens bijwerken, rapporten genereren en workflows automatiseren. ZoomMate is vooralsnog beschikbaar in Noord-Amerika vanaf 20 dollar per gebruiker per maand.

AWS lanceert de volgende generatie OpenSearch Serverless, speciaal ontworpen voor AI-agent workloads. Cloudflare meldt dat bots al 31% van het HTTP-verkeer uitmaken en verwacht dat niet-menselijk verkeer in de eerste helft van 2027 menselijk verkeer overtreft. Google, Microsoft en Meta passen ook hun infrastructuur aan om machine-naar-machine verkeer efficiënter te ondersteunen.

De ReAct-lus, geïntroduceerd in 2022, taalmodellen in staat stelt redeneren en handelen af te wisselen met externe tools. Hierdoor worden ze van tekstgeneratoren getransformeerd naar probleemoplossende systemen. De auteur legt uit waarom pure tekstgeneratie faalt bij taken die verificatie of meerstapsacties vereisen, zoals het opvragen van de actuele NVIDIA-aandelenkoers.

AWS Generative AI Innovation Center en Works Human Intelligence (WHI) hebben twee AI-agenten gebouwd met Amazon Bedrock AgentCore voor het automatiseren van HR-routinetaken. De Commuting Allowance Agent en Browser Operation Agent verlagen de kosten met tot 97% en verbeteren de operationele efficiëntie. De implementatie omvat migratie van LangGraph naar AgentCore en optimalisaties zoals prompt caching en modelwijzigingen.

Een ontwikkelaar bouwde een stateful research agent die langlopende browsertaken uitvoert in een TensorLake-sandbox. De agent gebruikt een desktop-VM met Firefox om client-side rendering en botdetectie te omzeilen. De LLM-aanroepen domineren de latentie, niet de sandbox-overhead.

Alipay heeft AI Wallet en Token Pay gelanceerd, betalingstools voor AI-agenten die kunnen winkelen, diensten boeken en betalingen voltooien met gebruikerscontroles. De tools zijn ontworpen om AI-agenten in staat te stellen namens gebruikers transacties uit te voeren.

WorkOS heeft auth.md uitgebracht, een open protocol waarmee AI-agenten zich gestandaardiseerd kunnen registreren bij webdiensten. Het protocol gebruikt een Markdown-bestand op een bekende locatie en twee OAuth-gebaseerde stromen: agent verified (via ID-JAG) en user claimed (via OTP). Dit maakt het mogelijk om credentials te verstrekken die per sessie kunnen worden gecontroleerd en selectief kunnen worden ingetrokken, zonder dat een menselijke handeling nodig is.

Datasette-agent 0.1a4 maakt gebruik van de nieuwe makeJumpSections() JavaScript plugin hook in Datasette 1.0a30 om een 'Start a new agent chat'-interface toe te voegen aan het Jump naar-menu. Gebruikers kunnen het uitproberen door in te loggen met een GitHub-account op agent.datasette.io.

Microsoft Research heeft Webwright uitgebracht, een open-source framework voor webagents dat de browser bestuurt via Playwright-code in een terminalomgeving. Het framework behaalt 60,1% op de Odysseys-benchmark, een stijging van 26,6 procentpunt ten opzichte van de 33,5% van het basis GPT-5.4-model. Op Online-Mind2Web scoort GPT-5.4 met Webwright 86,67% accuraatheid. De code is beschikbaar op GitHub.

Op 25 juli 2025 ontdekte het Brave Security Team een promptinjectie-kwetsbaarheid in Perplexity Comet, een AI-browser. Aanvallers konden via verborgen tekst in een Reddit-thread de AI misleiden om gebruikersgegevens te stelen. Perplexity bracht een fix uit, maar latere tests toonden aan dat de onderliggende aanvalsmethode nog niet volledig was verholpen. Ook beveiligingsonderzoekers van LayerX Security vonden een variant, genaamd CometJacking.

Microsoft Research heeft Fara1.5 uitgebracht, een familie van computergebruik-agenten voor de browser in de formaten 4B, 9B en 27B. De modellen, gebaseerd op Qwen3.5, scoren 72% taaksucces op de Online-Mind2Web-benchmark, waarmee ze OpenAI Operator (58,3%) en Gemini 2.5 Computer Use (57,3%) verslaan. Fara1.5 maakt gebruik van een observeer-denk-handel-lus en wordt getraind met een synthetische datapijplijn genaamd FaraGen1.5. Het model kan op kritieke punten pauzeren om de gebruiker om verduidelijking te vragen.

Amazon Nova Act is nu HIPAA-gecertificeerd, waardoor het ingezet kan worden in zorgomgevingen met elektronische beschermde gezondheidsinformatie (ePHI). Het stelt organisaties in staat om browsergebaseerde AI-agents te gebruiken voor het automatiseren van zorgworkflows zoals claimverwerking en verwijzingscoördinatie.

Google test via een nieuwe experimentele categorie 'Agentic Browsing' in de Lighthouse-analyse tool hoe goed websites omgaan met AI-agents. De audit controleert onder andere op de aanwezigheid van een llms.txt-bestand en integratie van Google's WebMCP API. De categorie is nog niet definitief en geeft geen score, maar een verhouding van geslaagde controles.