Nieuws
Open Source nieuws
Bekijk de nieuwste AI-artikelen binnen het thema Open Source. Links zie je alle thema's, rechts de recentste gekoppelde nieuwsitems.
24 jun 2026 18:53
Latent SpaceDatabricks lanceert Omnigent, een open-source meta-harness voor AI-agents
Databricks heeft tijdens de Data + AI Summit 2026 Omnigent aangekondigd, een open-source platform dat als meta-harness fungeert voor het combineren en delen van AI-agents zoals Claude Code en Codex. Cofounders Matei Zaharia en Reynold Xin bespreken ook LTAP, een nieuwe database-aanpak die de storage-laag verenigt voor het agent-tijdperk. Het platform moet een uniforme API bieden voor agent-sessies, beveiliging en samenwerking. Databricks streeft ernaar het besturingssysteem voor enterprise-agents te worden.
24 jun 2026 07:07
Analytics India MagazineBaseten claimt snelste API voor GLM-5.2 met meer dan 280 tokens per seconde
Baseten, een AI-infrastructuur-startup uit San Francisco, heeft een API-implementatie van het open-source model GLM-5.2 van Z.ai gebouwd die meer dan 280 tokens per seconde levert. De prestatie wordt bereikt door een reeks inferentie-optimalisaties, waaronder modelkwantisatie, cachebeheer en speculatieve decodering. Het 744-miljard parameter grote mixture-of-experts model van Z.ai presteert volgens Baseten vergelijkbaar met toonaangevende propriëtaire systemen tegen 70–80% lagere kosten per token.
24 jun 2026 00:00
LightOnLightOn lanceert krachtig nieuw OCR-model LightOnOCR-2-1B voor documentintelligentie
LightOn lanceert LightOnOCR-2-1B, een krachtig OCR-model dat documenten efficiënt en accuraat kan verwerken. Het model, met 1 miljard parameters, presteert beter dan concurrenten zoals Chandra-9B op de OlmOCR-benchmark, terwijl het kleiner is en sneller werkt. Het model biedt ook ondersteuning voor bounding boxes van afbeeldingen en is beschikbaar onder de Apache 2.0 licentie. LightOnOCR-2-1B is bedoeld voor gebruik in productieomgevingen en kan worden gebruikt via de Hugging Face Transformers ecosystem. Het model is onderdeel van een groter familie van modellen die verschillende functionaliteiten en toepassingen ondersteunen.
23 jun 2026 13:00
SiliconANGLE AILinux Foundation breidt DNS uit naar AI-agents met nieuwe Agent Name Service
De Linux Foundation heeft aangekondigd de Agent Name Service (ANS) te lanceren, een open standaard die AI-agents vertrouwde identiteiten geeft via het Domain Name System. ANS stelt systemen en personen in staat te verifiëren tot welke organisatie een agent behoort en welke toestemmingen hij heeft. De standaard is gebaseerd op gedecentraliseerde identificatiegegevens en Legal Entity Identifiers en wordt gesteund door onder andere GoDaddy, Cloudflare, Cisco en Salesforce.
23 jun 2026 13:00
SiliconANGLE AICData biedt AI-ontwikkelaars beheerde datatoegang met nieuwe tools
CData Software heeft drie producten aangekondigd om AI-ontwikkelaars eenvoudiger toegang te geven tot bedrijfsgegevens. Het gaat om een gratis Connect AI Developer Edition, een open-source Python SDK en een command-line tool. De tools moeten ontwikkelaars helpen beheerde data te gebruiken voor grote taalmodellen zonder uitgebreide IT-ondersteuning.
23 jun 2026 05:35
Towards AIWaarom ik een open-source SDK maak voor Generative UI op iOS en Android
Een React Native-ingenieur ontwikkelt Wire RN, een open-source SDK voor Generative UI op mobiele platforms. De SDK stelt AI-modellen in staat om interfaces in realtime samen te stellen, in plaats van vooraf vastgelegde schermen. Webplatformen hebben al tools zoals Vercel AI SDK en Google's A2UI, maar mobiel mist native ondersteuning. Wire RN moet die leemte vullen.
23 jun 2026 05:15
Computable AIAi-model met ruim 400 miljard parameters wint Europese ai-competitie
Het consortium Europa onder leiding van het Italiaanse AI-bedrijf Domyn heeft de Frontier AI Grand Challenge gewonnen. De competitie was opgezet om een opensource AI-model met meer dan 400 miljard parameters te ontwikkelen dat alle 24 officiële EU-talen ondersteunt. Domyn werkt nauw samen met Nvidia en krijgt gratis rekenkracht van EuroHPC. De Europese Commissie wil met het initiatief de technologische onafhankelijkheid van Europa versterken.
22 jun 2026 23:43
Simon WillisonMoebius 0.2B inpainting-model geporteerd naar browser met Claude Code
Simon Willison heeft het Moebius 0.2B image inpainting-model, oorspronkelijk voor PyTorch en NVIDIA CUDA, met behulp van Claude Code omgezet naar ONNX en WebGPU, zodat het direct in de browser draait. Het model kan afbeeldingsregio's verwijderen en de lege ruimte realistisch invullen. De conversie en demo zijn beschikbaar op GitHub en Hugging Face.
22 jun 2026 21:46
AI BusinessSpaceX sluit compute-deal met opensource-modelprovider
SpaceX heeft een compute-deal gesloten met een opensource-modelprovider. De overeenkomst laat zien dat SpaceX zich probeert te profileren als compute-provider en benadrukt het belang van compute voor modelproviders.
22 jun 2026 10:00
OpenAI NewsPatch the Planet: een Daybreak-initiatief ter ondersteuning van open-sourcebeheerders
OpenAI introduceert Patch the Planet, een Daybreak-initiatief dat open-sourcebeheerders helpt om kwetsbaarheden te vinden, valideren en repareren met behulp van AI en expertbeoordeling.
20 jun 2026 21:50
MarkTechPostNous Research voegt Blank Slate-modus toe aan Hermes Agent voor minimale setup
Nous Research heeft een nieuwe Blank Slate-installatiemodus toegevoegd aan de open-source Hermes Agent. Hiermee starten gebruikers met alleen een provider, model, bestandsbeheer en terminal. De modus schrijft expliciet platform_toolsets.cli en disabled_toolsets weg, zodat uitgeschakelde tools nooit worden geladen, zelfs niet na een update.
20 jun 2026 09:23
MarkTechPostYandex maakt YaFF open-source: zero-copy wireformaat voor Protobuf met bijna struct-leessnelheid
Yandex heeft YaFF (Yet another Flat Format) open-source uitgebracht onder Apache 2.0. YaFF is een zero-copy wireformaat voor Protobuf dat dezelfde .proto-schema's gebruikt maar de fysieke geheugenindeling optimaliseert. Volgens benchmarks van Yandec leest het Flat-layout hete data ongeveer 3,8 keer sneller dan FlatBuffers en binnen een factor 1,2 van een ruwe C++-struct. YaFF wordt al gebruikt in het advertentieaanbevelingssysteem van Yandex en levert daar een CPU-besparing van 10 tot 20 procent op in productieomgevingen.
19 jun 2026 10:29
MarkTechPostLiquid AI introduceert LFM2.5-Embedding-350M en LFM2.5-ColBERT-350M voor snel meertalig zoeken
Liquid AI heeft twee nieuwe retrievalmodellen uitgebracht: LFM2.5-Embedding-350M en LFM2.5-ColBERT-350M. Beide modellen hebben 350 miljoen parameters en zijn gericht op snel meertalig en crosslinguaal zoeken in 11 talen. Het Embedding-model is een dense bi-encoder, terwijl ColBERT een late-interaction model is voor hogere nauwkeurigheid. De modellen zijn beschikbaar op Hugging Face onder de LFM Open License v1.0.
19 jun 2026 05:53
Latent SpaceGLM-5.2 doorstaat de 'vibe check'; Z.ai voorspelt Open Fable in december
Het open-weight model GLM-5.2 van Zhipu AI wordt door de AI-gemeenschap geprezen als grenzend aan de mogelijkheden van propriëtaire frontier-modellen. Artificial Analysis plaatst het tussen GPT-5.5 en Opus 4.8 op een nieuwe agentic knowledge-work benchmark. Z.ai voorspelt bovendien dat er in december een open model van Fable-niveau zal verschijnen. Ook andere open modellen zoals Laguna M.1 en North Mini Code werden uitgebracht.
18 jun 2026 16:55
Black Forest LabsBlack Forest Labs CEO pleit bij G7 voor open innovatie in AI
Tijdens de G7-top riep Robin Rombach, medeoprichter en CEO van Black Forest Labs, wereldleiders op om open innovatie in AI te omarmen. Hij benadrukte dat open technologieën zoals Stable Diffusion en DeepSeek essentieel zijn voor transparantie en concurrentie, maar erkende ook de risico's van misbruik. Black Forest Labs werkt aan verantwoorde open modellen met minder kwetsbaarheden voor schadelijke content.
18 jun 2026 07:02
Analytics India MagazineAvataar.ai onthult Varya: AI-videomodel voor slechts ₹0,48 per seconde
Het Indiase Avataar.ai heeft Varya gelanceerd, een AI-videogeneratiemodel dat video's produceert tegen een fractie van de kosten van concurrenten. Het model, ontwikkeld onder de IndiaAI Mission, bouwt voort op Alibaba's open-source Wan 2.2 en genereert video voor ₹0,48 per seconde, tot 27 keer goedkoper dan vergelijkbare modellen. Varya gebruikt een efficiënte distillatietechniek met slechts vier denoising-stappen, waardoor een 720p-video in 45 seconden wordt gegenereerd. Het model is ontworpen om Indiase culturele nuances beter te begrijpen en wordt beschikbaar gesteld via AIKosh.
18 jun 2026 04:06
Emerce AIYann LeCun: 'AI blokkeren is verkeerd, middeleeuws'
Yann LeCun, voormalig chief AI scientist bij Meta, noemde het Amerikaanse verbod op AI-modellen van Anthropic tijdens VivaTech middeleeuws en vergeleek het met het verbieden van de boekdrukkunst. Hij pleitte voor open source AI, verwijzend naar Meta's Llama-modellen die ontwikkelaars stimuleren. LeCun kondigde ook zijn nieuwe bedrijf AMI Labs aan, dat werkt aan wereldmodellen en Project Tapestry, een open source platform dat meerdere AI-assistenten combineert.
17 jun 2026 09:00
The Rundown AISpacex neemt Cursor over in deal van $60 miljard; Z AI brengt open GLM-5.2-model uit
SpaceX heeft officieel zijn optie uitgeoefend om AI-codeerstartup Cursor over te nemen in een volledig in aandelen betaalde deal ter waarde van $60 miljard. De overname volgt op de beursgang van SpaceX, waarbij de aandelenkoers steeg naar ruim $200. Daarnaast bracht het Chinese AI-lab Z AI het open-weights model GLM-5.2 uit, dat concurreert met GPT 5.5 en Claude Opus 4.8 op codeerbenchmarks. Het model heeft een MIT-licentie en een contextvenster van 1 miljoen tokens.
17 jun 2026 08:49
Emerce AIZhipu maakt GLM-5.2 open source
Zhipu AI heeft zijn GLM-5.2-model open source gemaakt onder een MIT-licentie. Het model is technisch een evenknie van de topmodellen van Anthropic en OpenAI. De aankondiging leidde tot een koersstijging van bijna 50% van het bedrijf aan de beurs van Hong Kong. GLM-5.2 is sterk in coding, agentic workflows en lange context.
17 jun 2026 07:44
MarkTechPostMiniMax introduceert MiniMax Sparse Attention (MSA) voor efficiënte lange contextverwerking
MiniMax heeft MiniMax Sparse Attention (MSA) uitgebracht, een sparse attention methode die de kwadratische kosten van softmax attention bij lange contexten aanpakt. Het team testte MSA in een 109B-parameter Mixture-of-Experts-model en bracht een open-source inferentiekernel en het productmodel MiniMax-M3 uit. MSA is getraind met een 3T-token budget en biedt aanzienlijke snelheidswinsten bij lange contexten.
17 jun 2026 05:37
Latent SpaceGLM-5.2: nieuw open-source model voert op frontend-coderen volgens benchmarks
Z.ai heeft GLM-5.2 uitgebracht, een open-source model met MIT-licentie dat uitblinkt in coderen en agentische taken. Met 1M tokens context, twee redeneermodi en de IndexShare-technologie voor schaarse aandacht claimt het model topresultaten op diverse benchmarks, waaronder de nummer 1-positie in Design Arena en nummer 2 in Code Arena: Frontend. Het model wordt ondersteund door vele inferentieplatforms en wordt gezien als een belangrijke mijlpaal voor open-source AI.
16 jun 2026 17:47
AWS Machine Learning BlogAWS introduceert P-EAGLE voor parallel speculative decoding op Amazon SageMaker AI
AWS heeft P-EAGLE uitgevonden en open source bijgedragen, een methode die speculative decoding parallelliseert door alle draft-tokens in één keer te voorspellen. Dit levert tot 1,69x hogere doorvoer op dan EAGLE-3. Amazon SageMaker JumpStart ondersteunt nu native P-EAGLE voor modellen zoals Qwen3-Coder-30B-A3B-Instruct.
16 jun 2026 15:00
Towards Data ScienceDraai een lokale LLM met OpenClaw op je Mac Mini
Deze handleiding laat zien hoe je een lokale LLM op je Mac Mini kunt draaien met OpenClaw en llama.cpp. Het doel is om maandelijkse API-kosten te vermijden. Het artikel gebruikt het Qwen 3.5-9B model en biedt stapsgewijze instructies voor installatie en configuratie.
16 jun 2026 13:30
Towards Data ScienceLLM-fallbacks verstoren agentpijplijnen: Herstellaag voorkomt stille gegevenscorruptie
Een ontwikkelaar beschrijft hoe eenvoudige modelwisselingen bij snelheidslimieten (429) de gegevensstructuur van agentpijplijnen kunnen beschadigen zonder dat dit opvalt. Hij bouwde een herstellaag die fouten classificeert, payloads aanpast voor doelfmodellen, executiestatus bewaart en schemaintegriteit garandeert. De aanpak is getest met een mockprovider en de code is beschikbaar op GitHub. De auteur waarschuwt dat standaard retry-logica geen rekening houdt met payloadverschillen tussen modellen van bijvoorbeeld Anthropic of OpenAI.
16 jun 2026 13:00
SiliconANGLE AIMindbeam AI brengt open-source AI-inferentieframework Litespark-Inference uit voor CPU's
De startup Mindbeam AI heeft Litespark-Inference uitgebracht, een open-source framework dat ternary large language models efficiënt laat draaien op standaard consumentenprocessors. Het framework levert volgens benchmarks 17 tot 96 keer hogere doorvoer dan standaard PyTorch-implementaties en reduceert het geheugengebruik met meer dan 80%. De broncode is beschikbaar op GitHub en ondersteunt Apple Silicon, Intel- en AMD-processoren.
16 jun 2026 08:18
MarkTechPostGoogle Cloud introduceert Open Knowledge Format (OKF): een vendor-neutrale Markdown-specificatie voor AI-agenten met samengestelde context
Google Cloud heeft het Open Knowledge Format (OKF) geïntroduceerd, een open specificatie die de LLM-wiki-patroon formaliseert in een draagbaar en interoperabel formaat. OKF is een directory van Markdown-bestanden met YAML-frontmatter en vereist geen SDK, runtime of platform. Het is ontworpen om gefragmenteerde interne kennis uit verschillende bronnen te verenigen en bruikbaar te maken voor AI-agenten.
15 jun 2026 09:16
MarkTechPostFlash-KMeans: IO-bewuste exacte k-means tot 200× sneller dan FAISS op GPU's
Onderzoekers van UC Berkeley en UT Austin hebben Flash-KMeans uitgebracht, een open-source bibliotheek die Lloyd's k-means op GPU's versnelt door de datastroom te herstructureren. De implementatie behaalt tot 17,9× snelheidswinst ten opzichte van de beste baseline, 33× versus NVIDIA cuML en meer dan 200× versus FAISS op een H200 GPU, terwijl de exacte output behouden blijft. Flash-KMeans gebruikt FlashAssign en Sort-Inverse Update kernels om de geheugenknelpunten van de toewijzings- en centrumupdatefasen te omzeilen.
15 jun 2026 07:20
Towards AIChina bracht in één week drie grenscoderingmodellen uit, maar geen enkel publiceerde een echte benchmark
In juni 2026 brachten drie Chinese laboratoria in enkele dagen drie open 'frontier' coderingmodellen uit: Zhipu's GLM-5.2 en Moonshot's Kimi. Opvallend is dat geen van de modellen een echte benchmark publiceerde.
14 jun 2026 05:01
MarkTechPostDatabricks brengt Omnigent uit als open-source meta-harnas voor AI-agents
Databricks heeft Omnigent uitgebracht, een open-source 'meta-harnas' voor AI-agents onder de Apache 2.0-licentie. Het project, gebouwd met Neon, biedt een gemeenschappelijke interface bovenop terminal-agents zoals Claude Code, Codex en Pi. Omnigent maakt compositie, controle en samenwerking mogelijk door verschillende agent-harnassen uitwisselbaar te maken.
13 jun 2026 15:00
Databricks BlogIntroductie van Omnigent: een meta-harnas om je AI-agents te combineren, beheren en delen
Databricks heeft Omnigent geïntroduceerd, een open-source meta-harnas dat bovenop bestaande AI-agent-harnassen werkt. Het biedt compositie, controle en samenwerking voor agents zoals Claude Code en Codex. Gebruikers kunnen agents combineren, policies toepassen en sessies delen met teamgenoten.
13 jun 2026 08:38
The DecoderOpen model Kimi K2.7 Code onderbiedt GPT-5.5 en Claude tot 12x op prijs per token
Moonshot AI heeft Kimi K2.7 Code uitgebracht, een open-source model met een biljoen parameters voor programmeertaken. Het model presteert minder dan GPT-5.5 en Claude Opus 4.8 in benchmarks, maar is aanzienlijk goedkoper: $0,95 per miljoen invoertokens en $4,00 per miljoen uitvoertokens. De lagere prijs maakt het een kosteneffectieve optie voor veelvuldig gebruik.
13 jun 2026 04:57
MarkTechPostMoonshot AI brengt Kimi K2.7-Code uit: coderingsmodel scoort 21,8% hoger op Kimi Code Bench v2 dan K2.6
Moonshot AI heeft Kimi K2.7-Code uitgebracht, een coderingsgericht agentisch model met 1T totale parameters en 32B actieve parameters per token. Het model behaalt een stijging van 21,8% op Kimi Code Bench v2 ten opzichte van K2.6 en gebruikt ongeveer 30% minder reasoning-tokens. K2.7-Code is beschikbaar onder een Modified MIT-licentie op Hugging Face en via de Kimi API en Kimi Code.
12 jun 2026 04:30
TechCrunch AIAvataar AI's videomodel Varya is betaalbaar en cultureel bewust voor India's schaal
Het Indiase Avataar AI heeft het videogeneratiemodel Varya gelanceerd, gebaseerd op Alibaba's Wan 2.2. Het model is gedistilleerd voor snelheid en kost slechts $0,005 per seconde, veel goedkoper dan concurrenten zoals Veo en Runway. Varya herkent culturele nuances zoals festivals, eten en kleding en wordt open source aangeboden via India's AI Kosh-portaal.
11 jun 2026 09:53
MarkTechPostNous Research lanceert Hermes Agent Profile Builder voor eenvoudig beheer van AI-agenten
Nous Research heeft een Profile Builder uitgebracht voor Hermes Agent, waarmee gebruikers via een webdashboard eenvoudig AI-agenten kunnen configureren. De tool combineert identiteit, model, vaardigheden en MCP-servers in één begeleide flow, zonder dat CLI-commando's nodig zijn. Hermes Agent is een open-source, zelfverbeterende agent die draait op CLI, desktop en berichtenplatforms.
11 jun 2026 08:33
MarkTechPostCohere brengt 'North Mini Code' uit: 30B MoE-model met 3B actieve parameters voor agentisch programmeren
Cohere AI heeft 'North Mini Code' uitgebracht, een open-weight coderingsmodel met 30B totale parameters waarvan 3B per token actief worden. Het MoE-model is geoptimaliseerd voor codegeneratie, agentische software-engineering en terminaltaken. Het draait op één H100 GPU en biedt een contextvenster van 256K tokens. De gewichten zijn beschikbaar onder Apache 2.0 op Hugging Face.
10 jun 2026 20:00
Simon WillisonDiffusionGemma: Google brengt nieuw open-source model uit
Google heeft DiffusionGemma uitgebracht, een nieuw open-source model met een Apache 2-licentie. Het 26B parameter model is gebaseerd op eerder Gemini Diffusion-onderzoek en wordt gratis gehost door NVIDIA op hun NIM cloud API. Simon Willison testte het model en bereikte een snelheid van minstens 500 tokens per seconde.
10 jun 2026 19:20
The DecoderGoogle brengt open model DiffusionGemma uit: tekst genereren uit ruis in plaats van woord voor woord
Google heeft DiffusionGemma uitgebracht, een experimenteel taalmodel met 26 miljard parameters dat tekst genereert via diffusie in plaats van token voor token. Het model verwerkt blokken van 256 tokens parallel, wat leidt tot snelheden tot vier keer sneller dan autoregressieve modellen op een enkele H100 GPU, volgens Nvidia. De kwaliteit van de gegenereerde tekst is lager, waardoor Google het model positioneert als een experimentele tool voor ontwikkelaars. Het model is beschikbaar onder een Apache 2.0-licentie op Hugging Face.
9 jun 2026 15:16
Towards AITAI #208: Open modellen vinden hun rol nu tokenkosten voor AI-agenten stijgen
Deze week brachten Microsoft, Google, MiniMax, NVIDIA, OpenAI en Apple een breed scala aan goedkopere en open modellen uit. Tokenconsumptie stijgt snel doordat bedrijven overstappen van korte chats naar langlopende AI-agenten. Vercel-data laat zien dat DeepSeek in mei 17% van de tokenvolumes verwerkte tegen slechts 1% van de modeluitgaven. Een kanttekening: alleen Gemma 4 12B en Nemotron 3 Ultra hebben momenteel downloadbare gewichten; MAI-Thinking-1 is in private preview.
9 jun 2026 00:00
CohereCohere lanceert North Mini Code, een open-source agentisch codeermodel
Cohere heeft North Mini Code uitgebracht, het eerste open-source agentische codeermodel van het bedrijf. Het model heeft 30B total parameters met 3B actieve parameters en is ontworpen voor soevereine ontwikkelaars. Het presteert sterk op softwareontwikkelingstaken en is beschikbaar onder Apache 2.0-licentie.
8 jun 2026 17:57
The DecoderMicrosoft Research's Lens toont aan dat gedetailleerde bijschriften belangrijker zijn dan ruwe schaal voor het trainen van efficiënte beeldgeneratoren
Microsoft Research heeft Lens gepresenteerd, een tekst-naar-beeld model met slechts 3,8 miljard parameters dat presteert op het niveau van veel grotere concurrenten. Het geheim zit in 800 miljoen gedetailleerde afbeeldingsbijschriften gegenereerd door GPT-4.1 in plaats van vage web alt-tekst. Lens is open-source beschikbaar onder de MIT-licentie.
8 jun 2026 16:49
MarkTechPostXiaomi MiMo en TileRT bereiken 1000+ tokens per seconde met biljoen-parameter model op gangbare GPU's
Xiaomi's MiMo-team heeft in samenwerking met TileRT MiMo-V2.5-Pro-UltraSpeed uitgebracht, een model dat meer dan 1000 tokens per seconde decodeert op een biljoen-parameter model. De snelheidswinst komt door FP4-kwantificatie, DFlash speculatieve decodering en de TileRT-runtime. Het model draait op een standaard 8-GPU commodity node en is beschikbaar via een API-proefversie van 9 tot 23 juni 2026. Xiaomi heeft de checkpoint open-source gemaakt op Hugging Face en geselecteerde TileRT-modules op GitHub.
8 jun 2026 15:57
AWS Machine Learning BlogEvalueer uw Amazon Nova Sonic-spraakagent op schaal, geen microfoon nodig
AWS introduceert de Nova Sonic Test Harness, een open source framework voor het automatisch testen van spraakagenten. Het voert volledige meerderheidsgesprekken met Amazon Nova Sonic uit, evalueert deze met LLM-as-judge en detecteert audiotextafwijkingen. Het framework schaalt horizontaal en ondersteunt batchuitvoering van honderden scenario's.
8 jun 2026 05:07
Towards AIMoonshot brengt Claude Code-achtige terminal-agent uit onder MIT-licentie voor $0,60
Een Chinees lab heeft een terminal-gebaseerde codeeragent uitgebracht die vrijwel hetzelfde kan als Claude Code. Het model is gelicentieerd onder MIT en kost slechts $0,60 per gebruik. De agent is open-source beschikbaar.
6 jun 2026 23:01
Towards AIProductiearchitectuur voor financieel documentzoeken met RAG
Een blogpost op Towards AI beschrijft een productiearchitectuur voor het zoeken in financiële documenten op schaal, met focus op Retrieval-Augmented Generation (RAG). De auteur behandelt de problemen van rommelige financiële data en stelt Docling (IBM Research) voor als open-source tool voor het parseren van documenten, en Granite-Docling, een 258M parameter VLM voor geïntegreerde OCR en structuurherkenning. Het artikel benadrukt dat een goede ingestie essentieel is voor accurate en snelle retrieval.
6 jun 2026 22:07
MarkTechPostGoogle's nieuwe Colab CLI stelt ontwikkelaars en AI-agenten in staat om Python op externe Colab-GPU's en -TPU's uit te voeren via de terminal
Google AI heeft de Colab CLI uitgebracht, een command-line interface die de lokale terminal verbindt met externe Colab-runtimes. Ontwikkelaars en AI-agenten zoals Claude Code en Codex kunnen hiermee code uitvoeren op cloud-GPU's en -TPU's zonder de terminal te verlaten. De CLI is open source onder de Apache 2.0-licentie en ondersteunt onder andere het fine-tunen van modellen zoals Gemma 3 1B.
6 jun 2026 17:01
Towards AIMicrosoft maakt AI-besturingssysteem werkelijkheid met agenten op Build 2026
Op Build 2026 kondigde Microsoft aan dat Windows zich herpositioneert rond AI-agenten die taken uitvoeren in plaats van alleen te reageren op prompts. Het bedrijf opende het Microsoft Agent Framework onder een MIT-licentie en voegde een Agent Mode toe aan Microsoft 365 Copilot, waarmee agenten acties kunnen uitvoeren in Word, Excel, Teams en Outlook. Copilot wordt multi-model en kan taken routeren naar modellen van OpenAI, Anthropic en opensource-aanbieders.
6 jun 2026 07:55
MarkTechPostNVIDIA brengt Nemotron 3.5 ASR uit: een 600M-parameter streamingmodel dat 40 taallocaties in realtime transcibeert
NVIDIA heeft Nemotron 3.5 ASR uitgebracht, een streaming automatische spraakherkenningsmodel met 600 miljoen parameters. Het model kan 40 taallocaties in realtime transcriberen en wordt gedistribueerd als open gewichten op Hugging Face. De cache-aware architectuur zorgt voor lage latentie zonder in te leveren op nauwkeurigheid.
5 jun 2026 11:10
Simon WillisonLadybird Browser stopt met openbare pull-requests vanwege AI-code
Andreas Kling heeft aangekondigd dat de Ladybird-browser geen openbare pull-requests meer accepteert. De reden is dat aannames over inspanning en goede trouw niet langer opgaan met AI-gegenereerde code. Verantwoordelijkheid voor de code moet liggen bij degenen die beslissen over wijzigingen.
4 jun 2026 21:42
MarkTechPostNVIDIA brengt Nemotron 3 Ultra uit: een open 550B MoE-model voor langlopende AI-agenten
NVIDIA heeft Nemotron 3 Ultra gelanceerd, een open Mixture-of-Experts-model met 550 miljard parameters waarvan er 55 miljard actief zijn per token. Het model gebruikt een hybride Mamba-Attention-architectuur voor efficiënte verwerking van lange sequenties en is ontworpen voor langlopende agenten die plannen, tools gebruiken en redeneren. Volgens NVIDIA behaalt het tot 6x hogere inferentiedoorvoer dan vergelijkbare open LLM's bij gelijkwaardige nauwkeurigheid. Het model ondersteunt een context tot 1 miljoen tokens en wordt geleverd met open gewichten, trainingsdata en recepten.
4 jun 2026 09:00
The Rundown AIIdeogram en Reve lanceren nieuwe AI-beeldmodellen met verbeterde lay-outcontrole
Ideogram heeft versie 4.0 van zijn AI-beeldmodel open-source gemaakt, terwijl Reve 2.0 is gelanceerd. Beide modellen bieden meer gebruikerscontrole na de initiële prompt, met mogelijkheden om typografie, regio's en lay-out aan te passen. Ideogram 4.0 presteert het beste onder open modellen op Design Arena, terwijl Reve 2.0 de tweede plaats inneemt op de Text-to-Image leaderboard.
4 jun 2026 08:11
MarkTechPostMiso Labs brengt MisoTTS uit: een 8B emotioneel text-to-speech-model met open gewichten
Miso Labs heeft MisoTTS uitgebracht, een open-weights text-to-speech-model met 8 miljard parameters. Het model gebruikt residual vector quantization (RVQ) om een breed scala aan spraaknuances te genereren en is geïnspireerd op de Sesame CSM-architectuur. MisoTTS condenseert op zowel tekst als audiocontext, waardoor het de toon van de spreker kan overnemen. Het model is beschikbaar onder een aangepaste MIT-licentie.
4 jun 2026 06:23
MarkTechPostOpenJarvis: lokaal framework voor AI-agents met tools, geheugen en leerfunctie
Onderzoekers van Stanford University en Lambda Labs hebben OpenJarvis gepubliceerd, een open-source framework dat AI-inferentie, agents, geheugen en leren volledig op het apparaat uitvoert. OpenJarvis gebruikt een declaratieve configuratie met vijf verwisselbare primitieven, waardoor lokale modellen binnen 3,2 procentpunt van de beste cloudmodellen presteren, tegen 800× lagere marginale API-kosten en 4× lagere latentie. De framework ondersteunt 11 lokale modellen uit vier families en is getest op 8 benchmarks.
4 jun 2026 04:50
Towards AILangfuse: productieklare observability voor AI-agents
Langfuse biedt een open-source platform voor diepgaande observability van LLM-agents en RAG-pijplijnen. Het platform biedt traces, gestructureerde evaluaties, promptbeheer en regressietests om de prestaties van AI-systemen in productie te monitoren. Dit artikel geeft een praktische handleiding voor het implementeren van Langfuse in een AI-klantenservice-agent.
4 jun 2026 03:24
Latent SpaceReve 2 en Ideogram 4: Nieuwe mogelijkheden voor beeldcompositie
Microsoft introduceerde MAI-Thinking-1, een generalistisch redeneermodel met 97% op AIME 2025 en 53% op SWE-Bench Pro, getraind zonder synthetische data of distillatie. Google bracht Gemma 4 12B uit, een Apache 2.0 multimodaal model met encoder-loos ontwerp dat lokaal draait op 16GB VRAM. Ideogram 4.0 werd als open image model gelanceerd en staat op #1 onder open modellen in de Arena. Daarnaast verschenen nieuwe AI-agents, routing-oplossingen en opensource audio-modellen zoals Miso One.
3 jun 2026 18:46
MarkTechPostGoogle DeepMind brengt Gemma 4 12B uit: encoder-vrij multimodaal model met native audio dat draait op een laptop met 16 GB RAM
Google DeepMind heeft Gemma 4 12B uitgebracht, een dicht multimodaal model zonder aparte encoders voor beeld en audio. Het model verwerkt tekst, beeld, audio en video native en draait op laptops met 16 GB geheugen. De prestaties benaderen die van het grotere 26B MoE-model, terwijl het slechts de helft van het geheugen verbruikt. Het model wordt uitgebracht onder de Apache 2.0-licentie en ondersteunt diverse inferentie-omgevingen.
3 jun 2026 18:37
Google Research BlogHet volgende hoofdstuk in overstromingsbestendigheid: open sourcen van Google's hydrologieframework
Google Research heeft zijn hydrologiemodel voor AI-gebaseerde overstromingsvoorspellingen als open source uitgebracht op GitHub. Het framework gebruikt LSTM-netwerken en PyTorch en stelt meteorologische diensten in staat om lokale data te integreren. Het model kan de betrouwbare voorspellingshorizon met zes dagen verlengen.
3 jun 2026 18:34
The DecoderIdeogram 4.0 uitgebracht als open-weight-model met native 2K-resolutie en verbeterde tekstweergave
Ideogram heeft versie 4.0 van zijn tekst-naar-beeldmodel uitgebracht als een open-weight-model. De nieuwe functies omvatten native 2K-resolutie, transparante achtergronden en nauwkeurige lay-outcontrole via bounding boxes. Op de DesignArena-ranglijst staat het model op de eerste plaats onder open modellen, alleen overtroffen door gesloten modellen van OpenAI en Google. Commercieel gebruik vereist een betaalde licentie.
3 jun 2026 13:30
Towards Data ScienceC++ Backend optimaliseert LLM-inferentie door padding te elimineren
Een nieuwe C++ backend, WarpGroup-Backend, optimaliseert LLM-inferentie door padding van korte sequenties te elimineren. De techniek maakt gebruik van hardwarebewuste bin packing en pinned-memory transfers om de doorvoer tot 5,89× te versnellen op een GTX 1080. Het project is beschikbaar op GitHub en richt zich op prefill- en offline workloads.
3 jun 2026 10:56
The DecoderNous Research brengt Hermes Desktop uit, een open-source AI-agent voor elk platform
Nous Research heeft Hermes Desktop uitgebracht, een open-source AI-agentapp onder de MIT-licentie. De desktopapp is beschikbaar als publieke preview voor Windows, macOS en Linux. De agent werkt op meerdere platforms waaronder Telegram, Discord, Slack, WhatsApp, Signal, e-mail en de terminal. Het heeft blijvend geheugen voor projecten en taakplanning in natuurlijke taal.
3 jun 2026 08:35
MarkTechPostNVIDIA brengt Cosmos 3 uit: een twee-toren Mixture-of-Transformers foundationmodel voor fysieke AI
NVIDIA heeft Cosmos 3 gelanceerd, een familie van omnimodale wereldmodellen voor fysieke AI. Het model combineert fysieke redenering, wereldgeneratie en actiegeneratie in één open model met een Mixture-of-Transformers architectuur. Cosmos 3 is beschikbaar in twee schalen: Nano (16B) voor werkstations en Super (64B) voor datacenters. NVIDIA heeft de checkpoints, trainingsscripts, datasets en evaluatietools open source beschikbaar gesteld.
2 jun 2026 19:02
TechCrunch AIMicrosoft lanceert open source framework ASSERT voor AI-gedragstesten met tekstbeschrijvingen
Microsoft heeft ASSERT onthuld, een open source framework dat ontwikkelaars in staat stelt om AI-gedragstesten te genereren op basis van natuurlijke taal beschrijvingen. Het zet beleid en gewenst gedrag om in gestructureerde testcases en scoort de resultaten, zodat applicatiespecifiek AI-gedrag geëvalueerd kan worden. Het framework is bedoeld om de kloof te vullen tussen algemene evaluaties en de specifieke context van een product.
2 jun 2026 08:00
MarkTechPostJetBrains brengt Mellum2 uit: een 12B MoE-model voor gespecialiseerde taken in multi-model AI-pijplijnen
JetBrains heeft Mellum2 uitgebracht, een open-source Mixture-of-Experts model met 12B parameters onder de Apache 2.0-licentie. Het model is gespecialiseerd in software engineering en biedt snelle prestaties voor codegeneratie, debugging en toolgebruik. Mellum2 activeert slechts 2.5B parameters per token en heeft een contextlengte van 131.072 tokens. JetBrains positioneert het model als een 'focaal model' voor gebruik in grotere AI-systemen.
2 jun 2026 05:09
Towards AINVIDIA's 550B Nemotron overtreft alle Amerikaanse open modellen
NVIDIA heeft een open model van 550 miljard parameters uitgebracht, genaamd Nemotron. Het model behaalde een score van 48 op de Artificial Analysis Intelligence Index en presteert daarmee beter dan alle andere Amerikaanse open modellen. De snelheid van het model is opmerkelijk hoog.
2 jun 2026 03:28
Latent SpaceNVIDIA Cosmos 3, Nemotron 3 Ultra en RTX Spark
NVIDIA heeft Cosmos 3 uitgebracht, een familie van open omnimodale wereldmodellen voor fysieke AI, met een Mixture-of-Transformers architectuur. Ook werd Nemotron 3 Ultra aangekondigd, een 550B open-weight model dat de nieuwe Amerikaanse state-of-the-art is. Daarnaast is de RTX Spark personal computer met 1 petaflop superchip gepresenteerd.
1 jun 2026 17:25
Replit BlogReplit en Microsoft lanceren integratie voor AI-apps in Microsoft Fabric
Replit werkt samen met Microsoft om het bouwen van AI-aangedreven apps te vereenvoudigen via Microsoft Fabric. De integratie maakt gebruik van de nieuwe open-source SDK Rayfin. Teams kunnen sneller van idee naar productie komen, met behoud van enterprise-governance en -beveiliging.
1 jun 2026 16:53
MarkTechPostMemory OS: een open-source geheugenstack met zes lagen voor Hermes Agent
Memory OS is een nieuwe open-source bibliotheek onder MIT-licentie, ontwikkeld door ClaudioDrews, die zes geheugenlagen toevoegt aan Hermes Agent. Het omvat een vectordatabase, gestructureerde feiten en een automatisch samengestelde kenniswiki. Het systeem draait lokaal met Docker, Qdrant en Redis en is provider-agnostisch.
1 jun 2026 13:32
The DecoderNvidia's Nemotron 3 Ultra wordt slimste open US-model, maar China blijft voorloper
Volgens benchmarkplatform Artificial Analysis is Nvidia's Nemotron 3 Ultra het meest capabele open AI-model uit de VS tot nu toe, met een score van 48 punten. Het model heeft ongeveer 550 miljard parameters, waarvan 55 miljard actief. Desondanks presteren open Chinese modellen zoals Kimi K2.6 (54 punten) beter.
1 jun 2026 11:24
Luma AILuma kondigt Open Physical AI Lab aan voor open wetenschap om generalisatie in fysieke AI op te lossen
Luma AI lanceert het Open Physical AI Lab, een open wetenschapsinitiatief om het generalisatieprobleem in fysieke AI aan te pakken. Het lab richt zich op het ontwikkelen van wereldmodellen voor interactie met de fysieke wereld en streeft naar samenwerking met academische en industriële partners.
1 jun 2026 06:01
Analytics India MagazineNVIDIA brengt open-source AI-modellen Cosmos 3 uit voor de fysieke wereld
NVIDIA heeft Cosmos 3 gepresenteerd, een open-source fundamentmodel voor fysieke AI dat fysiek redeneren, wereldgeneratie en actiegeneratie combineert in één architectuur. Het bedrijf brengt twee modelgroottes uit: Cosmos 3 Nano (8B parameters) voor werkstations en real-time robotica, en Cosmos 3 Super (32B parameters) voor datacenters. Daarnaast worden zes synthetische datasets, trainingsscripts en implementatietools open-source beschikbaar gesteld via Hugging Face. Cosmos 3 leidt zijn parameterklassen op meerdere benchmarks voor fysieke AI en videogeneratie.
30 mei 2026 05:16
Towards AIBouw een XDR-achtige securitybot met OpenClaw om 24/7 logs te bewaken
Met OpenClaw, een open-source AI-agent, kun je een zelfgehoste XDR-achtige securitybot bouwen die continu logs analyseert. Het systeem gebruikt AI voor anomaliedetectie, correlatie en notificaties via Telegram, zonder cloudafhankelijkheid of dure licenties. De auteur claimt dat de totale kosten ongeveer $28 per maand bedragen.
29 mei 2026 07:28
MarkTechPostHexo Labs brengt SIA als open-source uit: een zelfverbeterende agent die zowel de scaffold als de modelgewichten bijwerkt
Hexo Labs heeft SIA (Self-Improving AI) als open-source uitgebracht onder een MIT-licentie. SIA is een zelfverbeterende agent die tijdens een loop zowel de scaffold (system prompt, tool-dispatch, retry-logica) als de modelgewichten kan aanpassen. Het systeem behaalde op drie uiteenlopende taken consistente verbeteringen ten opzichte van eerdere state-of-the-art. Op LawBench steeg de nauwkeurigheid van 50% naar 70,1% door gewichtsupdates via PPO.
28 mei 2026 19:49
AI BusinessIBM en Red Hat investeren $5 miljard in veiliger opensourcesoftware
IBM en Red Hat investeren $5 miljard in het veiliger maken van opensource-software. Het project volgt op Anthropic's nog niet uitgebrachte Mythos AI-cybersecuritymodel, dat ernstige beveiligingslekken in softwaresystemen ontdekte.
28 mei 2026 18:41
Latent SpaceHet tijdperk van asynchrone AI-agenten: Cognition's Walden Yan en OpenInspect's Cole Murray over achtergrondagenten
Cognition's Walden Yan en OpenInspect's Cole Murray bespreken de opkomst van asynchrone achtergrondagenten in AI-softwareontwikkeling. Ze gaan in op de architectuur, de groei van Devin's PR's en de december 2025 modelinflectie die spec-to-PR workflows praktisch maakte. Ook komen open-source alternatieven zoals OpenInspect aan bod.
28 mei 2026 14:29
The DecoderGoogle lanceert klein bord dat Gemma 3 lokaal draait
Google heeft op Google I/O de nieuwe Coral Board onthuld, een compacte single-board computer voor AI op het apparaat zelf. Het bord draait het open-source taalmodel Gemma 3 270M lokaal, zonder cloud. Het is bedoeld voor kleine apparaten zoals koptelefoons, AR-brillen en smartwatches en lost het versnipperingsprobleem van AI-versnellers op.
28 mei 2026 11:42
Mistral AIMistral introduceert Search Toolkit voor AI-zoekpijplijnen
Mistral AI heeft Search Toolkit uitgebracht, een composable framework voor het bouwen van productiezoekpijplijnen voor AI-toepassingen. Het open-source framework integreert ingestie, retrieval en evaluatie in één interface, waardoor teams minder tijd kwijt zijn aan integratie en meer aan zoekkwaliteit. Search Toolkit ondersteunt hybride retrieval (BM25 + dense), ingebouwde evaluatiemetrieken en is ontworpen voor enterprisegebruik in verschillende sectoren.
28 mei 2026 09:00
The Rundown AIEen wereldmodel voor eiwitten is hier: Biohub lanceert open-source ESMFold2
Biohub, de nonprofit van Mark Zuckerberg en Priscilla Chan, heeft Evolutionary Scale Models uitgebracht, waaronder ESMFold2. Dit AI-model voorspelt eiwitstructuren en presteert beter dan AlphaFold. Het systeem is open-source en ontwierp al binders tegen vijf kanker- en immuundoelen met hit rates van 36–88%. De ESM Atlas biedt een kaart van 6,8 miljard eiwitsequenties. Met een Virtual Biology Initiative van $500 miljoen wil Biohub de ontdekking van medicijnen versnellen.
28 mei 2026 08:07
MarkTechPostImplementatiegids voor een pgvector-zoekmachine voor vector-, semantische en hybride zoekopdrachten
Deze tutorial laat zien hoe je pgvector in PostgreSQL kunt gebruiken voor semantisch zoeken, hybride retrieval en andere AI-zoektechnieken. In een Google Colab-omgeving wordt stap voor stap uitgelegd hoe je embeddings maakt, HNSW-indexen bouwt en zoekopdrachten uitvoert. De gids behandelt ook half-precisie opslag, binaire kwantisering en sparse vector search. Het artikel richt zich op praktische toepassingen zoals retrieval-augmented generation en aanbevelingssystemen met alleen opensource-tools.
27 mei 2026 05:43
Towards AITogether AI's OSCAR vermindert KV-cachegeheugen met 8x — eerste 2-bit methode die niet instort bij 128K context
Together AI heeft op 25 mei 2026 OSCAR open-source uitgebracht, een 2-bit KV-cache methode die het geheugengebruik met 8x vermindert. In tegenstelling tot eerdere 2-bit methoden die boven de 32K context instorten, blijft OSCAR stabiel tot 128K context. De techniek is getest met Qwen3–8B.
26 mei 2026 08:53
Analytics India MagazineShunya Labs introduceert open standaard voor stotterannotatie
Shunya Labs heeft de Stuttering Annotation Markup Language (SAML) gelanceerd, de eerste open-source standaard voor het annoteren van stotteren in spraakdatasets. Het XML-gebaseerde formaat breidt W3C SSML uit en ondersteunt annotaties van disfluentieën zoals herhalingen, verlengingen en blokkades met een ernstschaal van 0 tot 8. De standaard moet interoperabiliteit in spraakonderzoek en klinische workflows verbeteren.
25 mei 2026 21:24
MarkTechPostTogether AI opent broncode van OSCAR: 2-bit KV-cache kwantisatiesysteem voor lange context LLM's
Together AI heeft OSCAR uitgebracht, een open-source systeem voor 2-bit kwantisatie van de KV-cache bij lange context LLM's. OSCAR gebruikt aandacht-gewogen rotaties om de kwantisatie te optimaliseren, waardoor de geheugenvoetafdruk met een factor 8 daalt en de doorvoer tot bijna 8 keer sneller wordt bij grote batchgroottes. Het systeem integreert met SGLang en ondersteunt modellen zoals Qwen3 en GLM-4.7.
Verder lezen
Meer AI-context naast het nieuws
Veelgestelde vragen
Over AI-nieuws op AI in Beeld
Hoe zijn de AI-nieuwsitems op deze pagina ingedeeld?
De nieuwsitems zijn gekoppeld aan thema’s zoals AI in de Zorg, Big Tech, Privacy en Open Source zodat je sneller per onderwerp kunt bijlezen.
Waarom zijn niet alle nieuwsitems zichtbaar?
Alleen geldige en publiek beschikbare nieuwsitems met bruikbare Qwen-samenvatting worden op de publieke nieuwspagina getoond.