Dossier

DeepSeek, Huawei Ascend en China's AI-stack

China's push naar eigen modellen en chips onder exportdruk.

Nieuwsitems

Gekoppelde artikelen

43 artikelen

Het Chinese AI-lab Z.ai heeft GLM-5.2 uitgebracht, een open weights LLM met 753 miljard parameters en een contextvenster van 1 miljoen tokens. Volgens onafhankelijke benchmarks van Artificial Analysis is het de krachtigste open weights model op de Intelligence Index, met een score van 51. Het model is echter token-hongerig: het gebruikt 43.000 output tokens per taak. Daarnaast staat het op de tweede plaats op de Code Arena WebDev leaderboard, alleen achter Claude Fable 5.

Onderzoekers van Tencent, Tsinghua University en HKUST hebben FlashMemory-DeepSeek-V4 ontwikkeld, een techniek die het geheugengebruik bij ultra-lange contexten drastisch vermindert. De methode, Lookahead Sparse Attention (LSA) genaamd, voorspelt welke tokens relevant zijn en slaat alleen die op. Hierdoor kan DeepSeek contextvensters van 1 miljoen tokens verwerken met een fractie van het gebruikelijke geheugen.

Zhipu AI heeft zijn GLM-5.2-model open source gemaakt onder een MIT-licentie. Het model is technisch een evenknie van de topmodellen van Anthropic en OpenAI. De aankondiging leidde tot een koersstijging van bijna 50% van het bedrijf aan de beurs van Hong Kong. GLM-5.2 is sterk in coding, agentic workflows en lange context.

DeepSeek heeft meer dan $7,4 miljard opgehaald in een nieuwe financieringsronde, waarmee de waardering boven $50 miljard uitkomt. Oprichter Liang Wenfeng droeg ongeveer $3 miljard bij. Het bedrijf werd wereldwijd bekend met het open-source redeneermodel DeepSeek-R1 en lanceerde recent DeepSeek-V4-Pro met 1,6 biljoen parameters. Microsoft overweegt een aangepaste versie van DeepSeek's AI-modellen te gebruiken als goedkoper alternatief voor OpenAI en Anthropic.

Uit een nieuwe wereldwijde peiling van Public First blijkt dat in 11 van de 15 ondervraagde landen de meerderheid denkt dat China de Verenigde Staten heeft ingehaald op het gebied van AI-mogelijkheden en -innovatie. Alleen in Japan, India, Vietnam en de VS zelf denkt men dat Amerika nog voorloopt. Binnen de VS is slechts 51 procent van de burgers ervan overtuigd dat hun land de AI-race domineert.

De Chinese AI-startup DeepSeek heeft in zijn eerste externe financieringsronde meer dan 50 miljard yuan (ongeveer 7,4 miljard dollar) opgehaald. De waardering van het bedrijf bedraagt nu meer dan 50 miljard dollar. Investeerders moeten hun geld in een commanditaire vennootschap steken, beheerd door CEO Liang Wenfeng, en hebben geen stemrecht. Alleen het staatsgesteunde AI-investeringsfonds van China belegt rechtstreeks en behoudt zijn stemrecht. Liang zelf investeerde ongeveer 20 miljard yuan.

Chinese AI-modellen zoals DeepSeek bieden API's aan tegen prijzen die 5 tot 10 keer lager liggen dan vergelijkbare Amerikaanse diensten, wat leidt tot een dreigende prijzenoorlog. Bedrijven zoals Lindy en Ramp schakelen over van modellen van Anthropic en Claude naar DeepSeek V4, met aanzienlijke kostenbesparingen tot gevolg. Technische efficiëntie, zoals DeepSeek's GRPO-methode, en strategische prijsstelling stellen Chinese aanbieders in staat om marges laag te houden. OpenAI overweegt prijsverlagingen en Google breidt zijn goedkopere Gemini-aanbod uit om concurrerend te blijven.

Vier dagen nadat Apple bevestigde dat Siri AI niet in China zou lanceren, onthulde Huawei HarmonyOS 7. Het besturingssysteem draait om het Intelligent Agent Framework 2.0 met AI-assistent Xiaoyi, die meer dan 2.100 systeemfuncties en 2.000 AI-agents beheert. Huawei's openPangu 2.0 foundation model heeft 505 miljard parameters. HarmonyOS 7 heeft 19% marktaandeel in China, tegenover 16% van iOS.

Meta is begonnen met het ontvlechten van de $2 miljard overname van Manus, nadat Beijing opdracht gaf de deal ongedaan te maken om nationale veiligheidsredenen. Het AI-startup Manus wordt afgesneden van Meta's interne systemen en de medeoprichters overwegen het bedrijf terug te kopen met een investering van $1 miljard. De stap onderstreept China's streven om controle te houden over strategisch gevoelige AI-technologie.

Diepgaand artikel over de rol van residuale verbindingen in neurale netwerken. DeepSeek-AI heeft een nieuwe methode genaamd Manifold-Constrained Hyper-Connections (mHC) voorgesteld die de beperkingen van bestaande technieken aanpakt. mHC stabiliseert de signaalvoortplanting en verbetert de prestaties, met slechts 6,7% overhead tijdens training. Het onderzoek toont aan dat zelfs fundamentele componenten van AI-architecturen nog aanzienlijk kunnen worden verbeterd.

China is van plan om ongeveer $295 miljard te investeren in een landelijk AI-datacenternetwerk, waarbij minstens 80 procent van de technologie van binnenlandse leveranciers zoals Huawei moet komen. Dit sluit Amerikaanse bedrijven zoals Nvidia en AMD uit. Daarnaast overweegt Taiwan om de smokkel van AI-chips naar China strafbaar te stellen.

Amerikaanse bedrijven testen het Chinese DeepSeek als goedkoper alternatief voor OpenAI en Anthropic, nu de AI-kosten in Silicon Valley blijven stijgen. DeepSeek stond in juni bovenaan de lijst van 'trending software vendors' van Ramp, hoewel het adoptiepercentage nog steeds laag is op 0,1%. Het artikel noemt ook de kapitaalronde van $7,4 miljard van DeepSeek en de zorgen over datalocatie en leveranciersrisico.

Huawei heeft op ISCAS 2025 in Shanghai de Tau (τ) Schaalwet onthuld als alternatief voor de Wet van Moore. De wet, gepresenteerd door He Tingbo, richt zich op tijdschaling in plaats van geometrische schaling om prestaties te verbeteren. Met technologieën zoals LogicFolding en chiplets claimt Huawei 1,4nm-equivalente transistordichtheden te kunnen bereiken tegen 2031 zonder EUV-lithografie.

Huawei's chipdivisie HiSilicon, onder leiding van president Tingbo He, heeft een nieuwe optimalisatiemethode onthuld genaamd Tau's Scaling Law, die de afnemende Moore's Law moet vervangen. De aanpak richt zich op het versnellen van berekeningen over chips, circuits en systemen heen, in plaats van alleen transistors te verdichten. He belooft dat de techniek binnen enkele maanden zal leiden tot een 'grote sprong voorwaarts' in chipprestaties, wat de Amerikaanse dominantie in de chipindustrie kan ondermijnen.

DeepSeek heeft voor het eerst externe financiering opgehaald, met een waardering van $45-50 miljard. Het staatsfonds ICF leidt de ronde, samen met Tencent en Alibaba. DeepSeek sloot bewust private VC's zoals Sequoia China en Hillhouse buiten. Dit weerspiegelt de trend dat Chinese AI-startups steeds vaker staatskapitaal aantrekken nu private VC in China opdroogt.

Het artikel legt de Manifold-Constrained Hyper-Connections (mHC) in DeepSeek V4 uit met visuele uitleg en korte animaties. mHC vervangt de residu-verbindingen in de transformerblokken door meerdere parallelle residustromen om de training te stabiliseren. Het artikel behandelt de architectuur, intuïtie en toepassing van mHC in de aandachts- en MoE-blokken.

Huawei's halfgeleiderdivisie claimt een doorbraak met het LogicFolding-platform, waarmee het binnen vijf jaar kan concurreren met Samsung en Nvidia. De technologie versnelt elektrische signalen in plaats van transistors te verkleinen. De eerste LogicFolding-chips debuteren dit najaar in Kirin-processoren.

DeepSeek heeft de prijzen van zijn vlaggenschipmodel V4 Pro permanent met 75% verlaagd. De nieuwe prijzen zijn vanaf 22 mei van kracht. Het bedrijf wijst op verbeteringen in de beschikbaarheid van Huawei's Ascend 950 AI-chips als belangrijke factor voor de prijsverlaging. De stap zet concurrentie in de AI-markt verder onder druk.

Huawei claimt binnen vijf jaar 1,4nm-chips te kunnen maken zonder de geavanceerde ASML-machines, met een nieuwe Tau-schaalwet en LogicFolding-technologie. De achterstand op TSMC zou daarmee teruglopen tot circa drie jaar. Het bedrijf zegt al 381 chips op deze basis in productie te hebben.

Chinese telecomaanbieders zoals China Mobile en China Telecom verkopen AI-bundels met tokens voor toegang tot AI-modellen zoals DeepSeek, Qwen, Doubao en GLM. De bundels kosten enkele euro's tot tientjes en worden beheerd met tokenmanagementsystemen. China Mobile biedt toegang tot driehonderd modellen via een modelmanagementsysteem dat per taak het beste model kiest.

Ondanks goedkeuring van de Amerikaanse exportlicenties voor Nvidia H200-chips aan Chinese bedrijven als Alibaba en Tencent, blokkeert Peking de levering omdat het bedrijven verplicht binnenlandse chips zoals die van Huawei te gebruiken. DeepSeek V4 is geoptimaliseerd voor Huawei Ascend-processors, wat duidt op een structurele verschuiving in de Chinese AI-hardwaremarkt. Nvidia's omzet uit China is gedaald naar circa 5% en het bedrijf rekent voor het huidige kwartaal op nul omzet uit China.

Chinese AI-bedrijven zijn beter geworden in videogeneratie dan Amerikaanse alternatieven. Partijen als ByteDance, Kuaishou en MiniMax worden door ontwikkelaars als realistischer en beter bruikbaar gezien. De voorsprong komt door de enorme hoeveelheid videodata van platforms zoals TikTok.

AI-bedrijf Anthropic, maker van chatbot Claude, waarschuwt in een rapport dat China de VS kan inhalen in de AI-race als er geen strengere maatregelen komen. Volgens Anthropic dreigt AI dan autoritaire trekjes te krijgen, omdat China AI inzet voor censuur en surveillance. Het rapport wijst op omzeiling van exportrestricties via smokkel van chips en distillatie-aanvallen op westerse AI-modellen.

Tencent plaatst in de tweede helft van 2026 een aanzienlijke toename van investeringen in AI-infrastructuur, mede door het verbeterde aanbod van Chinese AI-chips. Het bedrijf rapporteerde sterke eerste kwartaalresultaten en onderhandelt over een aandeel in Deepseek. Concurrent Bytedance pland meer dan 30 miljard dollar uit op AI-infrastructuur.

Chinese leveranciers van AI-hardware kunnen de stijgende vraag niet bijbenen vanwege tekorten aan kritieke componenten en beperkte productiecapaciteit, meldt Bloomberg. Onderzoeksinstellingen zoals Zhongji Innolight hebben grote hoeveelheden chips en circuitboards opgeslagen, terwijl fabrieken in Thailand en Vietnam nog niet op de Chinese productienormen zijn afgestemd. De lancering van nieuwe modellen zoals DeepSeek-V4 kan de vraag verder stimuleren.

ByteDance verhoogt zijn geplande AI-investeringen voor 2026 naar meer dan 200 miljard yuan (ongeveer 30 miljard dollar), een stijging van minstens 25 procent ten opzichte van eerdere plannen. Het bedrijf, dat ook bekend staat als de moeder van TikTok, richt zich steeds vaker op Chinese chips om geopolitieke risico's te verminderen en de druk van Beijing op binnenlandse semiconductoren te voldoen. De investeringen zijn echter nog steeds relatief klein vergeleken met de geplande AI-uitgaven van Amerikaanse tech-giganten zoals Google, Microsoft, Meta en Amazon, die samen ongeveer 725 miljard dollar willen uitgeven in 2026.

In deze uitgebreide podcast worden de laatste ontwikkelingen in de AI-wereld besproken, waaronder de lancering van GPT-5.5 door OpenAI, de open-source release van DeepSeek V4, en nieuwe onderzoeken naar AI-safety sabotage. Ook worden belangrijke bedrijfs- en beleidsupdates, zoals Google's investering in Anthropic en de blokkade van Meta's overname van Manus, besproken.

DeepSeek heeft zijn v4-versie van het model gelanceerd, die niet alleen een contextvenster van een miljoen tokens ondersteunt, maar ook een dieper inzicht biedt in de architectuur van langdurig redeneren. Het model is ontworpen met de kernstelling dat miljoen-tokens intelligentie meer vereist dan alleen het schalen van de Transformer-architectuur. DeepSeek-V4 introduceert een nieuwe geheugenstructuur, nieuwe aandachtstechnieken, nieuwe trainingssystemen, nieuwe optimisatoren, nieuwe kwantisatievormen en een dienststack die de economie van inferentie kan overleven. Het artikel benadrukt dat het model een systemenpaper is, die de praktische toepassing van langdurig redeneren mogelijk maakt.

DeepSeek-V4 Pro is nu beschikbaar op Together AI met een contextvenster van 512K tokens, controleerbare redeningsmodi en prijsmodel voor hergebruikte input. Het model maakt gebruik van een 1,6T-parameter MoE-architectuur met 49B actieve parameters. De redeningsmodi Non-Think, Think High en Think Max bieden teams de keuze tussen snelle antwoorden, diepere redeningsprocessen en maximaal redeningswerk. De prijs is gesteld op $2,10 per 1M inputtokens, $0,20 per 1M cached inputtokens en $4,40 per 1M outputtokens. DeepSeek-V4 Pro is bedoeld voor werklasten waar het model moet redeneren over langere contexten, zoals grote repositories, technische documenten en onderzoekscorpus. Het model is beschikbaar op Serverless Inference en kan later worden geïmplementeerd op Dedicated Endpoints voor productie.

DeepSeek, een AI-modellenbedrijf, heeft twee versies van zijn V4-model gelanceerd. Beide versies zijn open, goedkoper en gebruiken Huawei's AI-chips voor inferentie. De release van DeepSeek-V4 wordt gezien als een belangrijke ontwikkeling in de concurrentie tussen AI-modellen wereldwijd. De modellen zijn gericht op het verbeteren van de manier waarop mensen informatie verwerken en gebruiken.

DeepSeek introduceert zijn nieuwste AI-modellen, DeepSeek V4, die met een significante verlaging van de inferentiekosten en ondersteuning voor Huawei's Ascend-accelerators worden gepresenteerd. De modellen gebruiken geavanceerde architectuur en lagere precisie om efficiëntie te verbeteren, en zijn beschikbaar via Hugging Face en de DeepSeek API.

Huawei benadrukt het belang van schaalbare AI-infrastructuur in een tijd van massale dataverwerking. De maatregelen van de maatregelen van Huawei om data te beheren, op te slaan en te verwerken, zijn essentieel voor het opzetten van AI-modellen en toepassingen. De AI Data Lake-oplossing en de AI Data Platform (AIDP) helpen bij het oplossen van uitdagingen zoals data-silo's, lage prestaties bij inferentie en beperkte contextcapaciteit. Huawei benadrukt ook de noodzaak van samenwerking tussen opslag en rekenkracht voor efficiëntie en gebruikerservaring.

Volgens de 2026 AI Index van Stanford HAI is China de Amerikaanse leiding in AI geërfd, waardoor de twee landen nu gelijk staan. De rapportage benadrukt ook dat de AI-industrie sneller groeit dan ooit, terwijl er zorgen zijn over transparantie en het gebruik van supercomputers. De VS leidt in ontwikkeling, maar China heeft een sterke positie in patenten en robotica.

OpenAI begint met het testen van gemarkeerde bannerreclames in ChatGPT voor ingelogde gebruikers van de gratis versie en het $8-per-maand-abonnement ChatGPT Go, met een uitrol in de VS en andere markten in de komende weken. Daarnaast meldt het artikel dat Zhipu AI zijn afhankelijkheid van Amerikaanse chips heeft doorgebroken en dat er drama is bij het bedrijf Thinking Machines.

Alibaba Cloud introduceert Qwen2.5, een nieuw onderdeel van de Qwen-familie, met verbeterde prestaties in taalverwerking, programmeren en wiskunde. De release bevat meerdere modellen, waaronder Qwen2.5, Qwen2.5-Coder en Qwen2.5-Math, en biedt ondersteuning voor tot 128K tokens en meerdere talen. De modellen zijn beschikbaar via Hugging Face en andere platforms.

Alibaba Cloud heeft het Qwen1.5-110B-model vrijgegeven, het eerste model met meer dan 100 miljard parameters in de Qwen1.5-reeks. Het model presteert vergelijkbaar met Meta-Llama3-70B in basis-evaluaties en overtreft het aanzienlijk in chat-evaluaties zoals MT-Bench en AlpacaEval 2.0. Het ondersteunt een contextlengte van 32K tokens en is multilingual, met ondersteuning voor talen zoals Engels, Chinees, Frans en Spaans.