Alibaba bouwt AI-chips voor agenten: wat dit betekent

·
Luister naar dit artikel~6 min
Alibaba bouwt AI-chips voor agenten: wat dit betekent

Alibaba onthult de Zhenwu M890 AI-processor, speciaal ontworpen voor AI-agenten. Met een meerjarige roadmap en het Qwen 3.7-Max model bouwt het bedrijf een geïntegreerde AI-stack, waarmee het de concurrentie met Nvidia aangaat. Dit verandert de AI-wedloop.

Alibaba heeft een nieuwe AI-processor onthuld die speciaal is ontworpen voor AI-agenten. De chip-aankondiging gaat gepaard met een meerjarige silicium-roadmap en een nieuw groot taalmodel. Dit laat zien dat het bedrijf een geïntegreerde AI-stack bouwt, in plaats van alleen een gat te vullen dat is ontstaan door Amerikaanse exportcontroles. ### De Zhenwu M890: drie keer sneller De Zhenwu M890, ontwikkeld door Alibaba's halfgeleiderdochter T-Head, levert drie keer de prestaties van zijn voorganger, de Zhenwu 810E. Maar de prestatieverbetering is minder opvallend dan de architecturale intentie achter de chip. De M890 is namelijk gebouwd voor AI-agenten. Dat zijn softwaresystemen die lange stukken context moeten onthouden, in realtime met andere modellen moeten coördineren en complexe meerstapstaken moeten uitvoeren met minimale menselijke tussenkomst. Deze eisen, die zwaar leunen op geheugenbandbreedte en communicatie tussen modellen, zijn wezenlijk anders dan waar standaard inferentiechips voor zijn geoptimaliseerd. Het verschil is belangrijk omdat het je iets vertelt over waar Alibaba denkt dat AI-computing naartoe gaat. Het bedrijf ontwerpt niet rond de dominante use case van vandaag; het bouwt voor het werkprofiel dat volgens hen de komende jaren enterprise AI zal definiëren. ### Gebouwd voor AI-agenten, niet alleen inferentie Belangrijker dan de chip zelf is de roadmap die Alibaba erbij heeft gepresenteerd. De M890 wordt in het derde kwartaal van 2027 gevolgd door de V900, die naar verwachting opnieuw een ruime verdrievoudiging van de prestaties levert. Daarna komt in het derde kwartaal van 2028 de J900. Dat is een bewust, aanhoudend tempo van interne siliciumupgrades dat lijkt op de tick-tock-productcycli die Nvidia heeft gebruikt om zijn voorsprong in AI-versnellers te behouden. De parallel met Huawei is het vermelden waard. Huawei heeft vorig jaar een vergelijkbare chip-roadmap voor zijn Ascend-lijn gepresenteerd. Beide aankondigingen weerspiegelen dezelfde onderliggende realiteit: Chinese technologiebedrijven hebben geconcludeerd dat afhankelijkheid van buitenlandse silicium, zelfs in scenario's waarin exportbeperkingen zouden kunnen worden versoepeld, een structureel risico is dat ze niet kunnen accepteren. De reactie is geweest om halfgeleiderontwikkeling te behandelen als een oefening in het opbouwen van capaciteiten op de lange termijn, in plaats van een inkoopprobleem. Alibaba's toewijding aan die oefening is niet oppervlakkig. Het bedrijf heeft vorig jaar meer dan 380 miljard yuan (ongeveer €49 miljard) toegezegd aan cloud- en AI-infrastructuur over drie jaar. Dat is de grootste investeringsverplichting ooit in de sector. De M890 en zijn opvolgers zijn het gevolg van die uitgaven. ### Tractie die aan de aankondiging voorafging T-Head zegt dat het tot nu toe meer dan 560.000 Zhenwu-eenheden heeft verscheept, met meer dan 400 externe klanten in 20 sectoren die de chips inzetten, waaronder autofabrikanten en financiële dienstverleners. Dat is een aanzienlijke productievoetafdruk, geen laboratoriumhardware, en het geeft Alibaba schaal data uit de echte wereld vóór de uitrol van de M890. De nieuwe chip wordt beschikbaar gesteld aan Chinese zakelijke klanten via het binnenlandse modelplatform van Alibaba Cloud, Bailian, verpakt in de Panjiu AL128. Dat is een serversysteem dat 128 M890-versnellers in één rek stapelt. ### De softwarekant van de stack Naast de hardware kondigde Alibaba Qwen 3.7-Max aan, de nieuwste versie van zijn vlaggenschip grote taalmodel. Het is beschreven als ontworpen voor geavanceerd coderen en langdurige agenttaken. Het bedrijf zegt dat het model continu tot 35 uur kan werken zonder prestatieverlies. Dat is een specificatie die alleen logisch is als je ontwerpt voor langdurige autonome werking. De timing is bewust. Het op dezelfde dag uitbrengen van een chip en een model die voor dezelfde werklastklasse zijn geoptimaliseerd, is een platformspel. Alibaba bouwt een gesloten lus: zijn eigen silicium in T-Head, zijn eigen model in Qwen, zijn eigen cloudlevering in Bailian. Elk onderdeel versterkt de andere, en de gecombineerde stack is ontworpen om de afhankelijkheid van zakelijke klanten van externe partijen te verminderen. ### Wat dit betekent voor de AI-wedloop Deze zet van Alibaba verandert wat de wedloop eigenlijk inhoudt. Het gaat niet langer alleen om wie de snelste chip heeft, maar om wie het meest geïntegreerde ecosysteem kan bouwen. Door zowel hardware als software in eigen huis te ontwikkelen, kan Alibaba optimalisaties doorvoeren die concurrenten met losse componenten niet kunnen evenaren. Denk aan naadloze communicatie tussen chip en model, of aan energie-efficiëntie die is afgestemd op specifieke AI-werklasten. Voor Nederlandse professionals in AI-websitebouw en media-analyse is dit relevant. De keuzes die Alibaba maakt, beïnvloeden de beschikbaarheid en prijs van AI-infrastructuur wereldwijd. Als Chinese bedrijven hun eigen stack perfectioneren, kan dat leiden tot lagere kosten en betere prestaties voor AI-toepassingen, ook in Europa. Het kan ook betekenen dat de afhankelijkheid van Amerikaanse technologie zoals Nvidia afneemt, wat strategische implicaties heeft voor bedrijven die AI inzetten. ### Conclusie Alibaba's aankondiging van de M890-chip, de roadmap en het Qwen 3.7-Max-model markeert een verschuiving in de AI-wedloop. Het bedrijf bouwt niet alleen een snellere chip, maar een compleet, geïntegreerd platform voor AI-agenten. Voor wie in de AI-sector werkt, is dit een signaal om verder te kijken dan alleen hardwareprestaties en na te denken over de bredere ecosystemen die de toekomst van AI zullen bepalen.