Ontdek hoe OpenAI met de eigen JalapeƱo-chip de torenhoge kosten van AI-infrastructuur wil verlagen en minder afhankelijk wil worden van dure hardware van derden, zoals Nvidia.
OpenAI heeft een enorme financiƫle uitdaging: de kosten van AI-infrastructuur lopen gigantisch op. Daarom ontwikkelde het bedrijf samen met Broadcom de eigen OpenAI JalapeƱo-chip. Dit is een speciale ASIC-chip die moet helpen om minder afhankelijk te zijn van dure hardware van derden, zoals die van Nvidia.
Nvidia heeft een winstmarge van maar liefst 75% op zijn high-end processors. OpenAI houdt zelf maar ongeveer ā¬0,30 over van elke verdiende euro, nadat alle operationele kosten zijn betaald. Die kosten zijn enorm, vooral door het draaien van grote taalmodellen op schaal.
Vorig jaar kostte het draaiende houden van ChatGPT-servers al zo'n ā¬7,7 miljard. Dit jaar, met 900 miljoen wekelijkse gebruikers, wordt dat naar verwachting ongeveer ā¬12,9 miljard. En voor de komende acht jaar heeft OpenAI maar liefst ā¬1,3 biljoen aan rekenkracht vastgelegd. Een gigantische gok voor een bedrijf dat nu ā¬23 miljard aan jaarlijkse omzet draait.
### Hardware ontworpen voor LLM-inferentie
De OpenAI JalapeƱo-chip wordt door het bedrijf de eerste 'Intelligence Processor' genoemd. Hij is speciaal gemaakt voor het uitvoeren van grote taalmodellen (LLM-inferentie), niet voor algemene AI-taken. OpenAI leverde het basisontwerp op basis van zijn eigen modelroadmaps en serversystemen, terwijl Broadcom de chipengineering en de netwerk-integratie verzorgde.
TSMC produceert de chips in Taiwan, en Celestica bouwt de boards en racksystemen. Volgens OpenAI draaien de eerste labmonsters al geavanceerde workloads, waaronder een nog niet uitgebracht GPT-5.3-Codex-Spark-model, op de beoogde productiefrequentie en -stroom.
Richard Ho, hoofd van OpenAI's hardwareprogramma, vertelde dat de architectuur de databeweging minimaliseert. Hierdoor komt de werkelijke benutting dichter bij de theoretische piekprestaties. In tegenstelling tot algemene accelerators lost dit ontwerp specifiek de knelpunten op die ontstaan bij interactieve LLM-inferentie.
Om dit op schaal te bereiken, is Broadcom's Tomahawk-netwerkchip direct in het ontwerp geĆÆntegreerd. Zo kunnen de aangepaste processoren communiceren in enorme, geclusterde datacenteromgevingen.
### Het vliegwiel van verticale integratie
Door eigen chips te maken, verandert OpenAI van een softwarebedrijf in een verticaal geĆÆntegreerd infrastructuurbedrijf. Deze aanpak beslaat de hele keten: chiparchitectuur, softwarekernels, geheugensystemen, netwerkplanning en de uiteindelijke applicatielaag. Net zoals Apple zijn hardware en iOS strak op elkaar afstemt, kan OpenAI nu zijn infrastructuur optimaliseren voor zijn eigen modelroadmaps.
Deze integratie zorgt voor een continu operationeel vliegwiel. Betere infrastructuur verlaagt de kosten voor zowel trainen als gebruiken van modellen.
- Goedkopere inferentie leidt tot betere, snellere producten.
- Dat trekt meer gebruikers en omzet aan.
- Die omzet wordt opnieuw geĆÆnvesteerd in de volgende generatie infrastructuur.
### De late mover-achterstand inhalen
Door eigen chips te introduceren, betreedt OpenAI een veld waar concurrenten al bijna een decennium aan eigen hardware werken. Google begon in 2015 met Tensor Processing Units en heeft nu ongeveer een kwart van de wereldwijde AI-rekencapaciteit buiten Nvidia's toeleveringsketen in handen.
Amazon heeft meer dan een miljoen eigen chips verscheept, terwijl Meta en Microsoft hun eigen infrastructuur blijven opschalen.
> "JalapeƱo is onderdeel van onze langetermijnstrategie om rekenkracht overvloediger te maken," zei Greg Brockman, president en medeoprichter van OpenAI. "Door meer van de stapel zelf te ontwerpen, kunnen we meer intelligentie leveren met minder middelen."
De hamvraag is of OpenAI met deze chip de achterstand op Google, Amazon en anderen kan inhalen. De komende jaren zullen uitwijzen of de JalapeƱo-chip echt het verschil maakt.