OpenAI's financiƫle toekomst hangt af van infrastructuurkosten. De nieuwe JalapeƱo-chip, ontwikkeld met Broadcom, moet de hoge uitgaven voor hardware van derden verminderen. Ontdek hoe deze chip de AI-markt kan veranderen.
OpenAI's financiƫle toekomst hangt sterk af van infrastructuurkosten. Dat besef leidde tot de ontwikkeling van de eigen OpenAI JalapeƱo-chip. Deze chip, ontworpen samen met Broadcom, is een speciale ASIC (application-specific integrated circuit) die de hoge kapitaaluitgaven voor hardware van derden moet verminderen.
Nvidia heeft momenteel een winstmarge van ongeveer 75% op zijn high-end processoren. OpenAI werkt met veel kleinere marges: het houdt ruwweg ā¬0,30 winst over per verdiende euro, na aftrek van de enorme operationele kosten. De financiĆ«le last van het draaien van grote taalmodellen op schaal is gigantisch.
Vorig jaar kostte het responsief houden van ChatGPT-servers OpenAI maar liefst ā¬7,7 miljard. Nu het platform 900 miljoen wekelijkse gebruikers trekt, stijgen die operationele kosten naar verwachting naar ongeveer ā¬12,9 miljard dit jaar. In de komende acht jaar heeft OpenAI ongeveer ā¬1,3 biljoen toegezegd aan rekenkracht ā een enorme gok voor een bedrijf dat nu ā¬23 miljard aan jaarlijkse omzet genereert.
### Hardware ontwerpen voor LLM-inferentie
De OpenAI JalapeƱo-chip, door het bedrijf de eerste 'Intelligence Processor' genoemd, is specifiek gebouwd voor inferentie van grote taalmodellen (LLM's), niet voor algemene AI-workloads. OpenAI leverde het kernontwerp op basis van zijn eigen modelroadmaps en serversystemen. Broadcom verzorgde de siliciumtechniek en de integratie van hoogwaardige netwerken.
TSMC produceert de chips fysiek in Taiwan, en Celestica bouwt de bord- en racksystemen. Volgens OpenAI draaien vroege labmonsters al geavanceerde workloads, waaronder een nog niet uitgebracht GPT-5.3-Codex-Spark-model, op de beoogde productiefrequentie en -vermogen.
Richard Ho, hoofd van OpenAI's hardwareprogramma, merkte op dat de architectuur databewegingen minimaliseert om het gerealiseerde gebruik dichter bij de theoretische piekprestatie te brengen. In tegenstelling tot generieke versnellers die zijn aangepast aan oudere AI-workloads, balanceert deze architectuur specifiek reken-, geheugen- en netwerkbronnen om de knelpunten in datatransport op te lossen die typisch zijn voor interactieve LLM-inferentie.
Om dit op schaal te bereiken, integreert het platform Broadcom's Tomahawk-netwerksilicium direct in het ontwerp. Hierdoor kunnen de aangepaste processoren communiceren in enorme, geclusterde datacenteromgevingen.
### De vliegwiel van verticale integratie
Door over te stappen op eigen silicium verandert OpenAI van een simpele softwarelaag in een verticaal geĆÆntegreerd infrastructuurbedrijf. Deze full-stackstrategie beslaat de hele pijplijn: chiparchitectuur, softwarekernels, geheugensystemen, netwerkscheduling en de uiteindelijke applicatielaag. Net als Apple's strakke koppeling van eigen hardware en iOS kan OpenAI nu zijn infrastructuur optimaliseren rond zijn exacte interne modelroadmaps.
Deze integratie voedt een continu operationeel vliegwiel. Verbeterde infrastructuurefficiƫntie verlaagt de kosten van zowel trainen als serveren van modellen. Goedkoper serveren leidt tot betere, responsievere producten, wat het gebruikersvolume en de omzet stimuleert, die vervolgens worden geherinvesteerd in de volgende generatie eigen infrastructuur.
### De late-mover-voorsprong overwinnen
Door eigen silicium te introduceren, betreedt OpenAI een landschap waarin zijn belangrijkste concurrenten al bijna een decennium eigen hardware ontwikkelen. Google begon in 2015 met het inzetten van zijn Tensor Processing Units (TPU's) en heeft nu ongeveer een kwart van de wereldwijde AI-rekenkracht buiten Nvidia's toeleveringsketen in handen.
- Amazon heeft meer dan een miljoen van zijn eigen chips verzonden.
- Meta en Microsoft blijven hun eigen infrastructuur opschalen.
"JalapeƱo is onderdeel van onze langetermijn-full-stackinfrastructuurstrategie om rekenkracht overvloediger te maken," zei Greg Brockman, president en medeoprichter van OpenAI. "Door meer van de stack zelf te ontwerpen, kunnen we meer intelligentie leveren met minder middelen."
Dit is een cruciaal moment voor OpenAI. De chip kan de operationele kosten drastisch verlagen en de concurrentiepositie versterken. Maar het blijft een risicovolle zet, gezien de enorme investeringen die nodig zijn. De komende jaren zullen uitwijzen of de JalapeƱo-chip de verwachte voordelen oplevert.