De wiskunde achter de OpenAI JalapeƱo-chip

Ā·
Luister naar dit artikel~4 min
De wiskunde achter de OpenAI JalapeƱo-chip

OpenAI's financiƫle koers hangt af van infrastructuurkosten. De nieuwe custom JalapeƱo-chip, ontwikkeld met Broadcom, moet de afhankelijkheid van dure hardware van derden verminderen en de marges verbeteren.

OpenAI's financiĆ«le koers hangt sterk af van infrastructuurkosten. Die realiteit leidde tot de ontwikkeling van de nieuwe custom OpenAI JalapeƱo-chip. In samenwerking met Broadcom is deze application-specific integrated circuit (ASIC) een directe poging om de zware kapitaaluitgaven aan hardware van derden te verminderen. Terwijl Nvidia naar schatting 75% winstmarge heeft op zijn high-end processors, werkt OpenAI met veel kleinere marges. Het bedrijf houdt ongeveer €0,33 winst over per gegenereerde euro, na aftrek van de enorme operationele kosten. De financiĆ«le last van het draaien van grote taalmodellen op schaal is enorm. ### De kosten van ChatGPT Vorig jaar kostte het responsief houden van ChatGPT-servers OpenAI maar liefst €7,7 miljard. Nu het platform 900 miljoen wekelijkse gebruikers trekt, stijgen die operationele kosten naar verwachting naar ongeveer €12,9 miljard dit jaar. In de komende acht jaar heeft OpenAI ongeveer €1,3 biljoen toegezegd aan rekenkracht. Dat is een enorme gok voor een bedrijf dat nu €23 miljard aan jaarlijkse omzet genereert. ### Hardware ontwerpen voor LLM-inferentie De OpenAI JalapeƱo-chip, het eerste zogenaamde 'Intelligence Processor' van het bedrijf, is specifiek gebouwd voor LLM-inferentie en niet voor algemene AI-workloads. OpenAI leverde het kernontwerp op basis van zijn eigen modelroadmaps en servicesystemen. Broadcom zorgde voor de siliciumengineering en de integratie van high-performance netwerken. TSMC verzorgt de fysieke productie in Taiwan. Celestica bouwt de board- en racksystemen. Volgens OpenAI draaien vroege labmonsters al grensverleggende workloads, waaronder een onuitgebracht GPT-5.3-Codex-Spark-model, op de beoogde productiefrequentie en -vermogen. Richard Ho, hoofd van OpenAI's hardwareprogramma, merkte op dat de architectuur databeweging minimaliseert. Daardoor komt het gerealiseerde gebruik dichter bij de theoretische piekprestaties. In tegenstelling tot algemene accelerators die zijn aangepast aan legacy AI-workloads, balanceert deze architectuur specifiek reken-, geheugen- en netwerkbronnen. Het doel is om de databewegingsknelpunten op te lossen die inherent zijn aan interactieve LLM-serving. Om dit op schaal te bereiken, integreert het platform Broadcom's Tomahawk-netwerksilicium direct in het ontwerp. Zo kunnen de custom processors communiceren in enorme, geclusterde datacenteromgevingen. ### De vliegwiel van verticale integratie Door over te stappen op custom silicium verandert OpenAI van een simpele softwarelaag in een verticaal geĆÆntegreerd infrastructuurbedrijf. Deze full-stackstrategie omvat de hele pijplijn: chiparchitectuur, softwarekernels, geheugensystemen, netwerkscheduling en de uiteindelijke applicatielaag. Net als Apple's nauwe koppeling van eigen hardware en iOS, kan OpenAI nu zijn infrastructuur optimaliseren rond zijn exacte interne modelroadmaps. Deze integratie voedt een continu operationeel vliegwiel: - Verbeterde infrastructuurefficiĆ«ntie verlaagt de kosten van zowel training als serving van modellen. - Betaalbaardere serving leidt tot betere, responsievere producten. - Dit stimuleert gebruikersvolume en omzet, die opnieuw worden geĆÆnvesteerd in de volgende generatie custom infrastructuur. ### De late-mover voorsprong overwinnen Door zijn eigen silicium te introduceren, betreedt OpenAI een landschap waar zijn belangrijkste concurrenten bijna een decennium eigen hardware hebben ontwikkeld. Google begon in 2015 met het uitrollen van zijn Tensor Processing Units (TPU's) en controleert nu ongeveer een kwart van de wereldwijde AI-rekencapaciteit buiten Nvidia's toeleveringsketen. Amazon heeft meer dan een miljoen van zijn custom chips verscheept. Meta en Microsoft blijven hun eigen infrastructuur opschalen. > "JalapeƱo is onderdeel van onze langetermijn full-stack infrastructuurstrategie om rekenkracht overvloediger te maken," zei Greg Brockman, president en medeoprichter van OpenAI. "Door meer van de stack zelf te ontwerpen, kunnen we meer intelligentie leveren met minder middelen." Deze strategische zet plaatst OpenAI in een sterke positie om de groeiende vraag naar AI-diensten aan te kunnen, terwijl het tegelijkertijd de kosten beheerst.