Wat Anthropic's data onthult over succesvol AI-gebruik

·
Luister naar dit artikel~5 min
Wat Anthropic's data onthult over succesvol AI-gebruik

Anthropic's Economic Index analyseert miljoen interacties met Claude.ai. Data toont dat AI-gebruik zich concentreert op beperkte taken, vooral code. Samenwerking mens-AI werkt beter dan volledige automatisering voor complex werk.

Laat ik je meenemen in een fascinerend rapport van Anthropic. Ze hebben hun zogenaamde Economic Index gepubliceerd, en het geeft een uniek inkijkje in hoe bedrijven en individuen écht met grote taalmodellen werken. We hebben het over de analyse van een miljoen consumenteninteracties op Claude.ai, plus nog eens een miljoen enterprise API-aanroepen uit november 2025. Het mooie is dat deze cijfers gebaseerd zijn op daadwerkelijke observaties, niet op een standaard enquête onder besluitvormers. ### Beperkte use cases domineren Het valt meteen op dat het gebruik van Anthropic's AI zich concentreert rond een relatief klein aantal taken. De tien meest uitgevoerde taken zijn goed voor bijna een kwart van alle consumenteninteracties en bijna een derde van het enterprise API-verkeer. En raad eens waar de focus ligt? Juist, op codecreatie en -aanpassing. Deze concentratie op AI als softwareontwikkelingshulpmiddel blijft vrij constant in de tijd. Dat suggereert dat de waarde van het model vooral rond dit soort taken draait, zonder dat er nieuwe toepassingen van betekenis opkomen. Het is een belangrijke les: brede, algemene AI-implementaties hebben minder kans van slagen dan gerichte inzet op taken waar taalmodellen hun effectiviteit hebben bewezen. ### Samenwerken wint van automatiseren Op consumentenplatforms zie je vooral collaboratief gebruik - waar gebruikers hun vragen aan de AI verfijnen tijdens een virtueel gesprek. Automatisering van workflows komt minder voor. Bij enterprise API-gebruik is het precies andersom: bedrijven proberen juist kosten te besparen door taken te automatiseren. Maar hier zit een interessante nuance. Claude presteert goed op kortere taken, maar de kwaliteit van de uitkomsten daalt naarmate de taak complexer wordt en meer 'denktijd' vereist. Het is alsof je een collega vraagt om een snelle berekening versus een volledig projectplan op te stellen. - Automatisering werkt het best voor routine, goed gedefinieerde taken - Taken die mensen uren kosten hebben significant lagere slagingspercentages - Voor langere taken moeten gebruikers outputs itereren en corrigeren Wat wel werkt? Gebruikers die grote taken opbreken in beheersbare stappen en die apart aanbieden (interactief of via API) zien hun slagingskansen stijgen. Het is een kwestie van slim chunken, zoals we dat noemen. ### Wie gebruikt AI eigenlijk? De observaties laten zien dat de meeste queries bij LLM's te maken hebben met white-collar functies. Hoewel er wel verschillen zijn tussen landen - in armere landen wordt Claude vaker in academische settings gebruikt dan bijvoorbeeld in de VS. Neem reisagenten. Zij kunnen complexe planningswerkzaamheden overlaten aan de LLM, terwijl ze zich richten op meer transactioneel werk. Bij property managers zie je het omgekeerde: routineuze administratieve taken kunnen door de AI worden afgehandeld, terwijl taken die meer oordeel vereisen bij de menselijke professional blijven. ### Productiviteitswinst versus betrouwbaarheid Het rapport maakt een interessante kanttekening bij claims dat AI de arbeidsproductiviteit met 1,8% per jaar zou verhogen (over een decennium). Dat cijfer zou volgens de analyse beter op 1-1,2% kunnen liggen, omdat je extra arbeid en kosten moet meerekenen. Een efficiëntiewinst van 1% over tien jaar is nog steeds economisch betekenisvol, maar activiteiten zoals validatie, foutafhandeling en herwerking verlagen de slagingspercentages. Besluitvormers in bedrijven moeten hier rekening mee houden. De potentiële winst voor een organisatie hangt ook af van of taken aan de LLM complementair zijn aan of een vervanging vormen voor menselijk werk. In dat laatste geval hangt het succes van de vervanging af van hoe complex het werk is. Een cruciale bevinding: er is een bijna perfecte correlatie tussen de verfijning van de prompts die gebruikers aan de LLM geven en succesvolle uitkomsten. Hoe mensen AI gebruiken, bepaalt wat het oplevert. ### Belangrijkste inzichten voor leiders > "AI-implementatie levert het snelst waarde op in specifieke, goed gedefinieerde gebieden." Complementaire systemen (AI+mens) presteren beter dan volledige automatisering voor complexe taken. Het draait om de juiste balans vinden - weten wanneer je de menselijke expertise nodig hebt en wanneer de AI efficiënter is. De kunst is om niet te proberen alles te automatiseren, maar te identificeren waar AI écht verschil maakt. Begin klein, focus op bewezen use cases, en bouw van daaruit verder. Want zoals de data laat zien: succesvol AI-gebruik is geen kwestie van alles vervangen, maar van slim aanvullen.