AI en imperfecte data: de mythe ontkracht door JBS Dev
Sophie Jansen ·
Luister naar dit artikel~4 min

Joe Rose van JBS Dev doorbreekt de mythe dat perfecte data nodig is voor AI. Met praktijkvoorbeelden uit de medische sector laat hij zien hoe generatieve AI omgaat met imperfecte data, en waarom de focus verschuift naar kosten en draagbaarheid.
Joe Rose, president van strategisch technologiebedrijf JBS Dev, wil graag een hardnekkige mythe rond generatieve en agentische AI-systemen doorbreken. "Het is een veelvoorkomend misverstand dat je data perfect moet zijn voordat je dit soort workloads kunt uitvoeren," legt hij uit.
### Waarom perfecte data niet nodig is
Volgens een recent artikel in AI Fieldbook suggereren leveranciers en consultants – niet verrassend – dat je enorme datalakes en jarenlange datatransformatieprogramma's nodig hebt. Directeuren staan er dan ook met hun handen in het haar. De realiteit is echter anders. "De tools zijn nog nooit zo goed geweest als nu om met slechte kwaliteit data om te gaan," zegt Rose. "Het is bijna opmerkelijk wat een LLM kan begrijpen van een halfgeschreven prompt."
Dit is logisch. Als je zo'n krachtig hulpmiddel hebt, kun je het maar beter inzetten – met de juiste waarborgen. De inherente onvoorspelbaarheid van modellen vereist dat je omgaat met foutieve output, en daar komt de mens in de loop om de hoek kijken. Voor tekstuele of categorische data is er veerkracht ingebouwd. "Mensen zijn gewend aan 'we bouwen het, het werkt, we vergeten het'," zegt Rose. "Maar zo werken deze systemen niet."

### Een praktijkvoorbeeld uit de medische sector
Rose geeft een voorbeeld van een klant in de medische sector die wilde migreren naar een ander factuurvereffeningssysteem. De dossiers waren een mix: sommige waren PDF, andere een afbeelding; de procedure stond soms op naam van de arts, de artsennaam stond soms in het patiëntveld, enzovoort. De generatieve AI kon de schone data halen uit een simpele prompt, van OCR voor de afbeeldingen tot tekstextractie voor de PDF's. Vervolgens werden meer agentische benaderingen toegepast, zoals het vergelijken van een klantrecord met een verzekeringscontract om te controleren of het juiste tarief werd berekend.
"Je begint verschillende use cases op elkaar te stapelen," zegt Rose. "Dat betekent niet dat alles perfect gaat – je hebt nog steeds een mens in de loop nodig. Maar wat je wilt doen, is zeggen: 'we begonnen met 20% automatisering, daarna 40%, dan 60, 80%', en dat in de loop van de tijd laten groeien."
### De toekomst: kosten en draagbaarheid
Volgens Rose zullen toekomstige discussies over deze modellen gaan over kosten en draagbaarheid. "Ik denk dat je een verschuiving gaat zien van radicale sprongen in modelcapaciteit naar de vraag: hoe maken we de kosten duurzaam zodat we niet in hetzelfde tempo datacenters hoeven te bouwen?" zegt hij.
"De laatste mijl is: hoe krijgen we deze dingen op een laptop of telefoon te draaien in plaats van in een datacenter? De modellen zijn getraind op een enorme hoeveelheid data – in feite elke pagina op het internet en nog wat. Het is niet alsof er nog een enorme berg data is die niet al in de modellen zit en tot een doorbraak zal leiden."
### Doe het zelf: waarom je minder van SaaS-leveranciers moet kopen
Tijdens de AI & Big Data Expo, waar JBS Dev aan deelneemt, kijkt Rose uit naar de gesprekken. Een van zijn controversiële standpunten: stop met kopen van SaaS-leveranciers als je het zelf kunt doen. "Het is niet zo moeilijk als het klinkt," zegt hij. "Bijna iedereen heeft een cloudomgeving, en dat is waar ik zou beginnen. De cloudtools, vooral van de grote drie, bieden alles wat je nodig hebt om morgen agentische workloads te implementeren, zonder nieuwe softwarelicenties of training."
Zodra dat is opgezet, staat JBS Dev klaar voor de volgende stappen van de reis.
### Conclusie
Imperfecte data hoeft geen belemmering te zijn. Met de juiste tools en een menselijke controle kun je stap voor stap automatiseren. De focus verschuift van modelcapaciteit naar kostenefficiëntie en draagbaarheid. En vergeet niet: soms is het beter om zelf te bouwen dan te kopen.