AI bouwen met imperfecte data: mythe of realiteit?

·
Luister naar dit artikel~4 min
AI bouwen met imperfecte data: mythe of realiteit?

Joe Rose van JBS Dev doorbreekt de mythe dat perfecte data nodig is voor AI. Met de juiste tools en menselijke controle kun je al veel bereiken, zelfs met rommelige data. Lees hoe.

Joe Rose, president van JBS Dev, wil een hardnekkige mythe over AI doorbreken. 'Het is een veelvoorkomend misverstand dat je data perfect moet zijn voordat je met generatieve of agentische AI aan de slag kunt', vertelt hij. En hij heeft gelijk. Laten we eerlijk zijn: perfecte data bestaat bijna niet. Het is een ideaalbeeld, maar niet de realiteit waarin bedrijven opereren. ### Waarom perfecte data een illusie is Vendors en consultants beweren vaak dat je enorme datalakes nodig hebt, of jarenlange transformatieprogramma's. Geen wonder dat directeuren met hun handen in het haar zitten. De waarheid is anders. 'De tools zijn nog nooit zo goed geweest om met slechte data om te gaan', zegt Rose. 'Het is bijna ongelooflijk wat een LLM kan begrijpen van een half ingevulde prompt.' Met de juiste beveiligingsmaatregelen kun je dus al veel bereiken, zelfs met rommelige data. ![Visuele weergave van AI bouwen met imperfecte data](https://ppiumdjsoymgaodrkgga.supabase.co/storage/v1/object/public/etsygeeks-blog-images/domainblog-f9d98e73-7126-4a63-8bfc-cd2ed1f882b1-inline-1-1779001284899.webp) ### De mens blijft nodig Natuurlijk, AI is niet perfect. De onvoorspelbaarheid van modellen betekent dat je slechte output moet kunnen opvangen. Daar komt de mens in beeld. Voor tekstuele of categorische data is er een zekere veerkracht. 'Mensen zijn gewend aan "we bouwen het, het werkt, we vergeten het"', zegt Rose. 'Maar zo werken deze systemen niet.' ### Praktijkvoorbeeld: medische sector Rose geeft een voorbeeld uit de medische sector. Een klant moest overstappen naar een nieuw facturatiesysteem. De dossiers waren een rommeltje: sommige in PDF, andere als afbeelding. Soms stond de behandeling onder de naam van de arts, of de artsennaam in het patiëntendossier. Gen AI kon met een simpele prompt de schone data eruit halen: van OCR voor afbeeldingen tot tekstextractie voor PDF's. Daarna werden agentische technieken ingezet, zoals het vergelijken van een klantrecord met een verzekeringscontract om te controleren of het juiste tarief werd berekend. 'Je begint met simpele use cases en stapelt er steeds meer bovenop', legt Rose uit. 'Niet alles werkt meteen perfect, maar je kunt groeien van 20% automatisering naar 40%, 60% en uiteindelijk 80%.' ### De toekomst: kosten en draagbaarheid Rose verwacht dat de discussie over AI zal verschuiven. 'Ik denk dat we van radicale sprongen in modelcapaciteit gaan naar hoe we de kosten duurzamer maken. We kunnen niet doorgaan met datacenters bouwen in het huidige tempo.' De laatste mijl is volgens hem: hoe krijgen we deze systemen op een laptop of telefoon draaiend, in plaats van in een datacenter? 'De modellen zijn getraind op een enorme hoeveelheid data, eigenlijk elke pagina op het internet. Er komt niet opeens een schat aan nieuwe data die voor een doorbraak zorgt.' ### Doe het zelf: stop met SaaS Op de AI & Big Data Expo, waar JBS Dev aanwezig is, gaat Rose nog een stap verder. Hij adviseert bedrijven om te stoppen met het kopen van dure SaaS-licenties. 'Het is niet zo moeilijk als het klinkt', zegt hij. 'Bijna elk bedrijf heeft een cloudomgeving. Begin daarmee. De grote drie cloudproviders hebben alles wat je nodig hebt om morgen met agentische workloads te starten, zonder nieuwe softwarelicenties of training.' En als je dat eenmaal hebt opgezet, staat JBS Dev klaar voor de volgende stappen. ### Conclusie Perfecte data is geen vereiste voor AI. Met de juiste tools en een menselijke check kun je al veel bereiken. Focus op haalbare stappen, van 20% naar 80% automatisering. En overweeg om zelf te bouwen in de cloud, in plaats van te leunen op dure SaaS-oplossingen. De toekomst van AI is niet alleen slimmer, maar ook betaalbaarder en draagbaarder.