Mythe doorprikt: imperfecte data en de AI-laatste mijl

·
Luister naar dit artikel~4 min
Mythe doorprikt: imperfecte data en de AI-laatste mijl

Joe Rose van JBS Dev ontkracht de mythe dat perfecte data nodig is voor AI. Moderne tools kunnen uitstekend omgaan met imperfecte data. Ontdek hoe je met een mens-in-de-loop aanpak stapsgewijs kunt automatiseren.

Joe Rose, president van strategische technologieleverancier JBS Dev, wil een veelvoorkomende mythe over generatieve en agentische AI-systemen ontkrachten. "Het is een misvatting dat je data perfect moet zijn voordat je dit soort workloads kunt uitvoeren," legt hij uit. Leveranciers en consultants beweren vaak dat je enorme datalakes en jarenlange transformatieprogramma's nodig hebt. Dat klinkt logisch, maar de realiteit is anders. "De tools zijn nog nooit zo goed geweest om met slechte kwaliteit data om te gaan," zegt Rose. "Het is bijna opmerkelijk wat een LLM kan begrijpen van een halfgeschreven prompt." ### Waarom imperfecte data geen showstopper is Het klinkt misschien tegenstrijdig, maar moderne AI-tools zijn ontworpen om met rommelige data te werken. Je hebt alleen de juiste beveiligingsmaatregelen nodig. De onvoorspelbaarheid van modellen betekent dat je slechte uitkomsten moet kunnen opvangen, en daar komt de mens in de loop om de hoek kijken. Voor tekstuele of categorische data is er al veerkracht ingebouwd. "Mensen zijn gewend aan 'we bouwen het, het werkt, we vergeten het'," zegt Rose. "Maar zo werken deze systemen niet." ![Visuele weergave van Mythe doorprikt](https://ppiumdjsoymgaodrkgga.supabase.co/storage/v1/object/public/etsygeeks-blog-images/domainblog-8628f726-5d7d-4380-858d-90bac7fb05c4-inline-1-1779017482882.webp) ### Een praktijkvoorbeeld uit de medische sector Rose geeft een voorbeeld van een klant in de medische sector die wilde migreren naar een nieuw facturatie- en reconciliatiesysteem. De dossiers waren een mix: sommige in PDF, andere als afbeelding; de procedure stond soms op naam van de arts, de arts op naam van de patiënt, enzovoort. Gen AI kon de schone data halen uit een simpele prompt, van OCR voor afbeeldingen tot tekstextractie voor PDF's. Vervolgens werden agentische benaderingen gebruikt, zoals het vergelijken van een klantrecord met een verzekeringscontract om te controleren of het juiste tarief werd berekend. "Je begint verschillende use cases op elkaar te stapelen," zegt Rose. "Dat betekent niet dat het alles perfect doet – je hebt nog steeds een mens nodig. Maar je wilt zeggen: we begonnen met 20% automatisering, daarna 40%, 60%, 80%, en dat in de loop van de tijd laten groeien." ### De AI-laatste mijl: kosten en draagbaarheid Rose verwacht dat toekomstige discussies over AI-modellen zich gaan richten op kosten en draagbaarheid. "Ik denk dat we een verschuiving gaan zien van radicale sprongen in modelcapaciteit naar 'hoe maken we de kosten duurzamer, zodat we niet in hetzelfde tempo datacenters hoeven te bouwen?'," zegt hij. "De laatste mijl is: hoe krijgen we deze dingen op een laptop of telefoon te draaien in plaats van in een datacenter?" De modellen zijn getraind op een enorme hoeveelheid data – in feite elke pagina op het internet en meer. "Het is niet alsof er nog een ton data is die niet al in de modellen zit en die tot een doorbraak zal leiden." ### Doe het zelf: stop met SaaS-leveranciers Tijdens de AI & Big Data Expo, waar JBS Dev deelneemt, kijkt Rose uit naar de gesprekken. Een controversiële mening die hij zal delen: stop met het kopen van SaaS-licenties als je het zelf kunt doen. "Het is niet zo moeilijk als het klinkt," zegt hij. "Bijna iedereen heeft een cloud-omgeving, en dat is waar ik zou beginnen. De cloud-tools van de grote drie hebben alles wat je nodig hebt om morgen agentische workloads te implementeren, zonder nieuwe softwarelicenties of training." ### Conclusie Imperfecte data is geen excuus om niet met AI te beginnen. De tools zijn er, de mogelijkheden zijn er, en met de juiste aanpak kun je stapsgewijs automatiseren. JBS Dev helpt je graag bij de volgende stappen van de reis.