Chocola maken van onbetrouwbare data (Onder de Radar #12)
Kunstmatige intelligentie verovert de industrie stormenderhand. Maar integratie in een hightech systeem is gemakkelijker gezegd dan gedaan. Bij Thales bouwt Gregor Pavlin samen met zijn team gedegen kennis op van relevante AI-methodes, om deze vervolgens te vertalen in goede engineeringpraktijken.
“Bewakingssystemen, bijvoorbeeld in defensie- of veiligheidstoepassingen, combineren doorgaans allerlei sensoren die enorme hoeveelheden gegevens produceren. Deze gegevens zijn niet alleen groot, er zitten ook allerlei haken en ogen aan: verschillende soorten data, op ingewikkelde manieren gecorreleerd, dubbelzinnig en ruizig – wat betekent dat ze verkeerd kunnen zijn”, zegt Gregor Pavlin. “Zulke onbetrouwbare gegevens zijn in principe nutteloos zonder goede analyse. Het zijn gewoon een heleboel signalen die op zichzelf niet heel bruikbaar zijn voor de besluitvorming of het besturingsprobleem in kwestie. Maar verborgen in de berg gegevens zit een schat aan toepasbare informatie. Wij ontwikkelen de middelen om die informatie eruit te halen. En omdat dat een ongelooflijk complexe klus is, gebruiken we kunstmatige intelligentie om ons te helpen.”
Pavlin werkt bij Thales Research & Technology (TRT), waar hij zowel programmamanager als senior onderzoeker is in de AI-groep. “Met mij erbij zijn we met zijn vijven. De rol van TRT is om exotische technologie te vertalen naar iets wat de businesslijnen kunnen gebruiken. Het is geen theoretisch onderzoek; het is toegepaste wetenschap. We volgen de adacemische vooruitgang op ons gebied, identificeren en bestuderen de resultaten die relevant kunnen zijn voor Thales en passen ze aan voor toepassingen in de echte wereld.”
“Neem een ruimte die door meerdere sensoren wordt bewaakt”, illustreert Pavlin. “Een verdacht persoon loopt het beeld van een camera binnen maar verdwijnt vervolgens uit het zicht omdat er geen volledige dekking is. Een paar minuten later wordt elders in de ruimte iemand waargenomen. Kan het dezelfde persoon zijn? Kan deze persoon in de tussenliggende tijd deze afstand hebben afgelegd? We hebben dus al deze waarnemingen, deze onbetrouwbare gegevens die vaak dubbelzinnig zijn en soms zelfs verkeerd – omdat sensoren ook fouten maken – en we willen er bruikbare informatie uit halen. AI biedt de juiste machinerie om dat te doen: de tools om de modellen te maken die de probleemruimte representeren, de machine learning-algoritmes om de modellen automatisch te optimaliseren op basis van de waarnemingen en de redeneeralgoritmes om alles te begrijpen.”
Diep inzicht
Aan de universiteit van Graz in Oostenrijk heeft Pavlin voor het eerst kunnen proeven van de uitdaging om chocola te maken van onbetrouwbare data. “Ik ben daar gepromoveerd op autonome intelligente robots. Die hebben een breed scala aan sensoren aan boord en opereren in een omgeving met heel veel ruis. De omstandigheden zijn dus verre van ideaal, wat leidt tot soortgelijke informatiefusieproblemen als die waar wij bij Thales onderzoek naar doen.” In Graz had hij ook het voorrecht om van de beste wetenschappers te leren over AI en met name machine learning.
Na een korte periode bij een bedrijf in de luchtvaartelektronica, waar hij de taak had om vliegtuigsoftware te evalueren en te certificeren, kwam Pavlin in 2004 naar Nederland. “Bij toeval stuitte ik op een vacature bij de Universiteit van Amsterdam. Het ging om een functie in een project met TNO en Thales, gericht op het samenvoegen van gegevens uit verschillende bronnen voor crisismanagementdoeleinden. Ik was een beetje huiverig om te verhuizen, maar mijn vrouw pushte me om het gewoon een of twee jaar te proberen. Dat heb ik dus gedaan. Een jaar of twee later stapte ik over naar Thales en ik ben niet meer weggegaan.”
Toen Pavlin als onderzoeker bij TRT aan de slag ging, was kunstmatige intelligentie nog een exotische technologie voor industriële toepassingen. “Dat was lang voordat het de hype werd die het nu is. In die begindagen was het nog een beetje een gok om je geld op AI te zetten”, herinnert hij zich. “We hadden ons echter enorm in de technologie verdiept en daarbij was het ons duidelijk geworden dat dit echt de weg vooruit was voor belangrijke toepassingen. Het is heel bevredigend om te zien dat deze beredeneerde gok van zo veel jaren geleden nu zijn vruchten begint af te werpen.”
Diep inzicht is een cruciale succesfactor bij het maken van AI-gebaseerde oplossingen, benadrukt Pavlin. “We onderwerpen veelbelovende onderzoeksrichtingen aan een grondige evaluatie. We vinden zelf geen algoritmes uit, maar we nemen wat er nieuw is, van onderzoekers van wereldklasse, bestuderen de werkingsprincipes en kijken hoe en wanneer de methodes geschikt zijn voor ons – soms passen we ze aan om ze geschikt te maken voor onze doeleinden. Naast dit onderzoek werken we samen met de engineers in de businesslijnen van Thales, maar ook met externe partners, om de kennis die we opbouwen direct toe te passen.”
True AI
Boven op de huidige AI-hype wijst Pavlin op een paar trends die relevant zijn voor Thales. “Complexe problemen zoals de onze zijn maar hoogst zelden met één type algoritme op te lossen. De sleutel is dan om hybride AI-benaderingen te gebruiken. Die combineren meerdere hulpmiddelen, zoals diepe neurale netwerken en probabilistische grafische modellen. Wij proberen de eigenschappen van de verschillende methodes te doorgronden en ze te mixen en matchen tot robuuste oplossingen. Met hybride AI kunnen we bovendien systemen bouwen die minder trainingsdata nodig hebben, dus we spelen ook in op de trend van zuinige AI – trainingsgegevens moeten met de hand worden gecategoriseerd en door de behoefte aan die gegevens te verminderen, kunnen we het handmatige labelwerk beperken en zo de ontwikkelkosten verlagen.”
Een andere trend is gedistribueerde AI. “Moderne IoT-systemen combineren een scala aan sensoren, die grote hoeveelheden data verzamelen. Traditioneel worden alle gegevens voor verwerking doorgestuurd naar een centrale computer of cloud en gaan de resultaten weer terug naar de applicatie in het veld. Dergelijke centrale gegevensverwerking kost niet alleen vaak veel energie, maar de benodigde communicatiebandbreedtes kunnen ook niet altijd worden gegarandeerd. Daarbij vormt het versturen van zeer gevoelige gegevens een veiligheids- en privacyrisico. Om deze problemen het hoofd te bieden, zien we een verschuiving van de cloud naar de edge, waarbij het grootste deel van de gegevens dicht bij de toepassing wordt verwerkt, achter de firewall, en alleen de resultaten worden overgedragen – de informatie gedestilleerd uit eenvoudigere data. Dergelijke gedistribueerde AI vereist ook weer een grondig begrip van de algoritmes, aangezien sommige gemakkelijker zijn op te splitsen dan andere. We hebben op dit gebied veel ervaring opgedaan en een platform ontwikkeld dat een snelle en eenvoudige integratie van gedistribueerde algoritmes in het veld mogelijk maakt.”
Pavlin en zijn collega’s steken ook veel energie in het engineeren met kunstmatige intelligentie. “Ontwikkeling met AI wordt heel vaak verward met softwareontwikkeling, maar het is juist een heel andere, complementaire discipline. Het gaat erom dat je het juiste model hebt en de juiste redeneer- en leermethodes kiest. Wij werken aan verbeteringen voor het engineeringproces om hier rekening mee te houden, van conceptie tot implementatie tot onderhoud.”
Alle inspanningen komen samen in True AI, zoals Thales zijn benadering van kunstmatige intelligentie heeft genoemd: transparent, understandable, ethical. Gebruikers kunnen de gegevens zien waarop de conclusie is gebaseerd, de resultaten kunnen worden uitgelegd en verantwoord en het hele proces respecteert objectieve normen, protocollen, wetten en mensenrechten. Pavlin: “Ons doel is om systemen te creëren die kostenefficiënt kunnen worden geïmplementeerd en die we allemaal kunnen vertrouwen. Dat doen we door begrip op te bouwen van wat AI doet en dat begrip te vertalen in goede engineeringpraktijken.”
Meer weten over werken bij Thales? Op zoek naar een baan bij het leukste high-tech bedrijf van Nederland? Klik hier voor onze vacatures!