Blog over editie: Artificial Intelligence, maar nu concreet!

Sprekers:
Jasper Wognum en Maarten Stol – Braincreators

Lokale voorbeelden:
Antje Meindersma – Alledaags
Bastiaan Zijlema – Dataprovider
Jean-Paul van Oosten – Target Holding

Inleiding

Wat is intelligentie? En wat is kunstmatige intelligentie? Ik heb het ‘voor mijn gevoel’ weleens ervaren terwijl ik een computerspel speelde. De moeilijkheidsgraad werd dan geleidelijk aangepast aan mijn spelniveau. Verder zijn er SMC050 edities geweest over de autonome auto en zijn we wel bekend met de ‘Turingtest’. Maar waar wat betekent AI en waar houdt men zich nou concreet mee bezig? Ik was erg benieuwd.

Jasper Wognum en Maarten Stol

Jasper en Maarten namen ons mee in de ‘geschiedenis’ van kunstmatige intelligentie. Zo liet Jasper ons nadenken over wat Artificial Intelligence (afgekort: AI) betekent. Hierbij maakte hij inzichtelijk dat wat wij als AI beschouwen continu in beweging is. Zo was er in 1920 de eerste rekenmachine, in 1950 de eerste harddisk en in de jaren 80 de schaakcomputer (Deep Blue). En in 2000 liet TomTom ons files ontwijken, Het citaat dat Jasper hierbij aanhaalde van Larry Tesler was: “AI is whatever had not been done yet”.

Voor mijn gevoel zou aan die definitie van AI wel de voorwaarde toegevoegd moeten worden dat een systeem zelf leert en zich verbetert op basis van nieuwe informatie die van tevoren niet was gedefinieerd. Maar Maarten ontkrachtte die mythe, waarin ik geloofde, verderop in zijn verhaal.

Maarten ging vervolgens in op de mythes die spelen rond AI. Variërend van a) ‘je kunt AI kopen’, b) ‘AI is vergelijkbaar met menselijke intelligentie’, tot c) ‘AI leert helemaal zelf’. Bovengenoemde mythes zijn allen niet waar, aldus Maarten.

Zo moet a) een AI eerst heel toepassingsgericht gemaakt worden met behulp van datasets en je kunt dus niet zo een ‘AI’ van de plank trekken en gebruiken. En b) mensen leren op een hele andere manier. Een mens heeft een paar voorbeelden van een vis nodig om te begrijpen wat een vis is, terwijl voor machinelearning vele duizenden voorbeelden nodig zijn om een vis te herkennen. Maar dat kost veel tijd en is ook de reden dat mythe c) niet klopt, aldus Maarten. Veel werk bestaat uit data voorbereiden, schoonmaken en data selecteren.

Wat is AI/Machinelearning dan wel?

Een gereedschapskist vol modellen, aldus Maarten. Hierbij draait het erom om een match te vinden tussen de data en de use cases van de klant door te kijken naar welke gereedschap de waarde uit de data haalt.

Een manier om dat te doen is door middel van ‘supervised learning’, aldus Maarten. Daarbij draait het om het gebruiken van gelabelde data (input) om het systeem iets te leren herkennen (output). In het geval van later ingevoerde en niet gelabelde data (toekomstige input) levert dat de juiste output). Maarten legde daarbij uit dat mensen wel zien wat er op foto’s staat, maar AI niet en die data daarom ‘gelabeld’ moet worden. Maarten gaf daarbij in zijn presentatie een leuk voorbeeld van foto’s van honden en katten. Pas na het doornemen van duizenden gelabelde foto’s van honden en katten, herkent het systeem niet gelabelde foto’s van honden en katten.

Een andere toepassing is ‘unsupervised learning’, waarbij je onderzoekt welke data je hebt door het systeem de verbanden te laten leggen. Je weet dan van tevoren niet welke output je krijgt op basis van de input (data) die je het systeem geeft. Dat kan inzichtelijk maken wat voor data je hebt.

Enkele toepassingen uit de praktijk van Braincreators zijn tekstsegmentatie voor Elsevier, objectherkenning in video (mensen onderscheiden van gebruiksvoorwerpen), CT scan analyses, adrescorrectie, positiebepaling en fabricagefouten herkennen. Een uitdaging die momenteel speelt is het begrijpen van de intentie van mensen. Daar is meer data voor nodig.

Ik vond het erg leuk om van Braincreators te leren hoe machinelearning werkt en heb er veel van geleerd. Wat ik vooral meeneem is de conclusie van Maarten en Jasper, dat het succes van een AI/ML-algoritme afhankelijk is van de kwaliteit van de dataset.

Lokale voorbeelden

Antje Meindersma – Alledaags
Antje leerde ons wat de ingrediënten zijn van leren en inspireerde ons om te beginnen met AI. Ze vertelde ons dat moet worden gekeken naar de gebruiker, het leerdoel, de content, de moeilijkheidsgraad van de content en hoe je ervoor zorgt dat de gebruiker zoveel mogelijk leert van de content. Ze legde uit dat ze hiervoor een algoritme heeft ontwikkeld dat de gebruiker met de content matcht, waarbij de aan de gebruiker gestelde vragen niet te makkelijk en niet te moeilijk zijn om het meest efficiënt het gewenste leerdoel te behalen.

Jean-Paul van Oosten – Target Holding
Jean-Paul vertelde dat hij cv’s en kandidaten matcht met de toepassing ‘vacature matching’. Tegenwoordig gaat dat vaak ‘key-woord gestuurd’ op basis van een hele gestructureerde dataset. Dat levert soms het probleem op dat geschikte kandidaten niet gevonden worden. Vind je bijvoorbeeld ook de AI-expert als je een ‘machine learning engineer’ zoekt? Aan de hand van ongestructureerde tekst leert een algoritme de context en nieuwe woorden uit heel veel woorden, en kan Target Holding snel en efficiënt verbanden leggen tussen de gewenste kandidaat en het profiel dat daarbij hoort. Sommige cv’s die eruitzien als ‘infographics’, aldus Jean-Paul. Die zijn moeilijk doorzoekbaar, en bieden dus een leuke uitdaging.

Bastiaan Zijlema – Dataprovider
Bastiaan ging in op de use case waarvoor zij machine learning gebruiken: het detecteren van e-commerce websites. Deze data wordt geïndexeerd, gestructureerd en opgeslagen in een 150-tal variabelen en vervolgens geleverd aan een aantal grote bedrijven, waaronder Google. Ze beschouwen zich als een olieboorder die olie c.q. data aan de grote bedrijven levert. Het interessante hierbij is dat de data verticaal doorzocht kan worden. Bastiaan vertelde dat, als je bijvoorbeeld de telefoonnummers van alle Italiaanse restaurant in Groningen zoekt, je die vraag kunt stellen en dan alle telefoonnummers op een rij hebt.

Tot slot

Ook de lokale voorbeelden vond ik interessant om te mogen leren kennen. Hieruit maak ik op dat leren efficiënter kan met behulp van Alledaags, men wat Target Holding betreft niet te creatief moet omgaan met zijn of haar cv en Dataprovider alles van je weet. Mijn ongevraagde (en wellicht overbodige) advies aan allen die zich bezighouden met AI/ML is om de aanstaande Algemene Verordening gegevensbescherming en (alvast het wetsvoorstel van) de e-Privacyverordening onder de loep te nemen.

Dit blog werd geschreven door Henk Bethlehem.