Gedurende meerdere decennia spelen wij spellen tegen computers, denk bijvoorbeeld aan patience of schaak. Eén van de eerste spellen is het programma van Arthur Lee Samuel, namelijk ‘The Samuel Checkers-Playing Program’. Een programma waarmee je tegen de computer kunt dammen. Dit was één van de eerste zelflerende demonstraties van het concept ‘kunstmatige intelligentie’ (McCarthy & Feigenbaum, 1990). Ook was Arthur Lee Samuel de eerste die de term ‘machine learning’ gebruikte (Foote, 2019).

Kunstmatige intelligentie is een breed begrip voor een zelflerend systeem dat zijn handelswijzen kan aanpassen op basis van inzichten die zijn verkregen tijdens het verwerken van informatie. Machine learning is een toepassing van deze technologie die zich bezighoudt met de ontwikkeling van algoritmes en rekenkundige modellen waarmee computers met behulp van data zelf kunnen leren. Dit houdt in dat machine learning met behulp van data-analyse en algoritmes patronen probeert te herkennen in de gegevens (Bhattacharjee, 2018b). Machine learning is dus een data-analyse techniek.

Het doel van machine learning is om de computers automatisch te laten leren zonder menselijke tussenkomst of een andere vorm van hulp. Op deze wijze leert de computer van ervaringen, net als mensen en dieren. Het leren gebeurt door middel van algoritmes. Een algoritme is een reeks van instructies die vanuit een gegeven begintoestand naar een beoogd doel leidt (Bhattacharjee, 2018a). De algoritmes verbeteren zichzelf naar mate je ze traint. Door middel van iteraties en voldoende data wordt een algoritme getraind. Dergelijk algoritme genereert een model, een wiskundige weergave van een reëel proces. Door de komst van big data is machine learning steeds belangrijker aan het worden. Het wordt op veel vlakken al gebruikt, denk aan de economie waarbij het de beurs ‘in de gaten kan houden’ of op basis van een algoritme voorspellingen kan doen op stijgingen of dalingen. Het is zelfs mogelijk dat een computer op basis van deze gegevens ‘slim’ kan inkopen en verkopen (de Ingenieur, 2017). Maar hoe werkt het eigenlijk?

Het leerproces bij machine learning begint met observaties van gegevens, zoals voorbeelden, directe ervaring of instructie, om patronen in gegevens te zoeken en in de toekomst betere beslissingen te nemen op basis van wat aan het algoritme wordt aangeboden. De basis van machine learning ligt in de wiskunde en statistiek. Dit is met name zichtbaar in het gebruik van algoritmes binnen de machine learning.

 

Machine learning is hedendaags niet weg te denken uit ons leven. Zo wordt machine learning veelal ingezet binnen de verschillende studierichtingen, zoals informatica, wiskunde, filosofie en linguïstiek (Data4, 2019). Ook in het bedrijfsleven lijkt machine learning onmisbaar. Webshops gebruiken het voor personalisatie, dit gebeurt op basis van eerdere aankopen en bekeken items. Zo kunnen er gericht suggesties worden gedaan. Ook streamingsdiensten zoals Netflix en Spotify werken met gepersonaliseerde content (Netflix, z.d.; Ciocca, 2019). Op basis van wat is bekeken en beluisterd doen de streamingsdiensten voorstellen van nieuwe content. Op deze manier beogen webshops en streamingsdiensten hun aanbod af te stemmen op de klant en deze krijgt een gepersonaliseerd aanbod te zien. Ook zitten er tegenwoordig in e–mailprogramma’s zoals Outlook en Gmail spam– en malwarefilters verwerkt, die aan de hand van algoritmes phishing e-mails en spam onderscheppen (Vincent, 2019).

Uit bovenstaande blijkt dat op het eerste gezicht machine learning veel voordelen kent.

Toch wijzen verschillende artikelen van NU.nl (2019) en NOS (2019a, 2019b) ook op de nadelen van machine learning. Dit essay tracht een overzicht te creëren van de voor- en nadelen van machine learning.

Voordelen 

Wanneer gekeken wordt naar machine learning binnen verschillende beroepsgroepen, worden de voordelen van machine learning duidelijk. Machine learning heeft drie voordelen. Ten eerste het analyseren van data en ten tweede het herkennen van patronen (DataFlair, 2019). Deze voordelen zijn op veel verschillende vlakken zichtbaar. Een derde voordeel is dat machine learning een bijdrage levert aan het verminderen van arbeidsintensieve processen (NOS, 2019). Hieronder zullen aan de hand van voorbeelden deze drie voorbeelden zichtbaar en verder uitgelegd worden.

Het eerste voorbeeld is de gezondheidszorg waar dankzij draagbare apparaten en sensoren veel gegevens snel beoordeeld kunnen worden. De technologie kan medische experts adviseren en helpen bij onder andere het herkennen van huidkanker. Ook in de retail wordt steeds meer gebruik gemaakt van machine learning, denk hierbij aan het personaliseren van de winkelervaring, optimaliseren van een marketingcampagne, prijsoptimalisatie en het verwerken van klantenfeedback. Dit wordt bijvoorbeeld gedaan op basis van aankoopgeschiedenis, zoekopdrachten en bekeken items van de klanten (Data4, 2019).

De Lange (2019) schreef een artikel over machine learning in het onderwijs. Hij stelt dat op basis van prestatiegegevens van leerlingen het gemakkelijker is om onderwijs te personaliseren. Andere mogelijke toepassingen van machine learning binnen het onderwijs kunnen zijn: het nakijken van huiswerk, het bijhouden van de ontwikkelingen van een leerling, het geven van advies op vervolgonderwijs en het verbeteren van carrièrekeuzes.

Ook de overheid maakt steeds meer gebruik van machine learning. Zij beschikt over veel data – een belangrijke voorwaarde voor machine learning. Het Verenigd Koninkrijk en Japan hebben machine learning al geïmplementeerd binnen de gezondheidszorg. Zo gebruikt het Verenigd Koninkrijk chatbots voor het adviseren van patiënten in niet-levensbedreigende situaties en hebben artsen meer tijd voor noodgevallen en maakt Japan ‘smart’–ziekenhuizen waarin machine learning wordt gebruikt om medische testresultaten te beoordelen en zodoende de juiste behandelmethodes te kunnen voorschrijven. Bovendien zie je dat overheden, zoals Chicago, met behulp van een algoritme misdaden probeert te voorkomen. In het Verenigd Koninkrijk sporen ze geradicaliseerde mensen op met behulp van een technologie genaamd “natural language processing.” Dit is een techniek die gesproken en geschreven tekst begrijpt (Fransen, 2019).

Uit bovenstaande blijkt dat het analyseren van data en het herkennen van patronen in vele bedrijfstakken en instituties zichtbaar zijn. Daarbij dient echter wel de opmerking geplaatst te worden dat de voorspellingen die machine learning doet op basis van deze data, louter als advies kunnen dienen. Bij het nemen van besluiten op basis van deze voorspellingen zullen mensen betrokken moeten zijn (van Laatum, 2019). Na deze uiteenzetting van de voordelen worden in de volgende paragraaf de nadelen van machine learning benoemd.

Nadelen 

Binnen deze overzichtsstudie zijn drie nadelen gevonden van machine learning. Namelijk discriminatie, ondoorzichtigheid van besluitvorming en tenslotte het teveel personaliseren van aanbod.

Het eerste nadeel van machine learning is de vergrote kans op discriminatie. Op basis van bepaalde kenmerken en/of informatie doet een algoritme een voorspelling voor bijvoorbeeld het zijn van een voortijdig schoolverlater. De data waarop het algoritme deze voorspelling doet, kan bevooroordeeld zijn. Zodoende kan een algoritme gaan discrimineren op basis van geslacht, etniciteit, geloof of seksuele voorkeuren (NOS, 2019a).

Een ander kenmerkend voorbeeld om de kans op discriminatie toe te lichten, is het bedrijf Amazon. Amazon heeft een groot wervingsproject moeten annuleren. Het wervingssysteem diende als hulpmiddel bij het vinden van geschikt personeel voor een bepaalde functie. Bij het uploaden van curricula vitae selecteerde het systeem door middel van machine learning een top vijf van geschikte werknemers. Echter bleek dat het wervingssysteem een voorkeur had voor mannen waardoor gediscrimineerd werd op sekse (Dastin, 2018). De oorzaak hiervan lag in de training van de modellen van Amazon door patronen in curricula vitae te ontdekken. De data bestond uit curricula vitae die de afgelopen tien jaar bij het bedrijf waren ingediend. De meeste curricula vitae waren van mannen. Omdat de technologische industrie gedomineerd wordt door mannen, kreeg het systeem voorkeur voor mannen en werden curricula van vrouwelijke sollicitanten uitgesloten van selectie (Dastin, 2018).

Een tweede nadeel is de ondoorzichtigheid op basis waarvan algoritmes advies uitbrengen.

Tot nu toe is bij veel overheidsinstanties weinig inzicht in de algoritmes die ze gebruiken en dus hoe algoritmes tot een bepaalde voorspelling komt (NU.nl, 2019). Een slim systeem is als een black box, je ziet alleen de input en de output. Het enige wat meestal wel beschikbaar is, is welke data gebruikt is om het model te trainen (Duursma, 2017). De Tweede Kamer eist als reactie hierop meer inzicht te krijgen in welke bedrijven en instanties voor besluitvorming algoritmes gebruikt (NOS, 2019b).

Tenslotte is het teveel personaliseren van content een nadeel. Dit wordt toegepast bij bijna alle streamingsdiensten, zoekmachines en webshops. Omdat deze diensten zich aanpassen aan kijk–, zoek– en koopgedrag, wordt op een gegeven moment het aanbod beperkt tot alleen nog maar de suggesties op basis van kijk-, zoek- en koopgedrag (Soojian, 2015).

Kritische succesfactor 

Omdat data erg cruciaal is bij het trainen van een goed model, is een duidelijke structuur nodig in de informatielaag. De data die uiteindelijk aan de machine learning wordt gevoed moet geraffineerd zijn. Dat wil zeggen dat geen onzichtbare voorkeuren in de data aanwezig is, wat discriminatie in de hand kan werken. Ook is de hoeveelheid aanwezige data belangrijk, hoe meer data des te beter de voorspellingen uiteindelijk zullen zijn.

Voor machine learning is een goede investering nodig. Het is eventueel uit te besteden, maar het is ook intern op te lossen. Hiervoor is wel personeel nodig dat expertise heeft op het gebied van de technologie en data-analyse. Ook moet naast het personeel naar de middelen gekeken worden. De machines en de netwerkinfrastructuur moet de toename van dataverkeer aan kunnen. Bovendien moet genoeg data aanwezig zijn om mee te werken. Maar daar tegenover staat dat machine learning veel sneller te werk gaat dan dat een mens kan. Hierdoor is uiteindelijk meer tijd over voor andere werkzaamheden en/of minder personeelskosten.

Hype Cycle 

Omdat machine learning een onderdeel is van kunstmatige intelligentie en er veel verschillende soorten van bestaan is het lastig om een duidelijk beeld van de trend te krijgen. Machine learning in het algemeen zit (bijna) op het Plateau of Productivity, aangezien al veel bedrijven werken met machine learning en het steeds gemakkelijker is om het te implementeren. Het duurt niet lang meer dat bedrijven niet meer zonder machine learning kunnen. Machine learning is een hulpmiddel om vat te houden op en filteren op relevantie van de gigantische data stromen van tegenwoordig en in de toekomst. De trend moet met beide handen worden opgepakt, het is een hulpmiddel dat ervoor kan zorgen dat data snel kan worden verwerkt tot uitkomsten die kunnen dienen als een advies.

Het bepalen van de perfecte leefomstandigheden van mens of dier kan een nieuwe insteek van deze trend zijn. In dit voorbeeld neem ik de mens, omdat van een mens concrete feedback ontvangen kan worden. Op basis van het loggen van humeur, gewicht, gezondheid en externe factoren kan een duidelijk beeld verkregen worden van het effect van externe factoren op de mens. Dit is interessant voor voornamelijk verzekeringsmaatschappijen en ziekenhuizen. Zij krijgen een helder beeld van de effecten die de omstandigheden waarin mensen leven op de mens kan hebben. Zo kunnen zij tevens een omgeving situeren waarin de omstandigheden perfect op elkaar aangepast zijn. Ook kunnen situaties worden gecreëerd waarin de mens minder risico loopt op levensbedreigende omstandigheden.

Conclusie 

In dit onderzoek is getracht een overzicht te geven van de voor- en nadelen van machine learning. Uit dit onderzoek blijkt dat machine learning drie voordelen heeft, namelijk: het analyseren van data, het herkennen van patronen en als laatste het leveren van een bijdrage aan het verminderen van arbeidsintensieve processen. Daarmee is machine learning niet meer weg te denken uit het dagelijkse leven. De datastroom zal in grote mate toenemen en deze zijn dan niet meer te overzien voor de mens. Machine learning helpt ons bij het op relevantie selecteren van deze enorme datastroom. Toch blijkt machine learning ook nadelen te hebben. Allereerst is discriminatie een nadeel. Een advies vanuit de gebruikte algoritmes kan leiden tot discriminatie van een bepaalde doelgroep door een vooroordeel in de ingevoerde data. Ten tweede is het gebrek aan transparantie, oftewel ondoorzichtigheid, een nadeel. Het laatste nadeel is het dusdanig personaliseren van data, waardoor bijvoorbeeld klanten een beperkt aanbod te zien krijgen op webshops of men relevante informatie niet te zien krijgt. Ter afsluiting wordt in dit artikel gewezen op het belang van het bewust blijven van onze invloed binnen machine learning. Machine learning is het werk van de mens en wij houden invloed op de uitkomsten. Machine learning maakt het mogelijk meer te kunnen doen met minder mensen, maar niet zonder mensen.