Unsupervised learning is een machine learning-benadering waarbij een model wordt getraind op data zonder gelabelde antwoorden. In tegenstelling tot supervised learning, waarbij het model leert van voorbeelden met juiste antwoorden, moet het model zelf patronen en structuren in de data ontdekken.
Veelgebruikte unsupervised learning-technieken zijn clustering (het groeperen van vergelijkbare items) en dimensionality reduction (het vereenvoudigen van gegevens door irrelevante informatie weg te gooien). Deze benadering is waardevol wanneer je geen gelabelde trainingsdata hebt, of wanneer je wilt ontdekken welke verborgde patronen in je data bestaan.
Het grote voordeel is dat je geen dure handmatige labeling hoeft uit te voeren. Het nadeel is dat het moeilijker is om te bepalen of het model het goed doet, omdat je geen “juiste antwoorden” hebt om tegen af te testen.