Extreme multilabel classification (XMC) is een machine learning probleem waarbij elk voorbeeld kan worden toegewezen aan veel uit honderden, duizenden of zelfs miljoen mogelijke labels. Het is ‘extreem’ omdat het aantal labels exponentieel groter is dan in typische multilabel problemen.
Kenmerken van extreme multilabel classification:
1. Heel veel labels: Soms miljoen mogelijke labels per voorbeeld
2. Sparse labels: Elk voorbeeld krijgt slechts een klein percentage van alle labels
3. Computationeel uitdagend: Standaard methoden schalen niet goed
4. Long-tail distribution: Veel labels zijn zeldzaam
Toepassingen omvatten: product recommendation (uit miljoenen producten), scientific paper classification (duizenden topics), en genomics. Specialized algorithms zoals FastXML en PfastreXML zijn ontworpen voor effici entie. Recent gebruiken researchers deep learning methoden met hierarchische structuren.