Term van de dag
Extreme Multilabel Classification

Extreme multilabel classification (XMC) is een machine learning probleem waarbij elk voorbeeld kan worden toegewezen aan veel uit honderden, duizenden of zelfs miljoen mogelijke labels. Het is ‘extreem’ omdat het aantal labels exponentieel groter is dan in typische multilabel problemen.

Kenmerken van extreme multilabel classification:

1. Heel veel labels: Soms miljoen mogelijke labels per voorbeeld
2. Sparse labels: Elk voorbeeld krijgt slechts een klein percentage van alle labels
3. Computationeel uitdagend: Standaard methoden schalen niet goed
4. Long-tail distribution: Veel labels zijn zeldzaam

Toepassingen omvatten: product recommendation (uit miljoenen producten), scientific paper classification (duizenden topics), en genomics. Specialized algorithms zoals FastXML en PfastreXML zijn ontworpen voor effici entie. Recent gebruiken researchers deep learning methoden met hierarchische structuren.

Voorbeeld: Amazon moet elk product categor seren met uit 1000+ mogelijke tags. Dezelfde shirt kan gelabeld zijn als ‘kleding’, ‘mannen’, ‘zomer’, ‘katoen’, ‘blauw’, ‘casual’, enzovoort. Dit is extreme multilabel classification op schaal.

📚
Term van de dag archief
Alle AI-termen op één plek. Blader door het volledige archief, gesorteerd op alfabet.