Word Embedding – JiltedGeek.com

Term van de dag

Word Embedding

Een word embedding is een manier om woorden als vectoren (lijsten van getallen) weer te geven zodat AI-modellen ze kunnen verwerken. In plaats van het woord “kat” op te slaan als een tekenreeks, representeer je het als iets als [0.2, -0.5, 0.8, …] – honderden of duizenden getallen die de “betekenis” of “context” van het woord vastleggen.

Het slimme ervan is dat woorden met vergelijkbare betekenissen gelijkaardige vectoren hebben. Het woord “kat” ligt dicht bij “hond” en “dier”, en het woord “koning” min het woord “man” plus het woord “vrouw” geeft ongeveer “koningin”. Dit stelt AI-modellen in staat om betekenis en relaties in taal te begrijpen.

Word embeddings zijn fundamenteel voor moderne NLP. Voorbeelden zijn Word2Vec, GloVe, en FastText. Ze maken het mogelijk voor modellen om de semantische relaties tussen woorden te leren en teksttaken veel efficiënter uit te voeren.

Voorbeeld: In plaats van het woord “appel” letterlijk op te slaan, zet je het om in een vector van bijvoorbeeld 300 getallen. Het woord “oranje” heeft een zeer gelijkaardige vector omdat beide vruchten zijn. Dit laat het model toe om gerelateerde woorden te herkennen zelfs als het een exact woord nog nooit gezien.

Terug

📚

Term van de dag archief

Alle AI-termen op één plek. Blader door het volledige archief, gesorteerd op alfabet.