Inleiding :
Cosinegelijkenis wordt gebruikt om de gelijkenis tussen documenten of vectoren te bepalen. Mathematisch meet het de cosinus van de hoek tussen twee vectoren geprojecteerd in een multidimensionale ruimte.Er zijn andere technieken voor het meten van overeenkomst beschikbaar, zoals de Euclidische afstand of de Manhattan-afstand, maar wij zullen ons hier richten op de Cosinus-gelijkenis en de Cosinus-afstand.
De relatie tussen cosinusgelijkheid en cosinusafstand kan als volgt worden gedefinieerd.
- Gelijkenis neemt af wanneer de afstand tussen twee vectoren toeneemt
2. Gelijkenis neemt toe wanneer de afstand tussen twee vectoren afneemt.
Cosine Gelijkenis en Cosine Afstand:
Cosine Gelijkenis zegt dat om de gelijkenis tussen twee punten of vectoren te vinden we de hoek tussen hen moeten vinden.
De formule om de cosinusgelijkenis en de cosinusafstand te vinden is de volgende:
Hier A=Punt P1,B=Punt P2 (in ons voorbeeld)
Laten we de verschillende waarden van Cos Θ zien om de cosinusgelijkenis en cosinusafstand tussen twee gegevenspunten (vectoren) P1 & P2 te begrijpen, rekening houdend met twee assen X en Y.
Onderstaande afbeelding bevat gevallen.
Geval 1: Wanneer de hoek tussen de punten P1 & P2 45 graden is, dan
cosine_similarity= Cos 45 = 0.525
Voorbeeld 2: Wanneer twee punten P1 & P2 ver van elkaar verwijderd zijn en de hoek tussen de punten is 90 graden dan
cosine_similarity= Cos 90 = 0
Voorbeeld 3: Wanneer twee punten P1 & P2 zeer dicht bij elkaar liggen en op dezelfde as ten opzichte van elkaar liggen en de hoek tussen de punten is 0 graden dan
cosine_similarity= Cos 0 = 1