Kosinová podobnost se používá k určení podobnosti mezi dokumenty nebo vektory. Matematicky měří kosinus úhlu mezi dvěma vektory promítnutými do vícerozměrného prostoru. k dispozici jsou i další techniky měření podobnosti, například euklidovská vzdálenost nebo manhattanská vzdálenost, ale my se zde budeme věnovat kosinové podobnosti a kosinové vzdálenosti.
Vztah mezi kosinovou podobností a kosinovou vzdáleností lze definovat takto:
Podobnost se zmenšuje, když se zvětšuje vzdálenost mezi dvěma vektory
2. Podobnost se zvětšuje, když se zmenšuje vzdálenost mezi dvěma vektory.
Kosinová podobnost a kosinová vzdálenost:
Kosinová podobnost říká, že ke zjištění podobnosti mezi dvěma body nebo vektory musíme najít úhel mezi nimi.
Vzorec pro zjištění kosinové podobnosti a vzdálenosti je následující:
Tady A=bod P1,B=bod P2 (v našem příkladu)
Podívejme se na různé hodnoty Cos Θ pro pochopení kosinové podobnosti a kosinové vzdálenosti mezi dvěma datovými body(vektory) P1 & P2 s ohledem na dvě osy X a Y.
Následující obrázek má tyto případy.
Případ 1: Když je úhel mezi body P1 & P2 45 stupňů, pak
kosinová podobnost= Cos 45 = 0.525
Případ 2: Když jsou dva body P1 & P2 od sebe vzdáleny a úhel mezi body je 90 Stupňů pak
cosine_similarity= Cos 90 = 0
Případ 3: Když jsou dva body P1 & P2 od sebe vzdáleny a úhel mezi body je 90 Stupňů pak
cosine_similarity= Cos 90 = 0: Když jsou dva body P1 & P2 velmi blízko sebe a leží na stejné ose a úhel mezi body je 0 stupňů, pak