Introducción :
La similitud del coseno se utiliza para determinar la similitud entre documentos o vectores. Matemáticamente, mide el coseno del ángulo entre dos vectores proyectados en un espacio multidimensional.Hay otras técnicas de medición de la similitud como la distancia euclidiana o la distancia Manhattan disponibles, pero nos centraremos aquí en la similitud del coseno y la distancia del coseno.
La relación entre la similitud del coseno y la distancia del coseno se puede definir como sigue.
- La similitud disminuye cuando la distancia entre dos vectores aumenta
2. La similitud aumenta cuando la distancia entre dos vectores disminuye.
Similaridad del coseno y distancia del coseno:
La similitud del coseno dice que para encontrar la similitud entre dos puntos o vectores necesitamos encontrar el Ángulo entre ellos.
La fórmula para encontrar la similitud del coseno y la distancia es la siguiente:
Aquí A=Punto P1,B=Punto P2 (en nuestro ejemplo)
Veamos los distintos valores de Cos Θ para entender la similitud del coseno y la distancia del coseno entre dos puntos de datos(vectores) P1 & P2 considerando dos ejes X e Y.
La siguiente imagen tiene allí casos.
Caso 1: Cuando el ángulo entre los puntos P1 & P2 es de 45 grados entonces
coseno_similitud= Cos 45 = 0.525
Caso 2: Cuando dos puntos P1 & P2 están alejados entre sí y el ángulo entre los puntos es de 90 Grados entonces
coseno_similitud= Cos 90 = 0
Caso 3: Cuando dos puntos P1 & P2 están muy cerca y se encuentra en el mismo eje entre sí y el ángulo entre los puntos es 0 Grado entonces
cosine_similarity= Cos 0 = 1