Coeficiente de Jaccard

Embed Size (px)

DESCRIPTION

cdf

Citation preview

Coeficiente de Jaccard / TanimotoEsta calculadora en lnea mide la similaridad de dos conjuntos de muestra utilizando el coeficiente de Jaccard / TanimotoTimurHace 3 aosEl coeficiente de Jaccard / Tanimoto es una de las mtricas utilizadas para comparar la similaridad y diversidad de conjuntos de pruebas. Utiliza la razn del conjunto interceptante al conjunto de unin como la medida de similaridad. Es decir, es igual a cero si no hay elementos que intercepten e igual a uno si todos los elementos interceptan.

La ecuacin es

donde- cantidad de elementos en el conjunto - cantidad de elementos en el conjunto B- cantidad de elementos en el conjunto que intercepta

Cmo utilizarlo - introduce los elementos separados por coma, y la calculadora muestra el coeficiente y conjunto de intercepcin

;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;,,Criterios basados en similaridades. Medidas de similaridad Para determinar la homogeneidad entre los individuos se puede trabajar con indicadores de su divergencia o disimilaridad, como las distancias que hemos relatado anteriormente; o bien, podemos utilizar indicadores de la similitud.Si una distancia alta entre individuos nos indica que son muy diferentes y una baja que son muy similares; los indicadores de similitud actuarn de manera contraria: conforme aumente su valor, aumentar la similaridad entre los individuos. Muchos de los indicadores de similitud se basan en coeficientes de correlacin o de asociacin.El coeficiente de correlacin de Pearson se utiliza, en ocasiones, preferentemente con datos cuantitativos y utilizando el algoritmo de distancia mnima. Los coeficientes de correlacin por rangos de Kendall y Spearman se utilizan, tambin, en casos de variables ordinales.Para variables binarias se utilizan distintos coeficientes de asociacin o matching type: ndice binario: donde m es el nmero de coincidencias y M el un nmero total de variables comunes. ndice de Tanimoto donde h es el nmero de variables con 1 en los dos individuos y H es el nmero de variables con algn 1.y una veintena de indicadores ms que no tiene sentido mencionar aqu .