Pruebas Phi (Φ), Tau b (τb), y Coeficiente medio de contingencia (Cm)
Φ (Phi)
Mientras que, como comentábamos en el artículo anterior, Φ2 podía interpretarse del mismo modo que el valor absoluto del coeficiente de determinación de variables contínuas, Φ, o sea la raíz cuadrada de Φ2 sería, en concepto, similar al coeficiente de correlación en las variables contínuas (r), es decir, sería de 0 cuando no existiese asociación entre las variables, y de 1 cuando esta asociación sea perfecta, y sus gradaciones, es decir, los valores cercanos a 1 significarán una fuerte asociación, mientras que los próximo a cero una relación entre variables débil. Diversos estadísticos ha recomendado no utilizar Φ para compararse entreentre investigaciones con diferente tipo de muestreo. Hay que tener también cuidado, cuando lavariable dicotómica se obtenga a partir de una partición de una variable contínua, ya que, dentro de este esquema, el valor de Φ dependerá obviamente del punto de corte considerado, ya que el punto de corte, influye de forma importante en las proporciones incluídas en cada uno de los cuatro grupos, y por tanto, en el resultado de los cálculos.
τb de Kendall (Tau b)
Se trata de una medida de asociación muy empleada, con la característica de que, en el caso de las tablas de 2*2, los valores de τb y de Φ son de la misma magnitud, es decir, el valor absoluto de τb es igual al valor de Φ. No obstante, τb añade una característica: el signo puede ser positivo o negativo, y no siempre positivo, como en Φ. De este modo, cuando el resultado está cercano de 1, positivo, significa que los sujetos que muestran en la variable X mejor resultado, tienden a mostrar también mejor resultado en la variable Y, y si es negativa, la tendencia es la contrario, mejores resultados en X, significan peores resultados en Y. Por ello, aunque se pueda emplear con provecho en todo tipo de variables binarias, el mejor provecho se obtiene cuando las variables son realmente ordinales. Es cierto que todas variables binarias pueden ser consideradas ordinales, aunque en algunos casos pueda ser artificiosa esta, en cuyo caso, debe considerarse que el orden establecido no representa una característica de la variable en sí, sino de la propia decisión de la medición. Es lo que puede pasar, por poner un ejemplo, cuando se considera la aparición de una determinada enfermedad en dos regiones diferentes. Se puede considerar un orden, es decir, asegurar que es mejor que no se presente a que se presente la enfermedad, pero el considerar a priori una región mejor o peor es simplemente un artificio para hacer el muestre. Así, si tenemos dos variables realmente ordinales, es decir, presentan un orden propio, sacaremos más provecho del empleo de τb. En el resto, es decir, las que hemos considerado dicotómicas, pero no lo son en sí misma, se debería utilizar Φ.
Esto es una prueba de que τb tiene la misma base conceptual que la correlación (r): Los valores positivos se aplican cuando los datos en las dos variables son congruentes- van en la misma dirección- , y los negativos indican incongruencia, es decir, los resultados de ambas variables van en dirección contraria: cuando son más bajos en una variable tienden a ser más elevados en la otra, y viceversa. Como ocurre en la correlación, cuando más cercano a 1 o -1 sea τb más fuerte será la asociación, mientras que, cuanto más cercana esté a 0, la asociación es más débil.
Coeficiente medio de contingencia (Cm)
Es otra de las medidas propuestas por Pearson a partir de Chi cuadrado. Se obtiene así: Cm = raiz cuadrada (Chi2 / ( Chi2 + N)), o también como Cm= raís cuadrada (Φ2 / (Φ2 +1)). El valor máximo de Cm depende del número de columnas y filas de la tabla, por lo cual, no puede utilizarse sino en tablas de las mismas dimensiones. Por otra parte, en la tabla de 2*2, si uno se fija en las anteriores fórmulas, ya que Φ2 puede ser como máximo de valor 1, como máximo Cm podrá ser igual a raiz cuadrada (1 / (1+1)), es decir, a raiz cuadrada ( 1/2), es decir, aproximadamente 0.7071, y no llega a 1 como los anteriores estadísticos. Aunque este valor corresponda a la asociación perfecta, ya que existen otras estadísticas, muchos estadísticos no recomiendan su utilización en las tablas de 2*2.