El tamaño de la muestra, la fiabilidad del origen de los datos, y el posible sesgo muestral, pueden afectar los resultados de las pruebas de asociación e independencia. Muchas de las pruebas empleadas toman con base la prueba de Chi cuadrado, pero modificándola a fín de eliminar, cuando menos, el posible sesgo por el tamaño de la muestra.
Phi Cuadrado (Φ2):
Este estadístico fue propuesto por el propio Karl Pearson, en 1910, cuando presentó el Chi cuadrado (Χ2) como un estadístico útil para discernir la asociación entre dos variables cualitativas, como una forma de eliminar precisamente el tamaño de la muestra como origen de error. Se emplea para ello el X2 sin la corrección de Yates (veremos ambos en artículos posteriores), es decir, Φ2 = X2 / N.
Es posiblemente el estadístico más utilizado como medida de asociación, a pesar de que en tablas de distinto tamaño no siempre tiene una interpretación clara. No obstante, en las tablas 2*2, son de gran utilidad estos estadísticos aún basados en X2 . Puede determinar si el comportamiento de las categorías de una variable presenta diferencias estadísticamente significativas. Desde este punto de vista, es un análogo al coeficiente de determinacion r2 que se utiliza cuando se está midiendo la asociación entre dos variables aleatorias cuantitativas, y que se interpreta como la cantidad de varianza o variabilidad de una variable, que se refleja en la otra, o lo que es similar, la proporción de varianza que es común a ambas variables. El coeficiente de determinación va de 0 a 1.
Cuando el valor calculado es < 0.05, se rechaza la hipótesis nula (H0, las variables son independientes), por lo que sí existe una relación entre ellas, mientras que si el valor calculado es > 0.05, no se rechaza la hipótesis nula, aceptando que no existe ninguna relación entre las dos variables.
C de Cramer:
Propuesta por Cramer, con el mismo fin, ajustando Φ2 al número de filas y columnas de la tabla de contingencia, dividiendo el estadístico Φ2 entre el menor de la cantidad de filas o columnas, menos 1, con lo cual, en la tabla de 2*2, al ser la diferencia de 1, Φ2 y C de Cramer coinciden.
Proporción estimada de la varianza (Pev):
Como indicábamos al hablar de Φ2, una de las formas más fáciles de entender la asociación entre dos variables, es qué proporción de la variabilidad de una de las variables repercute en la variabilidad de la otra, o, de otro modo, qué proporción de la varianza en la primera variable está explicada por la varianza en la otra. Como ocurre con la C de Cramer, en las tablas de 2*2, la Pev coincide con Φ2.