Tanto Chi cuadrado, con o sin corrección de Yates, o eventualmente la prueba exacta de Fisher, no pueden aplicarse cuando se tienen que evaluar muestras pareadas, o sea, muestras en las que cada observación tiene su homóloga en la otra muestra, o un mismo individuo se somete primero a una tratamiento, y luego a otro, y finalmente se comparan los resultados entre ambos. En estos casos, puede aplicarse la Prueba de McNemar. En los casos en que un mismo individuo participe en dos momentos diferentes en los dos distintos tratamientos, hay que asegurarse de que transcurre el suficiente periodo de tiempo entre uno y otro tratamiento, si es que alguno de ellos puede tener un efecto residual, como para que esto no influya, o en todo caso, utilizar una prueba como la de Gart, que se describirá en un artículo posterior, que tiene inicialmente un esquema recíproco.

La idea de la prueba propuesta por McNemar, consiste en que este demostró que solamente los pares cuyos miembros se comportan de forma diferente en los dos tratamientos aplicados contribuyen a la diferencia entre ambos comportamientos, por lo que esto es lo que se emplea en la citada prueba, que solamente emplea las parejas discordantes entre ambas evaluaciones. Para corregir la continuidad del cálculo en relación con la distribución chi cuadrado empleada, Edwards modificó la prueba en 1948. El esquema sería el siguiente:

Grupo A
Grupo positivo negativo
B positivo a b
negativo c d

por lo que la prueba tomará para su cálculo los datos de b y c . El resultado, M, se compara con la distribución Chi cuadrado con un grado de libertad, como siempre en la tablas de 2*2. Valores de M menores de 3.84 (p<0.05) , o menores de 6.63 (p<0.01) supondrían escasa evidencia en favor de rechazar la hipótesis de igualdad entre ambos tratamientos o situaciones.

Prueba de McNemar (M)

Introduce el valor de la casilla a:
Introduce el valor de la casilla b:
Introduce el valor de la casilla c:
Introduce el valor de la casilla d:



Valor de M



Si el valor de M es menor que 3.84, no hay evidencias suficientes para rechazar H0 (p<0.05)
Si el valor de M es menor que 6.63, no hay evidencias suficientes para rechazar H0 (p<0.01)