Estimar los indicadores de calidad general de una prueba diagnóstica supone siempre el problema de conocer de forma exacta el número de casos que presentan la enfermedad y el de los que no la presentan. Casi nunca es posible determinarlo, por lo que se toma como referencia algún procedimiento lo bastante preciso, o al menos de calidad conocida. Así ocurre cuando intentamos evaluar la eficacia de un método de detección de una enfermedad , y comparamos los resultadosm obtenidos con este método con otra prueba de laboratorio cuya calidad ya es conocida. A los estimadores obtenidos de esta forma se les denominan sensibilidad y especificidad relativas, ya que indican la calidad de la nueva prueba, en relación con los resultados de otra, y no de una manera absoluta.. Por tanto, la validez des estas sensibilidad y especificidad relativas dependen de la anterior calidad de la prueba utilizada como referente.
En sentido estricto, la estimación de la especificidad – es decir, el porcentaje de sanos que presenta un resultado negativo en la prueba- requiere por supuesto que se aplique la prueba a individuos sanos. A menudo esto puede ser motivo de conflictos éticos, pues no todos los exámenes médicos son inocuos, y además conflictos económicos, pues a menudo añaden gasto, teóricamente innecesario, o ambas cosas a la vez. En ocasiones se ha recurrido a plicar la evaluación a individuos sospechosos de padecer la enfermedad, y no en una muestra aleatoria de la población, que en puridad es lo que habría que hacer. Sin embargo aquel proceder puede solventar el problema ético, y al mismo tiempo, la población de sospechosos representará realmente de una forma más exacta a aquellos individuos a los que habría que aplicar en todo caso la prueba, si esta es eficaz.
En algunas ocasiones puede conocerse el estado real del sujeto, es decir, estimar la sensibilidad y especificidad reales, sin precisar la comparación con otra prueba, por ejemplo, cuando se dispone de un procedimiento de diagnóstico exento de error (biopsia, necropsia, etc.), y la prueba a evaluar se compara con el resultado real, o cuando la propiam evolución hace posible efectuar un diagnóstico, como puede ser un test de embarazo al inicio de una sospecha de gestación. Esperando solamente algún tiempo, será posible tener una idea clara del resultado. En estos casos, los estimadores obtenidos son de más confianza. Los procedimientos matemáticos de la evaluación son los mismos para la sensibilidad y especificidad relativas (a las que a veces se nombra como Sr y Er) que para las reales (S y E).
Prueba en evaluación | Positiva | Negativa |
Positiva | a | b |
Negativa | c | d |
En la evaluación, se calculan la Sensibilidad y Especificidad. Serán absolutas o relativas, en dependencia de si la prueba de referencia es exacta o no- También se evalúan los factores de confiabilidad de ambas: S, y E que, dado que estas son un caso especial de la estimación de porcentajes en una población, es decir, sensibilidad = proporción de aciertos en la población de enfermos, y especificidad = estimación de la proporción de aciertos entre los sanos, hace que los intervalos de confianza correspondientes se calculen con los métodos utilizados para una proporción. Esto ayuda a la evaluación, ya que, aunque algunos valores obtenidos en la S y/o E sean elevados, si los intervalos de confianza son muy amplios probablemente haya que aumentar el número de individuos de la muestra antes de emitir o publicar la conclusión. Ej: Pudiera ser que la Sensibilidad de una prueba fuera de un 80%, pero si el intervalo de confianza baja en su nivel inferior al 40%, posiblemente haya que efectuar un estudio más numeroso.
Por supuesto,los valores de S y E se mueven entre 0 y 1, o entre el 0 y el 100%, si se expresan como porcentajes, mientras que los intervalos de confianzaen ocasones pueden exceder de la unidad. En estos casos, tanto el concepto como la forma de cálculo exige los valores sean truncados a 1 ( es decir, si el límite alto del intervalo de confianza arrojara un resultado de 1.345 ( o 134.5%), se deberá de truncar a 1.00 (o 100%).