A cualquier investigador le interesa manejar una serie de medidas descriptivas que describan las características de la población concreta que estudia. Las medidas obtenidas en la población se denominan parámetros, que es el objetivo real de toda investigación. El problema es que rara vez puede estudiarse toda la población, por lo que lo habitual es obtener una muestra, que se suponga representativa, y, a partir de ella calcular un estimador del parámetro. Si la muestra cumple con los requisitos de calidad necesarios (ver capítulo anterior), se espera que el estimador del parámetro, y el propio parámetro sean similares.
Estimador de punto o puntual:
Un estimador de punto es una estadística que, bajo ciertas condiciones, se presume tiene un valor cercano al del parámetro estimado de la población. Lo mucho o poco que difieran estimador y parámetro dependerá de la variabilidad de la población, que se evalúa con el denominado error estandar del estimador, que indica la magnitud de la variabilidad por azar que puede ocurrir en el estimador. El valor del error estandar es inversamente proporcional a su precisión, es decir, cuanto más pequeño es, menores variaciones aleatorias habrá en la estimación, y esta será más precisa.
Cuando no se analiza la población completa, sino solamente una muestra de ella, además de estimar el parámetro, hace falta evaluar la consistencia de esta estimación, lo que suele hacerse describiendo los intervalos de confianza, y también habrá que evaluar si los resultados obtenidos mediante la muestra apoyan o no X conclusión aplicable a la población, lo que se realiza mediante las pruebas de contraste de hipótesis. A todo ello nos referiremos en los siguientes artículos.
Estimación por intervalo:
Proporciona dos límites, inferior y superior, entre los cuales hay una probabilidad conocida de que esté el estimador. Estos dos límites se denominan intervalo de confianza. Esta probabilidad concreta de que el intervalo contenga al parámetro se denomina confiabilidad del intervalo. Qué nivel de confianza se requiere es una decisión del propio investigador. Los más comunes son el, 95% y el 99%, es decir, se elige que el intervalo tenga un 95% de probabilidades de contener al parámetro o bien el 99%. Siempre hablando de una misma muestra, un intervalo de confianza del 95% es más estrecho que uno del 99%, pero menos confiable. Conceptualmente, el nivel de confianza equivale al complemento de la probabilidad de cometer un error de tipo I al probar una hipótesis, es decir, a (1-α).
Así, el estimador por intervalo contendrá un estimador de punto del parámetro estudiado, junto al error estandar del estimador, y su factor de confiabilidad.
Cuando el intervalo de confianza sea más amplio de lo aceptable, antes de hacer inferencias sobre el valor del parámetro habría que pensar que la muestra, no es suficientemente buena para proveer una inferencia adecuada, por lo que en general habrá que tomar una muestra mayor.
El intervalo de confianza da también una idea del rango entre el cual se mueve el parámetro.