Post on 10-Jul-2015
En estadística, se llama intervalo de confianza a un par de
números entre los cuales se estima que estará cierto valor
desconocido con una determinada probabilidad de acierto.
Formalmente, estos números determinan un intervalo, que se
calcula a partir de datos de una muestra, y el valor
desconocido es un parámetro poblacional. La probabilidad de
éxito en la estimación se representa con 1 - α y se denomina
nivel de confianza. En estas circunstancias, α es el llamado
error aleatorio nivel de significación, esto es, una medida de
las posibilidades de fallar en la estimación mediante tal
intervalo.
El nivel de confianza y la amplitud del intervalo varían
conjuntamente, de forma que un intervalo más amplio tendrá más
posibilidades de acierto (mayor nivel de confianza), mientras que
para un intervalo más pequeño, que ofrece una estimación más
precisa, aumentan sus posibilidades de error.
El nivel de confianza y la amplitud del intervalo varían
conjuntamente, de forma que un intervalo más amplio tendrá más
posibilidades de acierto (mayor nivel de confianza), mientras que
para un intervalo más pequeño, que ofrece una estimación más
precisa, aumentan sus posibilidades de error.
En definitiva, un intervalo de confianza al 1 - α por ciento para la
estimación de un parámetro poblacional θ que sigue una
determinada distribución de probabilidad , es una expresión del tipo
[θ1, θ2] tal que P[θ1 ≤ θ ≤ θ2] = 1 - α, donde P es la función de
distribución de probabilidad de θ.
Las líneas verticales representan 50 construcciones diferentes de intervalos de confianza para la estimación del valor μ.
De una población de media y desviación típica se
pueden tomar muestras de elementos. Cada una de
estas muestras tiene a su vez una media ( ). Se puede
demostrar que la media de todas las medias muéstrales
coincide con la media poblacional:[2]
Pero además, si el tamaño de las muestras es lo
suficientemente grande,[3] la distribución de medias
muéstrales es, prácticamente, una distribución normal (o
gaussiana) con media μ y
una desviación típica dada por la siguiente expresión:
Esto se representa como sigue
Si estandarizamos, se sigue que:
En una distribución Z ~ N(0, 1) puede calcularse fácilmente un intervalo dentro del cual caigan un determinado porcentaje de las observaciones, esto es, es sencillo hallar z1 y z2 tales que P[z1 ≤ z ≤ z2] = 1 - α, donde (1 - α)·100 es el porcentaje deseado (véase el uso de las tablas en una distribución normal).
Se desea obtener una expresión tal que
En esta distribución normal de medias se puede calcular el intervalo de confianza donde se encontrará la media poblacional si sólo se conoce una media muestral ( ), con una confianza determinada. Habitualmente se manejan valores de confianza del 95 y del 99 por ciento. A este valor se le llamará (debido a que es el error que se cometerá, un término opuesto).
En esta distribución normal de medias se puede calcular el intervalo
de confianza donde se encontrará la media poblacional si sólo se
conoce una media muestral ( ), con una confianza determinada.
Habitualmente se manejan valores de confianza del 95 y del 99 por
ciento. A este valor se le llamará (debido a que es el error que se
cometerá, un término opuesto).
Para ello se necesita calcular el punto —o, mejor dicho, su versión
estandarizada o valor critico— junto con su "opuesto en la
distribución" . Estos puntos delimitan la probabilidad para el
intervalo, como se muestra en la siguiente imagen: