Post on 10-Apr-2018
DR. DENY GONZALEZ
UNIVERSIDAD ALONSO DE OJEDAESTADISTICA II
UNIDAD IMUESTREO Y ESTIMACION DE PARAMETROS
(GUIA DE ESTUDIO)
MAYO 2016
UNIDAD I. MUESTREO Y ESTIMACION DE PARAMETROS
La Estadística ……
“incluye la recopilación, presentación y caracterización de la informacióna fin de que auxilie tanto en el análisis de datos como en el proceso detoma de decisiones”. (Berenson y Levine, 1992).
“es un conjunto de métodos para la toma de decisiones en condiciones deincertidumbre”. (Harnett y Murphy, 1987 )
DESCRIPTIVA:Métodos que incluyen larecolección, presentación ycaracterización de unconjunto de datos con el finde describir apropiadamentelas diversas características deese conjunto de datos.
INFERENCIAL:Métodos que hacen posiblela estimación de unacaracterística de unapoblación o la toma de unadecisión referente a unapoblación, basándose sólo enlos resultados de la muestra.
UNIDAD I. MUESTREO Y ESTIMACION DE PARAMETROS
Población Muestra Muestreo Aleatorio
Herramientas Estadísticas
Mediana Muestral
2
)1)2/(()2/(
2/)1(
nn
n ; n es impar
; n es par
Media Muestraln
x
x
n
i
i 1
Moda
Varianza Muestral1
)(
1
2
2
n
xx
S
n
i
i
Desviación estándar muestral (S)
Media PoblacionalN
x
N
xxx iN
...21
1,2,3,4,4,4,5,6,7
𝑠2 =1
𝑛 − 1
𝑖=1
𝑛
𝑋𝑖2 − 𝑛( 𝑋)2
Ejemplo: El número de respuestas incorrectas en una prueba de competencia de
falso o verdadero para una muestra aleatoria de 15 estudiantes fueron los siguientes:
2,1,3,0,1,3,6,0,3,3,5,2,1,4 y 2. Encuentre: a) la media, b) la mediana c) la moda, d)
varianza y desviación estándar.
a)n
x
x
n
i
i 1 4.2
15
36x
b) 2/)1( nEs impar x(15+1)/2 = x8 = 2
Ordenar datos: 0,0,1,1,1,2,2,2,3,3,3,3,4,5,6
c) 0,0,1,1,1,2,2,2,3,3,3,3,4,5,6
d)
x f x2 x2 *f x*f
0 2 0 0 0
1 3 1 3 3
2 3 4 12 6
3 4 9 36 12
4 1 16 16 4
5 1 25 25 5
6 1 36 36 6
15 91 128 36
9714.2)115(*15
)36()128*15( 22
S
)1(*
***
1
2
1
2
2
nn
fxfxn
S
k
i
k
i
iiii
e) S = 1.7237
UNIDAD I. MUESTREO Y ESTIMACION DE PARAMETROS
n
fx
x
k
i
ii 1
*
𝑠2 =1
𝑛 − 1
𝑖=1
𝑛
𝑋𝑖2 − 𝑛( 𝑋)2
(1/14)(128-15*2.42)=2.9714
UNIDAD I. MUESTREO Y ESTIMACION DE PARAMETROS
Cuando se trabaja con conjuntos grandes de datos, es útil organizarlos
y resumirlos por medio de la construcción de una tabla que liste los
distintos valores posibles de los datos, individual o por grupos, junto
con el número de veces que se presentan dichos valores. (frecuencias)
Ordenamiento de notas en Estadística
9 9 10 11 11
11 12 12 13 13
13 14 14 14 14
16 17 17 19 20
Clase Frecuencia
9 - 11 6
12 - 14 9
15 - 17 3
18 - 20 2
Diferencia entre ordenamiento de datos y frecuencia
DISTRIBUCIÓN DE FRECUENCIAS
Si se agrupan en intervalos de clase y se cuenta el número deindividuos que pertenece a cada intervalo.
Regla de Spiegel: Se construyen entre 5 y 20 clases.
Regla de Sturgess: El número de clases viene dado por el valor de k, donde:
)( log1 5003,322 nnk
Regla Empírica: El número de clases viene dado por:
nk
Es necesario primero determinar el número óptimo de clases ocategorías (k) y luego construirlos.
UNIDAD I. MUESTREO Y ESTIMACION DE PARAMETROS
DISTRIBUCIÓN DE FRECUENCIAS
Ordenamiento de notas en Estadística
9 9 10 11 11
11 12 12 13 13
13 14 14 14 14
16 17 17 19 20
Clase Frecuencia
7 - 9 2
10 - 12 6
13 - 15 7
16 - 18 3
19 - 21 2
Regla de Spiegel: 5 clases
Regla de Sturgess: k=1+3.322*log(20) = 5.322
Regla Empírica: K=raíz(20) = 4.47
UNIDAD I. MUESTREO Y ESTIMACION DE PARAMETROS
DISTRIBUCIÓN DE FRECUENCIAS
Rango
KAncho de Clase =
Se selecciona k=5
(20-9)/5 = 2.75 aprox 3
Calcula los límites superiores sumándole al límite inferior el ancho de clase menosuna unidad, una décima o una centésima, según sea el caso para evitar que loslímites de un intervalo y el siguiente tengan los mismos valores. Ejemplo 3-1=2
UNIDAD I. MUESTREO Y ESTIMACION DE PARAMETROS
ESTIMADOR
Un estimador de un parámetro poblacional es una función de los datos
muestrales. En pocas palabras, es una fórmula que depende de los valores
obtenidos de una muestra, para realizar estimaciones.
Por ejemplo, un estimador de la media poblacional, μ, sería la media muestral,
, según la siguiente fórmula:
Donde (x1, x2, ..., xn) sería el conjunto de datos de la muestra.
MUESTREOS PROBABILISTICOS
Muestreo aleatorio simple
Muestreo aleatorio sistematico
Muestreo aleatorio estratificado
MUESTREO NO PROBABILISTICOS
Muestreo por cuotas
Muestreo intencional o por conveniencia
Bola de nieve.
TIPOS DE MUESTRA
UNIDAD I. MUESTREO Y ESTIMACION DE PARAMETROS
MUESTRA ALEATORIA Y TAMAÑO DE LA MUETRA (n).
Una colección de n variables aleatorias.
Todas con la misma distribución.
Todas independientes.
Si la población es finita, es decir conocemos el total de la población y deseásemos
saber cuántos del total tendremos que estudiar la respuesta seria:
Donde:
N = Total de la población
Za2 = 1.962 (si la seguridad es del 95%)
p = proporción esperada (en este caso 5% = 0.05)
q = 1 – p (en este caso 1-0.05 = 0.95)
d = precisión (en este caso deseamos un Ejemplo 1%, 2,% o 3%).
Fuente:https://www.fisterra.com/mbe/investiga/9muestras/9muestras2.asp
UNIDAD I. MUESTREO Y ESTIMACION DE PARAMETROS
¿A cuántas personas tendría que estudiar de una población de 15.000 habitantes para
conocer la prevalencia de diabetes?
Seguridad = 95%; Precisión = 3%; proporción esperada = asumamos que puede ser
próxima al 5% ; si no tuviese ninguna idea de dicha proporción utilizaríamos el valor p
= 0.5 (50%) que maximiza el tamaño muestral.
ESTIMACION DE TAMAÑO DE MUESTREO
Donde:
N = Total de la población
Za2 = 1.962 (si la seguridad es del 95%)
p = proporción esperada (en este caso 5% = 0.05)
q = 1 – p (en este caso 1-0.05 = 0.95)
d = precisión (en este caso deseamos un 3%).
Fuente:https://www.fisterra.com/mbe/investiga/9muestras/9muestras2.asp
UNIDAD I. MUESTREO Y ESTIMACION DE PARAMETROS
Si la población es finita, también podemos aplicar la siguiente ecuación
Según diferentes seguridades el coeficiente de Z(α/2) varía, así:
Para un intervalo de confianza del 90% el coeficiente Z(α/2) sería 1.645
Para un intervalo de confianza del 95% el coeficiente Z(α/2) sería 1.96
Para un intervalo de confianza del 97.5% el coeficiente Z(α/2) sería 2.24
Para un intervalo de confianza del 99% el coeficiente Z(α/2) sería 2.576
Para un intervalo de confianza del 99.7% el coeficiente Z(α/2) sería 3
Donde, S2 varianza de la población
ESTIMACION DE TAMAÑO DE MUESTREO
UNIDAD I. MUESTREO Y ESTIMACION DE PARAMETROS
INTERVALO DE CONFIANZA
Para encontrar un intervalo de confianza con cualquier nivel de confianza deseado, sea α un numero entre 0 y 1, y 100(1- α)% el nivel de confianza requerido.
Se define el área a Z(α/2) como puntaje z que corta un área α /2 en la cola del lado derecho
Con el propósito de determinar un intervalo de confianza de 85%,100(1- α)=851- α =0.85α =1-0.85 = 0.15, como α /2 = 0.075Buscamos en la tabla Z(0.075) = 1.44 aproximado
UNIDAD I. MUESTREO Y ESTIMACION DE PARAMETROS
Definición. Sea X1,…, Xn una muestra aleatoria grande (n > 30) de una
población con media µ y desviación estándar σ, por lo que X es
aproximadamente normal. Entonces su intervalo de confianza 100(1- α)%.
Cuando el valor de σ es desconocido, se puede sustituir por la desviación
estándar muestral s.
UNIDAD I. MUESTREO Y ESTIMACION DE PARAMETROS
Solución, Para un intervalo de confianza del 95% el coeficiente Z(α/2) sería 1.96
y del 99% el coeficiente Z(α/2) sería 2.576
a) b)
UNIDAD I. MUESTREO Y ESTIMACION DE PARAMETROS
Ejemplo 2. Una muestra aleatoria de 100 baterías producidas por cierto método, el
promedio de tiempo de vida fue de 150 horas y la desviación estándar de 25 horas.
a) Determine un intervalo de confianza de 95% para la media del tiempo de vida de
las baterías producidas por este método.
b) Un ingeniero afirma que la media del tiempo de vida esta entre 147 y 153 horas.
Con que nivel de confianza se puede hacer esta afirmación?
a) 150 – 1.96*(25/√100) < µ < 150 +1.96*(25/√100)
145.1 < µ < 154.9
b) 150 + X*(25/√100) = 153
X*(25/√100) = 3 ; X = 1.2
Por tabla Z α /2 = 0.1151 ; Z α = 0.2304
1- α =0.2304 ; α = 1-0.2304 = 0.7696 (76.96%)
UNIDAD I. MUESTREO Y ESTIMACION DE PARAMETROS
INTERVALOS DE CONFIANZA PARA LA MEDIA POBLACIONAL CON
MUESTRAS PEQUEÑAS.
Sea X1,…, Xn una muestra pequeña (por ejemplo n < 30) de una población
normal con media o, entonces la cantidad
Tiene una distribución t Student con n-1
grados de libertad, denotada por t(n-1).
Cuando n es grande, la distribución es muy
cercana a la distribución normal, de esta
forma la curva normal puede usarse en lugar
de la de t Student.
UNIDAD I. MUESTREO Y ESTIMACION DE PARAMETROS
n
x
x
n
i
i 1
𝑠2 =1
𝑛 − 1
𝑖=1
𝑛
𝑋𝑖2 − 𝑛( 𝑋)2
X=70 / 7 = 10
S2=(1/6)*(700,48-7(10) 2) = 0.08
S = 0.2828
100(1-α)=95%1- α =0.95α =0.05α /2=0.025Por tabla t(6,0.025) = 2.447
10 – 2.447*(0.2828/√7) < µ < 10 + 2.447*(0.2828/√7)
9.7387 < µ < 10.2615
UNIDAD I. MUESTREO Y ESTIMACION DE PARAMETROS
Ejemplo 2. Se presentan las mediciones de la fuerza nominal de corte (Kn) para una
muestra de 15 vigas de concreto. Los resultados son;
580 – 400 – 428 – 825 – 850
875 - 920 – 550 – 575 – 750
636 – 360 – 590 – 735 - 950 , se desea estimar el intervalo de confianza para un 99%,
para la media de la fuerza de corte.
X= 668.27S = 192.0891
100(1-α)=99%1- α =0.99α =0.01α /2=0.005Por tabla t(14,0.005) = 2.977
668.27 – 2.977*(192.0891/√15) < µ < 668.27 + 2.977*(192.0891/√15)
520.61 < µ < 815.92
EJERCICIOS PROPUESTOS
UNIDAD I. MUESTREO Y ESTIMACION DE PARAMETROS
UNIDAD I. MUESTREO Y ESTIMACION DE PARAMETROS
EJERCICIOS PROPUESTOS