POBLACION es la totalidad de observaciones relacionadas con una situación particular , puede ser finita o infinita.
Un PARAMETRO es una caracterización numérica de la distribución de la población de manera que describe, parcial o completamente la función de densidad de población de la característica de interés.
Una MUESTRA es un subconjunto de la población. Debe ser representativa y aleatoria.
Una estadística (un estadístico) es cualquier función de las variables aleatorias que se observaron en la muestra, de manera que esta función no contiene cantidades desconocidas.
REVISION DE CONCEPTOS
Ejemplos de PARAMETROS
N
X
N
1ii
N
X
N
X
N
ii
N
ii
1
2
1
2
2
)(
)(
Varianza muestral
Desviacion Standard
x
Media
POBLACIONtamañodela
cesosnumerodesu
n
Xp PROPORCION
Ejemplos de ESTADISTICOS
n
X X
n
1ii
1
)(
1
)(
1
2
1
2
2
n
XX
n
XXS
n
ii
n
ii
S
Varianza muestral
Desviacion Standard
Media
muestratamañodelacesosnumerodesu
nX
ps PROPORCION MUESTRAL
La distribución de muestreo de una estadística es la distribución de probabilidad que puede obtenerse como resultado de un número infinito de muestras aleatorias independientes, cada una de tamaño n provenientes de la población de interés.
Es decir es la distribución de probabilidad de un estadístico.
La distribución de probabilidad de se llama distribución muestral de la media.
La distribución de probabilidad de se llama distribución muestral de la varianza.
La distribución de probabilidad de p se llama distribución de muestral de la proporción.
X
2S
DISTRIBUCION DE MUESTREO DE UNA ESTADISTICA
Se utiliza para hacer inferencias sobre la media de la población
Es el resultado de un experimento que se lleva a cabo una y otra vez para muestras del mismo tamaño, de las cuales se obtienen los diversos valores de la media muestral.
Esta distribución describe la variabilidad de los promedios muestrales alrededor de la media de la población
Muestras Mediciones
1
2
3
. . .
. . .
. . .
. . .
. . .
. . .
. . .
. . .
m
TOTALES
1312111 .......,, nXXXX
2322212 .......,, nXXXX
3332313 .......,, nXXXX
nmmmm XXXX .......,, 321
2X
1X
3X
mX
iX
i
m
i
X1
C
A
L
C
U
L
O
S
Muestras tomadas a partir de una distribucion normal
Con media
Y varianza
2
n
X X
n
1ii
m
XX
m
ii
1
Sea
una muestra aleatoria de tamaño “n” de una población con función de densidad f(x) con media y varianza de una población normal La media muestral representada por , es la media aritmética de los elementos de la muestra, y su varianza muestral y desviación standard están dadas por:
2
X
n
X X
n
1ii
nXXXX ............,, 321
1
)(
1
)(
1
2
1
2
2
n
XX
n
XXS
n
ii
n
ii
S
Varianza muestral
Desviacion Standard
Propiedades de la Media Aritmética
•Imparcialidad
•Eficiencia
•Consistencia
La imparcialidad se refiere al hecho de que el promedio de todas las medias de muestra posibles de un tamaño n será igual a la media de la población
Muestras Mediciones
1
2
3
. . .
. . .
. . .
. . .
. . .
. . .
. . .
. . .
m
TOTALES
1312111 .......,, nXXXX
2322212 .......,, nXXXX
3332313 .......,, nXXXX
nmmmm XXXX .......,, 321
2X
1X
3X
mX
iX
i
m
i
X1
C
A
L
C
U
L
O
S
Muestras tomadas a partir de una distribucion normal
Con media
Y varianza
2
m
XX
m
ii
1
imparcialidad
La eficiencia se refiere a la precisión de la muestra de estadística como un estimador del parámetro de población
Para distribuciones como la normal, la Media Aritmética se considera más estable de muestra a muestra que otras mediciones de tendencia central
Para una muestra de tamaño n la media de la muestra se acercará más en promedio a la media de la población que cualquier otro estimador imparcial
Por lo tanto la media de la muestra es una mejor estimación de la media de la población
La consistencia se refiere al efecto del tamaño de muestra sobre la utilidad de un estimador
Al incrementarse el tamaño de muestra, la variación de la media de muestra de la media de la población se hace más pequeña, de manera que la media de la muestra se vuelve una mejor estimación de la media de la población
MUESTREO DE
POBLACIONES NORMALES
Muestras Mediciones
1
2
3
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
m
TOTALES
1312111 .......,, nXXXX
2322212 .......,, nXXXX
3332313 .......,, nXXXX
nmmmm XXXX .......,, 321
2X
1X
3X
mX
iX
i
m
i
X1
C
A
L
C
U
L
O
S
iS
1S
2S
3S
mS
m
iiS
1
2iS2
1S22S
23S
2mS
m
iiS
1
2
Muestras tomadas a partir de una distribucion normal
Con media
Y varianza
2
n
nXV
XE
x
x
x
22)(
)(
nXXXX ............,, 321Cada observación
en cada una de las muestras aleatorias tiene entonces la misma distribución normal que la población de la que se muestrea.
Error estándar de la media
Si se toman muestras de una población normal con media y una desviación estándar conocida la distribución de muestreo de la media también tendrá una distribución normal con media y una desviación estándar denominada Error Estándar de la Media
x
n
xz
xz
x
En este caso el valor de la
variable z estándar se calcula por:
Muestreo de poblaciones no normalesTeorema del Límite Central
Al hacerse lo bastante grande el tamaño de una muestra la distribución de muestreo de la media puede aproximarse mediante la distribución normal
Esto es cierto no importando la forma de la distribución de los valores individuales de la población
Para la mayoría de las distribuciones de población, sin importar la forma, la distribución de muestreo de la media tendrá una distribución aproximadamente normal si se seleccionan muestras de al menos 30 observaciones
Si la distribución de población es lo bastante simétrica, la distribución de muestreo de la media será aproximadamente normal si se seleccionan muestras de al menos 15 observaciones
Si la población se distribuye normalmente, la distribución de muestreo de la media se distribuirá normalmente sin importar el tamaño de la muestra
CUANTITATIVAMENTE EL TEOREMA DEL LIMITE CENTRAL SE DESCRIBE POR:
Si es la media de una muestra aleatoria de tamaño n tomada de una población con media y varianza , entonces la forma limite de la distribucion de
n
XXz
y
nNX
x
2
,
2
Conforme es la distribucion normal estándar n(z;0,1)
n
La aproximación es buena si
30nSi n es menor de 30 la aproximación será buena solo si se sabe que la población tiene una distribución normal
Suponga que a cada uno de los mecanógrafos que comprenden una población de servicio de apoyo secretarial de un departamento particular de una compañía se le pidiera mecanografiar la misma página de un manuscrito. El número de errores cometidos por cada mecanógrafo fue el siguiente:
MecanógrafoNúmero de
Errores Frecuencia
A 3 1
B 2 1
C 1 1
D 4 1
errores5.24
4123
12.12544.1
42544.1
2)5.24(........2)5.23(12
N
i
CALCULO DEL NUMERO PROMEDIO DE ERRORES Y SU VARIABILIDAD
Número de Errores cometidos por una población de cuatro mecanógrafos
0
0.2
0.4
0.6
0.8
1
1.2
1 2 3 4
Número de errores
Mec
anó
gra
fos
Serie1
La distribución de población se muestra en el siguiente grafico:
Muestra MecanógrafosResultados de muestra
Media Muestral
1 A,A 3,3 3
2 A,B 3,2 2.5
3 A,C 3,1 2
4 A,D 3,4 3.5
5 B,A 2,3 2.5
6 B.B 2,2 2
7 B,C 2,1 1.5
8 B.D 2,4 3
9 C,A 1,3 2
10 C,B 1,2 1.5
11 C,C 1,1 1
12 C,D 1,4 2.5
13 D,A 4,3 3.5
14 D,B 4,2 3
15 D,C 4,1 2.5
16 D,D 4,4 4
Si se toman muestras de tamaño DOS con reemplazo se tienen los siguientes resultados, mostrados en la tabla:
errores5.216
4.....25.23 La media de las muestras es:
X
Muestra MecanógrafosResultados de muestra
Media Muestral
1 A,B 3,2 2.5
2 A,C 3,1 2
3 A,D 3,4 3.5
4 B,C 2,1 1.5
5 B.D 2,4 3
6 C,D 1,4 2.5
Sin reemplazo
errores5.26
5.2.....25.2
Si se toma una muestra de tamaño DOS sin reemplazo se tienen los siguientes resultados, mostrados en la tabla
X
2
12.1nx
Cálculo del Error Estándar de la Media
En ambos el valor de la media es igual, por lo tanto se concluye que la Media Aritmética de muestra es un estimador imparcial de la media de la Población
Que se concluye al comparar los dos resultados anteriores?
Si se extraen al azar muestras independientes de tamaño n1 y n2 de dos poblaciones discretas o continuas, con medias y
y varianzas y respectivamente conocidas, entonces la distribución muestral de las diferencia de medias
esta distribuida aproximadamente de forma normal con media y varianza dada por:
1 221 2
2
21 XX
2
22
1
21
21
21
21
nn
y
XX
XX
2
22
1
21
2121 )()(
nn
XXz
DONDE
Es aproximadamente una variable normal estándar
CASO 1Suma de las
muestras no excede a 30
Si se extraen al azar muestras independientes de tamaño n1 y n2 de dos poblaciones discretas o continuas, con medias y
y varianzas y respectivamente desconocidas, entonces la distribución muestral de las diferencia de medias
esta distribuida aproximadamente de forma normal con media y varianza dada por:
1 221 2
2
21 XX
2121 XX DONDE
Es aproximadamente una variable normal estándar
CASO 2Suma de las
muestras excede a 30
2
22
1
21
2121 )()(
nS
n
XX
sz
2
22
1
21
21 n
S
nS
sxx
Si se extraen al azar muestras independientes de tamaño n1 y n2 (cuya suma no excede a 30) de dos poblaciones discretas o continuas, con medias y
y varianzas y respectivamente desconocidas, entonces la distribución muestral de las diferencias de las medias
esta distribuida con media y varianza dada por:
1 2
21
2
2
21 XX 22
21
DONDE
CASO 3
21
222
211
21
2121
)1()1(
11
)()(
nn
SnSnS
nnS
XX
p
p
t
2121
222
211 11)1()1(
21 nnnn
SnSnS xx
2121 XX
Si se extraen al azar muestras independientes de tamaño n1 y n2 (cuya suma no excede a 30) de dos poblaciones discretas o continuas, con medias y
y varianzas y respectivamente desconocidas, entonces la distribución muestral de las diferencias de medias
esta distribuida con media y varianza dada por:
1 221 2
2
21 XX
2121 XX DONDE
CASO 4
2
22
1
21
2121 )()(*nS
nS
XXt
v s1
2
n1 s2
2
n2 2(s1
2
n1)2
n1 1 (s2
2
n2)2
n2 1
22
21
2
22
1
21
21 n
S
nS
sxx
con
Si n1 y n2 son mayores o iguales a 30 la aproximación normal para la diferencia de medias es muy buena cuando las distribuciones originales están cerca de la normal
Si n1 y n2 son menores a 30 la aproximación normal para la diferencia de medias es muy buena cuando las distribuciones originales están cerca de la normal
Si n1 y n2 son menores a 30 la aproximación normal para la diferencia de medias NO es muy buena si las distribuciones originales no son normales
Distribución de Muestreo de la Proporción
Se utiliza para variables categóricas
Cada sujeto u objeto se clasifica como poseedor o no de una característica particular (masculino o femenino, satisfecho o no con su trabajo,)
A los dos resultados posibles se les puede asignar resultados de 1 y 0(cero) para representar la presencia o ausencia de la característica
En este caso la media muestral es la proporción de muestra ps, que tiene la característica de interés, se define como:
Donde
muestratamañodelacesosnumerodesu
nX
ps
10 sp
sp Es un estimador de la proporción de población p
ANALOGIA
La media de la muestra es un estimador de la media de la población
La estadística ps es un estimador de la proporción de la población
La distribución de muestreo de la proporción en realidad sigue la distribución BINOMIAL, sin embargo cuando np y n(1-p) son cada uno al menos 5 se puede utilizar la distribución normal para aproximar la distribución binomial.
En los casos de inferencias relacionadas con la proporción el tamaño de muestra es lo bastante sustancial para usar la aproximación normal
nX
p
npp
ppZ
s
s
)1(
)1( pnp
npXZ
PROPORCION DE EXITOS
NUMERO DE EXITOS
npp
sp
)1( Error estándar de la Proporción
Nota importante: esta distribución sigue la distribución binomial, sin embargo la distribución binomial puede usarse para aproximar la distribución binomial cuando np y n(1-p) son cada uno al menos 5. En ese caso se calcularía el valor de z por:
npp
ppsz)1(
Donde p es la proporción de la población
Ejemplo
El gerente de la sucursal local de un banco de ahorro ha determinado que 40% todos los depositantes tienen cuentas múltiples en el banco. Si se selecciona aleatoriamente una muestra de 200 depositantes, cual es la probabilidad de que la proporción muestra de depositantes con cuentas múltiples esté entre 0.40 y 0.43
1206.0*200)4.01(
804.0*200
n
np
Distribución de muestreo de la proporción se puede suponer normalmente distribuida
3078.0)87.00(
87.0200
6.0*4.0
4.043.0
0200
6.0*4.0
4.040.0
2
2
1
1
zP
z
z
z
z
Muestreo de Poblaciones Finitas
El TLC y los errores estándar de la media y la proporción se han basado en la premisa de que las muestras seleccionadas se eligieron con reemplazo.
E casi toda investigación de encuesta, el muestreo es conducido sin reemplazo de poblaciones que son de un tamaño finito N.
En estos casos cuando el tamaño de n no es pequeño comparado con el tamaño de población N (se muestrea mas del 5% de la población), de manera que n/N>0.05 debe usarse un factor de corrección de población finita en la fórmula de la media como del error estándar de la proporción
1
NnN
pcfN es tamaño de la población
n es tamaño de la muestra
Muestreo de Poblaciones Finitas
1
NnN
nx
x
1)1(
NnN
npp
sp
MUESTREO A PARTIR DE UNA DISTRIBUCION DE BERNOULLI
)1()(
p
pXP X=1
X=0
La variable aleatoria X con fdp
Se llama variable aleatoria de Bernoulli
Si se toma una muestra aleatoria de n observaciones, entonces la suma de de las observaciones muestrales
nXXXX ............21
Tiene una distribucion binomial con parametros n y p
n
X X
n
1ii
Su media muestral es
n
pp
p
ppaXP
X
X
knka
i
)1(
)1()(
2
0
n
k
Es posible obtener la distribucion de a partir de la distribucion binomialX
MUESTREO A PARTIR DE UNA DISTRIBUCION DE POISSON
Si se toma una muestra aleatoria de n observaciones, DE UAN DISTRIBUCION DE Posiisn con parametro entonces la suma de de las observaciones muestrales
nXXXX ............21
Tiene una distribucion poisson con parametro
n
X X
n
1ii
La media de cada muestral es
n
an
k
xn
x
neanXPaXP
0 !
)()(
nx
X
2nx