ESTIMACION 2015-02 bbioestadistica lina.docx

18
BIOESTADISTICA UNIDAD IV ESTIMACIONPOR INTERVALOS Mgs. Aníbal Verbel Castellar 16/07/2015 Barranquilla Colombia

Transcript of ESTIMACION 2015-02 bbioestadistica lina.docx

Page 1: ESTIMACION  2015-02 bbioestadistica lina.docx

BIOESTADISTICA

UNIDAD IV

ESTIMACIONPOR INTERVALOS

Mgs. Aníbal Verbel Castellar

16/07/2015

Barranquilla Colombia

ESTIMACION PUNTUAL

Page 2: ESTIMACION  2015-02 bbioestadistica lina.docx

Objetivos:Generalizar las características de una población valiéndose de observaciones empíricas de la muestra.

En este tema vamos a estudiar los problemas de estimación, que vamos a definir como el proceso por el que llegamos a la obtención y análisis de los estimadores. Para este curso de pregrado se estudiara solo la estimación puntual y estimación por intervalos.

1. ESTIMACIÓN PUNTUALSi a partir de las observaciones de una muestra se calcula un solo valor como estimación de un parámetro de la población desconocido, el procedimiento se denomina estimación puntual.

Un estimador puntual θ̂ de un parámetro poblacional θ es cualquier estadística que nos permita a partir de los datos muestrales obtener valores aproximados de ese parámetro θ.Un estimador puntual θ̂ también se le llama una estadística o un estadístico

Hay cuatro criterios que se suelen aplicar para determinar si una estadística es un buen estimador: Insesgamiento, eficiencia, consistencia y suficiencia

Estimador Insesgado:

Un estimador puntual θ̂es insesgado cuando la media del estimador es igual al parámetro θ, es decir:

E (θ̂ )=θEjercicios

1. Demuestre que:a) La media muestral es un estimador insesgado de la media poblacionalb) La proporción muestral es un estimador insesgado de la proporción poblacionalc) La varianza muestral es un estimador insesgado de la varianza muestrald) La desviación muestral no es un estimador insesgado de la desviación poblacional

1. Estimador consistente:Un estimador es consistente si a medida que aumenta el tamaño de la muestra, la probabilidad de que se acerque al parámetro va siendo mayor.

2. Estimador suficiente:Un estimador θ̂ es suficiente cuando es capaz de sustraer de la muestra toda la información que ésta contenga acerca del parámetro.

3. Estimador eficiente (Consultar)ESTIMACION POR INTERVALOS

1. Estimación por intervalos para una proporción p

1.1 Cuando la población es infinita

Page 3: ESTIMACION  2015-02 bbioestadistica lina.docx

1.2 Cuando la población es finita de tamaño N

2. Estimación por intervalos para el promedio μ

2.1 Cuando la población es infinita

2.2 Cuando la población es finita de tamaño N

1. Estimación por intervalos para una proporción

Una proporción es también un porcentaje, así por ejemplo si en el curso hay 30 alumnos de los cuales 12 son mujeres, entonces la proporción de mujeres en el curso es de

p=1230

=0.40

También se puede expresar en porcentaje: p=40%

1.1 Intervalo para la proporción cuando la población es infinita

Para estimar por intervalos la proporción de una población infinita, se parte del hecho

de que p̂ sigue una distribución normal con media p y varianza pqn

Es decir:

p̂ N ( p ; pqn )

En consecuencia el intervalo para la proporción p está dado por:

pϵ [ p̂−Zα /2√ p̂ q̂n ; p̂+Zα /2√ p̂ q̂n ]p: Es la proporción de la población que se va a estimar

p̂ : Es la proporción de la muestra de tamaño n

Zα /2: Es el percentil correspondiente al nivel de confianza de una distribución normal estándar, dado que la proporción muestral se distribuye normal.

Que es un percentil?Un percentil p es aquel valor por debajo del cual se encuentra el porcentaje p de los datos de una serie ordenada de menor a mayor.

Page 4: ESTIMACION  2015-02 bbioestadistica lina.docx

Puede recordarse que el punto percentil 90 es el punto de la distribución tal que el 90% de los valores se encuentran por debajo de él y el 10% por encima.

Para una distribución normal estándar:

a) El percentil es Z∝2

equivale a un punto por debajo del cual hay un área de α/2

(grafique)

b) El percentil es Z(1−∝2

) equivale a un punto por debajo del cual hay un área de 1- α/2

grafique

www.virtual.unal.edu.co/cursos/sedes/manizales/4030006/.../tema1.html

Ejercicio:

Suponga que en un proceso de producción de latas metálicas, se extrae una muestra de 120

latas para envasar leche pulverizada, 18 de ellos presentaron defectos (o no conformes).

Determine un intervalo de confianza del 90% para la verdadera proporción de latas no

conformes.

p̂= 18120

=0.15 ; q̂=0.85

1-α=0.90, de aquí α= 0.10, luego α/2 = 0.05, por lo tanto:

Z0.05=−1.65

Al reemplazar en la expresión

pϵ [ p̂−Zα /2√ p̂ q̂n ; p̂+Zα /2√ p̂ q̂n ]Resulta:

pϵ [0.15−1.65√ 0.15∗0.85120;0.15+1.65√ 0.15∗0.85120 ]

pϵ [0.15−0.053 ;0.15+0.053 ]

pϵ [0.097 ;0.203 ]En porcentaje:

pϵ [9.7%20.3% ]

Lectura: “Se estima que la proporción de latas no conformes, está entre el 9.7% y el 20.3% con

una confiabilidad del 90%”

Page 5: ESTIMACION  2015-02 bbioestadistica lina.docx

Margen de error y tamaño de muestra

El error es la diferencia positiva que separa a p de p̂ (p- p̂)

Si e=Zα /2√ p̂ q̂n significa que se tiene una confianza de (1-α)% de que la diferencia (p- p̂)

no excederá a Zα /2√ p̂ q̂n Error

p̂−Zα /2√ p̂ q̂n p̂ p p̂+Zα /2√ p̂ q̂n

Se deduce que

n=Zα /22 p̂ q̂

e2

Los valores de p̂ y q̂ se obtienen a partir de una muestra piloto.

Ejercicio 1:

Se desea estimar la proporción de jóvenes entre 18 y 30 años con hábitos de fumar (5 o más cigarrillos diarios) en el estrato cuatro de la ciudad de Barranquilla. Para ello se obtuvo una muestra piloto de 60 jóvenes la cual arrojo que 35 de ellos fuman

a) Determine el tamaño de muestra necesario si el NC es del 95% y el margen de error es del 3%.

b) Si de la muestra anterior 619 fuman, determine un intervalo de confianza del 95% para la verdadera proporción de jóvenes que fuman.

c) Resuelva los numerales a) y b) sin muestra piloto

Solución

Page 6: ESTIMACION  2015-02 bbioestadistica lina.docx

a)

p̂=3560

=0.583

n=(1.96 )20.583∗0.417

(0.03 )2=1037

p̂= 6331037

=0.61

b)

pϵ [ p̂−Zα /2√ p̂ q̂n ; p̂+Zα /2√ p̂ q̂n ]

pϵ [0.61−1.96√ 0.61∗0.391037;0.61+1.96√ 0.61∗0.391037 ]

pϵ [0.61−0.024 ;0.61+0.024 ]

pϵ [58.6% ;63.4% ]

c) Sin muestra piloto

Significa que hay que reemplazar, los valores de p̂ y q̂ así:

Dado que q = 1-p, entonces aplicando el principio de la primera y segunda derivada de la función p*q= p*(1-p), el valor que hace máxima esta función es p=1/2, veamos:

Si f y f ' son derivables en a, entonces a es un máximo relativo si se cumple:

1. f '(a) = 0

2. f ''(a) < 0

f(p)=p(1-p)

f '(p) = 1-2p

f ''(p)=-2

Page 7: ESTIMACION  2015-02 bbioestadistica lina.docx

Si p=1/2, entonces: f '(1/2)= 1-2(1/2)=0 y f ''(1/2)=-2 <0, es decir cumple por lo tanto p = ½ es un máximo.

por esta razón en la ecuación anterior se hace p̂=12y q̂=1

2, luego p̂ q̂=1

4 y la expresión

del tamaño de muestra se convierte en

n=Zα /22

4e2(sinmuestra piloto)

n=(1.96 )2

4 (0.03 )2=¿

n=1067

p̂= 6191067

=0.58

pϵ [ p̂−Z α2 √ p̂ q̂n ; p̂+Z α2 √ p̂ q̂n ]

pϵ [0.58−1.96 √ 0.58∗0.421067;0.58+1.96 √ 0.58∗0.421067 ]

pϵ [0.58−0.03 ;0.58+0.03 ]

pϵ [0.55 ;0.61 ]

pϵ [55% ;61% ]

1.2 Intervalo para la proporción cuando la población es finita de tamaño N

Para poblaciones finitas de tamaño N, se aplica el factor de corrección

N−nN−1

Luego

Page 8: ESTIMACION  2015-02 bbioestadistica lina.docx

pϵ [ p̂ ± Zα /2√ p̂ q̂n √ N−nN−1 ]

Margen de error y tamaño de muestra:

e=Zα /2√ p̂ q̂n √ N−nN−1

n=N Z α

2

2 p̂ q̂

Z α2

2 p̂ q̂+ (N−1 ) e2(Conmuestra piloto)

Con p̂=0.5 y q̂=0.5, se obtiene

n=N Z α

2

2

Z α2

2 +4 (N−1 ) e2(sinmuestra piloto)

Ejercicio 2

Se desea estimar la proporción de trabajadores hipertensos en la Empresa CARPINTEROS LTDA de Barranquilla. Si el número de trabajadores es de 3500:

a) Determine el tamaño de muestra necesario para un N.C. del 98.54% y un error máximo permisible del 4%

b) Si de la muestra calculada 240 son hipertensos, determine un intervalo de confianza para la verdadera proporción de trabajadores hipertensos para un N.C. del 95.86 %

n=3500 (2.44 )2

(2.44 )2+4 (3499)¿¿

p̂=240735

=0.326 ; q̂=0.674

pϵ [0.326±2.039√ 0.326∗0.674735 √ 3500−7353499 ]

Page 9: ESTIMACION  2015-02 bbioestadistica lina.docx

pϵ [0.326±0.0309 ]

pϵ [0.295 ;0.357 ]

pϵ [29.5% ;35.7% ]

2. Estimación por intervalos para el promedio:

2.1 Cuando la población es infinita y varianza conocida

μϵ [X ±Z α2 σ√n ]2.2 Cuando es desconocida y n>30

μϵ [X ±Z α2 S√n ]2.3 Cuando la población es finita de tamaño varianza conocida

μϵ [X ±Z α2

σ√n √ N−n

N−1 ]

2.4 Cuando la población es finita de tamaño varianza desconocida

μϵ [X ±Z α2

S√n √ N−n

N−1 ]Ejercicio:

Ejercicio 4.

Page 10: ESTIMACION  2015-02 bbioestadistica lina.docx

Un biólogo quiere estimar el peso promedio de ciertos peces en vía de extinción. Un estudio anterior de diez peces mostró que la desviación estándar de sus pesos es de 18.2 libras. ¿Qué tan grande debe ser una muestra para que el biólogo tenga el 95% de confianza de que el error de estimación es a lo sumo 4 libras?

n=[ 18.2∗1.964 ]2

=80

En consecuencia, para un tamaño de la muestra de 80, se tiene un 95% de confianza en que µ difiere en menos de 4 libras de X

Ejercicio:

Una empresa eléctrica fabrica focos y desea estimar la duración promedio de sus bombillos.

a) Cuál debe ser el tamaño de muestra de un lote de 5000 unidades, para un 96% de confianza que la media real esté dentro de 20 horas de la media muestral, si la desviación estándar del tiempo de duración es de 60 horas?

n=N σ 2Zα /2

2

σ2Zα /22 +(N−1)e2

= 5000∗3600∗2.052

2.052∗1600+(5000−1)102=147

b) Si de la muestra anterior se obtuvo un promedio de duración es de 4500 horas y una desviación estándar de 70, obtenga un intervalo de confianza del 96% para el verdadero promedio de duración.

Trabajo en equipo máximo de 4 alumnos

Estimación para la proporción p

1. Se desea analizar la opinión sobre el nivel de atención en un hospital el cual tiene una cap00acidad para atender a 5000 pacientes.

a) Determine el tamaño de muestra necesario para un nivel de confianza del 95.96% y un error máximo permisible del 3%

b) Si de la muestra anterior el 35% no están satisfechos con la atención, determine un intervalo de confianza del 98,12% para la verdadera proporción de pacientes insatisfechos.

2. Una escuela primaria donde enseñan tres idiomas quiere saber la proporción de madres que preferirían matricular a sus hijos en dicha escuela. Toman al azar una muestra de 100

Page 11: ESTIMACION  2015-02 bbioestadistica lina.docx

hogares con niños y 70 dicen que si matricularían a su hijos en esa escuela. Calcula un intervalo de confianza del 95% para la verdadera proporción de madres que preferirían la escuela.

3. Se selecciona una muestra preliminar de 200 familias en una ciudad y se encuentra que 20 de ellas conocen en forma aceptable las comunicaciones por Internet.a) Cuál es el tamaño de muestra si el N.C es del 93.72% y el margen de error es del 2%b) Si del n calculado en el numeral anterior 500 familias conocen en forma aceptable las

comunicaciones por Internet, determine un I. de C. del 96.16% para el verdadero porcentaje de familias que conocen las comunicaciones vía Internet

4. Una empresa de 3500 trabajadores desea estimar el porcentaje de trabajadores que están totalmente a gusto con su trabajo.

c) Determine el tamaño de muestra necesario para un N.C. del 98.54% y un error máximo permisible del 4%

d) Si de la muestra calculada 40 trabajadores no están a gusto, determine un intervalo de confianza para la verdadera proporción de trabajadores que no están a gusto para un N.C. del 95.86 %

5. Sólo una parte de las escuelas de primaria cumplen con la norma técnica ISO 14000; Si de 64 escuelas observadas 41 cumplen con la norma, obtenga un I de C del 94% para la proporción de escuelas que cumplen con la norma. ¿Qué número de escuelas habría que observar con un error inferior a 0,05 y una confianza del 95%?

6.

Intervalo de confianza para la Media

1. Una muestra aleatoria de 36 cigarrillos de una determinada marca dio un contenido promedio de nicotina de 3 miligramos y una desviación estándar de 1 miligramo.a) Obtenga e intérprete un intervalo de confianza del 96,6% para el verdadero contenido

promedio de nicotina en estos cigarrillos.b) El fabricante garantiza que el contenido promedio de nicotina es 2.5 miligramos, ¿qué

puede decirse de acuerdo con el intervalo hallado?

2. Los siguientes números representan el tiempo (en minutos) que tardaron 15 operarios en familiarizarse con el manejo de una nueva máquina adquirida por la empresa: 3.4, 2.8, 4.4, 2.5, 3.3, 4, 4.8, 2.9, 5.6, 5.2, 3.7, 3, 3.6, 2.8, 4.8. Supóngase que los tiempos se distribuyen normalmente.a) Determina e interpreta un intervalo del 95% de confianza para el verdadero tiempo

promedio.

Page 12: ESTIMACION  2015-02 bbioestadistica lina.docx

b) El instructor considera que el tiempo promedio requerido por los trabajadores es mayor que 5 minutos, ¿qué se puede decir de acuerdo con el intervalo hallado?

3. La varianza del tiempo empleado en cierta operación de ensamble está registrada con un valor de 16 seg2. Si una muestra de los tiempos de operación arrojo los siguientes resultados: 30, 28, 35, 25, 32, 27, 34, 26 segundos

a) Determine un intervalo de confianza del 90% para el verdadero tiempo promedio b) Con que nivel de confianza la media poblacional estará en el intervalo (27.01 ;

32.24 )

4. De un lote de 5000 unidades se extrae una muestra piloto de 10 aspirinas , de las cuales observamos su peso expresado en gramos, obtenemos:

1,19; 1,23; 1,18; 1,21; 1,27; 1,17; 1,15; 1,14; 1,19; 1,2

Suponiendo la Normalidad para esta distribución de pesos, a) Determinar el verdadero tamaño de muestra para un nivel de confianza del 96% y error permisible del 1.5% de la media muestral

b) Si de la muestra calculada en el numeral anterior se obtuvo una media de 1.2 gramos y una varianza de 0.0015, determine un intervalo de confianza del 93% para el verdadero peso promedio de dichas aspirinas.

7. Una muestra aleatoria de 36 ciudadanos que trabajan en el sector informal de cierto municipio arrojo una media de $ 800.000=y una desviación estándar de $80.000 pesos.c) Obtenga e intérprete un intervalo de confianza del 96,6% para el verdadero salario

promedio.d) El Alcalde garantiza que el salario promedio está por encima $1.100.000 pesos ¿qué

puede decirse de acuerdo con el intervalo hallado?

8. Los siguientes números representan el tiempo (en minutos) que tardaron 15 niños de 10 años en contestar un test de matemáticas: 34, 28, 44, 25, 33, 48, 29, 56, 52, 37, 30, 36, 28, 48. Supóngase que los tiempos se distribuyen normalmente.a) Determina e interpreta un intervalo del 95% de confianza para el verdadero tiempo

promedio.b) El instructor considera que el tiempo promedio requerido por los trabajadores es

mayor que 5 minutos, ¿qué se puede decir de acuerdo con el intervalo hallado?c) Calcule el verdadero tamaño de muestra para un NC del 95% y un error permisible del

3% de la media muestral.

9. El salario es una variable importante en el desarrollo de las competencias de los operarios. Suponga que una muestra de 7 trabajadores arrojo que el valor de los salarios son: 3000,

Page 13: ESTIMACION  2015-02 bbioestadistica lina.docx

3200, 3500, 2800, 2700, 3000, 2900 dólares. Supóngase que los salarios se distribuyen normalmente.

Determine un intervalo de confianza del 94 % para el verdadero promedio de los salarios.

10. En un hospital se tiene registrado un total de 3000 partos por bimestre. Suponga que se seleccionan aleatoriamente 32 mujeres cuyo peso promedio después del parto es de 72 Kilogramos y una desviación estándar de 10 Kg.

a) Determine un intervalo de confianza para el verdadero peso promedio, si el N.C es de 93.72%

b) Con que grado de confianza podrá decirse que la el promedio del peso de las 3000 mujeres está en el intervalo 125 ± 3.1

11. La varianza del tiempo empleado en cierta operación de ensamble está registrada con un valor de 16 seg2. Si una muestra de los tiempos de operación arrojo los siguientes resultados: 30, 28, 35, 25, 32, 27, 34, 26 segundos.

Con que nivel de confianza la media poblacional estará en el intervalo (27.01 ; 32.24 )

RESUMEN

I. de c. para la proporción

pϵ [ p̂ ± Zα /2√ p̂ q̂n ] pϵ [ p̂ ± Zα /2√ p̂ q̂n √ N−nN−1 ]

n con muestra piloto

n=Zα /22 p̂ q̂

e2n=

N Zα /22 p̂ q̂

Zα /22 p̂ q̂+(N−1)e2

n sin muestra piloto

n=Zα /22

4e2n=

N Zα /22

Zα /22 +4 (N−1)e2

Page 14: ESTIMACION  2015-02 bbioestadistica lina.docx

I. de C. para la media

a) Cuando la varianza σ 2 es conocida:

µ ϵ [X ±Z α2 σ√n ]

b) Cuando la varianza σ 2 es desconocida y n>30

µ ϵ [X ±Z α2 S√n ]

c) Cuando la población es finita de tamaño N, varianza σ 2 es conocida:

µ ϵ [X ±Z α2

σ√n √ N−n

N−1 ]

d) Cuando la población es finita de tamaño N, varianza σ 2 es desconocida:

µ ϵ [X ±Z α2

S√n √ N−n

N−1 ]

a) Si la varianza es conocida

e=Z α2

σ√n, luego ,n=[ σ Z α /2e ]

2

b) Varianza desconocida, n>30

Reemplace σ por S en el intervalo anterior

e=Z α2

S√n, luego ,n=[ S Zα /2

e ]2

c) Cuando la población es finita de tamaño N, varianza σ 2 es conocida:

e=Z α2

σ√n √ N−n

N−1 →

n=N σ 2Zα /2

2

σ2Zα /22 +(N−1)e2

d) Cuando la población es finita de tamaño N, varianza σ 2 es desconocida, reemplace σ por S en la expresión c)

e=Z α2

S√n √ N−n

N−1 →

n=N S2Zα /2

2

Zα /22 S2+(N−1)e2

Page 15: ESTIMACION  2015-02 bbioestadistica lina.docx