Diseños de La Muestra

38
DISEÑOS DE LA MUESTRA Elena Tapia López [email protected] Metodología de la Investigación

description

diseño de muestra metodologia

Transcript of Diseños de La Muestra

Page 1: Diseños de La Muestra

DISEÑOS DE LA

MUESTRA Elena Tapia López

[email protected]

Metodología de la Investigación

Page 2: Diseños de La Muestra

Índice o tabla de contenidos

• Objetivos,

• Etapas de selección de tamaño de muestra,

• Definición de población de interés

• Definición de procedimiento para selección de la

muestra

• Muestreo Probabilístico

• Muestreo No Probabilístico

• Cálculo de tamaño de muestra

• Factibilidad

Page 3: Diseños de La Muestra

Objetivos:

• Revisar aspectos teóricos del muestreo.

• Entender el propósito de muestreo y dar las pautas para

seleccionar muestras

• Entender el rol y métodos para el cálculo de tamaño de

muestra.

Page 4: Diseños de La Muestra

¿ Cuáles son las etapas en este proceso

de selección de tamaño de Muestra?

1. Defina la población de interés a la que se

desee generalizar sus resultados.

2. Defina procedimientos para seleccionar la

muestra deseada de esa población.

3. Calcular el tamaño de muestra

4. Evaluar la factibilidad del estudio

20/04/2015 Nombre y apellido del docente.

Page 5: Diseños de La Muestra

1. Definiendo la Población de Interés

20/04/2015 Nombre y apellido del docente.

Page 6: Diseños de La Muestra

2. Como obtener una muestra de

población: MUESTREO • Técnicas de Muestreo:

• 1. Muestreo Probabilístico:

• Conocemos la probabilidad de que un individuo sea elegido para la

muestra.

• 2. Muestreo No Probabilístico

• No se conoce la probabilidad

• Son muestreos que pueden esconder sesgos

• En principio no se pueden extrapolar resultados a la población

• Pese a ellos muchos estudios publicados usan esta técnica.

20/04/2015 Nombre y apellido del docente.

Page 7: Diseños de La Muestra

20/04/2015 Nombre y apellido del docente.

Page 8: Diseños de La Muestra

Muestreo Probabilístico

• En este muestreo, toda persona del marco muestral debe

tener una probabilidad definida de ser incluida en el

estudio.

• La selección de sujetos es aleatoria, según la

probabilidad de cada individuo.

20/04/2015 Nombre y apellido del docente.

Page 9: Diseños de La Muestra

Muestreo Probabilístico

1. Aleatorio Simple

2. Aleatorio Sistemático

3. Estratificado

4. Por conglomerados, clusters o racimos

20/04/2015 Nombre y apellido del docente.

Page 10: Diseños de La Muestra

Muestreo Aleatorio Simple

• Util en poblaciones pequeñas cerradas o bien

enumeradas

• Requiere una lista exhaustiva de todos sus miembros:

prisioneros, alumnos, pacientes, hospitalizados, etc

• Cada participante es seleccionado aleatoriamente por

separado

• Da estimados precisos sin sesgos, pero frecuentemente

es caro y a veces inviable

20/04/2015 Nombre y apellido del docente.

Page 11: Diseños de La Muestra

Ejemplos:

• Muestra de 30 alumnos de los seminarios de metodología

de Investigación.

• Preparar lista con todos los alumnos (n = 200)

• Dar # correlativo a cada uno (1 – 200)

• Seleccionar 30 alumnos sin repetición usando la tabla de

#s aleatorios, con los 2 últimos dígitos.

20/04/2015 Nombre y apellido del docente.

Page 12: Diseños de La Muestra

Tabla de números aleatorios

20/04/2015 Nombre y apellido del docente.

Page 13: Diseños de La Muestra

Muestreo Aleatorio Sistemático

• Similar a aleatorio simple pero mas simple. Util en

poblaciones ordenadas, no necesariamente cerradas.

• Casas organizadas por manzanas, pacientes llegando a

un hospital, etc.

• Primer participante seleccionado aleatoriamente de un

primer bloque, siguiente con salto fijo.

20/04/2015 Nombre y apellido del docente.

Page 14: Diseños de La Muestra

Pasos a seguir…

• Obtener un listado de todos

los integrantes de la

población.

• Numerar a todos los

sujetos de la población (o unidades de muestreo).

• Determinar una relación de muestreo denotado por K = N/n

Donde: N= tamaño poblacional y n= tamaño muestral

• Conociendo K, se genera un intervalo de selección comprendido entre 1 y K, incluyendo 1 y K,

• Seleccionar al azar un número: el arranque aleatorio (r). La muestra estará integrada por :

r r+K r+2K r+3K r+4K ......r+(n-1)K

20/04/2015 Nombre y apellido del docente.

Page 15: Diseños de La Muestra

Ejemplo:

• Obtener un muestra de 30 alumnos de los seminarios de

metodología de la investigación.

• Utilizar la organización de alumnos en el salón como

marco muestral.

• Tamaño del “salto”, 200/9 = 22.2

• Se randomizará primero sujeto (1 – 22)

• De ahí se avanzará cada 22.2 (22) alumnos.

20/04/2015 Nombre y apellido del docente.

Page 16: Diseños de La Muestra

Muestreo Estratificado

• Población tiene estratos (grupos)

heterogéneos entre si y homogéneos

internamente y se muestra cada uno.

• Estrato social, regiones geográficas,

severidad, estado civil, etc.

• Tamaño de muestra de cada estrato

usualmente es el mismo para poder

compararlos. En cada estrato se

muestrea aleatoriamente.

• Mejora la representatividad, puede

reducir error estándar. Puede ser

complejo y costoso.

20/04/2015 Nombre y apellido del docente.

Page 17: Diseños de La Muestra

Ejemplo:

• Muestra de 2000 personas de Lima para estimar

aprobación presidencial y compararla entre estratos (A/B,

C, D y E)

• A y B (24%), C (35%), D (29%) y E (13%)

• Muestrea 500 sujetos en cada grupo: estrato C y D

subrepresentados y E sobrerepresentado

• Promedio de los 2000 para calcular la aprobación general

ponderado por tamaño porcentual de cada estrato

20/04/2015 Nombre y apellido del docente.

Page 18: Diseños de La Muestra

Muestreo por Conglomerados

• En la población hay muchos subgrupos (conglomerados)

heterogéneos internamente pero homogéneos entre si:

cada subgrupo debe ser una representación del todo.

• Ejem: manzanas, colegios, batallones, etc.

Principalmente en estudios poblacionales.

• Se selecciona solo algunos conglomerados y luego se

muestra al interior de ellos solamente.

• No se buscan inferencias en cada conglomerado, solo al

nivel agregado (total)

• Facilita logística, incrementa variabilidad compensando

con mayor tamaño de muestra.

20/04/2015 Nombre y apellido del docente.

Page 19: Diseños de La Muestra

Ejemplo

• Muestra de 60 niños participantes de vaso de leche –

Arequipa (700 comités, todos de igual tamaño aprox.)

• Primero se seleccionará 20 comités de los 700

existentes.

• En cada comité se seleccionará 3 niños

• Hacer estimación con todos los niños juntos sin ponderar.

20/04/2015 Nombre y apellido del docente.

Page 20: Diseños de La Muestra

Muestreo no Probabilístico

• Por conveniencia, accidente o azar.

• Muestreo a propósito, se busca cierta población:

• Caso típico

• Muestra de expertos

• Por cuotas en la cantidad de participantes por grupo (proporcional

o no)

• Por heterogeneidad o diversidad

• Basado en participantes (bola de nieve u otros)

20/04/2015 Nombre y apellido del docente.

Page 21: Diseños de La Muestra

Muestreo No Probabilístico (cont.)

• También llamadas muestras dirigidas o intencionales.

• Las unidades muestrales no se seleccionan al azar, se basa en el

criterio subjetivo del investigador.

• Con este método no se puede elegir muestras representativas y no

se pueden hacer las inferencias estadísticas respectivas, porque

no se puede cuantificar el error muestral.

• Sólo se puede usar para un estudio preliminar, piloto o exploratorio.

20/04/2015 Nombre y apellido del docente.

Inferencia Estadística

Muestreo

Población (N) Muestra (n)

Page 22: Diseños de La Muestra

Muestreo Empírico no Probabilístico Accidental: Ejemplo: Inclusión de los pacientes a medida que van acudiendo a la

consulta.

Por Conveniencia: Ejemplos: un profesor que realiza una investigación en una

universidad puede usar estudiantes voluntarios; los grupos focales.

Por Cuotas: Se fijan unas "cuotas“, número de individuos que reúnen unas

determinadas condiciones.

Ejemplo: Seleccionar 50 estudiantes que hayan cursado el cuarto ciclo de

Medicina Humana y que tengan un promedio mayor de 15. Se eligen a los

primeros 50 que cumplan con estas condiciones.

Se utiliza para realizar encuestas de opinión y mercado.

De Bola de nieve: Los miembros de la población en estudio se conocen entre sí.

Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros,

hasta conseguir una muestra suficiente.

Ejemplo: Cuando se desea estudiar grupos con problemas de alcoholismo,

drogadicción, etc., que son de difícil acceso.

20/04/2015 Nombre y apellido del docente.

Page 23: Diseños de La Muestra

3. TAMAÑO DE MUESTRA

20/04/2015 Nombre y apellido del docente.

Page 24: Diseños de La Muestra

Calculando el Tamaño de Muestra

• JUSTIFICACIÓN

• Se necesita saber si estudio puede responder

adecuadamente a pregunta de investigación.

• Todo estudio lo requiere, excepto presentación de

casos sin búsqueda de generalización.

• Existen numerosos procedimientos posibles,

dependiendo del diseño de estudio y tipos de variables.

20/04/2015 Nombre y apellido del docente.

Page 25: Diseños de La Muestra

Determinar el tamaño de la muestra

• Tamaño del universo

• Homogeneidad-heterogeneidad (estrato)

• Margen de error

• Nivel de confianza

• Diferencia que se espera encontrar

• Recursos disponibles

Son de ayuda los Paquetes Estadísticos

Page 26: Diseños de La Muestra

Cuando se conoce N: • N : Tamaño de la población que es objeto de estudio.

• Z : desviación normal cuyo valor corresponde al grado de confianza

establecido.

• ² : Varianza poblacional de la población que es objeto de estudio.

En la práctica se desconoce, para ello se recomienda:

Recurrir a estudios similares que se han realizado y obtener el valor de ².

Realizar un estudio piloto para estimar ².

• E : Error absoluto o precisión de la estimación deseada de la media.

E = Margen de error permitido (determinado por el responsable del estudio).

Es la máxima diferencia que podemos tolerar entre el valor de la variable obtenido en la

muestra y el verdadero valor de ésta en la población. Para establecer el valor de “E”

debemos preguntarnos cuán precisos deseamos que sean los resultados de la investigación.

222

22

σZ1)(NE

NσΖn

TAMAÑO DE MUESTRA

Para estimar una media aritmética

Page 27: Diseños de La Muestra

Cuando se conoce N:

Ejemplo: Se busca conocer el colesterol promedio de los estudiantes de la Facultad de

Medicina (Número de estudiantes= 1800). Calcular el tamaño muestral (n)

considerando un grado de confianza del 95%

• Resultados de un estudio preliminar: x =120, s= 30 y Er= 6%

Solución

• Por definición:

Error relativo: Por consiguiente:

• Como el grado de confianza es 95%, Z=1.96

• Para realizar el estudio se requiere como mínimo 22 estudiantes de la Facultad de

Medicina considerando un grado de confianza de 95% y un error absoluto de 12.6.

222

22

σZ1)(NE

NσΖn

100xE

Er 12.6100

1206 EE

xr 100

x

222

22

301.96179912.6

1800301.96

21.53

TAMAÑO DE MUESTRA

Para estimar una media aritmética

Page 28: Diseños de La Muestra

Cuando NO se conoce N:

Ejemplo: Se desea estimar el tiempo medio de sangría en fumadores de más de 20

cigarrillos diarios, con edades comprendidas entre 35 y 40 años, con una precisión

de 5 segundos. Ante la ausencia de cualquier información acerca de la variabilidad

del tiempo de sangría es este tipo de individuos, se tomó una muestra preliminar de

5 individuos, en los que se obtuvieron los siguientes tiempos (en segundos):

97, 80, 67, 91, 73.

Determinar el tamaño mínimo de muestra, al 95%, para cumplir el objetivo anterior.

Solución:

• Z=1.96

• s=12.4

• E=5

• Se necesita una muestra de 24 fumadores de más de 20 cigarrillos diarios, con

edades comprendidas entre 35 y 40 años considerando un grado de confianza de

95% y un error absoluto de 5.

2

22

E

σΖn

2

22

E

σΖn

TAMAÑO DE MUESTRA

Para estimar una media aritmética

2423.632

22

5

12.41.96 x

Page 29: Diseños de La Muestra

Cuando se conoce N:

Donde :

• N: Tamaño de la población que es objeto de estudio.

• Z : desviación normal cuyo valor corresponde al grado de confianza establecido

• p: proporción de unidades que poseen el atributo de interés en la población.

En la práctica, este valor se desconoce. Para determinarlo se recomienda:

Recurrir a estudios similares realizados y extraer el valor de p.

En caso de no haber antecedentes, se recurre a un estudio piloto.

En caso contrario, se recurre a la máxima varianza, cuando p=0.5.

• q : 1 – p

• E: Error absoluto o precisión de la estimación de la proporción. Por lo general el

valor que asume es 0.05.

pqZ1)(NE

pqNΖn

22

2

TAMAÑO DE MUESTRA

Para estimar una proporción

Nivel de confianza 90% 95% 99%

Z 1.64 1.96 2.57

Page 30: Diseños de La Muestra

Cuando se conoce N: Ejemplo: Se desea conocer la proporción de estudiantes que fuman

cigarrillos en la Facultad de Medicina de la USMP (Número de estudiantes

= 1700). Calcular el tamaño de muestra considerando un grado de

confianza del 99%. De un estudio preliminar se ha determinado que la

proporción de alumnos que fuman cigarrillos es de p=0.40. El error absoluto

que se toma en cuenta es de E=0.05

Solución:

• Z=2.57

• p=0.4

• E=0.05

• Se requiere para ejecutar el estudio por lo menos 462 estudiantes que

fuman cigarrillos, con un grado de confianza del 99% y precisión del 5%.

4620.60.42.5716990.05

17000.60.42.57

pqZ1)(NE

pqNΖn

xxx

xxx

22

2

22

2

TAMAÑO DE MUESTRA

Para estimar una proporción

Page 31: Diseños de La Muestra

Cuando se conoce N:

Ejemplo: Se desea conocer la proporción de estudiantes del primer al sétimo

año sobre la satisfacción en la atención de tutorías en la Facultad de

Medicina de la USMP (Número de estudiantes = 2607) durante el año 2013.

Calcular el tamaño de muestra proporcional al año de estudio, considerando

un grado de confianza del 95% y un error absoluto de 0.05.

Población de estudiantes por año de estudios 2013

TAMAÑO DE MUESTRA

Para estimar una proporción

AÑO DE

ESTUDIO

2013

1 2 3 4 5 6 7 TOTAL

ESTUDIANTES 417 455 500 343 344 234 314 2607

Page 32: Diseños de La Muestra

Cuando se conoce N: Solución:

• Z=1.96 ; p=0.5 ; E=0.05

• Para la selección de los estudiantes para integrar la muestra se determina la

afijación proporcional, ni = Ni * (n/N), es decir:

• Se requiere para ejecutar el estudio por lo menos 335 estudiantes, con un

grado de confianza del 99% y precisión del 5%.

3350.50.51.961)-(26070.05

26070.50.51.96

pqZ1)(NE

pqNΖn

xxx

xxx

22

2

22

2

TAMAÑO DE MUESTRA

Para estimar una proporción

AÑO DE ESTUDIO

20131 2 3 4 5 6 7 TOTAL

ESTUDIANTES: Ni 417 455 500 343 344 234 314 N=2607

MUESTRA: ni 55 58 64 44 44 30 40 n=335

Page 33: Diseños de La Muestra

Cuando NO se conoce N:

Ejemplo: Un investigador está interesado en estimar la proporción de

muertes debidas a cáncer de estómago en relación con el número de

defunciones por cualquier tipo de neoplasia. Su experiencia le indica que

sería sorprendente que tal proporción supere el valor de 1/3. ¿Qué

tamaño de muestra debe tomar para estimar la anterior proporción, con

una confianza del 95%, para que el valor estimado no difiera del valor real

en más de 0,03?

Solución:

• Z=1.96

• p=1/3

• E=0.03

• Se necesita una muestra de 949 defunciones por cualquier tipo de

neoplasia considerando un grado de confianza de 95% y un error

absoluto de 0.03.

2

2

E

pqΖn

949948.540.03

2/31/31.96

E

pqΖn

2

2

2

2xx

TAMAÑO DE MUESTRA

Para estimar una proporción

Page 34: Diseños de La Muestra

4. Evaluando la Factibilidad

• Rechazos y Ausencias son Inevitables

• Deberían ser poco frecuentes y no llevar a sesgos

• Es deseable estimar/medir estos posibles sesgos.

• El tamaño de muestra calculado es el número de sujetos

necesarios para el análisis.

• El tamaño de muestra total debe incluir perdidas por falta

de elegibilidad, rechazos, falla en el seguimiento y datos

erróneos.

• Esto determina la factibilidad del estudio

21/04/2015 Nombre y apellido del docente.

Page 35: Diseños de La Muestra

Factibilidad

Estadío Parámetro Personas Condición

Muestra final Fórmula 90 A analizar

Considerando

perdidas en el

seguimiento

10% de perdidas 90/0.9 = 100 A enrolar

Considerando

rechazos o

ausencias

20% de

rechazos 100 / 0.8 = 125 A invitar

Considerando

elegibilidad 20% elegible 125 / 0.2 = 625 A evaluar

21/04/2015 Nombre y apellido del docente.

Page 36: Diseños de La Muestra

Finalmente, ¿qué debo escribir en mi

propuesta? • Definir cual será el universo, marco muestral y

procedimientos de muestreo.

• Tamaño de muestra estimado, fórmula y justificación de

parámetros usados (prevalencia, precisión, etc).

• Factibilidad: capacidad de enrolar, % de perdidas

esperado y número de sujetos disponibles por día.

21/04/2015 Nombre y apellido del docente.

Page 37: Diseños de La Muestra

Fuentes de información

• Fuentes Bibliográficas:

• Hernández Sampieri, Roberto. Metodología de la

Investigación. Quinta edición.

• Adaptación de clases de Willy Lescano – Maestría de

Investigación Epidemiológica UPCH – NAMRU-6

Page 38: Diseños de La Muestra