Diseños de La Muestra
-
Upload
cesar-panizo -
Category
Documents
-
view
26 -
download
0
description
Transcript of Diseños de La Muestra
Índice o tabla de contenidos
• Objetivos,
• Etapas de selección de tamaño de muestra,
• Definición de población de interés
• Definición de procedimiento para selección de la
muestra
• Muestreo Probabilístico
• Muestreo No Probabilístico
• Cálculo de tamaño de muestra
• Factibilidad
Objetivos:
• Revisar aspectos teóricos del muestreo.
• Entender el propósito de muestreo y dar las pautas para
seleccionar muestras
• Entender el rol y métodos para el cálculo de tamaño de
muestra.
¿ Cuáles son las etapas en este proceso
de selección de tamaño de Muestra?
1. Defina la población de interés a la que se
desee generalizar sus resultados.
2. Defina procedimientos para seleccionar la
muestra deseada de esa población.
3. Calcular el tamaño de muestra
4. Evaluar la factibilidad del estudio
20/04/2015 Nombre y apellido del docente.
1. Definiendo la Población de Interés
20/04/2015 Nombre y apellido del docente.
2. Como obtener una muestra de
población: MUESTREO • Técnicas de Muestreo:
• 1. Muestreo Probabilístico:
• Conocemos la probabilidad de que un individuo sea elegido para la
muestra.
• 2. Muestreo No Probabilístico
• No se conoce la probabilidad
• Son muestreos que pueden esconder sesgos
• En principio no se pueden extrapolar resultados a la población
• Pese a ellos muchos estudios publicados usan esta técnica.
20/04/2015 Nombre y apellido del docente.
20/04/2015 Nombre y apellido del docente.
Muestreo Probabilístico
• En este muestreo, toda persona del marco muestral debe
tener una probabilidad definida de ser incluida en el
estudio.
• La selección de sujetos es aleatoria, según la
probabilidad de cada individuo.
20/04/2015 Nombre y apellido del docente.
Muestreo Probabilístico
1. Aleatorio Simple
2. Aleatorio Sistemático
3. Estratificado
4. Por conglomerados, clusters o racimos
20/04/2015 Nombre y apellido del docente.
Muestreo Aleatorio Simple
• Util en poblaciones pequeñas cerradas o bien
enumeradas
• Requiere una lista exhaustiva de todos sus miembros:
prisioneros, alumnos, pacientes, hospitalizados, etc
• Cada participante es seleccionado aleatoriamente por
separado
• Da estimados precisos sin sesgos, pero frecuentemente
es caro y a veces inviable
20/04/2015 Nombre y apellido del docente.
Ejemplos:
• Muestra de 30 alumnos de los seminarios de metodología
de Investigación.
• Preparar lista con todos los alumnos (n = 200)
• Dar # correlativo a cada uno (1 – 200)
• Seleccionar 30 alumnos sin repetición usando la tabla de
#s aleatorios, con los 2 últimos dígitos.
20/04/2015 Nombre y apellido del docente.
Tabla de números aleatorios
20/04/2015 Nombre y apellido del docente.
Muestreo Aleatorio Sistemático
• Similar a aleatorio simple pero mas simple. Util en
poblaciones ordenadas, no necesariamente cerradas.
• Casas organizadas por manzanas, pacientes llegando a
un hospital, etc.
• Primer participante seleccionado aleatoriamente de un
primer bloque, siguiente con salto fijo.
20/04/2015 Nombre y apellido del docente.
Pasos a seguir…
• Obtener un listado de todos
los integrantes de la
población.
• Numerar a todos los
sujetos de la población (o unidades de muestreo).
• Determinar una relación de muestreo denotado por K = N/n
Donde: N= tamaño poblacional y n= tamaño muestral
• Conociendo K, se genera un intervalo de selección comprendido entre 1 y K, incluyendo 1 y K,
• Seleccionar al azar un número: el arranque aleatorio (r). La muestra estará integrada por :
r r+K r+2K r+3K r+4K ......r+(n-1)K
20/04/2015 Nombre y apellido del docente.
Ejemplo:
• Obtener un muestra de 30 alumnos de los seminarios de
metodología de la investigación.
• Utilizar la organización de alumnos en el salón como
marco muestral.
• Tamaño del “salto”, 200/9 = 22.2
• Se randomizará primero sujeto (1 – 22)
• De ahí se avanzará cada 22.2 (22) alumnos.
20/04/2015 Nombre y apellido del docente.
Muestreo Estratificado
• Población tiene estratos (grupos)
heterogéneos entre si y homogéneos
internamente y se muestra cada uno.
• Estrato social, regiones geográficas,
severidad, estado civil, etc.
• Tamaño de muestra de cada estrato
usualmente es el mismo para poder
compararlos. En cada estrato se
muestrea aleatoriamente.
• Mejora la representatividad, puede
reducir error estándar. Puede ser
complejo y costoso.
20/04/2015 Nombre y apellido del docente.
Ejemplo:
• Muestra de 2000 personas de Lima para estimar
aprobación presidencial y compararla entre estratos (A/B,
C, D y E)
• A y B (24%), C (35%), D (29%) y E (13%)
• Muestrea 500 sujetos en cada grupo: estrato C y D
subrepresentados y E sobrerepresentado
• Promedio de los 2000 para calcular la aprobación general
ponderado por tamaño porcentual de cada estrato
20/04/2015 Nombre y apellido del docente.
Muestreo por Conglomerados
• En la población hay muchos subgrupos (conglomerados)
heterogéneos internamente pero homogéneos entre si:
cada subgrupo debe ser una representación del todo.
• Ejem: manzanas, colegios, batallones, etc.
Principalmente en estudios poblacionales.
• Se selecciona solo algunos conglomerados y luego se
muestra al interior de ellos solamente.
• No se buscan inferencias en cada conglomerado, solo al
nivel agregado (total)
• Facilita logística, incrementa variabilidad compensando
con mayor tamaño de muestra.
20/04/2015 Nombre y apellido del docente.
Ejemplo
• Muestra de 60 niños participantes de vaso de leche –
Arequipa (700 comités, todos de igual tamaño aprox.)
• Primero se seleccionará 20 comités de los 700
existentes.
• En cada comité se seleccionará 3 niños
• Hacer estimación con todos los niños juntos sin ponderar.
20/04/2015 Nombre y apellido del docente.
Muestreo no Probabilístico
• Por conveniencia, accidente o azar.
• Muestreo a propósito, se busca cierta población:
• Caso típico
• Muestra de expertos
• Por cuotas en la cantidad de participantes por grupo (proporcional
o no)
• Por heterogeneidad o diversidad
• Basado en participantes (bola de nieve u otros)
20/04/2015 Nombre y apellido del docente.
Muestreo No Probabilístico (cont.)
• También llamadas muestras dirigidas o intencionales.
• Las unidades muestrales no se seleccionan al azar, se basa en el
criterio subjetivo del investigador.
• Con este método no se puede elegir muestras representativas y no
se pueden hacer las inferencias estadísticas respectivas, porque
no se puede cuantificar el error muestral.
• Sólo se puede usar para un estudio preliminar, piloto o exploratorio.
20/04/2015 Nombre y apellido del docente.
Inferencia Estadística
Muestreo
Población (N) Muestra (n)
Muestreo Empírico no Probabilístico Accidental: Ejemplo: Inclusión de los pacientes a medida que van acudiendo a la
consulta.
Por Conveniencia: Ejemplos: un profesor que realiza una investigación en una
universidad puede usar estudiantes voluntarios; los grupos focales.
Por Cuotas: Se fijan unas "cuotas“, número de individuos que reúnen unas
determinadas condiciones.
Ejemplo: Seleccionar 50 estudiantes que hayan cursado el cuarto ciclo de
Medicina Humana y que tengan un promedio mayor de 15. Se eligen a los
primeros 50 que cumplan con estas condiciones.
Se utiliza para realizar encuestas de opinión y mercado.
De Bola de nieve: Los miembros de la población en estudio se conocen entre sí.
Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros,
hasta conseguir una muestra suficiente.
Ejemplo: Cuando se desea estudiar grupos con problemas de alcoholismo,
drogadicción, etc., que son de difícil acceso.
20/04/2015 Nombre y apellido del docente.
3. TAMAÑO DE MUESTRA
20/04/2015 Nombre y apellido del docente.
Calculando el Tamaño de Muestra
• JUSTIFICACIÓN
• Se necesita saber si estudio puede responder
adecuadamente a pregunta de investigación.
• Todo estudio lo requiere, excepto presentación de
casos sin búsqueda de generalización.
• Existen numerosos procedimientos posibles,
dependiendo del diseño de estudio y tipos de variables.
20/04/2015 Nombre y apellido del docente.
Determinar el tamaño de la muestra
• Tamaño del universo
• Homogeneidad-heterogeneidad (estrato)
• Margen de error
• Nivel de confianza
• Diferencia que se espera encontrar
• Recursos disponibles
Son de ayuda los Paquetes Estadísticos
Cuando se conoce N: • N : Tamaño de la población que es objeto de estudio.
• Z : desviación normal cuyo valor corresponde al grado de confianza
establecido.
• ² : Varianza poblacional de la población que es objeto de estudio.
En la práctica se desconoce, para ello se recomienda:
Recurrir a estudios similares que se han realizado y obtener el valor de ².
Realizar un estudio piloto para estimar ².
• E : Error absoluto o precisión de la estimación deseada de la media.
E = Margen de error permitido (determinado por el responsable del estudio).
Es la máxima diferencia que podemos tolerar entre el valor de la variable obtenido en la
muestra y el verdadero valor de ésta en la población. Para establecer el valor de “E”
debemos preguntarnos cuán precisos deseamos que sean los resultados de la investigación.
222
22
σZ1)(NE
NσΖn
TAMAÑO DE MUESTRA
Para estimar una media aritmética
Cuando se conoce N:
Ejemplo: Se busca conocer el colesterol promedio de los estudiantes de la Facultad de
Medicina (Número de estudiantes= 1800). Calcular el tamaño muestral (n)
considerando un grado de confianza del 95%
• Resultados de un estudio preliminar: x =120, s= 30 y Er= 6%
Solución
• Por definición:
Error relativo: Por consiguiente:
• Como el grado de confianza es 95%, Z=1.96
• Para realizar el estudio se requiere como mínimo 22 estudiantes de la Facultad de
Medicina considerando un grado de confianza de 95% y un error absoluto de 12.6.
222
22
σZ1)(NE
NσΖn
100xE
Er 12.6100
1206 EE
xr 100
x
222
22
301.96179912.6
1800301.96
21.53
TAMAÑO DE MUESTRA
Para estimar una media aritmética
Cuando NO se conoce N:
Ejemplo: Se desea estimar el tiempo medio de sangría en fumadores de más de 20
cigarrillos diarios, con edades comprendidas entre 35 y 40 años, con una precisión
de 5 segundos. Ante la ausencia de cualquier información acerca de la variabilidad
del tiempo de sangría es este tipo de individuos, se tomó una muestra preliminar de
5 individuos, en los que se obtuvieron los siguientes tiempos (en segundos):
97, 80, 67, 91, 73.
Determinar el tamaño mínimo de muestra, al 95%, para cumplir el objetivo anterior.
Solución:
• Z=1.96
• s=12.4
• E=5
• Se necesita una muestra de 24 fumadores de más de 20 cigarrillos diarios, con
edades comprendidas entre 35 y 40 años considerando un grado de confianza de
95% y un error absoluto de 5.
2
22
E
σΖn
2
22
E
σΖn
TAMAÑO DE MUESTRA
Para estimar una media aritmética
2423.632
22
5
12.41.96 x
Cuando se conoce N:
Donde :
• N: Tamaño de la población que es objeto de estudio.
• Z : desviación normal cuyo valor corresponde al grado de confianza establecido
• p: proporción de unidades que poseen el atributo de interés en la población.
En la práctica, este valor se desconoce. Para determinarlo se recomienda:
Recurrir a estudios similares realizados y extraer el valor de p.
En caso de no haber antecedentes, se recurre a un estudio piloto.
En caso contrario, se recurre a la máxima varianza, cuando p=0.5.
• q : 1 – p
• E: Error absoluto o precisión de la estimación de la proporción. Por lo general el
valor que asume es 0.05.
pqZ1)(NE
pqNΖn
22
2
TAMAÑO DE MUESTRA
Para estimar una proporción
Nivel de confianza 90% 95% 99%
Z 1.64 1.96 2.57
Cuando se conoce N: Ejemplo: Se desea conocer la proporción de estudiantes que fuman
cigarrillos en la Facultad de Medicina de la USMP (Número de estudiantes
= 1700). Calcular el tamaño de muestra considerando un grado de
confianza del 99%. De un estudio preliminar se ha determinado que la
proporción de alumnos que fuman cigarrillos es de p=0.40. El error absoluto
que se toma en cuenta es de E=0.05
Solución:
• Z=2.57
• p=0.4
• E=0.05
• Se requiere para ejecutar el estudio por lo menos 462 estudiantes que
fuman cigarrillos, con un grado de confianza del 99% y precisión del 5%.
4620.60.42.5716990.05
17000.60.42.57
pqZ1)(NE
pqNΖn
xxx
xxx
22
2
22
2
TAMAÑO DE MUESTRA
Para estimar una proporción
Cuando se conoce N:
Ejemplo: Se desea conocer la proporción de estudiantes del primer al sétimo
año sobre la satisfacción en la atención de tutorías en la Facultad de
Medicina de la USMP (Número de estudiantes = 2607) durante el año 2013.
Calcular el tamaño de muestra proporcional al año de estudio, considerando
un grado de confianza del 95% y un error absoluto de 0.05.
Población de estudiantes por año de estudios 2013
TAMAÑO DE MUESTRA
Para estimar una proporción
AÑO DE
ESTUDIO
2013
1 2 3 4 5 6 7 TOTAL
ESTUDIANTES 417 455 500 343 344 234 314 2607
Cuando se conoce N: Solución:
• Z=1.96 ; p=0.5 ; E=0.05
• Para la selección de los estudiantes para integrar la muestra se determina la
afijación proporcional, ni = Ni * (n/N), es decir:
• Se requiere para ejecutar el estudio por lo menos 335 estudiantes, con un
grado de confianza del 99% y precisión del 5%.
3350.50.51.961)-(26070.05
26070.50.51.96
pqZ1)(NE
pqNΖn
xxx
xxx
22
2
22
2
TAMAÑO DE MUESTRA
Para estimar una proporción
AÑO DE ESTUDIO
20131 2 3 4 5 6 7 TOTAL
ESTUDIANTES: Ni 417 455 500 343 344 234 314 N=2607
MUESTRA: ni 55 58 64 44 44 30 40 n=335
Cuando NO se conoce N:
Ejemplo: Un investigador está interesado en estimar la proporción de
muertes debidas a cáncer de estómago en relación con el número de
defunciones por cualquier tipo de neoplasia. Su experiencia le indica que
sería sorprendente que tal proporción supere el valor de 1/3. ¿Qué
tamaño de muestra debe tomar para estimar la anterior proporción, con
una confianza del 95%, para que el valor estimado no difiera del valor real
en más de 0,03?
Solución:
• Z=1.96
• p=1/3
• E=0.03
• Se necesita una muestra de 949 defunciones por cualquier tipo de
neoplasia considerando un grado de confianza de 95% y un error
absoluto de 0.03.
2
2
E
pqΖn
949948.540.03
2/31/31.96
E
pqΖn
2
2
2
2xx
TAMAÑO DE MUESTRA
Para estimar una proporción
4. Evaluando la Factibilidad
• Rechazos y Ausencias son Inevitables
• Deberían ser poco frecuentes y no llevar a sesgos
• Es deseable estimar/medir estos posibles sesgos.
• El tamaño de muestra calculado es el número de sujetos
necesarios para el análisis.
• El tamaño de muestra total debe incluir perdidas por falta
de elegibilidad, rechazos, falla en el seguimiento y datos
erróneos.
• Esto determina la factibilidad del estudio
21/04/2015 Nombre y apellido del docente.
Factibilidad
Estadío Parámetro Personas Condición
Muestra final Fórmula 90 A analizar
Considerando
perdidas en el
seguimiento
10% de perdidas 90/0.9 = 100 A enrolar
Considerando
rechazos o
ausencias
20% de
rechazos 100 / 0.8 = 125 A invitar
Considerando
elegibilidad 20% elegible 125 / 0.2 = 625 A evaluar
21/04/2015 Nombre y apellido del docente.
Finalmente, ¿qué debo escribir en mi
propuesta? • Definir cual será el universo, marco muestral y
procedimientos de muestreo.
• Tamaño de muestra estimado, fórmula y justificación de
parámetros usados (prevalencia, precisión, etc).
• Factibilidad: capacidad de enrolar, % de perdidas
esperado y número de sujetos disponibles por día.
21/04/2015 Nombre y apellido del docente.
Fuentes de información
• Fuentes Bibliográficas:
• Hernández Sampieri, Roberto. Metodología de la
Investigación. Quinta edición.
• Adaptación de clases de Willy Lescano – Maestría de
Investigación Epidemiológica UPCH – NAMRU-6