Muestra y muestreo. EPIDAT

Post on 24-Jun-2015

9.659 views 1 download

Transcript of Muestra y muestreo. EPIDAT

Cálculos Muestra y Muestreo

Dr. Cristian Díaz VélezEditor Científico de Revista Cuerpo Médico Hospital Nacional Almanzor Aguinaga AsenjoMiembro del comité Científico. Revista Acta Médica Peruana del Colegio Médico del Perú y Revista Médica de Risaralda, Universidad Tecnológica de Pereira-Colombia.

MUESTRA

En las investigaciones muchas veces es imprescindible realizar un cálculo de tamaño de muestra para saber la precisión o la potencia del estudio.

Conceptos primarios

►Población ►Muestra ►Parámetro ►Estadístico ►Varianza poblacional ►Inferencia estadística►Error muestral o Tolerancia de error►Nivel de confianza.

Conceptos primarios

►Población: conjunto de individuos o elementos que cumplen ciertas propiedades comunes.

►Muestra: subconjunto representativo de una población.

Conceptos primarios

►Parámetro : Son las medidas o datos que se obtienen sobre la distribución de probabilidades de la población, tales como la media, la varianza, la proporción, etc.

►Estadístico. Los datos o medidas que se obtienen sobre una muestra y por lo tanto una estimación de los parámetros, es decir es igual al parámetro pero de la muestra.

Conceptos primarios

►Varianza Poblacional. Cuando una población es más homogénea la varianza es menor. Generalmente es un valor desconocido y hay que estimarlo a partir de datos de estudios previos.

►Inferencia estadística. Inferencias acerca de la población a partir de una muestra extraída de la población.

Conceptos primarios

►Error Muestral o Tolerancia de error: de estimación o estándar. Es la diferencia entre un estadístico y su parámetro correspondiente. Generalmente 5%, en estudios con fármacos 1%. La tolerancia debe ir de la mano de la prevalencia del estudio en cuestión.

►Nivel de Confianza. Probabilidad de que la estimación efectuada se ajuste a la realidad.

Conceptos primarios

►Ejemplo:Si por ejemplo estudiamos la prevalencia de asma bronquial en un estudio donde se cálculo la muestra con tolerancia de error del 5% y nivel de significancia del 95% y se encontró que la prevalencia es de 20%.

Interpretación: hay un 95% de probabilidad que la prevalencia real este entre 15 y 25%.

Que ocurre si las prevalencias son muy bajas, por ejemplo 2%??

Factores que influyen

►Tipo de diseño.►Tipo de muestreo utilizado.►Comparación de muestras independientes o pareadas.

Circulo vicioso del cálculo

Cálculo muestral

Frecuencia del Problema en estudio

La frecuencia se obtendrá en el estudio

x%rOR

Muestra para la media de población

El nivel de confianza o seguridad (1-α). El nivel de confianza prefijado da lugar a un coeficiente (Zα). Para una seguridad del 95% = 1.96; para una seguridad del 99% = 2.58.d : error máximo permisible o Tolerancia de error (mayormente 5%)S2: varianza poblacional

Población conocida Población no conocida

Las variables son numéricas

Muestra para la media de población

es la varianza de la población.

es la varianza de la muestra, la cual podrá determinarse en términos de probabilidad como

es error estándar que está dado por la diferencia entre () la media poblacional y la media muestral.

es el error estándar al cuadrado, que nos servirá para determinar , por lo que = es la varianza poblacional.

Variables Nominales

siendo

Muestra para la media de población

►Ejemplo:En un área sanitaria, la distribución del peso al nacer de niños que cumplen su período de gestación de 40 sem. es aproxim. normal con una media de m=3500 g. y una DS=430 g. Un investigador planea llevar a cabo un estudio para estimar el peso medio al nacer de los niños que llegan al término del embarazo y cuyas madres fumaron durante ese período, asumiendo que la DS es la misma. Si el investigador desea que el error (precisión) sea de 50 g con una confianza del 95%, ¿qué tamaño de muestra se requiere en este estudio?

Muestra para la proporción de población

n: Tamaño muestralN: Tamaño de la población, número total de historias.Z: Valor correspondiente a la distribución de Gauss 1,96 para α =0,05 p: Prevalencia del fenómeno en estudio.Q: 1-p“i” o “d”: Tolerancia de error (mayormente 5%)*.

•Si las prevalencias son bajas, las tolerancias de error lo debe ser aun más. Ejemplo de la tasa de prevalencia, se puede suponer que la proporción que ha de estimarse se moverá probablemente entre un 5% y un 15%, y es razonable aspirar a que no se incurra en un error mayor del 1%.

Población conocida Población no conocida

Las variables son nominales

Muestra para la proporción de población

• Si la seguridad Zα fuese del 90% el coeficiente sería 1.645• Si la seguridad Zα fuese del 95% el coeficiente sería 1.96• Si la seguridad Zα fuese del 97.5% el coeficiente sería 2.24• Si la seguridad Zα fuese del 99% el coeficiente sería 2.576

Muestra para la proporción de población

En estudio se quiere identificar las frecuencia de retención de restos placentarios como parte de la morbilidad materna extrema durante el embarazo, parto y puerperio en los hospitales MINSA- Lambayeque, en el periodo 1°enero 2010-31°diciembre 2011. Si se desea trabajar con una precisión del 3%, nivel de confianza del 95%, y se sabe que según estudios previos la proporción de restos placentarios es 15%. Calcule la muestra necesaria para el estudio.

Cálculo del tamaño muestra en estudios de casos y controles

p2: probabilidad de exposición entre los controlesW: es el OR previsto P1: la frecuencia de exposición entre los casos,

Así, el problema del cálculo del tamaño muestral podrá abordarse mediante las fórmulas habituales empleadas en la comparación de dos proporciones, asumiendo aquí que las proporciones esperadas son p1 y p2

Cálculo del tamaño muestra en estudios de casos y controles

p1: La frecuencia de la exposición entre los casos.p2: La frecuencia de la exposición entre los controles.α : La seguridad con la que se desea trabajar, o riesgo de cometer un error de tipo I. Generalmente se trabaja con una seguridad del 95% (α = 0,05).1-β: El poder estadístico que se quiere para el estudio, o riesgo de cometer un error de tipo II. Es habitual tomar β = 0,2, es decir, un poder del 80%.

Cálculo del tamaño muestra en estudios de casos y controles

son valores que se obtienen de la distribución normal estándar en función dela seguridad y el poder elegidos para el estudio. En particular, para una seguridad de un 95% y un poder estadístico del 80% se tiene que.

Donde:

Cálculo del tamaño muestra en estudios de casos y controles

n = número de sujetos sin pérdidasR = proporción esperada de pérdidas

Cálculo del tamaño muestra en estudios de casos y controles

►Ejemplo: Un estudio de casos y controles emparejado sobre tabaquismo y cáncer de laringe utilizando controles poblacionales.

►Suponiendo que la prevalencia del hábito tabáquico en la población es del 45% y que el OR esperado es aproximadamente es 3

►¿cuántos pares de casos y controles necesitará para estimar el OR con una potencia de 80% y un nivel de confianza del 95%?

Cálculo del tamaño muestra en estudios de Cohortes

n : sujetos necesarios en cada una de las muestrasZα : Valor Z correspondiente al riesgo deseadoZβ : Valor Z correspondiente al riesgo deseadoS2 : Varianza de la variable cuantitativa que tiene el grupo control o de referencia.d : Valor mínimo de la diferencia que se desea detectar (datos cuantitativos).

Cálculo del tamaño muestra en estudios de Cohortes

►Un epidemiólogo proyecta un estudio sobre la posibilidad de que cierta enfermedad pulmonar esté favorecida por la exposición a un contaminante atmosférico recién detectado cuyo efecto no ha sido examinado previamente.

►¿Qué tamaño tendrá que tener la muestra de cada grupo (el de expuestos y el de no expuestos) si se desea estimar el riesgo relativo con una potencia 80% y un 95% de confianza?

►La enfermedad se manifiesta en el 20% de las personas no expuestas y 30% en las expuestas al contaminante atmosférico y los dos grupos serán de igual tamaño.

Tamaño muestra del coeficiente correlación lineal

Siendo el error estándar de z aproximadamente igual a

r: magnitud de la correlación que se desea detectar. Esto se obtiene de estudios anteriores entre las dos variables a estudio.1−α: la seguridad con la que se desea trabajar o riesgo de cometer un error de tipo I. Generalmente se trabaja con una seguridad del 95% (α = 0,05 ).1−β: el poder estadístico que se quiere para el estudio, o riesgo de cometer un error de tipo II. Es habitual tomar β = 0,2 o, equivalentemente, un poder estadístico del 80%.

A. Planteamiento bilateral B. Planteamiento Unilateral

Tamaño muestra del coeficiente correlación lineal

Tamaño muestra del coeficiente correlación lineal

se obtienen de la distribución normal estándar en función de la seguridady el poder elegidos para el estudio. En particular, para una seguridad del 95% y un poder estadístico del 80% se tiene que

A

B

Tamaño muestra del coeficiente correlación lineal

►Supóngase que la correlación entre el volumen espiratorio forzado en un segundo y la capacidad vital forzada en individuos sanos es aproximadamente de 0,60.

►Supóngase, adicionalmente, que un grupo de pacientes con una enfermedad de pulmón está accesible en una clínica, e interesa contrastar si hay correlación entre ambas medidas en esos pacientes. Con un nivel de confianza del 95% y una potencia del 90%, ¿cuántos sujetos se necesitan en la muestra?

Ensayos Clínicos

►La formula dependerá del tipo de medida que se este calculando en el ensayo clínico.Ejemplo: un ensayo clínico sobre el uso de una droga en embarazos gemelares, un gineco-obstetra desea demostrar que hay un aumento significativo en la duración del embarazo al usar la droga frente a un placebo. El tocólogo estima que la media de la duración de los embarazos es de 1,75 semanas. ¿Cuántos embarazos debe observar como mínimo en cada grupo si considera que una semana es un aumento clínicamente importante en la duración del embarazo y quiere trabajar con una confianza del 95% y una potencia del 80%?

MUESTREO(Escoger la muestra)

Tipo de Muestreo

Muestreo aleatorio simple

►Es aquel en que cada elemento de la población tiene la misma probabilidad de ser seleccionado para integrar la muestra.

►Existen dos formas de extraer una muestra de una población: con reposición y sin reposición.

Muestreo aleatorio simple

►Muestreo con reemplazo: un elemento puede ser seleccionado más de una vez en la muestra para ello se extrae un elemento de la población se observa y se devuelve a la población, por lo que de esta forma se pueden hacer infinitas extracciones de la población aun siendo esta finita.

►Muestreo sin reemplazo: No se devuelve los elementos extraídos a la población hasta que no se hallan extraídos todos los elementos de la población que conforman la muestra.

Muestreo aleatorio simple

►Ejemplo:Supóngase que se quiere obtener una MAS de 120 descansos médicos de un registro de 973 emitidos durante el mes de diciembre del 2009.

Muestreo sistemático en fases

►También otorga igual probabilidad de integrar la muestra a todas las unidades de análisis de la población.

►Se usa para los casos en los que no se cuenta con una base de datos con el caso del muestreo aleatorio simple.

►Para su calculo se debe saber el tamaño de la población y que porcentaje es la muestra de la población.

Muestreo sistemático en fases

►Ejemplo:Supóngase que se quiere obtener una muestra sistemática que contenga aproximadamente al 12% de los estudiantes de un centro universitario que tiene 966 alumnos registrados.

Muestreo aleatorio estratificado

►Un muestreo aleatorio estratificado es aquel en el que se divide la población de N individuos, en k sub-poblaciones o estratos, atendiendo a criterios que puedan ser importantes en el estudio, de tamaños respectivos.N1, . . . , Nk,

Muestreo aleatorio estratificado

► Ejemplo:Supóngase que se quiere obtener una muestra de 120 estudiantes de un centro universitario que tiene 966 alumnos registrados, distribuidos en cuatro áreas académicas con los siguientes tamaños:Ingeniería:    264Ciencias económicas:  284Ciencias salud:   182Letras:    236

Muestreo por conglomerados monoetápico

►No se pueda disponer de un listado total de las unidades de análisis, solo se sabe de cuantas están conformadas cada unidades de análisis y/o

►Dispersión geográfica de las unidades de análisis a lo largo del territorio en que se halla ubicada la población.

Muestreo por conglomerados monoetápico

►Cuando solo se tienen identificados los conglomerados y sus tamaños; en este caso se debe conformar un archivo con tantos registros como conglomerados, con un campo que identifique el conglomerado y otro campo que contenga su tamaño (número de unidades de que consta).

Muestreo por conglomerados monoetápico

►Ejemplo:Supóngase que se quiere obtener una muestra de aproximadamente 120 estudiantes de un centro universitario que tiene 966 alumnos registrados y que los alumnos están distribuidos en 52 grupos de tamaños variables y conocidos.

Muestreo por conglomerados bietápico

►Este procedimiento de selección muestral se utiliza cuando hay gran variabilidad entre los tamaños de los conglomerados.

►Se usa para escoger más conglomerados, claro esta manteniéndose la misma cantidad de la muestra.

Muestreo por conglomerados bietápico

►Ejemplo:Supóngase que se quiere obtener una muestra de 120 estudiantes de un centro universitario que tiene 966 alumnos registrados. Supóngase además que los alumnos están distribuidos en 52 grupos de tamaños variables y conocidos y que se ha decidido seleccionar 12 de esos grupos, o equivalentemente, 10 alumnos por grupo.

Muestreo por conclomerados bietápico estratificado

►Este procedimiento de selección muestral se utiliza cuando se quiere aplicar un muestreo bietápico pero habiendo separado antes las Unidades de Primera Etapa según estratos.

►Se trata de un método cuyo uso está muy extendido en la práctica.

Muestreo por conclomerados bietápico estratificado

►Ejemplo:Supóngase que se quiere obtener una muestra de 120 estudiantes de un centro universitario que tiene 966 alumnos registrados. Supóngase además que hay cuatro áreas académicas y que en cada una existe cierto número de grupos de alumnos (14, 14, 11 y 13 grupos respectivamente) de modo que los alumnos están distribuidos en 52 grupos de tamaños variables y conocidos. Considérese, finalmente, que se ha decidido seleccionar 12 de esos grupos y 10 alumnos por grupo.

¿DÓNDE EMPIEZA EL PLAGIO DE UN ARTÍCULO

CIENTÍFICO? PROTOCOLO O INFORME FINAL

Dr. Cristian Díaz VélezPresidente del Comité de InvestigaciónHospital Nacional Almanzor Aguinaga Asenjo. Essalud

Resultados

Tabla 02: Frecuencia de plagio protocolos de investigación presentados al comité de investigación de la Red Asistencial Essalud de Lambayeque 2011

Frecuencia N %> 30% 8 7,5%

21%-30% 11 10,4%10%-20% 43 40,6%

< 10% 44 41,5%Total 106 100,0%

Saldaña-Gástulo titulo de Medico Cirujano, 6/33 tesis no se encontraron evidencias de plagio.

Resultados

Tabla 03: Promedio de la frecuencia de plagio según algunas características de filiación en los protocolos de investigación presentados al comité de investigación de la Red Asistencial Essalud de Lambayeque 2011.

CaracterísticasPlagio (%)

XGradoPostgrado 17,69Pregrado 13,68Tipo InvestigaciónCualitativa 14,85Cuantitativa 13,92Diseño InvestigaciónDescriptivo 13,60Analítico 17,42Facultad   Enfermería 16,03Medicina 13,78Psicología 12,40Ingeniería 6,50Motivo Investigación  Tesis Postgrado 13,62Tesis Especialidad 21,75Tesis Pregrado 14,94Pregrado Curso 6,50Pregrado Libre 5,60

Resultados

Tabla 04: Frecuencia de las páginas más usadas para plagio en los protocolos de investigación presentados al comité de investigación de la Red Asistencial Essalud de Lambayeque 2011.

Páginas %http://www.monografias.com 28%Paginas de revistas 25%

http://apuntes.rincondelvago.com 23%http://es.wikipedia.org 20%http://www.alipso.com/ 12%Blogs, foros 10%