Introduccion a La Estadistica

39
Bioestadística Mtro. Misael Lima Cárdenas

description

introduccion

Transcript of Introduccion a La Estadistica

  • Bioestadstica Mtro. Misael Lima Crdenas

  • Qu significa ESTADSTICA?La palabra estadstica tiene varios significados:Es usada frecuentemente al referirnos a datos registradosEstadstica tambin denota caractersticas calculadas para un grupo de datos, por ejemplo, media de la muestra Estadstica tambin se refiere a metodologa estadstica, tcnicas y procedimientos tratando con el diseo de experimentos, coleccin, organizacin, anlisis de la infromacin contenida en un grupo de datos para hacer inferencias acerca de los parmetros de la poblacin.

  • Qu hacen los estadsticos?Guiar el diseo de un experimento o encuesta antes de la coleccin de datos.

    Analizar datos usando los procedimientos y tcnicas estadsticos adecuados

    Presentar e interpretar resultados a los investigadores y otros tomadores de decisiones incluyendo al gobierno y a la industria

  • Por qu estudiar estadstica?Conocimiento de estadstica es esencial para personas que hacen investigacin, manejo de estudios Entendimiento bsico de estadstica es til para conducir investigaciones y una presentacin efectiva Entendimiento de estadstica puede ayudar a discriminar entre hechos y suposiciones en la vida diariaUn curso de estadstica deber ayudar a saber cuando un estadstico deber ser consultado.

  • Definicin de poblacin y muestra Una poblacin es un grupo de medidas de inters para un investigador.Ejemplos:1. Ingreso de familias viviendo en Karachi2. Nmero de nios en familias viviendo en Pakistn3. Status de salud de adultos en una comunidad

    Un subgrupo de la poblacin es llamado muestra. Una muestra es usualmente seleccionada de tal forma que es representativa de la poblacin.

  • Estadstica descriptiva e inferencial 1. Estadstica descriptiva trata con la enumeracin, organizacin y representacin grfica de los datos 2. Estadstica inferencial est interesada en llegar a conclusiones de informacin incompleta, o sea, generalizado desde la muestra

    Un ejemplo de estadstica inferencial incluye el uso de informacin disponible acerca del status de salud de las personas en una muestra para extraer inferencias acerca de la poblacin de la cual se obtuvo la muestra

  • Ejemplo deEstadstica descriptivaSuponga que se realiza un estudio para determinar los niveles sricos de plomo de 150 nios que viven en las casas ms viejas de un vecindario urbano en particular. Si uno investigara los hallazgos de este estudio, obtendra una lista de los resultados de las pruebas individuales. De tal forma, se reportara que el primer resultado mostr un nivel de 20 mcg/dl (microgramos por decilitro, tambin designados como g/dl o como ug/dl), mientras que el segundo arroj un nivel de 25 mcg/dl, y as sucesivamente. Despus de incluir en la lista los 150 resultados de la prueba, es probable que el investigador alcanzara a comprender un poco de la informacin obtenida. Tal in formacin no resumida abrumara la habilidad del oyente para llegar a una conclusin significativa. Una respuesta ms til podra ser: El promedio de los niveles sricos de plomo encontrados en los nios incluidos en el estudio fue de 30 mcg/dl. Otros resmenes podran incluir los valores ms altos y los ms bajos, as como varias representaciones grficas de los datos. De esta manera, la estadstica descriptiva se ocupa exactamente de lo que implica el trmino: descripcin de datos. Para reiterar, los investigadores podrn obtener fcilmente los resmenes de los datos relacionados con los elementos de una muestra (estadsticos), a diferencia de lo que sucede con los datos relacionados con la poblacin (parmetros).

  • Ejemplo de estadstica inferencialEn un sondeo de opinin, una muestra de opiniones obtenidas de un grupo de personas relativamente pequeo es utilizada para arrojar conclusiones sobre las opiniones de alguna poblacin. Por ejemplo, se podra preguntar a 1,000 personas si favorecen o no un determinado plan de salud que se administra a nivel federal. Si el 65% de los sondeos de opinin fueran favorables, entonces el encuestador intentara utilizar esta informacin para obtener conclusiones sobre la proporcin de opiniones favorables en todo el pas. Note que en este caso el valor de un estadstico (la proporcin de opiniones favorables en la muestra) se utiliza para comprender el valor de un parmetro no disponible (la proporcin de opiniones favorables en el pas).

  • Estadstica inferencial El objetivo de la estadstica inferencial es hacer inferencias acerca de los parmetros de la poblacin basada en la informacin obtenida de la muestra. Estimacin (e.g., estimando la prevalencia de hipertensin entre adultos viviendo en Tapachula)Probando hiptesis (e.g., probando la efectividad de un nuevo medicamento para reducir los niveles de colesterol)

  • Fuentes de datos Los datos pueden obtenerse de diferentes fuentes: Sistemas de vigilancia (e.g., NIH) Encuestas planeadas (Gobierno, universidades, ONG)Experimentos (Compaas farmacuticas)Organizaciones de salud (Grupo de datos administrativos)Sector privado (Bancos, compaas, etc) Gobierno (Todas las agencias gubernamentales)

    Aqu, nos enfocaremos en encuestas y experimentos Cul es la diferencia entre una encuesta y un experimento?

  • Diferencia entre encuestas y experimentosDatos de una encuesta representan observaciones de eventos o fenmenos sobre los cuales pocos o ningn, control se impone. (e.g., evaluando la asociacin entre diferentes estilos de vida y enfermedad cardiaca)En un experimento diseamos una investigacin planeada a propsito para imponer controles sobre la cantidad de exposicin (tratamiento) a una medicamento. (e.g., estudios clnicos)

  • Mtodos de muestreoMuestreo aleatorio (Simple)

    Muestreo sistemtico

    Muestreo estratificado

    Muestreo agrupado

    Muestreo por conveniencia

    Muestreo ms complejo

  • Algunos estudios epidemiolgicosEstudios retrospectivos:Renen datos del pasado de casos y controles seleccionados para determinar diferencias, si las hay, en la exposicin a un factor de sospecha. Comnmente son llamados estudios de caso-controlEstudios prospectivos:Generalmente son estudios cohorte en los cuales enrolamos a un grupo de personas sanas y las seguimos durante un cierto periodo de tiempo para determinar la frecuencia con la cual se presenta una enfermedad.

  • TIPOS DE POBLACIONESLas poblaciones populares :estn formadas por personas o cosas. As, es habitual referirnos a la poblacin de personas que habitan en Florida cuya prueba de hepatitis C result positivaLas poblaciones estadsticas: estn conformadas por caractersticas de personas o cosas. Una poblacin popular podra estar compuesta de los estudiantes de alguna universidad. Una poblacin estadstica, entonces, podra consistir en las presiones sanguneas de estos mismos estudiantes.Las poblaciones estadsticas consisten en caractersticas de personas o cosas, independientemente de si han sido medidas o no. La palabra datos se refiere al registro de mediciones hechas sobre caractersticas.Cuando tales caractersticas toman diferentes valores se conocen como variables.

  • TAMAO DE LA POBLACIONLas poblaciones infinitas pueden ser pensadas como poblaciones gran des, mientras que las poblaciones finitas son ms pequeas.PARMETROS Y ESTADSTICOSLos conceptos de parmetros y estadsticos estn relacionados de manera muy estrecha con los de poblaciones y muestras. Un PARMETRO se define como cualquier resumen de los elementos de una poblacin, mientras que el resumen de los elementos de una muestra se conoce como ESTADSTICO.

  • EJEMPLOSEl promedio de las presiones sanguneas de todos los estudiantes de la universidad mencionada sera un parmetro, mientras que el promedio de las presiones sanguneas de los estudiantes de un grupo en particular de esa universidad sera un estadstico.La mediana de las presiones sanguneas de todos los hombres por arriba de 65 aos de edad, que alguna vez tomarn el medicamento contra la hipertensin, sera un parmetro; mientras que la mediana de las presiones sanguneas de los 50 hombres que participaron en el estudio sera un estadstico.NOTA: los valores de los parmetros generalmente no estn disponibles para el investigador, mientras que los valores de losestadsticos son fcilmente localizables.

  • Variables cualitativas y cuantitativasEjemplos de variables cualitativas son ocupacin, sexo, estado civil, etc.

    Variables que producen observaciones que pueden medirse, se considera que son variables cuantitativas. Ejemplos de variables cuantitativas son peso, estatura, edad.Variables cuantitativas pueden clasificarse en discretas o continuas

  • Tipos de variablesVariables categricas (e.g., Sexo, estado civil, categora de ingreso)Variables continuas (e.g., edad, ingreso, peso, estatura, tiempo en lograr un resultado)Variables discretas (e.g. nmero de nios en una familia)Variables dicotmicas o binarias (e.g., respuesta s o no)

  • Escala de variablesEscala de variableEscala nominalEscala ordinal Escala de intervalo Escala de razn de intervalo

  • Escala de datos1. Nominal: estos datos no representan una cantidad (e.g., estado civil, sexo)

    2. Ordinal: estos datos representan una serie de datos ordenados (e.g., nivel de educacin)

    3. Intervalo: estos datos son medidos en una escala de intervalo teniendo iguales unidades pero teniendo un 0 arbitrario (e.g.: temperatura en Fahrenheit)

    4. Razn de intervalo: variable como peso para el cual podemos comparar significativamente un peso contra otro (digamos, 100 Kg es dos veces 50 Kg)

  • Variables en el protocoloTipos de variableindependientedependienteintermediaconfusora

  • Variable independienteLa caracterstica siendo observada y/o medida que hipotticamente influencia a un evento o resultado (variable dependiente).NOTALa variable independiente no es influenciada por el evento o el resultado, pero puede causarlo o contribuir a su variacin.

  • Variable dependienteUna variable cuyo valor depende del efecto de las otras variables (variables independientes) en la relacin siendo estudiada. Sinnimo: variables resultado o respuesta.NOTAUn evento o un resultado cuya variacin buscamos explicar o contabilizar por la influencia de variables independientes.

  • Variable intermediaUna variable que ocurre en el camino causal de una variable independiente a una variable dependiente. Sinnimo: interventora, mediadora NOTASProduce variacin en la variable dependiente, y es causada por a variable independiente.Tal variable est asociada con la variable dependiente e independiente.

  • Variable confusoraUn factor (que es un determinante del resultado), que distorsiona el efecto aparente de una variable de estudio sobre el resultado. NOTATal factor puede estar desigualmente distribuido entre los expuestos y no expuestos y por lo tanto influenciar la magnitud aparente y an, la direccin del efecto.

  • Organizando los datosTabla de frecuencias Histograma de frecuencias Histograma de frecuencias relativasPolgono de frecuenciasPolgono de frecuencia relativaBarrasPastel Tronco y hojaCaja y lnea

  • Tabla de frecuenciasSuponga que estamos interesados en estudiar el nmero de nios en las familias viviendo en la comunidad. Los datos siguientes fueron reunidos basados en una muestra aleatoria de n=30 familias de la comunidad.

    2, 2, 5, 3, 0, 1, 3, 2, 3, 4, 1, 3, 4, 5, 7, 3, 2, 4, 1, 0, 5, 8, 6, 5, 4 , 2, 4, 4, 7, 6

    Organice estos datos en una tabla de frecuencias!

  • X=No. de niosCuenta(Frecuencia)Frecuencia relativa022/30=0.067133/30=0.100255/30=0.167355/30=0.167466/30=0.200544/30=0.133622/30=0.067722/30=0.067811/30=0.033

  • Tabla de frecuenciasSuponga que necesitamos construir una tabla de frecuencias similar para la edad de pacientes con problemas relacionados al corazn en una clnica.

    Los siguientes datos han sido reunidos basados en una muestra aleatoria de n=30 pacientes quienes fueron a emergencias de la clnica por problemas relacionados al corazn.

    Las mediciones fueron: 42, 38, 51, 53, 40, 68, 62, 36, 32, 45, 51, 67, 53, 59, 47, 63, 52, 64, 61, 43, 56, 58, 66, 54, 56, 52, 40, 55, 72, 69.

  • Grupos de edadFrecuenciaFrecuencia relativa32 -36.9922/30=0.06737- 41.9933/30=0.10042-46.9944/30=0.13447-51.9933/30=0.10052-56.9988/30=0.26757-61.9933/30=0.10062-66.9944/30=0.13467-7233/30=0.100Totaln=301.00

  • Medidas de tendencia centralDnde est el corazn de la distribucin?

    1. Media 2. Mediana 3. Moda

  • Media de la muestraLa media aritmtica ( o simplemente media) es obtenida sumando todas las observaciones en la muestra y dividindola entre el nmero de observaciones. Para una muestra de 5 ingresos 6000, 10,000, 10,000, 14000, 50,000 la media de la muestra es:

  • Mediana de la muestraEn una lista ordenada del ms pequeo al mayor, la mediana es el valor de en medio

    En nuestro ejemplo de cinco ingresos en una vivienda, primero ordenamos las mediciones6,000, 10,000, 10,000, 14,000, 50,000 Mediana de la muestra 10,000

  • Medidas de dispersin o variabilidadRango

    Varianza

    Desviacin estndar

  • Frmula para varianza y desviacin estndar (S) de la muestraDesviacin estndar = S

  • Clculo de varianza y desviacin estndar

  • Reglas empricasPara una distribucin Normal, aproximadamente, a) 68% de las mediciones caen dentro de una desviacin estndar alrededor de la media

    b) 95% de las mediciones caen dentro de dos desviaciones estndar alrededor de la media

    c) 99.7% de las mediciones caen dentro de 3 desviaciones estndar alrededor de la media.

  • Suponga que el tiempo de reaccin de una droga en particular tiene una distribucin Normal con una media de 10 minutos y una desviacin estndar de 2 minutosAproximadamente,a) 68% de los sujetos tomando el medicamento tendrn la reaccin entreo 8 y 12 minutos

    b) 95% de los sujetos tomando la droga tendrn la reaccin entre 6 y 14 minutos

    c) 99.7% de los sujetos tomando la droga tendrn la reaccin entre 4 y 16 minutos.

    *Traduccin al Espaol. Dr en C Nicols Padilla Raygoza, Facultad de Enfermera y Obstetricia de Celaya, Universidad de Guanajuato, Mxico. [email protected] o [email protected]*********************************