Trabajo Final de Biestadistica por Alexander Rojas Patiño

9

Click here to load reader

Transcript of Trabajo Final de Biestadistica por Alexander Rojas Patiño

Page 1: Trabajo Final de Biestadistica por Alexander Rojas Patiño

Trabajo final de bioestadísticaAnálisis de Varianza

Docente: Carlos Acevedo

Alumnos: Ivonne Valencia Alexander Rojas Patiño

Mauricio Vergara

Universidad de AntioquiaFacultad de Química Farmacéutica

Tec. Regencia de FarmaciaBioestadística

Page 2: Trabajo Final de Biestadistica por Alexander Rojas Patiño

Facultad de Ciencias Exactas y Naturales Departamento de

Matema´ ticas Cursos de Servicios Para Q.F

Trabajo Final Bioestad´ıstica

Los siguientes datos corresponden al contenido en ml de 13 frascos de jarabe para la tos, que son envasados por tres laboratorios diferentes.

Laboratorio 1 Laboratorio 2 Laboratorio 3203 205 210198 194 201194 199 213204 203195 196

1. Explique brevemente en que consiste el ana´ lisis de varianza de un solo factor, y cuales son los supuestos del modelo.

2. En el anterior ejercicio identifique:

a. Factor de estudio.

b. Nu´ mero

de niveles. c.

Variable

respuesta.

d. Unidades experimentales.

3. Realizar un ana´ lisis de varianza

a. Usando las formulas para calcular SSA, SSE, SST.(Excel)

b. Usando la pestan˜ a de ana´ lisis de datos de excel.(Compare)

4. Con base en el resultado anterior, concluya si hay diferencia en el contenido promedio en ml de los frascos de jarabe para la tos, envasados por los tres diferentes laboratorios. (use un nivel de significancia de α = 0,005)

Nota: El trabajo debe ser desarrollado en Excel, adema´ s el trabajo debe llevar,portada, introduccio´ n, objetivos, ana´ lisis de resultados,conclusiones y bibliograf´ıa.

Page 3: Trabajo Final de Biestadistica por Alexander Rojas Patiño

Análisis de Varianza

Introducción:El análisis de la varianza (o Anova: Analysis of variance) es un método para comparar dos o más medias, que es necesario porque cuando se quiere comparar más de dos medias es incorrecto utilizar repetidamente el contraste basado en la t de Student. Por dos motivos:

-En primer lugar, y como se realizarían simultánea e independientemente varios contrastes de hipótesis, la probabilidad de encontrar alguno significativo por azar aumentaría. En cada contraste se rechaza la H0 si la t supera el nivel crítico, para lo que, en la hipótesis nula, hay una probabilidad.Por otro lado, en cada comparación la hipótesis nula es que las dos muestras provienen de la misma población, por lo tanto, cuando se hayan realizado todas las comparaciones, la hipótesis nula es que todas las muestras provienen de la misma población y, sin embargo, para cada comparación, la estimación de la varianza necesaria para el contraste es distinta, pues se ha hecho en base a muestras distintas.El método que resuelve ambos problemas es el anova, aunque es algo más que esto: es un método que permite comparar varias medias en diversas situaciones; muy ligado, por tanto, al diseño de experimentos y, de alguna manera, es la base del análisis multivariante.

Objetivo:El objetivo principal del estudio es determinar si el tipo de laboratorio en que son envasados 13 frascos de jarabe para la tos está asociado con la cantidad de ml que contienen dichos frascos.

Descripción:Para determinar la influencia del tipo de laboratorio en la cantidad de ml de los frascos, las 13 unidades de estudio son divididas en tres laboratorios: a cada uno de los laboratorios 1 y 2 se le asigna cinco frascos y al laboratorio 3 se le asignan los tres restantes. En cada laboratorio se hacen los respectivos envasamientos y se mide la cantidad final de jarabe de cada frasco.

Page 4: Trabajo Final de Biestadistica por Alexander Rojas Patiño

Modelo:

y ij=μi+ε ij

Donde:

y ij : Cantidad en ml del j-ésimo frasco de jarabe envasado en el i-ésimo laboratorio.μi : Media poblacional de la cantidad en ml de jarabe envasada en el i-ésimo laboratorio.

ε ij: Término de error de la j-ésima unidad experimental en el i-ésimo nivel del factor.

Hipótesis:

H0 : μ1=μ2=μ3=μ4

H1 : μi≠μ j para cualquier i ó j

H0 : La media poblacional de la cantidad de jarabe es igual en todos los laboratorios.H1 : La media poblacional de la cantidad de jarabe para la tos es diferente para al menos un par de laboratorios.

Análisis de Varianza (ANOVA):

Se descompone la variación total de la respuesta (conocida como suma de cuadrados totales SST) en dos componentes: suma de cuadrados del error (SSE) y suma de cuadrados del tratamiento (SSA).

Matemáticamente:

SST=∑i=1

I

∑j=1

J

( yij− y )2=SSA+SSE

Para que haya diferencias significativas entre los diferentes niveles del factor, se espera que la variación total (SST) se deba principalmente a la suma de cuadrados del tratamiento (SSA) y no a la suma de cuadrados del error (SSE).

El valor F tiene el objetivo de estudiar la importancia del SSA respecto al SSE y mide que tan grande es el primero con respecto al segundo, teniendo en cuenta los grados de libertad de cada uno, y determina a partir de un nivel de significancia especificado, si en verdad hay diferencias estadísticamente significativas entre cada uno de los niveles del tratamiento.

Page 5: Trabajo Final de Biestadistica por Alexander Rojas Patiño

Análisis de Resultados:

Los resultados indican que es SST es 429.69, que el SSE es 246.00 y que el SSA es 183.69. Observe que la variación total SST se debe en mayor parte al SSE y en menor proporción al SSA, lo cual indica que la variación del modelo se debe principalmente a los errores y no a los tratamientos. Esto conlleva a un valor F insuficiente para rechazar la hipótesis nula y por tanto, se concluye que no hay diferencias estadísticamente significativas entre las cantidades de jarabe para la tos que envasa cada uno de los tres laboratorios.

Taller de análisis de varianza ( solución )

DatosID Pastilla/Repetición Trat 1 Trat 2 Trat 3  

1 203 205 210  2 198 194 201  3 194 199 213  4 204 203    5 195 196    

Promedio 198,80 199,40 208,00 201,15

1. El análisis de varianza de un solo factor tiene como fin determinar si un factor determinado (el cual es controlado por el investigador) tiene una insidencia significativa en el valor de una variable respuesta estudiada. El modelo de análisis de varianza asume que los errores se distribuyen normalmente con varianza constante.

2. Factor de Estudio: Número de laboratorioNúmero de niveles: 3Variable respuesta: Contenido de jarabe en mlUnidades experimentales: Frascos de jarabe (en total 13).

3.a.

Grupos Cuenta Suma Promedio VarianzaTratamiento 1 5 994 198,8 20,7Tratamiento 2 5 997 199,4 21,3

Page 6: Trabajo Final de Biestadistica por Alexander Rojas Patiño

Tratamiento 3 3 624 208 39

Origen de las variaciones

Suma de cuadrados

Grados de

libertad

Promedio de los

cuadrados FProbabilida

d

Valor crítico para F

Entre grupos SSA = 183,69 2 91,85 3,7336 0.0615 9,427

Dentro de los grupos SSE = 246 10 24,6      

             Total SST = 429,69 12        

b.SST 429,69SSE 246,00SSA 183,69

El análisis del SSE, SSA y SST, arroja que los resultados son iguales tanto en el análisis de datos de Excel como en el cálculo matemático de estos datos.

4. Comparar en la tabla de análisis de varianza el valor calculado F con el valor crítico F. Si el valor calculado es mayor que el crítico, entonces se rechaza la hipótesis de que todos los laboratorios tienen el mismo efecto sobre el contenido de jarabe y por tanto, al menos uno de estos tiene un efecto significativo sobre la respuesta; si por el contrario el F crítico es mayor al F calculado, entonces se acepta la hipótesis de que ningún laboratorio tiene un efecto diferente a los otros sobre la cantidad de jarabe. En este caso, el F calculado es igual a 3.7336 y el F crítico es 9.427, con lo cual no se rechaza la hipótesis de que todos los laboratorios producen la misma cantidad de jarabe.

Comparar el valor p en la tabla de análisis de varianza con el nivel de significancia de la prueba. Si el nivel de significancia es mayor al valor p, entonces se rechaza la hipótesis de que todos los laboratorios producen la misma cantidad de jarabe y por tanto, al menos uno de ellos tiene un efecto significativo sobre la respuesta; si por el contrario el valor p es mayor al nivel de significancia, entonces se acepta la hipótesis de que ningún laboratorio tiene un efecto diferente a las otros sobre la cantidad de jarabe. En este caso, el valor p es igual a 0.0615 y el nivel de confianza es 0.005, con lo cual no se rechaza la hipótesis de que todos los laboratorios producen la misma cantidad de jarabe.

Page 7: Trabajo Final de Biestadistica por Alexander Rojas Patiño

Conclusiones.Según los análisis no se detecta diferencia entre los laboratorios en cuanto a la producción de jarabe.

Bibliografía.

-Estadística aplicada a las ciencias de la salud.

Álvarez Cáceres Rafael.2007. ISBN: 978-84-7978-823-0.

-Bioestadística sin dificultades matemáticas.

Prieto Valiente Luis, Herranz Tejedor Inmaculada.2010.ISBN: 978-84-7978-959-6