Analisis de VarianzaAnalisis de VarianzaAnalisis de VarianzaAnalisis de VarianzaAnalisis de...

6
ANALISIS DE VARIANZA (ANOVA) El análisis de la varianza permite contrastar la hipótesis nula de que las medias de K poblaciones (K >2) son iguales, frente a la hipótesis alternativa de que por lo menos una de las poblaciones difiere de las demás en cuanto a su valor esperado. Este contraste es fundamental en el análisis de resultados experimentales, en los que interesa comparar los resultados de K 'tratamientos' o 'factores' con respecto a la variable dependiente o de interés. H 0 : μ 1 =μ 2 = =μ k H 1 : Por lomenos hayuna mediadiferente alresto El Anova requiere el cumplimiento los siguientes supuestos: Las poblaciones (distribuciones de probabilidad de la variable dependiente correspondiente a cada factor) son normales. Las muestras sobre las que se aplican los tratamientos son independientes. Las poblaciones tienen todas igual varianza (homoscedasticidad). Las muestras son aleatorias simples. Las muestras provienen de poblaciones categorizadas de una sola forma. Criterios de decisión para el Anova: Utilizar programas estadísticos como el Excel, SPSS, Miniab, etc. Identificar el valor de P en los resultados Plantear una conclusión con base en estos criterios. Procedimiento de prueba: Si el valor de P≤α , se rechaza la hipótesis nula de medias iguales y se concluye que al menos una de mas medias poblacionales es diferente de las otras.

description

Analisis de VarianzaAnalisis de VarianzaAnalisis de VarianzaAnalisis de VarianzaAnalisis de VarianzaAnalisis de Varianza

Transcript of Analisis de VarianzaAnalisis de VarianzaAnalisis de VarianzaAnalisis de VarianzaAnalisis de...

Page 1: Analisis de VarianzaAnalisis de VarianzaAnalisis de VarianzaAnalisis de VarianzaAnalisis de VarianzaAnalisis de VarianzaAnalisis de Varianza

ANALISIS DE VARIANZA (ANOVA)

El análisis de la varianza permite contrastar la hipótesis nula de que las medias de K poblaciones (K >2) son iguales, frente a la hipótesis alternativa de que por lo menos una de las poblaciones difiere de las demás en cuanto a su valor esperado. Este contraste es fundamental en el análisis de resultados experimentales, en los que interesa comparar los resultados de K 'tratamientos' o 'factores' con respecto a la variable dependiente o de interés.

H 0 : μ1=μ2=…=μk

H 1:Por lomenos hayunamediadiferente al resto

El Anova requiere el cumplimiento los siguientes supuestos:

Las poblaciones (distribuciones de probabilidad de la variable dependiente correspondiente a cada factor) son normales.

Las muestras sobre las que se aplican los tratamientos son independientes.

Las poblaciones tienen todas igual varianza (homoscedasticidad). Las muestras son aleatorias simples. Las muestras provienen de poblaciones categorizadas de una sola

forma.

Criterios de decisión para el Anova:

Utilizar programas estadísticos como el Excel, SPSS, Miniab, etc. Identificar el valor de P en los resultados Plantear una conclusión con base en estos criterios.

Procedimiento de prueba:

Si el valor de P≤α, se rechaza la hipótesis nula de medias iguales y se concluye que al menos una de mas medias poblacionales es diferente de las otras.

Si el valor de P>α , se acepta la hipótesis nula de medias poblacionales iguales.

Teniendo en cuenta que el estadístico de prueba será F:

Page 2: Analisis de VarianzaAnalisis de VarianzaAnalisis de VarianzaAnalisis de VarianzaAnalisis de VarianzaAnalisis de VarianzaAnalisis de Varianza

F= Varianza entre lasmuestrasVarianzadentrode lasmuestras

REGLA DE DECISIÓN

Es donde se determina que si F>FC, se rechace la hipótesis nula. Donde Fc es el factor crítico.

CALCULO DEL F CON TAMANOS MUESTRALES

Cuando nuestros tamaños de muestras son iguales en cada uno de los tratamientos entonces F será:

F=nsx

2

sp2

Dónde:

n=Tamañode lamuestr a

sx2=varianzade lamediamuestra l

sp2=Varianza ponderad a

CALCULOS CON TAMAÑOS MUESTRALES DIFERENTE

Cuando los tamaños de muestras son desiguales se hacen cálculos mucho más complejos.

Suma de Cuadrados TotalSC (total )=∑ ( x−x )2

Page 3: Analisis de VarianzaAnalisis de VarianzaAnalisis de VarianzaAnalisis de VarianzaAnalisis de VarianzaAnalisis de VarianzaAnalisis de Varianza

SC (total )=∑i=1

r

∑j=1

ni

(x ij−x )2

Suma de Cuadrados entre tratamientosSC (tratamientos )=∑ ni (xi−x )2

SC (tratamientos )=∑i=1

r

ni (xi−x )2

Suma de cuadrados del error o residualSC (error )=∑ (ni−1 ) si2

SC (error )=∑i=1

r

∑j=1

ni

(x ij−x i)2

CUADRADOS MEDIOS O MEDIA DE CUADRADOS (Varianza)

Tendremos los siguientes:

CUADRADO MEDIO DEL TRATAMIENTO

CM ( tratamiento )=SC ( tratamiento )k−1

Donde :k es el N ° de tratamientos

CUADRADO MEDIO DEL ERROR

CM (error )=SC ( error )n−k

Donde :n esel N °total de lasmuestras

CUADRADO MEDIO TOTAL

CM ( total )= SC(total )n−1

ESTADISTICO DE PRUEBA

Será de la siguiente manera:

F=CM (tratamiento)

CM (error )

Este F se obtiene del teorema fundamental del anova, la cual este teorema permite dividir la variación total asociada a un conjunto de datos en dos componentes de variabilidad:

Page 4: Analisis de VarianzaAnalisis de VarianzaAnalisis de VarianzaAnalisis de VarianzaAnalisis de VarianzaAnalisis de VarianzaAnalisis de Varianza

Una es la asociada a los efectos de los tratamientos La otra es la asociada a otras fuentes de variación (error

experimental)

Dividimos por σ 2, seguirán una distribución de chi-cuadrada, y el cociente de los dos chi-cuadradas divididas por sus respectivos grados de libertad darán una F.

SC (trat . )σ2

≈ Xk−12

SC (error )σ 2

≈ X n−k2

Dividiendo esas dos ecuaciones nos da

SC (trat . )k−1

SC(error )n−k

≈ Fk−1 ,n−k

Que es lo mismo decir:

F=CM (tratamiento)

CM (error )

TABLA ANOVA

Según de todo lo anterior mencionado se resumen en la siguiente tabla:

Page 5: Analisis de VarianzaAnalisis de VarianzaAnalisis de VarianzaAnalisis de VarianzaAnalisis de VarianzaAnalisis de VarianzaAnalisis de Varianza

PRUEBA DE COMPARACION DE BONFERRONI

Cuando rechazamos la hipótesis nula eso implicaría que al menos una de las medias es diferente, entonces se hace la prueba de Bonferroni.

Paso1: realizar una prueba T separada para cada par de muestras, haciendo los ajustes de los siguientes pasos.

Paso 2: calcular para cada par de muestras el valor de T.

T=x1−x2

CM (error)( 1n1 + 1n2 )Paso 3: calcular el valor T crítico o el calor de P

Valor de P: elegir T con n-k grados de libertad y ajuste el valor de P multiplicándolo por el número de pares de muestras deferentes posibles.

Valor Crítico: Ajuste el nivel de significancia dividiéndolo entre el número de pares de muestras posibles.