Ejemplos SAS1

download Ejemplos SAS1

of 81

Transcript of Ejemplos SAS1

  • 7/24/2019 Ejemplos SAS1

    1/81

    UNIVERSIDAD DE GUANAJUATO

    CAMPUS CELAYA SALVATIERRA

    DIVISIN DE CIENCIAS DE LA SALUD E INGENIERAS

    DEPARTAMENTO DE INGENIERA AGROINDUSTRIAL

    PROGRAMA ACADMICO DE INGENIERA EN BIOTECNOLOGA

    EJEMPLOS DE ANLISIS DE

    VARIANZA, CORRELACIN Y

    REGRESIN.

    CON EL USO PRCTICO DEL PAQUETE SAS

    Dr. Carlos A. Nez-Coln.

    UDA: Diseos Experimentales (GN1808)

  • 7/24/2019 Ejemplos SAS1

    2/81

    1

    ANAVA en Diseo Experimental Completamente al Azar.

    En un experimento donde se probaron 4 dosis de Nitrgeno en el cultivo de Ans donde la variable respuesta

    fue el rendimiento en gramos por parcela.

    Teniendo el siguiente programa para SAS:

    DATA CA2;

    INPUT Y T;

    CARDS;

    34.4 1

    27.3 1

    65.0 1

    31.3 1

    48.5 1

    38.4 1

    40.5 1

    25.0 2

    23.2 2

    45.2 2

    26.4 2

    26.8 2

    32.7 2

    28.8 2

    20.9 3

    22.2 3

    27.8 319.6 3

    20.1 3

    22.1 3

    19.7 3

    19.7 4

    21.7 4

    21.1 4

    18.5 4

    16.0 4

    20.2 4

    21.2 4

    ;

    PROC PRINT;

    PROC ANOVA;

    CLASS T;

    MODEL Y=T;

    RUN;

    Obteniendo los siguientes resultados:

    El procedimiento del ANAVA

    Informacin del Nivel de Clase

    Clase Niveles Valores

    T 4 1 2 3 4

    Nmero de observaciones 28

    Variable Dependiente: Y

    Suma de

    Fuente de Variacin GL Cuadrados Cuadrado Medio F Value Pr > F

    Modelo 3 1908.209643 636.069881 11.14 F

    T 3 1908.209643 636.069881 11.14

  • 7/24/2019 Ejemplos SAS1

    3/81

    2

    ANAVA en Diseo Experimental Completamente al Azar Desbalanceado.

    En este experimento donde se aplicaron reguladores de crecimiento a plntulas de frijol, se midi la variable

    respuesta longitud del primer entrenudo.

    Teniendo el siguiente programa para SAS:

    DATA CA2;

    INPUT Y T;

    CARDS;

    3.0 1

    2.5 1

    3.0 1

    3.3 1

    4.0 1

    2.9 1

    6.1 2

    6.8 2

    5.2 2

    7.0 2

    4.8 2

    3.8 2

    5.9 3

    7.1 3

    6.7 3

    5.9 3

    ;PROC PRINT;

    PROC GLM;

    CLASS T;

    MODEL Y=T;

    RUN;

    Obteniendo los siguientes resultados:

    Procedimiento GLM

    Informacin de niveles de Clase

    Clase Niveles Valores

    T 3 1 2 3

    Nmero de observaciones 16

    El Procedimiento GLM

    Variable Dependiente: Y

    Suma de

    Fuente de Variacin GL Cuadrados Cuadrado Medio F Value Pr > F

    Modelo 2 31.15333333 15.57666667 20.18 0.0001

    Error 13 10.03666667 0.77205128

    Total Corregido 15 41.19000000

    R-Cuadrada Coef. Var. Raz CME Y Media

    0.756332 18.02389 0.878664 4.875000

    Fuente de Variacin GL SC Tipo I Cuadrado Medio F Value Pr > F

    T 2 31.15333333 15.57666667 20.18 0.0001

    Fuente de variacin GL SC Tipo III Cuadrado Medio F Value Pr > F

    T 2 31.15333333 15.57666667 20.18 0.0001

    En este anlisis por estar desbalanceado primero hace una regresin lineal, y despus el ANAVA.

    Teniendo para este caso ya con los valores corregidos que al menos uno de los tratamientos producen efecto

    diferente es decir que por lo menos en uno de los tratamientos el hipoctilo de frijol creci de manera diferente

    a los otros, considerando un alfa del 0.05.

  • 7/24/2019 Ejemplos SAS1

    4/81

    3

    ANAVA en diseo Bloques al Azar.

    El Experimento consto de una prueba de variedades de Maz, pero se hizo en bloques al azar por presentar

    un gradiente de variacin en la fertilidad del suelo.

    Teniendo el siguiente programa para SAS:

    DATA BA1;

    INPUT Y T B;

    CARDS;

    10.1 1 1

    8.9 1 2

    2.6 1 3

    7.4 1 4

    0.8 1 5

    9.2 2 1

    9.3 2 2

    3.1 2 3

    6.0 2 4

    1.2 2 5

    4.9 3 1

    5.2 3 2

    1.9 3 3

    5.4 3 4

    0.1 3 5

    ;

    PROC PRINT;PROC ANOVA;

    CLASS T B;

    MODEL Y=T B;

    RUN;

    Obteniendo los siguientes resultados:

    Procedimiento ANOVA

    Informacin de Niveles de Clases

    Clase Nivel Valores

    T 3 1 2 3

    B 5 1 2 3 4 5

    Nmero de observaciones 15

    Variable Dependiente: Y

    Suma de

    Fuente de Variacin GL Cuadrados Cuadrado Medio F Value Pr > F

    Modelo 6 148.8546667 24.8091111 18.98 0.0002

    Error 8 10.4546667 1.3068333

    Total Corregido 14 159.3093333

    R-Cuadrada Coef. Var. Raz CME Y Media

    0.934375 22.53288 1.143168 5.073333

    Fuente de Variacin GL Anova SC Cuadrado Medio F Value Pr > F

    T 2 18.6653333 9.3326667 7.14 0.0166

    B 4 130.1893333 32.5473333 24.91 0.0001

    Tenemos en este ejemplo que del modelo se desprenden 2 fuentes de variacin los tratamientos y los bloques

    y que en este caso ambos tienen diferencias significativas. Solo que en bloques es un poco ms fuertes, pero

    en ambos casos se concluye que al menos una variedad es diferente a las dems en cuanto a su rendimiento

    y que estas en conjunto en los bloques presentan tambin diferencias significativas es decir se comportan

    diferente en cada bloque.

  • 7/24/2019 Ejemplos SAS1

    5/81

    4

    ANAVA en Diseo Experimental Cuadrado Latino.

    En el experimento de variedades de trigo que funciona como tratamiento se tenan dos gradientes de variacin

    que era para columnas fertilidad del suelo y para hileras humedad del mismo y utilizando parcelas de 15 m2

    y la variable respuesta de rendimiento de grano en gramos por parcela.

    Teniendo el siguiente programa de SAS:

    DATA CL1;

    INPUT Y C H T;CARDS;

    732 1 1 4

    728 1 2 1

    1010 1 3 5

    900 1 4 3

    980 1 5 2

    854 2 1 5

    730 2 2 2

    750 2 3 1

    1100 2 4 4

    970 2 5 3

    641 3 1 3

    854 3 2 4

    860 3 3 2

    860 3 4 1

    1250 3 5 5610 4 1 2

    762 4 2 3

    720 4 3 4

    1200 4 4 5

    930 4 5 1

    549 5 1 1

    976 5 2 5

    1000 5 3 3

    920 5 4 2

    1070 5 5 4

    ;

    PROC PRINT;

    PROC ANOVA;

    CLASS C H T;

    MODEL Y=C H T;

    RUN;

    Obteniendo los siguientes resultados:

    Procedimiento ANOVA

    Informacin de Niveles de Clases

    Clase Nivel Valor

    C 5 1 2 3 4 5

    H 5 1 2 3 4 5

    T 5 1 2 3 4 5

    Nmero de observaciones 25

    Variable Dependiente: Y

    Suma de

    Fuentes de Variacin GL Cuadrados Cuadrado Medio F Value Pr > F

    Modelo 12 685015.6800 57084.6400 10.15 0.0002

    Error 12 67488.8800 5624.0733

    Total Corregido 24 752504.5600

    R-Cuadrada Coef. Var. Raz CME Y Media

    0.910314 8.539103 74.99382 878.2400

    Fuentes de Variacin GL Anova SC Cuadrado Medio F Value Pr > F

    C 4 10252.5600 2563.1400 0.46 0.7667

    H 4 426061.7600 106515.4400 18.94

  • 7/24/2019 Ejemplos SAS1

    6/81

    5

    ANAVA en Diseo Experimental Bloques al Azar Generalizado.

    El experimento se realiz en bloques porque existe un gradiente de variacin pero se sospecha que puede

    haber interaccin por lo que en lugar de utilizar el diseo bloques al azar, se utiliza el diseo bloques al azar

    generalizado, que la nica diferencia de que este presenta repeticin de bloques. En este caso se trata del

    rendimiento de tomate por corte por hectrea extrapolado, con un bloque que se trata de un gradiente de

    variacin de humedad, y los tratamientos son aplicaciones foliares de abono nitrogenado.

    Teniendo el siguiente programa de SAS:

    DATA BAG1;

    INPUT Y TRA BLO;

    CARDS;

    7.3 1 1

    7.2 1 2

    7.6 1 3

    7.2 1 1

    7.5 1 2

    7.6 1 3

    6.8 2 1

    5.5 2 2

    6.8 2 3

    6.5 2 1

    6.8 2 27.1 2 3

    6.7 3 1

    7.3 3 2

    6.8 3 3

    7.4 3 1

    7.5 3 2

    6.3 3 3

    5.7 4 1

    6.9 4 2

    6.4 4 3

    6.1 4 1

    6.4 4 2

    6.3 4 3

    ;

    PROC PRINT;

    PROC ANOVA;

    CLASS TRA BLO;MODEL Y=TRA BLO TRA*BLO;

    RUN;

    Obteniendo los siguientes resultados:

    Procedimiento ANOVA

    Informacin de Niveles de Clases

    Clase Nivel Valor

    TRA 4 1 2 3 4

    BLO 3 1 2 3

    Numero de observaciones 24

    Variable Dependiente: Y

    Suma de

    Fuentes de Variacin GL Cuadrados Cuadrado Medio F Value Pr > F

    Modelo 11 6.25458333 0.56859848 4.30 0.0092

    Error 12 1.58500000 0.13208333Total Corregido 23 7.83958333

    R-Cuadrada Coef. Var. Raz CME Y Media

    0.797821 5.328274 0.363433 6.820833

    Fuentes de Variacin GL Anova SC Cuadrado Medio F Value Pr > F

    TRA 3 4.17125000 1.39041667 10.53 0.0011

    BLO 2 0.14333333 0.07166667 0.54 0.5949

    TRA*BLO 6 1.94000000 0.32333333 2.45 0.0881

    En este caso segn este anlisis podemos interpretar que el gradiente de humedad existente en el

    experimento no presenta diferencias significativas en cuanto a rendimiento por corte, mientras que los

    tratamientos con aplicaciones foliares de fertilizantes si presentan una diferencia significativa, adems se

    concluye como no se rechaz H0de la interaccin, que no existe interaccin por lo que se hubiera podido

    ocupar el diseo bloques al azar pero como no se saba, estuvo bien ocupado el modelo.

  • 7/24/2019 Ejemplos SAS1

    7/81

    6

    ANAVA de un Factorial de 2 en Completamente al Azar.

    En este tipo de experimentos se tienen ms de un factor a evaluar, en este caso se tienen 2 factores a evaluar

    por la misma variable respuesta.

    En este caso se trata de rendimiento de forraje de alfalfa en toneladas por hectrea con una dosis de nitrgeno

    como factor A y de fsforo como factor B.

    Teniendo el siguiente programa de SAS:

    DATA F2CA1;

    INPUT Y TRA A B;

    CARDS;

    140 1 1 1

    150 1 1 1

    136 1 1 1

    143 1 1 1

    148 1 1 1

    155 2 1 2

    149 2 1 2

    156 2 1 2

    147 2 1 2

    152 2 1 2

    168 3 2 1

    174 3 2 1

    171 3 2 1166 3 2 1

    162 3 2 1

    180 4 2 2

    165 4 2 2

    176 4 2 2

    173 4 2 2

    170 4 2 2

    ;

    PROC PRINT;

    PROC ANOVA;

    CLASS A B;

    MODEL Y=A B A*B;

    PROC ANOVA;

    CLASS TRA;

    MODEL Y=TRA;

    RUN;

    Obteniendo los siguientes resultados:Procedimiento ANOVA

    Informacin de Niveles de Clases

    Clase Nivel Valor

    A 2 1 2

    B 2 1 2

    Nmero de observaciones 20

    Variable Dependiente: Y

    Suma de

    Fuentes de Variacin GL Cuadrados Cuadrado Medio F Value Pr > F

    Modelo 3 2851.350000 950.450000 37.49 F

    A 1 2622.050000 2622.050000 103.43 F

    Modelo 3 2851.350000 950.450000 37.49

  • 7/24/2019 Ejemplos SAS1

    8/81

    7

    R-Cuadrada Coef. Var. Raz CME Y Media

    0.875466 3.165595 5.034878 159.0500

    Fuentes de Variacin GL Anova SC Cuadrado Medio F Value Pr > F

    TRA 3 2851.350000 950.450000 37.49

  • 7/24/2019 Ejemplos SAS1

    9/81

    8

    ANAVA de un Factorial 2 en Diseo Bloque al Azar

    Este se utiliza cuando se van a evaluar ms de dos factores de variacin y se tiene un gradiente de variacin

    en las unidades experimentales. Este experimento se trata de evaluar a diferentes variedades de maz con

    distintas dosis de nitrgeno, para evaluar la produccin de grano en toneladas por hectrea, con un gradiente

    de humedad del suelo para formar los bloques.

    Teniendo el siguiente programa para SAS:

    DATA F2BA1;

    INPUT Y BLO V N COVN$;

    CARDS;

    3.3 1 1 1 V1N1

    4.2 1 1 2 V1N2

    6.1 1 1 3 V1N3

    5.4 1 2 1 V2N1

    6.5 1 2 2 V2N2

    7.2 1 2 3 V2N3

    2.3 1 3 1 V3N1

    2.5 1 3 2 V3N2

    5.8 1 3 3 V3N3

    4.7 1 4 1 V4N1

    6.0 1 4 2 V4N2

    7.2 1 4 3 V4N3

    2.9 2 1 1 V1N14.4 2 1 2 V1N2

    5.1 2 1 3 V1N3

    5.2 2 2 1 V2N1

    5.1 2 2 2 V2N2

    8.0 2 2 3 V2N3

    1.9 2 3 1 V3N1

    2.3 2 3 2 V3N2

    4.5 2 3 3 V3N3

    5.5 2 4 1 V4N1

    6.3 2 4 2 V4N2

    8.6 2 4 3 V4N3

    3.7 3 1 1 V1N1

    4.2 3 1 2 V1N2

    6.4 3 1 3 V1N3

    6.3 3 2 1 V2N1

    6.2 3 2 2 V2N2

    8.3 3 2 3 V2N3

    1.7 3 3 1 V3N1

    3.9 3 3 2 V3N2

    5.2 3 3 3 V3N3

    4.3 3 4 1 V4N1

    5.5 3 4 2 V4N2

    7.4 3 4 3 V4N3

    3.0 4 1 1 V1N1

    5.4 4 1 2 V1N2

    7.5 4 1 3 V1N3

    6.6 4 2 1 V2N1

    7.3 4 2 2 V2N2

    9.0 4 2 3 V2N3

    2.3 4 3 1 V3N1

    3.3 4 3 2 V3N2

    6.2 4 3 3 V3N3

    3.3 4 4 1 V4N15.4 4 4 2 V4N2

    8.2 4 4 3 V4N3

    2.3 5 1 1 V1N1

    5.5 5 1 2 V1N2

    6.6 5 1 3 V1N3

    5.6 5 2 1 V2N1

    7.7 5 2 2 V2N2

    8.9 5 2 3 V2N3

    1.8 5 3 1 V3N1

    2.2 5 3 2 V3N2

    6.3 5 3 3 V3N3

    2.6 5 4 1 V4N1

    4.3 5 4 2 V4N2

    8.2 5 4 3 V4N3

    ;

    PROC PRINT;

    PROC ANOVA;

    CLASS BLO V N;

    MODEL Y=BLO V N V*N;

    PROC ANOVA;

    CLASS BLO COVN;

  • 7/24/2019 Ejemplos SAS1

    10/81

    9

    MODEL Y=BLO COVN;

    RUN;

    Obteniendo los siguientes resultados:

    Procedimiento ANOVA

    Informacin de Niveles de Clases

    Clase Nivel Valor

    BLO 5 1 2 3 4 5

    V 4 1 2 3 4

    N 3 1 2 3

    Nmero de observaciones 60

    Variable Dependiente: Y

    Suma de

    Fuentes de Variacin GL Cuadrados Cuadrado Medio F Value Pr > F

    Modelo 15 215.8676667 14.3911778 25.98 F

    BLO 4 2.8623333 0.7155833 1.29 0.2878

    V 3 96.6733333 32.2244444 58.18

  • 7/24/2019 Ejemplos SAS1

    11/81

    10

    ANAVA de un Factorial de 3 en Completamente al Azar.

    Este experimento evalo tres factores en el diseo experimental completamente al azar que quiere decir que

    todas las unidades experimentales son homogneas, en este caso se trata de evaluar variedades de trigo(V),

    aplicacin de hormonas(H) y de fertilizantes foliares(F) para evaluar la variable respuesta altura de planta.

    Teniendo el siguiente programa para SAS:

    DATA F3CA1;

    INPUT Y V H F COMVH$ COMVF$ COMHF$ COMVHF$;CARDS;

    12 1 1 1 V1H1 V1F1 H1F1 V1H1F1

    10 1 1 1 V1H1 V1F1 H1F1 V1H1F1

    13 1 1 2 V1H1 V1F2 H1F2 V1H1F2

    11 1 1 2 V1H1 V1F2 H1F2 V1H1F2

    14 1 2 1 V1H2 V1F1 H2F1 V1H2F1

    14 1 2 1 V1H2 V1F1 H2F1 V1H2F1

    13 1 2 2 V1H2 V1F2 H2F2 V1H2F2

    14 1 2 2 V1H2 V1F2 H2F2 V1H2F2

    15 1 3 1 V1H3 V1F1 H3F1 V1H3F1

    14 1 3 1 V1H3 V1F1 H3F1 V1H3F1

    13 1 3 2 V1H3 V1F2 H3F2 V1H3F2

    14 1 3 2 V1H3 V1F2 H3F2 V1H3F2

    12 2 1 1 V2H1 V2F1 H1F1 V2H1F1

    13 2 1 1 V2H1 V2F1 H1F1 V2H1F1

    13 2 1 2 V2H1 V2F2 H1F2 V2H1F213 2 1 2 V2H1 V2F2 H1F2 V2H1F2

    15 2 2 1 V2H2 V2F1 H2F1 V2H2F1

    15 2 2 1 V2H2 V2F1 H2F1 V2H2F1

    15 2 2 2 V2H2 V2F2 H2F2 V2H2F2

    15 2 2 2 V2H2 V2F2 H2F2 V2H2F2

    15 2 3 1 V2H3 V2F1 H3F1 V2H3F1

    15 2 3 1 V2H3 V2F1 H3F1 V2H3F1

    14 2 3 2 V2H3 V2F2 H3F2 V2H3F2

    15 2 3 2 V2H3 V2F2 H3F2 V2H3F2

    ;

    PROC PRINT;

    PROC ANOVA;

    CLASS V H F;

    MODEL Y=V H V*H F V*F H*F V*H*F;

    PROC ANOVA;

    CLASS COMVH F;

    MODEL Y=COMVH F COMVH*F;

    PROC ANOVA;

    CLASS COMVF H;

    MODEL Y=COMVF H COMVF*H;

    PROC ANOVA;

    CLASS COMHF V;

    MODEL Y=COMHF V COMHF*V;

    PROC ANOVA;

    CLASS COMVHF;

    MODEL Y=COMVHF;

    RUN;

    Obteniendo los siguientes resultados:

    Procedimiento ANOVA

    Informacin de Niveles de Clases

    Clase Nivel Valor

    V 2 1 2H 3 1 2 3

    F 2 1 2

    Nmero de observaciones 24

    Variable Dependiente: Y

    Suma de

    Fuentes de Variacin GL Cuadrados Cuadrado Medio F Value Pr > F

    Modelo 11 37.12500000 3.37500000 6.23 0.0019

    Error 12 6.50000000 0.54166667

    Total Corregido 23 43.62500000

    R-Cuadrada Coef. Var. Raz CME Y Media

    0.851003 5.401689 0.735980 13.62500

    Fuentes de Variacin GL Anova SC Cuadrado Medio F Value Pr > F

    V 1 7.04166667 7.04166667 13.00 0.0036

    H 2 27.00000000 13.50000000 24.92

  • 7/24/2019 Ejemplos SAS1

    12/81

    11

    Procedimiento ANOVA

    Informacin de Niveles de Clases

    Clase Nivel Valor

    COMVH 6 V1H1 V1H2 V1H3 V2H1 V2H2 V2H3

    F 2 1 2

    Nmero de observaciones 24

    Variable Dependiente: Y

    Suma de

    Fuentes de Variacin GL Cuadrados Cuadrado Medio F Value Pr > FModelo 11 37.12500000 3.37500000 6.23 0.0019

    Error 12 6.50000000 0.54166667

    Total Corregido 23 43.62500000

    R-Cuadrada Coef. Var. Raz CME Y Media

    0.851003 5.401689 0.735980 13.62500

    Fuentes de Variacin GL Anova SC Cuadrado Medio F Value Pr > F

    COMVH 5 34.37500000 6.87500000 12.69 0.0002

    F 1 0.04166667 0.04166667 0.08 0.7862

    COMVH*F 5 2.70833333 0.54166667 1.00 0.4582

    Procedimiento ANOVA

    Informacin de Niveles de Clases

    Clase Nivel Valor

    COMVF 4 V1F1 V1F2 V2F1 V2F2

    H 3 1 2 3

    Nmero de observaciones 24

    Variable Dependiente: Y

    Suma de

    Fuentes de Variacin GL Cuadrados Cuadrado Medio F Value Pr > F

    Modelo 11 37.12500000 3.37500000 6.23 0.0019

    Error 12 6.50000000 0.54166667

    Total Corregido 23 43.62500000

    R-Cuadrada Coef. Var. Raz CME Y Media

    0.851003 5.401689 0.735980 13.62500

    Fuentes de Variacin GL Anova SC Cuadrado Medio F Value Pr > F

    COMVF 3 7.12500000 2.37500000 4.38 0.0265

    H 2 27.00000000 13.50000000 24.92 F

    Modelo 11 37.12500000 3.37500000 6.23 0.0019

    Error 12 6.50000000 0.54166667

    Total Corregido 23 43.62500000

    R-Cuadrada Coef. Var. Raz CME Y Media

    0.851003 5.401689 0.735980 13.62500

    Fuentes de Variacin GL Anova SC Cuadrado Medio F Value Pr > F

    COMHF 5 29.37500000 5.87500000 10.85 0.0004

    V 1 7.04166667 7.04166667 13.00 0.0036

    COMHF*V 5 0.70833333 0.14166667 0.26 0.9256

  • 7/24/2019 Ejemplos SAS1

    13/81

    12

    Procedimiento ANOVA

    Informacin de Niveles de Clases

    Clase Nivel Valor

    COMVHF 12 V1H1F1 V1H1F2 V1H2F1 V1H2F2 V1H3F1 V1H3F2 V2H1F1 V2H1F2 V2H2F1 V2H2F2 V2H3F1

    V2H3F2

    Nmero de observaciones 24

    Variable Dependiente: Y

    Suma de

    Fuentes de Variacin GL Cuadrados Cuadrado Medio F Value Pr > F

    Modelo 11 30.79166667 2.79924242 2.62 0.0564Error 12 12.83333333 1.06944444

    Total Corregido 23 43.62500000

    R-Cuadrada Coef. Var. Raz CME Y Media

    0.705826 7.590014 1.034139 13.62500

    Fuentes de Variacin GL Anova SC Cuadrado Medio F Value Pr > F

    COMVHF 11 30.79166667 2.79924242 2.62 0.0564

    En este caso tenemos de que del primer anlisis de varianza se concluye que V y H si tienen diferencias

    significativas lo que quiere decir que al menos uno de sus efectos es diferente a los dems, mientras que F

    resulta que todos los tratamientos de fertilizantes foliares, todos causan el mismo efecto, y tambin se puede

    interpretar de que no existen interacciones en este experimento, puesto que todas se rechazan, en cuanto a

    las combinaciones se puede decir que la combinacin VH sali con diferencias significativas lo que quiere

    decir que no todas las combinaciones VH producen el mismo efecto, las combinaciones VF tambin salieron

    con diferencias significativas lo que quiere decir de que no todas las combinaciones producen el mismo efecto,

    al igual que las combinaciones HF con diferencias significativas, mientras que las combinaciones VHF es

    decir la combinacin de los tres factores no presenta diferencias significativas.

  • 7/24/2019 Ejemplos SAS1

    14/81

    13

    ANAVA de un Factorial de 3 en Bloques al Azar.

    Esto es cuando se tienen un gradiente de humedad del suelo, es para diferentes dosis de fertilizacin N-P-K

    en el cultivo de berenjena donde la variable respuesta es rendimiento de fruta en toneladas por hectrea.

    Para ver cual dosis de cada elemento y cul de sus combinaciones tiene el mejor rendimiento.

    Teniendo el siguiente programa en SAS:

    DATA F3BA1;

    INPUT Y N P K BLO CONP$ CONK$ COPK$ CONPK$;CARDS;

    130 1 1 1 1 N1P1 N1K1 P1K1 N1P1K1

    100 1 1 1 2 N1P1 N1K1 P1K1 N1P1K1

    130 1 1 1 3 N1P1 N1K1 P1K1 N1P1K1

    110 2 1 1 1 N2P1 N2K1 P1K1 N2P1K1

    100 2 1 1 2 N2P1 N2K1 P1K1 N2P1K1

    140 2 1 1 3 N2P1 N2K1 P1K1 N2P1K1

    150 1 2 1 1 N1P2 N1K1 P2K1 N1P2K1

    150 1 2 1 2 N1P2 N1K1 P2K1 N1P2K1

    190 1 2 1 3 N1P2 N1K1 P2K1 N1P2K1

    170 2 2 1 1 N2P2 N2K1 P2K1 N2P2K1

    190 2 2 1 2 N2P2 N2K1 P2K1 N2P2K1

    150 2 2 1 3 N2P2 N2K1 P2K1 N2P2K1

    120 1 1 2 1 N1P1 N1K2 P1K2 N1P1K2

    100 1 1 2 2 N1P1 N1K2 P1K2 N1P1K2

    130 1 1 2 3 N1P1 N1K2 P1K2 N1P1K2150 2 1 2 1 N2P1 N2K2 P1K2 N2P1K2

    130 2 1 2 2 N2P1 N2K2 P1K2 N2P1K2

    160 2 1 2 3 N2P1 N2K2 P1K2 N2P1K2

    180 1 2 2 1 N1P2 N1K2 P2K2 N1P2K2

    170 1 2 2 2 N1P2 N1K2 P2K2 N1P2K2

    160 1 2 2 3 N1P2 N1K2 P2K2 N1P2K2

    150 2 2 2 1 N2P2 N2K2 P2K2 N2P2K2

    200 2 2 2 2 N2P2 N2K2 P2K2 N2P2K2

    200 2 2 2 3 N2P2 N2K2 P2K2 N2P2K2

    ;

    PROC PRINT;

    PROC ANOVA;

    CLASS BLO N P K;

    MODEL Y=BLO N P N*P K N*K P*K N*P*K;

    PROC ANOVA;

    CLASS BLO CONP K;

    MODEL Y=BLO CONP K CONP*K;

    PROC ANOVA;

    CLASS BLO CONK P;

    MODEL Y=BLO CONK P CONK*P;

    PROC ANOVA;

    CLASS BLO COPK N;

    MODEL Y=BLO COPK N COPK*N;

    PROC ANOVA;

    CLASS CONPK;

    MODEL Y=CONPK;

    RUN;

    Obteniendo los siguientes resultados:

    Procedimiento ANOVA

    Informacin de Niveles de Clases

    Clase Nivel Valor

    BLO 3 1 2 3N 2 1 2

    P 2 1 2

    K 2 1 2

    Nmero de observaciones 24

    Variable Dependiente: Y

    Suma de

    Fuentes de Variacin GL Cuadrados Cuadrado Medio F Value Pr > F

    Modelo 9 16633.33333 1848.14815 5.07 0.0036

    Error 14 5100.00000 364.28571

    Total Corregido 23 21733.33333

    R-Cuadrada Coef. Var. Raz CME Y Media

    0.765337 12.86715 19.08627 148.3333

  • 7/24/2019 Ejemplos SAS1

    15/81

    14

    Fuentes de Variacin GL Anova SC Cuadrado Medio F Value Pr > F

    BLO 2 1033.33333 516.66667 1.42 0.2749

    N 1 816.66667 816.66667 2.24 0.1565

    P 1 13066.66667 13066.66667 35.87 F

    Modelo 9 16633.33333 1848.14815 5.07 0.0036

    Error 14 5100.00000 364.28571

    Total Corregido 23 21733.33333

    R-Cuadrada Coef. Var. Raz CME Y Media

    0.765337 12.86715 19.08627 148.3333

    Fuentes de Variacin GL Anova SC Cuadrado Medio F Value Pr > F

    BLO 2 1033.33333 516.66667 1.42 0.2749

    CONP 3 13900.00000 4633.33333 12.72 0.0003

    K 1 816.66667 816.66667 2.24 0.1565

    CONP*K 3 883.33333 294.44444 0.81 0.5101

    Procedimiento ANOVA

    Informacin de Niveles de Clases

    Clase Nivel Valor

    BLO 3 1 2 3

    CONK 4 N1K1 N1K2 N2K1 N2K2

    P 2 1 2

    Nmero de observaciones 24

    Variable Dependiente: Y

    Suma deFuentes de Variacin GL Cuadrados Cuadrado Medio F Value Pr > F

    Modelo 9 16633.33333 1848.14815 5.07 0.0036

    Error 14 5100.00000 364.28571

    Total Corregido 23 21733.33333

    R-Cuadrada Coef. Var. Raz CME Y Media

    0.765337 12.86715 19.08627 148.3333

    Fuentes de Variacin GL Anova SC Cuadrado Medio F Value Pr > F

    BLO 2 1033.33333 516.66667 1.42 0.2749

    CONK 3 2233.33333 744.44444 2.04 0.1540

    P 1 13066.66667 13066.66667 35.87 F

    Modelo 9 16633.33333 1848.14815 5.07 0.0036

    Error 14 5100.00000 364.28571

    Total Corregido 23 21733.33333

    R-Cuadrada Coef. Var. Raz CME Y Media

    0.765337 12.86715 19.08627 148.3333

    Fuentes de Variacin GL Anova SC Cuadrado Medio F Value Pr > FBLO 2 1033.33333 516.66667 1.42 0.2749

    COPK 3 13900.00000 4633.33333 12.72 0.0003

    N 1 816.66667 816.66667 2.24 0.1565

    COPK*N 3 883.33333 294.44444 0.81 0.5101

  • 7/24/2019 Ejemplos SAS1

    16/81

    15

    Procedimiento ANOVA

    Informacin de Niveles de Clases

    Clase Nivel Valor

    CONPK 8 N1P1K1 N1P1K2 N1P2K1 N1P2K2 N2P1K1 N2P1K2 N2P2K1 N2P2K2

    Nmero de observaciones 24

    Variable Dependiente: Y

    Suma de

    Fuentes de Variacin GL Cuadrados Cuadrado Medio F Value Pr > F

    Modelo 7 15600.00000 2228.57143 5.81 0.0017

    Error 16 6133.33333 383.33333Total Corregido 23 21733.33333

    R-Cuadrada Coef. Var. Raz CME Y Media

    0.717791 13.19926 19.57890 148.3333

    Fuentes de Variacin GL Anova SC Cuadrado Medio F Value Pr > F

    CONPK 7 15600.00000 2228.57143 5.81 0.0017

    En el ANAVA de este experimento podemos interpretar que en los elementos solos, solamente el P es el que

    presenta diferencias significativas es decir por lo menos un tratamiento se comporta de manera diferente a

    los dems en cuanto a rendimiento de berenjena mientras que N y K no presentaron diferencias significativas

    dentro del rendimiento de esta hortaliza, en cuanto a las interacciones, podemos decir que todas presentan

    la misma tendencia dentro de las dems es decir no existe interaccin, en cuanto a las combinaciones

    podemos mencionar que la combinacin NP tiene diferencias significativas, al igual que la PK es decir que al

    menos una combinacin causa un efecto diferente de las otras combinaciones, mientras que la combinacin

    NK no presenta dichas diferencias por lo que todas las combinaciones producen el mismo efecto en el

    rendimiento de este cultivo; mientras que la combinacin de los tres elementos tambin presenta diferencias

    significativas es decir al menos una combinacin causa un efecto diferente que a las dems combinaciones.

  • 7/24/2019 Ejemplos SAS1

    17/81

    16

    ANAVA en Parcelas Divididas en Completamente al Azar.

    En este tipo de diseos experimentales no todas las fuentes de variacin se prueban contra el error estndar,

    si es que existen dos errores, como SAS no lo hace por default hay que programarlo, en este ejemplo se

    evalu el rendimiento de lneas de maz en toneladas por hectrea, y dosis de nitrgeno, donde parcela grande

    es las lneas de maz y la parcela chica es las dosis de nitrgeno.

    El error A estar dado por el anidamiento de repeticiones en lneas es decir (R:L).

    Teniendo el siguiente programa de SAS:

    DATA PDCA1;

    INPUT Y R L N;

    CARDS;

    13.5 1 1 1

    11.0 2 1 1

    11.2 1 1 2

    10.9 2 1 2

    15.9 1 1 3

    15.7 2 1 3

    17.4 1 2 1

    19.6 2 2 1

    12.7 1 2 2

    11.6 2 2 2

    15.4 1 2 313.6 2 2 3

    18.5 1 3 1

    17.0 2 3 1

    15.1 1 3 2

    10.3 2 3 2

    19.2 1 3 3

    19.1 2 3 3

    ;

    PROC PRINT;

    PROC ANOVA;

    CLASS R L N;

    MODEL Y=L R(L) N L*N;

    TEST H=L E=R(L);

    RUN;

    Obteniendo los siguientes resultados:

    Procedimiento ANOVAInformacin de Niveles de Clases

    Clase Nivel Valor

    R 2 1 2

    L 3 1 2 3

    N 3 1 2 3

    Nmero de observaciones 18

    Variable Dependiente: Y

    Suma de

    Fuentes de Variacin GL Cuadrados Cuadrado Medio F Value Pr > F

    Modelo 11 157.1194444 14.2835859 7.10 0.0127

    Error 6 12.0766667 2.0127778

    Total Corregido 17 169.1961111

    R-Cuadrada Coef. Var. Raz CME Y Media

    0.928623 9.539422 1.418724 14.87222

    Fuentes de Variacin GL Anova SC Cuadrado Medio F Value Pr > F

    L 2 37.03444444 18.51722222 9.20 0.0149

    R(L) 3 8.40833333 2.80277778 1.39 0.3331

    N 2 76.28111111 38.14055556 18.95 0.0026

    L*N 4 35.39555556 8.84888889 4.40 0.0533

    Prueba de la Hiptesis Usando el ANOVA CM de R(L) como el Error tipo a

    Fuentes de Variacin GL Anova SC Cuadrado Medio F Value Pr > F

    L 2 37.03444444 18.51722222 6.61 0.0796

    En este ejemplo podemos observar que el factor L es decir lnea de maz es significativo, pero no est bien

    probado con el error dado por SAS por lo que se tiene que pedir que se pruebe contra otro error al cual le

    llamaremos error tipo a por lo que en este ejemplo podemos concluir de que L ya probado con el error tipo a

    no es significativo y N probado con el error de SAS el cual si est bien probado es significativo es decir no

  • 7/24/2019 Ejemplos SAS1

    18/81

    17

    todas las dosis de nitrgeno causan el mismo efecto en cuanto al rendimiento de las lneas de maz, y no

    existe interaccin lo que quiere decir que todas las dosis de N siguen la misma tendencia en cada lnea de

    maz.

  • 7/24/2019 Ejemplos SAS1

    19/81

    18

    ANAVA en Parcelas Divididas en Bloques al Azar.

    En este diseo al igual que el anterior es en parcelas divididas, pero esta est diseado en bloques al azar,

    es decir existe un gradiente de variacin en las unidades experimentales, pero hay que decir que adems de

    la parcela grande tambin bloques se prueba contra el error tipo a no contra el error que da SAS, teniendo

    para este ejemplo que tenemos como gradiente de variacin la salinidad del suelo, y como parcela grande

    variedades de jitomate y como parcela pequea dosis de nitrgeno, evaluando dentro de un invernadero

    hidropnico como variable respuesta rendimiento.

    Teniendo el siguiente programa de SAS:

    DATA PDBA1;

    INPUT Y BLO V N;

    CARDS;

    83.7 1 1 1

    107.8 1 1 2

    115.9 1 1 3

    120.6 1 1 4

    120.0 1 1 5

    90.5 1 2 1

    84.5 1 2 2

    84.9 1 2 3

    84.3 1 2 4

    85.2 1 2 5

    153.4 1 3 1

    61.4 1 3 2

    81.9 1 3 3

    72.9 1 3 4

    83.2 1 3 5

    85.8 2 1 1

    89.7 2 1 2

    105.9 2 1 3

    120.9 2 1 4

    105.8 2 1 5

    71.6 2 2 1

    82.6 2 2 2

    83.8 2 2 3

    105.8 2 2 4

    118.9 2 2 5

    58.4 2 3 170.7 2 3 2

    84.2 2 3 3

    78.7 2 3 4

    81.9 2 3 5

    72.5 3 1 1

    103.5 3 1 2

    95.2 3 1 3

    114.1 3 1 4

    126.4 3 1 5

    82.9 3 2 1

    80.3 3 2 2

    79.6 3 2 3

    87.3 3 2 4

    93.0 3 2 5

    55.7 3 3 1

    64.0 3 3 265.0 3 3 3

    75.8 3 3 4

    74.7 3 3 5

    84.0 4 1 1

    95.6 4 1 2

    82.6 4 1 3

    104.2 4 1 4

    119.0 4 1 5

    70.4 4 2 1

    79.4 4 2 2

    85.8 4 2 3

    83.6 4 2 4

    105.8 4 2 5

    48.7 4 3 1

    57.8 4 3 2

    64.3 4 3 3

    59.9 4 3 4

    64.3 4 3 5

    ;

  • 7/24/2019 Ejemplos SAS1

    20/81

    19

    PROC PRINT;

    PROC ANOVA;

    CLASS BLO V N;

    MODEL Y=BLO V N BLO*V V*N;

    TEST H=BLO V E=BLO*V;

    RUN;

    Obteniendo los siguientes resultados:

    Procedimiento ANOVA

    Informacin de Niveles de Clases

    Clase Nivel ValorBLO 4 1 2 3 4

    V 3 1 2 3

    N 5 1 2 3 4 5

    Nmero de observaciones 60

    Variable Dependiente: Y

    Suma de

    Fuentes de Variacin GL Cuadrados Cuadrado Medio F Value Pr > F

    Modelo 23 17389.63850 756.07124 3.59 0.0003

    Error 36 7586.49000 210.73583

    Total Corregido 59 24976.12850

    R-Cuadrada Coef. Var. Raz CME Y Media

    0.696250 16.58962 14.51674 87.50500

    Fuentes de Variacin GL Anova SC Cuadrado Medio F Value Pr > F

    BLO 3 1877.784500 625.928167 2.97 0.0446V 2 8896.693000 4448.346500 21.11 F

    BLO 3 1877.784500 625.928167 2.59 0.1478

    V 2 8896.693000 4448.346500 18.44 0.0027

    En este ejemplo podemos interpretar lo siguiente: que en lo que se refiere a bloques, todos los bloques causan

    el mismo efecto en cuanto al rendimiento, mientras que variedades y dosis de N si presentas diferencias

    significativas, pero las dosis de N presentan la misma tendencia en cada Variedad. Por lo que podemos decir

    que ni existe interaccin entre variedades y dosis de N.

  • 7/24/2019 Ejemplos SAS1

    21/81

    20

    ANAVA de una Serie de Experimentos en Bloques al Azar pero en Modelo Fijo.

    Esta se debe de realizar cuando se tengan diferentes experimentos sobre un mismo tema.

    Por ejemplo el siguiente se trata de un ensayo comparativo de cinco variedades de trigo, en dos campos

    diferentes y se toma como variable respuesta los rendimientos obtenidos en 5 repeticiones en bloque es decir

    5 bloques diferentes:

    Teniendo el siguiente programa de SAS:

    OPTIONS NODATE NOCENTER;

    DATA SEBA1;

    INPUT Y V L BLO;

    CARDS;

    48 1 1 1

    51 1 1 2

    38 1 1 3

    43 1 1 4

    43 1 1 5

    50 2 1 1

    51 2 1 2

    38 2 1 3

    46 2 1 4

    36 2 1 5

    42 3 1 1

    42 3 1 236 3 1 3

    40 3 1 4

    35 3 1 5

    46 4 1 1

    49 4 1 2

    45 4 1 3

    47 4 1 4

    29 4 1 5

    45 5 1 1

    46 5 1 2

    39 5 1 3

    38 5 1 4

    36 5 1 5

    41 1 2 1

    36 1 2 2

    36 1 2 3

    46 1 2 4

    37 1 2 5

    48 2 2 1

    30 2 2 2

    35 2 2 3

    32 2 2 4

    20 2 2 5

    56 3 2 1

    54 3 2 2

    31 3 2 3

    37 3 2 4

    31 3 2 5

    47 4 2 1

    46 4 2 2

    33 4 2 3

    39 4 2 4

    46 4 2 543 5 2 1

    25 5 2 2

    33 5 2 3

    39 5 2 4

    31 5 2 5

    ;

    PROC PRINT;

    PROC ANOVA; BY L;

    CLASS BLO V;

    MODEL Y= BLO V;

    PROC ANOVA;

    CLASS BLO L V;

    MODEL Y=L V L*V BLO(L);

    RUN;

  • 7/24/2019 Ejemplos SAS1

    22/81

    21

    Obteniendo los siguientes resultados:Primero por localidades, luego general.

    Localidad 1

    Procedimiento ANOVA

    Informacin de Niveles de Clases

    Clase Nivel Valor

    BLO 5 1 2 3 4 5

    V 5 1 2 3 4 5

    Nmero de observaciones 25

    Variable Dependiente: Y

    Suma deFuentes de Variacin GL Cuadrados Cuadrado Medio F Value Pr > F

    Modelo 8 601.9200000 75.2400000 6.48 0.0008

    Error 16 185.8400000 11.6150000

    Total Corregido 24 787.7600000

    R-Cuadrada Coef. Var. Raz CME Y Media

    0.764091 8.045511 3.408079 42.36000

    Fuentes de Variacin GL Anova SC Cuadrado Medio F Value Pr > F

    BLO 4 487.7600000 121.9400000 10.50 0.0002

    V 4 114.1600000 28.5400000 2.46 0.0877

    Localidad 2

    Procedimiento ANOVA

    Informacin de Niveles de Clases

    Clase Nivel ValorBLO 5 1 2 3 4 5

    V 5 1 2 3 4 5

    Nmero de observaciones 25

    Variable Dependiente: Y

    Suma de

    Fuentes de Variacin GL Cuadrados Cuadrado Medio F Value Pr > F

    Modelo 8 993.280000 124.160000 2.47 0.0589

    Error 16 804.560000 50.285000

    Total Corregido 24 1797.840000

    R-Cuadrada Coef. Var. Raz CME Y Media

    0.552485 18.62183 7.091192 38.08000

    Fuentes de Variacin GL Anova SC Cuadrado Medio F Value Pr > F

    BLO 4 628.6400000 157.1600000 3.13 0.0445V 4 364.6400000 91.1600000 1.81 0.1757

    General del experimento

    Procedimiento ANOVA

    Informacin de Niveles de Clases

    Clase Nivel Valor

    BLO 5 1 2 3 4 5

    L 2 1 2

    V 5 1 2 3 4 5

    Nmero de observaciones 50

    Variable Dependiente: Y

    Suma de

    Fuentes de Variacin GL Cuadrados Cuadrado Medio F Value Pr > F

    Modelo 17 1824.180000 107.304706 3.47 0.0012

    Error 32 990.400000 30.950000

    Total Corregido 49 2814.580000

    R-Cuadrada Coef. Var. Raz CME Y Media

    0.648118 13.83210 5.563272 40.22000

    Fuentes de Variacin GL Anova SC Cuadrado Medio F Value Pr > F

    L 1 228.980000 228.980000 7.40 0.0105

    V 4 190.280000 47.570000 1.54 0.2151

    L*V 4 288.520000 72.130000 2.33 0.0771

    BLO(L) 8 1116.400000 139.550000 4.51 0.0010

    En este tipo de experimentos primero se evala como un simple bloques al azar por cada localidad, y despus

    se evala junto, por lo que podemos decir que en la localidad 1 solo existen diferencias significativas en cuanto

    a los bloques, no en cuanto a las variedades de trigo, de igual manera se presenta la localidad 2 es decir

    solamente los bloque presentan diferencias significativas, no variedades, en cuanto al general podemos decir

    que localidades si presenta diferencias significativas, es decir son diferentes, as tambin son significativos

  • 7/24/2019 Ejemplos SAS1

    23/81

    22

    los bloques anidados en localidades, lo que pudimos ver al correr los datos por localidad. Tanto las variedades

    como la interaccin localidades por variedades, no son significativos, estamos tomando en cuenta que es un

    modelo fijo por lo que todas las hiptesis se prueban con el error experimental.

  • 7/24/2019 Ejemplos SAS1

    24/81

    23

    ANAVA de una Serie de Experimentos en Bloques al Azar pero en Modelo Aleatorio.

    Esto es cuando todas las F. V. son aleatorias, para este caso no todas las F. V. para obtener Fcse prueban

    contra el error experimental para SAS por lo que hay que hacer pruebas, segn la F. V. por sus componentes

    de Varianza, es decir su Esperanza de Cuadrado Medio.

    Por lo que se tendra el siguiente programa en SAS:

    OPTIONS NODATE NOCENTER;

    DATA SEBA1;INPUT Y V L BLO;

    CARDS;

    48 1 1 1

    51 1 1 2

    38 1 1 3

    43 1 1 4

    43 1 1 5

    50 2 1 1

    51 2 1 2

    38 2 1 3

    46 2 1 4

    36 2 1 5

    42 3 1 1

    42 3 1 2

    36 3 1 3

    40 3 1 435 3 1 5

    46 4 1 1

    49 4 1 2

    45 4 1 3

    47 4 1 4

    29 4 1 5

    45 5 1 1

    46 5 1 2

    39 5 1 3

    38 5 1 4

    36 5 1 5

    41 1 2 1

    36 1 2 2

    36 1 2 3

    46 1 2 4

    37 1 2 5

    48 2 2 1

    30 2 2 2

    35 2 2 3

    32 2 2 4

    20 2 2 5

    56 3 2 1

    54 3 2 2

    31 3 2 3

    37 3 2 4

    31 3 2 5

    47 4 2 1

    46 4 2 2

    33 4 2 3

    39 4 2 4

    46 4 2 5

    43 5 2 1

    25 5 2 233 5 2 3

    39 5 2 4

    31 5 2 5

    ;

    PROC PRINT;

    PROC ANOVA;

    CLASS BLO L V;

    MODEL Y=L V L*V BLO(L);

    TEST H=V E=L*V;

    RUN;

  • 7/24/2019 Ejemplos SAS1

    25/81

    24

    Obteniendo los siguientes resultados:

    Procedimiento ANOVA

    Informacin de Niveles de Clases

    Clase Nivel Valor

    BLO 5 1 2 3 4 5

    L 2 1 2

    V 5 1 2 3 4 5

    Nmero de observaciones 50

    Variable Dependiente: Y

    Suma de

    Fuentes de Variacin GL Cuadrados Cuadrado Medio F Value Pr > F

    Modelo 17 1824.180000 107.304706 3.47 0.0012

    Error 32 990.400000 30.950000

    Total Corregido 49 2814.580000

    R-Cuadrada Coef. Var. Raz CME Y Media

    0.648118 13.83210 5.563272 40.22000

    Fuentes de Variacin GL Anova SC Cuadrado Medio F Value Pr > F

    L 1 228.980000 228.980000 7.40 0.0105

    V 4 190.280000 47.570000 1.54 0.2151

    L*V 4 288.520000 72.130000 2.33 0.0771

    BLO(L) 8 1116.400000 139.550000 4.51 0.0010

    Prueba de Hiptesis usando el CM de L*V como el trmino del Error

    Fuentes de Variacin GL Anova SC Cuadrado Medio F Value Pr > F

    V 4 190.2800000 47.5700000 0.66 0.6517

    En este caso aunque se prob a la F. V. Variedades, con la interaccin L*V no es significativa pero tambin

    hay que decir que el termino Lugares no tiene termino para probarlo por lo que se dice que No Existe Prueba

    Exacta (NEPE)., y solo estn bien probados con el Error Experimental de SAS L*V y BLO(L) y de estas

    solamente bloques anidados en lugares tiene diferencias significativas, con un alfa igual a 0.05 es decir con

    el 5% de probabilidad de equivocarnos

  • 7/24/2019 Ejemplos SAS1

    26/81

    25

    Componentes de Varianza de una Serie de Experimentos en Bloques al Azar.

    Esto es para calculas los estimadores de Varianza para ver la confiabilidad de los datos obtenidos en campo,

    por lo que varianzas negativas se supone que no son confiables puesto que por ser cuadrados no puede

    haber negativos, por lo que si tenemos varianzas negativas debemos no utilizar los datos para realizar el

    Anlisis Estadstico.

    Para este procedimiento el programa de SAS es el siguiente:

    DATA SEBA1;

    INPUT Y V L BLO;

    CARDS;

    48 1 1 1

    51 1 1 2

    38 1 1 3

    43 1 1 4

    43 1 1 5

    50 2 1 1

    51 2 1 2

    38 2 1 3

    46 2 1 4

    36 2 1 5

    42 3 1 1

    42 3 1 2

    36 3 1 340 3 1 4

    35 3 1 5

    46 4 1 1

    49 4 1 2

    45 4 1 3

    47 4 1 4

    29 4 1 5

    45 5 1 1

    46 5 1 2

    39 5 1 3

    38 5 1 4

    36 5 1 5

    41 1 2 1

    36 1 2 2

    36 1 2 3

    46 1 2 4

    37 1 2 5

    48 2 2 1

    30 2 2 2

    35 2 2 3

    32 2 2 4

    20 2 2 5

    56 3 2 1

    54 3 2 2

    31 3 2 3

    37 3 2 4

    31 3 2 5

    47 4 2 1

    46 4 2 2

    33 4 2 3

    39 4 2 4

    46 4 2 5

    43 5 2 125 5 2 2

    33 5 2 3

    39 5 2 4

    31 5 2 5

    ;

    PROC PRINT;

    PROC VARCOMP;

    CLASS BLO L V;

    MODEL Y=L V L*V BLO(L);

    RUN;

    Obteniendo los siguientes resultados:

    Procedimiento de Estimacin de Componentes de Varianza

    Informacin de Niveles de Clases

    Clase Nivel Valor

    BLO 5 1 2 3 4 5

    L 2 1 2

    V 5 1 2 3 4 5

    Nmero de observaciones 50

  • 7/24/2019 Ejemplos SAS1

    27/81

    26

    MIVQUE(0) Matriz de SC

    Fuente de Variacin L V L*V

    L 625.00000 2.7719E-30 125.00000

    V 2.7719E-30 400.00000 200.00000

    L*V 125.00000 200.00000 225.00000

    BLO(L) 125.00000 9.3459E-31 25.00000

    Error 25.00000 40.00000 45.00000

    MIVQUE(0) Matriz de SC

    Fuente de Variacin BLO(L) Error YL 125.00000 25.00000 5724.5

    V 9.3459E-31 40.00000 1902.8

    L*V 25.00000 45.00000 3538.9

    BLO(L) 225.00000 45.00000 6726.9

    Error 45.00000 49.00000 2814.6

    Procedimiento de Estimacin de Componentes de Varianza

    MIVQUE(0) Estimados

    Componente de Varianza Y

    Var(L) 1.93000

    Var(V) -2.45600

    Var(L*V) 8.23600

    Var(BLO(L)) 21.72000

    Var(Error) 30.95000

    En este caso en especial tenemos que la varianza estimada de V es negativa por lo que hay que checar los

    datos porque probablemente exista un error en la toma o en la trascripcin, si no diramos que los datos no

    son confiables y por lo tanto no se deben utilizar para realizar algn anlisis estadstico.

  • 7/24/2019 Ejemplos SAS1

    28/81

    27

    ANAVA de un Diseo Experimental Ltice.

    Este diseo se utiliza cuando se tienen bloques incompletos para poder formar los bloques completos, como

    repeticiones, este solo se puede hacerse si el nmero de tratamientos es un cuadrado perfecto excepto para

    el cuadrado de 6.

    En este caso tenemos un ltice 7 por 7 del cual la variable respuesta es rendimiento, este experimento fue

    realizado en variedades de trigo y triticale con un gradiente de variacin para bloques de fertilidad de suelos

    y un nmero base para K de 7; y un =1 es decir 49 tratamientos que son las variedades de trigo y triticale 7

    unidades experimentales por bloque incompleto los primeros 35 tratamientos son de trigo y los restantes de

    triticale, se utilizaron dos repeticiones.

    Teniendo el siguiente programa de SAS:

    data latice1;

    input group block treatment y;

    cards;

    1 5 1 2782

    2 7 1 3145

    1 3 2 2281

    2 1 2 2106

    1 7 3 2509

    2 7 3 2825

    1 7 4 3131

    2 1 4 2775

    1 6 5 1866

    2 3 5 1155

    1 4 6 2092

    2 1 6 3188

    1 7 7 3335

    2 4 7 2795

    1 2 8 2669

    2 6 8 2947

    1 5 9 2574

    2 6 9 1672

    1 4 10 2399

    2 7 10 3418

    1 2 11 3522

    2 7 11 29141 2 12 3617

    2 5 12 2235

    1 1 13 3501

    2 7 13 3462

    1 3 14 2992

    2 5 14 2928

    1 6 15 2681

    2 7 15 2633

    1 4 16 2414

    2 2 16 2971

    1 3 17 2514

    2 6 17 3140

    1 3 18 2758

    2 3 18 2431

    1 7 19 3909

    2 3 19 28121 5 20 3227

    2 4 20 3159

    1 6 21 3346

    2 6 21 3439

    1 6 22 3798

    2 4 22 3389

    1 6 23 3270

    2 2 23 3387

    1 1 24 3505

    2 4 24 2776

    1 1 25 2838

    2 3 25 2841

    1 2 26 3206

    2 3 26 2339

    1 5 27 2799

    2 2 27 3315

    1 4 28 29092 6 28 2931

    1 6 29 2542

    2 1 29 3272

    1 2 30 1333

  • 7/24/2019 Ejemplos SAS1

    29/81

    28

    2 4 30 2883

    1 1 31 3002

    2 5 31 3199

    1 3 32 2712

    2 7 32 3295

    1 1 33 2806

    2 6 33 2053

    1 7 34 3020

    2 6 34 2275

    1 1 35 3286

    2 2 35 40331 1 36 3056

    2 1 36 3182

    1 4 37 2815

    2 5 37 3089

    1 2 38 3119

    2 2 38 3130

    1 2 39 2780

    2 1 39 2254

    1 4 40 1902

    2 3 40 2662

    1 6 41 3354

    2 5 41 3280

    1 5 42 3506

    2 1 42 3949

    1 7 43 3102

    2 5 43 3250

    1 7 44 3541

    2 2 44 3772

    1 5 45 1878

    2 5 45 1692

    1 5 46 3081

    2 3 46 3237

    1 4 47 2476

    2 4 47 2506

    1 3 48 1944

    2 4 48 2864

    1 3 49 2381

    2 2 49 2456

    ;

    proc print;

    proc lattice;

    run;

    Obteniendo los siguientes resultados:El procedimiento Ltice

    Anlisis de Varianza para y

    Suma de Cuadrado

    Fuente de Variacin GL Cuadrados Medio

    Repeticiones 1 19461 19461

    Bloques dentro de Repeticiones (Ajus.) 12 2899741 241645

    Componente B 12 2899741 241645

    Tratamientos (Sin ajus.) 48 21493124 447773

    Error Intra Bloque 36 5825300 161814

    Error Efectivo del Bloque Completo 48 8725041 181772

    Total 97 30237625 311728

    Estadsticas Adicionales para y

    Descripcin Valor

    Varianza de Diferencia 161814

    LSD con =0.01 1078.95

    LSD con =0.05 808.80

    Eficiencia Relativa de RCBD 103.76

    SAS solamente da algunos resultados para la operacin ltice pero los datos restantes hay que hacerlos a

    mano, como lo son las Fcpara ver si se rechaza o no la H 0para realizarlo se utilizan los datos ya antes

    obtenidos por SAS por lo que para conseguir la Fc se divide el cuadro medio de tratamientos entre el cuadrado

    medio del error efectivo y para la F tse obtiene Buscando a F con los grados de libertad de tratamientos en el

    numerador y los grados de libertad del error intrabloque y un en este caso 0.05.

    Quedando que la Fc= 447773/181772= 2.46 y tenemos una Ft= 4.69 tomando en cuenta que en las tablas

    tenemos solamente 40 grados de libertad en lugar de 48 y 36 puesto que no existen tablas con estos valores,

  • 7/24/2019 Ejemplos SAS1

    30/81

    29

    lo que obtenemos es que no se rechaza H0por lo que no existe diferencia entre tratamientos, pero como la

    eficiencia relativa es menor al 110% no podemos realizar el anlisis en bloque al azar donde grupos

    (repeticiones) es bloque, por lo que tenemos que dejar de esta manera el anlisis estadstico.

  • 7/24/2019 Ejemplos SAS1

    31/81

    30

    ANACOVA en Diseo Experimental Completamente al Azar

    Este anlisis se realiza cuando adems de la variable respuesta tenemos una covariable que es aquella que

    no es afectada por los tratamientos, en este ejemplo tenemos como variable respuesta rendimiento de una

    huerta de Durazno, la covariable es grosor de la rama tratada, y los tratamientos son dosis de un fertilizante

    foliar orgnico.

    Teniendo el siguiente programa de SAS:

    DATA ANACOCA2;

    INPUT X Y T;

    CARDS;

    25.0 22.0 1

    24.5 21.5 2

    27.0 18.6 3

    23.1 23.0 1

    22.8 22.6 2

    20.0 19.8 3

    25.2 25.0 1

    21.0 24.0 2

    23.4 21.0 3

    20.0 25.5 1

    20.3 23.8 2

    24.0 22.5 3

    ;PROC PRINT;

    PROC GLM;

    CLASS T;

    MODEL Y=T X;

    LSMEANS T;

    RUN;

    Obteniendo los siguientes resultados:

    Procedimiento GLM

    Informacin de Niveles de Clases

    Clase Nivel Valor

    T 3 1 2 3

    Nmero de observaciones 12

    Variable Dependiente: Y

    Suma de

    Fuentes de Variacin GL Cuadrados Cuadrado Medio F Value Pr > FModelo 3 29.60682387 9.86894129 5.00 0.0306

    Error 8 15.80234280 1.97529285

    Total Corregido 11 45.40916667

    R-Cuadrada Coef. Var. Raz CME Y Media

    0.652001 6.262686 1.405451 22.44167

    Fuentes de Variacin GL SC Tipo I Cuadrado Medio F Value Pr > F

    T 2 24.82666667 12.41333333 6.28 0.0229

    X 1 4.78015720 4.78015720 2.42 0.1584

    Fuentes de Variacin GL SC Tipo III Cuadrado Medio F Value Pr > F

    T 2 22.26403038 11.13201519 5.64 0.0297

    X 1 4.78015720 4.78015720 2.42 0.1584

    Procedimiento GLM

    Cuadrado Medio Mnimo

    T Y LSMEAN

    1 23.9652342

    2 22.7118169

    3 20.6479489

    Para este caso en especial, se concluye de que tratamientos tiene diferencias significativas tanto en los datos

    normales como en los datos ajustados, pero la covariable no tiene influencia en la variable respuesta, si lo

    hubiera se toma la Pr > F de los datos ajustados, si no como es este caso se toma de los datos originales.

  • 7/24/2019 Ejemplos SAS1

    32/81

    31

    ANACOVA en diseo Experimental Bloques al Azar.

    Este anlisis se realiza cuando adems de la variable respuesta tenemos una covariable que es aquella que

    no es afectada por los tratamientos, en este ejemplo tenemos como variable respuesta rendimiento en una

    huerta de mango y la covariable es el grueso del tronco del rbol y los tratamientos son dosis de paclobutrazol

    y un gradiente de variacin de humedad en el suelo.

    Teniendo el siguiente programa de SAS:

    DATA ANACOBA1;

    INPUT X Y TRA BLO;

    CARDS;

    20.0 12.0 1 1

    19.5 11.5 2 1

    22.0 08.6 3 1

    18.0 13.0 1 2

    17.8 12.6 2 2

    15.0 09.8 3 2

    20.0 15.0 1 3

    16.0 14.0 2 3

    18.0 11.0 3 3

    15.0 15.5 1 4

    15.0 13.8 2 4

    19.0 12.5 3 4

    ;PROC PRINT;

    PROC GLM;

    CLASS TRA BLO;

    MODEL Y=BLO TRA X;

    LSMEANS TRA;

    RUN;

    Obteniendo los siguientes resultados:

    Procedimiento GLM

    Informacin de Niveles de Clases

    Clase Nivel Valor

    TRA 3 1 2 3

    BLO 4 1 2 3 4

    Nmero de observaciones 12

    Variable Dependiente: Y

    Suma deFuentes de Variacin GL Cuadrados Cuadrado Medio F Value Pr > F

    Modelo 6 44.39176243 7.39862707 36.36 0.0006

    Error 5 1.01740424 0.20348085

    Total Corregido 11 45.40916667

    R-Cuadrada Coef. Var. Raz CME Y Media

    0.977595 3.625628 0.451089 12.44167

    Fuentes de Variacin GL SC Tipo I Cuadrado Medio F Value Pr > F

    BLO 3 19.39583333 6.46527778 31.77 0.0011

    TRA 2 24.82666667 12.41333333 61.00 0.0003

    X 1 0.16926243 0.16926243 0.83 0.4036

    Fuentes de Variacin GL SC Tipo III Cuadrado Medio F Value Pr > F

    BLO 3 14.49515300 4.83171767 23.75 0.0022

    TRA 2 24.77225276 12.38612638 60.87 0.0003X 1 0.16926243 0.16926243 0.83 0.4036

    Procedimiento GLM

    Cuadrado Medio Mnimo

    TRA Y LSMEAN

    1 13.8486418

    2 13.0490879

    3 10.4272703

    Esto ltimo es para poder hacer pruebas de medias.

    En este anlisis podemos concluir que tanto los bloques como los tratamientos son significativamente

    diferentes pero la covariable no es significativa, esto es tanto en los valores normales como en los valoresajustados, esto quiere decir que tanto los tratamientos de paclobutrazol como los bloque que son por la

    humedad en el suelo, son significativos, no as el dimetro del tronco.

  • 7/24/2019 Ejemplos SAS1

    33/81

    32

    Prueba de Comparacin de Medias DMS (LSD).

    Esta prueba nos muestra en anlisis de varianza las diferencias que existen entre las medias de los

    tratamientos de todos los diseos bsicos y de los factoriales.

    En este caso ocuparemos el ejemplo del problema de completamente al azar.

    Teniendo el siguiente programa para SAS:

    DATA CA2;

    INPUT Y T;CARDS;

    34.4 1

    27.3 1

    65.0 1

    31.3 1

    48.5 1

    38.4 1

    40.5 1

    25.0 2

    23.2 2

    45.2 2

    26.4 2

    26.8 2

    32.7 2

    28.8 2

    20.9 322.2 3

    27.8 3

    19.6 3

    20.1 3

    22.1 3

    19.7 3

    19.7 4

    21.7 4

    21.1 4

    18.5 4

    16.0 4

    20.2 4

    21.2 4

    ;

    PROC PRINT;

    PROC ANOVA;

    CLASS T;

    MODEL Y=T;

    MEANS T /LSD ALPHA=0.05

    MEANS T /LSD ALPHA=0.01

    RUN;

    Obteniendo los siguientes resultados:

    Procedimiento ANOVA

    Prueba t (LSD) para Y

    Alpha 0.05

    Grados de Libertad del Error 24

    Cuadrado Medio del Error 57.11155

    Valor Crtico de t 2.06390

    Diferencia Mnima Significativa 8.3371

    Medias con la misma letra no tienen diferencias significativas.

    Groupo t Media N T

    A 40.771 7 1

    B 29.729 7 2

    C B 21.771 7 3

    C 19.771 7 4

    En este caso en particular podemos decir que el mejor tratamiento es el nmero 1, seguido del nmero 2 pero

    sin superar al nmero 3 y que el cuatro sin ser superado por el tres es el peor tratamiento, este es

    considerando un 5% de error es decir con esa probabilidad de equivocarnos en la comparacin

  • 7/24/2019 Ejemplos SAS1

    34/81

    33

    Procedimiento ANOVA

    Prueba t (LSD) para Y

    Alpha 0.01

    Grados de Libertad del Error 24

    Cuadrado Medio del Error 57.11155

    Valor Crtico de t 2.79694

    Diferencia Mnima Significativa 11.298

    Medias con la misma letra no tienen diferencias significativas.

    Groupo t Media N T

    A 40.771 7 1

    B A 29.729 7 2

    B 21.771 7 3

    B 19.771 7 4

    Este es el mismo experimento pero solamente que ahora se le da un valor de alfa diferente, es decir que en

    este ejemplo tenemos la probabilidad de equivocarnos del 1% en lugar del anterior que es del 5% por lo que

    podemos decir que el tratamiento 1 es el mejor pero sin superar estadsticamente al tratamiento 2, mientras

    que los tratamientos 2, 3 y 4 no presentan diferencias estadsticas.

  • 7/24/2019 Ejemplos SAS1

    35/81

    34

    Prueba de comparacin de Medias Tukey.

    Esta es la prueba ms segura puesto que es la ms precisa, pero solo sirve para pruebas balanceadas.

    En este caso utilizaremos el ejemplo de bloques al azar.

    Teniendo el siguiente programa de SAS:

    DATA BA1;

    INPUT Y T B;

    CARDS;

    10.1 1 1

    8.9 1 2

    2.6 1 3

    7.4 1 4

    0.8 1 5

    9.2 2 1

    9.3 2 2

    3.1 2 3

    6.0 2 4

    1.2 2 5

    4.9 3 1

    5.2 3 2

    1.9 3 3

    5.4 3 4

    0.1 3 5

    ;

    PROC PRINT;PROC ANOVA;

    CLASS T B;

    MODEL Y=T B;

    MEANS Y B/TUKEY ALPHA=0.05;

    MEANS Y B/TUKEY ALPHA=0.01;

    RUN;

    Obteniendo los siguientes resultados:

    Procedimiento ANOVA

    Prueba de Rango Studentizado de Tukey (HSD) para Y

    Alpha 0.05

    Grados de libertad del Error 8

    Cuadrado Medio del Error 1.306833

    Valor Critico del Rango Studentizado 4.04101

    Diferencia Mnima Significativa 2.0659

    Medias con la misma letra no presentan diferencias significativas.

    Grupo

    Tukey Medias N T

    A 5.9600 5 1

    A 5.7600 5 2

    B 3.5000 5 3

    Procedimiento ANOVA

    Prueba de Rango Studentizado de Tukey (HSD) para Y

    Alpha 0.05

    Grados de libertad del Error 8

    Cuadrado Medio del Error 1.306833

    Valor Critico del Rango Studentizado 4.88575

    Diferencia Mnima Significativa 3.2246

    Medias con la misma letra no presentan diferencias significativas.

    Grupo

    Tukey Medias N B

    A 8.0667 3 1

    A 7.8000 3 2

    A 6.2667 3 4

    B 2.5333 3 3

    B 0.7000 3 5

    En este ejemplo por ser bloques al azar podemos observar de que existe una prueba para tratamientos y otra

    para bloques, en el primero nos menciona que con una probabilidad de error tipo I de un 5% tenemos que el

    tratamiento 1 sin superar al tratamiento 2 son los mejores, mientras que el tres si presenta diferencias con los

    otros dos. En cuanto a bloques podemos decir que el mejor es el 1 sin superar al 2 y al 4 pero el 3 y el 5 son

    los peores bloques.

  • 7/24/2019 Ejemplos SAS1

    36/81

    35

    Procedimiento ANOVA

    Prueba de Rango Studentizado de Tukey (HSD) para Y

    Alpha 0.01

    Grados de Libertad del Error 8

    Cuadrado Medio del Error 1.306833

    Valor crtico del Rango Studentizado 5.63531

    Diferencia Mnima Significativa 2.881

    Medias con la misma letra no presentan diferencias significativas.

    Grupo

    Tukey Medias N T

    A 5.9600 5 1

    A 5.7600 5 2

    A 3.5000 5 3

    Procedimiento ANOVA

    Prueba de Rango Studentizado de Tukey (HSD) para Y

    Alpha 0.01

    Grados de libertad del Error 8

    Cuadrado Medio del Error 1.306833

    Valor Critico del Rango Studentizado 6.62515

    Diferencia Mnima Significativa 4.3727

    Medias con la misma letra no presentan diferencias significativas.

    Grupo

    Tukey Medias N B

    A 8.0667 3 1

    A 7.8000 3 2

    B A 6.2667 3 4

    B C 2.5333 3 3

    C 0.7000 3 5

    En este caso es la misma prueba que el anterior pero ahora con una probabilidad de error del 1%, por lo que

    tenemos que tratamientos no presentan diferencias significativas, lo que quiere decir que todos los

    tratamientos son iguales, mientras que en bloques tenemos tres grupos Tukey los mejores son el bloque 1 si

    superar al 2 y al 4 pero el 4 no supera al 3 y el 5 es el peor pero sin ser superado estadsticamente del 3.

  • 7/24/2019 Ejemplos SAS1

    37/81

    36

    Pruebas de Comparacin de Medias de Rangos Mltiple de Duncan.

    Es una de las pruebas ms utilizadas en experimentos en frutales, sobre todo para la comparacin de medias

    de tratamientos para adelantar cosecha en Mango, el problema de esta prueba es que no es tan estricta como

    Tukey pero s bastante confiable.

    La utilizaremos en un ejemplo en Completamente al Azar.

    Para lo que tenemos el siguiente Programa de SAS:

    DATA CA2;

    INPUT Y T;

    CARDS;

    34.4 1

    27.3 1

    65.0 1

    31.3 1

    48.5 1

    38.4 1

    40.5 1

    25.0 2

    23.2 2

    45.2 2

    26.4 2

    26.8 2

    32.7 228.8 2

    20.9 3

    22.2 3

    27.8 3

    19.6 3

    20.1 3

    22.1 3

    19.7 3

    19.7 4

    21.7 4

    21.1 4

    18.5 4

    16.0 4

    20.2 4

    21.2 4

    ;

    PROC PRINT;

    PROC ANOVA;

    CLASS T;

    MODEL Y=T;

    MEANS T /DUNCAN ALPHA=0.05;

    MEANS T /DUNCAN ALPHA=0.01;

    RUN;

    Obteniendo los siguientes resultados:

    Procedimiento ANOVA

    Prueba de Rangos Mltiples de Duncan para Y

    Alpha 0.05

    Grados de Libertad del Error 24

    Cuadrado Medio del Error 57.11155

    Nmero de Medias 2 3 4

    Rango Crtico 8.337 8.756 9.026

    Medias con la misma letra no presentan diferencias significativas

    Grupo

    Duncan Medias N T

    A 40.771 7 1

    B 29.729 7 2

    C B 21.771 7 3

    C 19.771 7 4

    En esta prueba es con alfa igual a 0.05, y podemos observar que el tratamiento 1 es el mejor y no lo igualan

    estadsticamente los dems tratamientos, en segundo lugar el tratamiento 2 pero sin superar estadsticamente

    al 3, y el peor es el tratamiento 4 pero sin ser superado estadsticamente con el tres, como ya se dijo esta es

    una prueba de rangos mltiples lo que quiere decir de que por ejemplo para comparar el tratamiento 1 con eltres se cuentan los tratamientos que se Encuentran all obviamente contando los que vamos a comparar en

  • 7/24/2019 Ejemplos SAS1

    38/81

    37

    este caso 3 entonces se toma el valor critico de nmero de medias 3 y si la diferencia es superior a este valor

    entonces son diferentes estadsticamente.

    Procedimiento ANOVA

    Prueba de Rangos Mltiples de Duncan para Y

    Alpha 0.01

    Grados de Libertad del Error 24

    Cuadrado Medio del Error 57.11155

    Nmero de Medias 2 3 4

    Rango Crtico 11.30 11.78 12.11

    Medias con la misma letra no presentan diferencias significativas

    Grupo

    Duncan Medias N T

    A 40.771 7 1

    B A 29.729 7 2

    B 21.771 7 3

    B 19.771 7 4

    En este caso con un alfa de 0.01 solamente tenemos dos grupos Duncan el primero con el mejor tratamiento

    que es el 1 sin superar estadsticamente al 2 pero el 2, 3 y 4 no presentan diferencias significativas

    estadsticamente hablando.

  • 7/24/2019 Ejemplos SAS1

    39/81

    38

    Prueba de Comparacin de Medias SNK (Student-Newman-Keuls).

    Esta es muy parecida a la prueba de rangos mltiples de Duncan pero solamente que esta ocupa las tablas

    de Tukey para obtener la diferencia mnima significativa

    Utilizando el mismo ejemplo de Duncan en completamente al Azar.

    Teniendo el siguiente programa de SAS:

    DATA CA2;

    INPUT Y T;CARDS;

    34.4 1

    27.3 1

    65.0 1

    31.3 1

    48.5 1

    38.4 1

    40.5 1

    25.0 2

    23.2 2

    45.2 2

    26.4 2

    26.8 2

    32.7 2

    28.8 2

    20.9 322.2 3

    27.8 3

    19.6 3

    20.1 3

    22.1 3

    19.7 3

    19.7 4

    21.7 4

    21.1 4

    18.5 4

    16.0 4

    20.2 4

    21.2 4

    ;

    PROC PRINT;

    PROC ANOVA;

    CLASS T;

    MODEL Y=T;

    MEANS T/ SNK ALPHA=0.05;

    MEANS T/ SNK ALPHA=0.01;

    RUN;

    Obteniendo los siguientes resultados:

    Procedimiento ANOVA

    Prueba Student-Newman-Keuls para Y

    Alpha 0.05

    Grados de Libertad del Error 24

    Cuadrado Medio del Error 57.11155

    Nmero de Medias 2 3 4

    Rango Crtico 8.3371399 10.0878 11.143415

    Medias con la misma letra no presentan diferencias significativas

    Grupo

    SNK Media N T

    A 40.771 7 1

    B 29.729 7 2

    B 21.771 7 3

    B 19.771 7 4

    En este caso y con un alfa del 0.05 podemos decir que el tratamiento 1 es el mejor tratamiento, y el 2, 3 y 4

    no presentan diferencias significativas entre ellos, se sigue el mismo procedimiento que para la prueba de

    Duncan pero solamente que el valor crtico, es decir la diferencia mnima significativa, son diferentes a

    Duncan, puesto que esta utiliza las tablas de Tukey.

  • 7/24/2019 Ejemplos SAS1

    40/81

    39

    Procedimiento ANOVA

    Prueba Student-Newman-Keuls para Y

    Alpha 0.01

    Grados de Libertad del Error 24

    Cuadrado Medio del Error 57.11155

    Nmero de Medias 2 3 4

    Rango Critico 11.298964 12.982623 14.014182

    Medias con la misma letra no presentan deferencias significativas

    Grupo

    SNK Media N T

    A 40.771 7 1

    B A 29.729 7 2

    B 21.771 7 3

    B 19.771 7 4

    Para este caso la prueba SNK se realiz con un alfa de 0.01 y tenemos los siguientes resultados, el

    tratamiento 1 es el mejor pero sin superar el tratamiento 2 pero los tratamientos 2,3 y 4 no presentan

    diferencias significativas estadsticamente hablando es decir son iguales.

  • 7/24/2019 Ejemplos SAS1

    41/81

    40

    Prueba de Comparacin de Medias de Dunnett.

    Esta prueba no es muy popular entre los investigadores, por su dificultad de interpretar y por no formar grupos,

    adems de solamente comparar el tratamiento testigo con todos los otros tratamientos y no los dems

    tratamientos entre s.

    Para lo que ocuparemos el mismo ejemplo que para Duncan utilizando como testigo el tratamiento 1.

    Para lo que tenemos el siguiente programa de SAS:

    DATA CA2;

    INPUT Y T;

    CARDS;

    34.4 1

    27.3 1

    65.0 1

    31.3 1

    48.5 1

    38.4 1

    40.5 1

    25.0 2

    23.2 2

    45.2 2

    26.4 2

    26.8 2

    32.7 228.8 2

    20.9 3

    22.2 3

    27.8 3

    19.6 3

    20.1 3

    22.1 3

    19.7 3

    19.7 4

    21.7 4

    21.1 4

    18.5 4

    16.0 4

    20.2 4

    21.2 4

    ;

    PROC PRINT;

    PROC ANOVA;

    CLASS T;

    MODEL Y=T;

    MEANS T /DUNNETT;

    /*TRATAMIENTO 1 ES EL TESTIGO PARA SAS*/;

    RUN;

    Obteniendo los siguientes resultados:

    Procedimiento ANOVA

    Prueba t de Dunnett para Y

    Alpha 0.05

    Grados de Libertad del Error 24

    Cuadrado Medio del Error 57.11155

    Valor Crtico de T de Dunnett 2.50672

    Diferencia Mnima Significativa 10.126

    Comparacin significativa con un nivel de 0.05 es indicado con ***.

    Diferencia Lmite de confianza

    Comparacin T entre Medias Simultanea al 95%

    2 - 1 -11.043 -21.169 -0.917 ***

    3 - 1 -19.000 -29.126 -8.874 ***

    4 - 1 -21.000 -31.126 -10.874 ***

    En este caso podemos observar que todos los tratamientos son diferentes significativamente con respecto al

    testigo, se pueden realizar a mano las pruebas entre los tratamientos con la diferencia mnima significativa, si

    as lo requiere el investigador.

  • 7/24/2019 Ejemplos SAS1

    42/81

    41

    Prueba de Comparacin de Medias de Sheff.

    Esta es una prueba de contrastes ortogonales por lo que para programarla en SAS primero se deben de tener

    los contrastes que se van a realizar y se realiza para la comparacin de una media con varias o de una contra

    una o ms medias, pero tambin al igual que la anterior no es la ms fcil de interpretar, por lo que aunque

    es usada no es de las populares entre la comunidad cientfica mundial, adems esta prueba es utilizada en

    el Procedimiento GLM no en el procedimiento ANOVA.

    Realizaremos la prueba con los mismos datos completamente al azar utilizados en las pruebas anteriores

    Por lo que tenemos el siguiente programa de SAS:

    DATA CA2;

    INPUT Y T;

    CARDS;

    34.4 1

    27.3 1

    65.0 1

    31.3 1

    48.5 1

    38.4 1

    40.5 1

    25.0 2

    23.2 2

    45.2 2

    26.4 2

    26.8 2

    32.7 2

    28.8 2

    20.9 3

    22.2 3

    27.8 3

    19.6 3

    20.1 3

    22.1 3

    19.7 3

    19.7 4

    21.7 4

    21.1 4

    18.5 4

    16.0 420.2 4

    21.2 4

    ;

    PROC PRINT;

    PROC GLM;

    CLASS T;

    MODEL Y=T;

    CONTRAST "TRAT1 VS TRAT2,TRAT3,TRAT4" T 3 -1 -1 -1;

    CONTRAST "TRAT2 VS TRAT1,TRAT3,TRAT4" T -1 3 -1 -1;

    CONTRAST "TRAT3 VS TRAT1,TRAT2,TRAT4" T -1 -1 3 -1;

    CONTRAST "TRAT4 VS TRAT1,TRAT2,TRAT3" T -1 -1 -1 3;

    CONTRAST "TRAT1 VS TRAT2,TRAT3" T 2 -1 -1 0;

    CONTRAST "TRAT1 VS TRAT2,TRAT4" T 2 -1 0 -1;

    CONTRAST "TRAT1 VS TRAT3,TRAT4" T 2 0 -1 -1;

    CONTRAST "TRAT2 VS TRAT1,TRAT3" T -1 2 -1 0;

    CONTRAST "TRAT2 VS TRAT1,TRAT4" T -1 2 0 -1;CONTRAST "TRAT2 VS TRAT3,TRAT4" T 0 2 -1 -1;

    CONTRAST "TRAT3 VS TRAT1,TRAT2" T -1 -1 2 0;

    CONTRAST "TRAT3 VS TRAT1,TRAT4" T -1 0 2 -1;

    CONTRAST "TRAT3 VS TRAT2,TRAT4" T 0 -1 2 -1;

    CONTRAST "TRAT4 VS TRAT1,TRAT2" T -1 -1 0 2;

    CONTRAST "TRAT4 VS TRAT1,TRAT3" T -1 0 -1 2;

    CONTRAST "TRAT4 VS TRAT2,TRAT3" T 0 -1 -1 2;

    CONTRAST "TRAT1 VS TRAT2" T 1 -1 0 0;

    CONTRAST "TRAT1 VS TRAT3" T 1 0 -1 0;

    CONTRAST "TRAT1 VS TRAT4" T 1 0 0 -1;

    CONTRAST "TRAT2 VS TRAT3" T 0 1 -1 0;

    CONTRAST "TRAT2 VS TRAT4" T 0 1 0 -1;

    CONTRAST "TRAT3 VS TRAT4" T 0 0 1 -1;

    RUN;

    (NOTA: Tambin puede utilizarse estimate en lugar de contrast, la diferencia es el estadstico de

    prueba, estimate utiliza tde Student y contrast utiliza F)

  • 7/24/2019 Ejemplos SAS1

    43/81

    42

    Obteniendo los siguientes resultados:

    Procedimiento GLM

    Variable dependiente Y

    Contraste GL Contraste SC Cuadrado Medio F Value Pr > F

    TRAT1 VS TRAT2,TRAT3,TRAT4 1 1519.801071 1519.801071 26.61

  • 7/24/2019 Ejemplos SAS1

    44/81

    43

    Transformacin de Datos mediante Raz Cuadrada.

    Esto se realiza cuando uno sospeche que los datos no tienen una distribucin normal o varianzas

    homogneas, es decir las condiciones para poder realizar el Anlisis de Varianza.

    En este caso utilizaremos un experimento en bloques al azar donde la variable respuesta fue nmero de frutos

    por pancula en rboles de Mango, donde el gradiente de variacin es que se tom como un bloque a un

    rbol.

    Teniendo el siguiente programa de SAS

    DATA BA1;

    INPUT Y T B;

    YTRC=SQRT(Y+0.5);

    CARDS;

    10 1 1

    8 1 2

    2 1 3

    7 1 4

    0 1 5

    9 2 1

    9 2 2

    3 2 3

    6 2 4

    1 2 54 3 1

    5 3 2

    1 3 3

    5 3 4

    0 3 5

    ;

    PROC PRINT;

    PROC ANOVA;

    CLASS T B;

    MODEL YTRC=T B;

    RUN;

    Obteniendo los siguientes resultados:

    Obs Y T B YTRC

    1 10 1 1 3.24037

    2 8 1 2 2.91548

    3 2 1 3 1.581144 7 1 4 2.73861

    5 0 1 5 0.70711

    6 9 2 1 3.08221

    7 9 2 2 3.08221

    8 3 2 3 1.87083

    9 6 2 4 2.54951

    10 1 2 5 1.22474

    11 4 3 1 2.12132

    12 5 3 2 2.34521

    13 1 3 3 1.22474

    14 5 3 4 2.34521

    15 0 3 5 0.70711

    Procedimiento ANOVA

    Informacin de Niveles de Clases

    Clase Nivel ValorT 3 1 2 3

    B 5 1 2 3 4 5

    Nmero de observaciones 15

    Variable Dependiente: YTRC

    Suma de

    Fuente de Variacin GL Cuadrados Cuadrado Medio F Value Pr > F

    Modelo 6 9.90767710 1.65127952 29.47 F

    T 2 1.04946413 0.52473206 9.36 0.0080

    B 4 8.85821297 2.21455324 39.52

  • 7/24/2019 Ejemplos SAS1

    45/81

    44

    Transformacin de Datos mediante Logaritmo natural y en base 10.

    Para esto se utilizara el ejemplo anterior pero para ambos tipos de logaritmos, pero como existen ceros

    entonces se les suma una constante que en este caso en 1.

    Teniendo el siguiente programa para SAS:

    DATA BA1;

    INPUT Y T B;

    YTLD=LOG10(Y+1);

    YTLN=LOG(Y+1);

    CARDS;

    10 1 1

    8 1 2

    2 1 3

    7 1 4

    0 1 5

    9 2 1

    9 2 2

    3 2 3

    6 2 4

    1 2 5

    4 3 1

    5 3 2

    1 3 3

    5 3 4

    0 3 5;

    PROC PRINT;

    PROC ANOVA;

    CLASS T B;

    MODEL YTLD=T B;

    PROC ANOVA;

    CLASS T B;

    MODEL YTLN=T B;

    RUN;

    Obteniendo los siguientes resultados:

    Obs Y T B YTLD YTLN

    1 10 1 1 1.04139 2.39790

    2 8 1 2 0.95424 2.19722

    3 2 1 3 0.47712 1.09861

    4 7 1 4 0.90309 2.07944

    5 0 1 5 0.00000 0.00000

    6 9 2 1 1.00000 2.30259

    7 9 2 2 1.00000 2.30259

    8 3 2 3 0.60206 1.38629

    9 6 2 4 0.84510 1.94591

    10 1 2 5 0.30103 0.69315

    11 4 3 1 0.69897 1.60944

    12 5 3 2 0.77815 1.79176

    13 1 3 3 0.30103 0.69315

    14 5 3 4 0.77815 1.79176

    15 0 3 5 0.00000 0.00000

    Procedimiento ANOVA

    Informacin de Niveles de Clases

    Clase Nivel Valores

    T 3 1 2 3

    B 5 1 2 3 4 5Nmero de observaciones 15

    Variable Dependiente: YTLD

    Suma de

    Fuente de Variacin GL Cuadrados Cuadrado Medio F Value Pr > F

    Modelo 6 1.68598239 0.28099707 35.94 F

    T 2 0.14872544 0.07436272 9.51 0.0077

    B 4 1.53725695 0.38431424 49.15

  • 7/24/2019 Ejemplos SAS1

    46/81

    45

    Procedimiento ANOVA

    Informacin de Niveles de Clases

    Clase Nivel Valores

    T 3 1 2 3

    B 5 1 2 3 4 5

    Nmero de observaciones 15

    Variable Dependiente: YTLN

    Suma de

    Fuente de Variacin GL Cuadrados Cuadrado Medio F Value Pr > F

    Modelo 6 8.93890687 1.48981781 35.94 F

    T 2 0.78852714 0.39426357 9.51 0.0077

    B 4 8.15037973 2.03759493 49.15

  • 7/24/2019 Ejemplos SAS1

    47/81

    46

    Transformacin de Datos Angular (Para Porcentajes)

    En este caso este tipo de transformacin se recomienda a casos donde se tengan como resultados

    porcentajes, adems hay que recordar que SAS trabaja en radianes por lo que hay que convertirlos a grados,

    esto al igual que en los ejemplos anteriores es cuando se tiene la sospecha de que los datos no cumplen con

    la Normalidad o la homogeneidad de Varianzas. El ejemplo es porcentaje de cido ctrico en frutos de mango

    Teniendo el siguiente programa para SAS:

    DATA CA1;

    INPUT Y T;

    YTAS=ARSIN(SQRT(Y/100))*(180/3.1416);

    CARDS;

    14.823 1

    14.676 1

    14.720 1

    14.514 1

    15.065 1

    25.151 2

    25.401 2

    25.131 2

    25.031 2

    25.267 2

    32.605 3

    32.460 332.256 3

    32.669 3

    32.111 3

    ;

    PROC PRINT;

    PROC ANOVA;

    CLASS T;

    MODEL YTAS=T;

    RUN;

    Obteniendo los siguientes resultados:

    Obs Y T YTAS

    1 14.823 1 22.6441

    2 14.676 1 22.5253

    3 14.720 1 22.5609

    4 14.514 1 22.3939

    5 15.065 1 22.83856 25.151 2 30.0997

    7 25.401 2 30.2645

    8 25.131 2 30.0865

    9 25.031 2 30.0204

    10 25.267 2 30.1763

    11 32.605 3 34.8205

    12 32.460 3 34.7318

    13 32.256 3 34.6069

    14 32.669 3 34.8596

    15 32.111 3 34.5180

    Procedimiento ANOVA

    Informacin de Niveles de Clases

    Clase Nivel Valores

    T 3 1 2 3

    Nmero de observaciones 15

    Variable Dependiente: YTAS

    Suma de

    Fuente de Variacin GL Cuadrados Cuadrado Medio F Value Pr > F

    Modelo 2 374.2162599 187.1081300 9946.81 F

    T 2 374.2162599 187.1081300 9946.81

  • 7/24/2019 Ejemplos SAS1

    48/81

    47

    Prueba de estadstica no paramtrica de Kruskal-Wallis.

    Esta prueba para datos no paramtricos, en este caso veremos una evaluacin de cuatro variedades de

    Chirimoya en donde se cuantifico el nmero de semillas por fruto, teniendo los siguientes resultados y juegos

    de hiptesis.

    43210 VVVV:H

    jia VVji:H

    V1 233.5

    5113

    265

    296

    379

    182

    6621

    337

    7725.5

    5917.5

    V2 13238

    4912

    17240

    12936

    5514

    5715.5

    13137

    11534

    10833

    13539

    V3 10632

    7523.5

    5917.5

    8228

    5715.5

    12835

    7523.5

    6119

    10131

    7022

    V4 4611

    368

    233.5

    6220

    8329

    7725.5

    161

    9430

    7927

    4410

    Donde

    R1 = 109.5; R2=298.5; R3 = 247; R4= 165; k = Nm. De tratamientos= 4.

    n1 = n2 = n3 = n4= 10; N = 40. Donde:

    53.1513

    1

    12

    1

    2

    2

    Nn

    R

    NN

    k

    j j

    j

    c

    81.72

    05.0,3

    2

    ,1

    2 kt

    Como2

    c es mayor que2

    t , se rechaza la H0, lo que quiere decir que no todos los tratamientos producen el

    mismo efecto, en este ejemplo no todas las variedades tienen el mismo nmero de semillas.

    Prueba de Comparacin Mltiple de Medias.

    Para hacer la comparacin de rangos se utilizar la prueba de rangos HSD de Tukey con la siguiente regla

    de decisin

    Si

    12

    1,,

    NkNkNqRR kji entonces ji

    En donde el valor honestamente significativo nico es 134.2Y el valor absoluto de las diferencias es de:

    |R1R2| = 189.0 > 134.2 por lo tanto i j

    |R1R3| = 137.5 > 134.2 por lo tanto i j

    |R1R4| = 055.5 < 134.2 por lo tanto i = j

    |R2R3| = 051.5 < 134.2 por lo tanto i = j

    |R2R4| = 133.5 < 134.2 por lo tanto i = j

    |R3R4| = 082.0 < 134.2 por lo tanto i = j

  • 7/24/2019 Ejemplos SAS1

    49/81

    48

    Por lo que quedara representado de la siguiente manera:

    T2298.5 a

    T3247.0 a

    T4 165.0 a b

    T1109.5 b

    Por lo que el mejor tratamiento es el 2 sin superar al 3 y al 4, se consideran estadsticamente iguales y el 1

    es el peor tratamiento, pero sin ser superado estadsticamente por el 4.

    Tambin puede utilizarse la prueba HSD de Tukey para la comparacin de rangos medios mediante la

    siguiente regla de decisin

    Si

    ji

    kji

    nn

    NNqRR

    11

    24

    1,, entonces ji

    Donde =

    En donde el valor honestamente significativo nico es 13.42

    Y el valor absoluto de las diferencias es de:

    |R1R2| = 18.90 > 13.42 por lo tanto i j

    |R1R3| = 13.75 > 13.42 por lo tanto i j

    |R1R4| = 05.55 < 13.42 por lo tanto i = j

    |R2R3| = 05.15 < 13.42 por lo tanto i = j

    |R2R4| = 13.35 < 13.42 por lo tanto i = j

    |R3R4| = 08.20 < 13.42 por lo tanto i = j

    Por lo que quedara representado de la siguiente manera:

    T229.85 a

    T324.70 a

    T4 16.50 a b

    T110.95 b

    Por lo que el mejor tratamiento es el 2 sin superar al 3 y al 4, se consideran estadsticamente iguales y el 1es el peor tratamiento, pero sin ser superado estadsticamente por el 4.

    O puede utilizarse la comparacin de rangos medios de Nemanyi mediante la siguiente regla de decisin

    Si 12

    1,,

    NkqRR kji entonces ji

    Para la prueba de Nemanyi se aplica esta frmula cuando todos los tratamientos tienen el mismo nmero de

    repeticiones, de lo contrario se debe aplicar

    ji

    k

    nn

    NNq 11

    12

    1

    2

    ,,.

  • 7/24/2019 Ejemplos SAS1

    50/81

    49

    En donde el valor mnimamente significativo nico es 13.42

    Y el valor absoluto de las diferencias es de:

    |R1R2| = 18.90 > 13.42 por lo tanto i j

    |R1R3| = 13.75 > 13.42 por lo tanto i j

    |R1R4| = 05.55 < 13.42 por lo tanto i = j

    |R2R3| = 05.15 < 13.42 por lo tanto i = j

    |R2R4| = 13.35 < 13.42 por lo tanto i = j

    |R3R4| = 08.20 < 13.42 por lo tanto i = j

    Por lo que quedara representado de la siguiente manera:

    T229.85 a

    T324.70 a

    T4 16.50 a b

    T110.95 b

    En todos los casos dan la misma respuesta debido a que se basan en el mismo caso y cualquiera de ellas es

    correcta.

  • 7/24/2019 Ejemplos SAS1

    51/81

    50

    Prueba de estadstica no paramtrica de Friedman.

    Para esta prueba se tom un experimento de frutos de Chirimoya, donde se cuantifico el peso de frutos de

    tres variedades, teniendo como gradiente de variacin la edad del rbol, teniendo los siguientes resultados y

    juego de hiptesis

    3210 :H

    jia ji:H

    Bloque T1 T2 T31 855

    2760

    1999

    32 1113

    3504

    1645

    23 719

    2412

    1880

    34 924

    2673

    11245

    3

    5 11153

    8081

    8832

    6 9213

    7642

    4221

    7 11063

    3561

    9702

    8 9122

    9513

    4161

    9 11703

    8562

    1431

    10 11903

    5602

    1181

    Teniendo que R1 =26; R2=15; R3=19; b =10 y k =3

    Donde

    2.6131

    12

    1

    22

    kbRkbk

    k

    i

    ic

    y 99.52

    05.0,2

    2

    ,1

    2 kt

    Como 2c es mayor que2

    t , se rechaza la hiptesis nula, lo que quiere decir que no todos los tratamientos

    provocan el mismo efecto en este caso no todas las variedades tienen el mismo peso de fruto

    Prueba de Comparacin de Medias.

    Esto es igual que la prueba Kruskal-Wallis, la siguiente frmula es para comparar los rangos ().

    Teniendo la siguiente regla de decisin:

    6

    1

    1

    kbkZRR

    kkji entonces ji

    En donde el valor mnimamente significativo nico es 10.68

    Y el valor absoluto de las diferencias es de:

    |R1R2| = 11 > 10.68 por lo tanto i j

    |R1R3| = 07 < 10.68 por lo tanto i = j

    |R2R3| = 04 < 10.68 por lo tanto i = j

  • 7/24/2019 Ejemplos SAS1

    52/81

    51

    Lo que quedara representado de la siguiente manera.

    T126 a

    T3 19 a b

    T2 15 b

    Quedando que el tratamiento 1 es el mejor, sin ser superado estadsticamente por el 3, y el peor es el 2 sin

    ser superado estadsticamente por el 3.

    En este sentido cuando se pretende hacer la prueba por los rangos medios ( ) de Nemanyi se debe

    emplear la siguiente regla de decisin

    Si b

    kkqRR

    kji

    6

    1

    2

    ,, entoncesji

    En donde el valor honestamente significativo nico es 1.07Y el valor absoluto de las diferencias es de:

    |R1R2| = 1.10 > 1.07 por lo tanto i j

    |R1R3| = 0.70 < 1.07 por lo tanto i = j

    |R2R3| = 0.40 < 1.07por lo tanto i = j

    Lo que quedara representado de la siguiente manera.

    T12.6 a

    T3 1.9 a b

    T2 1.5 b

    En ambos casos, al igual que con la prueba Kruskal-Wallis, dan la misma respuesta debido a que se basan

    en el mismo caso y cualquiera de ellas es correcta.

  • 7/24/2019 Ejemplos SAS1

    53/81

    52

    Correlacin Simple (Momento Producto De Pearson).

    Para ejemplificar la correlacin lineal simple se tomarn datos de 5 caractersticas de la anatoma de 7

    genotipos de durazno, recordando que la correlacin debe hacerse entre variables aleatorias.

    genotipo longest densest longlam epidsup epidinf

    almendro 3.03 110.66 11.88 1.80 1.34

    almendro 3.24 112.39 13.16 1.48 0.87

    almendro 3.03 105.48 10.27 1.66 1.08almendro 2.87 143.52 9.17 1.29 0.80

    almendro 2.52 131.99 10.28 1.41 1.00

    jalatzingo 3.08 167.72 11.58 1.93 1.30

    jalatzingo 3.14 172.33 12.41 1.76 1.28

    jalatzingo 2.78 140.06 10.70 2.03 1.34

    jalatzingo 2.79 209.22 11.62 1.93 1.20

    jalatzingo 3.00 141.21 12.56 1.74 1.17

    misantla 2.93 168.30 14.31 2.49 1.31

    misantla 3.08 144.67 13.39 2.02 1.16

    misantla 3.05 159.66 10.76 1.93 1.03

    misantla 2.99 131.41 10.78 1.73 1.01

    misantla 2.82 193.66 10.56 2.09 1.33

    nemaguard 2.97 147.55 12.33 1.75 1.03

    nemaguard 3.30 167.15 14.71 1.93 1.14

    nemaguard 3.43 184.44 16.63 2.24 1.30

    nemaguard 2.94 152.16 11.02 2.01 1.18

    nemaguard 3.07 188.47 10.34 1.81 1.00

    temascaltepec 3.30 134.87 9.67 1.65 0.96

    temascaltepec 3.21 129.11 10.92 1.42 1.07

    temascaltepec 3.30 125.08 9.60 1.83 1.23

    temascaltepec 3.24 167.72 11.05 1.58 0.96

    temascaltepec 3.13 133.14 9.74 1.44 1.14

    tulancingo, oax 3.00 186.16 11.26 1.52 1.04tulancingo, oax 3.15 177.52 12.03 1.52 1.06

    tulancingo, oax 3.03 171.76 12.54 1.81 1.15

    tulancingo, oax 3.04 197.12 11.55 1.92 1.08

    tulancingo, oax 3.15 187.90 12.18 1.74 0.96

    sombrerete 3.11 132.57 10.77 1.83 1.06

    sombrerete 2.96 141.79 10.93 2.21 1.47

    sombrerete 3.14 164.27 9.69 1.69 1.11

    sombrerete 3.24 142.94 10.75 2.10 1.50

    sombrerete 3.01 158.50 9.11 2.05 1.36

    Las variables aleatorias se comparan en pares mediante la frmula:

    n

    y

    yn

    x

    x

    n

    yx

    yx

    rn

    i

    in

    i

    i

    n

    i

    in

    i

    i

    n

    i

    i

    n

    i

    in

    i

    ii

    xyxy2

    1

    1

    2

    2

    1

    1

    2

    11

    1

  • 7/24/2019 Ejemplos SAS1

    54/81

    53

    El programa en SAS es el siguiente:

    data corr;

    input x$ y1-y5;

    cards;

    alm 3.03 110.66 11.88 1.80 1.34

    alm 3.24 112.39 13.16 1.48 0.87

    alm 3.03 105.48 10.27 1.66 1.08

    alm 2.87 143.52 9.17 1.29 0.80

    alm 2.52 131.99 10.28 1.41 1.00

    jal 3.08 167.72 11.58 1.93 1.30jal 3.14 172.33 12.41 1.76 1.28

    jal 2.78 140.06 10.70 2.03 1.34

    jal 2.79 209.22 11.62 1.93 1.20

    jal 3.00 141.21 12.56 1.74 1.17

    mis 2.93 168.30 14.31 2.49 1.31

    mis 3.08 144.67 13.39 2.02 1.16

    mis 3.05 159.66 10.76 1.93 1.03

    mis 2.99 131.41 10.78 1.73 1.01

    mis 2.82 193.66 10.56 2.09 1.33

    nem 2.97 147.55 12.33 1.75 1.03

    nem 3.30 167.15 14.71 1.93 1.14

    nem 3.43 184.44 16.63 2.24 1.30

    nem 2.94 152.16 11.02 2.01 1.18

    nem 3.07 188.47 10.34 1.81 1.00

    tem 3.30 134.87 9.67 1.65 0.96

    tem 3.21 129.11 10.92 1.42 1.07

    tem 3.30 125.08 9.60 1.83 1.23tem 3.24 167.72 11.05 1.58 0.96

    tem 3.13 133.14 9.74 1.44 1.14

    tul 3.00 186.16 11.26 1.52 1.04

    tul 3.15 177.52 12.03 1.52 1.06

    tul 3.03 171.76 12.54 1.81 1.15

    tul 3.04 197.12 11.55 1.92 1.08

    tul 3.15 187.90 12.18 1.74 0.96

    som 3.11 132.57 10.77 1.83 1.06

    som 2.96 141.79 10.93 2.21 1.47

    som 3.14 164.27 9.69 1.69 1.11

    som 3.24 142.94 10.75 2.10 1.50

    som 3.01 158.50 9.11 2.05 1.36

    ;

    proc print;

    proc corr;

    var y1-y5;run;

    y la salida nos da la siguiente informacin

    El procedimiento CORR

    5 Variables: y1 y2 y3 y4 y5

    Estadsticas Simples

    Variable N Media Desv Est Suma Mnimo Mximo

    y1 35 3.05914 0.17744 107.07 2.52 3.43

    y2 35 154.92857 26.24091 5423 105.48 209.22

    y3 35 11.43571 1.61783 400.25 9.11 16.63

    y4 35 1.80971 0.26372 63.34 1.29 2.49

    y5 35 1.14343 0.16439 40.02 0.80 1.50

    Coeficientes de Correlacin Pearson, N = 35

    Prob > |r| bajo H0: Rho=0

    y1 y2 y3 y4 y5

    y1 1.00000 -0.04712 0.30602 0.00383 -0.03317

    0.7881 0.0738 0.9826 0.8500

    y2 -0.04712 1.00000 0.26719 0.30275 0.07212

    0.7881 0.1207 0.0771 0.6805

    y3 0.30602 0.26719 1.00000 0.40063 0.14947

    0.0738 0.1207 0.0171 0.3915

    y4 0.00383 0.30275 0.40063 1.00000 0.74121

    0.9826 0.0771 0.0171

  • 7/24/2019 Ejemplos SAS1

    55/81

    54

    Interpretacin de los resultados:

    Se hace las siguientes hiptesis

    00 :H

    0:Ha

    Es decir, H0dice que no existe correlacin entre las dos variables, para hacer las pruebas de hiptesis se

    realizar mediante el P-valuedonde se rechaza H0si P-value < , si = 0.05 tenemos:

    Para y1y y2el P-valuees de 0.7881, por lo que no se rechaza H0

    Para y1y y3el P-valuees de 0.0738, por lo que no se rechaza H0

    Para y1y y4el P-valuees de 0.9826, por lo que no se rechaza H0

    Para y1y y5el P-valuees de 0.8500, por lo que no se rechaza H0

    Para y2y y3el P-valuees de 0.1207, por lo que no se rechaza H0

    Para y2y y4el P-valuees de 0.0771, por lo que no se rechaza H0

    Para y2y y5el P-valuees de 0.6805, por lo que no se rechaza H0

    Para y3y y4el P-valuees de 0.0171, por lo que se rechaza H0Para y3y y5el P-valuees de 0.3915, por lo que no se rechaza H0

    Para y4y y5el P-valuees de 0.0001, por lo que se rechaza H0

    Es decir las correlaciones que son significativas con un nivel de confianza del 95 % son:

    Entre la variables y3y y4y entre y4y y5todas las otras correlaciones no son estadsticamente diferentes de 0

    es decir no existe correlacin estadsticamente significativas

  • 7/24/2019 Ejemplos SAS1

    56/81

    55

    Regresin Lineal Simple

    Para ejemplificar la RLS se tomaron datos de prdida de peso de un coleoptero a diferentes humedades

    relativas y se trata de saber cmo calcular la prdida de peso de acuerdo a su humedad

    muestra Humedad relativa (%) Prdida de peso en mg1 0 8.982 12 8.143 29.5 6.674 43.6 6.085 53.5 5.906 62.5 5.837 75.5 4.688 85 4.209 93 3.72

    Y se probar el modelo xy 10 ; y = variable dependiente, x = variable independiente

    El programa en SAS es el siguiente

    data rls;

    input x y;

    cards;0 8.98

    12 8.14

    29.5 6.67

    43 6.08

    53 5.9

    62.5 5.83

    75.5 4.68

    85 4.2

    93 3.72

    ;

    proc print;

    proc reg;

    model y=x;

    run;

    y la salida nos da la siguiente informacinProcedimiento REG

    Modelo: xy 10 Variable Dependiente: y

    Anlisis de Varianza

    Suma de Cuadrado

    Fuente de Variacin GL Cuadrados medio F Value Pr > F

    Modelo 1 23.51449 23.51449 267.18 |t|

    0 1 8.70403 0.19156 45.44

  • 7/24/2019 Ejemplos SAS1

    57/81

  • 7/24/2019 Ejemplos SAS1

    58/81

    57

    *a

    :H 00

    Para probar se hace por una prueba de tdonde tcy ttson los siguientes:

    0

    00

    *

    c s

    t

    22

    ,nt

    tt

    Clculos para tc donde 00 *

    0

    00

    c s

    t

    191560

    070438

    .

    .tc

    4445.tc

    Clculos para tt

    2

    05029 .,

    t tt

    02507 .,t tt

    36464.tt

    Regla de decisin: Rechazar H0si tc> tto si tc< -tt

    45.44 > 4.3646; por lo tanto se RechazaH0, lo que significa que 0 es estadsticamente diferente de 0 con

    un nivel de confianza de 95 %

    Y para1

    , las hiptesis son:

    *:H110

    *a

    :H11

    Para probar se hace por una prueba de tdonde tcy ttson los siguientes:

    1

    11

    *

    c s

    t

    22

    ,nt tt

    Clculos para tc donde 01 *

    1

    01

    c s

    t

    003260

    0053220

    .

    .tc

    3516.tc

    Clculos para tt

    2

    05029 .,

    t tt

  • 7/24/2019 Ejemplos SAS1

    59/81

    58

    02507 .,t tt

    36464.tt

    Regla de decisin: Rechazar H0si tc> tto si tc< -tt

    -16.35 < -4.3646; por lo tanto se Rechaza H0, lo que significa que 1 es estadsticamente diferente de 0 con

    un nivel de confianza de 95 %

    Pruebas de hiptesis usando la prueba del P-value