Dissenys factorials dos o més factors creuats

33
1 Departament d’Estadística Divisió de Ciències Experimentals i Matemàtiques Dissenys factorials dos o més factors creuats Llicenciatura de Biologia Disseny d’Experiments i Anàlisi de Dades Jordi Ocaña Rebull

description

Dissenys factorials dos o més factors creuats. Llicenciatura de Biologia Disseny d’Experiments i Anàlisi de Dades Jordi Ocaña Rebull. Dissenys factorials creuats Contingut:. Dos factors fixos creuats Model, mitjanes i estimació dels paràmetres Sumes de quadrats i ANOVA - PowerPoint PPT Presentation

Transcript of Dissenys factorials dos o més factors creuats

Page 1: Dissenys factorials dos o més factors creuats

1

Departament d’EstadísticaDivisió de Ciències Experimentals i

Matemàtiques

Dissenys factorialsdos o més factors creuats

Llicenciatura de BiologiaDisseny d’Experiments i Anàlisi de Dades

Jordi Ocaña Rebull

Page 2: Dissenys factorials dos o més factors creuats

Dissenys factorials creuats 2

Departament

d’Estadística

Dissenys factorials creuatsContingut:

Dos factors fixos creuats– Model, mitjanes i estimació dels paràmetres– Sumes de quadrats i ANOVA– Cas d’una rèplica per casella– Blocs en dissenys multifactorials

Models o dissenys amb factors aleatoris– 2 factors aleatoris

• components de la variància, correlació intraclàssica• Sumes de quadrats i ANOVA

– Models mixtos: 1 factor fix, 1 factor aleatori

Page 3: Dissenys factorials dos o més factors creuats

Dissenys factorials creuats 3

Departament

d’Estadística

Disseny de dos factors creuats: estructura de les dades

Disseny no balancejat de dos factors, A i B, amb a i b nivells respectivament):

Si és balancejat,

11 1

1

1

1 111 11 1 1 1

11 1 1

, , , ,

, , , ,

b

a ab

b

n b bn

a a a n ab abn

B BA y y y y

A y y y y

per tot 1, , i 1, , ijn n i a j b

Page 4: Dissenys factorials dos o més factors creuats

Dissenys factorials creuats 4

Departament

d’Estadística

Disseny de dos factors creuats: model lineal

1 1

1 1

2

per 1, , , 1, , i 1,

0, 0,

0 per 1, i 0 per 1, ,

0, var

ijk i j ij ijk

ij

a b

i ji j

b a

ij ijj i

ijk ijk

Y e

i a j b k n

i a j b

E e e

Page 5: Dissenys factorials dos o més factors creuats

Dissenys factorials creuats 5

Departament

d’Estadística

Fertilitzant*VarietatDades de l’exercici 13 de dissenys multifactorials

Varietat Fertilitzant

A B C D

1 35 26 38 20

45 39 39 43

24 23 36 29

55 48 39 49

2 55 44 68 64

64 57 62 61

58 74 49 69

68 61 60 75

3 97 89 92 99

93 91 82 98

89 98 85 87

82 78 89 92

Page 6: Dissenys factorials dos o més factors creuats

Dissenys factorials creuats 6

Departament

d’Estadística

Disseny de dos factors creuatsSumes, mitjanes i estimació de paràmetres

........

.............

......

1 1 1...

..

1.

....

1 1..

....

1 1..

ˆ

ˆˆˆ

,,1,,1

,,1

,,1

YYYY

YYYYY

abnYYYY

bjai

nY

YYY

bjanY

YYY

aibnYYYY

jiijij

jjii

a

i

b

j

n

kijk

ijij

n

kijkij

jj

a

i

n

kijkj

ii

b

j

n

kijki

Page 7: Dissenys factorials dos o més factors creuats

Dissenys factorials creuats 7

Departament

d’Estadística

Disseny de dos factors creuatsDescomposició de la suma de quadrats

...)1(

...)1)(1(

...1

...1

...1

2

1 1 1.

2

1 1........

2

1.....

2

1.....

2

1 1 1...

lldgnabYYSS

lldgbaYYYYnSS

lldgbYYanSS

lldgaYYbnSS

lldgabnSSSSSSSSYYSS

a

i

b

j

n

kijijkE

a

i

b

jjiijAB

b

jjB

a

iiA

EABBA

a

i

b

j

n

kijkT

Page 8: Dissenys factorials dos o més factors creuats

Dissenys factorials creuats 8

Departament

d’Estadística

Disseny de dos factors creuatsQuadrats mitjans i esperances

2

1 1

2

2

1

2

2

1

2

2

)1(

)1)(1()1)(1(

11

11

EE

E

a

i

b

jij

ABAB

AB

b

jj

BB

B

a

ii

AA

A

MSEnab

SSMS

ba

nMSE

baSSMS

b

anMSE

bSSMS

a

bnMSE

aSSMS

Page 9: Dissenys factorials dos o més factors creuats

Dissenys factorials creuats 9

Departament

d’Estadística

Disseny de dos factors creuatsContrastos sobre els paràmetres del model

És significatiu l’efecte del factor A?

És significatiu l’efecte del factor B?

És significativa la interacció?

0:0:

0:0:

0:0:

1

12110

1

210

1

210

ij

ab

j

b

i

a

HH

HH

HH

Page 10: Dissenys factorials dos o més factors creuats

Dissenys factorials creuats 10

Departament

d’Estadística

Disseny de dos factors creuatsTaula ANOVA

Font de variació

Suma de quadrats

Graus de llibertat

Quadrats mitjans

Estadístic F

Tractament A

SSA a-1 MSA MSA/MSE

Tractament B

SSB b-1 MSB MSB/MSE

Interacció SSAB (a-1)(b-1) MSAB MSAB/MSE

Residu SSE ab(n-1) MSE

Total SST abn-1

Page 11: Dissenys factorials dos o més factors creuats

Dissenys factorials creuats 11

Departament

d’Estadística

Disseny de dos factors creuatsEstadístics F sota normalitat dels errors

Si els residus són iid, tots : – Significació del factor A:

– Significació del factor B:

– Significació de la interacció:

Per tant, els valors crítics o els p-valors s’obtindran d’una simple consulta de la taula F.

)1(,1~ nabaF F),0(~ Neij

)1(,1~ nabbF F

)1(),1)(1(~ nabbaF F

Page 12: Dissenys factorials dos o més factors creuats

Dissenys factorials creuats 12

Departament

d’Estadística

Fertilitzant*VarietatSegons Statgraphics 7.0

El factor fertilitzant i la interacció són clarament significatius.

Analysis of Variance for BLAT.Produccio - Type III Sums of SquaresSource of variation Sum of Squares d.f. Mean square F-ratio Sig. levelMAIN EFFECTS A:BLAT,Fertilitza 22764,875 2 11382,438 230,660 ,0000 B:BLAT,Varietat 331,750 3 110,583 2,241 ,1002INTERACTIONS AB 1052,1250 6 175,35417 3,553 ,0072

RESIDUAL 1776,5000 36 49,347222--------------------------------------------------------------------------------TOTAL (CORRECTED)25925,250 47--------------------------------------------------------------------------------0 missing values have been excluded.All F-ratios are based on the residual mean square error.

Page 13: Dissenys factorials dos o més factors creuats

Dissenys factorials creuats 13

Departament

d’Estadística

Fertilitzant*Varietatdiagrames de dispersió de residus (programa S-Plus 4.5)

parti

al fo

r Var

ieta

t

-40

-20

020

Varietat

1 2 3 4

Page 14: Dissenys factorials dos o més factors creuats

Dissenys factorials creuats 14

Departament

d’Estadística

Fertilitzant*VarietatNormalitat dels residus (S-Plus 4.5)

Quantiles of Standard Normal

Res

idua

ls

-2 -1 0 1 2

-10

-50

510

26

2718

Page 15: Dissenys factorials dos o més factors creuats

Dissenys factorials creuats 15

Departament

d’Estadística

És preferible un disseny multifactorial que anàlisis separades factor a factor

Més eficient: rèpliques ocultes (hidden replication). Possibles conclusions absurdes si factors per separat:

20 11 12 10

1 -10 1 -10 21 0 2 10 2 10 22 -20

Valors de E(Y i jk ) en un disseny de dos factors creuats

1 21 10 30 El millor tractament és2 20 20 la combinació d'A1 amb B2

Valors de E(Y ik ) en un disseny unifactoral per A (escala possiblement incorrecta)1 10 Conclusió correcta per A sol:2 30 Tractament A2 és preferible

Valors de E(Y jk ) en un disseny unifactoral per B (escala possiblement incorrecta)1 10 Conclusió correcta per B sol:2 30 Tractament B2 és preferible

Conclusió incorrecta en no considerar la interacció:

La millor estratègia és combinar els tractaments A2 i B2

B

B

A

A

Page 16: Dissenys factorials dos o més factors creuats

Dissenys factorials creuats 16

Departament

d’Estadística

Cas d’una rèplica per casella

La discussió anterior fa pensar en la importància de les interaccions.

Si n=1, SSE té 0 g.d.ll. i 2 no és estimable a no ser que suposem que no hi ha interacció. En aquest cas utilitzarem SSE = SST - (SSA+ SSB) amb (a-1)(b-1) g.d.ll. i sense possibilitat de separar el residu de les possibles interaccions.

F = MSA /{(SST - (SSA+ SSB))/((a-1)(b-1))} amb distribució F(a-1, (a-1)(b-1)) permet aleshores provar la significació d’A (i similarment de B).

Page 17: Dissenys factorials dos o més factors creuats

Dissenys factorials creuats 17

Departament

d’Estadística

Cas d’una rèplica per casella:és significativa la interacció?

És un problema difícil pel cas n = 1. Hi ha la prova de Tukey, solament vàlida sota un model restrictiu de la interacció: ij = i j.

En aquest cas, si H0 = 0 és certa,

NBATError

BA

a

i

b

jBAjiij

N

Error

N

SSSSSSSSSSSSSSab

abYSSSSYYYY

SS

babaSS

SSF

2

1 1

2..

....

1)1)(1(,1~1)1)(1(/

F

Page 18: Dissenys factorials dos o més factors creuats

Dissenys factorials creuats 18

Departament

d’Estadística

Blocs en dissenys multifactorials

Sovint no és possible aleatoritzar totalment, volem controlar factors addicionals no directament interessants o tenim restriccions experimentals.

El disseny de l’exemple Fertilitzant*Varietat no és, en realitat, totalment aleatoritzat:

“Es considera una àrea de sembra molt gran que es divideix en 12 zones igual de grans. Les 12 combinacions de fertilitzant i varietat s’assignen a l’atzar a les zones. Per a mesurar l’error experimental, cada zona es divideix en quatre subzones que reben totes el mateix tractament.”

Page 19: Dissenys factorials dos o més factors creuats

Dissenys factorials creuats 19

Departament

d’Estadística

Blocs en dissenys multifactorials

Fixem-nos que no és totalment aleatoritzat, cada zona i,j és un bloc que pot tenir el seu efecte, descrit per un paràmetre ij. Un model més realista seria:

En dependre dels mateixos índexs, ij no es pot estimar separadament de la interacció. Si ij no és constant i nul (cosa que no podem provar) tenim una font de biaix i/o variabilitat no mesurable, confosa amb la interacció.

ijkijijjiijk eY

Page 20: Dissenys factorials dos o més factors creuats

Dissenys factorials creuats 20

Departament

d’Estadística

Blocs en dissenys multifactorials

Un disseny també amb blocs, més adequat, seria: “Es considera una àrea de sembra molt gran que es divideix en 4 zones igual de grans. Cada zona es divideix en 12 subzones. Per cada una de les 4 zones, els 12 tractaments s’assignen a l’atzar a les 12 subzones”

Cada una de les 4 “rèpliques” s’associa a un “bloc zona”. El model és ara:

Interaccions amb el factor bloc s’han de suposar inexistents o confoses amb l’error (1 sola rèplica), però l’efecte principal k és analitzable.

ijkkijjiijk eY

Page 21: Dissenys factorials dos o més factors creuats

Dissenys factorials creuats 21

Departament

d’Estadística

Experiments factorials amb factors aleatoris

Suposem que A i B són factors aleatoris, és a dir els seus nivells són mostres aleatòries de mida a i b, respectivament, de poblacions més grans. Ara el model és:

amb Ai, Bj, Iij i eijk v.a. independents.

,0~

,0~,0~,0~,,1

,,1,,1

Ne

NINBNAnk

bjaieIBAY

ijk

ABijBjAi

ijkijjiijk

Page 22: Dissenys factorials dos o més factors creuats

Dissenys factorials creuats 22

Departament

d’Estadística

Factors aleatoriscomponents de la variància i correlació intraclàssica

La independència de les v.a. dels factors i del residu fa que la variància de les observacions es descomposi en les components de la variància:

Per altra banda hi ha dependència entre observacions:

2222)var( ABBAijkY

','0','','

','',

,cov 2

2

222

'''

jjiisijjiisijjiisi

kkjjiisi

YYB

A

ABBA

kjiijk

Page 23: Dissenys factorials dos o més factors creuats

Dissenys factorials creuats 23

Departament

d’Estadística

Dos factors aleatorissignificació dels factors i de la interacció

Ara els contrastos de més interès són:

Iguals sumes de quadrats i quadrats mitjans, però:

I els estadístics F adients són, respectivament:

0:0:

0:0:

0:0:

21

20

21

20

21

20

AB

AB

B

B

A

A

HH

HH

HH

222

222222

)(

EABAB

BABBAABA

MSEnMSE

annMSEbnnMSE

)1(),1)(1(~

)1)(1(,1~)1)(1(,1~

nabbaMSMSF

babMSMSFbaa

MSMSF

E

AB

AB

B

AB

A

F

FF

Page 24: Dissenys factorials dos o més factors creuats

Dissenys factorials creuats 24

Departament

d’Estadística

Dos factors aleatorisexemple

Producció de suc, 4 tarongers i 5 dies, tots agafats a l’atzar (els tarongers són, però, els mateixos tots els dies). Per cada taronger i dia s’agafen a l’atzar tres taronges. És significatiu el factor “taronger”? I el factor “dia”? Hi ha interacció?Dia 1 2 3 4 1 24 26 26 28 20 27 28 18 21 27 24 20 2 18 25 19 21 24 23 27 19 17 25 23 22 3 16 21 15 24 20 21 22 25 24 29 27 27 4 21 24 22 23 20 26 24 24 23 20 21 27 5 23 24 28 27 21 28 26 25 27 25 27 28

Page 25: Dissenys factorials dos o més factors creuats

Dissenys factorials creuats 25

Departament

d’Estadística

Taula ANOVA per producció de sucsegons Statgraphics 7.0

Analysis of Variance for TARONGER.suc - Type III Sums of SquaresSource of variation Sum of Squares d.f. Mean square F-ratio Sig. levelMAIN EFFECTS A:TARONGER.dia 108.93333 4 27.233333 2.14(1) .1374 B:TARONGER.taronger 53.65000 3 17.883333 1.40(1) .2881INTERACTIONS AB 152.26667 12 12.688889 1.45(0) .1843

RESIDUAL 350.00000 40 8.7500000--------------------------------------------------------------------------------TOTAL (CORRECTED) 664.85000 59--------------------------------------------------------------------------------0 missing values have been excluded.F-ratios are based on the following mean squares: (0)RESIDUAL (1)AB

Cap factor significatiu. Si anàlisi pròpia de factors fixos: conclusió errònia, “dia” significatiu.

Page 26: Dissenys factorials dos o més factors creuats

Dissenys factorials creuats 26

Departament

d’Estadística

Dos factors aleatorisestimació de components de la variància

Estimadors puntuals:

A l’exemple (i valors amb validesa dubtosa):

i la covariància entre taronges del mateix arbre i dia:

EEAB

AB

ABBB

ABAA

MSn

MSMSan

MSMSbn

MSMS

22

22

ˆˆ

ˆˆ

31,1ˆˆ

34,0ˆˆ21,134

86,1232,27ˆˆ2

,2

2222

tarongerdiaAB

tarongerBdiaA

86,2ˆˆˆˆ 2,

22', diatarongerdiatarongerijkijk

Page 27: Dissenys factorials dos o més factors creuats

Dissenys factorials creuats 27

Departament

d’Estadística

Dissenys o models mixtosun factor aleatori i un factor fix

Suposem que A és fix i B aleatori i el model:

Tota interacció amb un terme aleatori sempre és aleatòria. (1) i (2) fan que algunes expressions siguin més senzilles; a causa de (2) es coneix com model restringit.

( ) ( )1

1

.1

1, , 1, , 1, ,

0

~ 0, ~ 0, (1)

0 1, , (2)

i j ij ijijka

ii

aaj ijB AB

a

ij ji

Y B I e i a j b k n

B N I N

I I j b

m a

a

s s=

-

=

= + + + + = = =

=

= = =

å

å

K K K

K

Page 28: Dissenys factorials dos o més factors creuats

Dissenys factorials creuats 28

Departament

d’Estadística

Un factor fix, un factor aleatoricontrastos sobre els paràmetres

Contrastos:

Esperances dels quadrats mitjans:

Estadístics F:

0:0:

0:0:

0:0:

21

20

21

20

1

10

AB

AB

B

B

i

a

HH

HH

HH

222

2212

22

)(1

EABAB

BB

a

i iABA

MSEnMSE

anMSEa

bnnMSE

)1(),1)(1(~

)1(,1~)1)(1(,1~

nabbaMSMSF

nabbMSMSFbaa

MSMSF

E

AB

E

B

AB

A

F

FF

Page 29: Dissenys factorials dos o més factors creuats

Dissenys factorials creuats 29

Departament

d’Estadística

Producció de sucdia: factor fix; taronger: factor aleatori

Analysis of Variance for TARONGER.suc - Type III Sums of SquaresSource of variation Sum of Squares d.f. Mean square F-ratio Sig. levelMAIN EFFECTS A:TARONGER.dia 108,93333 4 27,233333 2,14(1) ,1374 B:TARONGER.taronger 53,65000 3 17,883333 2,04(0) ,1231INTERACTIONS AB 152,26667 12 12,688889 1,45(0) ,1843

RESIDUAL 350,00000 40 8,7500000--------------------------------------------------------------------------------TOTAL (CORRECTED) 664,85000 59--------------------------------------------------------------------------------0 missing values have been excluded.F-ratios are based on the following mean squares: (0)RESIDUAL (1)AB

Si “dia” és fix, el factor “taronger” s’acosta més a la significació (i “dia” igualment no significatiu):

Page 30: Dissenys factorials dos o més factors creuats

Dissenys factorials creuats 30

Departament

d’Estadística

Tres o més factors

Teoria anterior generalitzable a tres o més factors, p.e. tres factors fixos amb totes les interaccions:

( ) ( ) ( ) ( )

( ) ( ) ( )

( )

1 1 1

1 1 1

1 1

1, , 1, , 1, , 1,

0 0 0

0, 0, 0, etc.

0, etc.

ijkl i j k ijklij ik jk ijk

a b d

i j ki j kb a d

ij ij ikj i kb d

ijkj k

Y ei a j b k d l n

m a b d ab ad bd abd

a b d

ab ab ad

abd

= = =

= = =

= =

= + + + + + + + += = = =

= = =

= = =

=

å å åå å åå å

K K K K

Page 31: Dissenys factorials dos o més factors creuats

Dissenys factorials creuats 31

Departament

d’Estadística

Fertilitzant*VarietatSegons Statgraphics 7.0

El factor fertilitzant i la interacció són clarament significatius.

Analysis of Variance for BLAT.Produccio - Type III Sums of SquaresSource of variation Sum of Squares d.f. Mean square F-ratio Sig. levelMAIN EFFECTS A:BLAT,Fertilitza 22764,875 2 11382,438 230,660 ,0000 B:BLAT,Varietat 331,750 3 110,583 2,241 ,1002INTERACTIONS AB 1052,1250 6 175,35417 3,553 ,0072

RESIDUAL 1776,5000 36 49,347222--------------------------------------------------------------------------------TOTAL (CORRECTED)25925,250 47--------------------------------------------------------------------------------0 missing values have been excluded.All F-ratios are based on the residual mean square error.

Page 32: Dissenys factorials dos o més factors creuats

Dissenys factorials creuats 32

Departament

d’Estadística

Taula ANOVA per producció de sucsegons Statgraphics 7.0

Analysis of Variance for TARONGER.suc - Type III Sums of SquaresSource of variation Sum of Squares d.f. Mean square F-ratio Sig. levelMAIN EFFECTS A:TARONGER.dia 108.93333 4 27.233333 2.14(1) .1374 B:TARONGER.taronger 53.65000 3 17.883333 1.40(1) .2881INTERACTIONS AB 152.26667 12 12.688889 1.45(0) .1843

RESIDUAL 350.00000 40 8.7500000--------------------------------------------------------------------------------TOTAL (CORRECTED) 664.85000 59--------------------------------------------------------------------------------0 missing values have been excluded.F-ratios are based on the following mean squares: (0)RESIDUAL (1)AB

Cap factor significatiu. Si anàlisi propi de factors fixos: conclusió errònia, “dia” significatiu.

Page 33: Dissenys factorials dos o més factors creuats

Dissenys factorials creuats 33

Departament

d’Estadística

Producció de sucdia: factor fix; taronger: factor aleatori

Si “dia” és fix, el factor “taronger” s’acosta més a la significació (i “dia” igualment no significatiu):

Analysis of Variance for TARONGER.suc - Type III Sums of SquaresSource of variation Sum of Squares d.f. Mean square F-ratio Sig. levelMAIN EFFECTS A:TARONGER.dia 108,93333 4 27,233333 2,14(1) ,1374 B:TARONGER.taronger 53,65000 3 17,883333 2,04(0) ,1231INTERACTIONS AB 152,26667 12 12,688889 1,45(0) ,1843

RESIDUAL 350,00000 40 8,7500000--------------------------------------------------------------------------------TOTAL (CORRECTED) 664,85000 59--------------------------------------------------------------------------------0 missing values have been excluded.F-ratios are based on the following mean squares: (0)RESIDUAL (1)AB