Dissenys en blocs

21
Departament d’Estadística Divisió de Ciències Experimentals i Matemàtiques Dissenys en blocs Llicenciatura de Biologia Disseny d’Experiments i Anàlisi de Dades Jordi Ocaña Rebull

description

Dissenys en blocs. Llicenciatura de Biologia Disseny d’Experiments i Anàlisi de Dades Jordi Ocaña Rebull. Contingut. Blocs i el control del biaix i de l’error Disseny en blocs aleatoritzats complet Model estadístic Anàlisi estadística - PowerPoint PPT Presentation

Transcript of Dissenys en blocs

Page 1: Dissenys en blocs

Departament d’EstadísticaDivisió de Ciències Experimentals i

Matemàtiques

Dissenys en blocs

Llicenciatura de Biologia

Disseny d’Experiments i Anàlisi de Dades

Jordi Ocaña Rebull

Page 2: Dissenys en blocs

Dissenys en blocs

Departament

d’Estadística

Contingut

Blocs i el control del biaix i de l’error Disseny en blocs aleatoritzats complet

– Model estadístic– Anàlisi estadística– Altres qüestions: eficiència, cas de factors aleatoris,

comparacions múltiples...

Disseny en quadrats llatins– Model estadístic– Anàlisi estadística

Altres dissenys en blocs: comentaris i extensions

Page 3: Dissenys en blocs

Dissenys en blocs

Departament

d’Estadística

Fer blocs com a forma de controlar el biaix i l’error

Hi ha factors sense interés en un estudi però que poden influir en el resultat: factors “soroll”.

Possibles estratègies per eliminar-ne l’efecte:– Si desconegut i totalment incontrolable: aleatorització.

– Si incontrolable però mesurable: restar-ne l’efecte en l’anàlisi dels resultats (cas de l’anàlisi de la covariància).

– Si controlable experimentalment: fer blocs, comparar els tractament d’interés dins blocs fets segons nivells del(s) factor(s) de “soroll”.

Page 4: Dissenys en blocs

Dissenys en blocs

Departament

d’Estadística

Disseny en blocs aleatoritzats complet

Sovint un factor de soroll és la pròpia unitat experimental– Exemples: els propis pacients en un estudi clínic, amb les

seves característiques especials (salut, hàbits, ...), les parcel·les en un estudi de producció agrícola, la pròpia peça de material en estudis de duresa, etc.

Possible estratègia: tots els tractaments (factor(s) d'interès en l’estudi) a cada unitat experimental.

Ordre o lloc de tractament dins cada unitat a l’atzar. Temps de recuperació si és necessari.

Page 5: Dissenys en blocs

Dissenys en blocs

Departament

d’Estadística

Exemple de disseny en blocs aleatoritzats: [CO] i resistència a l’esforç

Distància recorreguda en 12’ tot respirant diverses “atmosferes” (A, B, C o D). Temps de recuperació entre proves i ordre de tractaments a l’atzar dins cada individu.

Individu A B C D1 835 874 750 8542 787 827 755 8293 724 738 698 7264 336 378 210 2795 252 315 168 3366 560 672 558 6427 336 341 260 336

Page 6: Dissenys en blocs

Dissenys en blocs

Departament

d’Estadística

Model estadístic pel disseny en blocs aleatoritzats complet

a tractaments, b blocs (~ individus), una observació per bloc i tractament, no interacció.

1

1

1,2, ,

1,2, ,0,

efecte del tractament , 0

efecte del bloc , 0

ij i j ij

ija

i ii

b

j jj

i aY e

j be N iid

i

j

Page 7: Dissenys en blocs

Dissenys en blocs

Departament

d’Estadística

Anàlisi estadística d’un disseny en blocs aleatoritzats complet (I)

Hipòtesis d’interès:

Sumes de quadrats:

0 1 2

1 '

:

: , per alguna 'a

i i

H

H i i

2

..

1 1

2 2

.. ... .1 1

2

... .1 1

T A B E

a b

T iji j

a b

iA B ji j

a b

iE ij ji j

SS SS SS SS

SS Y Y

SS b Y Y SS a Y Y

SS Y Y Y Y

Page 8: Dissenys en blocs

Dissenys en blocs

Departament

d’Estadística

Anàlisi estadística d’un disseny en blocs aleatoritzats complet (II)

Graus de llibertat:

Quadrats mitjans:

1 1 1 1A B E

A B E

SS SS SSMS MS MS

a b a b

1 1 . . .

1 . . .

1 . . .

1 1 . . .

T

A

B

E

SS ab N g d ll

SS a g d ll

SS b g d ll

SS a b g d ll

Page 9: Dissenys en blocs

Dissenys en blocs

Departament

d’Estadística

Anàlisi estadística d’un disseny en blocs aleatoritzats complet (i III)

Esperances dels quadrats mitjans:

Estadístic de test i distribució sota H0:

2

2 1

2

12

2

1

1

a

ii

A

b

jj

B

E

bE MS

a

a

E MSb

E MS

1, 1 1A

E

MSF F a a b

MS

Page 10: Dissenys en blocs

Dissenys en blocs

Departament

d’Estadística

Càlculs de les sumes de quadrats[CO] i resistència a l’esforç

Individu A B C D1 835 874 750 854 828.25 77900.80 1471772.432 787 827 755 829 799.50 62678.703 724 738 698 726 721.50 29706.984 336 378 210 279 300.75 61699.015 252 315 168 336 267.75 79181.946 560 672 558 642 608.00 3464.167 336 341 260 336 318.25 53311.51

547.14 592.14 485.57 571.71 549.14

4.00 1849.00 4041.33 509.47

44826.57 16316.43

. jy 2

. ..jy y

.iy

2

. ..iy y

BSS

ASS

ESS

Page 11: Dissenys en blocs

Dissenys en blocs

Departament

d’Estadística

Taula d’anàlisi de la variància[CO] i resistència a l’esforç

Font devariació

Suma dequadrats SS G.d.ll.

Quadrats mitjans MS F P-valor

Atmosfera 44826.57 3 14942.19 16.48 0.000021Individu (bloc) 1471772.43 6 245295.40 6.00 0.001372Error 16316.43 18 906.47Total 1532915.43 27

Page 12: Dissenys en blocs

Dissenys en blocs

Departament

d’Estadística

Disseny en blocs aleatoritzats complet. Comentaris finals

En general sempre més eficient que disseny totalment aleatoritzat.

Suposició de no interacció, perillosa i no demostrable (en general) estadísticament.

Cas de tractaments i/o blocs factor aleatori (com hauria de ser a l’exemple): són vàlides exactament les mateixes anàlisis (amb interpretació adequada).

Comparacions múltiples entre tractaments: són vàlids tots els mètodes explicats pel cas d’un factor.

Page 13: Dissenys en blocs

Dissenys en blocs

Departament

d’Estadística

Disseny en quadrats llatins

Volem analitzar un factor amb p nivells (p.e. Tractament, amb p = 4 possibilitats: A, B, C, D).

Hi ha dos factors (sense interès per ells mateixos) que sospitem que poden influir en la resposta, tots dos també amb p nivells (p.e. Pacient i Partida de matèria prima): factors de bloc.

Arrangem els factors de bloc en quadrat p x p. Assignem un tractament a l’atzar a cada casella (Pacient x Partida) amb la restricció que no hi hagi cap tractament repetit a cap fila ni columna.

Page 14: Dissenys en blocs

Dissenys en blocs

Departament

d’Estadística

Un exemple de quadrat llatí 4x4

Partida

1 2 3 4

1 A B D C

2 B C A D

3 C D B A

Pacient

4 D A C B

Quadrat llatí estàndard: si primera fila i columna en ordre alfabètic.Cada cop més quadrats llatins possibles en augmentar p.

midaquadrats llatins 3x3 4x4 5x5 6x6

estàndard 1 4 56 9408total 12 576 161280 >818·106

Page 15: Dissenys en blocs

Dissenys en blocs

Departament

d’Estadística

Model associat a un quadrat llatí

efecte de:– Fila (p.e. pacient), correspon a l’índex i– Tractament, índex j = j(i,k)– Columna (p.e. partida de producte), índex k

aquesta funció defineix el quadrat llatí concret es suposa que no hi ha cap mena d’interacció

1, , 1, ,

~ (0,

,

)

( )

ijk i j k ijk

ijk

Y e

i p k p

e N i

j j

d

i

i

k

Page 16: Dissenys en blocs

Dissenys en blocs

Departament

d’Estadística

Sumes de quadrats associades a un quadrat llatí

. .

2

···

1 1

2 2

·· ··· ·· ···.1 1

2

· · ···.1

T fila col tract E

p p

T ijki j

p p

i kfila coli k

p

jtractj

SS SS SS SS SS

SS Y Y

SS p Y Y SS p Y Y

SS p Y Y

Page 17: Dissenys en blocs

Dissenys en blocs

Departament

d’Estadística

Taula ANOVA per un disseny en quadrat llatí

Font devariació

Suma dequadrats

Graus dellibertat

Quadratmitjà

F

Tractament SStract p - 1 MStract MStract / MSE

F(p-1, (p-2)(p-1))

Fila SSfila p - 1 MSfila ?

Columna SScol. p - 1 MScol. ?

Error SSE (p-2)(p-1) MSE

Total SST

Page 18: Dissenys en blocs

Dissenys en blocs

Departament

d’Estadística

Exemple: producció d’ordi en Qmsegons varietat A, B, C, D

Finca dividida en 16 = 4 x 4 parcel·les, cada parcel·la sembrada amb una varietat segons quadrat llatí agafat a l’atzar.

C 47

D 40

B 50

A 57

B 49

A 53

C 37

D 29

D 28

C 34

A 46

B 37

A 48

B 44

D 25

C 30

Efecte parcel·la (posició en espai) eliminat pel quadrat llatí. Files i columnes representen l’espai.

Page 19: Dissenys en blocs

Dissenys en blocs

Departament

d’Estadística

Taula ANOVA per la producció d’ordi

Analysis of Variance for ORDI.Qm - Type III Sums of Squares-------------------------------------------------------------------------------------------Source of variation Sum of Squares d.f. Mean square F-ratio Sig. level-------------------------------------------------------------------------------------------MAIN EFFECTS A:ORDI.Varietat 968.75000 3 322.91667 227.941 .0000 B:ORDI.Fila 391.25000 3 130.41667 92.059 .0000 C:ORDI.Columna 67.25000 3 22.41667 15.824 .0030

RESIDUAL 8.5000000 6 1.4166667-------------------------------------------------------------------------------------------TOTAL (CORRECTED) 1435.7500 15-------------------------------------------------------------------------------------------0 missing values have been excluded.All F-ratios are based on the residual mean square error.

Page 20: Dissenys en blocs

Dissenys en blocs

Departament

d’Estadística

Quadrats llatins i altres dissenys en blocs: comentaris i extensions. I

Totalment additius (no consideren interaccions, que no es poden analitzar!).

Un quadrat llatí es pot replicar (i aleshores permet una certa anàlisi de la interacció):– dins cada casella

– replicant-lo per files (o columnes)

– replicant-lo per files i columnes

Un disseny “cross-over” per dos tractaments es pot interpretar com un quadrat llatí replicat per columnes.

Page 21: Dissenys en blocs

Dissenys en blocs

Departament

d’Estadística

Quadrats llatins i altres dissenys en blocs: comentaris i extensions. II

Dissenys greco-llatins: en quadrat p x p, dos tractaments (representats per lletra grega i lletra llatina).

A B C D B A D C C D A B D C B A

Com dos quadrats llatins superposats, ortogonals (cada lletra grega un sol cop amb una llatina).Altres tipus de dissenys en blocs: incomplets, replicats, ...