ESTIMACION DE LOS COMPONENTES DE VARIANZA EN …

5
ESTIMACION DE LOS COMPONENTES DE VARIANZA EN DISES'OS DESBALANCEADOS En este trabajo, se presenta en forma de ejemplos la estimación de los componentes de varianza para los diseños experimenta- les: una categoría de clasificación, p X q factorial método de Henderson, y jerár quico o anidado, suponiendo en todo!! ellos efectos aleatorios. Introduccl6n La teoría est adística se ha enfocado prin- cipalmente a aquellos diseños experimenta- les en los cuales todos los niveles a est u- diar de uno o más factores presentan igual número de observaciones y se les conoce como modelos balanceados; sin embargo, la investigación reali2ada en el estudio de procesos biológicos donde el material de trabajo son animales (t al es .el caso de nu· trición, reproducción, genética, etc.) se plantean problemas ya que se presentan ge- neralmente modelos desbalanceados; es de- cir, hay diferente mero de observaciones en l as celdas, debido a que algunos ani- males durante el t ranscurso drl experimen- to pueden morir o presentar algún factor como enfermedades que los deje fue ra del exper iment o, y por ende el análisis de la i n- formación será basado en modelos desba- En el área de genética al trabajar con ca racterísticas cuantita ti vas es importante conocer cufi.les son los component es de la variación atribuidas a las dif erentes causas que consti tuyen el modelo genético. Cuan- do Fe tr a ba ja con modelos deshalanceados la tarea de obtener estos component es no Recibido poro su publicocióo el 13 de diciem· bre de 1 982. 1 Departamento de Genética Animal lnstilu· to Nacional de l n\coti¡::aeiones SARII , Km 15.5 Carretera México-Toluca. M éxico, U.r. C.P. 05110. C. PEc . l. \Ux . 45 (1983) c. ,RLOS G. VÁSQ t:EZ P. 1 es directa, como es el caso de los modelos bnl4llcead06. Herdenson (1953), Searle (1968) y Harvey (1 975) son al gunos de los autores que más han contribuido al es· tudio de la teoría de los modelos desbalan· ccodos, siendo Harvey el que más se ha enfocado a aspectos biológicos. 1::1 propósito de este t. ra bajo es p1·esentar en forma de ejemplos el método para la estimación de los coeficientes k y la esti · rnación de los component es de varianza para los diseños desbala.nceados; una cate- goría de cl asifjcación, un diseño fact oria.l p X q utilizando el método uno de Hender· son, y je rárquico o anidado suponiendo to· dos loll factores aleatorios. Ejemplos A. Una categoría de clasificación. que exi5te un factor A (ya ¡;ean padres, t ratamientos, etc.) y que d presenta cinco nh ·eles tornados al IWH del total de la población (pad res: a, b, e, d, e) donde cada nb•cl presenta di- ferentes números de observaciones (n 1 ) es- to es: FACfOR A NiYc:le. (padra (i)) 111 b e d e T of:.\15 N ú1nc:ro Jc ohecr va,..i<;ne. (•'(.) (Protenie) 1 4 5 5 2 .n .. •N• I5 El modelo qut: presenta el total de la variación en este ejemplo e.s: Y ¡¡ = p. - S; + f (i¡¡; donde Y u es la de la 43

Transcript of ESTIMACION DE LOS COMPONENTES DE VARIANZA EN …

Page 1: ESTIMACION DE LOS COMPONENTES DE VARIANZA EN …

ESTIMACION DE LOS COMPONENTES DE VARIANZA EN DISES'OS DESBALANCEADOS

En este t rabajo, se presenta en forma de ejemplos la estimación de los componentes de varianza para los diseños experimenta­les: una categoría de clasificación, p X q factorial método d i n~cto de Henderson, y jerárquico o anidado, suponiendo en todo!! ellos efectos a leatorios.

Introduccl6n

La teoría estadística se ha enfocado prin­cipalmente a aquellos diseños experimenta­les en los cuales todos los niveles a estu­diar de uno o más factores presentan igual número de observaciones y se les conoce como modelos balanceados; sin embargo, la investigación reali2ada en el estudio de procesos biológicos donde el material de trabajo son animales (tal es .el caso de nu· trición, reproducción, genética, etc.) se plantean problemas ya que se presentan ge­neralmente modelos desbalanceados; es de­cir, hay diferente número de observaciones en las celdas, debido a que algunos ani­males durante el transcurso d rl experimen­to pueden morir o presentar algún factor como enfermedades que los deje fuera del experimento, y por ende el análisis de la in­formación será basado en modelos desba­lanceann<~.

En el área de genética al trabajar con características cuantitativas es importante conocer cufi.les son los componentes de la variación atribuidas a las diferentes causas que constituyen el modelo genético. Cuan­do Fe trabaja con modelos deshalanceados la tarea de obtener estos componentes no

Recibido poro su publicocióo el 13 de diciem· bre de 1982.

1 Departamento de Genética Animal lnstilu· to Nacional de ln\coti¡::aeiones Pecuaria~, SARII , Km 15.5 Carretera México-Toluca. M éxico, U.r. C.P. 05110.

TÉC. PEc. l.\Ux. 45 (1983)

c.,RLOS G. VÁSQt:EZ P.1

es directa, como es el caso de los modelos bnl4llcead06. Herdenson (1953), Searle (1968) y Harvey (1975) son algunos de los autores que más han contribuido al es· tudio de la teoría de los modelos desbalan· ccodos, siendo Harvey el que más se ha enfocado a aspectos biológicos.

1::1 propósito de este t.rabajo es p1·esentar en forma de ejemplos el método para la estimación de los coeficientes k y la esti· rnación de los componentes de varianza para los diseños desbala.nceados; una cate­goría de clasifjcación, un diseño factoria.l p X q utilizando el método uno de Hender · son, y jerárquico o anidado suponiendo to· dos loll factores aleatorios.

Ejemplos

A. Una categoría de clasificación.

Supónga~ que exi5te un factor A (ya ¡;ean padres, tratamientos, etc.) y que d f~tctur presenta cinco nh·eles tornados al IWH del total de la población (pad res: a, b, e, d, e) donde cada nb•cl presenta di­ferentes números de observaciones (n1) es­to es:

FACfOR A

NiYc:le. (padra (i))

111

b e d e

T of:.\15

N ú1nc:ro Jc ohecr va,..i<;ne. (•'(.) (Protenie)

1 4 5 5 2

. n .. •N• I5

El modelo qut: presenta el total de la variación en este ejemplo e.s: Y¡¡ = p. -

S; + f (i¡¡; donde Y u es la r~puesta de la

43

Page 2: ESTIMACION DE LOS COMPONENTES DE VARIANZA EN …

j-ésima progenie del i-ésimo padre; !" es la media poblacional; S¡ es el efecto del i-ésimo padre; y e111, es el error aleatorio NID (0, a2).

El cuadro de análisis de varian2a será pues:

Ea-anaa cle l010

Ori1ende la Gtadoede Cuadradoo cuadradoa v&rtac:i6n li~rtad m.cdioe mcdi.o. (O. V.) (GLJ (CM) (I!:C.M.l

Debido a padres S-1 CM. "2 +K ,,2

Error N-S CM. .,2

TOTAL N- 1

La estimación del coeficiente k sería en· tonces:

K= [ 1/(S- l)] (N- -¡;~~)

= 2:._ [15 - 2:._ (12+ ... +2~] ,2.83 4 15

Substituyendo el valor de 2.83 por el de K en la columna ECM la estimación de los componentes de varianza puede obtenerse por la solución 5imultánea de las ecuaciones.

CM.="'+ 2.83 "~ CM.,= u 2

Así que los componentes de varianza para este diseño serán :

y

o-!= _I_ [cM.- CM.] 2.8..~

O. V . GL

(i -1)

o presentado en forma matricial, los cont· ponentes de varianza se obtendrían resol­viendo el siguiente sistema :

[CM.]= [ 1 2.83] [o-:] CM. 1 0.00 u.

B. Disefío Factorial p x q.

Supónganse que existen dos factores: factor A con tres niveles y factor B con dos niveles, esto es un 3 X 2 factorial, que los factores (A y B) son aleatorios, y que cada combinación (ij) presenta diferentes números de observaciones, es decir:

FACTOR A (i)

1 2 3 n.;

FACTOR 1 l (n¡¡) 2 4 7 ------ - ---

B 2 3 l 2 6 (j) ----- - - ---

n· 4 3 6 13 .. (n .. )

El modelo en este diseño seda :

Y;;Jr. = ¡.¡ + A;+ B; + AB;¡ + E(ij)lr.

donde Y Uk es la k·ésima observación del i-ésimo factor A y el j-ésimo factor B; A, es el efecto del i-ésimo nivel del factor A; B1 es el efecto del j-é5imo nivel del factor B; AB,1 es el efecto de la interacción entre el i-ésimo nivel del factor A y el j-ésimo ni· vel del factor B; E<IJ>k e.s el error aleatorio NID (O, a 2 ). El análisis de varianza para e8te modelo será;

CM ECM

Factor A Facwr B AXB Error

(j - 1) (i -l)(j-1)

~ ~ (Dij-1)

CMA CMs CMAB CM,

•2 + K4 vZAB + Ks v2A *2 + K2 vZl\B + K;s vZa .,2 +K¡ .-zAB .,z . ,

TOTAL N-I

44

Page 3: ESTIMACION DE LOS COMPONENTES DE VARIANZA EN …

Para estimar los coeficientes K de acuer­do al método directo presentado por Hen­derson y conocido como He:nderson 1, es necesario contar con la siguiente informa­ción: i) Debido al diferente número de observaciones en cada subclase de los fac­tores A y B,

ii) Debido a los diferentes observaciones en cada nivel de los factores A y B

para el factor A.

3 1 ,E nUn . . = -

1,. (42 + 32 + 6:.1) = 4.69

••l \,}

para el factor A : 2

y para el factor B

2 1 :s I; nf; l 2: ,_, =-(12+32)+

1•1 ni. 4

I: n1/n. = -- (72 + 62) = 6 .54

i-l 13

+ (~ + 12) + ~ (42 + z1) = 7.5

iii) Debido a las düerentes ohservadont'.s en cada una de lii.S celdas (N1J)

3 2

para el factor B: 3

E Lnñ i-1 ,_¡ ....;...:;..;.____,:..:;;....: __ =

n z

.E , .. ~ nfj ¡':, - _l_ {ll + 22 + 42) +

n.; 7

Con esta información los valores de K serán:

K¡ = n L ---<-¡ - -- L ; '' 1 [ L n~ L:n~-gl (AB) · · - 1 n ¡_ ¡ n.¡ + 1 ' = ~:En~ J

n . .

1 2 [13-7. 5- 5.33 + 2. 69] = l. 45

[ Z:n~ í; Z:n~ J 2: i 1 ; J} l

J• - = -1 (5.53-2.69)=2 64

n; n .. K:=

l gl (B)

[ L n~ J 1

0 .. - in.. - - 1- (13-6.54)=6.46 Kz=

l gl (B)

K•= l

gl (A) [ t: nij í; 2; nij ] 1 ¡: - 1

} = -2 (7.5-2.69)=2 .41 • n;_ n ..

K6= l

gl (A) [ ~nr_ J 1

n .. - ~-- -2(13-4 .69) =4.16

Page 4: ESTIMACION DE LOS COMPONENTES DE VARIANZA EN …

· Por lo tanto, los estimadores de los com­ponentes de varianza pueden obtenerse re­solviendo el siguiente sistema de ecuacio­nes lineales.

CMA l 2.41 o 4.16 -2 a

CMs 1 2.64 6.46 o -2 UAB CMAB 1 1.43 o o -z

UB

CM e 1 o o o -z UA

Hay que hacer notar que en los diseños balanceados K1 = K 2 = K4•

C. Diseño Jerárquico o Anidsdo.

En algunos experimentos, todos los nive­les ne un cierto factor son diferentes a tra­vés de los niveles del otro factor. Frecuen-

SEMENTALES A m= 3 //~

HEMBRAS 1 li 111 mn = 8

1 1\ /1\ PROGENIE 1 l 2 l 2 3

mnr = 14

Nótese que el $emental A fue cruzado con las hembras 1, 11 y 111 y que cada cruza· miento dio una, dos y t res progenies respee· tivamcntc. Asimismo, el semental B fue cru· zado con las hembras IV, V y VI obte· niendo dos, dos y una progenie, respectiva­mente, etc.

El modelo involucrado en este diseño es:

y .... = ¡t. + sm + D(m)a + Ü (mG)r

Donde: Y,,.. es el valor fenotípico obser·

O. V.

Semental (S) Madre/Semental (D) P,-ogenie/D /S (0 )

TOTAL

46

Gt

m-1 m (n - 1)

mn (r -1}

n -1

temente los niveles son e.scogidos al azar para cada factor; sin embargo, esto no es una condición necesaria para el llamado " diseño jerárquico" ; de hecho, este diseño puede ser aleatorio, mixto o fijo. Se debe recalcar que este diseño es otro tipo de di· seño completamente aleatorio.

Ejemplo:

Si mn hembras son escogidas al azar de la población, n hembras son cruzadas con cada uno de los m sementales, suponiendo que todos los individuos involucrados en los mn cru2amientos son escogidos al azar; y de cada mn cruzas, r individuos son pro­ductos donde n (número de hembras en cada semental ) y r (número de progenie en cada cruza) pueden ser diferentes en una o más subclases, por lo tanto, esto nos lleva a un diseño deshalanceado.

B e

1 \"' /\ IV V VI VII VIII

1\ /\ 1 1 1\ 1 2 1 2 1 2

vado en la r·ésima. progenie en la n-ésima hembra y el m-~imo semental; f-1 es la me· dia poblacional ; Sm es el efecto del m·ésimo semental ; D <m>a es el efecto de la n-ési· ma hembra anidado en el m-ésimo semen­tal; O<mw es el efecto de la r-ésima pro­genie anidada en la n·ésima madre y el m-ésimo semental.

El análisis de varianza para este mode­lo es:

CM ECM

CMs cr2 + K2 crZo + K3 cr2s

CM o ,2 + K 1 ,z0

CMo .,-2

Page 5: ESTIMACION DE LOS COMPONENTES DE VARIANZA EN …

Los coeficientes K pueden ser estimados como sigue:

1 [ ~ 2 J 1 [ . 1 2 2 2] K3= gi(S) n .. - 'Í"'n;./n .. =2 14--¡-(6+5+5) =4.50

Los componentes de varianza pueden ser estimados por la solución del siguiente sis­tema de ecuaciones lineales :

Hay que hacer notar que para los dise­ños balanceados las constantes K1 y K2 son iguales.

Summa.ry

This papcr presents in thc form of cxam­ples, thc mcthods for estimating variancc

Literatura cltl&da

ANDERSON, V.L. and R.A. McL!:AN, 1974, Desi¡n of Experiment~. A Rcolistic Approach. Marcel Dekker, Jnc~ N.Y.

B ENN¡;'l'T, C.A. and N.L FnANKLI'N, 1954., Statis­tical Analysis in Chemistry and the Chemical lnduatry. Wiley, N.Y.

lluvr.Y, n.W., 1975, Letut·Squm:ll Analy~is o( Dntn wilh Unequal Subeln&& Nt,mber@. AHS H4 Agriculture Research Service. U.S. Department oj Agriculture.

ll tNDJ~RSON, C.R .. 1953, Estimotion ol Vnriance and Covariance Componenti. Biometrics, 9, 226-252.

1.90

1.64

o

components for the one way classification, two way classification (p x q factorial), Henderson l and bierarchical designs with unequal subclass numbers, assuming ran· dom effects in each of the models.

SEARLE, S.R .. 1968. Another Look at Henderson's Mcthods of Estimating Varianco Cornponents JJiometric'o 2f, 749488.

S.EARU:, S.R., 1971, Topics In Variance Component Estimation. Bi omctric8, 27, 1-76.

SEAIILt;, S.R. und C.R. H ENDEIISQN, 1961, Com· puting ProeedurCll for ütimating Componente of Variance in the Two-w4y Ciasilication, Mixed ModeL Biornetrics, 17, 6-70616.

Snut, G.D.R. and J,}l, ToRRIE, 1960~..,Priuciples ond Proceduree of Stati&tiee. A I:IÍometrical Approach. 2nd Ed. McGraw-Hül Book, Co.

47