Daniels Capítulo 13 Bioestadística: base para el análisis de las ciencias de la salud . Daniel...

79
13.1 INTRODUCCI6N 13.2 ESCALAS DE MEDICI6N 13.3 PRUEBA DEL SIGNO 13.4 PRUEBA DE JERARQuIA SIGNADA DE WILCOXON PARA UBICACI6N 13.5 PRUEBA DE LA MEDIANA 13.6 PRUEBA DE MANN-WHITNEY 13.7 PRUEBA DE BONDAD DE AJUSTE DE KOLMOGOROV-SMIRNOV , 13.1 INTRODUCCION 13.8 13.9 13.10 13.11 13.12 ANA.LlSIS UNILATERAL DE LA VARIANCIA POR JERARQuiAs DE KRUSKAL-WALLIS ANA.LISIS BILATERAL DE LA VARIANCIA POR JERARQUiAS DE FRIEDMAN COEFICIENTE DE CORRELACI6N POR JERARQuIAs DE SPEARMAN ANA.LlSIS DE REGRESI6N NO PARAMETRIC 0 RESUMEN Los procedimientos de inferencia estadfstica estudiados hasta este momenta se clasifican como estadisticas parametricas. La unica excepci6n es el uso de ji- cuadrada en la prueba de bondad de ajuste y en la prueba de independencia. Estos usos de ji-cuadrada se clasifican como estadisticas no parametncas. Ahora la pregunta obvia es: es la diferencia? Para responder, es necesario recordar la naturaleza de los procedimientos de inferencia clasificados como parametricos. En cada situaci6n, el objetivo consistfa en estimar 0 probar una hip6tesis acerca de uno 0 mas parametros de la poblaci6n. Ademas, el elemento fundamental de estos procedimientos fue el conocimiento de la forma funcional de la distribuci6n de la poblaci6n de la cual se extrajeron las muestras que proporcionaron la base para la inferencia. Un ejemplo de una prueba estadfstica parametrica es la ampliamente utilizada prueba t. Los usos mas comunes de esta prueba son los de probar una hip6tesis acerca de la media de una sola poblaci6n 0 la diferencia entre las medias de dos poblaciones. Una de las suposiciones que fundamentan el uso valido de esta prueba es que la poblaci6n 0 poblaciones de donde proceden las muestras tienen, al menos, una distribuci6n aproximadamente normal. 658

Transcript of Daniels Capítulo 13 Bioestadística: base para el análisis de las ciencias de la salud . Daniel...

13.1INTRODUCCI6N 13.2ESCALAS DE MEDICI6N 13.3PRUEBA DEL SIGNO 13.4PRUEBA DE JERARQuIA SIGNADA DE WILCOXONPARA UBICACI6N 13.5PRUEBA DE LAMEDIANA 13.6PRUEBA DE MANN-WHITNEY 13.7PRUEBA DEBONDAD DE AJUSTE DEKOLMOGOROV-SMIRNOV , 13.1INTRODUCCION 13.8 13.9 13.10 13.11 13.12 ANA.LlSISUNILATERAL DE LA VARIANCIA POR JERARQuiAs DEKRUSKAL-WALLIS ANA.LISISBILATERAL DE LA VARIANCIA POR JERARQUiAS DE FRIEDMAN COEFICIENTE DE CORRELACI6N POR JERARQuIAs DE SPEARMAN ANA.LlSISDE REGRESI6NNO PARAMETRIC 0 RESUMEN Los procedimientos de inferencia estadfstica estudiados hasta este momenta se clasifican como estadisticas parametricas.La unica excepci6n es el uso de jicuadrada en la prueba de bondad de ajuste y en la prueba de independencia. Estos usos de ji-cuadrada se clasifican como estadisticas no parametncas. Ahora la pregunta obvia es:~ c u a les la diferencia? Para responder, es necesario recordar la naturaleza de los procedimientos de inferencia clasificados como parametricos.En cada situaci6n, el objetivo consistfa en estimar 0probar una hip6tesis acerca de uno 0mas parametros de la poblaci6n. Ademas,el elemento fundamental de estos procedimientos fueel conocimiento de la forma funcional de la distribuci6n de la poblaci6n de la cual se extrajeron las muestras que proporcionaron la base para la inferencia. Un ejemplo de una prueba estadfstica parametrica es la ampliamente utilizada prueba t.Los usos mas comunes de esta prueba son los de probar una hip6tesis acerca de la media de una sola poblaci6n 0la diferencia entre las medias de dos poblaciones.Una de lassuposiciones que fundamentan el uso valido de esta prueba es que la poblaci6n 0poblaciones de donde proceden las muestras tienen, al menos, una distribuci6n aproximadamente normal. 658 65913.2ESCALASDE MEDICION En este capitulo se estudian procedimientos que no se centran en panimetros de poblacion ni dependen del conocimiento de la poblacion de la que seextraen las muestras.Estrictamente hablando, solo aquellos procedimientos que prueban hipotesis que no son afirmaciones acerca de los parametros de la poblacion, se clasifican como no parametricos,mientras que a aquellos que no hacen suposicion alguna acerca de la poblacion de la cual se extraen las muestras, se les conoce como procedimientos delibredistribucion.Pese a esta diferencia,seacostumbra utilizar los terminos no parametrico y delibre distribuciOnindistintamente y analizar losdiversos procedimientos de ambos tipos bajo el titulo de estadisticas no parametricas. A partir de aqui seseguira este uso convencional. Lo expuesto anteriormente implica las dos siguientes ventajas de las estadfsticas no parametricas. 1.Permiten la prueba de hipotesis que no son afirmaciones acerca de los valores de los parametros de la poblacion. Algunas pruebas de ji-cuadrada de bondad de ajuste y de independencia son ejemplos de pruebas que tienen estas ventajas. 2.Las pruebas no parametricas pueden utilizarse cuando sedesconoce la distribucion de la poblacion de la cual seextraen las muestras. 3.Los procedimientos no parametricos son mas facilesde calcular y,en consecuencia, se aplican con mayor rapidez que los procedimientos parametricos. Esta puede ser una caracteristica conveniente en ciertos casos, pero cuando el tiempo no es un factor importante merece poca priori dad como criterio para elegir una prueba no parametrica. 4.Los procedimientos no parametricos pueden aplicarse cuando los datos que sirven para el analisis constan simplemente de categorias 0clasificaciones. Esdecir,los datos pueden no estar basados en una escala de medicion 10 suficientemente solida como para permitir las operaciones aritmeticas necesarias para llevar a cabo los procedimientos parametricos. EItema de las escalas de medicion se analiza con mas detalle en la siguiente seccion. Aunque las estadfsticas no parametricas tienen ciertas ventajas, tambien deben reconocerse sus desventajas. 1.El uso de procedimientos no parametricos con datos que pueden manejarse con un procedimiento parametrico produce un desperdicio de informacion. 2.La aplicacion de algunas de las pruebas no parametricas puede ser muy laboriosa para muestras grandes. 13.2ESCAIAS DE MEDICION En la seccion anterior se menciona que una de las ventajas de losprocedimientos estadisticosnoparametricosesquepuedenutilizarsecondatosbasadosenuna escalade medicion debil.Para comprender completamente el significadodeesta afirmacion,esnecesarioconocer0entender elsignificadodemedicionyde las 660CAPITULO13ESTADISTICA NOPARAMETRICA diversasescalasdemedici6n queseutili zanconmasfrecuencia.Ellectorpuede consultar el capitulo1 donde se estudian las escalas de medici6n. Muchasautoridadesen lamateriaopinan que laspruebas estadisticasdiferentes requieren distintas escalas de medici6n. Aunque se crea que en la practica se sigue esta idea, existen puntos de vista alternativos. 13.3PRUEBA DEL SIGNO La prueba t,estudiada en los capitulos anteriores, no es estrictamente valida para probar:1) la hip6tesis nul a de que la media de una poblaci6n es igual a alglin valor enparticular,0bien,2)lahip6tesisnuladequelamediadeunapoblaci6nde diferencias entre pares de medicinas es igual a cero, a menos que las poblaciones en cuesti6n sigan una distribuci6n normal. El casu 2 se reconocera como una situaci6n quese analizamediantela prueba decomparaci6npor parejasen elcapitulo7. Cuando no es posible hacer suposiciones de normalidad 0cuando los datos disponibles son categorfas en lugar de medidas sobre una escala de intervalos 0de razones, debe buscarse un procedimiento opcional. Aun cuando se sabe que la prueba t es casi insensible a las violaciones de la suposici6n de normalidad, hay casos en que resulta preferible una prueba alternativa. Una prueba no parametrica que se utiliza con frecuencia y que no depende de los supuestos de la prueba t es laprueba del signo.Estaprueba se centra en la mediana mas que en la media como una medida de tendencia central 0de ubicaci6n.La mediana y la media seran iguales en distribuciones simetricas. La unica suposicion que fundamenta la prueba es que la distribuci6n de la variable de interes es continua. Esta suposici6n excluye el uso de datos nominales. La prueba del signo toma su nombre del hecho de que lossignos mas y menos,y no los valoresnumericos,proporcionan losdatos utilizados en loscalculos. Se ilustrara el uso de esta prueba primero en el casu de una sola muestra y,a continuaci6n, mediante un ejemplo que implique muestras por parejas. EJEMPLO 13.3.1 Los investigadores desean saber si al instruir en cuidados y aseo personal a una muestra de niiias con retraso mental mejorarfa su apariencia. Se eligi6 aleatoriamente a 10 niiiasde una escuela para niiios con retraso mental, para que recibieran educacion especial sobre cuidado y aseo personal. Dos seman as despues de conduir el curso de instrucci6n, las niiias fueron entrevistadas por una enfermera y una trab.yadora social,quienes asignaron a cada niiia una calificaci6n basada en su apariencia general. Losinvestigadores creian que,como maximo,lascalificaciones alcanzarfan el nivel de una escala ordinal. Crefan que aunque una calificacion de, digamos 8, representaba una apariencia mejor que una de 6,no podfan decir que ladiferencia entre las calificaciones de 6 y 8 era igual a la diferencia entre las calificaciones 8 y10,0bien, que la diferencia entre las calificaciones de 6 y 8 representaba el doble de mejora que la diferencia entre lascalificaciones 5 y 6.Las calificaciones se muestran en la tabla 13.3.1. Se desea saber siesposible conduir que la calificaci6n mediana de la poblaci6n de la que se supone se extrajo la muestra es diferente de 5. 66113.3PRUEBA DEL SIGNO TABLA13.3.1Caliticaciones de apariencia general de 10 ninas con reu'aso mental NinaCalificaci6n 14 25 38 48 59 NinaCalificaci6n 66 7lO 87 96 106 Soluci6n: 1. Datos.Ver el planteamiento del problema. 2. Supuestos.Sesuponequelasmedicionessetomaronpara una variable continua. 3, Hip6tesis. Ho:la mediana de la poblaci6n es 5. HA:la mediana de la poblaci6n es diferente de 5. Sea 0:=.05. 4.Estadisticade prueba.La estadisticadepruebaparalaprueba del signo es el numero observado de signos mas 0de signos menos. La naturaleza de la hip6tesis alternativa determina cual de estas estadisticas de prueba es conveniente. En una prueba dada, cualquiera de las siguientes hip6tesis alternativas puede ocurrir. HA:P( +) >PH alternativa unilateral HA:P( +)< P(-) alternativa unilateral HA:P( +) *- P(-) alternativa bilateral Sila hip6tesis alternativa es un numero suficientemente pequeno de signosmenos causa el rechazo de Ho'La estadistica de prueba es el numero de signos menos.En forma analoga, si la hip6tesis alternativa es un numero suficientemente pequeno de signos mascausa el rechazo de Ho'La estadistica de prueba es el numero de signos mas. Si la hip6tesis alternativa es: 662CAPITULO 13ESTADISTICA NOPARAMETRICA un numero suficientemente pequeno de signos menos 0signos mas causa el rechazo de la hip6tesis nula. Se puede tomar como estadfstica de prueba alsigno que ocurra con menor frecuencia. 5.Distribuci6n de la estadistica de prueba.EI primer paso para determinar la naturaleza de la estadfstica de prueba es analizar la tabla 13.3.1para establecer cuales calificaciones caen arriba y cuales abajo de la mediana supuesta de 5. Si el signo mas se asigna a las calificaciones que caen arriba de la mediana supuesta y el signa menos a las que caen por abajo,seobtienen los resultados quesemuestran en la tabla 13.3.2. Si la hip6tesis nula fuera verdadera, esto es,si en efecto la mediana fuera 5,seesperarfaqueelnumerodecalificacionesquecaenporarribaypor abajo de 5 fuera casiigual.Esta forma de razonamiento sugiere otra manera en la que podrfa haberse enunciado la hip6tesis nuIa, a saber, que la probabilidadde unsignomasesigualaIaprobabilidaddeunsignomenos.Estas probabilidades son, cada una, iguales a.5.Simb61icamente, la hip6tesis seria En otras palabras, se espera casi el mismo numero de signos masque de signosmenos en la tabla13.3.2 cuando Ho es verdadera.La observaci6nde esta tabla revela una preponderancia de signos mas; especfficamente, se observan ocho signos mas, un signa menos y un cero, el cual se asigno a la calificacion que cayo exactamente en la mediana. Elprocedimiento habitual para manejar los ceros es eliminarlos del analisis y,en consecuencia, reducir n, el tamano de la muestra. Sise sigue este procedimiento, el problema sereduce a nueve observaciones, de las cuales ocho son signos mas y una es menos. Dadoqueelnumerodesignosmasymenosnoeselmismo,unose pregunta si la distribucion de los signos es suficientemente desproporcionada comopara arrojaralgunaduda sobrelahipotesis.Dichodeotra forma,Ia pregunta essieste pequeno numero de signosmenospudo ser unicamente resultado del azar cuando la hip6tesis nula es verdadera, 0bien, si el numero estan pequeno que un elemento que no es el azar (es decir, una hip6tesis nula falsa)esresponsable de los resultados. TABlA13.3.2Calificaciones pOl'arriba (+) y pOl' abajo (-) de la mediana hipotetica basada en los datos del ejemplo 13.3.1 Nina12345678910 Calificaci6n0 ++++++++ relativa a Ia mediana hipotetica 66313.3PRUEBA DEL SIGNO Con base en 10 expuesto en el capitulo 4,parece razonable concluir que lasobservacionesdelatabla13.3.2constituyen un conjunto de nvariables aleatorias independientes de una poblaci6n de Bernoulli con parametro p. Si kesigual a la estadistica de prueba, la distribuci6n muestral de k es la distribuci6n binomial de probabilidad con parametro p.5,sila hip6tesis nula es verdadera. 6.Regia de decision.La regIa de decisi6n depende de lahip6tesis alternativa. Para H A:P( +)> P(-) se rechaza HQ,cuando Hoes verdadera, si la probabilidad de observar k 0menos signosmenoses menor 0igual que a. Para H A:P( +) < P(-) se rechaza Ho' cuando Hoes verdadera, si la probabilidad de obtener k 0menos signos mas esmenor 0 igual que a. Para HA:P( +)"*P(-) se rechaza Ho'cuando Hoes verdadera, si la probabilidad de obtener un valor de ktan extrema 0mas que el valor calculado es igual menor que a/2. Para este ejemplo,la regIa de decisi6n esrechazar Ho'Siel valor p de la estadfstica de prueba es menor igual que .05. 7.Calculo de la estadistica de prueba.Es posible determinar la probabilidadde observar x0menossignosmenos,cuando esta dada una muestra de tamano n y parametro p, mediante la evaluaci6n de la siguiente expresi6n: P(k ~x In, P)=t"Ckpkq,,-k(13.3.1) k=O Para este ejemplo se calcula 8.Decisi6n estadistica.En latabla B del apendice se encuentra P(k ~ x119,.5)=0.195 Con una prueba bilateral, un numero suficientemente pequeno de signos menos 0signos mas puede provo car el rechazo de la hip6tesis nula. Ya que, en el ejemplo, se tiene un menor numero de signos menos,la atenci6n secentra en estos mas que en lossignos mas. AI asignar a ael valor .05,sedice que siel numero de signos menos es tanpequenoquelaprobabilidaddeobservartanpocos,0incluso menos,esmenor que.025(lamitaddea),serechazalahip6tesis nula. La probabilidad calculada .0195, es menor que .025. Por 10tanto,se rechaza la hip6tesis nula. 664CAPITULO13ESTADISTICA NOPARAMETRICA 9.Conclusion.Se concluye que la calificaci6n mediana no es 5. 10.Valor de p.Para esta pmeba el valor de pes 2(.0195)=.0390. Pruebadelsignopara parejusdedatosCuandolosdatosquevana analizarse constan de observaciones por parejas y no se satisfacen los supuestos que fundamentan la pmeba t,0 la escala de medicion es debil, puede utilizarse la pmeba del signo para probar la hipotesis nula de que la mediana de las diferencias es igual aO.Una forma alternativa de enunciar la hip6tesis nula es la siguiente: De las calificaciones por parejas, setoma una, por ejempl0 y"y seresta de la otra calificaci6n Xi"SiY,esmenor que Xi'el signo de la diferencia es+, y siY,es mayor que Xi'el signo de la diferencia es -. Si la mediana de las diferencias es 0, se esperaria que una pareja seleccionada al azar tuviera exactamente la misma probabilidad de dar un signo + 0- cuando se hace la resta. Puede enunciarse la hip6tesis nula como sigue: Ho:P(+)=PH =.5 En una muestra aleatoria formada por parejas, se esperarfa que el numero de signos+ ysea casi igual. Siexisten mas signos+ 0 - que los que pueden atribuirse unicamente al azar, cuando la hipotesis nula es verdadera, se tendran ciertas dudas acerca de la veracidad de la hip6tesis nula. Mediante la prueba del signo, es posible determinar cuantos signos de uno u otro tipo son mas de los que pueden atribuirse unicamente al azar. FJEMPLO13.3.2 Un equipo de investigaci6n dental querfa saber si ensefiar a la gente a cepillarse los dientes serfa benefico. Se formaron doce parejas de pacientes de una clinica dental, con igualdad en factores como edad, sexo, inteligencia y calificaciones iniciales de higiene bucal. Un miembro de cada pareja recibi6 instrucci6n acerca de la forma de cepillarse los dientes y otros temas de higiene bucal.Seis meses despues, los 24 individuosfueronexaminadosyselesasignounacalificaci6ndehigienebucal mediante el examen de un especialista en la materia, quien ignoraba cuales personashahfanrecibidolainstrucci6n.Unacalificacion bajaindicaun altonivelde higiene bucal. Los resultados se muestran en la tabla13.3.3. Solucion: 1.Datos.Vease el planteamiento del problema. 2.Supuestos.Sesuponequelapoblaciondediferenciasentrelos pares de calificaciones es una variable continua. 3. HipOtesis.Si lasinstrucciones producen efectos beneficos, este hecho se reflejara en las calificaciones asignadas a los miembros de cada par. Si se toman las diferencias entre Xi - Y"es de esperarse que haya mas signos - que signos+ sila instrucci6n resulta benefica,pOIque 66513.3PRUEBA DEL SIGNO TABlA 13.3.3Calificaciones de higiene bucal de 12 individuos que recibieron instrucciones de higiene buca1 (Xi) y12 individuos que no recibieron instrucciones (Y,) Calificacion NumeroCon instruccionSin instruccion de pareja(X)(1') 1 2 3 4 5 6 7 8 9 10 11 12 1.5 2.0 3.5 3.0 3.5 2.5 2.0 1.5 1.5 2.0 3.0 2.0 2.0 2.0 4.0 2.5 4.0 3.0 3.5 3.0 2.5 2.5 2.5 2.5 una calificaci6nbaja indica unnivelmayor de higiene bucal.Si,en efecto, la instrucci6n es benefica, la mediana de la poblaci6n supuesta de todas las diferencias serla menor que 0, es decir, negativa. En caso contrario,sila capacitaci6n no tiene efectos,lamediana de esta poblaci6n seria cero.Las hip6tesis nula y alternativa son, por 10 tanto: Ho:la mediana de las diferencias es cero [P( +)=P(-I)J. H A:la mediana de las diferencias es negativa [P( +)< P(-)]. Seaa =.05. 4. Estadistica de prueba.La estadistica de prueba es el numero de signos+. 5. Distribucion de la estadistica de prueba.La distribuci6n muestral de kesauna distribuci6nbinomial con parametros ny.5siHoes verdadera. 6. Regia de decision.Se rechazaH si P(k:52I 11, .5):5.05. o 7. Calculo de la estadistica de prueba.EI procedimiento es identico al que se utiliza para una sola muestra, una vez que se obtienen las diferencias para cada par. AIefectuar lasrestas,se obtienen los resultados que aparecen en la tabla 13.3.4. 666CAPITULO13ESTADISTICA NOPARAMETRICA .TABLA 13.3.4Signos de las diferencias ~ - ~ )en las calificaciones de higiene bucal de 12 individuos con inst.uccion ~ )y12 individuos sernejantes sin instruccion ( ~ ) Pareja123456789101112 Signo de la diferenciao++ de calificaciones La naturaleza de las hipotesis indica una prueba unilateral, por 10que la totalidad de ex=.5esta asociada con la region de rechazo, que se compone de todos los valores de k (donde k esigual al numero designos+) para losque laprobabilidaddeobtener una cantidad igualo menor de signos+ atribuible al azar, cuando Ro es verdadera, esmenor 0igual que .05.En la tabla 13.3.4 se aprecia que el experimento proporciona un cero,dos signos mas y nueve signos menos. Siseelimina el cero,eltamano real de la muestra es n=11con dos signos+ y nueve signos -. En otras palabras, puesto que un numero "pequeno" de signos+ causa el rechazo de la hipotesis nula, el valor de la estadistica de prueba es k=2. 8.Decision estadistica.Lo que sepretende es conocer la probabilidad de tener no mas de dos signos + en las once pruebas, cuando la hipotesis nula es verdadera.La respuesta seobtiene al evaluar la expresion binomial adecuada.Para este ejemplo setiene P(k::; 2111,.5)=L2 llCk(5)k(.5)11-k k=O AI consultar la tabla B,se obtiene una probabilidad de.0327. Puesto que .0327 esmenor que .05,es posible rechazar a Ro. 9.Conclusion.Seconcluye que la mediana de lasdiferencias es negativa.Esto es,seconcluye que la capacitacion es benefica. 10.Valor de p.Para esta prueba, p =.0327. Prueba del signo con tablas "mayores que"Como se ha demostrado, la prueba del signo puede emplearse con una sola muestra 0con dos de ellas,en las que cada miembro de una de lasmuestrasseune con unode losmiembrosde la otrapara formarunamuestra porparejas.Tambienseha vistoquelahipotesis alternativapuede conducirauna prueba unilateral0auna prueba bilateral.En cualquiercaso,laatencionsecentra en elsignamenosfrecuenteysecalculala probabilidad de obtener un numero menor 0igual de signos de este tipo. Se utiliza el signo que se presenta con menos frecuencia como estadistica de prueba debido a que las probabilidades binomiales de la tabla B son probabilidades "menores 0iguales que". AI utilizar el signa menos frecuente, es posible obtener la 66713.3PRUEBA DEL SIGNO probabilidad directamente de la tabla B sin tener que hacer restas. Si lasprobabilidades de la tabla B fueron"mayores 0iguales que", como lasque suelen darse en lastablas de la distribucion binominal,se utilizada como estadistica de prueba el signomasfrecuente,para aprovechar la conveniencia de obtener directamente la probabilidad deseada sin tener que hacer resta alguna. De hecho, en estos ejemplos podric: utilizarse como estadistica de Hrueba el signa mas frecuente,pero dado que Iatabla B contiene probabilidades "menores 0iguales que",setendda que hacer una resta para obtener la probabilidad deseada. Considere el ultimo ejemplo. Si se utiliza como estadistica de prueba el signo mas frecuente, que es el signo -, el valor de la estadistica es 9. Asi, la probabilidad deseada es de 9 0mas signos -, cuando n 11yP = .5.Es decir,se necesita: P(k?9I 11,.5) Sin embargo, dado que la tabla B contiene probabilidades "menores 0iguales que", debe obtenerse esta probabilidad mediante resta. Esdecir, P(k?9I 11,.5)=1 - P(ks8I 11,.5) 1.9673 =.0327 que es el resultado obtenido anteriormente. Tomano de la muestraEn el capitulo 5 se estudia que,cuando el tamano de la muestra es grande ypesta cercano a .5,la distribucion binomial puede ser aproximada por la distribucion normaL La regIa empirica utilizada dice que la aproximacionnormalesconvenientecuando npy nqsonmayoresque5.Cuando p.5, como seestablece en las hipotesis de losejemplos estudiados, una muestra de tamano12puede satisfacer la regIaempirica.Siguiendo este razonamiento,puede utilizarse la aproximacion normal cuando se usa la prueba del signo para probar la hipotesis nula de que Iamediana 0la mediana de las diferencias es0 y nes mayor o igual que12.Dado que el procedimiento implica la aproximacion de una distribucion continua mediante una distribuci6n discreta, en general, se utiliza la correccion de continuidad de.5.Por 10tanto, la estadistica de prueba es (k.5)-.5nz = - ' - - - - ' - ; = ~ -(13.3.2).5-fr; Ia cual secompara contra el valor de z apartir de la distribucion normal estandar correspondiente al nivel de significacion escogido. En la ecuacion 13.3.2, k + .5 se utiliza cuando k< n/2, y k.5se utiliza cuando k> n/2. Antilisis por oomputaooraMuchos paquetes de software estadfstico aplican laprueba delsigno.Por ejemplo,sise utiliza elpaquete MINITABpara aplicar la prueba del signa para el ejemplo 13.3.1, donde losdatos estan almacenados en la columna 1,el procedimiento y los resultados sedan como los que se muestran en la figura13.3.1. 668CAPITULO 13ESTADiSTICA NOPARAMETRICA Datos: C1:45889610766 Caja de dialogo:Comandos de la sesi6n: Stat >- Nonparametrics >- 1 -Sample SignMTB>STest5C1i SUBC>AlternativeO. Teclear CIen Variables.Seleccionar Test median y teclear 5en la caja de texto.Clic OK. Resultados: Prueba de signo para la mediana Signtestofmedian=5.00versusN.E.5.000 NBELOWEQUALABOVEP-VALUEMEDIAN C1101180.03918.000 FIGURA 13.3.1Procedimiento MINITAB Yresultados para el ejemplo13.3.1. F-JERCICIOS 13.3.1Una muestra aleatoriade15estudiantesdeenfermerfa present6lossiguientes resultados despues de una prueba para medir sus niveles de autoritarismo: NumerodeCalificaci6n estudiantede autoritarismo 1 2 3 4 5 6 7 8 75 90 85 llO 115 95 132 74 NumerodeCalificaci6n estudiantede autoritarismo 982 10104 1188 12124 13llO 1476 1598 Pruebe en el nivelde significaci6n de .05 la hip6tesis nula que indica que la mediana de la calificaci6n para la poblaci6n de la que se extrae la muestra es100, y determine el valor de p. 13.3.2EI prop6sito de un estudio realizado por Vaubourdolle et ai.(A. 1) era investigar la influencia de la dihidrostestosterona(DHT) liberada atravesde la piel en la velocidad de eliminaci6n de etanol del plasma, para determinar siel efecto de inhibici6n de la DHT sobre la actividad 66913.4PRUEBA DE JERARQUiA DE WILCOXON de la deshidrogenasa del alcohol ocurria en hombres sanos. Los individuos eran 10 hombres sanos que voluntariamente participaron en el estudio, con edades entre 25 y 44 aftos.Entre los datos que se recolectaron estan las siguientes concentraciones de testosterona (T) (nmoW) antes y despues del tratamiento con DHT: Individuo:2345678910 Antes:21.523.021.021.822.814.721.023.420.029.5 Despues:9.417.213.06.44.84.510.715.612.57.7 FUENTE:M.VaubourdoIIe.J.Guechot,O.ChazouiIIeres,R.E.Poupony J.Giboudeau,"Effectof Dihydrotestosterone on the Rate of Ethanol Elimination in Healthy Men", Alcoholism:Clinical and Experimental Research,15 (No.2).238-240. Copyrigth, The Research Society of Alcoholism. Con base en estos datos, ~ e sposible conduir que el tratamiento con DHT reduce las concentraciones de testosterona en hombres sanos? Sea a.=.01. 13.3.3Una muestra de 15pacientes con asma particip6 en un experimento para estudiar losefectos de un nuevo tratamiento sobre la funci6n pulmonar. Una de las mediciones que se registraron fue la de vohimen espiratorio forzado (litros) en 1 segundo (VEFj)antes y despues de la aplicaci6n del tratamiento. Los resultados son los siguientes: IndividuoAntesDespues 1 2 3 4 5 6 7 8 1.691.69 2.772.22 1.003.07 1.663.35 3.003.00 .852.74 1.423.61 2.825.14 IndividuoAntesDespues 9 10 11 12 13 14 15 2.582.44 1.844.17 1.892.42 1.912.94 1.753.04 2.464.62 2.354.42 Conbaseenestosdatos,f.lo Cuando se utiliza el procedimiento de Wilcoxon se llevan a cabo los siguientes caIculos: 1.Se resta la media f.lode cada observacion Xipara obtener dSi cualquier Xjes igual a la media,de modo que d;=0, entonces seelimina a j del calculo y se reduce, por consiguiente, la n. 2.Se ordenan las jerarqufas con las dj utilizables de menor a mayor sin considerar el signo de d Esdecir,solo se considera el valor absoluto de dj,designado porrId;l, al establecer lasjerarquias con estos elementos. Sidos 0mas valores deIdj I son iguales, a cada uno de enos se Ie asigna la media de las posiciones jerarquicas que ocupan los valores iguales. Si, por ejemplo, los tres mas pequenos son iguales, se les coloca en las posiciones 1,2 y 3 dentro de las jerarquias, pero a cada uno se Ieasigna unajerarquia de (l + 2+ 3)/3= 2. 3.A cada jerarquia se Ie asigna el signa de la dj que produjo esa jerarqufa. 4.Se encuentra T+,que es la suma de lasjerarquias con signa positivo, y T_,que es la suma de las jerarquias con signa negativo. Prueba estadi..La estadistica de Wilcoxon es T+0dependiendo de la naturaleza de la hip6tesis alternativa. Si la hipotesis nula es verdadera, es decir, si la media verdadera de la poblacion es igual a la media hipotetica, y si las suposiciones secumplen, la probabilidad de observar una diferencia positiva dj = Xi- f.lode una magnitud dada es igual a la probabilidad de observar una diferencia negativa de la misma magnitud, Entonces, al repetir el muestreo, cuando la hip6tesis nula es 67113.4PRUEBA DE JERARQUIA DE WILCOXON verdadera y lassuposiciones se cumplen, elvalor esperado de T+es igual al valor esperado de T_.No es de esperarse que los valores de T+ ycalculados a partir de una muestra dada sean iguales. Sin embargo, cuando Hoes verdadera, no se espera gran diferencia en sus valores. En consecuencia, un valor suficientemente pequeno de T+0T_causa elrechazo de Ho' Cuando la hipotesis alternativa es bilateral (1-1=1= flo)'un valor suficientemente pequeno de T+0T_ causa el rechazo de Ho:fl=flo'La estadfstica de prueba, entonces, sera T+0T_,cualquiera que sea el mas pequeno. Para simplificar la notaci6n, al mas pequeno de los dos valores se IeHamara T. Cuando Ho:fl;::':floes verdadera, se espera que la muestra proporcione un valor grande de T+.Por 10tanto, cuando la hipotesis alternativa unilateral establece que la media verdadera de la poblaci6n es menor que la media hipotetica (fl< flo)'un valor suficientemente pequeno de T+ causa el rechazo de H ' YT + es la estadfstica de prueba.o Cuando Ho:fl~floesverdadera,seespera que lamuestraproporcione un valor grande de T_.Por 10tanto, para la hip6tesis alternativa unilateral HA:fl> flo, un valor suficientemente pequeno de T_ causa el rechazo de H 'y T_ es la estadistica o de prueba. Valores criticosLos valores criticos de la estadistica de prueba de Wilcoxon se encuentran en la tabla K del apendice. Los niveles exactos de probabilidad (P) se dan con cuatro decimales para todoslostotales posibles delas jerarqufas (T)que proporcionan un nivel diferente de probabilidad en el cuarto decimal de 0.000 Ihasta 0.5000. Los totales de lasjerarqufas (T) se tabulan para todas las muestras de tamano n=5hasta n30. A continuacion seenuncian lasreglasde decision para las tres hipotesis alternativas: a)HA :1-1 =1= 1-10,Se rechaza H 0en un nivel de significacion a, siel valor calculado de Tes menor 0igual al valor Ttabulado para n y una aJ2preseleccionada. Alternativamente se puede consultar la tabla K con n y el valor calculado de T para ver siel valor P tabulado asociado con el valor calculado de Tes menor o igual al nivel de significacion establecido. Si es asi, es posible rechazar H ' o b)HA :1-1 < 1-10,Se rechaza Ho en un nivel de significacion a, si T+es menor 0igual al valor de Ten latabla K para n y una apreseleccionada. c)HA :fl>1-10,Se rechaza Hoa un nivel de significacion a, si T_es menor 0igual al valor de Ten la tabla K para n y una apreseleccionada. EJEMPLO 13.4.1 EI gasto cardiaco (litros/minuto) se midi6 por termodilucion en una muestra aleatoria simple de 15 pacientes con cirugfa cardiaca en posicion lateral izquierda. Los resultados fueron los siguientes: 4.914.106.747.277.427.506.564.64 5.983.143.235.806.175.395.77 Se pretende saber si es posible conduir, con base en estos datos, que la media de la poblacion esdiferente de 5.05. 672CAPITULO 13ESTADISTICA NOPARAMETRICA Solucion: 1. Datos.Vease el planteamiento del problema. 2.Supuestos.Sesup onequelosrequerimientospara la aplicaci6n de la prueba de jerarquias signadas de Wilcoxonse cumplen. 3.Hipotesis. Ro:f.L5.05 RA:f.L*5.05 Sea a.0.05. 4. Estadlstica de prueba.Laestadisticadeprueba seraT+0T_,la que sea mas pequena, y se designara Tala estadfstica de prueba. 5. Distribucion de la estadistica de prueba.Los valores crfticos de la estadistica de prueba se encuentran en la tabla K del apendice. 6. RegIa de decision.Se rechazara Rosiel valor calculadode Tes menor 0igual que 25,el valor crftico para n15, y a/2==.0240,el valor mas cercano a.0250 en la tabla K. 7. Catculo de Ia estadlstica de prueba.EIcalculode estadistica de prueba se muestra en la tabla13.4.1. 8. Decision estadistica.Puesto que 34 es mayor que 25,no es posible rechazar Ro' Tabla 13.4.1Calculo de la estadistica de prueba para el ejemplo 13.4.1 GastoJerarqula asignada cardiacod.=x.-5.05Jerarqula deIdildeIdil , 4.91-.141-1 4.10-.957-7 6.74+1.6910+10 7.27+2.2213+13 7.42+2.3714+14 7.50+2.4515+15 6.56+ 1.519+9 4.64-.413-3 5.98+.936+6 3.14-1.9112-12 3.23-1.8211-11 5.80+.755+5 6.17+ 1.128+8 5.39+.342+2 5.77+.724+4 T+==86, T_==34,T34 EJERCICIOS673 Caja de dialogo:Comandos de sesi6n: Stat> Nonparametrics>1-Sample WilcoxonMTB>WTEST5.05C1i SUBC>AlternativeO. Teclear Clen Variables. 8eleccionar Test median. Teclear 5.05 en Ia caja de texto.Clic OK. Resultados: Prueba de jerarqu(a signada de Wilcoxon TESTOFMEDIAN~5.050VERSUSMEDIANN.E.5.050 NFORWILCOXONESTIMATED NTESTSTATISTICP-VALUEMEDIAN C1151586.00.1485.747 FIGURA 13.4.1Procedimiento MINITAB Y resultados para el ejemplo 13.4.1. 9.Conclusion.8e concluyequela mediadela poblacion puedeser 5.05. 10.Valor de p.A partir de Ia tabla K seaprecia que el valor pes p = 2(.0757)=.1514. Prueba de jerarquia signada de Wilcoxon para parejas igualesLa prueba de Wilcoxon puede emplearse en parejas de datos bajo circunstancias en las que no es adecuado utilizar la prueba de tpara comparacion de parejas estudiada en el capftulo 7.En estos casos seobtienen cada uno de los n di valores,lasdiferencias entre cada uno de los n pares de mediciones. 8i IlDes igual a la media de la poblacion deesasdiferencias,esposibleseguirelprocedimientodescritopreviamentepara probar cualquiera de las siguientes hipotesis nulas: Ho:IlD= 0, Ho:IlD S;0 YHo:IlD ;:::o. AntilisisporcompuJadoraMuchos paquetes de software estadfsticos aplican la prueba de jerarqufa signada de Wilcoxon. 8i, por ejemplo, los datos del ejemplo 13.4.1se almacenan en la columna 1, es posible utilizar el paquete MINITAB para ejecutar la prueba como se muestra en la figura13.4.1. EjERCICIOS 13.4.1Dieciseis animales de laboratorio fueronalimentados con una dieta especial desde su nacimiento hasta 12semanas despues del mismo.EI aumento de peso (en gramos) de cada uno de elios fue como sigue: 63687965646365647674666667736976 ~ E sposible conduir apartir de estos datos que la dieta proporcion6 un aumento depeso menor que 70 gramos? Sea a=.05, y calcule el valor de p. 674CAPiTULO13ESTADISTICA NOP ARAMETRICA 13.4.2Un psic610go seleccion6 aleatoriamente una muestra de 25estudiantes discapacitados.Las calificaciones de destreza manual de cada uno de los estudiantes son lassiguientes: 33532240245636283842355252 364741322042345337354742 lProporcionan estos datos suficiente evidencia para indicar que la calificaci6n media para las pohlaciones no es 45? Sea a= .05, Y calcule el valor de p. 13.4.3En un estudiorealizadopor Davisetai.(A-2)secomparo durante elrecreo y durantelas horas de clase ellenguaje de las madres dirigido hacia ninos con retraso mental y ninos con edad cronol6gica equivalente0conigualcapacidaddereconocimientodellenguaje.Los resultados fueron consistentes con la hip6tesis de que las madres de ninos con retraso mental igualan su comportamiento verbal a la capacidad de reconocimiento dellenguaje del nino. Entre los datos recolectados estin las siguientes mediciones respecto al numero de palabras por minuto durante el recreo para lasmadres de ninos con retraso (A) y para las madres de ninos de la misma edad pero sin retrasomentaI.(B): A:21.9015.8016.5015.0014.2517.1013.5014.6018.7519.80 B:13.9513.359.4011.8512.459.959.108.0014.6512.20 FUENTE:Con autorizaci6n de Hilton Davis,Ph.D. Conbaseenestosdatos,les posibleeoncluirqueentrelasmadresdeninosconretraso mental, el numero promedio de palabras por minuto durante el reereo esmayor que entre las madres con hijos que no tienen retraso mental? Sea a =.01. 13.5PRUEBA DE LA MEDIANA La prueba de la mediana es un procedimiento no parametrico que puede emplearse para probar la hip6tesis nula de quedos muestras independientes fueronextrafdas de poblaciones con medianas iguales. Esta prueba, que seatribuye principalmente a Mood (2) y a Westenberg (3),seestudia tambien en Brown y Mood (4). Se ilustra el procedimiento por medio de un ejemplo. FJEMPLO13.5.1 diferencia entre el nivel de salud mental de los alumnos desecundaria de un area rural y un area urbana? Soludon: 1.Datos.Se aplic6 una prueba para medir el nivel de salud mental en dos grupos. La primera muestra aleatoria de 12 estudiantes varones se deuna poblaci6ndeestudiantesde una secundaria del area rural, y la segunda muestra aleatoria independiente de 16 estudiantes, tambien varones,seextrajo de una poblaci6ndeestudiantes de una secundaria del areaurbana. Los resultados se muestran en la tabla 13.5.1. Para determinar sies posible conduir que hay una diferencia, sellevaacabouna prueba de hip6tesis que utiliza la prueba dela mediana. Suponga que elnivel de significaci6n es de .05. 2.Supuestos.Las suposiciones que fundamentan la prueba son: a) las muestras son elegidas independiente y aleatoriamente de sus respec67513.5PRUEBA DE LA MEDlANA TABLA13.5.1Calificaciones del nivel de salud mental de jovenes de secundaria Escuela UrbanaRural 35 26 27 21 27 38 23 25 29 50 43 22 42 47 42 32 UrbanaRural 25 27 45 46 33 26 46 41 50 37 34 31 tivas poblaciones; b) las poblaciones son de la misma forma y difieren solo en cuanto a su ubicacion, y c) la variable de interes es continua. El nivel de medicion debe ser, al menos, ordinal. No es necesario que las dos muestras sean del mismo tarnafio. 3.Hipotesis. Ho:Mu =MR HA:Mu-:f.MR Mu esla calificacion mediana de la poblacion de la que se extrae la muestra de estudiantes del area urbana, y MResla calificacion medianadelapoblaciondeestudiantesdelarearuraldelacualse extrae la muestra. Sea a=.05. 4.Estadistica de prueba.Como semuestra en el siguiente analisis, la estadfstica de prueba es X2,y se calcula, por ejemplo, mediante la ecuacion 12.4.1para una tabla de contingencia de 2 x 2. 5.Distribucion de la estadistica de pr;ueba.Cuando Hoes verdadera y las suposiciones se cumplen, X2sigue una distribucion semejante a la de ji-cuadrada con 1 grado de libertad. 6.RegIa de decision.Se rechaza Hosi el cilculo del valor de X2es 2:: 3.841(dado que a= .05). 7.Ci.ilculode la estadistica de prueba.El primer paso para caIcular la estadfsticadeprueba escalcularla mediana comiindelas dos muestras combinadas.Esto se hace arreglando las observaciones en orden ascendente y,dado que elniimerototalde observacionesespar,obteniendolamediadelosdosvalorescentrales. Para este ejemplo,la mediana es (33+ 34)/2=33.5. A continuacion se determina para cada muestra el niimero de observacionesque caenpor encima ypor debajode la mediana comtin. 676CAPITULO 13ESTADISTICA NOPARAMETRIC A TABLA13.5.2Caliticaciones del mvel de salud mental de j6venes de secundal'ia UrbanaRuralTotal Cantidad de calificaciones arriba de la mediana6814 Cantidad de calificaciones debajo de lamediana10414 Total161228 Las frecuenciasresultantessearreglan en una tabla de2 X2.La tabla 13.5.2 muestra los resultados de esta operadon. Si, en efecto, las dos muestras provienen de pobladones con la misma mediana,sepuede esperar que aproximadamente la mitad de calificaciones en cada muestra este arriba de la mediana combinada y la otra mitad por debajo. Si se cumplen las condiciones relativas al tamafio de la muestra y las frecuencias esperadas para la tabla de contingencia de 2 x 2, como se estudia en el capitulo 12. puede utilizarse la prueba deji-cuadrada con1 grado de libertad para probar lahipotesis nula de igualdad de medianas en las poblaciones. Mediante la formula12.4.1. se tiene que: X2=28[(6)(4)-8(10)]2=2.33 (16)(12)(14)(14 ) 8.Decision estadistica.Puesto que 2.33- Nonparametrics>- Mood's Median TestMTB>MoodClC2. Teclear Clen Response y C2en Factor.Clic OK. Resultados: Prueba de la mediana del estado de animo MoodmediantestofCl Chisquare2.33df= 1p= 0.127 Individual95.0%CIs C2NMedianQ3-Ql--------+---- ----+----- -+-110627.015.0(-+-----------------) 24839.514.8(-- ---- -+- ------) --+---- ----+------ --+-------30.036.042.0 Overallmedian= 33.5 A95.0%C.I.formedian(I}- median(2}:(-17.1,3.1) FIGURA 13.5.1Procedimiento MINITAB Y resultados para el ejemplo13.5.1. Malisis por computadoraEl calculo de la prueba de la median a puede Ilevarse a cabo con el paquete MINITAB.Para ilustrar el uso de este paquete con los datos del ejemplo13.5.1,primero sealmacenan lasmedicionesenla columna1; en lacolumna2sealmacenan losc6digosque identificanlasobservacionesque corresponden a los individuos urbanos (1)0rurales (2).La figura13.5.1muestra los resultados generados por el procedimiento de MINITAB. FJERCIOOS 13.5.1Se revisaron15 expedientes de pacientes de dos hospitales y se asign6 una calificaci6n disefiada para estimar el nivel de atenci6n recibida.Las calificaciones son lassiguientes; Hospital A:99, 85, 73, 98, 83,88,99,80,74,91, 80,94,94,98,80 Hospital B;78,74,69, 79,57, 78,79,68,59,91,89,55,60,55,79 ms posible concluir,en un nivel de significaci6n de .05,que las medianas de las dos pobladones son diferentes?Determine el valor de p. 678CAPITULO13ESTADISTICA NOPARAMETRICA 13.5.2Se obtuvieron lossiguientes valores de albfunina en el suero de 17personas normales y13 hospitalizadas. AlbUmina en el suero (gllOOml) IndividuosIndividuos nonnaleshospitalizados Albumina en el suero (gllOOml) Individuoslndividuos nonnaleshospitalizados 2.43.01.53.1 3.53.22.01.3 3.13.53.41.5 4.03.81.71.8 4.23.92.02.0 3.44.03.81.5 4.53.53.5 5.03.6 2.9 ~ S epodria conciuir, en el nivel de significacion de .05, que las medianas de las dos poblaciones de las que seextrajeron las muestras son distintas?Determine el valor de p. 13.6PRUEBA DE MANN-\VHlTNEY Laprueba delamediana,queseanalizo en laseccion anterior,no utilizatodala informacion presente en las dos muestras cuando la variable de interes se mide por 10 menos en una escala ordinal.Reducir el contenido de informacion de una observacion para concluir sicae 0no por arriba 0por debajo de una mediana comun,es desperdiciar informacion. Si,para probar la hipotesis deseada, se cuenta con un procedimiento que utilice una mayor cantidad de la informacion inherente en los datos,dichoprocedimientodebeutilizarsesiemprequeseaposible.EIprocedimiento no parametrico que puede utilizarse con frecuencia en lugar de la prueba de la mediana es la prueba de Mann-Whitney (5), algunas veces Hamada Mann-WhitneyWilcoxon.Estaprueba sebasa en las jerarqufas de lasobservaciones,por 10cual utiliza mas informacion que la prueba de la mediana. SupuestosLas suposiciones que fundamentan la prueba de Mann-Whitney son lassiguientes: 1.Las dos muestras, de tamafios n y m,respectivamente, que se utilizan para el anaIisis han sido extrafdas de manera independiente y en forma aleatoria de suspoblaciones respectivas. 2.La escala de medicion es por 10menos ordinaL 3.La variable de interes es continua. 4. Silaspoblaciones son diferentes,varian solamente en 10querespecta asus medianas. Hip6tesisCuando se satisfacen estas suposiciones, puede probarse la hipotesis nula de que las dos poblaciones denen medianas iguales contra cualquiera de tres alternativas posibles:1)las poblaciones no tienen medianas iguales {prueba bilate67913.6PRUEBA DE MA-NN-WHITNEY ral),2)la mediana de lapoblacion1 es mayor que la mediana de la poblacion2 (prueba unilateral), 0bien 3)la mediana de la poblacion 1 es menor que la mediana de la poblacion 2 (prueba unilateral). Silas dos poblaciones son simetricas,de modoquedentrodecada poblaci6nla media yla medianasonlasmismas,las condusiones alasque sellega respectoalasmedianas de lasdospoblacionesse aplicara.n tambien alas medias de ambas poblaciones. Elsiguiente ejemplo ilustra e1uso de la prueba de Mann-Whitney. FJEMPLO 13.6.1 En un experimento disefiado para estimar los efectos de la inhalaci6n prolongada de oxido de cadmio, 15animales de laboratorio sirvieron de sujetos para el experimento, mientras que 10 animales similares sirvieron de control. La variable de interes fue la concentracion de hemoglobina despues del experimento. Losresultados se muestran en la tabla13.6.1. Se desea saber sies posible conduir que la inhalaci6n prolongada de 6xido de cadmio disminuye elnivel de hemoglobina. Soludon: 1.Datos.Vease la tabla13.6.1. 2. Supuestos.Seconsideraquelassuposicionespara laprueba de Mann- Whitney se cumplen. TABlA13.6.1Determinacion de hemoglobina (gramos) en 25 animales de laboratorio Animales expuestosAnimales no expuestos (X)(Y) 14.417.4 14.216.2 13.817.1 16.517.5 14.115.0 16.616.0 15.916.9 15.615.0 14.116.3 15.316.8 15.7 16.7 13.7 15.3 14.0 680CAPITULO13ESTADISTICA NOPARAMETRICA 3. 4. Hipotesis.Laship6tesis nula y alternativa son las siguientes: H o : M x ~My HA:Mx son: a)Ho:X YY son mutuamente independientes. HA:X y Y no son mutuamente independientes. b)Ho:X y Y son mutuamente independientes. HA:Existe una tendencia a formar parejas entre los valores grandes de X y Y. c)Ho:X y Y son mutuamente independientes. HI.:Existe una tendencia de los valoresgrandes de X a formar parejas con los valores pequefios de Y. Las hip6tesis especificadas en el inciso a conducen a una prueba bilateral, y se utilizan cuandosedesea descubrir cualquier desviaci6nde la independencia. Las pruebas unilaterales indicadas en los incisos bye se utilizan, respectivamente, cuando elinvestigador deseasaber siesposible concluir que las variables estan directa 0 inversamente relacionadas. ProcedimientoElprocedimiento para probar laship6tesis comprende los siguientes pasos: 1.Clasificar porjerarqufa los valores de X desde 1 hasta n(el numero de parejas de valores de X y Yen lamuestra).Clasificar por jerarquia losvaloresdeY desde 1 hasta n. 2.Calcular dj para cada pareja de observaciones, restando la jerarqufa de Yi de la jerarquia de Xi' 3. Elevar al cuadrado cada d;y calcularI.d;2,la suma de los val ores al cuadrado. 4. Calcular 6I.d2 1-' tr, (13.10.1)n(n2 -1) 5.Si n esta entre 4 y 30, se compara el valor calculado de rscon los valores criticos, r,*, de la tabla P del apendice. Para la prueba bilateral, se rechaza Ho en el nivel de significaci6n a. si rs es mayor quer; 0menor que - r;, donde r; esta en la intersecci6n de la columna encabezada por a/2 y el rengl6n que corresponde a n. Parala prueba unilateral con HAque especifica una correlaci6n directa, se rechaza Ho 708CAPITULO 13.ESTADISTICA NO PARAMETRICA en elnivel de significaci6n a; sir,esmayor quer,'para a; y n.La hip6tesis nulaserechazaen elnivelde significaci6n a;en laotra prueba unilateral cuando r,es menor que - r;para a; y n. 6. Si n es mayor que 30, se puede calcular z=r)n-l(13.10.2) y utilizar la tabla D para obtener los valores crfticos. 7.Las observacionesde igual valor numerico plantean un problema: el uso de la tabla P es estrictamente valido solo cuando no hay dos valores iguales (a menos que se emplee alglin procedimiento aleatorio para cambiar los que sean iguales). Sin embargo, en la pnktica, con frecuencia se utiliza la tabla despues de que se ha utilizado alglin otro metodo para manejar los valores numericamente iguales. Si el numero de valores iguales es grande, puede utilizarse la siguiente correcci6n pot valores iguales: t3 -tT=--(13.10.3)12 donde t es el nlimero de observaciones de igual valor numerico para algunajerarquia particular. Cuando se utiliza este factor de correcci6n, r, se calcula a partir de (I3.I0.4) en lugar de utilizar la ecuaci6n 13.10.1. En la ecuaci6n13.10.4 se tiene r,::::--;=====-12 Tx.:::::la suma de losvalores deTpara diversas jerarqufas de valor numerico igual en X T:::::la suma delos valoresde Tpara diversas jerarquias deigual v ~ l o rnumerico en Y Muchos investigadores sefialan que a menos que sea excesivo el numero de cantidades iguales, la correcci6n produce una diferencia muy pequefia en el valor de r,.Cuando el numero de valores iguales es pequeno, puede seguirse el procedimiento habitual de asignar a las observaciones de igual valor numerico la media de las jerarquias que intervienen y proceder con los pasos anteriores del 2 al6. FJEMPLO 13.10.1 En un estudio de la relacion entre la edad y los resultados delelectroencefalograrna (EEG), se recopilaron datos en 20 personas con edades entre 20 y 60 anos.La tabla 13.10.1 muestra las edadesy un valor de rendimiento del EEG particular para cada una de esas 20 personas.Losinvestigadores pretenden saber sies posible concluir que este rendimiento del EEG particular tiene relaci6n inversa con la edad. 13.10COEFICIENTE DE CORRELACIONPOR JERARQUiAS DE SPEARMAN709 TABlA13.10.1Edad y valores resultantes del EEG para 20 individuos NumerodeValor resultante individuoEdad (X)del EEG (Y) 12098 22175 32295 424100 52799 63065 73164 83370 93585 103874 114068 124266 134471 144662 154869 165154 175363 185552 195867 206055 .Solucion: 1.Datos.Vease la tabla13.10.1. 2. Supuestos.Se supone que la muestra disponible para el analisis es una muestra aleatoriasimpley que X y Yson medidasen,por 10 menos, una escala ordinaL 3. Hipotesis. Ho:Elrendimiento delEEG y laedad son mutuamenteindependientes.. HA:Existe una tendencia del rendimiento del EEG a disminuir con la edad. Sea a=.05. 4. Estadistica de prueba.Vease la ecuaci6n 13.10.1. 5. ])istribuci6n de la estadistica de prueba.Los valores crfticos de la estadistica de prueba se encuentran en la tabla P del apendice. 6.RegIade decision.Paraestapruebaserechazani Hosielvalor calculado de r,esmenor que -.3789. 710CAPITULO 13ESTADISTICA NOPARAMETRICA TABlA13.10.2Jerarquias para los datos del ejemplo 13.10.1 Numerode individuoJ erarquia (X)Jerarquia (1')d., di 1118-17289 2215-13169 3317-14196 4420-16256 5519-14196 667-11 77611 8812--416 9916-749 101014--416 11111011 12128416 13131300 1414410100 151511416 1616214196 1717512144 1818117289 1919910100 2020317289 IA2 =2340 7. Calculo de la estadistica de prueba.Cuando los valores de X y Y son clasificados por jerarqufa, seobtienen los resultados de 1atabla 13.10.2.Los d,d2 Y 'l,d2semuestran en la misma tabla. La de datos de la tabla13.10.2 en la ecuaci6n 13.10.1proporciona r,= 1- 6(2340)=-.76 20[(20)21] 8. Decision estadistica.Dado que e1valor calculado de r,-.76 es menor que e1valor crftico der:,se rechaza la hipotesis nula. 9.Conclusion.Seconcluyequelasdosvariablesseencuentran inversamente re1acionadas; 10.Valor dep.Puesto que -.76 < -0.6586, se tiene que para esta pruebap 30 Yalgunas observaciones iguales. EJEMPLO13.10.2 En latabla13.10.3semuestran lasedades y lasconcentraciones(ppm)de cierto mineralen eltejidode35individuosaquienesselespracticolaautopsia como parte de un proyecto amplio de investigacion. En la "tabla13.10.4 se muestran lasjerarqufas de los val ores de di,di2 Y ldi2 Sepretende probar,en un nivel de significacion de .05, la hipotesis nula de que X y Y son mutuamente independientes contra la hipotesis alternativa bilateral de que no son mutuamente independientes.. Soluci6n:A partir de los datos en la tabla 13.10.4, elcaIculo es 6(1788.5)rs=1.75 35[352 1] Para probar la significacion de r,secalcula z. 7 5 ~ 3 5 - 14.37 TABlA13.10.3Edad y concentraci6n de mineral (ppm) en el tejido de 35 indlri.duos Concentraci6nConcentraci6n Ntimero deEdadde mineralNtimero deEdadde mineraI individuo(X)(Y)individuo(X)(Y) 182169.6219504.48 28548.94207146.93 38341.16215430.91 46463.95226234.27 58221.09234741.44 6535.402466109.88 7266.3325342.78 8474.2626464.17 9373.6227276.57 10494.82285461.73 1165108.22297247.59 124010.20304110.46 13322.6931353.06 14506.16327549.57 156223.8733505.55 16332.70347650.23 17363.1535286.81 185360.59 712CAPITULO 13ESTADISTICA NO PARAMETRICA TARLI\13.10.4Jerarquias para los datos del ejemplo 13.10.2 NumerodeJerarquiaJerarquia individuo(X)(Y)d. INumerodeJerarquiaJerarquia individuo(X)(Y)di19179864.00 20282539.00 2121.521.5.25 2223.5221.52.25 2313.524-10.5110.25 242734-749.00 256339.00 26127525.00 27215-13169.00 2821.531-9.590.25 29292639.00 301118-749.00 317439.00 32302824.00 331712525.00 34312924.00 35316-13169.00 32.5. 235 334 425 532.5 619.5 71 813.5 99 1015 1126 1210 134 1417 1523.5 165 178 1819.5 35 27 23 32 19 11 14 8 6 10 33 17 1 13 20 2 5 30 -2.5 8 11 -7 13.5 8.5 -13 5.5 3 5 -7 -7 3 4 3.5 3 3 -10.5 6.25 64.00 121.00 49.00 182.25 72.25 169.00 30.25 9.00 25.00 49.00 49.00 9.00 16.00 12.25 9.00 9.00 25 .. 110. 1 .E= 1788.5 Dado que 4.37 es mayor que z =3.S9,p