Contraste de Hipotesis

MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD

1

INFERENCIA ESTADSTICA

Dra. C. San Lus Costas

Dr. A. Lpez de la Llave

Inferencia Estadstica: es un conjunto de procedimientos basados en los modelos

de probabilidad mediante los cuales se pueden realizar validaciones relativas a la

existencia, explicacin y/o prediccin de algn fenmeno de inters a nivel poblacional

con base en la informacin extrada de una muestra de cumple determinadas

caractersticas. Este conjunto de procedimientos se agrupan en dos categoras:

Estimacin de parmetros y Tcnicas de Contraste de Hiptesis (tambin llamadas

Contrastes de Significacin). Sobre Estimacin de Parmetros (tanto puntual como por

intervalos) nos remitimos al apartado anterior dedicando este a los denominados

contrastes de hiptesis o pruebas de significacin.

En principio vamos a definir un modelo como una aproximacin a la

realidad que permite comprender la estructura del sistema modelizado y,

consecuentemente, ser capaz de generar hiptesis contrastables (sobre esta cuestin

abundaremos en el Tema 3). La construccin de un modelo supone siempre una

simplificacin de la realidad, no tiene sentido, pretender que un modelo acomode todos

los datos conocidos en la actualidad y en el futuro. El puente entre la realidad y el

modelo lo proporcionan los datos, a travs de su estudio y anlisis pormenorizado. Dado

que el modelo genera hiptesis constrastables debemos estudiar los procedimientos de

que disponemos en la metodologa para llevar a cabo el contrastar tales de hiptesis.

Si plantemos la cuestin, validar las hiptesis derivadas de un modelo, en

trminos de incertidumbre, tal y como hicimos en el caso de la estimacin de

paramtros, el problema de validacin de hiptesis hace referencia a la determinacin

de procedimeintos que premitn valorar el riesgo en una tarea que hace referncia a

evaluar la congruencia de las hiptesis que genera o se deducen del modelo (tanto a sus

componentes como a las relaciones establecidas) y los datos que hemos obtenido de la

realidad.


2

Como ya hemos comentado en el tema preliminar, existen al menos dos niveles

de hiptesis, las llamadas hiptesis de trabajo, que algunos autores denominan de

investigacin o cientficas y las hiptesis estadsticas.

Las primeras, hiptesis de trabajo, se explicitan de forma lingstica y se deriban

de la teora o del modelo. Estas hipotsis se pueden caracterizar como afirmaciones

acerca de las supuestas relaciones entre constructos o variables implicadas. Deben

explicitarse de tal forma que el modelo que las genera pueda ser falsable y que los

modelos competidores puedan eliminarse (la razn de esta forma de proceder viene

impuesta desde la Filosofa de la Ciencia y concretamente del falsacianismo

popperiano). Su claridad es fundamental para determinar si el resultado obtenido es

similar o no al esperado desde el modelo y su finalidad es servir de gua en el proceso

de investigacin.

Las segundas, hiptesis estadsticas, son conjeturas que realizamos sobre el

como ocurre un suceso (Lpez Cachero, 1991) o, ms claramente, supuestos en los que

se basan algunas operaciones estadsticas y que hacen referencia al valor de un

parmetro, la forma de una distribucin o la ley de probabilidad de un conjunto de

fenmenos (Sierra Bravo, 1991). En otros trminos una hiptesis estadstica es

cualquier conjetura sobre una o varias caractersticas de inters de un modelo de

probabilidad.

La distincin entre hiptesis cientficas y estadsticas es importante: las primeras

se refieren a resultados y relaciones entre los componentes del modelo (sea ste

formalizado o no), las segundas se refieren a subconjuntos de puntos en un espacio

paramtrico.

Las hiptesis estadsticas deben, por tanto, cumplir dos propiedades para

asegurar su correcin:

1. Deben ser congruentes con las hiptesis de investigacin.

2. Deben de ser lo suficientemente especficas como para determinar si los

resultados obtenidos son similares o no al resultado que se haba supuesto.

La hiptesis estadstica especifica que el punto del parmetro buscado se encuentra

en un lugar particular entre dos posibles. El procedimiento del contraste estadstico acta

sobre la base de un conjunto de observaciones (datos) y permite, con ciertas salvedades,

validar o no tal hiptesis.


3

Clasificaciones de hiptesis:

Las hiptesis pueden clasificarse, segn diferentes criterios que hacen referencia

al nmero de parmetros o relaciones implicadas; al tipo de relacin que se establece y a

la temporalidad de la relacin, o referencindolas a su formulacin y papel dentro del

proceso de contraste. As, atendiendo a la primara categora podemos hablar de:

Hiptesis simple o compuesta:

Hiptesis Simple: es aquella que especifica completamente la distribucin

(tambin se conoce como hiptesis de igualdad), o lo que es lo mismo es aquella que

asigna valores nicos a los parmetros ( = 1'5, = 10, X = Y ,...). Ej. El rendimiento

medio escolar de los estudiantes de bachillerato espaoles medido mediante un test es

de 47.

Hiptesis compleja: Es la que asigna un rango de valores a los parmetros poblacionales

desconocidos ( > 1'5, 5 < < 10, X < Y ,...). Ej. Los frecuencia del cncer de

pulmn de mayor en los fumadores que en los fumadores, siendo la prevaleca en el

primer caso de 6 por mil y en el segundo de 4 por mil"

Hiptesis direccional o no direccional:

Hiptesis Direccional: La hiptesis direccional establece relaciones asimtricas

entre variables. Ej. "La prctica del deporte es beneficiosa para conseguir un patrn de

sueo satisfactorio en adolescentes entre 12 y 16 aos."

Hiptesis no direccional: Es aquella que establece relaciones simtricas entre

variables. Ej. "Existe una relacin entre el consumo de tabaco y el sueo".

Hiptesis de asociacin o de causalidad:

Hiptesis de asociacin: Es aquella que hace referencia a la variacin conjunta

de las variables (son siempre relaciones simtricas por tanto no pueden establecer

antecedente y consecuente y por ende causalidad). Ej. "Existe una relacin positiva

entre el nmero de accidentes de trfico y el consumo de alcohol.

Hiptesis de causalidad: hacen referencia a variacin conjunta entre variables

pero en la que una de ellas antecede a la ocurrencia de la otra, o lo que es lo mismo la


4

primera produce un efecto en la segunda (son siempre por tanto relaciones asimtricas).

Ej. " La aspirina infantil reduce el riesgo de infarto

Atendiendo a la segunda de las categoras mencionadas, es decir al papel que

juegan en el proceso de contratacin hablamos de Hiptesis nula e hiptesis

alternativa.

Hiptesis nula e Hiptesis alternativa:

Hiptesis nula: se denota por H0 y de forme general podemos decir que expresa

la ausencia de relacin (comnmente expresa y recoge la situacin contraria a la

conjetura o hiptesis que la investigacin propone como explicacin del fenmeno en

estudio).

Hiptesis alternativa: Se denota por H1 y es la complementaria de la H0

(coincide generalmente con la propuesta de explicacin). La excepcin a esta

afirmacin se presenta en el caso de los estudios llamados diseos de equivalencia.

Planteamiento del contraste de hiptesis.

El contraste de hiptesis estadstico se basa en las distribuciones muestrales, que

como sabemos son modelos probabilsticos, de ah que el contraste slo est

circunscrito, y as debe entenderse, a un resultado estrictamente probabilstico, por lo

tanto no podr nunca demostrarse su falsedad en trminos absolutos, lo sern

nicamente en trminos probabilsticos. La finalidad de las tcnicas de contraste es

hacer que dicho soporte se mantenga dentro de unos lmites racionales lgicamente

probabilsticos.

El planteamiento de las tcnicas de contraste de hiptesis se debe a Fisher y a

Neyman y Pearson(como veremos inmediatamente a una mezcla entre el planteamiento

de Fisher y la propuesta de Neyman y Pearson) . Si bien todas ellas se fundamentan en

los mismos principios lgicos (modus tolendo tolens) existe un amplio elenco de

pruebas que responde a exigencias demarcadas por: especificidades del diseo

implicado, nmero de poblaciones , tipo de parmetro/s, carctersitcas de las

distrisbuciones de las variables implicadas (supuestos que deben cumplir tales que

normalidad, homocedasticidas, etc.).

Podemos definir un contraste (test de hiptesis) como un conjunto de tcnicas

que nos proporciona la Inferencia Estadstica y que permiten comprobar si la


5

informacin que proporciona una muestra observada concuerda (o no) con la hiptesis

estadstica formulada sobre el modelo de probabilidad y, por tanto, se puede validar (o

no) la hiptesis formulada. Esta hiptesis es la que hemos definido anteriormente como

hiptesis nula H0. Si se rechaza, en el sentido de no validacin, la hiptesis nula

implcitamente se asume como plausible la hiptesis alternativa, H1.

El problema del contraste de hiptesis se puede definir:

Dado un punto del espacio muestral x = (x1 , x2, x3, .; xn) conjunto de datos

obtenidos) se define una regla de decisin que siendo funcin de x, permita aceptar o

rechazar la H0 , dividiendo al espacio muestral en dos subconjuntos excluyentes C y Cc

tal forma que:

Si xC rechazamos la H0 (consideramos probado que esa hiptesis

es falsa y por ende admitiendo como plausible la H1 propuesta) a

este subconjunto del espacio muestral se le denomina regin crtica.

.S xCc entonces diremos que hiptesis (siempre refirindonos a

H0) es compatible con los datos.

Es decir, que el criterio que vamos a seguir para decidir si la hiptesis nula se

mantiene o se rechaza, se basa en la particin de la distribucin muestral del

estadstico en dos zonas mutuamente exclusivas y excluyentes que denominamos regin

crtica y regin de aceptacin y definimos:

Regin Crtica (o de Rechazo): Es el rea de la distribucin muestral que

corresponde a los valores del estadstico de contraste que se encuentran tan alejados de

la afirmacin establecida en H0 que es muy poco probable que ocurran, si la hiptesis

nula es correcta. Su probabilidad es (o nivel de significacin o riesgo).

Regin de Aceptacin: Es el rea de la distribucin muestral que corresponde a los

valores del estadstico de contraste prximos a la afirmacin establecida en la hiptesis

nula. Su probabilidad es 1- (o nivel de confianza).

El tamao de las zonas de aceptacin y rechazo se determinan fijando el valor de ?(nivel de significacin). Considerando que se trata de un nivel de error, su valor debe

ser pequeo, de ah que valores para ? considerados en la literatura y utilizados en la investigacin emprica son habitualmente 0.01 y 0.05.

Dado que la H0 y H1 son complementarias es decir exhaustivas y excluyentes


6

dependiendo de cmo formulemos H1 y en relacin a las regiones de rechazo y

aceptacin de H0, los contrastes de hiptesis pueden ser bilaterales o unilaterales.

Se dice que un contraste es bilateral, cuando las H1 planteada es simple ( ???'5, ????, X ?? Y ,...), en tales casos la zona crtica se encuentra, generalmente repartida a

partes iguales entre las dos colas de la distribucin muestral. Cuando la H1 compuesta

( < 1'5; 5 < < 10, X > Y ,...) los contraste se dicen unilaterales, en tales casos la

regin crtica se encuentra en una de las colas de la distribucin muestral. (Ver figura 1)

Figura 1

BILATERALBILATERAL UNILATERAL UNILATERAL ((derecha)derecha)

El procedimeinto general para el contraste de hiptesis estadsticas, tal y como

fue introducida por Fisher, se puede resumir en los siguientes pasos:

1) Plantear una hiptesis nula (H0). La hiptesis hace referencia, tpicamente, al

valor de algn parmetro en la poblacin de referencia.

2) Establecer una regla de muestreo. Generalmente, se trata de muestreo

aleatorio simple.

3) Determinar la distribucin muestral del estadstico de inters en funcin de

la hiptesis nula y la regla de muestreo.

4) Determinar una medida de la discrepancia, que no es ms que una diferencia


7

estandarizada, entre el estadtico correspondiente y el parmetro (en otros

trminos entre el valor obtenido a partir de la muestra y lo establecido por la

hiptesis nula dividido por el error tpico de la distribubin del estadstico). 1

El ndice de discrepancia d se denomina estadstico de contraste

Es funcin de los datos muestrales

y de la informacin contenida en la hiptesis nula (H0).

5) Establecer un nivel de significacin , en otros trminos especificar que

discrepancias se consideran inadmisibles cuando H0 es vlida.

Tras todo ello, se selecciona la muestra y se calcula la medida de discrepancia; si

la probabilidad de obtener bajo H0 una discrepancia igual o mayor que la obtenida es

menor que , se considerar que se debe rechazar la H0, entendiendo que el trmino

hiptesis nula, tal como fue introducido por Fisher, hace referencia a que es la

hiptesis cuya nulidad (falsedad) se pretende demostrar. Actualmente los paquetes

estadsticos para anlisis de datos incluyen en los resultados el valor de p (probalidad

asociada) que no es ms que la probabilidad de obtener un valor del estadstico de

contraste igual o ms extremo que el obetendio con los datos de la meustra bajo la

condicin de que H0 sea cierta. A los efectos se opera comparando el valor de p con el

nivel de significacin ??????????????????????????????????????n :Si p?????????????????0 Si p?????????????????0

Los dos enfoques del contraste de hiptesis: Fisher y Neyman - Pearson

Para Fisher, un contraste de significacin puede llevar a una de las dos

decisiones siguientes: o bien la H0 se rechaza al nivel de significacin o bien el juicio

se reserva en ausencia de base suficiente. Este autor desarroll los mtodos de contraste

1 Importante tener presente en la definicin del ndice de discrepancia (Estadstico de Contraste) que se trata

de una variable aleatoria cuya distribucun es, por lo ganeral, conocida y es precisamente este caracterstica del ndice

de discrepancia lo que permitir llevar a cabo la toma de decisiones


8

de hiptesis estadsticas dentro de una perspectiva puramente popperiana: las nicas

decisiones posibles son rechazar la hiptesis nula o declarar que la evidencia no es

suficiente.

Este enfoque se centra de forma exclusiva en el resultado de la prueba estadstica

y en concreto en la evaluacin del valor p (probabilidad asociada) 2 en relacin al

??????????????????????????????????n arbitrario y previamente fijado), es decir p???????????suficientes indicios para decartar H0, si p??????????????????rminos de la H0 indica queno es concordante con los datos disponibles. En otros trminos, cuando se rechaza la H0

se puede admitir que el valor de la relacin (el efecto) no es cero, pero cuando se acepta

H0 no se puede concluir que el valor de la relacin (el efecto) sea cero (Cohen, 1988),

como ya advertimos en este contexto nulo no quiere cero.

Por su parte la metodologa de Neyman y Pearson, en oposicin a esto, est

orientada a la resolucin de un tipo diferente de problema, una situacin en la que se

debe tomar una decisin partiendo de informacin limitada y en la que se desea

minimizar los costes de una decisin errnea. Su campo de aplicacin ideal es el control

de calidad, donde la situacin tpica consiste en controlar la produccin de cierto tipo de

objetos, es pues un plateamiento centrado en la toma de decisiones, para lo cual

introducen algunas modificaciones en el esquema fisheriano, al considerar

explcitamente la hiptesis alternativa H1 (contrapuesta a la H0) e introducir los

conceptos de error tipo I y II, regin crtica y potencia de la prueba y la necesidad de

????????????????????????????????????????????n) como garantia de de que las decisiones no se toman a posteriorien virtud de los resultados.

Planteemos la cuestin desde el punto de vista de la toma de decisiones para

explicar los los conceptos introducidos en este planteamiento. Dado que existen dos

posibles hiptesis ( H0 y H1) las decisiones que podemos tomar sern: (cyadro 1 y

2 Probabilidad asociada

Se llama nivel crtico p a la probabilidad de obtener una discrepancia mayor o igual que la

observada en la muestra, cuando H0 es cierta. p = P (d d | H0)

Es importante resear que la probabilidad asociada p no es una medida de la magnitud de la

significacin del contraste (tal y como muchas veces se interpreta) ni tampoco una medida de la magnitud

o relevancia del efecto detectado, en otros trminos significacin estadstica no supone significacin

terica ni clnica.


9

figura 2)

Cuadro 1

H0 es correcta H0 es incorrecta

Aceptamos H0 Decisin correcta

(1- )

Error tipo II

Rechazamos H0 Error tipo I Decisin correcta

(1- )

Figura 2

Error Tipo I: error cometido al rechazar H0 siendo verdadera. La probabilidad de

cometer este error es ? (nivel de significacin que fija y controla el investigador). Obviamente la probabilidad complementaria (1 ? ??? ??? ??? ?????? ??? ??????????(recuerdese lo visto al presentar la estimacin por intervalos).


10

Error tipo II: error cometido al aceptar H0 siendo falsa. La probabilidad de cometer

este error se designa por ?. La probabilidad complementaria (1-?) se denomina potencia del contraste y corresponde a la probabilidad de rechazar una hiptesis nula

que es falsa. Indica la capacidad que tiene un contraste para detectar que una hiptesis

nula concreta es falsa, o bien, la capacidad de aceptar H1 siendo esta verdadera.. Es

obvio que una regin crtica es la mejor o la mas potente cuando, para un ? dado, su potencia es mayor que la de cualquier otra de las infinitas regiones que llevan asociadas

esa misma probabilidad ?.La problemtica del contraste de hiptesis.

Las pruebas de significacin tal y como se aplican usualmente son el resultado

de un procedimiento hbrido en el que se mezclan las dos posturas (encontradas) de la

filosofa subyacente a los procedimientos de contraste que hemos expuesto.

Simplificando mucho se puede decir que la hibridacin consiste en que se toma del

planteamiento fisheriano la concepcin y el procedimiento de contraste de la hiptesis

nula (H0) pero introduciendo la hipotsis alternativa H1 (del enfoque Neyman

Pearson) como contrapuesta estadsticamente a la H0 ( cuesitn esta absolutamente

inaceptable para Fisher) y en consecuencia incluyendo tambin los conceptos de error

d??????? ??? ???? ?? ?????????????????? ???????????? ? ?? ??? ????????????? ??? ????????????n y fijacin del error de Tipo I (??????????????????????????????????????????????????????????????una toma de decisin entre dos contrarios complementarios y excluyentes.

Crticas al contraste Hiptesis

Son muchas y comprenden desde poner en tela de juicio los planteamientos

tericos y su aplicacin y considerarlas poco interesantes e incluso errneas hasta los

que slo se manifiestan en contra del uso inapropiado y de la mala enseanza que se

hace de ellas fruto de las confusiones sobre algunos de sus elementos claves tales que el

concepto de hiptesis nula; el problema de la significacin estadstica y los factores que

la determinan y desde luego, y como el ms destacable de todos los problemas, la

potencia estadstica. Todo ello ha llevado a que actualmente y en nimo a soslayar las

crticas y seguir las recomendaciones de la American Psychological Association

aparecidas en el American Psychology, 54, 594-604, se propone que para garantizar un

buen uso de estas tcnicas se tomen como mnimo las siguientes precauciones:

Determinacin previa del tamao muestral (n) necesario para


11

garantizar una determinada potencia, o informar de la potencia

obtenida.

Completar los resultados obtenidos de la aplicacin de las tcnicas de contraste de hiptesis con otros procedimientos

estadsticos que permitan extraer el sentido y la mayor

informacin posible de los datos mustrales, desde el modelo de

la inferencia tal y como lo conocemos (intervalos de confianza y

tamao del efecto).

Contraste de hiptesis desde la perspectiva actual

Conviene aclarar como afirma Frick (1995 y 96) el uso de los contrastes de

hiptesis, tal y como se vena haciendo (y aun se hace) puede ser vlido cuando

planteamos leyes en sentido ordinal o cualitativo y nicamente pretendemos

comprender y estructurar los datos de la realidad (es decir, cuando el valor real de la

relacin, es decir el efecto, no es trascendental) , ms all de este propsito, cuando se

pretenden predicciones cuantitativas o aplicaciones prcticas se hace necesario incluir

otros procedimientos estadsticos complementarios que informan sobre el grado,

direccin e importancia real de los resultados derivados de la aplicacin de las pruebas

de significacin.

Presentamos a continuacin los estadsticos y procedimientos complementarios a

las tcnicas de contrastes de hiptesis y que corresponden tanto a los planteamientos

terico prcticos como a las exigencias que estn imponiendo en las revistas al uso. A

tal efecto retomaremos algunos de los conceptos ya vistos que nos servirn de gua en

este planteamiento.

Comenzamos reproduciendo el cuadro de decisiones estadsticas posibles

relativas a la conclusin que se deriva de la prueba de hiptesis y obviamente

referenciadas a la poblacin/es pero, de forma ms concreta (reproducido de Lipsey,

1990), donde T representa al grupo de tratamiento y C el grupo control (ambos de forma

genrica).


12

Referencia Poblacional

Conclusin estadstica

T y C

difieren

T y C

no difieren

Diferencias Significativas

Rechazo de H0

Conclusin correcta

Probabilidad = 1-

POTENCIA

Error tipo I

Probabilidad

Diferencias no significativas

Aceptacin de H0

Error tipo II

Probabilidad

Conclusin correcta

Probabilidad 1-

(coeficiente de confianza)

Error tipo I: error cometido al rechazar H0 siendo verdadera. La probabilidad

de comenter un error Tipo I o riesgo de comenter este tipo de error , que denominamos

nivel de significacin, se define como la probabilidad de obtener en la distribucin

muestral del estadstico de contraste valores de ste que se encuentran tan alejados de la

afirmacin establecida en H0 que es muy poco probable que ocurran, si la hiptesis nula

es correcta.

Error tipo II: Aceptacin de la hiptesis nula siendo falsa, su probabilidad que

???????????????????. Estos dos errores ( y ) estn inversamente relacionados. Para una muestra determinada de tamao n, si disminuye aumenta. ???????????????????????fijado por el investigador, por tanto, se puede decir que el rechazo de las H0 verdaderas

esta controlado. Ahora bien, El error tipo II no se puede conocer hasta que no se

conozca la H1 entendiendo que H1 indica el efecto que el investigador espera, este valor

(que en realidad constituye la hiptesis que le investigador desea evaluar).


13

Relacin entre y

A medida que aumenta disminuye

Potencia es la probabilidad de rechazar correctamente la hiptesis nula cuando debe ser

rechazada. Aunque la especificacin alfa establece el nivel de significacin estadstica

aceptable, es la potencia la que dicta la probabilidad de xito en la bsqueda de las

relaciones/diferencias si es que realmente existen. Es importante tener presente que es

posible, para un parmetro determinado obtener su curva de potencia. 3

Factores que influyen en la Potencia Estadstica:

1. ??????????Dado que y estn inversamente relacionados a medida que alfa se vuelve ms restrictivo (menor), la potencia decrece. Esto significa que si reducimos la probabilidad de encontrar un efecto incorrecto significativo, tambin reducimos la probabilidad de detectar un efecto correcto.

2. El tamao de la muestra: Para cualquier valor dado, el incremento del tamao muestral incrementa tambin la Potencia del test estadstico. Pero, un aumento excesivo del tamao de la muestra puede producir demasiada potencia en el sentido de se puede llegar a observar que efectos (valores cuantificados de diferencias o relaciones mnimas pueden llegar ser significativos, hasta que para muestras muy grandes casi cualquier efecto es significativo. As, el tamao de la muestra puede afectar a la prueba estadstica tanto por hacerla insensible (para muestras

3 Curva de potencia: En el contexto que nos ocupa, es una grfica que muestra, para todos los

valores posibles de un parmetro poblacional que contradice la hiptesis nula, la probabilidad, 1 -? ??? ???rechazarla correctamente, dado el tamao muestral y un riesgo a mximo especificado.


14

muy pequeas) o demasiado sensible (para muestras muy grandes) 4.

3. Tamao del Efecto: La probabilidad de conseguir significacin estadstica se basa no slo en consideraciones estadsticas sino tambin en la magnitud real del efecto que nos interesa (por ejemplo, una diferencia de medias entre dos grupos o la correlacin entre variables) en la poblacin, denominado tamao del efecto. Como cabra esperar, un efecto grande es ms probable de encontrar que un efecto pequeo y por tanto, afecta a la potencia de la prueba estadstica. Para evaluar la potencia de cualquier prueba estadstica, el investigador debe entender primero el efecto examinado.

Relacin entre y el tamao de la muestra

A medida que aumenta el tamao de la muestra disminuye el error estandar y por lo tanto el

riesgo de

n1 n2

n1 < n2

4. Si la hiptesis alternativa es simple, pro ejemplo H1: ?????????????????valor prefijado de habr un nico valor de ????????????????????????????situacin no es la comn, lo que ocurre normalmente es que la H1 sea del tipo < >, es decir hiptesis compuesta (ms de una distribucin posible) lo cual supone que para cada posible valor del parmetro existe un valor de? ?? ????? ??fico). Siendo estrictos deberamos determinar la curva de ??????????????????????????????????????????????que contradicen la hiptesis nula dado el tamao muestral y prefijado.

4 Es importante resear ahora que para la determinacin del tamao muestral necesario en un estudio se

debe considerar si el inters se centra en la estimacin de parmetros (al respeto lo expuesto en los temas de relativos al

muestreo) o si el inters de la investigacin lleva a planteamientos de contraste de hiptesis referidas a algn parmetro

(problemtica que se plantea en este apartado). Para ms informacin pueden acudir

http://masmatematicas.com/estadisticas/n.html


15

Relacin entre el riego y el valor verdadero de H1

Hay tantos valores de como H1 se hayan enunciado

A continuacin se presentan dos ejemplos sencillos para ilustrar los comentarios

anteriores. El primero implica la comprobacin de la diferencia entre las medias de dos

grupos. Suponiendo que el tamao de efecto sea entre pequeo (0,2) y moderado (0,5)

(siguiendo los criterios convencionales sugeridos pos Cohen (1992).

La Tabla 1.1 muestra el impacto tanto del tamao de la muestra como del nivel

sobre la potencia, reacurdese que la potencia se ha definido como 1- ?. Como puede verse, la potencia llega a ser aceptable para tamaos de muestra de 80 o ms en

situaciones en las que el tamao del efecto es mediano para ambos niveles de alfa

prefijados (.70 en el peor caso). Para un tamao de efecto pequeo, obtenemos poca

potencia, incluso con niveles de de 0.01 y muestras de 200 sujetos. Por ejemplo, una

muestra de 200 sujetos en cada grupo con un de 0,05 tiene slo un 50 por ciento de

posibilidades de encontrar diferencias significativas si el tamao del efecto es pequeo.

Lo anterior indica que en el diseo del estudio, si anticipamos los efectos van a ser

pequeos, deberemos trabajar muestras mucho mayores y/o niveles de menos

restrictivos (0,05 o 0,10).

TABLA 2. Niveles de potencia para la comparacin entre dos medias: Tamao de la muestra,

nivel de significacin y tamao del efecto.


16

= 0.05

Tamao del

efecto (TE)

= 0.01

Tamao del

efecto (TE)Tamao

muestral

Pequeo

(0.2)

Mediano

(0.5)

Pequeo

(0.2)

Mediano

(0.5)

20 0.095 0.338 0.025 0.144

40 0.143 0.598 0.045 0.349

60 0.192 0.775 0.067 0.549

80 0.242 0.882 0.092 0.709

100 0.290 0.940 0.120 0.823

150 0.411 0.990 0.201 0.959

200 0.516 0.998 0.284 0.992

Grafico3

El Grafico 3 representa la curva de potencia para niveles de significacin

de 0,01; 0,05 para distintos tamaos maestrales y un tamao de efecto de .30.

Ntese que para lograr una potencia de .80 (recomendada por Cohen) para

=.05 son necesarios tamaos muestrales inferiores que los necesarios para =.01.

Cohen ha examinado la potencia para la mayor parte de las pruebas de inferencia

estadstica y ha proporcionado pautas para los niveles aceptables de potencia, sugiriendo


17

que los estudios deben disearse para conseguir niveles de alfa de al menos 0,05 con

niveles de potencia??????????????????????????????????????rminos mantener una relacin ?? de 4/1

Determinacin de la Potencia

Existen dos formas: a prior y a posteriori

A Priori: Se hace a partir de las Curvas de Potencia y permite determinar

el nmero de sujetos necesarios para alcanzar una potencia deseada. Si

bien, a partir de la propuesta de Cohen (1992) y por convencin se da por

suficiente potencias de .80, no debe tomarse como un criterio

inamovible, el investigador debe plantear su compromiso con las

probabilidades de error ? ?? ?? ?? ??? ???????? ???? ?????? ?????????? ????relacin inversa.

A posteriori: Muy tiles cuando los resultados de un estudio son

negativos ya que en general se suele interpretar un resultado negativo

como que le fenmeno estudiado no existe cuando lo que puede estar

ocurriendo es que estemos ante un estudio de potencia baja) bien porque

el tamao muestral sea insuficiente o el tamao del efecto pequeo) de

tal forma que el procedimiento no es capaz de detectar la significacin

estadstica.

Como ya hemos visto los cuatro elementos centrales en inferencia

son n; ?? ? y el tamao del efecto, todos ellos mutuamente interrelacionados de tal forma que cada uno es funcin de los otros tres.

As, y siguiendo a Cohen (1998) podemos plantear cuatro tipos de

anlisis de la potencia:

1.- Potencia en funcin de , TE5 (tamao el efecto) y n. Es decir,

conocidos los tres elementos calculamos (normalmente se busca en las

tablas de potencia) la potencia (si la queremos aumentar cambiaremos las

especificaciones preestablecidas).

2.- Se estima el TE (bien a travs del estudio de la literatura al caso o por

aproximacin fundamentada en la propia experiencia), se establece el

5 A partir de ahora designaremos el tamao del efecto por TE


18

valor de y la potencia deseada y se calcula n. Este procedimiento es

especialmente relevante en estudios clnicos y en diseos experimentales

ya que permite determinar el nmero de sujetos necesario.

3.- Determinar el TE conocidos los otros elementos en juego (apenas se

utiliza).

4.- Determinacin de conocidos los otros tres, apenas tiene utilidad

ya que la convencin de : 0.05 0.01, esta muy extendida e impuesta

por la convencin.(En algunos estudios clnicos se toma = .10)

A ttulo de resumen:

En condiciones ideales los valores de ? ?? ?? deberan ser especificados y utilizados para fijar el valor de n para la prueba estadstica seleccionada para el

anlisis. En general lo comn es fijar y n lo cual determina la potencia. Cuando el

resultado da una potencia baja, la solucin es incrementar n ya que es la nica manera

de reducir los errores tipo I y II, si bien el criterio de incremento de n debe ser

matizado por criterios de coste tanto econmico como de esfuerzo..

En los estudios en los que TE sea un elemento clave (estudios clnicos y algunos

experimentales) deber tenerse presente y prefijado ? ?? ????????????? ???n necesario, para el TE postulado.6

Actualmente existe software gratuito que permite, para algunas pruebas

especficas determina n TE la potencia. Por ejemplo el SamplePower del SPSS

permite determinar los tamaos maestrales y ajustar los parmetros del diseo,

obteniendo las curvas de potencia para un amplio nmero de tcnicas de anlisis

(medias, proporciones, correlacin, Anova, Ancova y Regresin). El documento

SOFTWARE PARA CALCULAR TAMAOS MUESTRALES Y POTENCIA incluido

en la carpeta COMPELMENTOS BLOUE 1 contiene direcciones web con software

disponible en la red para estos clculos.

6 Para mayor informacin sobre estas cuestiones ver:

Bono, R.; Arnau, J.; (1995) Consideraciones generales en torno a los estudios de potencia. Anales de Psicologa, 11 (2), 193-202.

Cohen, J. (1988). Statiscal power anlisis for the behavioral sciences. ( 2da ed.). Hillsdale, NJ: Erlbaum

Cohen, J. (1992). A power primer. Psychological Bulletin, 112, 155- 159.


19

Algunos comentarios relacionados con el TAMAO DEL EFECTO

Cohen define este estadstico como el grado en que el fenmeno en estudio est

en la poblacin. Responde a preguntas el tipo: cual ha sido la magnitud del efecto de

un tratamiento?; cmo de fuerte es la relacin entre las variables?, en otros trminos

facilita no slo el que se conozca que un efecto ocurre, sino tambin su magnitud. Tal y

como ha sido definido (grado en que el fenmeno esta presente en la poblacional)

puede calcularse su intervalo de confianza que indicar el rango dentro del cual es

posible que se encuentre el efecto real en la poblacin (se aplica todo lo visto sobre

intervalos confidenciales dado que se trata de un estadstico con su distribucin

muestral) 7 .

Como ya se comento, para determinar la Potencia Estadstica (ya sea a priori o a

posteriori) es necesario conocer el TE, aunque no esta todo dicho sobre cuales son las

medidas de TE y su interpretacin 8 (cuestin que hoy constituye un campo de

investigacin) Rosenthal (1994) clasifica las medidas del efecto en dos familias:

Familia d: ndices para diferencias entre medias y proporciones (en ambos casos

hay distintos ndices relativos a puntuaciones brutas d de Cohen; la g de

Hedges; la delta de Glass , tipificadas, estadstico CL de McGraw y Wong,

tambin llamado ndice universal del TE; d Cox, para variables dicotomizadas o

trasformaciones a r, en concreto de la de d de Cohen), entre otros.

Familia r: Coeficientes de correlacin de Pearson y sus derivados (correlaciones

cuadrticas o proporciones de varianza explicada. 2; ^2).

A la hora de realizar un estudio completo y, desde la perspectiva presentada, se

hacen una serie de recomendaciones que pueden encontrar en el documento

sugerencias metodolgicas.

7 Importante destacar que las tcnicas que calculan el TE para algunas de las diferentes pruebas estadsticas

de uso comn (ejemplo, t; F) ofrecen una mtrica comn que posibilita la integracin de resultados indispensable en el

Meta-anlisis.

8 Los diferentes ndices sern presentados asociados a las correspondientes pruebas de significacin.


20

Contraste de Hipotesis

Documents

Transcript of Contraste de Hipotesis