Contraste de Hipotesis

download Contraste de Hipotesis

of 20

description

Contraste de hipótesis estadística

Transcript of Contraste de Hipotesis

  • MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD

    1

    INFERENCIA ESTADSTICA

    Dra. C. San Lus Costas

    Dr. A. Lpez de la Llave

    Inferencia Estadstica: es un conjunto de procedimientos basados en los modelos

    de probabilidad mediante los cuales se pueden realizar validaciones relativas a la

    existencia, explicacin y/o prediccin de algn fenmeno de inters a nivel poblacional

    con base en la informacin extrada de una muestra de cumple determinadas

    caractersticas. Este conjunto de procedimientos se agrupan en dos categoras:

    Estimacin de parmetros y Tcnicas de Contraste de Hiptesis (tambin llamadas

    Contrastes de Significacin). Sobre Estimacin de Parmetros (tanto puntual como por

    intervalos) nos remitimos al apartado anterior dedicando este a los denominados

    contrastes de hiptesis o pruebas de significacin.

    En principio vamos a definir un modelo como una aproximacin a la

    realidad que permite comprender la estructura del sistema modelizado y,

    consecuentemente, ser capaz de generar hiptesis contrastables (sobre esta cuestin

    abundaremos en el Tema 3). La construccin de un modelo supone siempre una

    simplificacin de la realidad, no tiene sentido, pretender que un modelo acomode todos

    los datos conocidos en la actualidad y en el futuro. El puente entre la realidad y el

    modelo lo proporcionan los datos, a travs de su estudio y anlisis pormenorizado. Dado

    que el modelo genera hiptesis constrastables debemos estudiar los procedimientos de

    que disponemos en la metodologa para llevar a cabo el contrastar tales de hiptesis.

    Si plantemos la cuestin, validar las hiptesis derivadas de un modelo, en

    trminos de incertidumbre, tal y como hicimos en el caso de la estimacin de

    paramtros, el problema de validacin de hiptesis hace referencia a la determinacin

    de procedimeintos que premitn valorar el riesgo en una tarea que hace referncia a

    evaluar la congruencia de las hiptesis que genera o se deducen del modelo (tanto a sus

    componentes como a las relaciones establecidas) y los datos que hemos obtenido de la

    realidad.

  • MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD

    2

    Como ya hemos comentado en el tema preliminar, existen al menos dos niveles

    de hiptesis, las llamadas hiptesis de trabajo, que algunos autores denominan de

    investigacin o cientficas y las hiptesis estadsticas.

    Las primeras, hiptesis de trabajo, se explicitan de forma lingstica y se deriban

    de la teora o del modelo. Estas hipotsis se pueden caracterizar como afirmaciones

    acerca de las supuestas relaciones entre constructos o variables implicadas. Deben

    explicitarse de tal forma que el modelo que las genera pueda ser falsable y que los

    modelos competidores puedan eliminarse (la razn de esta forma de proceder viene

    impuesta desde la Filosofa de la Ciencia y concretamente del falsacianismo

    popperiano). Su claridad es fundamental para determinar si el resultado obtenido es

    similar o no al esperado desde el modelo y su finalidad es servir de gua en el proceso

    de investigacin.

    Las segundas, hiptesis estadsticas, son conjeturas que realizamos sobre el

    como ocurre un suceso (Lpez Cachero, 1991) o, ms claramente, supuestos en los que

    se basan algunas operaciones estadsticas y que hacen referencia al valor de un

    parmetro, la forma de una distribucin o la ley de probabilidad de un conjunto de

    fenmenos (Sierra Bravo, 1991). En otros trminos una hiptesis estadstica es

    cualquier conjetura sobre una o varias caractersticas de inters de un modelo de

    probabilidad.

    La distincin entre hiptesis cientficas y estadsticas es importante: las primeras

    se refieren a resultados y relaciones entre los componentes del modelo (sea ste

    formalizado o no), las segundas se refieren a subconjuntos de puntos en un espacio

    paramtrico.

    Las hiptesis estadsticas deben, por tanto, cumplir dos propiedades para

    asegurar su correcin:

    1. Deben ser congruentes con las hiptesis de investigacin.

    2. Deben de ser lo suficientemente especficas como para determinar si los

    resultados obtenidos son similares o no al resultado que se haba supuesto.

    La hiptesis estadstica especifica que el punto del parmetro buscado se encuentra

    en un lugar particular entre dos posibles. El procedimiento del contraste estadstico acta

    sobre la base de un conjunto de observaciones (datos) y permite, con ciertas salvedades,

    validar o no tal hiptesis.

  • MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD

    3

    Clasificaciones de hiptesis:

    Las hiptesis pueden clasificarse, segn diferentes criterios que hacen referencia

    al nmero de parmetros o relaciones implicadas; al tipo de relacin que se establece y a

    la temporalidad de la relacin, o referencindolas a su formulacin y papel dentro del

    proceso de contraste. As, atendiendo a la primara categora podemos hablar de:

    Hiptesis simple o compuesta:

    Hiptesis Simple: es aquella que especifica completamente la distribucin

    (tambin se conoce como hiptesis de igualdad), o lo que es lo mismo es aquella que

    asigna valores nicos a los parmetros ( = 1'5, = 10, X = Y ,...). Ej. El rendimiento

    medio escolar de los estudiantes de bachillerato espaoles medido mediante un test es

    de 47.

    Hiptesis compleja: Es la que asigna un rango de valores a los parmetros poblacionales

    desconocidos ( > 1'5, 5 < < 10, X < Y ,...). Ej. Los frecuencia del cncer de

    pulmn de mayor en los fumadores que en los fumadores, siendo la prevaleca en el

    primer caso de 6 por mil y en el segundo de 4 por mil"

    Hiptesis direccional o no direccional:

    Hiptesis Direccional: La hiptesis direccional establece relaciones asimtricas

    entre variables. Ej. "La prctica del deporte es beneficiosa para conseguir un patrn de

    sueo satisfactorio en adolescentes entre 12 y 16 aos."

    Hiptesis no direccional: Es aquella que establece relaciones simtricas entre

    variables. Ej. "Existe una relacin entre el consumo de tabaco y el sueo".

    Hiptesis de asociacin o de causalidad:

    Hiptesis de asociacin: Es aquella que hace referencia a la variacin conjunta

    de las variables (son siempre relaciones simtricas por tanto no pueden establecer

    antecedente y consecuente y por ende causalidad). Ej. "Existe una relacin positiva

    entre el nmero de accidentes de trfico y el consumo de alcohol.

    Hiptesis de causalidad: hacen referencia a variacin conjunta entre variables

    pero en la que una de ellas antecede a la ocurrencia de la otra, o lo que es lo mismo la

  • MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD

    4

    primera produce un efecto en la segunda (son siempre por tanto relaciones asimtricas).

    Ej. " La aspirina infantil reduce el riesgo de infarto

    Atendiendo a la segunda de las categoras mencionadas, es decir al papel que

    juegan en el proceso de contratacin hablamos de Hiptesis nula e hiptesis

    alternativa.

    Hiptesis nula e Hiptesis alternativa:

    Hiptesis nula: se denota por H0 y de forme general podemos decir que expresa

    la ausencia de relacin (comnmente expresa y recoge la situacin contraria a la

    conjetura o hiptesis que la investigacin propone como explicacin del fenmeno en

    estudio).

    Hiptesis alternativa: Se denota por H1 y es la complementaria de la H0

    (coincide generalmente con la propuesta de explicacin). La excepcin a esta

    afirmacin se presenta en el caso de los estudios llamados diseos de equivalencia.

    Planteamiento del contraste de hiptesis.

    El contraste de hiptesis estadstico se basa en las distribuciones muestrales, que

    como sabemos son modelos probabilsticos, de ah que el contraste slo est

    circunscrito, y as debe entenderse, a un resultado estrictamente probabilstico, por lo

    tanto no podr nunca demostrarse su falsedad en trminos absolutos, lo sern

    nicamente en trminos probabilsticos. La finalidad de las tcnicas de contraste es

    hacer que dicho soporte se mantenga dentro de unos lmites racionales lgicamente

    probabilsticos.

    El planteamiento de las tcnicas de contraste de hiptesis se debe a Fisher y a

    Neyman y Pearson(como veremos inmediatamente a una mezcla entre el planteamiento

    de Fisher y la propuesta de Neyman y Pearson) . Si bien todas ellas se fundamentan en

    los mismos principios lgicos (modus tolendo tolens) existe un amplio elenco de

    pruebas que responde a exigencias demarcadas por: especificidades del diseo

    implicado, nmero de poblaciones , tipo de parmetro/s, carctersitcas de las

    distrisbuciones de las variables implicadas (supuestos que deben cumplir tales que

    normalidad, homocedasticidas, etc.).

    Podemos definir un contraste (test de hiptesis) como un conjunto de tcnicas

    que nos proporciona la Inferencia Estadstica y que permiten comprobar si la

  • MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD

    5

    informacin que proporciona una muestra observada concuerda (o no) con la hiptesis

    estadstica formulada sobre el modelo de probabilidad y, por tanto, se puede validar (o

    no) la hiptesis formulada. Esta hiptesis es la que hemos definido anteriormente como

    hiptesis nula H0. Si se rechaza, en el sentido de no validacin, la hiptesis nula

    implcitamente se asume como plausible la hiptesis alternativa, H1.

    El problema del contraste de hiptesis se puede definir:

    Dado un punto del espacio muestral x = (x1 , x2, x3, .; xn) conjunto de datos

    obtenidos) se define una regla de decisin que siendo funcin de x, permita aceptar o

    rechazar la H0 , dividiendo al espacio muestral en dos subconjuntos excluyentes C y Cc

    tal forma que:

    Si xC rechazamos la H0 (consideramos probado que esa hiptesis

    es falsa y por ende admitiendo como plausible la H1 propuesta) a

    este subconjunto del espacio muestral se le denomina regin crtica.

    .S xCc entonces diremos que hiptesis (siempre refirindonos a

    H0) es compatible con los datos.

    Es decir, que el criterio que vamos a seguir para decidir si la hiptesis nula se

    mantiene o se rechaza, se basa en la particin de la distribucin muestral del

    estadstico en dos zonas mutuamente exclusivas y excluyentes que denominamos regin

    crtica y regin de aceptacin y definimos:

    Regin Crtica (o de Rechazo): Es el rea de la distribucin muestral que

    corresponde a los valores del estadstico de contraste que se encuentran tan alejados de

    la afirmacin establecida en H0 que es muy poco probable que ocurran, si la hiptesis

    nula es correcta. Su probabilidad es (o nivel de significacin o riesgo).

    Regin de Aceptacin: Es el rea de la distribucin muestral que corresponde a los

    valores del estadstico de contraste prximos a la afirmacin establecida en la hiptesis

    nula. Su probabilidad es 1- (o nivel de confianza).

    El tamao de las zonas de aceptacin y rechazo se determinan fijando el valor de ?(nivel de significacin). Considerando que se trata de un nivel de error, su valor debe

    ser pequeo, de ah que valores para ? considerados en la literatura y utilizados en la investigacin emprica son habitualmente 0.01 y 0.05.

    Dado que la H0 y H1 son complementarias es decir exhaustivas y excluyentes

  • MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD

    6

    dependiendo de cmo formulemos H1 y en relacin a las regiones de rechazo y

    aceptacin de H0, los contrastes de hiptesis pueden ser bilaterales o unilaterales.

    Se dice que un contraste es bilateral, cuando las H1 planteada es simple ( ???'5, ????, X ?? Y ,...), en tales casos la zona crtica se encuentra, generalmente repartida a

    partes iguales entre las dos colas de la distribucin muestral. Cuando la H1 compuesta

    ( < 1'5; 5 < < 10, X > Y ,...) los contraste se dicen unilaterales, en tales casos la

    regin crtica se encuentra en una de las colas de la distribucin muestral. (Ver figura 1)

    Figura 1

    BILATERALBILATERAL UNILATERAL UNILATERAL ((derecha)derecha)

    El procedimeinto general para el contraste de hiptesis estadsticas, tal y como

    fue introducida por Fisher, se puede resumir en los siguientes pasos:

    1) Plantear una hiptesis nula (H0). La hiptesis hace referencia, tpicamente, al

    valor de algn parmetro en la poblacin de referencia.

    2) Establecer una regla de muestreo. Generalmente, se trata de muestreo

    aleatorio simple.

    3) Determinar la distribucin muestral del estadstico de inters en funcin de

    la hiptesis nula y la regla de muestreo.

    4) Determinar una medida de la discrepancia, que no es ms que una diferencia

  • MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD

    7

    estandarizada, entre el estadtico correspondiente y el parmetro (en otros

    trminos entre el valor obtenido a partir de la muestra y lo establecido por la

    hiptesis nula dividido por el error tpico de la distribubin del estadstico). 1

    El ndice de discrepancia d se denomina estadstico de contraste

    Es funcin de los datos muestrales

    y de la informacin contenida en la hiptesis nula (H0).

    5) Establecer un nivel de significacin , en otros trminos especificar que

    discrepancias se consideran inadmisibles cuando H0 es vlida.

    Tras todo ello, se selecciona la muestra y se calcula la medida de discrepancia; si

    la probabilidad de obtener bajo H0 una discrepancia igual o mayor que la obtenida es

    menor que , se considerar que se debe rechazar la H0, entendiendo que el trmino

    hiptesis nula, tal como fue introducido por Fisher, hace referencia a que es la

    hiptesis cuya nulidad (falsedad) se pretende demostrar. Actualmente los paquetes

    estadsticos para anlisis de datos incluyen en los resultados el valor de p (probalidad

    asociada) que no es ms que la probabilidad de obtener un valor del estadstico de

    contraste igual o ms extremo que el obetendio con los datos de la meustra bajo la

    condicin de que H0 sea cierta. A los efectos se opera comparando el valor de p con el

    nivel de significacin ??????????????????????????????????????n :Si p?????????????????0 Si p?????????????????0

    Los dos enfoques del contraste de hiptesis: Fisher y Neyman - Pearson

    Para Fisher, un contraste de significacin puede llevar a una de las dos

    decisiones siguientes: o bien la H0 se rechaza al nivel de significacin o bien el juicio

    se reserva en ausencia de base suficiente. Este autor desarroll los mtodos de contraste

    1 Importante tener presente en la definicin del ndice de discrepancia (Estadstico de Contraste) que se trata

    de una variable aleatoria cuya distribucun es, por lo ganeral, conocida y es precisamente este caracterstica del ndice

    de discrepancia lo que permitir llevar a cabo la toma de decisiones

  • MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD

    8

    de hiptesis estadsticas dentro de una perspectiva puramente popperiana: las nicas

    decisiones posibles son rechazar la hiptesis nula o declarar que la evidencia no es

    suficiente.

    Este enfoque se centra de forma exclusiva en el resultado de la prueba estadstica

    y en concreto en la evaluacin del valor p (probabilidad asociada) 2 en relacin al

    ??????????????????????????????????n arbitrario y previamente fijado), es decir p???????????suficientes indicios para decartar H0, si p??????????????????rminos de la H0 indica queno es concordante con los datos disponibles. En otros trminos, cuando se rechaza la H0

    se puede admitir que el valor de la relacin (el efecto) no es cero, pero cuando se acepta

    H0 no se puede concluir que el valor de la relacin (el efecto) sea cero (Cohen, 1988),

    como ya advertimos en este contexto nulo no quiere cero.

    Por su parte la metodologa de Neyman y Pearson, en oposicin a esto, est

    orientada a la resolucin de un tipo diferente de problema, una situacin en la que se

    debe tomar una decisin partiendo de informacin limitada y en la que se desea

    minimizar los costes de una decisin errnea. Su campo de aplicacin ideal es el control

    de calidad, donde la situacin tpica consiste en controlar la produccin de cierto tipo de

    objetos, es pues un plateamiento centrado en la toma de decisiones, para lo cual

    introducen algunas modificaciones en el esquema fisheriano, al considerar

    explcitamente la hiptesis alternativa H1 (contrapuesta a la H0) e introducir los

    conceptos de error tipo I y II, regin crtica y potencia de la prueba y la necesidad de

    ????????????????????????????????????????????n) como garantia de de que las decisiones no se toman a posteriorien virtud de los resultados.

    Planteemos la cuestin desde el punto de vista de la toma de decisiones para

    explicar los los conceptos introducidos en este planteamiento. Dado que existen dos

    posibles hiptesis ( H0 y H1) las decisiones que podemos tomar sern: (cyadro 1 y

    2 Probabilidad asociada

    Se llama nivel crtico p a la probabilidad de obtener una discrepancia mayor o igual que la

    observada en la muestra, cuando H0 es cierta. p = P (d d | H0)

    Es importante resear que la probabilidad asociada p no es una medida de la magnitud de la

    significacin del contraste (tal y como muchas veces se interpreta) ni tampoco una medida de la magnitud

    o relevancia del efecto detectado, en otros trminos significacin estadstica no supone significacin

    terica ni clnica.

  • MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD

    9

    figura 2)

    Cuadro 1

    H0 es correcta H0 es incorrecta

    Aceptamos H0 Decisin correcta

    (1- )

    Error tipo II

    Rechazamos H0 Error tipo I Decisin correcta

    (1- )

    Figura 2

    Error Tipo I: error cometido al rechazar H0 siendo verdadera. La probabilidad de

    cometer este error es ? (nivel de significacin que fija y controla el investigador). Obviamente la probabilidad complementaria (1 ? ??? ??? ??? ?????? ??? ??????????(recuerdese lo visto al presentar la estimacin por intervalos).

  • MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD

    10

    Error tipo II: error cometido al aceptar H0 siendo falsa. La probabilidad de cometer

    este error se designa por ?. La probabilidad complementaria (1-?) se denomina potencia del contraste y corresponde a la probabilidad de rechazar una hiptesis nula

    que es falsa. Indica la capacidad que tiene un contraste para detectar que una hiptesis

    nula concreta es falsa, o bien, la capacidad de aceptar H1 siendo esta verdadera.. Es

    obvio que una regin crtica es la mejor o la mas potente cuando, para un ? dado, su potencia es mayor que la de cualquier otra de las infinitas regiones que llevan asociadas

    esa misma probabilidad ?.La problemtica del contraste de hiptesis.

    Las pruebas de significacin tal y como se aplican usualmente son el resultado

    de un procedimiento hbrido en el que se mezclan las dos posturas (encontradas) de la

    filosofa subyacente a los procedimientos de contraste que hemos expuesto.

    Simplificando mucho se puede decir que la hibridacin consiste en que se toma del

    planteamiento fisheriano la concepcin y el procedimiento de contraste de la hiptesis

    nula (H0) pero introduciendo la hipotsis alternativa H1 (del enfoque Neyman

    Pearson) como contrapuesta estadsticamente a la H0 ( cuesitn esta absolutamente

    inaceptable para Fisher) y en consecuencia incluyendo tambin los conceptos de error

    d??????? ??? ???? ?? ?????????????????? ???????????? ? ?? ??? ????????????? ??? ????????????n y fijacin del error de Tipo I (??????????????????????????????????????????????????????????????una toma de decisin entre dos contrarios complementarios y excluyentes.

    Crticas al contraste Hiptesis

    Son muchas y comprenden desde poner en tela de juicio los planteamientos

    tericos y su aplicacin y considerarlas poco interesantes e incluso errneas hasta los

    que slo se manifiestan en contra del uso inapropiado y de la mala enseanza que se

    hace de ellas fruto de las confusiones sobre algunos de sus elementos claves tales que el

    concepto de hiptesis nula; el problema de la significacin estadstica y los factores que

    la determinan y desde luego, y como el ms destacable de todos los problemas, la

    potencia estadstica. Todo ello ha llevado a que actualmente y en nimo a soslayar las

    crticas y seguir las recomendaciones de la American Psychological Association

    aparecidas en el American Psychology, 54, 594-604, se propone que para garantizar un

    buen uso de estas tcnicas se tomen como mnimo las siguientes precauciones:

    Determinacin previa del tamao muestral (n) necesario para

  • MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD

    11

    garantizar una determinada potencia, o informar de la potencia

    obtenida.

    Completar los resultados obtenidos de la aplicacin de las tcnicas de contraste de hiptesis con otros procedimientos

    estadsticos que permitan extraer el sentido y la mayor

    informacin posible de los datos mustrales, desde el modelo de

    la inferencia tal y como lo conocemos (intervalos de confianza y

    tamao del efecto).

    Contraste de hiptesis desde la perspectiva actual

    Conviene aclarar como afirma Frick (1995 y 96) el uso de los contrastes de

    hiptesis, tal y como se vena haciendo (y aun se hace) puede ser vlido cuando

    planteamos leyes en sentido ordinal o cualitativo y nicamente pretendemos

    comprender y estructurar los datos de la realidad (es decir, cuando el valor real de la

    relacin, es decir el efecto, no es trascendental) , ms all de este propsito, cuando se

    pretenden predicciones cuantitativas o aplicaciones prcticas se hace necesario incluir

    otros procedimientos estadsticos complementarios que informan sobre el grado,

    direccin e importancia real de los resultados derivados de la aplicacin de las pruebas

    de significacin.

    Presentamos a continuacin los estadsticos y procedimientos complementarios a

    las tcnicas de contrastes de hiptesis y que corresponden tanto a los planteamientos

    terico prcticos como a las exigencias que estn imponiendo en las revistas al uso. A

    tal efecto retomaremos algunos de los conceptos ya vistos que nos servirn de gua en

    este planteamiento.

    Comenzamos reproduciendo el cuadro de decisiones estadsticas posibles

    relativas a la conclusin que se deriva de la prueba de hiptesis y obviamente

    referenciadas a la poblacin/es pero, de forma ms concreta (reproducido de Lipsey,

    1990), donde T representa al grupo de tratamiento y C el grupo control (ambos de forma

    genrica).

  • MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD

    12

    Referencia Poblacional

    Conclusin estadstica

    T y C

    difieren

    T y C

    no difieren

    Diferencias Significativas

    Rechazo de H0

    Conclusin correcta

    Probabilidad = 1-

    POTENCIA

    Error tipo I

    Probabilidad

    Diferencias no significativas

    Aceptacin de H0

    Error tipo II

    Probabilidad

    Conclusin correcta

    Probabilidad 1-

    (coeficiente de confianza)

    Error tipo I: error cometido al rechazar H0 siendo verdadera. La probabilidad

    de comenter un error Tipo I o riesgo de comenter este tipo de error , que denominamos

    nivel de significacin, se define como la probabilidad de obtener en la distribucin

    muestral del estadstico de contraste valores de ste que se encuentran tan alejados de la

    afirmacin establecida en H0 que es muy poco probable que ocurran, si la hiptesis nula

    es correcta.

    Error tipo II: Aceptacin de la hiptesis nula siendo falsa, su probabilidad que

    ???????????????????. Estos dos errores ( y ) estn inversamente relacionados. Para una muestra determinada de tamao n, si disminuye aumenta. ???????????????????????fijado por el investigador, por tanto, se puede decir que el rechazo de las H0 verdaderas

    esta controlado. Ahora bien, El error tipo II no se puede conocer hasta que no se

    conozca la H1 entendiendo que H1 indica el efecto que el investigador espera, este valor

    (que en realidad constituye la hiptesis que le investigador desea evaluar).

  • MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD

    13

    Relacin entre y

    A medida que aumenta disminuye

    Potencia es la probabilidad de rechazar correctamente la hiptesis nula cuando debe ser

    rechazada. Aunque la especificacin alfa establece el nivel de significacin estadstica

    aceptable, es la potencia la que dicta la probabilidad de xito en la bsqueda de las

    relaciones/diferencias si es que realmente existen. Es importante tener presente que es

    posible, para un parmetro determinado obtener su curva de potencia. 3

    Factores que influyen en la Potencia Estadstica:

    1. ??????????Dado que y estn inversamente relacionados a medida que alfa se vuelve ms restrictivo (menor), la potencia decrece. Esto significa que si reducimos la probabilidad de encontrar un efecto incorrecto significativo, tambin reducimos la probabilidad de detectar un efecto correcto.

    2. El tamao de la muestra: Para cualquier valor dado, el incremento del tamao muestral incrementa tambin la Potencia del test estadstico. Pero, un aumento excesivo del tamao de la muestra puede producir demasiada potencia en el sentido de se puede llegar a observar que efectos (valores cuantificados de diferencias o relaciones mnimas pueden llegar ser significativos, hasta que para muestras muy grandes casi cualquier efecto es significativo. As, el tamao de la muestra puede afectar a la prueba estadstica tanto por hacerla insensible (para muestras

    3 Curva de potencia: En el contexto que nos ocupa, es una grfica que muestra, para todos los

    valores posibles de un parmetro poblacional que contradice la hiptesis nula, la probabilidad, 1 -? ??? ???rechazarla correctamente, dado el tamao muestral y un riesgo a mximo especificado.

  • MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD

    14

    muy pequeas) o demasiado sensible (para muestras muy grandes) 4.

    3. Tamao del Efecto: La probabilidad de conseguir significacin estadstica se basa no slo en consideraciones estadsticas sino tambin en la magnitud real del efecto que nos interesa (por ejemplo, una diferencia de medias entre dos grupos o la correlacin entre variables) en la poblacin, denominado tamao del efecto. Como cabra esperar, un efecto grande es ms probable de encontrar que un efecto pequeo y por tanto, afecta a la potencia de la prueba estadstica. Para evaluar la potencia de cualquier prueba estadstica, el investigador debe entender primero el efecto examinado.

    Relacin entre y el tamao de la muestra

    A medida que aumenta el tamao de la muestra disminuye el error estandar y por lo tanto el

    riesgo de

    n1 n2

    n1 < n2

    4. Si la hiptesis alternativa es simple, pro ejemplo H1: ?????????????????valor prefijado de habr un nico valor de ????????????????????????????situacin no es la comn, lo que ocurre normalmente es que la H1 sea del tipo < >, es decir hiptesis compuesta (ms de una distribucin posible) lo cual supone que para cada posible valor del parmetro existe un valor de? ?? ????? ??fico). Siendo estrictos deberamos determinar la curva de ??????????????????????????????????????????????que contradicen la hiptesis nula dado el tamao muestral y prefijado.

    4 Es importante resear ahora que para la determinacin del tamao muestral necesario en un estudio se

    debe considerar si el inters se centra en la estimacin de parmetros (al respeto lo expuesto en los temas de relativos al

    muestreo) o si el inters de la investigacin lleva a planteamientos de contraste de hiptesis referidas a algn parmetro

    (problemtica que se plantea en este apartado). Para ms informacin pueden acudir

    http://masmatematicas.com/estadisticas/n.html

  • MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD

    15

    Relacin entre el riego y el valor verdadero de H1

    Hay tantos valores de como H1 se hayan enunciado

    A continuacin se presentan dos ejemplos sencillos para ilustrar los comentarios

    anteriores. El primero implica la comprobacin de la diferencia entre las medias de dos

    grupos. Suponiendo que el tamao de efecto sea entre pequeo (0,2) y moderado (0,5)

    (siguiendo los criterios convencionales sugeridos pos Cohen (1992).

    La Tabla 1.1 muestra el impacto tanto del tamao de la muestra como del nivel

    sobre la potencia, reacurdese que la potencia se ha definido como 1- ?. Como puede verse, la potencia llega a ser aceptable para tamaos de muestra de 80 o ms en

    situaciones en las que el tamao del efecto es mediano para ambos niveles de alfa

    prefijados (.70 en el peor caso). Para un tamao de efecto pequeo, obtenemos poca

    potencia, incluso con niveles de de 0.01 y muestras de 200 sujetos. Por ejemplo, una

    muestra de 200 sujetos en cada grupo con un de 0,05 tiene slo un 50 por ciento de

    posibilidades de encontrar diferencias significativas si el tamao del efecto es pequeo.

    Lo anterior indica que en el diseo del estudio, si anticipamos los efectos van a ser

    pequeos, deberemos trabajar muestras mucho mayores y/o niveles de menos

    restrictivos (0,05 o 0,10).

    TABLA 2. Niveles de potencia para la comparacin entre dos medias: Tamao de la muestra,

    nivel de significacin y tamao del efecto.

  • MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD

    16

    = 0.05

    Tamao del

    efecto (TE)

    = 0.01

    Tamao del

    efecto (TE)Tamao

    muestral

    Pequeo

    (0.2)

    Mediano

    (0.5)

    Pequeo

    (0.2)

    Mediano

    (0.5)

    20 0.095 0.338 0.025 0.144

    40 0.143 0.598 0.045 0.349

    60 0.192 0.775 0.067 0.549

    80 0.242 0.882 0.092 0.709

    100 0.290 0.940 0.120 0.823

    150 0.411 0.990 0.201 0.959

    200 0.516 0.998 0.284 0.992

    Grafico3

    El Grafico 3 representa la curva de potencia para niveles de significacin

    de 0,01; 0,05 para distintos tamaos maestrales y un tamao de efecto de .30.

    Ntese que para lograr una potencia de .80 (recomendada por Cohen) para

    =.05 son necesarios tamaos muestrales inferiores que los necesarios para =.01.

    Cohen ha examinado la potencia para la mayor parte de las pruebas de inferencia

    estadstica y ha proporcionado pautas para los niveles aceptables de potencia, sugiriendo

  • MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD

    17

    que los estudios deben disearse para conseguir niveles de alfa de al menos 0,05 con

    niveles de potencia??????????????????????????????????????rminos mantener una relacin ?? de 4/1

    Determinacin de la Potencia

    Existen dos formas: a prior y a posteriori

    A Priori: Se hace a partir de las Curvas de Potencia y permite determinar

    el nmero de sujetos necesarios para alcanzar una potencia deseada. Si

    bien, a partir de la propuesta de Cohen (1992) y por convencin se da por

    suficiente potencias de .80, no debe tomarse como un criterio

    inamovible, el investigador debe plantear su compromiso con las

    probabilidades de error ? ?? ?? ?? ??? ???????? ???? ?????? ?????????? ????relacin inversa.

    A posteriori: Muy tiles cuando los resultados de un estudio son

    negativos ya que en general se suele interpretar un resultado negativo

    como que le fenmeno estudiado no existe cuando lo que puede estar

    ocurriendo es que estemos ante un estudio de potencia baja) bien porque

    el tamao muestral sea insuficiente o el tamao del efecto pequeo) de

    tal forma que el procedimiento no es capaz de detectar la significacin

    estadstica.

    Como ya hemos visto los cuatro elementos centrales en inferencia

    son n; ?? ? y el tamao del efecto, todos ellos mutuamente interrelacionados de tal forma que cada uno es funcin de los otros tres.

    As, y siguiendo a Cohen (1998) podemos plantear cuatro tipos de

    anlisis de la potencia:

    1.- Potencia en funcin de , TE5 (tamao el efecto) y n. Es decir,

    conocidos los tres elementos calculamos (normalmente se busca en las

    tablas de potencia) la potencia (si la queremos aumentar cambiaremos las

    especificaciones preestablecidas).

    2.- Se estima el TE (bien a travs del estudio de la literatura al caso o por

    aproximacin fundamentada en la propia experiencia), se establece el

    5 A partir de ahora designaremos el tamao del efecto por TE

  • MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD

    18

    valor de y la potencia deseada y se calcula n. Este procedimiento es

    especialmente relevante en estudios clnicos y en diseos experimentales

    ya que permite determinar el nmero de sujetos necesario.

    3.- Determinar el TE conocidos los otros elementos en juego (apenas se

    utiliza).

    4.- Determinacin de conocidos los otros tres, apenas tiene utilidad

    ya que la convencin de : 0.05 0.01, esta muy extendida e impuesta

    por la convencin.(En algunos estudios clnicos se toma = .10)

    A ttulo de resumen:

    En condiciones ideales los valores de ? ?? ?? deberan ser especificados y utilizados para fijar el valor de n para la prueba estadstica seleccionada para el

    anlisis. En general lo comn es fijar y n lo cual determina la potencia. Cuando el

    resultado da una potencia baja, la solucin es incrementar n ya que es la nica manera

    de reducir los errores tipo I y II, si bien el criterio de incremento de n debe ser

    matizado por criterios de coste tanto econmico como de esfuerzo..

    En los estudios en los que TE sea un elemento clave (estudios clnicos y algunos

    experimentales) deber tenerse presente y prefijado ? ?? ????????????? ???n necesario, para el TE postulado.6

    Actualmente existe software gratuito que permite, para algunas pruebas

    especficas determina n TE la potencia. Por ejemplo el SamplePower del SPSS

    permite determinar los tamaos maestrales y ajustar los parmetros del diseo,

    obteniendo las curvas de potencia para un amplio nmero de tcnicas de anlisis

    (medias, proporciones, correlacin, Anova, Ancova y Regresin). El documento

    SOFTWARE PARA CALCULAR TAMAOS MUESTRALES Y POTENCIA incluido

    en la carpeta COMPELMENTOS BLOUE 1 contiene direcciones web con software

    disponible en la red para estos clculos.

    6 Para mayor informacin sobre estas cuestiones ver:

    Bono, R.; Arnau, J.; (1995) Consideraciones generales en torno a los estudios de potencia. Anales de Psicologa, 11 (2), 193-202.

    Cohen, J. (1988). Statiscal power anlisis for the behavioral sciences. ( 2da ed.). Hillsdale, NJ: Erlbaum

    Cohen, J. (1992). A power primer. Psychological Bulletin, 112, 155- 159.

  • MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD

    19

    Algunos comentarios relacionados con el TAMAO DEL EFECTO

    Cohen define este estadstico como el grado en que el fenmeno en estudio est

    en la poblacin. Responde a preguntas el tipo: cual ha sido la magnitud del efecto de

    un tratamiento?; cmo de fuerte es la relacin entre las variables?, en otros trminos

    facilita no slo el que se conozca que un efecto ocurre, sino tambin su magnitud. Tal y

    como ha sido definido (grado en que el fenmeno esta presente en la poblacional)

    puede calcularse su intervalo de confianza que indicar el rango dentro del cual es

    posible que se encuentre el efecto real en la poblacin (se aplica todo lo visto sobre

    intervalos confidenciales dado que se trata de un estadstico con su distribucin

    muestral) 7 .

    Como ya se comento, para determinar la Potencia Estadstica (ya sea a priori o a

    posteriori) es necesario conocer el TE, aunque no esta todo dicho sobre cuales son las

    medidas de TE y su interpretacin 8 (cuestin que hoy constituye un campo de

    investigacin) Rosenthal (1994) clasifica las medidas del efecto en dos familias:

    Familia d: ndices para diferencias entre medias y proporciones (en ambos casos

    hay distintos ndices relativos a puntuaciones brutas d de Cohen; la g de

    Hedges; la delta de Glass , tipificadas, estadstico CL de McGraw y Wong,

    tambin llamado ndice universal del TE; d Cox, para variables dicotomizadas o

    trasformaciones a r, en concreto de la de d de Cohen), entre otros.

    Familia r: Coeficientes de correlacin de Pearson y sus derivados (correlaciones

    cuadrticas o proporciones de varianza explicada. 2; ^2).

    A la hora de realizar un estudio completo y, desde la perspectiva presentada, se

    hacen una serie de recomendaciones que pueden encontrar en el documento

    sugerencias metodolgicas.

    7 Importante destacar que las tcnicas que calculan el TE para algunas de las diferentes pruebas estadsticas

    de uso comn (ejemplo, t; F) ofrecen una mtrica comn que posibilita la integracin de resultados indispensable en el

    Meta-anlisis.

    8 Los diferentes ndices sern presentados asociados a las correspondientes pruebas de significacin.

  • MASTER EN METODOLOGA DE LAS CIENCIAS DEL COMPORTAMIENTO Y DE LA SALUD

    20