2007 Jose.Rios@uab.es / Ferran.Torres@uab.es 1 Hipótesis de trabajo, pruebas de hipótesis e...

Post on 12-Jan-2015

12 views 0 download

Transcript of 2007 Jose.Rios@uab.es / Ferran.Torres@uab.es 1 Hipótesis de trabajo, pruebas de hipótesis e...

20072007

Jose.Rios@uab.es / Ferran.Torres@uab.esJose.Rios@uab.es / Ferran.Torres@uab.es 11

Hipótesis de trabajo, pruebas Hipótesis de trabajo, pruebas de hipótesis e intervalos de de hipótesis e intervalos de

confianzaconfianzaLaboratorio de Bioestadística y Epidemiología, sección Ensayos ClínicosLaboratorio de Bioestadística y Epidemiología, sección Ensayos Clínicos

Unidad de Bioestadística Unidad de Bioestadística Universidad Autónoma de BarcelonaUniversidad Autónoma de Barcelona

20072007

Jose.Rios@uab.es / Ferran.Torres@uab.esJose.Rios@uab.es / Ferran.Torres@uab.es 22

Debe estar lo más claramente formulada.Debe estar lo más claramente formulada. Debe ser ‘estadística’ y ‘científicamente’ Debe ser ‘estadística’ y ‘científicamente’

correctacorrecta– Prohíbo circulación de camiones en Rondas. Prohíbo circulación de camiones en Rondas.

Tres semanas después encargo un estudio Tres semanas después encargo un estudio para ver si el número de accidentes en Rondas para ver si el número de accidentes en Rondas con camiones disminuye.con camiones disminuye.

Las ‘técnicas de pesca’ se han de evitar Las ‘técnicas de pesca’ se han de evitar siempre.siempre.

Hipótesis de trabajoHipótesis de trabajo

20072007

Jose.Rios@uab.es / Ferran.Torres@uab.esJose.Rios@uab.es / Ferran.Torres@uab.es 33

Por supuesto, LA HIPÓTESIS DE TRABAJO Por supuesto, LA HIPÓTESIS DE TRABAJO SE FORMULA CON ANTERIORIDAD A SE FORMULA CON ANTERIORIDAD A CUALQUIERA DE LOS PASOSCUALQUIERA DE LOS PASOS

Hipótesis de trabajoHipótesis de trabajo

20072007

Jose.Rios@uab.es / Ferran.Torres@uab.esJose.Rios@uab.es / Ferran.Torres@uab.es 44

En el fondo todo está En el fondo todo está relacionadorelacionado

20072007

Jose.Rios@uab.es / Ferran.Torres@uab.esJose.Rios@uab.es / Ferran.Torres@uab.es 55

Inferencia estadísticaInferencia estadística

PruebasPruebas estadísticas estadísticas

Intervalo de confianzaIntervalo de confianza

20072007

Jose.Rios@uab.es / Ferran.Torres@uab.esJose.Rios@uab.es / Ferran.Torres@uab.es 66

¿Qué es lo que busca todo ¿Qué es lo que busca todo el mundo?el mundo?

p

20072007

Jose.Rios@uab.es / Ferran.Torres@uab.esJose.Rios@uab.es / Ferran.Torres@uab.es 77

¿Para qué se usa la ¿Para qué se usa la estadística?estadística?

MUESTRA

POBLACIÓN

InferirProbabilidad

Prueba estadísticaIntervalo de confianza

20072007

Jose.Rios@uab.es / Ferran.Torres@uab.esJose.Rios@uab.es / Ferran.Torres@uab.es 88

Errores de Tipo I y IIErrores de Tipo I y II

El valor del error tipo I ó es de 0.05 (5%)

El valor del error tipo II ó es igual o superior a 0.20 (20%)

El poder (1 - ) es igual ó superior a 0.80 (80%)

20072007

Jose.Rios@uab.es / Ferran.Torres@uab.esJose.Rios@uab.es / Ferran.Torres@uab.es 99

Variable binariaVariable binaria: : {evento,no evento}{evento,no evento}

– ProporcionesProporciones:: p = r/n p = r/n suma de eventos en un grupo de individuossuma de eventos en un grupo de individuos denominador fijo: n individuosdenominador fijo: n individuos distribución binomialdistribución binomial

– RecuentosRecuentos:: suma de eventos raros en un periodo de tiempo o suma de eventos raros en un periodo de tiempo o

un territorioun territorio 0,1,2,…,k0,1,2,…,k denominador personas-tiempo denominador personas-tiempo tasas tasas distribución Poissondistribución Poisson

DatosDatos categóricos.categóricos.Definiciones básicasDefiniciones básicas

20072007

Jose.Rios@uab.es / Ferran.Torres@uab.esJose.Rios@uab.es / Ferran.Torres@uab.es 1010

Datos cuantitativosDatos cuantitativos

Distribución de la muestraDistribución de la muestraTendencia central:Tendencia central: X mediaX media

Dispersión o variabilidad:Dispersión o variabilidad: DE desviación estándarDE desviación estándar

Distribución de la media de una muestraDistribución de la media de una muestraTendencia central:Tendencia central: mediamedia

Dispersión o variabilidad:Dispersión o variabilidad: error estándard error estándard

20072007

Jose.Rios@uab.es / Ferran.Torres@uab.esJose.Rios@uab.es / Ferran.Torres@uab.es 1111

Distribución normalDistribución normal

X

X + ‘2’DS =>95%

Distribución de la

muestra

X

X +’2’ EEM

Distribución de la media

20072007

Jose.Rios@uab.es / Ferran.Torres@uab.esJose.Rios@uab.es / Ferran.Torres@uab.es 1212

¿p?¿p? Probabilidad de observar, por azar, una Probabilidad de observar, por azar, una

diferencia como la de la muestra o mayor, diferencia como la de la muestra o mayor, cuando Hcuando H00 es cierta es cierta

Es una medida de la evidencia en contra Es una medida de la evidencia en contra de la Hde la H00– Es el azar una explicación posible de las Es el azar una explicación posible de las

diferencias observadas?diferencias observadas?Supongamos que así es (HSupongamos que así es (H00).).¿Con qué probabilidad observaríamos unas ¿Con qué probabilidad observaríamos unas

diferencias de esa magnitud, o incluso mayor? diferencias de esa magnitud, o incluso mayor? P-P-valorvalor

Si P-valor pequeño, rechazamos HSi P-valor pequeño, rechazamos H00..– ¿Difícil?... No, es como un juicio!¿Difícil?... No, es como un juicio!

20072007

Jose.Rios@uab.es / Ferran.Torres@uab.esJose.Rios@uab.es / Ferran.Torres@uab.es 1313

¿p?¿p?

Se acepta un valor máximo de 5% (0,05).Se acepta un valor máximo de 5% (0,05).– Si pSi p0,05 0,05 diferencias estadísticamente diferencias estadísticamente

significativas.significativas.

– Si p>0,05 Si p>0,05 diferencias estadísticamente NO diferencias estadísticamente NO significativas.significativas.

NO implica importancia clínica.NO implica importancia clínica.

NO implica magnitud de efecto!!NO implica magnitud de efecto!!– Influenciada por el tamaño de la muestra. Si Influenciada por el tamaño de la muestra. Si n n p p

20072007

Jose.Rios@uab.es / Ferran.Torres@uab.esJose.Rios@uab.es / Ferran.Torres@uab.es 1414

Errores y aciertosErrores y aciertos

Realidad

Ttos. I guales Ttos. Dif erentes

Ttos. I guales AciertoError tipo I I

()Conclusión

Ttos. Dif erentesError tipo I

()Acierto

20072007

Jose.Rios@uab.es / Ferran.Torres@uab.esJose.Rios@uab.es / Ferran.Torres@uab.es 1515

SituacionesSituaciones ConclusiónConclusión: Diferencias estadísticamente : Diferencias estadísticamente

significativassignificativas– Realidad:Realidad: Hay diferencias Hay diferencias Acierto Acierto– Realidad:Realidad: No hay diferencias No hay diferencias Error tipo I ( Error tipo I ())

ConclusiónConclusión: Diferencias NO estadísticamente : Diferencias NO estadísticamente significativassignificativas– Realidad:Realidad: No hay diferencias No hay diferencias Acierto Acierto– Realidad:Realidad: Hay diferencias Hay diferencias

Error tipo II (Error tipo II ())Muestra insuficienteMuestra insuficiente

20072007

Jose.Rios@uab.es / Ferran.Torres@uab.esJose.Rios@uab.es / Ferran.Torres@uab.es 1616

Utilidad de Creer en la Existencia Utilidad de Creer en la Existencia de Dios (según Pascal)de Dios (según Pascal)

Realidad

Dios Existe Dios No Existe

Dios Existe Acierto No PenalizaciónDecisiónde Pascal

Dios No Existe Condena Eterna Acierto

H0: Dios No ExisteH1: Dios Existe

20072007

Jose.Rios@uab.es / Ferran.Torres@uab.esJose.Rios@uab.es / Ferran.Torres@uab.es 1717

Sentido/No sentido de la Sentido/No sentido de la prueba estadísticaprueba estadística

Una o dos colasUna o dos colas– Sentido – una colaSentido – una cola

El ‘fenómeno’ existe si A es mayor que BEl ‘fenómeno’ existe si A es mayor que B

– No Sentido – dos colasNo Sentido – dos colasEl ‘fenómeno’ existe si A es diferente que BEl ‘fenómeno’ existe si A es diferente que B

20072007

Jose.Rios@uab.es / Ferran.Torres@uab.esJose.Rios@uab.es / Ferran.Torres@uab.es 1818

Pruebas de hipótesisPruebas de hipótesis

Unilateral (una cola)Unilateral (una cola)

HHoo: : EE - - CC 0 0HH11: : EE - - CC > 0 > 0

Bilateral (dos colas)Bilateral (dos colas)

HHoo: : EE - - CC = 0 = 0HH11: : EE - - CC > 0 ó > 0 ó EE - - CC < 0 < 0

20072007

Jose.Rios@uab.es / Ferran.Torres@uab.esJose.Rios@uab.es / Ferran.Torres@uab.es 1919

Revisión de la Revisión de la aplicabilidad de las aplicabilidad de las distintas pruebas distintas pruebas

estadísticasestadísticas

20072007

Jose.Rios@uab.es / Ferran.Torres@uab.esJose.Rios@uab.es / Ferran.Torres@uab.es 2020

NormalidadNormalidad

MÉTODOS PARAMÉTRICOS

20072007

Jose.Rios@uab.es / Ferran.Torres@uab.esJose.Rios@uab.es / Ferran.Torres@uab.es 2121

No normalidadNo normalidad

MÉTODOS NO PARAMÉTRICOS

X

20072007

Jose.Rios@uab.es / Ferran.Torres@uab.esJose.Rios@uab.es / Ferran.Torres@uab.es 2222

Pruebas paramétricas y no-Pruebas paramétricas y no-paramétricasparamétricas

Una prueba paramétrica requiere la Una prueba paramétrica requiere la estimación de uno o más parámetros estimación de uno o más parámetros (estadísticos) de la población(estadísticos) de la población– Ej.: Una estimación de la diferencia entre la Ej.: Una estimación de la diferencia entre la

media antes y después de una intervenciónmedia antes y después de una intervención Las pruebas no-paramétricas no Las pruebas no-paramétricas no

involucran ningún tipo de estimación de involucran ningún tipo de estimación de parámetrosparámetros– Ej.: Facilitarnos la una estimación de la P[X>Y], Ej.: Facilitarnos la una estimación de la P[X>Y],

probabilidad de que, selecionando un paciente probabilidad de que, selecionando un paciente después del tratamiento, su valor sea mayor después del tratamiento, su valor sea mayor que antes del tratamientoque antes del tratamiento

20072007

Jose.Rios@uab.es / Ferran.Torres@uab.esJose.Rios@uab.es / Ferran.Torres@uab.es 2323

Advantage of non-parametric testAdvantage of non-parametric test– No assumptions about the distribution of the dataNo assumptions about the distribution of the data

– Handles every kind of outcome variableHandles every kind of outcome variable DisadvantageDisadvantage

– Non-parametric test do not have the same statistical Non-parametric test do not have the same statistical power as parametric test dopower as parametric test do

Data issuesData issues– Ranks of data, not data in original units, usedRanks of data, not data in original units, used– Effect of outliers is removed (can be good or bad)Effect of outliers is removed (can be good or bad)

Use n-p. test when p. methods are inappropriate Use n-p. test when p. methods are inappropriate due to lack of distribution requirementsdue to lack of distribution requirements

Pruebas paramétricas y no-Pruebas paramétricas y no-paramétricasparamétricas

20072007

Jose.Rios@uab.es / Ferran.Torres@uab.esJose.Rios@uab.es / Ferran.Torres@uab.es 2424

Pruebas estadísticasPruebas estadísticas2 grupos 3 grupos

Tipo de Datos datos independientes Datos apareados datos independientes datos apareados

Nominales (p.e. sexo) A. J i al cuadrado (2)B. Prueba exacta de FisherNota:1) Si N>40 usar 2

2) Si N=20-40 usar 2 solamente si laf recuencia esperada en cada celda5; si no usar el test exacto deFisher3) Si N<20 usar siempre el testexacto de Fisher

A. Prueba deMcNemar

A. J i al cuadrado (2)Nota: No se puede usar si el 20%de las celdas tienen unaf recuencia esperada <5 o sialguna celda tiene una f recuenciaesperada <1

A. Prueba de Cochran Q

Ordinales o intervalossi no se cumple ladistribución normal enlos grupos

A. Prueba de la U deMann-Whitney

A. Prueba deWilcoxon

A. Prueba de Kruskal-Wallis A. Prueba de Friedman

I ntervalos (p.e.edad,peso, tensión arterial)

A. Prueba de la t deStudent (t-test)

A. Prueba de la t de Studentpara datos apareados

A. Análisis de la Varianza(ANOVA)Nota:1) No es apropiado usar varios t-test para comparar 3 grupos2) Si hay una dif erencia entre 3grupos, existen varias pruebaspara localizar la dif erencia(Prueba de Student-Newman-Keuls)

A. Análisis de la varianza paramedidas repetidasNota:1) No es apropiado usar varios t-test apareados para comparar 3medidas repetidas2) Si hay una dif erencia entre 3medidas, existen varias pruebaspara localizar la dif erencia

20072007

Jose.Rios@uab.es / Ferran.Torres@uab.esJose.Rios@uab.es / Ferran.Torres@uab.es 2525

Más chuletario Más chuletario

V. CUANTITATIVA NO NORMAL EN ALGUN GRUPO

Estadística /Pruebas no paramétricas /2 muestras relacionadas /Wilcoxon

NORMALIDAD? Estadísticos / Pruebas no paramétricas /K-S de 1 muestra / Normal

COMPARACIÓN

DE MEDIAS

Grupos independientes

Grupos apareados

V. CUANTITATIVA NORMALEN AMBOS GRUPOS

V. DIFERENCIA NO NORMAL

Estadística /Pruebas no paramétricas /2 muestras independientes /U de Mann-Whitney

Estadística /Comparar medias /Prueba T para muestras independientes

V. DIFERENCIA NORMAL

Estadística /Comparar medias /Prueba T para muestras relacionadas

V. CUANTITATIVA .vs. V. CUALITATIVA (2 grupos)

20072007

Jose.Rios@uab.es / Ferran.Torres@uab.esJose.Rios@uab.es / Ferran.Torres@uab.es 2626

Más chuletario Más chuletario V. CUANTITATIVA .vs. V. CUALITATIVA ( 2 grupos)

NORMALIDAD ?(NPAR TEST K-S (NORMAL))

INDEPENDENCIA ?ASIGNACIONES ALEATORIAS

HOMOSCEDASTICIDAD?H0:

n

ó n

(TEST DE LEVENE)

ANOVASI

NPAR TEST K-W (Kruskal-Wallis)NO

p > 0.05 No se rechaza H0

p < 0.05 Test a posteriori

--> Test de Scheffé

20072007

Jose.Rios@uab.es / Ferran.Torres@uab.esJose.Rios@uab.es / Ferran.Torres@uab.es 2727

Más chuletario Más chuletario V. CUANTITATIVA .vs. V. CUANTITATIVA

Incumplimiento de condiciones de aplicabilidad

* 1 v. cuantitativa aleatoria .vs. 1 v. cuantitativa diseñadaREGRESION

CORRELACION

Cumplimiento de condiciones de aplicabilidad

* NONPAR CORR (Test de Spearman)

(Normalidad de la v. cuantitativa en los grupos a comparar, homoscedasticidad)

* 2 v. cuantitativas aleatorias

(Normalidad de las dos v. cuantitativas en su conjunto)

20072007

Jose.Rios@uab.es / Ferran.Torres@uab.esJose.Rios@uab.es / Ferran.Torres@uab.es 2828

Análisis de la Co-varianza Análisis de la Co-varianza (ANCOVA)(ANCOVA)

Los valores que estamos Los valores que estamos comparando pueden estar comparando pueden estar afectados directamente por otros afectados directamente por otros (covarianción)(covarianción)– TA al final del estudioTA al final del estudio– TA al inicio del estudioTA al inicio del estudio

Medias ajustadasMedias ajustadas: Media al : Media al final del estudio si las TA al final del estudio si las TA al inicio fuesen las mismas.inicio fuesen las mismas.

20072007

Jose.Rios@uab.es / Ferran.Torres@uab.esJose.Rios@uab.es / Ferran.Torres@uab.es 2929

Intervalo de ConfianzaIntervalo de Confianza

Def.: “Si se realiza el mismo experimento en las mismas condiciones, el 95% de las veces la media que obtendremos estará entre los

márgenes”

Intuitivamente: “El verdadero valor se encuentra dentro del intervalo con una

confianza del 95%”

20072007

Jose.Rios@uab.es / Ferran.Torres@uab.esJose.Rios@uab.es / Ferran.Torres@uab.es 3030

Amplitud del ICAmplitud del IC También depende de la También depende de la informacióninformación que que

la muestra proporciona sobre el la muestra proporciona sobre el verdadero valor poblacionalverdadero valor poblacional

– Mayor Mayor tamaño de muestratamaño de muestra -> -> mayor precisión -> IC más estrechomayor precisión -> IC más estrecho

– Mayor Mayor dispersióndispersión de la medida -> de la medida ->IC más amplioIC más amplio

20072007

Jose.Rios@uab.es / Ferran.Torres@uab.esJose.Rios@uab.es / Ferran.Torres@uab.es 3131

p=0.002

Relación entre IC y Relación entre IC y significación (p)significación (p)

p=0.05

IC al 95%

0

20072007

Jose.Rios@uab.es / Ferran.Torres@uab.esJose.Rios@uab.es / Ferran.Torres@uab.es 3232

Intervalo de ConfianzaIntervalo de Confianza

2 gruposDif. NS

2 gruposDif. Sig.

20072007

Jose.Rios@uab.es / Ferran.Torres@uab.esJose.Rios@uab.es / Ferran.Torres@uab.es 3333

Superioridad no observada

Superioridad observada

Intervalo de confianza para evaluar ensayos de superioridad

0

20072007

Jose.Rios@uab.es / Ferran.Torres@uab.esJose.Rios@uab.es / Ferran.Torres@uab.es 3434

Distribución normalDistribución normal

X

X + ‘2’DS =>95%

Distribución de la

muestra

X

X +’2’ EEM

Distribución de la media

20072007

Jose.Rios@uab.es / Ferran.Torres@uab.esJose.Rios@uab.es / Ferran.Torres@uab.es 3535

EstimaciónEstimación

Un estimador es una cantidad Un estimador es una cantidad numérica calculada sobre una numérica calculada sobre una muestra y que esperamos que sea muestra y que esperamos que sea una buena aproximación de cierta una buena aproximación de cierta cantidad con el mismo significado en cantidad con el mismo significado en la población (parámetro).la población (parámetro).

20072007

Jose.Rios@uab.es / Ferran.Torres@uab.esJose.Rios@uab.es / Ferran.Torres@uab.es 3636

EstimaciónEstimación

Problema que presenta el uso de estimadores puntuales:

– El problema de los estimadores puntuales es que solo dan una idea de lo que puede valer el parámetro que estimamos, sin conocer como de buena es la aproximación; es decir, simplemente proporcionan un valor (de los muchos posibles) que puede proponerse como valor del parámetro.

– Si realizamos diversas muestras, obtendremos tantas estimaciones del parámetro como muestras

20072007

Jose.Rios@uab.es / Ferran.Torres@uab.esJose.Rios@uab.es / Ferran.Torres@uab.es 3737

EstimaciónEstimación Ventaja de la estimación por intervalos de confianza:Ventaja de la estimación por intervalos de confianza:

– Se trata de asignar al parámetro poblacional desconocido, por ejemplo μ, un intervalo de valores, digamos (a, b) entre los cuales está μ con una cierta confianza (1- α). Es decir, si se cumple que

– diremos entonces que (a, b) es un intervalo de confianza para el parámetro μ construido al (1- )% de confianza o, lo que es lo mismo, al % de error.

¿INTERPRETACIÓN?

1)(aP

20072007

Jose.Rios@uab.es / Ferran.Torres@uab.esJose.Rios@uab.es / Ferran.Torres@uab.es 3838

EstimaciónEstimación Por ejemplo, seleccionamos cinco muestras Por ejemplo, seleccionamos cinco muestras

aleatorias de n=5 y elaboramos sus aleatorias de n=5 y elaboramos sus intervalos de confianza. Consideramos un intervalos de confianza. Consideramos un nivel de confianza del 90%nivel de confianza del 90%

20072007

Jose.Rios@uab.es / Ferran.Torres@uab.esJose.Rios@uab.es / Ferran.Torres@uab.es 3939

EstimaciónEstimación Un último ejemplo:Un último ejemplo:

Una muestra de n=100 individuos de una población tiene Una muestra de n=100 individuos de una población tiene media de peso 60 kg y desviación 5kg.media de peso 60 kg y desviación 5kg.

– Dichas cantidades pueden considerarse como aproximaciones Dichas cantidades pueden considerarse como aproximaciones (estimaciones puntuales)(estimaciones puntuales)

60 kg estima a μ60 kg estima a μ 5 kg estima a σ5 kg estima a σ 5/raiz(n)= 0,5 estima el error estándar (típico) EE5/raiz(n)= 0,5 estima el error estándar (típico) EE

– Estas son las llamadas estimaciones puntuales: un número concreto Estas son las llamadas estimaciones puntuales: un número concreto calculado sobre una muestra es aproximación de un parámetro.calculado sobre una muestra es aproximación de un parámetro.

– Una estimación por intervalo de confianza es una que ofrece Una estimación por intervalo de confianza es una que ofrece un intervalo como respuesta. Además podemos asignarle una un intervalo como respuesta. Además podemos asignarle una probabilidad aproximada que mida nuestra confianza en la probabilidad aproximada que mida nuestra confianza en la respuesta:respuesta:

Hay una confianza del 68% de que μ esté en 60±0,5Hay una confianza del 68% de que μ esté en 60±0,5 Hay una confianza del 95% de que μ esté en 60±1.Hay una confianza del 95% de que μ esté en 60±1.

Ojo: He hecho un poco de trampa. ¿Quien la ve? Ojo: He hecho un poco de trampa. ¿Quien la ve?

20072007

Jose.Rios@uab.es / Ferran.Torres@uab.esJose.Rios@uab.es / Ferran.Torres@uab.es 4040

EstimaciónEstimación Pero hemos de tener en cuenta que todo intervalo de Pero hemos de tener en cuenta que todo intervalo de

confianza conlleva dos noticias, la buena y la malaconfianza conlleva dos noticias, la buena y la mala

La buena: hemos usado una técnica que en % alto de casos La buena: hemos usado una técnica que en % alto de casos acierta.acierta.

La mala: no sabemos si ha acertado en nuestro caso.La mala: no sabemos si ha acertado en nuestro caso.

20072007

Jose.Rios@uab.es / Ferran.Torres@uab.esJose.Rios@uab.es / Ferran.Torres@uab.es 4141

Para quien guste de las Para quien guste de las fórmulasfórmulas