Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3...

30
Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C. www.fernandotuya.org

Transcript of Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3...

Page 1: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C. .

Análisis estadístico aplicado a la fisioterapiaIntroducción

Fernando Tuya, Investigador I3Universidad de Las Palmas de G.C.

www.fernandotuya.org

Page 2: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C. .

2

Presentación

¿Quiénes son Vds.?

¿Qué hacen? ¿Precisan de ayuda en sus diseños y/o análisis? ¿Traen datos para analizar?

Page 3: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C. .

3

Gran carga matemática/

algebraica“Monkey”

¿Análisis estadístico?

“No necesitas ser un mecánico para conducir un coche: pero si saber las normas de educación vial”

Punto medio

….

Page 4: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C. .

4

Quinn, G.P. y Keough, M.J. Experimental Design and Data Analysis forBiologists. Cambridge University Press. 2002

Gotelli, N.J., Ellison, A.M. A Primer of Ecological Statistics. Sinauer Associates, Inc. 2004

Referencias claves

que aúnen conceptos de diseños muestral/experimental con estadística de forma sencilla

Page 5: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C. .

5

Medidas de tendencia central y dispersión: ejemplo

F(x)

µ

µ = S Xi / N

X = S Xi / ns2

s2 = S (Xi - µ)2 / N

s2 = S (Xi - X)2 / (n-1)

S = desviación estándar

Error estándar = s / Ö n

Nos medimos la altura; generamos histograma de casos; esa función presenta distribución (normal o gaussiana en este caso), con su media/mediana/moda y su dispersión/curtosis, etc..

Page 6: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C. .

6

Repaso: medidas de tendencia central y dispersión

F(x)

µ

µ = S Xi / N

X = S Xi / ns2

s2 = S (Xi - µ)2 / N

s2 = S (Xi - X)2 / (n-1)

S = desviación estándar

Error estándar = s / Ö n

10

20

30

Núm

ero

de

mue

s tr a

s

1 2 3 4 5 6

Histograma

Page 7: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C. .

7

Naturaleza del problema

Observaciones

Definir objetivos, cuestiones…y por tanto un modelo a contrastar

Hipótesis (hipótesis nula)

Muestreo y/o experimentoRechazar hipótesis

Refinar el modelo

Retener hipótesis

¿Y este rollo? método científico (hipotético-deductivo) karl Popper

Page 8: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C. .

8

¿ Ven la diferencia entre modelo (proposición general) e hipótesis (postulados particulares derivados del modelo)?

Clave para una buena investigación…

Page 9: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C. .

9

· Inferencia estadística – generalizar resultados de unas muestras (universo muestral) a la población (universo poblacional). La inferencia permite verificar hipótesis y, consecuentemente, modelos: representación/abstracción de la realidad

Conceptos; al pan, pan y al vino, vino¡

Distribución de una variable (ej. variable muestral) – tipo de distribución de acuerdo a un modelo (e.g. gaussiana o normal; si n>30 toda variable tiende a la normalidad)

10

20

30Número de erizos por m2

Núm

ero

de

mue

s tr a

s

1 2 3 4 5 6

Page 10: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C. .

10

Réplica – nivel más bajo de muestreo en un diseño – se corresponde con la unidad de muestreo (p.e. personas que entrevisto)

Muestreo aleatorio – las unidades de muestreo (p.e. personas que entrevisto) se distribuyen en el espacio y/o tiempo aleatoriamente y con independencia una de las otras (ausencia de independencia = resultados falsos)….Pensemos un caso de falta de independencia

Conceptos…continuamos

Ej. de “confounding” = “confusión experimental” (p.e. encuestas telefónicas en los 50s)

Page 11: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C. .

11

· Variables – mediciones que hacemos. Son:Dependientes (Y) = variables respuestaIndependientes (X) = predicen la variable respuesta = variables predictoras/ quiero conocer su influencia. · Las variables pueden ser:Numéricas (cualquier valor numérico en un rango) Categóricas (solo determinados valores o caracteres alfanuméricos, p.e. si/no, hombre mujer, alto/medio/bajo)

Factores – aquellas variables predictoras categóricas cuyo efecto queremos conocer sobre otra(s) variable(s); cada categoría = nivel (p.e. en ANOVAs)

Conceptos…continuamos (MUY IMPORANTE)

Page 12: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C. .

12

Veamos un ejemplo….variables continuas y categóricas

Pero… quiénes son mis variables - ¿cómo tabulo? ¿quién es la dependiente? ¿quién es la independiente?¿Son continuas o categóricas?

Page 13: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C. .

13

Cada variable se tabula (en su columna) acorde a sus niveles

Page 14: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C. .

14

Continuemos…

Page 15: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C. .

15

Ejemplo para razonar algunas cosas…

Mido la altura de los chicos y chicas de un grupo (muestra); quiero generalizar (inferencia) a un universo poblacional:

¿Son los chicos más altos que las chicas?Ho: No hay diferencias entre chicos y chicas

H1: Si hay…

Hipótesis de nulidad

Page 16: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C. .

16

1,861,70

n ↓, para poder decir que hay diferencias a nivel poblacional (inferencia), tendrá que haber grandes diferencias a nivel muestral

1,82

Si n ↑, las diferencias muestrales no tendrán que ser tan grandes para detectar diferencias significativas para un nivel de confianza dado

Page 17: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C. .

17

Universo poblacional (N)

Universo muestral (n)

Page 18: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C. .

18

Además, la detección (o no) de diferencias sign. no sólo depende n; tb del nivel de confianza de la inferencia

Todo test estadístico para el contraste objetivo de hipótesis incorpora 2 atributos clave:

Tamaño de la muestra (n) y la confianza de la inferencia

La confianza de la inferencia se determina mediante nivel de significación (α)…siempre hay un margen de error q cometemos y necesitamos conocer independientemente de “n”

Page 19: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C. .

19

DecisiónHo verdadera Ho falsa

Rechazar Ho

Aceptar Ho

Error tipo I (α) = P (rechazar Ho/Ho verdad)

No hay error (1-α) Error tipo II (β) =P(aceptar Ho/Ho es falsa)

No hay error (1-β)

α determina nuestro nivel de confianza. Si α=0.05, esto significa que tengo una confianza del 95% en mi inferencia. Si fijo α = 0.01, la confianza sería del 99%

1-β: “poder del análisis” = P(escoger H1/H1 es verdad) – capacidad de detectar diferencias – evidencia para rechazar Ho ¡¡

Page 20: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C. .

20

nn

Pequeño, poco poder para detectar diferencias sign.

Grande - $

Compromiso: ¿qué n?

Si queremos ↑ poder = aumentar n…pero ojo q ↑ n es difícil ($, tiempo)…necesitamos equilibrio

Page 21: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C. .

21

Universomuestral

Universo poblacional

Contraste de hipótesis: ¿evidencia para rechazar la Ho?

Inferir (Ho)

Ho: las cosas son igualesH1: las cosas son distintas o diferentes a algo que espero

Estadísticof(mis datos; x, n)

Distribución de probabilidad conocida

Protocolo general (idea conceptual):

extraigof(Ho)

Se compara

región de rechazo: si el valor del estadístico aquí= rechazo HoRegión crítica en función de gl y α

Podemos calcular la probabilidad de q “entre” el estadístico (“el valor p”)

Page 22: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C. .

22

Región de rechazo

Tabuladas en f(α y grados libertad proxy a n)

Page 23: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C. .

23

Por ello, cuando P < 0.05 ó 0.01 decimos q es significativo

Hace años: sólo decíamos si P era > ó < 0.05 /0.01Hoy: sabemos el P-valor exacto = sabemos si el resultado es “muy significativo”, “poco significativo” o “marginalmente significativo” – evidencia para rechazar o no la Ho

¿Qué hacemos en la práctica? Software estadístico

Buscan el "valor p"= la probabilidad de equivocarnos si rechazamos H0

Como la P (rechazar H0 cuando es verdad) α = 0.05; un P < 0.05 nos proporciona evidencia para rechazar la H0

Page 24: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C. .

24

Software estadístico

Existe una amplísima amalgama….la uni = SPSS

Nosotros vamos a aprender el uso de Rcommander (freeware)

Nos hacen todos los cálculos, fantástico¡¡¡ Es decir, a partir de nuestros datos calcula el valor del estadístico (en función del test) y su significación¡¡¡

pero debemos (1) seleccionar el análisis adecuado para nuestros datos, (2) saber interpretarlos y (3) saber conectar su interpretación con las gráficas – ojo con esto.

Page 25: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C. .

25

¿Cómo elijo el test estadístico adecuado a mis datos?

Depende de:

(i) tipo de datos y de (ii) cómo se comporten

Page 26: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C. .

26

Independiente (predictoras)

Categórica ContinuaDependiente(o respuesta)

Categórica Tabular (tabla contingencia) Regresión Logística

Continua

ANOVA (t student, caso más simple) y sus equivalentes no

paramétricos Regresión lineal

Tipo de datos

Variables continuas (altura, peso, abundancia, etc..) vs. categóricas (e.g. sexo, trabajo, grupo de edad, etc.)

Page 27: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C. .

27

Técnicas estadísticas paramétricas vs. no paramétricas

Paramétricas: “datos se comportan bien” = asumimos ciertas asunciones: tomados al azar, normales, hay homogeneidad de varianzas

¿Qué ocurre cuando los datos no se comportan bien? Técnicas no paramétricas

· Técnicas no paramétricas: convierten los datos a rangos- perdemos información¡¡¡¡¡ (veamos ej. en la pizarra)

¿Cómo se comportan los datos?

Page 28: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C. .

28

Pragmáticamente, en cualquier estudio/experimento:

Ho: variación en la variable dependiente no relacionada con la variables(s) respuesta – predictor(es); es decir, no es mayor que la esperada por casualidad

H1: la casualidad no explica totalmente la variación en esta variable respuesta; hay “algo” de variación atribuida a la variable(s) respuesta

Hipótesis de nulidad

Ho: las cosas son igualesH1: las cosas son distintas o diferentes a algo que espero

Page 29: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C. .

29

Resumiendo…cómo procedemos…

Page 30: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C. .

30

Especifica la pregunta q quieres contestar

Pon esta pregunta en forma de una Ho/Ha estadística

Determina qué variables y factores son relevantes para tu pregunta. ¿Qué tipo de variables son? ¿Continuas o categóricas?

Selecciona el mejor test estadístico en función: tipo y nº de variables, las asunciones paramétricas, etc.

Haz el estudio y pregúntate si los resultados cambiarían conceptualmente en función del tamaño muestral (replicación); hazte la siguiente pregunta: ¿si n hubiera sido distinto, mi interpretación de los resultados sería la misma?

Guarda los datos y juega con ellos: mira si siguen las asunciones de tu test. Aplica un test adecuado e interpreta los resultados

Comunica los resultados eficientemente – gráficas/tablas