1
PLACAS DE BIOESTADÍSTICA
BIOESTADÍSTICA Y METODOLOGÍA DE LA
INVESTIGACIÓN
CURSO 2015
CLASE 1
ddd
2
• Básicamente, se presentará una situación quehay que encarar con criterio estadístico yresolver los interrogantes que se planteen. Sedistribuirá un ejemplo tipo antes de finalizarel Curso. Se exige al menos un 75% deexactitud o de coherencia para aprobar.
• Como complemento hay dos preguntasextraídas de un pool que se distribuirá antesde finalizar el Curso. Se exige al menos unapregunta correcta para aprobar.
EVALUACIÓN FINAL ESCRITA DEL CURSO (BIOESTADÍSTICA)
BIBLIOGRAFIA DE BIOESTADÍSTICA• Para complementar los apuntes de clase:
“Guía de bioestadística” (se puede descargar de la web)
• Para estudiar, repasar, digerir y/o completar todos los temas conceptuales:“Bioestadística”Norman G. y Streiner D. (en español) (1996) Edición 1.0Harcourt – Mosby (Librería Ursino y otras) (disponible en biblioteca y fotocopiadora)
• Para estudiar, profundizar y/o completar temas específicos de ensayosestadísticos y temas de epidemiología:“Manual de estadística práctica”(2005) Edición 1.01Cátedra de Biofísica (FOUBA)
(disponible en la web)
Pag45
Cuando aparezca en alguna placa este símbolo, se refiere al númerode página del “Manual de estadística práctica” donde se trata el tema
3
CONOCIMIENTOCIENTÍFICO
La ciencia es un conjunto demétodos y técnicas para laadquisición y organización deconocimientos sobre la estructurade evidencias e ideas objetivasaccesibles a observadoresindependientes.
4
LOS OBJETIVOS DEL CONOCIMIENTO
CIENTIFICO� Explicar y comprender la realidad
� Predecir hechos futuros
� Manipular la realidad para ajustarla a intereseshumanos
Podemos distinguir al menos dos tipos básicos de ciencias:
• La verdad entendida como coherencia y éste es eltipo de verdad propia de las matemáticas y lalógica a las que se designa habitualmente con elnombre de ciencias formales, dado que sólo se ocupande la estructura o forma del pensamiento.
• La verdad entendida como adecuación delpensamiento al universo. El conocimiento queresponde a este criterio de verdad está subordinado a laexperiencia. Por ello a las ciencias que se manejandentro de este concepto de verdad se les llama cienciasexperimentales o fácticas. A este terreno pertenecenciencias como la física, química y biología y sus derivadas(la medicina y por ser contenida, la odontología)
5
LOS PRINCIPIOS CONCEPTUALES DEL
UNIVERSO
� DETERMINISMO, NECESIDAD, CAUSALIDAD
�AZAR, CASUALIDAD, INCERTIDUMBRE
AZAR• Casualidad, aleatoriedad, contingencia, suerte, caos
(gran cantidad de causas cada una con mínimos efectos, aveces causas desconocidas o directamente causasinexistentes)
• resultados inciertos• predicciones inseguras¿se nos ocurre algún ejemplo en odontología?
DETERMINISMO• Causalidad, finalismo, necesidad, fatalidad, orden
(Principio de causalidad: a cada causa le corresponden susefectos y si se presenta(n) esa(s) causa(s), susconsecuencias son inevitables)
• resultados previsibles• predicciones seguras¿se nos ocurre algún ejemplo en odontología?
Pag11
6
Para lidiar con la incertidumbre enel conocimiento acumulado por lasciencias fácticas, en particular enlas observaciones (mediciones), sedesarrolló:• El cálculo de probabilidades• La estadística (o bioestadística cuando se
aplica a las ciencias biológicas y susderivadas)
Simplificando conceptos, se vinculan entre sícomo la teoría y la práctica.
METODOS CIENTÍFICOS• INDUCTIVO (puro)
Va de lo particular a lo general. En CienciasFácticas implica generar hipótesis a partir deobservaciones experimentales.
• DEDUCTIVO (puro)Va de lo general a lo particular. En CienciasFormales implica demostrar teoremas a partir deaxiomas (o principios) y otros teoremas.
• HIPOTÉTICO DEDUCTIVO (combinado)Es el método actualmente aplicado por lasCiencias Fácticas.
7
MÉTODO HIPOTÉTICO-DEDUCTIVO
observaciones
formulación (y reformulación)de hipótesis
consecuenciasderivadas
2. deducción1. inducción
3. verificación experimental de consecuencias
4. validación parcial o total (LEY?)
4. falsación y descarte
NECESIDAD DE LA ESTADÍSTICA
1. las observaciones nunca sonexactas ni se repiten porestar afectadas por el azar
2. por lo tanto, para medirracionalmente y comprobar lavalidez de las hipótesis se hacenecesario usar herramientasestadísticas
8
CÁLCULO DEPROBABILIDADES
cálculo de probabilidades• Permite medir el grado de incertidumbre
asociado a las predicciones• La medida de probabilidad es un número que
representa en escala cero a uno el grado de verosimilitud de un suceso incierto
• En modelos ideales se obtiene el valor exacto de una probabilidad o probabilidad teórica
• Experimentalmente se obtienen aproximaciones al valor de probabilidad midiendo la frecuencia relativa o probabilidad empírica de aparición, es decir el cociente entre sucesos “favorables” y sucesos “totales” Pag
11
9
Lanzamos una dado 100 veces y sale el número dos 18veces, cual es la probabilidad empírica
de aparición de ese suceso?
FR = 18
100=0.18
p(2) = 1/6 = 0.16666666666..limc.tot.� �
FR =
c.fav. =
c.tot.
PROBABILIDAD
0 10.5
p = casos favorables / casos totales (cuando el n° casos totales � infinito)
Mañana
lloverá
Viviré menos de
1000 años
El sol brillará día y noche
Lloverá en este
mes
Ganaré la
lotería
La moneda que tiramos al aire
saldrá caraPag12
10
PROBABILIDAD
Ocurre( A )
No ocurre( A )
p(A)
U
Si elegimos un punto al azar en U, la p(A) será el AREA de A (casos favorables) dividido al AREA de U (casos posibles)
U : universo o conjunto de todos los casos posibles
Pag12
PROBABILIDAD COMPUESTAEs la probabilidad asociada a laocurrencia combinada de dos o maseventos (por unión o intersección)
Por ejemplo la probabilidad de ocurrencia de un eventoentre dos sucesos (Tenemos dos personas y se enfermasólo una, ya sea la primera o la segunda pero no ambas) ola probabilidad de ocurrencia simultánea de dos eventos(Tenemos dos personas y se enferman ambas: la primera yla segunda)
Resulta de interés analizar los casos de sucesosindependientes y de sucesos excluyentes.
11
LEY DE LA SUMA
A
A , B y C son mutuamente excluyentes
p(A)
p(A ó B ó C) =p(A) + p(B) + p(C)
Bp(B)
Ejemplo: tiramos 1 dado, sale un número par (hay 3 casos)
UC
p(C)
Pag13
LEY DEL PRODUCTO
A
A y B son independientes
p(A)
p(A y B) =p(A) . p(B)
Bp(B)
Ejemplo: tiramos 2 dados, en ambos sale el número cuatro
U1
U2
Pag13
12
PROBABILIDAD CONDICIONAL
Si elegimos un punto al azar en A, p(B|A) es la probabilidad (condicional) que ocurra B habiendo ocurrido A, p(A y B) la probabilidad que ocurran ambos simultáneamente y la p(A) la probabilidad que ocurra A o sea el área de casos posibles.
A
p(A)
U
p(B|A)=p(A y B)/p(A)
B
es la probabilidad de un suceso habiendo ocurrido otro
Pag13
PROBABILIDAD CONDICIONAL
Tirando un dado, cuál es la probabilidad que haya salido un 4 si salió un número par?
Par
p(Par)=1/2
U
p(4|Par)=p(Par y 4)/p(Par)=(1/6)/(1/2)=1/3
4
Pag13
13
PROBABILIDAD CONDICIONAL
Si A y B son independientes, la probabilidad condicional p(B|A) es igual a la probabilidad absoluta p(B)
A
p(A) p(B|A)=p(B)
B
Pag13
EN GENERAL:
p(A) p(B)
p(A y B)=p(A).p(B|A)=p(B).p(A|B)
p(U)=1
esta es la generalización de las leyes de la suma y delproducto para sucesos de cualquier clase
p(A o B)=p(A)+p(B)-p(A y B)
Pag13
14
UN EJEMPLO:
|C|=100
|CyF|=200
|U|=1000
Pag13
C: pacientes con cariesF: pacientes con piezas faltantes
|F|=250
Calcular: p(C), p(F), p(C), p(F), p(CyF), p(CoF)
tamaño de la muestra
cariados
c/faltantes
no cariados y c/faltantes
: ( ) ( ). ( | ) ( ). ( | )100 50 250 50 0.05
1000 100 1000 250
EJEMPLO p CyF p C p F C p F p C F= =
= × = × =
UN EJEMPLO DE APLICACIÓN DE LAPROBABILIDAD CONDICIONAL
MUESTREO CON Y SIN REPOSICION
En una caja hay 4 bolillas negras y 3 bolillas blancas, cual es la probabilidad de extraer 2 bolillas negras en forma sucesiva?
p(N1 y N2)=p(N1 ).p(N2| N1)
(analizar casos con y sin reposición) Pag13
15
CLASE 2
ESTADÍSTICAGENERAL Y
DESCRIPTIVA
16
ESTADÍSTICA
• DESCRIPTIVA- cómo se comporta una muestra?- obtener parámetros descriptivos o atributos de
las muestras
• INFERENCIAL- cómo se comparan dos o mas muestras?- comparar parámetros descriptivos o atributos
de las muestras
Pag13
VARIABLES ALEATORIAS o ESTADÍSTICAS
son magnitudes sujetas al azar, pasibles de ser medidas y luego
procesadas por medio de técnicas estadísticas
Pag14
17
VARIABLES ESTADISTICAS• CUALITATIVAS
�RELACION DE PERTENENCIA
• SEMICUANTITATIVAS �RELACION DE PERTENENCIA �RELACION DE ORDEN
• CUANTITATIVAS (discretas o contínuas)�RELACION DE PERTENENCIA�RELACION DE ORDEN�RELACION DE PROPORCIONALIDAD
Pag14
Qué ejemplos podemos citar de cada clase?
ESTADISTICA DESCRIPTIVA
M
muestra
población
P
observaciónindividual
Pag16
18
parámetros descriptivos
• De posición o centrales (obtener valores representativos)- Media aritmética (promedio)- Moda- Mediana
• De dispersión (confianza asignada a esos valores)- Varianza- Desviación standard- Error standard- Rango (diferencia xMAX – x MIN)
Pag22
PROMEDIOn
xx �=
VARIANZA2( )
1x x
VARn
−=
−�
DESVIACION STANDARD
ERROR STANDARD (estimado)
DS VAR=
DSESn
=Pag23
19
PARAMETROS MUESTRALES Y POBLACIONALES(en distribuciones normales)
M
muestra
población
P
,μ σ
,x DS
Los parámetros muestrales son
estimadores de los poblacionales
COMPORTAMIENTO DE LOS PARAMETROS MUESTRALESA MEDIDA QUE CRECE EL TAMAÑO DE LA MUESTRA(en distribuciones normales y poblaciones de gran tamaño)
μ
x
n0
σ
DS
n0
ES
n0
Porqué se comportan así?
20
DISTRIBUCIONES frecuencia = f( valor)
UNIMODAL BIMODAL
UNIMODAL SIMETRICA UNIMODAL ASIMETRICAPag21
LA DISTRIBUCION NORMAL • Es la distribución más frecuente o habitual en todas
las mediciones de las ciencias naturales (odontología incluida)
• Cualquier medida biomédica que sea cuantitativacontinua (¿Que significa esto?) debe ser considerada normal hasta que se demuestre lo contrario
• Sus propiedades permiten “controlar” las consecuencias del azar sobre las medidas y predecir el comportamiento de las poblaciones en base a muestras relativamente pequeñas (¿Cómo se logra?)
21
LA DISTRIBUCION NORMAL(también conocida como la campana de Gauss)
28 30 32 34 36 38 400
10
20
30
40
50
DS
( x ) PROMEDIO
punto de inflexión
frecuencia
DIC (mm)
-3 -2 -1 0 1 2 3
para unificar todas las distribuciones normales:DISTRIBUCION NORMAL NORMALIZADA (Z)
0.0
0.1
0.2
0.3
0.4
0.5
0.6
otros valores obtenibles porTABLA II
Intervalo(z)
Probabilidad(= area)
(-1 +1) 68,3%(-2 +2) 95,5%(-3 +3) 99,7%
(-∞ +∞) 100,0%
Pag25
xsxxz −=
z
y=frecuencia(z)
Pag45
22
( , ) 0.68 (68%)X DS X DS p− + → =
( 2 , 2 ) 0.95 (95%)X DS X DS p− + → =
( 3 , 3 ) 0.99 (99%)X DS X DS p− + → =
El área bajo la curva normal es laprobabilidad de hallar observacionesindividuales entre los límites de cadaintervalo considerado.
Los parámetros descriptivos recomendados según la
distribución(centrales y de dispersión)
• Para distribuciones (unimodales) normales- Promedio- Desviación Standard (DS)
• Para distribuciones (unimodales) no-normales (ej: Poisson)
- Mediana- Rango
Tiene sentido calcular si medimos variables discretas como el recuento de dientes cariados? Hay algo mejor para describirlas?
,x DS
23
VALORES NORMALES EN MEDICINA
Pag29
INTERVALO DE CONFIANZA 95%
( 1.96 , 1.96 )X DS X DS− +
MEDICIONESY
ERRORES
24
CUANDO SE EFECTUAN MEDIDAS
INDIVIDUALES...
MEDICIONES Y ERRORES
MEDIR: comparar contra un patrón de referencia
ERROR DE MEDICION: inexactitud cometida al medir
CLASES DE ERRORES DE MEDICIÓN:• SISTEMATICOS (sistema instrumento+observador)• ALEATORIOS (azar)
Ejemplos de cada uno?Se pueden eliminar? Cómo?
Se pueden controlar? Cómo?
25
errores de medición:
Definimos VALOR TEORICO o EXACTO (Vt): es el valor real de una medida, generalmente es desconocido
Definimos VALOR MEDIDO (Vm): es el valor obtenido por una medición efectuada
• ERROR ABSOLUTO (Ea) =|Vt-Vm|• ERROR RELATIVO (Er) = Ea/Vt
PARA UNA MEDIDA INDIVIDUAL,TEÓRICAMENTE PODRÍAMOS CALCULAR…
SENSIBILIDAD DE UN INSTRUMENTO DE MEDICIÓN
SENSIBILIDAD: está dada por la menor unidad demagnitud distinguible por el aparato.
12 g 12,0g 12,00g 12,000g 12,0000g
son medidas obtenidas por instrumentos de sensibilidad creciente y no son equivalentes aunque aritméticamente
lo parezcan!!!
26
CIFRAS SIGNIFICATIVASDE UNA MEDICIÓN
CIFRAS SIGNIFICATIVAS: es el número total dedígitos obtenidos por una medición, donde cada uno deellos TIENE SENTIDO FÍSICO, es decir refleja unatributo real y objetivo de lo que se mide.
No confundir dígitos con decimales!!! Alcontar dígitos ignoramos la coma decimal.
• 12 g � 2 cifras significativas•12,0 g� 3 cifras significativas•12,00 g � 4 cifras significativas
•etc.
¿Cómo se interpreta una medida?
Tenemos que “interpretar” lo que significa 26,7623 g
Esta medición de 6 cifras significativas (obtenida por un aparato cuya sensibilidad es la décima de miligramo), expresa que el peso “real” del objeto se encuentra
entre 26,7622 g y 26,7624 g o sea Peso medido ± 1 décima de miligramo
26,7623 g
¿Qué clase de error es responsable por esa incertidumbre?
27
¿Qué opinan de cambiar la unidad de medida?
4 Kg y 4000 g son medidas equivalentes ?
Para pasar de Kg a g hay que usar notación exponencialpara no alterar las cifras significativas 4 Kg = 4 x 103 g
CUANDO SE EFECTUAN SERIES DE MEDIDAS...
28
HAY DOS FORMAS DE EFECTUAR MEDIDAS COLECTIVAS
• CLASE I -Repetir una medición individual Por ejemplo, dado un diente incisivo superior derecho,medir su longitud 10 veces. Por lo general los valoresobtenidos se van a parecer bastante, es decir estaránmuy agrupados (13, 13, 12, 13, 14, 13, 14, 13, 14, 13 mm)
• CLASE II - Repetir mediciones dentro de un conjunto de casos similares Por ejemplo, medir la longitud de los dientes incisivossuperiores derechos en 10 personas (de la misma edad ysexo). Por lo general los datos se van a parecer pero notanto como antes y no van a estar tan agrupados (13, 15,11, 12, 16, 12, 14, 11, 17, 10 mm)
En qué difieren ambos grupos?Porqué ocurre esto?
PRECISION
EXACTITUD
Está dada por la mayor o menor dispersión de lasobservaciones individuales alrededor de su valor másfrecuente (en mediciones de Clase I)
Está dada por la distancia del valor más frecuente a unvalor de referencia (en mediciones de Clase I)
PODEMOS COMPARAR LOS SISTEMAS DE MEDICIÓN
Ejemplos??
Ejemplos??
Pag28
29
Entre dos instrumentos de medida se puededar el caso que uno sea mas preciso peromenos exacto que el otro. Veamos un ejemplode tiro al blanco.
¿ cuál es el tirador más preciso y cuál el más exacto ?
ESTADÍSTICAINFERENCIAL
30
ENSAYOS (“TEST”) ESTADISTICOS
Son las técnicas matemáticas que permiten contestarqué hipótesis estadística se acepta (la nula o laalternativa) y con qué riesgo.
HAY DOS CATEGORIAS
ENSAYOS PARAMÉTRICOS
ENSAYOS NO PARAMÉTRICOS Pag
32
TESTPARAMETRICOS
TESTNO PARAMETRICOS
POTENCIA RELATIVA
100% 95%-65%
APLICABILIDAD SOBRE DATOS
CUANTITATIVOSSólo Escala de Intervalo o
Escala de Proporcion
CUALI/CUANTITATIVOSEscala Nominal, Ordinal, Intervalo o de Proporción
PREREQUISITOS •Obs. independientes•Poblaciones normales (z)•Varianzas proporcionales•Efectos aditivos de causas determinísticas sobre los promedios
Poblaciones de cualquier clase y datos de cualquier tipo
EJEMPLOS t-Student, Análisis de Varianza (ANOVA), test F,
etc.
Prueba de rangos, Prueba de signos, Chi-
cuadrado, etc.Pag33
31
ESTADISTICA INFERENCIAL
23, 35,16,
42,56,19
Muestra A
18, 22,19,
32,44,15
Muestra B
n = 6
xA = 32
SxA = 15
n = 6
xB = 25
SxB = 11
ESTOS PROMEDIOS SON O NO SON ESTADISTICAMENTE EQUIVALENTES ? Pag
33
Ho : no hay causa específica para lasdiferencias observadas, estas se debenexclusivamente al azar
H1 : hay una causa específica para esasdiferencias observadas
HIPOTESIS ESTADISTICAS
…pero tomar decisiones implica el riesgo de equivocarse ya que todos los datos estan sujetos al azar
Pag33
32
Pag36
DECISIONES DE RIESGO CALCULADO
LA REALIDAD(generalmente desconocida)
H0 ES VERDADERA H0 ES FALSA
LA DECISIONDEL TEST
ACEPTAR H0CORRECTA
ERROR TIPO I (=alfa)
FALSO +
ERROR TIPO II (=beta) FALSO -
RECHAZAR H0
CORRECTA(región de la potencia del
ensayo)
alfa = es la probabilidad de cometer el error de terminar decidiendo el rechazo de H0 (siendo cierta)
ERROR TIPO I o NIVEL DE SIGNIFICACION
alfa debe ser fijado de antemano, usualmente será a lo sumop=0.05 (aceptamos un error del 5% o sea 1 en 20
decisiones similares), o menor si queremos estar más seguros
Pag33
beta = es la probabilidad de cometer el error de terminar decidiendo la aceptación de H0 (siendo falsa)
ERROR TIPO II
normalmente beta se fija en 0.10 (entre 0.05 y 0.20). Se define como POTENCIA DE UN ENSAYO a la probabilidad
1- beta
33
H1 DE UNA o DOS COLASMuestra A Muestra B
n = 6
xA = 32
SxA = 15
n = 6
xB = 25
SxB = 11
Ho : xA = xB
H1 : xA = xB
Ho : xA = xB
H1 : xA > xB
HAY DOS PLANTEOS POSIBLES
Ensayo de 2 colas Ensayo de 1 cola
Usar si no hay fundamento a priori Usar si hay fundamento a priori
Pag36
Cuando se comparan 2 grupos
Siempre que sea naturalmente posible,trabajar sobre las diferencias (aparearlos datos), y el ensayo será máseficiente.Ej: antes y después de un tratamiento en cada paciente
Pag38
ENSAYOS APAREADOS Y AGRUPADOS
¿PORQUÉ?
34
DISEÑO DE TEST ESTADISTICOS A CIEGO, DOBLE CIEGO Y TRIPLE
CIEGO
Pag38
CLASE 3
35
repasamos…
Ho : no hay causa específica para lasdiferencias observadas, estas se debenexclusivamente al azar
H1 : hay una causa específica para esasdiferencias observadas
HIPOTESIS ESTADISTICAS
…pero tomar decisiones implica el riesgo de equivocarse ya que todos los datos estan sujetos al azar
Pag33
36
Pag36
DECISIONES DE RIESGO CALCULADO
LA REALIDAD(generalmente desconocida)
H0 ES VERDADERA H0 ES FALSA
LA DECISIONDEL TEST
ACEPTAR H0CORRECTA
ERROR TIPO I (=alfa)
FALSO +
ERROR TIPO II (=beta) FALSO -
RECHAZAR H0
CORRECTA(región de la potencia del
ensayo)
alfa = es la probabilidad de cometer el error de terminar decidiendo el rechazo de H0 (siendo cierta)
ERROR TIPO I o NIVEL DE SIGNIFICACION
alfa debe ser fijado de antemano, usualmente será a lo sumop=0.05 (aceptamos un error del 5% o sea 1 en 20
decisiones similares), o menor si queremos estar más seguros
Pag33
beta = es la probabilidad de cometer el error de terminar decidiendo la aceptación de H0 (siendo falsa)
ERROR TIPO II
normalmente beta se fija en 0.10 (entre 0.05 y 0.20). Se define como POTENCIA DE UN ENSAYO a la probabilidad
1- beta
37
SELECCIÓNDE DATOS
ANGULOS CEFALOMÉTRICOS SNAOBTENIDOS SOBRE 10 PACIENTES
PROGNATICOS
36°32°45°84°37°34°40°29°33°42°
Hay que descartar datos excénticos porque afectan la estadística
?
(el problema es saber cuándo un dato es excéntrico)
38
ANGULOS SNA OBTENIDOS SOBRE 10 PACIENTES PROGNATICOS
36°32°45°84°37°34°40°29°33°42°
x = 41 s = ± 16
d=1.96 xmax=72xmin=10
se descarta 1 datoporque se escapa del IC
(x-d.s x+d.s)
N d N d5 1,68 20 2,246 1,73 22 2,287 1,79 24 2,318 1,86 26 2,359 1,92 30 2,39
10 1,96 40 2,5012 2,03 50 2,5814 2,10 100 2,8016 2,16 200 3,0218 2,20 500 3,29
TABLA DE CHAUVENET
39
ANGULOS SNA OBTENIDOS SOBRE 10 PACIENTES PROGNATICOS
36°32°45°37°34°40°29°33°42°
x = 36 s = ± 5
dmax=1.92 xmax=46xmin=26
no se descartanmas datos
Observar como disminuyó la dispersión !!!
CORRELACION
40
ASOCIACION ENTRE VARIABLESse trata de medir la categoría y magnitud de
vinculación existente entre dos variables estadísticas de proporción (x, y)
ANALISIS DE CORRELACION :se desconoce la relación funcional y=f(x) (???)
ANALISIS DE REGRESION :se conoce la relación funcional y=f(x)
(recta, parábola, polinomio, exponencial, etc.)si se trata de una recta, se conoce como regresión lineal
Pag52
hay dos variantes:
CORRELACION|r| = coeficiente de correlación de Pearsonp = probabilidad asociada a r
(la correlación es significativa si p < 0.05)
0 10.5
Asociación
moderada
Asociación funcional perfecta
No hay asociación
(independencia)
Asociación alta
Asociación pobre
escala válida para 10 pares de datos Pag53
41
REGRESION LINEAL
ln A
x
También sirve para ajustar funciones transformadas en lineales
Ejemplo: en radiactividadaparece la fórmula A=A0e-�t
Aplicando logaritmos naturalesse obtiene: ln A = ln A0 - �tComo A0 y � son constantes,podemos definir la ecuación de unarecta y’=ln A en función de t (tiempo)y ajustar datos experimentales.
REGRESION NO LINEAL
y
x
y = 1,31 x2 - 4.63 x + 0,88
Pag54
y=ax2+bx+c
42
DISTRIBUCIONZETA
HAY MUCHAS DISTRIBUCIONES NORMALES…
43
¿CÓMO UNIFICAR TODAS LAS DISTRIBUCIONES NORMALES EN UNA SOLA?
LA DISTRIBUCIONZETA TRANSFORMA
CUALQUIER VARIABLE GAUSSIANA EN NORMALIZADA
(Media=0, DS=1)
x XzDS−=
44
La ventaja de unificar lasdistribuciones normales consiste en quelas preguntas de probabilidad deaparición de valores en intervalosarbitrarios se responden consultando auna única tabla (z).
Pag143
t - STUDENT
45
EL TEST t - STUDENTPara comparar los promedios de 2 conjuntos dedatos “normales”, se puede efectuar unacomparación entre ambos usando el test t-Student
test t
Este ensayo COMPARA ambos grupos y obtiene unparámetro de ensayo t (es un número) cuyas probabilidadesasociadas están tabuladas y que permite decidir entre:
1. Aceptar H0 (NO HAY DIFENCIA ENTRE LOS GRUPOS)2. Rechazar H0 (HAY DIFENCIA ENTRE LOS GRUPOS) Pag
49
Cuando se comparan 2 grupos...
Siempre que sea naturalmente posible, trabajar sobre las diferencias (aparear los datos), y el ensayo será más eficiente.
(Ej: antes y después de un tratamiento en cada paciente)
Pag38
ENSAYOS APAREADOS Y ENSAYOS AGRUPADOS
Y COMO ES HABITUAL, SE FIJA alfa=0.05
46
comenzaremos con el ensayo agrupado, es decir compararemos parametros grupales y no las diferencias individuales...
TEST t-STUDENT AGRUPADO
23, 35,16,
42,56,19
Muestra A
18, 22,19,
32,44,15
Muestra B
n = 6
xA = 32
SxA = 15
n = 6
xB = 25
SxB = 11
ESTOS PROMEDIOS SON O NO SON ESTADISTICAMENTE EQUIVALENTES ? Pag
50
47
Ahora seguimos con el ensayo apareado, es decir compararemos cada dato contra sí mismo y trabajaremos con las diferencias...
TEST t-STUDENT APAREADODespués del tratamiento
EL TRATAMIENTO MODIFICALOS DATOS ? (1 o 2 colas??)
Pag51
Antes del tratamiento
LOS 6 PACIENTES APARECEN EN ORDEN
23
35
16
42
56
19
18
22
19
32
44
15
48
CLASE 4
ANOVAANALISIS DE VARIANZA
49
TEST T-STUDENT VERSUS ANOVA
Para comparar los promedios de n conjuntos, se podrían armar las n(n-1)/2 comparaciones de a dos posibles y efectuar los test t-student
test ttest t
test t test tEso se reemplaza con un único ensayo: el ANOVA. Esto:1. economiza prácticamente todo el trabajo computacional2. brinda información acerca de interacciones entre dos o masconjuntos, cosa que los test t no informan. Pag
59
ANOVA vs BATERIA DE t-STUDENT
VISION 3D:ANOVA
VISIONES 2D:t-STUDENT
Los planos brindan visiones parciales,
sólo el espacio brinda toda la información
Pag60
50
QUE ES ANALISIS DE VARIANZA (ANOVA) ?
Es una familia de ensayos deestadística inferencial paramétricaque permiten detectar las posiblesdiferencias entre promedios de dos omas grupos, lo que implica medir lapresencia (�H1) o ausencia (�H0) defactores causales para esas diferenciasy adicionalmente sus eventualesinteracciones
Pag63
VARIANZA
36324533373440293342
s2 = 24es una medida de dispersión de los datos alrededor de la media en poblaciones normales
1)( 2
2
−−
= �n
xxs
51
la VARIANZA en el lenguaje ANOVA
suma de cuadrados
MCldeg
SSn
xxs ≡≡
−−
= �..1
)( 22
grados de libertad
media cuadrada
Pag63
LA SUMA DE CUADRADOS
( )2
2
22
2
1
2
)(
� �
� � ���
−=
=+−=
=−=
xn
x
xxxx
xxSS
esta es la“suma de cuadrados”propiamente dicha
este término se conocecomo “corrección”
Pag63
52
ANOVA: un ejemplo ficticio de partición
36324533373440293342
supongamos que la muestra surge de la union de dos “poblaciones” con medias
distintas
3233342933
3637404245
x = 36
SS = 216
g. de l. = 9
x = 32
SS = 16
g. de l. = 4
x = 40
SS = 56
g. de l. = 4
residuo
SSerror = 144
g. de l. = 1
Pag63
ANOVA: obtención de las MC
DIVIDIENDO LAS SS/GDL SE OBTIENEN LAS VARIANZAS (MC)
MCerr
MCB
MCA
G.DE L.residuales
G.DE L.de B
G.DE L.de A
Pag64
53
ANOVA: el test termina con los cocientes de MC vs MCerror obteniendo los parámetros F (Fisher) cuyas probabilidades asociadas están tabuladas
MCerr
MCCOLUMNAS
MCFILAS
F=1.3 (α=0.22)
HAY DIFERENCIA ENTRE LAS FILAS?
MCerr
F=9.6 (α=0.01)
∴ aceptar H0 de FILAS
∴ rechazar H0 de COLUMNAS
HAY DIFERENCIA ENTRE LAS COLUMNAS?
Pag65
UN TIPICO CUADRO ANOVA
FUENTE DE VARIACION SS g. l. MC F alfa
ENTRE FILAS 400 4 100 1.4 N.S. (p>0.05)
ENTRE COLUMNAS 20000 1 20000 286 p<0.05
ERROR EXPERIMENTAL 70 1 70 -.- -.-
Conclusiónes del ANOVA:En el presente ensayo, no se detectan diferencias significativasentre pacientes (filas). En cambio, se rechaza H0 deigualdad de respuesta ante los dos tratamientos(columnas). Además, la ausencia de interacción brinda valideza estas conclusiones.
Pag65
Pag145
54
PRINCIPALES VARIANTES DE LA FAMILIA DE ENSAYOS ANOVA
• ANOVA 1-ruta• ANOVA 2-rutas• ANOVA factorial balanceado• ANOVA factorial completo• ANOVA de efectos principales• ANOVA anidado• ANOVA con repeticiones• MANOVA (anova múltiple)• ANCOVA (análisis de covarianza)• etc…
EJEMPLO DE UN ANOVA 2-RUTAS
PACIENTE Diclofenac Ibuprofeno Paracetamol
TOTAL
PEREZ 18 44 34 76
GOMEZ 21 40 45 106
DIAZ 26 38 39 105
GIMENEZ 20 37 31 88
TOTAL 85 159 149 293
se administran 3 fármacos a un grupo de pacientes.
1. Hay diferencias entre los tratamientos?2. Los pacientes responden todos de la misma
forma? Pag68
55
PACIENTE Diclofenac Ibuprofeno Paracetamol
TOTAL
PEREZ 18 44 34 76
GOMEZ 21 40 45 106
DIAZ 26 38 39 105
GIMENEZ 20 37 31 88
TOTAL 85 159 149 293
EJEMPLO DE UN ANOVA 2-RUTAS
Corrección = (23 +44 +…+37 +31 )2/12
SSTOTAL = (232+442+…+372+312) - Corrección
( )2
2 1� �−= xn
xSS Pag69
PACIENTE Diclofenac Ibuprofeno Paracetamol
TOTAL
PEREZ 18 44 34 76
GOMEZ 21 40 45 106
DIAZ 26 38 39 105
GIMENEZ 20 37 31 88
TOTAL 85 159 149 293
EJEMPLO DE UN ANOVA 2-RUTAS
SSentre tratam= (1082+1592+1492)/4– Corrección
Pag69
56
PACIENTE Diclofenac Ibuprofeno Paracetamol
TOTAL
PEREZ 18 44 34 76
GOMEZ 21 40 45 106
DIAZ 26 38 39 105
GIMENEZ 20 37 31 88
TOTAL 85 159 149 293
EJEMPLO DE UN ANOVA 2-RUTAS
SSdentro tratam=(1012+1122+1092+942)/3 – Corrección
Pag69
EJEMPLO DE UN ANOVA 2-RUTAS
SSerror= SSTOTAL – (SSentre tratam + SSdentro tratam)
Pag69
PACIENTE Diclofenac Ibuprofeno Paracetamol
TOTAL
PEREZ 18 44 34 76
GOMEZ 21 40 45 106
DIAZ 26 38 39 105
GIMENEZ 20 37 31 88
TOTAL 85 159 149 293
57
CUADRO ANOVA(datos simulados sobre otro cuadro de números)
Conclusiónes del ANOVA:En el presente ensayo, no se detectan diferencias significativasentre pacientes En cambio, se rechaza H0 de igualdad derespuesta entre los tres fármacos (columnas). Un ensayoulterior conocido como prueba POST-HOC identifica cuáles sonesas diferencias (1 vs 2 , 1 vs 3, 2 vs 3) Pag
69
FUENTE DE VARIACION SS g. l. MC F alfa
ENTRE PACIENTES 400 4 100 1.4 N.S. (p>0.05)
ENTRE FARMACOS 20000 1 20000 286 p<0.05
ERROR EXPERIMENTAL 70 1 70 -.- -.-
MUESTREO
58
59
ESTIMACION DETAMAÑOS MUESTRALES
EN PRUEBAS DE INFERENCIA
resolver diferencias estadísticasentre promedios…
es equivalente a resolver imágenes con instrumentos ópticos
mejora al incrementar la potencia del método de medición (1-Beta)
60
mejora si aumenta la distancia entre ambos (�)
también mejora si disminuyen los DS
Para poder llegar a estimar lostamaños muestrales (n) hay queefectuar ensayos preliminares(reducidos) que permitan estimarla variabilidad natural (DS) y elgrado de respuesta que puedellegar a presentarse (�) .
61
UN EJEMPLO DE APLICACIÓN
(test t-Student)
test t-agrupado
• Comparamos dos grupos de pacientes, el DS pre-estimado en cada uno es de 5 unidades. Se buscahallar una diferencia ( � ) de al menos 10 unidadesque sea significativa (�=0.05, 1 cola). Hay queestimar el tamaño de cada grupo.
redondear hacia arriba
0.05; 0.10
2 2( ) (1.96 1.28)2 2 ~ 6 ( / )z z DS DSn p grupo
α β
α β
= =
+� � +� �= ≈� � � �Δ Δ� �� �
62
test t-apareado
• Estudiamos el efecto de un medicamento en un grupode pacientes, el DS pre-estimado es de 3 unidades.Se busca hallar una diferencia (�) de al menos 2unidades (antes y después de la aplicación) y que lamisma sea significativa (�=0.05, 1 cola). Hay queestimar el tamaño del grupo.
redondear hacia arriba
0.05; 0.10
2 2( ) (1.96 1.28) ~ 25z z DS DSn
α β
α β
= =
+� � +� �= ≈� � � �Δ Δ� �� �
CLASE 5
63
Ji-CUADRADOCONTINGENCIA,
BONDAD DE AJUSTE Y ASOCIACION
EL TEST JI-CUADRADO
ES UNA FAMILIA DE PRUEBAS ESTADISTICASNO PARAMETRICAS QUE PERMITEN MEDIR:
1) ASOCIACION o INDEPENDENCIA ENTRE DOS O MASGRUPOS DE NUMEROS
2) CAMBIOS DE PATRONES DE COMPORTAMIENTO ENTABLAS 2x2
3) BONDAD DE AJUSTE DE UNA SERIE DE DATOS A ALGUNTIPO DE DISTRIBUCION TEORICA
Pag89
64
EL TEST JI-CUADRADO
COMO SE TRATA DE UN TEST NO PARAMETRICOSE PUEDE APLICAR A DATOS PROVENIENTES DECUALQUIER DISTRIBUCION CONOCIDA O NO, ENPARTICULAR A RECUENTO DE FRECUENCIAS ENDISTINTAS CATEGORIAS
Pag89
PRUEBA DE ASOCIACION
TOTALESPACIENTESCONTROL
PACIENTESCON
TRATAMIENTO
SIN CAMBIO 23 12
CURADOS 19 42
la curación está asociada con el tratamiento?o sea, el tratamiento es efectivo?
las filas son independientes de las columnas?
Pag89
65
Cómputos Ji Cuadrado(a mano)
Pag89
TOTALESPACIENTESCONTROL
PACIENTESCON
TRATAMIENTO
SIN CAMBIO 23 12
CURADOS 19 42
2 22
1 2 1 2
(| | / 2) 96 (738 48) 9,4442 54 35 61
( 1)( 1) 1 1 1
N AD BC NC C F F
C F
χ
ν
− − × −= = =× × ×
= − − = × =
Consultando en la tabla ji-cuadrado pág 147, se rechaza H0. El x2 obtenido supera al x2*(1%) (=6.64) pero nó al x2*(0,1%) (=10.83)
Pag147
PRUEBA DEL CAMBIO (Mc NEMAR)
En esta prueba cada individuo es su propio
control
DESPUES DEL TRATAMIENTO CON VIT C
SANOS ENFERMOS
ANTES DEL TRATAMIENTO
ENFERMOS A B
SANOS C DLas hipótesis estadísticas son:H0: A=D (el tratamiento no influye en los cambios de estado)H1: A>D (el tratamiento influye en los cambios de estado) (mejora habitantes!)
Pag91
22
20
(| | 1) . . 1
supera el límite tabulado al 5%, se rechaza H
A D con g delA D
si
χ
χ
− −= =+
En una población hay F1 enfermos y F2 sanos de gripe. Después de aplicar unmismo tratamiento con vitamina “C” a todos (se supone preventivo y curativo a lavez), se vuelve a medir uno por uno y se determina cuántos habitantes cambiaronde estado (A se curaron + D se enfermaron).
SUMADE
FILAS
F1
F2
66
PRUEBA DE AJUSTE
hay tendencia en la preferenciade los pacientes ?
PATRON ESTETICO DEPROTESIS DENTALES
PREFERENCIAS OBSERVADAS(en cant de pacientes)
1 A 0
2 B 1
3 C 0
4 D 5
5 E 4
Pag91
PRUEBAS DE BONDAD DE AJUSTE KOLMOGOROV-SMIRNOF Y LILLIEFORS
SON PRUEBAS ESTADISTICAS NO PARAMETRICASVINCULADAS AL TEST JI-CUADRADO Y QUE ESTANESPECIALIZADAS PARA DETECTAR SI DOS SERIESDE NUMEROS SIGUEN O NO UN PATRONCOINCIDENTE, EN CUYO CASO SE ACEPTA ORECHAZA UN Ho: AJUSTE BUENO (si p>0.05 seacepta bondad de ajuste, si p<0.05 se rechazabondad de ajuste)
67
DIC(mm) PDF1 32 0
2 45 0
3 31 1
4 56 0
5 42 0
6 37 2
7 35 0
8 41 0
9 29 0
10 36 3
11 46 1
12 37 1
13 42 0
14 36 0
15 39 0
16 45 0
17 43 1
18 36 0
19 39 1
20 38 2
DISTRIBUCION DE DISTANCIAS INTERCANINAS Y DE PIEZAS DENTALES
FALTANTES EN 20 PACIENTES
Queremos saber si las DIC y las PDF siguen distribuciones
normales o de otro tipo…
Sospechamos que las PDFcorresponden a una
distribución especial conocida como Poisson
68
69
AJUSTE A DISTRIBUCIONES NORMALESY NO NORMALES
70
…es normal?
comprobación
rechazar ajuste
71
… y asociamos dos variables
r=0.9629p=1E-7
NO PARAMETRICAS ESPECIALES
SIGNOS, SECUENCIAL, RACHAS y CONCORDANCIA
72
Pag92
PRUEBA DE LOS SIGNOS
Se aplica cuando queremos comparar Npares de dos conjuntos, en cualquierorden y sin que sean necesariamentedatos cuantitativos.
Este test es una generalización del testde t-Student apareado y sirve paracualquier clase de datos ordinales.
Cómo califica la atención odontológica recibida?
mala (0)regular (1)buena (2)sobresaliente (3) Pag
92
Por ejemplo, queremos comparar el grado desatisfacción (subjetivo) de pacientes atendidospor dos odontólogos A y B. Cada vez que sale unpaciente, le pedimos que complete esta ficha:
73
A medida que salen los pacientes,comparamos ficha de A contraficha de B, de a pares. Elresultado será calificado con signo+ si A atendió mejor, signo – si Batendió mejor y 0 si hubo empate.
N° par A B SIGNO1 0 2 -2 2 1 +3 3 2 +4 4 4 05 3 2 +6 4 2 +7 1 3 -8 4 2 +9 4 3 +10 3 1 +
ResultadosObtenidos
Sobre n=10Pares de
pacientes.
Un par se descarta porque
dio empate.
Quedamos con n=9 pares y x=2
signos menos frecuentes
Pag93
74
TABLA VII: Probabilidad Binomial Acumulada (para H0: p =q = 0,5)Muestras pequeñas ( n < 26) (prueba de una cola)Los números deben dividirse por 1000
x 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
n
5 31 188 500 812 969
6 16 109 344 656 891 984
7 8 62 227 500 773 938 992
8 4 35 145 363 637 855 965 996
9 2 20 90 254 500 746 910 980 998
10 1 11 55 172 377 623 828 945 989 999
Pag150
La probabilidad de que en n=9 pares aparezcan 2 (o menos) signos menos frecuentes es p=0.09, o sea se acepta H0 pero está cerca de p=0.05 y por eso vale la pena seguir investigando si A es mejor que B o nó.
0 5 10 15 20 25
H1: Y > X��0.05
H0: Y = X��0.05
H1: X > Y��0.05
MUESTREO SECUENCIALPag
83-86
75
0 5 10 15 20 25
H1: Y > X��0.05
H0: Y = X��0.05
H1: X > Y��0.05
MUESTREO SECUENCIALPag
83-86
Pag97
PRUEBA DE LAS RACHAS de wald-wolfowitz
Se aplica cuando queremos saber si lasrachas que aparecen a lo largo deltiempo están distribuídas al azar o sihay algo que las alterasistemáticamente.Supongamos que queremos saber si enun consultorio ingresan varones ymujeres por grupos ordenados o si lohacen simplemente al azar.
76
Pag97
Anotamos los pacientes que llegan y losprimeros 28 fueron, en orden de arribo:
Observar que hay r=9 rachas con untotal de n1=14 M y n2=14 F.
M-M-M-F-F-M-M-F-F-F-F-F-M-M--F-F-F-F-M-M-M-F-F-F-M-M-M-M
Pag160
TABLA XII: Prueba de rachas de Wald-WolfowitzPrueba de rachas para una muestra: α = 0,05 (dos colas)
Tabla para Ho de menor o igual (todo r � límite tabulado es significativo 5%)
n2 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
n12 2 2 2 2 2 2 2 2 23 2 2 2 2 2 2 2 2 2 3 3 3 3 3 34 2 2 2 3 3 3 3 3 3 3 3 4 4 4 4 45 2 2 3 3 3 3 3 4 4 4 4 4 4 4 5 5 56 2 2 3 3 3 3 4 4 4 4 5 5 5 5 5 5 6 67 2 2 3 3 3 4 4 5 5 5 5 5 6 6 6 6 6 68 2 3 3 3 4 4 5 5 5 6 6 6 6 6 7 7 7 79 2 3 3 4 4 5 5 5 6 6 6 7 7 7 7 8 8 810 2 3 3 4 5 5 5 6 6 7 7 7 7 8 8 8 8 9
11 2 3 4 4 5 5 6 6 7 7 7 8 8 8 9 9 9 9
12 2 2 3 4 4 5 6 6 7 7 7 8 8 8 9 9 9 10 10
13 2 2 3 4 5 5 6 6 7 7 8 8 9 9 9 10 10 10 10
14 2 2 3 4 5 5 6 7 7 8 8 9 9 9 10 10 10 11 11
15 2 3 3 4 5 6 6 7 7 8 8 9 9 10 10 11 11 11 12
Se rechaza H0 de independencia de llegadas
77
Pag108
PRUEBA DE CONCORDANCIA de Kendall
Se aplica cuando queremos saber siexiste concordancia entre las opinionesde varios jueces sobre los méritosrelativos de varios entes. (Atención: Laconcordancia no garantiza la exactitud del juicio!)
Supongamos que hay 6 postulantes a unabeca y tres profesores los califican enforma independiente, usando una escalade méritos del 1 al 6.
Pag108
POSTULANTES (N=6)JUECES(k=3)
a b c d e f
X 1 6 3 2 5 4
Y 1 5 6 4 2 3
Z 6 3 2 5 4 1
Rj 8 14 11 11 11 8
78
Pag108
Ahora calculamos:2
12
1
2 3 2 31 112 12
25,5
25,5 0,16( ) 3 (6 6)
N
jNj
jj
Rs R
N
sWk N N
=
=
� � �= − =
= = =− −
��
W es es coeficiente de concordancia de Kendall
Pag170
TABLA XVIII: Valores críticos de s en el coeficiente de concordancia de Kendall
kN Valores adicionales para N=3
3 4 5 6 7 k s
Valores al nivel de significación 0.05
3 64.4 103.9 157.3 9 54.0
4 49.5 88.4 143.3 217.0 12 71.9
5 62.6 112.3 182.4 276.2 14 83.8
6 75.7 136.1 221.4 335.2 16 95.8
8 48.1 101.7 183.7 299.0 453.1 18 107.7
10 60.0 127.8 231.2 376.7 571.0
15 89.8 192.9 349.8 570.5 864.9
20 119.7 258.0 468.5 764.4 1158.7
Como s=25.5 es inferior a 103.9 se rechaza H0de concordancia entre los tres jueces al nivel 5%
79
CLASE 6
EPIDEMIOLOGÍA
80
DEFINICION DE LA EPIDEMIOLOGIA
Pag111
Es la disciplina que estudia laenfermedad en poblacioneshumanas
SALUD (OMS, 1946)La salud no sólo es la ausenciade enfermedad, sino el estadode completo bienestar físico,mental y social del individuo
Pag113
INTRODUCCION AL ESTUDIO DE COHORTES
Pag122
81
La epidemiología se ha preocupado por dos objetivos fundamentales:
•Probar causalidad e•Identificar riesgo
Los estudios de cohorte consisten en elseguimiento de uno o más grupos de individuos(las cohortes) que presentan distinto grado deexposición a un factor de riesgo sanitario y enlos cuales se mide la cantidad de afectados parallegar a medir el grado de asociación entreexposición y aparición de la enfermedad y losdiversos riesgos vinculados.
Pag123
Pag122
Esquema básico de estudios de cohorte
82
Pag128MEDIDAS OBTENIDAS DE LOS
ESTUDIOS DE COHORTEStabla de contingencia 2x2 o tabla tetracórica
ENFERMOS SANOS sumaEXPUESTOS A B F1
NO EXPUESTOS C D F2
suma C1 C2 N
Es la misma tabla de contingencia empleada en la prueba ji-cuadrado, sólo que se aplica
siempre a exposición y enfermedad
Pag128
ENFERMOS SANOS suma
EXPUESTOS A B F1
NO EXPUESTOS C D F2
suma C1 C2 N
TASA DE INCIDENCIA EN EXPUESTOS (TIexp): =A/F1TASA DE INCIDENCIA EN NO EXPUESTOS(TIno exp): =C/F2RIESGO RELATIVO (RR): = TIexp/ TIno expINTERV CONF 95% DE RR: =(RR1-1.96��2 , RR1+1.96��2)RIESGO ATRIBUIBLE (RA): = TIexp-TIno expFRACCION ETIOLOGICA (RA%): = [(TIexp-TIno exp)/ TIexp)]x100RIESGO ATRIBUIBLE POBLACIONAL (RAP): =C1/N-TIno expRAP PORCENTUAL (RAP%): =[(C1/N-TIno exp)/(C1/N)]x100
Pag129
83
ANALISIS DE CASOS Y CONTROLES (C&C)
Pag131
Pag131
Es un esquema particular de estudio epidemiológico en elcual en vez de seguir la evolución de cohortes, se procedea estudiar algún factor de riesgo clasificando a losindividuos en dos grupos:
•CASOS: es la subpoblación afectada por una patología.Algunos pueden haber estado expuestos a algún factor deriesgo y otros nó.•CONTROLES: es la subpoblación no afectada por esapatología. Algunos pueden haber estado expuestos a algúnfactor de riesgo y otros nó.
El estudio C&C puede ser “pareado” o no “pareado” segúncómo se seleccionen las muestras de Casos y Controles.
84
Pag131
ESQUEMA BASICO DE INFORMACIONEN UN ESTUDIO C&C
tabla de contingencia 2x2 o tabla tetracórica
estudioC&C
variable dependiente(enfermedad)
variable indep(exposición)
(CASOS)
+(CONTROLES)
-suma
+ A B F1
- C D F2
suma C1 C2 N
Pag131
estudioC&C
variable dependiente(enfermedad)
variable indep(exposición)
(CASOS)
+(CONTROLES)
-suma
+ A B F1
- C D F2
suma C1 C2 N
Tasa % de Exposición en CASOS: =(A/C1)x100Tasa % de Exposición en CONTROLES: =(B/C2)x100...y se pueden calcular los mismos riesgos que en el estudio de cohortes.
85
Pag135
CASOS CONTROLES suma
EXPUESTOS A B F1
NO EXPUESTOS C D F2
suma C1 C2 N
CALCULO DE Ji-CUADRADO PARA COHORTESY CASOS & CONTROLES
1..;2121
)2/|(| 22 =
−−= ldeg
FFCC
NBCADNχ
ODDS RATIO (OR)
Pag135
86
Pag135
CASOS CONTROLES suma
EXPUESTOS A B F1
NO EXPUESTOS C D F2
suma C1 C2 N
OR = (A.D) / (B.C)
Es una medida muy empleada para indicar el grado de asociación entre exposición y casos(o sea el riesgo de haber estado expuesto dada la
enfermedad)
Pag137
UN EJEMPLO:
SARAMPION+
SARAMPION-
suma
VACUNADO + 34 46 80
VACUNADO - 14 2 16
suma 48 48 96
ln ln 3.84653inf
ln ln 0.75349inf
34 2( ) 0.1046 14
95% ( )0.021
95% ( )0.470
OR z ES
OR z ES
Odds Ratio OR
Intervalo deConfianza límiteinferiorIC e e
Intervalo deConfianza límite superiorIC e e
− −
+ −
×= =×
= = =
= = =
87
VALOR ”Odds Ratio”
INTERVALO DE CONFIANZATIPO DE
ASOCIACIÓNINFERIOR SUPERIOR
1 NO EVIDENCIA DE ASOCIACIÓN
MAYOR DE 1 >1 >1 SIGNIFICATIVA, RIESGO
MAYOR DE 1 < 1 > 1 NO SIGNIFICATIVA
MENOR DE 1 < DE 1 < DE 1 SIGNIFICATIVA, PROTECCIÓN
MENOR DE 1 < DE 1 > DE 1 NO SIGNIFICATIVA
Pag136
Nuestro ejemplo
CURVA ROC (receiver operating characteristic,en español: característica operativa del receptor)
Es una herramienta estadísticaque permite estudiar laprecisión de una pruebadiagnóstica. La curva ROC seobtiene graficando lasensibilidad de la pruebaversus 1-especificidad.
Sensibilidad (S): Proporción de casos positivos detectados correctamentepor la prueba (S=VP/VP+FN)Especificidad (E): Proporción de casos negativos detectados correctamentepor la prueba (E=VN/VN+FP)VP=verdadero positivoFN=falso negativoVN=verdadero negativoFP=falso positivo
1 - Especificidad
Sens
ibili
dad
0.0
0.2
0.4
0.6
0.8
1.0
0.0 0.2 0.4 0.6 0.8 1.0
AUC: area under the curve (en español: área bajo la curva)Mientras más cerca de 1.0 se encuentra AUC, más precisa es la prueba.Mientras más cerca de 0.5 se encuentra AUC, menos precisa.AUC = 1.0: prueba “perfecta”AUC = 0.5: prueba inválida (resultados aleatorios)
AUC
88
En general, a medida que incrementa la sensibilidad, disminuyela especificidad, y viceversa. Dentro del marco ROC se puedenrealizar procedimientos para encontrar puntos de corte óptimosde la variable diagnóstico.Ejemplo: Se pretende detectar pacientes positivos y negativospara determinada infección viral (variable respuesta: negativo opositivo) midiendo alguna variable cuantitativa diagnóstica(ejemplo: concentración de un antígeno). El marco ROCcontribuye a encontrar un punto de corte óptimo (un valor de laconcentración del antígeno) haciendo un balance entre lasensibilidad y la especificidad. Por encima de dicho punto decorte, el paciente será clasificado como positivo.
CURVA ROC
Para saber más:-Akobeng, A. K. 2007 Understanding diagnostic tests 3: receiver operating characteristic curves. Acta Paediatrica 96, 644-647.-Bewick, V., Cheek, L. & Ball, J. 2004 Statistics review 13: receiver operating characteristic curves. Critical Care 8, 508-512.-Burgueño, M. J., García-Bastos, J. L. & González-Buitrago, J. M. 1995 Las curvas ROC en la evaluación de las pruebas diagnósticas. Medicina Clínica (Barc) 104, 661-670.-
RESÚMENESComo en las transparenciasanteriores, este símbolo indica lapágina en donde se encontrará eltema en el “Manual de estadísticapráctica”.
p. ###
89
RESUMEN DE ENSAYOS DE COMPARACIONSI SE COMPARAN PRUEBAS
PARAMÉTRICASPRUEBAS
NO-PARAMÉTRICASDos grupos de datos relacionados entre sí
(de a pares)t-student apareado Wilcoxon, Walsh
(para valores de escala)Kolmogorov-Smirnov
(para frecuencias acumuladas)Signos, Muestreo Secuencial
(para valores cualitativos)
Dos grupos de datos independientes t-student agrupado, ANOVA de 1-vía
U de Mann-Whitney(para valores de escala)
Más de dos grupos de datos independientes y un solo factor
ANOVA de 1-vía ANOVA 1-vía Kruskal-Wallis (para valores de escala)
Más de dos grupos de datos clasificables por dos factores (tabla NxM)
ANOVA de 2-vías ANOVA 2-vías Friedman(para valores de escala)
Más de dos grupos de datos relacionados entre sí ANOVA de 2-vías Q de Cochran(para valores cualitativos)
Frecuencia de casos (cualitativos) de dos grupos (tabla 2XN)
-.- Chi-Cuadrado(dos grupos o factores independientes)
Cambio de McNemar(un sólo grupo que cambia por un factor)
Series (binarias) temporales -.- Rachas de Wald-Wolfowitz
Más de dos grupos de datos y mas de dos factores ANOVA factorial -.-
Dos dispersiones de grupos independientes F (Snedecor) Reacciones Extremas de Moses(para valores de escala)
TEST t-STUDENT
Se utiliza para comparar medias entre dos grupos.
Test t-Student agrupado: Existe independencia entre las observaciones de ambos grupos.
Test t-Student apareado: Se toman observaciones de a pares (Ejemplos: mediciones antes y después, mediciones sobre hermanos, mediciones sobre progenitor y descendiente).
Test paramétrico
p. 49
90
TEST t-STUDENT(continuación)
Hipótesis estadísticas para test t-Student:
Hipótesis nula (H0): media de X en grupo A = media de X en grupo B.Hipótesis alternativa (H1): media de X en grupo A ≠ media de X en grupo B.
Test t-Student (apareado o agrupado) de DOS COLAS:
Hipótesis nula (H0): media de X en grupo A = media de X en grupo B.Hipótesis alternativa (H1): media de X en grupo A > media de X en grupo B.
Test t-Student (apareado o agrupado) de UNA COLA:
“X” es la denominación de la variable dependiente. Por ejemplo, si se está midiendo glucemia en pacientes tratados y no tratados con cierta droga, entonces la hipótesis nula se expresa de la siguiente manera:H0: media de glucemia en pacientes tratados = media de glucemia en pacientes no tratados.
ANOVA DE UNA VÍA (un factor)Test paramétrico
Se utiliza para comparar medias entre dos o más gruposindependientes (cuando sólo son dos grupos se prefiere eltest t-Student agrupado).
Hipótesis estadísticas:Hipótesis nula (H0): La media de X es igual en todos los grupos.Hipótesis alternativa (H1): La media de X no es igual en todos los grupos.
-Si p es mayor o igual que alfa: se acepta la hipótesis nula.-Si p es menor que alfa: se rechaza la hipótesis nula, pero además se debe hacer algún test post-hoc (por ejemplo: test de Tukey) para saber entre qué pares de grupos existe una media diferente.
“X” es la denominación de la variable dependiente.
Resultados posibles del test:
Generalmente: alfa = 0,05p. 66
91
ANOVA DE DOS VÍAScon una observación “por casilla”
Test paramétricoSe utiliza para comparar medias entre los distintos nivelesde cada factor a estudiar. Se analizan dos factores. Sedebe suponer que no existe interacción entre ambosfactores.
Factor 1: paciente (cada persona es un nivel del factor “paciente”)Factor 2: fármaco (cada fármaco es un nivel del factor “fármaco”)
Solamente hay una observación para cada combinación de dos niveles de factores diferentes (esto es: en una tabla de doble entrada, como la que se presentó en la clase, hay sólo una observación por casilla). Por ejemplo, para la combinación: paciente “Gomez” y “Fármaco Nº1” sólo tenemos un dato.
Ejemplo visto en clase (transparencias anteriores):
p. 68
ANOVA DE DOS VÍAScon una observación “por casilla”
(continuación)Hipótesis estadísticas
Se debe establecer un par de hipótesis por cada factor:
Siguiendo con el ejemplo de la clase (trasladable a casos análogos), las hipótesis son las siguientes:
Factor 1 (paciente)H0: La media de X es igual en todos los pacientes.H1: La media de X no es igual en todos los pacientes.
Factor 2 (fármaco)H0: La media de X es igual para todos los fármacos.H1: La media de X no es igual para todos los fármacos.
“X” es la denominación de la variable dependiente. Por ejemplo, “X” podría ser la concentración de glóbulos rojos en sangre.
92
ANOVA FACTORIAL COMPLETOTest paramétrico
Se utiliza para comparar medias entre los distintos niveles de cada factor a estudiar (pueden analizarse dos o más factores).También permite evaluar si existe interacción entre estos factores. Se tiene más de una observación por cada combinación de dos niveles de factores diferentes (más de una observación “por casilla”).
Hipótesis estadísticasSe indicarán en el contexto del siguiente ejemplo para un caso de dos factores (trasladable a problemas análogos). Ejemplo: Se quiere saber si el sexo y el estado de peso influyen sobre la glucemia en ratas.Factor 1 = sexo (niveles del factor 1: hembra y macho)Factor 2 = estado de peso (niveles del factor 2: peso bajo,peso normal, peso alto)Por ejemplo: Si trabajamos con 5 hembras de bajo peso, entonces tendremos 5 observaciones para la combinación “hembra” y “peso bajo”.
p. 69
(continuación)Hipótesis estadísticas
Se deben establecer tres pares de hipótesis:
Factor 1:H0: La media de glucemia es igual en ambos sexos.H1: La media de glucemia no es igual en ambos sexos.
Factor 2:H0: La media de glucemia es igual en los tres niveles del estado de peso.H1: La media de glucemia no es igual en los tres niveles del estado de peso.
Interacción:H0: No hay interacción entre el sexo y el estado de peso.H1: Hay interacción entre el sexo y el estado de peso.
ANOVA FACTORIAL COMPLETO
93
Test de Chi cuadrado para prueba de asociaciónSe utiliza para estudiar la existencia de asociación entredos factores. El test de Chi cuadrado es no paramétrico.
Se miden frecuencias. Para realizar el test, estas frecuencias se organizan en tablas de contingencia.
Hipótesis estadísticas
H0: No existe asociación entre X e Y.H1: Existe asociación entre X e Y.
“X” e “Y” son las denominaciones de cada factor. Por ejemplo,en el caso que se explicó en la clase (transparencias anteriores), “X” puede ser la curación (se produce/no se produce), e “Y” puede ser el tratamiento (control/tratado con medicamento).En este caso, la hipótesis nula es la siguiente:H0: No existe asociación entre la curación y el tratamiento. p. 89
Test de Chi cuadrado para prueba de bondad y ajuste
Se utiliza para saber si la distribución de losvalores observados se ajusta (concuerda) a unadeterminada distribución teórica, como ladistribución normal o la distribución de Poisson.
Hipótesis estadísticas
H0: Hay un buen ajuste a la distribución X.H1: No hay un buen ajuste a la distribución X.
“X” es la denominación de la distribución que se está estudiando (normal, Poisson, etc.)
p. 91
94
Test de correlación linealTest paramétrico
Sirve para saber si existe correlación lineal entre dos variables (por ejemplo: entre el peso y la altura).
Se calcula un coeficiente de correlación, conocido como coeficiente de correlación del producto-momento de Pearson (r).
Hipótesis estadísticas
H0: No existe correlación lineal entre X e Y (r=0).H1: Existe correlación lineal entre X e Y (r≠0).
“X” e “Y” son las denominaciones de las variables. Si “X” es peso, e “Y” es altura, entonces la hipótesis nula será la siguiente:H0: No existe correlación entre el peso y la altura (r=0).
p. 52
Top Related