1
DEPARTAMENTO DE QUIMICA
ESTADISTICA APLICADA AL ANALISIS QUIMICO
Bases para la Validación de Métodos Analíticos
Recopilado por J. Sandoval
“LA GENTE SOLO VE LO QUE ESTA PREPARADA PARA VER”
Emerson
1
CUANDO SE APLICA LA ESTADISTICA
A UN ANALISIS
(QUIMIOMETRIA)
2
ANALISISDISEÑO
EXPERIMENTALANTES
MANIPULACION
DE DATOSDESPUES
LA APLICACION DE LA ESTADISTICA EN TODOS LOS PASOS DE UNA
MEDICION QUIMICA ASEGURA LA CALIDAD DE LA MEDICION
ADQUISICION DE DATOS
DURANTE
CONTROL ESTADISTICO DE CALIDAD
EN LAS MEDICIONES QUIMICAS
CALIDAD CONFIABILIDAD
3
UN RESULTADO CONFIABLE ES AQUEL
QUE DEMUESTRA SER VALIDO
VALIDEZ: GRADO AL CUAL UNA MEDICION (REALIZADA
MEDIANTE UN INSTRUMENTO Y/O PROCEDIMIENTO ANALITICO
ESPECIFICOS) PRODUCE EL RESULTADO ESPERADO
DEFINICION PRACTICA DE
ESTADISTICA
HERRAMIENTA UTILIZADA PARA DISCRIMINAR
ENTRE LAS PARTES SISTEMATICA (DETERMINADA)
Y AL AZAR (INDETERMINADA) DE UNA SEÑAL O
RESULTADO ANALITICO
4
y = D + dTotal Sistemática Al azar
2
OBJETIVO DE UNA MEDICION:
DETERMINAR LA MAGNITUD DE
LA PARTE SISTEMATICA DE LA SEÑAL
PARA SEPARAR LA PARTE SISTEMATICA DE UNA
SEÑAL ESPECIFICA, EL ANALISTA DEBERA TENER UN
CONOCIMIENTO PREVIO DE LAS POSIBLES FUENTES
DE ESA PARTE SISTEMATICA
LA ESTADISTICA ES UN COMPLEMENTO QUE LE AYUDA INDIRECTAMENTE EN DICHA SEPARACION
5 6
EXACTITUD
Y
PRECISION
CERCANIA AL
VALOR “VERDADERO”
REPRODUCIBILIDAD
ERROR SISTEMATICO
• SU PRESENCIA PUEDE SER DETECTADA MEDIANTE PRUEBAS
ESTADISTICAS SENCILLAS. DICHAS PRUEBAS, SIN EMBARGO,
NO PERMITEN IDENTIFICAR EL ORIGEN DEL ERROR
SISTEMATICO
• LA MANERA MAS SIMPLE DE DETERMINAR LA PRESENCIA DE
ERROR SISTEMATICO ES CUANTIFICAR EL ANALITO EN UN
MATERIAL DE REFERENCIA (ESTANDAR)*
7
* MATERIAL DE REFERENCIA:
CONTIENE UNO O MAS ANALITOS EN CONCENTRACION CONOCIDA CON
ALTAS EXACTITUD Y PRECISION
PUEDEN OBTENERSE EN
National Institute of Standards and Technology (NIST)
American Society for Testing and Materials (ASTM)
ERROR ALEATORIO
(AL AZAR, INDETERMINADO)
TIENE SU ORIGEN EN LOS EFECTOS DE VARIABLES
FUERA DE CONTROL (TAL VEZ INCONTROLABLES)
EN LAS MEDICIONES
TIENE IGUAL PROBABILIDAD DE SER POSITIVO O
NEGATIVO
ESTA SIEMPRE PRESENTE Y NO PUEDE
CORREGIRSE
8
3
DOS CONCEPTOS BASICOS:
POBLACION Y MUESTRA
• POBLACION
COLECCION COMPLETA DE OBJETOS QUE COMPARTEN
UNA O MAS CARACTERISTICAS
DESDE UN PUNTO DE VISTA ANALITICO:
EL NUMERO INFINITO DE RESULTADOS QUE, EN
PRINCIPIO, SE PUEDE OBTENER CON UNA INFINITA
CANTIDAD DE MUESTRA Y EN UNA INFINITA CANTIDAD
DE TIEMPO
• MUESTRA
UN SUBCONJUNTO DE UNA POBLACION
9
PUNTOS IMPORTANTES
EN ESTADISTICA
ESTRICTAMENTE, LAS LEYES DE LA ESTADISTICA SE APLICAN SOLO
A POBLACIONES. CUANDO ESTAS LEYES SE APLICAN A MUESTRAS
DE DATOS DE LABORATORIO, SE ASUME QUE LA MUESTRA ES
REPRESENTATIVA DE LA POBLACION
LA ESTADISTICA TIENE SUS BASES EN LA TEORIA DE
PROBABILIDADES (UNA TEORIA UTILIZADA PARA EXPLICAR
EVENTOS AL AZAR)
LA ESTADISTICA NO MANEJA “ABSOLUTOS”: SOLO PUEDE DECIR
SI UN EVENTO ES ESTADISTICAMENTE SIGNIFICATIVO O
ESTADISTICAMENTE INSIGNIFICANTE
10
DOS DEFINICIONES BASICAS EN ESTADISTICA:
MEDIA Y DESVIACION STANDARD
MEDIA
POBLACION:
MUESTRA:
n NÚMERO DE MEDICIONES
xi i-ÉSIMA MEDICIÓN DE x
11
n
xn
1i
n
i
lim
n
x
x
n
1i
i
DOS DEFINICIONES BASICAS EN ESTADISTICA:
MEDIA Y DESVIACION ESTANDAR
12
DESVIACION ESTANDAR
POBLACION:
MUESTRA:
sn-1 en su calculadora
GRADOS DE LIBERTAD
UN GRADO DE LIBERTAD
SE PIERDE CUANDO LA
MEDIA SE USA EN EL
CALCULO POSTERIOR DE
CUALQUIER PARAMETRO
n
xn
1i
2
i
nlim
s
1n
xx
s
n
1i
2
i
4
DESVIACION ESTANDAR
13
LA DESVIACION ESTANDAR ES
UNA MEDIDA CUANTITATIVA
DE LA PRECISON
(REPRODUCIBILIDAD o
DISPERSION DE LAS
MEDICIONES ALREDEDOR DE
LA MEDIA)
DESVIACION ESTANDAR RELATIVA
(RSD)
14
TAMBIEN CONOCIDA COMO COEFICIENTE
DE VARIACION (CV)
x
sRSD
100x
sRSD%
GRADOS DE LIBERTAD
NUMERO DE VALORES NO RESTRINGIDOS
Ejemplo:
• ESCOJA UN TOTAL DE 5 VALORES AL AZAR:
3 5 17 2 10
5 GRADOS DE LIBERTAD
• ESCOJA UN TOTAL DE 5 VALORES CON UN PROMEDIO DE 8:
3 5 17 2 13
4 GRADOS DE LIBERTAD
PARA OBTENER UN PROMEDIO DE 8 DESPUES DE ESCOJER LOS PRIMEROS 4 VALORES, EL 13 Y SOLAMENTE EL 13 PUEDE SER EL 5o VALOR
15
Ejemplo:
• ESCOJA UN TOTAL DE 5 VALORES CON UN PROMEDIO DE 8 YUNA DESVIACION ESTANDAR DE 6:
3 5 17 3.725 11.275
3 GRADOS DE LIBERTAD
PARA OBTENER UN PROMEDIO DE 8 Y UNA DESVIACION ESTANDAR DE 6 , SOLAMENTE LOS NUMEROS 3.725 Y 11.275 PUEDEN SER EL 4oY EL 5o VALORES, DESPUES DE ESCOJER LOS PRIMEROS 3 NUMEROS
16
GRADOS DE LIBERTAD(CONTINUACION)
EN GENERAL...
SI UNO TIENE n DATOS Y CALCULA m PARAMETROS
ESTADISTICOS, LOS GRADOS DE LIBERTAD SON DE (n - m)
5
DISTRIBUCIONES
50 determinaciones
de la concentración
(g/mL) del ión
nitrato en una
muestra de agua
17
media= 0.500 g/mL
desv. estd. = 0.0165 g/mL
TABLA DE FRECUENCIA
LA DISTRIBUCION SE
PUEDE VISUALIZAR
MEDIANTE UN
HISTOGRAMA
0.51 0.51 0.51 0.50 0.51 0.49 0.52 0.53 0.50 0.47
0.51 0.52 0.53 0.48 0.49 0.50 0.52 0.49 0.49 0.50
0.49 0.48 0.46 0.49 0.49 0.48 0.49 0.49 0.51 0.47
0.51 0.51 0.51 0.48 0.50 0.47 0.50 0.51 0.49 0.48
0.51 0.50 0.50 0.53 0.52 0.52 0.50 0.50 0.51 0.51
Concentracion Frecuencia
0.46 1
0.47 3
0.48 5
0.49 10
0.50 10
0.51 13
0.52 5
0.53 318
0
2
4
6
8
10
12
14
0.46 0.47 0.48 0.49 0.50 0.51 0.52 0.53
Concentracion, g/mL
Fre
cu
en
cia
HISTOGRAMA DE LOS DATOS DE CONCENTRACION DE ION NITRATO
LA DISTRIBUCION
DE LAS
MEDICIONES ES
CERCANAMENTE
SIMETRICA CON
RESPECTO A LA
MEDIA
LA SIMETRIA SE HACE MAS APARENTE A MEDIDA QUE n SE INCREMENTA
ES UN ESTIMADO DE
S ES UN ESTIMADO DE s
x
LA DISTRIBUCION NORMAL O GAUSSIANA
19
FRACCION DE LA POBLACION CUYOS
VALORES SE ENCUENTRAN ENTRE x Y x+dx
s
s
2
2
xexp
y
2
2
ydxN
dN
Funcion de densidad de probabilidad
LA DISTRIBUCION NORMAL O GAUSSIANA
20
La probabilidad de que la variable aleatoria x
tome un valor dentro de un determinado rango es
la integral de la función y sobre dicho rango
El área total encerrada
bajo la curva es igual a 1:
1ydx
b
aydxbxaP )(
s
s
2
2
xexp
y
2
2
6
LA DISTRIBUCION NORMAL O GAUSSIANA
21
RELACION
MUY UTIL:
DIFERENCIA EN
UNIDADES DE
DESVIACION
ESTANDAR
ECUACION
MAS
COMPACTA:
s
xz
dze2
1
N
dN2
z2
s
s
2
2
xexp
y
2
2
LA DISTRIBUCION NORMAL “ESTANDAR”
22
Se llama distribución normal "estándar" a aquélla en la
que sus parámetros toman los valores μ = 0 y σ = 1. En este
caso la función de densidad tiene la siguiente expresión:
xxx
z
1
0
s
dxeN
dNx
2
2
2
1
s
s
2
2
xexp
y
2
2
dze2
1
N
dN2
z2
Que, naturalmente, coincide con:
Puesto que...
INTERPRETACION GEOMETRICA DE LA
DESVIACION ESTANDAR s
23
A MAYOR s, MAS ANCHA LA CURVA
DISTRIBUCIONES NORMALES CON LA MISMA MEDIA PERO
DIFERENTES VALORES DE LA DESVIACION ESTANDAR
OTRAS DISTRIBUCIONES COMUNES
DISTRIBUCIONES APROXIMADAMENTE LOG-NORMAL: CONCENTRACION DEL ANTICUERPO INMUNOGLOBULINA MEN SUERO DE INDIVIDUOS MACHOS
EL TAMAÑO DE LAS GOTITAS FORMADAS POR LOS NEBULIZADORES DE ABSORCION/ EMISION ATOMICA TAMBIEN EXHIBEN ESTA DISTRIBUCION
24
7
25
OTRAS PROPIEDADES DE LA DISTRIBUCION NORMAL
PREGUNTA: CUAL ES LA PROBABILIDAD DE QUE REPLICAS DE UNA MEDICION SE ENCUENTREN DENTRO DE UN RANGO PARTICULAR ALREDEDOR DE LA MEDIA?
26
s
1x
1z
s
2x
2z
s
3x
3z
En el intervalo
[μ - 2σ, μ + 2σ]
se encuentra
comprendida,
aproximadamente,
el 95% de la
distribución
OTRAS PROPIEDADES DE LA DISTRIBUCION NORMAL
OTRA PREGUNTA: CUAL ES RANGO ALREDEDOR DE LA MEDIA PARA EL CUAL HAY UNA PROBABILIDAD DADA DE QUE REPLICAS DE UNA MEDICION SE ENCUENTREN DENTRO DE EL?
EN OTRAS PALABRAS:
CUAL ES EL VALOR DE z PARA UN PORCENTAJE DADO DE VALORES
OBSERVADOS?
27
%Valores Observados Intervalo alrededor de Desviaciones estandares, z
50 ± 0.67s 0.67
68 ± 1.00s 1.00
80 ± 1.29s 1.29
90 ± 1.64s 1.64
95 ± 1.96s 1.96
98 ± 2.33s 2.33
99 ± 2.58s 2.58
99.7 ± 3.00s 3.00
99.9 ± 3.29s 3.29
28
A SU DESVIACION
ESTANDARD SE LE CONOCE
COMO ERROR ESTANDARD
DE LA MEDIA
0.51 0.51 0.51 0.50 0.51 0.49 0.52 0.53 0.50 0.47
0.51 0.52 0.53 0.48 0.49 0.50 0.52 0.49 0.49 0.50
0.49 0.48 0.46 0.49 0.49 0.48 0.49 0.49 0.51 0.47
0.51 0.51 0.51 0.48 0.50 0.47 0.50 0.51 0.49 0.48
0.51 0.50 0.50 0.53 0.52 0.52 0.50 0.50 0.51 0.51
0.506 0.504 0.502 0.496 0.502 0.492 0.506 0.504 0.500 0.486
RESULTADOS DE 50 DETERMINACIONES DE LA CONCENTRACION DE ION NITRATO, EN g/mL
LA DISTRIBUCION DE MEDIAS
NOTESE QUE ESTAS
MEDIAS EXHIBEN UNA
DISPERSION MENOR
QUE LOS DATOS
ORIGINALES
PARTE DE UNA
POBLACION DE MEDIAS
8
TEOREMA DEL LIMITE CENTRAL
INDEPENDIENTEMENTE DEL TIPO DE DISTRIBUCION DE LOS DATOS...
ENTRE MAS MUESTRAS DE DATOS SE TOMAN, MAS NORMALMENTE DISTRIBUIDA
SE HACE LA DISTRIBUCION DE LAS MEDIAS DE ESAS MUESTRAS
EN OTRAS PALABRAS,
AUN SI LA POBLACION ORIGINAL NO ES NORMALMENTE DISTRIBUIDA, LA
DISTRIBUCION DE LAS MEDIAS TIENDE A SER MAS NORMALMENTE DISTRIBUIDA A
MEDIDA QUE n AUMENTA
29
EN LA PRACTICA,
sx
xi
sm
ix
n
xm
ss
n
ss x
m
CONFIABILIDAD DE UN RESULTADO ANALITICO
RESULTADO ANALÍTICO:
INTERVALO DE CONFIANZA*_
RANGO DENTRO DEL CUAL UNO PUEDE RAZONABLEMENTE ASUMIR
QUE SE ENCUENTRA EL VALOR REAL
LIMITES DE CONFIANZA_
LOS VALORES EXTREMOS DE ESE RANGO
* “CONFIANZA” SIGNIFICA QUE UNO PUEDE AFIRMAR CON UN
GRADO ESPECIFICO DE CERTEZA (i. e. , UNA CIERTA PROBABILIDAD)
QUE EL INTERVALO INCLUYE EL VALOR REAL
30
confianzadeervalointx
RANGO DE CONFIANZA Y DISTRIBUCION DE LAS MEDIAS
DISTRIBUCION DE MEDIAS MOSTRANDO EL RANGO DENTRO
DEL CUAL SE ENCUENTRA EL 95% DE LAS MEDIAS
31
LIMITES DE CONFIANZA
SI SE CONOCE s :
32
P1
nzxIC s
1.96 (95%)
2.58 (99%)Z =
9
LIMITES DE CONFIANZA
SI NO SE CONOCE s (MUESTRAS PEQUEÑAS):
33
ntsxIC P,ftt
1nf
P1
t ES FUNCIÓN DE:
LOS GRADOS DE LIBERTAD LA PROBABILIDAD, P, DE QUE SE
ENCUENTRE DENTRO DEL RANGO ESTABLECIDO
ALGUNAS VECES SE USA (LA PROBABILIDAD DE QUE
SE ENCUENTRE FUERA DEL RANGO ESTABLECIDO)
VALORES DE t
34
P,ftt
P=0.95
0.00
2.00
4.00
6.00
8.00
10.00
12.00
14.00
0 20 40 60 80 100 120
Degrees of freedom
t-valu
e
EJEMPLO
SE DETERMINÓ LA CONCENTRACIÓN DE PLOMO EN LA
SANGRE DE 50 NIÑOS DE UNA ESCUELA CERCA A UNA
CARRETERA CON MUCHO TRÁFICO. LA MEDIA DE LAS
MUESTRAS FUÉ DE 10.1 ng/mL Y LA DESVIACIÓN ESTÁNDAR
FUÉ DE 0.6 ng/mL.
(a) CALCULAR EL INTERVALO DE CONFIANZA DE LA
CONCENTRACIÓN MEDIA DE PLOMO EN TODOS LOS NIÑOS DE
LA ESCUELA.
(b) CUAL DEBERÍA SER EL TAMAÑO DE LA MUESTRA PARA
REDUCIR EL RANGO DE CONFIANZA A 0.2 ng/mL (ES DECIR, ±0.1
ng/mL)?
35
LIMITES DE CONFIANZA
36
50n
ppb6.0s
ppb1.10x
n
stxIC
17.01.1050
6.001.21.10IC
10.27
9.93
Intervalo de confianza
lim. superior
lim. inferior
10.1
0.17 0.17
0.34 Rango de confianza
10
37
?n
ppb6.0s
ppb1.10x
n
stxIC
Tamaño de la muestra
10.1
0.1 0.1
0.2
1.0n
st
2
1.0
tsn
2
2
104.11441.0
6.02n
LIMITES DE CONFIANZA
EN GENERAL_
EL TAMAÑO DE MUESTRA (n)
NECESARIO PARA ESTIMAR LA
PRECISION DENTRO DE ± C ES
38
2
C
tsn
MAS SOBRE LA DISTRIBUCION NORMAL
EN GENERAL UNO ASUME QUE REPETIDAS DETERMINACIONES
DE UN ANALITO SIGUEN UNA DISTRIBUCION NORMAL
LA ASUNCION NO ES DEL TODO GRATUITA:
ESTUDIOS MATEMATICOS DE LA DISTRIBUCION NORMAL
(AL MENOS POR 300 AÑOS) HAN MOSTRADO QUE EN
SITUACIONES EN LAS QUE MUCHOS PEQUEÑOS ERRORES
AFECTAN CADA MEDICION, EL ERROR TOTAL EN EL
RESULTADO SIGUE SIEMPRE UNA DISTRIBUCION NORMAL
MUCHOS CIENTIFICOS HAN ENCONTRADO UN GRAN
NUMERO DE SITUACIONES EN LAS QUE MEDICIONES
REPETIDAS SIGUEN UNA DISTRIBUCION NORMAL
39
USO DE LAS “COLAS“ DE
UNA DISTRIBUCION NORMAL DE ERROR
HAY SITUACIONES EN LAS QUE ES IMPORTANTE
DETERMINAR LA FRECUENCIA CON LA CUAL
CIERTOS RESULTADOS EXTREMOS PODRIAN
OCURRIR EN UNO DE LOS LADOS DE LA CURVA
NORMAL DE ERROR:
TIPICAMENTE, EL ANALISTA DEBE ASEGURARSE
QUE NO MAS QUE UN PEQUEÑO PORCENTAJE DE
LAS MUESTRAS SEA MAYOR O MENOR QUE
ALGUN VALOR LIMITE PREDETERMINADO
40
11
USO DE LAS “COLAS“ DE
UNA DISTRIBUCION NORMAL DE ERROR
RETOMEMOS LAS DETERMINACIONES DE LA CONCENTRACIÓN (ppm) DE IÓN NITRATO EN UNA MUESTRA DE AGUA
MEDIA= 0.500 ppm
DESV. ESTD. = 0.0165 ppm
SUPONGAMOS QUE DESEAMOS ESTIMAR EL PORCENTAJE DE DETERMINACIONES QUE EXCEDE 0.53 ppm
41
QUE PORCENTAJE DE LAS DETERMINACIONES EXCEDE 0.53?
“COLAS“ DE LA DISTRIBUCION NORMAL
EL PORCENTAJE REQUERIDO PUEDE OBTENERSE DE LA
TABLA DE DISTRIBUCION NORMAL “ESTANDAR” (VIDE
INFRA), PERO PARA USAR ESTA TABLA DEBEMOS PRIMERO
ESTANDARIZAR EL VALOR (0.53) EN EL QUE ESTAMOS
INTERESADOS.
ESTO SE HACE EN TERMINOS DE z, LA DESVIACION DEL
VALOR CON RESPECTO A LA MEDIA, EXPRESADA EN
UNIDADES DE DESVIACION ESTANDAR, ES DECIR :
42
s
xxxz lim
s
818.1
0165.0
50.053.0
“COLAS“ DE DISTRIBUCION NORMAL
RECUERDE QUE ESTE VALOR DE z NOS DICE QUE EL VALOR (0.53) ESTA 1.818 DESVIACIONES ESTANDAR POR ENCIMA DE LA MEDIA (0.50)
43
818.1z
USANDO EL VALOR DE z Y LA TABLA DE
DISTRIBUCION NORMAL ESTANDAR, VEMOS
QUE APROXIMADAMENTE 3.45% DE LAS
DETERMINACIONES EXCEDEN 0.53 ppm
TABLA DE DISTRIBUCION NORMAL ESTANDAR
Standardized value = (value – mean)/SD
44
Stan
dard
ized
valu
e
% e
xcee
ding
the
valu
e
Stan
dard
ized
valu
e
% e
xcee
ding
the
valu
e
Stan
dard
ized
valu
e
% e
xcee
ding
the
valu
e
Stan
dard
ized
valu
e
% e
xcee
ding
the
valu
e
Stan
dard
ized
valu
e
% e
xcee
ding
the
valu
e
Stan
dard
ized
valu
e
% e
xcee
ding
the
valu
e
Stan
dard
ized
valu
e
% e
xcee
ding
the
valu
e
0.000 50.0 0.842 20.0 1.645 5.0 2.054 2.00 2.575 0.50 2.877 0.200 3.287 0.050
0.025 49.0 0.860 19.5 1.655 4.9 2.064 1.95 2.582 0.49 2.885 0.195 3.317 0.045
0.050 48.0 0.878 19.0 1.664 4.8 2.075 1.90 2.589 0.48 2.893 0.190 3.349 0.040
0.075 47.0 0.896 18.5 1.675 4.7 2.086 1.85 2.597 0.47 2.901 0.185 3.385 0.035
0.101 46.0 0.915 18.0 1.685 4.6 2.097 1.80 2.604 0.46 2.910 0.180 3.427 0.030
0.126 45.0 0.935 17.5 1.695 4.5 2.108 1.75 2.612 0.45 2.919 0.175 3.476 0.025
0.151 44.0 0.954 17.0 1.706 4.4 2.120 1.70 2.619 0.44 2.928 0.170 3.534 0.020
0.176 43.0 0.974 16.5 1.717 4.3 2.132 1.65 2.627 0.43 2.937 0.165 3.607 0.015
0.202 42.0 0.994 16.0 1.728 4.2 2.144 1.60 2.635 0.42 2.946 0.160 3.707 0.010
0.228 41.0 1.015 15.5 1.739 4.1 2.157 1.55 2.643 0.41 2.956 0.155 3.869 0.005
0.253 40.0 1.036 15.0 1.751 4.0 2.170 1.50 2.652 0.40 2.966 0.150
0.279 39.0 1.058 14.5 1.762 3.9 2.183 1.45 2.660 0.39 2.977 0.145
0.305 38.0 1.080 14.0 1.774 3.8 2.197 1.40 2.669 0.38 2.987 0.140
0.332 37.0 1.103 13.5 1.786 3.7 2.211 1.35 2.678 0.37 2.998 0.135
0.358 36.0 1.126 13.0 1.799 3.6 2.226 1.30 2.687 0.36 3.010 0.130
0.385 35.0 1.150 12.5 1.812 3.5 2.241 1.25 2.696 0.35 3.022 0.125
0.412 34.0 1.175 12.0 1.825 3.4 2.257 1.20 2.706 0.34 3.034 0.120
0.440 33.0 1.200 11.5 1.838 3.3 2.273 1.15 2.716 0.33 3.047 0.115
0.468 32.0 1.226 11.0 1.852 3.2 2.290 1.10 2.726 0.32 3.060 0.110
0.496 31.0 1.254 10.5 1.866 3.1 2.308 1.05 2.736 0.31 3.074 0.105
0.524 30.0 1.282 10.0 1.881 3.0 2.326 1.00 2.747 0.30 3.089 0.100
0.553 29.0 1.311 9.5 1.896 2.9 2.345 0.95 2.758 0.29 3.104 0.095
0.583 28.0 1.341 9.0 1.911 2.8 2.365 0.90 2.770 0.28 3.120 0.090
0.613 27.0 1.372 8.5 1.927 2.7 2.386 0.85 2.781 0.27 3.136 0.085
0.643 26.0 1.405 8.0 1.943 2.6 2.409 0.80 2.794 0.26 3.154 0.080
0.674 25.0 1.439 7.5 1.960 2.5 2.432 0.75 2.806 0.25 3.172 0.075
0.706 24.0 1.476 7.0 1.977 2.4 2.457 0.70 2.819 0.24 3.192 0.070
0.739 23.0 1.514 6.5 1.995 2.3 2.483 0.65 2.833 0.23 3.214 0.065
0.772 22.0 1.555 6.0 2.014 2.2 2.512 0.60 2.847 0.22 3.237 0.060
0.806 21.0 1.598 5.5 2.033 2.1 2.542 0.55 2.862 0.21 3.261 0.055
12
“COLAS“ DE DISTRIBUCION NORMAL
LA TABLA DE DISTRIBUCION NORMAL ESTANDAR
TAMBIEN PUEDE USARSE “EN REVERSA”:
QUE VALOR ES PROBABLE DE SER EXCEDIDO POR
EL 10% DE LAS DETERMINACIONES MAS ALTAS?
45
QUE VALOR ES EXCEDIDO POR EL 10% DE LAS DETERMINACIONES?
“COLAS“ DE DISTRIBUCION NORMAL
LOCALIZANDO EL 10% EN LA COLUMNA DE LA
DERECHA DE LA TABLA DE DISTRIBUCION
NORMAL ESTANDAR, OBTENEMOS UN VALOR, z,
DE 1.282, DEL CUAL SE PUEDE OBTENER EL VALOR
DESCONOCIDO:
46
CONCLUIMOS QUE EL 10% MAS ALTO DE LAS
DETERMINACIONES EXCEDE 0.52 ppm
0165.0
50.0x282.1 lim
52.00165.0282.150.0xlim
EJERCICIO DE TALLER
EL OCTANAJE DE LA GASOLINA SE PUEDE INCREMENTAR
MEDIANTE LA ADICION DE TETRAETILO DE PLOMO (TEL,
TETRAETHYLLEAD), PERO EL LIMITE MAXIMO DE TEL PERMITIDO
ES 0.50 g/gal. SI MAXIMO EL 0.5% DE LAS MUESTRAS DE GASOLINA
PUEDEN EXCEDER ESTE LIMITE Y LA DESVIACION ESTANDAR
DEL CONTENIDO DE TEL EN LA COMPAÑIA A ES sA = 0.05 g/gal,
CUAL ES LA CONCENTRACIO MEDIA QUE ESTA COMPAÑIA PUEDE
USAR EN SU GASOLINA?
LA COMPAÑIA B MANTIENE UN CONTROL MAS ESTRICTO EN SUS
PROCEDIMIENTOS, DE TAL MANERA QUE sB = 0.01 g/gal. CUANTO
TEL PUEDE AÑADIR EN PROMEDIO ESTA COMPAÑIA?
47 48
13
PRUEBAS DE SIGNIFICACION
TAMBIEN LLAMADAS
PRUEBAS DE HIPOTESIS (NULA)
UN PROCEDIMIENTO SISTEMATICO QUE NOS PERMITE
DECIDIR SI UN CONJUNTO DE MEDICIONES REPETIDAS
MUESTRA EVIDENCIA DE ERROR SISTEMATICO
49
EL PROPOSITO DE UNA PRUEBA DE SIGNIFICACION ES
SACAR UNA CONCLUSION ACERCA DE UNA POBLACION
UTILIZANDO DATOS PROVENIENTES DE UNA MUESTRA
PRUEBAS DE SIGNIFICACION
EJEMPLO: (Analyst 1983, 108, 64)
EN UN METODO PARA DETERMINAR PLOMO EN SANGRE POR
ABSORCION ATOMICA SE OBTUVIERON LOS SIGUIENTES
VALORES PARA UNA MUESTRA STANDARD QUE CONTIENE
38.9 ppb DE PLOMO:
50
ppbx 80.37 ppbs 964.0
38.9 37.4 37.1
EXISTE ALGUNA EVIDENCIA DE ERROR SISTEMATICO?
LA CUESTION ES SI LA DIFERENCIA ENTRE EL RESULTADO Y
EL VALOR REAL ES ESTADISTICAMENTE SIGNIFICATIVA, O SI
SE DEBE A MERAS VARIACIONES FORTUITAS (AL AZAR)
SE SIGUE UN PROCEDIMIENTO DE 6 PASOS
PASO 1:
HIPOTESIS “NULA” ( H0) : EL RESULTADO NO ES
INEXACTO
OJO: UNO NO SABE SI ESTA DECLARACION ES
CIERTA O ES FALSA, PERO SERA ASUMIDA
CIERTA HASTA QUE SE PRUEBE QUE ES FALSA
PASO 2:
HIPOTESIS ALTERNA ( H1) : EL RESULTADO ES
INEXACTO
51
PROCEDIMIENTO DE SEIS PASOS
PASO 3:
PRUEBA ESTADISTICA
OJO: ESTE PASO CONDENSA LA INFORMACION DE LA
MUESTRA EN UN SIMPLE NUMERO
52
s
nxtcalc
98.1964.0
39.388.37
calct
14
PASO 4:
VALORES CRITICOS : COMPARE EL RESULTADO DE LA
PRUEBA ESTADISTICA (tcalc) CON VALORES TEORICOS
TABULADOS
tcrit = 4.3 (P = 95%, f = 2)
SI tcalc EXCEDE EL VALOR CRITICO, LA HIPOTESIS NULA SE
RECHAZA.
LOS VALORES CRITICOS PUEDEN INTEPRETARSE COMO
VALORES QUE SON IMPROBABLES* QUE SEAN EXCEDIDOS POR
LA PRUEBA ESTADISTICA (tcalc) SI LA HIPOTESIS NULA ES CIERTA
* A UN 95% DE CONFIANZA, LA PROBABILIDAD ES MENOR DE 5% (ES DECIR, MENOS QUE 1 EN 20)
53
PASO 5:
DECISION: RETENEMOS LA HIPOTESIS NULA
PASO 6:
CONCLUSION: HEMOS SIDO INCAPACES DE PROBAR QUE EL
RESULTADO ES INEXACTO
54
NOTA IMPORTANTISIMA:
LA DECISION DE RETENER LA HIPOTESIS NULA NO
SIGNIFICA QUE SE HA DEMOSTRADO QUE ES CIERTA;
SIMPLEMENTE, NO SE PUDO DEMOSTRAR QUE SEA FALSA
VALORES CRITICOS PARA LA PRUEBA t
55
LA HIPOTESIS NULA SE USA
(O SE DEBERIA USAR)
EN LAS CORTES CRIMINALES:
EL ACUSADO SE ASUME “NO CULPABLE”
HASTA QUE SE DEMUESTRE QUE ES CULPABLE
56
VEREDICTO “NO CULPABLE” EN CORTE CRIMINAL
LA EVIDENCIA (PRUEBAS DE SIGNIFICACION) INDICA QUE LA
HIPOTESIS NULA DEBE CONSERVARSE
CONCLUSION:
NO SE HA DEMOSTRADO QUE EL ACUSADO ES INOCENTE...
(NO SE PUDO DEMOSTRAR QUE EL ACUSADO SEA CULPABLE)
15
PRUEBAS DE SIGNIFICACIONENFASIS SOBRE LO IMPORTANTE
H0 ES UNA DECLARACION DE QUE “NO HAY
DIFERENCIA”, ES DECIR, QUE CUALQUIER DIFERENCIA
OBSERVADA ES DEBIDA SOLO AL AZAR
H0 ES LA HIPOTESIS QUE EL INVESTIGADOR ESPERA
RETENER
EL UMBRAL DE ERROR, (= 1-P), ES EL RIESGO (LA
PROBABILIDAD) QUE EL INVESTIGADOR ESTA
DISPUESTO A TOMAR SI RECHAZARA
INCORRECTAMENTE LA H0 VERDADERA
57
COMPARACION DE LAS MEDIAS DE
DOS MUESTRAS
SE QUIEREN COMPARAR LOS RESULTADOS DE UN
NUEVO METODO ANALITICO CON AQUELLOS
OBTENIDOS POR UN SEGUNDO METODO
(REFERENCIA)
58
CONOCIDOS:
21
21
21
&
&
&
nn
ss
xx
COMPARACION DE DOS MEDIAS
CASO I:
s1 Y s2 NO SON SIGNIFICATIVAMENTE DIFERENTES
H0: LOS DOS METODOS NO PRODUCEN RESULTADOS DIFERENTES
PRUEBA ESTADISTICA:
tcalc TIENE f1 + f2 (O SEA, n1+n2-2) GRADOS DE LIBERTAD
59
21
21
11
nns
xxtcalc
*
* UN PROMEDIO PONDERADO
CON
21
2
22
2
112
ff
sfsfs
21 xx NO
Y QUE ES UN PROMEDIO “PONDERADO”?
A CADA NUMERO xi EN EL CONJUNTO (x1, x2, x3, …., xn)
SE LE ASIGNA UN FACTOR DE PONDERACION wi
EL PROMEDIO PONDERADO SE DEFINE COMO
NOTESE QUE SI TODOS LOS FACTORES DE PONDERACION FUERAN
IGUALES EL PROMEDIO PONDERADO SE REDUCE AL PROMEDIO COMUN
60
n
i
i
n
i
ii
w
w
xw
x
1
1
16
CASO II:
s1 Y s2 SON SIGNIFICATIVAMENTE DIFERENTES
H0: LOS DOS METODOS NO PRODUCEN RESULTADOS DIFERENTES
PRUEBA ESTADISTICA:
61
2
2
2
1
2
1
21
n
s
n
s
xxtcalc
2
11 2
2
2
2
2
1
2
1
2
1
2
2
2
2
1
2
1
n
n
s
n
n
s
n
s
n
s
f
REDONDEADO AL
ENTERO MAS
CERCANO
COMPARACION DE DOS MEDIAS
21 xx NO
CON
CUANDO SE USE LA PRUEBA t...
s1 = s2
?
62
SI
NO
21 fff
CASO I
CASO II
USE LA PRUEBA F PARA RESOLVER
ESTE CONDICIONAL
2
2
2
1
2
1
21
n
s
n
s
xxtcalc
2
11 2
2
2
2
2
1
2
1
2
1
2
2
2
2
1
2
1
n
n
s
n
n
s
n
s
n
s
f
21
21
11
nns
xxtcalc
21
2
22
2
112
ff
sfsfs
21
21
21
nn
svss
xx
EJEMPLO (CASO I)
COMPARACION DE DOS METODOS PARA LA DETERMINACION DE BORO EN MATERIAL VEGETAL
63
PRUEBAS DE SIGNIFICACION
Resultados obtenidos (ppm) media desv std n
MET. ESPECTROFOTOMETRICO 28.00 0.30 10
MET. FLUORIMETRICO 26.25 0.23 8
SON LOS RESULTADOS DE ESTOS DOS METODOS SIGNIFICATIVAMENTE
DIFERENTES? (Analyst 1983, 108, 368)
64
Subindices: E: Espectrofotométrico F: Fluorimétrico
91101nf
10n
ppm30.0s
ppm00.28x
EE
E
E
E
7181nf
8n
ppm23.0s
ppm65.26x
FF
F
F
F
CASO I : sE NO sF
FE0 xNOx:H FE1 xx:H
FE
FE
calc
n
1
n
1s
xxt
FE
2
FF
2
EE2
ff
sfsfs
17
65
271604.079
23.0730.09s
22
58.13
8
1
10
12716.0
25.2600.28
n
1
n
1s
xxt
FE
FE
calc
1679fff FE
tcrit (16 GdL, 95%) = 2.12
tcrit (16 GdL, 99%) = 2.92
tcalc (13.58) > tcrit (2.12) ? SI (aun por encima del 99%)
66
DECISION: Se rechaza H0 FE xNOx
Se retiene H1 FE xx
CONCLUSION: SI, LOS RESULTADOS DE ESTOS
DOS METODOS SON SIGNIFICATIVAMENTE
DIFERENTES
PRUEBAS DE SIGNIFICACION
EJEMPLO (CASO II)
LA SIGUIENTE TABLA PROPORCIONA LA CONCENTRACION DE TIOL EN
SANGRE DE DOS GRUPOS DE VOLUNTARIOS. EL PRIMER GRUPO ES
“NORMAL” Y EL SEGUNDO SUFRE DE ARTRITIS REUMATOIDE. (Analyst,
1983, 107,195)
Concentración de tiol (mM)
67
Normal Reumatoide
1.84 2.81
1.92 4.06
1.94 3.62
1.92 3.27
1.85 3.27
1.91 3.76
2.07
ES LA CONCENTRACION DE
TIOL EN LA SANGRE DE LOS
ENFERMOS DE ARTRITIS
REUMATOIDE DIFERENTE DE
AQUELLA DE LOS
INDIVIDUOS “NORMALES”?
68
Subindices: N: Normal R: Reumatoide
7n
mM07559.0s
mM9214.1x
N
N
N
CASO II : sN sR
6n
mM4404.0s
mM465.3x
R
R
R
RN0 xNOx:H RN1 xx:H
47.8
6
440.0
7
0755.0
645.3921.1
n
s
n
s
xxt
22
R
2
R
N
2
N
RN
calc
18
69
52
16
6
440.0
17
7
0755.0
6
440.0
7
0755.0
2
1n
n
s
1n
n
s
n
s
n
s
f2
22
2
222
R
2
R
2
R
N
2
N
2
N
2
R
2
R
N
2
N
tcrit (5 GdL, 95%) = 2.57 tcrit (5 GdL, 99%) = 4.06
tcalc (8.47) > tcrit (2.57) ? SI (aun por encima del 99%)
DECISION: Se rechaza H0 RN xNOx
Se retiene H1 RN xx
CONCLUSION: SI, LA CONCENTRACION DE TIOL EN LA SANGRE
DE LOS ENFERMOS DE ARTRITIS REUMATOIDE ES DIFERENTE DE
AQUELLA DE LOS INDIVIDUOS “NORMALES”
LA PRUEBA t POR PAREJAS
CIRCUNSTANCIAS EN LAS CUALES ES NECESARIO O DESEABLE HACER UNA COMPARACION DE MEDIAS POR PAREJAS:
CANTIDAD LIMITADA DE UNA O MAS MUESTRAS (SOLO HAY MUESTRA
SUFICIENTE PARA UNA DETERMINACION POR CADA METODO)
MUESTRAS DE ORIGENES DIFERENTES Y POSIBLEMENTE CON
CONCENTRACIONES DIFERENTES*
MUESTRAS QUE SE RECIBEN EN UN PERIODO DE TIEMPO LARGO (SE
HACE NECESARIO ELIMINAR EFECTOS DE CONDICIONES AMBIENTALES
VARIABLES COMO TEMPERATURA, PRESION, ETC.)
ASUNCION: CUALQUIER ERROR (SISTEMATICO O AL AZAR) ES INDEPENDIENTE DE LA CONCENTRACION
* EN CASO DE DIFERENCIAS DE CONCENTRACION MUY AMPLIAS ES MEJOR USAR ANALISIS DE
REGRESION (VER LUEGO)
70
EJEMPLO DE PRUEBA t POR PAREJAS
LA SIGUIENTE TABLA PROPORCIONA LA CONCENTRACION
DE PLOMO (g/mL) POR DOS METODOS DIFERENTES PARA 4
MUESTRAS:
71
LOS DOS METODOS PROPORCIONAN VALORES PARA LAS
CONCENTRACIONES MEDIAS DE PLOMO QUE DIFIEREN
SIGNIFICATIVAMENTE?
MUESTRA
EXTRACCION
OXIDATIVA
EXTRACCION
DIRECTA
1 71 76
2 61 68
3 50 48
4 60 57
DIF
-5
-7
+2
+3
72
0NOx:H DIF0
0x:H DIF0
70.0991.4
475.1
s
nx
s
n0xt
DIF
DIFDIF
DIF
DIFDIF
calc
3141nf
4n
991.4s
75.1x
DIFE
DIF
DIF
DIF
tcrit (3 GdL, 95%) = 3.18
DECISION: Se retiene H0 0NOxDIF
tcalc (0.70) > tcrit (3.18) ? NO
No, los dos métodos no proporcionan valores para las
concentraciones medias de plomo que difieren significativamente
19
PRUEBA FPARA LA COMPARACION DE DESVIACIONES STANDARD
UTIL PARA COMPARAR LA PRECISION DE DIFERENTES METODOS
LA PRUEBA F CONSIDERA EL COCIENTE DE LAS DOS VARIANZAS MUESTRALES*
(SIEMPRE, VARIANZA MAYOR / VARIANZA MENOR):
73
2
2
2
1
s
sFcalc
* SE ASUME QUE LAS POBLACIONES DE DONDE
SE TOMAN LAS MUESTRAS SON NORMALES
21 ss
PRUEBA FPARA LA COMPARACION DE DESVIACIONES STANDARD
74
H0 : LAS DESVIACIONES ESTANDAR DE LAS
POBLACIONES NO SON DIFERENTES
(ES DECIR, EL COCIENTE DE VARIANZAS NO DIFIERE
SIGNIFICATIVAMENTE DE LA UNIDAD)
EVALUACION:
RECHAZAR LA HIPOTESIS NULA SI Fcalc > Fcrit
21 ss NO
PRUEBA F* 2 FORMAS 2 *
PRUEBA DE UNA COLA (UNILATERAL):
PRUEBA SI UN METODO A ES MAS PRECISO QUE
UN METODO B
OJO: UNO ESTA INTERESADO EN DETECTAR LA DIFERENCIA
EN UNA SOLA DIRECCION
PRUEBA DE DOS COLAS (BILATERAL):
PRUEBA SI LOS METODOS A Y B DIFIEREN EN SU
PRECISION
OJO: UNO ESTA INTERESADO EN DETECTAR CUALQUIER
DIFERENCIA EN CUALQUIER DIRECCION
75 76
20
PRUEBA F - EJEMPLOS
UNA COLA:
SE COMPARO UN METODO PROPUESTO PARA LA DETERMINACION DE DE LA
DEMANDA DE OXIGENO EN AGUAS RESIDUALES CON UN METODO
STANDARD. SE OBTUVIERON LOS SIGUIENTES RESULTADOS (ppm) EN UNA
MUESTRA:
77
METODO media desv std n
STANDARD 72 3.31 9
PROPUESTO 72 1.51 8
ES EL METODO PROPUESTO MAS PRECISO QUE EL METODO
ESTANDAR?
78
Subindices: S: Standard P: Propuesto
8191nf
9n
ppm31.3s
SS
S
S
7181nf
8n
ppm51.1s
FP
P
P
SP0 sNOs:H
SP1 ss:H
2
P
2
Scalc
s
sF
8 GdL
7 GdL
81.451.1
31.32
2
79
Fcrit (8/7, 95%) = 3.73
Fcalc (4.81) > Fcrit (3.73) ? SI
DECISION: Se rechaza H0 SP sNOs
CONCLUSION: EL METODO PROPUESTO ES MAS PRECISO QUE
EL METODO ESTANDAR
Se retiene H1 SP ss
PRUEBA F - EJEMPLOS
DOS COLAS:
DATOS ANTERIORES DE BORO EN MATERIAL VEGETAL
80
METODO media desv std n
ESPECTROFOTOMETRICO 28.00 0.30 10
FLUORIMETRICO 26.25 0.23 8
CHEQUEAR LA ASUNCION DE QUE LAS DOS VARIANZAS NO
DIFIEREN SIGNIFICATIVAMENTE
21
81
Subindices: E: Espectrofotométrico F: Fluorimétrico
91101nf
10n
ppm30.0s
EE
E
E
7181nf
8n
ppm23.0s
FF
F
F
CASO I : sE NO sF
FE0 sNOs:H FE1 ss:H
70.123.0
30.0
s
sF
2
2
2
F
2
Ecalc
VERIFICAR QUE ESTO ES CIERTO
82
Fcrit (9/7, 95%) = 4.82
Fcalc (1.70) > Fcrit (4.82) ? NO
DECISION: Se retiene H0 FE sNOs
CONCLUSION: SE CONFIRMA LA ASUNCION DE QUE LAS DOS
VARIANZAS NO DIFIEREN SIGNIFICATIVAMENTE
EXISTE UNA PEQUEÑA PROBABILIDAD DE
QUE HAYAMOS TOMADO UNA MALA DECISION(DOS POSIBLES ERRORES EN PRUEBAS DE SIGNIFICACION)
83
DECISION
______________________________
RECHACE LA NO RECHACE LA
HIPOTESIS NULA Y HIPOTESIS NULA Y
CONCLUYA QUE NO CONCLUYA QUE
EL RESULTADO ES EL RESULTADO ES
REALIDAD INEXACTO INEXACTO
______________________________________________
HIPOTESIS NULA SE TOMO LA ERROR DEL
ES FALSA; ES DECIR, DECISION CORRECTA TIPO II
EL RESULTADO ES
INEXACTO
HIPOTESIS NULA ERROR DEL SE TOMO LA
ES CIERTA; ES DECIR, TIPO I DECISION CORRECTA
EL RESULTADO NO
ES INEXACTO
EJERCICIO DE TALLER
Una de sus amigas se ha metido en el negocio de fabricar vinos.
En una fiesta de catadores de vino ella le dijo a usted que estaba
segura que un cierto restaurante estaba etiquetando el vino de ella
como si fuera importado y que estaba cobrando precios
exhorbitantes. Usted le respondió que estaba tomando el curso de
Estadística en Univalle y que si ella le proporcionaba unas cuantas
botellas, usted podría determinar si los dos vinos eran el mismo.
(Durante una de esas fiestas, uno dice casi cualquier cosa).
Cual es su conclusión, con base en los siguientes resultados de
contenido (%v/v) de alcohol?
•Vino de su amiga: 12.50, 12.34, 12.38, 12.33, 12.28, 12.41
•Vino del restaurante: 12.49, 12.62, 12.69, 12.64
84
22
EJERCICIO DE TALLER
85
Cuando se hacen mediciones por replicado, a veces un resultado parece
diferir sustancialmente de los demás. Una prueba de significación
llamada “prueba-Q” o “prueba de Dixon” puede utilizarse para chequear
si el valor “sospechoso” puede descartarse antes de calcular la media y la
desviación estándar. Para aplicar esta prueba, se calcula un cociente de
rechazo Q, definido como
resultado sospechoso - resultado más próximo
rango de resultados
y se ve si excede el valor crítico apropiado en la tabla estadística de
cocientes, que aparece en la página siguiente.
Si Qcalc. > Qcrit. , el resultado sospechoso puede descartarse.
Aplicar la prueba-Q a los siguientes datos del contenido de estronsio
(g/mL) en una muestra, para ver si el valor sospechoso puede o no
descartarse: 1.15, 1.02. 1.10, y 1.88.
Q