Aplicaciones de la T de Student
Distribución t- de -Student
2
Antecedentes
• Propuesta por William Sealy Gosset (1908)
• Se emplea cuando se trabaja con muestras pequeñas
• Se utiliza para estimar el valor esperado de una distribución normal de población
Distribución t- de -Student
3
¿ Cuándo se utiliza?• Para muestras pequeñas
• Para estimar el valor esperado de una distribución normal de población
• Estimación de la media cuando se desconoce la varianza
• Comparación entre dos poblaciones
• Contraste de hipótesis
Distribución t- de -Student
4
¿Cuál es la distribución exacta del
estadístico ?s
X
conocida la de insesgadoestimador un es
den distribucó la de media la es
X
X
Distribución t- de -Student
5
Supuestos de la inferencia para la media
• Los datos son una muestra (n) aleatoria
• Población con distribución normal N(μ,σ)
Distribución t- de -Student
6
Características de Ẋ• La media muestral tiene una distribución
normal con media μ y desviación típica
• σ se estima a partir de la desviación típica muestral s
• La desviación típica de Ẋ se estima por
n
ns
Error típico de la muestra
Distribución t- de -Student
7
Error típico de la muestra
• Es la estimación de la desviación típica del estadístico a partir de los datos
• El error típico de la media muestral Ẋ es:
ns
Distribución t- de -Student
8
Propiedades
• La distribución t–Student es diferente para los distintos tamaños de la muestra
• Es generalmente en forma de campana
• Para n≥30 se comporta como la normal
• La media es cero
• La distribución es simétrica en torno a la media
Distribución t- de -Student
9
Propiedades
• La varianza es igual a uno cuando t→∞
• La población es esencialmente normal
• Es una distribución continua
• Par n=1 no existe media (Distribución de Cauchy)
• Para n=2,3,... μ=0
• Para n=1 y 2 la distribución t no tiene varianza
Distribución t- de -Student
10
• Varianza para n=2,3...
22
nn
Distribución t- de -Student
11
Grados de libertad
• Número de valores que se pueden variar después de imponer ciertas restricciones
• Número de valores que se pueden escoger libremente al calcular un estadístico
• Libertad de movimiento
Distribución t- de -Student
12
Grados de libertad
Distribución t- de -Student
13
10 yx
Num. Variables=2Num. Restricciones=1
Grados de libertad =r= Num. Variables- Num. de restriccionesGrados de libertad=r=2-1r=1
Distribución t- de -Student
14
10 yx
x
y
-30 -25 -20 -15 -10 -5 0 5 10 15 20 25 30
-15
-10
-5
0
5
10
15
Distribución t- de -Student
15
x
y
-14 -12 -10 -8 -6 -4 -2 0 2 4 6 8 10 12 14
-10
-5
0
5
10
(1)
(2)
3
42
yx
yx
Distribución t- de -Student
16
x
y
-3 -2 -1 0 1 2 3
-2
0
2
(1)
(2)
(2) 12
(1) 124
2
xxy
xy
Distribución t- de -Student
17
cX i
n
i
1r=N-1
n
i
i
n
XX
1
Distribución t- de -Student
18
Distribución t- de -Student
19
DefiniciónSe Z una variable aleatoria con N(0,1) y si U es una variable aleatoria que se distribuye en forma χ2(r), con la condición de que Z y U sean independientes.
Por lo tanto:
Se tiene una distribución T con rr grados de libertad
ns
X
rU
ZT
población la deestándar desviación la deestimador el es y
muestra la de media la es y lpoblaciona media la es donde
s
X
ns
X
rUZT
Distribución t- de -Student
20
DefiniciónEstimador de la desviación estándar de la población:
n
ii Xx
ns
1
22
1
1
normalón distribuci laen
a transformseón distribuci la ,y Si z ts
Es un estimador insesgado de μX
Distribución t- de -Student
21
DefiniciónComo N aumenta, entonces la distribución t se aproxima cada vez más a la distribución normal
Distribución t- de -Student
22
DefiniciónEntonces la distribución t se puede obtener mediante la transformación:
sX
Z
y t se define entonces como:
1 nzt
Distribución t- de -Student
23
DefiniciónFunción de densidad de probabilidad:
2
12
12
21
)(
r
rtrr
r
tf
Distribución t- de -Student
24
r=25r=5r=1
Distribución t- de -Student
25
DefiniciónDistribución acumulativa de probabilidad:
rt
rrt
itB
tF
trtr
rIrItF
21
2
121
121
,21
;2
21
)(
sgn21
,21
,21
,21
;121
21
)(
2
2
daregulariza BetaFunción
,,;
,;*
BetaFunción ,*
GammaFunción *
*
1*
baBbazB
baZI
baB
z
t
nr
Distribución t- de -Student
26
r=1r=25 r=5
Distribución t- de -Student
27
Pruebas de significación: hipótesis“Pruebas de una cola o de dos colas”
• H0 regularmente afirma la ausencia de efectos
• Ha establece que un determinado parámetro difiere del valor que le otorga la hipótesis nula en una dirección concreta
Distribución t- de -Student
28
Estadístico de contraste
• P este valor es la probabilidad calculada suponiendo que H0 sea cierta, de que el estadístico de contraste tome un valor al menos tan extremo como el valor observado
• Valores P pequeños indican la existencia de una fuerte evidencia en contra de H0
• Si el valor P es pequeño, o más pequeños que un valor concreto α, los datos son estadísticamente significativos a un nivel de significación α.
Distribución t- de -Student
29
¿cuánto debe ser el valor de P?
• Nivel de significación más utilizado : 5% (α=.05)
Distribución t- de -Student
30
Errores tipo I y tipo II
• Tipo I: Se presenta cuando se rechaza H0 cuando en realidad es cierta.
• Tipo II: Se da cuando no se rechaza H0 cuando en realidad Ha es cierta
Distribución t- de -Student
31
Escenarios posibles :
Error tipo I Decisión correcta
Decisión correcta
Error tipo II
H0 es cierta Ha es cierta
Certeza sobre la población
Decisión basada
en la muestra
Rechazo H0
Aceptación H0
No rechazo h0
Distribución t- de -Student
32
Ejemplo 1
Refrescos light: los fabricantes de refrescos prueban nuevas fórmulas para evitar la pérdida de dulzor de los refrescos light durante el almacenamiento. Uno de los catadores experimentados evalúan el dulzor de los refrescos antes y después del almacenamiento. He aquí las pérdidas de dulzor ( dulzor antes del almacenamiento menos dulzor después del almacenamiento) hallados por 10 catadores para una nueva fórmula del refresco.
Distribución t- de -Student
33
Datosx Antes-
después
X1 2.0
X2 0.4
X3 0.7
X4 2.0
X5 -0.4
x6 2.2
X7 -1.3
X8 1.2
X9 1.1
x10 2.3
¿Estos datos constituyen una buena evidencia de que el refresco perdió dulzura durante el almacenamiento?
Distribución t- de -Student
34
• Paso 1: Hipótesis Existen diferencias sobre la percepción de la pérdida de dulzura por parte de los catadores
Hipótesis: Pérdida media de dulzor μ
H0: μ=0
Ha: μ>0
Distribución t- de -Student
35
• Paso 2: Estadístico de contraste:
10
3.21.12.13.13.24.00.27.04.00.21
n
i
i
n
XX
02.1X
n
ii Xx
ns
1
22
1
1
1961.14306.1 s
ns
Xt 0
6967.2101961.1
002.1 t
Distribución t- de -Student
36
2XX i iX
2 0.96040.4 0.38440.7 0.1024
2 0.9604-0.4 2.01642.2 1.3924
-1.3 5.38241.2 0.03241.1 0.00642.3 1.6384
Ẋ= 1.02 S2= 1.43066667S= 1.19610479
Distribución t- de -Student
37
2.69672.2622 2.814
• Paso 3: Valor P: t=2.6967 (Tabla)
Distribución t- de -Student
38
2 2.05 2.1 2.15 2.2 2.25 2.3 2.35 2.4 2.45 2.5 2.55 2.6 2.65 2.7 2.75 2.8 2.85 2.9 2.95 3
0.005
0.01
0.015
0.02
0.025
0.03
t=2.69672.2622 2.8214
(t1,p1)
(t2,p2)
(t, p)
T
P
¿p?
Distribución t- de -Student
39
t=2.6967p=?
En tablas
t1=2.2622 p1=.025t2=2.8214 p2=.01
1
21
21
1xx
xxyy
yy
1
21
21
1tt
ttpp
pp
01334.02622.26967.2
8214.22622.2
01.025.025.
p
Distribución t- de -Student
40
Conclusión del cambio de dulzor
• Como P=0.01334 ,existe evidencia bastante fuerte a favor de que se produce una pérdida de dulzor.
Distribución t- de -Student
41
Ejemplo 2• La tasa actual de producir fusibles de 5 amp en
DFEletric, es 250 por hora. Se compro e instaló una máquina nueva que según el proveedor aumentará la tasa de producción. Una nuestra de 10 horas seleccionadas al azar el mes pasado indica que la producción media por hora en la nueva máquina es 256, con desviación estándar muestral de 6 por hora. Con 0.05 de nivel de significancia. ¿Puede DFElectric concluir que la nueva máquina es más rápida?
Distribución t- de -Student
42
solución
• Paso 1:
H0:μ≤250
Ha:μ≥250
• Paso 2: H0 se rechaza si t>1.833
Distribución t- de -Student
43
Solución
16.3
106
250256
6
256
250
ns
Xt
s
X
• Paso 3:
Distribución t- de -Student
44
H0 se rechaza y por lo tanto la nueva máquina es más rápida
Distribución t- de -Student
45
Ejemplo 3: Comparación de dos media poblacionales
• Un estudio EPA reciente compara la economía de combustible en carretera de los automóviles nacionales e importados. Una nuestra de 15 autos nacionales reveló una media de 33.7 mpg con desviación estándar de 2.4 mpg. Una muestra de 12 autos importados indicó una media de 35.7 mpg con desviación estándar de 3.9 mpg.
Distribución t- de -Student
46
• Para un nivel de significancia de 0.05, ¿puede EPA concluir que el consumo de las mpg para los autos importados es mayor?
• Paso1:
H0:μ2≤μ1
Ha:μ2>μ1
Distribución t- de -Student
47
• Paso 2: H0 se rechaza si t<-1.708
• Paso 3:
21
2
21
11nn
s
XXt
p
2
11
21
222
2112
nn
snsnsp
Distribución t- de -Student
48
918.9
25
95.247
25
31.16764.80
25
9.3114.214
21215
9.31124.2115
2
11
2
222
22
21
222
2112
p
p
p
s
s
nn
snsns
8037.12197.1
2.24877.1
2.2
203
918.9
2.2
121
151
918.9
7.357.33
11
21
2
21
t
nns
XXt
p
Distribución t- de -Student
49
• Paso 4: H0 se rechaza. Entonces el consumo de mpg en los autos importados es más alto.
Distribución t- de -Student
50
Ejemplo 4: Pruebas de hipótesis con observaciones por pares
• Una empresa de pruebas independientes estadísticas compara el precio diario de renta de un auto compacto en Eclipse Rent y Avis. Se obtiene una muestra aleatoria de 8 ciudades con la información dada. Con 0.05 de nivel de significancia, ¿puede la empresa concluir que existe una diferencia en los costos de la renta?
Distribución t- de -Student
51
Ciudad Eclipse Rent ($) Avis ($)
Acapulco
Los Cabos
420
560
400
520
D.F.
Cancún
450
480
430
480
Guadalajara
Monterrey
370
450
320
480
Puebla 410 390
Tijuana 460 500
Distribución t- de -Student
52
Solución:
Paso 1: H0:μd=0H1:μd≠0
Paso 2: H0 se rechaza si: t<-2.365 y t>2.365
Distribución t- de -Student
53
• Paso 3: Cálculo del estadístico t mediante la expresión:
as)(diferenci pares de número el Es
sdiferencia las deestándar Desviación
sdiferencia las de Promedio
n
s
d
ns
dt
d
d
Distribución t- de -Student
54
Ciudad Eclipse Rent ($)
Avis ($) Diferencias
($)
Acapulco
Los Cabos
420
560
400
520
20
40
D.F.
Cancún
450
480
430
480
20
0
Guadalajara
Monterrey
370
450
320
480
50
-30
Puebla 410 390 20
Tijuana 460 500 -40
Distribución t- de -Student
55
Ciudad Eclipse Rent ($)Avis ($) Diferencias ($) (di-d)2
Acapulco 420 400 20 20 100Los Cabos 560 520 40 40 900D.F. 450 430 20 20 100Cancún 480 480 0 0 100Guadalajara 370 320 50 50 1600Monterrey 450 480 -30 -30 1600Puebla 410 390 20 20 100Tijuana 460 500 -40 -40 2500
μ= 10 ∑ 7000s= 31.6227766
Distribución t- de -Student
56
8944.01803.1110
86227.3110
ns
dt
d
6227.3110007
7000
700018
1
11
10
1
2
d
d
n
iid
s
s
ddn
s
d
Distribución t- de -Student
57
• Paso 4: H0 no se rechaza. No existe diferencia en los costos.
Distribución t- de -Student
58
Distribución t- de -Student
59
Distribución t- de -Student
60
Referencias[1] Meyer PL. Probabilidad y aplicaciones estadísticas: Addison-Wesley Iberoamericana 1986.[2] Montgomery DC. Probabilidad y estadística aplicadas a la ingeniería. México: MzGraw-Hill Interamericana Editores 1996.[3] More DS. Estadística aplicada básica. 2 ed. España: Antoni Bosch editor 2004.[4] Technology M. WolframMathWorld. Student's t-Distribution 2009 [ciado Mayo 15 2009]; Disponoble en: http://mathworld.wolfram.com/Studentst-Distribution.html[5] University A. Statistical Probabilities and Distributions 2009 [citado Mayo 15 2009]; Disponible en: http://www.andrews.edu/~calkins/math/webtexts/prod12.htm[6] Whitmore GA. Problemas de estadística Método autododáctico. México: Compañía Editorial Continental S.A. 1970.[7] Walpole Ronad E., Myers Raymond H. Probabilidad y Estadística. México: McGraw-Hill. Junio 2005.
Top Related