Post on 11-Jul-2015
5/11/2018 Equipo 10 Estadistica - slidepdf.com
http://slidepdf.com/reader/full/equipo-10-estadistica 1/16
INSTITUTO TECNOLÓGICO DE REYNOSA
SOFTWARE ESTADÍSTICOEQUIPO NO. 10
DOCENTE: ING. ANA MARITZA RAMÍREZ GOVEA.
MATERIA: ESTADÍSTICA INFERENCIAL ITURNO: MATUTINO.
CARRERA: INGENIERÍA INDUSTRIAL. 3° SEMESTRE
INTEGRANTES DEL EQUIPO:
GARCÍA SÁNCHEZ MARIO ALBERTO LOMBARD MONTERO WENDY MARICRUZ RODRÍGUEZ OLVERA KARLA ABIGAIL TORRES DE LA ROSA SANDRA NOHEMÍ ZERMEÑO GONZÁLEZ KARLA YESENIA
A: 28.NOV.2011
CD. REYNOSA, TAMPS.
5/11/2018 Equipo 10 Estadistica - slidepdf.com
http://slidepdf.com/reader/full/equipo-10-estadistica 2/16
2
PRUEBAS NO PARAMÉTRICAS
Se estudiarán las pruebas NO PARAMÉTRICAS, las cuales no requieren asumir
normalidad de la población y que en su mayoría se basan en el ordenamiento de los
datos.
Todas las pruebas vistas en este capítulo requieren que la población sea continua. El
parámetro que se usa para hacer las pruebas estadísticas es la Mediana y no la Media.
En MINITAB, para las pruebas no paramétricas se elige la secuencia:
→ Abrir programa.
→ Estadísticas. → No Paramétricos.
5/11/2018 Equipo 10 Estadistica - slidepdf.com
http://slidepdf.com/reader/full/equipo-10-estadistica 3/16
3
6. PRUEBA DE KOLMOGOROV-SMIRNOV (KS)
En estadística, la prueba de Kolmogórov-Smirnov (también prueba K-S) es una prueba no
paramétrica que se utiliza para determinar la bondad de ajuste de dos distribuciones de
probabilidad entre sí.Conviene tener en cuenta que la prueba Kolmogórov-Smirnov es más sensible a los valores
cercanos a la mediana que a los extremos de la distribución. La prueba de Anderson-
Darling proporciona igual sensibilidad con valores extremos.
En esta prueba también se está interesado en el grado de concordancia entre la distribución de
frecuencia muestral y la distribución de frecuencia teórica, bajo la hipótesis nula de que la
distribución de la muestra es f0(x,q) e interesa probar que no existe diferencia significativa. La
prueba trabaja con la función de distribución (distribución de frecuencia acumulativa). Esta
prueba pertenece al campo de la Estadística No Paramétrica.
Sea F0(x) la función de distribución teórica para la variable aleatoria X, y representa la
probabilidad de que la variable aleatoria X tome un valor menor o igual a x (también se
interpreta como la proporción esperada de observaciones que tengan un valor menor o igual a
x). Es decir:
Sea Sn (x) la función de distribución empírica, calculada con base en los valores observados de
la muestra n observaciones. Sn (x) representa la proporción de valores observados que son
menores o iguales a x, y está definida como:
Sn (x) = P ( X £ x/ dados los resultados muestrales) = m/n
donde m es el número de valores observados que son menores o iguales a x.
5/11/2018 Equipo 10 Estadistica - slidepdf.com
http://slidepdf.com/reader/full/equipo-10-estadistica 4/16
4
PASOS A SEGUIR EN MINITAB:
1.-Generaremos 100 datos aleatorios con una Media= 264.6 y una Desviación Estándar de32.02, de la siguiente manera:
→ Calc
→ Datos Aleatorios
→ Normal
→ Damos doble clic.
→ Rellenamos la pantalla con los datos que nosproporcionaron en el problema, como se observaen la imagen, y damos un clic más en aceptar.
→ Aparecerán 100 datos en la columna C1
[Distribución Normal].
Nos aseguramos que los datos se distribuyan normalmente con la prueba de Kolmogorov-Smirnov como sigue.
→ Estadísticas
→ Estadísticas Básicas
→ Prueba de Normalidad
→ Rellenamos los datos que nos piden: envariable seleccionamos C1 y ahí en dondedice prueba de normalidad seleccionamosKolmogorov-Smirnov.
→ Presionamos Aceptar.
5/11/2018 Equipo 10 Estadistica - slidepdf.com
http://slidepdf.com/reader/full/equipo-10-estadistica 5/16
5
→ De ahí les aparecerá el grafico donde se observa la distribución de los datos.
El VALOR P > 0.05 para que losdatos se distribuyan
normalmente.Y como se puede observar en elgrafico el Valor P > 0.100, lo quenos indica que los datos si sedistribuyen normalmente y por lotanto Aceptamos H₀ yrechazamos H₁.
5/11/2018 Equipo 10 Estadistica - slidepdf.com
http://slidepdf.com/reader/full/equipo-10-estadistica 6/16
6
PRUEBA DE ANDERSON-DARLIN
La prueba Anderson-Darling es, en general, más potente que la pruebas X2 de Pearson y la deKolmogorov-Smirnov . Resulta lógico pensar que la X2 de Pearson es menos potente que la de
Kolmogorov-Smirnov y la de Anderson- Darling debido a que trabaja con datos agrupadosdebido al agrupamiento. Hay pérdida de información. Por otro lado, la prueba Kolmogorov-Smirnov es menos sensible a desajustes que pudieran haber en las colas de la distribución,que la prueba Anderson- Darling (Easterling 1976; Stephens 1974, Cap 4). En particular, laprueba Anderson- Darling funciona mejor que cualquiera otra, cuando haya casosextraordinarios o aberrantes (outliers).
La estadística Anderson-Darling está dada por la siguiente expresión:
A2 =-n- (1/n)Σ [(2i - 1) Ln(P ( i ) ) + (2n +1 - 2i)Ln{1 - p ( i ) }]
Donde P (i) es el área bajo la curva normal para el intervalo (-oo,z( i )), o sea es la función
distribución normal estándar evaluada en el i-ésimo elemento (en orden ascendente) de lamuestra.
Se presentan dos situaciones para la estadística Anderson-Darling: la primera en que seconocen los parámetros de la distribución llamado caso 0 (cero), y la otra en que se desconoceal menos uno de ellos (casos 1, 2 y 3).
Situándonos en el caso de bondad de ajuste a la distribución normal se consideran lossiguientes casos:
Caso 0: µ y s 2 conocidos.Caso 1: s 2 conocida y µ desconocida y estimada por X .
Caso 2: µ conocida y s
2
desconocida y estimada por s (n) = Σ (x i - µ)
2
/nCaso 3: ambos desconocidos, estimados por X y s n-1 = Σ (x i - x )2 /n-1
Para cada uno de los casos existe una tabla estadística para realizar la prueba de lahipótesis, Ho: "La muestra aleatoria proviene de una distribución normal". La estadística deAnderson-Darling se calcula para los cuatro casos de la misma manera; sin embargo, en elcaso 3 se debe multiplicar por un factor de corrección el cual es: 1 + (0.75/n) + (2.25/n2 ), quemejora la aproximación.La prueba Anderson-Darling para la bondad de ajuste normal, en el caso 0, se realiza siguiendolos siguientes pasos:
5/11/2018 Equipo 10 Estadistica - slidepdf.com
http://slidepdf.com/reader/full/equipo-10-estadistica 7/16
7
Supongamos que tenemos 40 pesos en libras de estudiantes varones.
¿Provienen estos datos d una distribución normal?
154 135 126 138 132 135 125 135136 128 138 147 140 152 142 144
144 145 145 176 156 157 158 161163 164 165 168 173 146 146 140147 148 149 150 150 142 119 153
Ho: Los datos se ajustan a un modelo normal.Ha: Los datos no se ajustan a un modelo normal.
PASOS A SEGUIR EN MINITAB:
→ Introducimos los 40 datos de los pesos en C1 .
→ Estadísticas.
→ Estadísticas Básicas.
→ Mostrar Estadísticas descriptivas.
→ Aparecen estadísticas.
→ Estadísticas Básicas.
→ Prueba de Normalidad.
5/11/2018 Equipo 10 Estadistica - slidepdf.com
http://slidepdf.com/reader/full/equipo-10-estadistica 8/16
8
→ Rellenamos datos y seleccionamos la prueba
de Anderson-Darling.
→ De ahí nos aparece el gráfico.
El VALOR P > 0.05 para que los datos se distribuyan normalmente.
Y como se puede observar en el grafico el Valor P = 0.926, lo que nos indica que los datos si
se distribuyen normalmente y por lo tanto Aceptamos H₀ y rechazamos H₁.
5/11/2018 Equipo 10 Estadistica - slidepdf.com
http://slidepdf.com/reader/full/equipo-10-estadistica 9/16
9
PRUEBA DE RYAN-JOINER
La prueba de Ryan - Joiner es usada para probar si una muestra viene de una distribución
especifica. Esta prueba es una modificación de la prueba de Kolmogorov-Smirnov donde se le
da más peso a las colas de la distribución que la prueba de Kolmogorov-Smirnov .
En estadística, la prueba de Ryan - Joiner es una prueba no paramétrica sobre si los datos de
una muestra provienen de una distribución específica. La fórmula para el estadístico determina
si los datos (observar que los datos se deben ordenar) vienen de una distribución con función
acumulativa F.
Formulas:
A2 = − N − S
Donde:
Elestadístico de la prueba se puede entonces comparar contra las distribuciones del estadísticode prueba (dependiendo que F se utiliza) para determinar el P-valor.
5/11/2018 Equipo 10 Estadistica - slidepdf.com
http://slidepdf.com/reader/full/equipo-10-estadistica 10/16
10
Ejemplo:
En el método de Anderson Darling o Ryan Joiner, si el valor de probabilidad P de la prueba es
mayor a 0.05, se considera que los datos son normales. Seguir los siguientes pasos:
H₀= Los datos tienen una distribución normal
H₁= Los datos NO tienen una distribución normal
PASOS A SEGUIR EN MINITAB:
1.-Generaremos 100 datos aleatorios con una Media= 264.6 y una Desviación Estándar de
32.02, de la siguiente manera:
→ Calc.
→ Datos Aleatorios
→ Normal
→ Damos doble clic.
→ Rellenamos la pantalla con los datos que nos
proporcionaron en el problema, como se observa
en la imagen, y damos un clic más en aceptar.
5/11/2018 Equipo 10 Estadistica - slidepdf.com
http://slidepdf.com/reader/full/equipo-10-estadistica 11/16
11
→ Aparecerán 100 datos en la columna C1
[Distribución Normal].
Nos aseguramos que los datos se distribuyan normalmente con la prueba de
Ryan-Joiner como sigue.
→ Estadísticas
→ Estadísticas Básicas
→ Prueba de Normalidad
→ Rellenamos los datos que nos
piden: en variable seleccionamos C1
y ahí en donde dice prueba de
normalidad seleccionamos
Ryan-Joiner.
→ Presionamos Aceptar.
→ De ahí les aparecerá el grafico donde se observa la distribución de los datos.
5/11/2018 Equipo 10 Estadistica - slidepdf.com
http://slidepdf.com/reader/full/equipo-10-estadistica 12/16
12
Como el de la siguiente imagen:
El VALOR P > 0.05 para que los datos se distribuyan normalmente.
Y como se puede observar en el grafico el Valor P > 0.100, lo que nos indica que los datos sise distribuyen normalmente y por lo tanto Aceptamos H₀ y rechazamos H₁.
Otra opción por medio de una gráfica de probabilidad normal, se tiene:
→ Gráfica.
→ Gráfica de Probabilidad.
→ Individual. Clic Aceptar.
→ Aparece Gráfica de Probabilidad.
5/11/2018 Equipo 10 Estadistica - slidepdf.com
http://slidepdf.com/reader/full/equipo-10-estadistica 13/16
13
→ En la variable seleccionan C1, y luego distribución dan clic en distribución normal. Luego
Aceptar.
→Los puntos deben
quedar dentro del
intervalo de confianza
para indicar que es
normal la distribución.
5/11/2018 Equipo 10 Estadistica - slidepdf.com
http://slidepdf.com/reader/full/equipo-10-estadistica 14/16
14
PRUEBA DE SHAPPIRO-WILK
En estadística, el Test de Shapiro –Wilk, se usa para contrastar la normalidad de un conjunto dedatos. Se plantea como hipótesis nula que una muestra x 1…x n proviene de una poblaciónnormalmente distribuida. Fue publicado en 1965 por Samuel Shapiro y Martin Wilk. Se
considera uno de los test más potentes para el contraste de normalidad, sobre todo paramuestras pequeñas.
El estadístico del test es:
Donde
x (i ) (con el subíndice i entre paréntesis) es el número que ocupa la i-ésima posición en lamuestra;
= (x 1 + ... + x n ) / n es la media muestral; las constantes a i se calculan2
Donde
Siendo m 1...m n son los valores medios del estadístico ordenado, de variables aleatoriasindependientes e idénticamente distribuidas, muestreadas de distribuciones normales. V es lamatriz de covarianzas de ese estadístico de orden.
La hipótesis nula se rechazará si W es demasiado pequeño.Es un contraste de ajuste que se utiliza para comprobar si unos datos determinados (X 1, X2,…,
Xn) han sido extraídos de una población normal. Los parámetros de la distribución no tienenporqué ser conocidos y está adecuado para muestras pequeñas (n<50).Un contraste de ajustetiene como objetivo comprobar si con base en la información suministrada por una muestra sepuede aceptar que la población de origen sigue una determinada distribución de probabilidad,en nuestro caso, la distribución normal
5/11/2018 Equipo 10 Estadistica - slidepdf.com
http://slidepdf.com/reader/full/equipo-10-estadistica 15/16
15
PASOS A SEGUIR EN MINITAB:
1.-Generaremos 25 datos aleatorios con una Media= 152.05 y una Desviación Estándar de
48.09, de la siguiente manera:
→ Calc
→ Datos Aleatorios
→ Normal
→ Damos doble clic.
→ Rellenamos la pantalla con los datos que nos proporcionaron en el problema, como seobserva en la imagen, y damos un clic más en aceptar.
→ Aparecerán 25 datos en la columna C1.
→ Realizaremos la prueba de Wilcoxon
para 1 muestra.
→ Estadísticas.
→ No paramétricas.
→ Wilcoxon de 1 muestra.
→ Rellenamos los datos que nos piden: en variable seleccionamos C1 y ahí en donde dice
media de la prueba rellenamos con 152 y damos clic en
aceptar.
→ Nos aparece otra ventana
5/11/2018 Equipo 10 Estadistica - slidepdf.com
http://slidepdf.com/reader/full/equipo-10-estadistica 16/16
16
→ Gráfica. →Gráfica de Probabilidad.
→ Individual. Con distribución normal.
→ Y aparece el gráfico.
Mide el ajuste de la muestra a una recta, al dibujarla en papel probabilístico normal. Este tipode representación también lo proporcionan algunos programas de estadística, de tal manera
que nos permite además apreciar el ajuste o desajuste de forma visual:
En escala probabilística normal se representa en el eje horizontal, para cada valor observadoen nuestros datos, la función de distribución o probabilidad acumulada observada, y en el ejevertical la prevista por el modelo de distribución normal. Si el ajuste es bueno, los puntos sedeben distribuir aproximadamente según una recta a 45º. En la imagen vemos que en esteejemplo existe cierta discrepancia.
En cualquier caso siempre es adecuado efectuar una representación gráfica de tipo histogramade los datos, y comparar el valor de la media y la mediana, así como evaluar el coeficiente deasimetría y apuntamiento, además de llevar a cabo una representación en escala probabilísticade la distribución de probabilidad esperada versus observada, como la de la figura.