Download - Unidad 5

Transcript

HER

UNIDAD 5 “ESTADÍSTICA

NO PARAMÉTRICA”.LUCIA FLORES GARCÍA

ING. EN ADMISTRACIÓN.

MATERIA: ESTADÍSTICA II

2012

DOMINGO, 6 DE MAYO DE 2012

5.1 ESCALA DE MEDICIÓN

Niveles o Escalas de mediciones Escala Nominal:La escala de medida nominal, puede considerarse la escala de nivel más bajo, y consiste en la asignación, puramente arbitraria de números o símbolos a cada una de las diferentes categorías en las cuales podemos dividir el carácter que observamos, sin que puedan establecerse relaciones entre dichas categorías, a no ser el de que cada elemento pueda pertenecer a una y solo una de estas categorías.Se trata de agrupar objetos en clases, de modo que todos los que pertenezcan a la misma sean equivalentes respecto del atributo o propiedad en estudio, después de lo cual se asignan nombres a tales clases, y el hecho de que a veces, en lugar de denominaciones, se le atribuyan números, puede ser una de las razones por las cuales se le conoce como "medidas nominales".Por ejemplo, podemos estar interesados en clasificar los estudiantes de la UNESR Núcleo San Carlos de acuerdos a la carrera que cursan.

Carrera Número asignada a la categoríaEducación 1Administración 2Se ha de tener presente que los números asignados a cada categoría sirven única y exclusivamente para identificar la categoría y no poseen propiedades cuantitativas.

Escala Ordinal:

En caso de que puedan detectarse diversos grados de un atributo o propiedad de un objeto, la medida ordinal es la indicada, puesto que entonces puede recurrirse a la propiedad de "orden" de los números asignándolo a los objetos en estudio de modo que, si la cifra asignada al objeto A es mayor que la de B, puede inferirse que A posee un mayor grado de atributo que B.La asignación de números a las distintas categorías no puede ser completamente arbitraria, debe hacerse atendiendo al orden existente entre éstas. Los caracteres que posee una escala de medida ordinal permiten, por el hecho mismo de poder ordenar todas sus categorías, el cálculo de las medidas estadísticas de posición, como por ejemplo la mediana. Escalas de intervalos iguales: La escala de intervalos iguales, está caracterizada por una unidad de medida común y constante que asigna un número igual al número de unidades equivalentes a la de la magnitud que posea el elemento observado. Es importante destacar que el punto cero en las escalas de intervalos iguales es arbitrario, y no refleja en ningún momento ausencia de la magnitud que estamos midiendo. Esta escala, además de poseer las características de la escala ordinal, encontramos que la asignación de los números a los elemento es tan precisa que podemos determinar la magnitud de los intervalos (distancia) entre todos los elementos de la escala. Sin lugar a dudas, podemos decir que la escala de intervalos es la primera escala verdaderamente cuantitativa y a los caracteres que posean esta escala de medida pueden calculársele todas las medidas estadísticas a excepción del coeficiente de variación. Escala de coeficientes o Razones: El nivel de medida más elevado es el de cocientes o razones, y se diferencia de las escalas de intervalos iguales únicamente por poseer un punto cero propio como origen; es decir que el valor cero de esta escala significa ausencia de la magnitud que estamos midiendo. Si se observa una carencia total de propiedad, se dispone de una unidad de medida para el efecto. A iguales diferencias entre los números asignados corresponden iguales diferencias en el grado de atributo presente en el objeto de estudio. Además, siendo que cero ya no es arbitrario, sino un valor absoluto, podemos decir que A. Tiene dos, tres o cuatro veces la magnitud de la propiedad presente en B.Ejemplo:En una encuesta realizada en un barrio de esta localidad se observó que hay familias que no tienen hijos, otras tienen 6 hijos que es exactamente el doble de hijos que aquellas que tienen 3 hijos.

Las variables y su medición: Una variable es un símbolo, tal como X, Y, H, x ó B, que pueden tomar un conjunto prefijado de valores, llamado dominio de esa variable. Para Murray R. Spiegel (1991) "una variable que puede tomar cualquier valor entre dos valores dados se dice que es una variable continua en caso contrario diremos que la variable es discreta".

Las variables, también llamadas caracteres cuantitativos, son aquellas cuyas variaciones son susceptibles de ser medidas cuantitativamente, es decir, que pueden expresar numéricamente la magnitud de dichas variaciones. Por intuición y por experiencia sabemos que pueden distinguirse dos tipos de variables; las continuas y las discretas Las variables continuas se caracterizan por el hecho de que para todo para de valores siempre se puede encontrar en valor intermedio, (el peso, la estatura, el tiempo empleado para realizar un trabajo, etc.)Una variable es continua, cuando puede tomar infinitos valores intermedios dentro de dos valores consecutivos. Por ejemplo, la estatura, el peso, la temperatura. Para ver el gráfico seleccione la opción "Descargar" del menú superior.Las variables discretas serán aquellas que pueden tomar solo un número limitado de valores separados y no continuos; son aquellas que solo toman un determinado números de valores, porque entre dos valores consecutivos no pueden tomar ningún otro; por ejemplo el número de estudiantes de una clase es una variable discreta ya que solo tomará los valores 1, 2, 3, 4... Nótese que no encontramos valor como 1,5 estudiantes 5.2 MÉTODOS ESTADISTICOS CONTRA NO

PARAMETRICOS

5.3 PRUEBA DE CORRIDAS PARA ALEATORIEDAD

Una corrida es una serie de observaciones similares. La prueba de corridas se usa para probar la aleatoriedad de una serie de observaciones cuando cada observación puede ser asignada a una de dos categorías.Ejemplo. En relación con una muestra aleatoria de n = 10 individuos, supongamos que cuando se les clasifica por sexo la secuencia de observaciones es: M, M, M, M, F, F, F, F, M, M. Estos datos contienen tres corridas, o series de elementos semejantes.Respecto de datos numéricos, un medio para obtener el esquema requerido de dos categorías es clasificar cada observación según si es superior o inferior a la mediana del grupo. En general, mucho menos corridas o mucho más corridas que las que sería de esperar al azar resultarían en el rechazo de la hipótesis nula de que la secuencia de observaciones es una secuencia aleatoria.El número de corridas de elementos semejantes se determina de acuerdo con los datos muéstrales, con el uso del símbolo R para designar el número de corridas observadas. Si n1 equivale al número de elementos muestreados de un tipo y n2 al número de elementos muestreados del segundo tipo, la media y el error estándar asociados con la distribución de muestreo de la estadística de prueba R cuando la secuencia es aleatoria sonSin, n1 > 20 o n2 > 20, la distribución de muestreo de r aproxima la distribución normal. Por lo tanto, en estas circunstancias la estadística R puede convertirse a la estadística de prueba z de la siguiente manera:Cuando n1 20 y n2 20, en libros de texto especializados en estadística no paramétrica se dispone de tablas de valores críticos de la estadística de prueba R.

5.4 UNA MUESTRA: PRUEBA DE SIGNOS

Esta prueba corresponde a la prueba de media de una sola muestra y se recurre a ella cuando la muestra es de menos de 30 elementos y no se puede sostener el supuesto de normalidad de la población.Se le llama prueba del signo porque la información contenida en la muestra seleccionada se puede transformar en un conjunto de signos más y menos; y cuando se hace la prueba no se hace uso de la magnitud de los valores de la muestra, sino solamente se consideran los signos.Ésta se aplica cuando se muestrea una población simétrica continua de tal manera que la probabilidad de que una valor sea mayor que la media o menor que la media es de un medio. Para esta prueba se utiliza la distribución binomial.En esta prueba se tiene la hipótesis nula H0 : m = m0 contra la alternativa pertinente, pudiendo ser ésta de uno o dos extremos. Los supuestos que se deben tomar en cuenta para aplicarla, son los siguientes: se tiene una muestra aleatoria que proviene de una población con mediana desconocida, la variable de interés se mide en escala ordinal o más fuerte y esta misma variable es de naturaleza continua .Cuando la variable se mide en escala ordinal, las hipótesis se referirán a la mediana y no a la media.La prueba de signos es uno de los métodos no paramétricos más simples. La prueba t supone que los datos se distribuyen normalmente. La prueba del signo prescinde de tal hipótesis y es mucho más fácil de realizar. Se puede utilizar de diferentes formas, la más simple se describe a continuación:Para probar la hipótesis nula m = mo contra una alternativa apropiada, basándose en una muestra aleatoria de tamaño n, se reemplaza cada valor muestral mayor que mo por un signo más y cada valor muestral menor que mo por un signo menos (MILLER y FREUND, 1986, cap. 10).Se ignoran por completo aquellos valores que son iguales a mo. Para contrastar si la preponderancia de signos menos, es significativa se utiliza la ley de la binomial acumulada. Esta ley establece que la probabilidad de que aparezcan r signos menos entre n signos está dada por (MILLER y MILLER, 1993, cap. 6):

nCr : Indica el número de combinaciones de r elementos de un total de nelementos.p: es la probabilidad de que aparezca un signo menos en uno de los resultados.q: es la probabilidad de que no aparezca un signo menos en uno de los resultados, es decir, q = 1 – p.

5.5 UNA MUESTRA PRUEBA DE WILCOXON

Sea X una variable aleatoria continua. Podemos plantear cierta hipótesis sobre la mediana de dicha variable en la población, por ejemplo, M=M0. Extraigamos una muestra de tamaño m y averigüemos las diferencias Di = X - M0. Consideremos únicamente las n diferencias no nulas (n " m). Atribuyamos un rango u orden (0i) a cada diferencia según su magnitud sin tener en cuenta el signo.Sumemos por un lado los 0+i , rangos correspondientes a diferencias positivas y por otro lado los 0-i , rangos correspondientes a diferencias negativas.La suma de los órdenes de diferencias positivas sería igual a la suma de los órdenes de diferencias negativas, caso que la mediana fuera el valor propuesto M0. En las muestras, siendo M0 el valor de la verdadera mediana, aparecerán por azar ciertas discrepancias, pero si la suma de los rangos de un ciclo es considerablemente mayor que la suma de los rangos de otro signo, nos hará concebir serias dudas sobre la veracidad de M0.

La prueba de Wilcoxon va a permitir contrastar la hipótesis de que una muestra aleatoria procede de una población con mediana M0. Además, bajo el supuesto de simetría este contraste se puede referir a la media, E(X). Esta prueba es mucho mas sensible y poderosa que la prueba de los signos; como se puede apreciar utiliza mas información, pues no solo tiene en cuenta si las diferencias son positivas o negativas, sino también su magnitud.El contraste de Wilcoxon puede ser utilizado para comparar datos por parejas. Supongamos que la distribución de las diferencias es simétrica, y nuestro propósito es contrastar la hipótesis nula de que dicha distribución está centrada en 0. Eliminando aquellos pares para los cuales la diferencia es 0 se calculan los rangos en orden creciente de magnitud de los valores absolutos de las restantes diferencias. Se calculan las sumas de los rangos positivos y negativos, y la menor de estas sumas es el estadístico de Wilcoxon. La hipótesis nula será rechazada si T es menor o igual que el valor correspondiente.

5.6 DOSMUESTRAS: PRUEBA DE MANN-WHITNEY

5.8 OBSERVACIONES PAREADAS PRUEBA DE WILCOXON

5.9 VARIAS MUESTRAS INDEPENDIENTES: PRUEBA DE KRAUSKAL-WALLIS