Medidas de Distibución

download Medidas de Distibución

of 6

description

La medidas de distribución central permiten el análisis descriptivo

Transcript of Medidas de Distibución

Medidas de Distibucin - Asimetra y CurtosisLas medidas de distribucin nos permiten identificar la forma en que se separan o aglomeran los valores de acuerdo a su representacingrfica. Estas medidas describen la manera como los datos tienden a reunirse de acuerdo con la frecuencia con que se hallen dentro de la informacin. Su utilidad radica en la posibilidad de identificar las caractersticas de la distribucin sin necesidad de generar el grfico. Sus principales medidas son laAsimetray laCurtosis.1. ASIMETRAEsta medida nos permite identificar si los datos se distribuyen de forma uniforme alrededor del punto central (Media aritmtica). La asimetra presenta tres estados diferentes [Fig.5-1], cada uno de los cuales define de forma concisa como estn distribuidos los datos respecto al eje de asimetra. Se dice que laasimetra es positivacuando la mayora de los datos se encuentran por encima del valor de la media aritmtica, la curva esSimtricacuando se distribuyen aproximadamente la misma cantidad de valores en ambos lados de la media y se conoce comoasimetra negativacuando la mayor cantidad de datos se aglomeran en los valores menores que la media.Figura 5-1ElCoeficientede asimetra, se representa mediante la ecuacinmatemtica,Ecuacin 5-9Donde (g1) representa elcoeficientede asimetra de Fisher, (Xi) cada uno de los valores, () la media de la muestra y (ni) la frecuencia de cada valor. Los resultados de esta ecuacin se interpretan:(g1 = 0): Se acepta que la distribucin es Simtrica, es decir, existe aproximadamente la misma cantidad de valores a los dos lados de la media. Este valor es difcil de conseguir por lo que se tiende a tomar los valores que son cercanos ya sean positivos o negativos ( 0.5).(g1 > 0):La curva es asimtricamente positiva por lo que los valores se tienden a reunirmsen la parte izquierda que en la derecha de la media.(g1 < 0):La curva es asimtricamente negativa por lo que los valores se tienden a reunirmsen la parte derecha de la media.Desde luego entre mayor sea el nmero (Positivo o Negativo), mayor ser la distancia que separa la aglomeracin de los valores con respecto a la media.2. CURTOSISEsta medida determina el grado de concentracin que presentan los valores en la regin central de la distribucin. Por medio delCoeficientede Curtosis, podemos identificar si existe una gran concentracin de valores (Leptocrtica), una concentracin normal (Mesocrtica) una baja concentracin (Platicrtica).Figura 5-2Para calcular elcoeficientede Curtosis se utiliza la ecuacin:Ecuacion 5-10Donde (g2) representa elcoeficientede Curtosis, (Xi) cada uno de los valores, () la media de la muestra y (ni) la frecuencia de cada valor. Los resultados de esta frmula se interpretan:(g2 = 0)la distribucin es Mesocrtica: Al igual que en la asimetra es bastante difcil encontrar uncoeficientede Curtosis de cero (0), por lo que se suelenaceptarlos valores cercanos ( 0.5 aprox.).(g2 > 0)la distribucin es Leptocrtica(g2 < 0)la distribucin es PlaticrticaCuando la distribucin de los datos cuenta con uncoeficientede asimetra (g1 = 0.5) y uncoeficientede Curtosis de (g2 = 0.5), se le denomina Curva Normal. Este criterio es de suma importancia ya que para la mayora de los procedimientos de la estadstica de inferencia se requiere que los datos se distribuyan normalmente.La principal ventaja de la distribucin normal radica en el supuesto que el 95% de los valores se encuentra dentro de una distancia de dos desviaciones estndar de la media aritmtica (Fig.5-3); es decir, si tomamos la media y le sumamos dos veces la desviacin y despus le restamos a la media dos desviaciones, el 95% de los casos se encontrara dentro del rango que compongan estos valores.Figura 5-3Desde luego, los conceptos vistos hasta aqu, son slo una pequea introduccin a las principales medidas de Estadstica Descriptiva; es de gran importancia que los lectores profundicen en estostemasya que la principal dificultad del paquete SPSS radica en el desconocimiento de los conceptos estadsticos.Las definiciones plasmadas en este captulo han sido extradas de loslibrosEstadstica paraadministradoresescrito porAlan Westerde laeditorialMcGraw-Hilly ellibroEstadstica y Muestreoescrito porCiro MartnezeditorialEcoe editores(Octava edicin). No necesariamente tienes que guiarte por estoslibrosya que en las libreras encontraras una gran variedad de textos que pueden ser de bastante utilidad en la introduccin a estaciencia.

Escalas de MedidaPara realizar un correctoanlisisde los datos es fundamental conocer deantemanoel tipo de medida de la variable, ya que para cada una de ellas se utiliza diferentes estadsticos. La clasificacin ms convencional de lasescalasde medida las divide en cuatro grupos denominadosNominal,Ordinal,IntervaloyRazn.1. NOMINALSon variables numricas cuyos valores representan una categora o identifican un grupo de pertenencia. Este tipo de variables slo nos permite establecer relaciones de igualdad/desigualdad entre los elementos de la variable. La asignacin de los valores se realiza en formaaleatoriapor lo queNOcuenta con un orden lgico. Unejemplode este tipo de variables es el Gnero ya que nosotros podemos asignarle un valor a los hombres y otro diferente a las mujeres y por ms machistas o feministas que seamos no podramos establecer que uno es mayor que el otro.2. ORDINALSon variables numricas cuyos valores representan una categora o identifican un grupo de pertenencia contando con un orden lgico. Este tipo de variables nos permite establecer relaciones de igualdad/desigualdad y a su vez, podemos identificar si una categora es mayor o menor que otra. Unejemplode variable ordinal es el nivel de educacin, ya que se puede establecer que una persona con ttulo de Postgrado tiene un nivel de educacin superior al de una persona con ttulo de bachiller. En las variables ordinales no se puede determinar la distancia entre sus categoras, ya que no es cuantificable o medible.3. INTERVALOSon variables numricas cuyos valores representanmagnitudesy la distancia entre los nmeros de su escala es igual. Con este tipo de variables podemos realizar comparaciones de igualdad/desigualdad, establecer un orden dentro de sus valores y medir la distancia existente entre cada valor de la escala. Las variables de intervalo carecen de un cero absoluto, por lo que operaciones como la multiplicacin y la divisin no son realizables. Unejemplode este tipo de variables es la temperatura, ya que podemos decir que la distancia entre 10 y 12 grados es la misma que la existente entre 15 y 17 grados. Lo que no podemos establecer es que una temperatura de 10 grados equivale a la mitad de una temperatura de 20 grados.4. RAZNLas variables de razn poseen las mismas caractersticas de las variables de intervalo, con la diferencia que cuentan con un cero absoluto; es decir, el valor cero (0) representa la ausencia total de medida, por lo que se puede realizar cualquier operacinAritmtica(Suma, Resta, Multiplicacin y Divisin) yLgica(Comparacin y ordenamiento). Este tipo de variables permiten el nivel ms alto de medicin. Las variables altura, peso, distancia o el salario, son algunosejemplosde este tipo de escala de medida.Debido a la similitud existente entre lasescalasde intervalo y de razn, SPSS las ha reunido en un nuevo tipo de medida exclusivo del programa, al cual denominaEscala. Las variables de escala son para SPSS todas aquellas variables cuyos valores representanmagnitudes, ya sea que cuenten con un cero (0) absoluto o no. Teniendo esto en cuenta discutiremos a continuacin los diferentes procedimientos estadsticos que se pueden utilizar de acuerdo al tipo de medida de cada variable.B. Anlisis Descriptivo de acuerdo al nivel de MedidaNo todos los procedimientos estadsticos son realmente tiles para la totalidad de los niveles de medida. Cada uno de los tipos de medida posee ciertas caractersticas, las cuales debemos tener en cuenta en el momento de realizar unanlisisdescriptivo. En la tabla [5-2], encontrars algunos de los procedimientos que resultan ventajosos en losanlisisdescriptivos de los diferentes niveles de medida. Es necesarioaclararque esta tabla es slo una muestra de las medidas que se pueden emplear; en algunos textos de estadstica aparecen tablas ms amplias y detalladas de los procedimientos.Tabla 5-2Si nos fijamos en la tabla 5-2, notaremos que los niveles Nominal y Ordinal cuentan con los mismos procedimientos deanlisis, por lo que se agrupan como variables categricas. A partir de este punto cuando nos refiramos a las variables categricas debemos recordar que se alude a las variables de tipoNominalyOrdinal.Es importante resaltar que para losanlisisdescriptivos no hay una gran diferencia entre estos dos tipos de variables, pero si existe diferencia en losanlisisde Inferencia. Antes de conocer como se efectan estos procedimientos en SPSS, es necesario exponer las razones por las que ciertos procedimientos no son de utilidad en algunos de los niveles de medida.B.1. Variables CategricasPara las variables que representan categoras o grupos de pertenencia, los principales procedimientos estadsticos, que se pueden utilizar en suanlisisdescriptivo son lasfrecuencias(Recuento), elPorcentaje, laModa, en algunoscasosla mediana y los grficos ms favorables son el deSectoresy el deBarras.Para comprender mejor la razn de estos procedimientos vamos a realizar elanlisisde la variable Gnero, la cual cuenta con los valores (1, 1, 1, 1, 1, 1, 1, 1, 2, 2); en donde el valor uno (1) representa al gnero Femenino y el valor Dos (2) al gnero Masculino. Las frecuencias y sus respectivos porcentajes para esta variable seran los expuestos en la tabla [5-3]. Ahora si hallamos las principales medidas de tendencia central, obtenemos los resultados expuestos en la tabla [5-4].Figura5-4Si nos fijamos en los resultados notaremos que la Media toma el valor 1.2, el cual nos indica que en promedio los encuestados cuenta con un gnero de (1.2). Este resultado no posee una interpretacin aplicable a la informacin de la variable, por lo que esta medida no es de utilidad en elanlisisdescriptivo.Si observamos la Mediana notaremos que toma el valor 1, que para el caso corresponde al gnero Femenino, pero si en vez de 10 valores tuviramos nicamente dos (1 y 2), la mediana sera de (1.5), cuya interpretacin no es aplicable a la informacin de la variable. La mediana se puede utilizar cuando estamos trabajando con variables que contienen un elevado nmero de categoras y su interpretacin se debe manejar como un factor informativo para el investigador y no como una medida representativa en el reporte.Por ltimo encontramos la Moda, la cual para el caso asume el valor 1 y nos indica que la categora con mayorfrecuenciadentro de la variable es la correspondiente al gnero Femenino. Las medidas de dispersin y distribucin no son aplicables a este tipo de variables ya que sus ecuaciones nos permiten determinar como se comportan los datos respecto a un punto central o media. Si hallamos la desviacin estndar para los datos delejemplo, obtendramos un valor de 0.42164, que nos indicara que el promedio del gnero presenta una variacin de 0.42, cuyo resultado no sera aplicable a la interpretacin de la variable.B.2. Variables de EscalaEste tipo de variables nos permite realizaranlisisms profundos de los datos, aplicando una gran variedad de medidas. Al contrario de las variables categricas en este tipo de variables las frecuencias no son de utilidad en losanlisisdescriptivos, debido a la gran cantidad de valores que suele tomar. Supongamos que realizamos un sondeo de edad con una muestra de 500 personas, si generamos una tabla de frecuencias obtendramos fcilmente unos 60 o 70 rangos diferentes hacindola muy extensa y poco informativa.Para las variables de escala son ms informativas la medidas como la media, la mediana, la desviacin estndar, la asimetra y otras ms, a las cuales se les suele denominarMedidas deResumen.