Cómo Calcular Media

38
Cómo calcular, la media, la moda y la mediana Media aritmética o promedio Es aquella medida que se obtiene al dividir la suma de todos los valores de una variable por la frecuencia total. En palabras más simples, corresponde a la suma de un conjunto de datos dividida por el número total de dichos datos. Ejemplo 1: En matemáticas, un alumno tiene las siguientes notas: 4, 7, 7, 2, 5, 3 n = 6 (número total de datos) La media aritmética de las notas de esa asignatura es 4,8. Este número representa el promedio. Ejemplo 2: Cuando se tienen muchos datos es más conveniente agruparlos en una tabla de frecuencias y luego calcular la media aritmética. El siguiente cuadro con las medidas de 63 varas de pino lo ilustra. Largo (en m) Frecuencia absoluta Largo por Frecuencia absoluta 5 10 5 . 10 = 50 6 15 6 . 15 = 90 7 20 7 . 20 = 140 8 12 8 . 12 = 96

description

como calcular la media

Transcript of Cómo Calcular Media

Page 1: Cómo Calcular Media

Cómo calcular, la media, la moda y la mediana

Media aritmética o promedio

Es aquella medida que se obtiene al dividir la suma de todos los valores de una variable por la frecuencia total. En palabras más simples, corresponde a la suma de un conjunto de datos dividida por el número total de dichos datos.

Ejemplo 1:

En matemáticas, un alumno tiene las siguientes notas:  4, 7, 7, 2, 5, 3

n = 6 (número total de datos)

La media aritmética de las notas de esa asignatura es 4,8. Este número representa el promedio.

Ejemplo 2:

Cuando se tienen muchos datos es más conveniente agruparlos en una tabla de frecuencias y luego calcular la media aritmética. El siguiente cuadro con las medidas de 63 varas de pino lo ilustra.

Largo (en m)

Frecuencia absoluta Largo por Frecuencia absoluta

5 10 5          .       10  =   506 15 6          .        15 =   907 20 7          .        20 =  1408 12 8          .        12 =    969 6 9            .          6 = 54

Frecuencia total = 63

430

 

Se debe recordar que la frecuencia absoluta indica cuántas veces se repite cada valor, por lo tanto, la tabla es una manera más corta de anotar los datos (si la frecuencia absoluta es 10, significa que el valor a que corresponde se repite 10 veces).

Page 2: Cómo Calcular Media

Moda (Mo)

Es la medida que indica cual dato tiene la mayor frecuencia en un conjunto de datos; o sea, cual se repite más.

Ejemplo 1:

Determinar la moda en el siguiente conjunto de datos que corresponden a las edades de niñas de un Jardín Infantil.

                  5, 7, 3, 3, 7, 8, 3, 5, 9, 5, 3, 4, 3

La edad que más se repite es 3, por lo tanto, la Moda es 3 (Mo = 3)

Ejemplo 2:

               20, 12, 14, 23, 78, 56, 96

En este conjunto de datos no existe ningún valor que se repita, por lo tanto, este conjunto de valores no tiene moda.

Mediana (Med)

Para reconocer la mediana, es necesario tener ordenados los valores sea de mayor a menor o lo contrario. Usted divide el total de casos (N) entre dos, y el valor resultante corresponde al número del caso que representa la mediana de la distribución.

Es el valor central de un conjunto de valores ordenados en forma creciente o decreciente. Dicho en otras palabras, la Mediana corresponde al valor que deja igual número de valores antes y después de él en un conjunto de datos agrupados.

Según el número de valores que se tengan se pueden presentar dos casos:

Si el número de valores es impar, la Mediana corresponderá al valor central de dicho conjunto de datos.

Si el número de valores es par, la Mediana corresponderá al promedio de los dos valores centrales (los valores centrales se suman y se dividen por 2).

Ejemplo 1:

Se tienen los siguientes datos:  5, 4, 8, 10, 9, 1, 2

Al ordenarlos en forma creciente, es decir de menor a mayor, se tiene:  1, 2, 4,  5, 8, 9, 10

El 5 corresponde a la Med, porque es el valor central en este conjunto de datos impares.

Ejemplo 2: 

Page 3: Cómo Calcular Media

El siguiente conjunto de datos está ordenado en forma decreciente, de mayor a menor, y corresponde a un conjunto de valores pares, por lo tanto, la Med será el promedio de los valores centrales.

     21, 19, 18, 15,  13, 11, 10, 9, 5, 3

          

Ejemplo 3:

                  

 

Interpretando el gráfico de barras podemos deducir que:

 5 alumnos obtienen puntaje de 62

5 alumnos obtienen puntaje de 67

8 alumnos obtienen puntaje de 72

12 alumnos obtienen puntaje de 77

16 alumnos obtienen puntaje de 82

4 alumnos obtienen puntaje de 87

lo que hace un total de 50 alumnos

Sabemos que la mediana se obtiene haciendo

Page 4: Cómo Calcular Media

 lo cual significa que la mediana se ubica en la posición intermedia entre los alumnos 25 y 26 (cuyo promedio es 25,5), lo cual vemos en el siguiente cuadro:

 

puntaje

alumnos

62 162 262 362 462 567 667 767 867 967 1072 1172 1272 1372 1472 1572 1672 1772 1877 1977 2077 2177 2277 2377 2477 2577 2677 2777 2877 2977 3082 3182 3282 3382 3482 3582 36

Page 5: Cómo Calcular Media

82 3782 3882 3982 4082 4182 4282 4382 4482 4582 4687 4787 4887 4987 50

 

El alumno 25 obtuvo puntaje de 77

El alumno 26  obtuvo puntaje de 77

Entonces, como el total de alumnos es par debemos promediar esos puntajes:

La mediana es 77, lo cual significa que 25 alumnos obtuvieron puntaje desde 77 hacia abajo (alumnos 25 hasta el 1 en el cuadro)  y 25 alumnos obtuvieron puntaje de 77 hacia arriba (alumnos 26 hasta el 50 en el cuadro).

MEDIA ARITMÉTICA SIMPLE

2.1.1.1) Definición

Es la medida de tendencia central más utilizada por lo general se ubica hacia el centro de distribución estadística.

2.1.1.2) Métodos de Cálculo

a) Para Datos sin Agrupar

Page 6: Cómo Calcular Media

b) Para Datos Agrupados en Tablas de Frecuencias.- Cuando una serie se la agrupa en serie simple con frecuencias para obtener la media aritmética, se multiplica la variable por la frecuencia respectiva (f), luego se obtiene la suma de todos estos productos y luego a este valor se lo divide para el número de elementos (n). Todo esto puede representarse mediante una fórmula matemática, así:

c) Para Datos Agrupados en Intervalos.- Cuando una serie se la agrupa en intervalos para obtener la media aritmética, se multiplica la marca de clase de intervalo (xm) por la frecuencia respectiva (f), luego se obtiene la suma de todos estos productos y luego a este valor se lo divide para el número de elementos. Todo esto puede representarse mediante una fórmula matemática, así

Ejemplo ilustrativo

Calcular la media aritmética de las siguientes calificaciones de Estadística tomadas de una muestra de 20, sin agrupar, agrupando en tablas de frecuencias y agrupando en intervalos.

4, 8, 10, 10, 5, 10, 9, 8, 6, 8, 10, 8, 5, 7, 4, 4, 8, 8, 6 y 6

Solución:

1) Sin agrupar

Page 7: Cómo Calcular Media

En Excel se calcula insertando la función PROMEDIO:

2) Agrupando en tablas de frecuencias

Además presentar los datos en un diagrama de sectores.

x f4 35 26 37 18 69 110 4Total 20

3) Agrupando en intervalos

Intervalos f xm4- 5 5 4,56 -7 4 6,58- 9 7 8,510-11 4 10,5

Page 8: Cómo Calcular Media

Nota: Cuando se agrupa en intervalos los cálculos son sólo aproximaciones

En Excel se calcula insertando la función: SUMAPRODUCTO (C27:C30;D27:D30)/SUMA(C27:C30) como se muestra en la siguiente figura:

Nota: La principal propiedad de la media aritmética es:

La suma algebraica de las desviaciones de un conjunto de datos respecto de su media aritmética es cero

Leer más: http://www.monografias.com/trabajos85/interaprendizaje-medidas-tendencia-central/interaprendizaje-medidas-tendencia-central.shtml#mediaarita#ixzz3Z57zTDqd

Page 9: Cómo Calcular Media

LA VARIANZA (S2 ó 2 ):δ

La varianza es una medida de dispersión relativa a algún punto de referencia. Ese punto de referencia es la media aritmética de la distribución. Más específicamente, la varianza es una medida de que tan cerca, o que tan lejos están los diferentes valores de su propia media aritmética. Cuando más lejos están las Xi de su propia media aritmética, mayor es la varianza; cuando más cerca estén las Xi a su media menos es la varianza. Y se define y expresa matemáticamente de la siguiente manera:

La varianza para datos no agrupados

Dado un conjunto de observaciones, tales como X1, X2, … , Xn, la varianza denotada usualmente por la letra minúscula griega δ (sigma) elevada al cuadrado (δ2)y en otros casos S2 según otros analistas, se define como: el cuadrado medio de las desviaciones con respecto a su media aritmética"

Matemáticamente, se expresa como:

   

Ejemplo:

Se tienen las edades de cinco estudiantes universitarios de Ier año, a saber: 18,23, 25, 27, y 34. Al calcular la media aritmética (promedio de las edades, se obtuvo 25.4 años, encontrar la varianza de las edades de estos estudiantes:

Para calcular se utiliza una tabla estadística de trabajo de la siguiente manera:

Xi ( Xi - )

( Xi - )2

18 (18 – 25.5)=-7.4 (-7.4)2=54.76

Page 10: Cómo Calcular Media

23 (23 – 25.5)=-2.4 (-2.4)2= 5.7625 (25 – 25.5)=-0.4 (-0.4)2= 0.1627 (27 – 25.5)= 1.6 ( 1.64)2= 2.1634 (34 – 25.5)= 8.6 ( 8.6)2 =73.96

Total Xxxx 137.20

Respuesta: la varianza de las edades es de 27.4 años

La varianza para datos agrupados

Si en una tabla de distribución de frecuencias. Los puntos medios de las clases son X1, X2, … , Xn; y las frecuencias de las clases f1, f2, … , fn; la varianza se calcula así:

Σ(Xi-)2f1

δ2 = ----------------

Σfi

Sin embargo la formula anterior tiene algún inconveniente para su uso en la practica, sobre todo cuando se trabaja con números decimales o cuando la media aritmética es un número entero. Asimismo cuando se trabaja con máquinas calculadoras, La tarea de computar la varianza se simplifica utilizando la formula de computación que se da a continuación:

ΣXi2fi - [(ΣXifi)2/N]

δ2 = ----------------------------

Page 11: Cómo Calcular Media

N donde N=Σfi

Ejemplo:

Se tienen los datos de una muestra de 30 cuentas por cobrar de la tienda Cabrera’s y Asociados dispuestos en una tabla de distribución de frecuencias, a partir de los cuales se deberá calcular la varianza, para lo cual se construye la siguiente tabla estadística de trabajo, si se calculó anteriormente la media aritmética y se fijó en 43.458 (ver ejemplo del calculo en "media aritmética para datos agrupados) de la siguiente manera

clases

Punto medios

Xi

fi Xi2 Xifi X2fi

7.420 – 21.835 14.628 10 213.978 146.280 2,139.78021.835 – 36.250 29.043 4 843,496 116.172 3,373.98436.250 – 50.665 43.458 5 1,888.598 217.270 9,442.99050.665 – 65.080 57.873 3 3,349.284 173.619 10,047.85265.080 – 79.495 72.288 3 5,225.555 216.864 15,676.66579.495 – 93.910 86.703 5 7,533.025 433.965 37,665.125

Total XXX 30 19,053.936 1,304.190 78,346.396

= 21,649.344 / 30 = 721.645

Respuesta: la varianza de las cuentas por cobrar es igual B/.721.645

Propiedades de la varianza :

s siempre un valor no negativo, que puede ser igual o distinta de 0. Será 0 solamente cuando Xi=

La varianza es la medida de dispersión cuadrática optima por ser la menor de todas. Si a todos los valores de la variable se le suma una constante la varianza no se

modifica. Veámoslo:

Si a xi le sumamos una constante xi’ = xi + k tendremos (sabiendo que )

Page 12: Cómo Calcular Media

Si todos los valores de la variable se multiplican por una constante la varianza queda multiplicada por el cuadrado de dicha constante. Veámoslo:

Si a xi’ = xi · k tendremos (sabiendo que )

Si en una distribución obtenemos una serie de subconjuntos disjuntos, la varianza de la distribución inicial se relaciona con la varianza de cada uno de los subconjuntos mediante la expresión

Siendo

Ni è el nº de elementos del subconjunto (i)

S2i è la varianza del subconjunto (i)

1.3.- LA DESVIACIÓN ESTÁNDAR (S ó )δ

Es una medida de la cantidad típica en la que los valores del conjunto de datos difieren de la media. Es la medida de dispersión más utilizada, se le llama también desviación típica. La desviación estándar siempre se calcula con respecto a la media y es un mínimo cuando se estima con respecto a este valor.

Se calcula de forma sencilla, si se conoce la varianza, por cuanto que es la raíz cuadrada positiva de esta. A la desviación se le representa por la letra minúscula griega "sigma" ( δ ) ó por la letra S mayúscula, según otros analistas.

Cálculo de la Desviación Estándar

δ = √δ2 ó S = √S2

Ejemplo:

Del calculo de la varianza de las edades de cinco estudiantes universitarios de primer año se obtuvo δ2=27.44, como la desviación estándar es la raíz cuadrada positiva, entonces δ = √27.44 = 5.29 años.

Page 13: Cómo Calcular Media

Igual procedimiento se aplica para encontrar le desviación estándar de las cuentas por cobrar de la Tienda Cabrera’s y Asociados, recordemos que la varianza obtenida fue de 721.645, luego entonces la desviación estándar es igual a δ =√721.645 = 26.86 balboas.

Propiedades de la Desviación Estándar

A su vez la desviación estándar, también tiene una serie de propiedades que se deducen fácilmente de las de la varianza (ya que la desviación típica es la raíz cuadrada positiva de la varianza):

La desviación estándar es siempre un valor no negativo S será siempre ³ 0 por definición. Cuando S = 0 è X = xi (para todo i).

Es la medida de dispersión óptima por ser la más pequeña. La desviación estándar toma en cuenta las desviaciones de todos los valores de la

variable Si a todos los valores de la variable se le suma una misma constante la desviación

estándar no varía. Si a todos los valores de la variable se multiplican por una misma constante, la

desviación estándar queda multiplicada por el valor absoluto de dicha constante.

1.4.- El Coeficiente de Variación de Pearson (C.V.)

Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo, las medidas de dispersión nos dicen hasta que punto estas medidas de tendencia central son representativas como síntesis de la información. Las medidas de dispersión cuantifican la separación, la dispersión, la variabilidad de los valores de la distribución respecto al valor central. Distinguimos entre medidas de dispersión absolutas, que no son comparables entre diferentes muestras y las relativas que nos permitirán comparar varias muestras.

El problema de las medidas de dispersión absolutas es que normalmente son un indicador que nos da problemas a la hora de comparar. Comparar muestras de variables que entre sí no tienen cantidades en las mismas unidades, de ahí que en ocasiones se recurra a medidas de dispersión relativas.

Un problema que se plantea, tanto la varianza como la desviación estándar, especialmente a efectos de comparaciones entre distribuciones, es el de la dependencia respecto a las unidades de medida de la variable. Cuando se quiere comparar el grado de dispersión de dos distribuciones que no vienen dadas en las mismas unidades o que las medias no son iguales se utiliza el llamado "Coeficiente de Variación de Pearson", del que se demuestra que nos da un número independiente de las unidades de medidas empleadas, por lo que entre dos distribuciones dadas diremos que posee menor dispersión aquella cuyo coeficiente de variación sea menor., y que se define como la relación por cociente entre la desviación estándar y la media aritmética; o en otras palabras es la desviación estándar expresada como porcentaje de la media aritmética.

Definición del Coeficiente de Variación

Page 14: Cómo Calcular Media

Donde: C.V. representa el número de veces que la desviación típica contiene a la media aritmética y por lo tanto cuanto mayor es CV mayor es la dispersión y menor la representatividad de la media.

Propiedades del Coeficiente de Variación :

Si a todos los valores de la variable se le suma una misma constante el coeficiente de variación queda alterado .

Ejemplo:

Suponga que Usted trabaja en una compañía de ventas, que ofrece como premio de incentivo al mejor vendedor del trimestre anterior las entradas al palco empresarial en la serie final de béisbol de las grandes ligas en los Estados Unidos (E,E,U,A,).

De los registros de ventas se tienen los siguientes datos de ventas, expresados en porcentajes de cumplimiento de las metas fijadas mensualmente:

Vendedor A 95 105 100

Vendedor B 100 90 110

El promedio trimestral de cumplimiento de las metas de ventas de ambos vendedores es igual y equivale al 100%, pero Ud. Sólo le puede dar el premio de incentivo a uno de ellos. ¿Cuál usted escogería?. ¿En base a que criterio’. Explique.

Este problema se resuelve utilizando el coeficiente de variación, para estos efectos es necesario encontrar la desviación estándar trimestral de las ventas de cada uno de la siguiente manera:

Vendedor A

Xi ( Xi - ) ( Xi - )2

95 95 – 100 = -5 (-5)2 = 25105 105 – 100 = 5 ( 5)2 = 25100 100 – 100 = 0 ( 0)2 = 0

Total XXX 50

La desviación estándar es δ=√(50/3) = √16.667 = 4.08, luego entonces el coeficiente de variación es igual a:

δ 4.08

Page 15: Cómo Calcular Media

C.VA= --------- = ----------- = 0.0408

100

Vendedor B

Xi ( Xi - ) ( Xi - )2100 100 – 100 = 0 ( 0 )2 = 090 90 – 100 = -10 (-10)2 =

100110 110 – 100 = 10 ( 10)2 = 100

Total XXX 200

La desviación estándar es δ=√(200/3) = √66.667 = 8.16, luego entonces el coeficiente de variación es igual a:

Respuesta: Dado que el vendedor A tiene menor coeficiente de variación, A él le corresponde recibir el premio de incentivo.

Leer más: http://www.monografias.com/trabajos43/medidas-dispersion/medidas-dispersion2.shtml#ixzz3Z59W9CaO

MEDIA

Es la medida de posición central más utilizada, la más conocida y la más sencilla de calcular, debido principalmente a que sus ecuaciones se prestan para el manejo algebraico, lo cual la hace de gran utilidad. Su principal desventaja radica en su sensibilidad al cambio de uno de sus valores o a los valores extremos demasiado grandes o pequeños. La media se define como la suma de todos los valores observados, dividido por el número total de observaciones.

 

Ecuación 5-1

 

Cuando los valores representan una población la ecuación se define como:

Page 16: Cómo Calcular Media

Ecuación 5- 2

 

Donde (m) representa la media, (N) representa el tamaño de la población y (Xi) representa cada uno de los valores de la población. Ya que en la mayoría de los casos se trabajan con muestras de la población todas las ecuaciones que se presenten a continuación serán representativas para las muestras. La media aritmética para una muestra esta determinada como

 

Ecuación 5-3

 

Donde (X) representa la Media para la muestra, (n) el tamaño de la muestra y (Xi) representa cada uno de los valores observados. Esta fórmula únicamente es aplicable si los datos se encuentran desagrupados; en caso contrario debemos calcular la media mediante la multiplicación de los diferentes valores por la frecuencia con que se encuentren dentro de la información; es decir,

 

Ecuación 5-4

 

Donde (Yi) representa el punto medio de cada observación, (ni) es la frecuencia o número de observaciones en cada clase y (n) es el tamaño de la muestra siendo igual a la suma de las frecuencias de cada clase.

Para entender mejor este concepto vamos a suponer que hemos tomado la edad de 5 personas al azar cuyos resultados fueron (22, 33, 35, 38 y 41). Para facilitar su interpretación se han generado tres rangos de edad los cuales se han establecido de 21 a

Page 17: Cómo Calcular Media

30 años, de 31 a 40 años y de 41 a 50 años. Si nos fijamos en estos rangos notaremos que los puntos medios son 25, 35 y 45 respectivamente. Los resultados de la organización de estos datos se representan en la tabla [5-1].

 

Figura 5-1

 

Si aplicamos la fórmula para valores agrupados obtendríamos que la media es igual a

 

Lo que nos indicaría que el promedio de edad de los encuestados es de 35 años. Si ha estos mismos resultados le aplicamos la ecuación para datos desagrupados (Ecuación 5-3), tomando como referencia cada uno de los valores individuales, obtendríamos que la media es igual a

 

Lo que nos indicaría que el promedio de edad para los datos desagrupados es de 34 años aproximadamente. Esta diferencia se debe a que al agrupar los datos se pierde parcialmente la exactitud de los cálculos, principalmente al aumentar el número de datos. Para evitar estos inconvenientes, SPSS nos permite calcular las Medias, como si se trataran de valores desagrupados, aunque tiene algunos procedimientos para valores agrupados.

 

Es importante resaltar que existe una gran variedad de medias como la Media geométrica, la Media ponderada, la Media cuadrática, etc. Por el momento sólo hacemos énfasis en la media aritmética ya que es la más utilizada, aunque se recomienda a los lectores profundizar en estos temas.

 

Page 18: Cómo Calcular Media

2. MEDIANA

Con esta medida podemos identificar el valor que se encuentra en el centro de los datos, es decir, nos permite conocer el valor que se encuentra exactamente en la mitad del conjunto de datos después que las observaciones se han ubicado en serie ordenada. Esta medida nos indica que la mitad de los datos se encuentran por debajo de este valor y la otra mitad por encima del mismo. Para determinar la posición de la mediana se utiliza la fórmula

 

Ecuación 5-5

 

Para comprender este concepto vamos a suponer que tenemos la serie ordenada de valores (2, 5, 8, 10 y 13), la posición de la mediana sería:

 

 

Lo que nos indica que el valor de la mediana corresponde a la tercera posición de la serie, que equivale al número (8). Si por el contrario contamos con un conjunto de datos que contiene un número par de observaciones, es necesario promediar los dos valores medios de la serie. Si en el ejemplo anterior le anexamos el valor 15, tendríamos la serie ordenada (2, 5, 8, 10, 13 y 15) y la posición de la mediana sería,

 

 

Es decir, la posición tres y medio. Dado que es imposible destacar la posición tres y medio, es necesario promediar los dos valores de la posiciones tercera y cuarta para producir una mediana equivalente, que para el caso corresponden a  (8 + 10)/2 =9. Lo que nos indicaría que la mitad de los valores se encuentra por debajo del valor 9 y la otra mitad se encuentra por encima de este valor.

 

Page 19: Cómo Calcular Media

En conclusión la mediana nos indica el valor que separa los datos en dos fracciones iguales con el cincuenta porciento de los datos cada una. Para las muestras que cuentan con un número impar de observaciones o datos, la mediana dará como resultado una de las posiciones de la serie ordenada; mientras que para las muestras con un número par de observaciones se debe promediar los valores de las dos posiciones centrales.

 

3. MODA

La medida modal nos indica el valor que más veces se repite dentro de los datos; es decir, si tenemos la serie ordenada (2, 2, 5 y 7), el valor que más veces se repite es el número 2 quien seria la moda de los datos. Es posible que en algunas ocasiones se presente dos valores con la mayor frecuencia, lo cual se denomina Bimodal o en otros casos más de dos valores, lo que se conoce como multimodal.

 

En conclusión las Medidas de tendencia central, nos permiten identificar los valores más representativos de los datos, de acuerdo a la manera como se tienden a concentrar. La Media nos indica el promedio de los datos; es decir, nos informa el valor que obtendría cada uno de los individuos si se distribuyeran los valores en partes iguales. La Mediana por el contrario nos informa el valor que separa los datos en dos partes iguales, cada una de las cuales cuenta con el cincuenta porciento de los datos. Por último la Moda nos indica el valor que más se repite dentro de los datos.

QUÉ ES LA DESVIACIÓN ESTANDAR Y COMO INTERPRETARLA   #2 13 noviembre 2009

En la primera parte de este articulo, vimos la definición de desviación estándar y su cálculo mediante una fórmula matemática, ahora con ese dato obtenido definamos  una probabilidad en la cual el activo cotice  a determinado precio.  Por lo tanto preguntarnos

Page 20: Cómo Calcular Media

cuántas desviaciones estándar deberá moverse el activo  de la media/promedio, y asi determinar la probabilidad asociada a ese número de desviaciones estándar.

La probabilidad exacta asociada con cualquier número de desviaciones estándar puede encontrarse en los libros  de estadística. Sin embargo las siguientes aproximaciones pueden resultarles útiles:

± 1 desviación estándar significa  aproximadamente un 68,3% o cerca de 2/3 de todos los casos.

± 2 desviaciones son aproximadamente un 95,4% o cerca de 19/20 de todos los casos.

± 3 desviaciones estándar engloban aproximadamente un 99,7% (cerca de 369/370) de todos los casos.

La  desviación estándar va precedida de un signo más-menos (±) debido a que se considera que las distribuciones de los retornos son simétricas (no precios), es decir la probabilidad de un movimiento hacia arriba o hacia abajo es idéntica en ambos casos.

Retomando el ejemplo númerico de la parte #1, en el que calculamos la desviación estándar según la fórmula estadistica, no necesariamente tienen que hacer todos los cálculos ustedes, excel facilita la operatoria mediante la función PROMEDIO y DESVEST , la cual utilizarían para calcular el promedio y  la desviacion estandar  del cambio logarítmico en los precios.

El dato obtenido con esa serie de precios fue 1.296% de desviación estandar, por lo tanto es de esperar que en un día la acción cotice aproximadamente  entre:

$158±1.786019

$158 ± 2(1.786019)

$158±3(1.786019)

Page 21: Cómo Calcular Media

La otra manera de interpretar este resultado, sería decir que  se espera un cambio en el precio de este activo de  $1.78 o menos aproximadamente dos  días hábiles de cada tres,  un cambio de  $3.56 o menor aproximadamente 19 de  cada 20 días, y solo un día de cada 20 podemos esperar un cambio en el precio de mas de $3.56. Recuerde  que estamos hablando en términos de probabilidad, y puede  que  sea poco probable que el precio cambie más de tres desviaciones, pero no  es imposible.

Aplicabilidad

Para los que estén más familiarizados con el mercado, sabemos que la volatilidad es útil no sólo para ver el movimiento que pueda tener el activo, sino que es importante a la hora de valorar opciones. En un modelo de valuación de opciones la volatilidad es el único factor que no puede ser directamente observado, y va a  depender de muchos factores tales como  el método utilizado para determinarla, numero de datos, situación especifica en un momento del tiempo,  etc, sin embargo, lo que si es cierto es que  el precio de las opciones depende de las expectativas de volatilidad, a mayor volatilidad, mas caras son las opciones.

Es entonces cuando podemos hablar de volatilidad histórica (desviación estándar) y volatilidad implícita, la histórica ya vimos que se obtiene de datos pasados, mientras que la implícita es  la valoración de la volatilidad que hace el mercado hasta el vencimiento de una opción y que está continuamente cambiando en función de las expectativas y variaciones en las primas de las opciones.

La volatilidad implícita  se calcula en un determinado momento seleccionado un modelo de valoración de opciones y despejando la incógnita, tenemos como datos: el precio de la opción que está cotizando en el mercado, el tiempo al vencimiento, el precio de ejercicio de la opción y el precio de cotización del activo subyacente.

Esta volatilidad está expresada en términos anuales en la mayoría de los casos,  sin embargo la característica que presenta la volatilidad implícita y  la desviación estándar es que es  proporcional a la raíz cuadrada del tiempo. Por lo tanto la volatilidad anual (sa) de un activo es igual a la volatilidad diaria multiplicada por la raíz cuadrada de 252 o de 360 dependiendo los días hábiles o calendarios que cotice:

O si tenemos la volatilidad semanal:

Y de estas fórmulas despejamos la volatilidad diaria o semanal.

Para los operadores de opciones,  lo que nos interesa es saber cuánto valora el mercado que el precio de ese activo se puede mover hasta el vencimiento, por lo tanto si estamos viendo una pantalla de trading o leyendo fuentes de información en la cual nos muestre el dato de volatilidad, lo que debemos hacer es  tomar las opciones cuyo precio de ejercicio sea mas parecido al precio de cotización (at the Money) y si nos dice  por ejemplo que la volatilidad implícita es 25.96%, debemos contar los números de días que

Page 22: Cómo Calcular Media

hay entre la fecha que estamos mirando y la fecha al vencimiento, suponiendo que falten 18 días, hacemos el siguiente cálculo:

σ al vencimiento = 25.96% /√(252/18)= ±6.94% con un nivel de confianza del 68%.

Aclaraciones

La volatilidad implícita no necesariamente  coincide con la volatilidad histórica, pues la información adicional que pueda presentarse puede cambiar la percepción de riesgo, independientemente de lo que haya ocurrido en el pasado. Sin embargo la volatilidad histórica tiene un peso en la volatilidad implicita  ya que en el pasado también hubo variaciones importantes cuando se incorporaba nueva información

Estas son medidas que nos muestran una aproximación de cómo puede moverse el precio, sin embargo nunca es imposible que los precios del mercado ante situaciones adversas se muevan por encima o por debajo de nuestras predicciones.

Por Lilian Mora.

Etiquetas:cómo interpretar la desviación estándar, desviación estándar, desvio estándar, opciones, probabilidad, riesgo, volatilidad, volatilidad histórica, volatilidad implícitaPublicado en Conceptos | Leave a Comment »

QUÉ ES LA DESVIACIÓN ESTÁNDAR Y COMO INTERPRETARLA   #1 11 noviembre 2009

Para muchos la palabra desviación estándar puede sonar desconocida y no la habrán oído nombrar a menos que hayan asistido a una clase de estadística.

Sin embargo no se preocupe, es probable que si ha escuchado la palabra volatilidad, volatilidad del mercado, volatilidad del precio, ya esta familiarizado con el tema, ya que volatilidad lo podemos connotar como movimiento, y significa lo mismo que desviación estándar sino que esta última palabra es usada en estricto sentido matemático

Que es desviación estándar?

Page 23: Cómo Calcular Media

Justamente la desviación Estándar, en un conjunto de datos (precios en el caso del mercado de valores)  es una medida de dispersión, que nos indica cuánto pueden alejarse los valores respecto al promedio (media), por lo tanto es  útil para buscar probabilidades de que un evento ocurra, o en el caso del mercado bursátil, determinar entre que  rango de precios puede moverse un determinado activo, y determinar que tipo de activos pueden ser mas volátiles que otros.

Los operadores del  mercado están interesados en la dirección del precio de un activo y en la velocidad de los movimientos del subyacente para determinar  que tan riesgoso o vólatil puede llegar a ser un activo. Los mercados cuyos precios se mueven lentamente son mercados de baja volatilidad,  los mercados cuyos precios se mueven a alta velocidad son mercados de alta volatilidad.

Existen varias maneras de estimar la volatilidad, y el mundo ideal sería aquel donde se pueda determinar la volatilidad de todo el conjunto de datos existentes, sin embargo teniendo en cuenta que se cuentan con recursos (información, costos, etc) limitados, la desviación estándar se pude tomar sobre un determinado conjunto de datos que se ajusten a nuestros requerimientos, mediante la siguiente fórmula:

Donde

xi= dato i que esta entre (o, n)

x= promedio de los datos

n= numero datos

Cómo se interpreta y se analiza?

Ya dijimos que los operadores y los inversores estarían muy interesados en saber cual puede ser la dirección del precio, y también poder determinar un rango de precios en el cual el activo pueda moverse. Veamos entonces un ejemplo de cómo calcular la desviación  y su interpretación:

Si definimos  la desviación como  una medida de la variación de los precios, esta medida se basará en los cambios porcentuales que sufren los mismos. Sin embargo existen dos formas de calcular estos cambios porcentuales:

Page 24: Cómo Calcular Media

La manera correcta de tomar el % es en cambios logarítmicos, ya que es una manera de interpretar que los precios no pueden tomar valores negativos, y  por lo tanto considera mayores los movimientos al alza que los movimientos a la baja.

Lo importante no es  saber cómo se calcula cada uno de estos parámetros, lo que importa es la interpretación,  más concretamente, qué sugieren la media y la desviación estándar en términos de probabilidad del movimiento del precio.

En  nuestro ejemplo la media nos indica un promedio de resultados. Si sumamos todos los resultados y los dividimos entre el número de datos, nos da un promedio de -0.4741% es decir, el retorno promedio de resultados en estos días fue -0.4741%

Si calculamos la desviación de acuerdo a la fórmula presentada anteriormente nos da que la Desviación Estándar o volatilidad es 1.13%, hay que tener en cuenta que los datos tomados son datos diarios, por lo tanto el dato obtenido es de una volatilidad diaria de 1.3%.

Esto nos quiere decir que si el precio del activo cotiza a $158,  el precio de este activo puede moverse hacia arriba o hacia abajo::

$158,1 x 1,129677% = ±1,786019166 diario

Gráficamente  se puede representar de la siguiente manera

Page 25: Cómo Calcular Media

Este simple numerito aunque  nos dice una aproximacion del movimiento, nos puede resultar útil para interpretarlo en términos de probabilidad, es decir cuál es la probabilidad de que el activo cotice a determinado precio, pero este tema  lo trataremos en la segunda parte de este articulo.

La Desviación Estándar

La desviación estándar es un índice numérico de la dispersión de un conjunto de datos (o población). Mientras mayor es la desviación estándar, mayor es la dispersión de la población. La desviación estándar es un promedio de las desviaciones individuales de cada observación con respecto a la media de una distribución. Así, la desviación estándar mide el grado de dispersión o variabilidad. En primer lugar, midiendo la diferencia entre cada valor del conjunto de datos y la media del conjunto de datos. Luego, sumando todas estas diferencias individuales para dar el total de todas las diferencias. Por último, dividiendo el resultado por el número total de observaciones (normalmente representado por la letra “n”) para llegar a un promedio de las distancias entre cada observación individual y la media. Este promedio de las distancias es la desviación estándar y de esta manera representa dispersión.

Matemáticamente, la desviación estándar podría, a primera vista, parecer algo complicada. Sin embargo, es en realidad un concepto extremadamente simple. En realidad no importa si usted no sabe calcular con exactitud la desviación estándar, siempre y cuando usted comprenda claramente el concepto.

La desviación estándar es un indicador en extremo valioso con muchas aplicaciones. Por ejemplo, los estadísticos saben que cuando un conjunto de datos se distribuye de manera “normal”, el 68% de las observaciones de la distribución tiene un valor que se encuentra a menos de una desviación estándar de la media. También saben que el 96% de todas las observaciones tiene un valor no es mayor a la media más o menos dos desviaciones estándar (la Figura 18 grafica esta información).

La desviación estándar de una población es normalmente representada por la letra griega (sigma), cuando se calcula sobre la base de toda la población; por la letra s (minúscula) cuando se infiere de una muestra; y por la letra S (mayúscula) cuando simplemente corresponde a la desviación estándar de una muestra. La fórmula de la

desviación estándar es , donde representa la suma de las diferencias al cuadrado entre cada observación y la media y N representa el número total de observaciones. La aparente complicación de la fórmula surge del hecho de que al restar la media a los valores de cada observación individual para calcular las diferencias ( ), los valores de las observaciones que están bajo la media producirán diferencias negativas, mientras que los valores de las observaciones que son mayores que la media proporcionarán valores positivos. Así, las diferencias positivas y negativas se compensarán entre sí y, en el caso de una distribución simétrica, producirán una suma igual a cero para la suma de las desviaciones individuales. Para evitar este problema, las desviaciones se elevan al cuadrado, de modo que todas las desviaciones sean positivas y se puedan sumar. Después, se calcula la raíz cuadrada para ‘compensar’, por decirlo así, la elevación al cuadrado anterior de los valores. Cuando no se incluye la raíz cuadrada, el resultado es otro famoso indicador

Page 26: Cómo Calcular Media

de dispersión conocido como la “varianza”.

Los mejores cursos GRATIS

Ver TODOS los 1353 cursos GRATIS

Participa en el Foro

Destacamos

Síguenos en nuestro Twitter: @AulaFacil [<<] [||] [>>]

Búsqueda personalizada

Inicio » Cursos » Ciencia » Estadísticas » Estadísticas » Coeficiente de correlación lineal

Curso gratis de Estadísticas

Compartiren Facebook

Compartiren Twitter

Enviaramigo

Page 27: Cómo Calcular Media

ReportarError

Imprimirartículo

Lección 12 Índice

< Anterior 7 8 9 10 11 12 13 14 15 16 Siguiente >

Coeficiente de correlación lineal

En una distribución bidimensional puede ocurrir que las dos variables guarden algún tipo de relación entre si.

Por ejemplo, si se analiza la estatura y el peso de los alumnos de una clase es muy posible que exista relación entre ambas variables: mientras más alto sea el alumno, mayor será su peso.

El coeficiente de correlación lineal mide el grado de intensidad de esta posible relación entre las variables. Este coeficiente se aplica cuando la relación que puede existir entre las variables es lineal (es decir, si representáramos en un gráfico los pares de valores de las dos variables la nube de puntos se aproximaría a una recta).

 

 

No obstante, puede que exista una relación que no sea lineal, sino exponencial, parabólica, etc. En estos casos, el coeficiente de correlación lineal mediría mal la

Page 28: Cómo Calcular Media

intensidad de la relación las variables, por lo que convendría utilizar otro tipo de coeficiente más apropiado.

Para ver, por tanto, si se puede utilizar el coeficiente de correlación lineal, lo mejor es representar los pares de valores en un gráfico y ver que forma describen.

El coeficiente de correlación lineal se calcula aplicando la siguiente fórmula:

 

 

 

Es decir:

Numerador: se denomina covarianza y se calcula de la siguiente manera: en cada par de valores (x,y) se multiplica la "x" menos su media, por la "y" menos su media. Se suma el resultado obtenido de todos los pares de valores y este resultado se divide por el tamaño de la muestra.

Denominador se calcula el producto de las varianzas de "x" y de "y", y a este producto se le calcula la raíz cuadrada.

Los valores que puede tomar el coeficiente de correlación "r" son: -1 < r < 1

Si "r" > 0, la correlación lineal es positiva (si sube el valor de una variable sube el de la otra). La correlación es tanto más fuerte cuanto más se aproxime a 1.

Por ejemplo: altura y peso: los alumnos más altos suelen pesar más.

Si "r" < 0, la correlación lineal es negativa (si sube el valor de una variable disminuye el de la otra). La correlación negativa es tanto más fuerte cuanto más se aproxime a -1.

Por ejemplo: peso y velocidad: los alumnos más gordos suelen correr menos.

Si "r" = 0, no existe correlación lineal entre las variables. Aunque podría existir otro tipo de correlación (parabólica, exponencial, etc.)

De todos modos, aunque el valor de "r" fuera próximo a 1 o -1, tampoco esto quiere decir obligatoriamente que existe una relación de causa-efecto entre las dos variables, ya que este resultado podría haberse debido al puro azar.

Ejemplo: vamos a calcular el coeficiente de correlación de la siguiente serie de datos de altura y peso de los alumnos de una clase:

Page 29: Cómo Calcular Media

 

Alumno Estatura Peso Alumno Estatura Peso Alumno Estatura Peso

X x x x X x x x x

Alumno 1 1,25 32 Alumno 11 1,25 33 Alumno 21 1,25 33

Alumno 2 1,28 33 Alumno 12 1,28 35 Alumno 22 1,28 34

Alumno 3 1,27 34 Alumno 13 1,27 34 Alumno 23 1,27 34

Alumno 4 1,21 30 Alumno 14 1,21 30 Alumno 24 1,21 31

Alumno 5 1,22 32 Alumno 15 1,22 33 Alumno 25 1,22 32

Alumno 6 1,29 35 Alumno 16 1,29 34 Alumno 26 1,29 34

Alumno 7 1,30 34 Alumno 17 1,30 35 Alumno 27 1,30 34

Alumno 8 1,24 32 Alumno 18 1,24 32 Alumno 28 1,24 31

Alumno 9 1,27 32 Alumno 19 1,27 33 Alumno 29 1,27 35

Alumno 10 1,29 35 Alumno 20 1,29 33 Alumno 30 1,29 34

 

 

Aplicamos la fórmula:

(1/30) * (0,826)

r =-----------------------------------------------------------

(((1/30)*(0,02568)) * ((1/30)*(51,366)))^(1/2)

Interpretación:

**Si r < 0 Hay correlación negativa : las dos variables se correlacionan en sentido inverso.A valores altos de una de ellas le suelen corresponder valor bajos de la otra y viceversa.Cuánto más próximo a -1 esté el coeficiente de correlación más patente será esta covariación extrema.Si r= -1 hablaremos de correlación negativa perfecta lo que supone una determinación absoluta entre las dos variables ( en sentido inverso): Existe una relación funcional perfecta entre ambas(una relación lineal de pendiente negativa).

** Si r > 0 Hay correlación positiva: las dos variables se correlacionan en sentido directo.A valores altos de una le corresponden valores altos de la otra e igualmente con los valores bajos.Cuánto más próximo a +1 esté el coeficiente de correlación más

Page 30: Cómo Calcular Media

patente será esta covariación.Si r = 1 hablaremos de correlación positiva perfecta lo que supone una determinación absoluta entre las dos variables (en sentido directo):Existe una relación lineal perfecta ( con pendiente positiva).

** Si r = 0 se dice que las variables están incorrelacionadas: no puede establecerse ningún sentido de covariación.

Propiedad importante: Si dos variables son independientes estarán incorrelacionadas aunque el resultado recíproco no es necesariamente cierto.   Matriz de correlaciones

ir a análsis multidimensional