ESTADÍSTICA 1 ARIANZA Y DESVIACIÓN STANDAR

9
 Varianza y desviación estándar La desviación sólo significa qué tan lejos de lo normal  Desviación estándar La desviación estándar ( ) mide cuánto se separan los datos. La fórmula es fácil: es la raíz cuadrada de la varianza. Así que, "¿qué es la varianza?" Varianza la varianza (que es el cuadrado de la desviación estándar: 2 ) se define así: Es la media de las diferencias con la media elevadas al cuadrado. En otras palabras, sigue estos p asos: 1. Calcula la media (el promedio de los números) 2. Ahora, por cada número resta la media y eleva el resultado al cuadrado (la diferencia elevada al cuadrado). 3. Ahora calcula la media de esas diferencias al cuadrado. (¿Por qué al cuadrado?) Ejemplo Tú y tus amigos habéis medido las alturas de vuestros perros (en milímetros): Las alturas (de los hombros) son: 600mm, 470mm, 170mm, 430mm y 300mm. Calcula la media, l a varianza y la desviación estándar. R espuesta: Media = 600 + 470 + 170 + 430 + 300 = 1970 = 394 5 5

Transcript of ESTADÍSTICA 1 ARIANZA Y DESVIACIÓN STANDAR

Page 1: ESTADÍSTICA 1 ARIANZA Y DESVIACIÓN STANDAR

5/12/2018 ESTADÍSTICA 1 ARIANZA Y DESVIACIÓN STANDAR - slidepdf.com

http://slidepdf.com/reader/full/estadistica-1-arianza-y-desviacion-standar 1/9

 

Varianza y desviación estándar

La desviación sólo significa qué tan lejos de lo normal  

Desviación estándar

La desviación estándar () mide cuánto se separan los datos.

La fórmula es fácil: es la raíz cuadrada de la varianza. Así que, "¿qué es la varianza?"

Varianza

la varianza (que es el cuadrado de la desviación estándar: 2) se define así:

Es la media de las diferencias con la media elevadas al cuadrado.

En otras palabras, sigue estos pasos:

1. Calcula la media (el promedio de los números) 

2. Ahora, por cada número resta la media y eleva el resultado al cuadrado (la diferencia

elevada al cuadrado).

3. Ahora calcula la media de esas diferencias al cuadrado. (¿Por qué al cuadrado?) 

Ejemplo

Tú y tus amigos habéis medido las alturas de vuestros perros (en milímetros):

Las alturas (de los hombros) son: 600mm, 470mm, 170mm, 430mm y 300mm.

Calcula la media, la varianza y la desviación estándar.

R espuesta:

Media =

600 + 470 + 170 + 430 + 300

=

1970

= 394

5 5

Page 2: ESTADÍSTICA 1 ARIANZA Y DESVIACIÓN STANDAR

5/12/2018 ESTADÍSTICA 1 ARIANZA Y DESVIACIÓN STANDAR - slidepdf.com

http://slidepdf.com/reader/full/estadistica-1-arianza-y-desviacion-standar 2/9

 

así que la altura media es 39

4

mm. Vamos a dibujar esto en el gráfico:

Ahora calculamos la diferencia de cada altura con la media:

Para calcular la varianza, toma cada diferencia, elévala al cuadrado, y haz la media:

Varianza: 2 =

2062

+ 762

+ (-224)2

+ 362

+ (-94)2 

=

108,520

= 21,704

5 5

Así que la varianza es 21,704.

Y la desviación estándar es la raíz de la varianza, así que:

Desviación estándar: = ¥21,704 = 147 

y lo bueno de la desviación estándar es que es útil: ahora veremos qué alturas están a

distancia menos de la desviación estándar (147mm) de la media:

Page 3: ESTADÍSTICA 1 ARIANZA Y DESVIACIÓN STANDAR

5/12/2018 ESTADÍSTICA 1 ARIANZA Y DESVIACIÓN STANDAR - slidepdf.com

http://slidepdf.com/reader/full/estadistica-1-arianza-y-desviacion-standar 3/9

 

Así que usando la desviación estándar tenemos una manera "estándar" de saber qué

es normal, o extra grande o extra pequeño.

Los Rottweilers son perros grandes. Y los Dachsunds son un poco menudos... ¡peroque no se enteren!

*Nota: ¿por qué al cuadrado? 

Elevar cada diferencia al cuadrado hace que todos los números sean positivos (para evitar quelos números negativos reduzcan la varianza) 

Y también hacen que las diferencias grandes se destaquen. Por ejemplo 1002=10,000 es muchomás grande que 502=2,500.

Pero elevarlas al cuadrado hace que la respuesta sea muy grande, así que lo deshacemos (con

la raíz cuadrada) y así la desviación estándar es mucho más útil.

Volver arriba 

Medidas descriptivas 

Las medidas descriptivas son valores numéricos calculados a partir de la muestra y que nos resumen la información contenidaella. 

Medidas de Posición: Cuantiles 

Los cuantiles son valores de la distribución que la dividen en partes iguales, es decir, en intervalos, que comprenden el m

número de valores. Los más usados son los cuarti les, los deciles y los percentiles. 

PERCENTILES: son 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Ejemplo, el percenorden 15 deja por debajo al 15% de las observaciones, y por encima queda el 85% 

 

CUARTILES: son los tres valores que dividen al conjunto de datos ordenados en cuatro partes iguales, son un caso particulos percentiles: 

- El primer cuartil Q 1 es el menor valor que es mayor que una cuarta parte de los datos

Page 4: ESTADÍSTICA 1 ARIANZA Y DESVIACIÓN STANDAR

5/12/2018 ESTADÍSTICA 1 ARIANZA Y DESVIACIÓN STANDAR - slidepdf.com

http://slidepdf.com/reader/full/estadistica-1-arianza-y-desviacion-standar 4/9

 

- El segundo cuartil Q 2 (la mediana), es el menor valor que es mayor que la mitad de losdatos- El tercer cuartil Q 3 es el menor valor que es mayor que tres cuartas partes de los datos 

DECILES: son los nueve valores que dividen al conjunto de datos ordenados en diez partes iguales, son también un casoparticular de los percentiles. 

Ejemplo: 

Dada la siguiente distribución en el número de hijos (Xi) de cien familias, calcular sus cuartiles. 

 x i   ni   Ni  

0  14  14 

1  10  24 

2  15  39 

3  26  65 

4  20  85 

5  15  100 

n=100 

Solución: 

1.Primer cuartil: 

2.Segundo cuartil: 

3. 

Tercer cuartil: 

Medidas de Centralización 

Nos dan un centro de la distribución de frecuencias, es un valor que se puede tomar como representativo de todos los datosdiferentes modos para definir el "centro" de las observaciones en un conjunto de datos. Por orden de importancia, son: 

MEDIA : (media aritmética o simplemente media). es el promedio aritmético de las observaciones, es decir, el cociente en

Page 5: ESTADÍSTICA 1 ARIANZA Y DESVIACIÓN STANDAR

5/12/2018 ESTADÍSTICA 1 ARIANZA Y DESVIACIÓN STANDAR - slidepdf.com

http://slidepdf.com/reader/full/estadistica-1-arianza-y-desviacion-standar 5/9

 

suma de todos los datos y el numero de ellos. Si xi es el valor de la variable y ni su frecuencia, tenemos que: 

Si los datos están agrupados utilizamos las marcas de clase, es decir c i en vez de xi. 

MEDIANA (Me):es el valor que separa por la mitad las observaciones ordenadas de menor a mayor, de tal forma que el 50estas son menores que la mediana y el otro 50% son mayores. Si el número de datos es impar la mediana será el valor cenes par tomaremos como mediana la media aritmética de los dos valores centrales. 

MODA (M0): es el valor de la variable que más veces se repite, es decir, aquella cuya frecuencia absoluta es mayor. Noporque ser única. 

Medidas de Dispersión 

Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo, las medidas de dispernos dicen hasta que punto estas medidas de tendencia central son representativas como síntesis de la información. Las mediddispersión cuantifican la separación, la dispersión, la variabilidad de los valores de la distribución respecto al valor central. Distinguimos entre medidas de dispersión absolutas, que no son comparables entre diferentes muestras y las relativasnos permitirán comparar varias muestras. 

MEDIDAS DE DISPERSIÓN ABSOLUTAS 

VARIANZA ( s2 ): es el promedio del cuadrado de las distancias entre cada observación y la media aritmética del conjunto dobservaciones. 

Haciendo operaciones en la fórmula anterior obtenemos otra fórmula para calcular la varianza: 

Si los datos están agrupados utilizamos las marcas de clase en lugar de Xi. 

Page 6: ESTADÍSTICA 1 ARIANZA Y DESVIACIÓN STANDAR

5/12/2018 ESTADÍSTICA 1 ARIANZA Y DESVIACIÓN STANDAR - slidepdf.com

http://slidepdf.com/reader/full/estadistica-1-arianza-y-desviacion-standar 6/9

 

 DESVIACIÓN TÍPICA (S): La varianza viene dada por las mismas unidades que la variable pero al cuadrado, para evitaproblema podemos usar como medida de dispersión la desviación típica que se define como la raíz cuadrada positiva de la var

Para estimar la desviación típica de una población a partir de los datos de una muestra se utiliza la fórmula (cuasi desviacióntípica): 

RECORRIDO O RANGO MUESTRAL (Re). Es la diferencia entre el valor de las observaciones mayor y el menor. Re = xma

MEDIDAS DE DISPERSIÓN RELATIVAS 

COEFICIENTE DE VARIACIÓN DE PEARSON: Cuando se quiere comparar el grado de dispersión de dos distribuciones qvienen dadas en las mismas unidades o que las medias no son iguales se utiliza el coeficiente de variación de Pearson qdefine como el cociente entre la desviación típica y el valor absoluto de la media aritmética 

CV representa el número de veces que la desviación típica contiene a la media aritmética y por lo tanto cuanto mayor es CV es la dispersión y menor la representatividad de la media. 

Medidas de Forma 

Comparan la forma que tiene la representación gráfica, bien sea el histograma o el diagrama de barras de la distribución, c

distribución normal. 

MEDIDA DE ASIMETRÍA 

Diremos que una distribución es simétrica cuando su mediana, su moda y su media aritmética coinciden. 

Diremos que una distribución es asimétric a a l a derecha si las frecuencias (absolutas o relativas) descienden más lentamente pderecha que por la izquierda. 

Si las frecuencias descienden más lentamente por la izquierda que por la derecha diremos que la distribución es asimétric a a l a

izquierd a. 

Existen varias medidas de la asimetría de una distribución de frecuencias. Una de ellas es el Coeficiente de Asimetría de

Pearson: 

Su valor es cero cuando la distribución es simétrica, positivo cuando existe asimetría a la derecha y negativo cuando existeasimetría a la izquierda. 

Page 7: ESTADÍSTICA 1 ARIANZA Y DESVIACIÓN STANDAR

5/12/2018 ESTADÍSTICA 1 ARIANZA Y DESVIACIÓN STANDAR - slidepdf.com

http://slidepdf.com/reader/full/estadistica-1-arianza-y-desviacion-standar 7/9

 

 

MEDIDA DE APUNTAMIENTO O CURTOSIS 

Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda. Se definen 3 tipos de distribuciones según

grado de curtosis:

Distribución mesocúrtica: presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mque presenta una distribución normal). Distribución leptocúrtica: presenta un elevado grado de concentración alrededor de lovalores centrales de la variable. Distribución platicúrtica: presenta un reducido grado de concentración alrededor de los valor

centrales de la variable. 

EJEMPLO 1

El número de diás necesarios por 10 equipos de trabajadores para terminar 10 instalaciones de iguales características han sido

32, 15, 59, 60, 61, 64, 60, 71, y 80 días. Calcular la media, mediana, moda, varianza y desviación típica.

SOLUCIÓN: 

La media: suma de todos los valores de una variable dividida entre el número total de datos de los que se dispone:

La mediana: es el valor que deja a la mitad de los datos por encima de dicho valor y a la otra mitad por debajo. Si ordenamos los datos de ma menor observamos la secuencia:

15, 21, 32, 59, 60, 60,61, 64, 71, 80.

Como quiera que en este ejemplo el número de observaciones es par (10 individuos), los dos valores que se encuentran en el medio son 60 y

realizamos el cálculo de la media de estos dos valores nos dará a su vez 60, que es el valor de la mediana.

La moda: el valor de la variable que presenta una mayor frecuencia es 60 

La varianza S2: Es la media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmética de la distribución.

Page 8: ESTADÍSTICA 1 ARIANZA Y DESVIACIÓN STANDAR

5/12/2018 ESTADÍSTICA 1 ARIANZA Y DESVIACIÓN STANDAR - slidepdf.com

http://slidepdf.com/reader/full/estadistica-1-arianza-y-desviacion-standar 8/9

 

 

Sx2=

La desviación típica S: es la raíz cuadrada de la varianza.

; S = ¥ 427,61 = 20.67 

El rango: diferencia entre el valor de las observaciones mayor y el menor  

80 - 15 = 65 días 

El coeficiente de variación: cociente entre la desviación típica y el valor absoluto de la media aritmética 

CV = 20,67/52,3 = 0,39 

EJEMPO 2

El precio de un interruptor magentotérmico en 10 comercios de electricidad de una ciudad son : 25, 25, 26, 24, 30, 25, 29, 2827 Euros. Hallar la media, moda, mediana, (abrir la calculadora estadística, más abajo) diagrama de barras y el diagrama de ca

SOLUCIÓN: 

(Utilizar la calculadora de debajo) 

[El diagrama de cajas: caja desde Q1 a Q3 (50% de los datos), bigotes el recorrido] 

Page 9: ESTADÍSTICA 1 ARIANZA Y DESVIACIÓN STANDAR

5/12/2018 ESTADÍSTICA 1 ARIANZA Y DESVIACIÓN STANDAR - slidepdf.com

http://slidepdf.com/reader/full/estadistica-1-arianza-y-desviacion-standar 9/9

 

Resumen de Fórmulas

--