Estadística 1

70

Transcript of Estadística 1

Page 1: Estadística 1
Page 2: Estadística 1

LA ESTADÍSTICA ES LA CIENCIA QUE PROVEE DE MÉTODOS QUE PERMITEN RECOGER, ORGANIZAR ,RESUMIR, PRESENTAR Y ANALIZAR DATOS RELATIVOS A UN CONJUNTO DE INDIVIDUOS U OBSERVACIONES , PARA ASÍ , EXTRAER CONCLUSIONES VÁLIDAS Y TOMAR DECISIONES LÓGICAS BASADAS EN DICHOS ANÁLISIS.

Page 3: Estadística 1

LA ESTADÍSTICA SE DIVIDE EN DOS TIPOS:

A) ESTADÍSTICA DESCRIPTIVA

B) ESTADÍSTICA INFERENCIAL O DEDUCTIVA

Page 4: Estadística 1

LA ESTADÍSTICA DESCRIPTIVA :

SE REFIERE A LA DESCRIPCIÓN NUMÉRICA DE UN GRUPO PARTICULAR.NINGUNA CONCLUSIÓN PUEDE IR MÁS

ALLÁ DEL GRUPO DESCRITO.

LOS DATOS ANALIZADOS , DESCRIBENESTE GRUPO Y SÓLO ÉSTE .

Page 5: Estadística 1

ESTADÍSTICA INFERENCIAL

ES EL EMPLEO DE LA TÉCNICA DE MUESTREO PARA LLEGAR ADETERMINADAS CONCLUSIONES ACERCA DE LA POBLACIÓN DE LA CUAL SE HAN OBTENIDO LAS MUESTRAS

Page 6: Estadística 1
Page 7: Estadística 1

POBLACIÓN

SE LLAMA POBLACIÓN AL CONJUNTO FORMADO POR TODOS LOS

ELEMENTOS CUYO CONOCIMIENTO NOS INTERESA . CADA UNODE ESTOS ELEMENTOS LO

DENOMINAREMOS INDIVIDUO .

Page 8: Estadística 1

MUESTRA

SE LLAMA MUESTRA A UN SUBCONJUNTO FINITO DE LA

POBLACIÓN EN ESTUDIO . SE USA UNA MUESTRA

CUANDO ES IMPOSIBLE ( O POCO PRÁCTICO) ESTUDIAR A TODOS LOS INDIVIDUOS DE UNA

POBLACIÓN .

Page 9: Estadística 1

Población y MuestraPoblación

Muestra

Page 10: Estadística 1

Concepto de Variable

Una variable en estadística corresponde a la o las características que se miden en la muestra. Las variables pueden ser:

a) CUANTITATIVAS (Se pueden medir numéricamente)

b) CUALITATIVAS (No se pueden medir numéricamente)

Page 11: Estadística 1

VARIABLES CUALITATIVAS

Nominales Ordinales

No existe orden Existe orden intuitivo Estado Civil Nivel Educacional

Page 12: Estadística 1

VARIABLES CUANTITATIVAS

Variables discretas Variables continuas

Sólo números naturales Números reales

Page 13: Estadística 1

BUEN MÉTODO ESTADÍSTICO

a) SELECCIÓN Y RECOPILACIÓN DE LOS DATOS A ESTUDIAR EN UNA MUESTRA O POBLACIÓN .

b) CLASIFICACIÓN Y ORDENACIÓN DE LOS DATOS .

c) TABULACIÓN DE LOS DATOS

Page 14: Estadística 1

d) CÁLCULO DE ALGUNOS PARÁMETROS ESTADÍSTICOS QUE

COMPLETEN LA INFORMACIÓN .e) ENTREGA O PUBLICACIÓN DE LA INFOMACIÓN . PARA ELLO ES USUAL UTILIZAR LOS DISTINTOS GRÁFICOS ESTADÍSTICOS .

Page 15: Estadística 1

CONSTRUCCIÓN DE UNA TABLA DEDISTRIBUCIÓN DE FRECUENCIA

REGLAS GENERALES

1 ) LOS DATOS SE ORDENAN DE MENOR A MAYOR

2 ) SE DETERMINA EL CAMPO DE VARIACIÓN (RECORRIDO DE LAVARIABLE) . C.v. = X(max.) - X(min.) SE SELECCIONA LA AMPLITUD DE LOS INTERVALOS

Page 16: Estadística 1

EJEMPLO

EN UN GRUPO DE 50 ALUMNOS EN UNA PRUEBA SE REGISTRARON LOS SIGUIENTES PUNTAJES .

61 70 77 82 63 75 83 62 67 8367 80 77 85 83 76 83 67 78 7672 80 83 72 84 71 77 82 79 8366 88 68 74 84 75 73 75 83 8487 64 83 72 87 77 63 72 84 78

EN PRIMER LUGAR SE ORDENAN LOS DATOS DE MENOR A MAYOR

Page 17: Estadística 1

2 ) CALCULAMOS EL CAMPO DE VARIACIÓN O RANGO

C.V = 88 - 61 C.V = 27

61 62 63 63 64 66 67 67 67 6870 71 72 72 72 72 73 74 75 7575 76 76 77 77 77 77 78 78 7980 80 82 82 83 83 83 83 83 8383 83 84 84 84 84 85 87 87 88

Page 18: Estadística 1

3 ) SE SELECCIONA LA AMPLITUD DE LOS INTERVALOS.

a ) CUANDO SE TIENE UN CONJUNTO DE DATOS Y SE ESPECIFICA EL NÚMERO DE INTERVALOS PARA LA TABLA, LA AMPLITUD “a”, SE TIENE :

intervalosdeNvariacióndeCampo

=

Page 19: Estadística 1

EN CASO DE OBTENER UN NÚMERO DECIMAL PARA “a” , SE APROXIMA AL ENTERO MAS CERCANO.

4 ) SE DETERMINAN LOS INTERVALOS

I ) EL NÚMERO DE INTERVALO RECIBE EL NOMBRE DE CLASE .

II ) LOS INTERVALOS QUEDAN CARACTERIZADOS POR LAS MARCAS DE CLASES QUE SON LOS PUNTOS MEDIOS O SEMISUMA DE LOS LÍMITES SUPERIORES E INFERIORES, ÉSTE NORMALMENTE ES POSITIVA .

Page 20: Estadística 1

CALCULAMOS LA AMPLITUD “a”

TENIENDO EN CUENTA QUE LA CANTIDAD DE DATOS ES PEQUEÑA , LOS AGRUPAREMOS EN SOLO 6 CLASES LUEGO TENEMOS :

SIEMPRE SE APROXIMA LA AMPLITUD AL ENTEROMAS CERCANO

LUEGO :

27a =

6Cv

a =6

a = 4,5

a =5

Page 21: Estadística 1

60 64

65 69

70 7475 7980 8485 89

626772778287

Page 22: Estadística 1

5 ) SE REALIZA LA TABULACIÓN

FRECUENCIA o FRECUENCIA ABSOLUTA:

ES EL NÚMERO DE VECES QUE SE REPITE EL VALOR DE UN DATO , O EL NÚMERO DE INDIVIDUOS QUE PERTENECEN A LA MISMA CLASE. SE SIMBOLIZA POR

if

Page 23: Estadística 1

60 6465 6970 7475 7980 8485 89

626772778287

5 5 81216 4

50

Page 24: Estadística 1

FRECUENCIA ACUMULADA

PARA CADA VALOR ES LA SUMA DE SU FRECUENCIA MAS LAS ANTERIORES,

SE SIMBOLIZA POR acf

Page 25: Estadística 1

60 64

65 69

70 74

75 79

80 84

85 89

62

67

7277

8287

558

1216

4

510

18

30

46

50

50

5

812164

Page 26: Estadística 1

FRECUENCIA RELATIVA

ES EL NÚMERO DE VECES QUE SE REPITE UN DATO O CLASE, REFERIDO AL TOTAL DE INDIVIDUOS. ESTA FRECUENCIA RELATIVA SE SIMBOLIZA POR , Y SECALCULA :

rif

elementosdetotalnúmeroeles,n;nf

f iri =

Page 27: Estadística 1

60 6465 6970 7475 7980 8485 89

626772778287

5 5 81216 4

0,10,10,160,240,320,08

51018304650

1,050

Page 28: Estadística 1

FRECUENCIA PORCENTUAL

ES EXPRESAR LA FRECUENCIA EN FORMA DE PORCENTAJE , PARA TAL EFECTO SE TOMA LA FRECUENCIA RELATIVA Y SE CORRE LA COMA DOS ESPACIOS O SE MULTIPLICA POR 100

SE SIMBOLIZA POR : f%

Page 29: Estadística 1

60 6465 6970 7475 7980 8485 89

626772778287

5 5 81216 4

51018304650

0,10,10,160,240,320,08

1010162432 8

50 1,0 100

Page 30: Estadística 1

FRECUENCIA PORCENTUAL ACUMULADA

ES EXPRESAR EN FORMA ACUMULADA LA FRECUENCIA PORCENTUAL

Page 31: Estadística 1

60 6465 6970 7475 7980 8485 89

59,5- 64,5

64,5-69,5

69,5-74,5,74,5-79,5

79,5-84,5

84,5-89,5

626772778287

5 5 81216 4

51018304650

0,10,10,160,240,320,08

1010162432 8

10 20 36 60 92100

50 1,0 100

Page 32: Estadística 1

59,5- 64,5

64,5-69,5

69,5-74,5,74,5-79,5

79,5-84,5

84,5-89,5

626772778287

0,10,10,160,240,320,08

¿ Cuánto alumnos obtuvieron 69 o menos punto ?¿ Qué % obtuvo 75 o más puntos ? ¿ Cuántos alumnos obtuvieron entre 80 y 84 puntos ?¿ En cuales clases se concentraron la mayoría de los puntajes , entre puntos estuvieron y a que % corresponde ?

64%

10 20 36 60 92100

60 6465 6970 7475 7980 8485 89

30%³ 51018304650

5 5 81216 4

75 y 84 puntos

1010162432 8

56 %

Page 33: Estadística 1

GRÁFICOS

Los gráficos nos permiten obtener información de forma ordenada y resumida sobre las variables en estudio. Los gráficos más utilizados son:

a) Gráfico de barra: Es un diagrama de barras rectangulares, cuya altura de cada barra indica la frecuencia absoluta de cada valor de la variable.

Page 34: Estadística 1

Las barras pueden estar orientadas en forma horizontal o vertical. Estos gráficos se usan para comparar dos o más valores. Este gráfico sirve para representar variables cualitativas y cuantitativas.

Page 35: Estadística 1

Ejemplo 1:

Page 36: Estadística 1

Ejemplo 2:

cantidad de personas arriba de un avión

0

10

20

30

40

50

60

HOMBRES MUJERES

Género

Can

tid

ad

Serie1

Page 37: Estadística 1

b) Gráfico Circular: Es un gráfico formado por un círculo dividido en sectores. Se utiliza para representar cualquier tipo de frecuencias aunque, generalmente, se utiliza para frecuencias relativas porcentuales. Este gráfico sirve para representar variables cualitativas y cuantitativas.

Page 38: Estadística 1

Ejemplo 1:

Deportes Preferidos

41%

12%24%

21%

Bicicleta

Nadar

Trotar

Fútbol

Page 39: Estadística 1

Histograma: Es un gráfico cuya altura es proporcional a la frecuencia absoluta, frecuencia relativa o frecuencia porcentual, y la base está formada por segmentos cuyos extremos representan los extremos de cada intervalo. Este gráfico sirve para representar variables cuantitativas.

Page 40: Estadística 1

5 - 89 - 12

13 - 1617 - 20

05

1015202530354045

1

5 - 8

9 - 12

13 - 16

17 - 20

Page 41: Estadística 1

Polígono de Frecuencias: Se obtiene al unir los puntos medios de los intervalos representados por cada barra de un histograma, es decir, al unir la marca de clase de cada intervalo mediante una línea poligonal.

Page 42: Estadística 1

Edad de los estudiantes

0

5

10

15

20

25

30

35

40

45

5 - 8 9 - 12 13 - 16 17 - 20

Años

de

estu

dia

nte

s

Serie2

Page 43: Estadística 1

Medidas de tendencia central

Las medidas de tendencia central, denominados también PROMEDIOS, ubican el centro de los datos, como la media aritmética, la media geométrica, la media armónica y la mediana.

Las cuales serán calculadas para datos NO agrupados y agrupados (tabla de frecuencia)

Page 44: Estadística 1

MEDIA ARITMÉTICA OPROMEDIO ARITMÉTICO

SE SIMBOLIZA POR X

n321, x,......x,xxSE CALCULA SUMANDO LASOBSERVACIONES

Y SE DIVIDE POR POR EL NÚMERO TOTAL DE ELLAS , O SEA :

nx....xxx

X n321 +++=

Page 45: Estadística 1

MEDIANA

ES EL VALOR CENTRAL DE UNA DISTRIBUCIÓN ORDENADA DE MENOR A MAYOR O VICEVERSA , QUE DEJA SOBRE Y BAJO SI , EL 50 % DE LOS VALORES DE LA DISTRIBUCIÓN, SE SIMBOLIZA POR :

Me

Page 46: Estadística 1

EJEMPLO :

2 4 6 7 9 12 16MENORES MAYORES

ME

DIA

NA

Me = 7

Page 47: Estadística 1

SI EL NÚMERO DE DATOS ES PAR

5 8 10 13 15 18

LA MEDIANA ES IGUAL A LA MEDIA ARITMÉTICA DE LOS DOS VALORES CENTRALES

EJEMPLO :

11,52

1310x =+=ˆ

Page 48: Estadística 1

MODA

EN LENGUAJE COTIDIANO LO QUE ESTÁ DE MODA ES LO QUE MAS SE LLEVA, LOQUE MAS SE USA .

MODA : ES EL VALOR CON MAYOR FRECUENCIA , SE DESIGNA POR : Mo

Page 49: Estadística 1

PUEDE HABER MAS DE UNA MODA ONO HABER MODA

EJEMPLO

1 1 2 2 2 3 3 4 4 4 4 5 5 5 6 6 6 6 7 7 8 8 9

HAY DOS MODAS 4 Y 6

3 3 5 5 6 6 7 7 8 8 9 9EN ESTE CASO NO HAY MODA

Page 50: Estadística 1

EJEMPLO

EN EL CONJUNTO DE LOS DATOS :

5 2 2 2 4 5 6 6 6 6 7 7 8 9

LA MODA ES : Mo = 6

La moda es el promedio menos importante por su ambigüedad

Page 51: Estadística 1

Medidas de tendencia central para datos agrupados.

Media o Media aritmética: Si valores de alguna variable están tabulados en una distribución de frecuencias de intervalos, donde:

nX

son las marcas de clases, luego kyyyy ,...,,, 321

kffff ,...,,, 321 son las frecuencias absolutas respectivas,

Page 52: Estadística 1

Entonces su media aritmética está dada por:

n

mfx

k

iii∑

=

⋅= 1

Page 53: Estadística 1

Mediana para Datos Agrupados

Está dada por la fórmula:

Af

Fn

LMei

i

i ⋅−

+=−12

Page 54: Estadística 1

Dónde

:iLLímite inferior de la frecuencia acumulada, inmediatamente posterior al 50%

:n Cantidad total de datos

:1−iF Frecuencia acumulada anterior a la mediana

:if Frecuencia absoluta del intervalo de la Mediana

Page 55: Estadística 1

Ejemplo

Ingreso de personas a U.C.I coronaria de un determinado Hospital

45182 - 89

44374 – 81

41866 – 73

331658 – 65

171050 – 57

7442 – 49

3234 – 41

1126 – 33

Frecuencia Acumulada

Número de Personas

Edades

Af

Fn

LMei

i

i ⋅−

+=−12

Page 56: Estadística 1

Moda para datos agrupados

Para calcular la moda tabulados por intervalos, primero se determina el intervalo que contiene la moda, esto es, el intervalo que tiene la mayor frecuencia (intervalo modal). Luego se utiliza la fórmula

Add

dLMo i ⋅

+

+=21

1

Page 57: Estadística 1

Donde:

esto es igual a la frecuencia del intervalo modal menos la frecuencia del intervalo inmediatamente anterior

=iL Límite inferior del intervalo modal

11 −−= ii ffd

Page 58: Estadística 1

12 +−= ii ffd Esto es igual a la frecuencia del intervalo modal menos la frecuencia del intervalo inmediatamente posterior

A = Amplitud

Page 59: Estadística 1

Del ejemplo anterior

45182 - 89

44374 – 81

41866 – 73

331658 – 65

171050 – 57

7442 – 49

3234 – 41

1126 – 33

Frecuencia Acumulada

Número de PersonasEdades

Page 60: Estadística 1

61996,60

7429,058

786

658

≈=⋅+

=⋅

++=Mo

Page 61: Estadística 1

Cuartiles, Deciles y Percentiles

Si un conjunto de datos se ordena de acuerdo con su magnitud, el valor central que divide al conjunto en dos partes iguales es la MEDIANA. Extendiendo esta idea, es posible considerar los valores que dividen al conjunto en cuatro, diez o cien partes iguales

Page 62: Estadística 1

Fórmula general

)(% 1

isi

i LLf

NnLi −⋅−⋅+ −

Page 63: Estadística 1

Donde:

: Límite inferior de la clase utilizada

: Porcentaje a utilizar, expresado cómo número racional (Dividir en 100)

: Número total de datos de la muestra

Li

%

n

Page 64: Estadística 1

: Frecuencia acumulada anterior

: Frecuencia absoluta de la clase utilizada

: Límite Superior de la clase utilizada

1−iN

if

sL

Page 65: Estadística 1

Ejemplo 1

583105100 – 109

58

55395 90 - 99

52585 80 - 89

471175 70 - 79

362165 60 – 69

151055 50 – 59

5545 40 – 49

Fr. ac.Fr.M. ClasePeso

13,76)7079(11

365,4370)(

5875,0 175 =−−+=−−⋅+= −

isi

ii LL

f

NLP

Page 66: Estadística 1

Ejemplo 2:

La siguiente tabla muestra una distribución de frecuencia de salarios semanales de 65 empleados de una determinada empresa.

2310.000 – 319.999

5300.000 – 309.999

10290.000 – 299.999

14280.000 – 289.999

16270.000 – 279.999

10260.000 – 269.999

8250.000 – 259.999

N° EmpleadosSalarios

Calcule: el cuartil 3, los deciles 2, 4,7 y 9 y los percentiles 7, 19, 48, 67, 79

Page 67: Estadística 1

Medidas de dispersión

Son números que miden el grado de separación de los datos con respecto a un valor central. (Generalmente la media)

Estudiaremos las dos más importante:

c) Varianza

d) Desviación Estándar

Page 68: Estadística 1

Varianza

Es la media aritmética de los cuadrados de las diferencia de los datos con respecto a su media aritmética. Está dada por la fórmula:

n

xxs

n

ii∑

=

−= 1

2

2

)(

Page 69: Estadística 1

Ejemplo 1: (Datos no agrupados)

Obtener la varianza de los siguientes valores:

1,3,3,5,7,18,10

Page 70: Estadística 1

Varianza para datos AGRUPADOS

n

xxfs

n

iii∑

=

−= 1

2

2

)(