SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN...

61
SENA TECNOLOGÍA EN GESTION DE MERCADOS

Transcript of SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN...

Page 1: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

SENA

TECNOLOGÍA EN GESTION DE MERCADOS

Page 2: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

veamosPOBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS

COMUNES QUE SERÁN OBJETO DE ESTUDIO.

EJEMPLOS:

ALEMANES CONSUMIDORES DE CAFÉ

PAISES CON TRATADOS COMERCIALES CON COLOMBIA

En este video introduciremos conceptos básicos de la estadística que nos permitirá analizar los datos recolectados hasta ahora

Page 3: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

MUESTRA: SUBCONJUNTO DE LA POBLACIÓN QUE AL SER ESTUDIADO PERMITE INFERIR CARACTERISTICAS DE LA POBLACIÓN.

EJEMPLO

SI DE LA POBLACIÓN DE CONSUMIDORES DE CAFÉ EN ALEMANIA, SE TOMA EL SUBCONJUNTO DE LAS MUJERES, ES PROBABLE QUE LAS CONCLUSIONES NO SE PUEDAN APLICAR A TODA LA POBLACIÓN QUIZÁ POR QUE LOS HOMBRES CONSUMAN MAYOR CANTIDAD DE CAFÉ.

EN NUESTRA SEGUNDA POBLACIÓN SI EL NÚMERO DE PAISES NO ES MUY GRANDE ,NO HABRÁ NECESIDAD DE MUESTRA, AUNQUE SI POR ALGUNA RAZÓN COMO LOS COSTOS SE QUISIERA ESCOGER UNA MUESTRA, SE PODRÍA TOMAR PAISES REPRESENTANTES DE CONTIENENTES.

MUCHAS VECES SE HABLA DE UNA MUESTRA ALEATORIA AUNQUE DEBEMOS TENER CUIDADO EN QUE ESTA QUEDE BIEN DISTRIBUIDA

Page 4: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

LAS CARACTERISTICAS QUE SE LE PUEDEN ESTUDIAR A UNA POBLACIÓN SE DENOMINAN VARIABLES Y ESTAS LAS PODEMOS

CLASIFICAR EN DOS GRUPOS

1. VARIABLE CUALITATIVA: HACE REFERENCIA A UN ATRIBUTO O CARACTERISTICA DE LA POBLACIÓN DIFERENTE DE LA CANTIDAD.

- EN EL EJEMPLO DE LOS ALEMANES SERÍA EL GENERO, EL ESTILO DE VIDA, PROFESIÓN, ETC.

- EN EL EJEMPLO DE LOS PAISES SERÍA LOS PRODUCTOS QUE IMPORTAN O LOS PRODUCTOS QUE NO PRODUCEN.

Page 5: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

2. VARIABLES CUANTITATIVAS: SE EXPRESAN EN CANTIDADES.

- EN EL EJEMPLO DE LOS ALEMANES SERÍA LA CANTIDAD DE CAFÉ QUE CONSUMEN. (continua)

- EN EL EJEMPLO DE LOS PAISES SERÍA EL TAMAÑO DE LA POBLACIÓN. (discreta)

Esta variable se dicen discreta si se pueden colocar el correspondencia con los números enteros (…-2,-1,0,1,2,…) y se llama continua si la variable puede tomar cualquier valor de los números reales (“decimales”).

LAS CARACTERISTICAS QUE SE LE PUEDEN ESTUDIAR A UNA POBLACIÓN SE LLAMAN VARIABLES Y ESTAS LAS PODEMOS

CLASIFICAR EN DOS GRUPOS

Page 6: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

MEDIDAS PARA EL ANÁLISIS DE DATOS

Calcularemos las medidas con los siguientes datos recolectados a una muestra de 10 alemanes sobre su consumo de café en kg durante el año 2011.

5, 0.5, 3, 1.6, 3.5, 5, 1, 2, 2.6, 3.8

1. Media: Se entiende como el promedio de los datos.

Lo interpretamos que en promedio los alemanes toman 2.8 kg de café al año. Si llamamos n a la cantidad de datos recolectados y xi a cada valor entonces la formula está dada por:

Page 7: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

2. Mediana: se entiende como el valor intermedio de la población.

Primero organizamos los datos en orden

0.5, 1, 1.6, 2, 2.6, 3, 3.5 , 3.8, 5, 5

Segundo calculamos posición media

De esto se deduce que si n es impar el valor no dará un entero. Además que la formula es

Por último calculamos la mediana, en este caso como el valor intermedio nos dio 5.5 la mediana es un promedio entre el 5º y 6º dato.

Se puede observar que este promedio no es necesario si n es impar

Page 8: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

3. Moda: es el dato con mayor frecuencia, es decir el que se repite mayor número de veces.

5, 0.5, 3, 1.6, 3.5, 5, 1, 2, 2.6, 3.8

En este caso la moda es 5 debido a que se repite dos veces, mientras el resto aparece una vez. Cuando se tenga dos valores que pueden ser modas diremos que nuestra conjunto de valores es bimodal.

OBSERVACIONES1. Las herramientas anteriores son denominadas medidas de tendencia central debido a que buscan donde se concentran los datos.

Page 9: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

2. Como la mediana nos señala el centro de la distribución y la media su promedio es interesante notar que:

- si estas son iguales la distribución es simétrica- si la media es menor que la mediana es asimétrica negativa - si la media es mayor que la mediana es asimétrica positiva.

OBSERVACIONES

Page 10: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

4. Desviación estándar: se interpreta como la dispersión de los datos con respecto a la media. Se denota con la letra griega sigma.

Primero calculamos la desviaciones de cada dato con respecto a la media y lo elevamos al cuadrado para que los negativos no anulen los demás.

5, 0.5, 3, 1.6, 3.5, 5, 1, 2, 2.6, 3.8

Page 11: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

Segundo realizamos la sumatoria de todos las diferencias

Por último dividimos la sumatoria por el número de datos y calculamos su raíz cuadrada

Con lo anterior deducimos que la formula para la desviación estándar es

Se interpreta que los datos están alejados en promedio 1.47 kg de la media de consumo de café.

Page 12: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

5. Coeficiente de variación: Al igual que la desviación estándar nos permite conocer el grado de dispersión de los datos con respecto a la media, pero en este caso se aísla las unidades del análisis. Es especialmente útil para comparar la variación de diferentes muestras.

Para calcular el coeficiente de variación se necesitan los datos de la media y la desviación estándar.

Se interpreta que la muestra tiene una dispersión del 53%.

La formula general está dada por:

Page 13: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

DATOS ORDENADOSEn los ejemplos anteriores realizamos fácilmente el análisis debido a que la cantidad de datos era pequeña pero cuando la cuantía de los datos es más grande debemos organizarlos en una tabla que facilite su tratamiento.

La elaboración de la tabla varía dependiendo del tipo de variable (cualitativa, cuantitativa discreta y cuantitativa continua).

Además mostraremos dos tipos de gráficos que brindan una herramienta visual para la interpretación.

Page 14: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

TABLA DE FRECUENCIAS VARIABLE CUALITATIVA

Los siguientes datos fueron recolectados a una muestra de 50 alemanes consumidores de café sobre la procedencia del café que toman.

Brasil Indonesia Vietnam Brasil Brasil

Vietnam Indonesia Perú Vietnam Colombia

Colombia Colombia Colombia Colombia Indonesia

Indonesia Colombia Indonesia Indonesia Brasil

Perú Colombia Colombia Brasil Vietnam

Vietnam Perú Indonesia Vietnam Colombia

Colombia Brasil Brasil Indonesia Indonesia

Brasil Brasil Vietnam Brasil Brasil

Brasil Brasil Colombia Vietnam Vietnam

Brasil Vietnam Indonesia Indonesia Colombia

Page 15: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

TABLA DE FRECUENCIAS VARIABLE CUALITATIVA

• Lo primero que debemos hacer es realizar un listado de los datos sin repeticiones.

Brasil Colombia Indonesia Perú Vietnam

• Luego creamos una tabla donde la primera columna se llame datos y la rellenamos con el listado anterior. • Creamos una columna llamada frecuencia absoluta y colocamos la repeticiones de cada dato.

• Creamos una columna llamada a frecuencia relativa en donde insertamos el peso porcentual de la frecuencia de cada dato con respecto al total de la muestra.

Page 16: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

Datos Frecuencia Absoluta (fi)

Frecuencia Relativa(hi)

Brasil 14 28%Vietnam 10 20%Colombia 12 24%Indonesia 11 22%Perú 3 6%

50 100%

TABLA DE FRECUENCIAS VARIABLE CUALITATIVAPor ejemplo Brasil aparece 14 veces (frecuencia absoluta) y su peso porcentual (frecuencia relativa) es

Page 17: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

GRÁFICOS TABLA DE FRECUENCIASLa primera gráfica que podemos deducir se llama histograma de frecuencias en la que en el eje x se colocan los datos y en el eje y la frecuencia absoluta de cada dato.

Brasil Vietnam Colombia Indonesia Perú02468

10121416

Histograma de frecuencias sobre la procedencia del café de alemania

Nota. En cualquiera de los paquetes básicos de office lo podemos encontrar en insertar -gráfico -columna.

Page 18: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

GRÁFICOS TABLA DE FRECUENCIASOtro gráfico útil es el diagrama circular en el cual se grafica la frecuencia relativa, este coloca en proporción los ángulo del circulo con los pesos porcentuales de los datos. La formula para esto es multiplicar la frecuencia relativa por 360.

Brasil

28%

Vietnam20%

Colombia

24%

Indonesia22%

Perú6%

Nota. En cualquiera de los paquetes básicos de office lo podemos encontrar en insertar -gráfico -circular.

Page 19: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

TABLA DE FRECUENCIAS VARIABLE CUANTITATIVA DISCRETA

Los siguientes datos fueron recolectados a una muestra de 50 alemanes consumidores de café sobre la edad (en años) en que iniciaron el consumo de café.

18 21 18 22 1521 19 24 18 3015 18 20 19 2124 20 21 20 2219 15 18 21 2419 30 21 20 1922 21 15 20 1818 22 24 19 2419 24 19 18 2020 19 19 20 21

Page 20: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

• Lo primero que debemos hacer es realizar un listado ordenado de los datos sin repeticiones.

• Al igual que con la variable cualitativa creamos las columna datos, frecuencia absoluta y frecuencia relativa.

• Luego creamos una columna llamada frecuencia absoluta acumulada en donde escribimos la suma de la frecuencia absoluta de ese dato y los menores.

• Por último añadimos una columna que se denomina frecuencia relativa acumulada y en ella consignaremos la suma de la frecuencia relativa de ese dato y los menores..

TABLA DE FRECUENCIAS VARIABLE CUANTITATIVA DISCRETA

15 18 19 20 21 22 24 30

Page 21: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

Por ejemplo la frecuencia absoluta acumulada de 19 años es 22=4+8+10 y la frecuencia relativa acumulada es 44%=8%+16%+20%

TABLA DE FRECUENCIAS VARIABLE CUANTITATIVA DISCRETA

Datos(xi) Frecuencia Absoluta (fi)

Frecuencia Relativa(hi)

Frecuencia Absoluta

Acumulada (Fi)

Frecuencia Relativa

Acumulada (Hi)

15 4 8% 4 8%18 8 16% 12 24%19 10 20% 22 44%20 8 16% 30 60%21 8 16% 38 76%22 4 8% 42 84%24 6 12% 48 96%30 2 4% 50 100%

50 100%

Page 22: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

GRÁFICOS TABLA DE FRECUENCIASLa primera gráfica que podemos deducir se llama histograma de frecuencias en la que en el eje x se colocan los datos y en el eje y la frecuencia absoluta de cada dato.

Nota. En cualquiera de los paquetes básicos de office lo podemos encontrar en insertar -gráfico -columna.

15 18 19 20 21 22 24 300

2

4

6

8

10

12

Histograma de frecuencias sobre la edad inicial para el consumo de café

Page 23: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

GRÁFICOS TABLA DE FRECUENCIASOtro gráfico útil es el diagrama circular en el cual se grafica la frecuencia relativa, este coloca en proporción los ángulo del circulo con los pesos porcentuales de los datos. La formula para esto es multiplicar la frecuencia relativa por 360.

Nota. En cualquiera de los paquetes básicos de office lo podemos encontrar en insertar -gráfico -circular.

158%

1816%

1920%

2016%

2116%

228%

2412%

304%

Page 24: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

TABLA DE FRECUENCIAS VARIABLE CUANTITATIVA CONTINUA

Los siguientes datos fueron recolectados a una muestra de 50 alemanes consumidores de café sobre la cantidad de café (en kg) que toman durante un año.

3,6 4,11 2,8 1,3 3,42,5 4,8 0,4 2,2 2,24 1,7 4,1 3,6 2,6

0,2 2,6 2,9 1,7 3,43 3,4 3,4 2,6 2,8

2,2 3,8 2,86 0 3,55 2,1 3,1 3,4 4,2

1,6 4,3 4,4 5 2,91,9 2,7 1,7 2,6 3,022,8 3,5 2,4 1,9 1,4

Page 25: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

• En este caso se puede observar que realizar un listado de datos independiente no es eficiente, por que pueden salir un listado con una cantidad muy similar a la de n.

• En este caso parece conveniente utilizar 5 intervalos. Esta decisión depende del criterio del analista y lo resumido que necesite los datos.

TABLA DE FRECUENCIAS VARIABLE CUANTITATIVA CONTINUA

• Por lo anterior lo mas aconsejable es colocar los datos en intervalos (cajones) para que el listado que coloquemos en la tabla tan resumido como queramos.

• Para calcular la amplitud (tamaño) de los intervalos calcularemos el rango de la muestra y lo dividimos por la cantidad de intervalos que definimos.

Page 26: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

En esta tabla adicionaremos una columna denominada marca de clase que es el valor medio del intervalo.

TABLA DE FRECUENCIAS VARIABLE CUANTITATIVA CONTINUA

En el intervalo del [1.01-2] se encuentran los valores de 1.3, 1.4, 1.6, 1.7, 1.7, 1.7, 1.9, 1.9.

Intervalos Frecuencia Absoluta (fi)

Frecuencia Relativa(hi)

Frecuencia Absoluta

Acumulada (Fi)

Frecuencia Relativa

Acumulada (Hi)

Marca de clase (yi)

0 - 1 3 6% 3 6% 0.5

1.01 - 2 8 16% 11 22% 1.5

2.01 - 3 18 36% 29 58% 2.5

3.01 - 4 13 26% 42 84% 3.5

4.01 - 5 8 16% 50 100% 4.5

50 100%

Page 27: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

GRÁFICOS TABLA DE FRECUENCIASLa primera gráfica que podemos deducir se llama histograma de frecuencias en la que en el eje x se colocan los datos y en el eje y la frecuencia absoluta de cada dato.

Nota. En cualquiera de los paquetes básicos de office lo podemos encontrar en insertar -gráfico -columna.

0 - 1 1.01 - 2 2.01 - 3 3.01 - 4 4.01 - 50

5

10

15

20

Histograma de frecuencias sobre la cantidad de café que se consume al año

Page 28: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

GRÁFICOS TABLA DE FRECUENCIASOtro gráfico útil es el diagrama circular en el cual se grafica la frecuencia relativa, este coloca en proporción los ángulo del circulo con los pesos porcentuales de los datos. La formula para esto es multiplicar la frecuencia relativa por 360.

Nota. En cualquiera de los paquetes básicos de office lo podemos encontrar en insertar -gráfico -circular.

0 - 16%

1.01 - 216%

2.01 - 336%

3.01 - 426%

4.01 - 516%

Page 29: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

MEDIDAS DE TENDENCIA CENTRAL DATOS AGRUPADOS

Para calcular las medidas de tendencia central para los datos agrupados tomaremos el ejemplo de la variable cuantitativa continua debido a que es el más completo.

MediaRecordemos que es la suma de todos los datos dividido por n.Para calcular la suma de todos los datos en la tabla debemos naturalmente sumar las multiplicaciones de cada dato por su frecuencia.

Como en la tabla de frecuencias de la variable continua no existen los datos de manera individual sino intervalos tomamos un representante de cada uno el cual se estableció en la marca de clase.

Page 30: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

MEDIDAS DE TENDENCIA CENTRAL DATOS AGRUPADOS

Media

Con lo anterior podemos plantear la formula como sigue

Es importante notar que si la variable fuera cuantitativa discreta reemplazamos el yi con xi.También debemos ver que esta medida no es aplicable a variables cualitativas.

Lo interpretamos que en promedio los alemanes consumen 2.8 kg de café al año

Page 31: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

MEDIDAS DE TENDENCIA CENTRAL DATOS AGRUPADOS

MedianaRecordemos que es el dato que se encuentra en el centro de la distribución.

Para esto debemos identificar el intervalo en el que esta dicho dato. Dividiendo la cantidad de datos (n) por 2.

En nuestro ejemplo el dato debe estar en la posición 25 y esta posición se encuentra en el tercer intervalo [2.01 - 3].

Luego para escoger la mediana dentro de los datos del intervalo podríamos escoger el representante llamado marca de clase aunque con esta elección estaríamos suponiendo que la mediana se encuentra exactamente en la mitad del intervalo.

Page 32: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

MEDIDAS DE TENDENCIA CENTRAL DATOS AGRUPADOS

MedianaCuando el intervalo tiene abundantes datos debemos tener cuidado con hacer la suposición anterior y debemos refinar la búsqueda de la mediana. Identificando hacia que parte del intervalo se encuentra. Para esto utilizamos el siguiente factor.

La diferencia entre la posición media y la frecuencia absoluta acumulada del intervalo anterior nos indica la cantidad de datos que hay desde que empieza el intervalo hasta la mediana. Y la división con la frecuencia del intervalo me da una proporción de donde se encuentra.

Este factor se puede escribir en general como

Page 33: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

MEDIDAS DE TENDENCIA CENTRAL DATOS AGRUPADOS

MedianaLuego de tener la posición de la mediana dentro del intervalo en forma de factor necesitamos conocerla en kg y para esto resta multiplicarla por la amplitud del intervalo.

0.77 kg es lo que recorre la mediana desde que comienza el intervalo, por lo cual para establecer el valor de la mediana debemos sumarle el limite inferior del intervalo que notaremos Li(inf).

Page 34: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

MEDIDAS DE TENDENCIA CENTRAL DATOS AGRUPADOS

MedianaCon lo anterior podemos escribir una expresión general para la mediana como sigue

ModaLa moda es el dato que más se repite por lo cual para su cálculo observamos el intervalo con mayor frecuencia y tomamos el representante llamado marca de clase.En nuestro ejemplo la mayor frecuencia está en el tercer intervalo [2.01 - 3] y su marca de clase es 2.5, por lo cual

Page 35: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

MEDIDAS DE DISPERSIÓN

Desviación estándarRecordemos que esta medida representa la dispersión de los datos con respecto a la media.

La formula para calcularla es idéntica a la de los datos no agrupados, recordemos

Aunque como en este caso las Di no se realizan por elemento se debe escoger el representante y multiplicarlo por la frecuencia.

Cuando la tabla de frecuencias pertenezca a una variable cuantitativa continua el representante es la marca de clase.

Page 36: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

MEDIDAS DE DISPERSIÓN

Desviación estándarCalculemos

Lo interpretamos como la dispersión promedio del consumo de café anual con respecto a 2.8kg es de 1.1 kg.

Page 37: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

PROBABILIDADVamos a introducir la probabilidad con un ejemplo para luego definirla formalmente.

Ejemplo. Supongamos que queremos conocer las preferencias de las empresas de cierto país y para esto aplicamos una encuesta vía e-mail a 60 compañías. Supongamos que de las 60 solo 25 nos respondieron. Entonces ¿cuál es la probabilidad de que una empresa nos responda una encuesta?, sí necesitamos tener 60 encuestas para realizar el análisis ¿Cuántas encuestas debería enviar?. Respuesta pregunta 1

Si llamamos R al evento de que una empresa responda una encuesta vía e-mail, entonces

Lo que interpretamos como la probabilidad de que una empresa responda una encuesta vía e-mail es de 41.66%.

Page 38: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

PROBABILIDAD

La probabilidad de un experimento o suceso donde se conocen todos los posibles resultados es un valor entre 0 y 1, este número mide la frecuencia de obtener un resultado luego de realizar el experimento cierto numero de veces. Su formula es

Respuesta pregunta 2Si la probabilidad de R es de 41.66% y si notamos como E el número de encuestas enviadas tenemos que:

Por lo cual para que recibamos 60 encuestas debemos enviar 144.

Luego del ejemplo conceptualicemos

Notemos que si P(A)=0 implica que ese evento nunca ocurre y si P(A)=1 indica que ese evento siempre sucede.

Page 39: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

Lógica y probabilidadLa relación entre la lógica y la probabilidad se ve claramente expresada en las siguientes tres reglas para calcular probabilidad.

Regla de la adición

Esta regla se utiliza cuando dados 2 eventos se quiera conocer la probabilidad que ocurra alguno de los dos. Su formula es la siguiente

Ejemplo. Supongamos que queremos conocer las preferencias de las empresas de cierto país y para esto aplicamos una encuesta vía e-mail y otra vía telefónica a 60 compañías. Supongamos que de las 60 solo 25 nos respondieron vía e-mail, 36 nos respondieron vía telefónica y 20 nos respondieron por ambos medios.

Encuentre la probabilidad de que una empresa nos responda una encuesta por cualquier vía.

Page 40: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

Lógica y probabilidadUtilicemos la siguiente notación:

R: evento de que una empresa responda una encuesta vía e-mail.K: evento de que una empresa responda una encuesta vía telefónica.

la probabilidad de que una empresa nos responda una encuesta por cualquier vía e-mail o telefónica es de 68,32%

Notemos que si los eventos son mutuamente excluyentes la probabilidad de la intersección es igual a 0

Page 41: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

Lógica y probabilidadRegla de la probabilidad condicional

Esta regla se utiliza cuando queremos conocer la probabilidad de un evento A dado un evento B. lo notamos como P(A/B). La formula esta dada por

Veamos el ejemplo con los datos anteriores. Queremos conocer la probabilidad de que una empresa nos responda una encuesta vía telefónica luego de haber respondido una encuesta vía e-mail. Es decir P(K/R)

Compruebe que

Page 42: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

Lógica y probabilidadRegla de la probabilidad conjunta

Se utiliza cuando queremos conocer de que ocurran dos eventos a la vez.Cuando los eventos están relacionados y conocemos la probabilidad condicional la formula está dada por :

Notemos que si A y B son independientes P(A/B)=P(A), por lo cual la formula se reduce a

Veamos esta regla en el ejemplo. Como K y R están relacionados debemos utilizar la primera

La probabilidad de que una empresa responda una encuesta vía telefónica y e-mail es de 33,33%

Page 43: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

DISTRIBUCION NORMALAl realizar un análisis estadístico de los datos obtenidos por una variable cuantitativa continua es útil asociar un tipo de distribución.

En lo sucesivo presentaremos la distribución normal y veremos su utilidad en el análisis de datos.

Se dice que una cantidad de datos sigue una distribución normal si cumple las siguientes características.

1. Tiene una única moda, que coincide con su media y su mediana.

2. La curva normal es asintótica al eje x, es decir la curva no toca el eje x pero se acerca mucho a este. Por ello, cualquier valor del eje x es teóricamente posible. El área total bajo la curva es, por tanto, igual a 1.

3. Es simétrica con respecto a su media . Según esto, para este tipo de variables existe una probabilidad de un 50% de observar un dato mayor que la media, y un 50% de observar un dato menor.

Page 44: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

4. El área bajo la curva comprendido entre los valores situados aproximadamente a dos desviaciones estándar de la media es igual a 0.95. En concreto, existe un 95% de posibilidades de observar un valor comprendido en el intervalo.

DISTRIBUCION NORMALSe dice que una cantidad de datos sigue una distribución normal si cumple las siguientes características.

El gráfico de la distribución normal teórica es la llamada campana de gauss

Page 45: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

DISTRIBUCION NORMALPara identificar si nuestros datos corresponden a una distribución normal podemos analizar visualmente el histograma de frecuencias, ejemplo:

Poseen distribución normal

No poseen distribución normal

Page 46: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

DISTRIBUCION NORMALPara el ejemplo de variable continua que tenemos observemos que la distribución la podemos asociar a una normal.

Cuando tenemos asociada la distribución normal a unos datos podemos resolver preguntas de probabilidad acerca del comportamiento de variables. Ejemplo la probabilidad de encontrar alemanes que consuman menos de 3kg de café al año.

Page 47: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

DISTRIBUCION NORMALPara obtener información como la del ejemplo anterior debemos asociar nuestros datos a una distribución normal con media cero y varianza 1 debido a que para este tipo de distribución existen tablas con la probabilidad ya calculada.Dicha asociación la debemos hacer con la siguiente transformación:

Realicemos el ejemplo propuesto sobre la probabilidad de encontrar alemanes que consuman menos de 3kg de café al año.

Busquemos la probabilidad en la tabla para un valor menor o igual que 0.18, es decir

Page 48: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

Observemos que la gráfica toma una probabilidad acumulada desde el infinito negativo, Por esto la probabilidad de Z=0 es de 50%

Page 49: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

DISTRIBUCION NORMALSegún la tabla la probabilidad de encontrar un alemán que consuma menos de 3kg de café al año es de 57.14%.

Ejemplo 2. ¿Cuál es la probabilidad de encontrar de encontrar un alemán que consuma entre 3.5kg y 4kg de café anualmente?

Como buscamos en la tabla el área (probabilidad) entre dos valores y la tabla nos da el área acumulada debemos realizar la resta entre las dos áreas, es decir

Primero realizamos la respectiva transformación

Page 50: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

DISTRIBUCION NORMAL

Lo interpretamos como la probabilidad de que un alemán consuma entre 3.5kg y 4kg al año es de 12.64%

Page 51: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

DISTRIBUCION NORMALEjemplo 3. ¿Cuál es la probabilidad de encontrar de encontrar un alemán que consuma menos de 1kg al año?

Para revisar un resultado negativo debemos recordar que la media de la distribución Z es cero y como esta es simétrica el cero está en la mitad de la distribución.

Recordado lo anterior es fácil ver en la gráfica que el área entre -1.63 y cero es igual al área entre 0 y 1.63, es decir

Como en la tabla no aparecen los negativos para calcular el área menor que -1.63 debo al área menor que cero restarle el área entre 0 y -1.63 que es lo mismo por la igualdad anterior que el área entre 0 y 1.63 , es decir

Page 52: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

DISTRIBUCION NORMAL

Además

Lo que interpretamos como la probabilidad de encontrar un alemán que consuma menos de 1kg de café es de 5.16%

Page 53: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

DISTRIBUCION NORMALCONSIDERACIONES

Hasta ahora hemos realizado nuestro trabajo de análisis con la distribución normal acerca de la población de consumidores de café alemanes sobre una muestra de 50 de estos, es deducimos características de la población a partir de la muestra.

Apliquemos a nuestro ejemplo la característica de la distribución normal del intervalo de confianza que se presentó anteriormente. Recordemos que esta decía que había una probabilidad del 95% que los datos estuvieran en el siguiente intervalo

Entonces existe una probabilidad de un 95% de que encontremos un alemán que consuma entre 0.644kg y 4.956kg de café al año.

Page 54: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

DISTRIBUCION NORMAL

CONSIDERACIONES

Si esto no ocurre pero escogimos la muestra aleatoriamente un teorema de la estadística nos dice que la desviación estándar de la muestra dividida por la raíz cuadrada de n es igual a la de la población y que las medias son iguales. Por lo cual nuestra función de transformación Z. queda expresada como sigue

Para que en los ejemplos anteriores sea valido realizar la inferencia debemos suponer que la media y desviación estándar de la muestra es igual a la de la población.

Realizar este tipo de análisis es lo que se denomina inferencia y hace parte de la estadística inferencial.

Page 55: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

OTRAS DISTRIBUCIONES DE PROBABILIDAD

De las gráficas podemos observar que tienen diferencias con la distribución normal por ejemplo la simetría y donde se concentran los datos.

La distribución normal que acabamos de estudiar es ampliamente utilizada pero no por ello se puede pensar que es la única, existen otras que se describen otros tipo de distribuciones veamos los siguientes ejemplos

Profundizar sobre estos tipos de distribuciones esta fuera del alcanza de los objetivos de esta guía aunque su manejo es similar al que realizamos con la distribución normal.

Page 56: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

REGRESIÓN LINEALEn ocasiones cuando estamos analizando datos nos interesa conocer como se relacionan con otra variable y así predecir cambios en nuestros datos a partir de modificaciones de la variable. Por ejemplo si tenemos el valor de las importaciones de cierto país en una cantidad de años y queremos conocer que va a pasar en los años venideros.

Esto se realiza aproximando nuestros datos a una función conocida por ejemplo la función lineal gráficamente sería

Aquí los puntos representa los datos y la línea la función conocida

Page 57: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

REGRESIÓN LINEALEn el calculo de la regresión calculamos dos valores notados a y b. El valor a representa la tasa de variación de la variable y con respecto a la variable x , en el ejemplo de las importaciones si este valor diera positivo implica que las importaciones están creciendo y si fuera negativo muestra un decrecimiento. La formula para este cálculo es:

El valor b se interpreta como el valor de la variable y cuando la variable tenga un valor nulo. Su formula es

Veamos con un ejemplo su aplicación.

Page 58: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

REGRESIÓN LINEALEjemploLos siguientes son los datos de importaciones hechas por Alemania de especias y café durante los correspondientes años. El valor está dado en millones de dólares.

Notemos que para aplicar las formulas debemos añadir las siguientes columnas.

x 2006 2007 2008 2009 2010 2011

y

4.336

4.749

7.831

6.627

8.149

8.360

xy

8.698.016

9.531.243

15.724.648

13.313.643

16.379.490

16.811.960

x.x

4.024.036

4.028.049

4.032.064

4.036.081

4.040.100

4.044.121

Ahora mostraremos los cálculos que se necesita para las formulas

Page 59: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

REGRESIÓN LINEAL

Page 60: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

REGRESIÓN LINEAL

2005 2006 2007 2008 2009 2010 2011 20124,000

4,500

5,000

5,500

6,000

6,500

7,000

7,500

8,000

8,500

9,000

f(x) = 831.885714285714 x − 1664167.12380952R² = 0.779772139224243

Con esta fórmula ahora calculemos un valor futuro, por ejemplo las importaciones alemanas de café y especias para el año 2012 y 2015.

y = 831,89x - 1.664.167,12

Si x=2012 entonces y = 831,89(2012) - 1.664.167,12 = 9.586,93

Es decir que en el 2012 las importaciones alemanas de café y especias serán por valor de 9.586,93 millones de dólares.

Page 61: SENA TECNOLOGÍA EN GESTION DE MERCADOS. veamos POBLACIÓN: CONJUNTO EN EL CUAL SUS ELEMENTOS POSEEN CARACTERISTICAS COMUNES QUE SERÁN OBJETO DE ESTUDIO.

REGRESIÓN LINEALSi x=2015 entonces y = 831,89(2015) - 1.664.167,12 = 12.082,59

Es decir que en el 2015 las importaciones alemanas de café y especias serán por valor de 12.082,59 millones de dólares.

Notemos que los valores de los años lo podríamos tomar del 1 al 6 para facilitar los cálculos, y para las dos proyecciones utilizaríamos los valores de 7 y 10.

Analicemos ahora los a y b

El valor a=831,89 significa que las importaciones están creciendo a una tasa de 831,89 millones de dólares al año.

El valor b=-1.664.167,12 es negativo significa que no se realizaron importaciones aunque notemos que un análisis al año 0 no tiene sentido, por lo cual sería mejor para el análisis de la b tomar los años del 1 al 6.