Instructivo para Gráficos de Cajas y Bigotes

5
GRÁFICOS DE CAJAS Y BIGOTES INSTRUCTIVO Es un tipo de gráfico estadístico que permite resumir información utilizando 5 medidas estadísticas: el valor mínimo, el primer cuartil, la media, el tercer cuartil y el valor máximo. Además proporciona una idea de la tendencia central del conjunto de datos, la dispersión de los mismos y la posible presencia de datos atípicos. Un gráfico de este tipo consiste en un rectángulo (caja), donde los lados más largos muestran el recorrido entre cuartiles. Dicho rectángulo se ubica a escala sobre un segmento que tiene como extremos los valores mínimo y máximo de la variable. Las líneas que quedan abajo y arriba de la caja se llaman bigotes. La media esta representada por un punto que generalmente esta ubicado dentro de la caja. En algunas gráficas se acostumbra denotar la mediana como una línea que divide la caja de cuartiles, pero en nuestro caso este estadístico no fue utilizado. Definiciones Promedio: Es un estadístico numérico considerado como la típica de un conjunto de números, se obtiene por la adición de cada uno de estos, dividiendo por el total de miembros. Cuartil: Es una medida de posición dentro de un rango o población de datos ordenados en forma ascendente que,

Transcript of Instructivo para Gráficos de Cajas y Bigotes

Page 1: Instructivo para Gráficos de Cajas y Bigotes

GRÁFICOS DE CAJAS Y BIGOTES

INSTRUCTIVO

Es un tipo de gráfico estadístico que permite resumir información utilizando 5

medidas estadísticas: el valor mínimo, el primer cuartil, la media, el tercer

cuartil y el valor máximo. Además proporciona una idea de la tendencia central

del conjunto de datos, la dispersión de los mismos y la posible presencia de

datos atípicos.

Un gráfico de este tipo consiste en un rectángulo (caja), donde los lados más

largos muestran el recorrido entre cuartiles. Dicho rectángulo se ubica a escala

sobre un segmento que tiene como extremos los valores mínimo y máximo de

la variable. Las líneas que quedan abajo y arriba de la caja se llaman bigotes.

La media esta representada por un punto que generalmente esta ubicado

dentro de la caja.

En algunas gráficas se acostumbra denotar la mediana como una línea que

divide la caja de cuartiles, pero en nuestro caso este estadístico no fue

utilizado.

Definiciones

Promedio: Es un estadístico numérico considerado como la típica de un

conjunto de números, se obtiene por la adición de cada uno de estos,

dividiendo por el total de miembros.

Cuartil: Es una medida de posición dentro de un rango o población de datos

ordenados en forma ascendente que, junto con la mediana, sirven para

separar la población en cuatro porciones, cada una de ellas con la cuarta parte

de los datos.

Q1: “Cuartil 25%, es el valor por debajo del cual queda el 25% de la población

de datos”.

En otras palabras, si se tiene 100 datos ordenados de menor a mayor el Q1 es

el valor que ocupa el puesto 25.

Q3: “Cuartil 75%, es un valor por debajo del cual queda el 75% de la población

de datos”.

Page 2: Instructivo para Gráficos de Cajas y Bigotes

En otras palabras, si se tiene 100 datos ordenados de menor a mayor el Q3 es

el valor que ocupa el puesto 75.

Mediana: Colocando todos los valores en orden creciente, la mediana es

aquel dato que ocupa la posición central Q2 (50%)

Valor Máximo: Es el valor mas alto encontrado dentro del conjunto de datos

reportado por una planta para una variable en particular.

Valor Mínimo: Es el valor mas bajo encontrado dentro del conjunto de datos

reportado por una planta para una variable en particular.

Grafica 1. Componentes de una gráfica de cajas y bigotes

Grafica 2. Casos para interpretación de gráficas

Page 3: Instructivo para Gráficos de Cajas y Bigotes

Caso (A): Nos indica que la dispersión de datos es poca y no existen valores

máximos y mínimos muy alejados de la tendencia; esto nos señala que tan

reproducible o no es una planta. Una caja de cuartiles pequeña indica una

buena reproducibilidad puesto que los datos son muy cercanos entre sí.

Caso (B): Respecto a la caja de cuartiles (A), se puede asegurar que este

conjunto de datos posee una mayor dispersión, además de la posible

existencia de valores atípicos que alargan las líneas de máximo y mínimo.

Caso (C): Existen valores atípicos que sesgaron el promedio y lo sacaron de la

caja de cuartiles.

Ejemplo:

Se tiene el siguiente conjunto de datos:

1 2 2 4 5 6 6 7 9

25% 25% 25% 25%

Como el primer cuartil corresponde al valor por debajo del cual se encuentra el

25% de los datos, se observa que para este caso Q1=2. Asimismo, el tercer

cuartil, que representa el valor por debajo del cual se encuentra el 75% de los

datos, seria en este caso Q3=6.

La mediana en este caso es “5”, valor debajo del cual esta el 50% de todos los

datos, que es diferente al promedio “4.78”.

Lo anterior, llevado a una gráfica de cajas y bigotes, resultaría así: