Post on 05-Feb-2016
description
CONCEPTOS BASICOS
ESTADISTICA Es la parte de las matemáticas que se encarga del estudio de una determinada característica en una población, recogiendo los datos, organizándolos en tablas, representándolos gráficamente y analizándolos para sacar conclusiones de dicha población.
La estadística recolecta, organiza, presenta, analiza e interpreta.
TIPOS DE ESTADISTICA
Estadística descriptiva. Realiza el estudio sobre la población completa, observando una característica de la misma y calculando unos parámetros que den información global de toda la población.
Estadística inferencial. Realiza el estudio descriptivo sobre un subconjunto de la población llamado muestra y, posteriormente, extiende los resultados obtenidos a toda la población.
POBLACION
Es el conjunto de todos los valores de un fenómeno o propiedad que se quiere observar.
También se usa el nombre de variable para designar a este conjunto.
Por ejemplo, las edades de los escolares de enseñanza media del país, las preferencias de marca
de jabón manifestadas por un conjunto de consumidores, los diámetros de los ejemplares de un
objeto producido por una máquina, etc.
TIPOS DE ESTADISTICA
ESTADISTICA DESCRIPTIVA ESTADISTICA INFERENCIAL
Se ocupa de la colección y clasificación de información, de su resumen en cuadros y gráficos adecuados que resuman en forma apropiada la información captada.
Se ocupa de los procesos de estimación, análisis y prueba de hipótesis con el propósito de llegar a conclusiones que brinden una adecuada base científica para la toma de decisiones tomando como base la información captada por la muestra.
MUESTRA
Es la parte de la población que efectivamente se mide, con el objeto de obtener información
acerca de toda la población. La selección de la muestra se hace por un procedimiento que
asegure en alta grado que sea representativa de la población.
La muestra es una herramienta de la investigación científica, cuya función básica es determinar
que parte de la población debe examinarse, con la finalidad de hacer inferencias sobre dicha
población.
Para que una muestra sea representativa, y por lo tanto útil, debe de reflejar las similitudes y
diferencias encontradas en la población, es decir ejemplificar las características de ésta.
Los errores más comunes que se pueden cometer son:
1.- Hacer conclusiones muy generales a partir de la observación de sólo una parte de la
Población, se denomina error de muestreo.
2.- Hacer conclusiones hacia una población mucho más grandes de la que originalmente se
tomó la muestra. Error de Inferencia.
TIPOS DE MUESTREO
Existen diferentes criterios de clasificación de los diferentes tipos de muestreo, aunque en
general pueden dividirse en dos grandes grupos: métodos de muestreo probabilísticos y
métodos de muestreo no probabilísticos.
MUESTREO PROBABILISTICO: Son aquellos que se basan en el principio de
equiprobabilidad, es decir, aquellos en los que todos los individuos tienen la misma
probabilidad de ser elegidos para formar parte de una muestra.
MUESTREO NO PROBABILISTICO: Este tipo de muestra no tiene la certeza de que la
muestra extraída sea representativa, ya que no todos los sujetos de la población tienen la
misma probabilidad de ser elegidos. En general se seleccionan a los sujetos siguiendo
determinados criterios procurando, en la medida de lo posible, que la muestra sea
representativa.
Ventajas e inconvenientes de los distintos tipos de muestreo probabilístico
CARACTERISTICAS VENTAJAS INCONVENIENTES
Aleatorio simple
Se selecciona una muestra
de tamaño n de una
población de N unidades,
cada elemento tiene una
probabilidad de inclusión
igual y conocida de n/N.
Sencillo y de fácil comprensión.
Cálculo rápido de medias y varianzas.
Se basa en la teoría estadística, y por tanto existen paquetes informáticos para analizar los datos
Requiere que se posea de
antemano un listado
completo de toda la
población. Cuando se
trabaja con muestras
pequeñas es posible que no
represente a la población
adecuadamente.
Sistemático
Conseguir un listado de los N elementos de la poblaciónDeterminar tamaño muestral n.Definir un intervalo k= N/n.Elegir un número aleatorio, r, entre 1 y k (r= arranque aleatorio).Seleccionar los elementos de
la lista.
Fácil de aplicar. No siempre es
necesario tener un listado de toda la población.
Cuando la población está ordenada siguiendo una tendencia conocida, asegura una cobertura de unidades de todos los tipos.
Requiere que se posea de
antemano un listado
completo de toda la
población. Cuando se
trabaja con muestras
pequeñas es posible que no
represente a la población
adecuadamente.
En ciertas ocasiones resultará conveniente estratificar la muestra según ciertas variables de interés.
Tiende a asegurar que la muestra represente
Se ha de conocer la distribución en la población de las
Estratificado
Para ello debemos conocer la composición estratificada de la población objetivo a hacer un muestreo. Una vez calculado el tamaño muestral apropiado, este se reparte de manera proporcional entre los distintos estratos definidos en la población usando una simple regla de tres.
adecuadamente a la población en función de unas variables seleccionadas.
Se obtienen estimaciones más precisa
Su objetivo es conseguir una muestra lo más semejante posible a la población en lo que las variables estratificadoras se refiere.
variables utilizadas para la estratificación
Conglomerados
Se realizan varias fases de muestreo sucesivas (polietápico)La necesidad de listados de
las unidades de una etapa se
limita a aquellas unidades de
muestreo seleccionadas en la
etapa anterior.
Es muy eficiente cuando la población es muy grande y dispersa.
No es preciso tener un listado de toda la población, sólo de las unidades primarias de muestreo.
El error estándar es mayor que en el muestreo aleatorio simple o estratificado.
El cálculo del error estándar es complejo.
VARIABLES
Es una característica observable que varía entre los diferentes individuos de una población. La
información que disponemos de cada individuo es resumida en variables.
Las variables representan y sintetizan conceptualmente las propiedades o características de las
unidades de análisis, a las cuales se les pueden adjudicar distintos valores numéricos
Clasificación de las variables estadísticas: cualitativas y cuantitativas
(Discretas y continuas).
Hemos visto que un carácter estadístico es una propiedad que permite clasificar a los individuos
de la población.
Hay dos tipos:
Caracteres estadísticos cuantitativos:
Se dice que un carácter estadístico es cuantitativo cuando sus modalidades son medibles
(expresables como números y cumpliendo unas propiedades de medida.). Ejemplos: peso, talla,
pulso, edad, etc.
Caracteres estadísticos cualitativos:
Se dice que un carácter estadístico es cualitativo cuando sus modalidades no pueden ser
medidas. Ejemplos: raza, sexo, profesión, estado civil, etc.
Nota: Es evidente, por ejemplo, que si el carácter es el estado civil, podíamos asignarle a sus
modalidades los siguientes números: A los casados 1, solteros 0, viudos un 2, etc., pero este
carácter no es medible en el sentido de que el 1>0 por ejemplo, expresión que no tiene sentido.
Ejemplos:
La profesión es un carácter cualitativo.
Dentro del podemos tener modalidades: profesor, peón, abogado, etc.
Lo anterior determina un atributo que puede ser observado pero no medido. Podemos contar el
número de abogados o profesores, pero no medirlos. En cambio, un carácter cuantitativo
determina una variable que llamaremos variable estadística. Atributos: se le suele llamar a las
variables cualitativas.
La talla es un carácter cuantitativo. Es por lo tanto una variable estadística que podemos medir,
puede tomar diversos valores: 1.60, 1.62,......., 1.92,....etc.
Las variables estadísticas cuantitativas pueden ser: continuas o discretas.
Discreta: es aquella que solo puede tomar un número finito o infinito numerable de valores.
Dicho con otras palabras: cuando no puede tomar cualquier valor entre dos valores dados. O
bien solo toma valores aislados, generalmente enteros.
Ejemplo: el número de libros en una estantería, las tiradas de un dado, el número de pétalos de
una flor, etc.
Continua: cuando puede tomar, al menos teóricamente, todos los valores posibles dentro de un
cierto intervalo de la recta real.
Ejemplo: la temperatura de los enfermos entre 35 y 40 grados, aunque en la práctica sea
imposible medir temperaturas aproximando hasta la cuarta o quinta cifra decimal. En la
práctica son variables estadísticas continuas aquellas que fijamos como suceso elemental las
que entren en un intervalo.
DATOS NO AGRUPADOS
Son datos recolectados, normalmente en una cantidad pequeña, los cuales se analizan tal y como fueron recolectados, es decir, que no se cuentan o clasifican para analizarse.
Media Aritmética:
Medida de tendencia central usualmente llamada promedio, se define como la división de la
suma de todos los valores entre el número de datos.
El promedio aritmético de un conjunto de valores (x1 x2 x3 x4 … xn) es:
x = ∑i=1
n
X i
n =
x1+ x2+ x3 + x4 +…+ xn
n
Ejercicios:
1. Un cazador sale durante cinco noches a los faldeos de un cerro y diariamente trae, el siguiente número de conejos: 15, 17, 13, 18, 17. Luego, la media aritmética del número de conejos cazados diariamente es:
Solución
La media aritmética o promedio es:
x=15+17+13+18+17
5=80
5=16
2. La media aritmética del siguiente grupo de datos 7, 20 13, 14, 6, 9, 1 es :
Solución
x=7+20+13+14+6+9+1
7=70
7=10
3. El promedio aritmético de los siguientes puntajes: 12, 15, 23, 18, 32, 48, 9 es:
Solución
x=12+15+23+18+32+48+97
=1577
=22.4
4. Se sabe que el promedio del siguiente grupo de datos 2, 4, 6, 8, x es 10. ¿cuál es el valor de “X”?
Solución
10=2+4+6+8+x5
=20+ x5
50=20+x→ x=30
5. La media entre cinco datos es 5 y se sabe que los cuatro primeros son: 4, 3, 9 y 7, entonces, el dato que falta es:
Solución
5=4+3+9+7+x5
=23+x5
25=23+x→ x=2
Mediana:
Es el valor que ocupa la posición central de un conjunto de datos, los cuales han sido
previamente ordenados, ya sea de manera creciente o decreciente.
La ubicación de la mediana de n datos ordenados se determina por:
n+12
Ejemplos:
Cuando la cantidad de datos es impar.
Determine la mediana de los siguientes datos:
6; 5; 9; 10; 15; 7; 12
Solución
Ordenamos los datos de forma creciente
5; 6; 7; 9; 10; 12; 15 ubicacion mediana→7+1
2=4
Me = 9
Cuando la cantidad de dato es par.
Determine la mediana de los siguientes datos:
10; 13; 11; 9; 20; 7; 6; 4; 18; 16
Solución
Ordenamos en forma creciente
4; 6; 7; 9; 10; 11; 13; 16; 18; 20 ubicacionmediana→10+1
2=5.5
Me=10+112
=10.5
Moda
La moda es la medida que se relaciona con la frecuencia con que se presenta el dato o los datos
con mayor incidencia, con lo que se considera la posibilidad de que exista más de una moda
para un conjunto de datos. La notación más frecuente es la siguiente: Mo y x̂ . Esta medida se
puede aparecer tanto para datos cualitativos como cuantitativos. Se dice que cuando un
conjunto de datos tiene una moda la muestra es unimodal, cuando tiene dos modas bimodal,
cuando la muestra contiene más de un dato repetido se dice que es multimodal y un último
caso es cuando ningún dato tiene una frecuencia, en dicho caso se dice que la muestra es
amodal.
Es el valor, clase o categoría que ocurre con mayor frecuencia y sus características son:
- Puede no existir o existir más de una moda
- Su valor no se ve afectado por los valores extremos en los datos
- Se utiliza para analizar tanto la información cualitativa como la cuantitativa
- Es una medida “inestable” cuando en número de datos es reducido.
Ejemplos:
1.- Determinar la moda del siguiente conjunto de datos:
v v v v
a) 1, 2, 3, 3, 4, 5, 6, 7, 7, 3, 1, 9, 3
La moda de este conjunto de datos es igual a 3 y si considera unimodal
b) 1, 2, 3, 4, 4, 5, 2, 1, 3, 4, 2, -3, 4, 6, 3, 3
Las modas de este conjunto de datos son 3 y 4 ya que ambas tienen la más alta frecuencia, por
lo que la muestra es bimodal
c) 1, 2, 3, 4, 5, 6, 7, 8, 9
La muestra no contiene ningún dato repetido por lo que se considera que la muestra es amodal.
Gráficamente eso se puede reflejar mediante el análisis de un histograma de frecuencias.
DATOS AGRUPADOS
UNIMODAL BIMODAL AMODAL
Es aquella distribución en la que la disposición tabular de los datos estadísticos se encuentra
ordenada en clases y con la frecuencia de cada clase; es decir, los datos originales de varios
valores adyacentes del conjunto se combinan para formar un intervalo de clase.
Su fin es resumir la información.
Generalmente, los elementos son de mayor tamaño, por lo cual requieren ser agrupados,
esto implica: ordenar, clasificar y expresar los en una tabla de frecuencias.
Se agrupa a los datos, si se cuenta con 20 o más elementos. Aunque contemos con más
de 20 elementos, debe de verificarse que los datos n sean significativos, Esto es: que la
información sea “repetitiva”, también debemos de verificar que los datos puedan
clasificarse. Y que dicha clasificación tiene coherencia y lógica (de acuerdo a lo que se
nos está pidiendo). Una vez que ya hemos ordenado y clasificado, presentaremos la
información obtenida mediante una “tabla de frecuencias”.
La agrupación de los datos puede ser simple o mediante intervalos de clase.
Media
Se calcula sumando todos los productos de marca clase con la frecuencia absoluta respectiva y
su resultado dividirlo por el número total de datos:
Ejemplo:
1. Edad de los estudiantes de Topografía SENCICO
Clase Frecuencia (f) Punto Medio (X) f .X
17 – 19 71 18 1278
19 – 21 50 20 1000
21 – 23 41 22 902
23 – 25 53 24 1272
25 – 27 23 26 598
n = 238 ∑ ¿5050
❑X
−¿=∑ fX
n→
5050238
=21.22 años¿
Se determina que la media de las edades de los estudiantes de topografía es de 21.22 años.
2. En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones que muestra la
tabla. Calcula la puntuación media
Clase Frecuencia (f) Punto Medio (X) f .X
10 – 20 1 15 15
20 – 30 8 25 200
30 – 40 10 35 350
40 – 50 9 45 405
50 – 60 8 55 440
60 – 70 4 65 260
70 – 80 2 75 150
n = 42 ∑ ¿1820
❑X
−¿=∑ fX
n→
182042
=43.33 ¿
Mediana
Es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de menor
a mayor.
La mediana se representa por Me.
La mediana se puede hallar sólo para variables cuantitativas.
Cálculo de la mediana para datos agrupados
La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de
la suma de las frecuencias absolutas.
Es decir tenemos que buscar el intervalo en el que se encuentre. N / 2
Ejemplo:
1. Distribución de 250 personas según su edad, que utilizan el servicio de Windows Live
Messenger.
Edades Frecuencia FA
5 – 10 11 11
10 – 15 23 34
15 – 20 61 95
20 – 25 60 155
25 – 30 45 200
30 – 35 20 220
40 – 45 15 235
50 - …. 15 250
n = 250
Localización: n2
→250
2→125
Mediana=L+
n2−FA
f(i )
Mediana=20+
2502
−95
60(5 ) →22.5 años
2. Calcular la mediana de una distribución estadística que viene dada por la siguiente tabla:
N Frecuencia FA
60 – 63 5 5
63 – 66 18 23
66 – 69 42 65
69 – 72 27 92
72 – 75 8 100
n = 100
Localización: n2
→100
2→50
Mediana=L+
n2−FA
f(i )
Mediana=66+
1002
−23
42(3 ) →67.93
Moda
Es el valor que representa la mayor frecuencia absoluta. En tablas de frecuencias con datos
agrupados, hablaremos de intervalo modal.
La moda se representa por Mo.
Mo=li+(D1
D1+D2
) A i
Dónde:
Li: Limite inferior de la clase modal .
D1 :esel delta de frecuencia absolutamodal y la frecuencia absoluta premodal .
D2 :esel delta de frecuencia absolutamodal y la frecuencia absoluta postmodal .
Ai :amplitud delintervalo modal .
Ejemplo:
1. Determinar la Moda, a partir de la tabla presentada.
EdadMarca
clase (x i)Frecuencia
absoluta (f i)Frecuencia
acumulda (f i)10 – 20 15 8 820 – 30 25 20 2830 – 40 35 14 4240 – 50 45 8 5050 – 60 55 2 5260 – 70 65 2 5470 – 80 75 1 55
n = 55
Mo=li+( D 1
D1+D2)A i li=20
D1=20−8=12
D2=20−14=6
Ai=10
Mo=20+( 1212+6 )10 →26.66
Ejercicios resueltos de media, moda y mediana
1. Sea una distribución estadística que viene dada por la siguiente tabla
Datos(X i)
FrecuenciaAbsoluta¿)
61 564 1867 4270 2773 8
100
Calcular la media, mediana y moda
Solución: Primero se calcula las columnas de: x i . f i y de las frecuencias acumuladas FA.
Datos(X i)
FrecuenciaAbsoluta¿)
x i . f iFrecuencia
acumulada FA
61 5 305 564 18 1152 2367 42 2814 6570 27 1890 9273 8 584 100
100 6745Calculamos la media o promedio
X
−¿=∑ fX
n→
6745100
=67.45 ¿
Calculamos la mediana
Para calcular la mediana Me, usamos la expresión n+1
2
n+12
→100+1
2→50.5
Me = 67
Como se sabe que la moda es el dato que más se repite por lo tanto Mo = 67.