Post on 22-Jan-2017
Fundamentos de EstadisticaDr. Angel Francisco Villalpando Reyna
Se le conoce como el conjunto de métodos y procedimientos derivados de la recopilación, presentación y análisis de datos con el fin de llegar a una conclusión concreta
Estadística
Estadística
Descriptiva
Se emplea para describir y
analizar conjuntos de
datos provenientes de una población
Inferencial
Es aquella que se emplea para
estimar hábitos o características de una población de
estudio.
Variables
Cualitativas
Son Aquellas variables que no
son medibles, sino son
propiedades que se tiene o no
(discriminativas)
Cuantitativas
Es aquella que se son observables, medibles ya sea
por conteo simple o medición física
Ejemplos: Tamaño, Estado Civil, Nacionalidad
VariablesCuantitativas
Discretas
Son variables derivadas de un conteo simple y esta basado en
números enteros
Continuas
Son variables derivadas de una medición física
empleando escalas continuas, que
incluyen valores decimales o fraccionales
Ejemplos: Numero de Integrantes de una familia o la Edad
Ejemplos: Estatura, Temperatura, longitud, etc.
Conceptos Básicos Población: conjunto compuesto por individuos, objetos o medidas de estudio que tienen cualidades observables y clasificables (N).
Tipos de Población
FinitasPoblaciones
Pequeñas que es posible analizarse
por completo
Infinitas Poblaciones que por si solas no es posible analizarse por completo por
lo que es necesario realizar en muestreo
Muestra: Es un subconjunto o porción de la población ya sea seleccionada arbitrariamente o al azar se representa como (n).
Los Datos: Son el numero de medidas realizadas a la muestra o población y recopiladas por medio de una observación.
Valor Estadístico: Es una medida o valor que se calcula para describir una característica a partir de una muestra.Va
lore
s Est
adís
ticos Tendencia
Central
Tendencia de Dispersión
Parámetro: Característica cuantificable de una población y se establece como referencia de una medida aceptable.
METODOS DE ANALISIS ESTADISTICO
Análisis Estadístico
Datos No Agrupados (conjunto no mayor a 30 elementos
Datos Agrupados (conjunto mayor a 30 elementos)
CONCEPTOS PARA LA TABULACION DE DATOS
Son empleados para calcular los valores estadísticos en conjuntos grandes de datos.
• Frecuencia Absoluta Son considerados como el numero de veces en que se repite una variable o fenómeno.Se representa con la letra fi
Edades de polizones. El Queen Mary navegaba entre Inglaterra y Estados Unidos; en ocasiones se encontraron polizones a bordo. A continuación se listan las edades (en años) de los polizones que iban con rumbo al este y de los que iban al oeste
(datos de Cunard Steamship Co., Ltd.). Compare los dos conjuntos de datos.
• Tamaño de la muestra Indica la cantidad de elementos que conforman la muestra estudiada y se obtiene sumando todas las frecuencias absolutas.Se representa con la letra n
n = fi
• Frecuencia Relativa Es la proporción de datos que se encuentran en cada una de las clases. En valor fracción o porcentual. Se obtiene dividiendo la frecuencia del intervalo, entre el tamaño de la muestra (n).
Se representa con la letra hi
• Frecuencia Relativa Acumulada Es la proporción de datos acumulados que se encuentran hasta cierta clase o renglón.
Se representa con la letra Hi
j = Frecuencia
• Frecuencia Absoluta Acumulada Es la cantidad de datos acumulados que se encuentran hasta cierta clase o renglón.
Se representa con la letra Fi
j = Frecuencia
• Rango o Recorrido
Es la diferencia entre el valor máximo y el valor mínimo de la muestra.
Se representa con la letra R
R = x (max de muestra) - x (min de muestra)
x = valor
• Numero de Intervalos
Es el numero de grupos en que se puede dividir una serie de datos.
Se representa con la letra m
• Amplitud del Intervalo
El espacio entre el valor superior e inferior de cada clase, intervalo o renglón.Se representa con la letra a
• Limites de un intervaloSon los valores extremos de cada clase o renglón.Se representa con las letras L inf. y L sup
• Limites reales de un intervalo se obtiene calculando el promedio entre el valor superior de una clase y la inferior de la clase continua.Se representa con las letras Lr inf. y Lr sup
• Marca de Clase Es el punto medio de cada intervalo (clase)
x =
Intervalo f h F H xi Limite Real
Tipos de Graficos
Tipos de Gráficos • Los gráficos circulares se usan para mostrar
los comparativos, entre los comportamientos de frecuencias relativas, absolutas o porcentuales
• Pictogramas Similar a los gráficos circulares, pero la frecuencia es representada por medio de un dibujo o figura representativa dependiendo del estudio,
• Graficas de barras Son gráficos empleados para representar una tabla de frecuencias con variables discretas de unos pocos valores.
• Graficas de líneas Son gráficos lineales que se emplean para mostrar los cambios entre las frecuencias relativas o absolutas, de variables continuas o discretas.
• Histograma Son gráficos de barras en donde se pueden emplear variables continuas y frecuencias absolutas o relativas y emplea escalas continuas en sus ejes.
• Ojiva de Frecuencias Son gráficos puntos que representan la evolución de las frecuencias, determina los cambios de pendiente y por lo tanto el comportamiento de la muestra, acorde a los valores.
Medidas de Tendencia Central
En todo análisis y/o interpretación se pueden utilizar diversas medidas descriptiva que representan las propiedades de tendencia central, dispersión y forma para extraer y resumir las principales características de los datos.
Medidas de tendencia central
La mayor parte de los conjuntos de datos muestran una tendencia a agruparse alrededor de un punto "central" y por lo general es posible elegir algún valor que describa todo un conjunto de datos. Las medidas de tendencia central a estudiar son: media aritmética, mediana y moda.
La media aritmética (también denominada media). Se calcula sumando todas las observaciones de un conjunto de datos, dividiendo después ese total entre el número total de elementos involucrados
Media aritmética
Para datos no Agrupados
Media aritmética
Para datos no Agrupados
Media aritmética
La mediana es el valor que se encuentra en el centro de una secuencia ordenada de datos. La mediana no se ve afectada por observaciones extremas en un conjunto de datos.
Por ello, cuando se presenta alguna información extrema, resulta apropiado utilizar la mediana, y no la media, para describir el conjunto de datos.Su símbolo es Me
Mediana
Para datos no Agrupados
Mediana
Para datos Agrupados
Mediana
es el primer intervalo cuya frecuencia acumulada supera a
es el límite real inferior del intervalo de la mediana.
n es el número de datos.
es la frecuencia acumulada anterior al intervalo de la mediana.
es la frecuencia absoluta del intervalo de la mediana.
es la amplitud del intervalo
Donde
La moda es el valor de un conjunto de datos que aparece con mayor frecuencia. Se le obtiene fácilmente a partir de un arreglo ordenado. A diferencia de la media aritmética, la moda no se afecta ante la ocurrencia de valores extremos.
Sin embargo, sólo se utiliza la moda para propósitos descriptivos porque es más variable que las anteriores.
Moda
Para datos No agrupadosNo existe formula solo el dato que mas se repite. se lee como Mo
ejemplo 1,2,3,3,3,5,7,9 Mo =3
Moda
Para datos AgrupadosNo existe formula solo el dato que mas se repite. se lee como Mo
Moda
es el intervalo de mayor frecuencia absoluta
es el límite real inferior del intervalo i.
es la frecuencia absoluta del intervalo anterior.
es la frecuencia absoluta del intervalo posterior.
es la amplitud del intervalo
Donde