Estadística introductoria folleto

download Estadística introductoria folleto

of 13

Transcript of Estadística introductoria folleto

1

UNAN-LEON

EstadsticaLa estadstica es comnmente considerada como una coleccin de hechos numricos expresados en trminos de una relacin sumisa, y que han sido recopilados a partir de otros datos numricos. Kendall y Buckland (citados por Gini V. Glas / Julian C. Stanley, 1980) definen la estadstica como un valor resumido, calculado, como base en una muestra de observaciones que generalmente, aunque no por necesidad, se considera como una estimacin de parmetro de determinada poblacin; es decir, una funcin de valores de muestra. "La estadstica es una tcnica especial apta para el estudio cuantitativo de los fenmenos de masa o colectivo, cuya mediacin requiere una masa de observaciones de otros fenmenos ms simples llamados individuales o particulares". (Gini, 1953. Murria R. Spiegel, (1991) dice: "La estadstica estudia los mtodos cientficos para recoger, organizar, resumir y analizar datos, as como para sacar conclusiones vlidas y tomar decisiones razonables basadas en tal anlisis. "La estadstica es la ciencia que trata de la recoleccin, clasificacin y presentacin de los hechos sujetos a una apreciacin numrica como base a la explicacin, descripcin y comparacin de los fenmenos". (Yale y Kendal, 1954). Poblacin: El concepto de poblacin en estadstica va ms all de lo que comnmente se conoce como tal. Una poblacin se precisa como un conjunto finito o infinito de personas u objetos que presentan caractersticas comunes. "Una poblacin es un conjunto de todos los elementos que estamos estudiando, acerca de los cuales intentamos sacar conclusiones". Levin & Rubin (1996). "Una poblacin es un conjunto de elementos que presentan una caracterstica comn". Cadenas (1974). Ejemplo: Los miembros del Colegio de Ingenieros. El tamao que tiene una poblacin es un factor de suma importancia en el proceso de investigacin estadstica, y este tamao vienen dado por el nmero de elementos que constituyen la poblacin, segn el nmero de elementos la poblacin puede ser finita o infinita. Cuando el nmero de elementos que integra la poblacin es muy grande, se puede considerar a esta como una poblacin infinita, por ejemplo; el conjunto de todos los nmeros positivos. Una poblacin finita es aquella que est formada por un limitado nmero de elementos, por ejemplo; el nmero de estudiante del Instituto de Somoto. Cuando la poblacin es muy grande, es obvio que la observacin de todos los elementos se dificulte en cuanto al trabajo, tiempo y costos necesario para hacerlo. Para solucionar este inconveniente se utiliza una muestra estadstica. Es a menudo imposible o poco prctico observar la totalidad de los individuos, sobre todos si estos son muchos. En lugar de examinar el grupo entero llamado poblacin o universo, se examina una pequea parte del grupo llamada muestra. Muestra: "Se llama muestra a una parte de la poblacin a estudiar que sirve para representarla". Murria R. Spiegel (1991). "Una muestra es una coleccin de algunos elementos de la poblacin, pero no de todos". Levin & Rubin (1996). "Una muestra debe ser definida en

2

UNAN-LEON

base de la poblacin determinada, y las conclusiones que se obtengan de dicha muestra solo podrn referirse a la poblacin en referencia", Cadenas (1974). Ejemplo; El estudio realizado a 50 miembros del Colegio de Ingenieros. El estudio de muestras es ms sencillo que el estudio de la poblacin completa; cuesta menos y lleva menos tiempo. Por ltimo se aprobado que el examen de una poblacin entera todava permite la aceptacin de elementos defectuosos, por tanto, en algunos casos, el muestreo puede elevar el nivel de calidad.Una muestra representativa contiene las caractersticas relevantes de la poblacin en las mismas proporciones que estn incluidas en tal poblacin. Tipos de muestreo Existen dos mtodos para seleccionar muestras de poblaciones; el muestreo no aleatorio o de juicio y el muestreo aleatorio o de probabilidad. En este ltimo todos los elementos de la poblacin tienen la oportunidad de ser escogidos en la muestra. Una muestra seleccionada por muestreo de juicio se basa en la experiencia de alguien con la poblacin. Algunas veces una muestra de juicio se usa como gua o muestra tentativa para decidir como tomar una muestra aleatoria ms adelante. Las muestras de juicio evitan el anlisis estadstico necesario para hacer muestras de probabilidad. Variables y Atributos: Las variables, tambin suelen ser llamados caracteres cuantitativos, son aquellos que pueden ser expresados mediante nmeros. Son caracteres susceptibles de medicin. Como por ejemplo, la estatura, el peso, el salario, la edad, etc. Todos los elementos de la poblacin poseen los mismos tipos de caracteres, pero como estos en general no suelen representarse con la misma intensidad, es obvio que las variables toman distintos valores. Por lo tanto estos distintos nmeros o medidas que toman los caracteres son los "valores de la variable". Todos ellos juntos constituyen una variable. Ejemplo; El estado civil de cada uno de los estudiantes del curso de estadsticas I, no se presenta en la misma modalidad en todos. Formas de Observar la Poblacin: 1. Atendiendo a la fuente se clasifican en directa o indirecta. o Observacin directa: es aquella donde se tienen un contacto directo con los elementos o caracteres en los cuales se presenta el fenmeno que se pretende investigar, y los resultados obtenidos se consideran datos estadsticos originales. Para Ernesto Rivas Gonzlez (1997) "Investigacin directa, es aquella en que el investigador observa directamente los casos o individuos en los cuales se produce el fenmeno, entrando en contacto con ellos; sus resultados se consideran datos estadsticos originales, por esto se llama tambin a esta investigacin primaria". Ejemplo; el seguimiento de la poblacin agrcola por ao, llevado en una determinada granja. o Observacin Indirecta: es aquella donde la persona que investiga hace uso de datos estadsticos ya conocidos en una investigacin anterior, o de

3

UNAN-LEON

datos observados por un tercero (persona o entidad). Con el fin de deducir otros hechos o fenmenos. Ejemplo; si un investigador pretende estudiar la produccin por aos de una granja avcola, en sus ltimos cinco aos de produccin, tendra que hacer un seguimiento, a tal fin recurrira a las observaciones que posee la oficina administrativa de la granja durante estos cinco aos, o dirigirse a la oficina de estadstica, llevada en el ministerio de produccin y comercio (M.P.C) de la localidad donde est registrada dicha granja. Es de notar que el investigador se vale de observaciones realizadas por terceros. 2. Atendiendo a la periodicidad, puede ser continua, peridica o circunstancial. o Una observacin continua; como su nombre lo indica es aquella que se lleva acabo de un modo permanente. Ejemplo: la contabilidad comercial, llevada en cuanto a compras, ventas y otras operaciones que se van registrando a medida que van producindose. o Una observacin peridica; es aqulla que se lleva a cabo a travs de perodos de tiempo constantes. Estos perodos de tiempos pueden ser semanas, trimestres, semestres, aos, etc. Lo que debemos destacar es que los perodos de tiempo tomados como unidad deben tomarse constantes en los posible. Ejemplo; el registro llevado por la Oficinas de Control de Estudios de la UNESR, en cuanto a la inscripcin de los estudiantes por semestre. o La observacin circunstancial, es aquella que se efecta en forma ocasional o espordica, esta observacin hecha ms por una necesidad momentnea, que de carcter regular o permanente. Ejemplo; la obtencin de nmeros de aulas utilizadas y no utilizadas en los colegios pertenecientes al municipio San Carlos del Estado Cojedes. 3. Atendiendo a la cobertura; pueden ser exhaustiva, parcial o mixta o Observacin Exhaustiva. Cuando la observacin es efectuada sobre la totalidad de los elementos de la poblacin se habla de una observacin exhaustiva. o Observacin Parcial. Dados que las poblaciones en general son grandes, la observacin de todos sus elementos se ve imposibilitada. La solucin para superar este inconveniente es observar una parte de esta poblacin. o Observacin Mixta. En este tipo de observacin se combinan adecuadamente la observacin exhaustiva con la observacin parcial. Por lo general, este tipo de observaciones se lleva a cabo de tal manera que los caracteres que se consideran bsicos se observan exhaustivamente y los otros mediante una muestra; o bien cuando la poblacin es muy grande, parte de ella se observa parcialmente. Censo: Se entiende por censo aquella numeracin que se efecta a todos y cada uno de los caracteres componentes de una poblacin. Encuesta: Se entiende por encuesta las observaciones realizadas por muestreo, es decir son observaciones parciales.

4

UNAN-LEON

Estadstica Descriptiva: Tienen por objeto fundamental describir y analizar las caractersticas de un conjunto de datos, obtenindose de esa manera conclusiones sobre las caractersticas de dicho conjunto y sobre las relaciones existentes con otras poblaciones, a fin de compararlas. No obstante puede no solo referirse a la observacin de todos los elementos de una poblacin (observacin exhaustiva) sino tambin a la descripcin de los elementos de una muestra (observacin parcial). Estadstica Inductiva: Est fundamentada en los resultados obtenidos del anlisis de una muestra de poblacin, con el fin de inducir o inferir el comportamiento o caracterstica de la poblacin, de donde procede, por lo que recibe tambin el nombre de Inferencia estadstica. El objetivo de la inferencia en investigacin cientfica y tecnolgica radica en conocer clases numerosas de objetos, personas o eventos a partir de otras relativamente pequeas compuestas por los mismos elementos. Medicin de Caracteres Medicin: Existen diversas definiciones del trmino "medicin", pero estas dependen de los diferentes puntos de vista que se puedan tener al abordar el problema de la cuantificacin y el proceso mismo de la construccin de una escala o instrumento de medicin. En general, se entiende por medicin la asignacin de nmeros a elementos u objetos para representar o cuantificar una propiedad. . Las variables y su medicin: Una variable es un smbolo, tal como X, Y, H, x B, que pueden tomar un conjunto prefijado de valores, llamado dominio de esa variable. Para Murray R. Spiegel (1991) "una variable que puede tomar cualquier valor entre dos valores dados se dice que es una variable continua en caso contrario diremos que la variable es discreta". Las variables, tambin llamadas caracteres cuantitativos, son aquellas cuyas variaciones son susceptibles de ser medidas cuantitativamente, es decir, que pueden expresar numricamente la magnitud de dichas variaciones. Ejemplo:Un preescolar de esta ciudad se procedi a recoger las medidas de talla y peso de los nios que a este asisten. Nio Peso Talla Jos 18,300 1,15 Julio 20,500 1,20 Pedro 19,000 1,10 Luis 18,750 1,18 Las variables discretas sern aquellas que pueden tomar solo un nmero limitado de valores separados y no continuos; son aquellas que solo toman un determinado nmeros de valores, porque entre dos valores consecutivos no pueden tomar ningn otro; por ejemplo el nmero de estudiantes de una clase es una variable discreta ya que solo tomar los valores 1, 2, 3, 4... ntese que no encontramos valor como 1,5 estudiantes

5

UNAN-LEON

Datos Estadsticos: Los datos estadsticos no son otra cosa que el producto de las observaciones efectuadas en las personas y objetos en los cuales se produce el fenmeno que queremos estudiar. Dicho en otras palabras, son los antecedentes (en cifras) necesarios para llegar al conocimiento de un hecho o para reducir las consecuencias de este. Los datos estadsticos se pueden encontrar de forma no ordenada, por lo que es muy difcil en general, obtener conclusiones de los datos presentados de esta manera. Para poder obtener una precisa y rpida informacin con propsitos de descripcin o anlisis, estos deben organizarse de una manera sistemtica; es decir, se requiere que los datos sean clasificados. Esta clasificacin u organizacin puede muy bien hacerse antes de la recopilacin de los datos. Ejemplo:Si se quiere conocer las caractersticas de los estudiantes del 1er ao de trabajo social que solicitan prstamo a la biblioteca de dicha Universidad, la recoleccin de la informacin debe clasificar a cada estudiante sobre la base de: Carrera que estudia, edad, semestre de estudios, etc. Vemos pues que la clasificacin marca la pauta de la clase de datos que debe ser obtenido. Clasificacin de los datos Los datos estadsticos pueden ser clasificados en cualitativos, cuantitativos, cronolgicos y geogrficos. Datos Cualitativos: cuando los datos son cuantitativos, la diferencia entre ellos es de clase y no de cantidad. Ejemplo: Si deseamos clasificar los estudiantes que cursan la materia de estadstica I por su estado civil, observamos que pueden existir solteros, casados, divorciados, viudos. Datos cuantitativos: cuando los valores de los datos representan diferentes magnitudes, decimos que son datos cuantitativos. Ejemplo: Se clasifican los estudiantes del 1er ao de trabajo social de acuerdo a sus notas, observamos que los valores (nota) representan diferentes magnitudes. Datos cronolgicos: cuando los valores de los datos varan en diferentes instantes o perodos de tiempo, los datos son reconocidos como cronolgicos. Ejemplo: Al registrar los promedios de notas de los Alumnos del 1er ao de trabajo social en los diferentes semestres. Datos geogrficos: cuando los datos estn referidos a una localidad geogrfica se dicen que son datos geogrficos. Ejemplo Series o distribuciones estadsticas: Anteriormente hemos sealado que la estadstica, no se encarga del estudio de un hecho aislado, sino que tienen por objeto de los colectivos. Pues bien cuando se realiza una investigacin se obtiene una masa de datos que deben ser organizados para disponerlos en un orden, arreglo o secuencia lgica, con el fin de facilitar el anlisis de los mismos esta coleccin de datos numricos obtenidos de la observacin, que se clasifican y ordenan segn un determinado criterio, se denominan "series estadsticas", tambin conocidas como "distribucin estadstica".

6

UNAN-LEON

Clasificacin de las series estadsticas: 1. Series temporales o cronolgicas; estas se definen como una masa o conjunto de datos producto de la observacin de un fenmeno individual o colectivo, cuantificable en sucesivos instantes o periodos de tiempo. Ejemplo:Produccin nacional de madera en Rola en m Rollizos (periodo 1993 1998) Aos Produccin (m rollizos) 1993 1994 1995 1996 1997 1.161.061,454 981.668,626 1.087.926,142 1.440.306,250 1.618.075,000

1998 1.027.177,876 Es importante resaltar que cuando se trata de series temporales o cronolgicas, se debe especificar el instante o el periodo de tiempo a los que se refiere los caracteres en estudio. Cuando nos referimos a instantes de tiempo, por el hecho de que la observacin se hace en un momento especfico de tiempo. Ejemplo:Plantaciones forestales ejecutadas a nivel nacional, al 31 de diciembre de cada ao entre 1997 2001. 2. Series atemporales; cuando las observaciones de un fenmeno se hacen referidas al mismo instante o intervalo de tiempo, nos encontramos ente una serie atemporal. Aqu el tiempo no va incluido a cada observacin, puesto que es el mismo tiempo para todas ellas. Este tipo de observacin proporciona una "visin instantnea" de los fenmenos o caracteres de los componentes del colectivo en estudio. Ejemplo: Las notas de las participantes en la materia de estadstica I en el periodo acadmico que termin en septiembre del 2001. 2.1) Series de frecuencia; cuando realizamos un estudio de cada uno de los elementos que componen la poblacin o muestra bajo anlisis, observamos que en general, hay un nmero de veces en que aparece repetido un mismo valor de una variable, o bien repeticiones de la misma modalidad de un atributo. Este nmero de repeticiones de un resultado, recibe el nombre de frecuencia absoluta o simplemente frecuencia. El procedimiento mediante el cual se realiza el conteo, para as determinar el nmero de veces que cada dato se repite, recibe el nombre de tabulacin. Ejemplo: Consideremos las edades de 20 nios, pertenecientes al Preescolar Blanca de Prez, ubicado en la urbanizacin Monseor Padilla 56543 63454 34653 43646

7

UNAN-LEON

Tabulando los datos tenemos Nios distribuidos por edades: Edad (variable) 3 4 5 6 Total = N de nios (Frecuencia) 5 6 4 5 20

Al agrupar los resultados de las observaciones en trmino de las veces que stos se repiten, da lugar a las llamadas "series de frecuencias" o distribuciones de frecuencias; las cuales se dividen a su vez en series de frecuencias cualitativas y cuantitativas, segn que los caracteres de estudio se refieran a atributos o variables respectivamente. 2.2.1) Series de frecuencia acumulativa: son comnmente llamadas series de frecuencia de atributos o caracteres cualitativos y las formas de representar un atributo recibe el nombre de modalidades. Cuando se observan y se obtienen los elementos que deseamos estudiar con respecto a un carcter de tipo cualitativo y se procede a agruparlos segn las distintas modalidades que toma el atributo, "frecuencia cualitativa". Ejemplo: Agrupamos los resultados obtenidos al observar los 35 estudiantes de la materia estadstica I, respecto a su estado civil. Estudiantes de la materia Estadsticas I, clasificados por su estado civil. Estado civil Solteros Casados Viudos N de Estudiantes (frecuencia) 18 12 1

Divorciados 4 2.1.2) Series de frecuencias cualitativas: es el resultado del agrupamiento de los valores que se repiten (frecuencia) al ser observada una variable. Ejemplo: Tomamos nuevamente los 35 estudiantes de la materia estadstica I, respecto a su edad. Edad (en aos) N de estudiantes (frecuencia) 19 20 25 28 32 12 2 8 6 4

8 42 Total = 3 35 Frecuencias

UNAN-LEON

Ejemplo: En una comunidad de vecinos hemos preguntado a 20 de ellos por el nmero de personas que trabaja en cada familia, sus respuestas han sido: 1, 3, 0, 1, 0, 2, 2, 1, 2, 0, 1, 1, 4, 1, 1, 1, 1, 1, 0, 2 Realizando una tabla de distribucin de frecuancia. Xi 0 1 2 3 4 n 4 10 4 1 1

Frecuencia total N = n = 20 Frecuencia relativa (ni): ni = n / N , X0 = 4/20=0,2 , X1 = n1 / N = 10/20 = 0,5 , y as sucesivamente, la suma tota debe de ser 1. Frecuencia relativa porcentual (ni%) :

Xi 0 1 2 3 4

n 4 10 4 1 1

ni 0.2 0.5 0.2 0.05 0.05

Ni % 20% 50% 20% 5% 5%

Frecuencia absoluta acumulada ascendente Ni: un determinado valor ordenado de menor a mayor xi al nmero de datos que son menores o iguales a l Xi 0 1 2 3 4 n 4 10 4 1 1 ni 0.2 0.5 0.2 0.05 0.05 Ni % 20% 50% 20% 5% 5% Ni 4 14 18 19 20

Frecuencia absoluta acumulada descendente Ni un determinado valor ordenado de menor a mayor xi al nmero de datos que son mayores a l

9

UNAN-LEON

Xi 0 1 2 3 4

n 4 10 4 1 1

ni 0.2 0.5 0.2 0.05 0.05

Ni % 20% 50% 20% 5% 5%

Ni 4 14 18 19 20

Ni 16 6 2 1 0

Medidas de Tendencia Central La media aritmtica: Es el valor obtenido sumando todas las observaciones y dividiendo el total por el nmero de observaciones que hay en el grupo. La media resume en un valor las caractersticas de una variable teniendo en cuenta a todos los casos. Solamente puede utilizarse con variables cuantitativas. Ejemplo: Notas de 5 alumnos en una prueba: Alumno Nota 1 6.0 Entonces se suman las Notas: 2 5.4 6.0+5.4+3.1+7.0+6.1=27.6 3 3.1 Luego el total se divide entre la cantidad de alumnos: 4 7.0 27.6/5=5.52 5 6.1 LA MEDIA ARITMTICA EN ESTE PROBLEMA SERA 5.52 La media aritmtica es, probablemente, uno de los parmetros estadsticos ms extendidos. Se le llama tambin promedio o, simplemente, media. Definicin formal Dado un conjunto numrico de datos, x1, x2, ..., xn, se define su media aritmtica como

Ejemplo: Calcule la media de los siguientes nmeros: 10 , 11 , 12 , 12 , 13 1. Sumar las cantidades 10 + 11 + 12 + 12 + 13 = 58 2. Dividir la suma por la cantidad de elementos 58/5 3. El resultado es la media 11.6

10

UNAN-LEON

Ejemplo: Cuando se tienen muchos datos es ms conveniente agruparlos en una tabla de frecuencias y luego calcular la media aritmtica. El siguiente cuadro lo ilustra. Largo (en m) Frecuencia absoluta Largo por Frecuencia absoluta 3 10 3 * 10 = 50 6 15 6 * 15 = 90 7 20 7 * 20 = 140 8 12 8 * 12 = 96 9 6 9 * 6 = 54 Frecuencia total = 63 430 X= 430 = 6,825 63

Moda: Es el dato ms repetido, el valor de la variable con mayor frecuencia absoluta. En cierto sentido se corresponde su definicin matemtica con la locucin "estar de moda", esto es, ser lo que ms se lleva. Su clculo es extremadamente sencillo, pues slo necesita de un recuento. Ejemplo: Nmero de personas en distintos carros en una carretera: 5-7-4-6-9-5-6-1-5-37. En este caso el nmero que ms se repite es 5, entonces la moda es 5. Ejemplo 1: Buscar la moda de: 5 12 9 5 8 7 1 Como la moda es el nmero que ms se repite, la moda es 5. Ejemplo 2: Buscar la moda de: 14 16 18 16 15 12 14 El 14 se repite 3 veces. El 18 se repite 2 veces. El 16 se repite 5 veces. Por lo tanto, la moda es 16. 14 16 18 20 16 16

Ejemplo 3: Buscar la moda de : 23 35 45 33 47 31 29 22 Como ningn nmero se repite, no tiene moda. Mediana: Es un valor de la variable que deja por debajo de s a la mitad de los datos, una vez que estos estn ordenados de menor a mayor. Ejemplo: la mediana del nmero de hijos de un conjunto de trece familias, cuyos respectivos hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto que, una vez ordenados los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el que ocupa la posicin central es 2:

11

UNAN-LEON

En caso de un nmero par de datos, la mediana no correspondera a ningn valor de la variable, por lo que se conviene en tomar como mediana el valor intermedio entre los dos valores centrales. Por ejemplo, en el caso de doce datos como los anteriores:

Se toma como mediana

Ejemplo: Buscar la mediana de los siguientes nmeros: 2 4 1 3 5 6 3 Primero, hay que ordenarlos: 1 2 3 3 4 5 6 X1 X2 X3 X4 X5 X6 X7 (Las posiciones de los nmeros) Mediana = La mediana est en la posicin 4 Por lo tanto, la mediana es 3.

Ejemplo: Buscar la mediana de: 10, 12, 13, 12,11 1. Hay que ordenarlos, en este caso de forma ascendente; aunque tambin puede ser descendente. 10, 11, 12, 12, 13 2. El elemento del medio es 12. Por lo tanto, la mediana es 12. Ejemplo Buscar la mediana de: 15, 13, 11, 14, 16, 10, 12, 18 Como el nmero de elementos es par, hay que utilizar los dos nmeros intermedios. 10, 11, 12, 13, 14, 15, 16, 18 (ordenados). Los nmeros del centro son 13 y 14

1. Sumar ambos nmeros. 13 + 14 = 27 2. Dividirlo entre 2. 27/2 = 13.5 3. El resultado es la mediana. 13.5 DATOS AGRUPADOS EN INTERVALOS DE CLASE Se realiza cuando el nmero de valores que puede tomar la caracterstica X es muy elevado por lo que es necesario agruparlos en intervalos Slo tienen sentido en el caso de variables cuantitativas

12 Recorrido o Rango R = Xr Xi = max (Xi) - min (Xi) Amplitud del intervalo Clases: Constante C = R / k , siendo k el nmero de clase o agrupamientos Marcas de clase = El valor medio entre 2 datos X1 = (L0 + L1)/2, siendo L0 = X1, L1 = L0 + C,

UNAN-LEON

C = R / k (amplitud)

INTERVALOS 5000-9000 9000-13000 13000-17000 17000-21000 21000-25000

MARCA DE CLASE 7000 11000 15000 19000 23000

FRECUENCIA ABSOLUTA 3 4 7 5 6

13

UNAN-LEON