Conceptos y términos_básicos_en_estadistica_descriptiva_2_new

Post on 10-Jul-2015

184 views 0 download

Transcript of Conceptos y términos_básicos_en_estadistica_descriptiva_2_new

Por Lic. David Peña UCB FM UES

La estadística es una rama de la matemática que se refiere a la recolección, análisis e interpretación de los datos obtenidos en un estudio.

Es aplicable a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales, ciencias de la salud como la Psicología y la Medicina, y usada en la toma de decisiones en áreas de negocios e instituciones gubernamentales

La palabra estadística procede del latín “consejo de Estado” y de subderivado italiano “hombre de Estado o político”, el término alemán que fue introducido por (Gottfried Achenwall) en 1749 designaba originalmente el análisis de datos del Estado, es decir, la ciencia del Estado o también llamada la aritmética política.

No fue hasta el siglo XIX cuando el término estadística adquirió el significado de recolector y clasificar datos este concepto fue introducido por el inglés Jhon Sinclair.

La palabra estadística también se utiliza para referirse a la información estadística; es decir, a series de datos, tablas y gráficas que presentan resultados.

Por ejemplo, cuando leemos las estadísticas de los equipos de futbol o escuchamos la estadística muestra que el índice de reprobación en las escuelas es tal, se hace referencia a los datos y no al procedimiento o metodología deanálisis.

La palabra "estadística" suele utilizarse bajo dos significados distintos, a saber:

1º Como colección de datos numéricos.- 1º Como colección de datos numéricos.- Esto es el significado más vulgar de la palabra estadística. Se sobre entiende que dichos datos numéricos han de estar presentados de manera ordenada y sistemática.

Una información numérica cualquiera puede no constituir una estadística, para merecer este apelativo, los datos han de constituir un conjunto coherente, establecido de forma sistemática y siguiendo un criterio de ordenación.

Tenemos muchos ejemplos de este tipo de estadísticas…puedes dar algunos ejemplos.

2º Como ciencia.- 2º Como ciencia.- En este significado, la Estadística estudia el comportamiento de los fenómenos de masas.

Como todas las ciencias, busca las características generales de un colectivo y prescinde de las particulares de cada elemento.

Clasificación de la estadística. El estudio de la estadística se ha concretado

primordialmente en el análisis de datos y su aplicación en la toma de decisiones, lo que ha permitido dividir a la estadística por su aplicación en:

1. Estadística descriptiva. 2. Estadística inferencial (estadística inductiva o

estadística analítica).

La estadística es la ciencia cuyo objetivo es reunir información cuantitativa relacionada a individuos, grupos, series de hechos, entre otros. Gracias al análisis de estos datos se pueden deducir algunos significados precisos o algunas previsiones para el futuro. La estadística, en general, es la ciencia que trata la recopilación, la organización, la presentación, el análisis y la interpretación de datos numéricos con el fin de realizar una toma de decisiones más efectiva.

La palabra estadística también se utiliza para referirse a la información estadística; es decir, a series de datos, tablas y gráficas que presentan resultados.

Por ejemplo, cuando leemos las estadísticas de los equipos de futbol o escuchamos la estadística muestra que el índice de reprobación de la PAES es tal, se hace referencia a los datos y no al procedimiento o metodología de análisis.

La estadística resulta muy útil no sólo para recopilar y describir datos, sino también para interpretar la información obtenida, que puede ser aprovechada para demostrar la evolución de un fenómeno a través de cierto tiempo

Población, elementos y caracteres. Es obvio que todo estudio estadístico ha de estar referido a

un conjunto o colección de personas o cosas. Este conjunto de personas o cosas es lo que denominaremos población.

Las personas o cosas que forman parte de la población se denominan elementos. En sentido estadístico un elemento puede ser algo con existencia real, como un automóvil o una casa, o algo más abstracto como la temperatura, un voto, o un intervalo de tiempo.

A su vez, cada elemento de la población tiene una serie de características que pueden ser objeto del estudio estadístico. Así por ejemplo si consideramos como elemento a una persona, podemos distinguir en ella los siguientes caracteres: Sexo, Edad, Nivel de estudios, Profesión, Peso, Altura, Color de pelo, Etc. Por tanto de cada elemento de la población podremos estudiar uno o más aspectos cualidades o caracteres.

La población puede ser según su tamaño de dos tipos: Población finita: cuando el número de elementos que la

forman es finito, por ejemplo el número de alumnos de un centro de enseñanza, o grupo clase.

De ejemplos:

Población infinita: cuando el número de elementos que la forman es infinito, o tan grande que pudiesen considerarse infinitos.. Como por ejemplo si se realizase un estudio sobre los productos que hay en el mercado. Hay tantos y de tantas calidades que esta población podría considerarse infinita.

Da ejemplos:

La muestra es, en esencia, un subgrupo de la población.

Digamos que es un subconjunto de elementos que pertenecen a ese conjunto definido en sus características al que llamamos población.

Con frecuencia leemos y oímos hablar de “muestra representativa”, ‘muestra al azar “ “muestra aleatoria” como si con los simples términos se pudiera dar más seriedad a los resultados.

En realidad, pocas veces se puede medir a toda la población, por lo que obtenemos o seleccionamos una muestra y se pretende —desde luego— que este subconjunto sea un reflejo fiel del conjunto de la población.

Todas las muestras deben ser representativas, por tanto el uso de este término es por demás inútil.

Los términos al azar y aleatorio denotan un tipo de procedimiento mecánico relacionado con la probabilidad y con la selección de elementos, pero no logra esclarecer tampoco el tipo de muestra y el procedimiento de muestreo.

Básicamente categorizamos a las muestras en dos grandes ramas: las muestras no probabilísticas y las muestras probabilísticas.

En estas últimas todos los elementos de la población tienen la misma posibilidad de ser escogidos.

Esto se obtiene definiendo las características de la población, el tamaño de la muestra y a través de una selección aleatoria y/o mecánica de las unidades de análisis. Imagínense el procedimiento para obtener el número premiado en un sorteo de lotería.

En las muestras no probabilísticas, la elección de los elementos no depende de la probabilidad, sino de causas relacionadas con las características del investigador o del que hace la muestra.

Aquí el procedimiento no es mecánico, ni en base a fórmulas de probabilidad, sino que depende del proceso de toma de decisiones de una persona o grupo de personas, .y desde luego, las muestras seleccionadas por decisiones subjetivas tienden a estar sesgadas.

La estadística trabaja con datos de característica variabilidad, conocidos por ello como variables.

¿Qué es una Variable?Las variables pueden clasificarse también, en

variables cuantitativas y cualitativas

Las variables cuantitativas también se conocen como variables propiamente dichas, mientras que las cualitativas se conocen como atributos, clases o categorías.

Una posterior división de las variables es en continuas y discontinuas o discretas.

Variables Cualitativas : Atributos o Clases o categorías.

DiscretasVariables Cuantitativas

Continuas

Las variables cuantitativas son las que se describen por medio de números, como por ejemplo el peso, Altura, Edad, Número de fallecidos…

A su vez este tipo de variables se puede dividir en dos subclases:Cuantitativas discretas: Aquellas a las que se les puede asociar un

número entero, es decir, aquellas que por su naturaleza no admiten un fraccionamiento de la unidad, por ejemplo número de hermanos, páginas de un libro, etc.

Cuantitativas continuas: Aquellas que no se pueden expresar mediante un número entero, es decir, aquellas que por su naturaleza admiten que entre dos valores cualesquiera la variable pueda tomar cualquier valor intermedio, por ejemplo peso, tiempo. etc.

No obstante en muchos casos el tratamiento estadístico hace que a variables discretas las trabajemos como si fuesen continuas y viceversa.

Los atributos son aquellos caracteres que para su definición precisan de palabras, es decir, no le podemos asignar un número. Por ejemplo Sexo Profesión, Estado Civil, etc.

A su vez las podemos clasificar en:

Ordenables: Aquellas que sugieren una ordenación, por ejemplo la graduación militar, El nivel de estudios, etc.

No ordenables: Aquellas que sólo admiten una mera ordenación alfabética, pero no establece orden por su naturaleza, por ejemplo el color de pelo, sexo, estado civil, etc.

Son una sucesión de medidas que permiten organizar datos en orden jerárquico. Las escalas de medición, pueden ser clasificadas de acuerdo a una degradación de las características de las variables.

De acuerdo con la definición clásica del término —ampliamente difundida— medir significa “asignar números a objetos y eventos de acuerdo a reglas” (Stevens, 1951).

Sin embargo, como señalan Carmines y Zeller (1979), esta definición es más apropiada para las ciencias físicas que para las ciencias sociales, ya que varios de los fenómenos que son medidos en éstas no pueden caracterizarse como objetos o eventos, puesto que son demasiado abstractos para ello.

Este razonamiento nos hace sugerir que es más adecuado definir la medición como “el proceso de vincular conceptos abstractos con indicadores empíricos proceso que se realiza mediante un plan explicito y organizado para clasificar (y frecuentemente cuantificar) los datos disponibles —los indicadores— en términos del concepto que el investigador tiene en mente (Carmines y Zeller, 1979, p. 10).

Y en este proceso, el instrumento de medición o de recolección de los datos juega un papel central. Sin él no hay observaciones clasificadas.

La definición sugerida incluye dos consideraciones: La primera es desde el punto de vista empírico y se resume en que el centro de atención es la respuesta observable (sea una alternativa de respuesta marcada en un cuestionario, una conducta grabada vía observación o una respuesta dada a un entrevistador).

La segunda es desde una perspectiva teórica y se refiere a que el interés se sitúa en el concepto subyacente no observable que es representado por la respuesta (Carmines y Zeller, 1979). Así, los registros del instrumento de medición representan valores observables de conceptos abstractos.

Un instrumento de medición adecuado es aquel que registra datos observables que representan verdaderamente a los conceptos o variables que el investigador tiene en mente.

Estas escalas son: nominales, ordinales, intervalares o racionales. Según pasa de una escala a otra el atributo o la cualidad aumenta.

Las escalas de medición ofrecen información sobre el tipo de variable: discretas o continuas.

Dicha clasificación determina la selección de la gráfica adecuada.

Una clasificación de las escalas de medida por el Psicólogo llamado Steven en 1946, que han tenido una aceptación en los últimos tiempos es: Escala Nominal Escala Ordinal Escala por Intervalos Escala Racional

La escala mas rudimentaria es la nominal, donde los objetos se distinguen en base a un nombre, muchas veces dado por un número.

En este nivel se tienen dos o más categorías del ítem o variable.

Las categorías no tienen orden o jerarquía. Lo que se mide es colocado en una u otra

categoría, lo que indica solamente diferencias respecto a una o más características.

Por ejemplo, la variable sexo de la persona tiene sólo dos categorías: masculino y femenino (si la variable fuera “práctica sexual” podría haber tal vez más, pero sexo sólo tiene dos categorías). Ninguna de las categorías tiene mayor jerarquía que la otra, las categorías únicamente reflejan diferencias en la variable. No hay orden de mayor a menor.

Si les asignamos una etiqueta o símbolo a cada categoría, éste exclusivamente identifica a la categoría. Por ejemplo: * = Masculino z = Femenino

Las mediciones en una escala ordinal solo indican orden (“ranking”). Los objetos en una escala ordinal se distinguen, pues, en base a la cantidad relativa de una característica que poseen.

Además de haber orden o jerarquía entre categorías, se establecen intervalos iguales en la medición. Las distancias entre categorías son las mismas a lo largo de toda la escala. Hay intervalo constante, una unidad de medida.

dólares

Tipo de variable de respuesta Ejemplo

Categoría con dos categorías Vivo/MuertoPresencia o ausencia de una enfermedadEmpleado/desempleado

Categoría con mas de dos categorías no ordenadas

Causa de muerteTipo de cáncerPartido políticoAfiliación religiosa

Categorías con categorías ordenadas Fuerza de convicción a una actitud políticaClase en la universidadSeveridad de síntomas de una enfermedad

Conteo discretos Numero de hijos en una familiaNumero de accidentes en un cruce de calles

Discretas duración de tiempo datos históricos Situación de desempleo para cada mes (tiempo desempleado)

Obtención de DatosOrganización de DatosRepresentación de DatosAnálisis de DatosToma de decisiones con los datos.

¿QUÉ IMPLICA LA ETAPA DE RECOLECCIÓN DE LOS DATOS?

Una vez que seleccionamos el diseño de investigación apropiado y la muestra adecuada de acuerdo con nuestro problema de estudio e hipótesis, la siguiente etapa consiste en recolectar los datos pertinentes sobre las variables involucradas en la investigación.

Recolectar los datos implica tres actividades estrechamente vinculadas entre sí:

a)Seleccionar un instrumento de medición de los disponibles en el estudio del comportamiento o desarrollar uno (el instrumento de recolección de los datos: guía de observación, guía de entrevista, cuestionario, otros). Este instrumento debe ser válido y confiable, -de lo contrario- no podemos basarnos en sus resultados. Debe adaptarse al estudio de investigación.

b) Aplicar ese instrumento de medición. Es decir, obtener las observaciones y mediciones de las variables que son de interés para nuestro estudio (medir variables).

c) Preparar las mediciones obtenidas para que puedan analizarse correctamente (a esta actividad se le denomina codificación de los datos).

Se deberá organizar el grupo para obtener lo datos y llevar un registro exacto de los datos.

Tomando en cuenta que tipo de datos, el tipo de población y muestra.

El espacio geográfico y otros factores que pudieran facilitar o impedir la correcta obtención de datos.

OBTENCION DE DATOSOBTENCION DE DATOS

Una vez que seleccionamos el diseño de investigación apropiado y la muestra adecuada de acuerdo con nuestro problema de estudio e hipótesis, la siguiente etapa consiste en recolectar los datos pertinentes sobre las variables involucradas en la investigación.

Recolectar los datos implica tres actividades estrechamente vinculadas entre sí:

a)Seleccionar un instrumento de mediciónb)Aplicar ese instrumento de medición. c)Preparar las mediciones

a) Seleccionar un instrumento de medición de los disponibles en el estudio del comportamiento o desarrollar uno (el instrumento de recolección de los datos). Este instrumento debe ser válido y confiable, -de lo contrario no podemos basamos en sus resultados.

B. Aplicar ese instrumento de medición. Es decir, obtener las observaciones y mediciones de las variables que son de interés para nuestro estudio (medir variables).

C. Preparar las mediciones obtenidas para que puedan analizarse correctamente (a esta actividad se le denomina codificación de los datos).

Hoy día, los análisis estadísticos se llevan a cabo a través de programas para computadora, utilizando paquetes estadísticos. Estos paquetes son sistemas integrados de programas para computadora diseñados para el análisis de datos. Cada paquete tiene su propio formato, instrucciones, procedimientos y Características.Para conocer un paquete es necesario consultar el manual respectivo. Los manuales de los paquetes más importantes han sido publicados y difundidos ampliamente. Y el procedimiento para analizar los datos es crear o desarrollar un programa basándonos en el manual. Este programa incluye el llamado de la matriz de datos y las pruebas estadísticas seleccionadas. Después se corre el programa y se obtienen los resultados, los cuales se interpretan.

1. BMDP (Programa Biomédico Computarizado). Desarrollado por la Universidad de California de la ciudad de Los Ángeles. Es utilizable en máquinas IBM y otros sistemas (CYBER, Honeywell, Univac, Xerox, etc.). Aunque está diseñado para el área biomédica, contiene una gran cantidad de análisis aplicables a ciencias sociales.La referencia del manual es la siguiente:Dixon, W J. (1975). BMDP biomedical computer programs. Los Ángeles, California: UCLA.

2. ESP (Paquete econométrico de Software). Especialmente útil para análisis estadísticos de series cronológicas. Se puede tener en máquinas IBM, aunque hay adaptaciones a otras máquinas.

La referencia del manual es:Cooper, J. P. y Curtis, O. A. (1976) ESP: Econometric Software Package. Chicago Illinois: Graduate School of Business, University of Chicago.

3. OSIRIS (Organized Set of Integrated Routines for Investigation with Statistics) (Conjunto organizado de rutinas integradas para la investigación con estadística). Desarrollado por el Instituto de Investigación Social de la Universidad de Michigan. Disponible en máquinas IBM y otras máquinas.

4. SAS (Sistema de Análisis Estadístico). Desarrollado en la Universidad Estatal de Carolina del Norte y distribuido por SAS Institute, Inc. de Raleigh, Carolina del norte. Es muy poderoso y su utilización se ha incrementado notablemente.La referencia del manual es: Barr, A. J; Goodnight, J. H.; Salí, J. R.; y Helwig, J. T. (1976). SAS: Statistical Analysis System. Raleigh, North Carolina: SAS Institute, INC.

5. SPSS (Paquete Estadístico para las Ciencias Sociales). Desarrollado en la Universidad de Chicago, es probablemente el más difundido en el mundo occidental (en Latinoamérica es tal vez el más utilizado). Disponible en muchos tipos de máquinas. Contiene todos los análisis estadísticos descritos en este capítulo. Además del paquete tradicional cuenta con una versión interactiva denominada SPSS-X que tiene mayor capacidad, variedad de análisis y es menos rígida, y una versión para la elaboración de gráficas (SPSS Graphics) con una versión para computadoras personales y microcomputadoras (SPSS/PC).

Aunque hoy en día, si se realiza un estudio estadístico importante esta tarea la realiza el ordenador, ya sea por medio de programas de estadística específicos, o bien utilizando herramientas informáticas de propósito general como Bases de Datos u Hojas de Cálculo u otros métodos manuales como los siguientes:

Por Palitos o Palotes l, ll, lll,

Formando cuadros , , ,

Y para muestras muy grandes el de puntos . , . . , …, …., ….., ….. ¨ Aunque el método más utilizado o conocido sea el primero, quizás el más cómodo de utilizar es el 2º en la mayoría de los casos.

Muchas veces, al comienzo de un trabajo de análisis de datos se cuenta con un gran volumen de información en bruto.

Una de las primeras tareas es organizar esa información y tabularla.

El propósito de la tabulación es resumir la información hasta llegar, a veces, a un par de valores (la media y la varianza por ejemplo) que encierran toda la utilidad de la información.

Traer tensiómetro (esfigmomanómetro) Termómetro Bascula de pesar Cinta métrica Leer las técnicas para la utilización de estos

instrumentos de medición de signos vitales.

TOMAR SIGNOS VITALES DE TODOS LOS ESTUDIANTES DEL SALON: FRECUENCIA CARDIACA (PULSO) TEMPERATURA PESO TALLA CINTURA PRESION ARTERIAL SISTOLICA/DIASTOLICA