Medidas de de Tendencia Central

17
Medidas de de tendencia central La medidas de centralización nos indican en torno a qué valor (centro) se distribuyen los datos. Las medidas de centralización son: Moda La moda es el valor que tiene mayor frecuencia absoluta. Se representa por Mo. Se puede hallar la moda para variables cualitativas y cuantitativas. Hallar la moda de la distribución: 2, 3, 3, 4, 4, 4, 5, 5 Mo= 4 Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la máxima, la distribución es bimodal o multimodal, es decir, tiene varias modas. 1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo= 1, 5, 9 Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda. 2, 2, 3, 3, 6, 6, 9, 9 Si dos puntuaciones adyacentes tienen la frecuencia máxima, la moda es el promedio de las dos puntuaciones adyacentes. 0, 1, 3, 3, 5, 5, 7, 8 Mo = 4 Mediana Es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de menor a mayor. La mediana se representa por Me. La mediana se puede hallar sólo para variables cuantitativas. Cálculo de la mediana 1. Ordenamos los datos de menor a mayor.

description

Estadística I

Transcript of Medidas de de Tendencia Central

Medidas de de tendencia centralLa medidas de centralizacin nos indican en torno a qu valor (centro) se distribuyen los datos.Las medidas de centralizacin son:

Moda

La moda es el valor que tiene mayor frecuencia absoluta. Se representa por Mo. Se puede hallar la moda para variables cualitativas y cuantitativas.

Hallar la moda de la distribucin:2, 3, 3, 4, 4, 4, 5, 5 Mo= 4

Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la mxima, la distribucin es bimodal o multimodal, es decir, tiene varias modas.

1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo= 1, 5, 9

Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda.

2, 2, 3, 3, 6, 6, 9, 9

Si dos puntuaciones adyacentes tienen la frecuencia mxima, la moda es el promedio de las dos puntuaciones adyacentes.

0, 1, 3, 3, 5, 5, 7, 8 Mo = 4

Mediana

Es el valor que ocupa el lugar central de todos los datos cuando stos estn ordenados de menor a mayor. La mediana se representa por Me. La mediana se puede hallar slo para variables cuantitativas.

Clculo de la mediana1. Ordenamos los datos de menor a mayor.

2. 2 Si la serie tiene un nmero impar de medidas la mediana es la puntuacin central de la misma.

2, 3, 4, 4, 5, 5, 5, 6, 6 Me= 5

3. Si la serie tiene un nmero par de puntuaciones la mediana es la media entre las dos puntuaciones centrales.

4. Si la serie tiene un nmero par de puntuaciones la mediana es la media entre las dos puntuaciones centrales.7, 8, 9, 10, 11, 12 Me= 9.5

Media aritmtica

La media aritmtica es el valor obtenido al sumar todos los datos y dividir el resultado entre el nmero total de datos.

Es el smbolo de la media aritmtica.

EjemploLos pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.

Estadstica inferencialLa Estadstica inferencial o Inferencia estadstica estudia cmo sacar conclusiones generales para toda la poblacin a partir del estudio de una muestra, y el grado de fiabilidad o significacin de los resultados obtenidos.Laestadstica inferenciales una parte de laestadsticaque comprende los mtodos y procedimientos que por medio de la induccin determina propiedades de unapoblacin estadstica, a partir de unapequea partede la misma. La estadstica inferencial comprende como aspectos importantes: La toma de muestras omuestreo. La estimacin de parmetros ovariables estadsticas. Elcontraste de hiptesis. Eldiseo experimental. Lainferencia bayesiana. Los mtodos no paramtricos

Para que un mtodo de inferencia estadstica proporcione buenos resultados debe de:Basarse en una tcnica estadstico-matemtica adecuada al problema y suficientemente validada.

Utilizar una muestra que realmente sea representativa de la poblacin y de un tamao suficiente.

Conceptos bsicos que se utilizarn en este texto son los siguientes: Poblacin:es un conjunto homogneo de individuos sobre los que se estudia una o varias caractersticas que son, de alguna forma, observables.

Muestra:es un subconjunto de la poblacin. El nmero de elementos de la muestra se denominatamao muestral.

Muestreo aleatorio simple:es aquel en el que todos los individuos de la poblacin tienen la misma probabilidad de ser elegidos.

Muestra aleatoria simple,de una variable aleatoriaX,con distribucinF,de tamaon,es un conjunto denvariables aleatoriasX1,X2,...,Xn,independientes e igualmente distribudas (i.i.d.) con distribucinF.

Espacio muestral:es el conjunto de muestras posibles que pueden obtenerse al seleccionar una muestra aleatoria, de tamaon,de una cierta poblacin.

Parmetro:es cualquier caracterstica medible de la funcin de distribucin de la variable en estudio (media, varianza,..).

Estadstico:es una funcin de la muestraT.Por tanto, es una variable aleatoria que tiene una funcin de distribucin que se denomina distribucin en el muestreo deT.Los estadsticos independientes del parmetro a estimar se denominanestimadores.

Propiedades de los estimadores.

Estimacin de parmetrosEs el procedimiento utilizado para conocer las caractersticas de un parmetro poblacional, a partir del conocimiento de la muestra.Con una muestra aleatoria, de tamao n, podemos efectuar una estimacin de un valor de un parmetro de la poblacin; pero tambin necesitamos precisar un:

Intervalo de confianza

Se llama as a un intervalo en el que sabemos que est un parmetro, con un nivel de confianza especfico.

Nivel de confianza

Probabilidad de que el parmetro a estimar se encuentre en el intervalo de confianza.

Error de estimacin admisible

Que estar relacionado con el radio del intervalo de confianza.

Eninferencia estadsticase llamaestimacinal conjunto de tcnicas que permiten dar un valor aproximado de unparmetrode una poblacin a partir de los datos proporcionados por unamuestra. Por ejemplo, una estimacin de lamediade una determinada caracterstica de unapoblacinde tamao N podra ser la media de esa misma caracterstica para unamuestrade tamao n. La estimacin se divide en tres grandes bloques, cada uno de los cuales tiene distintos mtodos que se usan en funcin de las caractersticas y propsitos del estudio: Estimacin puntual: Mtodo de los momentos; Mtodo de la mxima verosimilitud; Mtodo de los mnimos cuadrados; Estimacin por intervalos. Estimacin bayesiana.

Poblaciones infinitasCuando la poblacin es infinita, o puede ser considerada como tal en relacin a la muestra (el tamao de la muestra no supera el 5% del tamao de la poblacin), empelamos la siguiente frmula para calcular el tamao:

Donde es el parmetro proporcin, que indica la proporcin de individuos de la poblacin que posee una determinada caracterstica en estudio. Como estimador de se suele tomar la proporcin p.Cuando el valor de las proporciones poblacionales no son conocidas, nos basamos en estudios previos o similares para conocer tales parmetros, o tambin llevamos a cabo estudios piloto. La solucin ms frecuente es utilizar el mximo (caso ms desfavorable, puesto que exige una muestra mayor producto *(1-), es decir 0.50 x 0.50.

Poblaciones infinitasCuando la poblacin es infinita, o puede ser considerada como tal en relacin a la muestra (el tamao de la muestra no supera el 5% del tamao de la poblacin), empelamos la siguiente frmula para calcular el tamao: Donde es el parmetro proporcin, que indica la proporcin de individuos de la poblacin que posee una determinada caracterstica en estudio. Como estimador de se suele tomar la proporcin p.Cuando el valor de las proporciones poblacionales no son conocidas, nos basamos en estudios previos o similares para conocer tales parmetros, o tambin llevamos a cabo estudios piloto. La solucin ms frecuente es utilizar el mximo (caso ms desfavorable, puesto que exige una muestra mayor producto *(1-), es decir 0.50 x 0.50.Determinacin del tamao muestral1. Estudios para determinar parmetros Estimar una proporcin Estimar una media2. [Seguridad-Precisin-Proporcin esperada]3. [Poblacin infinita-Poblacin finita]4. Estudios para contraste de hiptesis Comparacin de dos proporciones Comparacin de dos medias5. Tamao muestral ajustado a las prdidas6. Valores de Za y Zb ms frecuentesTodo estudio epidemiolgico lleva implcito en la fase de diseo la determinacin del tamao muestral necesario para la ejecucin del mismo (1-4). El no realizar dicho proceso, puede llevarnos a dos situaciones diferentes: primera que realicemos el estudio sin el nmero adecuado de pacientes, con lo cual no podremos ser precisos al estimar los parmetros y adems no encontraremos diferencias significativas cuando en la realidad s existen. La segunda situacin es que podramos estudiar un nmero innecesario de pacientes, lo cual lleva implcito no solo la prdida de tiempo e incremento de recursos innecesarios sino que adems la calidad del estudio, dado dicho incremento, puede verse afectada en sentido negativo.Para determinar el tamao muestral de un estudio, debemos considerar diferentes situaciones (5-7):A. Estudios para determinar parmetros. Es decir pretendemos hacer inferencias a valores poblacionales (proporciones, medias) a partir de una muestra (Tabla 1).B. Estudios para contraste de hiptesis. Es decir pretendemos comparar si las medias o las proporciones de las muestras son diferentes.

Tabla 1. Elementos de la Inferencia Estadstica

A. Estudios para determinar parmetros

Con estos estudios pretendemos hacer inferencias a valores poblacionales (proporciones, medias) a partir de una muestra.A.1. Estimar una proporcin:Si deseamos estimar una proporcin, debemos saber:a. El nivel de confianza o seguridad (1- ). El nivel de confianza prefijado da lugar a un coeficiente (Z ). Para una seguridad del 95% = 1.96, para una seguridad del 99% = 2.58. b. La precisin que deseamos para nuestro estudio. c. Una idea del valor aproximado del parmetro que queremos medir (en este caso una proporcin). Esta idea se puede obtener revisando la literatura, por estudio pilotos previos. En caso de no tener dicha informacin utilizaremos el valor p = 0.5 (50%). Ejemplo: A cuantas personas tendramos que estudiar para conocer la prevalencia de diabetes?Seguridad = 95%; Precisin = 3%: Proporcin esperada = asumamos que puede ser prxima al 5%; si no tuvisemos ninguna idea de dicha proporcin utilizaramos el valor p = 0,5 (50%) que maximiza el tamao muestral:

donde: Z 2 = 1.962 (ya que la seguridad es del 95%) p = proporcin esperada (en este caso 5% = 0.05) q = 1 p (en este caso 1 0.05 = 0.95) d = precisin (en este caso deseamos un 3%)

Si la poblacin es finita, es decir conocemos el total de la poblacin y desesemos saber cuntos del total tendremos que estudiar la respuesta seria:

donde: N = Total de la poblacin Z2 = 1.962 (si la seguridad es del 95%) p = proporcin esperada (en este caso 5% = 0.05) q = 1 p (en este caso 1-0.05 = 0.95) d = precisin (en este caso deseamos un 3%). A cuntas personas tendra que estudiar de una poblacin de 15.000 habitantes para conocer la prevalencia de diabetes?Seguridad = 95%; Precisin = 3%; proporcin esperada = asumamos que puede ser prxima al 5% ; si no tuviese ninguna idea de dicha proporcin utilizaramos el valor p = 0.5 (50%) que maximiza el tamao muestral.

Segn diferentes seguridades el coeficiente de Z vara, as: Si la seguridad Z fuese del 90% el coeficiente sera 1.645 Si la seguridad Z fuese del 95% el coeficiente sera 1.96 Si la seguridad Z fuese del 97.5% el coeficiente sera 2.24 Si la seguridad Z fuese del 99% el coeficiente sera 2.576 A.2. Estimar una media:Si deseamos estimar una media: debemos saber: El nivel de confianza o seguridad (1- ). El nivel de confianza prefijado da lugar a un coeficiente (Z ). Para una seguridad del 95% = 1.96; para una seguridad del 99% = 2.58. La precisin con que se desea estimar el parmetro (2 * d es la amplitud del intervalo de confianza). Una idea de la varianza S2 de la distribucin de la variable cuantitativa que se supone existe en la poblacin.

Ejemplo: Si deseamos conocer la media de la glucemia basal de una poblacin, con una seguridad del 95 % y una precisin de 3 mg/dl y tenemos informacin por un estudio piloto o revisin bibliogrfica que la varianza es de 250 mg/dl

Si la poblacin es finita, como previamente se seal, es decir conocemos el total de la poblacin y desearamos saber cuantos del total tendramos que estudiar, la respuesta sera:

B. Estudios para contraste de hiptesis:

Estos estudios pretenden comparar si las medias o las proporciones de las muestras son diferentes. Habitualmente el investigador pretende comparar dos tratamientos. Para el clculo del tamao muestral se precisa conocer:a. Magnitud de la diferencia a detectar que tenga inters clnicamente relevante. Se pueden comparar dos proporciones o dos medias. b. Tener una idea aproximada de los parmetros de la variable que se estudia (bibliografa, estudios previos). c. Seguridad del estudio (riesgo de cometer un error ) d. Poder estadstico (1 - ) (riesgo de cometer un error ) e. Definir si la hiptesis va a ser unilateral o bilateral. Bilateral: Cualquiera de los dos parmetros a comparar (medias o proporciones) puede ser mayor o menor que el otro. No se establece direccin. Unilateral: Cuando se considera que uno de los parmetros debe ser mayor que el otro, indicando por tanto una direccin de las diferencias. La hiptesis bilateral es una hiptesis ms conservadora y disminuye el riesgo de cometer un error de tipo I (rechazar la H0 cuando en realidad es verdadera).B1. Comparacin de dos proporciones:

Donde: n = sujetos necesarios en cada una de las muestras Z = Valor Z correspondiente al riesgo deseado Z = Valor Z correspondiente al riesgo deseado p1 = Valor de la proporcin en el grupo de referencia, placebo, control o tratamiento habitual. p2 = Valor de la proporcin en el grupo del nuevo tratamiento, intervencin o tcnica. p = Media de las dos proporciones p1 y p2

Los valores Z segn la seguridad y Z segn el poder se indican en la Tabla 2 (8).B2. Comparacin de dos medias:

Donde: n = sujetos necesarios en cada una de las muestras Z = Valor Z correspondiente al riesgo deseado Z = Valor Z correspondiente al riesgo deseado S2 = Varianza de la variable cuantitativa que tiene el grupo control o de referencia. d = Valor mnimo de la diferencia que se desea detectar (datos cuantitativos) Los valores Z segn la seguridad y Z segn el poder se indican en la Tabla 2 (8).Tabla 2. Valores de Z y Z ms frecuentemente utilizados

Z

Test unilateralTest bilateral

0.2000.1500.1000.0500.0250.0100.8421.0361.2821.6451.9602.3261.2821.4401.6451.9602.2402.576

Potencia

(1-)Z

0.010.050.100.150.200.250.300.350.400.450.500.990.950.900.850.800.750.700.650.600.550.502.3261.6451.2821.0360.8420.6740.5240.3850.2530.1260.000

Ejemplo de comparacin de dos medias:Deseamos utilizar un nuevo frmaco antidiabtico y consideramos que seria clnicamente eficaz si lograse un descenso de 15 mg/dl respecto al tto. Habitual con el antidiabtico estndar. Por estudios previos sabemos que la desviacin tpica de la glucemia en pacientes que reciben el tratamiento habitual es de 16 mg/dl. Aceptamos un riesgo de 0.05 y deseamos un poder estadstico de 90% para detectar diferencias si es que existen. precisamos 20 pacientes en cada grupo.Ejemplo de comparacin de dos proporciones:Deseamos evaluar si el Tratamiento T2 es mejor que el tratamiento T1 para el alivio del dolor para lo que diseamos un ensayo clnico. Sabemos por datos previos que la eficacia del frmaco habitual est alrededor del 70% y consideramos clnicamente relevante si el nuevo frmaco alivia el dolor en un 90%. Nuestro nivel de riesgo lo fijamos en 0.05 y deseamos un poder estadstico de un 80%.

n = 48 pacientes. En cada grupo precisamos 48 pacientes.

El tamao muestral ajustado a las prdidas:

En todos los estudios es preciso estimar las posibles perdidas de pacientes por razones diversas (prdida de informacin, abandono, no respuesta.) por lo que se debe incrementar el tamao muestral respecto a dichas prdidas.El tamao muestral ajustado a las prdidas se puede calcular:Muestra ajustada a las prdidas = n (1 / 1R) n = nmero de sujetos sin prdidas R = proporcin esperada de prdidas As por ejemplo si en el estudio anterior esperamos tener un 15% de prdidas el tamao muestral necesario seria: 48 (1 / 1-0.15) = 56 pacientes en cada grupo.

Pruebas de Hiptesis.Etapas Bsicas en Pruebas de Hiptesis.Al realizar pruebas de hiptesis, se parte de un valor supuesto (hipottico) en parmetro poblacional. Despus de recolectar una muestra aleatoria, se compara la estadstica muestral, as como la media (x), con el parmetro hipottico, se compara con una supuesta media poblacional (). Despus se acepta o se rechaza el valor hipottico, segn proceda. Se rechaza el valor hipottico slo si el resultado muestral resulta muy poco probable cuando la hiptesis es cierta.Etapa 1.- Planear la hiptesis nula y la hiptesis alternativa. La hiptesis nula (H0) es el valor hipottico del parmetro que se compra con el resultado muestral resulta muy poco probable cuando la hiptesis es cierta.Etapa 2.- Especificar el nivel de significancia que se va a utilizar. El nivel de significancia del 5%, entonces se rechaza la hiptesis nula solamente si el resultado muestral es tan diferente del valor hipottico que una diferencia de esa magnitud o mayor, pudiera ocurrir aleatoria mente con una probabilidad de 1.05 o menos.Etapa 3.- Elegir la estadstica de prueba. La estadstica de prueba puede ser la estadstica muestral (el estimador no segado del parmetro que se prueba) o una versin transformada de esa estadstica muestral. Por ejemplo, para probar el valor hipottico de una media poblacional, se toma la media de una muestra aleatoria de esa distribucin normal, entonces es comn que se transforme la media en un valor z el cual, a su vez, sirve como estadstica de prueba.Consecuencias de las Decisiones en Pruebas de Hiptesis.Decisiones PosiblesSituaciones Posibles

La hiptesis nula es verdaderaLa hiptesis nula es falsa

Aceptar la Hiptesis NulaSe acepta correctamenteError tipo II

Rechazar la Hiptesis NulaError tipo ISe rechaza correctamente

Etapa 4.- Establecer el valor o valores crticos de la estadstica de prueba. Habiendo especificado la hiptesis nula, el nivel de significancia y la estadstica de prueba que se van a utilizar, se produce a establecer el o los valores crticos de estadstica de prueba. Puede haber uno o ms de esos valores, dependiendo de si se va a realizar una prueba de uno o dos extremos.Etapa 5.- Determinar el valor real de la estadstica de prueba. Por ejemplo, al probar un valor hipottico de la media poblacional, se toma una muestra aleatoria y se determina el valor de la media muestral. Si el valor crtico que se establece es un valor de z, entonces se transforma la media muestral en un valor de z.Etapa 6.- Tomar la decisin. Se compara el valor observado de la estadstica muestral con el valor (o valores) crticos de la estadstica de prueba. Despus se acepta o se rechaza la hiptesis nula. Si se rechaza sta, se acepta la alternativa; a su vez, esta decisin tendr efecto sobre otras decisiones de los administradores operativos, como por ejemplo, mantener o no un estndar de desempeo o cul de dos estrategias de mercadotecnia utilizar.La distribucin apropiada de la prueba estadstica se divide en dos regiones: una regin de rechazo y una de no rechazo. Si la prueba estadstica cae en esta ltima regin no se puede rechazar la hiptesis nula y se llega a la conclusin de que el proceso funciona correctamente.Al tomar la decisin con respecto a la hiptesis nula, se debe determinar el valor crtico en la distribucin estadstica que divide la regin del rechazo (en la cual la hiptesis nula no se puede rechazar) de la regin de rechazo. A hora bien el valor crtico depende del tamao de la regin de rechazo.PASOS DE LA PRUEBA DE HIPTESIS1. Expresar la hiptesis nula2. 3. Expresar la hiptesis alternativa4. Especificar el nivel de significancia5. Determinar el tamao de la muestra6. Establecer los valores crticos que establecen las regiones de rechazo de las de no rechazo.7. Determinar la prueba estadstica.8. Coleccionar los datos y calcular el valor de la muestra de la prueba estadstica apropiada.9. Determinar si la prueba estadstica ha sido en la zona de rechazo a una de no rechazo.10. Determinar la decisin estadstica.11. Expresar la decisin estadstica en trminos del problema.

Bibliografahttp://cosmech.tripod.com/index.htmhttp://www.ditutor.com/estadistica/medidas_centralizacion.htmlhttp://www.ditutor.com/inferencia_estadistica/estadistica_inferencial.htmlhttp://www.vitutor.net/2/12/estimacion_estadistica.html