tr_bases_4

9
Estudio de una poblaci´ on Una poblaci´ on es un conjunto de elementos homog´ eneos respecto a una variable que se desea estudiar. Debe definirse sin ambig¨ uedad de manera que siempre pueda clasificarse un elemento como perteneciente o no a ella Ejemplo: Como parte de un proyecto de mejora ambiental en el campus en el que proponemos la eliminaci´on de la circulaci´on de veh´ ıculos, queremos incluir un estudio sobre la opini´on de las personas vinculadas a la universidad. ¿Cu´ anta gente est´ a a favor de prohibir la entrada de coches en el campus? ¿C´ omo definimos la poblaci´on? 1. Todos los estudiantes matriculados durante este curso en los tres ciclos 2. Todo el personal de administraci´on y servicios (incluidos los dependientes de alguna contrata) con un contrato de seis meses como m´ ınimo 3. Todos los profesores a tiempo completo.

description

POBLACION

Transcript of tr_bases_4

  • Estudio de una poblacion

    Una poblacion es un conjunto de elementos homogeneos respecto a

    una variable que se desea estudiar.

    Debe definirse sin ambiguedad de manera que siempre pueda

    clasificarse un elemento como perteneciente o no a ella

    Ejemplo: Como parte de un proyecto de mejora ambiental en el campus en el

    que proponemos la eliminacion de la circulacion de vehculos, queremos incluir

    un estudio sobre la opinion de las personas vinculadas a la universidad.

    Cuanta gente esta a favor de prohibir la entrada de coches en el campus?

    Como definimos la poblacion?

    1. Todos los estudiantes matriculados durante este curso en los tres ciclos

    2. Todo el personal de administracion y servicios (incluidos los dependientes

    de alguna contrata) con un contrato de seis meses como mnimo

    3. Todos los profesores a tiempo completo.

  • Suponemos que en cada elemento de la poblacion se ha definido una

    variable aleatoria, y queremos conocer su distribucion entre los

    elementos de la poblacion.

    Puede ocurrir:

    1. La distribucion la conocemos por estudios anteriores o viene

    prefijada por la forma de recoger la informacion.

    2. La forma de la distribucion la conocemos pero depende de los

    valores que toman algunos parametros (caractersticas que sirven

    para determinarla)

    3. No tenemos ni idea de como se distribuye la probabilidad.

    Podemos estudiar la variable en toda la poblacion?

    SI = hacemos un CENSO, que es un estudio exhaustivo en todoslos elementos de la poblacion

    NO = cogemos una MUESTRA, que es un conjunto representativode elementos de la poblacion

    Cuando la muestra esta bien escogida podemos obtener una infor-

    macion similar a la del censo con mayor rapidez y menor coste.

  • Analisis de poblaciones grandes por muestreo

    N tamano de la poblacion

    n numero de elementos que forman la muestra

    n/N Fraccion de muestro (proporcion de la poblacion representada enla muestra)

    N/n Factor de elevacion (unidades en la poblacion por cada elementoen la muestra)

    ESTIMADOR: valor que puede calcularse a partir de los datos de la

    muestra y que proporciona informacion sobre el valor del parametro

    Importante: como es su PRECISION?

    En el ejemplo: Para cada individuo de los N que hay en la poblacion definimos

    Xi =

    {1 si la persona i-esima esta a favor

    0 si esta en contraXi Bernoulli(p)

    El parametro p es la proporcion de personas a favor = Cuanto vale p?

    Censo o muestra?

    Elegimos una muestra de n personas = X1, . . . , Xn v.a.i.i.d. Bernoulli(p)

    X numero de personas a favor entre las n, X =n

    i=1 Xi Bin(n, p)

    Numero esperado de respuestas positivas es E(X) = np

    Estimamos p como la proporcion de respuestas positivas en la muestra

    Como elegimos la muestra para que sea representativa de toda la poblacion?

  • Sesgos de muestreo

    El riesgo principal de un procedimiento de muestreo es obtener una

    MUESTRA SESGADA, que significa que no es representativa de la

    poblacion

    1. Sesgo de seleccion: algunos miembros de la poblacion tienen una

    probabilidad mas alta que otros de estar representados en la muestra

    En el ejemplo: si solo preguntamos a las personas que salen de la estacion

    de tren a primera hora MUESTRA SESGADA

    Solucion: Disenar la muestra con un procedimiento objetivo que garan-

    tice la representacion de todos los individuos de la poblacion . . .

    2. Sesgo por no respuesta: una parte de la poblacion no esta represen-

    tada porque no proporciona respuesta

    En el ejemplo: si enviamos un cuestionario, puede que no contesten los

    que no tienen coche propio por sentirse poco afectados MUESTRASESGADA

    Solucion: no siempre se puede evitar, pero al menos se debe controlar

    (incluir preguntas tipo tienes coche propio . . . ?)

  • Muestreo aleatorio simple (m.a.s.)

    Diremos que hemos extrado una muestra aleatoria simple cuando

    su proceso de extraccion garantice:

    1. Cada elemento de la poblacion tiene la misma probabilidad de ser

    elegido

    2. Los elementos se seleccionan de uno en uno y con reposicion, de

    manera que la poblacion permanece identica en todas las extrac-

    ciones

    Notar: cuando la fraccion de muestreo (n/N) es pequena, sera

    indiferente realizar el muestreo con o sin reposicion

    - Se utiliza cuando la poblacion es homogenea respecto a la carac-

    terstica a estudiar

    - Para disenar la muestra se utilizan los numeros aleatorios

    En el ejemplo: si esperamos que la opinion sea homogenea en todos los grupos

    universitarios, otorgamos un numero a cada persona y sorteamos n numeros,

    luego preguntamos a los que hayan salido elegidos

  • Muestreo sistematico

    Se utiliza cuando la poblacion esta ordenada en una lista.

    1. Elegimos al azar un individuo n1 entre los primeros fe

    fe = redondear N/n

    2. Elegimos a continuacion los elementos n1 + fe, n1 + 2fe, . . . hasta

    completar la muestra

    - Si la lista esta ordenada al azar, es equivalente al m.a.s.

    - Si existe algun ciclo en la lista puede aparecer un sesgo de seleccion

  • Muestreo estratificado

    Cuando la poblacion se divide en clases o estratos formados por ele-

    mentos heterogeneos (entre estratos) respecto a la variable, la mues-

    tra se toma siguiendo:

    1. Se asigna un numero de miembros a cada estrato

    a) Proporcionalmente al tamano relativo del estrato en la poblacion

    b) Proporcionalmente a la variabilidad que presenta la carac-

    terstica que estudiamos dentro de cada estrato

    2. Los elementos que forman la muestra se escogen por muestreo

    aleatorio simple dentro del estrato

    - Necesitamos disponer de informacion sobre que estratos existen (no

    siempre es sencillo . . . )

    - En general, es mas preciso que el m.a.s.

    En el ejemplo: Si sospechamos que la opinion puede ser diferente entre distintos

    estamentos universitarios, seleccionamos m.a.s. dentro de cada estrato, de

    tamano proporcional a la dimension relativa del estrato

  • Muestreo por conglomerados.

    Cuando la poblacion se clasifica en unidades amplias de agrupacion

    fsica, en el espacio o en el tiempo, que llamamos conglomerados

    Idealmente los elementos dentro de cada conglomerado tienen que

    ser tan heterogeneos como en la poblacion total respecto a la variable

    que se estudia (los conglomerados son unidades representativas)

    El muestreo se hace por etapas:

    1. Seleccionamos aleatoriamente algunos conglomerados

    2. Si dentro de cada conglomerado existen nuevos conglomerados,

    seleccionamos aleatoriamente algunos de ellos

    3. Dentro de cada conglomerado analizamos todos los elementos o

    una m.a.s.

    En el ejemplo: las opiniones dentro de cada facultad son representativas de

    lo que ocurre en toda la poblacion. El muestreo lo hacemos seleccionando

    aleatoriamente una o varias facultades (conglomerados)

  • Muestro polietapico

    Para estudiar poblaciones complejas se combinan las ideas de estrati-

    ficacion y conglomerados en procedimientos de muestreo polietapicos.

    Entre Dentro

    Estratos heterogeneos homogeneos

    Conglomerados homogeneos heterogeneos

    1. Se agrupan los conglomerados en estratos y seleccionamos una

    muestra estratificada de los conglomerados

    La probabilidad de elegir un conglomerado dentro de cada estrato

    es proporcional a su poblacion

    2. Repetimos el proceso si dentro de cada conglomerado seleccionado

    hay otra estructura de conglomerados o estratos

    3. Se toman uno o varios elementos de la unidad final por m.a.s.

    En el ejemplo: las facultades las podemos agrupar en estratos (letras o ciencias,

    mas o menos alejadas de la estacion, . . . )

    Como debemos elegir la muestra para que sea representativa de

    la opinion de todos los interesados en el tema de la prohibicion

    de los vehculos en el campus?

    Otros: Muestreo por cuotas, muestreo por rutas aleatorias, . . .