Conceptos Distribución Muestrales

download Conceptos Distribución Muestrales

of 2

description

Conceptos de Distribución Muestral

Transcript of Conceptos Distribución Muestrales

  • Universidad Nacional Agraria La Molina Departamento de Manejo Forestal FR2000 ESTADISTICA FORESTAL

    Pgina 1 ConceptosDistribMuestrales.doc

    CONCEPTOS SOBRE DISTRIBUCIONES MUESTRALES1

    Si de una poblacin formada por 12 probetas de papel de las que se desea conocer el ndice de blancura se toman en forma aleatoria todas las muestras de tamao n=3 que es posible obtener con reemplazo, entonces se completarn Nn muestras, o sea 123 o 1728 muestras. Si las muestras se obtuvieran sin reemplazo, entonces el nmero de muestras que podra formarse se calcula con la frmula:

    En el caso actual el desarrollo de esta frmula es:

    O sea, 220 muestras.

    Dado que cada muestra est formada por individuos de valores variables dentro del rango de variacin de la poblacin de la que provienen, es posible obtener un promedio muestral x y una varianza muestral s2.

    El teorema del lmite central seala que sin tener en cuenta la forma funcional de la poblacin de donde se extrae la muestra, la distribucin de las medias muestrales, calculadas con muestras de tamao n extradas de una poblacin con media y varianza finita 2, se aproxima a una distribucin normal con media y varianza 2/n, cuando n aumenta. Si n es grande, la distribucin de las medidas muestrales pueden aproximarse mucho a una distribucin normal.

    El promedio de la nueva poblacin de medias (media de medias) se simboliza as: x , y se obtiene sumando todas las medias muestrales y dividiendo el resultado entre M, el nmero de medias que intervienen en la suma.

    La desviacin estndar de dichas medias, simbolizada como x , se denomina frecuentemente error estndar de la muestra, o simplemente error estndar, y se calcula con la frmula:

    Es decir, la raz cuadrada de la sumatoria de los cuadrados de las desviaciones de las medias muestrales (respecto de la media de la poblacin) dividida por el tamao de esta poblacin de medias.

    Si conocemos los parmetros de una poblacin, la varianza x 2 de la poblacin de medias obtenidas con muestras de tamao n se calcula tomando la varianza de la poblacin original 2 y dividindola por el tamao de las muestras: 2/n.

    Si no conocemos los parmetros de una poblacin, una muestra obtenida de ella nos permite obtener un estimacin s2 de la varianza 2 de los individuos de tal poblacin. La varianza de la poblacin de medias

    2x se estimar en tal caso mediante la ecuacin: nssx

    22 = , donde n es el tamao de muestra. Si contamos con una serie de m medias (una parte de la poblacin de medias) obtenidas de muestras de

    tamao n, una mejor estimacin de 2x se logra mediante ( )

    m

    xxs

    m

    x

    = 1

    2

    2

    , donde x es el promedio

    aritmtico de estas m medias.

    1 Responsable: Ing.For. Carlos R. Vargas Salas

    nN

    6880362600001479

    )123()12..89(12...1112

    !3)!312(!12

    312

    ===

    M

    XM

    ixi

    x

    =

    = 1

    2)(

    &&&

    Las poblaciones de medias muestrales se mantienen centradas en el promedio de la poblacin original pero la variabilidad que les caracteriza es menor, estrechndose la curva de la distribucin de frecuencias. La forma de esta curva ser cada vez ms parecida a la distribucin normal conforme crezca el tamao de las muestras.

    x i n2 (>n1) x i n1 X

  • Universidad Nacional Agraria La Molina Departamento de Manejo Forestal FR2000 ESTADISTICA FORESTAL

    Pgina 2 ConceptosDistribMuestrales.doc

    La distribucin normal es un ideal matemtico, y difcilmente puede encontrarse en la naturaleza variables aleatorias que se distribuyan exactamente en forma normal. Sin embargo, muchas variables pueden caracterizarse mediante la distribucin normal.

    Cuando al investigar algn fenmeno la variable X de inters est normalmente distribuida por lo menos de manera aproximada, utilizamos en su anlisis el conocimiento que tenemos de la distribucin normal.

    La curva normal est definida por dos constantes que representan a la poblacin, esto es, la media y la desviacin estndar . Conociendo tales constantes (o parmetros), se puede dibujar la curva, mediante la

    aplicacin de la ecuacin

    2

    2

    21

    =x

    ey

    En una distribucin normal, el rea bajo la curva entre dos valores X1 y X2 corresponde al porcentaje de elementos de la poblacin que ocurren dentro del rango que tales valores determinan. Si levantamos dos ordenadas a una distancia a ambos lados de la media, el rea de la porcin central que as se corta es aproximadamente 68% (68.27%) del rea total, encontrndose la proporcin restante en las porciones laterales. Igualmente, si las ordenadas se levantan en ambos lados de la media a una distancia igual a 2, el rea central representar aproximadamente el 95% (95.44%). Ello equivale a decir que slo el 5%, aproximadamente, del nmero total de observaciones se desva de la media en 2 o ms.

    De lo sealado se desprende que, para una curva normal, la proporcin del rea total contenida entre dos ordenadas depende de la distancia a la que se encuentran estas ordenadas del promedio , distancia medida en desviaciones estndar .

    Para responder a preguntas de probabilidad transformamos la variable X con media y desviacin estndar en la variable Z, con media 0 y desviacin estndar 1. Para ello empleamos la frmula (x - )/ mediante la cual cualquier valor x de la variable aleatoria X se transforma en un valor Z de la variable normal estandarizada. Cuando X iguala a la media {x=}, la variable Z tiene valor 0; cuando X es una desviacin estndar menor que el promedio {(x - ) = -}, Z posee valor -1; y si X supera en una desviacin estndar al valor de la media {(x - ) = }, Z posee valor 1.

    As, aplicada la frmula de transformacin, puede establecerse que la eleccin aleatoria de una observacin cuyo valor Z es 2 o ms alto, ocurrir en slo el 2.5% de los casos. Igualmente, slo en el 2.5% de los casos elegiremos aleatoriamente una observacin cuyo valor Z es -2. En el 95% de los casos de elementos sacados aleatoriamente, se tratar de observaciones con valor Z entre los dos valores referidos.

    Para fines de claridad en la explicacin, en los prrafos precedentes se ha recurrido a aproximaciones. As por ejemplo, en vez de 2F como medida de la distancia desde para que las ordenadas definan la proporcin 95% (Z=+2 y Z= -2), debera emplearse la expresin 1.96F (Z=+1.96 y Z= -1.96). La tabla siguiente contiene algunos valores especficos de Z y las probabilidades de eleccin aleatoria de observaciones X.

    z1 Valor X original

    P(-z1Z> z1)

    1 1 0.6827 0.3173 1.96 1.96 0.9500 0.0500

    2 2 0.9544 0.0456 2.58 2.58 0.9900 0.0100

    3 3 0.9974 0.0026 Los textos de estadstica contienen tablas mucho ms completas de valores Z. Algunas tablas indican la

    probabilidad de ocurrencia de valores ms grandes que el valor Z de referencia, mientras que otros indican la probabilidad de ocurrencia de valores menores que el valor Z de referencia.

    As como podemos convertir los valores individuales de X a valores Z empleando la frmula (x - )/, se pueden convertir los individuos que conforman la poblacin de medias a travs de ( x - )/ x . De una serie de m medias podemos obtener igual nmero de valores Z, cada uno positivo o negativo, es decir, ( x - )/ x = z.

    -3 -2 -1 0 1 2 3 z

    2.5% 2.5%