Assignment 1

2
A = {a 1 ,a 2 ,a 3 , ..., a n } W = {w 1 ,w 2 ,w 3 , ..., w m } WA = (WA) i=1...m,j=1....n WA i,j w i a j l i w i L = {l 1 , ......,l m } w i a j w i a j WAL P (W, A) P (W, A) i,j w i a j P (w i ,a j ) P (W |A) P (A|W ) P (A) P (W ) E[l] l V ar(l)

Transcript of Assignment 1

  • Actividad N 1

    Procesos Estocsticos y Simulacin

    26 de Enero del 2015

    Mximo: 2 estudiantes por grupo.

    Fecha de Entrega: 14 de Febrero

    Valor: 10 Puntos

    Recomendaciones:

    Cualquier plagio de internet o entre grupos automticamente anular el

    valor del trabajo.

    El trabajo deber ser entregado en formato pdf, elaborado en latex.

    El cdigo fuente de R deber estar anexo, comentario lnea a lnea.

    El trabajo deber ser sustentado en la fecha de entrega.

    1. (Valor 5)Dado un conjunto de archivos A = {a1, a2, a3, ..., an} y unconjunto de palabras W = {w1, w2, w3, ..., wm}. Dada la matriz WA =(WA)i=1...m,j=1....n, donde WAi,j equivale al nmero de veces que apa-rece la palabra wi en el archivo aj .Tambin dado li la longitud (nmerode caracteres) de la palabra wi, y dado L = {l1, ......, lm} un vector co-lumna. Asumamos que el proceso en el cual un archivo es seleccionado

    aleatoriamente tiene una probabilidad uniforme y a su vez una palabra wipresente en el archivo aj es escogido aleatoriamente con una probabilidadproporcional a la frecuencia de wi en aj .

    (a) Para las siguiente expresiones usted deber calcular la matriz solici-

    tada tal que incluya a las matrices WA,L, escalares, vectores, etc...

    Matriz P (W,A)(cada posicin de la matriz P (W,A)i,j , corres-ponde a la probabilidad conjunta de la palabra wiy el archivoaj , P (wi, aj)).

    Matriz P (W |A). Matriz P (A|W ). Vector P (A).

    Vector P (W ).

    E[l](El valor espeado de una variable aleatoria l corresponde ala longitud de una palabra seleccionada aleatoriamente).

    V ar(l)

    (b) Deber programar en R un funcin que genere el valor de la matriz

    solicitada para cada una de las expresiones.

    1

  • (c) Tenga en cuenta que:

    WA =

    2 3 0 3 70 5 5 0 35 0 7 3 33 1 0 9 90 0 7 1 36 9 4 6 0

    L =

    523643

    2. (Valor 1.5)Implemente un algoritmo en R para calcular la mediana de

    un conjunto de datos cuya complejidad computacional sea de O(nlogn),compare los resultados con un algoritmo del orden O(n2).

    3. (Valor 3.5)Demuestre que:

    Para una variable aleatoria X = {x1, x2, x3, x4, ....xn}con una distri-bucin binomial E[X] = np, donde n es el nmero de datos y p es laprobabilidad de xito.

    Para una variable aleatoria X = {x1, x2, x3, x4, ....xn} con una dis-tribucin bernoulli E[X] = p, donde p es la probabilidad de xito.

    Para una variable aleatoria X = {x1, x2, x3, x4, ....xn}con una distri-bucin poisson E[X] = y V ar[X] = , donde es el nmero dehechos que ocurre en un intervalo de tiempo.

    Referencias

    [1] Blanco Liliana. Probabilidad. Universidad Nacional de Colombia.2014.

    [2] Hanwen ZHang, Teora estadstica: Aplicaciones y mto-

    dos.Universidad Santo Tomas.2010.

    [3] Knill, Oliver. Probability Theory and Stochastic Processes with Ap-

    plications.2009.

    2