Post on 04-Nov-2015
description
1
TABLA DE CONTENIDO1.OBJETIVOS32.ALCANCES33.INTRODUCCIN34.FUNDAMENTO TEORICO35.PRIMER TRABAJO DEJADO POR EL PHD . MARN76.TABLAS Y FIGURAS76.1 Tablas de datos Tabla de datos de poblacin anormal76.2 Figuras histogramas y P-P plot87.SEGUNDO TRABAJO DEJADO POR EN PHD. MARN117.1Algoritmo del Variograma117.2Visualizacin del programa117.3Algoritmo del programa en VBA117.4Creacin de datos con el T.L.C iniciar el programa128.TABLAS Y FIGURAS138.1Tablas de datos generados138.2Figuras149.CONCLUSIONES1510.REFERENCIAS15
OBJETIVOS Analizar la grfica p-p plot de los Ln de los datos dejador por el PHD Marn. Analizar la grfica p-p plot de los Ln de los datos con un incremento de datos anormales. Tener capacidad para comprender porque se produce cambios es la grppafica p-p plot. Crear un algoritmo para generar datos con distribucin de gauss usando el Teorema del Limite Central.ALCANCESEn el transcurso de este informe se podr dar cuenta de que el anlisis de la curva p-p plot del Ln de los datos nos da informacin de posibles anomalas en nuestros datos.INTRODUCCINLa necesidad de acudir a herramientas estadsticas para el anlisis de datos en todas las reas del conocimiento, ha hecho que aparezcan con el correr de los aos nuevas metodologas que, no obstante se centran en fundamentos probabilsticos comunes, son especficas para cada una de las diversas disciplinas del saber. Algunos ejemplos son, entre otros, la econometra, psicometra o la bioestadstica. La gran relevancia que tiene actualmente a nivel mundial el tema ambiental ha hecho que los profesionales en estadstica encaminen esfuerzos en el desarrollo de nuevas tcnicas apropiadas para el anlisis de informacin enmarcada dentro de este contexto. Como consecuencia de este impulso surgi la geoestadstica, teniendo como padre a George Matheron.FUNDAMENTO TEORICOPROBABILIDAD-PROBABILIDAD (PP) TERRENOUna probabilidad-probabilidad (PP) parcela se utiliza para ver si un determinado conjunto de datos sigue alguna distribucin especificado. Debe ser aproximadamente lineal si la distribucin especificado es el modelo correcto.
La probabilidad-probabilidad (PP) trama se construye utilizando la funcin de distribucin acumulada terica, F (x), del modelo especificado. Los valores de la muestra de datos, en orden de menor a mayor x, se denotan (1), X (2), ..., x (n). Para i = 1, 2, ....., n, F (x (i)) se representa frente a (i-0.5) / n.EjemploEn la figura de abajo, dos conjuntos de datos se han visualizado en grficos de probabilidad normal. El primer conjunto de datos (que se muestra en negro) realmente proviene de una distribucin normal, por lo que la trama PP es lineal. El segundo conjunto de datos (que se muestra en rojo) proviene de una distribucin exponencial, por lo que no es ni siquiera cerca de simetra, y la trama del PP se desva de una lnea recta. El uso de estas parcelas, queremos inferir correctamente que el primer conjunto de datos es normal, pero la segunda no lo es.
HISTOGRAMAEn estadstica, un histograma es una representacin grfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. Sirven para obtener una "primera vista" general, o panorama, de la distribucin de la poblacin, o la muestra, respecto a una caracterstica, cuantitativa y continua, de la misma y que es de inters para el observador (como la longitud o la masa). De esta manera ofrece una visin en grupo permitiendo observar una preferencia, o tendencia, por parte de la muestra o poblacin por ubicarse hacia una determinada regin de valores dentro del espectro de valores posibles (sean infinitos o no) que pueda adquirir la caracterstica. As pues, podemos evidenciar comportamientos, observar el grado de homogeneidad, acuerdo o concisin entre los valores de todas las partes que componen la poblacin o la muestra, o, en contraposicin, poder observar el grado de variabilidad, y por ende, la dispersin de todos los valores que toman las partes, tambin es posible no evidenciar ninguna tendencia y obtener que cada miembro de la poblacin toma por su lado y adquiere un valor de la caracterstica aleatoriamente sin mostrar ninguna preferencia o tendencia, entre otras cosas.En el eje vertical se representan las frecuencias, es decir, la cantidad de poblacin o la muestra, segn sea el caso, que se ubica en un determinado valor o subrango de valores de la caracterstica conocido como intervalo de clase. En el eje horizontal se representa el espectro de valores posibles que toma la caracterstica de inters, evidentemente, cuando ste espectro de valores es infinito o muy grande el mismo es reducido a slo una parte que muestre la tendencia o comportamiento de la poblacin, en otras ocasiones ste espectro es extendido para mostrar el alejamiento o ubicacin de la poblacin o la muestra analizada respecto de un valor de inters.TEOREMA DEL LIMITE CENTRALEl teorema del lmite central o teorema central del lmite indica que, en condiciones muy generales, si Sn es la suma de n variables aleatorias independientes y de varianza no nula pero finita, entonces la funcin de distribucin de Sn se aproxima bien a una distribucin normal (tambin llamada distribucin gaussiana, curva de Gauss o campana de Gauss). As pues, el teorema asegura que esto ocurre cuando la suma de estas variables aleatorias e independientes es lo suficientemente grande.Sealafuncin de densidadde ladistribucin normaldefinida como1
con unamediay unavarianza2. El caso en el que su funcin de densidad sea, a la distribucin se le conoce comonormal estndar. Se defineSncomo la suma denvariables aleatorias, independientes, distribuidas, y con una mediay varianza2finitas (20):
de manera que, la media deSnesny lavarianzan2, dado que son variables aleatorias independientes. Con tal de hacer ms fcil la comprensin del teorema y su posterior uso, se hace una estandarizacin deSncomo
para que la media de la nueva variable sea igual a 0 y ladesviacin estndarsea igual a 1. As, las variablesZnconvergern en distribucina la distribucin normal estndarN(0,1), cuandontienda ainfinito. Como consecuencia, si (z) es lafuncin de distribucinde N(0,1), para cadanmero realz:
donde Pr() indicaprobabilidady lim se refiere almite matemtico.
PRIMER TRABAJO DEJADO POR EL PHD . MARNAgregar datos al archivo una poblacin anormal y ver la media y desviacin tpica hacer el P-P plotTABLAS Y FIGURAS6.1 Tablas de datosTabla de datos de poblacin anormal#DatosLn(datos)
11,91,65
2,76-,27
3,76-,27
4,90-,10
52,991,10
6,49-,71
7,69-,37
81,59,46
92,39,87
10,87-,14
111,88,63
12,97-,03
131,10,10
142,08,73
1965,74-,30
1966,91-,10
19672,05,72
19681,51,41
19693,031,11
19701,12,12
1971,61-,49
1972,95-,05
19731,44,37
19741,16,15
19751,41,35
19761,15,14
1977,86-,15
19782,65,97
#datosLn(datos)
15.041.62
26.531.88
34.451.49
45.861.77
54.931.59
65.071.62
75.121.63
85.841.76
94.141.42
104.031.39
114.631.53
125.851.77
135.011.61
144.911.59
876.391.85
885.861.77
893.301.19
903.711.31
914.651.54
925.221.65
934.051.40
944.681.54
955.431.69
965.371.68
974.821.57
982.731.00
995.731.75
1004.551.52
6.2 Figuras histogramas y P-P plotHISTOGRAMA DE DATOS DEL PHD. MARN
HISTOGRAMA DE LN(DATOS)
P-P PLOT DE LN DE DATOS
HISTOGRAMA DE DATOS AADIDOS CON POBLACIN ANORMAL
HISTOGRAMA DE LN(DATOS+POBLACION ANORMAL)
P-P PLOT DE LN(DATOS+POBLACION ANORMAL)
SEGUNDO TRABAJO DEJADO POR EN PHD. MARNHacer un programa para generar datos con distribucin de gauss usando el Teorema de Limite CentralAlgoritmo del VariogramaEl algoritmo fue desarrollado en el programa VBA, de tal manera que podamos generar 1000 grupos de 100 datos aleatorios y por cada grupo obtener un valor con el T.L.C.Los datos sern puestos en una hoja de Excel pudiendo realizar luego la grfica del histograma correspondiente.Visualizacin del programa
Algoritmo del programa en VBADim aleatorio(1 To 100) As DoubleDim alfa, beta As DoubleDim i, j As IntegerPrivate Sub CommandButton1_Click()Randomizealfa = Val(txt1.Text)beta = Val(txt2.Text)For i = 1 To 1000 For j = 1 To 100 aleatorio(j) = Rnd() suma = suma + aleatorio(j) Next Cells(i, 1) = beta * ((suma - 100 * (1 / 2)) / ((100 ^ 0.5) / (12 ^ 0.5))) + alfa suma = 0NextEnd Sub End SubCreacin de datos con el T.L.C iniciar el programaAsignamos una media = 3 y una desviacin = 1
TABLAS Y FIGURASTablas de datos generados1.- Tabla de 1000 datos generados#Dato generado
13.236860107
22.502508926
33.044123336
44.036864883
52.592318956
62.743508351
71.566836175
83.016841672
94.048143127
103.946861591
112.576919439
123.822491352
133.095587863
142.210041671
154.163704581
163.763722511
9813.455611601
9823.234596133
9833.530082571
9842.559191859
9852.62424915
9862.123699456
9873.151480568
9883.854348866
9892.567150621
9901.601683139
9912.028891703
9922.964398612
9932.586083034
9943.308582791
9952.754979527
9963.088222431
9973.714864213
9984.38110192
9992.033434848
10002.228549237
MediaVarianzaDesviacin estndar
3.024287120.911503120.954726727
Figuras
CONCLUSIONES El p-p plot sirve para identificar la funcin ms adecuada para representar los datos. El p-p plot ayuda a identificar posibles anomalas en el muestreo al variar la recta. El Teorema del Limite central nos ayuda a simular datos con una media y desviacin estndar dados. El teorema del lmite central nos da como resultado una funcin de gaussREFERENCIASClases de Informtica por Ing. Chvez, Adolfo Clases del PhD. Alfredo Marn SuarezClases realizadas por el Ing. Tves.http://www.stats.gla.ac.uk/glossary/?q=node/392http://es.wikipedia.org/wiki/Teorema_del_l%C3%ADmite_central