Tecnicas de Estadistica - Regresión

download Tecnicas de Estadistica - Regresión

of 20

Transcript of Tecnicas de Estadistica - Regresión

  • El diagrama de dispersin es una tcnica estadstica utilizada para estudiar la relacin entre dos variables. Por ejemplo, entre una caracterstica de calidad y un factor que le afecta.CURVA DE AJUSTEFrecuentemente encontramos que existe una relacin entre dos o ms variables, y la expresamos por medio de una ecuacin matemtica.

  • Uno de los propsitos principales de la curva de ajuste es estimar una de las variables (la variable dependiente) de la otra (la variable independiente). El proceso de estimacin se conoce como regresin. Si y se va estimar a partir de x por medio de alguna ecuacin la llamamos ecuacin de regresin de y sobre x y a la curva correspondiente curva de regresin de y sobre x.

  • La relacin entre dos variables se representa mediante una grfica de dos dimensiones en la que cada relacin est dada por un par de puntos (uno para cada variable). La variable del eje horizontal x normalmente es la variable causa, y la variable del eje vertical y es la variable efecto.

  • MTODO DE MNIMOS CUADRADOSMs de una curva parece ajustar a un conjunto de datos, por lo que se hace necesario obtener la mejor recta o curva de ajuste.

    De todas las curvas de aproximacin de un conjunto de puntos de datos dados, la curva que tenga la propiedad de que

    Es la mejor curva de ajuste.

  • ANALISIS DE CORRELACION SIMPLEOBJETIVOSMuchas decisiones comerciales dependen de conocer la relacin entre dos o ms variables. El anlisis de correlacin da como resultado un nmero que resume el grado de relacin lineal existente entre dos variables.Utiliza diagramas de dispersin para estimar la relacin entre dos variables.El coeficiente de correlacin expresa el grado de asociacin lineal que existe entre dos variables.

  • COVARIANZA: Estadstica que mide el grado de dispersin conjunta de dos variables x e y. Se define como la media aritmtica de los productos de las diferencias de los datos con respecto a sus medias. Se denota por: Cov(X, Y) SXY

  • Diagrama de dispersin: Llamada tambin nube de puntos, grfica que presenta la relacin entre las dos variables de inters.Anlisis de correlacin: Tcnicas estadsticas empleadas para medir la intensidad de la relacin (correlacin) entre dos variables.Ejemplo: Se est realizando un estudio de mercado para determinar si existe relacin entre la cantidad gastada por semana en alimentos y el tamao de la familia. Se toma una muestra de 10 familias y revel las siguientes cifras:

  • X : 3 6 5 7 4 5 2 5 8 1Y : 90 130 110 140 100 115 80 105 150 70 DIAGRAMA DE DISPERSINX : Tamao de la familia Y : Dinero gastado en alimentos

  • Coeficiente de correlacin: Mide la intensidad de la relacin entre dos variables, se denota por r. Puede tomar cualquier valor entre -1 a +1 inclusive.r = +1,00 Correlacin perfecta positiva.r = - 1,00 Correlacin perfecta negativa.r = 0,00 No existe correlacinLa frmula para el clculo de r es:r recomendable: [ -1; -0,8 ] [ 0,8; 1,0 ]COVARIANZADESVIACIONES ESTNDAR

  • ANALISIS DE REGRESION SIMPLEOBJETIVOS El anlisis de regresin lineal da como resultado una ecuacin matemtica que describe cierta relacin entre dos o ms variables. Utiliza estimacin de mnimos cuadrados para predecir valores futuros de la variable dependiente. Medir el error en el pronstico, error estndar.

  • ECUACION DE REGRESIONExpresin matemtica que define la relacin entre la variable independiente (x) y la variable dependiente (y). La determinacin de la recta de regresin se lleva a cabo mediante el mtodo denominado: Principio de mnimos cuadrados, que proporciona la recta de mejor ajuste.La forma general de la ecuacin de regresin es:Modelo Matemtico Lineal

  • Y : Valor pronosticado de la variable dependiente Y para un valor seleccionado de la variable independiente X. X : Valor seleccionado para la variable X.a : Interseccin con el eje Y. Valor estimado de Y cuando X = 0.b : Pendiente de la recta. Variacin de Y cuando la variable independiente X varia en una unidad.

  • Las frmulas para hallar a y b son:Donde:X : Es el valor de la variable independiente.Y : Es el valor de la variable dependiente.n : Es el nmero de elementos de la muestra.

  • En nuestro ejemplo, la ecuacin de regresin lineal obtenida a travs de Excel es:Su representacin grfica es:http://www.stat.wvu.edu/SRS/Modules/Applets/Regression/regression.html

    Grfico2

    9090.2832448378

    130125.3773156342

    110113.6792920354

    140137.075339233

    100101.9812684366

    115113.6792920354

    8078.5852212389

    105113.6792920354

    150148.7733628319

    7066.8871976401

    55.1955.1891740413

    Y

    Pronstico para Y

    Hoja1

    390Resumen

    6130

    5110Estadsticas de la regresin

    7140Coeficiente de correlacin mltiple0.99

    4100Coeficiente de determinacin R^20.98

    5115R^2 ajustado0.97

    280Error tpico4.15

    5105Observaciones10.00

    8150

    170ANLISIS DE VARIANZA

    055.19Grados de libertadSuma de cuadradosPromedio de los cuadradosFValor crtico de F

    Regresin1.005802.265802.26337.010.00

    Residuos8.00137.7417.22

    Total9.005940.00

    CoeficientesError tpicoEstadstico tProbabilidadInferior 95%Superior 95%Inferior 95.0%Superior 95.0%

    Intercepcin55.193.2117.180.0047.7862.5947.7862.59

    Variable X 111.700.6418.360.0010.2313.1710.2313.17

    Anlisis de los residuales

    ObservacinPronstico para YResiduos

    190.28-0.280.08

    2125.384.6221.37

    3113.68-3.6813.54

    4137.082.928.55

    5101.98-1.983.92

    6113.681.321.74

    778.581.422.00

    8113.68-8.6875.33

    9148.771.231.50

    1066.893.119.69

    0.00137.74

    Syx17.22

    4.15

    Hoja1

    Y

    Pronstico para Y

    Hoja2

    390Resumen

    6130

    5110Estadsticas de la regresin

    7140Coeficiente de correlacin mltiple0.99

    4100Coeficiente de determinacin R^20.98

    5115R^2 ajustado0.98

    280Error tpico3.91

    5105Observaciones11.00

    8150

    170ANLISIS DE VARIANZA

    055.19Grados de libertadSuma de cuadradosPromedio de los cuadradosFValor crtico de F

    Regresin1.008434.558434.55551.130.00

    Residuos9.00137.7415.30

    Total10.008572.29

    CoeficientesError tpicoEstadstico tProbabilidadInferior 95%Superior 95%Inferior 95.0%Superior 95.0%

    Intercepcin55.192.3923.050.0049.7760.6149.7760.6057814419

    Variable X 111.700.5023.480.0010.5712.8310.5712.825238816

    Anlisis de los residuales

    ObservacinPronstico para YResiduos

    190.28-0.28

    2125.384.62

    3113.68-3.68

    4137.082.92

    5101.98-1.98

    6113.681.32

    778.591.41

    8113.68-8.68

    9148.771.23

    1066.893.11

    1155.190.00

    Hoja2

    Y

    Pronstico para Y

    Hoja3

  • Coeficiente de determinacin (r2):Mide la proporcin(%) de la variacin total en la variable y que se explica se debe , a la variacin en la variable x.En nuestro ejemplo:r = 0,99 significa que las dos variables tienen una correlacin positiva intensa.r2 = 0,98 significa que el 98% de la variacin total del dinero gastado en alimentos, se debe es explicado por la variacin del tamao de las familias.

  • ERROR ESTANDAR DE ESTIMACIONResume la disparidad entre lo observado y lo estimadoEs un indicador del grado de precisin con que la ecuacin de regresin, describe la relacin entre las dos variables.

    Hoja1

    390Resumen

    6130

    5110Estadsticas de la regresin

    7140Coeficiente de correlacin mltiple0.99

    4100Coeficiente de determinacin R^20.98

    5115R^2 ajustado0.97

    280Error tpico4.15

    5105Observaciones10.00

    8150

    170ANLISIS DE VARIANZA

    055.19Grados de libertadSuma de cuadradosPromedio de los cuadradosFValor crtico de F

    Regresin1.005802.265802.26337.010.00

    Residuos8.00137.7417.22

    Total9.005940.00

    CoeficientesError tpicoEstadstico tProbabilidadInferior 95%Superior 95%Inferior 95.0%Superior 95.0%

    Intercepcin55.193.2117.180.0047.7862.5947.7862.59

    Variable X 111.700.6418.360.0010.2313.1710.2313.17

    Anlisis de los residuales

    YYY - Y

    9090.28-0.280.08

    130125.384.6221.37

    110113.68-3.6813.54

    140137.082.928.55

    100101.98-1.983.92

    115113.681.321.74

    8078.581.422.00

    105113.68-8.6875.33

    150148.771.231.50

    7066.893.119.69

    0.00137.74

    Syx17.22

    4.15

    Hoja1

    9090.2830188679

    130125.3773584906

    110113.679245283

    140137.0754716981

    100101.9811320755

    115113.679245283

    8078.5849056604

    105113.679245283

    150148.7735849057

    7066.8867924528

    Y

    Pronstico para Y

    Hoja2

    390Resumen

    6130

    5110Estadsticas de la regresin

    7140Coeficiente de correlacin mltiple0.99

    4100Coeficiente de determinacin R^20.98

    5115R^2 ajustado0.98

    280Error tpico3.91

    5105Observaciones11.00

    8150

    170ANLISIS DE VARIANZA

    055.19Grados de libertadSuma de cuadradosPromedio de los cuadradosFValor crtico de F

    Regresin1.008434.558434.55551.130.00

    Residuos9.00137.7415.30

    Total10.008572.29

    CoeficientesError tpicoEstadstico tProbabilidadInferior 95%Superior 95%Inferior 95.0%Superior 95.0%

    Intercepcin55.192.3923.050.0049.7760.6149.7760.6057814419

    Variable X 111.700.5023.480.0010.5712.8310.5712.825238816

    Anlisis de los residuales

    ObservacinPronstico para YResiduos

    190.28-0.28

    2125.384.62

    3113.68-3.68

    4137.082.92

    5101.98-1.98

    6113.681.32

    778.591.41

    8113.68-8.68

    9148.771.23

    1066.893.11

    1155.190.00

    Hoja2

    Y

    Pronstico para Y

    Hoja3

  • Regresin en ExcelLos valores que se presentan a continuacin corresponden a las ventas en unidades de cierto artculo por da.Valores de XValores de YValores de Salida

    DaVenta110021503140412551306150714081609180

  • Regresin en ExcelValores de SalidaCoeficiente de CorrelacinCoeficiente de DeterminacinParmetros del modelo:a: Intercepto con el eje Yb: Pendiente (ndice de regresin) SSE