Capitulo 34 - WordPress.com€¦ · por mínimos cuadrados usando fórmulas ... Si la línea de...

Capitulo

Describir la

relación entre dos

variables

Relación entre dos variables

reserved

Al estudiar conjuntos de variables con más de una

variable, una pregunta fundamental debe ser si

podemos utilizar el valor de una variable para predecir

el valor de alguna otra variable.

Ejemplos:

• ¿Existe una relación entre la estatura y el peso?

• ¿Existe una relación entre la dosis de un

medicamento y el tiempo de recuperación?

• ¿Existe una relación entre la tasa de criminalidad y

los cambios en la población?

reserved

Tipos de variables en un experimento

• Variable de respuesta

• variable bajo estudio;

• aquella variable cuyos cambios se desean

estudiar

• variable dependiente en el estudio

• Variable explicativa

• variable cuyos valores explican los valores de

la variable respuesta

• se estudian los efectos que tiene la variable

explicativa sobre la variable respuesta

• variable que manipula el investigador

• variable independiente en el experimento

reserved

Diagrama de dispersión

• El primer paso para identificar el tipo de relación que

puede existir entre dos variables es hacer un dibujo.

• Datos de dos variables pueden ser representados

gráficamente a través de un diagrama de

dispersión.

• Diagrama de dispersion es una gráfica formada

localizando en el plano-xy los pares ordenados que

corresponden a las variables bajo estudio.

• Los valores de las variables se expresan como pares

ordenados (x, y);

x → variable explicativa (variable de entrada)

y → variable de respuesta (variable de salida)

reserved

Diagrama de dispersión (cont.)

• Es una gráfica que muestra la relación entre

dos cantidades cuantitativas que se miden en

un mismo individuo.

• Cada individuo en el conjunto de

observaciones se representa con un punto

del diagrama.

• El eje horizontal representa la variable

explicativa, y el eje vertical representa la

variable respuesta.

• Esta gráfica nos permite observar si hay una

relación lineal entre la variable explicativa y la

variable de respuesta.

EJEMPLO Construir e interpretar un diagrama de dispersión

Source: Penner, R., and Watts, D.G. “Mining Information.” The American Statistician, Vol. 45, No. 1, Feb. 1991, p. 6.

reserved

Los investigadores deseaban

determinar si el tiempo que se

necesita para perforar en seco una

distancia de 5 pies de roca

incrementa con la profundidad a la

que se comienza la perforación.

• La profundidad a la que comienza

la perforación es la variable

explicativa, x

• el tiempo (en minutos) para

perforar 5 pies es la variable de

respuesta, y.

Dibuje un diagrama de dispersión de

los datos.

reserved

EJEMPLO … Diagrama de dispersión (cont)

reserved

Tipos de Relaciones en un

Diagrama de Dispersión

reserved

Correlación lineal

• Si a medida que los valores de una variable aumentan

los valores de la otra variable también aumentan,

entonces existe correlación positiva.

• Si a medida que los valores de una variable aumentan

los valores de la otra variable disminuyen, entonces

existe correlación negativa.

• Coeficiente de correlación lineal de una muestra (r)

es una medida de la fuerza y dirección de la relación

lineal entre dos variable cuantitativas (coeficiente de

correlación Pearson)

reserved

Coeficiente de correlación lineal de una muestra

reserved

Propiedades del Coeficiente de correlación lineal

reserved

Tipos de correlación

Determine el coeficiente de

correlación lineal de la data

sobre perforación en rocas.

reserved

EJEMPLO Coeficiente de correlación lineal

reserved

EJEMPLO Coeficiente de correlación lineal (cont.)

EJEMPLO ¿Existe una relación lineal?

Determine si existe una relación lineal en la data sobre

perforación en rocas. Si existe, comente sobre el tipo de relación

que existe entre la profundidad a la cual se comienza a perforar y

el tiempo que toma perforar 5 pies. .

• El coeficiente de correlación

entre la profundidad y el

tiempo es 0.773.

• Según la tabla, para r = 0.773

existe una relación lineal

positiva moderada entre la

profundidad y el tiempo de

perforar rocas.

reserved

Ejemplo: • Según datos recopilados por El Resumen Estadístico de

Los Estados Unidos, la correlación entre el porcentaje de la población femenina con grados de bachillerato y el porcentaje de nacimientos a madres solteras desde 1990 es 0.940.

Cierto o Falso: Un porcentaje mayor de féminas con bacillerato causa un porcentaje mayor de madres solteras. • ¡Falso! • Cuando obtenemos datos obtenidos mediante

observación y no a través de un diseño experimental, no podemos definir una relación causal .

reserved

Diferencia entre correlación y

relación causal

• Entre dos variables puede existir otro factor que provoca una correlación alta sin que haya una relación causal.

Ejemplo: Se ha encontrado que la relación entre la venta de helado y la taza de criminalidad tiene una correlación positiva alta. Justificación • A medida que aumentan las temperaturas ambientales.

tanto la venta de helados como la criminalidad aumenta. • La variable “temperatura ambiental” afecta tanto la venta

de helado como la alza en criminalidad. • La variable “temperatura ambiental” se conoce como una

variable oculta.

reserved

Variables ocultas (“lurking variables”)

(a) Encuentre una ecuación lineal que relaciona x (la variable explicativa) con y, (la variable de respuesta) seleccionando dos puntos y luego, encontrar la ecuación de la recta que contiene los puntos.

Use la siguente muestra:

Usando (2, 5.7) y (6, 1.9): 5.7 1.9

5.7 0.95 2

5.7 0.95 1.9

0.95 7.6

y y m x x

reserved

0 1 2 3 4 5 6 7

(b) Traza la gráfica de la ecuación sobre el diagrama de dispersión

(c) Use the equation to predict y if x = 3. 0.95 7.6

0. 395( ) 7.6

} (3, 5.2)

residual = observed y – predicted y = 5.2 – 4.75 = 0.45

La diferencia entre el valor observado de la variable respuesta y el valor estimado usando el modelo lineal que hemos obtenido se conoce como error, o residual.

Ejemplo: residual = observado en y – estimado en y = 5.2 – 4.75 = 0.45

Valores residuales

0 1 2 3 4 5 6 7

Línea de regresión por mínimos

cuadrados

• La línea de regresión por mínimos cuadrados es la línea que minimiza los residuales.

• Es la línea que minimiza la suma de los cuadrados de las distancias verticales entre los valores observados y los valores que predice el modelo.

Línea de regresión por mínimos

cuadrados

La ecuación de la línea de regresión por mínimos cuadrados está dada por

𝑦 = 𝑏1𝑥 + 𝑏0

donde 𝑏1 = 𝑟 ∙𝑠𝑦

𝑠𝑥 es la pendiente

y 𝑏0 = 𝑦 − 𝑏1𝑥 es el intercepto en y

EXAMPLE Determinar el modelo de regresión lineal

Usar los datos sobre perforación

de rocas

(a)Encuentre la línea de

regresión por mínimos

cuadrados.

(b)Predecir el tiempo de

perforación en caso de que la

perforación se inicia en 130

(c)Dibuje la línea de regresión

por mínimos cuadrados sobre

el diagrama de dispersión de

los datos.

reserved

EJEMPLO Determinar la línea de regresión (cont.)

(a)Modelo que da TI 89 Titanium

(c) El tiempo observado es 6.93 segundos. El tiempo de perforación predecido es ≈ 7.03 s

𝑦 = 0.011553𝑥 + 5.52727

𝑦 = 0.011553(130) + 5.52727

𝑦 = 7.02916

La línea de regresión por mínimos cuadrados

sobre el diagrama de dispersión de los datos

usando TI 89

0 20 40 60 80 100 120 140 160 180 200

Profundidad (pies)

La línea de regresión por mínimos cuadrados

sobre el diagrama de dispersión de los datos

usando Excel

EJEMPLO Predecir peso del oso negro americano

Los datos muestran la longitud y el

peso de 10 osos blancos

americanos. Se quiere poder usar

el largo para predecir el peso.

(a) Construir un diagrama de

dispersión

(b) Encuentre la línea de regresión

por mínimos cuadrados usando

la fórmula.

(c)Compare la respuesta de b, con

la línea de regresión por

mínimos cuadrados que da la

calculadora.

𝒚 = 𝒃𝟏𝒙 + 𝒃𝟎 , 𝒃𝟏 = 𝒓 ∙𝒔𝒚

𝒔𝒙, 𝒃𝟎 = 𝒚 − 𝒃𝟏𝒙

Calcular la ecuación de la línea de regresión

por mínimos cuadrados usando fórmulas

𝑏1 = 𝑟 ∙𝑠𝑦

𝑠𝑥

𝑏1 = 0.703903 ∙27.9982

11.6329

𝑏1 = 1.69416

𝑏0 = 𝑦 − 𝑏1𝑥 𝑏0 = 99.5833 − 1.69416 142.875

𝑏0 = −142.47

longitud

𝒚 = 1.69416𝒙 − 142.47

Interpretación de la pendiente: • La pendiente de la línea de regresión es 1.69417. • Su interpretación es que para cada cm adicional de longitud,

el peso aumenta aproximadamente 1.69 kg, en promedio. Interpretación del intercepto en y: • El intercepto en y de la línea de regresión es -142. 471. • Para interpretar el intercepto en y, nos hacemos dos

preguntas: 1. ¿Es 0 un valor razonable para la variable explicativa? 2. ¿Existe alguna observación cerca de x=0 en el conjunto?

• Un valor de 0 NO es razonable en este problema ya que una longitud de 0 implica que el oso no existe.

reserved

Interpretación de la pendiente y el intercepto

en y de la línea de regresión

Si la línea de regresión por mínimos cuadrados se utiliza para hacer predicciones basadas en los valores de la variable explicativa que son mucho más grande o mucho más pequeño que los valores observados, decimos que el investigador está trabajando fuera del alcance del modelo. Nunca usamos una línea de regresión por mínimos cuadrados para hacer predicciones fuera del alcance del modelo, porque no podemos estar seguros de que la relación lineal sigue existiendo.

Si una gráfica de los residuos contra la variable explicativa muestra un patrón discernible, tal como una curva definida, entonces, es posible que las variables no estén relacionadas linealmente.

reserved

Comentarios sobre los residuos

reserved

Un químico tiene una muestra de 1,000 gramos de un material radiactivo. Se registra la cantidad de material radiactivo restante en la muestra todos los días durante una semana y obtiene los siguientes datos.

Día Peso (en gramos)

0 1000.0

1 897.1

2 802.5

3 719.8

4 651.1

5 583.4

6 521.7

7 468.3

reserved

coeficiente de correlación lineal: -0.994

reserved

Cantidad de material radioactivo restante

reserved

𝑦 = −75.2964𝑥 + 969.025

Modelo lineal no es apropiado.

reserved

Capitulo 34 - WordPress.com€¦ · por mínimos cuadrados usando fórmulas ... Si la línea de...

Documents

Transcript of Capitulo 34 - WordPress.com€¦ · por mínimos cuadrados usando fórmulas ... Si la línea de...

Aproximación por mínimos cuadrados - Facultad de Ingeniería - Universidad de …jana/gal22010/clase12.pdf · 2010. 9. 9. · planteo del problema mínimos cuadrados - recta mínimos

Mínimos cuadrados lineales

Método de Mínimos Cuadrados

Investigación Mínimos cuadrados generalizados para funciones ...

face.unt.edu.ar · Contenidos: Modelos uniecuacionales, máxima verosimilitud, mínimos cuadrados generalizados, métodos no lineales. Mínimos cuadrados ordinarios, regresión simple,

Ejercicios de compensación, y mínimos cuadrados-Topografía

PROBLEMAS DE MÍNIMOS CUADRADOS

TEMA II Análisis de Regresión Simple Mínimos Cuadrados Ordinarios (MCO)

Algoritmo Recursivo de Mínimos Cuadrados: Identificación ...

El Coeficiente de Correlación y la Recta de Mínimos Cuadrados

MÍNIMOS CUADRADOS. A mxn A x = b Sistema Inconsistente.

Metodos Numericos, diferencias divididas de Newton y mínimos cuadrados

El modelo Mínimos cuadrados

Investigación Mínimos cuadrados generalizados para ... · 1 Investigación Mínimos cuadrados generalizados para funciones vectoriales en la Geofísica Espacial Jorge Lemagne Pérez

Regresión lineal simple mínimos cuadrados

Estimación de modelos de regresión por mínimos cuadrados ...

Ejercicios resueltos mínimos cuadrados (línea recta y parábola)

Modelo matemático para el ajuste simultáneo mínimos cuadrados ...

El Método de los Mínimos Cuadrados - BAIXARDOC

UTILIZACIÓN DE UN ALGORITMO DE MÍNIMOS CUADRADOS ... · UTILIZACIÓN DE UN ALGORITMO DE MÍNIMOS CUADRADOS ... plástica uniforme, pueden determinarse mediante transformaciones