ESTADSTICA BIDIMENSIONAL
1.- Se considera la tabla estadstica siguiente:
X 2 4 3 5
Y 1 2 1 1 3
a) Calcule el valor de sabiendo que la media de X es 3.
Tenemos que la media se calculara como 2 4 3 5
3 14 15 15
x
b) Mediante la correspondiente recta de regresin lineal, haga una prediccin del valor que se obtiene para Y cuando X=4.5. Halle el cuadrado del coeficiente de correlacin entre
X e Y y explique la fiabilidad de la prediccin anterior.
Construimos la tabla siguiente:
X Y ni xini yini xi2ni yi
2ni xi yi ni
2 1 1 2 1 4 1 2
4 2 1 4 2 16 4 8
1 1 1 1 1 1 1 1
3 1 1 3 1 9 1 3
5 3 1 5 3 25 9 15
5 15 8 55 16 29
Y por tanto
3, 2
1.6, 0.8
1
X
y
XY
x S
y S
S
y con estos resultados 1
0.88392 0.8
r
y por tanto,
entre las dos variables existe una relacin estadstica directa muy fuerte y tiene sentido
calcular la recta de regresin para realizar las predicciones. Realizado este clculo se
obtiene que la recta de regresin de Y sobre X ser 0.5 0.1y x y para el caso de que
x=4.5 se obtiene que 2.35y .
El cuadrado de r ser 2 0,78r , por lo que podremos decir que el 78% de la
variabilidad de Y quedara explicada por la variable X, lo cual da una alta fiabilidad.
2.- Se pasa un cuestionario a un grupo de 40 alumnos para medir su dominio del vocabulario (X) y su capacidad de razonamiento (Y). Con los resultados se han obtenido las
siguientes cantidades: 2 21800, 86000, 1390, 53100, 66500x x y y x yi i i i i i
a) Halle la recta de regresin de Y sobre X.
Realizamos todos los clculos: 1800
4540
xixn
,
139034.75
40
yiyn
,
22
286000 45 11,1840
iX
xS x
n
,
22
253100 34.75 10.9540
iY
yS y
n
6650045 34.75 98.75
40
i iXY
x yS xy
n
y por lo tanto
98.750.8065
11.18 10.95r
y se
trata, por tanto, de una relacin estadstica directa y fuerte siendo la recta de regresin
de Y sobre X 0.79 0.8y x
b) Qu capacidad de razonamiento cabe esperar para un alumno que tiene una puntuacin de 60 en dominio del vocabulario?.
Basta sustituir en la ecuacin calculada la x por el valor de 60, obtenindose 46.6y en
capacidad de razonamiento.
ESTADSTICA BIDIMENSIONAL
3.- La informacin estadstica obtenida de una muestra de tamao 6 sobre la relacin existente entre el nmero de horas de estudio dedicado a la preparacin de un examen y
la puntuacin obtenida en dicho examen, se refleja en la siguiente tabla:
Horas de estudio (X) 15 20 25 32 18 34
Puntuacin (Y) 50 60 70 92 70 84
a) Halle la ecuacin de la recta de regresin de Y sobre X. Realizamos los clculos reflejados en la siguiente tabla estadstica
X Y xini yini xi2ni yi
2ni xi yi ni
15 50 15 50 225 2500 750
20 60 20 60 400 3600 1200
25 70 25 70 625 4900 1750
32 92 32 92 1024 8464 2944
18 70 18 70 324 4900 1260
34 84 34 84 1156 7056 2856
144 426 3754 31420 10760
Y tenemos que 24, 7.05
89.3371, 13.99
X
XY
Y
x SS
y S
y con estos datos la recta de regresin
sera 1.7987 27.83y x
b) Obtenga el coeficiente de correlacin lineal entre X e Y e interprtalo.
89.330.906
7.05 13.99r
, y la relacin que existe entre las dos variables es estadstica
directa y muy fuerte, es decir la nube de puntos est muy cerca de la recta de regresin
y por lo tanto las predicciones serian muy fiables.
4.- La estatura y pesos de 10 jugadores de baloncesto de un equipo son:
Estatura (X) 186 189 190 192 193 193 198 201 203 205
Pesos (Y) 85 85 86 90 87 91 93 103 100 101
a) Halla la recta de regresin de Y sobre X.
X Y ni xini yini xi2ni yi
2ni xi yi ni
186 85 1 186 85 34596 7225 15810
189 85 1 189 85 35721 7225 16065
190 86 1 190 86 36100 7396 16340
192 90 1 192 90 36864 8100 17280
193 87 1 193 87 37249 7569 16791
193 91 1 193 91 37249 8281 17563
198 93 1 198 93 39204 8649 18414
201 103 1 201 103 40401 10609 20703
203 100 1 203 100 41209 10000 20300
205 101 1 205 101 42025 10201 20705
10 1950 921 380618 85255 179971
Y con estos clculos 195, 6.066
37.692.1, 6.564
X
XY
Y
x SS
y S
y la recta de regresin sera
1.0217 107.139y x
b) Halla el coeficiente de correlacin.
ESTADSTICA BIDIMENSIONAL
El coeficiente de correlacin lineal ser 37.6
0.9446.066 6.564
r
, y la relacin que existe
entre las dos variables es estadstica directa y muy fuerte
c) Si el equipo ficha a un jugador que mide 208 cm, se puede predecir su peso? En caso afirmativo, obtenerlo.
Basta sustituir en la ecuacin calculada la x por el valor de 208, obtenindose 105.38y
como peso en Kg estimado. Esta prediccin es muy fiable ya que 2100 89.16F r
indica que el 86% de la variabilidad del peso queda explicada por la variable estatura.
5.- Las puntuaciones obtenidas por un grupo de alumnos de 2 Bachillerato en una batera de test que mide la habilidad verbal (X) y el razonamiento abstracto (Y) son las siguientes:
X Y 20 30 40 50
[25, 35) 6 4
[35, 45) 3 6 1
[45, 55) 2 5 3
[55, 65) 2 7
Se pide:
a) Existe correlacin entre ambas variables? Aunque no es necesario, traslado esta tabla de doble entrada a una de simple entrada y
realizo en ella los clculos(tambin los podra haber realizado en esta tabla)
Variable
X
Variable
Y Marca
de X
Marca
de Y ni xini yini xi2ni yi
2ni xi yi ni
25 35 20 30 20 6 180 120 5400 2400 3600
25 35 30 30 30 4 120 120 3600 3600 3600
35 45 20 40 20 3 120 60 4800 1200 2400
35 45 30 40 30 6 240 180 9600 5400 7200
35 45 40 40 40 1 40 40 1600 1600 1600
45 55 30 50 30 2 100 60 5000 1800 3000
45 55 40 50 40 5 250 200 12500 8000 10000
45 55 50 50 50 3 150 150 7500 7500 7500
55 65 40 60 40 2 120 80 7200 3200 4800
55 65 50 60 50 7 420 350 25200 17500 21000
39 1740 1360 82400 52200 64700
Y con estos clculos 44.615, 11.058
103.15634.872, 11.064
X
XY
Y
x SS
y S
y el coeficiente de
correlacin sera 103.156
0.84311.058 11.064
r
lo que nos muestra que existe relacin
estadstica positiva o directa fuerte entre ambas variables.
b) Segn los datos de la tabla, si uno de estos alumnos obtiene una puntuacin de 70 puntos en razonamiento abstracto, en cunto se estimar su habilidad verbal?
En este caso tendremos que calcular la recta de regresin de X sobre Y, ya que el dato
conocido es de Y y el que queremos estimar es de X. Con los clculos realizados
tendremos que esta recta ser: 2103.156
44.615 ( 34.872)122.42
XY
Y
Sx x y y x y
S y
simplificada 0.843 15.23x x y en el caso de y=70 tendremos que 74,216x ,
resultado fiable (F=71%) aunque se pierde algo de fiabilidad ya que el valor que
queremos estimar se encuentra fuera del rango de la variable.
Top Related