ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que...

184
’(3$57$0(172’((67$’¸67,&$(,19(67,*$&,ˇ123(5$7,9$ (67$’¸67,&$’(6&5,37,9$ 1 ESTADÍSTICA DESCRIPTIVA Nº 1.- Hallar: Media, moda, mediana, 1er cuartil, 6º decil, 52 percentil de la siguiente distribución: Xi 1 2 3 4 5 6 ni 2 15 9 6 3 1 Solución Xi 1 2 3 4 5 6 ni 2 15 9 6 3 1 Q ; 2 30 27 24 15 6 104 Ni 2 17 26 32 35 36 MEDIA ; = = 1 Q ; 36 104 = 2,89 MODA Mo = Valor de la variable que más veces se repite = 2 MEDIANA Me = Valor de la variable que deja por debajo suya el 50% de los valores, valor central de la distribución 18 2 36 2 = = 1 Valor de la variable cuya frecuencia acumulada sea 18, en este caso Me = 3 4 1 T 9 4 36 = Valor de la variable que deja el 25% de los valores debajo suya, el valor de la variable que ocupa el lugar 9º 4 1 T = 2 6º decil es = al percentil 60 100 60 T 6 , 21 36 100 60 = El valor de la variable que ocupa el lugar 22 100 60 T = 3 Percentil 52 100 60 T 72 , 18 36 100 52 = El valor de la variable que ocupa el lugar 19 100 52 T = 3

Transcript of ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que...

Page 1: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

1

ESTADÍSTICA DESCRIPTIVA

Nº 1.- Hallar: Media, moda, mediana, 1er cuartil, 6º decil, 52 percentil de la siguiente distribución:

Xi 1 2 3 4 5 6 ni 2 15 9 6 3 1

Solución

Xi 1 2 3 4 5 6 ni 2 15 9 6 3 1

�� Q; 2 30 27 24 15 6 104

Ni 2 17 26 32 35 36

MEDIA → ; = =∑1

Q; ��

36

104 = 2,89

MODA → Mo = Valor de la variable que más veces se repite = 2 MEDIANA → Me = Valor de la variable que deja por debajo suya el 50% de los

valores, valor central de la distribución

182

36

2==1

Valor de la variable cuya frecuencia acumulada sea 18, en este caso

Me = 3

4

1T → 94

36 = Valor de la variable que deja el 25% de los valores debajo suya, el valor

de la variable que ocupa el lugar 9º 4

1T = 2

6º decil es = al percentil 60 100

60T → 6,2136100

60 = El valor de la variable que ocupa el

lugar 22 100

60T = 3

Percentil 52 100

60T → 72,1836100

52 = El valor de la variable que ocupa el lugar 19

100

52T = 3

Page 2: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

2

Nº 2.- De las 283 personas encuestadas en 1993 sobre si se encontraban afiliados a algún sindicato, 86 contestaron afirmativamente. Con los resultados afirmativos y clasificados según la edad obtenemos la siguiente tabla:

Edad 25-35 35-45 45-55 55-65

Nº personas 45 23 15 3 86 Marca de clase 30 40 50 60

�� Q; 1350 920 750 180 3200

Ni 45 68 83 86 Hallar: Media aritmética. Mediana. Moda. 1er cuartil, 6º decil y 52 percentil. Solución ; = edad de las personas encuestadas

Media = ; ; = 1

Q; ��∑ = 86

3200 = 37,21

Mediana = Me

Intervalo mediano es el intervalo que contiene a la mediana, como N/2 es 2

86 = 43

el intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y 44, es decir el intervalo (25 - 35)

Me = =−

+=−

+=−

− 1045

0862

1

252

11

1

2

1 ��

�� &

Q

11

/T 34,55

Moda = Mo Intervalo modal es aquel que contiene la moda, la moda se encuentra en el intervalo que presenta mayor densidad de frecuencia, en este caso como los intervalos son de igual amplitud, el de mayor densidad de frecuencia coincide con el de mayor frecuencia, es decir el intervalo (25 - 35), y dentro de él consideramos como la moda, la marca de clase, es decir Moda = Mo = 30. También podemos aplicar la formula:

F

F

Q

F

Q

F

Q

/0

��

��

1

1

1

1

1

1

1

��

��

��

� �� ��Como todos los ci son iguales la formula

nos queda:

3510032

23 52

11

11 =

++=

++=

−+

+−

FQQ

Q/0 . es la moda

Page 3: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

3

Nº 3.- Calcular los datos que faltan en la siguiente tabla:

Li-1 - Li ni fi Ni 0 - 10 60 f1 60 10 - 20 n2 0,4 N2 20 - 30 30 f3 170 30 - 100 n4 0,1 N4 100 - 200 n5 f5 200

Solución

N = 200 N2 = N3 - n3 = 170 - 30 = 140 N2 = N2 - n1 = 140 - 60 = 80

f4 = 1

Q4 � n4 = f4 N = (0,1) 200 = 20

N4 = N3 + n4 = 170 + 20 = 190 n5 = N5 - N4 = 200 - 190 = 10

f1 = 1

Q1 = 200

60 = 0,3

f3 = 1

Q3 = 200

30 = 0,15

f5 = 1

Q5 = 200

10 = 0,05

La tabla completa queda:

Li-1 - Li ni fi Ni 0 - 10 60 0,30 60 10 - 20 80 0,40 140 20 - 30 30 0,15 170 30 - 100 20 0,10 190 100 - 200 10 0,05 200

Page 4: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

4

Nº 4.- Se desea conocer la media de edad de los tres grupos de teatro infantil que funcionan en un barrio. Grupo A: Grupo B: Grupo C: Años Nº niños Años Nº niños Años Nº niños

2 6 5 1 7 2 3 7 7 2 9 3 4 8 2 1 2 9 5 9 3 1 13 1 Solución X = edad de los niños

GRUPO A

años Nº niños Xini 2 3 4 5

6 7 8 9 30

12 21 32 45 110

ΝΑ = 30

�; = 1

;LQL¦ =30

110 = 3,66 años

GRUPO B

años Nº niños Xini

5 7 2 3

1 2 1 1 5

5 14 2 3

24

ΝΒ = 5

�; = 1

;LQL¦ = 5

24 = 4,8 años

GRUPO C

años Nº niños Xini

7 9 2 13

2 3 9 1 15

14 27 18 13 72

ΝC = 15

; = 1

;LQL¦ = 15

72 = 4,8 años

; = ���������

111

;1;1;1

��

�� =

15530

)8,4(15)8,4/(5)66,3(30

++++ =

= 50

204 = �����DxRV

Page 5: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

5

Nº 5.- Se ha tomado una muestra de 65 personas que leen más de 5 revistas al mes, y se ha clasificado según el nivel cultural. Calcular la mediana.

Nivel cultural Nº personas que leen 5 o más revistas 1. Lee sin estudios 7 2. Lee sin terminar primaria 5 3. Estudios primarios 8 4. Bachiller o similar 15 5. Universitarios 30

Solución Nivel cultural ni Ni

1 2 3 4 5

7 5 8

15 30 65

7 12 20 35 65

Mediana Me = Valor de la variable que divide a la distribución en dos partes iguales. Valor de la variable que ocupa el lugar central.

Valor de la variable que deja por debajo suya el 50% de los valores.

Como N/2 es 32,5, será el valor de la variable que ocupa el lugar inmediatamente siguiente al 32,5; en nuestro caso el nivel 4 "bachiller o similar"

Luego: El 50% de las personas que leen 5 revistas o más tienen un nivel cultural igual o inferior a "bachiller" y lógicamente el otro 50% tienen un nivel superior a "bachiller".

Page 6: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

6

Nº 6.- Se desea estudiar las alturas de un grupo de 20 alumnos, a través de sus promedios. Realizar el estudio:1º) Con los datos sin agrupar.

2º)Con los datos agrupados en intervalos de amplitud 10 cm. Las alturas fueron expresadas en cm.: 162-166-168-170-172-174-180-164-166-168-

168-172-178-182-164-166-168-170-176-188.

Solución X = altura de los alumnos 1º Sin agrupar:

Xi ni Ni Xini 162 164 166 168 170 172 174 176 178 180 182 188

1 2 3 4 2 2 1 1 1 1 1 1

20

1 3 6 10 12 14 15 16 17 18 19 20

162 328 498 672 340 344 174 176 178 180 182 188

3422

N = 20

N/2 = 10

�� Q;∑ ��������

0HGLD�� � ; �N

X i∑ �Q� �

20

422.3��

��������FP��

Moda � Mo = Valor de la variable que más veces se repite, en este caso el valor 168 es la moda, que se repite cuatro veces.

Mediana � Me = Valor de la variable que divide a la distribución en dos partes debajo suya el 50% de los valores. Como N/2 es 10, será la media aritmética de los valores que ocupan los lugares 10 y 11, es decir los valores 168 y 170 por tanto la mediana es el valor 169 cm.

2º Con los datos agrupados:

Li-1 - Li

Xi ni Ni Xini

160 - 170 170 - 180 180 - 190

165 175 185

10 7 3

20

10 17 20

1650 1225 555

3.430

�� Q;∑ = 3.430

; = N

n X ii∑ = 20

430.3

= 171,5 cm.

Moda:� Intervalo modal es aquel que contiene la moda, la moda se encuentra en el intervalo que presenta mayor densidad de frecuencia, en este caso como los intervalos son de igual amplitud, el de mayor densidad de frecuencia coincide con el de mayor frecuencia, es decir el intervalo (160 - 170), y dentro de él consideramos como la moda, la marca de clase, es decir

Page 7: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

7

Moda = 165 cm. También podemos aplicar la formula:

F

F

Q

F

Q

F

Q

/0

��

��

��

1

1

1

1

1

1

1

��

��

��

� �� ��Como todos los ci son iguales la formula

nos queda:

1701007

7 160

11

11

��

��

���

� ���

��� F

QQ

Q/0 cm. es la moda

Mediana Me Intervalo mediano es el intervalo que contiene a la mediana, como N/2 es 10 el intervalo mediano es aquel que contiene a los valores que ocupan los lugares 10 y 11, es decir el intervalo (160 - 170) contiene el valor que ocupa el lugar 10 y el intervalo (170 - 180) contiene el valor que ocupa el lugar 11, la mediana será entonces el valor 170 cm.

Como vemos hay pequeñas diferencias. Lo que se consigue agrupando los datos es rapidez y facilidad de cálculos a cambio de perder información

Page 8: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

8

Nº 7.- La siguiente distribución se refiere a la duración en horas de un lote de 500 tubos

fluorescentes:

DURACIÓN EN HORAS NÚMERO DE TUBOS 300 - 499 50 500 - 699 150

700 - 1.099 275 1.100 - O MÁS 25

TOTAL 500 1.- Representar el histograma de frecuencias relativas y el polígono de frecuencias 2.- Trazar la curva de frecuencias relativas acumuladas 3.- Determinar el número mínimo de tubos que tienen una duración inferior a 900 horas. Solución X = duración, en horas, de tubos fluorescentes

3.- 50+150+2

1275 = 337,5 tubos

100

UT = 900

100

UT = 700 + 400

275

200500100

−U

= 900

=

+−=

500

100200

400

275)700900(U 67,5%

67,5% de 500 = 0,675 (500) = 337,5 tubos. El número mínimo de tubos con una

duración inferior a 900 horas serán 338 tubos.

Page 9: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

9

Nº 8.- Calcular: Media, moda, mediana, 1er y 3er cuartil. Varianza, desviación típica y coeficiente de variación. De los siguientes datos obtenidos de una investigación en un establecimiento benéfico que tiene acogidos a 112 personas de diversas edades:

Edad 40-50 50-60 60-70 70-80 80-90 Nº Personas 13 24 29 35 11

Solución X = edad de los personas del establecimiento benéfico

Edad 40-50 50-60 60-70 70-80 80-90 �; 45 55 65 75 85

Nº Personas ( �Q ) 13 24 29 35 11 112

�1 13 37 66 101 112

�� Q; 585 1320 1885 2625 935 7350

�� Q; 2 26325 72600 122525 196875 79475 497800

; = 1

Q; ��¦ = 112

7350� �65,625 años

Moda � Mo � Intervalo que presenta mayor densidad de frecuencia, en este caso como todos los intervalos tienen la misma amplitud, el intervalo modal es (70.- 80)� � y dentro del intervalo podemos considerar la moda igual a la marca de clase ���o también aplicar la formula:�

F

F

Q

F

Q

F

Q

/0

!

1

1

1

1

1

1

1

"

"##

#

#

"�

� � � =+

+ 102911

1170 �72,75 años

Me = =−

+=−

+==−

− 1029

371122

1

602

11

1

4

2

2

1 $$

$$ &

Q

11

/TT 66,55 años

=−

+=−

+=−

− 1024

131124

1

504

11

1

4

1 %%

%% &

Q

11

/T 56,25 años

Page 10: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

10

=−

+=−

+=−

− 1035

661124

3

704

31

14

3 &&

&& &

Q

11

/T 75,14 años

22

2 ;1

Q;6

''( � ¦ = 2625,65

112

497800 − = 138�

75,111382 === )) 66 años

( );

6;&9

*= =

625,65

75,11 = 0,18

Como es menor de 1 podemos admitir que es homogénea y al ser bastante cercano a cero diremos que es bastante homogénea, por lo que la media de la distribución será bastante representativa del conjunto.

Page 11: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

11

Nº 9.- Las calificaciones de 150 alumnos en una determinada asignatura se distribuyen de la siguiente manera. Calcular la media aritmética y dar una medida de la representatividad.

Calificaciones 0-2 2-5 5-7 7-9 9-10 Nº Alumnos 30 52 38 25 5

Solución X = calificaciones de los alumnos en una asignatura

Calificaciones 0-2 2-5 5-7 7-9 9-10 +; 1 3,5 6 8 9,5

Nº Alumnos 30 52 38 25 5 ,, Q; 30 182 228 200 47,5 687,5

-- Q; 2 30 637 1368 1600 451,25 4086,25

,1 30 82 120 145 150

; = 1

Q; ..¦ = 150

5,687� �4,58

22

2 ;1

Q;6

//0 � ¦ = 258,4

150

25,4086 − = 6,23�

497,223,62 === 11 66

( );

6;&9

2= =

58,4

497,2 = 0,5451

Como es menor de 1 podemos admitir que es homogénea diremos que la media de la distribución es bastante representativa del conjunto.

Page 12: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

12

Nº 10.- Dada la siguiente distribución relativa a una muestra de 100 personas que emigran de una zona rural a una urbana clasificada según la edad.

a).- Calcular: media, mediana y moda. b).- Calcular el recorrido intercuartílico. c).- Calcular el coeficiente de variación.

Edades 11-20 21-30 31-50 51-70 Nº Personas 40 30 20 10

Solución X = edad de las personas que emigran

Edades 11 - 20 20 - 30 30 - 50 50 – 70 3; 15,5 25 40 60

Nº Personas 40 30 20 10 100 densidad 4,44 3 2 3

44 Q; 620 750 800 600 2770

55 Q; 2 9610 18750 32000 36000 96360

41 40 70 90 100

; = 1

Q; 66¦ = 100

2770� �27,70 años

Moda � Mo � Intervalo que presenta mayor densidad de frecuencia, en este caso como todos los intervalos no tienen la misma amplitud, el intervalo modal es (11.- 20)� TXH� WLHQH�PD\RU� GHQVLGDG� GH� IUHFXHQFLD� �y dentro del intervalo podemos considerar la moda igual a la marca de clase �����o también aplicar la formula:�

F

F

Q

F

Q

F

Q

/0

77

77

7

7

78

1

1

1

1

1

1

1

9

9:

::

:

9�

� � � =+

+ 90

10

3010

30

11 �20 años

Mediana:

502

100

2==1

Será el valor de la variable que ocupa el lugar 75, y está en el intervalo

mediano (20 – 30)

Me = =−

+=−

+==−

− 1030

401002

1

202

11

1

4

2

2

1 ;;

;; &

Q

11

/TT 23,33 años

Page 13: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

13

=−

+=−

+=−

− 940

01004

1

114

11

1

4

1 <<

<< &

Q

11

/T 16,625 años

=−

+=−

+=−

− 2020

701004

3

304

31

14

3 ==

== &

Q

11

/T 35 años

Recorrido intercuartílico = Re = distancia entre el 1º y 3º cuartil =

4

1

4

3 TT −

Re = 4

1

4

3 TT − = 35 – 16,625 = 18,375 años

22

2 ;1

Q;6

>>? � ¦ = 27,27

100

96360 − = 196,31�

1431,1962 === @@ 66 años

( );

6;&9

A= =

7,27

14 = 0,50

Como es menor de 1 podemos admitir que es homogénea, por lo que la media de la distribución será bastante representativa del conjunto.

Page 14: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

14

Nº 11.- Tipificar la siguiente distribución de frecuencias y comprobar que esta bien tipificada.

Xi 2 3 4 5 ni 5 9 10 6

Solución

B; CQ DD Q; EE Q; 2 F

GG6

;;=

−=

HH Q= II Q= 2

2 5 10 20 -1,5834 -7,918 12,537 3 9 27 81 -0,5726 -5,154 2,951 4 10 40 160 0,4380 4,380 1,919 5 6 30 150 1,4488 8,692 12,593 30 107 411 0 30

La media será: === ∑30

107

1

Q;;

JJ 3,56667

La varianza será: =−=−= ∑ 222

2 56667,330

411;

1

Q;6

KKL 0,978888

La desviación típica será: 2MN 66 += = =+= 97888,0O6 0,98938

=== ∑30

0

1

Q==

PP 0 =−=−= ∑ 22

22 0

30

30;

1

Q=6

QQR 1

2ST 66 += = =+= 1U6 1

Page 15: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

15

Nº 12.- Se desea averiguar la superficie media de los pisos en 2 barrios de Pamplona: Ermitagaña y Mendebaldea.

Del primero se toman 10 muestras y del segundo 12, con los siguientes resultados: Ermitagaña: 125-120-90-75-100-90-65-110-80-90

Mendebaldea: 70-65-70-90-85-140-65-70-80-90-92-100 ¿Cuál es la media del conjunto de ambos barrios? Solución 1; = superficie de los pisos de Ermitagaña

2; = superficie de los pisos de Mendebaldea

11 = Número de pisos de Ermitagaña = 10

21 = Número de pisos de Mendebaldea = 12

1; 125 120 90 75 100 90 65 110 80 90 945

2; 70 65 70 90 85 140 65 70 80 90 92 100 1017

21 5,94

10

945P; == 2

2 75,8412

1017P; ==

Lógicamente son subconjuntos excluyentes, la media del conjunto total será la media ponderada de las dos medias.

21

2211

11

;1;1; V WXV Y[Z

++

= = 1210

)75,84(12)5,94(10

++

= 22

1962 = 89,18 2P

La superficie media de los pisos del conjunto Ermitagaña – Mendebaldea es de 89,18 2P

Page 16: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

16

Nº 13.- Dada la siguiente distribución del número de hijos de 100 familias, calcular sus cuartiles:

Xi ni Ni 0 14 14 1 10 24 2 15 39 3 26 65 4 20 85 5 15 100 total 100

Solución X = número de hijos en una familia

251004

1 = =4

1T Valor de la variable que ocupa el lugar 25 =4

1T 2

501004

2 = =4

1T Valor de la variable que ocupa el lugar 50 =4

2T 3

751004

3 = =4

1T Valor de la variable que ocupa el lugar 75 =4

3T 4

Page 17: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

17

Nº 14.- El paro registrado en Navarra en el mes de Junio, por sexos y grupos de edad, fue:

VARONES MUJERES Li-1- Li ni Li-1-Li ni < 20 842 < 20 1493 20-24 1439 20-24 3140 25-29 1412 25-29 3381 30-34 872 30-34 2841 35-39 628 35-39 1919 40-44 516 40-44 1516 45-49 453 45-49 944 50-54 456 50-54 487 55-59 666 55-59 318 > 59 319 >59 101

Solución 1.- Calcular razonadamente Media, varianza, desviación típica, mediana, moda 2.- Calcular razonadamente 1er cuartil, 60º percentil. EDAD VARONES MUJERES

\\ // −−1 ]; ^Q ^1 __ Q; `` Q; 2 aQ b1 cc Q< dd Q< 2

16-20 18 842 842 15156 272808 1493 1493 26874 483732 20-25 22,5 1439 2281 32377,5 728493,75 3140 4633 70650 1589625 25-30 27,5 1412 3696 38830 1067825 3381 8014 92977,5 2556881,3 30-35 32,5 872 4565 28340 921050 2841 10855 92332,5 3000806,3 35-40 37,5 628 5193 23550 883125 1919 12774 71962,5 2698593,8 40-45 42,5 516 5709 21930 932025 1516 14290 64430 2738275 45-50 47,5 453 6162 21517,5 1022081,3 944 15234 44840 2129900 50-55 52,5 456 6618 23940 1256850 487 15721 25567,5 1342293,8 55-60 57,5 666 7284 38295 220162,5 318 16039 18285 1051387,5 60-65 62,5 319 7603 19937,5 1246093,8 101 16140 6312,5 394531,25 7603 263.873,5 10.532.314 16140 514.231,5 17.986.026

X = edad de los varones Y = edad de las mujeres

VARONES

; = 1

Q; ee¦ = 603.7

5,873.263� �34,7 años

Moda � Mo � Intervalo que presenta mayor densidad de frecuencia, en este caso como todos los intervalos tienen la misma amplitud, el intervalo modal es (20-25)� � y dentro del intervalo podemos considerar la moda igual a la marca de clase �����o también aplicar la formula:�

Page 18: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

18

F

F

Q

F

Q

F

Q

/0

ff

ff

f

f

fg

1

1

1

1

1

1

1

hh

ii

i

i

h�

� � � =+

+ 58421412

141220 �23,13años

5,380176032

1 = Intervalo mediano = (30 – 35)

Me = =−

+=−

+==−

− 5872

369376032

1

302

11

1

4

2

2

1 jj

jj &

Q

11

/TT 30,62años

75,190076034

1 = Intervalo = (20 – 25)

=−

+=−

+=−

− 51439

84276034

1

204

11

1

4

1 kk

kk &

Q

11

/T 23,68años

8,45617603100

60 = Intervalo = (30 – 35)

=−

+=−

+=−

− 5872

36937603100

60

30100

601

1100

60 ll

ll &

Q

11

/T 34,98 años

22

2 ;1

Q;6

mmn � ¦ = 27,34

7603

314.532.10 − = 180,78�

44,1378,1802 === oo 66 años

( );

6;&9

p= =

7,34

44,13 = 0,387

Como es menor de 1 podemos admitir que es homogénea y al ser bastante cercano a cero diremos que es bastante homogénea, por lo que la media de la distribución será bastante representativa del conjunto.

MUJERES

< = 1

<q∑ = 16140

5,231.514� �31,86 años

Page 19: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

19

Moda � Mo � Intervalo que presenta mayor densidad de frecuencia, en este caso como todos los intervalos tienen la misma amplitud, el intervalo modal es (25-30)� � y dentro del intervalo podemos considerar la moda igual a la marca de clase �����o también aplicar la formula:�

F

F

Q

F

Q

F

Q

/0

rr

rr

r

r

rs

1

1

1

1

1

1

1

tt

uu

u

u

t�

� � � =+

+ 58421412

141220 �23,13años

8070161402

1 = Intervalo mediano = (30 – 35)

Me = =−

+=−

+==−

− 52841

8014161402

1

302

11

1

4

2

2

1 vv

vv &

Q

11

/TT 30,01años

4035161404

1 = Intervalo = (20 – 25)

=−

+=−

+=−

− 53140

1493161404

1

204

11

1

4

1 ww

ww &

Q

11

/T 20,81años

968416140100

60 = Intervalo = (30 – 35)

=−

+=−

+=−

− 52841

801416140100

60

30100

601

1100

60 xx

xx &

Q

11

/T 32,94 años

22

2 <1

Q<6

yz{ −= ∑ = 286,31

16140

026.986.17 − = 99,2724�

96,92724,992 === || 66 años

( )<

6<&9

}= =

86,31

96,9 = 0,310

Como es menor de 1 podemos admitir que es homogénea y al ser bastante cercano a cero diremos que es bastante homogénea, por lo que la media de la distribución será bastante representativa del conjunto.

Page 20: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

20

Nº 15.- Calcular la mediana del salario de una determinada empresa con 34 empleados.

~; 20000 30000 40000 50000 60000 70000 80000

�Q 1 3 3 15 6 2 4

Solución X = Salarios de los empleados de una empresa

�; 20000 30000 40000 50000 60000 70000 80000

�Q 1 3 3 15 6 2 4

�1 1 4 7 22 28 30 34

17342

1 = → Me = 50.000 Valor de la variable que ocupa el lugar central. Valor que

deja el 50% de los valores por debajo suya. El 50% de los empleados de la empresa tienen un salario inferior a 50.000

Page 21: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

21

Nº 16.-Se ha tomado una muestra de 45 personas que asisten a los conciertos y se ha clasificado según la edad obteniéndose la siguiente distribución.

Calcular la edad mediana.

Años 14-19 20-26 27-32 33-40 41-50 51-60 61-69 Nº Personas 10 8 6 4 4 10 3

Solución Primeramente ponemos los límites de los intervalos. X = edad de las personas que asisten a conciertos

Años 14-20 20-27 27-33 33-41 41-51 51-61 61-69 Nº Personas 10 8 6 4 4 10 3

�1 10 18 24 28 32 42 45

5,22452

1 = → Me = Valor de la variable que ocupa el lugar central. Valor que deja el

50% de los valores por debajo suya. Intervalo mediano = aquel en el que se encuentra la mediana (27 – 33) Aplicando la formula:

Me = =−

+=−

+==−

− 66

18452

1

272

11

1

4

2

2

1 ��

�� &

Q

11

/TT 31,5 años

El 50% de las personas que asisten a conciertos tienen menos de 31,5 años

Page 22: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

22

Nº 17.-El número de varones jóvenes clasificados según la edad en el censo de 1987 era el siguiente. Calcular la desviación típica.

�; 19 20 21 22 23

�Q 127 120 112 130 120

Solución X = edad de los varones jóvenes.

�; 19 20 21 22 23

�Q 127 120 112 130 120 609

�� Q; 2.413 2.400 2.351 2.860 2.760 12.785

�� Q; 2 45.847 48.000 49.392 62.920 63.480 269.639

La desviación típica es la raíz cuadrada positiva de la varianza La varianza es la media aritmética de los cuadrados de las desviaciones de los valores de la variable a su media aritmética. Tanto la varianza como la desviación son medidas de dispersión absoluta, nos dan una idea de la distancia entre los valores y su media. A mayor desviación mayor será la dispersión de los valores y por tanto la media aritmética será menos representativa. Como medida de dispersión suele ser más interesante el coeficiente de variación que es una medida de dispersión relativa, que si esta entre 0 y 1 se considera que la distribución es homogénea, y cuanto mas se acerque a 0 será menos dispersa, por tanto más homogénea y la media más representativa del conjunto.

; = 1

Q; ��¦ = 609

785.12� �20,99 ≅ 21 años

22

2 ;1

Q;6

��� � ¦ = 221

609

639.269 − = 2,06�

435,106,22 === �� 66 Años

( );

6;&9

�= =

21

435,1 = 0,068

Como es menor de 1 podemos admitir que es homogénea y al ser bastante cercano a cero diremos que es bastante homogénea, por lo que la media de la distribución será bastante representativa del conjunto.

Page 23: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

23

Nº 18.-Los ingresos mensuales de 4 personas son: 60.000, 75.000, 65.000 y 150.000 ptas. La media aritmética de estos valores, ¿puede ser representativa? dígalo en %. Solución

�; = Ingresos mensuales en miles

�; �Q �1 �� Q; �� Q; 2

60 1 1 60 3.600 65 1 2 65 4.225 75 1 3 70 5.625 150 1 4 75 22.500 4 350 35.950

; = 1

Q; ��¦ = 4

350� �87,5 miles

22

2 ;1

Q;6

��� � ¦ = 25,87

4

950.35 − = 1.331,25�

48,3625,13312 === �� 66 miles

( );

6;&9

�= =

5,87

48,36 = 0,417 → 41,7%

Como es menor de 1 podemos admitir que es homogénea y al ser bastante cercano a cero diremos que es bastante homogénea, por lo que la media de la distribución será bastante representativa del conjunto.

Page 24: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

24

Nº 19.-Los asalariados de una oficina cobran los siguientes sueldos mensuales:

Sueldo (miles) 10-20 20-30 30-50 50-70 Nº Empleados 40 30 20 10

1.- Obtener el Sueldo medio del asalariado.

2.- Hallar la mediana y la Moda de la distribución de salarios y explicar su significado. 3.- Analizar la dispersión de la distribución, mediante el coeficiente de variación. Solución X = sueldos de los asalariados de una oficina.

Sueldo (miles) 10-20 20-30 30-50 50-70 �; 15 25 40 60

Nº Empleados = �Q 40 30 20 10 100

��

�F

QG =

4 3 1 0,5

�1 40 70 90 100

�� Q; 600 750 800 600 2.750

�� Q; 2 9.000 18.750 32.000 36.000 95.750

1.- Obtener el Sueldo medio del asalariado.

; = 1

Q; ��¦ = 100

750.2� �27,5 miles

2.- Hallar la mediana y la Moda de la distribución de salarios y explicar su

significado.

501002

1 = La mediana es el valor de la variable que ocupa el lugar central,

en nuestro caso el lugar 50. Intervalo mediano = Es aquel en el que se encuentra la mediana (20 – 30)

Me = =−

+=−

+==−

− 1030

401002

1

202

11

1

4

2

2

1 ��

�� &

Q

11

/TT 23,33 miles

El 50% de los asalariados de esta oficina, cobran menos de 23,33 miles

Moda � Mo � Intervalo que presenta mayor densidad de frecuencia, en este caso como todos los intervalos no tienen la misma amplitud, el intervalo modal es el que presenta mayor densidad de frecuencia, (10-20)��y dentro del intervalo podemos considerar la moda igual a la marca de clase ���o también aplicar la formula:�

Page 25: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

25

F

F

Q

F

Q

F

Q

/0

��

��

��

1

1

1

1

1

1

1

��

��

��

� � � =+

+ 100

10

3010

30

10 �20 miles

3.- Analizar la dispersión de la distribución, mediante el coeficiente de

variación.

La desviación típica es la raíz cuadrada positiva de la varianza La varianza es la media aritmética de los cuadrados de las desviaciones de los valores de la variable a su media aritmética. Tanto la varianza como la desviación son medidas de dispersión absoluta, nos dan una idea de la distancia entre los valores y su media. A mayor desviación mayor será la dispersión de los valores y por tanto la media aritmética será menos representativa. Como medida de dispersión suele ser más interesante el coeficiente de variación que es una medida de dispersión relativa, que si esta entre 0 y 1 se considera que la distribución es homogénea, y cuanto mas se acerque a 0 será menos dispersa, por tanto más homogénea y la media más representativa del conjunto.

22

2 ;1

Q;6

��� � ¦ = 25,27

100

750.95 − = 201,25�

186,1425,2012 === �� 66 miles

( );

6;&9

�= =

5,27

186,14 = 0,51

Como es menor de 1 podemos admitir que es homogénea y al ser bastante cercano a cero diremos que es poco dispersa, es decir, bastante homogénea, por lo que la media de la distribución será bastante representativa del conjunto.

Page 26: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

26

Nº 20.- Se han seleccionado una muestra de 176 personas que han respondido mejor a la pregunta: ¿Cree Vd. que dentro de un año la situación política será mejor, igual o peor que ahora? Se ha clasificado la respuesta según la edad del entrevistado. 1.- Desarrollar la distribución. 2.- Calcular medidas de tendencia central, de variabilidad o dispersión. 3.- Calcular las unidades Z para los siguientes valores: (18, 23, 29, 35, 44, 69)

 ; 15-18 19-21 22-25 26-35 36-45 46-60 61-70

¡Q 10 9 19 27 42 42 27

Solución

¡; = edad de las personas que han respondido a la pregunta = marca de clase del

intervalo i-esimo ¡¡ // −−1 = Intervalo i-esimo

¡Q = frecuencia absoluta del intervalo i-esimo ¡1 = frecuencia absoluta acumulada hasta el intervalo i-esimo incluido ¢I = frecuencia relativa del intervalo i-esimo ¢) = frecuencia relativa acumulada hasta el intervalo i-esimo incluido £& = amplitud del intervalo i-esimo

£G = ¤¤

&

Q = densidad de frecuencia

¤¤ // −−1 ¤; ¤Q ¥1 ¦I ¦)

100

%§I=

%acumulado

( )100¦) ¦& ¦G ¨¨ Q; ©© Q; 2

15-19 17 10 10 0,057 0,057 5,7 5,7 4 2,5 170 2890 19-22 20,5 9 19 0,051 0,108 5,1 10,8 4 2,25 184,5 3782,25 22-26 24 19 38 0,108 0,216 10,8 21,6 4 4,75 456 10944 26-36 31 27 65 0,153 0,369 15,3 36,9 10 2,7 837 25947 36-46 41 42 107 0,239 0,608 23,9 60,8 10 4,2 1722 70602 46-61 53,5 42 149 0,239 0,847 23,9 84,7 15 2,8 2247 120214,5 61-71 66 27 176 0,157 1 15,7 100 10 2,7 1782 117642 176 1 100 7.398,5 351.991,75

Media = ;

; = 1

Q; ªª¦ = 176

5,7398� �42 años

Moda � Mo � Valor de la variable que más veces se repite

Intervalo Modal, es el intervalo en el que se encuentra la moda, en este caso como todos los intervalos no tienen la misma amplitud, el intervalo modal es el que presenta mayor densidad de frecuencia, (22 - 26)��y dentro del intervalo podemos considerar la moda igual a la marca de clase ���o también aplicar la formula:�

Page 27: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

27

F

F

Q

F

Q

F

Q

/0

««

««

«

«

«¬

1

1

1

1

1

1

1

­­

®®

®

®

­�

� � � =+

+ 425,27,2

7,222 �24,18años

24,18 años es la edad que más veces se repite, es decir la más común entre los entrevistados.

Mediana = Me

881762

1 = La mediana es el valor de la variable que ocupa el lugar central,

en nuestro caso el lugar 88. Intervalo mediano = Es aquel en el que se encuentra la mediana (36-46)

Me = =−

+=−

+==−

− 1041

651762

1

362

11

1

4

2

2

1 ¯¯

¯¯ &

Q

11

/TT 41,60 años

El 50% de los entrevistados tienen una edad inferior a 41,6 años 1º Cuartil =

4

1T

441764

1 = El 1º cuartil es el valor de la variable que ocupa el lugar 44.

Intervalo en el que se encuentra el 1º cuartil (26-36)

=−

+=−

+=−

− 1027

381764

1

264

11

1

4

1 °°

°° &

Q

11

/T 28,22 años

El 25% de los entrevistados tienen una edad inferior a 28,22 años

3º Cuartil = 4

3T

1321764

3 = El 1º cuartil es el valor de la variable que ocupa el lugar 132.

Intervalo en el que se encuentra el 3º cuartil (46-61)

=−

+=−

+=−

− 1542

1071764

3

704

31

14

3 ±±

±± &

Q

11

/T 54,93años

El 75% de los entrevistados tienen una edad inferior a 54,93 años

Varianza = 2²6

22

2 ;1

Q;6

³³´ −= ∑ = 204,42

176

351.991,75 − = 232,59

Desviación = µ6 �

Page 28: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

28

25,1559,2322 === ¶¶ 66 años

Coeficiente de variación = ( );&9

( );

6;&9

·= =

04,42

25,15 = 0,36

Como es menor de 1 podemos admitir que es homogénea y al ser bastante cercano a cero diremos que es poco dispersa, por tanto, bastante homogénea, por lo que la media de la distribución será bastante representativa del conjunto.

Page 29: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

29

Nº 21.- La distribución de la renta personal en 1970 según los hogares era:

Ingresos (en miles) Nº Hogares 60-120 3.433.103 120-180 2.129.198 180-240 1.002.469 240-500 748.196 500-1.000 167.814 1.000-2.000 70.025 2.000-3.000 16.477 3.000-4.000 16.916 4.000-5.000 3.411

Analizar la distribución de la renta en ese año.

Solución

¸¸ // −−1 ¹; ¹Q ºI º)

60-120 90 3433103 0,4225 0,4525 120-180 150 2129198 0,2806 0,7331 180-240 210 1002469 0,1321 0,8652 240-500 370 748196 0,0968 0,9638 500-1000 750 167814 0,0221 0,9859 1000-2000 1500 70025 0,0092 0,9951 2000-3000 2500 16477 0,0022 0,9973 3000-4000 3500 16916 0,0022 0,9995 4000-5000 4500 3411 0,0005 1 7.587.612 1

»» Q;

∑ ¼¼¼¼Q;

Q;

∑ ½½½½Q;

Q;

acumulado

½3 ½T ¾¾ T3 −

308.979.270 0,2113 0,2113 45,25 21,13 24,21 319.379.700 0,2184 0,4297 73,31 42,97 30,34 210.518.490 0,1440 0,5737 86,52 57,37 29,15 276.832.520 0,1893 0,7630 96,38 76,30 20,08 125.860.500 0,0861 0,8491 98,59 84,91 13,68 105.037.500 0,0718 0,9209 99,51 92,09 7,42 41.192.500 0,0282 0,9491 99,73 94,91 4,82 59.216.500 0,0405 0,9896 99,95 98,96 0,99 15.349.500 0,0104 1 100 100 0 1.462.366.500 1 130,60

( )

∑−

=

=

−=

1

1

1

1 ¿

¾¾

¿

¾¾¾

¾3

T3

* = 24,699

60,130 = 0,187 No existe demasiada concentración, El coeficiente

está comprendido entre 0 y 1, a mayor índice mayor concentración.

Page 30: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

30

Nº 22.- A partir de los siguientes datos sobre ingresos mensuales por hogar (en euros) de cierta localidad

Ingreso mensual

por hogar Nº de hogares

280-600 15 600-1200 120

1200-1800 150 1800-2400 224 2400-3000 270 3000-3600 310 3600-4200 358 4200-4800 320 4800-5400 208 5400-6000 115 6000-7000 35

7000-10000 9 10000-15000 1

a) Obtener razonadamente: El ingreso anual medio por hogar. Y El ingreso más común. c) Si la cantidad máxima disponible para gastos de alquiler de una vivienda es la tercera

parte del ingreso mensual, ¿qué precio sería inaccesible a la mitad de los hogares? d) ¿Es cierto que el 80 % de los ingresos totales de dicha población recae sobre el 20 %

de los hogares con mayores ingresos? Solución

¾¾ // −−1 À& ÀQ ÁG Â; ÃÃ Q; Ã1 ÄÄ

ÄQ;∑

1

Ã4 % Ã3 %

280-600 320 15 0.04 440 6600 15 6600 0.09 0.70 600-1200 600 120 0.20 900 108000 135 114600 1.54 6.32

1200-1800 600 150 0.25 1500 225000 285 339600 4.57 13.35 1800-2400 600 224 0.37 2100 470400 509 810000 10.90 23.84 2400-3000 600 270 0.45 2700 729000 779 1539000 20.71 36.49 3000-3600 600 310 0.52 3300 1023000 1089 2562000 34.48 51.01 3600-4200 600 358 0.60 3900 1369200 1447 3958200 53.27 67.78 4200-4800 600 320 0.53 4500 1440000 1767 5398200 72.65 82.76 4800-5400 600 208 0.35 5100 1060800 1975 6459000 86.93 92.51 5400-6000 600 115 0.19 5700 655500 2090 7114500 95.75 97.89 6000-7000 1000 35 0.03 6500 227500 2125 7342000 98.81 99.53

7000-10000 3000 9 0.00 8500 76500 2134 7418500 99.84 99.95 10000-15000 5000 1 0.00 12500 12500 2135 7431000 100 100

2.135 7.431.000

Page 31: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

31

1.- 5621,480.3135.2

000.431.7 === ∑1

Q;;

ÅÅ Euros

2.- El ingreso más común será el valor que más veces se repita, es decir la moda: Intervalo modal, aquel en el que se encuentra la moda, es el intervalo que tenga mayor densidad de frecuencia (3.600 – 4.200)

Moda = F

F

Q

F

Q

F

Q

/0

ÆÆ

ÆÆ

Æ

Æ

ÆÇ

1

1

1

1

1

1

1

ÈÈ

ÉÉ

É

É

�

� � � 76,904.3600

600

310

600

320600

320

600.3 =+

+ �

Euros.

3.- Mediana = Me

5,106721352

1 = La mediana es el valor de la variable que ocupa el lugar central,

en nuestro caso el lugar 1068 Intervalo mediano = Es aquel en el que se encuentra la mediana (3.000 – 3.600)

Me = =−

+=−

+==−

− 600310

77921352

1

000.32

11

1

4

2

2

1 ÊÊ

ÊÊ &

Q

11

/TT 3.558,38 Euros

La tercera parte de esa cantidad (máximo a dedicar en concepto de alquiler) es de

13,11863

38,3558 = Euros.

Luego una vivienda cuyo alquiler fuera mayor de 1186.13 Euros/mes no seria accesible para la mitad de los hogares. 4.- No parece a simple vista que sea cierta ya que no se aprecia excesiva concentración. No obstante vamos a calcular los porcentajes que los valores acumulados ËË Q; representan

sobre el total de ingresos 7.431.000 (que denominamos Ì4 ), así como los porcentajes

acumulados de hogares sobre el total de hogares 2.135 (que denominamos Í3 ). Calculamos

ambos en el sentido creciente de la variable Ingresos.

Page 32: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

32

Nº 23.- ¿Qué transformaciones sufren la media aritmética y la varianza de una variable estadística X, cuando se aumentan sus valores en K unidades? Razone su respuesta. Solución

Î; ÎQ N;8 ÏÏ +=

1[ 1Q N[ Ï +

2[ 2Q 2[ +k

3[ 3Q 3[ +k

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

Ð[ ÐQ Ð[ +k

N;8 ÏÏ +=

Es un cambio de origen Media Aritmética

1

Q;;

ÑÑ∑=

1

Q88

ÒÒ∑= =( )

1

QN; ÓÓ∑ +=

1

Q; ÔÔ∑+

1

NQ Õ∑ =1

Q; ÖÖ∑+

1

QN

×∑ = N; +

La media aritmética se modifica de la misma manera que cualquier valor Los cambios de origen le afectan a la media aritmética Varianza

( )1

Q;;6

ØØÙ ∑ −

=2

2 ( )

1

Q886

ÚÚÛ ∑ −

=2

2 =( ) ( )( )

1

QN;N; ÚÚ∑ +−+2

=

= ( )

1

QN;N; ÜÜ∑ −−+2

= ( )

1

Q;; ÝÝ∑ −2

= 2Þ6

La varianza permanece igual Los cambios de origen NO afectan a la varianza

Page 33: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

33

Nº 24.- En una caja de reclutas se han medido la altura de 110 jóvenes obteniéndose la tabla:

Altura 1,55-1,60 1,60-1,70 1,70-1,80 1,80-1,90 1,90-2,00

Nº Jóvenes 18 31 24 20 17

1.- Calcúlense: Los percentiles 21 y 87 y los deciles 3 y 9. 2.- Se consideran "bajos" a aquellos cuya altura está bajo el percentil 3. ¿cuál es la

altura máxima que puede alcanzar? 3.- Se consideran "altos" aquellos cuya altura está sobre el percentil 82. ¿Cuál es su

altura mínima? 4.- ¿En qué percentil estará un joven de altura 1,78? Solución

Altura ß; 1,55-1,60 1,60-1,70 1,70-1,80 1,80-1,90 1,90-2,00

Nº Jóvenes àQ 18 31 24 20 17

à1 18 49 73 93 110

PERCENTIL r-esimo áá

ááâ &

Q

11U

/T1

1

100

100 −

−+=

DECIL r-esimo ãã

ããä &

Q

11U

/T1

1

10

10 −

−+=

1º.-

1.1.- Percentil 21 ⇒ 1,23110100

21 =

Valor de la variable que ocupa el lugar 24, se encuentra en el intervalo (1,60-1,70)

ãã

ãã &

Q

11

/T1

1

100

21100

21−

−+= = 10,0

31

18110100

21

60,1−

+ = 1,6164 metros

El 21% de los jóvenes miden menos de 1,6164 metros

1.2.- Percentil 87 ⇒ 7,95110100

87 =

Valor de la variable que ocupa el lugar 96, se encuentra en el intervalo (1,90 -2,00)

ãã

ãã &

Q

11

/T1

1

100

87100

87−

−+= = 10,0

17

93110100

87

90,1−

+ = 1,9159 metros

El 87% de los jóvenes miden menos de 1,9159 metros

Page 34: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

34

1.3.- Decil 3 ⇒ 3311010

3 =

Valor de la variable que ocupa el lugar 33-34, se encuentra en el intervalo (1,60-1,70)

ãã

ãã &

Q

11

/T1

1

10

310

3−

−+= = 10,0

31

1811010

3

60,1−

+ = 1,6483 metros

Las 3 décimas partes de los jóvenes miden menos de 1,6483 metros

2º.- Se consideran "bajos" a aquellos cuya altura está bajo el percentil 3. ¿Cuál es la altura máxima que puede alcanzar?

Percentil 3 ⇒ 3,3110100

3 =

Valor de la variable que ocupa el lugar 4, se encuentra en el intervalo (1,55-1,60)

ãã

ãã &

Q

11

/T1

1

100

3100

3−

−+= = 10,0

18

0110100

3

55,1−

+ = 1,559 metros

El 3% de los jóvenes miden menos de 1,559 metros

3º.- Se consideran "altos" aquellos cuya altura está sobre el percentil 82. ¿Cuál es su altura mínima?

Percentil 82 ⇒ 2,90110100

82 =

Valor de la variable que ocupa el lugar 91, se encuentra en el intervalo (1,80-1,90)

ãã

ãã &

Q

11

/T1

1

100

82100

82−

−+= = 10,0

20

73110100

82

80,1−

+ = 1,8860 metros

El 82% de los jóvenes miden menos de 1,8860 metros 4º.- ¿En qué percentil estará un joven de altura 1,78?

ãã

ããä &

Q

11U

/T1

1

100

100 −

−+= = 1,78 Hallar r

1,78 está en el intervalo (1,70-1,80)

10,024

4911010070,1

100

−+=

U

T å ⇒ r =( )

110

10049

10,0

2470,178,1

+−

= 62

Por tanto 78,1

100

62 =T ⇒ En el percentil 62

Page 35: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

35

Nº 25.- Se han medido mediante pruebas los coeficientes intelectuales de 20 alumnos, viniendo los resultados agrupados en seis intervalos de amplitud variable. Estas amplitudes son: C1=12, C2=12, C3=4, C4=4, C5=12, C6=20. Si las frecuencias relativas acumuladas correspondientes a cada uno de los intervalos son: 0,15; 0,15; 0,55; 0,8; 0,95; 1.

a) Formar la tabla de la distribución de frecuencias, sabiendo que el extremo inferior del 1er intervalo es 70.

b) Dibujar el Histograma y el polígono de frecuencias absolutas. Calcular la moda. c) ¿Entre qué dos percentiles está comprendido un coeficiente intelectual de 98,4?

Encontrar el valor de ambos percentiles. Al mismo grupo de alumnos se les hace una prueba de rendimiento, y los resultados nos

vienen dados en el gráfico siguiente:

0 4 6 8 10

1

5

10

1516

20

d) Formar la tabla de distribución de frecuencias y calcular la mediana. e) ¿Qué medidas están más dispersas, los coeficientes intelectuales o las puntuaciones del

rendimiento? Solución

Page 36: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

36

Nº 26.- En un convenio colectivo para mejorar las condiciones retributivas de los trabajadores de una fábrica se está discutiendo entre dos métodos para aumentar los salarios:

Método I: Aumentar a todo el personal una cantidad constante "c" pesetas. Método II: Aumentar a todo el personal un porcentaje fijo "p" sobre el sueldo actual. Probar que el método I hace disminuir la desigualdad entre los salarios de los trabajadores

Solución Lamamos X, a la variable sueldo actual. Después de la subida salarial tenemos:

&;< ææ += = Sueldo después de la subida según el Método I

çç ;.: *= = Sueldo después de la subida según el Método II .S =

+

1001

1

Q;;

èè∑= 2

22 ;

1

Q;6

ééê �

¦ 2ëì 66 � ;

6&9

í

Método I

( )

&;1

Q&

1

Q;

1

Q&;

1

Q<<

îîîîîîî+=+=

+== ∑∑∑∑

( ) ( ) ( )( ) ( )2

22

2 ïððððððñ 6

1

Q;;

1

Q&;&;

1

Q<<6 =

−=

+−+=

−= ∑∑∑

òòóó 6666 =+=+= 22

&;

6

<

6<&9

ôõ

+==)(

Método II

( )

;.1

Q;.

1

Q.;

1

Q::

öööööö*==== ∑∑∑

( ) ( ) ( )( ) ( )22

2

2

2

2 *** ÷

øøøøøøù 6.

1

Q;;.

1

Q.;.;

1

Q::6 =

−=

−=

−= ∑∑∑

úúûû 6.6.66 ** 222 =+=+=

)(*

*)( ;&9

;

6

;.

6.

:

6:&9

üüý====

Page 37: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

37

Luego:

Con el sueldo actual CV(X) = ;

6 þ

Aumento Método I &;

6

<

6<&9

ÿ�

+==)(

Aumento Método II )(*

*)( ;&9

;

6

;.

6.

:

6:&9

���====

Por tanto CV (Y) < CV (W) ⇒ Luego el Método I presenta menor dispersión en términos relativos. Luego hace disminuir la desigualdad de los salarios.

Page 38: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

38

Nº 27.- Con objeto de conocer determinada información sobre el grado de satisfacción de los enfermos ingresados en un hospital se han realizado 200 encuestas. La tabla recoge la distribución de los encuestados según grupos de edad:

Edad 0-20 20-40 40-50 50-60 60-70 70-80 80-90 Individuos 6 40 30 28 48 40 8

1.- Edad media y desviación típica de los individuos ingresados 2.- Calcular los cuartiles. El 70 percentil. Y La edad más frecuente. 3.- En una clínica privada se ha realizado la misma encuesta a 150 personas y se ha

obtenido una edad media de 55,8 años. Calcular la edad media del conjunto de los dos centros.

Solución

�� // �� 1 �Q �; �� Q; QL; �2 �1 �&

F

QG

0 - 20 20 - 40 40 - 50 50 - 60 60 - 70 70 - 80 80 - 90

6 40 30 28 48 40 8

200

10 30 45 55 65 75 85

60 1200 1350 1540 3120 3000 680

10950

600 36000 60750 84700 202800 225000 57800 667650

6 46 76

104 152 192 200

20 20 10 10 10 10 10

0,3 2,0 3,0 2,8 4,8 4,0 0,8

; = 1

Q; ¦ = 200

10950� �54,75 años

22

2 ;1

Q;6

��� � ¦ = 275,54

200

667650 − = 340,68 años�

45,1868,3402 === 66 años

DxRV&Q

11

/T ��

�� 33,4110

30

462004

1

404

11

1

4

1 =−

+=−

+=−

DxRV&Q

11

/T ��

�� 57,5810

28

762004

2

504

21

1

4

2 =−

+=−

+=−

DxRV&Q

11

/T ��

�� 58,6910

48

1042004

3

604

31

14

3 =−

+=−

+=−

De este modo: el 25% de los ingresados tienen menos de 41,33 años El 50% de los ingresados tienen menos de 58,57 años

Page 39: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

39

El 75% de los ingresados tienen menos de 69,58 años Percentil 70

)7060(140200100

70�� ,QWHUYDOR

DxRV&Q

11

/T ��

�� 5,6710

48

104200100

70

60100

701

1

100

70

� �

Moda � Mo � Intervalo que presenta mayor densidad de frecuencia, en este caso como todos los intervalos no tienen la misma amplitud, el intervalo modal es (60.- 70)��y dentro del intervalo podemos considerar la moda igual a la marca de clase ���años o también aplicar la formula:�

F

F

Q

F

Q

F

Q

/0

��

��

1

1

1

1

1

1

1

��

��

��

� � � 88,6510

10

28

10

4010

40

60

� �años

Que, como vemos, nos da muy parecido.

Media del conjunto total Hospital � DxRV; � 75,54 � 200 �1

Clínica � DxRV; � 8,55 ...� 150 �1 Media Total

� DxRV11

1;1;;

������

2,55350

19320

150200

)150)(8,55()200)(75,54( ==++=

++

=

Page 40: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

40

Nº 28.- Una residencia de ancianos tiene 5 tipos de habitaciones, cuyos precios, así como los ingresos obtenidos, son los siguientes: Precio por habitación 200 500 750 1.000 1.300 Ingresos 16.000 20.000 37.500 30.000 26.000 1.- Calcúlese razonadamente el precio medio y su representatividad. 2.- Si el coeficiente de variación de los precios de otra residencia es 0,75 ¿Cuál de las dos

residencias presenta una estructura de precios más homogénea? ¿Por qué? Solución

En primer lugar hay que hallar el número de habitaciones de cada precio Como los ingresos correspondientes a las habitaciones de 200 unidades han sido 16.000 unidades esto indica que el número de habitaciones de este precio será:

HVKDELWDFLRQQ 80200

160001

De la misma manera:

HVKDELWDFLRQQ 40500

200002 HVKDELWDFLRQQ 50

750

375003

HVKDELWDFLRQQ 301000

300004 HVKDELWDFLRQQ 20

1300

260005

Luego la distribución de los precios por habitación será:

Xi ni Xini 2�; ni

200 20 16.000 3.200.000 500 40 20.000 10.000.000 750 50 37.500 28.125.000

1000 30 30.000 30.000.000 1300 20 26.000 33.800.000

220 129.500 105.125.000

El precio medio por habitación será: XQLGDGHV1

Q;;

��64,588

220

500.129 === ∑

Para comprobar si este promedio es representativo calcularemos el Coeficiente de Variación

;

6&9

� 2� 66 �

22

2 ;1

Q;6

!!" �

¦

86,343.13164,588220

000.125.105 22 =−=#6 4,36286,343,131 =+=$6

61,064,588

4,362)( ;&9

Para poder comparar las estructuras de precios entre dos residencias, compararemos los coeficientes de variación de ambas. Será más homogénea aquella que tenga menor coeficiente de variación. En este caso como la otra residencia tiene un coeficiente de 0,75 >0,61. Quiere decir que la primera residencia tiene una estructura más homogénea ya que presenta menor dispersión.

Page 41: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

41

Nº 29.- Una variable X tiene su desviación típica igual a 4 y su media es 6. Determínese la media y la varianza de las variables. Razone el porqué de sus resultados

1.- 2

1−=;< 2.-

4

6−=;7

Solución

1.- 2

1−=;<

[ ]

( ) 5,22

16

2

11

2

1

12

11

2

12

1

=−=−=−=

=

−=

−=

== ∑∑∑ ∑∑∑

;;

1

Q

1

Q;

1

QQ;

1

Q;

1

Q<<

%%%%%%%%

%%

Los cambios de origen y de escala afectan a la media aritmética

2&& 66 +=

( ) ( )2

2

2

2

2

4

1

4

12

1

2

1

'((

((

(() 6

1

Q;;

1

Q;;

1

Q<<6 =

−=

−−−

=−

= ∑∑∑

22

4

1 *++ 666 =+= = 22

4

2==

,6

Los cambios de origen No afectan a la desviación típica Los cambios de escala Si afectan a la desviación típica

2.- 4

6−=;7

[ ]

( ) 04

66

4

66

4

1

64

16

4

14

6

=−=−=−=

=

−=

−=

== ∑∑∑ ∑∑∑

;;

1

Q

1

Q;

1

QQ;

1

Q;

1

Q77

--------

--

Los cambios de origen y de escala afectan a la media aritmética

2.. 66 +=

Page 42: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

42

( ) ( )2

2

2

2

2

16

1

16

14

6

4

6

/00

00

001 6

1

Q;;

1

Q;;

1

Q776 =

−=

−−−

=−

= ∑∑∑

22

16

1 233 666 =+= = 14

4

4==

46

Los cambios de origen No afectan a la desviación típica Los cambios de escala Si afectan a la desviación típica Esta variable T es precisamente la variable X tipificada

55

65

5 7;

6

;;= =

−=

−=

4

6

Page 43: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

43

Nº 30.- De dos regiones con la misma población, de un determinado país, se han tomado sendas muestras sobre las rentas percibidas. La información recogida es la siguiente:

REGION I REGION II

Renta (en miles) Nº Familias Renta (en miles) Nº Familias 10-20 24 05-15 10 20-30 36 15-25 42 30-40 20 25-55 35 40-50 20 55-75 20

50-100 50 75-95 13 a) Hállese la renta media de las muestras de cada región y del conjunto de las dos regiones.

¿Cuál de las dos rentas medias es más representativa? b) ¿Es posible decir si una región posee un nivel de vida superior a la otra, si medimos este

nivel a través de la renta? d) ¿Cuál es el nivel de renta percibido por un mayor número de familias en la primera

región? e) Si en la segunda región clasificamos a una familia en el grupo en donde se encuentra el

50 % de las menos favorecidas. ¿Cuál sería el tope de renta que podría percibir? Solución REGIÓN I

77 // −−1 7Q 81 8; 99 Q; :: Q; 2 ;& <<

<&

QG =

10-20 24 24 15 360 5400 10 2,4 20-30 36 60 25 900 22500 10 3,6 30-40 20 80 35 700 24500 10 2 40-50 20 100 45 900 40500 10 2

50-100 50 150 75 3750 281250 50 1 6610 374.150

REGIÓN II

<< // −−1 <Q <1 <; << Q; == Q; 2 >& ??

?&

QG =

05-15 10 10 10 100 1000 10 1 15-25 42 52 20 840 16800 10 4,2 25-55 35 87 40 1400 56000 30 1,17 55-75 20 107 65 1300 84500 20 1 75-95 13 120 85 1105 93925 20 0,65

4745 252.225

1.- La renta media de cada región será: 1

Q;;

@@∑=

Page 44: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

44

Región I ⇒ 1

Q;;

AA∑=1 = 06,44150

610.6 =

Región II ⇒ 1

Q;;

BB∑=2 = 54,39120

745.4 =

Conjunto de ambas Regiones:

05.42120150

54,39*12006,44*150

21

2211 =++=

++

=11

;1;1; C DEC FHG

2.- Para estudiar cual de las dos medias es más representativa debemos calcular sus correspondientes coeficientes de variación. Y será más representativa aquella que tenga menor coeficiente de variación.

;

6&9

I=

Región I 2JK 66 � 2

22 ;

1

Q;6

LLM �

¦

2

22 ;

1

Q;6

NNO �

¦ = ( ) 04,55306,44150

374150 2 =−

2JK 66 � = 52,2304.553 =+

;

6&9

P=)1( = 53,0

06,44

52,23 =

Región II 2P66 � 2

22 ;

1

Q;6

LLM �

¦

2

22 ;

1

Q;6

LLM �

¦ = ( ) 46,53854,39120

252225 2 =−

2P66 � = 20,2346,538 =+

;

6&9

Q=)2( = 58,0

54,39

20,23 =

Por tanto la renta media de la Región I es más representativa que la renta media de la Región II, aunque la dispersión relativa de ambas no es muy diferente.

Page 45: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

45

3.- Al ser los coeficientes de variación bastante similares, la variabilidad es parecida en ambas distribuciones, así como la representatividad de cada una de las rentas medias. Como en la región I la renta media es superior, podemos suponer que en esta región las personas disfrutan de un nivel de vida más alto que en la región II 4.- El nivel de renta percibido por un mayor número de familias en la región I será la MODA. Como la distribución viene dada en intervalos de desigual amplitud, hallaremos el intervalo modal, que es en el que se halla la moda, y es el que presenta mayor densidad de frecuencia, es decir: (20 – 30) Y dentro de ese intervalo tomaremos como MODA el valor central Mo = 25 O también podemos utilizar la formula

F

F

Q

F

Q

F

Q

/0

R

R

R

RR

R

RS

1

1

1

1

1

1

1

T

TU

UU

U

T�

� � � 56,2410

4,22

220 =

++ �24,18años

5.- El tipo de renta que podrían percibir será la renta MEDIANA

.- Mediana = Me

601202

1 = La mediana es el valor de la variable que ocupa el lugar central, en

nuestro caso el lugar inmediatamente siguiente al 60. Intervalo mediano = Es aquel en el que se encuentra la mediana, en el que se

encuentran los valores que ocupan los lugares 60 y 61 (25 – 55)

Me = =−

+=−

+==−

− 3035

521202

1

000.32

11

1

4

2

2

1 VV

VV &

Q

11

/TT 31,85

El 50% de las familias de la Región II tienen una renta inferior a 31,85

Page 46: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

46

Nº 31.- El Servicio Central de Correos realiza una encuesta por muestreo sobre el franqueo medio de las cartas (en unidades monetarias) que diariamente tiene que distribuir en el Hospital de Navarra. La información recogida, sobre una muestra de 500 cartas es la siguiente:

Franqueo 3 4 5 7 10 12 18 20 25 Nº Cartas 145 132 84 50 48 22 10 8 1

1.- Determínese el franqueo medio en la muestra y verifíquese si es representativo. 2.- Si la muestra anterior es significativa del total de cartas que diariamente se reparten en el hospital, calcúlese si el servicio es rentable, teniendo en cuenta que se reparten 35.000 cartas al día y que el costo diario del servicio es de medio millón de unidades monetarias Solución Franqueo W; 3 4 5 7 10 12 18 20 25

Nº Cartas XQ 145 132 84 50 48 22 10 8 1 500

YY Q;

435 528 420 350 480 264 180 160 25 2842

ZZ Q; 2

1305 2112 2100 2450 4800 3168 3240 3200 625 23000

1.- Determínese el franqueo medio en la muestra y verifíquese si es representativo.

Media aritmética: 500

2842== ∑1

Q;;

[[= 5,684 unidades monetarias

Para verificar si esta media es representativa hallaremos el coeficiente de variación, es decir una medida de la dispersión relativa.

;

6&9

\=

22

2 ;1

Q;6

]]^ −= ∑ = ( ) 7,13684,5

500

23000 2 =− 2__ 66 += = 7,37,13 =

;

6&9

_= = 65,0

684,5

7,3 = Como es menor de 1 podemos decir que no hay gran dispersión y

por tanto la media es bastante representativa. 2.- Si la muestra anterior es significativa del total de cartas que diariamente se reparten en el hospital, calcúlese si el servicio es rentable, teniendo en cuenta que se reparten 35.000 cartas al día y que el costo diario del servicio es de medio millón de unidades monetarias. Para determinar si el servicio es rentable debemos estimar los ingresos diarios por este servicio, para ello supondremos que el franqueo medio de la muestra es el franqueo medio del total de las 35.000 cartas, es decir el franqueo medio de la población. Ingresos = (350.000) 5,684 = 1.989.400 u.m. Beneficio = Ingresos –Costes = 1.989.400-2.000.000 = -106.000 u.m. Como el beneficio es negativo, significa que el servicio de correos, en este supuesto No es rentable.

Page 47: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

47

Nº 32.- En unos laboratorios farmacéuticos, los empleados se encuentran clasificados en tres categorías: Técnicos, Administrativos y Operarios; de tal forma que, en diciembre de 1988 se tenía:

Nº empleados

Salario medio/mes (En miles.)

Desviación típica

(En miles.)

CV=;

6[

Técnicos

Administrativos

operarios

20

50

130

300

145

156

70

22.5

42

70/300= 0,233

22.5/145 = 0,155

42/ 156 = 0,261

1.- Calcúlese el salario medio para el conjunto de la empresa. 2.- Estúdiese en qué categoría de empleados existe mayor homogeneidad salarial. Solución 1.- El salario medio del conjunto será la media ponderada de los salarios

medios de cada categoría:

; = `ab

``aabb111

;1;1;1

��

�� =

200

)156)(130()145()50()300)(20( ++ = 167,65

Salario medio al mes: 167.650 pesetas.

2.- Existirá mayor homogeneidad en aquella categoría que tenga menor dispersión,

para poder comparar las dispersiones hallamos los coeficientes de variación, que es una medida de dispersión relativa, tendrá mayor homogeneidad la categoría que tenga menor coeficiente de variación, en este caso los administrativos.

CV=;

6[

Técnicos

Administrativos

operarios

70/300= 0,233

22.5/145 = 0,155

42/ 156 = 0,261

Page 48: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

48

Nº 33.- Dada la siguiente distribución:

cc // −−1 10-20 20-30 30-40 40-50 50-60 60-70

cQ 7 11 15 10 5 2

Ni 7 18 33 43 48 50 dd Q; 105 275 525 450 275 130 1760

Calcúlese: Media, mediana, moda, tercer cuartil, sexto decil, trigésimo percentil Solución

Media → ; = 1

Q; ee¦ = 50

1760� �35,2

Mediana → =−

+=−

+==−

− 1015

18502

1

302

11

1

4

2 ff

ff &

Q

11

/T0H 34,66

Moda � Mo � Intervalo que presenta mayor densidad de frecuencia, en este caso como todos los intervalos tienen la misma amplitud, el intervalo modal es el que presenta mayor frecuencia (30.- 30)��y dentro del intervalo podemos considerar la moda igual a la marca de clase ���años o también aplicar la formula:�

F

F

Q

F

Q

F

Q

/0

g

g

g

gg

g

gh

1

1

1

1

1

1

1

i

ij

jj

j

i�

� � � =

++ 10

1011

1130 �34,76

1º Cuartil → =−

+=−

+=−

− 1011

7504

1

204

11

1

4

1 kk

kk &

Q

11

/T 25

3º Cuartil → =−

+=−

+=−

− 1010

33504

3

404

31

14

3 ll

ll &

Q

11

/T 44,5

6º Decil = Percentil 60

)4030(3050100

60 −⇒= ,QWHUYDOR

Page 49: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

49

=−

+=−

+=−

− 1015

1850100

60

30100

601

1

100

60 mm

mm &

Q

11

/T 38

Percentil 30

)4030(1550100

30 −⇒= ,QWHUYDOR

=−

+=−

+=−

− 1011

750100

30

30100

301

1

100

30 nn

nn &

Q

11

/T 37,27

Page 50: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

50

Nº 34.- Calcular los cuartiles de la siguiente distribución:

oo // −−1 0-1 1-2 2-3 3-4 4-5

oQ 10 12 12 10 7

Ni 10 22 34 44 50 Solución

1º Cuartil → =−

+=−

+=−

− 112

10504

1

14

11

1

4

1 pp

pp &

Q

11

/T 1,208

2º Cuartil → =−

+=−

+=−

− 112

22504

1

24

21

1

4

2 qq

qq &

Q

11

/T 2,25

3º Cuartil → =−

+=−

+=−

− 110

34504

3

34

31

14

3 qq

qq &

Q

11

/T 3,35

Page 51: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

51

Nº 35.- Calcular la varianza, desviación típica, y coeficiente de variación del conjunto de datos siguiente:

r; 2 3 5 1 6 8 3 2 6 36 2s; 4 9 25 1 36 64 9 4 36 188

Solución

Xi ni Xi ni Xi

2 ni 1 1 1 1 2 2 4 8 3 2 6 18 5 1 5 25 6 2 12 72 8 1 8 64 9 36 188

Media: 49

36 === ∑1

Q;;

tt

Varianza: 2

22 ;

1

Q;6

uuv �

¦ = 89,449

188 2 =−

Desviación Típica: 2wx 66 � = 21,289,4 =+

Para comprobar si este promedio es representativo, calcularemos el Coeficiente de

Variación

Coeficiente de variación: ;

6&9

y= = 55,0

4

21,2 =

Si, es representativo ya que el CV es menor de 1

Page 52: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

52

Nº 36.- Las edades de los alumnos de un centro de enseñanza se refleja en la siguiente tabla:

zz // −−1 7 - 9 9 - 11 11 - 12 12 - 13 13 - 14 14 - 15 15 - 17 17 - 19

zQ 4 18 14 27 42 31 20 1

Determinar la variabilidad de la edad mediante los estadísticos varianza, desviación típica,

coeficiente de variación Estudiar la simetría de la variable. Solución

En primer lugar realizaremos los cálculos necesarios a partir de la tabla de frecuencias:

intervalos ni Xi Ni Xi ni Xi2ni

7 - 9 4 8 4 32 256 9 – 11 18 10 22 180 1800 11 – 12 14 11,5 36 161 1851,5 12 – 13 27 12,5 63 337,5 4218,75 13 – 14 42 13,5 105 567 7654,5 14 – 15 31 14,5 136 449,5 6517,75 15 – 17 20 16 156 320 5120 17 - 19 1 18 157 18 324

157 2065 27742,5

La media será: DxRV1

Q;;

{{15,13

157

2065 === ∑

La varianza será: 2222

2 78,315,13157

5,27742DxRV;

1

Q;6

||} =−=−= ∑

La desviación típica será: 2~� 66 += = DxRV6 � 94,178,3 =+=

Para comprobar si este promedio es representativo calcularemos el Coeficiente de Variación

;

6&9

� 15,0

15,13

94,1 == Es muy representativo ya que se acerca bastante a 0

Para analizar la simetría de la distribución hallaremos las distancias entre cuartiles, para ello primero hallaremos los cuartiles: 1º cuartil será:

25,391574

1 = El 1º cuartil será el valor de la variable que ocupa el lugar

inmediatamente siguiente al 39.25 y se encuentra en el intervalo (12 – 13) por tanto, aplicando la formula:

Page 53: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

53

DxRV&Q

11

/T ��

�� 33,4110

30

462004

1

404

11

1

4

1 =−

+=−

+=−

2º cuartil, que es la Mediana será:

5,781574

2 = El 2º cuartil será el valor de la variable que ocupa el lugar inmediatamente

siguiente al 78.5 y se encuentra en el intervalo (13 – 14) por tanto, aplicando la formula:

37,13142

631574

2

134

21

1

4

2 =−

+=−

+=−

− ��

�� &

Q

11

/T años

3º cuartil será:

75,1171574

3 = El 3º cuartil será el valor de la variable que ocupa el lugar

inmediatamente siguiente al 117,75 y se encuentra en el intervalo (14 – 15) por tanto, aplicando la formula:

41,14131

1051574

3

604

31

14

3 =−

+=−

+=−

− ��

�� &

Q

11

/T años

Comprobamos las distancias

4

1

4

2

4

2

4

3 TTTT −=− 14,41 –13,37 ≠ 13,37 – 12,12 1,04 ≠ 1,25 Hay una pequeña

diferencia, esto nos indica que hay una pequeña asimetría

Vamos hacer lo mismo entre dos percentiles 30 y 70, y ver si las distancias a la mediana son iguales: El percentil 30 será:

1,47157100

30 = El 30 percentil será el valor de la variable que ocupa el lugar

inmediatamente siguiente al 47.1 y se encuentra en el intervalo (12 – 13) por tanto, aplicando la formula:

41,12127

36157100

30

12100

301

1100

30 =−

+=−

+=−

− ��

�� &

Q

11

/T años

El percentil 70 será:

9,109157100

70 = El 70 percentil será el valor de la variable que ocupa el lugar

inmediatamente siguiente al 109.9 y, que se encuentra en el intervalo (14 – 15) por tanto, aplicando la formula:

158,14131

105157100

70

14100

701

1100

70 =−

+=−

+=−

− ��

�� &

Q

11

/T años

Page 54: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

54

Comprobamos las distancias

100

30

4

2

4

2

100

70 TTTT −=− 14,158 –13,37 ≠ 13,37 – 12,41 0,788 ≠ 0,96 Sigue

habiendo una pequeña diferencia, esto nos indica que hay una pequeña asimetría

Page 55: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

55

Nº 37.- Dado el número de horas semanales trabajadas por un colectivo de 100 empleados,

obtener: 1.- La variable tipificada Z 2.- Valores de la media y varianza de la Z

horas trabajadas 0 - 4 4 - 10 10 - 20 20 - 40 número empleados 47 32 17 4

Solución

�� // −−1 �; �Q �� Q; �� Q; 2 �

��

6

;;=

−=

�� Q= �� Q= 2

0 – 4 2 47 94 188 -0,7937 -37,304 29,61 4 – 10 7 32 224 1568 0,0453 1,450 0,060 10 – 20 15 17 255 3825 1,3877 23,591 32,74 20 - 40 25 4 100 2500 3,0656 12,263 37,59 100 673 8081 0 100

La media será: === ∑100

673

1

Q;;

�� 6,73

La varianza será: =−=−= ∑ 222

2 73,6100

8081;

1

Q;6

��� 35,5171

La desviación típica será: 2�� 66 += = =+= 5171,35�6 5,9596

=== ∑100

0

1

Q==

�� 0 =−=−= ∑ 22

22 0

100

100;

1

Q=6

��� 1

2�� 66 += = =+= 1�6 1

Page 56: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

56

Nº 38.- El consumo de productos farmacéuticos y sanitarios (Yj) y la renta mensual familiar en una muestra de 5 hogares son los siguientes:

Consumo: 100 150 180 200 210 Renta 20.000 25.000 35.000 40.000 45.000

1.- Representación gráfica de la nube de puntos 2.- Ajústese un modelo por mínimos cuadrados, razonando la elección de la función. Solución

No es necesario establecer la tabla de doble entrada ya que ningún par de valores se repite.

Y = Consumo X = Renta en miles

�< �; 2�< �� Q; 2 � <;

100 20 10.000 400 2.000 150 25 22.500 625 3.750 180 35 32.400 1.225 6.300 200 40 40.000 1.600 8.000 210 45 44.100 2.025 9.450 840 165 149.000 5.875 29.500

La media será: Consumo === ∑5

840

1

<<

� 168

Renta 5

165== ∑1

;;

� = 33

La varianza será: Consumo =−=−= ∑ 222

2 1685

000.149<

1

<6

�  1.576

Renta =−=−= ∑ 222

2 335

875.5;

1

Q;6

¡¡¢ 86

La desviación típica será: Consumo 2££ 66 += = =+ 576.31 39,70

Renta 2¤¥ 66 += = =+ 86 9,27

La covarianza Consumo/renta =−=−= ∑ )33)(168(5

500.29<;

1

<;6

¦§¨ª© 356

9673,0)70,39)(27,9(

356 ==«¬

¬ª«66

6U 9357,0)9673,0( 22 ==U 93,57% de fiabilidad

Page 57: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

57

Como es bastante grande nos indica que es buena la relación lineal entre Consumo y Renta. Por lo que establecemos esa relación:

14,486

3562

===­­ª®

6

6E 22,0

576.1

3562

’ ===®­ª®

6

6E

38,31)33(14,4168 =−=−= ;E<D 96,3)1688(22,033’’ −=−=−= <E;D

;< =

QWD&RQVXPR

Re <

; = &RQVXPR

QWDRe

¯;< 14,438,31* += °<; 22,096,3* +−=

Page 58: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

58

Nº 39.- Dada la distribución Bidimensional

±; 10 20 30 40 50

²< 200 180 150 120 100

1.- Ajústese una recta por el procedimiento de los Mínimos Cuadrados. 2.- Calcúlese el coeficiente de correlación lineal y explíquese su significado. Solución

No es necesario establecer la tabla de doble entrada ya que ningún par de valores se repite.

³< ±; 2<́ µµ Q; 2 µ <;

200 10 40.000 100 2.000 180 20 32.400 400 3.600 150 30 22.500 900 4.500 120 40 14.400 1.600 4.800 100 50 10.000 2.500 5.000 750 150 119.300 5.500 19.900

La media será: === ∑5

750

1

<<

¶ 150

5

150== ∑1

;;

· = 30

La varianza será: =−=−= ∑ 222

2 1505

300.119<

1

<6

¸¹ 1.360

=−=−= ∑ 222

2 305

500.5;

1

Q;6

ºº» 200

La desviación típica será: 2¼¼ 66 += = =+ 360.1 36,88

2½¾ 66 += = =+ 200 14,14

La covarianza =−=−= ∑ )30)(150(5

900.19<;

1

<;6

¿ÀÁªÂ -520

Covarianza negativa por tanto relación inversa, cuando una variable crece la otra decrece y viceversa.

9971,0)14,14)(88,36(

520 −=−=ÃÄ

ĪÃ66

6U 9943,0)9971,0( 22 =−=U 99,43% de fiabilidad

Page 59: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

59

Como es bastante grande nos indica que es buena la relación lineal entre las dos variables. Por lo que establecemos esa relación:

6,21200

5202

−=−==ÅŪÆ

6

6E 38,0

360.1

5202

’ −=−==ÇȪÇ

6

6E

228)30(6,2150 =+=−= ;E<D 87)150(38,030’’ =+=−= <E;D

;<

<;

É;< 6,2228* −= Ê<; 38,087* −=

Significados Coeficiente de correlación lineal = r = �0,9971 ∗ Mide la bondad de la estimación, la bondad de la predicción o la bondad del ajuste. ∗ Mide la fiabilidad ∗ Varía entre (-1 y + 1). Cuanto más se acerque a +1 o a -1 mayor será la bondad, mejor

será el ajuste ∗ Su signo nos indica si la correlación es positiva o negativa, es decir directa o inversa.

En este caso inversa las variables varían en sentido contrario. ∗ Tiene el mismo signo que el de la covarianza y el de los coeficientes de regresión Covarianza = ˪Ì6

ͪÎ6 = � 520 Covariación (variación conjunta) negativa. Nos indica que existe cierta covariación pero no nos dice si es muy grande o no. Es una medida en términos absolutos

Page 60: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

60

Nº 40.- El consumo y la renta mensual de 100 familias expresadas en 104 pesetas, son los siguientes: X= (Consumo) Y = (Renta). X/Y 15 25 35 45 30 10 15 -- -- 40 5 20 25 -- 50 -- 15 5 5 1.- Calcúlese la recta de regresión del consumo sobre la renta. 2.- Consumo esperado para una renta de 60.104 Pts. y la representatividad de esta

regresión. Solución Y X

15 25 35 45 ÏQ ÐÐ Q; ÑÑ Q; 2 Ò ÓÓÒ Q<; Ô1

30 10 15 - - 25 750 22500 15750 25 40 5 20 25 - 50 2000 80000 58000 75 50 - 15 5 5 25 1250 62500 38750 100 ÕQ 15 50 30 5 100 4.000 165.000 112.500

ÖÖ Q< 225 12250 1050 225 2750

×× Q< 2 3775 31250 36750 10125 81500

Ø1 15 65 95 100

Solución

40100

4000 ==; 50)40(100

165000 22 =−=Ù6 07,750 ==Ú6

5,27100

2750 ==< 75,58)5,27(100

81500 22 =−=Û6 66,775,58 ==Ü6

25)5,27)(40(100

112500 =−=ݪÞ6

46,0)66,7)(07,7(

25 ==U 213,0)46,0( 22 ==U 21,3% de fiabilidad

5,050

252

===ßߪà

6

6E 425,0

75,58

252

’ ===áâªá

6

6E

5,47)40(5,05,27 =+=−= ;E<D 3,28)5,27(425,040’’ =+=−= <E;D

ã;< 5,05,47* += ä<; 4257,03,28* +=

Page 61: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

61

1.- å<; 4257,03,28* +=

2.- Renta de 60 104 Predecir æ; conocido =ç< 60

Sustituimos en la recta de regresión å<; 4257,03,28* +=

( ) 8,53604257,03,28* =+=; Para una renta de 600.000 el consumo esperado será de 538.000.

3.- 46,0)66,7)(07,7(

25 ==U 213,0)46,0( 22 ==U 21,3% de fiabilidad

La bondad de la predicción es pequeña r = 0,46. Es decir solamente el 21,3% de la variación de la renta nos explica la variación del consumo. Por tanto la predicción es muy poco fiable.

Page 62: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

62

Nº 41.- El volumen de ahorro y la renta del sector familiar, en billones de pesetas constantes de 1986, para el periodo 1986-1995, fueron:

Años t 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 Ahorro X 1,9 1,8 2,0 2,1 1,9 2,0 2,2 2,3 2,7 3,0 Renta Y 20,5 20,8 21,2 21,7 22,1 22,3 22,2 22,6 23,1 23,5

Ajústese un modelo lineal que explique el comportamiento del ahorro en función de la renta. Solución

æ; è< 2é; 2ê< é <;

1,9 20,5 3,61 420,25 38,95 1,8 20,8 3,24 432,64 37,44 2,0 21,2 4,00 449,44 42,40 2,1 21,7 4,41 470,89 45,57 1,9 22,1 3,61 488,41 41,99 2,0 22,3 4,00 497,29 44,60 2,2 22,2 4,84 492,84 48,84 2,3 22,6 5,29 510,76 51,98 2,7 23,1 7,29 533,61 62,37 3 23,5 9,00 552,25 70,50

21,9 220 49,29 4.848,38 484,64 Media Varianza Desviación típica

19,210

9,21 ==; 133,0)19,2(10

29,49 22 =−=ë6 365,0133,0 ==ì6

Media Varianza Desviación típica

2210

220 ==< 838,0)22(10

38,4848 22 =−=í6 915,0838,0 ==î6

Covarianza

284,0)22)(19,2(10

64,484 =−=ïªð6

Coeficiente de correlación Coeficiente de determinación

85,0)915,0)(365,0(

284,0 ==U 723,0)85,0( 22 ==U 72,3% de fiabilidad

Coeficiente de regresión de Y/X Coeficiente de regresión de X/Y

13,2133,0

284,02

===ññªò

6

6E 34,0

838,0

284,02

’ ===óôªó

6

6E

Ordenada en el origen Ordenada en el origen 33,17)19,2(13,222 =−=−= ;E<D 29,5)22(34,019,2’’ −=−=−= <E;D

Recta de regresión Y/X Recta de regresión de X/Y õ;< 13,233,17* += ö<; 34,029,5* +−=

Coeficientes de regresión: b = 2,13 Nos indica lo que varia la renta, al variar el ahorro en una unidad b’= 0,34 Nos indica lo que varia el ahorro, al variar la rente en una unidad Al ser positivos nos indican que las variaciones son en el mismo sentido.

Page 63: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

63

Nº 42.-En una empresa el 20% es personal "no cualificado", el 50% es personal "cualificado" y el resto personal "técnico". La plantilla consta de 1000 empleados. Se ha estimado la productividad para cada uno de estos grupos en unos coeficientes que van de 1 a 5, siendo como se puede observar en la tabla siguiente:

Coeficiente Productividad

;

Personal No Cualificado

(En %)

Personal Cualificado

(En %)

Personal Técnico (En %)

1 10 5 - 2 20 20 10 3 30 20 40 4 30 40 30 5 10 15 20

1.- Hállese la productividad media de los 1000 empleados. 2.- ¿Qué nivel de productividad es el más corriente en esta empresa? 3.- ¿Bajo qué coeficiente están el 50% de los trabajadores menos productivos? 4.- Comparando las productividades medias del personal no cualificado y del personal

cualificado, ¿cuál de ellas corresponde a una distribución de frecuencias más homogénea?

Solución

1.- Para hallar la productividad media Haremos: 1

Q;;

÷÷∑=

Coeficiente

Productividad ;

Personal No Cualificado

(En %)

Personal Cualificado

(En %)

Personal Técnico (En %)

100øø IS =

%

ùù S;

ú3 %

acumulado

1 10 5 - 4,5 4,5 4,5 2 20 20 10 17 34 21,5 3 30 20 40 28 84 49,5 4 30 40 30 35 140 84,5 5 10 15 20 15,5 77,5 100 100 340

1

Q;;

÷÷∑= = 4,3100

340

100==∑ ûû S;

Coeficiente de productividad media.

2.- El nivel de productividad más corriente será la moda. Productividad modal ü0 = 4 Valor de la variable que presenta mayor frecuencia.

3.- El nivel de productividad que separa al 50% de los trabajadores es la mediana

502

=1 Luego la mediana es ý0 = 4

4.- Analizar la homogeneidad, es decir hallar CV de cada distribución:

Page 64: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

64

)1(; Personal No cualificado

Coeficiente Productividad

; (1)

Personal No Cualificado

(En %)

þþ S;

ÿÿ S; 2

1 10 10 10 2 20 40 80 3 30 90 270 4 30 120 480 5 10 50 250 100 310 1090

1,3100

310

100)1( ( === ∑ �� S;

; 29,1)1,3(100

1090

100)1( 22

22 =−=−= ∑

;S;

6��

1358,129,1)1( 2 === �� 66 36,01,3

1358,1)1( ===

;

6&9

� Homogeneidad

aceptable ya que es menor de 1. Nos dice que hay una dispersión bastante pequeña.

)2(; Personal cualificado

Coeficiente Productividad

; (2)

Personal No Cualificado

(En %)

�� S;

�� S; 2

1 5 5 5 2 20 40 80 3 20 60 180 4 40 160 640 5 15 75 375 100 340 1280

4,3100

340

100)2( ( === ∑ �� S;

; 24,1)4,3(100

1280

100)2( 22

22 =−=−= ∑

;S;

6��

1135,124,1)2( 2 === 66 32,04,3

1135,1)2( ===

;

6&9

� Homogeneidad

aceptable ya que es menor de 1. Nos dice que hay una dispersión bastante pequeña. Mayor homogeneidad será el que tenga menor coeficiente de variación, es decir el de menor dispersión en este caso el personal cualificado presenta una productividad MÁS homogénea.

Page 65: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

65

Nº 43.- En el departamento de personal de un determinado Banco, se ha realizado un estudio queriendo constatar si la edad de los empleados está en relación con el número de días que no se asiste al trabajo. Establecer una función lineal que relacione las dos variables y la bondad del ajuste. Los resultados numéricos son:

EDAD DÍAS DE

AUSENCIA 20 - 28 29 - 37 38 - 46 47 - 55 56 - 64

65 – 71 0 1 8 7 16 58 – 64 2 6 10 2 4 51 – 57 5 9 5 0 1 44 – 50 14 6 2 2 0

Solución Primero reorganizamos los datos y construimos la tabla:

�;

<

20–28 24

29–37 33

38–46 42

47–55 51

56–64 60

�Q �� Q< �� Q< 2

44 – 50 (47)

14 6 2 2 0 24 1128 53016

50 – 57 (54)

5 9 5 0 1 20 1080 58320

57 – 64 (62)

2 6 10 2 4 24 1488 92256

64 – 71 (68)

0 1 8 7 16 32 2176 147968

�Q 21 22 25 11 21 100 5872 351560

�� Q; 504 726 1050 561 1260 4101

�� Q; 2 12096 23958 44100 26611 75600 182365

� ��� Q<; 25248 39864 64176 35394 83400 248082

72,58100

5872 === ∑1

<<

�días 01,41

100

4101 === ∑1

;;

� años

56,6772,58(100

351560 222

2 =−=−= ∑<

1

<6

��

83,141)01,41(100

182365 222

2 =−=−= ∑;

1

Q;6

���

2�� 66 += = 2,856,67 =+ días 2�� 66 += = 1283,141 =+ años

71,72)72,58)(01,41(100

248082 =−=−= ∑<;

1

<;6

�� "!

Page 66: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

66

74,0)2,8)(12(

71,72 ==#$

$"#

66

6U 546,0)74,0( 22 ==U 54,6% de fiabilidad. Es decir el

54,6% de las variaciones de la edad explican las variaciones de los días de ausencia, y viceversa. Como es bastante grande nos indica que es buena la relación lineal entre Edad y días de ausencia. Por lo que establecemos esa relación:

51,083,141

71,722

===%

%"&

6

6E 07,1

56,67

71,722

’ ==='

("'

6

6E

7,37)01,41(51,072,58 =−=−= ;E<D 18,22)72,58(07,101,41’’ −=−=−= <E;D

;

< = (GDG

LD'tDV$XVHQF <

; = LD'tDV$XVHQF

(GDG

);< 51,07,37* += *<; 07,118,22* +−=

No hay demasiada fiabilidad por lo que las predicciones no serán buenas.

Page 67: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

67

Nº 44.- La relación de los gastos de publicidad y el volumen de ventas de 25 empresas se recoge en la siguiente tabla: Hallar la recta de regresión X/Y

+; ,<

5 10 15

100 1 2 2 125 1 7 4 150 2 1 5

Solución

+; -<

5 10 15 .Q // Q< 00 Q< 2

100 1 2 2 5 500 50000 125 1 7 4 12 1500 187500 150 2 1 5 8 1200 180000

1Q 4 10 11 25 3200 417500

22 Q; 20 100 165 285

33 Q; 2 100 1000 2475 3575

4 554 Q<; 2625 12250 21750 36625

12825

3200 === ∑1

<<

6 4,11

25

285 === ∑1

;;

7

31612825

417500 222

2 =−=−= ∑<

1

<6

89 2:: 66 += = 77,17316 =+

04,13)4,11(25

3575 222

2 =−=−= ∑;

1

Q;6

;;< 2=> 66 += = 61,304,13 =+

8,5)4,11)(128(25

36625 =−=−= ∑<;

1

<;6

?@A"B

09,0)77,17)(61,3(

8,5 ==CD

D"C

66

6U 00817,0)09,0( 22 ==U 0,8% de fiabilidad.

Es decir solamente el 0,8% de las variaciones de una variable vienen explicadas por las variaciones de la otra variable. Como 2U es muy pequeño nos indica que es muy mala la relación lineal entre las variables. Aun y todo establecemos la relación:

44,004,13

8,52

===E

E"F

6

6E 018,0

316

8,52

’ ===G

H"G

6

6E

9,122)41,11(44,0128 =−=−= ;E<D 05,9)128(018,041,11’’ =−=−= <E;D

;

< I;< 44,09,122* += <

; J<; 018,005,9* +=

No hay demasiada fiabilidad, es prácticamente nula. Por lo que las predicciones serán muy malas, El modelo no nos sirve.

Page 68: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

68

Nº 45.- La relación entre el precio de un producto y el volumen de consumo es la siguiente:

Precio X 180 220 260 300 340 Consumo Y 1905 2370 2835 3300 3765

Hallar el valor del coeficiente de correlación y las rectas de regresión Solución

K; L< 2M; 2N< M <;

180 1905 32400 3629025 342900 220 2370 48400 5616900 521400 260 2835 67600 8037225 737100 300 3300 90000 10890000 990000 340 3765 115600 14175225 1280100

1300 14175 354000 42348375 3871500 Media Varianza Desviación típica

2605

1300 ==; 3200)260(5

354000 22 =−=O6 56,563200 ==P6

Media Varianza Desviación típica

28355

14175 ==< 435450)2835(5

42348375 22 =−=Q6 88,659435450 ==R6

Covarianza

37200)2835)(260(5

3871500 =−=S"T6

Coeficiente de correlación Coeficiente de determinación

9965,0)88,659)(56,56(

37200 ==U 9931,0)9965,0( 22 ==U 99,31% de fiabilidad

Coeficiente de regresión de Y/X Coeficiente de regresión de X/Y

625,113200

372002

===U

U"V

6

6E 08,0

435450

372002

’ ===V

U"V

6

6E

Ordenada en el origen Ordenada en el origen 1875)260(625,112835 −=−=−= ;E<D 2,33)2835(08,0260’’ =−=−= <E;D

Recta de regresión Y/X Recta de regresión de X/Y W;< 625,111875* +−= X<; 08,02,33* +=

Coeficientes de regresión: b = 11,625 Nos indica lo que varia la renta, al variar el ahorro en una unidad b’= 0,08 Nos indica lo que varia el ahorro, al variar la rente en una unidad Al ser positivos nos indican que las variaciones son en el mismo sentido. r = 0,9965 Fiabilidad muy grande

19931,02 ≅=U ⇒ 100% de fiabilidad, bondad de las estimaciones. Es decir el 100% de las variaciones de una variable vienen explicadas por las variaciones de la otra variable, a través de las rectas de regresión, que al ser r prácticamente 1 coincidirán ambas rectas.

Page 69: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

69

Nº 46.- En un estudio sobre alcohólicos se informa que el 40% de los mismos tienen padre alcohólico y el 6% madre alcohólica. El 42% tienen al menos uno de los padres alcohólicos. 1.- Porcentaje de personas que tengan ambos padres alcohólicos. 2.- Porcentaje de personas que tengan madre alcohólica si lo es el padre. 3.- Porcentaje de personas que tengan madre alcohólica pero no un padre alcohólico. 4.- Porcentaje de personas que tengan madre alcohólica si el padre no lo es Solución P = padre alcohólico %(P) = 40% M = madre alcohólica %(M) = 6% %(P ∪ M) = 42%

No tener padre alcohólico y no tener madre alcohólica = suceso ( )03 ∩

Suceso ( )03 ∩ = suceso ( )03 ∪ % ( )03 ∪ = 100 – 42= 58%

P SI NO SI % 30 ∩ % 30 ∩ % 0

M NO % 30 ∩ % 30 ∩ % 0 % 3 % 3 100

Padre alcohólico SI NO SI 4 2 6

Madre alcohólica NO 36 58 94 40 60 100

1.- %(P ∩ M ) = 4%

2.- )%(3

0 = 10040

4 = 10%

3.- %( )( 03 ∩ = 2%

4.- %33,331006

2100

)%(

)%()%( ==∩=

3

30

30

Page 70: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

70

Nº 47.- Realizada una encuesta entre fumadores se obtuvieron los resultados sobre las variables: X: Nº de cigarrillos fumados diariamente Y: Horas de sueño diarias Que hemos recogido en la siguiente tabla X Y

2 - 6 4

6 - 12 9

12 – 14 13

14 - 20 17

20 - 30 25

YQ ZZ Q; [[ Q; 2 \1

4 - 6 0 2 8 26 36 72 360 1800 72 6 - 7 4 10 16 20 26 76 494 3211 148 7 - 8 18 24 14 12 14 82 615 4612,5 230 8 - 9 28 26 10 4 2 70 595 5057,5 300

]Q 50 62 48 62 78 300 2064 14681

^^ Q; 200 558 624 1054 1950 4386

__ Q; 2 800 5022 8112 17918 48750 80602

` aa` Q<; 1700 4284 4342 6528 11775 28629

b1 50 112 160 222 300

Solución

63,14300

4386 ==; 63,54)63,14(300

80602 22 =−=c6 39,763,54 ==d6

88,6300

2064 ==< 6,1)88,6(300

14681 22 =−=e6 26,16,1 ==f6

23,5)88,6)(63,14(300

28629 −=−=g"h6

56,0)26,1)(39,7(

23,5 −=−=U 315,0)56,0( 22 =−=U 31,5% de fiabilidad

096,063,54

23,52 −=−==i

i"j

6

6E 27,3

6,1

23,52

’ −=−==k

l"k

6

6E

28,8)63,14(096,088,6 =+=−= ;E<D 13,37)88,6(27,363,14’’ =+=−= <E;D

m;< 096,028,8* −= n<; 27,313,37* −=

Page 71: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

71

1.- Calcular el porcentaje de personas que fuman entre 15 y 22 cigarrillos al día Distribución Y/15<X<22

Y 4 - 6 86,283610

22665 =+

6 - 7 86,2626102206

5 =+

7 - 8 80,1214102126

5 =+

8 - 9 73,3210246

5 =+

72,25

%08,24100300

25,72 =

2.- Obtener el número mínimo de cigarrillos diarios que fuma uno de los fumadores del 30% que más fuma.

Hay que hallar el percentil 70 → 210300100

70 = El valor de la variable que ocupa

el lugar 210, que esta en el intervalo (14 – 20)

84,18662

16021014100

701

1

100

70 =−+=−

+=−

− oo

o

o &Q

11

/T Cigarrillos

3.- Podemos pronosticar que a mayor número de cigarrillos fumados diariamente se dormirá más horas. Con que fiabilidad

No, porque la covarianza es negativa, luego a más cigarrillos, menos horas se dormirá. La fiabilidad es del 31,5%

4.- Estimar el consumo de tabaco para una población de 1.500 personas de las que son fumadoras el 32%

32% de 1.500 será → 0,32 (1.500) = 480 personas fumadoras Cada persona fumadora, fuma un promedio de 14,63 cigarrillos, es decir 15 cigarrillos por persona fumadora al día Luego será: → 480(15) = 7.200 cigarrillos

5.- Estimar el número de horas de sueño diarias para una persona que fuma 35 cigarrillos al día.

p;< 096,028,8* −=

Para X = 35 9,4)35(096,028,8* =−=< ⇒ 5 horas de sueño diarias 6.- Porcentaje de personas fumadoras que duermen entre 6 y 8 horas sabiendo que no fuman más de 15 cigarrillos al día

Page 72: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

72

No fuma más de 15

Si fuma más de 15

Totales

Si Duerme (6 – 8) 81,33 76,67 158 No Duerme (6 – 8) 89 53 142

Totales 170,33 129,66 300

% (Duerme entre (6 – 8) / No fuma más de 15) = %748,4710033,170

33,81 =

Page 73: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

73

Nº 48.- Un estudio indica que el 10% de la población de Pamplona tiene 65 o más años, y que el 1% de la población padece deficiencia cardiaca moderada. Además el 10,4% de la población tiene 65 o más años o padece deficiencia cardiaca moderada. 1.- Porcentaje de personas que tengan 65 o más y padezcan la enfermedad. 2.- Porcentaje de personas que Si tienen 65 o más padezcan de deficiencia cardiaca 3.- Porcentaje de personas que Si no tienen 65 tengan la enfermedad Solución Suceso A = tener 65 o más años %(A) = 10%

Suceso B = Padecer deficiencia cardiaca moderada %(B) = 1%

%4,10)%( =∪ %$

A $ B 0,6 0,4 1

% 9,4 89,6 99 10 90 100

1.- %6,0)%( =∩ %$

2.- %610010

6,0,

)%(

)%()%( ==∩=

$

$%

$%

3.- %444,010090

4,0

)%(

)%()%( ==∩=

$

$%

$%

Page 74: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

74

Nº 49.- Se estima que el 30% de los ciudadanos de Navarra son obesos y el 3% sufre de diabetes. El 2% son obesos y sufre diabetes. ¿Cuál es el porcentaje de personas que son obesas o sufren diabetes?

Solución Suceso A = ser obeso %(A) = 30%

Suceso B = Padecer Diabetes %(B) = 3%

%2)%( =∩ %$

A $ B 2 1 3

% 28 69 97 30 70 100

312330)%()%()%()%( =−+=∩−+=∪ %$%$%$

Page 75: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

75

Nº 50.- De 300 estudiantes 100 cursan Antropología y 80 Estadística. Estas cifras incluyen 30 estudiantes que cursan ambas asignaturas. ¿Cuál es el porcentaje de estudiantes que cursan Antropología o Estadística? Solución

Suceso A = Estudiar A %(A) = %33,33100300

100 =

Suceso E = Estudiar E P(E) = %67,26100300

80 =

%10100300

30)( ==∩ ($3

A $ E 30 50 80

( 70 150 220 100 200 300

% ( )%$ ∪ = 100300

705030 ++ = 50%

A $ E 10 16,67 26,67

( 23,33 50 73,33 33,33 66,67 100

=∩−+=∪ )%()%()%()%( %$%$%$ 33,33 + 26,67 – 10 = 50%

Page 76: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

76

Nº 51.- Se estima que entre la población total de Europa el 55% padece de obesidad, el 20% es hipertensa, y el 60% es obesa o hipertensa. ¿Es, de hecho, independiente el que una persona sea obesa de que padezca hipertensión?

Solución Suceso A = padecer obesidad %(A) = 55%

Suceso B = Ser hipertenso % (B) = 20%

Ser obeso o hipertenso = suceso A ∪ B %(A ∪ B) = 60%

No ser obeso y no ser hipertenso = suceso ( )%$ ∩

Suceso ( )%$ ∩ = suceso ( )%$ ∪ % ( )%$ ∪ = 100 – 60 = 40%

A $ B 15 5 20

% 40 40 80 55 45 100

Luego A y B 12 son Independientes

100

20

45

5

55

15 ≠≠ No se mantienen las proporciones, condición necesaria para ser

Independientes

Page 77: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

77

Nº 52.- Se sabe por informes recientes que el 18% de los estudiantes sufren de depresión en algún periodo de su escolarización, que el 2% piensa en el suicidio y que el 19% sufre de depresión o piensa en el suicidio. 1.- ¿Cuál es el porcentaje de estudiantes que sufren depresión y piensen en el suicidio? 2.- ¿Cuál es el porcentaje de estudiantes que sufren depresión pero no piense en el suicidio?

Solución Suceso A = Sufrir depresión %(A) = 18%

Suceso B = Pensar en suicidio %(B) = 2%

Sufrir depresión R pensar en suicidio = Suceso ( %$ ∪ ) %(A ∪ B) = 19%

Sufrir depresión \ pensar en suicidio = Suceso (A ∩ B)

Sufrir depresión \�QR pensar en suicidio = Suceso (A %∩ )

No sufrir depresión y no pensar en el suicidio = suceso ( )%$ ∩

Suceso ( )%$ ∩ = suceso ( )%$ ∪ % ( )%$ ∪ = 100 – 19 = 81%

A $ B 1 1 2

% 17 81 98 18 82 100

1.- Sufrir depresión \ pensar en suicidio = Suceso (A ∩ B)

% (A ∩ B) = 15

2.- Sufrir depresión \�QR pensar en suicidio = Suceso (A %∩ )

%(A %∩ ) = 17%

Sufrir depresión 6DELHQGR�TXH�QR piensa en el suicidio = Suceso

%

$

% ==

10098

17%

$ 17,347%

Page 78: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

78

Nº 53.- Se estima que el 15% de la población adulta padece de hipertensión, pero que el 75% de todos los adultos creen no tener este problema. Se estima también que el 6% de la población tiene hipertensión pero no es consciente de padecer dicha enfermedad. ¿Cuál es el porcentaje de personas que creyendo que no tienen hipertensión, y sin embargo la tienen? Solución

Suceso A = Sufrir Hipertensión %(A) = 15%

Suceso B = Creer no tener problemas %(B) = 75%

Sufrir Hipertensión \ Creer no tener problemas = Suceso A ∩ B

%(A ∩ B) = 6%

Padecer hipertensión / creer no tener problemas = Suceso %

$

A $ B 6 69 75

% 9 16 25 15 85 100

%(%

$ ) = 10075

6 = 8%

Es decir un 8% de personas que creen no tener problemas de hipertensión, padecen

de hecho la enfermedad.

Page 79: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

79

Nº 54.- Dados los siguientes valores de las variables X e Y ajustar una recta por mínimos cuadrados y dar una medida del ajuste realizado.

Y 16 19 22 25 X 52 39 45 51

Solución

q< 16 19 22 25 82

r; 52 39 45 51 187 2s< 256 361 484 625 1726

2t; 2704 1521 2025 2601 8851

uv <; 832 741 990 1275 3838

5,204

82 ==< 25,11)5,20(4

1726 22 =−=w6 35,325,11 ==x6

75,464

187 ==; 19,27)75,46(4

8851 22 =−=y6 21,519,27 ==z6

125,1)5,20)(75,46(4

3838 =−={"|6

064,0)21,5)(35,3(

125,1 ==U 0041,0)064,0( 22 ==U

0,41% de fiabilidad (muy pequeña = 0)

041,019,27

125,12

===}

}"~

6

6E 1,0

25,11

125,12

’ ===�

�"�

6

6E

5,18)75,46(041,05,20 =−=−= ;E<D 7,44)5,20(1,075,46’’ =−=−= <E;D

�;< 041,05,18* += �<; 1,07,344* +=

Demasiado pequeña la bondad de las estimaciones

Page 80: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

80

Nº 55.- En una residencia de ancianos tenemos: El 20% casados, el 30% solteros y el 50% viudos. El 5% de los casados tienen mal carácter, el 10% de los solteros y el 20% de los viudos también tienen mal carácter. 1.- Hallar el porcentaje de personas que tengan mal carácter y estén casadas. 2.- Sabiendo que tienen mal carácter hallar el porcentaje de personas que estén casadas. Solución

Estado civil C S V

SI 1 3 10 14

Tener mal Carácter

NO 19 27 40 86

20 30 50 100

C = Casado %(C) = 20% %5)%( =&

0

S = Soltero %(S) = 30% %10)%( =6

0

V = Viudo %(V) = 50% %20)%( =9

0

M = Tener Mal Carácter

0 = No Tener Mal Carácter

1.- %5)%( =∩ 0& del %20 = 1%

2.- %10)%( =∩ 06 del %30 = 3%

%20)%( =∩ 09 del %50 = 10%

( ) %141031% =++=0

=∩=)%(

)%()%(

0

0&

0& =)100(

14

1 7,14%

Page 81: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

81

Nº 56 - De un grupo de 522 personas se desea conocer el grado de relación entre el sexo y la delincuencia. Se sabe que hay: 190 mujeres de las cuales 112 son delincuentes, mientras que entre los hombres solo hay 122 delincuentes. Solución

Suceso A = ser mujer (190) %(A) = 522

190 100 = 36,40%

Suceso $ = No ser mujer (522 − 190) = 332 %( $ ) = 522

332100 = 63,6%

Suceso B = Ser delincuente

Suceso % = No ser delincuente

Suceso Ser delincuente siendo mujer ( )$

% % ( )$

% = 190

112100 = 58,95%

Suceso Ser delincuente No siendo mujer

$

% %

$

% =332

122100= 36,75%

A $ B 112 122 234

% 78 210 288 190 332 522

Luego A y B 12 son Independientes

522

234

332

122

190

112 ≠≠ No se mantienen las proporciones, condición necesaria para ser

Independientes

( )( ) ( )( )( )( ) ( )( )12278210112

12278210112

+−=���4 =

30036

14004 = 0,424

0,424 es el grado de asociación entre sexo y delincuencia, se atraen el ser mujer con ser

delincuente

Page 82: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

82

Nº 57.- Se desea conocer la posible relación entre las diferentes nacionalidades y su actitud en contra o a favor del federalismo, a través de la siguiente muestra:

Galicia P. vasco Cataluña Andalucía Total A favor 10 37 22 8 77 En contra 6 13 8 6 33 Total 16 50 30 14 110

Solución FRECUENCIAS OBSERVADAS (OB)

Galicia P. vasco Cataluña Andalucía Total A favor 10 37 22 8 77 En contra 6 13 8 6 33 Total 16 50 30 14 110

FRECUENCIAS TEORICAS CASO DE INDEPENDENCIA (TE)

Galicia P. vasco Cataluña Andalucía Total A favor 11,2 35 21 9,8 77 En contra 4,8 15 9 4,2 33 Total 16 50 30 14 110

No se mantienen iguales luego hay alguna relación, algún grado de dependencia

( ) ( ) ( ) ( ) =+−+−+−=−

= ∑ .......................21

2122

35

3537

2,11

2,1110 2222

2

7(

7(2%χ

Page 83: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

83

Nº 58.- Deseamos analizar la posible relación entre el color de la piel y el tener o no los ojos azules, para ello tomamos una muestra de 200 personas de las cuales 79 tienen piel clara y entre estas hay 49 con ojos azules, mientras que entre los que tienen piel oscura tenemos 25 con ojos azules.

Solución A = Tener la piel clara B = Tener ojos azules

A $ B 49 25 74

% 30 96 126 79 121 200

200

74

121

25

79

49 ≠≠ No se mantienen las proporciones, condición necesaria para ser

Independientes

Luego A y B 12 son Independientes

( )( ) ( )( )( )( ) ( )( )25309649

25309649

+−=���4 =

5454

3954 = 0,7249

0,7249 es el grado de asociación entre el color de la piel y el de los ojos, tener piel clara

y tener ojos azules, se atraen

Page 84: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

84

Nº 59 - Se quiere analizar la posible dependencia entre la práctica religiosa y la identificación con grupos pacifistas, de los jóvenes entre 15 y 25 años de Pamplona para ello se realiza una encuesta, y los datos se recogen en la tabla siguiente:

PRÁCTICA RELIGIOSA Grupos Pacifistas

nunca Varias al año

Algunas al mes

Solo domingos

Domingos y festivos

Varias a la semana

Muy cercano 77 31 18 16 25 4 Cercano 161 119 57 67 62 3 Distante 42 26 36 34 21 2 Muy Distante 14 18 6 13 12 0

Solución FRECUENCIAS OBSERVADAS (OB) PRÁCTICA RELIGIOSA Grupos Pacifistas

nunca Varias al año

Algunas al mes

Solo domingos

Domingos y festivos

Varias a la semana

TOTAL

Muy cercano 77 31 18 16 25 4 171 Cercano 161 119 57 67 62 3 469 Distante 42 26 36 34 21 2 161 Muy Distante 14 18 6 13 12 0 63 TOTAL 294 194 117 130 120 9 864

FRECUENCIAS TEORICAS CASO DE SER INDEPENDIENTES (TE) PRÁCTICA RELIGIOSA Grupos Pacifistas

Nunca

Varias al año

Algunas al mes

Solo domingos

Domingos y festivos

Varias a la semana

TOTAL

Muy cercano 58,4 38,4 23,1 25,7 23,8 1,6 171 Cercano 159,6 105,3 63,5 70,6 65,1 4,9 469 Distante 54,8 36,2 21,8 24,2 22,4 1,6 161 Muy Distante 21,2 14,1 8,6 9,5 8,7 0,9 63 TOTAL 294 194 117 130 120 9 864

Las tablas de frecuencias observadas y las teóricas caso de independencia no coinciden, lo que indica que hay algún grado de dependencia.

( ) ( ) ( ) =+−+−+−=−

= ∑ .......................1,23

1,2318

4,38

4,3831

4,58

4,5877 2222

2

7(

7(2%χ 7,2

COEFICIENTE DE CONTINGENCIA

1&

+=

2

2

χχ

= 8642,7

2,7

+ = 0,09 No Parece demasiado grande

Page 85: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

85

Nº 60.- Se esta estudiando la relación existente entre los años de estudio realizados por los padres y los estudios realizados por los hijos. Para ello se toma una muestra de 7 personas.

ENTREVISTADOS PADRES HIJOS A 12 12 B 10 8 C 6 6 D 16 11 E 8 10 F 9 8 G 12 11

Analizar y establecer la posible dependencia y correlación entre ambas variables. Y en su caso, dar una medida de la bondad de los posibles pronósticos de ambas. Solución

Entrevistados Padres X

Hijos Y

2;

2<

;<

A 12 12 144 144 144 B 10 8 100 64 80 C 6 6 36 36 36 D 16 11 256 121 176 E 8 10 64 100 80 F 9 8 81 64 72 G 12 11 144 121 132

TOTAL 73 66 825 666 720

43,97

66 === ∑1

<<

� años 43,10

7

73 === ∑1

;;

� años

2,6)43,9(7

666 222

2 =−=−= ∑<

1

<6

�� 07,9)43,10(

7

825 222

2 =−=−= ∑;

1

Q;6

���

2�� 66 += = 49,22,6 =+ años 2�� 66 += = 01,307,9 =+ años

5,4)43,10)(43,9(7

720 =−=−= ∑<;

1

<;6

���"�

60,0)49,2)(01,3(

5,4 ==��

�"�

66

6U 36,0)60,0( 22 ==U 36% de fiabilidad. Aunque no es

bastante grande nos indica que no es demasiado buena la relación lineal entre ambas variables. De todas formas establecemos esa relación:

49,007,9

5,42

===�

�"�

6

6E 32,4)43,10(49,043,9 =−=−= ;E<D

Recta: �� ;< 49,032,4* +=

Page 86: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

86

Nº 61.- Hallar las rectas de regresión de las variables X e Y correspondientes a las edades de hombres y mujeres a la hora de contraer matrimonio, y hallar el grado de correlación.

Esposo 40 36 20 18 60 50 Esposa 27 25 17 16 37 32

Solución

Esposo X

Esposa Y

2;

2<

;<

40 27 1600 729 1080 36 25 1296 625 900 20 17 400 289 340 18 16 324 256 288 60 37 3600 1369 2220 50 32 2500 1024 1600

224 154 9720 4292 6458

6,256

154 === ∑1

<<

� años 3,37

6

224 === ∑1

;;

� años

97,59)6,25(6

4292 222

2 =−=−= ∑<

1

<6

��

71,228)3,37(6

9720 222

2 =−=−= ∑;

1

Q;6

�� 

2¡¡ 66 += = 74,797,59 =+ años 2¢£ 66 += = 12,1571,228 =+ años

45,116)3,37)(6,25(6

6428 =−=−= ∑<;

1

<;6

¤¥¦"§

995,0)74,7)(12,15(

45,116 ==¨©

©"¨

66

6U 99,0)995,0( 22 ==U 99% de fiabilidad. Es bastante

grande nos indica que es buena la relación lineal entre ambas variables. Establecemos esa relación:

50,071,228

45,1162

===ª

ª"«

6

6E 95,6)3,37(50,06,25 =−=−= ;E<D

Recta: ¬­ ;< 50,095,6* +=

Page 87: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

87

Nº 62.- Dadas las variables estadísticas correspondientes a las edades de 5 niños y sus pesos respectivos, hallar las rectas de regresión y su representación gráfica.

Edad 2 4 6 7 8 Peso 15 19 25 33 34

Solución

Edad X

Peso Y

2;

2<

;<

2 15 4 225 30 4 19 16 361 76 6 25 36 625 150 7 33 49 1089 231 8 34 64 1156 272

27 126 169 3456 759

2,255

126 === ∑1

<<

®Kg. 4,5

5

27 === ∑1

;;

¯ años

16,56)2,25(5

3456 222

2 =−=−= ∑<

1

<6

°± 64,4)4,5(

5

169 222

2 =−=−= ∑;

1

Q;6

²²³

2´´ 66 += = 5,716,56 =+ Kg. 2µ¶ 66 += = 15,264,4 =+ años

72,15)4,5)(2,25(5

759 =−=−= ∑<;

1

<;6

·¸¹"º

974,0)5,7)(15,2(

72,15 ==»¼

¼"»

66

6U 95,0)974,0( 22 ==U 95% de fiabilidad. Es bastante

grande nos indica que es buena la relación lineal entre ambas variables. Establecemos esa relación:

38,364,4

72,152

===½

½"¾

6

6E Es lo que varia Y al variar X en una unidad

948,6)4,5(38,32,25 =−=−= ;E<D

Recta: ¿À ;< 38,3948,6* +=

Page 88: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

88

Nº 63.- La tabla de frecuencias siguiente corresponde a una variable bidimensional (X; Y) Y = Edad de pacientes ingresados en Ubarmin por fractura de menisco X = Número de días que permanecen ingresados dichos pacientes. Se desea hacer un estudio sobre pacientes entre 14 y 30 años. Para ello tomamos una

muestra de pacientes de esas edades ingresados en Ubarmin durante el mes de marzo por fracturas de menisco. Recogemos los datos en la tabla:

Yj Xi

14 - 18 18 - 22 22 - 26 26 - 30

3 - 5 0,00 0,01 0,09 0,40 5 - 7 0,08 0,06 0,03 0,01 7 - 9 0,30 0,02 0,00 0,00

OBTENGA RAZONADAMENTE Y EXPLIQUE BREVEMENTE EL PORQUE

Y EL SIGNIFICADO DE TODOS Y CADA UNO DE LOS RESULTADOS OBTENIDOS.

1.- Distribuciones condicionadas: Xi / Yj < 22 Xi / Yj > 26 1.1.- ¿Cual es más homogénea y por qué? 2.- Porcentaje de pacientes con edad inferior a 26 y mayores de 18 años. 3.- Media aritmética y cuartiles de la siguiente distribución: Yj / 5 < Xi < 7 4.- Analizar razonadamente la dependencia y la correlación entre las variables X e Y. 5.- Suponiendo que el día 30 de Junio ingresas en Ubarmin por rotura de menisco,

analiza las posibilidades que tienes de que el 6 de Julio, puedas oír el cohete desde la plaza del Castillo.

6.- En el mes de marzo una persona estuvo ingresada en Ubarmin por rotura de menisco 7 días y afirma tener 18 años. Comentar posible veracidad y fiabilidad de su afirmación.

Solución

Yj Xi

14 - 18 18 - 22 22 - 26 26 - 30 ÁI ÁÁ I; ÂÂ I; 2

3 - 5 0,00 0,01 0,09 0,40 0,50 2,00 8,00 5 - 7 0,08 0,06 0,03 0,01 0,18 1,08 6,48 7 - 9 0,30 0,02 0,00 0,00 0,32 2,56 20,48

ÃI 0,38 0,09 0,12 0,41 1 5,64 34,96

ÄÄ I< 6,08 1,80 2,88 11,48 22,24

ÅÅ I< 2 97,28 36,00 69,12 321,44 523,84

Æ ÇÇÆ I<; 46,08 11,20 12,48 46,48 116,24

ÈÈ I;; ∑= = 5,64 222 ;I;6 ÉÉÊ −= ∑ = 2)64,5(96,34 − 3,16

ËË I<< ∑= = 22,24 222 <I<6 ÌÌÍ −= ∑ = 2)24,22(84,523 − = 22,22

Page 89: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

89

== 16,3Î6 1,777 22,22=Ï6 = 5,217

<;I<;6 Ð ÑÑÐÒ"Ó −= ∑ = 116,24 – (5,64)(22,24) = −9,1936

1.- Distribuciones condicionadas: Xi / Yj < 22 Xi / Yj > 26 1.1.- ¿Cual es más homogénea y por qué? Xi / Yj < 22 Ô; ÕI Õ) ÕÕ I; ÖÖ I; 2

4 0,01 4 0,021 0,021 0,084 0,336 6 0,14 6 0,298 0,319 1,788 10,728 8 0,32 8 0,681 1 5,448 43,584

0,47 1 7,32 54,648

×× I;; ∑= = 7,32 222 ;I;6 ØØÙ −= ∑ = 2)32,7(648,54 − = 1,0656

== 0656,1Ú6 1,032 ;

6;&9

Û=)( = 141,0

32,7

032,1 =

Xi / Yj > 26 Õ; ÕI Õ) ÕÕ I; ÜÜ I; 2

4 0,4 4 0,976 0,976 3,904 15,616 6 0,01 6 0,024 1 0,144 0,864 8 0,0 8 0 1 0 0

0,41 1 4,048 16,48

×× I;; ∑= = 4,048 222 ;I;6 ÝÝÞ −= ∑ = 2)048,4(48,16 − = 0,093696

== 093696,0ß6 0,306098 ;

6;&9 =)( = 075,0

048,4

306098,0 =

Es más homogénea la que sea menos dispersa, es decir la que tenga menor coeficiente de variación. Es decir la distribución de Xi / Yj > 26 es más homogénea que la distribución de Xi / Yj < 22 2.- Porcentaje de pacientes con edad inferior a 26 y mayores de 18 años.

18 - 22 22 - 26 totales 0,01 0,09 0,10 0,06 0,03 0,09 0,02 0,00 0,02 0,09 0,12 0,21

Luego el 21% tienen una edad entre 18 y 26 años

Page 90: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

90

3.- Media aritmética y cuartiles de la siguiente distribución: Yj / 5 < Xi < 7

Yj 14 - 18 18 - 22 22 - 26 26 - 30 totales àI /5 <X< 7 0,08 0,06 0,03 0,01 0,18

áI 0,445 0,333 0,167 0,055 1

â< 16 20 24 28

ãã I< 7,12 6,66 4 1,54 19,32

ä) 0,445 0,778 0,945 1

< = 19,32 años

25,164445,0

025,014)1814(25,0

4

1

4

1 =−+=

−→== ,QWHUYDORT

66,184333,0

445,05,018)2218(50,0

4

2

4

2 =−+=

−→== ,QWHUYDORT

66,214333,0

445,075,018)2218(75,0

4

3

4

3 =−+=

−→== ,QWHUYDORT

4

2T − 4

1T = 18,66 – 16,25 = 2,41 4

3T − 4

2T = 21,66 – 18,66 = 3

Para que la distribución fuera simétrica, deberían de ser iguales ambas distancias. 4.- Analizar razonadamente la dependencia y la correlación entre las variables X e Y.

FRECUENCIAS OBSERVADAS

Yj Xi

14 - 18 18 - 22 22 - 26 26 - 30 åI

3 - 5 0,00 0,01 0,09 0,40 0,50 5 - 7 0,08 0,06 0,03 0,01 0,18 7 - 9 0,30 0,02 0,00 0,00 0,32

æI 0,38 0,09 0,12 0,41 1

FRECUENCIAS TEORICAS CASO DE INDEPENDENCIA

Yj Xi

14 - 18 18 - 22 22 - 26 26 - 30 åI

3 - 5 0,19 0,045 0,06 0,205 0,50 5 - 7 0,0684 0,0162 0,0216 0,0738 0,18 7 - 9 0,1216 0,0288 0,0384 0,1312 0,32

çI 0,38 0,09 0,12 0,41 1

Page 91: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

91

Como se ve no se mantienen ninguna proporción por tanto No son Independientes Hay dependencia

<;I<;6 è ééèê"ë −= ∑ = 116,24 – (5,64)(22,24) = −9,1936 ≠ 0 Luego Hay correlación

Como ì"í6 = −9,1936 < 0 Correlación inversa o negativa, ambas variables varían en sentido contrario cuando una aumenta la otra disminuye y viceversa.

îï

ï"î

66

6U = =

)217,5)(777,1(

1936,9− = -0,9916 22 )9916,0(−=U = 0,98337

98,337% de fiabilidad, o bondad del ajuste. El 98,337% de las variaciones de una variable vienen explicadas por las variaciones de la otra variable a través de las rectas de regresión. Como es suficientemente bueno establecemos la recta de regresión.

9,216,3

1936,92

−=−==ð

ð"ñ

6

6E Es lo que varia Y al variar X en una unidad

65,38)64,5(9,224,22 =+=−= ;E<D

Recta: Y/X òó ;< 9,265,38* −=

413,022,22

1936,9’

2−=−==

ñ

ð"ñ

6

6E Es lo que varia X al variar Y en una unidad

83,14)24,22(413,064,5’’ =+=−= <E;D

Recta: X/Y ôõ <; 413,083,14* −=

5.- Suponiendo que el día 30 de Junio ingresas en Ubarmin por rotura de menisco,

analiza las posibilidades que tienes de que el 6 de Julio, puedas oír el cohete desde la plaza del Castillo.

ôõ <; 413,083,14* −=

Suponiendo que tienes 18 años 396,7)18(413,083,14* =−=ö; días Estaré ingresada el día 6 de julio No podré oír

el cohete desde la plaza del castillo. 6.- En el mes de marzo una persona estuvo ingresada en Ubarmin por rotura de menisco

7 días y afirma tener 18 años. Comentar posible veracidad y fiabilidad de su afirmación.

ôõ <; 413,083,14* −=

Para Y = 18 X = 7,369 días

õô ;< 9,265,38* −=

Para X = 7 )7(9,265,38* −=÷< = 18,35 años

Puede ser verdad. Con una fiabilidad del 98,337%

Page 92: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

92

Nº 64.- A un grupo de alumnos se les examina de teoría (X) y práctica (Y) de una asignatura. La nota global de dicha asignatura (Z) se obtiene de la siguiente forma: Zi = X + Y Se pide: Comparar la Homogeneidad de la distribución de la nota global en los dos casos siguientes: 1.- las variables X e Y están totalmente correlacionadas 2.- Las variables X e Y son totalmente independientes Solución Zi = X + Y

( )<;

1

Q<

1

Q;

1

Q<;

1

Q==

øøùùù øøùùù+=+=

+== ∑∑∑∑

( ) ( ) ( )( ) ( ) ( )( )1

Q<<;;

1

Q<;<;

1

==6

ú ûûúú ûûúúü

∑∑∑ −+−=

+−+=

−=

222

2 =

( ) ( ) ( )( )1

Q<<;;

1

Q<<

1

Q;; ý þþýþþýý ∑∑∑ −−+

−+

−= 2

22

= ÿ���ÿ 666 222 ++

=

6=&9

�=)(

A.1.- r = +1 ⇒ ���6 > 0 ⇒ <;

666=&9

�����+

++=

2)(

22

A.2.- r = −1 ⇒ ���6 < 0 ⇒ <;

666=&9

�����+

−+=

2)(

22

B.- r = 0 ⇒ ��6 = 0 ⇒ <;

66=&9

�++

=22

)(

Más homogénea la que tenga menor coeficiente de variación El CV(Z) en el caso A.-1 siempre será mayor que el CV(Z) del caso B El CV(Z) en el caso A.-2 siempre será menor que el CV(Z) del caso B Luego la más homogénea será cuando existe correlación perfecta negativa.

Page 93: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

93

Nº 65.- Un hospital adquiere una nueva maquina para rellenar bombonas de oxigeno. Al cabo de un mes, se eligen 100 bombonas al azar y se comprueba su peso: peso en Kg. (45 - 48) (48 - 50) (50 - 53) (53 - 55) Nº bombonas 10 48 30 12 Ni 10 58 88 100 Se supone que si el 75% de las bombonas pesan menos de 52 Kg., la maquina será aceptada como buena, en caso contrario la maquina será devuelta. ¿Cree usted que el hospital aceptara la maquina? Explique clara y exactamente el porqué de su respuesta. Solución

Habrá que comprobar que el 75% de las bombonas pesan más o menos de 52 kilos. Para ello hallaremos el percentil 75 y comprobaremos si es mayor o menor de 52. O También podemos hallar bajo que percentil se encuentra el valor 52 y comprobar si es mayor o menor que 75. El percentil 75 será:

75100100

75 = El percentil 75 será el valor de la variable que ocupa el lugar

inmediatamente siguiente al 75 y, que esta en el intervalo (50 – 53). Aplicando la formula:

527,51330

58100100

75

14100

751

1100

75 <=−

+=−

+=−

− ��

�� &

Q

11

/T

Por tanto No devolverá la maquina ya que 75% de las bombonas pesan menos de 52 kilos De la otra forma:

Despejaremos “r” de la formula del percentil

� &

Q

11U

/T1

1100

100 −

−+=

78583

)30)(5052(*)( 1

100

75

=+−=+−

=−

��

��1

&

Q/T

U

El 78% de las bombonas pesan menos de 52 kilos por tanto No devolverá la maquina.

Page 94: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

94

Nº 66.-A una feria acuden 600 firmas expositoras que ocupan otros tantos “Stands”. La superficie de estos, así como el personal asignado a cada uno vienen dados en la siguiente tabla:

Personal

m2 X

Y 10 - 20 20 - 30 30 - 70 70 - 130 total 0 - 2 2 - 6

6 - 10 10 - 12 12 - 18

74 46 18 2 0

10 86 76 60 30

0 22 26 50 26

0 2 12 22 38

84 156 132 134 94

totales 140 262 124 74 600 1.- Superficie aproximada de la feria teniendo en cuenta que hay 60.000 m2 desocupados. 2.- Distribución, en frecuencias relativas, de la superficie de los “Stands” en que trabajan entre 5 y 15 personas. 3.- Distribución del personal asignado en “Stands” con superficie entre 25 y 70 m2. Analizar la posible simetría de dicha distribución. 4.- Distribuciones de: Nº personas asignadas a un “Stand” / superficie > 30 m2 Nº personas asignadas a un “Stand” / superficie < 30 m2 ¿Cuál de las dos es más homogénea y por qué? 5.- % de “Stands” que tengan asignadas menos de10 personas sabiendo que ocupan más de 25 m2. 6.- Analizar y establecer la posible relación lineal entre ambas variables 7.- Estimar el número de personas que podemos esperar que tenga asignado un “Stand” con 78 m2. Dar una media de la bondad de dicha estimación. Solución

Personal

m2 X 15 25 50 100

Y 10 - 20 20 - 30 30 - 70 70 - 130 �Q �� Q< �� Q< 2

1 4 8 11 15

0 - 2 2 - 6

6 - 10 10 - 12 12 - 18

74 46 18 2 0

10 86 76 60 30

0 22 26 50 26

0 2

12 22 38

84 156 132 134 94

84 624 1056 1474 1410

84 2496 8448 16214 21150

�Q 140 262 124 74 600 4648 48392

�� Q; 2100 6550 6200 7400 22250

�� Q; 2 31500 163750 310000 740000 1245250

� ��� Q<; 6360 51800 61800 91600 211560

1.-Superficie aproximada de la feria teniendo en cuenta que hay 60.000 m2 desocupados.

22.250 + 60.000 = 82.250 metros cuadrados

2.- Distribución, en frecuencias relativas, de la superficie de los “Stands” en que trabajan entre 5 y 15 personas.

Page 95: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

95

�� // −−1 Frecuencias absolutas �Q �I

10 - 20 4

1 46 + 18 + 2 + 21 0 = 31,5 0,090

20 – 30 4

1 86 + 76 + 60 + 21 30 = 172,5 0,490

30 – 70 4

1 22 + 26 + 50 + 21 26 = 94,5 0,270

70 - 130 4

1 2 + 12 + 22 + 21 38 = 53,5 0,150

352 1 3.- Distribución del personal asignado en “Stands” con superficie entre 25 y 70 m2. Analizar la posible simetría de dicha distribución.

�� // −−1 Frecuencias absolutas �Q �1

0 – 2 2

1 10 + 0 = 5 5

2 – 6 2

1 86 + 22 = 65 70

6 – 10 2

1 76 + 26 = 64 134

10 – 12 2

1 60 + 50 = 80 214

12 - 18 2

1 30 + 26 = 41 255

255

615,5465

575,632)62(75,63255

4

1

4

1 =−+=

−→== ,QWHUYDORT

594,9464

705,1276)106(5,127255

4

2

4

2 =−+=

−→== ,QWHUYDORT

431,11280

13425,19110)1210(25,191255

4

3

4

3 =−+=

−→== ,QWHUYDORT

Distancias entre cuartiles:

4

2T − 4

1T = 9,594 – 5,615 = 3,979 4

3T − 4

2T = 11,431 – 9,594 = 1,837

Para que la distribución fuera simétrica, deberían de ser iguales ambas distancias. Por tanto No es simétrica. 4.- Distribuciones de: Nº personas asignadas a un “Stand” / superficie > 30 m2 Nº personas asignadas a un “Stand” / superficie < 30 m2

Page 96: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

96

¿Cuál de las dos es más homogénea y por qué?

Distribución de Nº personas asignadas a un “Stand” / superficie > 30 m2

�� // −−1 30>;

Q �

�< �� Q< � Q< 2

0 – 2 0 + 0 = 0 1 0 0 2 – 6 22 + 2 = 24 4 96 384 6 – 10 26 + 12 = 38 8 304 2432

10 – 12 50 + 22 = 72 11 792 8712 12 - 18 26 + 38 = 64 15 960 14400

198 2152 25928

La media será: 87,10198

2152 === ∑1

Q<<

!!

La varianza será: 82,1287,10198

25928 222

2 =−=−= ∑<

1

Q<6

""#

La desviación típica será: 2$$ 66 += = 58,382,12 =+

El Coeficiente de Variación será: <

6&9

%= 329,0

87,10

58,3 ==

Distribución de Nº personas asignadas a un “Stand” / superficie < 30 m2

&& // −−1

30<;Q '

(< )) Q< *+ Q< 2

0 – 2 74 + 10 = 84 1 84 84 2 – 6 46 + 86 = 132 4 528 2112 6 – 10 18 + 76 = 94 8 752 6016

10 – 12 2 + 60 = 62 11 682 7502 12 - 18 0 + 30 = 30 15 450 6750

402 2496 22464

La media será: 20,6402

2496 === ∑1

Q<<

,,

La varianza será: 44,1720,6402

22464 222

2 =−=−= ∑<

1

Q<6

--.

La desviación típica será: 2// 66 += = 1762,444,17 =+

El Coeficiente de Variación será: <

6&9

0= 6735,0

20,6

1762,4 ==

Page 97: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

97

Es más homogénea, la que es menos dispersa es decir la que tiene el coeficiente de variación menor. La más homogénea es la Distribución del Nº personas asignadas a un “Stand”/ superficie > 30 m2 5.- % de “Stands” que tengan asignadas menos de10 personas sabiendo que ocupan más de 25 m2.

Superficie de los “Stand” Personal Menos de 25 Más de 25

Menos de 10 224 148 372 Más de 10 47 181 228

271 329 600

% de Stand” con (menos de 10 personas / más de 25 m2) = 100329

148 = 44,985%

6.- Analizar y establecer la posible relación lineal entre ambas variables

Como no se mantienen las proporciones, No son Independientes. Luego hay

dependencia

75,7600

4648 === ∑1

Q<<

11. 08,37

600

22250 === ∑1

Q;;

22

65,20)75,7(600

48392 222

2 =−=−= ∑<

1

<6

34

5,700)08,37(600

1245250 222

2 =−=−= ∑;

1

Q;6

556

277 66 += = 54,465,20 =+ 289 66 += = 46,265,700 =+

23,65)75,7)(08,37(600

211560 =−=−= ∑<;

1

<;6

:;<�=

543,0)54,4)(46,26(

23,65 == >??�>66

6U 295,0)543,0( 22 ==U 29,5% de fiabilidad. Es

bastante pequeña nos indica que es bastante pequeña la relación lineal entre ambas variables. Solamente el 29,5% de las variaciones de una variable vienen explicadas por las variaciones de la otra variable a través de las rectas de regresión. Establecemos esa relación: Recta Y/X

09,05,700

23,652

=== @@�A

6

6E Es lo que varia Y al variar X en una unidad

3,4)08,37(09,075,7 =−=−= ;E<D

Recta: BC ;< 09,03,4* +=

6,19600

84*14074 =≠

Page 98: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

98

Recta que nos sirve para pronosticar el comportamiento de la Y (personal asignado al “Stand”)conocida la X(metros cuadrados del “Stand”), pero solamente con una fiabilidad del 29,5% Recta X/Y

15,365,20

23,65’

2=== D

E�D6

6E Es lo que varia Y al variar X en una unidad

6,12)75,7(15,308,37’’ =−=−= <E;D

Recta: FG <; 15,36,12* +=

Recta que nos sirve para pronosticar el comportamiento de la X (metros cuadrados del “Stand”), conocida la Y (personal asignado al “Stand”), pero solamente con una fiabilidad del 29,5% 7.- Estimar el número de personas que podemos esperar que tenga asignado un “Stand” con 78 m2. Dar una media de la bondad de dicha estimación.

Recta: GF ;< 09,03,4* +=

Para 78=H; 32,11)78(09,03,4* =+=I<

Es decir estimamos que tendrá 11 o 12 personas asignadas pero la bondad de esta estimación es muy pequeña es 543,0=U 295,0)543,0( 22 ==U 29,5% de fiabilidad.

Solamente el 29,5% de las variaciones del número de personas asignadas al “stand” (Y) vienen explicadas por las variaciones de los metros cuadrados del “Stand” (X) a través

de la recta de regresión. JK ;< 09,03,4* +=

Page 99: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

99

Nº 67.- En una empresa el 20% es personal "no cualificado", el 50% es personal "cualificado" y el resto personal "técnico". La plantilla consta de 1000 empleados. Se ha estimado la productividad para cada uno de estos grupos en unos coeficientes que van de 1 a 5, siendo como se puede observar en la tabla siguiente:

Coeficiente Personal Personal Personal Productividad no cualificado cualificado técnico x en % en % en % 1 10 5 - 2 20 20 10 3 30 20 40 4 30 40 30

a) Hállese la productividad media de los 1000 empleados. b) ¿Qué nivel de productividad es el más corriente en esta empresa? c) ¿Bajo qué coeficiente están el 50% de los trabajadores menos productivos? d) Comparando las productividades medias del personal no cualificado y del personal cualificado, ¿cuál de ellas corresponde a una distribución de frecuencias más homogénea? Solución

1.- Para hallar la productividad media Haremos: 1

Q;;

LL∑=

Coeficiente

Productividad ;

Personal No Cualificado

(En %)

Personal Cualificado

(En %)

Personal Técnico (En %)

100MM IS =

%

NN S;

O3 %

acumulado

1 10 5 - 4,5 4,5 4,5 2 20 20 10 17 34 21,5 3 30 20 40 28 84 49,5 4 30 40 30 35 140 84,5 5 10 15 20 15,5 77,5 100 100 340

1

Q;;

LL∑= = 4,3100

340

100==∑ PP S;

Coeficiente de productividad media.

2.- El nivel de productividad más corriente será la moda. Productividad modal Q0 = 4 Valor de la variable que presenta mayor frecuencia.

3.- El nivel de productividad que separa al 50% de los trabajadores es la mediana

502

=1 Luego la mediana es R0 = 4

4.- Analizar la homogeneidad, es decir hallar CV de cada distribución:

)1(; Personal No cualificado

Coeficiente Personal No SS S; TT S; 2

Page 100: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

100

Productividad ; (1)

Cualificado (En %)

1 10 10 10 2 20 40 80 3 30 90 270 4 30 120 480 5 10 50 250 100 310 1090

1,3100

310

100)1( ( === ∑ UU S;

; 29,1)1,3(100

1090

100)1( 22

22 =−=−= ∑

;S;

6VV

W

1358,129,1)1( 2 === XX 66 36,01,3

1358,1)1( ===

;

6&9

Y Homogeneidad

aceptable ya que es menor de 1. Nos dice que hay una dispersión bastante pequeña.

)2(; Personal cualificado

Coeficiente Productividad

; (2)

Personal No Cualificado

(En %)

ZZ S;

[[ S; 2

1 5 5 5 2 20 40 80 3 20 60 180 4 40 160 640 5 15 75 375 100 340 1280

4,3100

340

100)2( ( === ∑ \\ S;

; 24,1)4,3(100

1280

100)2( 22

22 =−=−= ∑

;S;

6]]

^

1135,124,1)2( 2 === __ 66 32,04,3

1135,1)2( ===

;

6&9

` Homogeneidad

aceptable ya que es menor de 1. Nos dice que hay una dispersión bastante pequeña. Mayor homogeneidad será el que tenga menor coeficiente de variación, es decir el de menor dispersión en este caso el personal cualificado presenta una productividad MÁS homogénea.

Page 101: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

101

Nº 68.- En los últimos 10 años (1.988 - 1.997) el número de personas menores de 18 años ingresadas en Ubarmin han sido: 28 - 30 - 29- 30 - 32 - 34 - 33 - 33 - 34 - 35 1.- ¿Podemos confirmar la aparente tendencia lineal creciente, del número de personas, menores de 18 años, ingresadas en Ubarmin en los últimos años? ¿Con que fiabilidad? 2.- Pronosticar el número de personas, menores de 18 años, que cabe esperar para el año 2.005. Suponiendo que se mantiene la tendencia lineal. 3.- Analizar la representatividad del número medio de ingresos en Ubarmin de personas menores de 18 años, en los últimos 10 años. Solución

Años T

Personas X

T- 1.993 Y

2;

2<

;<

1994 28 1 784 1 28 1995 30 2 900 4 60 1996 29 3 841 9 87 1997 30 4 900 16 12 1998 32 5 1024 25 160 1999 34 6 1156 36 204 2000 33 7 1089 49 231 2001 33 8 1089 64 264 2002 34 9 1156 81 306 2003 35 10 1225 100 350

318 55 10164 385 1810

8,3110

318 === ∑1

;;

a 5,5

10

55 === ∑1

<<

b

16,5)8,31(10

10164 222

2 =−=−= ∑;

1

Q;6

ccd 2ef 66 += = 27,216,5 =+

25,8)5,5(10

385 222

2 =−=−= ∑<

1

<6

gh 2ii 66 += = 87,225,8 =+

1,6)5,5)(8,31(10

1810 =−=−= ∑<;

1

<;6

jkl�m

936,0)87,2)(27,2(

1,6 == noo�n66

6U 8767,0)936,0( 22 ==U 87,67% de fiabilidad. Es

bastante grande nos indica que es buena la relación lineal entre ambas variables. Establecemos esa relación:

18,116,5

1,62

=== pp�q

6

6E Es lo que varia Y al variar X en una unidad

36,31)8,31(18,15,5 −=−=−= ;E<D

Recta: rs ;< 18,136,31* +−=

Page 102: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

102

74,025,8

1,6’

2=== t

u�t6

6E Es lo que varia X al variar Y en una unidad

73,27)5,5(74,08,31’’ =−=−= <E;D

Recta: vw <; 74,073,27* +=

Sustituyendo 1993−=7< x Nos queda: )1993(74,073,27* −+= 7; y

Donde T es el año en el que queremos pronosticar el número de personas que estimamos van a ingresar en Ubarmin, estimación con una bondad de 936,0=U

8767,0)936,0( 22 ==U 87,67% de fiabilidad. 1.- ¿Podemos confirmar la aparente tendencia lineal creciente, del número de personas, menores de 18 años, ingresadas en Ubarmin en los últimos años? ¿Con que fiabilidad? Si porque r es positivo y además bastante cercano a 1 con lo que la fiabilidad es bastante grande 936,0=U lo que significa que 8767,0)936,0( 22 ==U 87,67% de fiabilidad. 2.- Pronosticar el número de personas, menores de 18 años, que cabe esperar para el año 2.005. Suponiendo que se mantiene la tendencia lineal.

T = 2.005 )1993(74,073,27* −+= 7; z )19932005(74,073,27* −+={; = 36,61

Es decir estimamos que en 2.005 habrá 37 ingresos de personas menores de 18 años, en Ubarmin. 3.- Analizar la representatividad del número medio de ingresos en Ubarmin de personas menores de 18 años, en los últimos 10 años.

;

6;&9

|)( = 071,0

8,31

27,2 = Menor de 1 y además muy pequeño, Luego poca dispersión,

es decir es muy homogénea la distribución, los datos son muy parecidos, la media es muy representativa del conjunto.

Page 103: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

103

Nº 69.- En una clase el 30% de alumnos varones y el 10% de mujeres son repetidores. Sabiendo que en una clase de 160 alumnos hay 90 varones. Calcular el porcentaje de alumnos que siendo repetidores sean mujeres. Solución

Suceso A = Ser hombre A = 90 $ = 160 – 90 = 70

Suceso B = Ser repetidor

% Ser repetidor 6DELHQGR�TXH�HV�KRPEUH� = 30% ⇒ 0,3 (90) = 27

Suceso ( )%$ ∩ = 27

% Ser repetidor 6DELHQGR�TXH�HV�PXMHU� = 10% ⇒ 0,1 (70) = 7

Suceso ( )%$ ∩ = 7

Suceso B = ( )%$ ∩ + ( )%$ ∩ = 27 + 7 = 34 % = 160 – 34 = 126

A $ B 27 7 34

% 63 63 126 90 70 160

1.-% de alumnos que siendo repetidores sean mujeres

% (Mujer/repetidor) = %( )

( )SHWLGRUD

SHWLGRUD0XMHU

%$

Re

Re∩=

= 10034

7 = 20,588 %

Es decir el 20,588% de los repetidores son mujeres.

Page 104: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

104

Nº 70.- La tabla de frecuencias siguiente, corresponde a una variable bidimensional

X/Y 1,5-2,5 2,5-3,5 3,5-4,5 4,5-5,5 50-150 14 28 21 7 150-250 4 8 6 2 250-350 6 12 9 3 350-450 4 8 6 2

Sabiendo que: Xi = peso, en kilos, de los niños nacidos en maternidad en una semana

Yj = peso, en gramos, que pierden los recién nacidos en esos primeros días 1.- Analizar y establecer la posible relación lineal entre ambas variables. 2.- Pronosticar el peso de un niño que ha perdido en esos días 400 gramos de peso. Dar una medida de la fiabilidad de dicho pronóstico. 3.- Calcular el peso medio de los niños nacidos en maternidad que han perdido menos de 200 gramos. Compararla con la media de los que si han perdido mas de 200 gramos. Y decir cual es mas representativa y porque. 4.- distribución de X/ 100 < Y< 400 ¿podemos afirmar que es simétrica? 5.- Distribuciones marginales de ambas variables. ¿Cuál es más homogénea? ¿Por qué? Solución Peso en kilos de los niños (X)

Y

1,5 – 2,5 2

2,5 – 3,5 3

3,5 – 4,5 4

4,5 – 5,5 5

}Q ~~ Q< �� Q< 2

100 50-150 14 28 21 7 70 7000 700000 200 150-250 4 8 6 2 20 4000 800000 300 250-350 6 12 9 3 30 9000 2700000 400 350-450 4 8 6 2 20 8000 3200000

�Q 28 56 42 14 140 28000 7400000

�� Q; 56 168 168 70 462

�� Q; 2 112 504 672 350 1638

� ��� Q<; 11200 33600 33600 14000 92400

1.- Analizar y establecer la posible relación lineal entre ambas variables.

Frecuencias observadas (OB)

X Y

1,5 – 2,5

2,5 – 3,5 3,5 – 4,5 4,5 – 5,5

}Q

50-150 14 28 21 7 70 150-250 4 8 6 2 20 250-350 6 12 9 3 30 350-450 4 8 6 2 20

�Q 28 56 42 14 140

Page 105: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

105

Frecuencias teóricas caso de ser Independientes

X Y

1,5 – 2,5

2,5 – 3,5 3,5 – 4,5 4,5 – 5,5

}Q

50-150 14 28 21 7 70 150-250 4 8 6 2 20 250-350 6 12 9 3 30 350-450 4 8 6 2 20

�Q 28 56 42 14 140

Como se mantienen todas las proporciones, Son Independientes. Luego No hay ninguna dependencia

3,3140

462 === ∑1

Q;;

�� 200

140

28000 === ∑1

Q<<

��.

81,0)3,3(140

1638 222

2 =−=−= ∑;

1

Q;6

��� 2�� 66 += = 9,081,0 =+

14,12857)200(140

7400000 222

2 =−=−= ∑<

1

<6

�� �6 = 39,11314,12857 =+

0)200)(3,3(140

92400 =−=−= ∑<;

1

<;6

����� Incorrelación total

2.- Pronosticar el peso de un niño que ha perdido en esos días 400 gramos de peso. Dar una medida de la fiabilidad de dicho pronóstico. No se puede pronosticar ya que son dos variables Independientes e Incorrelacionadas 3.- Calcular el peso medio de los niños nacidos en maternidad que han perdido menos de 200 gramos. Compararla con la media de los que si han perdido mas de 200 gramos. Y decir cual es mas representativa y porque. (1) = Niños nacidos en maternidad que han perdido menos de 200 gramos.

X 1,5 – 2,5 2

2,5 – 3,5 3

3,5 – 4,5 4

4,5 – 5,5 5

�Q 16 32 24 8 80

�� Q; 32 96 96 40 264

�� Q; 2 64 288 384 200 936

3,380

264)1( ( === ∑

1

Q;;

�� 81,0)3,3(

80

936)1( 22

22 =−=−= ∑

;1

Q;6

���

9,081,0)1( 2 === �� 66 2727,03,3

9,0)1( ===

;

6&9

(2) = Niños nacidos en maternidad que han perdido más de 200 gramos.

Page 106: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

106

X 1,5 – 2,5

2 2,5 – 3,5

3 3,5 – 4,5

4 4,5 – 5,5

5

�Q 12 24 18 6 60

�� Q; 24 72 72 30 198

�� Q; 2 48 216 288 150 702

3,360

198)2( ( === ∑

1

Q;;

�� 81,0)3,3(

60

702)2( 22

22 =−=−= ∑

;1

Q;6

���

9,081,0)2( 2 ===    66 2727,03,3

9,0)2( ===

;

6&9

¡

Son igual de homogéneas además tienen la misma media, y son igual de representativas. Es porque las variables son independientes y por tanto se mantienen las proporciones. 4.- distribución de X/ 100 < Y< 400 ¿podemos afirmar que es simétrica?

X 1,5 – 2,5 2

2,5 – 3,5 3

3,5 – 4,5 4

4,5 – 5,5 5

¢Q 19 38 28,5 9,5 95

¢¢ Q; 38 114 114 47,5 313,5

�� Q; 2

76 342 456 237,5 1111,5

£1 19 57 85,5 95

3,395

5,315 === ∑1

Q;;

¤¤

625,2138

1975,235,2)5,35,2(75,2395

4

1

4

1 =−+=

−→== ,QWHUYDORT

25,3138

195,475,2)5,35,2(5,4795

4

2

4

2 =−+=

−→== ,QWHUYDORT

415,28

5725,715,3)5,45,3(25,7195

4

3

4

3 =−+=

−→== ,QWHUYDORT

Distancias entre cuartiles:

4

2T − 4

1T = 3,25 – 2,625 = 0,625 4

3T − 4

2T = 4 – 3,25 = 0,75

Para que la distribución fuera simétrica, deberían de ser iguales ambas distancias. Por tanto No es simétrica.

Page 107: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

107

5.- Distribuciones marginales de ambas variables. ¿Cuál es más homogénea? ¿Por qué?

X ¥Q Y ¦Q

1,5 – 2,5 28 50-150 70 2,5 – 3,5 56 150-250 20 3,5 – 4,5 42 250-350 30 4,5 – 5,5 14 350-450 20

140 140

3,3140

462 === ∑1

Q;;

§§ 200

140

28000 === ∑1

Q<<

¨¨.

©6 = 9,081,0 =+ ª6 = 39,11314,12857 =+

2727,03,3

9,0)( ===

;

6;&9

« 56,0

200

39,113)( ===

<

6<&9

¬

Es más homogénea la distribución de la variable X (peso de los recién nacidos) que la distribución de la variable Y (peso, en gramos, que pierden los recién nacidos en esos primeros días) Ya que presenta un coeficiente de variación menor, es decir tiene menor dispersión por tanto es más homogénea.

Page 108: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

108

Nº 71.- Un hospital adquiere una nueva maquina para rellenar bombonas de oxigeno. Al cabo de un mes, se eligen 100 bombonas al azar y se comprueba su peso: Peso en Kg. (45 - 48) (48 - 50) (50 - 53) (53 - 55) Nº bombonas 10 48 30 12 Se supone que si el 75% de las bombonas pesan menos de 52 Kg., la maquina será aceptada como buena, en caso contrario la maquina será devuelta. ¿Cree usted que el hospital aceptara la maquina? Explique clara y exactamente el porqué de su respuesta. Solución

Habrá que comprobar que el 75% de las bombonas pesan más o menos de 52 kilos. Para ello hallaremos el percentil 75 y comprobaremos si es mayor o menor de 52. O También podemos hallar bajo que percentil se encuentra el valor 52 y comprobar si es mayor o menor que 75. El percentil 75 será:

75100100

75 = El percentil 75 será el valor de la variable que ocupa el lugar

inmediatamente siguiente al 75 y, que esta en el intervalo (50 – 53). Aplicando la formula:

527,51330

58100100

75

14100

751

1100

75 <=−

+=−

+=−

− ­­

­­ &

Q

11

/T

Por tanto No devolverá la maquina ya que 75% de las bombonas pesan menos de 52 kilos De la otra forma: Despejaremos “r” de la formula del percentil

®®

®®¯ &

Q

11U

/T1

1100

100 −

−+=

78583

)30)(5052(*)( 1

100

75

=+−=+−

=−

°°

°°1

&

Q/T

U

El 78% de las bombonas pesan menos de 52 kilos por tanto No devolverá la

maquina.

Page 109: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

109

Nº 72.- Realizada una encuesta entre fumadores se obtuvieron los resultados, de la tabla, sobre las variables: X: Nº de cigarrillos fumados diariamente Y: Horas de sueño diarias

Nº DE CIGARRILLOS Horas 2 - 6 6 - 12 12 - 14 14 - 20 20 - 30 total 4 - 6 0 2 8 26 36 72 6 - 7 4 10 16 20 26 76 7 - 8 18 24 14 12 14 82 8 - 9 28 26 10 4 2 70 total 50 62 48 62 78 300

Solución 1).- Calcular el porcentaje de personas que fuman entre 15 y 22 cigarrillos al día

,QWHUYDORV ±; ²Q ²1

4-6

5 6

526+

10

236 =28,87

28,87

6-7

6,5 6

520+

10

226 =21,86

50,73

7-8

7,5 6

512+

10

214 =12,80

63,53

8-9

8,5 6

54+

10

22 =3,73

67,26

67,26

300

26,67 = 22,42%

2).- Obtener el número mínimo de cigarrillos diarios que fuma uno de los fumadores del 30% que más fuma. Percentil 70

)2014(210300100

70 −⇒= ,QWHUYDOR

VFLJDUULOOR&Q

11

/T ³³

³³ 84,186

62

160300100

70

60100

701

1

100

70 =−

+=−

+=−

3).- Podemos pronosticar que a mayor número de cigarrillos fumados diariamente se

dormirá más horas. Con que fiabilidad

Page 110: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

110

No ya que la covarianza es negativa, y ambas variables varían en sentido contrario a mayor número de cigarrillos, pronosticaremos menos horas de sueño con una fiabilidad del 34,34%

4).- Estimar el consumo de tabaco para una población de 1.500 personas de las que son

fumadoras el 32%

32% de 1.500 = (0,32) (1500) = 480 personas que fuma Como la media de cigarrillos es de 14,62 es decir 15 cigarrillos por persona El consumo de tabaco será 480 personas a un promedio de 15 cigarrillos por

persona serán: ( 480)(15 ) = 7.200 cigarrillos/día

5).- Estimar el número de horas de sueño diarias para una persona que fuma 35 cigarrillos al día.

Como la recta de regresión de Y/X es Y* = 8,3 – 0,1 Xi Para un valor X = 35 años sustituimos en la recta y obtenemos Y* = 8,3 – (0,1 )(35) = 4,8 horas de sueño que pronosticamos para una persona

que tiene 35 años, pero con una fiabilidad, o bondad de –0,58 es decir del 34,34% Que parece un poco pequeña.

6).- Porcentaje de personas fumadoras que duermen entre 6 y 8 horas sabiendo que no fuman más de 15 cigarrillos al día

Menos de 15

cigarrillos Más de 15 cigarrillos

Menos de 6 horas de sueño

14,33 57,67 72

Entre 6 y 8 horas de sueño

91,33 66,67 158

Más de 8 horas de sueño

64,67 5,33 70

170,33 129,67

scigarrillo 15 de másfuman Nohoras 8y 6 entreDuermen % = %62,53100

33,170

33,91 =

Page 111: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

111

Nº 73.- Una empresa decide hacer un reajuste entre sus empleados. La clasificación se lleva a cabo mediante un Test, que arroja las siguientes puntuaciones:

Puntuación

Nº de Empleados Ni

0 – 30 30 – 50 50 – 70 70 – 90

90 - 100

94 140 160

98 8

94 234 394 492 500

La planificación óptima de la empresa exige que el 65% sean Administrativos, el 20% Jefes de Sección, el 10% Jefes de Departamento y el 5% Inspectores, según sea la puntuación obtenida (estas categorías van de menor a mayor puntuación) Calcular la puntuación máxima para ser Administrativo, Jefe de Sección y Jefe de Departamento.

Solución

65% Administrativos 100

65T Valor de la variable que ocupa el lugar, inmediatamente

siguiente a 325)500(100

65 =

El siguiente 20% Jefes de sección 100

85T Valor de la variable que ocupa el lugar,

inmediatamente siguiente a 425)500(100

85 =

El siguiente 10% Jefes Departamento 100

95T Valor de la variable que ocupa el lugar,

inmediatamente siguiente a 475)500(100

95 =

El último 5% Inspectores.

Luego hay que hallar los tres puntos que dividirán la distribución en cuatro partes:

100

65T100

85T 100

95T

Aplicando la formula del percentil: ´´

´´µ &

Q

11U

/T1

1100

100 −

−+=

100

65T Se encuentra en el intervalo (50–70)

.375,61)20(160

234)500(100

65

1100

65 SXQWRV/T ¶ =−

+= −

61,375 puntos: puntuación máxima para ser Administrativo

Page 112: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

112

100

85T Se encuentra en el intervalo (70 – 90)

.326,76)20(98

394)500(100

85

1100

85 SXQWRV/T · =−

+= −

76,326 puntos: puntuación máxima para ser Jefe de sección

100

95T Se encuentra en el intervalo (70 – 90)

.53,86)20(98

394)500(100

95

1100

95 SXQWRV/T ¸ =−

+= −

86,53 puntos: puntuación máxima para ser Jefe de Departamento.

Page 113: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

113

Nº 74.- Se ha efectuado un examen a un grupo de alumnos, en una determinada materia. El examen constaba de dos pruebas A y B. De la información obtenida se han hecho los siguientes cálculos:

¹; = 15,5 º; = 75 »6 = 2,5 ¼6 = 30,6 Los alumnos F y G han obtenido en la A un 16,7 y 14 respectivamente y en la prueba B 77,5 y 82,4 respectivamente. Diga globalmente cuál de los dos alumnos supera en puntuación al otro. Solución

48,05,2

5,157,16)( =−=)= ½ 081,0

6,30

755,77)( =−=)= ¾ 561,0081,048,0)( =+=)=

6,05,2

5,1514)( −=−=*= ¿ 24,0

6,30

754,82)( =−=*= À 36,024,06,0)( −=+−=*=

La posición relativa más alejada de la media es 0,561 Luego en términos relativos esta más cerca de la media - 0,36 En este caso como se supone que es mejor estar por encima de la media tendrá mejor posición el alumno F que tiene posición más alejada de la media pero por encima

Page 114: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

114

Nº 75.- De la encuesta de salarios correspondiente a un periodo que abarca los tres primeros meses de 1.988, obtenemos los siguientes datos en cuanto a ganancias medias mensuales de los trabajadores del sector industrial. Se pide: Estudiar la concentración salarial del sector

Ganancias en pesetas Nº de Trabajadores (En millones) 15.000 - 25.000 ................................................ 16 25.001 - 30.000 ................................................ 34 30.001 - 40.000 .............................................. 211 40.001 - 50.000 .............................................. 332 50.001 - 60.000 .............................................. 310 60.001 - 80.000 .............................................. 582 80.001 - 100.000 .............................................. 194 100.001 - 200.000 .............................................. 134

Solución

ÁÁ // −−1 Â; ÂQ Â1 ÃÃ3

1

1=100*

15.000 – 25.000 20 16 16 0.882 25.001- 30.000 27,5 34 50 2.758 30.001 - 40.000 35 211 261 14.40 40.001 - 50.000 45 332 593 32.70 50.001 - 60.000 55 310 903 49.80 60.001 - 80.000 70 582 1485 81.91 80.001 -100.000 90 194 1679 92.61

100.001 - 200.000 150 134 1813 100 1813

ÄÄ Q;

∑ ÅÅÅÅQ;

Q;

∑ ÆÆ

ÆÆQ;

Q;*100= ÆT

acumulado

Æ3 ÆT ÇÇ T3 −

320 0.275 0.275 0.882 0.275 0.607 935 0.805 1.080 2.758 1.080 1.678 7385 6.35 7.430 14.40 7.430 6.966

14940 12.85 20.28 32.70 20.28 12.42 17050 14.66 34.94 49.80 34.94 14.86 40740 35.03 69.97 81.91 69.97 11.94 17460 15.01 84.98 92.61 84.98 7.63 20100 7.39 100 100 100 0 116290

( )

∑−

=

=

−=

1

1

1

1 È

Ç Ç

È

Ç ÇÇÇ

3

T3

* = 0056,275

101,56 = 0,2004

No existe demasiada concentración, El coeficiente está comprendido entre 0 y 1, a mayor índice mayor concentración.

Page 115: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

115

Nº 76.- Se conocen las ventas de un cierto número de empresas. Y se desea obtener las ventas medias de este número de empresas.

Ventas (millones) 4 5 6 7 Empresas 10 3 3 10

Solución

Ç; ÇQ ÉÉ Q;

4 10 40 5 3 15 6 3 18 7 10 70

26 143

Ventas Medias 5,526

143 === ∑1

Q;;

ÊÊ millones .

Page 116: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

116

Nº 77.- De una encuesta realizada entre 100 familias han agrupado la masa de salarios según la siguiente distribución:

Salario 1.000 2.000 3.000 4.000 Familias 20 30 30 20

1.- Obtener el salario medio 2.- Obtener el salario medio con cambio de origen 2.000 3.- Obtener el salario medio con cambio de unidad 1.000 4.- Obtener el salario medio con cambio de origen y unidad simultáneamente Solución 1.- Obtener el salario medio

É; ÉQ ÉÉ Q;

1000 20 20000 2000 30 60000 3000 30 90000 4000 20 80000

100 250.000

Salario medio

500.2100

000.250 === ∑1

Q;;

ËË

. 2.- Obtener el salario medio con cambio de origen 2.000 2000−= ÌÌ ;8

2000−= ÍÍ ;8

ÍQ ÍÍ Q8

-1000 20 -20000 0 30 0 1000 30 30000 2000 20 40000

100 50.000

Salario medio

500100

50000 === ∑1

Q88

ÎÎ

500.2000.2 =+= 8;

3.- Obtener el salario medio con cambio de unidad 1.000 000.1ÏÏ ;

8 =

000.1ÐÐ ;

8 = ÍQ ÍÍ Q8

1 20 20 2 30 60 3 30 90 4 20 80

100 250

Salario medio

500100

50000 === ∑1

Q88

ÎÎ

500.2000.2 =+= 8;

Page 117: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

117

4.- Obtener el salario medio con cambio de origen y unidad simultáneamente:

1000

2000−=

ÑÑ ;8

1000

2000−=

ÒÒ ;8 ÍQ ÍÍ Q8

-1 20 -2 0 30 0 1 30 3 2 20 4

100 5

Salario medio

05,0100

5 === ∑1

Q88

ÓÓ

500.2000.21000* =+= 8;

Page 118: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

118

Nº 78.- Dados los siguientes valores: Xi: 1, 2, 3, 4, 3, 2, 1, 1, 5, 1, 2, 4, 2, 1, 1, 2, 3, 4, 5, 5. Obtener la tabla estadística. Y el diagrama de barras de la distribución. Solución

Xi ni Ni Xi ni 1 6 6 6 2 5 11 10 3 3 14 9 4 3 17 12 5 3 20 15

20 52

valores de la variable

5,04,03,02,01,0

valores de la variable

Fre

cuen

cia

7

6

5

4

3

2

1

0

Desv. típ. = 1,47

Media = 2,6

N = 20,00

Page 119: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

119

1����.- Dados los siguientes valores: 2,38; 2,06; 2,15; 2,47; 2,21; 2,36; 2,32; 2,32; 2,24; 2,15; 2,10; 2,13; 2,49; 2,41; 2,29; 2,36; 2,22; 2,46; 2,19; 2,06. 1.- Obtener la tabla estadística de valores agrupados, comprendidos entre 2,00 y 2,50; con una amplitud de 0,10 para cada intervalo 2.- Obtener el histograma de frecuencias Solución

INTERVALOS ni Xi 2 – 2,10 2,10 – 2,20 2,20 – 2,30 2,30 – 2,40 2,40 – 2,50

2 5 4 5 4

20

2,05 2,15 2,25 2,35 2,45

valores de la variable

2,452,352,252,152,05

valores de la variable

Fre

cuen

cia

6

5

4

3

2

1

0

Desv. típ. = ,13

Media = 2,27

N = 20,00

Page 120: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

120

Nº 80.- Dada la siguiente distribución, calcular las frecuencias absolutas acumuladas, sabiendo que el número de observaciones ha sido 50 Xi 7,90 8,10 8,30 8,50 fi 0,10 0,20 0,40 0,30 �

6ROXFLyQ��

�Ô; �

�ÕI ��

)50(ÖÖ IQ = � ∑=

× ×× Q11

7,90 0,10 5 5 8,10 0,20 10 15 8,30 0,40 20 35 8,50 0,30 15 50

�� ��� �

Page 121: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

121

Nº 81.- Dada la distribución�

Xi 5.000 6.000 7.000 8.000 9.000

ni 60 50 70 80 50

Obtener la media, la Mediana y la moda. �

6ROXFLyQ��

Ö; � ØQ � Ø1 � ÙÙ Q; �

5.000 60 60 300.000 6.000 50 110 300.000 7.000 70 180 490.000 8.000 80 260 640.000 9.000 50 310 450.000 � ���� � ����������

Media = ; = N

Xini∑ = 20

422.3 = 171,1 cm.

Moda � Mo = Valor de la variable que más veces se repite, en este caso el valor 168 es la moda, que se repite cuatro veces. Mediana � Me = Valor de la variable que divide a la distribución en dos partes iguales. Valor de la variable que ocupa el lugar central. Valor de la variable que deja por debajo de ella el 50% de los valores. Como N/2 es 10, será la media aritmética de los valores que ocupan los lugares 10 y 11, es decir los valores 168 y 170 por tanto la mediana es el valor 169 cm.

Page 122: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

122

Nº 82-. Realizada una encuesta entre 100 pacientes de un hospital sobre dos características x e y se obtuvieron los siguientes resultados:

ÚÚ Q;∑ = 1.650 ÛÛ Q<∑ = 840 ÜÜ Q;∑ 2 = 587.500

ÝÝ Q<∑ 2 =149.000 Þ ßßÞ Q<;∑ = 295.000

1º.- Grado de homogeneidad de cada variable 2º.- Hallar r y explicar su Significado 3º.- % de la variación de Y explicada por la variación de X 4º.- Variación de X al variar Y en una unidad 5º.- Estimar el valor de X para Y =9 6º.- Fiabilidad de la estimación anterior 7º.- Significado del valor del coeficiente de regresión lineal de la recta de Y*/X 8º.- Hallar y explicar el Significado de (1 - r2) 9º.- Es cierto que la variable X es más dispersa que la variable Y, ya que tiene una mayor varianza 10.- Significado de la Covarianza entre X e Y 11º.- % de la variación de X explicada por la variación de Y 12º.- Dibujar las dos rectas de regresión y comentar el gráfico. Solución

50,16100

650.1 === ∑1

Q;;

àà 4,8

100

840 === ∑1

Q<<

áá.

75,5602)5,16(100

587.500 222

2 =−=−= ∑;

1

Q;6

ââã 2äå 66 += = 85,7475,5602 =+

44,1419)4,8(100

000.149 222

2 =−=−= ∑<

1

<6

æç è6 = 67,3744,1419 =+

4,2811)4,8)(5,16(100

000.295 =−=−= ∑<;

1

<;6

éêë�ì Correlación positiva

( )( ) 9971,067,3785,74

44,2811 === íîî í

66

6U ( ) 9942,09971,0 22 ==U 99,42% de fiabilidad

( ) ( ) 0058,09942,011 2 =−=− U 0,58% No explicado

536,45,16

85,74)( ===

;

6;&9

ï 484,4

4,8

67,37)( ===

<

6<&9

ð

5,075,5602

4,28112

=== ññ�ò

6

6E Es lo que varia Y al variar X en una unidad

15,0)5,16(5,04,8 =−=−= ;E<D Recta ;

< : óô ;< 5,015,0* +=

98,144,1419

4,2811’

2=== õ

ö�õ6

6E Es lo que varia X al variar Y en una unidad

13,0)4,8(98,15,16’’ −=−=−= <E;D Recta <

; : ÷ø <; 98,113,0* +−=

Page 123: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

123

1º.- Grado de homogeneidad de cada variable

536,45,16

85,74)( ===

;

6;&9

ù 484,4

4,8

67,37)( ===

<

6<&9

ú

Ambas tienen mucha dispersión ya que los coeficientes son mayores de 1 luego hay muy poca homogeneidad. 2º.- Hallar r y explicar su Significado

( )( ) 9971,067,3785,74

44,2811 === ûüü û

66

6U

Coeficiente de correlación lineal es bastante cercano a 1 luego hay mucha correlación, prácticamente perfecta, y positiva, es decir ambas variables varían en el mismo sentido. La recta será creciente. 3º.- % de la variación de Y explicada por la variación de X ( ) 9942,09971,0 22 ==U 4º.- Variación de X al variar Y en una unidad

98,144,1419

4,2811’

2=== ý

þ ý

6

6E Coeficiente de regresión de

<;

5º.- Estimar el valor de X para Y =9

ÿ� <; 98,113,0* +−= ( ) 69,17998,113,0* =+−=�;

6º.- Fiabilidad de la estimación anterior

( ) 9942,09971,0 22 ==U 99,42% de fiabilidad 7º.- Significado del valor del coeficiente de regresión lineal de la recta de Y*/X

5,075,5602

4,28112

===����

6

6E Es lo que varia Y al variar X en una unidad

8º.- Hallar y explicar el Significado de (1 - r2) ( ) ( ) 0058,09942,011 2 =−=− U 0,58% De la variación de una variable que No viene explicado por las variaciones de la otra variable. 9º.- Es cierto que la variable X es más dispersa que la variable Y, ya que tiene una mayor varianza No, la varianza mide dispersión absoluta, para comparar dispersiones es necesario medidas de dispersión relativas, en este caso utilizamos el coeficiente de variación, es algo mayor el de la variable X por lo que será un poco más dispersa, pero ambas son demasiado dispersas. 10.- Significado de la Covarianza entre X e Y

4,2811)4,8)(5,16(100

000.295 =−=−= ∑<;

1

<;6

����� Correlación positiva Ambas

variables varían en el mismo sentido. 11º.- % de la variación de X explicada por la variación de Y ( ) 9942,09971,0 22 ==U 99,42% 12º.- Dibujar las dos rectas de regresión y comentar el gráfico. Prácticamente será la misma recta ya que hay correlación casi perfecta, es decir, todos los puntos están en la recta, las dos rectas coinciden.

Page 124: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

124

Nº 83.- En un determinado país la renta "per capita" fue en 1.997 de 3.200 $. Se ha estimado que en los próximos 8 años se duplicará la renta "per capita". Determínese: 1.- Si la tasa de crecimiento de 1.998 fue un 3% anual. ¿Cuál será la renta "Per capita" en ese periodo? 2.- La tasa media anual acumulativa para poder alcanzar el objetivo de duplicar esa renta. Solución Es de Indices, no entra

Page 125: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

125

Nº 84.- En un museo se sabe que el precio medio de las entradas es de 76 Pts. Los adultos deben pagar sus correspondientes entradas a 100 Pts. Y los niños a 20 Pts. ¿Que porcentaje de adultos y niños visitan el museo? Solución

Page 126: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

126

Nº 85.- En un barrio de una ciudad, el 20% de las viviendas tienen una superficie entre 50 y 60 m2, el 25% entre 60 y 70 m2, el 20% entre 70 y 80 m2, el 25% entre 80 y 100 m2 y, el 10% entre 100 y 120 m2. Determínese: 1.- La superficie media por vivienda 2.- El tipo de vivienda más frecuente. Solución �

Page 127: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

127

Nº 86.- A partir de una distribución bidimensional de las variables X e Y, hemos calculado la regresión de Y sobre X, con el siguiente resultado: Y* = 5 + 3X 1.-Estimar los parámetros de la recta de regresión de X sobre Y, teniendo en cuenta, además, que en la regresión anterior el coeficiente de correlación obtenido ha sido 1. 2.- ¿Qué pensaría si le dijeran que en dicha regresión de Y sobre X el coeficiente de correlación obtenido ha sido –1 en lugar de +1? Solución

Page 128: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

128

Nº 87.- Entre las variables X e Y se han estimado las rectas de regresión: Y* = 1,7 - 0,8X X* = 0,1- 0,8Y Si construimos dos nuevas variables: Z = 3X + 1 W = 3Y- 3 Hallar los coeficientes de correlación entre las variables X e Y, y entre las variables Z y W. Comentar brevemente y razonadamente los resultados obtenidos. Solución

Page 129: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

129

Nº 88.- Diga si es cierto o falso el siguiente apartado:

1- "Al hacer el cambio de variable z = 2x + 3

4 , el coeficiente de variación permanece

invariable (CVx = CVz)". Demuestre razonadamente su respuesta. Solución

Page 130: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

130

Nº 89.- En la distribución bidimensional (xi yj), sabiendo que:

∑∑ 1

1 � ���Q<; = −15

¿Pueden ser las rectas de regresión entre las variables X e Y las siguientes: 2X − Y = 1 X – 3Y = −2 Diga razonadamente El Porqué. Solución

Page 131: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

131

Nº 90 .- Se desea analizar la relación entre la madurez de la persona (medida por un test, entre 0 y 4)) y la edad (de 3 a 27 años, de un grupo de jóvenes discapacitados psíquicos, después de tres años de funcionamiento de un centro de salud mental, con un programa específico. En la tabla siguiente se recogen los datos de las dos variables: <

Grado de madurez alcanzado. �; Edad actual de los jóvenes

� Edad actual

�Grado �Madurez

(3 - 9)

(9-13)

(13-17)

(17-23)

(23-27)

0 1 2 3 4

5 2 1 0 0�

3 5

10 2 0�

3 6

15 5 1�

2 8

17 4 3�

0 1 5 1 1�

�� Q;∑ = 1.598 �� Q<∑ = 174 �� Q;∑ 2 = 28.058

�� Q<∑ 2 =402 � ��� Q<;∑ = 2.960

�1- Distribución de la "madurez" de los jóvenes entre 13 y 23 años 2- Covarianza entre las variables X e Y Significado 3.- Coeficiente de variación de la variable Y Significado 4.- Percentil 57 de la variable X Significado 5.- Valor de la variable Y que deja por encima suyo el 72% de los valores 6�� Coeficiente de 'HWHUPLQDFLyQ� entre ambas variables y su significado Solución �

Page 132: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

132

1�������Si entre las variables X e Y se establece la recta de regresión Y* = - 3 + 2X, con una fiabilidad del 96%. Podemos afirmar que (señale todas las afirmaciones ciertas marcando V, y todas las falsas marcando F): 1) coeficiente de correlación > 0 V F 9)coeficiente de determinación

es igual 0,96 V F

2)si aumenta X en una unidad Y disminuye un 2%

V F 10) coeficiente de correlación es igual 0,96

V F

3) coeficiente de regresión = 2 V F 11)coeficiente de regresión es positivo

V F

4) Las variables X e Y son Independientes

V F 12) la recta es decreciente V F

5) si aumenta X en una unidad Y disminuye en 2 unidades

V F 13) la varianza es negativa V F

6) si aumenta Y en una unidad X disminuye en 0,96

V F 14)la recta es creciente V F

7) Las variables X e Y están correlacionadas

V F 15) la covarianza es negativa V F

8)la desviación típica es negativa V F 16) hay una correlación = 0,98 V F �

Page 133: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

133

1������Señale todas las expresiones que son ciertas, marcando V, y las que son falsas marcando F

El coeficiente de correlación no puede ser 2,3

V F El percentil 50 es un Promedio

V F

La Mediana es el valor central de la distribución

V F La Varianza puede ser cero

V F

La desviación típica es siempre no negativa

V F Coeficiente de correlación puede ser 0

V F

La mediana es igual al segundo cuartil

V F 19)La La Moda es el valor de mayor densidad

V F

Coeficiente de determinación es siempre no negativo

V F La Covarianza puede ser negativa

V F

la covarianza puede ser negativa

V F La Moda es un promedio V F

la varianza nunca puede ser negativa

V F La desviación típica no puede ser < 0

V F

El percentil 50 es igual a la mediana

V F La Covarianza puede ser negativa

V F

La covarianza puede ser positiva V F La Media aritmética puede ser negativa

V F

La probabilidad de un suceso X puede ser 0,5

V F La Varianza siempre es positiva

V F

el coeficiente de correlación puede ser negativo

V F La Probabilidad de X puede ser 0,2

V F

la covarianza puede ser cero V F La media aritmética puede ser cero

V F

El coeficiente de variación puede ser -1,4

V F La desviación típica no puede ser <0

V F

El coeficiente de regresión puede ser - 1.4

V F Coeficiente de variación puede ser 0.98

V F

El Coeficiente de correlación puede ser 0,98

V F la moda puede ser cero 0 V F

1�� ����� Que significa que entre dos variables haya un coeficiente r = -0,999 (señale todos los significados ciertos marcando la V, y todos los falsos marcando la F): �

Están poco correlacionadas

V F la covarianza es > 0 V F

ambas variables son dependientes

V F Están muy correlacionadas V F

el coeficiente de regresión es 0,999

V F ambas variables son independientes

V F

cuando Y disminuye X aumenta

V F rectas de regresión son perpendiculares

V F

varían en sentido contrario V F Están incorrelacionadas V F la covarianza es < 0 V F la covarianza es muy grande V F

Page 134: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

134

1������ Que significa que entre dos variables haya un coeficiente r = 0 (señale todos los significados ciertos marcando la V, y todos los falsos marcando la F):

ambas variables están correlacionadas

V F ambas variables son dependientes

V F

la recta de X sobre Y es decreciente

V F ambas variables están incorrelacionadas

V F

las varianzas son negativas

V F las medias son muy representativas

V F

la covarianza es muy grande

V F el coeficiente de variación es cero

V F

el coeficiente de determinación es cero

V F el coeficiente de regresión es uno

V F

las varianzas son iguales

V F ambas varían conjuntamente

V F

un disparate V F la recta de Y sobre X Es creciente.

V F

Page 135: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

135

1������ A partir de una distribución bidimensional de las variables X e Y, hemos calculado la regresión de Y sobre X, con el siguiente resultado:

< � ������;�

���Estimar los parámetros de la recta de regresión de X sobre Y:��; � �D���E<� teniendo en cuenta, además, que en la regresión anterior el coeficiente de correlación obtenido ha sido -1. ���� ¢Qué pensaría si le dijeran que en dicha regresión de Y sobre X el coeficiente de correlación obtenido ha sido –1 en lugar de +1? Solución �

Page 136: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

136

1����- Sea una distribución (Xi ni) con las siguientes características:

; = 7 Mo = 5 S2 = 3,4 N = 50 Determínese estas medidas para: La distribución (Xi +2, ni) y La distribución (20Xi, ni)

Solución �

Page 137: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

137

1������ Cincuenta y cinco alumnos reciben puntuaciones de una asignatura (Z): En Teoría (X) y en problemas (Y) del 1 al 10 reflejándose en la siguiente tabla: �

� 352%/(0$6 7(25,$� 0 - 2 2 - 4 4 - 5 5 - 7 7 - 10 0 - 2 5 4 4 2 0 2 - 4 4 4 2 4 1 4 - 5 1 4 5 3 1 5 - 7 0 3 2 2 0 7 - 10 0 0 2 1 1 1.- ¿Podemos afirmar que ambas variables son estadísticamente dependientes? 2.- Distribuciones X/ Y ≤ 2 X/ 1≤ Y ≤ 4

2.1.- ¿Cual es más homogénea? ¿Porque? 3.- Porcentaje de alumnos que habiendo obtenido más de 3,5 puntos en teoría también hayan obtenido más de 3,5 en problemas. 4.- Analizar y establecer la posible relación lineal entre ambas variables. 5.- Supongamos que la nota global de dicha asignatura (Z) se obtiene de la siguiente forma:

Comparar la Homogeneidad de la distribución de la nota global en los dos casos siguientes: 5.1.- las variables X e Y están totalmente correlacionadas 5.2.- Las variables X e Y son totalmente independientes Solución �

3

32 <; +

Page 138: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

138

1������ Se ha estudiado las cotas máximas de rendimiento de un grupo de enfermeras de un hospital en los turnos de mañana y de tarde. Se han hecho las siguientes anotaciones X = tiempo máximo de concentración y rendimiento por la mañana y Z = tiempo máximo de concentración y rendimiento por la tarde (al mismo grupo de personas). Así se obtuvo los siguientes datos (en horas) ; = 3,5 = = 2 Sx = 1,2 Sz = 0,8 Siendo el coeficiente de Correlación Lineal entre ellas 0,9. Se pide: 1.- ¿Qué tiempo se puede esperar para la tarde, en una persona que haya tenido 4 horas de rendimiento máximo por la mañana? Si es posible, dar una medida de la estimación realizada. 2.- Una persona cuyos tiempos máximos de rendimiento y concentración por la mañana y por la tarde han sido respectivamente: 3 y 2,5. ¿Dónde ha obtenido mayor tiempo de rendimiento relativo? �

Solución �

Page 139: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

139

1����.-En dos compañías de seguros médicos, el pago de indemnizaciones durante el año 1998 tuvo la siguiente distribución: 1~PHUR�SDJRV��

�FRPSDxtD�$���

�FLHQWRV��

&XDQWtD� GH� ODV�

,QGHPQL]DFLRQHV�

�0LOORQHV���

1~PHUR�SDJRV��

�FRPSDxtD�%���

�FLHQWRV��

10 0 - 20 11 12 20 - 40 12 30 40 - 50 41 40 50 - 100 20 10 100 - 150 8

���- ¿Qué porcentaje del montante total de las indemnizaciones que ha pagado la compañía B corresponde al 20% de los pagos más bajos? ���Calcular la cuantía máxima de la indemnización, que ha pagado la compañía B, recibida por el 20% de las personas con menores indemnizaciones. ���Calcular la cuantía mínima de la indemnización, que ha pagado la compañía B, recibida por el 20% de las personas con mayores indemnizaciones. �

6ROXFLyQ��

���- ¿Qué porcentaje del montante total de las indemnizaciones que ha pagado la compañía B corresponde al 20% de los pagos más bajos?

�;

�Q

�1

�� Q;

��

�� Q;∑

=1

)100(1

∑∑

==��

���

�Q;

Q;

3

)100(1

1T

�� =

10 11 11 110 110 11,96 2,28 30 12 23 360 470 25,00 9,76 45 41 64 1.845 2.315 69,56 48,08 75 20 84 1.500 3.815 91,30 79,23 125 8 92 1.000 4.815 100,00 100,00 � ��� � ������ � � �

92==∑ 1Q � � � 815.4=∑ �� Q; �

�3 �(V�HO�DFXPXODGR�GH� �Q �H[SUHVDGR�HQ�SRUFHQWDMHV��

�T �HV�HO�DFXPXODGR�GH� �� Q; �H[SUHVDGR�HQ�SRUFHQWDMHV��

+DFHPRV�XQD�LQWHUSRODFLyQ�HQ�ODV�FROXPQDV� �3 �\� �T �GH�OD�VLJXLHQWH�IRUPD��

����� o� ���� � � � ����±�������� o� ������±�������

��� o� [� � � ����±�������� o� �[�±�������

��� o� �����

Page 140: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

140

� � � �

892,6612,428,204,13

1392,6028,2

)96,1125(

)28,276,9)(96,1120(28,2 =+=+=

−−−+=[ �

3RU� WDQWR� HO� ������� GHO�PRQWDQWH� WRWDO� GH� ODV� LQGHPQL]DFLRQHV� TXH� KD�

SDJDGR�OD�FRPSDxtD�%�FRUUHVSRQGH�DO�����GH�ORV�SDJRV�PiV�EDMRV��

���� Calcular la cuantía máxima de la indemnización, que ha pagado la compañía B, recibida por el 20% de las personas con menores indemnizaciones. �

�; �Q �1

0 – 20 11 11 20 – 40 12 23 40 – 50 41 64 50 – 100 20 84 100 - 150 8 92

��� �

Habrá que hallar el percentil 20.

4,1892100

20 = El percentil 20 será el valor de la variable que ocupa el lugar

inmediatamente siguiente a 18,4 y que está en el intervalo (20 – 40). Aplicando la formula del percentil será: �

��

�� &

Q

11U

/T1

1100

100 −

−+= 33,32)20(

12

1192100

20

20100

20 =−

+=T

32,33 millones, es la cuantía máxima de la indemnización, que ha pagado la compañía B, recibida por el 20% de las personas con menores indemnizaciones.

����� Calcular la cuantía mínima de la indemnización, que ha pagado la compañía B,

recibida por el 20% de las personas con mayores indemnizaciones.

Habrá que hallar el percentil 80.

6,73)92(100

80 = El percentil 80 será el valor de la variable que ocupa el lugar

inmediatamente siguiente a 73,6 y está en el intervalo (50 – 100). Aplicando la formula del percentil será:

Page 141: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

141

��

�� &

Q

11U

/T1

1100

100 −

−+= 74)50(

20

6492100

80

50100

80 =−

+=T

74 millones, es la cuantía mínima de la indemnización, que ha pagado la compañía B, recibida por el 20% de las personas con mayores indemnizaciones.

Page 142: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

142

1�� ���� Se tienen las puntuaciones de 8 sujetos en una prueba de inteligencia X, y el número de problemas resueltos en un examen de Psicoestadística Y.

X: 95 105 87 98 115 100 99 125 Y: 8 5 3 6 8 7 8 9

1. - Calcular: La proporción de la variación de la variable Y que no puede ser explicada por la variación de la variable X. 2. - Contestar razonadamente si, en este caso, la inteligencia es un buen predictor del número de problemas resueltos en el examen de Psicoestadística. 3. - Calcular Mediana y Cuartiles de X. ¿Podemos afirmar que es Simétrica? ¿Por qué? Solución ; < 2; 2< ;< 87 3 7569 9 261 95 8 9025 64 760 98 6 9604 36 588 99 8 9801 64 792 100 7 10000 49 700 105 5 11025 25 525 115 8 13225 64 920 125 9 15625 81 1125 ���� ��� ������ ���� �����

1038

824 === ∑1

;;

! 75,6

8

54 === ∑1

<<

"

25,125)103(8

185874 222

2 =−=−= ∑;

1

Q;6

##$ 2%& 66 += = 19,1125,125 =+

4375,3)75,6(8

392 222

2 =−=−= ∑<

1

<6

'( 2)) 66 += = 85,14375,3 =+

625,13)75,6)(103(8

5671 =−=−= ∑<;

1

<;6

*+,�-

66,0)85,1)(19,11(

625,13 ==./

/�.

66

6U 43,0)66,0( 22 ==U 43% de fiabilidad. Es bastante

pequeña nos indica que no es buena la relación lineal entre ambas variables. Establecemos esa relación:

1,025,125

625,132

===00�1

6

6E Es lo que varia Y al variar X en una unidad

45,4)103(1,075,6 −=−=−= ;E<D

Recta: 23 ;< 1,045,4* +−=

Page 143: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

143

96,34375,3

625,13’

2===

45�4

6

6E Es lo que varia X al variar Y en una unidad

24,76)75,6(96,3103’’ =−=−= <E;D

Recta: 67 <; 96,324,76* +=

�1. - Calcular: La proporción de la variación de la variable Y que no puede ser explicada por la variación de la variable X. 100*)1( 2U− = (1-0,43) = 0,57 ⇒ 57% de las variaciones de una variable no vienen explicadas por las variaciones de la otra a través de la recta de regresión 2. - Contestar razonadamente si, en este caso, la inteligencia es un buen predictor del número de problemas resueltos en el examen de Psicoestadística. No lo es, ya que solo el 43% de las variaciones de la X, explican las variaciones de la Y 3. - Calcular Mediana y Cuartiles de X. ¿Podemos afirmar que es Simétrica? ¿Por qué?

4

1T ⇒ 284

1 = ⇒ 4

1T = 2

9895 + = 96,5

80 = 4

2T ⇒ 484

2 = ⇒ 4

2T = 2

10099 + = 99,5

4

3T ⇒ 684

3 = ⇒ 4

3T = 2

115105 + = 110

'LVWDQFLDV�HQWUH�FXDUWLOHV��

80 - 4

1T = 99,5 – 96,5 = 3

4

3T - 90 = 110 – 99,5 = 10,5

�No son simétricas las distancias entre cuartiles no son iguales

Page 144: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

144

1������� En un estudio sobre alcohólicos se informa que el 40% de los mismos tienen un padre alcohólico y el 6% madre alcohólica. El 42% tienen al menos uno de los padres alcohólicos. Se pide: obtener razonadamente los porcentajes de personas alcohólicas que: 1. - Tenga ambos padres alcohólicos. 2. - Tenga madre alcohólica si lo es el padre. 3. - Tenga madre alcohólica y no padre alcohólico. 4. - Tenga madre alcohólica si el padre no lo es. Solución P = padre alcohólico %(P) =40% M = madre alcohólica %(M) = 6% %(P ∪ M) = 42 %

( )03 ∩% = ( )03 ∪% = 100 - ( )03 ∪% 100 – 42 = 58%

Padre alcohólico SI NO SI 4 2 6

Madre alcohólica NO 36 58 94 40 60 100

1.- %(P ∩ M ) ⇒ %(P ∪ M) =%(P) +%(M)- %(P ∩ M ) ⇒

%(P ∩ M ) = %(P) + %(M) – %(P ∪ M) = 40 + 6 - 42 = 4

2.- )%(3

0 = 10040

4= 10%

3.- %( %246)%()%()( =−=∩−=∩ 03003

4.- %331006

2100

)%(

)%()%( ==∩=

3

30

30

Page 145: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

145

1������� Cincuenta y cinco alumnos reciben puntuaciones de una asignatura (Z): En Teoría (X) y en problemas (Y) del 1 al 5 reflejándose en la siguiente tabla:

� ;�<� �� �� �� �� ��

� 5 4 4 2 0 � 4 4 2 4 1 � 1 4 5 3 1 � 0 3 2 2 0 � 0 0 2 1 1

1.- ¿Podemos afirmar que ambas variables son estadísticamente Independientes? 2.- Distribuciones X/ Y>2 X/ 1< Y < 4 2.1.- ¿Cual es más homogénea? ¿Porque? 2.2.- Analizar la forma de ambas distribuciones 3.- % de alumnos que habiendo obtenido más de 2,8 en teoría hayan obtenido más de 3 en problemas 4.- Analizar y establecer la posible relación lineal entre ambas variables. 5.- ¿Con que fiabilidad podemos pronosticar las notas de problemas conocidas las de teoría? 6.- Supongamos que la nota global de dicha asignatura (Z) se obtiene de la forma: Zi = 3X + 5Y Comparar la Homogeneidad de la distribución de la nota global en los dos casos siguientes: 6.1.- las variables X e Y están totalmente correlacionadas 6.2.- Las variables X e Y son totalmente independientes Solución

Page 146: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

146

1������� Encuestamos a 150 familias sobre el número de extracciones dentarias realizadas a lo largo de 1.992 resultando que: En 15 familias, 1 extracción, en 43, 2 extracciones, en 76 familias, 3 extracciones, en 11, 4 extracciones, y en 5 familias, 6 extracciones. 1.- Realizar la tabla estadística completa 2.- Hallar la media y la varianza y el Coeficiente de variación. Solución

:; � ;Q � << Q; � == Q; 2 �

1 15 15 15 2 43 86 172 3 76 228 684 4 11 44 176 6 5 30 180 ���� ���� �����

La media será: 686,2150

403 === ∑1

Q;;

>>extracciones

La varianza será: 965,0686,2150

1227 222

2 =−=−= ∑;

1

Q;6

??@ extracciones2

Que mide Dispersión en términos Absolutos, viene expresada en unidades de la variable al cuadrado

La desviación típica será: 2AB 66 += = 9825,0965,0 =+=C6 extracciones

Que mide Dispersión en términos absolutos, viene expresada en las mismas unidades

que la variable Para comprobar si este promedio es representativo calcularemos el Coeficiente de

Variación

Que es una medida de Dispersión relativa. Indica que a mayor valor implica mayor Dispersión y por tanto menor Homogeneidad y menor representatividad de la media.

La distribución será homogénea cuando el coeficiente de variación sea menor de 1

;

6&9

B 3658,0

686,2

9825,0 ==

Es bastante representativa la media, ya que el coeficiente de variación se acerca

bastante a 0

Page 147: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

147

1�����.-Se desea analizar la relación entre la madurez de la persona (medida por un test porcentual) y la edad de un grupo de 120 jóvenes discapacitados psíquicos, después de tres años de funcionamiento de un centro de salud mental, con un programa específico. En la tabla siguiente se recogen los datos de las dos variables: Xi : = edad actual de los jóvenes Yj : = grado de madurez alcanzado.

Y X

(2-6)

(6-8)

(8-14)

(14-18)

(18-24)

(24-30)

15 20 25

5 8 15

6 12 6

6 0 6

4 9 3

0 4 12

6 12 6

1.- Analizar y establecer la posible relación lineal entre ambas variables. 2.- Porcentaje de jóvenes mayores de edad, con un grado de madurez superior a 20 3.- Analizar la distribución del grado de madurez entre los jóvenes menores de 20 y mayores de 20. ¿En cuál hay mayor homogeneidad? 4.- ¿Podemos afirmar que la variable Y es una distribución normal de media 13,766 y desviación típica 8,65? Dar al menos dos razones 5.-Si medimos la discapacidad como Zi = 4Yi - 2Xi + 8. Comparar el grado de dispersión de la distribución de la Discapacidad en los siguientes casos: 5.1.- las variables X e Y son totalmente independientes 5.2.- las variables X e Y están totalmente correlacionadas 6.- Distribuciones condicionadas:

6.1- Y/X<23 6.2.- Y/X>21

6.3.- Analizar la simetría de ambas distribuciones (no utilizar ningún coeficiente) 7.- ¿Que grado de madurez podemos pronosticar para un joven discapacitado de 28 años? ¿Con que fiabilidad? Solución

Page 148: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

148

Nº 105.- Realizada una encuesta entre fumadores se obtuvieron los resultados, de la tabla, sobre las variables: X: Nº de cigarrillos fumados diariamente Y: Horas de sueño diarias

X Y

2 - 6 6 - 12 12 - 14 14 - 20 20 - 30 total

4 - 6 0 2 8 26 36 72 6 - 7 4 10 16 20 26 76 7 - 8 18 24 14 12 14 82 8 - 9 28 26 10 4 2 70 total 50 62 48 62 78 300

Solución 1).- Calcular el porcentaje de personas que fuman entre 15 y 22 cigarrillos al día

,QWHUYDORV D; EQ E1

4-6

5 6

526+

10

236 =28,87

28,87

6-7

6,5 6

520+

10

226 =21,86

50,73

7-8

7,5 6

512+

10

214 =12,80

63,53

8-9

8,5 6

54+

10

22 =3,73

67,26

67,26

300

26,67 = 22,42%

2).- Obtener el número mínimo de cigarrillos diarios que fuma uno de los fumadores del 30% que más fuma.

Percentil 70

)2014(210300100

70 −⇒= ,QWHUYDOR

VFLJDUULOOR&Q

11

/T FF

FF 84,186

62

160300100

70

60100

701

1

100

70 =−

+=−

+=−

3).- Podemos pronosticar que a mayor número de cigarrillos fumados diariamente se dormirá más horas. Con que fiabilidad

Page 149: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

149

No ya que la covarianza es negativa, y ambas variables varían en sentido contrario a mayor número de cigarrillos, pronosticaremos menos horas de sueño con una fiabilidad del 34,34%

4).- Estimar el consumo de tabaco para una población de 1.500 personas de las que son fumadoras el 32%

32% de 1.500 = 0,32*1500=480 personas que fuman Como la media de cigarrillos es de 14,62 es decir 15 cigarrillos por persona El consumo de tabaco será 480 personas a un promedio de 15 cigarrillos por persona serán: 480 (15) = 7.200 cigarrillos/día

5).- Estimar el número de horas de sueño diarias para una persona que fuma 35 cigarrillos al día.

Como la recta de regresión de Y/X es Y* = 8,3 – 0,1 Xi Para un valor X = 35 años sustituimos en la recta y obtenemos Y* = 8,3 – 0,1 *35 = 4,8 horas de sueño que pronosticamos para una persona que tiene 35 años, pero con una fiabilidad, o bondad de –0,58 es decir del 34,34% Que parece un poco pequeña.

6).- Porcentaje de personas fumadoras que duermen entre 6 y 8 horas sabiendo que no fuman más de 15 cigarrillos al día

Menos de 15

cigarrillos Más de 15 cigarrillos

Menos de 6 horas de sueño

14,33 57,67 72

Entre 6 y 8 horas de sueño

91,33 66,67 158

Más de 8 horas de sueño

64,67 5,33 70

170,33 129,67

Page 150: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

150

1�����.- Tomamos el número de pulsaciones por minuto de 15 pacientes que acuden a una consulta y obtenemos los siguientes datos: 68 - 100 - 94 - 86 - 72 - 70 - 84 - 85 - 69 - 73 - 65 - 78 - 83 - 86 - 75. Hallar las Medidas de tendencia central y de dispersión. Solución �

E; � EQ � GG Q; � HH Q; 2 � G1 �

65 1 65 4225 1 68 1 68 4624 2 69 1 69 4761 3 70 1 70 4900 4 72 1 72 5184 5 73 1 73 5329 6 75 1 75 5625 7 78 1 78 6084 8 83 1 83 6889 9 84 1 84 7056 10 85 1 85 7225 11 86 2 172 14792 13 94 1 94 8836 14 100 1 100 10000 15 � ��� ����� ������ �

La media será: 2,7915

1188 === ∑1

Q;;

II pulsaciones por

minuto

La mediana 5,7)15(2

=1 Será el valor de la variable que ocupa el lugar

inmediatamente siguiente a 7,5 es decir, el valor 78 pulsaciones por minuto. La Moda es el valor de la variable que más veces se repite, es decir el de mayor frecuencia absoluta, en nuestro caso el valor 86 pulsaciones por minuto. La varianza será:

026,962,7915

95530 222

2 =−=−= ∑;

1

Q;6

JJK pulsaciones2

Que mide Dispersión en términos Absolutos, viene expresada en unidades de la variable al cuadrado

La desviación típica será: 2LM 66 += = 799,9026,96 =+=N6 pulsaciones

Para comprobar si este promedio es representativo calcularemos el Coeficiente de

Variación

Page 151: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

151

;

6&9

M 12373,0

2,79

799,9 ==

La distribución será homogénea cuando el coeficiente de variación sea menor de 1. Y tanto más homogénea cuanto menor sea el coeficiente de variación.

En este caso la media es bastante representativa, ya que el coeficiente de variación se acerca bastante a 0.

Page 152: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

152

1�� ���.- A lo largo de los doce meses del año, en un servicio de cirugía se realizan las siguientes apendicectomías 8 - 12 - 7 - 1 - 20 - 6 - 8 - 16 - 9 - 3 - 4 - 5 Hallar: Medidas de tendencia central, cuartiles, Medidas de dispersión Solución

Tiempo O; P; (ordenada)

QQ Q1

Enero 8 1 1 1 Febrero 12 3 1 2 Marzo 7 4 1 3 Abril 1 5 1 4 Mayo 20 6 1 5 Junio 6 7 1 6 Julio 8 8 2 8 Agosto 16 9 1 9 Septiembre 9 12 1 10 Octubre 3 16 1 11 Noviembre 4 20 1 12 Diciembre 5 99 99

99=∑ R; � � 11452 =∑ S; �� 12=1 �

25,812

99 === ∑1

;;

T� 354,2725.8

12

1145 222

2 =−=−= ∑;

1

;6

UV �

25,5354,27 ==W6 �� 634,025,8

25,5 ===;

6&9

X�

Y0 � 62

12

2==1

La mediana será el valor de la variable, media aritmética de los que ocupan el lugar

6 y el lugar 7, es decir, la mediana será: 5,72

87 =+�

Z0 �Es el valor de la variable que más veces se repite, es decir, el valor 8

Page 153: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

153

1������� En un grupo de personas se analizan las características A y B obteniéndose:

Característica A SI NO característica % SI 57 32 89 NO 82 91 173 139 123 262

1.- porcentaje de personas que presentan una sola de las dos características 2.- porcentaje de personas que no tienen ninguna característica 3.- porcentaje de personas que teniendo la característica A no tienen la característica B 4.- porcentaje de personas que tienen ambas características 5.- porcentaje de personas que teniendo la característica B tienen también la característica A 6.- porcentaje de personas que presentan alguna característica Solución

1.- %51,43100262

3282 =+ 5.- %04,64100

89

57 =

2.- %73,34100262

91 = 6.- 26,65100262

823257 =++

3.- %99,58100139

82 =

4.- %75,21100262

57 =

Page 154: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

154

1������� Se han medido la altura de 110 jóvenes obteniéndose la siguiente tabla: $OWXUD� 1��-yYHQHV

1,55-1,60 18 1,60-1,70 31 1,70-1,80 24 1,80-1,90 20 1,90-2,00 17 1.- Se consideran "altos" aquellos cuya altura está sobre el percentil 82. ¿Cuál es su altura mínima? 2.- ¿En qué percentil estará un joven de altura 1,78? Solución

$OWXUD� 1��

-yYHQHV�

[1 �

1,55-1,60 18 18 1,60-1,70 31 49 1,70-1,80 24 73 1,80-1,90 20 93 1,90-2,00 17 110

���� 1.- Se considera altos aquellos cuya altura está sobre el percentil 82, es decir (100-82)=18,

el 18% de los más altos, son aquellos que se consideran altos, y su altura mínima será el percentil 82. Habrá que hallar el percentil 82, ya qué

2,90)110(100

82 = El percentil 82, será aquel valor de la variable que ocupe el lugar

inmediatamente siguiente a 90,2 y está en el intervalo (1,80 – 1,90). Aplicando la formula del percentil:

\\

\\] &

Q

11U

/T1

1100

100 −

−+= 886,1)10,0(

20

73110100

82

80,1100

82 =−

+=T

Se consideran altos aquellos que miden más de 1,886 metros

2.- La altura 1,78 está en el intervalo (1,70 – 1,80). Tenemos que hallar el % de valores que hay debajo del valor 1,78 luego despejaremos “r” de la formula del percentil:

\\

\\] &

Q

11U

/T1

1100

100 −

−+=

Page 155: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

155

62110

10049

10,0

)24)(70,178,1(100*

)(

1

1

100 =

+−=

+

−= −

11

&

Q/T

U ^^

^^_

Por tanto 78,1

100

62 =T metros

El 62% de los reclutas miden menos de 1,78 metros luego (100 – 62) = 38, el 38% restante medirán más de 1,78 metros.

Page 156: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

156

1�����.-Se desea analizar la relación entre la madurez de la persona (medida por un test porcentual) y la edad de un grupo de 120 jóvenes discapacitados psíquicos, después de tres años de funcionamiento de un centro de salud mental, con un programa específico. En la tabla siguiente se recogen los datos de las dos variables: xi := edad actual de los jóvenes y j := grado de madurez alcanzado.

Y X

(2-6)

(6-8)

(8-14)

(14-18)

(18-24)

(24-30)

15 20 25

5 8 15

6 12 6

6 0 6

4 9 3

0 4 12

6 12 6

1.- Distribución marginal de la variable X. 2.- Segundo cuartil de la distribución de la variable Y 3.- Covarianza entre ambas variables 4.- Coeficiente de variación de la variable Y 5.- Percentil 27 de la variable X 6.- Valor de la variable Y que deja por encima suyo el 34% de los valores 7.- Coeficiente de correlación entre ambas variables y su significado �

Solución �

Page 157: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

157

1�����.- Estudiamos en 60 pacientes el contenido en Hb en grs. % y tenemos la siguiente distribución:

Hb % 9-10 10-11 11-12 12-13 13-14 14-15 15-16 Nº de pacientes 2 8 12 17 14 4 3

Construir la tabla necesaria para dibujar un histograma, y la determinación de la media, la mediana, la moda, cuartiles, varianza, desviación típica, coeficiente de variación. Significado de todos y cada uno de los resultados obtenidos. 6ROXFLyQ��

)( 1 `` // −− Hb. gr.

Marca de clase a;

bQ b1 cc Q; dd Q; 2

9-10 9.5 2 2 19 180,50 10-11 10.5 8 10 84 882 11-12 11.5 12 22 138 1587 12-13 12.5 17 39 212,5 2656,25 13-14 13.5 14 53 189 2551,50 14-15 14.5 4 57 58 841 15-16 15.5 3 60 46,5 720,75

��� ���� �����

; = 1

Q; ee¦ = 60

747� �12,45 Hb.gr.

Moda � Mo = Valor de la variable que más veces se repite, estará en el intervalo que presente mayor densidad de frecuencia, frecuencia por unidad de intervalo, este caso al ser todos los intervalos de igual amplitud, estará en el de mayor frecuencia, es decir, en el intervalo (12-13), que se repite 17 veces, y dentro de el cualquier valor , aplicando la formula será:

f

ff

ff

ff

fg F

F

Q

F

Q

F

Q

/0

1

1

1

1

1

1

1

+

+

+

+

++= � � ..53,121

1214

1412 JU+E=

++ �

Mediana � Me = Valor de la variable que divide a la distribución en dos partes iguales. Valor de la variable que ocupa el lugar central. Valor de la variable que deja por debajo de ella el 50% de los valores. Como N/2 es 30, será el valor de la variable que ocupa el lugar inmediatamente siguiente al 30, y que está en el intervalo (12 13). Aplicando la formula de la mediana:

..47,12117

22602

1

122

11

1 JU+E&Q

11

/0 hh

hhi =

−+=

−+=

Page 158: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

158

15604

1 = El 1º cuartil será el valor de la variable que ocupe el lugar

inmediatamente siguiente al 15, y está en el intervalo (11-12)

..416,11112

10604

1

114

11

1

4

1 JU+E&Q

11

/T jj

jj =

−+=

−+=

30604

2 = El 2º cuartil será el valor de la variable que ocupe el lugar

inmediatamente siguiente al 30, y está en el intervalo (12-13)

..47,12117

22604

2

124

21

1

4

2 JU+E&Q

11

/T kk

kk =

−+=

−+=

45604

3 = El 3º cuartil será el valor de la variable que ocupe el lugar

inmediatamente siguiente al 45, y está en el intervalo (13-14)

..428,13114

39604

3

134

31

14

3 JU+E&Q

11

/T ll

ll =

−+=

−+=

De este modo: El 25% de los pacientes tienen un contenido de Hb. menor de 11,416gr. El 50% de los pacientes tienen un contenido de Hb. menor de 12,53 gr. El 75% de los ingresados tienen un contenido de Hb. menor de 13,428 gr. 0HGLGDV�GH�GLVSHUVLyQ��

Varianza: 2

22 ;

1

Q;6

mmn � ¦ = 245,12

60

9419 − = 1,98 Hb.gr.2�

Desviación típica: 4,198,12 === oo 66 Hb.gr.

Coeficiente de variación: � 1124,045,12

4,1 ===;

6&9

p�

�Existe una pequeña dispersión aceptable ya que el CV es menor de 1. Es decir bastante homogénea porque se acerca mucho a 0. Por lo que la media será un promedio representativo del conjunto.

Page 159: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

159

1�����.- La tabla de frecuencias siguiente, corresponde a una variable bidimensional ;L����<M ������� �������� �������� �������� ��������

50-80 15 5 0 0 0 80-110 20 30 10 0 0 110-150 4 26 34 16 0 150-220 0 6 13 7 4 220-300 0 0 3 3 2 300-500 0 0 0 0 2 Sabiendo que: Xi =salario mensual de 200 empleados de un hospital (miles de pesetas)

Yj = valor de los automóviles de los 200 empleados del hospital (millones pesetas) Hallar: 1.- Distribuciones marginales de ambas variables. ¿Cuál es más homogénea? y por qué 2.- ¿Por encima de que salario se sitúa el 70% de los empleados mejor pagados? 3.- De entre los empleados que poseen coche valorado entre 1,3 y 1,9 millones ¿qué porcentaje representan aquellos que cobran un sueldo inferior a 130.000? 4.- ¿Qué porcentaje de la masa salarial total corresponde al 60% de los empleados que más cobran? ¿Y al 30% que menos cobran? 5.- Podemos asegurar que empleados que cobran mayores salarios poseen automóviles más caros 6.- Estimar, utilizando una función lineal, el valor del automóvil de un nuevo empleado que cobra 600.000 Fiabilidad de la estimación Solución �

Page 160: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

160

1������� El consumo y la renta mensual de 100 familias expresadas en 104 pesetas, son los siguientes: C = Consumo Y = Renta. C/Y 15 25 35 45 30 10 15 -- -- 40 5 20 25 -- 50 -- 15 5 5 1.- Calcúlese la recta de regresión del consumo sobre la renta. 2.- Consumo esperado para una renta de 60.104 Pts. y la representatividad de esta regresión. Solución

Page 161: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

161

1�����.- En un hospital, los análisis efectuados para la determinación de urea en orina a un grupo de 60 pacientes visitados, han dado los siguientes resultados ordenados: �

1 paciente con 9,3 grs/l 1 paciente con 9,5 grs/l 2 paciente con 9,8 grs/l 1 paciente con 10 grs/l 1 paciente con 10,1 grs/l 2 paciente con 10,2 grs/l 2 paciente con10,3 grs/l 2 paciente con 10,4 grs/l 3 paciente con 10,5 grs/l 4 paciente con 10,6 grs/l 1 paciente con 10,7 grs/l 6 paciente con 10,8 grs/l 2 paciente con 10,9 grs/l 3 paciente con 11 grs/l 2 paciente con 11,1 grs/l 4 paciente con 11,2 grs/l 3 paciente con 11,3 grs/l 2 paciente con 11,4 grs/l 4 paciente con 11,5 grs/l 3 paciente con 11,6 grs/l 2 paciente con 11,7 grs/l 2 paciente con 11,8 grs/l 2 paciente con 12 grs/l 2 paciente con 12,2 grs/l 1 paciente con 12,3 grs/l 1 paciente con 12,5 grs/l 1 paciente con 12,7 grs/l 1 paciente con 13,2 grs/l 1.- Formar la tabla estadística y a partir de ella dibujar el histograma de frecuencias 2.- Calcular: las Medidas de tendencia central y los cuartiles. �

6ROXFLyQ��

)( 1 qq // −−

Marca de clase r;

sQ s1 tt Q; uu Q; 2

9-9,5 9,25 1 1 9,25 85,56 9,5-10 9,75 3 4 29,25 285,18 10-10,5 10,25 8 12 82 840,50 10,5-11 10,75 16 28 172 1849 11-11,5 11,25 13 41 146,25 1645,31 11,5-12 11,75 11 52 129,25 1518,68 12-12,5 12,25 5 57 61,25 750,31 12,5-13 12,75 2 59 25,50 325,12 13-13,5 13,25 1 60 13,25 175,56

��� ���� ��������

Media � ; Es el promedio más utilizado ; = 1

Q; vv¦ = 60

668� �11,13gr.

Moda � Mo = Valor de la variable que más veces se repite, estará en el intervalo que presente mayor densidad de frecuencia, frecuencia por unidad de intervalo, este caso al ser todos los intervalos de igual amplitud, estará en el de mayor frecuencia, es decir, en el intervalo (10,5-11), que se repite 16 veces, y dentro de el cualquier valor , aplicando la formula será:

w

ww

ww

ww

wx F

F

Q

F

Q

F

Q

/0

1

1

1

1

1

1

1

+

+

+

+

++= � � .81,10)5,0(

813

135,10 JU=

++ �

Mediana � Me = Valor de la variable que divide a la distribución en dos partes iguales. Valor de la variable que ocupa el lugar central. Valor de la variable que deja por debajo suya el 50% de los valores. Como N/2 es 30, será el valor de la

Page 162: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

162

variable que ocupa el lugar inmediatamente siguiente al 30, y que está en el intervalo (11-11,5) aplicando la formula será:

.077,11)5,0(13

28604

2

114

21

1 JU&Q

11

/0 yy

yyz =

−+=

−+=

15604

1 = El 1º cuartil será el valor de la variable que ocupe el lugar

inmediatamente siguiente al 15, y está en el intervalo (10,5-11)

.6,10)5,0(16

12604

1

5,104

11

1

4

1 JU&Q

11

/T {{

{{ =

−+=

−+=

30604

2 = El 2º cuartil será el valor de la variable que ocupe el lugar

inmediatamente siguiente al 30, y está en el intervalo (11-11,5) el 2º cuartil es la Mediana.

.077,115,0*13

28604

2

114

21

1

4

2 JU&Q

11

/T ||

|| =

−+=

−+=

45604

3 = El 3º cuartil será el valor de la variable que ocupe el lugar

inmediatamente siguiente al 45, y está en el intervalo (11,5-12)

.68,11)5,0(11

41604

3

5,114

31

14

3 JU&Q

11

/T }}

}} =

−+=

−+=

De este modo: el 25% de los pacientes tienen un contenido de Urea. menor de10,6

gr..

Page 163: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

163

El 50% de los pacientes tienen un contenido de Urea. < de 11,077 gr. El 75% de los ingresados tienen un contenido de Urea. < de 11,68 gr. 0HGLGDV�GH�GLVSHUVLyQ��

Varianza: 2

22 ;

1

Q;6

~~� � ¦ = .5875,013,11

60

25,7475 22 JU=− �

Desviación típica: .766,05875,02 JU66 �� ===

Coeficiente de variación: � 0688,013,11

766,0 ===;

6&9

��

�Existe muy poca dispersión ya que el CV es muy pequeño, es menor de 1, y se acerca mucho a 0. Por lo que la media será un promedio muy representativo del conjunto. La distribución será muy homogénea.

Diagrama de dispersión

altura hijo = f (altura padre)

altura del padre

172170168166164162160158

altu

ra d

el h

ijo

176

174

172

170

168

166

164

162

160

158

Page 164: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

164

1�����.- Medimos las alturas de un grupo de 11 padres y sus respectivos hijos y obtenemos los siguientes resultados: altura del padre 160 165 170 168 163 164 162 166 164 166 162 altura del hijo 165 160 175 170 165 175 163 170 170 166 168 Realizar el diagrama de dispersión Solución

E;D< +=* �;< 8165,056,33* += (esta hecho con el programa SPSS.11)

altura del hijo

altura del padre

172170168166164162160158

176

174

172

170

168

166

164

162

160

158

Observada

Lineal

Page 165: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

165

1�� ���.- Treinta y cinco alumnos reciben puntuaciones en Bioquímica (X) y en Bioestadística (Y) del 1 al 5 reflejándose en la siguiente tabla:

� ;�<� �� �� �� �� ��

� 0 1 2 2 0 � 1 2 1 1 2 � 0 3 4 3 1 � 0 1 0 3 0 � 1 1 2 4 0

1.- Hallar Las medias de las variables X e Y 2.- Hallar Las varianzas de las variables X e Y 3.- Hallar La covarianza entre X e Y Solución

Page 166: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

166

1�����.- Determinamos el pulso y la temperatura de 9 pacientes del Hospital de Navarra:

PULSO 68 70 71 71 73 73 74 75 76 TEMPERATURA 36.5 37 37.2 36.8 37.3 37.5 38 37.4 38

1.- Establecer El diagrama de dispersión. 2.- Hallar la covarianza entre ambas variables y, su significado. Solución �

Page 167: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

167

1�� ���- Se conocen las ventas de agua oxigenada a hospitales y clínicas de un cierto número de empresas que son:

Ventas (millones de pts.) 4 5 6 7 Empresas 10 3 3 10

Obtener las ventas medias de este número de empresas. Solución

Page 168: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

168

1�����.-�Dados los siguientes valores: 28 - 26 - 32 - 19 - 34 - 45 - 38 - 25 - 24 - 21; 26 - 23 - 22 - 24 - 21 - 21 - 23 - 29 - 21 - 29 - 26 - 22 - 24 - 29 - 26 - 32 - 23 - 14 - 16 - 32 - 19 - 34 - 45 - 38 - 43 - 15 -27 -36 - 38 - 38 - 26 - 23 - 22 - 24 - 26 - 32 - 23 - 14 - 16 - 32 - 45 - 38 - 43 - 15 - 27 – 36.

Se pide: 1.- La tabla estadística de valores agrupados en intervalos con una amplitud de 2, para cada intervalo 2.- Dibujar El histograma de frecuencias 3.- Medidas de tendencia central 4.- Medidas de Dispersión 6ROXFLyQ��

'$726�6,1�$*583$5�5(8(/72�&21�(/�352*5$0$�6366����

� 9$/25(6�

Frecuencia Porcentaje Porcentaje

válido Porcentaje acumulado

Válidos 14 2 3,6 3,6 3,6 15 2 3,6 3,6 7,1 16 2 3,6 3,6 10,7 19 2 3,6 3,6 14,3 21 4 7,1 7,1 21,4 22 3 5,4 5,4 26,8 23 5 8,9 8,9 35,7 24 4 7,1 7,1 42,9 25 1 1,8 1,8 44,6 26 6 10,7 10,7 55,4 27 2 3,6 3,6 58,9 28 1 1,8 1,8 60,7 29 3 5,4 5,4 66,1 32 5 8,9 8,9 75,0 34 2 3,6 3,6 78,6 36 2 3,6 3,6 82,1 38 5 8,9 8,9 91,1 43 2 3,6 3,6 94,6 45 3 5,4 5,4 100,0 Total 56 100,0 100,0

� (VWDGtVWLFRV�

VALORES N Válidos 56 Perdidos 0 Media 27,68 Mediana 26,00 Moda 26

Page 169: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

169

� (VWDGtVWLFRV�

VALORES N Válidos 56 Perdidos 0 Desv. típ. 8,315 Varianza Coeficiente variación

69,131 0,3009

$*583$'26�(1�,17(59$/26�'(�$03/,78'���

LQWHUYDORV� �Q � �1 � �; � �� Q; � �� Q; 2 �

������� �� �� ��� ��� ����

������� �� �� ��� ��� �����

������� �� �� ��� �� ��

������� �� �� ��� ��� ����

������� �� ��� ��� ���� �����

������� �� ��� ��� ���� �����

������� �� ��� ��� ���� �����

������� �� ��� ��� ���� �����

������� �� ��� ��� ��� �����

������� �� ��� ��� ���� �����

������� �� ��� ��� ��� �����

������� �� ��� ��� ��� �����

������� �� ��� ��� ���� �����

������� �� ��� ��� �� ��

������� �� ��� ��� �� ��

������� �� ��� ��� ���� �����

� ��� � � ����� ������

Media � ; Es el promedio más utilizado ; = 1

Q; ��¦ = 96,2756

1566 = �

Moda � Mo = Valor de la variable que más veces se repite, estará en el intervalo que presente mayor densidad de frecuencia, frecuencia por unidad de intervalo, este caso al ser todos los intervalos de igual amplitud, estará en el de mayor frecuencia, es decir, en el intervalo (23 25), que se repite 9 veces, y dentro de el cualquier valor , aplicando la formula será:

��

��

��

�� F

F

Q

F

Q

F

Q

/0

1

1

1

1

1

1

1

+

+

+

+

++= � � 24)2(

77

723 =

++

Page 170: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

170

Mediana � Me = Valor de la variable que divide a la distribución en dos partes iguales. Valor de la variable que ocupa el lugar central. Valor de la variable que deja por debajo de ella el 50% de los valores. Como N/2 es 28, será el valor de la variable que ocupa el lugar inmediatamente siguiente al 28, y esta en el intervalo (25 27) aplicando la formula será:

14,26)2(7

24562

1

252

11

1 =−

+=−

+=−

− ��

��� &

Q

11

/0

14564

1 =

El 1º cuartil será el valor de la variable que ocupe el lugar inmediatamente siguiente al 14, y está en el intervalo (21 23)

71,22)2(7

8564

1

214

11

1

4

1 =−

+=−

+=−

− ��

�� &

Q

11

/T

El 2º cuartil es la mediana 14,26

2

1

4

2 === �0TT

42564

3 = El 3º cuartil será el valor de la variable que ocupe el lugar

inmediatamente siguiente al 42, y está en medio de los intervalos (31- 33) y (33 35), así que uniremos ambos y formaremos un único intervalo de (31 - 35) en el que se encontrará el 3º percentil, y aplicando la formula tendremos:

.857,33)4(25

37564

3

314

31

14

3 =+

−+=

−+=

− ��

�� &

Q

11

/T

0HGLGDV�GH�GLVSHUVLyQ��

Varianza: 2

22 ;

1

Q;6

��� � ¦ = 6496,27

56

47380 2 =− �

Desviación típica: 8642 === �� 66

Coeficiente de variación: � 286,096,27

8 ===;

6&9

��

�Como vemos no hay demasiadas diferencias entre los resultados obtenidos con los valores sin agrupar y con los valores agrupados en intervalos, en el segundo caso perdemos información y ganamos rapidez.

Page 171: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

171

�1��������Dada la siguiente distribución: Xi ............ 1.................3 .............. 4 .................6.............10 ni ............. 5...............12 ............ 20 .................8...............5

1.- Obtener Media aritmética, mediana y moda 2.- Hallar la Desviación típica y el Coeficiente de variación 6ROXFLyQ��

�; � �Q � �� Q; � �� Q; 2 � �1 �

1 5 5 5 5 3 12 36 108 17 4 20 80 320 37 6 8 48 288 45 10 5 50 500 50 ��� ���� �����

; = 1

Q; ��¦ = 50

219� �4,38

Moda � Mo = Valor de la variable que más veces se repite, en este caso el valor 4 Mo = 4 Mediana � Me = Valor de la variable que divide a la distribución en dos

partes iguales. Valor de la variable que ocupa el lugar central. Valor de la variable que deja por debajo de ella el 50% de los valores. Como N/2 es 25, será el valor de la variable que ocupa el lugar inmediatamente siguiente al 25, y que es el 4

Me = 4

0HGLGDV�GH�GLVSHUVLyQ��

9DULDQ]D��2

22 ;

1

Q;6

��� � ¦ = 238,4

50

1221 − = 5,2356 medida de dispersión

absoluta, viene expresada en unidades al cuadrado�

Desviación típica: 888,22356,152 === �� 66 medida de dispersión

absoluta, viene expresada en las mismas unidades que la variable. �

&RHILFLHQWH�GH�YDULDFLyQ: � 522,038,4

288,2 ===;

6&9

�medida de dispersión relativa.

Se considera aceptable si esta entre 0 y 1. Mide el grado de homogeneidad de la distribución. Y también el grado de representatividad de la media.

Page 172: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

172

1������� Determinamos el pulso y la temperatura de 10 pacientes del Hospital de Navarra:� PULSO 74 70 68 77 75 66 69 75 76 69 TEMPERATURA 35.5 37 37 35.8 36.3 37.8 38.7 37.7 38.4 39 1.- Dibujar El diagrama de dispersión. 2.- Hallar la covarianza entre ambas variables y, su significado. 3.- Analizar la dependencia y la correlación entre ambas variables

Page 173: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

173

1�����.- La distribución por edades de los trabajadores de un hospital es la siguiente: Edades..........(18 - 26)..... (26 - 36) ...(36 - 50) .... (50 - 60) .... (60 - 70) Nº Empleados.... 7...............13 ............ 20 ...............15...............5 1.- Hallar La media aritmética de las edades. 2.- Analizar la asimetría. Solución

Page 174: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

174

1�����.- Dada la siguiente distribución:

Xi ............ 1.................3 .............. 4 .................6.............10

ni ............. 5...............12 ............ 20 .................8...............5

1.- Hallar Media aritmética, mediana y moda 2.- Obtener Desviación típica, coeficiente de apertura y coeficiente de variación 3.- Analizar la simetría de la distribución. 4.- Significados de los resultados obtenidos. Solución

�; 1 3 4 6 10 TOTALES

�Q 5 12 20 8 5 50

�1 5 17 37 45 50

�� Q; 5 36 80 48 50 219

�� Q; 2 5 108 320 288 500 1221

; = 1

Q;   ¦ = 50

219� �4,38

Moda �Mo � Valor De la variable que más veces se repite, es decir el que presenta mayor frecuencia absoluta Mo = 4 Me = Valor central de la distribución, valor de la variable que deja por debajo el 50% de

los valores 252

50

2==1

valor de la variable que ocupa el lugar 25

Me = 4

22

2 ;1

Q;6

¡¡¢ � ¦ = 2)38,4(

50

1221 − = 5,2356 Medidas de dispersión absolutas

228,22356,52 === ££ 66

( );

6;&9

¤= =

38,4

228,2 = 0,522 Dispersión relativa

Como es menor de 1 podemos admitir que es homogénea y al ser bastante cercano a cero diremos que es bastante homogénea, por lo que la media de la distribución será bastante representativa del conjunto.

Page 175: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

175

1��������Dada la siguiente distribución:

Xi 6 13 14 16 21

ni 15 14 20 18 15

1.- Hallar la Media aritmética, mediana y moda 2.- Obtener la Desviación típica y coeficiente de variación�3.- Calcular el primer y el tercer cuartil Solución

¥; 6 13 14 16 21 Totales

¦Q 15 14 20 18 15 82

¦1 15 29 49 67 82

§§ Q; 90 182 280 288 315 1155

¨¨ Q; 2 540 2366 3920 4608 6615 18049

; = 1

Q; ©©¦ = 82

1155� �14,085

22

2 ;1

Q;6

ªª« � ¦ = 2)085,14(

82

18049 − = 21,71 Medidas de dispersión absolutas

66,471,212 === ¬¬ 66

( );

6;&9

­= =

085,14

66,4 = 0,33 Dispersión relativa

Como es menor de 1 podemos admitir que es homogénea y al ser bastante cercano a cero diremos que es bastante homogénea, por lo que la media de la distribución será bastante representativa del conjunto.

Moda �Mo � Valor De la variable que más veces se repite, es decir el que presenta mayor frecuencia absoluta Mo = 14 Me = Valor central de la distribución, valor de la variable que deja por debajo el 50% de

los valores 412

82

2==1

valor de la variable que ocupa el lugar 41 Me = 14

4

1T � Valor de la variable que deja por debajo el 25% de los valores 5,204

82

4==1

valor

de la variable que ocupa el lugar 21 4

1T = 13

4

3T � Valor de la variable que deja por debajo el 75% de los valores 5,61824

3

4

3 ==1

valor de la variable que ocupa el lugar 62 4

3T = 16

Page 176: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

176

1��������Dada la distribución Xi 450 367 965 146 349

ni 23 69 47 78 95

1.- Calcular La media, la mediana y la moda. 2.- Hallar El percentil 67 3.- Explicar el Significado de los resultados obtenidos. Solución

®; 146 349 367 450 965 Totales

¯Q 78 95 69 23 47 312

¯1 78 173 242 265 312

°° Q; 11.388 33.155 25.323 10.350 45.355 125.571

±± Q; 2 1.662.648 11.571.095 9.293.541 4.657.500 43.767.575 70.952.359

; = 1

Q; ²²¦ = 312

571.125� �402,47

22

2 ;1

Q;6

³³´ � ¦ = 2)47,402(

312

359.952.70 − = 65.429,3 Medidas de dispersión

absolutas

79,2553,429.652 === µµ 66

( );

6;&9

¶= =

47,402

79,255 = 0,635 Dispersión relativa

Como es menor de 1 podemos admitir que es homogénea y al ser bastante cercano a cero diremos que es bastante homogénea, por lo que la media de la distribución será bastante representativa del conjunto. Moda �Mo � Valor De la variable que más veces se repite, es decir el que presenta mayor frecuencia absoluta Mo = 349 Me = Valor central de la distribución, valor de la variable que deja por debajo el 50% de

los valores 1562

312

2==1

valor de la variable que ocupa el lugar 156 Me = 349

4

1T � Valor de la variable que deja por debajo el 25% de los valores 784

312

4==1

valor

de la variable que ocupa el lugar intermedio entre el 78 y el 79 4

1T =2

349146 += 247,5

4

3T � Valor de la variable que deja por debajo el 75% de los valores 2343124

3

4

3 ==1 valor de

la variable que ocupa el lugar 234 4

3T = 367�

100

67T � Valor de la variable que deja por debajo el 67% de los valores 04,209312100

67

100

67 ==1

valor de la variable que ocupa el lugar 210 100

67T = 367�

Page 177: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

177

1������� Dada la distribución Bidimensional

Xi 210 120 360 149 225

Yj 70 65 58 52 69

1.- Ajústese una recta por el procedimiento de los Mínimos Cuadrados. 2.- Calcúlese el coeficiente de correlación lineal y explíquese su significado. 3.- Pronosticar el valor de X para Y = 73, dando una medida de la bondad del pronostico. Solución

Page 178: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

178

1�������La distribución de salarios en una clínica es la siguiente:

·· // −−1 10.000-16.000 16.000-22.000 22.000-28.000 28.000-34.000 34.000-40.000

·Q 135 215 320 225 105

1.- Determínese el salario medio. 2.- ¿Cuál es el salario que percibe un mayor número de personas? 3.- ¿Puede emplearse el salario medio como representativo del conjunto de salarios? 4.- El horario no es único para todos los trabajadores. Sabiendo que el número medio de horas trabajadas por empleado es de 8 horas y su desviación típica es de 4,5 horas. ¿Es lógica la distribución de salarios en relación a la de horas trabajadas? Solución

Page 179: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

179

1������� Un análisis de la relación entre el consumo de tabaco y el número de personas con cáncer de pulmón se resume en la siguiente recta de regresión estimada:

< � ���������;���en donde�����U� ������

Siendo ; el nº de años durante los cuales una persona ha fumado, e < el porcentaje de cancerígenos habidos en cada grupo de personas según sus años de fumador. 1.- Explíquese el significado de los resultados -2 y 1,2 en la recta de regresión. 2.- ¿Cuál es la expectativa respecto a la tasa de cancerígenos para personas que han fumado 30 años? 3.- Si U hubiese sido = 1 ¿Podríamos decir que el tabaco fue la única causa del cáncer de pulmón? Solución �

Page 180: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

180

1������� Supongamos que el Coeficiente de variación de una distribución es 0,2 y su media es 30. Hállese la desviación típica de la distribución. Solución �

Page 181: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

181

1��������Dada la distribución Bidimensional

Xi 10 20 30 40 50

Yj 50 45 38 32 29

1.- Ajústese una recta por el procedimiento de los Mínimos Cuadrados. 2.- Calcúlese el coeficiente de correlación lineal y explíquese su significado. Solución

Page 182: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

182

1�����.-La distribución de las acciones de una determinada sociedad, entre sus accionistas, según la edad de estos, viene expresada por intervalos en la tabla siguiente:

Edad X Nº Acciones Y

menos de 18

(18-26)

(26-36)

(36-46)

(46-64)

0-20 20-28 28-32 32-48

2 8 9 1

3 4

10 2

1 3 16 1

2 10 10 2

2 7 5 2

10 32 50 8

20 19 21 24 16 100 Se pide: OBTENER RAZONADAMENTE, EXPLICANDO BREVEMENTE EL SIGNIFICADO DE TODOS Y CADA UNO DE LOS RESULTADOS OBTENIDOS: 1.- Capital aproximado de la sociedad, supuesto un valor nominal para cada título de 1.200. Ptas... 2.- Promedio de acciones por accionista. 3.- En el supuesto que en la Junta General de accionistas los votos se establecen en proporción al número de acciones poseídas, ¿qué mínimo de acciones debe tener un accionista para que su poder decisorio sea mayor al de la mitad de los socios? 4.- Analizar y establecer la posible relación entre la edad y el número de acciones de los accionistas. 5.- Probabilidad de que una persona tomada al azar tenga menos de 26 años sabiendo que posee más de 28 acciones 6.- Estimar el número de acciones que podemos esperar que posea una persona con 30 años. Dar una media de la bondad de dicha estimación. 7.- Distribuciones de:

1.- Nº acciones / edad > 35 2.- Nº acciones / 26 < edad < 46 ¿Cuál de las dos es más homogénea y por qué?

Solución

Page 183: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

183

Nº 132.- De una población de 100 personas, se ha observado que 30 de ellas están en paro. Los padres de 11 de estas 30 tampoco tienen empleo. Estúdiese si el paro es una situación que se reproduce dentro de las familias, teniendo en cuenta que de las 100 personas observadas 40 tienen padres en desempleo. Solución

Page 184: ESTADÍSTICA DESCRIPTIVA Xi 1 2 3 4 5 6 · PDF fileel intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y ... Como N/2 es 10, será la media aritmética

'(3$57$0(172�'(�(67$'Ë67,&$�(�,19(67,*$&,Ï1�23(5$7,9$�

(67$'Ë67,&$�'(6&5,37,9$��

184

1����.- Se han estudiado las calificaciones de 100 alumnos en dos asignaturas: Economía (xi) y Estadística (yj) obteniéndose los siguientes datos:

; = 110 < = 2,5 ¸6 = 10 ¹6 = 0,5

Además se sabe que el coeficiente de correlación lineal entre ambas variables es 0,85. Obtener razonadamente, demostrando brevemente el porqué de sus respuestas, y explicando el significado de los resultados: 1.- ¿Qué nota se puede esperar de un alumno que ha obtenido 125 puntos en Economía, en la asignatura de Estadística? Bondad de la estimación. 2.- Se puede decir que aquellos alumnos que obtienen mayor calificación en Economía, sean los mismos que obtienen mayor calificación en Estadística 3.- Un alumno que obtiene 120 puntos en Economía y 3,5 en Estadística ¿En cuál obtuvo mejor calificación relativa? Solución