ESTADÍSTICA (GRUPO 12 - Universidad de Sevilla › aggonzalez › Docencia › TEMA_8.pdf ·...

42
CAPÍTULO III .- ANÁLISIS DE DOS CARACTERÍSTICAS (DISTRIBUCIONES BIDIMENSIONALES) ESTADÍSTICA (GRUPO 12) TEMA 8 .- ANÁLISIS DE DOS VARIABLES. DIPLOMATURA EN CIENCIAS EMPRESARIALES UNIVERSIDAD DE SEVILLA

Transcript of ESTADÍSTICA (GRUPO 12 - Universidad de Sevilla › aggonzalez › Docencia › TEMA_8.pdf ·...

Page 1: ESTADÍSTICA (GRUPO 12 - Universidad de Sevilla › aggonzalez › Docencia › TEMA_8.pdf · frecuencias absolutas de la distribución conjunta. kkm i. ij i1 i1 j1 nnN === ∑∑∑=

CAPÍTULO III.-ANÁLISIS DE DOS CARACTERÍSTICAS

(DISTRIBUCIONES BIDIMENSIONALES)

ESTADÍSTICA (GRUPO 12)

TEMA 8.- ANÁLISIS DE DOS VARIABLES.

DIPLOMATURA EN CIENCIAS EMPRESARIALES

UNIVERSIDAD DE SEVILLA

Page 2: ESTADÍSTICA (GRUPO 12 - Universidad de Sevilla › aggonzalez › Docencia › TEMA_8.pdf · frecuencias absolutas de la distribución conjunta. kkm i. ij i1 i1 j1 nnN === ∑∑∑=

2© Antonio Pajares Ruiz

1. DISTRIBUCIÓN BIDIMENSIONAL DE FRECUENCIAS. TABLA DE CORRELACIÓN. REPRESENTACIONES GRÁFICAS.

1

2

j

N

x1y1

XY

Distribución de frecuenciasbidimensional de (X, Y)

x2y2

xjyj

xNyN

1 2 k

1 2 m

X : x , x , ..., x

Y : y , y , ..., y

i j ij[(x , y ); n ]

i 1, 2, ... kj 1, 2, ... m∀ =∀ =

Page 3: ESTADÍSTICA (GRUPO 12 - Universidad de Sevilla › aggonzalez › Docencia › TEMA_8.pdf · frecuencias absolutas de la distribución conjunta. kkm i. ij i1 i1 j1 nnN === ∑∑∑=

3© Antonio Pajares Ruiz

nkm...nkj...nk2nk1xk

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

nim...nij...ni2ni1xi

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

n2m...n2j...n22n21x2

n1m...n1j...n12n11x1

ym...yj...y2y1X/Y

TABLA DE CORRELACIÓN

1. DISTRIBUCIÓN BIDIMENSIONAL DE FRECUENCIAS. TABLA DE CORRELACIÓN. REPRESENTACIONES GRÁFICAS.

Page 4: ESTADÍSTICA (GRUPO 12 - Universidad de Sevilla › aggonzalez › Docencia › TEMA_8.pdf · frecuencias absolutas de la distribución conjunta. kkm i. ij i1 i1 j1 nnN === ∑∑∑=

4© Antonio Pajares Ruiz

CARACTERÍSTICAS DE LA DISTRIBUCIÓN BIDIMENSIONAL

Frecuencias absolutas conjuntas de las distintas parejas de valores de X e Y:nij: nº de veces que aparecen conjuntamente los valores xi e yj

Frecuencia relativa conjunta de la pareja de valores xi e yj:

Frecuencias acumuladas:

1. DISTRIBUCIÓN BIDIMENSIONAL DE FRECUENCIAS. TABLA DE CORRELACIÓN. REPRESENTACIONES GRÁFICAS.

k m

iji 1 j 1

n N= =

=∑∑ij

ij

nf

N=

k m

iji 1 j 1

f 1= =

=∑∑ji

ij uvu 1 v 1

N n= =

= ∑∑ji

ij uvu 1 v 1

F f= =

= ∑∑

Page 5: ESTADÍSTICA (GRUPO 12 - Universidad de Sevilla › aggonzalez › Docencia › TEMA_8.pdf · frecuencias absolutas de la distribución conjunta. kkm i. ij i1 i1 j1 nnN === ∑∑∑=

5© Antonio Pajares Ruiz

Ej.: Análisis de las características “Altura en cm.” (X) y “Nº de zapato calzado” (Y), definidas sobre un colectivo de 10 personas.Valores observados para X e Y en las 10

personas:(174;40)(184;44)(163;40)(167;41)(191;45)(166;40)(188;43)(179;42)(169;41)(176;43)

100000191001000188010000184000100179001000176000001174000010169000010167000001166000001163454443424140X/Y

Tabla de correlación

45191431884418442179431764017441169411674016640163yixi

1. DISTRIBUCIÓN BIDIMENSIONAL DE FRECUENCIAS. TABLA DE CORRELACIÓN. REPRESENTACIONES GRÁFICAS.

Page 6: ESTADÍSTICA (GRUPO 12 - Universidad de Sevilla › aggonzalez › Docencia › TEMA_8.pdf · frecuencias absolutas de la distribución conjunta. kkm i. ij i1 i1 j1 nnN === ∑∑∑=

6© Antonio Pajares Ruiz

REPRESENTACIONES GRÁFICASA. Diagrama de barras tridimensional (X e Y no están agrupadas en

intervalos)

yj

nij

xi-1 xi xi+1

yj+1

0

1. DISTRIBUCIÓN BIDIMENSIONAL DE FRECUENCIAS. TABLA DE CORRELACIÓN. REPRESENTACIONES GRÁFICAS.

Sus características

Se utiliza un sistema cartesiano de tres ejes:

Dos de ellos sirven para colocar los valores de ambas variables.En el eje vertical se describen las frecuencias absolutas conjuntas de cada pareja de valores.

En la confluencia en el plano entre cada pareja de valores se levanta una línea vertical con altura igual a su frecuencia.

Page 7: ESTADÍSTICA (GRUPO 12 - Universidad de Sevilla › aggonzalez › Docencia › TEMA_8.pdf · frecuencias absolutas de la distribución conjunta. kkm i. ij i1 i1 j1 nnN === ∑∑∑=

7© Antonio Pajares Ruiz

REPRESENTACIONES GRÁFICASB. Escalograma o estereograma (X e Y están agrupadas en intervalos)

Li-1

Li

Lj-1 Lj+1Lj

hij

Li+1

Lj+2

1. DISTRIBUCIÓN BIDIMENSIONAL DE FRECUENCIAS. TABLA DE CORRELACIÓN. REPRESENTACIONES GRÁFICAS.

ijij

i i 1 j j 1

nd

(L L ) (L L )− −

=− ⋅ −

Sus características

Se utiliza un sistema cartesiano de tres ejes:

Dos de ellos sirven para colocar los límites de los distintos intervalos para ambas variables.En el eje vertical se describen las densidades de frecuencia dijconjuntas para cada pareja..

En la confluencia en el plano entre cada pareja de intervalos se levanta un cubo cuya altura va a ser igual a la densidad de frecuencia.

Page 8: ESTADÍSTICA (GRUPO 12 - Universidad de Sevilla › aggonzalez › Docencia › TEMA_8.pdf · frecuencias absolutas de la distribución conjunta. kkm i. ij i1 i1 j1 nnN === ∑∑∑=

8© Antonio Pajares Ruiz

C. Sólo una de las variables está agrupada en intervalos

Lj+1 LjLj-1

xi-1xi

xi+1xi+2

hij

REPRESENTACIONES GRÁFICAS

1. DISTRIBUCIÓN BIDIMENSIONAL DE FRECUENCIAS. TABLA DE CORRELACIÓN. REPRESENTACIONES GRÁFICAS.

Sus características

Se utiliza un sistema cartesiano de tres ejes:

Dos de ellos sirven para colocar los valores o límites de los intervalos para ambas variables.En el eje vertical se describen las densidades de frecuencia dijconjuntas para cada pareja de intervalo y valor.

En la confluencia entre cada pareja de valor e intervalo se levanta un plano cuya altura va a ser igual a la densidad de frecuencia.

ijij

j j 1

nd

(L L )−

=−

Page 9: ESTADÍSTICA (GRUPO 12 - Universidad de Sevilla › aggonzalez › Docencia › TEMA_8.pdf · frecuencias absolutas de la distribución conjunta. kkm i. ij i1 i1 j1 nnN === ∑∑∑=

9© Antonio Pajares Ruiz

D. Nube de puntos o diagrama de dispersión

yj+1

yj

yj-1

xi+1xixi-1

REPRESENTACIONES GRÁFICAS

1. DISTRIBUCIÓN BIDIMENSIONAL DE FRECUENCIAS. TABLA DE CORRELACIÓN. REPRESENTACIONES GRÁFICAS.

Sus características

Se utiliza un sistema cartesiano de dos ejes, situando en cada uno de ellos los valores de cada una de los dos variables (o las marcas de clase de los correspondientes intervalos).En la confluencia en el plano entre cada pareja de valores se dibuja un punto.La conjunción del conjunto constituye la nube de puntos.Al lado de cada punto se puede poner el valor de la frecuencia si no es unitaria.

Page 10: ESTADÍSTICA (GRUPO 12 - Universidad de Sevilla › aggonzalez › Docencia › TEMA_8.pdf · frecuencias absolutas de la distribución conjunta. kkm i. ij i1 i1 j1 nnN === ∑∑∑=

10© Antonio Pajares Ruiz

2. DISTRIBUCIONES MARGINALES Y CONDICIONADAS.

DISTRIBUCIONES MARGINALESEs la distribución de frecuencias de los valores de cada una de las dos variables, sin considerar el valor concreto que tome la otra.

Consecuentemente, para cada una de ellas, es posible realizar idénticos análisis que para las dist. unidimensionales.

( )i i.x ,n

i 1, 2, ..., k∀ =m

i. ijj=1

n = n∑

DISTRIBUCIÓN MARGINAL DE X

( )j .jy ,n

j 1, 2, ..., m∀ =k

.j iji=1

n = n∑

DISTRIBUCIÓN MARGINAL DE Y

Page 11: ESTADÍSTICA (GRUPO 12 - Universidad de Sevilla › aggonzalez › Docencia › TEMA_8.pdf · frecuencias absolutas de la distribución conjunta. kkm i. ij i1 i1 j1 nnN === ∑∑∑=

11© Antonio Pajares Ruiz

2. DISTRIBUCIONES MARGINALES Y CONDICIONADAS.

DISTRIBUCIONES MARGINALES

nk.nkm...nkj...nk2nk1xk

n.m

...

...n2m

n1m

ym

N

...ni.

...n2.

n1.

ni.

...n.j...n.2n.1n.j

..................

...nij...ni2ni1xi

..................

...n2j...n22n21x2

...n1j...n12n11x1

...yj...y2y1X/Y

Distribución marginal de X

Distribución marginal de Y

Page 12: ESTADÍSTICA (GRUPO 12 - Universidad de Sevilla › aggonzalez › Docencia › TEMA_8.pdf · frecuencias absolutas de la distribución conjunta. kkm i. ij i1 i1 j1 nnN === ∑∑∑=

12© Antonio Pajares Ruiz

2. DISTRIBUCIONES MARGINALES Y CONDICIONADAS.DISTRIBUCIONES MARGINALES

Algunas propiedades de interés

La suma de las frecuencias absolutas de la distribución marginal de X es igual al total de observaciones o, lo que es igual, a la suma de las frecuencias absolutas de la distribución conjunta.

k k m

i. iji 1 i 1 j 1

n n N= = =

= =∑ ∑∑La suma de las frecuencias absolutas de la distribución marginal de Y es igual al total de observaciones o, lo que es igual, a la suma de las frecuencias absolutas de la distribución conjunta.

m k m

.j ijj 1 i 1 j 1

n n N= = =

= =∑ ∑∑Las distribuciones marginales determinadas son unidimensionales. En éstas, se pueden realizar los análisis ya abordados para una variable.

Page 13: ESTADÍSTICA (GRUPO 12 - Universidad de Sevilla › aggonzalez › Docencia › TEMA_8.pdf · frecuencias absolutas de la distribución conjunta. kkm i. ij i1 i1 j1 nnN === ∑∑∑=

13© Antonio Pajares Ruiz

2. DISTRIBUCIONES MARGINALES Y CONDICIONADAS.DISTRIBUCIONES MARGINALES

Frecuencias relativas marginales

m

ijj 1i.

i.

nn

fN N

== =∑

Frecuencias relativas de la distribución marginal de Y:

k

ij.j i 1

.j

nnf

N N== =∑

Frecuencias relativas de la distribución marginal de X:

Algunas propiedades

La suma de las frecuencias relativas de la distribución marginal de X o de la distribución marginal de Y es 1.

k mk

iji.ki 1 j 1i 1

i.i 1

nnN

f 1N N N

= ==

=

= = = =∑∑∑

∑m k m

.j ijmj 1 i 1 j 1

.jj 1

n nN

f 1N N N

= = =

=

= = = =∑ ∑∑

Page 14: ESTADÍSTICA (GRUPO 12 - Universidad de Sevilla › aggonzalez › Docencia › TEMA_8.pdf · frecuencias absolutas de la distribución conjunta. kkm i. ij i1 i1 j1 nnN === ∑∑∑=

14© Antonio Pajares Ruiz

Ej.: Determinar las distrib. marginales de las variables “Altura en cm.” (X) y “Nº de zapato calzado” (Y) para un determinado colectivo de 10personas, a partir de la distr. conjunta de ambas variables.

1100000000045

101111111111ni.

12123n.j

000001910100018810000184001001790100017600001174000101690001016700001166000011634443424140X/Y

Tabla de correlación

10N1191118811841179117611741169116711661163ni.xi

2. DISTRIBUCIONES MARGINALES Y CONDICIONADAS.DISTRIBUCIONES MARGINALES

10N245144243142241340n.jyj

Page 15: ESTADÍSTICA (GRUPO 12 - Universidad de Sevilla › aggonzalez › Docencia › TEMA_8.pdf · frecuencias absolutas de la distribución conjunta. kkm i. ij i1 i1 j1 nnN === ∑∑∑=

15© Antonio Pajares Ruiz

Ej.: Calcular la media y la varianza de la distribución marginal de la variable “Altura en cmts.”, definida sobre un colectivo de 10 personas.

10N1191118811841179117611741169116711661163ni.xi

2. DISTRIBUCIONES MARGINALES Y CONDICIONADAS.DISTRIBUCIONES MARGINALES

k

i i.i 1

x n163 166 ... 191

xN 10

=

⋅+ + +

= =∑

k2

2 2 2i i.2 2 2i 1x

x n163 166 ... 191

s x 175'7N 10

=

⋅+ + +

= − = −∑

1757x 175'7 cm.

10= =

2 2 2x

309549s 175'7 84 '41 cm.

10= − =

Page 16: ESTADÍSTICA (GRUPO 12 - Universidad de Sevilla › aggonzalez › Docencia › TEMA_8.pdf · frecuencias absolutas de la distribución conjunta. kkm i. ij i1 i1 j1 nnN === ∑∑∑=

16© Antonio Pajares Ruiz

Ej.: Calcular la media y la varianza de la distribución marginal de la variable “Nº de zapato calzado”, definida sobre un colectivo de 10 personas.

2. DISTRIBUCIONES MARGINALES Y CONDICIONADAS.DISTRIBUCIONES MARGINALES

m

j .jj 1

y n40 3 41 2 ... 45 2

yN 10

=

⋅⋅ + ⋅ + + ⋅

= =∑

m2j .j 2 2

j 12 2 2y

y n40 3 ... 45 1

s y 41'9N 10

=

⋅⋅ + + ⋅

= − = −∑

419y 41'9

10= =

2 2y

17585s 41'9 2 '89

10= − =

10N145144243142241340n.jyj

Page 17: ESTADÍSTICA (GRUPO 12 - Universidad de Sevilla › aggonzalez › Docencia › TEMA_8.pdf · frecuencias absolutas de la distribución conjunta. kkm i. ij i1 i1 j1 nnN === ∑∑∑=

17© Antonio Pajares Ruiz

2. DISTRIBUCIONES MARGINALES Y CONDICIONADAS.

DISTRIBUCIONES CONDICIONADAS

Concepto

Se trata de distribuciones unidimensionales de una de las variables de la distribución conjunta bidimensional cuando la otra cumple una determinada condición:

Que presente un determinado valor.Que presente un determinado conjunto de valores.

Consecuentemente, sobre estas distribuciones, también es posiblerealizar idénticos análisis que para las distribuciones unidimensionales.

Page 18: ESTADÍSTICA (GRUPO 12 - Universidad de Sevilla › aggonzalez › Docencia › TEMA_8.pdf · frecuencias absolutas de la distribución conjunta. kkm i. ij i1 i1 j1 nnN === ∑∑∑=

18© Antonio Pajares Ruiz

2. DISTRIBUCIONES MARGINALES Y CONDICIONADAS.DISTRIBUCIONES CONDICIONADAS

Distribución de X condicionada a que Y tome el valor yj(X/Y=yj)

Frec. Abs.Vals. X

nk/j=nkjxk

……

ni/j=nijxi

......

n2/j=n2jx2

n1/j=n1jx1k k

i/j ij .ji 1 i 1

n n n= =

= =∑ ∑

iji/j

.j

nf = n

Propiedades básicas1.La suma de las frecuencias absolutas de la

distribución condicionada coincide con el número de observaciones que cumplen la condición.

2.Las frec. relativas de la distribución condicionada se calculan dividiendo la frecuencia absoluta entre el total de observaciones de esa distribución.

Page 19: ESTADÍSTICA (GRUPO 12 - Universidad de Sevilla › aggonzalez › Docencia › TEMA_8.pdf · frecuencias absolutas de la distribución conjunta. kkm i. ij i1 i1 j1 nnN === ∑∑∑=

19© Antonio Pajares Ruiz

2. DISTRIBUCIONES MARGINALES Y CONDICIONADAS.

DISTRIBUCIONES CONDICIONADAS

Distribución de X condicionada a que Y tome el valor yj(X/Y=yj)

Frec. Abs.Vals. X

nk/j=nkjxk

……ni/j=nijxi

......n2/j=n2jx2

n1/j=n1jx1

k

ijk.ji 1

i / ji 1 .j .j

n nf 1

n n=

=

= = =∑

Propiedades básicas

3. La suma de las frecuencias relativas de cualquier distribución condicionada es 1.

Page 20: ESTADÍSTICA (GRUPO 12 - Universidad de Sevilla › aggonzalez › Docencia › TEMA_8.pdf · frecuencias absolutas de la distribución conjunta. kkm i. ij i1 i1 j1 nnN === ∑∑∑=

20© Antonio Pajares Ruiz

Ej.: Para la distrib. de la “Altura en cm.” (X) y del “Nº de zapato calzado” (Y) por 10 personas, determinar la distribución de la altura de los individuos que calzan un 40 y la altura media de ese colectivo.

1100000000045

101111111111ni.

12123n.j

000001910100018810000184001001790100017600001174000101690001016700001166000011634443424140X/Y

3Total117411661163ni.xi

2. DISTRIBUCIONES MARGINALES Y CONDICIONADAS.

DISTRIBUCIONES CONDICIONADAS

X/Y=40

163 + 166 + 174x/Y 40

3= =

503x/Y 40 167'67 cm.

3= = =

Page 21: ESTADÍSTICA (GRUPO 12 - Universidad de Sevilla › aggonzalez › Docencia › TEMA_8.pdf · frecuencias absolutas de la distribución conjunta. kkm i. ij i1 i1 j1 nnN === ∑∑∑=

21© Antonio Pajares Ruiz

3. INDEPENDENCIA ESTADÍSTICA DE VARIABLES.

Concepto

X e Y son independientes entre sí cuando los valores que toma una de ellas no vienen afectados, o no están influidos, por los valores que toma la otra.Cuando no existe independencia entre las variables, se dice que éstas son dependientes entre si.

Verificación de la independencia estadísticaentre variables

La condición necesaria y suficiente de independencia entre las dos variables se puede expresar:

j/i .jf f=

i/j i.f f=

i=1,2,…k; j=1,2,…,m

ó i=1,2,…k; j=1,2,…,m

Page 22: ESTADÍSTICA (GRUPO 12 - Universidad de Sevilla › aggonzalez › Docencia › TEMA_8.pdf · frecuencias absolutas de la distribución conjunta. kkm i. ij i1 i1 j1 nnN === ∑∑∑=

22© Antonio Pajares Ruiz

3. INDEPENDENCIA ESTADÍSTICA DE VARIABLES.

Verificación de la independencia estadísticaentre variables: Demostración

ijj/i

i.

nf n

=

1. Definamos la frec. relativa de la distribución condicionada de Y al valor i-ésimo de X:

ij

i.

nijN

j/i ni.N

ff f

= =

2. En la expresión anterior dividimos entre el total N numerador y denominador:

ij j/i i.f f f= ⋅

3. Despejamos la frecuencia relativa de la distribución conjunta:

k

.j iji 1

f f=

= ∑

4. Definamos la frec. relativa de la distribución marginal de Y y sustituyamos en ella la expresión anterior:

( )k

.j j / i i.i 1

f f f=

= ⋅∑

k

.j j / i i.i 1

f f f=

= ⋅∑

5. Si X e Y son independientes, las frec. relativas de la distrib. marginal de Y (fj/i) no varían:

.j j / i j / if f 1 f= ⋅ =

Page 23: ESTADÍSTICA (GRUPO 12 - Universidad de Sevilla › aggonzalez › Docencia › TEMA_8.pdf · frecuencias absolutas de la distribución conjunta. kkm i. ij i1 i1 j1 nnN === ∑∑∑=

23© Antonio Pajares Ruiz

3. INDEPENDENCIA ESTADÍSTICA DE VARIABLES.Verificación de la independencia estadística

entre variables

ij i. .jf f f= ⋅

i. .jij

n nn

N⋅

=

i=1,2,…k; j=1,2,…,m

i=1,2,…k; j=1,2,…,m

Las variables X e Y son independientes si para todos los valores de dichas variables, la frecuencia relativa conjunta de cualquier pareja de valores de ambas variables es igual al producto entre las correspondientes frecuencias relativas marginales.

Las variables X e Y son independientes si para todos los valores de dichas variables, la frecuencia absoluta conjunta de cualquier pareja de valores de ambas variables es igual al producto entre las correspondientes frecuencias absolutas marginales, dividido entre el total de observaciones.

Page 24: ESTADÍSTICA (GRUPO 12 - Universidad de Sevilla › aggonzalez › Docencia › TEMA_8.pdf · frecuencias absolutas de la distribución conjunta. kkm i. ij i1 i1 j1 nnN === ∑∑∑=

24© Antonio Pajares Ruiz

3. INDEPENDENCIA ESTADÍSTICA DE VARIABLES.

Verificación de la independencia estadísticaentre variables: Demostración

ijj/i

i.

nf n

=

1. Definamos la frec. relativa de la distribución condicionada de Y al valor i-ésimo de X:

ij

i.

nijN

j/i ni.N

ff f

= =

2. En la expresión anterior dividimos entre el total N numerador y denominador:

j / i .jf f=

3. Si X e Y son independientes, las frec. relativas de la distrib. marginal de Y (fj/i) no varían y coinciden con las frec. relativas de la distr. marginal de Y:

ij.j

i.

ff

f=

4. A partir de los resultados de los puntos 2 y 3, la frec. relativa conjunta se expresaría como producto entre las frecuencias relativas marginales:

ij i. .jf f f= ⋅

Page 25: ESTADÍSTICA (GRUPO 12 - Universidad de Sevilla › aggonzalez › Docencia › TEMA_8.pdf · frecuencias absolutas de la distribución conjunta. kkm i. ij i1 i1 j1 nnN === ∑∑∑=

25© Antonio Pajares Ruiz

3. INDEPENDENCIA ESTADÍSTICA DE VARIABLES.

Ej.: Analizar la independencia entre la “Altura en cm.” (X) y la“Calificación” (Y) de 147 alumnos presentados a examen, a partir de la distribución conjunta conocida.

848162040

5’5-6’5

1472142Total1424185-1952848175-18535510165-175701020155-165

Total4’5-5’53’5-4’5X/Y

Distribución conjunta de (X,Y)

Page 26: ESTADÍSTICA (GRUPO 12 - Universidad de Sevilla › aggonzalez › Docencia › TEMA_8.pdf · frecuencias absolutas de la distribución conjunta. kkm i. ij i1 i1 j1 nnN === ∑∑∑=

26© Antonio Pajares Ruiz

3. INDEPENDENCIA ESTADÍSTICA DE VARIABLES.Ej.: Analizar la independencia entre la “Altura en cm.” (X) y la“Calificación” (Y) de 147 alumnos presentados a examen, a partir de la distribución conjunta conocida.

a. Las frecuencias relativas de las distribuciones de Y condicionadas a los distintos valores de X coinciden con las frecuencias relativas marginales de Y.

8/14

2/14

4/14

fj/i=4

6

5

4

yj/X=190

Y/X=190

84/147616/28620/35640/706

21/14754/2855/35510/705

42/14748/28410/35420/704

f.jyjfj/i=3yj/X=180fj/i=2yj/X=170fj/i=1yj/X=160

YY/X=180Y/X=170Y/X=160

X e Y dependientes

Page 27: ESTADÍSTICA (GRUPO 12 - Universidad de Sevilla › aggonzalez › Docencia › TEMA_8.pdf · frecuencias absolutas de la distribución conjunta. kkm i. ij i1 i1 j1 nnN === ∑∑∑=

27© Antonio Pajares Ruiz

3. INDEPENDENCIA ESTADÍSTICA DE VARIABLES.Ej.: Analizar la independencia entre la “Altura en cm.” (X) y la“Calificación” (Y) de 147 alumnos presentados a examen, a partir de la distribución conjunta conocida.

b. Las frec. absolutas conjuntas para cualquier pareja de valores se pueden expresar como el producto entre sus frecuencias absolutas marginales dividido entre el total de observaciones.

848162040

5’5-6’5

1472142Total1424185-1952848175-18535510165-175701020155-165

Total4’5-5’53’5-4’5X/Y

1. .111

n n 70 42n 20

N 147⋅ ⋅

= ≠ =

70 21 70 84 14 8410 ;40 ;...;8

147 147 147⋅ ⋅ ⋅

= = =

Para la 1ª pareja de valores:

X e Y dependientes

De todas maneras, se podría actuar de igual forma para el resto:

Page 28: ESTADÍSTICA (GRUPO 12 - Universidad de Sevilla › aggonzalez › Docencia › TEMA_8.pdf · frecuencias absolutas de la distribución conjunta. kkm i. ij i1 i1 j1 nnN === ∑∑∑=

28© Antonio Pajares Ruiz

3. INDEPENDENCIA ESTADÍSTICA DE VARIABLES.

TIPOS DE RELACIÓN ENTRE VARIABLES DEPENDIENTES

Relación debida al azar:Es la ocasionada por razones fortuitas y meramente aleatorias y que no sustenta una relación explicativa entre las mismas.

Relación debida a una tercera variable:La relación existente entre las dos variables se explica por la influencia que tiene en ellas una tercera variable, de forma exclusiva.

Relación causal:Es la que se presenta cuando la variación de valores de una de las variables se pueden explicar a partir de los valores de la otra, o viceversa, desde un punto de vista lógico.

Page 29: ESTADÍSTICA (GRUPO 12 - Universidad de Sevilla › aggonzalez › Docencia › TEMA_8.pdf · frecuencias absolutas de la distribución conjunta. kkm i. ij i1 i1 j1 nnN === ∑∑∑=

29© Antonio Pajares Ruiz

4. MOMENTOS DE LA DISTRIBUCIÓN BIDIMENSIONAL.Concepto

Son valores del vector (X, Y) que caracterizan la distribución de frecuencias.

Momentos respecto al origen de orden r, sk m

r si j ij

i 1 j 1rs

x y na

N= =

⋅ ⋅=∑∑

k m

i j iji 1 j 1

11

x y na

N= =

⋅ ⋅=∑∑r, s = 0, 1, 2, ...

Momentos respecto al origen de la distribución marginal de X (r=0)

kri i.

i 1r0

x na

N=

⋅=∑

Momentos respecto al origen de la distribución marginal de Y (s=0)

msj .j

j 10s

y na

N=

⋅=∑

10a x= 01a y=

Page 30: ESTADÍSTICA (GRUPO 12 - Universidad de Sevilla › aggonzalez › Docencia › TEMA_8.pdf · frecuencias absolutas de la distribución conjunta. kkm i. ij i1 i1 j1 nnN === ∑∑∑=

30© Antonio Pajares Ruiz

4. MOMENTOS DE LA DISTRIBUCIÓN BIDIMENSIONAL.

Momentos centrales o respecto a la media de orden r, s

( ) ( )k m sr

i j iji 1 j 1

rs

x x y y nm

N= =

− ⋅ − ⋅=∑∑ r, s = 0, 1, 2, ...

Momentos centrales de la distribución marginal de X (r=0)

( )k

r

i i.i 1

r0

x x nm

N=

− ⋅=∑

Momentos centrales de la distribución marginal de Y (s=0)

220 xm s=

( ) ( )k m

i j iji 1 j 1

11

x x y y nm

N= =

− ⋅ − ⋅=∑∑Covarianza:

( )m s

j .jj 1

0s

y y nm

N=

− ⋅=∑ 2

02 ym s=

Page 31: ESTADÍSTICA (GRUPO 12 - Universidad de Sevilla › aggonzalez › Docencia › TEMA_8.pdf · frecuencias absolutas de la distribución conjunta. kkm i. ij i1 i1 j1 nnN === ∑∑∑=

31© Antonio Pajares Ruiz

4. MOMENTOS DE LA DISTRIBUCIÓN BIDIMENSIONAL.

OPERACIONES ENTRE VARIABLESSe trata de que, una vez conocida la distribución de frecuenciasconjunta de (X,Y), y sus principales características, determinemos las correspondientes a determinadas variables definidas en términos de X e Y, en función de las de éstas.

u x y= +

2 2 2u x y xys s s 2 s= + + ⋅

CARACTERÍSTICAS DE LADISTRIBUCIÓN DE LA SUMA

DE DOS VARIABLES

U=X+Y

v x y= −

2 2 2v x y xys s s 2 s= + − ⋅

CARACTERÍSTICAS DE LADISTRIBUCIÓN DE LA DIFERENCIA

ENTRE DE DOS VARIABLES

V=X-Y

Page 32: ESTADÍSTICA (GRUPO 12 - Universidad de Sevilla › aggonzalez › Docencia › TEMA_8.pdf · frecuencias absolutas de la distribución conjunta. kkm i. ij i1 i1 j1 nnN === ∑∑∑=

32© Antonio Pajares Ruiz

5. CONCEPTO DE CORRELACIÓN. COVARIANZA. COEFICIENTE DE CORRELACIÓN LINEAL.

CORRELACIÓN

Sirve para determinar la existencia de relación lineal entre dos variables.Mide, cuando existe relación lineal, la intensidad de ésta.

COVARIANZA

Se define matemáticamente como el momento central de orden 1,1 de la distribución bidimensional. Es una medida simple que determina:

Si existe variación lineal conjunta entre los valores de dos variables.Si tal variación es directa o inversa.La relevancia de ésta, aunque de forma aproximada.

Page 33: ESTADÍSTICA (GRUPO 12 - Universidad de Sevilla › aggonzalez › Docencia › TEMA_8.pdf · frecuencias absolutas de la distribución conjunta. kkm i. ij i1 i1 j1 nnN === ∑∑∑=

33© Antonio Pajares Ruiz

5. CONCEPTO DE CORRELACIÓN. COVARIANZA. COEFICIENTE DE CORRELACIÓN LINEAL.

COVARIANZA

( ) ( )k m

i j iji 1 j 1

xy

x x y y ns

N= =

− ⋅ − ⋅=∑∑

k m

i j iji 1 j 1

xy

x y ns x y

N= =

⋅ ⋅= − ⋅∑∑

xy 11s m=

xy 11 10 01s a a a= − ⋅

PropiedadesSu signo nos informa sobre el tipo de relación lineal que existe entre las mismas, directa o inversa:

Si sxy>o, la relación es directa.Si sxy<o, la relación es inversa.

Page 34: ESTADÍSTICA (GRUPO 12 - Universidad de Sevilla › aggonzalez › Docencia › TEMA_8.pdf · frecuencias absolutas de la distribución conjunta. kkm i. ij i1 i1 j1 nnN === ∑∑∑=

34© Antonio Pajares Ruiz

5. CONCEPTO DE CORRELACIÓN. COVARIANZA. COEFICIENTE DE CORRELACIÓN LINEAL.

COVARIANZAPropiedades

Su valor indica el grado de dicha relación lineal, aunque no se encuentra acotado.Si las variables son independientes, la covarianza es nula.

i. .jij

n nn

N⋅

=

mk

.jji i.j=1i=1

xy

( y) ny(x x) ns

N N

− ⋅− ⋅= ⋅

∑∑

i. . j

k mn n

i Nji=1 j=1

xy

(x x) ( y)ys

N

⋅− ⋅ − ⋅=∑∑

xys 0 0 0= ⋅ =

Page 35: ESTADÍSTICA (GRUPO 12 - Universidad de Sevilla › aggonzalez › Docencia › TEMA_8.pdf · frecuencias absolutas de la distribución conjunta. kkm i. ij i1 i1 j1 nnN === ∑∑∑=

35© Antonio Pajares Ruiz

5. CONCEPTO DE CORRELACIÓN. COVARIANZA. COEFICIENTE DE CORRELACIÓN LINEAL.

COVARIANZA

Problemas de la covarianza

La covarianza no está acotadaDepende de las unidades de medida en ambas variables (varía antelos cambios de escala)

Conclusiones generales

sxy=0⇒No existe relación lineal entre las variables (var. incorreladas)sxy≠0⇒ Existe relación lineal entre las variables (var. dependientes)

P a b XQ c d Y= + ⋅= + ⋅ b 0; d 0≠ ≠

pq xys b d s= ⋅ ⋅

Page 36: ESTADÍSTICA (GRUPO 12 - Universidad de Sevilla › aggonzalez › Docencia › TEMA_8.pdf · frecuencias absolutas de la distribución conjunta. kkm i. ij i1 i1 j1 nnN === ∑∑∑=

36© Antonio Pajares Ruiz

5. CONCEPTO DE CORRELACIÓN. COVARIANZA. COEFICIENTE DE CORRELACIÓN LINEAL.COEFICIENTE DE CORRELACIÓN LINEAL

Concepto

Es la covarianza entre las variables tipificadas de las variables originales.Es el cociente entre la covarianza entre ambas variables y el producto entre las correspondientes desviaciones típicas.

X

X xT

s−

=

Y

Y yZ

s−

=

xy tz xyx y

1 1r s s

s s= = ⋅ ⋅

X X

1 xT X

s s= ⋅ −

Y Y

1 yZ Y

s s= ⋅ −

xyxy

x y

sr

s s=

Page 37: ESTADÍSTICA (GRUPO 12 - Universidad de Sevilla › aggonzalez › Docencia › TEMA_8.pdf · frecuencias absolutas de la distribución conjunta. kkm i. ij i1 i1 j1 nnN === ∑∑∑=

37© Antonio Pajares Ruiz

5. CONCEPTO DE CORRELACIÓN. COVARIANZA. COEFICIENTE DE CORRELACIÓN LINEAL.COEFICIENTE DE CORRELACIÓN LINEAL

PropiedadesSu signo nos informa sobre el tipo de relación lineal que existe entre las mismas, directa o inversa:

Si rxy>o, la relación es directa.Si rxy<o, la relación es inversa.

Su valor indica el grado de dicha relación lineal, y se encuentra acotado:

Si rxy = 1, la relación lineal es directa y perfecta.Si rxy = -1, la relación lineal es inversa y perfecta.

Si las variables son independientes, el coeficiente de correlación es nulo.No viene expresado en ningún tipo de unidad de medida (adimensional).

Page 38: ESTADÍSTICA (GRUPO 12 - Universidad de Sevilla › aggonzalez › Docencia › TEMA_8.pdf · frecuencias absolutas de la distribución conjunta. kkm i. ij i1 i1 j1 nnN === ∑∑∑=

38© Antonio Pajares Ruiz

5. CONCEPTO DE CORRELACIÓN. COVARIANZA. COEFICIENTE DE CORRELACIÓN LINEAL.COEFICIENTE DE CORRELACIÓN LINEAL

Propiedades

No es totalmente inalterable a las transformaciones lineales en las variables. Nunca varía su valor, en términos absolutos, pero puede variar su signo.

P a b XQ c d Y= + ⋅= + ⋅ b 0; d 0≠ ≠

pqpq

p q

sr

s s=

⋅xy

pqx y

b d sr

b s d s⋅ ⋅

=⋅ ⋅ ⋅

xypq xy

x y

sb d b dr r

b d s s b d⋅ ⋅

= ⋅ = ⋅⋅ ⋅ ⋅ pq xyr r =

Page 39: ESTADÍSTICA (GRUPO 12 - Universidad de Sevilla › aggonzalez › Docencia › TEMA_8.pdf · frecuencias absolutas de la distribución conjunta. kkm i. ij i1 i1 j1 nnN === ∑∑∑=

39© Antonio Pajares Ruiz

5. CONCEPTO DE CORRELACIÓN. COVARIANZA. COEFICIENTE DE CORRELACIÓN LINEAL.COEFICIENTE DE CORRELACIÓN LINEAL

Problemas

Distintas distribuciones de frecuencias pueden conducir al mismovalor de r.

Valores atípicos, “anormalmente pequeños o grandes” (outliers), pueden producir cambios de cierta consideración en el valor de r.

La existencia de relaciones distintas entre grupos de observaciones de una distribución de frecuencias bidimensional, pueden producir que el valor del coeficiente de correlación lineal de cada grupodifiera notablemente del coeficiente de correlación de la distribución completa.

Page 40: ESTADÍSTICA (GRUPO 12 - Universidad de Sevilla › aggonzalez › Docencia › TEMA_8.pdf · frecuencias absolutas de la distribución conjunta. kkm i. ij i1 i1 j1 nnN === ∑∑∑=

40© Antonio Pajares Ruiz

3. INDEPENDENCIA ESTADÍSTICA DE VARIABLES.Ej.: Analizar si existe relación de tipo lineal entre la “Calificación” (X) y la “Nº de veces que se ha matriculado en la disciplina” (Y) de 30 alumnos presentados a examen, a partir de la distribución conjunta conocida y, en su caso, determinar su tipo e intensidad.

13 189

30⋅

En primer lugar nos cercioraríamos de si existe dependencia entre las variables:

304818-n.j

1213

753xi

715(6-8]1044(4-6]1339[2-4]ni.21X/Y

X e Y dependientes

Constatada la existencia de dependencia entre X e Y, en orden a poder dar respuesta a la cuestión planteada, realizamos en la siguiente diapositiva determinados cálculos previos necesarios sobre las distribuciones marginales.

Page 41: ESTADÍSTICA (GRUPO 12 - Universidad de Sevilla › aggonzalez › Docencia › TEMA_8.pdf · frecuencias absolutas de la distribución conjunta. kkm i. ij i1 i1 j1 nnN === ∑∑∑=

41© Antonio Pajares Ruiz

3. INDEPENDENCIA ESTADÍSTICA DE VARIABLES.Ej.: Analizar si existe relación de tipo lineal entre la “Calificación” (X) y la “Nº de veces que se ha matriculado en la disciplina” (Y) de 30 alumnos presentados a examen, a partir de la distribución conjunta conocida y, en su caso, determinar su tipo e intensidad.

138x 4 '6puntos

30= =

46y 1'53 veces

30= =

304818-n.j

1213

753xi

715(6-8]1044(4-6]1339[2-4]ni.21X/Y

2 2 2x

710s 4 '6 2 '51puntos

30= − =

2 2 2y

86s 1'53 0 '52 veces

30= − =

xs 1'58puntos=

ys 0 '72 veces=

Page 42: ESTADÍSTICA (GRUPO 12 - Universidad de Sevilla › aggonzalez › Docencia › TEMA_8.pdf · frecuencias absolutas de la distribución conjunta. kkm i. ij i1 i1 j1 nnN === ∑∑∑=

42© Antonio Pajares Ruiz

3. INDEPENDENCIA ESTADÍSTICA DE VARIABLES.Ej.: Analizar si existe relación de tipo lineal entre la “Calificación” (X) y la “Nº de veces que se ha matriculado en la disciplina” (Y) de 30 alumnos presentados a examen, a partir de la distribución conjunta conocida y, en su caso, determinar su tipo e intensidad.

xy

214 138 46s 0 '08

30 30 30= − ⋅ =

xy

0 '08r 0 '070

1'58 0 '72= =

⋅xy

xyx y

s r

s s=

Para verificar si existe relación lineal y el tipo de ésta, en su caso, calcularnos la covarianza.

k m

i j iji 1 j 1

xy

x y ns x y

N= =

⋅ ⋅= − ⋅∑∑

Consiguientemente, existe cierta relación lineal directa. Para cuantificar su importancia, calculamos el coeficiente de correlación lineal.

Relación lineal directa ymuy débil