OCW 2019: Curso práctico para el análisis e inferencia ... · inferencia estadística con...
Transcript of OCW 2019: Curso práctico para el análisis e inferencia ... · inferencia estadística con...
Ejercicios resueltos
OCW 2019: Curso práctico para el
análisis e inferencia estadística con
Mathematica
Bloque III: Variables aleatorias
Equipo docente del curso
Arrospide Zabala, Eneko
Martín Yagüe, Luis
Unzueta Inchaurbe, Aitziber
Soto Merino, Juan Carlos
Durana Apaolaza, Gaizka
Bikandi Irazabal, Iñaki
Departamento de Matemática Aplicada
Escuela de Ingeniería de Bilbao, Edificio II-I
OCW2019: Curso práctico para el análisis e inferencia estadística con Mathematica
EJERCICIOS DEL BLOQUE 3. VARIABLES ALEATORIAS
Ejercicio nº1
Enunciado
El diámetro interior, medido en centímetros, de ciertas arandelas fabricadas en un taller de
matricería es una variable aleatoria X que se distribuye según la función de densidad:
f �x� � c � �x� 1� � �3� x� si x � �1, 30 si x �1, 3
� a) Calcule el valor del parámetro c � � y represente gráficamente la función de densidad
� b) Obtenga la correspondiente función de distribución de probabilidad de la variable aleatoria X y
represéntela gráficamente
� c) Calcule el diámetro esperado de las arandelas y su desviación estándar
� d) �Qué percentil supone el valor x � 2.5112cm?
� e) Una empresa que compra al taller necesita, para uno de sus procesos productivos, arandelas
con un diámetro interior entre 1.7cm y 2.4cm; calcule la probabilidad de que una de las arandelas
fabricadas en el taller sea válida para ese proceso productivo
Resolución
� a) Calcule el valor del parámetro c � � y represente gráficamente la función de densidad
� Para que f �x� sea una función de densidad, el área limitada bajo la curva tiene que ser la
unidad:
dist1 � ProbabilityDistribution�c��x � 1���3 � x�, �x, 1, 3�;
Solve�Integrate�PDF�dist1, x, �x, 1, 3� 1
c �3
4
� Solución: c � 34
� Utilizando el método “Normalize”:
dist1 � ProbabilityDistribution�c��x � 1���3 � x�, �x, 1, 3�, Method � "Normalize";
PDF�dist1, x �� TraditionalForm
3
4�3� x� �x� 1� 1� x� 3
0 True
� Representación gráfica de la función de densidad:
PlotPDF�dist1, x, �x, 0, 4�, Filling � Axis, AxesLabel � HoldForm�"x", HoldForm" f �x�"
1
OCW2019: Curso práctico para el análisis e inferencia estadística con Mathematica
� b) Obtenga la correspondiente función de distribución de probabilidad de la variable aleatoria X y
represéntela gráficamente
CDF�dist1, x �� TraditionalForm
1 x 31
4�x3 � 6 x2 � 9 x� 4 1 � x � 3
� Solución: F �x� �0 si x� 1
14� 4� 9 x� 6 x2 � x3
1
si x � �1, 3�si x� 3
Plot�CDF�dist1, x, �x, �1, 6�, Filling � Axis,
PlotRange � �0, 1�, AxesLabel � �HoldForm�"x", HoldForm�"F�x�"�
� c) Calcule el diámetro esperado de las arandelas y su desviación estándar
Expectation�x, x � dist12
StandardDeviation�dist1 �� N
0.447214
� Solución: E�X � 2cm
SD�X � 0.4472cm
� d) �Qué percentil supone el valor x � 2.5112cm?
CDF�dist1, 2.51120.850003
� Se trata del percentil 85: P85� 2.5112cm
2
OCW2019: Curso práctico para el análisis e inferencia estadística con Mathematica
� e) Una empresa que compra al taller necesita, para uno de sus procesos productivos, arandelas
con un diámetro interior entre 1.7cm y 2.4cm; calcule la probabilidad de que una de las arandelas
fabricadas en el taller sea válida para ese proceso productivo
Probability�1.7 � x � 2.4, x� dist10.50225
� Solución: P �1.7� X � 2.4� � 0.50225
Ejercicio nº2
Enunciado
Una bolsa de tela contiene siete bolas, de las cuales tres son negras y cuatro blancas. Se extraen tres
bolas sin reemplazamiento.
� a) Represente gráficamente la función de masa de probabilidad
� b) Calcule la probabilidad de extraer dos bolas negras
� c) Calcule la probabilidad de extraer, al menos, una bola negra
� d) Calcule la probabilidad de sacar, a lo sumo, una bola negra
� e) �Cuál es el valor esperado y la desviación estándar para las bolas blancas?
Resolución
Se define la variable aleatoria X � ”número de bolas negras entre las tres extraídas de la bolsa”. La
variable X sigue una distribución hipergeómetrica: X � H 7, 3, 37
� Introducción de parámetros: tamaños de la población (tp) y muestral (n) y número de éxitos
iniciales (r)
n � 3; r � 3; tp � 7;
� Definición del modelo de distribución de probabilidad
dist2 � HypergeometricDistribution�n, r, tp;
� a) Represente gráficamente la función de masa de probabilidad
DiscretePlotPDF� dist2, x, �x, 0, 3�, PlotRange � ��0, 3�, �0, 0.5��, PlotMarkers � Automatic,
PlotLabel � "H�7,3,3
7�", AxesLabel � �HoldForm�"x", HoldForm�"p�x�"�
3
OCW2019: Curso práctico para el análisis e inferencia estadística con Mathematica
� b) Calcule la probabilidad de extraer dos bolas negras
PDF�dist2, 212
35
N�PDF�dist2, 2, 40.3429
� Solución: P �X � 2� � 1235
� 0.3429
� c) Calcule la probabilidad de extraer, al menos, una bola negra
1 � CDF�dist2, 031
35
PDF�dist2, 1 � PDF�dist2, 2 � PDF�dist2, 331
35
Probability�x � 1, x � dist231
35
N�31�35, 40.8857
� Solución: P �X 1� � 3135
� 0.8857
� d) Calcule la probabilidad de sacar, a lo sumo, una bola negra
CDF�dist2, 122
35
PDF�dist2, 0 � PDF�dist2, 122
35
Probability�x � 1, x � dist2 �� N
0.628571
� Solución: P �X � 1� � 2235
� 0.6286
� e) �Cuál es el valor esperado y la desviación estándar para las bolas blancas?
� Se define la variable aleatoria Y � ”número de bolas blancas entre las tres extraídas de la bolsa”.
La variable Y sigue una distribución hipergeómetrica: X � H 7, 3, 47
� Introducción de parámetros: número de éxitos iniciales (rb), los tamaños de la población y
muestral ya fueron definidos
4
OCW2019: Curso práctico para el análisis e inferencia estadística con Mathematica
rb � 4;
� Definición del modelo de distribución de probabilidad
dist2b � HypergeometricDistribution�n, rb, tp;
� Valor esperado
�Mean�dist2b, Expectation�x, x � dist2b�
12
7,12
7
� Desviación estándar
StandardDeviation�dist2b �� N
0.699854
� Solución: E�X � 127
SD�X � 0.69985
Ejercicio nº3
Enunciado
La altura del alumnado de un centro de enseñanza se distribuye de forma normal, con una media
de 173cm y una desviación típica de 15cm.
� a) Calcule el primer cuartil de la población e interprete el resultado obtenido
� b) Se considera un individuo cuya altura es 160cm; �a qué porcentaje del alumnado es menor en
altura?
� c) Se considera un individuo cuya altura es 178cm; �a qué porcentaje del alumnado es mayor en
altura?
� d) Halle la probabilidad de que en un grupo de 100 estudiantes haya, al menos, 70 que midan
menos de 178cm
Resolución
Sea la variable aleatoria X � ”altura, en cm, del alumnado del centro de enseñanza”. La variable X sigue
una distribución normal: X � N �173, 15�.� Definición del modelo de distribución de probabilidad
dist3 � NormalDistribution�173, 15;
� a) Calcule el primer cuartil de la población e interprete el resultado obtenido
Para calcular el primer cuartil, Q1, se debe obtener el valor de la variable que deja el 25% de los
valores de la muestra a su izquierda (menores que él).
InverseCDF�dist3, 0.25162.883
� Primer cuartil: Q1 � P25� 162.8830cm
En conclusión, el 25% del alumnado del centro de enseñanza mide, a lo sumo, 162.88cm; por tanto,
el 75% restante mide, al menos, esa altura.
5
OCW2019: Curso práctico para el análisis e inferencia estadística con Mathematica
� b) Se considera un individuo cuya altura es 160cm; �a qué porcentaje del alumnado es menor en
altura?
1 � CDF�dist3, 160 �� N
0.806938
Probability�x � 160, x � dist3 �� N
0.806938
� Percentil correspondiente: P80.69� 160cm
Este individuo es más bajo que el 80.69 % del alumnado del centro de enseñanza
� c) Se considera un individuo cuya altura es 178cm; �a qué porcentaje del alumnado es mayor en
altura?
CDF�dist3, 178 �� N
0.630559
Probability�x � 178, x � dist3 �� N
0.630559
� Percentil correspondiente: P63.06� 178cm
Este individuo es más alto que el 63.06 % del alumnado del centro de enseñanza
� d) Halle la probabilidad de que en un grupo de 100 estudiantes haya, al menos, 70 que midan
menos de 178cm
� En el apartado anterior se ha calculado que la probabilidad de que un individuo mida menosde 178cm es 63.06 %.
� Se define la variable aleatoria Y � “número de individuos que miden menos de 178 cm al escoger alazar a cien estudiantes del centro de enseñanza”. La variable Y sigue una distribución binomial
con n � 100 intentos y una probabilidad de éxito p � 0.6306: Y � B �100, 0.6306� � Definición del modelo de distribución de probabilidad
pB � Probability�x � 178, x � dist3 �� N; nB � 100;
dist3B � BinomialDistribution�nB, pB;
1 � CDF�dist3B, 690.0895516
Probability�x � 70, x � dist3B �� N
0.0895516
� Solución: P �Y 70 Y � B �100, 0.6306�� � 0.08955
� Utilizando la convergencia a la normal
� Una variable aleatoria Y � B �n , p� converge a la distribución Y ' � N n� p , n� p�q mu � nB�pB63.0559
sig � Sqrt�nB�pB��1 � pB�4.82654
6
OCW2019: Curso práctico para el análisis e inferencia estadística con Mathematica
� En este caso, Y � B �100, 0.6306� converge a la distribución Y ' � N �63.0559, 4.82654�
dist3N � NormalDistribution�mu, sig;
� Se superpone la gráfica de la función de densidad de la distribución normal a la de la
función de masa de la binomial
Show�DiscretePlot�PDF�dist3B, x, �x, 40, 90�,PlotRange � Full, PlotLabel � "B�100,0.6306��N�63.06,4.83�",
AxesLabel � �HoldForm�"x", HoldForm�"p�x�, f �x�"�, PlotMarkers � Automatic,Plot�PDF�dist3N, x, �x, 40, 90�, PlotRange � Full, PlotStyle � Orange
1 � CDF�dist3N, 69.50.0909141
Probability�x � 69.5, x � dist3N �� N
0.0909141
� Solución: P �Y ' 69.5 Y ' � N �63.0559, 4.82654�� � 0.0909
Ejercicio nº4
Enunciado
La duración media, desde su venta hasta que son dados de baja, de los coches vendidos en un
concesionario oficial sigue una distribución exponencial con una vida media de 15.7 años.
� a) Represente la función de densidad de la variable X � “duración media, en años, de los cochesvendidos en un concesionario oficial”
� b) Calcule la probabilidad de que un coche dure mas de 7 años
� c) Calcule la probabilidad de que un coche dure mas de 15 años sabiendo que se compró hace, al
menos, 12 años
Resolución
� a) Represente la función de densidad de la variable X � “duración media, en años, de los cochesvendidos en un concesionario oficial”
7
OCW2019: Curso práctico para el análisis e inferencia estadística con Mathematica
� Definición del parámetro Λ
Λ � 1�15.70.0636943
� Definición del modelo de distribución de probabilidad
dist4 � ExponentialDistribution�1�15.7;PDF�ExponentialDistribution�Λ, x �� TraditionalForm
0.0636943��0.0636943x x 00 True
PlotPDF�dist4, x, �x, 1, 50�, Filling � Axis, PlotRange � All,
PlotLabel � "��0.0637�", AxesLabel � HoldForm�"x", HoldForm" f �x�"
� b) Calcule la probabilidad de que un coche dure mas de 7 años
Probability�x � 7, x � dist40.640273
� Solución: P X � 7 X � � �0.0637� � 0.6403
� c) Calcule la probabilidad de que un coche dure mas de 15 años sabiendo que se compró hace, al
menos, 12 años
� Cálculo de la probabilidad condicionada:
Probability�x � 15 � x � 12, x � dist40.826064
� Solución: P X � 15 X � 12� X � � �0.0637� � 0.8261
� Utilizando la propiedad de “falta de memoria”, exclusiva de la distribución exponencial setiene que la probabilidad de que un coche dure mas de 15 años sabiendo que se compró hacemas de 12 años coincide con la probabilidad de que el coche dure mas de 3 años:
Probability�x � 3, x � dist40.826064
� Solución: P X � 3 X � � �0.0637� � 0.8261
8
OCW2019: Curso práctico para el análisis e inferencia estadística con Mathematica
Ejercicio nº5
Enunciado
Sea una variable aleatoria X cuya función de masa de probabilidad viene dada por:
� a) Calcule y represente la función de distribución
� b) Calcule P �X � 5�� c) Calcule P �X � 3 X � 7�� d) Calcule P �X � 7 X � 3�
Resolución
� a) Calcule y represente la función de distribución
� Se define la función de masa de probabilidad de la variable X:
dist5 � ProbabilityDistribution�Piecewise���0.3, 1 � x � 2�, �0.05, 2 � x � 3�, �0.1, 3 � x � 4�,�0.15, 4 � x � 5�, �0.2, 6 � x � 7�, �0.1, 7 � x � 8�, �0.1, 8 � x � 9��, �x, 0, 15, 1�;
PDF�dist5, x �� TraditionalForm
0.05 2 � x� 30.1 3� x� 4 � 7 � x� 90.15 4� x� 50.2 6 � x� 70.3 1 � x� 2
� Función de masa: f �x� �
0.300.05
0.10
0.150.200.100.10
si 1 � x � 2si 2 � x � 3
si 3� x� 4
si 4� x� 6si 6 � x � 7si 7 � x � 8si 8 � x � 9
� Usando EmpiricalDistribution:
dist5ED �EmpiricalDistribution��0, 0.3, 0.05, 0.1, 0.15, 0.2, 0.1, 0.1� � �1, 2, 3, 4, 5, 7, 8, 9�;
PDF�dist5ED, x �� TraditionalForm
0.3 Boole�2� x � 0.05 Boole�3� x � 0.1 Boole�4� x �0.15 Boole�5� x � 0.2 Boole�7� x � 0.1 Boole�8� x � 0.1 Boole�9� x � 0.
9
OCW2019: Curso práctico para el análisis e inferencia estadística con Mathematica
� Representación gráfica de la función de masa de probabilidad de la variable X:
DiscretePlot�PDF�dist5, x, �x, 1, 9�,AxesLabel � �HoldForm�"x", HoldForm�"p�x�"�, PlotMarkers � Automatic
� Función de distribución de probabilidad y su representación gráfica:
CDF�dist5, x �� TraditionalForm
0. x � 20.3 2� x� 30.35 3� x� 40.45 4 � x� 50.6 5 � x� 70.8 7 � x� 80.9 8 � x� 91. True
� Función de distribución: F �x� �
00.30
0.35
0.450.600.800.90
1
si x� 2si 2 � x � 3
si 3� x� 4
si 4� x� 5si 5 � x � 7si 7 � x � 8si 8 � x � 9
si x� 9
Plot�CDF�dist5, x, �x, 0, 10�, Filling � Axis,
PlotRange � �0, 1�, AxesLabel � �HoldForm�"x", HoldForm�"F�x�"�
10
OCW2019: Curso práctico para el análisis e inferencia estadística con Mathematica
� b) Calcule P �X � 5�Probability�x � 5, x � dist50.4
� Solución: P �X � 5� � 0.4
� c) Calcule P �X � 3 X � 7�Probability�Conditioned�x �� 3, x � 7, x� dist50.0833333
Probability�x �� 3 � x � 7, x� dist50.0833333
� Solución: P �X � 3 X � 7� � 0.0833
� d) Calcule P �X � 7 X � 3�Probability�x � 7 � x � 3, x� dist50.692308
� Solución: P �X � 7 X � 3� � 0.69233
11