Informe Aplicativo de Muestreo
-
Upload
kevin-quispe-osccorima -
Category
Documents
-
view
224 -
download
0
description
Transcript of Informe Aplicativo de Muestreo
INFORME APLICATIVO DE LAS
TECNICAS DE MUESTREO
Por: Wilmots Ortiz huaman Kevin Albert Quispe Osccorima
INTRODUCCION
En el siguiente informe se presentara la aplicación de las técnicas de muestreo en una base de datos de una cartera de clientes de un banco emergente llamado “INKA BANK”, con un total de 5000 registros y 14 variables de estudio.
Se aplicaran los diversos métodos de muestreo utilizados en la materia y para cada caso calculando el total de la muestra y considerando el tamaño óptimo de esta; con el fin de estimar los valores de los parámetros poblaciones (media, total, total de clase y proporción).
Se contextualizará, para cada tipo de muestreo, su respectivo caso aplicativo para dar sentido a los resultados obtenidos y a las interpretaciones
A continuación detallaremos cada caso de muestreo
VARIABLES
1. VARIABLE: número de días de atraso máximo durante los 12 meses antes de la aprobación de crédito.Tipo de Variable: DiscretaEscala: NominalVariable: Cuantitativa
2. VARIABLE: Situación de la casa ( alquilada, familiar, otras o propia)Tipo de Variable: DiscretaEscala: Ordinal
1= alquilada2=familiar3= otras4=propia
Variable: Cualitativa
3. VARIABLE: EdadTipo de variable: ContinuaEscala: IntervaloVariable: Cuantitativa
4. VARIABLE: Máxima antigüedad con tarjeta de crédito en el sistema financiero en meses.Tipo de Variable: DiscretaEscala: NominalVariable: Cuantitativa
5. VARIABLE: Numero de meses con algún producto pasivo (ahorro) durante los 12 meses antes de la aprobación del crédito.Tipo de Variable: DiscretaEscala: NominalVariable: Cuantitativa
6. VARIABLE: Ingreso MensualTipo de Variable: ContinuaEscala: Nominal
Variable: Cuantitativa
7. VARIABLE: Monto de línea de crédito en el sistema financiero.Tipo de Variable: ContinuaEscala: NominalVariable: Cuantitativa
8. VARIABLE: Monto de saldo deudor promedio total en el sistema financieroTipo de Variable: ContinuaEscala: NominalVariable: Cuantitativa
9. VARIABLE: Scour con el que fue aprobada la tarjeta de banco.Tipo de Variable: ContinuaEscala: IntervaloVariable: Cuantitativa
10. VARIABLE: Número de veces con abono de pago de haberes en el banco durante los 12 meses antes de la aprobación de créditos.Tipo de Variable: ContinuaEscala: NominalVariable: Cuantitativa
11. VARIABLE: Zona geográfica.Tipo de Variable: DiscretaEscala: NominalVariable: Cualitativa
12. VARIABLE: Máxima clasificación de riesgos durante los 12 meses durante la aprobación de crédito.
Tipo de Variable: ContinuaEscala: ordinal
0= Normal1=CPP2=Deficiente3=Dudoso4=Perdida
Variable: Cualitativa
13. VARIABLE: Nivel educativo.Tipo de Variable: DiscretaEscala: ordinal
1= Sin Educación2= Educación básica3=Técnico4= Superior5= Profesional
Variable: Cualitativa
MUESTREO BIFASICO PARA ESTRATIFICACIÓN
Para este tipo de muestre se considerara el cálculo de estimadores infestados utilizando variables auxiliares para el caso de la media, total, proporción y total de clase.
Se tiene necesidad de extraer una muestra a poco costo y con suficiente precisión para estimar el promedio y total de mora de deuda (variable 8) entre los clientes y como variable auxiliar se considerara el grado de educación de los mismos.
También existe la necesidad de estimar la proporción de clientes con vivienda Propia (variable 2) para eso se usara como variable auxiliar el grado de educación como variable asociada.
En primera fase consideraremos como tamaño de muestra un muestreo aleatorio simple calculado por medio de un pre-muestreo de 1250 elementos
1. ESTIMACION DE INTERVALO DE CONFIANZA PARA θ USANDO DESIGUALDAD DE SHEBYSHEV
Muestra Pre-Muestreo Χ=η0=Z2S2
e2
1. VARIABLES CUANTITATIVAS
A. Tamaño de Muestra media : Χ=η0=Z2S2
e2
η0 :Variable 1: número de días de atraso máximo durante los 12 meses
antes de la aprobación de crédito.
η0 : Variable 3: Edad
η0 : Variable 4: Máxima antigüedad con tarjeta de crédito en el sistema
financiero en meses.
η0 : Variable 5: Numero de meses con algún producto pasivo (ahorro)
durante los 12 meses antes de la aprobación del crédito.
η0 : Variable 6: Ingreso Mensual
η0 : Variable 7: Monto de línea de crédito en el sistema financiero.
η0 : Variable 8: Monto de saldo deudor promedio total en el sistema
financiero
η0 : Variable 9: Score con el que fue aprobada la tarjeta de banco.
η0 : Variable 12: Número de veces con abono de pago de haberes en el
banco durante los 12 meses antes de la aprobación de créditos.
A. APLICANDO PARA LA MEDIA POBLACIONAL
η0=Z2S2
e2
Dónde:α=0.051−α=0.95Ζ=1.96e=1
η0 : Número de días de atraso máximo durante los 12 meses antes de la aprobación de crédito. e=1
η0=Z2S2
e2=¿687.30
n0=nonoN
+1=604.24
η0 : Variable: Edad
η0=Z2S2
e2=¿365.87
n0=nonoN
+1=340.92
η0 : Variable: Máxima antigüedad con tarjeta de crédito en el sistema
financiero en meses. e=3
η0=Z2S2
e2=¿458.40
n0=nonoN
+1=419.90
η0 : Variable: Numero de meses con algún producto pasivo (ahorro)
durante los 12 meses antes de la aprobación del crédito. e=0,5
η0=Z2S2
e2=¿188.70
n0=nonoN
+1=181.84
η0 : Variable: Ingreso Mensual e=500
η0=Z2S2
e2=¿392.32
n0=nonoN
+1=363.78
η0 : Variable: Monto de línea de crédito en el sistema financiero. e=1000
η0=Z2S2
e2=¿1465.06
n0=nonoN
+1=1133.06
η0 : Variable: Monto de saldo deudor promedio total en el sistema
financiero e=1000
η0=Z2S2
e2=¿419.45
n0=nonoN
+1=386.99
η0 : Variable: Score con el que fue aprobada la tarjeta de banco. e=3
η0=Z2S2
e2=¿ 170.26
n0=nonoN
+1=164.65
η0 : Variable: Número de veces con abono de pago de haberes en el banco
durante los 12 meses antes de la aprobación de créditos. e=0.5
η0=Z2S2
e2=¿420.65
n❑=nonoN
+1=388.01
2. VARIABLES CUALITATIVAS
B. APLICANDO PARA PROPORCION POBLACIONAL
Tamaño de Muestra: no=Z2PQe2
Dónde:
Z=1.96P=0.5Q=0.5
no: Variable 2: Situación de la casa ( 1 alquilada, 2 propia 3 otras 4 propia)
no=Z2PQe2
=338.70
n0=nonoN
+1=317.21
no: Variable 11: Zona geográfica.
no=Z2PQe2
=185.08
n0=nonoN
+1=178.47
no: Variable 12: Máxima clasificación de riesgos durante los 12 meses
durante la aprobación de crédito.
no=Z2PQe2
=¿355.74
n0=nonoN
+1=332.11
no: Variable 13: Nivel educativo.(1.S.E 2 E.B 3 Técnico 4. Superior 5.
Profesional)
no=Z2PQe2
=382.06
n0=nonoN
+1=354.94
Se resuelve utilizar la primera variable para tomar el tamaño de la muestra.
Resumen del procesamiento de los casos
Casos
Incluidos Excluidos Total
N Porcentaje N Porcentaje N Porcentaje
VAR01 * 604 de los primeros
5000 casos (SAMPLE)
604 100,0% 0 ,0% 604 100,0%
VAR03 * 604 de los primeros
5000 casos (SAMPLE)
604 100,0% 0 ,0% 604 100,0%
VAR04 * 604 de los primeros
5000 casos (SAMPLE)
604 100,0% 0 ,0% 604 100,0%
VAR05 * 604 de los primeros
5000 casos (SAMPLE)
604 100,0% 0 ,0% 604 100,0%
VAR06 * 604 de los primeros
5000 casos (SAMPLE)
604 100,0% 0 ,0% 604 100,0%
VAR07 * 604 de los primeros
5000 casos (SAMPLE)
604 100,0% 0 ,0% 604 100,0%
VAR09 * 604 de los primeros
5000 casos (SAMPLE)
604 100,0% 0 ,0% 604 100,0%
VAR10 * 604 de los primeros
5000 casos (SAMPLE)
604 100,0% 0 ,0% 604 100,0%
De esta muestra se extraen 2 estratos:
Profesional 302 Técnico 241
Sumando en total n´=543
1er caso (Y = Monto de saldo deudor, X = Educación del cliente)
Proporcionalmente se toma una segunda muestra utilizando un muestreo estratificado con afijación proporcional al tamaño muestral y se considera utilizar 200 elementos de la muestra de forma aleatoria quedando al final la siguiente muestra.
0,556 5908,71 120990260,49
0,444 4065,38 79644438,02
Siendo 0.556 la proporción de profesionales en el estrato 1 y 0.444 la proporción de técnicos en el segundo estrato, de aquí pasamos a calcular los estimadores.
Estimador Resultado
Total(estimado) 25`452,943.4
Media(estimado) 5090.58
Total(población)
Parámetro28´662,191.02
Media(población)
parámetro5732,43
Habiendo realizado el cálculo de los estimadores observamos una relativa aproximación al valor poblacional de la deuda de los clientes en el sistema financiero del mismo modo para el valor promedio de deuda de estos pacientes considerando como variable auxiliar el nivel de estudio.
Como nota aparte no se incluyeron en el cálculo la proporción de clientes que (con educación básica, superior y sin educación por representar una minoría en la muestra de la primera fase).
Varianza estimada resultado
Error de muestreo
541324,937
Error relativo
0,144531 (14,45%)
Para la estimación de las varianzas el error de muestreo denota una gran variabilidad poblacional y como error relativo el estimador tiene una precisión del 14,45% que indica la fiabilidad del estimador calculado.
2er caso (Y = Situación de la vivienda, X = Educación del cliente)
De la muestra de 604 se eliminan las demás clases de situación de vivienda (Alquilada y otras) al ser las de menor presencia entro de la muestra quedando viviendas propias y familiar (543 elementos).
1er muestreo 2do muestreo
Profesional 0,556 Propia 0,265
Técnico 0,444 Familiar 0,735
Para el segundo muestreo solo quedaron 200 elementos.
Estimador Resultado
Proporción(estimado) 0,4736
Total de clase(estimado) 2368
Proporción(población)
Parámetro0,2858
Total de clase(población)
parámetro1429
A diferencia del caso anterior los estimadores no se aproximan a sus valores poblacionales en proporción y total de clase. De esta manera podemos concluir que esta técnica de muestreo no es adecuada para el caso planteado sin embargo al igual que el caso anterior no se tomaron en cuenta los demás valores para el nivel de educación y el total de situaciones de vivienda)
Varianza estimada resultado
Error de muestre
o0,00246601
Error relativo
0,10485402 (10,48%)
El error de muestreo es discreto y se ve reflejada en la aparente fiabilidad mostrada por el coeficiente de variación sin embargo los resultados poblacionales indican que el tipo de muestreo no
AnexosPrueba de normalidad para variables cuantitativas (muestreo bifásico estratificado)
La normalidad es significativa para la variable 4 (máxima antigüedad con tarjeta de crédito) y la variable 10(Número de veces con abono de pago de haberes)