Informe Final Econometría

43
Universidad de talca

description

,

Transcript of Informe Final Econometría

Page 1: Informe Final Econometría

Universidad de talca

Page 2: Informe Final Econometría

ÍNDICE DE CONTENIDOS

ÍNDICE DE ANEXOS

Page 3: Informe Final Econometría

RESUMEN EJECUTIVO

Page 4: Informe Final Econometría

I. ANTECEDENTES GENERALES

Page 5: Informe Final Econometría

Todos los países desarrollados y subdesarrollados requieren de un factor fundamental para hacer

crecer a una nación, ésta es la educación. Se entiende por educación al proceso de socialización y

endoculturación de las personas a través del cual se desarrollan capacidades físicas e intelectuales,

habilidades, destrezas, técnicas de estudio y formas de comportamiento ordenadas con un fin social.

(Azúa H, Bascuñán P., Caballero C., Castro Q., & Figueroa F, 2007)

1.1 Definición de Educación.

El sistema educacional chileno se caracteriza por tener una organización descentralizada, lo cual

significa que su administración se realiza a través de instituciones del estado autónomas,

municipales, particulares y fundaciones, que asumen ante el Estado la responsabilidad de brindar

educación y mantener un establecimiento educacional.

Reconocido en la Constitución Política del Estado, está constituido por cuatro niveles

educacionales: el nivel preescolar, el nivel básico, el nivel medio y el nivel de educación superior.

Es de real importancia el manejo y eficiencia del sistema tanto para la sociedad como para las

autoridades del país, con el objetivo de controlar y hacer un seguimiento a la evolución de este se

aplica periódicamente una prueba llamada SIMCE. (Azúa H, Bascuñán P., Caballero C., Castro Q.,

& Figueroa F, 2007)

1.2 Definición de SIMCE

El SIMCE es el Sistema Nacional de Evaluación de resultados de aprendizaje del Ministerio de

Educación de Chile. Su propósito principal es contribuir al mejoramiento de la calidad y equidad de

la educación, informando sobre el desempeño de los estudiantes en diferentes subsectores del

currículum nacional, y relacionándolos con el contexto escolar y social en el que ellos aprenden.

Las pruebas SIMCE evalúan el logro de los Objetivos Fundamentales y Contenidos Mínimos

Obligatorios (OF-CMO) del Marco Curricular vigente en diferentes subsectores de aprendizaje, a

través de una medición que se aplica a nivel nacional(una vez al año) a los estudiantes que cursan

un determinado nivel educacional.

Hasta el año 2005, la aplicación de las pruebas se alternó entre 4º y 8° básico y 2° medio. A partir

del año 2006, se evalúa a los 4 ° básicos y se alternan 8° básico y 2° medio.

Además de las pruebas asociadas al currículum, el SIMCE recoge información sobre docentes,

estudiantes y padres y apoderados, a través de cuestionarios de contexto. Esta información se utiliza

Page 6: Informe Final Econometría

para contextualizar y analizar los resultados de los estudiantes en las pruebas SIMCE.

Las pruebas nacionales SIMCE evalúan lenguaje, matemática y ciencias (naturales y sociales).

LLECE (Laboratorio Latinoamericano de la Calidad de la Educación): Estudio

Internacional Comparativo sobre lenguaje, matemática y factores asociados. Evalúa

lenguaje y matemática en alumnos y alumnas de 3°, 4° y 6° básico de países

latinoamericanos. (Ministerio de Educación)

1.2.1 Comparación gráfica de puntajes SIMCE prueba de lenguaje y matemáticas año 2002 y 2008Se considera una muestra de promedios de puntajes SIMCE de los años 2002 y 2008 obtenidos en

las asignaturas de lenguaje y matemática a nivel nacional con el objetivo de analizar las diferencias

entre los puntajes en los distintos tipos de dependencias.

PONER GRAFICO

A simple vista las tablas parecen mostrar que ha habido un aumento general de los puntajes SIMCE

en los diversos subsectores en la cual esta prueba ha sido aplicada, sin embargo al analizarlos en

más profundidad podemos notar que en el caso de la prueba de lenguaje en las regiones de

Magallanes y la Antártica chilena y Antofagasta bajan sus rendimientos en menos de un 1% en los

establecimientos particulares pagados y en la Región Metropolitana la corporación privada baja,

aproximadamente, en un 7% su rendimiento. En el caso de la prueba de matemáticas se concluye de

los datos analizados, que en la región de Magallanes y la Antártica chilena todas las dependencias

bajan su puntaje en un 3% aproximado, mientras que en la Región Metropolitana, los

establecimientos que obtuvieron un mayor impacto, fue la corporación privada que disminuyó sus

puntajes en más de un 12%.En la región de Antofagasta, los puntajes, disminuyeron en un casi 4%

su rendimiento en todas las dependencias.

A continuación se mostrara la evolución grafica.

MOSTRAR GRAFICO

En general el pensamiento lógico sería creer que la variable dependencia, es la variable más directa

entre el tipo de colegio y el puntaje SIMCE, sin embargo los datos muestran que esta idea no se

cumple en todos los caso, es por ello que se ve necesario realizar un análisis más exhaustivo acerca

de cuáles son los factores y en que medidas afectan el puntaje SIMCE.

1.3 Planteamiento del ProblemaConocer los aspectos que determinan el puntaje SIMCE.

Page 7: Informe Final Econometría

1.4 Justificación del ProblemaSe espera que la presente investigación sea de referencia para la identificación de las variables que

afectan tanto positiva como negativamente al sistema educacional chileno, a través del puntaje

obtenido en la prueba SIMCE y a la potenciación de estos por parte del ministerio de educación, en

pro de un sistema equitativo y más eficiente en la utilización de recursos.

1.5 Objetivos y preguntas de InvestigaciónObjetivo General.

Determinar los factores que afectan el puntaje SIMCE obtenido por los cuartos básicos de

Chile desde 1998 al 2010.

Objetivos específicos.

Conocer los resultados del puntaje SIMCE y su evolución por género (masculino/femenino)

de los alumnos.

Conocer los resultados del puntaje SIMCE y su evolución por región geográfica.

Conocer los resultados del puntaje SIMCE y su evolución por zona (urbana/rural).

Conocer los resultados del puntaje SIMCE y su evolución por dependencia.

Conocer los resultados del puntaje SIMCE y su evolución por estrato social.

Preguntas de Investigación.

¿Cómo afecta la variable socioeconómica en el puntaje SIMCE?

¿Cómo afecta la variable zona (urbana/rural) en el puntaje SIMCE?

¿Cómo afecta al puntaje SIMCE el tipo de dependencia en que se encuentran los alumnos?

¿Cómo afecta al puntaje SIMCE la inasistencia a la educación preescolar?

¿Cómo afecta al puntaje SIMCE la tasa de inasistencia a clases de los alumnos?

¿Cómo afecta la variable tasa profesor-alumnos en el puntaje SIMCE?

¿Cómo afecta al puntaje SIMCE la variable género (masculino/femenino) de los alumnos?

¿Cómo afecta la región geográfica al puntaje SIMCE?

Page 8: Informe Final Econometría

II. ESTADO DEL ARTE.

Análisis de Papers Científicos

En Chile, existe una problemática latente respecto a la eficiencia del actual sistema educacional,

con relación a esto, (Donoso D., Aguirre G., Espinoza B., Manríquez G., & Silva C., 1999)

reconocen que “es complejo identificar el producto educacional, dado a que éste no sólo se

relaciona con el rendimiento de los alumnos en las escuelas, sino que también con su inserción en

el mundo laboral” (p. 24). Es por ello, que es fundamental alcanzar resultados deseables durante las

etapas escolares, pero como lo señala Levin (1991) “el éxito escolar depende en muchas

oportunidades de factores que se encuentran fuera de la escuela” (p. 24). Dentro de los factores

exógenos se pueden mencionar la educación de los padres, nutrición, condiciones de vivienda,

recursos materiales, acceso a prestaciones de salud, entre otros. Por otra parte, es posible identificar

que existen diversas variables que inciden en el logro de un estudiante al momento de rendir las

pruebas SIMCE, tales como la relación existente con sus familiares, pares, escuela y profesores.

Estas juegan un papel crucial interactuando entre sí y con las habilidades innatas o potencial de

aprendizaje del estudiante. Según Mizala en (Donoso D., Aguirre G., Espinoza B., Manríquez G., &

Silva C., 1999) “las variables explicativas se pueden clasificar en las relativas a: características de la

familia (ingreso familiar, nivel de educación y características de la estructura familiar, ausencia de

uno o más padres y tamaño de la familia), de los estudiantes (sexo, edad y raza), de la escuela

(infraestructura pública o privada, localización urbano o rural, tamaño de los cursos, matrícula de la

escuela, número de administrativos por alumno) y de los docentes (nivel formal de educación,

experiencia en la profesión, perfeccionamiento y salarios)” (p. 24). Con respecto a la familia, esta

ejerce una poderosa influencia en la educación de los hijos, siendo los padres los que cumplen un

rol fundamental en el proceso enseñanza-aprendizaje, ya que si se preocupan de la educación de sus

hijos y colaboran con los profesores, los niños presentan buen rendimiento y se adaptan fácilmente

a la escuela. Entre las variables familiares que influyen positivamente en el rendimiento escolar se

encuentran el nivel de educación de los padres y el nivel de ingreso familiar. En relación a la

escuela Summers y Wolf (Contreras & Macías, 2002) encuentran que “el efecto tamaño no es

significativo” (p. 399), sin embargo, los estudiantes que son asignados a clases con un menor

número de alumnos obtienen mejores puntajes en las pruebas SIMCE. Investigaciones realizadas en

Chile en base a si asistir a un tipo de establecimiento particular pagado, particular subvencionado o

municipalizado arroja diferencias significativas en cuanto a resultados. Rodríguez (1988), Aedo y

Page 9: Informe Final Econometría

Larrañaga (1994) y Aedo (1997) concluyen que “los colegios particulares subvencionados obtienen

mejores resultados que los municipalizados” (p. 400) (Contreras & Macías, 2002).

Para Aedo y Larrañaga (1994) y Aedo (1997) considera que en Chile la variable socioeconómica es

una de las más importantes, sosteniendo que “factores como el índice de vulnerabilidad de la

escuela y las características de ingreso promedio de los alumnos están asociados fuertemente al

logro educacional” (p. 25). Idea fuertemente respaldada por los estudios pedagógicos de la

Universidad Austral de Chile, los que sostienen que la vulnerabilidad socioeconómica es una

variable que afecta significativamente el rendimiento de los alumnos en el SIMCE. En Chile, el

Programa de Escuelas Críticas lo comprueba, señalando que las escuelas que reciben intervención,

incrementan sustancialmente sus niveles de aprendizaje en las mediciones SIMCE. Como lo afirma

Fullan (Volante Beach, Cumsille Eltit, Denardin Gonçalves, & Müller Araya, 2008) ha descrito

factores de sustentabilidad que explican los cambios en las escuelas y ha determinado variables

como el mejoramiento del ambiente escolar, mejoramiento de procesos organizacionales y

monitoreo de procesos de cambios con el objetivo de dar seguimiento a lo anteriormente señalado.

Antiguamente la diferencia entre hombres y mujeres en los resultados de los test de inteligencia y

de logros educacionales era objeto de investigación. Las diferencias de género, en base a miles de

estudios realizados en los inicios de los años setenta, según Maccoby y jacklin (1974) señalan que

“los hombres lograban mejores resultados en los tests de habilidades cuantitativas(matemática y

física) desde los 13 años, mientras que las mujeres se desempeñaban mejor en lectura y

escritura”(p.23).Hoy en día los resultados de la prueba simce de acuerdo al género, no presenta

significancia, es decir, representan equidad.

La condición de Actividad Económica es uno de los principales temas investigados en los censos

nacionales y encuestas de hogares, que permiten clasificar a la población entre económicamente

activa y económicamente inactiva , según sea el tipo de actividad que realizan las personas, de

acuerdo a los resultados ,las mujeres , las personas jóvenes y residentes en zonas rurales fueron las

más afectadas en la captación de su condición de actividad , mientras que para los hombres, sobre

todo de zonas urbanas, se lograron mejores resultados”, lo que se ve reflejado en que los hombres

proporcionan mayor capacidad física.

Page 10: Informe Final Econometría

2.2 Análisis de Variables que Afectan el Rendimiento de los Alumnos en el Puntaje SIMCE de 4° BásicoSe han seleccionado variables en función del grado de incidencia que tienen en el rendimiento

escolar en conjunto con la información proporcionada por el SIMCE. Siendo Y la variable

endógena y X las variables exógenas.

Variable endógena (Y):

Y: Resultado del SIMCE para los alumnos de 4° básico comprendido entre los años 1998 a

2010 a nivel nacional.

Variables exógenas (X):

Nivel socioeconómico (X1): Nivel de educación de los padres y disponibilidad de

alimentación escolar, debido a su gran incidencia en el rendimiento escolar. Estas se

asocian al grado de vulnerabilidad.

Infraestructura de la escuela (X2): Características medibles de los establecimientos

educacionales considerados a nivel nacional.

Eficiencia escolar (X3): Corresponde a la eficiencia interna de la unidad educativa para

llevar a cabo el proceso educacional. Se consideran tasa de promoción, de repitencia, de

retiro y tasa de éxito oportuno. Se elabora a partir de información entregada por el

establecimiento.

Dependencia del establecimiento (X4): Corresponde al tipo de establecimiento educacional

ya sea particular subvencionado, particular pagado, corporación municipal, corporación

privada y municipal.

Cobertura (X5): Se mide como la fracción de alumnos que pertenecen al sistema educativo

formal, con respecto a la población en edad escolar del área geográfica en análisis.

Desarrollo personal (X6): Identifica el grado de internalización de los alumnos. Se realiza

mediante un test diseñado para medir estos efectos.

Logro de objetivos académicos por los alumnos (X7): Permite identificar el nivel de logro

de los objetivos propuestos para las asignaturas básicas (castellano, matemáticas, ciencias

sociales y naturales). Se obtiene mediante pruebas que se aplican a los alumnos.

Aceptación de la labor educacional (X8): Se utiliza para establecer el grado de satisfacción

de los alumnos, padres y profesores con la educación impartida por el establecimiento.

Precisa la percepción de estos grupos respecto de lo que el establecimiento entrega en

materia de contenidos, trato personal, infraestructura y equipamiento. Se realiza mediante

una encuesta cerrada a cada grupo.

Page 11: Informe Final Econometría

Tasa profesor-alumno (X9): Influye directamente en la forma de brindar conocimientos y

metodologías a los alumnos lo que se ve reflejado en su rendimiento escolar.

Total de alumnos matriculados (X10): Determina el tamaño del establecimiento e

infraestructura.

Días efectivos de clases (X11): Cantidad de días que se realizan actividades académicas al

interior del establecimiento educacional. En la práctica es declarada como constante debido

a que no existe la posibilidad de conocer su real comportamiento.

Escuelas de mujeres, hombres y mixtos (X12): Esta variable hace referencia al tipo de

alumnos que existen al interior de las dependencias. En la actualidad la tendencia se da al

aumento de colegios mixtos.

Existencia de educación preescolar (X13): Es importante considerarla debido a que en esta

etapa se desarrollan habilidades que son significativas en el rendimiento futuro de los niños.

Tasa de aprobación (X14): Existe una relación positiva entre la tasa de aprobación en la

enseñanza básica y el rendimiento del establecimiento.

Tasa de deserción (X15): Es un factor para determinar la menor demanda por el colegio.

Tasa de aceptación de la labor educativa por parte de los padres y/o

apoderados(X16): Refleja el nivel de satisfacción respecto del establecimiento.

Zona geográfica(X16): Se considera para conocer si existe alguna diferencia en el resultado

obtenido en el SIMCE, dependiendo de su ubicación.

Tasa de Denuncias de violencia intrafamiliar(X17): Corresponden a las denuncias hechas por

maltratos de índole físico o sicológico que acontecen en los hogares. La importancia de esta

variable radica en la influencia que puede tener esta en los menores a la hora de evaluar su

rendimiento escolar. [N° de Denuncias / Población de la comuna].

Tasa de establecimientos municipales (X18): Corresponde a la proporción que existe en una

comuna sobre el total de establecimiento (Colegios Privados, Colegios Pagados, Colegios

Subvencionados y Municipales) y los Municipales. Con el fin de observar si existe una

relación entre estas variables. [N° de establecimientos municipales / N° de establecimientos

en la comuna].

Porcentaje de Analfabetos (X19): Esta variable se obtiene al medir la capacidad de leer y

escribir a una edad determinada en una comuna. La importancia radica en que al tener altos

niveles de analfabetización y de educación en general, estos pueden impedir el desarrollo

económico de un país, especialmente en un mundo que cambia rápidamente impulsado por

la tecnología. Lo que trae como consecuencia una comuna con menos nivel educacional.

[N° de analfabetos / Población de la comuna]

Page 12: Informe Final Econometría

Tasa de Deserción escolar(X20): Tal como indica el nombre, corresponde a la cantidad de

alumnos que abandonan el colegio, y cuyo motivo es diferente al cambio de

establecimiento, esto fue llevado a porcentaje, dividiendo por el total de alumnos de cada

comuna. [Porcentaje de deserción en la enseñanza básica]

Tasa de Asistencia(X21): Corresponde al promedio anual del total de asistencias de los

alumnos de una comuna dividido en el total de asistencia que se hubiese obtenido si nadie

hubiese faltado. [Porcentaje de asistencia a nivel comunal]

Tasa de Población Económico Activa(X22): Porcentaje de personas de 15 años de edad o

más, que proporcionan mano de obra para la producción de bienes y servicios. En cada

comuna analizada. [Porcentaje]

III. FUENTES DE INFORMACIÓN

Los datos obtenidos para la realización del presente informe han sido rescatados de la base de datos

SIMCE comprendida entre los años 1998 a 2010. Estos corresponden a fuentes secundarias de

información, recuperadas de la página Web del MINEDUC.

En primera instancia se realizó una investigación exploratoria, la cual consistió en recopilar

información acerca de las posibles variables que podrían explicar el rendimiento SIMCE de 4°

básico a nivel nacional. Posteriormente, se realizó una investigación descriptiva con el objetivo de

determinar cuáles de éstas son significativas para el modelo y las que no lo son desecharlas.

Dado que las variables obtenidas en la base de datos SIMCE son de carácter cuantitativas fue

preciso realizar un proceso de transformación de variables, el que consistió en transformarlas a

dicotómicas, con el fin de mejorar los resultados del modelo. Una vez que fueron obtenidas, el

modelo a utilizar es de tipo causal al que se le aplicará una función Semi-Logarítmicas y una Cobb-

Douglas.

Page 13: Informe Final Econometría

IV. ANÁLISIS DE DATOS

4.1 VARIABLES DEPENDIENTES1. Logaritmo Natural del puntaje promedio del año 2010 de Lectura Ln(PPL): Variable

continua que muestra el logaritmo natural de la variable puntaje promedio del año 2010 del

establecimiento.

2. Logaritmo Natural del puntaje promedio del año 2010 en Educación Matemáticas

Ln(PPM): Variable continua que muestra el logaritmo natural de la variable puntaje

promedio del año 2010 del establecimiento.

4.2 VARIABLES INDEPENDIENTES

4.2.1 Descripción de las Variables Continuas 1. Alumnos con puntaje del año 2010 del establecimiento en Lectura (TEL): variable continua

que muestra a los alumnos con puntaje e el año 2010 en la región en Lectura

2. Alumnos con puntaje del año 2010 del establecimiento en Educación Matemática (TEM):

variable continua que muestra a los alumnos con puntaje e el año 2010 en la región en

Educación Matemática.

3. Logaritmo natural de Alumnos con puntaje del año 2010 del establecimiento en Lectura

(LNTEL)

4. Logaritmo natural de Alumnos con puntaje del año 2010 del establecimiento en Educación

Matemáticas (LNTEM)

4.2.2 Descripción de las Variables Dicotómicas1. ZN: Variable dicotómica que representa la Zona Norte (1=ZN; 0=Otra Zona)

Zona Norte compuesta por las siguientes regiones:

Valor Etiqueta

Nombre Región

NR1

NR2

NR3

NR4

NR5

NR6

Arica-Parinacota

Tarapacá

Antofagasta

Atacama

Coquimbo

Valparaíso

Page 14: Informe Final Econometría
Page 15: Informe Final Econometría

ZC: Variable dicotómica que representa la Zona Centro (1=ZC; 0=Otra Zona)

Zona Centro compuesta por las siguientes regiones:

Valor Etiqueta

Nombre Región

NR7

NR8

NR9

NR10

Arica-Parinacota

Tarapacá

Antofagasta

Biobío

ZS: Variable de criterio

Zona Sur compuesta por las siguientes regiones:

Valor Etiqueta

Nombre Región

NR11

NR12

NR13

NR14

NR15

Araucanía

De los Ríos

De los Lagos

De Aysén del General Carlos Ibáñez del

Campo

De Magallanes

2. DP: Variable dicotómica que representa la Dependencia del Establecimiento (1=DP; 0=Otro

Caso)

Dependencia del Establecimiento se compone de la siguiente forma:

Valor Etiqueta

Tipo de Dependencia

DP1,2

DP4,5

Corporación Municipal y Dirección de

Administración de Educación Municipal

Particular Pagado y Corporación Privada

Page 16: Informe Final Econometría

DP3: Variable de criterio: Particular Subvencionado.

3. GS: variable dicotómica que representa el Grupo Socioeconómico (1=GS; 0=Otro Caso)

Grupo Socioeconómico se compone de la siguiente forma:

Valor Etiqueta

Tipo de Grupo Socioeconómico

GS1,2

GS4,5

A y B. Medio Bajo y Bajo

D y E. Medio Alto y Alto

(GS3): Variable de Criterio: C. Medio

Page 17: Informe Final Econometría

V. MODELOS DE REGRESIÓN

5.1 MODELO SEMI-LOGARÍTMICO EN LA ASIGNATURA DE LECTURA. LN(PPL)= β0 + β1 TEL - β2 MUN + β3 PART - β4 GBAJO + β5 GALTO

La variable dependiente incluida en este modelo es el logaritmo natural del puntaje promedio del

año 2010 del establecimiento en Lectura; y como variables exógenas se incluyen las variables

dicotómicas, entre las que se encuentran Grupo Socioeconómico y Tipo de dependencia, además de

incorporar la variable continua correspondiente al número de alumnos con puntaje 2010 en el

establecimiento en Lectura. Al agrupar las regiones en tres zonas estas tienden a homogeneizar los

resultados, por lo que se eliminarán dentro de este análisis. (Ver anexo 1)

El siguiente paso consistió en realizar el modelo de regresión, el cual arrojó que todas las variables

se encuentran en región de rechazo, lo que indica que todas las variables son significativas para el

modelo. Con respecto a este modelo se obtuvo un R2 de 0,332; el que explica en un 33.2% de toda

la variabilidad de la variable puntaje promedio del año 2010 del establecimiento en Lectura, esto lo

hace ser representativo para nuestra investigación.

Con respecto a la prueba F global el modelo presenta un valor-p de 0,000 el que contrastado con un

nivel de significación del 5% indica que la hipótesis nula se rechaza, por ende, el modelo es

globalmente significativo y puede ser utilizado con fines predictivos RR:{valor-p < α} (Ver anexo

1).

En relación a la capacidad explicativa se analizará la siguiente tabla:

Hipótesis Valor-p DecisiónH0: β1=0, H1: β1≠1H0: β2=0, H1: β2≠1H0: β3=0, H1: β3≠1H0: β4=0, H1: β4≠1H0: β5=0, H1: β5≠1

0,0000,0080,0000,0000,000

Se rechaza H0

Se rechaza H0

Se rechaza H0

Se rechaza H0

Se rechaza H0

Por lo tanto todas las variables son significativas para el modelo y pueden ser utilizadas con fines explicativos.

Page 18: Informe Final Econometría

5.2 MODELO SEMI-LOGARÍTMICO EN LA ASIGNATURA DE MATEMÁTICA.LN(PPM)= β0 + β1 TEM - β2 MUN + β3 PART - β4 GBAJO + β5 GALTO

La variable dependiente incluida en este modelo es el logaritmo natural del puntaje promedio del

año 2010 del establecimiento en la asignatura de Matemática; y como variables exógenas se

incluyen las variables dicotómicas, entre las que se encuentran Grupo Socioeconómico y Tipo de

dependencia, además de incorporar la variable continua correspondiente al número de alumnos con

puntaje 2010 en el establecimiento en la asignatura de Matemática. Al agrupar las regiones en tres

zonas estas tienden a homogeneizar los resultados, por lo que se eliminarán dentro de este análisis.

El siguiente paso consistió en realizar el modelo de regresión, el cual arrojó una variable en región

de aceptación, lo que explica que la diferencia entre la variable Dependencia Municipal (MUN) y

Dependencia Subvencionada (variable de criterio) no es significativa. Con respecto a este modelo se

obtuvo un R2 de 0,388; el que explica en un 38,8% de toda la variabilidad de la variable puntaje

promedio del año 2010 del establecimiento en la asignatura de Matemática.

Con respecto a la prueba F global el modelo presenta un valor-p de 0,000 el que contrastado con un

nivel de significación del 5% indica que la hipótesis nula se rechaza, por ende, el modelo es

globalmente significativo y puede ser utilizado con fines predictivos RR:{valor-p < α} (Ver anexo

2).

En relación a la capacidad explicativa se analizará la siguiente tabla:

Hipótesis Valor-p DecisiónH0: β1=0, H1: β1≠1H0: β2=0, H1: β2≠1H0: β3=0, H1: β3≠1H0: β4=0, H1: β4≠1H0: β5=0, H1: β5≠1

0,0000,8620,0000,0000,000

Se rechaza H0

No se rechaza H0

Se rechaza H0

Se rechaza H0

Se rechaza H0

La variable dicotómica MUN está en región de aceptación, por lo que esta no es significativamente distinta a la variable de criterio.

Page 19: Informe Final Econometría

5.3 MODELO LOGARÍTMICO-LOGARÍTMICO DE LECTURA.

LN(PPL)= β0 + β1 LN(TEL) - β2 MUN + β3 PART - β4 GBAJO + β5 GALTO

La variable dependiente incluida en este modelo es el logaritmo natural del puntaje promedio del

año 2010 del establecimiento en Lectura; y como variables exógenas se incluyen las variables

dicotómicas, entre las que se encuentran Grupo Socioeconómico y Tipo de dependencia, además de

incorporar la variable logarítmica correspondiente al número de alumnos con puntaje 2010 en el

establecimiento en Lectura. Con respecto a la Zona, es importante señalar que al agrupar las

regiones en tres zonas estas tienden a homogeneizar los resultados, por lo que se eliminará del

análisis.

El siguiente paso consistió en realizar el modelo de regresión, el cual arrojó que todas las variables

se encuentran en región de rechazo, lo que indica que todas las variables son significativas para el

modelo. Con respecto a este modelo se obtuvo un R2 de 0,329; el que explica en un 32.9% de toda

la variabilidad de la variable puntaje promedio del año 2010 del establecimiento en Lectura, esto lo

hace ser representativo para nuestra investigación.

Con respecto a la prueba F global el modelo presenta un valor-p de 0,000 el que contrastado con un

nivel de significación del 5% indica que la hipótesis nula se rechaza, por ende, el modelo es

globalmente significativo y puede ser utilizado con fines predictivos RR:{valor-p < α} (Ver anexo

3).

En relación a la capacidad explicativa se analizará la siguiente tabla:

Hipótesis Valor-p DecisiónH0: β1=0, H1: β1≠1H0: β2=0, H1: β2≠1H0: β3=0, H1: β3≠1H0: β4=0, H1: β4≠1H0: β5=0, H1: β5≠1

0,0000,0100,0000,0000,000

Se rechaza H0

Se rechaza H0

Se rechaza H0

Se rechaza H0

Se rechaza H0

Por lo tanto todas las variables son significativas para el modelo y pueden ser utilizadas con fines

explicativos.

Page 20: Informe Final Econometría

5.4 REGRESIÓN LOGARÍTMICO-LOGARÍTMICO MATEMÁTICALN(PPM)= β0 + β1 LN(TEM) - β2 MUN + β3 PART - β4 GBAJO + β5 GALTO

La variable dependiente incluida en este modelo es el logaritmo natural del puntaje promedio del

año 2010 del establecimiento en educación Matemática; y como variables exógenas se incluyen las

variables dicotómicas, entre las que se encuentran Grupo Socioeconómico y Tipo de dependencia,

además de incorporar la variable logarítmica correspondiente al número de alumnos con puntaje

2010 en el establecimiento en educación Matemática. Con respecto a la Zona, es importante señalar

que al agrupar las regiones en tres zonas estas tienden a homogeneizar los resultados, por lo que se

eliminará del análisis.

El siguiente paso consistió en realizar el modelo de regresión, el cual arrojó una variable en región

de aceptación, lo que explica que la diferencia entre la variable Dependencia Municipal (MUN) y

Dependencia Subvencionada (variable de criterio) no es significativa. Con respecto a este modelo se

obtuvo un R2 de 0,388; el que explica en un 38,8% de toda la variabilidad de la variable puntaje

promedio del año 2010 del establecimiento en la asignatura de Matemática.

Con respecto a la prueba F-Global el modelo presenta un valor-p de 0,000 el que contrastado con un

nivel de significación del 5% indica que la hipótesis nula se rechaza, por ende, el modelo es

globalmente significativo y puede ser utilizado con fines predictivos RR:{valor-p < α} (Ver anexo

4).

En relación a la capacidad explicativa se analizará la siguiente tabla:

Hipótesis Valor-p DecisiónH0: β1=0, H1: β1≠1H0: β2=0, H1: β2≠1H0: β3=0, H1: β3≠1H0: β4=0, H1: β4≠1H0: β5=0, H1: β5≠1

0,0000,8450,0000,0000,000

Se rechaza H0

No se rechaza H0

Se rechaza H0

Se rechaza H0

Se rechaza H0

La variable dicotómica MUN está en región de aceptación, por lo que esta no es significativamente distinta a la variable de criterio.

Page 21: Informe Final Econometría

Dado que la función Cobb-Douglas es una función de producción, esta representa a cabalidad el

objetivo de mirar el sistema educacional chileno como un sistema productivo, donde la eficiencia

del producto es medido por diversos instrumentos formales, en este caso el SIMCE.

Considerando, además, la capacidad que tiene este tipo de función de otorgar distintas importancias

a cada parámetro (β) y con ello la importancia de cada variable.

LN(Y)= β0 + β1 LN(TE) – β2 MUN + β3 PART - β4 GBAJO + β5 GALTO

Donde:

TE: alumnos con puntaje del año 2010 del establecimiento en Lectura y Educación

Matemática, para cada caso.

MUN, PART, GBAJO y GALTO representan a las variables dicotómicas.

Análisis de los signos

LNTEL: el coeficiente dice en relación con su signo positivo, que mientras mayor sea el

número de alumnos de un establecimiento está asociado a un mayor rendimiento de las

pruebas SIMCE, dado que si un colegio tiene buen rendimiento en consecuencia tendrá

mayor demanda de alumnos, por lo que se asocia tamaño a rendimiento.

MUN: el coeficiente dice en relación con su signo negativo, que en comparación con la

variable de criterio Dependencia Subvencionado, éste presenta un menor rendimiento.

PART: el coeficiente dice en relación con su signo positivo, que en comparación con la

variable de criterio Dependencia Subvencionado, éste presenta un mayor rendimiento.

GBAJO: el coeficiente dice en relación con su signo negativo, que en comparación con la

variable de criterio Grupo Socioeconómico Medio, éste presenta un menor rendimiento.

GALTO: el coeficiente dice en relación con su signo negativo, que en comparación con la

variable de criterio Grupo Socioeconómico Medio, éste presenta un menor rendimiento.

1. Propuesta de modelos

1.1 MODELO LOGARÍTMICO - LOGARÍTMICO LECTURA.

Page 22: Informe Final Econometría

Resumen del modelo

Modelo R R cuadrado

R cuadrado

corregida

Error típ. de la

estimación

1 ,574a ,329 ,329 ,07627

a. Variables predictoras: (Constante), LNTEL, PART, MUN, GALTO,

GBAJO

El modelo final de lectura explica un 32,9% de la variable dependiente, es decir, del logaritmo

natural del puntaje promedio en Lectura en el año 2010. Como variables exógenas se tomaron las

siguientes variables dicotómicas: grupo socioeconómico y tipo de dependencia, junto con una

variable continua logarítmica correspondiente al número de alumnos con puntaje 2010 en el

establecimiento en la asignatura de Lectura. La variable dicotómica Zona

Para determinar si el modelo es globalmente significativo se realizó la siguiente tabla:

ANOVAb

Modelo

Suma de

cuadrados gl

Media

cuadrática F Sig.

1 Regresión 16,327 5 3,265 561,320 ,000a

Residual 33,234 5713 ,006

Total 49,560 5718

a. Variables predictoras: (Constante), LNTEL, PART, MUN, GALTO, GBAJO

b. Variable dependiente: LNPPL

Hipótesis nula H0: βi = 0

Hipótesis alternativa H1: βi ≠ 0

El F-Global calculado se encuentra en región de rechazo. Además el p-value es menor que el nivel

de significancia del 5% (p-value = 0,000 < α = 0,05). Por lo tanto el modelo es globalmente

significativo, en consecuencia, el modelo puede ser utilizado con fines de pronóstico.

En relación a la capacidad explicativa, se realizaron pruebas t-student.

Page 23: Informe Final Econometría

Coeficientesa

5,577 ,006 995,817 ,000

,006 ,001 ,049 4,103 ,000

-,007 ,003 -,035 -2,590 ,010

,038 ,005 ,102 7,921 ,000

-,050 ,003 -,268 -17,372 ,000

,065 ,003 ,277 18,713 ,000

(Constante)

LNTEL

MUN

PART

GBAJO

GALTO

Modelo1

B Error típ.

Coeficientes noestandarizados

Beta

Coeficientesestandarizad

os

t Sig.

Variable dependiente: LNPPLa.

Por lo tanto como todas las variables se encuentran en región de rechazo (p-value < α = 0,05) éstas

son significativas para el modelo y pueden ser utilizadas con fines explicativos.

1.2 MODELO LOGARÍTMICO – LOGARÍTMICO EN EDUCACIÓN MATEMÁTICA.

Resumen del modelo

Modelo R R cuadrado

R cuadrado

corregida

Error típ. de la

estimación

1 ,623a ,388 ,387 ,09565

a. Variables predictoras: (Constante), LNTEM PART, MUN, GALTO,

GBAJO

El modelo final de lectura explica un 38,8% de la variable dependiente, es decir, del logaritmo

natural del puntaje promedio en Educación Matemáticas en el año 2010. Como variables exógenas

se tomaron las siguientes variables dicotómicas: grupo socioeconómico, tipo de dependencia y

zona, junto con una variable continua logarítmica correspondiente al número de alumnos con

puntaje 2010 en el establecimiento en la asignatura de Matemáticas.

Para determinar si el modelo es globalmente significativo se realizó la siguiente tabla:

Page 24: Informe Final Econometría

ANOVAb

Modelo

Suma de

cuadrados gl

Media

cuadrática F Sig.

1 Regresión 33,038 5 6,608 722,267 ,000a

Residual 52,173 5703 ,009

Total 85,211 5708

a. Variables predictoras: (Constante), PART, MUN, GALTO, GBAJO, LNTEM

b. Variable dependiente: LNPPM

Hipótesis nula H0: βi = 0

Hipótesis alternativa H1: βi ≠ 0

El F calculado se encuentra en región de rechazo. Además el p-value es menor que el nivel de

significancia del 5% (p-value = 0,000 < α = 0,05). Por lo tanto el modelo es globalmente

significativo, en consecuencia, el modelo puede ser utilizado con fines de pronóstico.

En relación a la capacidad explicativa, se realizaron pruebas t-student.

Coeficientesa

5,442 ,007 774,348 ,000

-,001 ,003 -,003 -,195 ,845

,068 ,006 ,140 11,298 ,000

-,062 ,004 -,254 -17,237 ,000

,092 ,004 ,298 21,035 ,000

,020 ,002 ,134 11,643 ,000

(Constante)

MUN

PART

GBAJO

GALTO

LNTEM

Modelo1

B Error típ.

Coeficientes noestandarizados

Beta

Coeficientesestandarizad

os

t Sig.

Variable dependiente: LNPPMa.

La variable dicotómica MUN está en región de aceptación, por lo que esta no es significativamente

distinta a la variable de criterio.

2. Diagnósticos de Multicolinealidad.

Page 25: Informe Final Econometría

2.1 MODELO LOGARÍTMICO - LOGARÍTMICO LECTURA.

Para conocer si el modelo presenta problemas de Multicolinealidad es necesario realizar los

siguientes test: Índice de Tolerancia, donde los valores de las variables deben ser superiores a 0,1

(Tol<0,1), Factor de Inflación de la Varianza donde los valores de las variables deben ser inferiores

a 10 (FIV≥10) e Índice de Condición donde los valores de las variables deben ser inferiores a 30

(Ic> 30 Multicolinealidad grave; 10≤Ic≤30 Multicolinealidad moderada).

Diagnósticos de colinealidada

3,415 1,000 ,00 ,02 ,01 ,01 ,01 ,00

1,622 1,451 ,00 ,02 ,15 ,02 ,10 ,00

,502 2,609 ,00 ,05 ,72 ,03 ,14 ,01

,246 3,727 ,01 ,62 ,08 ,01 ,49 ,03

,196 4,173 ,00 ,29 ,03 ,67 ,24 ,02

,019 13,390 ,98 ,00 ,01 ,26 ,02 ,94

Dimensión1

2

3

4

5

6

Modelo1

AutovalorIndice decondición (Constante) MUN PART GBAJO GALTO LNTEL

Proporciones de la varianza

Variable dependiente: LNPPLa.

Por lo tanto, el modelo no presenta problemas de Multicolinealidad.

Coeficientesa

5,577 ,006 995,817 ,000

,006 ,001 ,049 4,103 ,000 ,807 1,239

-,007 ,003 -,035 -2,590 ,010 ,644 1,552

,038 ,005 ,102 7,921 ,000 ,705 1,419

-,050 ,003 -,268 -17,372 ,000 ,492 2,033

,065 ,003 ,277 18,713 ,000 ,535 1,868

(Constante)

LNTEL

MUN

PART

GBAJO

GALTO

Modelo1

B Error típ.

Coeficientes noestandarizados

Beta

Coeficientesestandarizad

os

t Sig. Tolerancia FIV

Estadísticos decolinealidad

Variable dependiente: LNPPLa.

Page 26: Informe Final Econometría

2.2 MODELO LOGARÍTMICO – LOGARÍTMICO EN EDUCACIÓN MATEMÁTICA.

Para conocer si el modelo presenta problemas de Multicolinealidad es necesario realizar los

siguientes test: Índice de Tolerancia donde los valores de las variables deben ser superiores a 0,1

(Tol<0,1); Factor de Inflación de la Varianza donde los valores de las variables deben ser inferiores

a 10 (FIV≥10) e Índice de Condición donde los valores de las variables deben ser inferiores a 30

(Ic> 30 Multicolinealidad grave; 10≤Ic≤30 Multicolinealidad moderada).

Coeficientesa

5,442 ,007 774,348 ,000

,020 ,002 ,134 11,643 ,000 ,809 1,236

-,001 ,003 -,003 -,195 ,845 ,644 1,554

,068 ,006 ,140 11,298 ,000 ,704 1,420

-,062 ,004 -,254 -17,237 ,000 ,493 2,027

,092 ,004 ,298 21,035 ,000 ,535 1,869

(Constante)

LNTEM

MUN

PART

GBAJO

GALTO

Modelo1

B Error típ.

Coeficientes noestandarizados

Beta

Coeficientesestandarizad

os

t Sig. Tolerancia FIV

Estadísticos decolinealidad

Variable dependiente: LNPPMa.

Diagnósticos de colinealidada

3,416 1,000 ,00 ,00 ,02 ,01 ,01 ,01

1,622 1,451 ,00 ,00 ,02 ,15 ,02 ,10

,501 2,610 ,00 ,01 ,05 ,72 ,03 ,14

,246 3,730 ,01 ,03 ,61 ,08 ,01 ,49

,196 4,174 ,00 ,02 ,29 ,03 ,68 ,24

,019 13,391 ,98 ,94 ,00 ,01 ,26 ,02

Dimensión1

2

3

4

5

6

Modelo1

AutovalorIndice decondición (Constante) LNTEM MUN PART GBAJO GALTO

Proporciones de la varianza

Variable dependiente: LNPPMa.

Por lo tanto, el modelo no presenta problemas de Multicolinealidad.

Page 27: Informe Final Econometría

3. Diagnósticos de Heterocedasticidad.

3.1 MODELO LOGARÍTMICO - LOGARÍTMICO LECTURA.

Correlaciones

1,000 -,208**

. ,000

7923 5719

-,208** 1,000

,000 .

5719 5719

Coeficiente decorrelación

Sig. (bilateral)

N

Coeficiente decorrelación

Sig. (bilateral)

N

Alumnos con puntajedel año 2010 delestablecimiento enLectura

Res_Lectura

Rho de Spearman

Alumnos conpuntaje del

año 2010 delestablecimiento en Lectura Res_Lectura

La correlación es significativa al nivel 0,01 (bilateral).**.

Al analizar el test de Spearman se logra identificar que el modelo de Lectura hasta el momento presenta problemas de Heterocedasticidad. Para que no existan problemas se busca aceptar la Hipótesis nula. En este caso p-value= 0.000 por lo tanto, la Hipótesis nula se rechaza y es necesario solucionar el problema a través del método de los mínimos cuadrados ponderados donde la función de ponderación se presenta a continuación:

1/Variable de Ponderación * Potencia

Donde:

Variable de ponderación: LNTEL. Variable logarítmica continua que expresa al Alumnos con puntaje del año 2010 del establecimiento en Lectura.

Potencia: El rango de las potencias comprende valores de -2 a 2 en el cual se ha seleccionado la potencia correspondiente a -1,5 para análisis porque maximiza la función de log-verosimilitud (Ver anexo 5).

Luego el modelo cumple con todos los supuestos básicos puesto que el R2 logra explicar en un 39,8% la variable dependiente, es decir, del logaritmo natural del puntaje promedio en Lectura en el año 2010. La F-Global se encuentra en región de rechazo (p-value=0,000), por lo tanto, el modelo puede ser utilizado con fines de pronóstico y finalmente, lo mismo sucede con las pruebas t, las que se encuentran en región de rechazo, de esta manera el modelo puede ser utilizado con fines explicativos (Ver anexo 6).

Page 28: Informe Final Econometría

3.2 MODELO LOGARÍTMICO – LOGARÍTMICO EN EDUCACIÓN MATEMÁTICA.

Correlaciones

1,000 -,197**

. ,000

7914 5709

-,197** 1,000

,000 .

5709 5709

Coeficiente decorrelación

Sig. (bilateral)

N

Coeficiente decorrelación

Sig. (bilateral)

N

Alumnos con puntajedel año 2010 delestablecimiento enEducación Matemática

Res_Matemática

Rho de Spearman

Alumnos conpuntaje del

año 2010 delestablecimien

to enEducaciónMatemática

Res_Matemática

La correlación es significativa al nivel 0,01 (bilateral).**.

Al analizar el test de Spearman se logra identificar que el modelo de Matemática hasta el momento presenta problemas de Heterocedasticidad. Para que no existan problemas se busca aceptar la Hipótesis nula. En este caso p-value= 0.000 por lo tanto, la Hipótesis nula se rechaza y es necesario solucionar el problema a través del método de los mínimos cuadrados ponderados donde la función de ponderación se presenta a continuación:

1/Variable de Ponderación * Potencia

Donde:

Variable de ponderación: LNTEM. Variable logarítmica continua que expresa al Alumnos con puntaje del año 2010 del establecimiento en Matemática.

Potencia: El rango de las potencias comprende valores de -2 a 2 en el cual se ha seleccionado la potencia correspondiente a -1,5 para análisis porque maximiza la función de log-verosimilitud (Ver anexo 7).

Luego el modelo cumple con todos los supuestos básicos puesto que el R2 logra explicar en un 44,9% la variable dependiente, es decir, del logaritmo natural del puntaje promedio en Matemática en el año 2010. La F-Global se encuentra en región de rechazo (p-value=0,000), por lo tanto, el modelo puede ser utilizado con fines de pronóstico y finalmente, lo mismo sucede con las pruebas t, las que se encuentran en región de rechazo, de esta manera el modelo puede ser utilizado con fines explicativos (Ver anexo 8).

Page 29: Informe Final Econometría

4. Discusión de los resultados.

En el modelo final de Lectura la variable número alumnos con puntaje 2010 en el establecimiento

en la asignatura de lectura, por la interpretación de su signo se obtiene que los alumnos con este

puntaje influyen en el puntaje promedio en la prueba SIMCE en dicha asignatura. Lo mismo ocurre

con el modelo final de Educación Matemáticas y su variable número alumnos con puntaje 2010 en

el establecimiento en la asignatura de Educación Matemáticas.

Con respecto al tipo de dependencia del establecimiento los establecimientos municipales según lo

avala su signo poseen menor puntaje promedio en la prueba SIMCE de Lectura y en Educación

Matemáticas en comparación con los alumnos de los establecimientos particulares, lo arrojado en

esta variable concuerda con estudios hechos por revistas y artículos científicos de gran credibilidad,

pero también es importante destacar que esta comparación no toma en cuenta todos los aspectos;

“La relación entre las condiciones socioeconómicas de la familia – con todos los efectos que esto

puede tener sobre las condiciones de aprendizaje – y la dependencia de la escuela implica que la

diferencia en el desempeño de las escuelas de distinto tipo no puede explicarse únicamente por

variables internas: las escuelas municipales son comparadas permanentemente con

establecimientos donde los estudiantes tienen un mayor apoyo de parte de los padres, menores

dificultades de aprendizaje, un desarrollo madurativo acorde con el curso en el que se encuentran,

los padres poseen un nivel educacional superior, etc.” (Castillo, González, & Puga, 2011).

Los alumnos de grupo socioeconómico bajo obtienen puntajes por debajo de los alumnos de grupo

socioeconómico alto en la dos asignaturas, esto se debe a que según la lógica los alumnos de grupo

bajo estudian en establecimientos municipales y viceversa, por eso están directamente relacionadas

entre sí y con la variable dependiente.

Cabe destacar que la variable zona no se incluye en este análisis ya que existen correlaciones

perdidas que tienden a homogenizar el análisis.

5. Conclusiones.

6. Limitaciones del Estudio.

Page 30: Informe Final Econometría

Existen diversas limitaciones asociadas con el estudio, una de ellas es que éste estudio es de corte

transversal, es decir, en un instante determinado de tiempo, esto puede afectarlo ya que puede que

no sea representativo en su totalidad.

Lo anteriormente descrito implica que el modelo esta creado para un momento determinado del

tiempo, con una cierta cantidad de personas, que tienen ciertas características; es por esto que el

modelo no podría ser utilizado para otros años debido a que las variables determinantes de los

puntajes promedios en la prueba SIMCE varían en distintos momentos del tiempo.

Page 31: Informe Final Econometría