Post on 05-Jul-2022
ANÁLISIS GEOGRÁFICO PARA IDENTIFICAR FACTORES QUE INCIDEN EN LA SEVERIDAD DE
LOS SINIESTROS VIALES EN EL ÁREA URBANA DE BOGOTÁ
Tesis propuesta para optar el título de Magister en Ingeniería Civil con énfasis en
Transporte
Elaborado por:
Yuly Alexandra Cubillos Rojas
Asesor:
Ph.D. Álvaro Rodríguez Valencia
Departamento de Ingeniería Civil y Ambiental
Universidad de los Andes
Facultad de Ingeniería
Departamento de Ingeniería Civil y Ambiental
Bogotá D.C. 2019
2
CONTENIDO
1 INTRODUCCIÓN 3
2 OBJETIVOS 4
2.1 OBJETIVO GENERAL 4
2.2 OBJETIVOS ESPECÍFICOS 4
3 SINIESTRALIDAD VIAL BOGOTÁ 4
3.1 CARACTERÍSTICAS DE LOS SINIESTROS VIALES REPORTADOS EN BOGOTÁ 5
3.2 CARACTERÍSTICAS DE LA VÍCTIMA DEL SINIESTRO VIAL 8
4 REVISIÓN DE LITERATURA 9
5 METODOLOGÍA 12
5.1 RECOLECCIÓN DE INFORMACIÓN 12
5.2 GEORREFERENCIACIÓN Y ANÁLISIS ESPACIAL DE DATOS 13
5.3 MODELO LOGIT 15
5.3.1 R2 MCFADDEN 17
5.4 PROCESAMIENTO EN R STUDIO 17
6 RESULTADOS 18
6.1 ANÁLISIS COMPARATIVO GRUPO DE MODELOS 21
7 CONCLUSIONES Y RECOMENDACIONES 26
8 REFERENCIAS 27
9 CARTOGRAFÍA 29
3
1 INTRODUCCIÓN
En Bogotá en el año 2017 murieron 546 personas en siniestros viales (6.8 muertos por cada
100.000 habitantes) convirtiéndose en la segunda causa de muerte de los bogotanos
después del homicidio (Secretaria Distrital de Movilidad, 2018). Por lo anterior la
administración distrital ha adoptado políticas que apuntan a la disminución de estos
indicadores, como la política internacional de Visión Cero, mediante la cual se estable que
“ninguna muerte en el tránsito es aceptable, todas son evitables”. Esta política se
fundamenta principalmente en la movilidad sostenible y en la generación de infraestructura
segura, especialmente para los actores más vulnerables, como lo son los peatones, ciclistas
y motociclistas.
La literatura existente y los datos disponibles en los recursos bibliográficos nacionales e
internacionales sugieren que existen patrones de problemas persistentes de seguridad
vial relacionados con la infraestructura vial, esto plantea la necesidad de una mayor
comprensión de la identificación de factores de riesgo específicos y su impacto en los
resultados de seguridad vial. Sin embargo, los resultados obtenidos en estos estudios varían
de acuerdo a las características propias lugar de análisis, así como de la combinación de
variables analizadas.
Para el caso de Bogotá se han realizado múltiples estudios, uno de los más recientes es el
estudio realizado por el Instituto de Recursos Mundiales WRI “Entorno Urbano y Seguridad Vial,
Implicaciones de los puentes peatonales, el uso del suelo y la infraestructura del transporte
público masivo en Bogotá” mediante el cual se buscaba determinar relación de los siniestros
viales con su cercanía a los puentes peatonales o al sistema de troncales de la ciudad, en este
estudio se analizaron las variables de manera independiente, por ejemplo se evaluó cada uso
de suelo por separado.
En este sentido, en este estudio se pretende determinar los factores (operativos y físicos)
presentes en el entorno urbano (número de intersecciones, cercanía a puente peatonal,
cercanía a infraestructura exclusiva de ciclistas, etc.) que inciden en la gravedad de los
siniestros viales en el área urbana de Bogotá, a través de un modelo, mediante el cual se
determine de manera conjunta las variables estadísticamente significativas con la gravedad
de los siniestros en períodos anuales completos, desde el año 2016 hasta el año 2018.
Este documento se encuentra organizado de la siguiente manera, en el primer capítulo se
establecen los objetivos generales y específicos de la investigación. Luego se presenta un
análisis de la situación de siniestralidad de la ciudad para los tres años de análisis, describiendo
principalmente las características de la víctima. Seguido de esto, se relaciona y presenta una
síntesis de la revisión de literatura representativa y utilizada como guía para la elaboración de
este documento. En el capítulo 5 se presenta el proceso metodológico adelantado para la
elaboración del modelo. Y por último en los capítulos 6 y 7 se presenta el análisis de resultados,
los hallazgos significativos del estudio y las conclusiones.
4
2 OBJETIVOS
2.1 OBJETIVO GENERAL
Identificar a través de un modelo la relación entre factores geográficos del entorno urbano
y su influencia en la severidad de los siniestros viales en Bogotá.
2.2 OBJETIVOS ESPECÍFICOS
Generar un modelo de predicción de siniestros desagregado que permita predecir
cómo la naturaleza del entorno urbano, con sus características asociadas a la
movilidad influyen en la gravedad de los siniestros viales en Bogotá.
Realizar un análisis descriptivo de los datos recopilados sobre los accidentes
ocurridos en la ciudad de Bogotá entre los años 2016 y 2018.
Predecir las variaciones de siniestralidad asociadas con el entorno urbano para
establecer recomendaciones de planificación.
3 SINIESTRALIDAD VIAL BOGOTÁ
Bogotá es la ciudad con mayor población del país, 8.080.734 habitantes que corresponden
al 16,4% de la población total de Colombia. En la capital colombiana también se concentra
el mayor registro de vehículos activos, 2.433.446 vehículos que corresponden al 17,8% de
los vehículos registrados en el país. (Secretaria Distrital de Movilidad, 2018)
Figura 1 Índice de mortalidad por cada 100.000 habitantes, Bogotá y Nacional 2000 – 2017. Fuente: Anuario de siniestralidad vial de Bogotá 2017. (Secretaria Distrital de Movilidad, 2018)
Aunque actualmente Bogotá tiene una tasa baja de muertes por cada 100.000 habitantes
(6,76 en el año 2017), esta tasa equivale a la mitad de la tasa reportada del país, como se
muestra en la gráfica anterior. (Secretaria Distrital de Movilidad, 2018).
5
De acuerdo con la información de siniestralidad disponible en las bases de datos de la
Secretaria Distrital de Movilidad Bogotá, se realiza un resumen del análisis de la información
registrada en el periodo de enero de 2016 y diciembre de 2018.
Figura 2 Mapa de calor siniestralidad Bogotá 2016-2018. Fuente: Elaboración propia con base en datos suministrados
por la SDM
Se identifica que los corredores viales arteriales de la ciudad son los que presentan mayor
cantidad de registros de víctimas de siniestros viales en la ciudad, como se evidencia en la
Figura 2 Mapa de calor siniestralidad Bogotá 2016-2018, en la que se grafican los siniestros
a través de puntos calientes mediante la densidad de Kernel, esta metodología asigna los
rangos densidad de acuerdo a la cercanía entre entidades, asignando rangos de color en las
áreas en las cuales se presenta mayor densidad de puntos.
En las vías arteriales de Bogotá se reportaron 18.798 víctimas, equivalentes al 40% del total
reportadas durante los 3 años de análisis.
3.1 Características de los siniestros viales reportados en Bogotá
De acuerdo con la información disponible de siniestros viales ocurridos en la ciudad, se
cuenta con la siguiente caracterización según la gravedad, clase, perfil temporal y horario.
6
No se incluyeron los registros de siniestros “solo daños”, ya que estos presentan errores de
georreferenciación y un alto porcentaje de datos atípicos.
En Bogotá en el periodo de tiempo comprendido entre enero de 2016 y diciembre de 2018,
se tuvieron 46.472 registros de víctimas, dentro de los cuales el 3.5% corresponde a víctimas
fatales.
Figura 3 registros de Víctimas por año según gravedad. Fuente: Elaboración propia con base en datos suministrados por la SDM
De acuerdo con la anterior gráfica, es de resaltar que los registros de víctimas fatales
disminuyeron en un 7%. En cuanto a los registros de lesionados del año 2018 presentan un
aumento significativo frente a los registros del 2017 y 2016, esto no significa que haya un
aumento en los indicadores de siniestralidad de la ciudad, sino puede deberse a variables
externas que afectan los reportes de los siniestros con víctimas lesionadas, entre los cuales
se encuentra el tiempo de atención del agente de tránsito, el tiempo de atención de las
ambulancias, los cambios en la operación del sistema de emergencias, el incremento del
apoyo del Centro de Gestión de la Secretaria Distrital de Movilidad para reportar los
siniestros y solicitar atención en menor tiempo, entre otras.
14036 14330
16460
585 547 514
0
2000
4000
6000
8000
10000
12000
14000
16000
18000
2016 2017 2018
LESIONADO MUERTO
7
Figura 4 registros de siniestros según clase. Fuente: Elaboración propia con base en datos suministrados por la SDM
De acuerdo con la anterior gráfica, la mayor cantidad de siniestros viales en las cuales
mueren las víctimas son choque y atropellos, lo cual refleja que los peatones, los ciclistas y
los conductores son las víctimas más frecuentes de los siniestros viales de la ciudad.
Figura 5 Registro de víctimas en siniestros por mes (2016-2018.) Fuente: Elaboración propia con base en datos suministrados por la SDM
De acuerdo con la Figura 5 Registro de víctimas en siniestros por mes (2016-2018.), en el
periodo de análisis (2016-2018), los meses en los cuales se registran más víctimas son
octubre y agosto. El mes que registra menor siniestralidad es enero. En cuanto a días el
viernes y el martes registran el mayor número de víctimas en la ciudad.
0 5000 10000 15000 20000 25000 30000 35000
ATROPELLO
AUTOLESION
CAIDA DE OCUPANTE
CHOQUE
INCENDIO
OTRO
VOLCAMIENTO
LESIONADO
MUERTO
0
500
1000
1500
2000
2500
3000
3500
4000
4500
MUERTO
LESIONADO
8
Figura 6 Registros de víctimas en siniestros por día de la semana (2016-2018). Fuente: Elaboración propia con base en datos suministrados por la SDM
3.2 Características de la víctima del siniestro vial
En cuanto a clasificación por género las víctimas tanto heridas como fallecidas en mayoría
corresponden a hombres, superando por más de la mitad a las mujeres, como se evidencia
en la Figura 7 Registros de víctimas según género a continuación.
Figura 7 Registros de víctimas según género. Fuente: Elaboración propia con base en datos suministrados por la SDM
De acuerdo con el gráfico se obtiene que, para el período de análisis, el rango etario con
mayor cantidad de víctimas son mujeres y hombres de 21 a 30 años, en mayor proporción
son víctimas de sexo masculino.
0 1000 2000 3000 4000 5000 6000 7000 8000
DOMINGO
LUNES
MARTES
MIERCOLES
JUEVES
VIERNES
SABADO
LESIONADO
MUERTO
36%
63%
1%
LESIONADO
FEMENINO MASCULINO SIN INFORMACION
19%
74%
7%
MUERTO
FEMENINO MASCULINO SIN INFORMACION
9
Figura 8 rango etario de población en Bogotá. Fuente DANE Figura 9 Registros de víctimas según rango etario. Fuente:
Elaboración propia con base en datos suministrados por la SDM
De acuerdo con los datos de población del DANE para el año 2016, tiene que los rangos
etarios con mayor población son personas entre 31 y 40 años y 21 a 30 años, sin embargo,
la proporción de personas en la que resultan heridas y muertas es mayor para el rango de
los 21 a 30 años.
Figura 10 Registros de víctimas por condición. Fuente: Elaboración propia con base en datos suministrados por la SDM.
De total de víctimas de siniestros viales registrados de la ciudad durante el periodo de enero
2016 a diciembre de 2018 se tiene que el 26% corresponde a peatones, el 29% a pasajero,
el 30% a motociclistas, el 6% corresponde a conductores y el 10% a ciclista.
4 REVISIÓN DE LITERATURA
La búsqueda bibliográfica, la selección de estudios, la codificación y el análisis para cada
factor de riesgo se llevaron a cabo durante todo el proceso de elaboración de este
0-10
11-20
21-30
31-40
41-50
51-60
61-70
71-80
>80
-20% -10% 0% 10% 20%
Hombres Mujeres
0-10
11-20
21-30
31-40
41-50
51-60
61-70
71-80
>80
-40% -20% 0% 20%
MASCULINO FEMENINO
C I C L I S T A
C O N D U C T O R
M O T O C I C L I S T A
P A S A J E R O
P E A T O N
4372
2818
13235
13302
11099
193
31
476
149
797
LESIONADO
MUERTO
10
documento. Las principales bases de datos utilizadas para buscar estudios relacionados
sobre modelos y análisis de siniestralidad se obtuvieron a partir de la búsqueda en el
sistema de recursos electrónicos de la Universidad de los Andes Science Direct y en Google
Scholar.
(Wier et al, 2009) realizaron una investigación denominada “An area-level model of vehicle-
pedestrian injury collisions with implications for land use and transportation planning” en la
cual evaluaron un modelo de regresión multivariada agregado de accidentes con peatones
lesionados en las vías locales de San Francisco California, para este estudio utilizaron
variables de las vías, usos de suelo, características de la población y comportamientos de
viajes. Concluyeron que los peatones representan el 11% de las muertes por colisión de
vehículos motorizados, y el 15% de las personas murieron mientras caminaban en
California. De acuerdo con los hallazgos se identificó que el volumen vehicular es un factor
importante en los accidentes en los cuales se ven involucrados peatones. Además del
volumen vehicular, la población de empleados y residentes, calles arteriales sin transporte
público, proporciones de área de tierra dividida para uso comercial de vecindario y uso
comercial de barrio residencial, son predictores estadísticamente significativos de
accidentes de lesiones vehiculares-peatonales. Este estudio se utilizó como insumo para la
determinación y caracterización de variables de uso de suelo y de las vías a ser incluidas
dentro de la evaluación del modelo.
(Gómez et al, 2014) Gómez y Bocarejo realizaron una investigación “Accident prediction
Models for bus rapid transit systems: Generalized linear models versus neural network” en
la cual consistió en una comparación de tres modelos basados en regresión de Poisson,
regresión binomial negativa y redes neuronales mediante los cuales se analizan los factores
que influyen en la frecuencia de accidentes en el sistema BRT de Bogotá y comparan los
resultados. Encontraron que el modelo basado en redes neuronales presenta mejores
indicadores predictivos, sin embargo, las mejoras en la predictibilidad del modelo de red
neuronal no son lo suficientemente relevantes como para afirmar categóricamente que
este modelo es mejor en la predicción de accidentes en los sistemas de BRT. Asimismo,
dadas las características de los accidentes en el sistema BRT modelado, la regresión de
Poisson es más apropiada que la regresión binomial negativa para el análisis de los
siniestros. A partir de los resultados de esta investigación, la cual está enfocada a vías de
Bogotá, se determinan las posibles variables a analizar y se realiza el proceso de selección
del modelo más acorde con los datos disponibles.
(Patil, 2012) en su investigación “Analysis of crash severities using nested logit model—
Accounting for the underreporting of crashes” realizó un modelo con el fin de determinar la
importancia de variables e información asociada a los siniestros viales, su área de estudio
fueron las carreteras del estado de Texas. Para la evaluación del modelo incluyeron
variables sobre la gravedad del accidente, el tipo de accidente, la información de la
carretera, la condición ambiental, el sexo y la edad del conductor, la edad del vehículo y la
11
conducción bajo la influencia del alcohol. En cuanto a severidad del accidente utilizaron 4
categorías, fatal, incapacitante, no incapacitante y sin lesiones. Como resultados se obtuvo
que los ciclistas entre 25 y 30 años son los más accidentados, y su gravedad aumenta cuanto
hay presencia de alcohol. También resultaron relevantes las variables de luminosidad y
velocidad del vehículo con la gravedad del siniestro. Este estudio permitió establecer una
metodología para el análisis de variables asociadas a la gravedad de los siniestros utilizando
un modelo de elección discreta.
(Fan Ye, 2014) en su estudio titulado “Comparing three commonly used crash severity
models on sample size requirements: Multinomial logit, ordered probit and mixed logit
models” realizó una comparación de tres modelos de gravedad de siniestros, uno fue un
logit multinomial, otro un modelo probit ordenado y por último un modelo logit mixto, con
el fin de determinar el efecto de la muestra de datos, como es el comportamiento y cual
tiene un mejor ajuste utilizando 27 variables independientes para cinco tipos de gravedad.
Para el modelo logit multinomial, se trabajaron 10 variables significativas, para el modelo
probit ordenado se utilizaron 18 variables y para el modelo logit mixto se utilizaron las 27
variables. Finalmente, comparando los tres modelos, se encuentra que el modelo logit
mixto es más interpretativo que el modelo logit multinomial, ya que el primero incluye la
aleatoriedad asociada con algunas variables. El modelo probit ordenado no tiene el mismo
poder interpretativo que el logit multinomial y los modelos logit mixtos. En conclusión y
como aporte para la elaboración de este documento, se tiene obtiene una metodología
para el análisis de modelos predictivos de siniestralidad, así como el uso de variables
representativas dentro de cada modelo.
(Gomes, 2013) en su estudio “The influence of the infrastructure characteristics in urban
road accidents occurrence” Gomes desarrolló varios modelos para estimar la frecuencia de
accidentes viales de las intersecciones y segmentos de vía en de Lisboa. A partir de la
distribución de Poisson-gamma determinó las variables relacionadas con el entorno vial y
la accidentalidad. Este estudio presenta diferentes modelos desagregados con diferentes
variables de análisis como características físicas de la carretera, las intersecciones y los
segmentos viales. Determinó que las variables explicativas significativas asociadas con los
aumentos en la frecuencia de los accidentes fueron el tráfico, el ancho promedio de carril,
la presencia de carriles de giro a la derecha, los dispositivos de control de tráfico, el número
total de carriles y el número de tramos de la intersección. Esta investigación define variables
de la infraestructura vial representativas dentro de los análisis de siniestralidad, que pueden
ser evaluadas de igual forma en el modelo de gravedad de siniestros viales.
(Greibe, 2003) realizó una investigación titulada “Accident prediction models for urban
roads” cuyo objetivo principal fue establecer modelos de accidentes simples y factibles que
puedan predecir el número esperado de accidentes en las uniones urbanas y enlaces de
carreteras con la mayor precisión posible en las carreteras de Dinamarca. Se utilizaron
técnicas de modelado lineal generalizadas para relacionar las frecuencias de accidentes con
12
las variables explicativas. Las variables explicativas que describen el diseño de la carretera
y la geometría de la carretera demostraron ser significativas para los modelos de enlace de
carreteras, pero menos importantes en los modelos de cruce. La variable más poderosa
para todos los modelos fue el flujo de tráfico de vehículos motorizados.
(Francesca La Torre et al, 2019) “Accident prediction models for urban roads” en este
estudio desarrollaron dos modelos de predicción de accidentes utilizando un conjunto de
datos que incluye información sobre 884 km de segmentos de autopistas en un período de
5 años. Los modelos de predicción de accidentes se desarrollaron con variables como tipo
de carretera, segmento de la autopista tipo de área, sección transversal. Los modelos
permitieron estimar accidentes fatales y lesiones por año en una dirección de viaje con las
variables descritas.
En consecuencia, de acuerdo con los hallazgos evidenciados en las referencias
bibliográficas, en este estudio se realizó un modelo de gravedad de siniestros tipo logit, el
cual se ajusta con las variables seleccionadas en el entorno geográfico de la ciudad de
Bogotá
5 METODOLOGÍA
La metodología aplicada para el modelo aplicado de siniestros viales en Bogotá se
fundamentó en los 5 pasos que se muestran en la Figura 11 Esquema de la metodología
planteada y se describe a continuación:
Figura 11 Esquema de la metodología planteada. Fuente: Elaboración propia
5.1 Recolección de información
Para la elaboración del modelo se requirió información de siniestralidad de la ciudad,
características físicas, operativas y usos de suelo.
La información obtenida de las bases de datos de siniestralidad georreferenciadas, fueron
suministradas por la Secretaria Distrital de Movilidad, se utilizaron las bases completas de
accidentes, heridos y muertos, para un periodo de tres años (2016-2018).
13
Los datos de siniestralidad son obtenidos utilizando la base de datos del Sistema de
Información Geográfica de Accidentes de Tránsito (SIGAT) que incluye los accidentes
reportados por la Policía de Tránsito con diligenciamiento de IPAT y georreferenciados por
la Secretaria Distrital de Movilidad.
En cuanto a la información de malla vial, puentes peatonales, red semafórica, red de
ciclorrutas, usos de suelo y red de transporte público fueron descargadas del geo portal del
Instituto de Desarrollo Urbano IDU y de las bases de metadatos del IDECA cuya fuente es la
Secretaría Distrital de Planeación.
Figura 12 Información Secundaria obtenida. Fuente: Elaboración propia
5.2 Georreferenciación y análisis espacial de datos
Para el análisis de datos y generación de las bases de datos para el modelo se empleó el
Software Arcgis y sus herramientas de análisis geográfico. Los datos de siniestros con
heridos y muertos, son unas capas o shape de puntos georrefenciados que contienen las
características de la víctima (edad, sexo, condición) y un reporte del siniestro (hora, fecha
mes, día dirección exacta).
Mediante el uso de esta herramienta se asociaron las características de las otras capas de
geometrías diferentes (puntos, polígonos, líneas), siempre vinculándolas al ID del registro
del siniestro, para mantener la georreferenciación.
Se utilizaron datos de conteo para las variables de infraestructura y operativas, por ejemplo,
el número de intersecciones semaforizadas en un radio de 300 metros del lugar donde
ocurrió el siniestro. Y para las variables categóricas, posteriormente se realizó la
codificación de las variables para facilitar su procesamiento de la siguiente forma:
14
NOMBRE NOMBRE DE LA VARIABLE TIPO DESCRIPCIÓN VALORES
CODIGO_ACC CÓDIGO DE ACCIDENTE TEXTO CÓDIGO DE ACCIDENTE
FORMULARIO FORMULARIO DEL ACCIDENTE TEXTO FORMULARIO DEL ACCIDENTE
ANO_OCURRE AÑO DE OCURRENCIA DEL ACCIDENTE
NUMERO AÑO DE OCURRENCIA DEL ACCIDENTE
MES_OCURRE MES DE OCURRENCIA DEL ACCIDENTE
NUMERO 1 A 12 MES DE OCURRENCIA DEL ACCIDENTE
DIA_OCURRE DÍA DE OCURRENCIA DEL ACCIDENTE
NUMERO 1 A 7 DÍAS DE LA SEMANA
DIRECCIÓN DIRECCIÓN DONDE OCURRIÓ EL ACCIDENTE
TEXTO DIRECCIÓN DONDE OCURRIÓ EL ACCIDENTE
CLASE CLASE DE ACCIDENTE NUMERO 1 CHOQUE, 2 ATROPELLO, 3 AUTOLESIÓN, 4 CAÍDA DE OCUPANTE, 5 VOLCAMIENTO, 6 INCENDIO, 7 OTRO
LOCALIDAD LOCALIDAD EN LA CUAL OCURRIÓ EL ACCIDENTE
NUMERO 1 a 20 LOCALIDAD EN LA CUAL OCURRIÓ EL ACCIDENTE
CONDICIÓN CONDICIÓN DEL ACCIDENTADO NUMERO 1 PEATÓN, 2 CICLISTA, 3 MOTOCICLISTA, 4 CONDUCTOR, 5 PASAJERO
GENERO GENERO DE LA VICTIMA NUMERO 1 FEMENINO, 2 MASCULINO, 3 SIN INFORMACIÓN
EDAD EDAD DE LA VICTIMA NUMERO EDAD DE LA VICTIMA
LES_MUER GRAVEDAD DE LA VICTIMA NUMERO 0 LESIONADO, 1 MUERTO
MVITCLA
CLASIFICACIÓN DE LA MALLA VIAL EN DONDE OCURRIÓ EL ACCIDENTE
NUMERO 1 ARTERIAL, 2 INTERMEDIA, 3 LOCAL, 6 PEATONAL
USO SUELO USO DE SUELO DONDE OCURRIÓ EL ACCIDENTE
NUMERO
1 RESIDENCIAL, 2 INDUSTRIAL, 3 DOTACIONAL, 4 COMERCIO Y SERVICIOS, 5 ÁREA DE ACTIVIDAD CENTRAL, 6 ÁREA URBANA INTEGRAL, 7 ÁREA DE ACTIVIDAD MINERA, 8 SUELO PROTEGIDO.
UPLCODIGO CÓDIGO DE LA UPZ UNIDAD DE PLANEAMIENTO ZONAL
NUMERO CÓDIGO DE LA UPZ UNIDAD DE PLANEAMIENTO ZONAL
UPLNOMBRE NOMBRE DE LA UPZ TEXTO NOMBRE DE LA UPZ
POBLACIÓN POBLACIÓN DE LA UPZ NUMERO POBLACIÓN DE LA UPZ
NO_VEH
TASA DE VEHÍCULOS POR CADA 100.000 HAB (ENCUESTA DE MOVILIDAD 2015)
NUMERO TASA DE VEHÍCULOS REGISTRADOS EN LA UPZ (ENCUESTA DE MOVILIDAD 2015)
DP DENSIDAD POBLACIONAL DE LA UPZ
NÚMERO DE HABITANTES POR HA
CICLORRUTA CICLORRUTA CERCANA (500 M) NUMERO 0 NO 1 SI
RUTAS_SITP
NUMERO DE RUTAS QUE TRANSITAN EL PUNTO DONDE SE REGISTRO EL ACCIDENTE
NUMERO NUMERO DE RUTAS QUE TRANSITAN EL PUNTO DONDE SE REGISTRO EL ACCIDENTE
PUENTES_PE
NUMERO DE PUENTES PEATONALES A 300 METROS DE RADIO
NUMERO NUMERO DE PUENTES CERCANOS A EL PUNTO DONDE SE REGISTRO EL ACCIDENTE
Tabla 1 Variables de análisis. Fuente: Elaboración propia con base en datos suministrados por la SDM
Finalmente, se obtuvo una base de datos con la siguiente información:
15
46472 registros de lesionados y muertos en siniestros viales para tres años de
análisis (2016-2018)
44826 lesionados y 1646 muertos.
8 columnas de registros de características de las Víctimas
9 columnas de registros de caracterización del entorno vial en el cual ocurrió el
siniestro.
Las variables independientes fueron cuantificadas y codificadas de acuerdo con lo
enunciado en la Tabla 1 Variables de análisis. El modelo final resulta a partir de los atributos
de los datos geográficos que se ilustran en la Figura 13 Variables de análisis incluidas en el
modelo.
Figura 13 Variables de análisis incluidas en el modelo. Fuente: Elaboración propia
5.3 Modelo Logit
De acuerdo con la literatura para la modelación de siniestros viales, el modelo Logit es que
mejor se ajusta el análisis de datos de gravedad, debido a la flexibilidad en términos de la
captura de los efectos de las variables independientes. (John C. Milton, 2007). Diferentes
estudios realizados en el área de seguridad vial relacionados en el capítulo 4 de este
documento, han demostrado la utilidad de los modelos Logit para modelar la gravedad de
los siniestros viales, e identificar el efecto de diferentes factores que inciden es su gravedad.
En general en estos modelos se asume la misma probabilidad de ocurrencia para cada nivel
de gravedad de la lesión en los datos. (Sunil Patil, 2012)
En los últimos años se han desarrollado metodologías apoyadas en el uso de herramientas
SIG y regresión múltiple, que tratan de estimar la siniestralidad en función de un reducido
16
número de variables, con el fin de identificar las que más inciden en la ocurrencia de los
siniestros y de esta forma implementar medidas para su reducción. Este tipo de modelos
tienen la ventaja de su simplicidad y la facilidad para interpretar sus resultados. Sin
embargo, estos modelos usan análisis de regresión múltiple (OLS) que asume estabilidad
paramétrica y que no funcionan como modelos predictores para variables cuantificables,
como en este caso. (Gutiérrez Puebla, 2012)
Así mismo, el uso de la gravedad de los siniestros como fuente para la planeación de
medidas encaminadas a la seguridad vial es diferente, ya que la frecuencia no determina la
gravedad, por lo tanto, la aplicación de modelos de regresión múltiple requiere del análisis
de un modelo diferente para cada nivel de gravedad. (John C. Milton, 2007). La frecuencia
de los siniestros con diferencias de gravedad es independiente entre sí, porque a medida
que cambia la frecuencia de un tipo de gravedad, la frecuencia de otros tipos también
cambiará.
Por otro lado, se revisó como afecta la proporcionalidad de los datos, dado que los
lesionados (96.5%) tienen una proporción mayor frente a las víctimas fatales (3.5%) y de
acuerdo a lo indicado Gary King y Langche Zeng en su artículo Logistic Regression in Rare
Events Data, los procedimientos estadísticos populares, como la regresión logística, pueden
subestimar la probabilidad de eventos raros, por lo cual se recomienda utilizar correcciones
que superen los métodos existentes con el fin de no descartar variables cuantificadas. (Gary
King, 2001).
Por lo anterior, se utilizó un modelo Logit para datos desagrupados y se calcula Rho-
cuadrado de McFadden para determinar su correlación. La variable dependiente
seleccionada es la gravedad del siniestro, asignando 0 para víctima lesionado y 1 para
víctima fatal. Cabe resaltar que, aunque se cuenta con información con gravedad de “solo
daños” no se utilizaron estos datos. Los siniestros en Bogotá reportados con gravedad de
solo daños, presentan información más dispersa, menos detallada y con más presencia de
datos atípicos, debido a que los informes policiales no son tan completos como cuando se
registran víctimas, así como factores externos expuestos posteriormente.
El modelo logit en este caso se expresa como:
𝐿𝑖 = ln (𝑃𝑖
1 − 𝑃𝑖)
𝐿𝑖 = 𝛽0 + 𝛽1𝑋1 + 𝛽2𝑋2 + 𝛽3𝑋3 + 𝛽𝑛𝑋𝑛 + 𝜖
𝑃𝑖 = 0 sí es lesionado y 𝑃𝑖 = 1 si es muerto.
17
Para la evaluación de este modelo debemos tener en cuenta las siguientes observaciones
generales:
1. Como empleamos el método de máxima verosimilitud, que en general es para muestras
grandes, los errores estándar estimados son asintóticos.
2. Como resultado, en vez del estadístico t para evaluar la importancia estadística de un
coeficiente, empleamos el estadístico (normal estandarizado) Z, por lo que las inferencias
se basan en la tabla normal. Si el tamaño de la muestra es razonablemente grande, la
distribución t converge a la distribución normal.
3. La medida convencional de la bondad de ajuste, R2, no es particularmente significativa
para los modelos con variable independiente binaria. Existen diversas medidas similares a
R2, llamadas pseudo R2 o R2 McFadden, denotada como R2McF, cuyo valor varía entre 0 y 1.
(Damodar N. Gujarati, 2009).
5.3.1 R2 McFadden
Los modelos de regresión logit se ajustan utilizando el método de máxima verosimilitud, es
decir, las estimaciones de los parámetros son aquellos valores que maximizan la
probabilidad de los datos observados. La medida al cuadrado de McFadden se define como
𝑅𝑀𝑐𝐹2 = 1 −
log(𝐿𝑐)
log(𝐿𝑛𝑢𝑙𝑙)
donde denota el valor de probabilidad (maximizado) del modelo ajustado actual, y denota
el valor correspondiente para el modelo nulo. (Bartlett, 2014)
5.4 Procesamiento en R Studio
Para la obtención del modelo se realizó el análisis mediante el software estadístico R Studio, el cual cuenta con un paquete para estimar los modelos logit con base en datos no agrupados y cuantitativos. El procesamiento de los datos se realizó a través del modelo de estimación logit (modelo
lineal de probabilidades), para lo cual es necesario usar la función GLM utilizando la familia
de probabilidad. Los datos utilizados son los obtenidos después del procesamiento de
información georreferenciados de siniestros en ArcGis, tal y como se describió en el
subcapítulo de Georreferenciación y análisis espacial de datos.
Después de cargar la base de datos, se debe convertir en Data Frame para trabajarlos en R
Studio, debido a que cuando se realiza un estudio estadístico sobre los objetos de una
muestra, la información se organiza en una nueva hoja de datos, en los que cada fila
corresponde a un objeto y cada columna a una variable de ese objeto. Luego se define la
18
variable dependiente y se convierte como factor binario, y posteriormente se procede a
correr el modelo, con las variables determinadas.
Tabla 2 visualización de primeros 20 filas cargadas en R Studio. Fuente: Elaboración propia con base en datos suministrados por la SDM
6 RESULTADOS
Los resultados del modelo permiten identificar la significancia estadística y relación de las
variables independientes con la gravedad del siniestro (variable dependiente). Con los
resultados obtenidos se realizó un análisis de sensibilidad variando las variables
independientes del modelo y su vez eliminado las variables menos representativas, esto
con el fin de determinar el modelo que presenta mejor ajuste estadístico.
Los resultados indican que características como el mes de ocurrencia del siniestro, la
ubicación geográfica dentro de una UPZ (Unidad de planeamiento zonal) y la población, no
son variables que inciden en la gravedad de los siniestros viales. Por el contrario, las
variables de características de las víctimas como la edad, el género y la condición son muy
representativas, así como las características físicas como la cercanía a un puente peatonal
o una intersección semaforizada.
Modelo 1: 16 variables
Variable Estimate Std. Error z value Pr(>|z|)
(Intercept) -4,77E+03 2,13E+02 -22.417 < 2e-16 ***
EDAD 1,50E+01 1,21E+00 12.377 < 2e-16 ***
GENERO 9,97E+02 6,00E+01 16.617 < 2e-16 ***
CONDICION -4,03E+02 1,95E+01 -20.703 < 2e-16 ***
MES_OCURRE -6,19E+00 7,51E+00 -0.824 0.40994
DIA_OCURRE 2,83E+01 1,33E+01 2.125 0.03360 *
CLASE 2,27E+02 2,37E+01 9.594 < 2e-16 ***
LOCALIDAD 9,55E+00 5,24E+00 1.824 0.06815 .
MVITCLA -1,31E+02 3,16E+01 -4.139 3.49e-05 ***
UPLCODIGO -3,43E-01 9,11E-01 -0.377 0.70649
POBLACIÓN 2,23E-04 3,57E-04 0.626 0.53160
19
NO_VEH -2,78E-03 3,18E-03 -0.874 0.38238
RUTAS_SITP 4,40E+00 2,78E+00 1.583 0.11347
COD_USO -7,35E+00 1,61E+01 -0.457 0.64747
INT_SEM -1,72E+02 6,87E+01 -2.508 0.01215 *
RED_BICI -1,61E+02 6,64E+01 -2.429 0.01513 *
PUENTE_PE 2,46E+02 8,41E+01 2.926 0.00344 **
Tabla 3 resultados de evaluación modelo logit (todas las variables). Fuente: Elaboración propia
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1) Null deviance: 14221 on 46443 degrees of freedom Residual deviance: 13039 on 46427 degrees of freedom (28 observations deleted due to missingness) AIC: 13073
Deviance Residuals:
Min 1Q Median 3Q Max
-10.871 -0.2874 -0.2271 -0.1544 34.746 Tabla 4 desviación de los residuales modelo 1, Fuente: Elaboración propia
En la interpretación de los p-valores se puede ver que las variables de edad, genero,
condición, clase y clasificación vial son altamente significativas, mientras que la variable de
cercanía a puente peatonal es significativa; y las variables de red semafórica, red de
ciclistas, localidad y día de ocurrencia son moderadamente significativas (p-valor entre 0.01
y 0.05)
El R2 McFadden en este caso es bajo, sin embargo, se encuentra dentro del rango admisible
de 0 a 1 y sirve para realizar comparación entre modelos.
R2 McFadden = 0.18369575
Coeficientes del modelo (la proporción de probabilidades estimada)
(Intercept) EDAD GENERO CONDICIÓN MES_OCURRE DIA_OCURRE CLASE LOCALIDAD MVITCLA
0.0085 1.0151 2.7107 0.6682 0.9938 1.0287 1.2551 1.0096 0.8774
UPLCODIGO POBLACIÓN NO_VEH RUTAS_SITP COD_USO INT_SEM RED_BICI PUENTE_PE
0.9997 1.0000 0.9999 1.0044 0.9927 0.8417 0.8511 1.2791
Modelo 2: 10 variables
Los resultados del modelo anterior en el cual se incluyeron todas las variables, sugieren que
algunas de estas no son estadísticamente significativas para predecir la gravedad del
siniestro, por lo cual se omiten y se vuelve a realizar la modelación.
20
Variable Estimate Std. Error z value Pr(>|z|)
(Intercept) -4.802706 0.189214 -25.382 < 2e-16 ***
EDAD 0.015062 0.001211 12.439 < 2e-16 ***
GENERO 0.996646 0.060005 16.609 < 2e-16 ***
CONDICION -0.404611 0.019428 -20.826 < 2e-16 ***
DIA_OCURRE 0.028984 0.01331 2.178 0.02943 *
CLASE 0.227678 0.023648 9.628 < 2e-16 ***
LOCALIDAD 0.010397 0.005084 2.045 0.04084 *
MVITCLA -0.136557 0.029675 -4.602 4.19E-06 ***
INT_SEM -0.163332 0.067729 -2.412 0.01589 *
RED_BICI -0.16561 0.06551 -2.528 0.01147 *
PUENTE_PE 0.224316 0.082635 2.715 0.00664 **
Null deviance: 14221 on 46443 degrees of freedom Residual deviance: 13044 on 46433 degrees of freedom (28 observations deleted due to missingness) AIC: 13066
El criterio de información de Akaike (AIC) es una medida de la calidad relativa de un modelo
estadístico, para un conjunto dado de datos. Como tal, el AIC proporciona un medio para la
selección del modelo. La metodología AIC intenta encontrar el modelo que mejor explica
los datos con un mínimo de parámetros libres y, por lo tanto, penaliza a los modelos con un
gran número de parámetros. El modelo con el AIC más bajo se considera el mejor modelo
entre todos los modelos disponibles.
En este segundo modelo la interpretación de los p-valores podemos ver que las variables
de edad, genero, condición, clase y clasificación vial continúan siendo las variables más
significativas.
Deviance Residuals:
Min 1Q Median 3Q Max
-1.0828 -0.2867 -0.2277 -0.1548 3.4997 Tabla 5 desviación de los residuales modelo 2
El R2 McFadden en este caso es 0.18333943 un poco más bajo que el anterior, sin embargo,
la significancia mejoró en algunas variables.
Coeficientes del modelo (la proporción de probabilidades estimada)
(Intercept) EDAD GENERO CONDICIÓN DIA_OCURRE CLASE
0.0082 1.0151 2.7091 0.6672 1.0294 1.2556
LOCALIDAD MVITCLA INT_SEM RED_BICI PUENTE_PE
1.0104 0.8723 0.8493 0.8473 1.2514
21
El valor de los estimados no tiene una interpretación directa, dado que se trata de
coeficientes de una función logit, sin embargo, el signo de este valor si es importante, el
signo negativo indica una relación negativa (a medida que aumenta el valor de la variable
disminuye la severidad del siniestro) y el signo positivo indica una relación positiva (si
aumenta el valor aumenta la gravedad del siniestro).
Por lo anterior y de acuerdo con los resultados del modelo, las variables con estimadores
negativos son la condición, el mes de ocurrencia, la clasificación vial, la cercanía una
intersección semaforizada y la cercanía a red de biciusuarios. En cuanto a la condición del
siniestro los peatones y los ciclistas son los que más inciden en la gravedad. Las vías más
críticas son las que pertenecen a la malla vial arterial, y las que cuentan con menor cercanía
de la red de ciclorrutas o de una intersección semaforizada.
Asimismo, los resultados del modelo indican que entre mayor sea la edad de la víctima,
mayor su gravedad. En cuanto a la clase del siniestro, el choque y el atropello tienen mayor
gravedad, así como la cercanía a un puente peatonal.
6.1 ANÁLISIS COMPARATIVO GRUPO DE MODELOS
Se analizaron tres grupos de modelos utilizando las variables de infraestructura, uso de
suelo y demográficas, con el fin de analizarlas dentro del modelo de gravedad de siniestros.
Grupo 1 de modelos
En el primer grupo, se analizaron todas las variables de cada categoría en un solo modelo
(modelo A), luego se evaluaron cada una de manera independiente (modelo B) y por último
se evaluaron por pares de categorías de variables (modelo C), los resultados se muestran a
continuación:
MODELO A
INFRAESTRUCTURA ARTERIAL 1.88.E-01 INTERMEDIA -1.65.E-01 LOCAL -1.37.E-01 PEATONAL NA RUTAS SITP 2.53.E-03
INTERSECCIÓN SEMAFORIZADA -7.69.E-02 RED DE CICLORRUTAS -1.20.E-01 .
PUENTE PEATONAL 2.55.E-01 ** USOS DE SUELO
RESIDENCIAL -1.87.E-01 . DOTACIONAL -1.97.E-01 INDUSTRIAL 1.33.E-01
COMERCIO -2.41.E-01 * ÁREA DE ACTIVIDAD INTEGRAL NA ÁREA DE ACTIVIDAD CENTRAL -5.48.E-01 ** SUELO DE PROTECCIÓN -4.93.E-01
22
DEMOGRÁFICAS
TASA DE VEHÍCULOS POR HABITANTES -2.97.E-07 DENSIDAD POBLACIONAL -1.87.E-04 TASA DE OCUPACIÓN LABORAL -2.41.E-02 ***
R2 de McFadden 0.1024339
En el modelo A en el cual se incluyeron todas las variables de cada categoría, se tiene que,
dentro de las variables de infraestructura las más significativas son la cercanía al puente
peatonal y a la red de ciclorrutas. La gravedad del siniestro aumenta cuando se encuentra
cerca un puente peatonal y cuando no hay cercanía a la red de ciclorrutas.
En cuanto a los usos de suelo, son variables significativas dentro del modelo, resaltando que
la gravedad del siniestro disminuye no se presenta uso comercial, el área de actividad
central y el uso residencial.
Y por último de las variables demográficas, la más significativa dentro de la categoría y
dentro del grupo es la tasa de ocupación laboral, entre menor es la tasa de ocupación en la
zona, mayor es la gravedad de los siniestros.
MODELO B
INFRAESTRUCTURA
ARTERIAL 8.39.E-02
INTERMEDIA -2.70.E-01
LOCAL -2.13.E-01
PEATONAL
RUTAS SITP 4.35.E-03
INTERSECCIÓN SEMAFORIZADA -1.47.E-01 *
RED DE CICLORRUTAS -1.71.E-01 *
PUENTE PEATONAL 2.16.E-01 **
USOS DE SUELO
RESIDENCIAL
-1.99.E+00 ***
DOTACIONAL -1.94.E+00 **
INDUSTRIAL -1.63.E+00 **
COMERCIO -2.06.E+00 ***
ÁREA DE ACTIVIDAD INTEGRAL -1.79.E+00 **
ÁREA DE ACTIVIDAD CENTRAL -2.55.E+00 ***
SUELO DE PROTECCIÓN -2.17.E+00 **
DEMOGRÁFICAS
TASA DE VEHÍCULOS POR HABITANTES
-2.45.E-08
DENSIDAD POBLACIONAL -5.52.E-04 *
TASA DE OCUPACIÓN LABORAL -2.66.E-02 ***
R2 de McFadden 0.09954258 0.09813682 0.09675876
23
En el Modelo B se evaluaron las categorías de variables de manera independiente. Dentro
de las variables de infraestructura las más significativas son la cercanía a los puentes
peatonales, la red de ciclorrutas y las intersecciones semaforizadas, si no se cuenta con este
tipo de infraestructura en un entorno de 300 metros, mayor es la gravedad del siniestro. En
cuanto a los usos de suelo los más significativos son el uso de suelo residencial, comercial y
las áreas de actividad central. Por último, dentro de las variables demográficas, la más
significativa es la tasa de ocupación laboral seguido de la densidad poblacional.
MODELO C
INFRAESTRUCTURA
ARTERIAL 1.10.E-01 1.83.E-01
INTERMEDIA -2.32.E-01 -1.83.E-01 LOCAL -1.86.E-01 -1.52.E-01 PEATONAL NA NA RUTAS SITP 3.81.E-03 2.82.E-03 INTERSECCIÓN SEMAFORIZADA -1.05.E-01 -1.03.E-01 RED DE CICLORRUTAS -1.54.E-01 * -1.22.E-01 * PUENTE PEATONAL 2.19.E-01 ** 2.51.E-01 **
USOS DE SUELO
RESIDENCIAL -2.04.E-01 *
-1.78.E-01 *
DOTACIONAL -2.41.E-01 -1.21.E-01 INDUSTRIAL 6.79.E-02 1.90.E-01 COMERCIO -3.23.E-01 ** -2.09.E-01 * ÁREA DE ACTIVIDAD INTEGRAL -7.18.E-01 ÁREA DE ACTIVIDAD CENTRAL -6.27.E-01 ** SUELO DE PROTECCIÓN -5.12.E-01 -3.93.E-01
DEMOGRÁFICAS
TASA DE VEHÍCULOS POR HABITANTES
-3.29.E-07 -2.34.E-07
DENSIDAD POBLACIONAL -2.96.E-04 -4.13.E-04 *
TASA DE OCUPACIÓN LABORAL -2.74.E-02 *** -2.23.E-02 ***
R2 de McFadden 0.1014447 0.1009549 0.09857269
Para el modelo C se incluyeron las variables por grupos de dos categorías, se tiene que tiene
mayor relación las variables de uso de suelo con las variables de infraestructura. Las
variables más significativas en este caso son el uso de suelo comercial y residencial y la
cercanía al puente peatonal o la red de ciclorrutas. En el modelo en el cual se evaluaron las
variables de infraestructura y las variables demográficas siguen siendo significativas las
variables de la cercanía al puente peatonal y la tasa de ocupación laboral.
Grupo 2 de modelos
En este grupo se evaluaron las tres categorías de variables (infraestructura, usos de suelo y
demográficas) para determinar su significancia en la clase del siniestro reportada.
24
ATROPELLO CHOQUE CAÍDA VOLCAMIENTO
INFRAESTRUCTURA
ARTERIAL 1.45.E-01 9.54.E-01 . 2.11.E+13 -4.96.E-01
INTERMEDIA -1.96.E-01 5.96.E-01 2.11.E+13 -7.18.E-01
LOCAL -1.36.E-01 6.59.E-01 2.11.E+13 -6.18.E-01
PEATONAL NA NA 2.11.E+13 NA
RUTAS SITP 1.66.E-03 -7.62.E-03 . -6.62.E-03 2.22.E-02 *
INTERSECCIÓN SEMAFORIZADA
-1.26.E-01 . -1.13.E-01 1.85.E-01 -1.62.E-01
RED DE CICLORRUTAS -1.38.E-01 * 3.03.E-02 -1.65.E-01 -5.78.E-02
PUENTE PEATONAL 1.99.E-01 * 3.43.E-01 ** -9.74.E+00 1.33.E-01
USOS DE SUELO
RESIDENCIAL -1.85.E+00 ** 1.08.E+01 -5.95.E+12 -1.58.E+01
DOTACIONAL -1.87.E+00 ** 1.10.E+01 -5.95.E+12 -1.56.E+01
INDUSTRIAL -1.55.E+00 ** 1.11.E+01 -5.95.E+12 -1.48.E+01
COMERCIO -1.87.E+00 ** 1.07.E+01 -5.95.E+12 -1.55.E+01
ÁREA DE AC. INTEGRAL -1.72.E+00 ** 1.08.E+01 -5.95.E+12 -1.54.E+01
ÁREA DE AC. CENTRAL NA NA NA NA
SUELO DE PROTECCIÓN -2.02.E+00 ** 1.05.E+01 -5.95.E+12 -1.64.E+01
DEMOGRÁFICAS
TASA DE VEH/HAB -1.04.E-06 -1.13.E-06 -2.90.E-05 2.64.E-06
DENSIDAD POBLACIONAL 2.08.E-06 -5.24.E-04 1.23.E-04 1.89.E-03 *
TASA DE OCUPACIÓN LABORAL
-2.55.E-02 *** -2.26.E-02 * 5.22.E-02 -1.40.E-02
R2 de McFadden 0.052814 0.09185384 0.134303 0.051884
Con los registros de siniestros reportados de acuerdo a la clase del siniestro se identificó
que las víctimas registradas en siniestros de clase choque, tienden a ser más graves cuando
hay ausencia de ciclorrutas y de intersecciones semaforizadas. En cuanto a usos de suelo
todos presentan significancia para la gravedad del siniestro, y la tasa de ocupación laboral
dentro de este modelo es la variable más significativa.
Para las víctimas de atropello, las variables más significativas son la cercanía al puente
peatonal, el tránsito de rutas de transporte público y las vías arteriales. En las variables
demográficas analizadas presenta significancia la tasa de ocupación laboral.
Dentro de la clase reportada como volcamiento son significantes, la densidad poblacional y
el tránsito de rutas de transporte público. Para la clase caída no se presentan variables
significativas, aunque este modelo es el que presenta mejor R2.
25
Grupo 3 de modelos
En el grupo 3 de modelos, se evaluaron las variables para los registros de siniestros de
acuerdo a la condición de la víctima, peatón, ciclista y motociclistas, los cuales son los
actores más vulnerables en las vías. Los resultados se muestran en la tabla resumen a
continuación.
PEATÓN CICLISTA MOTOCICLISTA
INFRAESTRUCTURA
ARTERIAL 1.10E+00 * -2.21E-01 -1.96E-01
INTERMEDIA 6.66E-01 -4.24E-01 -5.74E-01
LOCAL 7.53E-01 -5.88E-01 -6.61E-01 .
PEATONAL NA NA NA
RUTAS SITP -3.84E-03 5.00E-03 -3.47E-03
INTERSECCIÓN SEMAFORIZADA -1.34E-01 -2.35E-01 1.27E-01
RED DE CICLORRUTAS 2.97E-02 -4.98E-01 ** -1.79E-01
PUENTE PEATONAL 3.36E-01 ** -2.52E-01 2.78E-01 .
USOS DE SUELO
RESIDENCIAL 1.09E+01 1.05E+01 -2.78E+00 ***
DOTACIONAL 1.10E+01 9.84E+00 -2.66E+00 ***
INDUSTRIAL 1.12E+01 1.06E+01 -2.34E+00 **
COMERCIO 1.08E+01 1.03E+01 -2.91E+00 ***
ÁREA DE ACTIVIDAD INTEGRAL 1.09E+01 1.04E+01 -2.30E+00 **
ÁREA DE ACTIVIDAD MINERA
ÁREA DE ACTIVIDAD CENTRAL 1.05E+01 9.41E+00 -3.36E+00 ***
SUELO DE PROTECCIÓN 9.72E+00 9.58E+00 -2.39E+00 **
DEMOGRÁFICAS
TASA VEHÍCULOS POR HABITANTE -1.68E-06 -1.44E-06 4.93E-08
DENSIDAD POBLACIONAL -5.11E-04 3.14E-04 9.72E-05
TASA DE OCUPACIÓN LABORAL -1.64E-02 . -4.81E-02 * -1.92E-02
R2 de McFadden 0.08791836 0.08791836 0.01984743
Para los peatones reportados como víctimas, aumenta la gravedad del siniestro cuando hay
cercanía a un puente peatonal y cuando la vía se clasifica como arterial. En cuanto a los
ciclistas esta gravedad aumenta cuando no se cuenta con red de ciclorrutas y se tiene una
baja tasa de ocupación laboral en la zona. Por último, la gravedad de los siniestros de los
motociclistas aumenta en las vías locales de la ciudad y cerca de un puente peatonal. En
este caso los usos de suelo toman gran importancia, destacándose el uso residencial,
dotacional y e industrial.
26
7 CONCLUSIONES Y RECOMENDACIONES
Este documento propone un modelo logit binomial con datos de siniestralidad para analizar
los factores clave que afectan el nivel de gravedad de los siniestros en las vías de Bogotá.
Se utilizaron registros de víctimas heridas y muertas de la base de datos de la Secretaria
Distrital de Movilidad. Estas bases de datos corresponden a las víctimas registradas en un
periodo de tres años, datos suficientes para calibrar el modelo y con el fin de que funcionara
el modelo logit planteado.
Los resultados sugieren correlaciones espaciales significativas en los datos registros de
siniestros con víctimas y las variables seleccionadas. En los hallazgos se encontró que la
combinación de factores asociados a la infraestructura vial y características de la víctima
inciden directamente en la gravedad de la víctima.
En resumen, es más probable que ocurran siniestros con mayor severidad: i) cuando están
involucrados peatones, ciclistas y motociclistas; ii) en vías arteriales; iii) vías que no cuentan
con ciclorrutas cercana; iv) cuando no se tienen intersecciones semaforizadas cerca; v)
entre mayor sea la edad de la víctima; vi) cuando se presentan choques o atropellos; y vii)
cuando se encuentra cerca de un puente peatonal.
Los hallazgos anteriores permiten la identificación de factores que permiten definir las
medidas de gestión adecuadas para reducir los siniestros en las vías de la ciudad. En este
sentido, las medidas pueden ir encaminadas al incremento de intersecciones semaforizadas
y la ampliación de la red de ciclorrutas, ya que, de acuerdo a los resultados de los modelos,
la presencia de este tipo de infraestructura reduce la gravedad de los siniestros.
Asimismo, debe notarse que el modelo general propuesto no considera una gran cantidad
de variables que también hubieran podido incidir en los resultados, es decir asociar un
mayor número de variables a cada siniestro. Por esta razón, no se encontró
satisfactoriamente una relación con algunas de las variables planteadas, por lo cual sería
útil complementar el análisis con otros factores que se considere que pueden incidir en la
gravedad de los siniestros.
Por otro lado, cabe resaltar que los datos recopilados del periodo de tiempo analizado,
constituyen una buena fuente de análisis para el caso de Bogotá. Sin embargo, en este
estudio los coeficientes encontrados y las relaciones empíricas encontradas no son
transferibles a otra área geográfica. Para lograr esto, sería necesario contar con una
muestra tipo panel que permita controlar las asociaciones con variables adicionales a las
utilizadas en el presente estudio.
En general el presente estudio contó con datos suficientes para el alcance que se planteó
desde el principio, sin embargo, sería útil contar con una muestra más grande y con más
variables que permitieran hacer más robusto el análisis. Entre estas, sería útil contar con
información más específica para cada uno de los diferentes modos, e información adicional
27
como volúmenes o velocidades puntuales de operación, los cuales ya han sido identificados
como factores relevantes en la severidad de los siniestros.
8 REFERENCIAS
Bartlett, J. (8 de February de 2014). The Stats Geek. Obtenido de The Stats Geek:
https://thestatsgeek.com/2014/02/08/r-squared-in-logistic-regression/
Damodar N. Gujarati, D. C. (2009). Econometría. Quinta edición. Mexico.: Mc Graw-Hill.
Fan Ye, D. L. (2014). Comparing three commonly used crash severity models on sample size
requirements: Multinomial logit, ordered probit and mixed logit models. Analytic
Methods in Accident Research, 72-85.
Fidel Gómez, J. P. (2014). Accident prediction Models for bus rapid transit systems:
Generalized linear models versus neural network. TRB 2015 Annual Meeting.
Francesca La Torre, M. M. (2019). Accident prediction models for urban roads. Accident
Analysis & Prevention, , 1-11.
Gary King, L. Z. (2001). Logistic Regression in Rare Events Data. Political Analysis, 9(2), 137-
163.
Gomes, S. V. (2013). The influence of the infrastructure characteristics in urban road
accidents occurrence. Accident Analysis & Prevention, 289-297.
Greibe, P. (2003). Accident prediction models for urban roads. Accident Analysis &
Prevention, 273-285.
Gutiérrez Puebla, J. G.-P.-C. (2012). Regresión Geográficamente Ponderada (GWR) y
estimación de la demanda de las estaciones del Metro de Madrid. Madrid: XV
Congreso Nacional de Tecnologías de la Información Geográfica.
John C. Milton, V. N. (2007). Highway accident severities and the mixed logit model: An
exploratory empirical analysis. Accident Analysis and Prevention.
R, M. G. (2016). Modelos de regresión lineal múltiple. Granada: Documentos de Trabajo en
Economía Aplicada. Universidad de Granada.
Secretaria Distrital de Movilidad. (2018). Anuario de siniestralidad vial de Bogotá 2017.
Bogotá D.C.: Secretaria Distrital de Movilidad.
Sunil Patil, S. R. (2012). Analysis of crash severities using nested logit model—Accounting
for the underreporting of crashes. Accident Analysis & Prevention, 646-653.
28
Wier, W. E. (2009). An area-level model of vehicle-pedestrian injury collisions with
implications for land use and transportation planning. Accident Analysis and
Prevention, 137-145.
29
9 CARTOGRAFÍA Figura 14 SINIESTRALIDAD VIAL BOGOTÁ 2016-2018
Fuente: Elaboración propia con base en información SDM
30
Figura 15 RED SEMAFÓRICA BOGOTÁ
Fuente: Elaboración propia con base en información SDM
31
Figura 16 puentes peatonales Bogotá
Fuente: Elaboración propia con base en información SDM
32
Figura 17 USOS DE SUELO
Fuente: Elaboración propia con base en información SDM
33
Figura 18 LESIONADOS Y MUERTOS EN SINIESTROS VIALES EN BOGOTÁ 2016-2018
Fuente: Elaboración propia con base en información SDM
34
Figura 19 RED VIAL DE BOGOTÁ
Fuente: Elaboración propia con base en información SDM
35
Figura 20 RED DE TRANSPORTE DE BOGOTÁ
Fuente: Elaboración propia con base en información SDM
36
Figura 21 UPZ DE BOGOTÁ
Fuente: Elaboración propia con base en información SDM