Post on 20-Sep-2020
RESUMEN EJECUTIVO
ANÁLISIS FORENSE ELECTORAL DE BOLIVIA PARA LAS ELECCIONES
PRESIDENCIALES DE OCTUBRE DEL 2019
Grupo de Académicos de la Universidad Católica Boliviana “San Pablo”
El objetivo de la democracia es el autogobierno de los ciudadanos de un país. Para lograr ese objetivo se
hace necesario la existencia de instituciones electorales transparentes y confiables que puedan gestionar el
voto de los ciudadanos hacia una elección justa de candidatos. Sin embargo, en algunos casos las
instituciones a cargo de la gestión del voto alteran el mismo debido a intereses personales, políticos y/o
económicos. Actualmente avances en técnicas científicas (análisis forense electoral) permiten identificar
este tipo de actos de manipulación arbitraria de registros electorales. Estas técnicas se basan en el uso de
leyes matemáticas universales que reflejan patrones de comportamiento de los números. Una de esas
técnicas se basa en una ley matemática conocida como la Ley de Benford. Esta ley indica que los
primeros dígitos de los números encontrados en cualquier tipo de registro no muestran una distribución
uniforme. Más bien, se organizan de manera tal que el dígito "1" es el más frecuente, seguido del "2", "3",
y de manera sucesivamente decreciente hasta "9". Quizás la mejor manera de convencerse a uno mismo
de que la ley funciona es escoger un libro o revista al azar y enumerar u ordenar los números que se
encuentren. Se notará que aproximadamente: (a) 33.4% de los números recopilados comenzarán con el
número 1; (b) 18.5% comenzarán con el número 2; (c) 12.4% comenzarán con el número 3; (c) 7.5%
comenzarán con el número 4; y así sucesivamente. Además, se ha demostrado que la Ley de Benford se
puede aplicar a una amplia variedad de registros, que incluyen: facturas de electricidad, direcciones de las
calles, precios de acciones, precios de viviendas, cantidad de población, tasas de mortalidad, tramos de
ríos, procesos electorales y otros. En particular, un uso muy común de la Ley de Benford corresponde a la
detección de manipulaciones arbitrarias de datos, donde se analizan registros existentes y se comparan
con las proporciones mencionadas. En caso que las proporciones de los números recolectados no
correspondan a las proporciones esperadas por la Ley de Benford, se considera como indicativo de la
existencia de manipulación arbitraria de registros. A través del uso de la Ley de Benford se han
identificado: fraudes fiscales en EEUU (Business Insider 2015), manipulación de cuentas del Gobierno
Griego para entrar a la Unión Europea (Forbes 2015), operaciones de inversión fraudulenta (Matthews
2019), irregularidades en las elecciones en Rusia (The Washington Post 2017) y otros. En consecuencia,
la Ley de Benford ofrece una herramienta científica universal para la detección de actos de manipulación
arbitraria de registros en diferentes tipos de procesos, como ser los procesos electorales.
Por otro lado, para la detección de actos de manipulación arbitraria de registros también se cuenta con una
ley estadística conocida como la Distribución Normal. En esencia, la Distribución Normal es una fórmula
que se basa en dos parámetros simples (media y desviación estándar) que cuantifican las características de
un conjunto dado de datos. Específicamente, la media indica el valor "central" o promedio de todo un
conjunto de datos y la desviación estándar indica la "dispersión" o la variación de los puntos de datos
alrededor de ese valor medio. La distribución se parece a una campana y por eso también se la llama la
Campana de Gauss. Para no entrar en formulas complejas, se puede entender la Distribución Normal
como una medición de cuán “normal” es un fenómeno bajo estudio. Específicamente, cuando el
fenómeno bajo estudio no es “normal”, los datos obtenidos se comportan de forma extraña, excéntrica o
anormal y no se parecen a una campana. En cambio, cuando el fenómeno bajo estudio es “normal”, la
mayoría de los datos son más o menos parecidos (la mayor parte del tiempo) y se asemejan a una
campana. En otras palabras, cuando los datos siguen una Distribución Normal, la mayor parte de los datos
estarán alrededor del medio de la campana, mientras que unos pocos datos estarán en los alrededores. En
ese sentido, cuando los registros de un proceso complejo bajo análisis, como procesos electorales, no
siguen una Distribución Normal, se consideran como un indicativo de la existencia de algo inusual.
Basados en esos principios, la Distribución Normal se utiliza para: detección de procesos fraudulentos en
asignación de créditos (Giardino 2014), líneas de producción fuera de control (Muelaner 2019),
manipulación electoral (Klimek et al. 2012) y otros.
Para analizar la existencia de huellas de manipulación arbitraria en las bases de datos electorales de
Bolivia, nuestra investigación analizó la base de datos de elecciones presidenciales del 20 de octubre de
2019 realizadas en Bolivia. Específicamente, se utilizaron leyes estadístico-matemáticas que permiten la
detección de huellas de una posible manipulación arbitraria de registros en las bases de datos de votos
registradas en el sistema de Transmisión de Resultados Electorales Preliminares (TREP) y Conteo Oficial
del tribunal electoral de Bolivia (Órgano Electoral Plurinacional - OEP). Para ese propósito se descargó
de la página web del OEP las bases de datos del TREP al 95% (22:23 del 21 de octubre de 2019) y el
conteo oficial al 100% (20:31 del 24 de octubre del 2019). Luego de aplicar cuatro técnicas estadísticas
relacionadas con la Ley de Benford y cinco técnicas relacionadas con la Distribución Normal, se
detectaron huellas de manipulación arbitraria de registros. Específicamente, se encontró que la Ley de
Benford detecta manipulaciones numéricas en las bases de datos del TREP y conteo oficial para: (a) el
segundo dígito (2BL); (b) último digito para el partido CC (Ultimo C); y (d) último dígito para los
partidos CC y PDC (C05 y P05). Por otro lado, las cinco técnicas relacionadas con la Distribución
Normal detectaron anomalías en el TREP y Conteo Oficial relacionadas con: (a) síntomas mezclas de
votos de los votantes utilizando votos de fuentes arbitrarias para el partido CC (Unimodalidad); (b)
formas extrañas no simétricas y puntiagudas que no se aproximan a la Campana de Gauss (Skew, Kurt,
Test de Normalidad) (ver Fig. 1); y (c) mesas con porcentajes de votación superiores al 100% y patrones
de votación irregulares muy diferentes a un patrón ideal esperado (Huella Dactilar de Elecciones) (ver
Fig. 2).
En conclusión, el uso de leyes estadístico-matemáticas sugiere que las bases de datos de la elección
presidencial 2019 de Bolivia se han generado huellas relacionadas con manipulaciones arbitrarias de los
registros de votación. Además, nuestros resultados sirven como un marco referencial que explican los
posibles errores registrados durante esa contienda electoral (por ejemplo, ver Aré-Vasquez 2019; Molina
2019 y otros). En consecuencia, este estudio implementa un análisis forense electoral en Bolivia y abre
nuevos caminos de investigación forense de transparencia electoral.
Fig. 1 Distribución de datos de votantes TREP y Conteo Oficial
Nota. En ambas graficas se representan los histogramas de los datos de votación real para el TREP y el Conteo
Oficial. La línea continua representa el comportamiento ideal esperado de la variable analizada bajo condiciones
normales (Campana de Gauss).
Fig. 2 Huella dactilar de un Patrón Ideal vs TREP vs. Conteo Oficial:
Nota. En la gráfica de la izquierda se representa la huella dactilar de elecciones de una base de datos ideal.
En las gráficas del centro y de la derecha se representa la huella dactilar de elecciones para los datos del TREP y
del Conteo Oficial, respectivamente.
Referencias
Aré-Vasquez, T. (2019). Entrevista al informático que asegura que hubo fraude en las elecciones
de Bolivia: “Se computó el voto de ausentes para favorecer a Evo Morales". Retrieved November
2, 2019, from https://www.infobae.com/america/america-latina/2019/11/02/entrevista-con-el-
informatico-que-asegura-que-hubo-fraude-en-las-elecciones-bolivianas-se-computo-el-voto-de-
ausentes-para-favorecer-a-evo-morales/
Business Insider. (2015). This mathematical law can tell you whether a company is cooking its
books. Retrieved November 4, 2019, from https://www.businessinsider.com/deutsche-banks-use-
of-benford-law-to-detect-company-fraud-2015-6
Forbes. (2015). Greece financial crisis: Data science could have exposed warning signs.
Retrieved November 4, 2019, from https://www.forbes.com/sites/sap/2015/07/09/greece-
financial-crisis-data-science-could-have-exposed-warning-signs/#55d9864f6066
Giardino, J. (2014). Caught by the numbers: Data analytics winnows out possible fraudster.
Fraud Magazine. Retrieved from https://www.fraud-magazine.com/article.aspx?id=4294981970
Klimek, P., Yegorov, Y., Hanel, R., & Thurner, S. (2012). Statistical detection of systematic
election irregularities. Proceedings of the National Academy of Sciences of the United States of
America, 109(41), 16469–16473. https://doi.org/10.1073/pnas.1210722109
Matthews, R. (2019, January 11). Why a little-known law could be number one way to combat
global fraud. The National. Retrieved from https://www.thenational.ae/uae/science/why-a-little-
known-law-could-be-number-one-way-to-combat-global-fraud-1.811947
Molina, F. (2019). ¿En qué se basan las acusaciones de fraude que sacuden Bolivia? El País.
Retrieved November 2, 2019 from
https://elpais.com/internacional/2019/10/25/america/1572027831_226380.html
Muelaner, J. (2019). An introduction to statistical process control (SPC). Retrieved November 4,
2019, from https://www.engineering.com/AdvancedManufacturing/ArticleID/19494/An-
Introduction-to-Statistical-Process-Control-SPC.aspx
The Washington Post. (2017, January 11). When the Russians fake their election results, they
may be giving us the statistical finger. Analysis. Retrieved from
https://www.washingtonpost.com/news/monkey-cage/wp/2017/01/11/when-the-russians-fake-
their-election-results-they-may-be-giving-us-the-statistical-finger/
PATRON IDEAL TREP CONTEO OFICIAL
INVESTIGACIÓN
ANÁLISIS ELECTORAL FORENSE DE BOLIVIA PARA LAS ELECCIONES
PRESIDENCIALES DE OCTUBRE DEL 2019
Grupo de Académicos de la Universidad Católica Boliviana “San Pablo”
RESUMEN
Las sociedades democráticas se construyen basadas en elecciones realizadas con libertad e imparcialidad.
Estadísticamente hablando, las elecciones pueden considerarse como experimentos sociales a gran escala
donde las personas se agrupan en mesas electorales y votan por el candidato de su preferencia. Debido a
que la elección presidencial conlleva un gran número de votantes, los datos obtenidos deberían cumplir
las leyes de la estadística-matemática (por ejemplo, la Ley de Benford). El no cumplimiento de las leyes
estadístico-matemáticas de las bases de datos electorales puede sugerir la existencia de irregularidades
como ser la manipulación arbitraria de registros electorales. Además, mediante una representación
adecuada de datos se pueden obtener las distribuciones estadísticas de los resultados electorales. Cuando
esas distribuciones muestran asimetrías excesivas, curtosis irregulares, huellas electorales dudosas y
comportamientos no normales, también pueden ser consideradas como huellas de manipulación arbitraria
de registros electorales.
Actualmente, la literatura boliviana e internacional adolece de estudios científicos relacionados con el
análisis forense al sistema electoral de Bolivia. Específicamente, la literatura boliviana e internacional
muestra la presencia de estudios políticos o sociológicos. Sin embargo, adolece de estudios cuantitativos
que analicen el fenómeno de las elecciones bolivianas desde una perspectiva cuantitativa. Para avanzar en
ese problema de la literatura, nuestro estudio analiza cuantitativamente los resultados de las últimas
elecciones presidenciales del 20 de octubre de 2019. En particular, se procesaron las bases de datos del
sistema de Transmisión de Resultados Electorales Preliminares (TREP) y del Conteo Oficial (CO) del
Órgano Plurinacional Electoral (OEP) de Bolivia. Como resultado, se obtuvo una muestra 33045 mesas
del TREP y 34552 mesas del Cómputo Oficial. A continuación, se procedió con la implementación de
pruebas relacionadas con leyes matemático-estadísticas a ambas bases de datos: (a) Ley de Benford (2BL,
UltimoC, C05 y P05): y (b) análisis de distribuciones de votantes (Unimodal, Skew, Kurt, Huella Dactilar
de Elecciones y Test de Normalidad).
Como resultado de los análisis se encontró que las diferentes técnicas producían resultados similares y
robustos para ambas bases de datos (TREP y CO). Específicamente, los resultados obtenidos sugieren la
existencia de huellas de manipulación arbitraria de los registros de votación. Finalmente, nuestra
investigación abre oportunidades de investigación para el desarrollo y validación de procesos electorales
en países subdesarrollados, como Bolivia.
Palabras clave. Análisis forense electoral, elecciones presidenciales, modelamiento estadístico, Bolivia
1. INTRODUCCIÓN
Las sociedades democráticas son construidas alrededor del principio de libertad y elecciones justas
(Klimek et al. 2012). Las elecciones transparentes se caracterizan porque el conteo de votos es igualitario,
libre y justo. Sin embargo, en muchos casos los conteos de votos no son realizados de forma transparente
debido a intereses personales, políticos y/o económicos de las instituciones o personas encargadas de
gestionar los resultados electorales. Como resultado, se hace necesario distinguir si los resultados de una
votación se deben a la voluntad del pueblo, o la voluntad de las instituciones electorales.
El análisis forense electoral es un campo nuevo en el que los científicos utilizan un conjunto diverso
de herramientas estadísticas, incluidas técnicas similares a las desarrolladas para detectar fraude
financiero, para analizar datos electorales numéricos y detectar patrones artificiales que se desvían de los
patrones que deberían ocurrir naturalmente. Cuando las personas manipulan números dejan desviaciones
que naturalmente no ocurrían. Estas desviaciones sugieren que los números fueron intencionalmente
alterados o que otros factores han influenciado los resultados electorales. En consecuencia, Hicken y
Mebane (2017) sugieren que cuanto mayor sea el número de pruebas estadísticas que identifican patrones
que se desvían de lo que se espera que ocurra naturalmente, es más probable que la desviación resulte de
la manipulación de los votos, en lugar del voto libre y soberano.
A diferencia de otros países, a la fecha en Bolivia no se han realizado estudios cuantitativos que hayan
analizado de forma forense la información disponible de procesos electorales pasados. Al mejor de
nuestro conocimiento la mayoría de los estudios electorales científicos se enfocan a aspectos como:
participación indígena (Von Cott 2003), votación de emigrantes bolivianos (Lafleur y Sánchez-
Domínguez 2015), populismo (Lazar 2004), elecciones judiciales (Driscol y Nelson 2015) y otros. En
consecuencia, el presente estudio es el primero en la literatura boliviana e internacional en realizar un
análisis estadístico forense al sistema electoral boliviano. Los resultados de este estudio aportan a la
literatura boliviana e internacional como un marco referencial para el análisis estadístico forense de
elecciones previas y futuras en Bolivia. Por otro lado, los resultados de este estudio aportan a la literatura
metodológica electoral forense al brindar un panorama del estado de los procesos electorales de un país
subdesarrollado, como Bolivia.
En las siguientes secciones presentamos la revisión de literatura, donde se presentan aspectos
relevantes de la estadística electoral forense. Posteriormente, se presenta la metodología de análisis
estadístico forense basado en las investigaciones realizadas por Hicken y Mebane (2017) y Klimek et al.
2012. Luego se presentan los resultados y conclusiones del estudio.
2. REVISIÓN DE LITERATURA
Las elecciones pueden considerarse como experimentos sociales de gran escala. Es decir, un país se
segmenta en una gran cantidad de mesas electorales. Cada mesa electoral representa un experimento
estandarizado donde cada ciudadano materializa su preferencia electoral. En condiciones ideales, los
votos de los ciudadanos serán registrados sin modificaciones por los organismos electorales para poder
declarar un ganador del proceso electoral. Sin embargo, por razones personales, políticas y/o económicas
los organismos electorales realizan la alteración de los registros electorales. En ese sentido, existen
diferentes maneras de realizar manipulaciones arbitrarias de registros electorales. Por ejemplo, eliminar el
secreto del voto forzando a los ciudadanos a mostrar física o electrónicamente el partido por el que
votaron. Por otro lado, a pesar que la revisión de los registros electorales para la búsqueda de
incoherencias entre registros físicos y electrónicos puede establecer estadísticas descriptivas de una
posible manipulación arbitraria, bajo ninguna circunstancia pueden establecer la misma. Esto ocurre
porque, aunque las estadísticas descriptivas permiten entender la tendencia central y variabilidad de los
datos bajo análisis, estas no permiten hacer generalizaciones a la población. En ese sentido, la estadística
inferencial ofrece herramientas matemáticas que permiten realizar generalizaciones a la población
indicando un rango de números potenciales junto con un grado de confianza (Taylor 2019). Bajo lo
anteriormente expuesto, el estudio de la manipulación arbitraria de procesos electorales hace necesario el
uso de técnicas de estadística inferencial.
Dentro de las técnicas de estadística inferencial para el análisis de manipulación de registros
electorales se encuentra una familia de técnicas científicas conocidas como análisis forense electoral. El
análisis forense electoral es un área científica emergente que busca aislar posibles anomalías electorales y
diagnosticar la precisión de los resultados electorales mediante técnicas estadísticas que pueden
identificar patrones y evaluar la probabilidad de que estas se deban a la casualidad (Hicken y Mebane
2017). Diferentes técnicas del análisis estadístico forense adoptan las técnicas desarrolladas para la
detección de fraudes financieros. El principio básico que comparten ambas áreas se relaciona con que
cuando las personas manipulan números dejan patrones de dígitos que probablemente no ocurrirían a
través de un proceso “natural”. En esencia, las manipulaciones numéricas dejan huellas claras. En
consecuencia, si los resultados electorales tienen patrones no naturales, esas anomalías pueden ser
detectadas utilizando técnicas estadísticas.
Los métodos del análisis forense electoral muestran tres ventajas claras. Primero, se basan en
resultados electorales objetivos reportados por los tribunales electorales de un país y no en observaciones
subjetivas de observadores electorales. Estos resultados se los utiliza exactamente como han sido
reportados sin ningún tipo de manipulación adicional o criterio subjetivo personal. Segundo, el análisis
forense electoral permite el análisis sistemático de todos los votos reportados de un país, incluso de
aquellos lugares que los observadores no tuvieron acceso por razones políticas, de seguridad o logística.
Tercero, el análisis forense electoral produce estimaciones confiables de la manipulación arbitraria, que
incluyen rangos de confianza de las conclusiones. Además, se diferencian de los métodos de observación
descriptiva que se basan en una vaga certeza del analista y que no necesariamente puede estar bien
fundamentada.
Dentro de los métodos de análisis forense electoral sobresalen aquellos relacionados con la Ley de
Benford (Benford 1938). Específicamente, algunas prácticas de manipulación numérica del voto dejan
huellas que se pueden detectar mediante métodos cuantitativos. En ese sentido, la Ley de Benford surge
como una herramienta de detección de manipulación arbitraria de registros electorales (Klimek et al.
2012). La Ley de Benford es una observación estadístico-matemática para muchos procesos de la vida
cotidiana y sugiere que el logaritmo del primer digito es una variable aleatoria y se encuentra
uniformemente distribuido. Como consecuencia, las desviaciones numéricas de esta ley indican la
existencia de otros mecanismos, posiblemente arbitrarios, que afectan los resultados. Por ejemplo, los
resultados de mesas de votación alejadas para cierto distrito electoral podrían haber sido manipuladas y
elegidas a conveniencia por el representante de un partido político que le gustan los múltiplos de 10. En
consecuencia, en comparación con votaciones no manipuladas, el digito 0 ocurrirá más frecuentemente
como el último dígito en los conteos manipulados de votos. De esa manera se rompe la Ley de Benford y
se infiere una posible manipulación arbitraria.
Otra manera de detectar posibles manipulaciones arbitrarias de registros electorales corresponde a la
revisión de la distribución de votantes y el número de votantes inscritos. Este análisis consiste en la
detección de dos mecanismos: rellenado forzado de votos y reporte de números inventados. Según
Klimek et al. (2012), estos tipos de análisis permiten identificar características diferenciadas del voto y
distribuciones de votantes manipuladas arbitrariamente. Específicamente, el rellenado forzado de votos no
solamente cambia la forma de la distribución de votos y participación, sino también muestra la existencia
de conteos de votos inusualmente altos que ocurren de forma paralela con niveles de votación
inusualmente elevados.
Bajo lo anteriormente expuesto, en esta investigación utilizamos la Ley de Benford para detectar la
existencia de mecanismos de manipulación arbitraria de registros electorales. Por otro lado, analizamos
las desviaciones de las distribuciones de votantes y su participación como evidencia de rellenado de votos
y números inventados. En consecuencia, de encontrarse evidencia de la existencia de ese tipo de procesos
se podrá inferir que la base de datos presenta evidencia de manipulación arbitraria de registros electorales.
3. METODOLOGÍA
3.1. Ley de Benford
Para la implementación de la Ley de Benford existen diferentes técnicas. En nuestro caso utilizaremos
las técnicas recomendadas por Hicken y Mebane (2017) que sugieren el uso de: (a) 2BL: (b) UltimoC: (c)
C05; y (d) P05. Específicamente:
(a) 2BL o conocida como media del segundo digito. Es una prueba estadística en la que se aplica la
prueba al segundo dígito significativo en cada conteo de votos. Por ejemplo, si el conteo es 4213,
entonces 2 es el segundo digito significativo. Perichi y Torres (2011) sugieren que cuando el
conteo de votos de una elección no es arbitrario, la distribución de los segundos dígitos es similar
a la Ley de Benford (ver Tabla 1). Esto sugiere que, si los segundos dígitos aparecen con las
frecuencias que muestra la Tabla 1, la media será de aproximadamente 4.187. En consecuencia,
cuando una elección muestra indicios de manipulación arbitraria, el conteo de dígitos del voto no
mostrará la distribución de la Tabla 1 y la media será diferente a 4.187.
Tabla 1: Distribución de la Ley de Benford
Dígito 0 1 2 3 4 5 6 7 8 9
Probabilidad 0.120 0.114 0.109 0.104 0.100 0.097 0.093 0.090 0.088 0.085
(b) UltimoC o conocida como media del último dígito. Es una prueba estadística relacionada a la
aplicación de la técnica al último dígito de cada conteo de votos. Por ejemplo, si el conteo es
4213, entonces 3 es último dígito. Beber y Scacco (2012) indican que, si se ha realizado una
elección sin manipulación arbitraria de registros, la distribución de los últimos dígitos debería ser
uniforme. Es decir, cada uno de los diez dígitos (0, 1, 2, 3, 4, 5, 6, 7, 8, 9) deberían ocurrir con la
frecuencia 1/10 (0,1). En consecuencia, cuando los últimos dígitos ocurren en esas frecuencias, su
media será 4.5. En consecuencia, en elecciones sin manipulación arbitraria de registros se esperan
valores aproximados de 4.5 para la media de valores calculados de UltimoC.
(c) C05 es la media de una variable binaria construida por valores 1 cuando el último digito del
conteo de votos para un partido bajo análisis es 0 o 5. El C05 es un caso especial del argumento
de Beber y Scacco (2012) donde se indica que cuando una elección no presenta evidencia de
manipulación arbitraria, la media de C05 debería ser similar a 0.2.
(d) P05 es la media de una variable binaria construida por valores 1 cuando el último dígito de un
porcentaje redondeado de votos para un partido o candidato bajo análisis es 0 o 5. Los individuos
dejan huella que cometieron actos de manipulación arbitraria cuando estos dígitos suben su
probabilidad de aparecer. Luego, cuando de la media de la variable indicada es diferente a 0.2 es
un indicio de manipulación electoral arbitraria.
3.2. Análisis de distribuciones de votantes
Para realizar en análisis de las distribuciones de los votantes se utilizarán las siguientes técnicas
sugeridas por Hicken y Mebane (2019) y Klimek et al. (2012): (a) DipT; (b) Skew; (c) Kurt; (d) huella
dactilar de elecciones; y (e) test de normalidad. Donde:
(a) Unimodalidad. Esta prueba sugiere que cuando una distribución de votantes es multimodal, es
indicativo de irregularidades. Específicamente, las distribuciones de votantes inscritos y de
partidos participantes en la votación debería ser unimodal (Borghesi y Bouchaud 2010).
(b) Skew o asimetría. Esta prueba argumenta que cuando no existe comportamiento arbitrario, la
distribución de la votación debería ser aproximadamente normal. En consecuencia, las
mediciones de asimetría significativamente diferentes de cero sugieren la existencia de
manipulación arbitraria de datos.
(c) Kurt o curtosis. De forma similar a Skew, esta prueba argumenta que la distribución de una
votación sin manipulación arbitraria de registros debería ser aproximadamente normal. En
consecuencia, la existencia de fuertes curtosis es un indicativo de la existencia de manipulación
arbitraria.
(d) Huella dactilar de elecciones. Esta prueba es una prueba gráfica propuesta por Klimek et al.
(2012) que sugiere el uso de diagramas de dispersión del porcentaje de votos participantes en el
proceso electoral (eje x) y el porcentaje de votos para el partido o candidato ganador (eje y). Si se
identifican clústeres de datos, estos sugieren la existencia de procesos y mecanismos arbitrarios
en el proceso electoral.
(e) Test de normalidad. Esta prueba combina las pruebas de Skew y Kurt e indica que, si los valores
de Skew y Kurt se encuentran dentro de los rangos de normalidad, la votación no sufre de
comportamiento arbitrario. Para mejorar la precisión del test se pueden utilizar pruebas
estadísticas de normalidad como la prueba de Ghasemi y Zahediasl (2012).
4. ANALISIS Y RESULTADOS
Para cumplir el objetivo de este estudio inicialmente se procedió a bajar las bases de datos de la página
web del tribunal electoral de Bolivia (Organismo Electoral Plurinacional – OEP) para el Sistema de
Trasmisión de Resultados Electorales Preliminares (TREP) al 95% (22:23 del 21 de octubre de 2019) y el
Conteo Oficial (CO) al 100% (20:31 del 24 de octubre del 2019). A continuación, se procedió a remover
aquellos datos que correspondían a la votación por diputaciones para solamente analizar el conteo de
votos para presidente-vicepresidente. Como resultado se obtuvo una muestra de 33045 mesas del TREP y
34552 mesas del CO. Para la implementación de cálculos de pruebas de análisis forense electoral se
utilizó el software estadístico R. Además, debido a que los conteos de votos para los partidos con menor
votación generalmente no llegaban a dos dígitos por mesa, se realizó el cálculo solamente para el total de
votos válidos y los tres partidos con mayor votación de las bases de datos obtenidas (Movimiento al
Socialismo-Instrumento Político por la Soberanía de los Pueblos: IMAS-IPSP; Comunidad Ciudadana:
CC; y Partido Demócrata Cristiano: PDC).
4.1. Implementación de la Ley de Benford
A continuación, se presentan los resultados de la implementación de las pruebas estadísticas
relacionadas con la Ley de Benford:
(a) 2BL. Inicialmente se calculó el último dígito para la votación de cada partido para cada mesa de
la base de datos del TREP. A continuación, se calculó la media y se utilizó la prueba t de Student
de una muestra para determinar si los valores 2BL calculados los votos válidos y para cada
partido eran aproximadamente iguales al valor recomendado de 4.187 (ver Tabla 2). Como
resultado se obtuvo que ninguno de los valores 2BL se aproximan estadísticamente a 4.187 a un
nivel de confianza del 99% (p < 0.01). En consecuencia, la prueba 2BL sugiere la posible
existencia de manipulación arbitraria en la base de datos del TREP.
Posteriormente para validar los resultados obtenidos con en el sistema TREP se procedió a repetir
el procedimiento utilizando la base de datos del CO. Como muestra la Tabla 3, ninguno de los
valores 2BL para los votos válidos y los partidos cumple los criterios estadísticos recomendados
de aproximarse a la media de 4.187. En consecuencia, la base de datos del CO también sugiere la
existencia de manipulación arbitraria a un 99% de nivel de confianza (p < 0.01).
Tabla 2. Valores 2BL del TREP
Media t gl Valor p Media
Votos válidos
4.50
19.5
33043
< .001
0.309
MAS - IPSP
4.47
17.7
33043
< .001
0.280
CC
4.35
10.5
33043
< .001
0.166
PDC
4.38
12.1
33043
< .001
0.190
Tabla 3. Valores 2BL del CO
Media t gl Valor p Media
Votos válidos
4.50
19.7
34550
< .001
0.305
MAS - IPSP
4.47
18.3
34550
< .001
0.283
CC
4.35
10.0
34550
< .001
0.155
PDC
4.38
12.1
34550
< .001
0.186
(b) UltimoC. A continuación, se procedió a calcular la media del último dígito para la base de datos
del TREP. Inicialmente, se calculó la media e implementó la prueba t de Student de una muestra
para determinar si los valores UltimoC para los votos válidos y por partido eran
aproximadamente iguales a la media recomendada de 4.5. Adicionalmente, se eliminaron los
conteos menores a 100 votos utilizando la variable de votos válidos y siguiendo las
recomendaciones de Beber y Scacco (2012). Como resultado de la implementación de los
anteriores análisis se encontró que los valores de UltimoC para votos válidos de los partidos
MAS-IPSP y PDC no difieren significativamente del valor recomendado de 4.5 al 99% de nivel
de confianza (p > 0.01). Sin embargo, los valores de UltimoC para el CC difieren
significativamente al 99% de nivel de confianza del valor recomendado de 4.5 (p < 0.01). En
consecuencia, este último resultado sugiere que los valores del CC fueron sujetos a una
manipulación numérica arbitraria. Para validar estos resultados, se procedió a implementar el
mismo procedimiento en la base de datos del CO. Como resultado del análisis se obtuvo la Tabla
5 que, similar a la Tabla 4, muestra que con 99% de nivel de confianza, los valores de CO, MAS-
IPSP y PDC no difieren significativamente del valor recomendado de 4.5 (p > 0.01). Sin
embargo, los valores del CC difieren significativamente del valor recomendado (p < 0.01). En
consecuencia, los valores del CC para el CO presentan evidencia de haber sufrido manipulación
arbitraria de registros. Estas diferencias entre los valores de UltimoC del TREP y del CO sugieren
la existencia de manipulación arbitraria para los votos obtenidos por el partido CC.
Tabla 4. Valores UltimoC del TREP
Media t gl Valor p Media
Votos válidos
4.49
-0.347
30654
0.729
-0.00569
MAS – IPSP
4.47
-1.834
30654
0.067
-0.03013
CC
4.41
-5.661
30654
< .001
-0.09260
PDC
4.47
-1.625
30654
0.104
-0.02641
Tabla 5. Valores UltimoC del CO
Media t gl Valor p Media
Votos válidos
4.49
-0.634
31944
0.526
-0.0102
MAS – IPSP
4.47
-1.639
31944
0.101
-0.0263
CC
4.40
-6.236
31944
< .001
-0.0999
PDC
4.48
-1.473
31944
0.141
-0.0234
(c) C05. Posteriormente, se procedió a calcular C05 buscando valores ideales de 0.2 que indicarían
que la elección no presenta huella de manipulación arbitraria. Inicialmente se trabajaron los
valores del TREP y como muestra la Tabla 6, la prueba t de Student de una muestra indica que los
valores de votos válidos y MAS-IPSP no difieren significativamente del valor recomendado (p >
0.01). En cambio, los valores para CC y PDC difieren con un 99% de nivel de confianza del valor
recomendado de 0.2 (p < 0.01). En consecuencia, estos resultados sugieren que los valores del
TREP fueron sujetos a manipulación arbitraria para el caso específico de los partidos CC y PDC.
Tabla 6. Valores C05 del TREP
Media t gl Valor p Media
Votos válidos
0.200
-0.121
33043
0.904
-2.66e−4
MAS – IPSP
0.202
0.825
33043
0.409
0.00182
CC
0.207
3.086
33043
0.002
0.00688
PDC
0.209
3.968
33043
< .001
0.00887
A continuación, se procedió a validar los datos utilizando la base de datos de CO. Similar a la
Tabla 6, la Tabla 7 muestra, a un nivel de confianza del 99%, que los datos del CO sufrieron
manipulación arbitraria para los partidos CC y PDC porque son significativamente diferentes del
valor recomendado de 0.2 (p < 0.01). En consecuencia, C05 sugiere la presencia de manipulación
arbitraria en la base de datos del TREP y del CO para los partidos CC y PDC.
Tabla 7. Valores C05 del CO
Media t Gl Valor p Media
Votos Validos
0.199
-0.258
34550
0.796
-5.56e−4
MAS – IPSP
0.202
0.708
34550
0.479
0.00153
CC
0.207
3.224
34550
0.001
0.00703
PDC
0.209
4.138
34550
< .001
0.00905
(d) P05. Se procedió a calcular P05 para el TREP. Los resultados de la Tabla 8 muestran que para
P05, CC no se acerca al valor recomendado de 0.2 para un nivel de confianza del 99% (p < 0.01).
En consecuencia, estos resultados indican que existió manipulación arbitraria de los datos para el
partido CC.
Tabla 8. Valores P05 del TREP
Media t gl Valor p Media
MAS – IPSP
0.199
-0.646
33018
0.519
-0.00142
CC
0.207
3.006
33018
0.003
0.00670
PDC
0.203
1.452
33018
0.146
0.00322
Posteriormente, de igual manera que para anteriores pruebas, se utilizó la base de datos de CO
para validar los resultados obtenidos del TREP. Los resultados presentados en la Tabla 9 muestran
que para CC no se acerca al valor recomendado de 0.2 con un nivel de confianza del 99% (p <
0.01). En conjunto, los resultados del indicador P05 muestran que los datos presentan huella de
haber sufrido manipulación arbitraria para CC.
Tabla 9. Valores P05 del CO
Media t Gl Valor p Media
MAS – IPSP
0.199
-0.593
34524
0.553
-0.00127
CC
0.207
2.991
34524
0.003
0.00652
PDC
0.203
1.445
34524
0.149
0.00313
4.1.1. Conclusiones preliminares de la implementación de la Ley de Benford.
Los resultados presentados anteriormente muestran la presencia de rellenado de votos y números
inventados sugiriendo una manipulación arbitraria de registros para las bases de datos del TREP y CO
(2BL, p < 0.01). Por otro lado, ese hallazgo se relaciona con los valores de UltimoC, C05 y P05 que
también identificaron manipulación arbitraria CC y/o PDC a un 99% de nivel de confianza.
Específicamente, estos registros indican una posible manipulación arbitraria en los últimos dígitos para
los registros de votos de esos partidos (p < 0.01).
4.2. Implementación de análisis de distribuciones de votantes
A continuación, se presentan análisis relacionados con el análisis de la distribución de votantes:
(a) Unimodalidad. Esta prueba busca que la distribución de votantes sea unimodal. Sin embargo, en
caso de ser multimodal, se puede inferir la existencia procesos irregulares de manipulación
arbitraria de registros. Para ese propósito se graficaron cada una de las variables con sus
respectivos histogramas y box plots para cada partido político de la base de datos del TREP.
Como muestra la Tabla 10, todos los histogramas son unimodales con excepción del histograma
del CC que muestra una moderada bimodalidad que puede ser síntoma de la existencia de mezcla
de datos o manipulación arbitraria de registros. Por otro lado, es llamativo la existencia de colas
muy largas y valores extremos en la distribución de votos válidos. Este último resultado podría
deberse a una participación minoritaria de votantes en algunas mesas de votación, o existencia de
un amplio número de mesas de votación en lugares con poblaciones extremadamente pequeñas.
Tabla 10. DipT por variable para TREP
Datos Histograma Box Plot DipT
Votos validos
Distribución
unimodal y
asimétrica negativa
con presencia de
valores extremos en
la cola izquierda.
MAS-IPSP
Distribución
unimodal y
asimétrica positiva
con presencia de
valores extremos en
la cola derecha.
CC
Posible distribución
bimodal con
asimetría positiva e
inexistencia de
valores extremos.
PDC
Distribución
unimodal y
asimétrica positiva
con presencia de
valores extremos en
la cola derecha.
A continuación, se procedió a validar los resultados presentados en la Tabla 10 utilizando la base
de datos del CO (Tabla 11). En todos los casos se obtuvieron distribuciones con características
similares. En consecuencia, para DipT las distribuciones de datos del TREP y CO sugieren la
existencia de manipulación arbitraria de registros.
Tabla 11. DipT por variable para CO
Datos Histograma Box Plot DipT
Votos validos
Distribución
unimodal y
asimétrica negativa
con presencia de
valores extremos en
la cola izquierda.
MAS-IPSP
Distribución
unimodal y
asimétrica positiva
con presencia de
valores extremos en
la cola derecha.
CC
Posible distribución
bimodal con
asimetría positiva e
inexistencia de
valores extremos.
PDC
Distribución
unimodal y
asimétrica positiva
con presencia de
valores extremos en
la cola derecha.
(b) Skew o asimetría. Para esta prueba se calcularon los histogramas y el valor de asimetría para la
base de datos del TREP. Específicamente, cuando el valor de asimetría es significativamente
diferente de cero sugiere la existencia de manipulación arbitraria de registros. Para cumplir esa
condición se calculó la asimetría estandarizada. Específicamente, la asimetría estandarizada se
calcula dividiendo el valor de asimetría de la variable bajo análisis entre el error estándar de la
asimetría. Cuando el valor de la asimetría estandarizada es menor a -2.58 o mayor a 2.58, para
tamaños de muestra superiores a 200 (Ghasemi y Zahediasl 2012), se puede concluir que la
asimetría es significativamente diferente a cero al 95 % de nivel de confianza.
Tabla 12. Skew por variable para TREP
Datos Histograma Asimetría estandarizada Skew
Votos validos
-166.66
Asimetría negativa
significativamente
diferente de cero al
95% de nivel de
confianza.
MAS-IPSP
28.81
Asimetría positiva
significativamente
diferente de cero al
95% de nivel de
confianza.
CC
23.11
Asimetría positiva
significativamente
diferente de cero al
95% de nivel de
confianza.
PDC
63.04
Asimetría positiva
significativamente
diferente de cero al
95% de nivel de
confianza.
Los resultados de la Tabla 12 muestran inequívocamente la existencia de asimetrías diferentes de
cero para todas las votaciones bajo análisis. En consecuencia, se puede concluir que los datos del
TREP presentan huella de manipulación arbitraria de registros. Para validar el anterior resultado,
de igual forma que en anteriores pruebas, se procedió a realizar el mismo procedimiento con el
CO. Como muestra la Tabla 13, los resultados de Skew del CO son similares a los del TREP. En
consecuencia, Skew sugiere que existe evidencia de manipulación arbitraria para el TREP y el
CO.
Tabla 13. Skew por variable para CO
Datos Histograma Asimetría estandarizada Skew
Votos validos
-163.64
Asimetría negativa
significativamente
diferente de cero al
95% de nivel de
confianza.
MAS-IPSP
29.92
Asimetría positiva
significativamente
diferente de cero al
95% de nivel de
confianza.
CC
24.55
Asimetría positiva
significativamente
diferente de cero al
95% de nivel de
confianza.
PDC
64.55
Asimetría positiva
significativamente
diferente de cero al
95% de nivel de
confianza.
(c) Kurt. Esta prueba es similar a Skew porque argumenta que la curtosis de una distribución de una
votación sin manipulación arbitraria debería ser aproximadamente normal. En consecuencia, se
calcularon los histogramas y el valor de curtosis para la base de datos del TREP. En particular,
cuando el valor de curtosis es significativamente diferente de cero sugiere la existencia de
manipulación arbitraria de registros. En ese sentido se calculó la curtosis estandarizada que fue el
resultado de dividir el valor de curtosis de la variable bajo análisis sobre el error estándar de
curtosis. Luego, cuando el valor de curtosis estandarizada es menor a -2.58 o mayor a 2.58, para
tamaños de muestra superiores a 200 (Ghasemi y Zahediasl 2012), se puede concluir que la
curtosis es significativamente diferente a cero al 95 % de nivel de confianza. Los resultados de la
Tabla 14 para el TREP indican que, para todas las variables bajo análisis, el valor de curtosis es
significativamente diferente de cero al 95% de nivel de confianza. Entonces, este resultado
sugiere que el TREP presenta huella de manipulación arbitraria de registros.
Tabla 14. Kurt por variable para TREP Datos Histograma Curtosis estandarizada Kurt
Votos validos
167.29
Distribución
leptocurtica con
curtosis
significativamente
diferente de cero al
95% de nivel de
confianza.
MAS-IPSP
-13.49
Platicurtica con
curtosis
significativamente
diferente de cero al
95% de nivel de
confianza.
CC
-36.32
Platicurtica con
curtosis
significativamente
diferente de cero al
95% de nivel de
confianza.
PDC
23.20
Distribución
leptocurtica con
curtosis
significativamente
diferente de cero al
95% de nivel de
confianza.
De forma similar a anteriores procedimientos, para validar los resultados se procedió a utilizar la
base de datos del CO para calcular los niveles de curtosis. Como muestra la Tabla 15, todas las
variables bajo análisis tienen niveles de curtosis significativamente diferentes de cero, validando
el resultado del TREP. En consecuencia, se puede concluir que Kurt sugiere la existencia de
huellas de manipulación arbitraria en la base de datos del TREP y CO.
Tabla 15. Kurt por variable para CO Datos Histograma Curtosis estandarizada Kurt
Votos validos
162.88
Distribución
leptocurtica con
curtosis
significativamente
diferente de cero al
95% de nivel de
confianza.
MAS-IPSP
-13.75
Platicurtica con
curtosis
significativamente
diferente de cero al
95% de nivel de
confianza.
CC
-36.59
Platicurtica con
curtosis
significativamente
diferente de cero al
95% de nivel de
confianza.
PDC
23.48
Distribución
leptocurtica con
curtosis
significativamente
diferente de cero al
95% de nivel de
confianza.
(d) Huella dactilar de elecciones. Para esta prueba gráfica, utilizando el procedimiento sugerido por
Klimek et al. (2012), se calculó el porcentaje de votantes que ejercieron su voto (voter turnout)
vs. el porcentaje de votantes para el partido ganador (MAS-IPSP voter turnout). Específicamente,
para calcular el voter turnout se dividió el número de votos válidos entre la suma del total de
votaciones para los diferentes partidos, incluidos los votos blancos y nulos. Adicionalmente, este
método permite encontrar aquellas mesas que muestren voter turnout superiores al 100%, como
indicador de inflación de datos y consecuente manipulación arbitraria de registros.
Posteriormente, se procedió a dibujar la gráfica relacionada que se conoce como huella dactilar de
elecciones. En la Figura 1 se muestra la huella dactilar de las elecciones para el partido ganador
MAS-IPSP. La figura claramente muestra la existencia de clústeres de datos y patrones no
radiales (ver líneas punteadas en la Figura 1). En consecuencia, existen mesas que tienen voter
turnout por encima del 100%, lo cual es raro. Específicamente, se identificaron 167 mesas que
tienen votaciones superiores al 100% con las siguientes características: (a) 98.2% se encuentran
en Bolivia y 0.8% en el extranjero; (b) 34.7% en Cochabamba, 25.7% en La Paz, 13.8% en Santa
Cruz y 23.1% en el resto de departamentos; y (c) con proporciones iguales de 0.6%, 1.2% y 1.8%
de mesas para diferentes unidades educativas del país. En consecuencia, basado en la huella
dactilar de elecciones del TREP se puede afirmar que existe evidencia de manipulación arbitraria
de registros. Esta manipulación arbitraria causó anomalías en los datos, mostrando votaciones
superiores a 100% y patrones en múltiplos de 0.6% para todas las mesas observadas.
Específicamente, por definición los procesos electorales se caracterizan por ser libres y justos. En
consecuencia, se espera el comportamiento de una variable aleatoria (sin patrones numéricos). Sin
embargo, la existencia de patrones numéricos en mesas problemáticas con múltiplos de 0,6 para
167 mesas es estadísticamente no “normal” y sugiere la manipulación arbitraria de registros.
Figura 1. Huella dactilar de elecciones en Bolivia para TREP
A continuación, nuevamente se procedió a validar los resultados utilizando la base de datos de
CO. Como muestra la Fig. 2, de igual manera se encontraron clústeres de datos con voter turnouts
superiores al 100% (ver líneas punteadas) y patrones no radiales. Específicamente, se
identificaron 92 mesas con problemas, donde: (a) 95.7% se encuentran en Bolivia, 2.2% en
Brasil, 1.1% en Chile y 1.1% en España (múltiplos de 1.1); (b) 28.3% en Cochabamba, 31.5% en
La Paz, 28.3% en Santa Cruz y 11.9% para el resto de departamentos; y (c) con proporciones
iguales de 1.1% y 2.2% de mesas para diferentes mesas en unidades educativas de Bolivia
(múltiplos de 1.1%). Más aún se encuentra un patrón de votación donde la mayoría de las mesas
tienen votaciones cerca al 100% de voter turnout en lugar de estar aleatoriamente distribuidas
mostrando un patrón radial. En consecuencia, basado en la huella dactilar de elecciones del CO
los resultados sugieren la presencia de huellas de manipulación arbitraria de los registros de
votación. Esta manipulación creó anomalías con votaciones superiores al 100% y patrones de
mesas en múltiplos de 0.6% para el TREP y 1.1% para el CO. Como se mencionó anteriormente,
estos patrones con múltiplos de 0.6% y 1.1% son raros al tratarse de una variable aleatoria
.
Figura 2. Huella dactilar de elecciones en Bolivia para CO
(e) Test de normalidad. Para esta prueba se utilizaron los resultados de las pruebas Skew y Kurt de
tablas anteriores y determinar si la distribución por partido para el TREP y el CO se encuentran
dentro de los rangos de normalidad (Ghasemi y Zahediasl 2012) (ver Tabla 13). Más aún, para
validar los resultados sobre normalidad de datos se realizaron pruebas de normalidad adicionales
de Kolmogorov Smirnov (Lilliefors 1967). En todos los casos bajo estudio, los resultados
muestran que las distribuciones del TREP y CO no están normalmente distribuidas (Prueba de
Kolmogorov-Smirnov con p < 0.05). En consecuencia, los resultados sugieren la existencia de
huellas de manipulación arbitraria de registros.
Tabla 13. Test de normalidad por variable para TREP y CO
Datos
Asimetría
estandarizada
Curtosis
estandarizada
Prueba de
Kolmogorov-Smirnov
(valor p)
¿Distribución
Normal?
TREP CO TREP CO TREP CO TREP CO
Votos validos -166.66 -163.64 167.29 162.88 < .001 < .001 No No
MAS-IPSP 28.81 29.92 -13.49 -13.75 < .001 < .001 No No
CC 23.11 24.55 -36.32 -36.59 < .001 < .001 No No
PDC 63.04 64.55 23.20 23.48 < .001 < .001 No No
4.2.1. Conclusiones preliminares de la implementación de análisis de distribuciones de votantes
Los resultados presentados en esta subsección sugieren la presencia de anomalías en las distribuciones
de los datos de votación del TREP y CO. Específicamente, en todos los casos los indicadores bajo estudio
muestran que las distribuciones de datos no cumplen los criterios requeridos de asimetría, curtosis y
normalidad. Adicionalmente, se identificaron mesas con patrones de votación extraños que muestran
patrones de inflación porcentual similar para mesas con porcentajes de votación superior al 100%
(múltiplos de 0.6% y 1.1%).
5. DISCUSIÓN Y CONCLUSIONES
En esta investigación se realizó un análisis forense electoral de Bolivia para las elecciones
presidenciales del 20 de octubre de 2019. Como resultado de la implementación de diferentes pruebas
estadísticas se encontró evidencia que sugiere la existencia de manipulación arbitraria de registros para las
bases de datos bajo estudio. Específicamente, se tienen los siguientes dos hallazgos principales:
(a) La implementación de la Ley de Benford en sus diferentes técnicas (2BL, UltimoC, C05, y P05)
sugiere la manipulación arbitraria de las bases de datos del TREP y del CO mediante un posible
rellenado de votos o inclusión de números inventados. Específicamente, la implementación de la
técnica 2BL sugiere la manipulación del segundo dígito de las bases de datos del TREP y CO. Por
ejemplo, si una mesa tenía una votación de 123 votos, se manipulo el dígito “2” y se lo cambio
por otros dígitos arbitrariamente escogidos. Adicionalmente, la técnica UltimoC presenta
evidencia de manipulación arbitraria de los registros del CC. Específicamente, UltimoC sugiere
que se manipuló el último dígito de la votación para CC. Por ejemplo, si una mesa para CC tenía
una votación de 345 votos, arbitrariamente se cambió el dígito “5” y se modificó a otros dígitos
arbitrarios. Más aun, la técnica C05, similar a UltimoC, sugiere la manipulación arbitraria del
último dígito para las votaciones de CC y PDC. Finalmente, la técnica P05 sugiere de igual
manera la manipulación arbitraria de votaciones para CC para el último dígito de sus votaciones.
En consecuencia, las técnicas relacionadas con la Ley de Benford muestran que la distribución
numérica de datos del TREP y del CO no siguen el patrón aleatorio que es común en los procesos
de votación sin manipulación arbitraria de registros (ver Hicken y Mebane (2017) y Klimek et al.
(2012) donde presentan casos similares de manipulación arbitraria electoral en otros países).
(b) Igualmente, la implementación de análisis de distribuciones de votantes muestra que las
distribuciones de datos no cumplen con las diferentes técnicas recomendadas por Hicken y
Mebane (2017) para el análisis forense electoral (DipT, Skew, Kurt, huella dactilar de elecciones,
test de normalidad). En consecuencia, las diferentes técnicas muestran que la distribución de
datos del TREP y del CO no siguen patrones comunes de elecciones sin manipulación arbitraria.
Por otro lado, mediante la huella dactilar de elecciones se encontraron mesas del TREP y del CO
que muestran tasas de votantes superiores al 100%. Específicamente, las mesas identificadas se
caracterizan por porcentajes inflados en múltiplos de 0.6% y 1.1%. Estos valores son extraños,
porque la distribución de datos en elecciones sin manipulación arbitraria no debería seguir ningún
patrón numérico al ser una variable aleatoria. Por otro lado, la existencia de votaciones
frecuentemente cercanas al 100% tampoco pasa desapercibido, porque la misma debería estar
uniformemente distribuida y mostrar un patrón radial (ver Klimek et al. 2012). En consecuencia,
las distribuciones de datos de los votantes sugieren la existencia de huellas de manipulación
arbitraria de los registros de votación.
Finalmente, hoy en día en Bolivia existen posibles errores registrados relacionados con la contienda
electoral analizada (por ejemplo, ver Aré-Vasquez 2019; Molina 2019; The Economist 2019; entre otros)
que explican los resultados de esta investigación. En consecuencia, como sugieren Hicken y Mebane
(2017), el alto número de pruebas estadísticas utilizadas que identificaron patrones que se desvían de lo
que se espera que ocurra naturalmente sugiere que las desviaciones identificadas en las bases de datos del
TREP y CO se deben a la manipulación arbitraria de los registros de los votos, en lugar del voto libre y
soberano.
6. LIMITACIONES Y FUTURAS INVESTIGACIONES
Todo estudio adolece de debilidades y el nuestro no es la excepción. Primero, el desarrollo de las
estadísticas presentadas en nuestro estudio requiere un conocimiento bastante sofisticado de los métodos
cuantitativos, así como una capacidad informática considerable. En consecuencia, deberían desarrollarse
soluciones informáticas prácticas que permitan analizar la transparencia de los resultados de procesos
electorales actuales y futuros para un público de especialistas y no especialistas. Segundo, el análisis
forense electoral no produce una prueba definitiva de manipulación arbitraria de registros electorales. En
cambio, la observación directa del rellenado de urnas si lo hace. Sin embargo, el análisis electoral forense
produce evidencia probabilística de anomalías que sugieren una manipulación arbitraria de registros
electorales. Esta limitación no necesariamente invalida el enfoque forense electoral, porque la mayoría de
los métodos de evaluación electoral tienen la misma restricción (nuevamente, a falta de pruebas tangibles
de manipulación arbitraria). En consecuencia, las técnicas del análisis forense electoral deberían utilizarse
en conjunto con otras técnicas de auditoria electoral para converger hacia una conclusión global y ayudar
a determinar la transparencia y veracidad de los procesos electorales de un país.
REFERENCIAS
Aré-Vasquez, T. (2019). Entrevista al informático que asegura que hubo fraude en las elecciones de Bolivia:
“Se computó el voto de ausentes para favorecer a Evo Morales". Retrieved November 2, 2019, from
https://www.infobae.com/america/america-latina/2019/11/02/entrevista-con-el-informatico-que-asegura-que-
hubo-fraude-en-las-elecciones-bolivianas-se-computo-el-voto-de-ausentes-para-favorecer-a-evo-morales/
Beber, B., & Scacco, A. (2012). What the numbers say: A digit-based test for election fraud. Political
Analysis, 20(2), 211-234.
Benford, F. (1938). The law of anomalous numbers. Proceedings of the American Philosophical Society, 551-
572.
Borghesi, C., & Bouchaud, J. P. (2010). Spatial correlations in vote statistics: a diffusive field model for
decision-making. The European Physical Journal B, 75(3), 395-404.
Driscoll, A., & Nelson, M. J. (2015). Judicial selection and the democratization of justice. Journal of Law and
Courts, 3(1), 115–148. https://doi.org/10.1086/679017
Ghasemi, A., & Zahediasl, S. (2012). Normality tests for statistical analysis: a guide for non-
statisticians. International journal of endocrinology and metabolism, 10(2), 486.
Hicken, A., & Mebane, W. R. (2017). A guide to elections forensics. USAID, from
https://pdf.usaid.gov/pdf_docs/PA00MXR7.pdf
Klimek, P., Yegorov, Y., Hanel, R., & Thurner, S. (2012). Statistical detection of systematic election
irregularities. Proceedings of the National Academy of Sciences of the United States of America, 109(41),
16469–16473.
Lafleur, J.-M., & Sánchez-Domínguez, M. (2015). The political choices of emigrants voting in home country
elections: A socio-political analysis of the electoral behaviour of Bolivian external voters. Migration Studies,
3(2), 155–181.
Lazar, S. (2004). Personalist politics, clientelism and citizenship: Local elections in El Alto, Bolivia. Bulletin
of Latin American Research, 23(2), 228–243.
Lilliefors, H. W. (1967). On the Kolmogorov-Smirnov test for normality with mean and variance
unknown. Journal of the American Statistical Association, 62(318), 399-402.
Molina, F. (2019). ¿En qué se basan las acusaciones de fraude que sacuden Bolivia? El País. Retrieved
November 2, 2019 from https://elpais.com/internacional/2019/10/25/america/1572027831_226380.html
Pericchi, L., & Torres, D. (2011). Quick anomaly detection by the newcomb—Benford Law, with applications
to electoral processes data from the USA, Puerto Rico and Venezuela. Statistical Science, 502-516.
Taylor, C. (2019). The difference between descriptive and inferential statistics. Retrieved October 30, 2019,
from https://www.thoughtco.com/differences-in-descriptive-and-inferential-statistics-3126224.
The Economist. (2019). Bolivia’s baffling ballot count. The Economist. Retrieved from
https://www.economist.com/the-americas/2019/10/26/bolivias-baffling-ballot-count.
Van Cott, D. L. (2003). From exclusion to inclusion: Bolivia’s 2002 elections. Journal of Latin American
Studies, 35(4), 751–775. https://doi.org/10.1017/S0022216X03006977