MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE...

93
FACULTAD DE ADMINISTRACIÓN HOTELERA, TURISMO Y GASTRONOMÍA Carrera de Administración en Turismo MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE FOTOGRAFÍAS EN RELACIÓN A SUS ATRIBUTOS VISUALES EN LA RED SOCIAL INSTAGRAM PARA EL CASO DE LA ISLA TAQUILE Tesis para optar el Título Profesional de Licenciado en Administración en Turismo DIANA CAROLINA GARAYAR LEGUA SAMANTHA ESTEFANIA CIRIACO BELLIDO Asesora: Mg. Sandra Sotomayor Masalias Lima Perú 2020

Transcript of MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE...

Page 1: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

FACULTAD DE ADMINISTRACIÓN HOTELERA, TURISMO

Y GASTRONOMÍA

Carrera de Administración en Turismo

MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE FOTOGRAFÍAS EN RELACIÓN A SUS

ATRIBUTOS VISUALES EN LA RED SOCIAL INSTAGRAM

PARA EL CASO DE LA ISLA TAQUILE

Tesis para optar el Título Profesional de Licenciado en

Administración en Turismo

DIANA CAROLINA GARAYAR LEGUA

SAMANTHA ESTEFANIA CIRIACO BELLIDO

Asesora:

Mg. Sandra Sotomayor Masalias

Lima – Perú 2020

Page 2: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

ÍNDICE DE CONTENIDOS

CAPÍTULO I: INTRODUCCIÓN .............................................................................. 6

1.1. Planteamiento del Problema ............................................................................. 7

1.2. Formulación del Problema ............................................................................. 10

1.3. Justificación ................................................................................................. 10

CAPÍTULO II: MARCO REFERENCIAL ................................................................ 13

2.1. Antecedentes ................................................................................................ 13

2.2. Marco Teórico .............................................................................................. 16

2.2.1. Modelado Predictivo................................................................................ 16

2.2.2. Modelo predictivo de referencia ................................................................ 17

2.2.3. Redes Sociales y Turismo ........................................................................ 18

2.2.4. Importancia de las fotografías en el turismo ................................................ 20

2.2.5. Instagram y Turismo ................................................................................ 21

2.2.6. Engagement en Instagram ........................................................................ 23

2.2.7. Atributos visuales presentes en una fotografía en el contexto peruano ............ 26

2.2.8. Aspectos teóricos del análisis pictórico ...................................................... 27

2.2.9. El análisis de imágenes con soporte computacional ..................................... 32

2.2.10. Isla Taquile ........................................................................................... 34

2.3. Objetivos ..................................................................................................... 39

2.4. Hipótesis ...................................................................................................... 39

CAPÍTULO III: MÉTODO ...................................................................................... 40

3.1. Tipo de investigación..................................................................................... 40

3.2. Diseño de Investigación ................................................................................. 40

3.3. Variables ...................................................................................................... 42

3.4. Universo ...................................................................................................... 44

3.5. Muestra........................................................................................................ 44

3.6. Instrumentos de Investigación ......................................................................... 45

3.6.1. Downloader for Instagram ....................................................................... 45

3.6.2. Google Vision AI ..................................................................................... 46

3.6.3. EyeEm Vision ......................................................................................... 48

Page 3: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

3.6.4. Everypixel .............................................................................................. 49

3.6.5. SPSS Modeler......................................................................................... 50

3.7. Recolección de datos ..................................................................................... 52

3.8. Plan de análisis ............................................................................................. 53

3.8.1. Regresión Lineal Múltiple ........................................................................ 53

3.8.2. Redes Neuronales .................................................................................... 55

3.8.3. Comparación de ambos modelos ............................................................... 62

CAPÍTULO IV: RESULTADOS .............................................................................. 63

4.1. Resultados .................................................................................................... 63

4.2. Discusión ..................................................................................................... 78

CAPÍTULO V: CONCLUSIONES ........................................................................... 81

5.1. Conclusiones ................................................................................................ 81

5.2. Recomendaciones ......................................................................................... 82

5.3. Limitaciones ................................................................................................. 84

BIBLIOGRAFIA .................................................................................................... 85

Page 4: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

ÍNDICE DE TABLAS

Tabla 1: Categorías identificadas en fotografías tomadas en territorio peruano .................. 27

Tabla 2: Variables de Estudio ............................................................................................... 43

Tabla 3: ANOVA de la regresión lineal múltiple automática .............................................. 63

Tabla 4: Análisis de coeficientes y test de colinealidad ....................................................... 64

Tabla 5: Análisis de variables retiradas del modelo ............................................................. 66

Tabla 6: Resumen del modelo y Test de Durbin Watson ..................................................... 66

Tabla 7: Prueba de Kolmogórov-Smirnov para los residuos no estandarizados .................. 68

Tabla 8: Parámetro del modelo ............................................................................................. 72

Tabla 9: Resumen del modelo basado en una red neuronal ................................................. 73

Tabla 10: Precisión de cada modelo ..................................................................................... 77

Page 5: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

ÍNDICE DE FIGURAS

Figura 1. Interés mensual en aspectos relacionados a viajes en Instagram durante el 2010 al

2019. ..................................................................................................................................... 23

Figura 2. Interés mundial hacia la Visión Artificial entre marzo del 2015 y marzo del 2019.

.............................................................................................................................................. 34

Figura 3. Arribos a la Isla Taquile durante el 2015-2019. .................................................... 36

Figura 4. Distribución mensual de arribos nacionales a la Isla Taquile durante el 2015-

2019. ..................................................................................................................................... 37

Figura 5. Distribución mensual de arribos internacionales a la Isla Taquile durante el 2015-

2019. ..................................................................................................................................... 37

Figura 6: Proporción de arribos a la Isla Taquile de acuerdo a origen (nacional-extranjero).

.............................................................................................................................................. 38

Figura 7. Modo de uso de Downloader for Instagram. ......................................................... 46

Figura 8. Interface de uso de Google Vision AI. .................................................................. 47

Figura 9. Formato de resultados del instrumento Google Vision AI.................................... 47

Figura 10. Interface y resultados del instrumento EyeEm Vision. ....................................... 48

Figura 11. Interface de Uso para el software Everypixel. .................................................... 49

Figura 12. Resultados de la aplicación Everypixel............................................................... 50

Figura 13. Interface inicial del SPSS Modeler. .................................................................... 50

Figura 14. Interface del SPSS Modeler empleado en la investigación. ................................ 51

Figura 15. Arquitectura de una red neuronal. ..................................................................... 588

Figura 16. Valores observados y predichos en la distribución normal. ................................ 68

Figura 17. Valores observados y predichos del engagement en la regresión lineal. ............ 69

Figura 18. Arquitectura de la red neuronal. .......................................................................... 70

Figura 19. Valores observados y predichos del engagement en la red neuronal. ................. 74

Figura 20. Importancia de cada variable predictora dentro de cada modelo. ....................... 75

Figura 21. Comparación de los valores predichos y observados en la regresión lineal y red

neuronal. ............................................................................................................................... 76

Page 6: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

6

CAPÍTULO I: INTRODUCCIÓN

Una fotografía propia de la actividad turística presenta múltiples atributos visuales;

desde el paisajístico hasta incluso puede representar un estilo de vida, que naturalmente se

encuentra condicionado por el tipo de lugar visitado. Por ejemplo, en la selva amazónica se

puede registrar una biodiversidad basta y vistosa a diferencia de Barcelona donde destaca la

combinación de arquitectura gótica y modernista.

Actualmente, los usuarios de las redes sociales son testigos del incremento de la

popularidad de la temática viajera. Tal es el caso de la red social Instagram, que concentra

el mayor volumen de fotografías de la actividad turística. Una de las métricas de mayor uso

en esta red social es el engagement, el cual representa una valoración y/o aceptación de los

contenidos por parte del usuario, determinada por la suma de likes (“me gusta”) y

comentarios obtenidos (Vignisdóttir, 2016; Bakshi, Shamma & Gilbert, 2014). Asimismo,

el término engagement ha sido usado cada vez más en la literatura del marketing (Bowden,

2009). Preciamente la inrupción de internet y redes sociales han traido consigo un gran

interés por el estudio el engagement, mediante la medición de variables como las utilizadas

en las redes sociales: “me gusta” o comentarios. Cada una de estas variables responde a un

diferente grado de compromiso e intencionalidad por parte del usuario, por lo que su

utilización cuantitativa es muy diferente (Ballesteros, 2019).

Las imágenes (fotografías) y textos son extremadamente abundantes en la web, dentro

de ellos se encuentran las relacionadas al sector turismo. En este sentido, la „Ciencia de

Datos‟, viene efectuando con mayor crecimiento el aprovechamiento de datos no

estructurados (textos e imágenes). Esto debido al volumen existente en la web de dichos

Page 7: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

7

datos empleando algoritmos como la regresión lineal múltiple y las redes neuronales para

poder pronosticar interacciones web.

Teniendo en cuenta que el engagement es una variable cuantitativa y que existen

herramientas informáticas para convertir imágenes (fotografías) en datos numéricos, ha

resultado factible construir un modelo de predicción orientado al engagement y su relación

con los atributos visuales de las imágenes (fotografías). Se ha tomado como objeto de

estudio las fotografías de la Isla Taquile en la red social Instagram, considerando que

constituye uno de los principales atractivos turísticos de la región Puno, desarrolla

actividades de turismo rural y comunitario y que cuenta con un registro fotográfico por

parte de visitantes nacionales y extranjeros.

1.1. Planteamiento del Problema

Las redes sociales han ganado un gran territorio en la vida de las personas y los

negocios. Hasta el año 2017 más de la mitad de la población mundial (más de 4.422

millones de personas) eran usuarios activos de Internet (Internet World Stats, 2019);

además, más de 2.500 millones de personas eran usuarios activos de redes sociales y el

91.3% de ellos utilizaban un dispositivo móvil para conectarse (eMarketer, 2013). Entre las

redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019), siendo

Instagram la que ofrece hasta 58 veces más interacción por seguidor que Facebook y 150

veces más que Twitter (Forrester, 2015).

En Instagram, el engagement de una fotografía puede medirse como la suma del número

de likes y comentarios que alcanza la misma en un momento determinado (Rochman,

2017). Según Quintly (2018), el 72.6% de las publicaciones en Instagram son fotografías.

Page 8: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

8

Además, el 80% de las personas que tienen una cuenta en Instagram siguen a una empresa,

mientras que el 59% de usuarios ha utilizado esa red social para descubrir una marca o

comprar un producto o servicio. De esta manera Instagram se consagra como una de las

plataformas más potentes para la promoción de los negocios (Escobar, 2019).

El sector turismo no es ajeno a la relevancia que tiene Instagram hoy en día, ya que

según Schofield (2017), cuatro de cada diez jóvenes que forman parte de la generación

millennials (personas nacidas entre 1980 y 2000) y centennials (personas nacidas en el

2001 a la actualidad) eligen su destino de vacaciones no solo porque sea económico,

exótico o porque les traiga recuerdos, sino que el 40% lo elige en función de si es

„instagrameable‟; es decir, eligen un destino a partir de las fotografías que pueden

compartir ellos mismos o que sus amigos compartieron previamente; conclusión que

coincide con el estudio de Lonely Planet (2016), una de las mayores editoras de viajes en el

mundo. Además, según eDreams (2019), una de las principales agencias de viaje en línea

del mundo, el 52% de viajeros americanos reservan sus vacaciones basados en el insta-

worthiness (suficiente belleza de un destino para ser publicado en Instagram), antecedidos

por el viajero italiano (58%) y el viajero español (55%). De esta manera, Instagram se ha

convertido en una plataforma importante para los millennials y centennials, siendo los

primeros el segmento de mayor participación (45%) dentro de los turistas extranjeros que

visitan el Perú (PROMPERÚ, 2018).

Según IBM (2019), los instrumentos de analítica visual pueden encontrar escenas,

objetos, rostros, colores y otras características sobre el contenido de fotografías. Analizar

imágenes forma parte de la disciplina llamada “Computer Vision” (o visión por

computadora), la cual permite a un ordenador simular el proceso que realizan los ojos de un

Page 9: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

9

ser humano cuando procesan el contenido de una fotografía (Forsyth & Ponce, 2012).

Asimismo permite la descripción y clasificación de fotografías (Szelizki, 2010) y la

medición de sus atributos visuales como: estilo de vida, paisaje, naturaleza, entre otros, los

mismos que pueden ser relacionados con el engagement mediante métodos estadísticos o

computacionales.

Por otro lado, se ha elegido la Isla Taquile como caso de aplicación, considerando que

este atractivo cuenta con tres elementos esenciales: Elemento Natural: localización

geográfica – Lago Titicaca; Elemento Cultural: Costumbres ancestrales (vestimenta típica,

alojamiento y alimentación) – turismo comunitario / turismo vivencial; Elemento Humano:

Comunidad constituida en la Isla; lo cual permite tener un mayor alcance para identificar

los atributos visuales de las fotografías. Asimismo, constituye uno de los atractivos de la

región Puno preferidos por los turistas extranjeros (52%) (PROMPERÚ, 2018). Su

ubicación en la región Puno asegura su preferencia en el tiempo, al formar parte de la Ruta

Sur del Perú (ruta de mayor preferencia), conjuntamente con la región Cusco y la región

Arequipa.

Asimismo, según el Perfil del Turista Extranjero que visita Puno 2018, tiene entre 25 a

34 años de edad; es decir, preferentemente jóvenes (PROMPERÚ, 2018); lo cual coincide

con las edades de la mayoría de usuarios que publican más del 70% del contenido de

Instagram (Hootsuite, 2019). Por lo expuesto, se puede precisar que el internet como las

redes sociales – entre ellas Instagram – constituye una importante fuente de información y

de fotografías relevantes o motivadoras para los turistas, al momento de decidir su próximo

destino a visitar.

Page 10: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

10

Por lo anteriormente mencionado, resulta tentativo construir un modelo orientado a

predecir el engagement (nivel de aprobación) de las fotografías en la red social Instagram

en base a ciertos atributos visuales para el caso de la Isla Taquile. Finalmente, el

engagement es una variable cuantitativa, y para poder ser pronosticada a menudo son

empleados dos algoritmos: regresión lineal múltiple y redes neuronales, ambos bastante

citados en distintas publicaciones internacionales.

1.2. Formulación del Problema

¿Es significativo un modelo que relacione el engagement con los atributos visuales de

fotografías en la red social Instagram, para el caso de la Isla Taquile?

1.3. Justificación

Si bien los atributos visuales pueden ser relevantes para predecir los likes y comentarios

- o el engagement- de una imagen en Instagram, lo cierto es que todavía no se puede

establecer con precisión qué atributo visual es más importante e incluso es probable que no

todos sean importantes de acuerdo a cada ámbito del conocimiento (De, Maity, Goel,

Shitole, & Bhattacharya, 2017). El debate académico no ha incorporado modelamientos

matemáticos que contribuyan a respaldar o refutar ciertos postulados; probablemente, ello

se deba a que no se contaba con los medios tecnológicos necesarios para medir los atributos

visuales.

El aporte del presente estudio es conocer la importancia de los atributos visuales en las

fotografías de Instagram de la Isla Taquile, que tienen mayor relación con el engagement y

medir su resultado, a través de Computer Vision, y poder aplicarlo a otros destinos no

Page 11: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

11

convencionales, ahorrando recursos económicos y tiempo al momento de escoger las

fotografías adecuadas, y de esta manera se podría incrementar el engagement de un destino

específico en Instagram, con fines principalmente promocionales para el Sector Turístico.

La aplicación práctica del análisis de fotografías es denominada Analítica de Imágenes

(Image Analytics). Debe tomarse en cuenta que el análisis de fotografías siempre ha

presentado dificultades en cuanto a su metodología, siendo uno de los principales

problemas la clasificación y descripción de su contenido (Toivonen, et al., 2019). Dicha

labor era llevada a cabo por el investigador o por los participantes, pero la aplicación de un

software especializado minimiza los sesgos.

La obtención de patrones numéricos a partir de fotografías debe ser considerada desde

una perspectiva operacional; así, los instrumentos en formato de encuesta son validados con

técnicas estadísticas, mientras que el Computer Vision se cimienta sobre la computación

cognitiva (ámbito que pretende emular el pensamiento humano en máquinas). El objetivo

surge a partir del hecho de poder conocer y cuantificar los atributos visuales de fotografías

de un destino turístico y medir su nivel de engagement, empleando dichos atributos

visuales. Esto debe ser considerado como un punto de referencia para quienes deseen

analizar registros fotográficos en investigaciones relacionadas al turismo, todo ello

aprovechando un contexto en donde son los propios viajeros quienes de forma libre eligen

proporcionar datos acerca de sus distintas experiencias.

Asimismo, este estudio pretende explorar los atributos visuales de una fotografía a través

de instrumentos que pueden obtener patrones de imágenes (ámbito del Computer Vision) y

poder ampliar este tema para futuras investigaciones, al haber escasos estudios académicos

relacionados al sector turismo, de ello queda evidencia si se exploran en los principales

Page 12: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

12

repositorios académicos y plataformas como Web of Science o Scopus. Por otro lado, este

estudio será útil para construir KPI´s, al determinar los atributos visuales con los que debe

contar una fotografía para llegar a una determinada cantidad de reacciones positivas; es

importante recordar que los modelos predictivos contribuyen a reducir la incertidumbre y a

tomar mejores decisiones.

Finalmente, el comparar dos modelos como la regresión lineal y las redes neuronales

para pronosticar el engagement contribuye a la discusión acerca del uso de ambos

algoritmos (Kavuncuoglu, et al. 2018), los mismos han sido comparados en ámbitos de la

ingeniería, biología, físico-química, marketing, finanzas, otros (Aggarwal, 2019). Desde

luego, ambas opciones de modelado tienen sus alcances y limitaciones. Ello se menciona en

el plan de análisis y se evidencia en la sección correspondiente a resultados.

Page 13: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

13

CAPÍTULO II: MARCO REFERENCIAL

2.1. Antecedentes

Belk y Yeh (2011) tuvieron por objetivo investigar las razones por las que los turistas

capturan imágenes de sus excursiones en cámaras o videocámaras. Durante un período de

aproximadamente cinco años, los autores analizaron fotografías o videos tomadas en

diferentes lugares internacionales por turistas y completaron su análisis por medio de

entrevistas. Los informantes al momento de llegar a casa, enviaron por correo electrónico

sus fotos de viajes junto con descripciones de lo que las imágenes representaban; estos

datos se archivaron y posteriormente fueron interpretados por los investigadores. Los

investigadores sugirieron que las imágenes formaban parte de un proyecto de identidad que

sirven para transmitir historias internas y proyectarlas hacia los demás. Asimismo,

determinaron que el nivel de actividad humana tiene relación con el hecho de que ese

momento sea capturado. Este aspecto debe ser tomado en cuenta, considerando que la

actividad humana es un rasgo inherente a una proporción de fotografías en Instagram.

Cahyanto, Pennington-Gray y Thapa (2012) adoptaron un enfoque cualitativo, indicando

que existen un conjunto de motivaciones cuando las personas deciden capturar una imagen;

el estudio se llevó a cabo en la aldea de Sambi, Indonesia, entre junio y julio del 2007; se

entregó cámaras fotográficas a 28 pobladores y se les pidió tomar fotografías de las cosas,

lugares, personas o cualquier cosa que consideraban importante de su aldea y que deseaban

compartir con los visitantes; asimismo, se le efectuaron entrevistas individuales para

obtener información acerca de las fotografías tomadas. Para el análisis de datos de las

fotografías y entrevistas, el estudio utilizó un enfoque temático inductivo, hallando cinco

temas principales que los pobladores deseaban compartir con los visitantes como: forma

Page 14: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

14

rural de la vida, características ambientales, estructuras construidas, personas, ceremonias

tradicionales y artes. Los autores dan un especial peso a la calidad paisajística de las

fotografías como atributo para que las personas prefieran capturarlas. De este estudio cabe

destacar el uso del análisis cualitativo aplicado a quienes capturan las imágenes, así como

el dimensionamiento del contenido visual.

Haussmann, et al. (2017), centraron su atención en las preferencias acerca de la

biodiversidad en el Parque Nacional Kruger, Sudáfrica; los investigadores en un periodo

determinado, realizaron una encuesta tradicional a los turistas que visitaban el parque y

compararon los resultados con las preferencias de más de 13.600 fotografías compartidas

por turistas en Instagram y Flickr en ese mismo período. No encontraron ninguna diferencia

significativa entre las preferencias de los turistas de ambos grupos. En general, los

mamíferos de gran tamaño fueron encontrados como el grupo favorito, tanto en la encuesta

como en las plataformas de redes sociales. Sin embargo, se descubrió que Flickr

concordaba mejor con la preferencia de los turistas por la biodiversidad menos carismática.

Los hallazgos sugieren que el contenido de los medios de comunicación, como las redes

sociales, puede ser utilizado como una forma rentable de explorar y supervisar

constantemente las preferencias relacionadas a la biodiversidad y actividades humanas en

áreas protegidas. De este antecedente se determina que la presencia de fauna de gran

tamaño guarda relación con las preferencias de los turistas.

Thommes y Hubner (2018) analizaron un total de 700 fotografías vinculadas a obras

arquitectónicas. Los investigadores emplearon el modelo (algoritmos) de regresión lineal

múltiple y determinaron que habían atributos relacionados al hecho de que una imagen

registrara más likes. Entre ellos identificaron el hecho de que la fotografía fuera del tipo 3D

Page 15: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

15

en lugar de 2D. También consideraron la variable nivel de estética; para encontrar el valor

de esta variable consideraron necesario realizar encuestas en donde los participantes

indicaron en una escala de Likert si les agradaba la fotografía. Asimismo, determinaron que

el balance de la fotografía influía directamente en la cantidad de likes. De este antecedente

cabe destacar el uso de la regresión lineal como algoritmo predictor y el uso de una escala

para medir la belleza de una foto desde una perspectiva de los participantes.

De, et al. (2017) desarrollaron un modelo predictivo en donde la variable dependiente

era el número de likes (me gusta) que recibió una fotografía relacionada a los estilos de vida

de los hindúes. Para ello fueron analizadas un total de 1280 fotografías de la red social

Instagram. El modelamiento empleado fue de redes neuronales; las fotografías fueron

extraídas de los hashtags #polaroid #oldschool #KanganaRanaut, #GQAwards, #BTS

#Exclusive, #Throwback, #WomenWeLove, #2016, #Woman. Entre las variables

consideradas se encontraban: el número de seguidores, seguidos y días en que estuvo

colgada la fotografía, número de etiquetas empleadas en la descripción, el hecho de que la

fotografía incluyera o no textos. Se obtuvo como resultado de la investigación que se puede

predecir los likes de una fotografía con el 88% de precisión. El estudio evidencia el uso del

algoritmo de redes neuronales como modelo predictivo para determinar la cantidad de likes

de fotografías de Instagram.

Ruiz y Calero (2019), tuvieron por objetivo determinar la relación entre elementos de la

discriminación digital con el precio de alquiler por noche de habitaciones de Airbnb

localizadas en el distrito de Miraflores. Para ello analizaron los datos de 120 habitaciones

rentadas en los últimos dos meses del 2018. Entre las variables predictoras fueron

consideradas la “belleza” presente en las fotografías de las habitaciones y la calificación de

Page 16: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

16

“sorprendente”, es decir el hecho de que pudieran ser calificadas como asombrosas. Los

investigadores determinaron mediante el modelo de regresión lineal múltiple que ambos

atributos (belleza y sorprendente) tenían una relación significativa y directa con el precio.

De esta investigación se destaca el uso de instrumentos como Eyeem Vision y EveryPixel,

donde la primera permitía medir la belleza y la segunda el nivel en que una fotografía

puede ser calificada como sorprendente; asimismo, la posibilidad de emplear redes

neuronales como modelo predictivo fue mencionada en las recomendaciones de los

investigadores, aspecto que es desarrollado en el caso de la Isla Taquile.

2.2. Marco Teórico

2.2.1. Modelado Predictivo

El modelado predictivo puede ser definido como un proceso que consiste en

descubrir relaciones dentro de los datos para predecir algunos resultados deseados

en el futuro utilizando datos históricos (Mitchell, 2020). Dado que muchos dominios

científicos han contribuido a este campo, hay sinónimos para diferentes entidades;

así, por ejemplo, a la variable respuesta se lo conoce también como dependiente u

output, mientras que las independientes son denominadas también inputs del modelo

(Kuhn & Johnson, 2013).

Además, existen muchos tipos diferentes de técnicas de modelado predictivo que

incluyen regresión lineal (mínimos cuadrados ordinarios), regresión logística, series

de tiempo, árboles de decisión, redes neuronales y muchos más (Kuhn & Johnson,

2013). Al seleccionar la técnica de modelado predictivo correcta al inicio del

Page 17: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

17

proyecto se puede ahorrar mucho tiempo. La elección de la técnica de modelado

incorrecta puede dar lugar a predicciones inexactas (Oldon & Wu, 2020).

El análisis predictivo amplía la inteligencia estadística y/o artificial para

proporcionar la capacidad de previsión (Kuhn & Johnson, 2013). También incluye

el modelado de clasificación, la aplicación de modelos para sugerir mejores formas

de hacer las cosas, para incluir la identificación de los perfiles de clientes más

probables para enviar materiales de marketing, identificar transacciones realizadas

con tarjetas de crédito robadas, medir la satisfacción de los consumidores mediante

el procesamientos de reviews online, entre otras aplicaciones (Oldon & Wu, 2020).

2.2.2. Modelo predictivo de referencia

En el ámbito de la Ciencia de Datos (o Data Science), un sector de la academia

se ha abocado a construir modelos que puedan predecir el engagement de

publicaciones en redes sociales empleando distintos algoritmos como la regresión

lineal o las redes neuronales (De, et al., 2017).

Por otra parte, con relación a las variables del modelo; investigadores como

Vignisdóttir (2016) y Chatzopolou, Sheng y Faloutsos (2010), sugieren incorporar

determinadas variables como la “cantidad de seguidores”, “número de días” que ha

permanecido la publicación en línea y “cantidad de hashtags” empleados. Por otro

lado, Salem (2012) postuló que las fotografías que contenían “textos” eran menos

atractivas visualmente. Asimismo, es necesario mencionar que hay dos principales

grupos que publican contenido: organizaciones y personas. Después, cabe destacar

que aspectos como el hecho de que la fotografía puede ser calificada como

Page 18: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

18

“sorprendente” puede generar engagement en redes sociales (Stokman, 2014). A

ello hay que incorporar el nivel en que la fotografía pueda ser calificada como

“bella” (Ruiz & Calero, 2019). Finalmente se toman en cuenta como variables a las

categorías indicadas por Stepchenkova y Zhan (2012) (ver Tabla 1). Luego, el

modelo se determina de la siguiente forma:

Log(Engagement) = f(seguidores, hashtags, tipo_usuario, presencia_texto,

cantidad_dias, belleza, sorprendente, paisaje_natural, personas,

sitios_arqueológicos, estilo_vida, vestimenta_tradicional, arquitectura,

vida_salvaje, aventura, objeto_arte, instalaciones_turísticas)

La expresión anterior, representa al modelo de referencia a evaluar en la presente

investigación: “f” representa una función que combina a las variables establecidas .

2.2.3. Redes Sociales y Turismo

El turismo está lleno de situaciones en que los vínculos son esenciales para una

comprensión plena de su actividad: flujos turísticos, movimientos entre destinos y

rutas, relaciones interempresariales, como alianzas y franquicias, relaciones de los

interesados en los destinos, relaciones informales entre los diferentes actores,

gestión de relaciones con clientes y turistas, etc. En este sentido, el desarrollo de

redes sociales es relativamente reciente (Casanueva, Gallego, & García-Sánchez,

2014). Desde entonces, el desarrollo de algoritmos que explican la estructura de los

Page 19: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

19

vínculos ha sido constante y ha crecido exponencialmente con el uso de la

tecnología de la información.

Según Martorell (2016), las redes sociales son plataformas digitales que sirven de

punto de encuentro para usuarios con intereses comunes, donde se comparte

información a través de diferentes herramientas y servicios que ofrecen ya sea de

mensajería, publicación de fotografía o creación de grupos entre otros. Además, las

redes sociales poseen poderosas herramientas como la interactividad, la alta calidad,

visualización, búsqueda rápida y transmisión de información, pudiendo convertirse

en una de las principales herramientas de elección de destinos turísticos (Martorell,

2016).

Las personas son miembros de las redes sociales y, por lo tanto, interactúan con

otros miembros de su red y en la medida en que la interacción implica la necesidad

de ponerse en contacto cara a cara, induce a viajar. Por consiguiente, las

características de la red social, como su número de miembros, su composición y

distribución espacial, son una fuente de explicación de la actividad social

relacionada a los viajes (Kim, Rasouli & Timmermans, 2018). Las redes sociales no

son sólo una fuente de explicación de la frecuencia, naturaleza de las actividades

sociales y el comportamiento de los viajes, sino también una fuente de explicación

de otras decisiones relacionada a los viajes, como el intercambio de información, la

influencia social y la formación de actitudes (Kim, et al., 2018). Asimismo, otro

estudio reciente demostró que las redes sociales impactan las expectativas de los

turistas sobre un destino turístico (Smith, 2018).

Page 20: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

20

2.2.4. Importancia de las fotografías en el turismo

En los últimos años, la fotografía ha experimentado cambios sustanciales. En la

década del noventa, Fontcuberta (1997) definió a la fotografía como aquella que

requiere de la presencia de un objeto, que mediante una luz reflejada en el mismo y

sobre una superficie fotosensible, genera finalmente una imagen; esta imagen, según

el mencionado autor es un rastro almacenado, que queda en la memoria. Años

después, en el 2011, este mismo autor resalta que las fotografías, hoy en día, son

parte de una nueva cultura urbana en la que jóvenes y adolescentes no las recogen

como recuerdos para guardarlos en su mente, sino que ahora son mensajes que son

intercambiados en gestos de comunicación.

El enunciado anterior, afirma que las fotografías ya no son memorias, sino

instantes que por medio de las redes sociales muestran aspectos como “estuve aquí”,

“compré esto”, “me gusta esta marca”, entre otros. En ese sentido, la fotografía

compartida en redes sociales recopila millones de momentos intrascendentes de

manera aislada, pero a su vez es capaz de aportar nuevo conocimiento sobre

espacios, cuerpos, estéticas, modos y estilos de vida.

A principios del siglo XX, la fotografía y el turismo se integraron de manera

completa y la cámara fotográfica ha sido un distintivo de identidad del turista

(Chalfen, 1989); es decir, a donde viaje el turista coleccionará evidencias de dónde

ha estado, qué ha visto, realizado y probado. La función de la fotografía turística es

proporcionar un recuerdo del viaje (Belk & Yeh, 2011)

Page 21: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

21

La percepción de un destino turístico no sólo se relaciona con información, sino

también se transmite por medio de imágenes o fotografías; por consiguiente, hay

muchas empresas del rubro turístico utilizan fotografías como parte de su estrategia

de marketing digital para promocionar los destinos que ofrecen. Por otro lado, se

percibe que a través de la comunicación que realiza una empresa (publicidad o

promoción de ventas), los consumidores se forman determinadas expectativas,

creencias y opiniones acerca del resultado que proporcionará el consumir el servicio

o producto en el futuro (Ngobo, 2011).

Para el caso turístico, al no existir un traslado físico de los productos y servicios

desde donde se encuentra la oferta (destino turístico) hasta donde reside la demanda

(turista), es importante realizar una apropiada publicidad del destino que genere una

buena imagen y deseo de visitarlo. Según Fakeye y Crompton (1991), la imagen de

un destino turístico es vital para la toma de decisiones del turista, ya que refleja lo

que se espera ver del destino; por ello, se deben distinguir tres dimensiones para

construir la imagen percibida de un destino: imagen orgánica (creada a través de

documentación), inducida (creada a través de la promoción del destino) y compleja

(creada a través de la experimentación del turista) (Fakeye & Crompton, 1991). Por

tanto, la elección del destino turístico depende de las 3 dimensiones mencionadas,

siendo la variable inducida (promoción) importante para la presente investigación.

2.2.5. Instagram y Turismo

Instagram es una red social, inaugurada en octubre del 2010, que permite a los

usuarios colgar fotografías y videos, de manera que estos puedan compartir

Page 22: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

22

contenidos relacionados a su personalidad, gustos e intereses con sus seguidores.

Asimismo, ofrece una serie de funciones atractivas al usuario como: filtros de

imagen, marcos, uso de hashtags que agrupan las fotos en espacios compartidos,

chats internos, grabación de voz, visualización de estados, entre otras (Salinas,

2017).

Además, se debe de tener en cuenta que la promoción en Instagram funciona

diferente a la estructura convencional: esta última genera un costo de promoción

altísimo y un bajo impacto en los usuarios. Por otro lado, al ser principalmente una

aplicación para compartir fotografías y videos, Instagram se ha destacado como una

herramienta efectiva de comunicación y marketing para mostrar productos con

descripciones visuales (Amornpashara, Rompho & Phadoongsitthi, 2015); en tal

sentido, esta red social se convierte en una plataforma útil para usuarios como

empresas.

En cuanto a turismo, Instagram provee la facilidad de una comunicación

completa que va desde promocionar y posicionar la marca turística de un destino en

todo el mundo hasta una fotografía con contenido turístico generado por usuarios.

Según Megasari y Wayan (2015), Instagram es uno de los canales perfectos para los

tours operadores para promocionar destinos turísticos a través de imágenes, hoy en

día, el usar herramientas convencionales de promoción no es lo suficientemente

impactante como usar las redes sociales. Un claro ejemplo de esta afirmación es el

estudio aplicado en Indonesia, que explica el potencial de Instagram para

promocionar este país y describir cómo es capaz de crear y desarrollar una marca

destino a través de la publicación de fotografías en esta red social. Además, el 60%

de usuarios en Instagram publican en sus perfiles imágenes de los lugares que han

Page 23: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

23

visitado, convirtiéndose en fotógrafos de sus experiencias y hasta embajadores de

destinos turísticos (Megasari & Wayan, 2015). Por otro lado, cabe mencionar que

las búsquedas de Instagram, a través de Google Trends (herramienta que muestra

tendencias de búsquedas en Google), en lo relacionado a la categoría „viajes‟ han

crecido en los últimos 10 años, tal como se evidencia en la figura 1.

Figura 1. Interés mensual en aspectos relacionados a viajes en Instagram durante el 2010 al 2019.

Fuente: Google Trends (2020a)

2.2.6. Engagement en Instagram

Como se menciona anteriormente, el engagement es el grado de compromiso

cognitivo y afectivo del consumidor con la marca a través de cualquier canal digital

Page 24: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

24

(Molen & Wilson, 2010), es decir, se mide a través de la interacción de los usuarios

en los canales digitales (Molero & Milano, 2019); igualmente se define como un

término que mide de cierta forma el nivel de interacción entre una marca y los

usuarios en redes sociales (Nuñez, 2017). El engagement, también, puede ser

considerado como el arte de crear una relación de amor incondicional hacía una

marca (Perezbolde, 2010). Por otro lado, según Rodríguez (2016) el engagement se

relaciona con el número de seguidos, el número de “me gusta” en las publicaciones,

número de veces que el contenido se ha compartido por otros usuarios, por el

número de menciones y comentarios positivos (Rodríguez, 2016).

Al respecto, para medir el engagement se utilizan dos fórmulas: La primera es el

total de interacciones de los usuarios (likes, comentarios y shares) sobre la cantidad

de personas que vieron la publicación y multiplicarlo por 100 y la segunda es el

total de interacciones sobre total de seguidores actuales y multiplicarlo por 100,

según Núñez (2017). Asimismo, Origami Logic (2016) calcula el engagement

considerando el número total de interacciones dividido por: seguidores (representa

la audiencia que está potencialmente expuesta de manera directa a los contenidos),

alcance (representa el número de individuos que estuvieron expuestos al contenido)

o impresiones (representa el número total de vistas del contenido). Otra fórmula

para calcular el engagement es dividiendo el total de interacciones de los usuarios

en un período de tiempo determinado por el número de publicaciones realizadas en

ese mismo período y, luego, dividido por el número de seguidores, y multiplicado

por cien (Human Level Communications). Por ello puede ser considerado como una

métrica de popularidad muy importante para el marketing digital (Vignisdóttir,

2016).

Page 25: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

25

No obstante, una de las fórmulas de mayor difusión para determinar el

engagement en Instagram empleada por profesionales del Marketing y la ciencia de

datos (Data Science) es la sumatoria de likes y comentarios (Vignisdóttir, 2016),

indicado también por Bakshi, Shamma y Gilbert (2014). Por otro lado,

investigadores como Zohourian, Sajedi y Yavary (2018) indicaron que resultaba

adecuado realizar ajustes a una variable de interacción empleando operaciones

como los logaritmos, ello con el fin de suavizar las diferencias.

Según el estudio de Brandwatch (2019), diariamente se producen 4,2 mil

millones de likes en Instagram y afirma que las publicaciones con al menos un

hashtag genera 12.6% de engagement. Se define como hashtag a una etiqueta o

símbolo (#) compuesto seguido por una o más palabras juntas utilizadas para

clasificar o categorizar por temática las publicaciones de usuarios en las redes

sociales (Custodio, 2017). Además, Brandwatch afirma que las publicaciones que

cuenten con Geotags (geolocalizadores) reciben 79% más de engagement;

entiéndase como Geotag a etiquetas que permiten geolocalizar mediante GPS las

imágenes y videos publicados en Instagram, permitiendo ubicar de manera más

rápida a las publicaciones de un determinado lugar. Esto demuestra la gran

capacidad que tiene Instagram de generar engagement utilizando al menos dos de

sus funciones (hashtag y geotags) y además su capacidad de penetrarse a todos los

segmentos convirtiéndolo en una plataforma imprescindible para el sector turismo

(Brandwatch, 2019).

Page 26: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

26

2.2.7. Atributos visuales presentes en una fotografía en el contexto peruano

Si bien existen diversos atributos en una fotografía, no todos pueden ser

calificados como indicadores asociados al turismo, la cantidad de colores, el hecho

de que la fotografía cuente con efectos, una posición determinada, ángulo de toma y

otros son atributos visuales propiamente dichos, pero pueden ser estudiados por

otras disciplinas como las Ciencias de la Comunicación. Asimismo, en turismo

existen investigaciones que han buscado categorizar los atributos visuales presentes

en una fotografía (Fahmy, Bock, & Wanta, 2014).

En el contexto peruano, los atributos visuales presentes en las fotografías fueron

estudiadas por Stepchenkova y Zhan (2012) en su trabajo Visual destination images

of Peru: Comparative content analysis of DMO and user-generated photography.

Los investigadores indican que existen un grupo de atributos visuales (los cuales

denominaron categorías) presentes en las fotografías tomadas por los viajeros en el

territorio peruano, tales como: paisaje natural, presencia de personas, sitios

arqueológicos, estilo de vida, vestimenta tradicional, arquitectura, vida salvaje,

aventura, objetos de artes e instalaciones turísticas, tal como se muestra en la Tabla

1.

Page 27: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

27

Tabla 1

Categorías identificadas en fotografías tomadas en territorio peruano

Categoría Descripción

Paisaje Natural

Naturaleza prístina con atributos menores relacionados con el ser humano;

incluye montañas, desiertos, bosques, junglas, ríos y lagos, playas, otros

afines.

Personas Pobladores locales y viajeros, razonablemente identificables en la imagen.

Sitios Arqueológicos

Estructuras preincas e incas, remanentes de la arquitectura preinca e inca,

tumbas y sitios de entierro, pirámides, templos, centros ceremoniales,

fortalezas y otros afines.

Estilo de Vida

Forma de vida de pobladores locales, refleja sus condiciones de vida, vivienda

o actividades cotidianas; puede incluir viviendas individuales o múltiples y

arquitecturas para el uso de residentes del Perú: viviendas privadas, garajes,

tiendas locales, restaurantes, pequeñas iglesias, escenas en calle de zonas

residenciales urbanas o rurales, escenas del mercado local en un campo.

Vestimenta Tradicional

Vestidos o trajes de fiesta que reflejan la cultura diferenciada del Perú y sus

regiones; algunas personas nativas (e.g. los indios Yagua del Amazonas) no

llevan ropa convencional y normalmente usan vestidos hechos a partir de

animales o hojas de árboles.

Arquitectura

Del interior como exterior de la arquitectura de estilo occidental, español y

moderno en las zonas urbanas y rurales; incluye iglesias, monasterios,

palacios, edificios públicos y otros afines.

Vida Salvaje Aves, mamíferos marinos, camélidos andinos, mariposas, primates, otros.

Aventura Actividades en bote, kayak, senderismo, trekking, equitación, pesca, natación,

ecoturismo y otros afines.

Objeto de Arte Arte folklórico, arte de museo, arte moderno o arte callejero, lo que refleja la

cultura antigua o moderna de Perú.

Instalaciones Turísticas Hoteles, restaurantes, resorts y spas, playas con sillas y sombrillas, campos de

golf, otros afines.

Fuente: Stepchenkova y Zhan (2012) – Elaboración propia

2.2.8. Aspectos teóricos del análisis pictórico

La fotografía de destino, producida por organismos de marketing turístico de

destinos como: DMO (Destination Marketing Organization) o UGC (User

Generated Content), comunican imágenes que configuran y modifican las

percepciones de destino de los viajeros. Hay dos componentes principales de una

Page 28: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

28

fotografía: contenido y composición (Albers & James, 1988), el contenido se refiere

a las apariencias o signos capturados en una fotografía en su totalidad y la

composición a la forma en que estas apariencias o signos están vinculados entre sí y

son presentados a los espectadores. Los autores postulan que en los materiales

pictóricos que son analizados en varios dominios, incluido el turismo, a menudo se

encuentra redundancia en contenido y composición; esta redundancia no es

aleatoria.

El significado de una fotografía puede ser estructurado desde dos perspectivas,

metonímica o metafórica (Stepchenkova & Zhan, 2012). Desde la perspectiva

metonímica, todos los signos presentados en una fotografía representan a sí mismos

y se interpretan al pie de la letra; la perspectiva metafórica, en contraste, tiene que

ver con lo que la imagen significa más allá de las meras apariencias. Todos los

atributos de una fotografía se tratan como símbolos que aluden colectivamente a un

significado que se encuentra fuera de la imagen en particular. Un ejemplo de una

"lectura" metafórica sería una imagen de una rosa, que podría clasificarse como una

planta o una flor o, en ciertos contextos, podría simbolizar el romance o la pasión

(Strinati, 1995). La perspectiva elegida, metonímica o metafórica, define el enfoque

metodológico para el análisis (Stepchenkova & Zhan, 2012).

El proceso de análisis fotográfico puede ser cuantitativo y cualitativo, con dos

grandes grupos de metodologías empleados, análisis de contenido y análisis

semiótico, respectivamente (Stepchenkova & Zhan, 2012). El análisis de contenido

se ha utilizado con mayor frecuencia con contenido textual, pero también se puede

realizar en material gráfico (fotografías). En estudios culturales, las imágenes,

(incluidas pinturas, mapas, videos e incluso paisajes) a menudo se consideran como

Page 29: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

29

una forma de textual (Albers & James, 1988). El análisis de contenido se basa en

atributos y se ocupa principalmente en describir cuantitativamente la apariencia de

ciertos temas y atributos en la colección de imágenes o fotografías, lo que permite

identificar los principales temas focales en las imágenes y sus frecuencias,

concurrencia, agrupación y otros relacionados para ser recodificados (Albers &

James, 1988). Por lo tanto, el análisis de contenido considera que una fotografía es

una metonimia y trata sus atributos (signos y manifestaciones) de forma

independiente, como atributos independientes (Albers & James, 1988). En otras

palabras, el análisis de contenido "divide" una imagen en una serie de atributos (o

categorías) guiados por lo que se representa en una foto y toma estas

representaciones al pie de la letra. Ello hace referencia al contenido manifiesto

versus el contenido latente, un problema común que se da también en el análisis

textual (Krippendorff, 2004).

Albers y James (1988), en su estudio de la relación entre fotografía, etnia y viaje,

afirmaron que el análisis de contenido está dominado por el paradigma positivista

con su énfasis en la cuantificación; siendo los temas: número de personas en la foto,

edad y género, vestimenta (e.g., ropa cotidiana o vestimenta festiva), presentación

(e.g., sujetos representados en una acción o como un retrato formal) y alrededores

(e.g., estudio, escenario al aire libre o atracción turística). Estos autores también

declararon que las coincidencias de atributos focales en una fotografía son un factor

importante para describir un conjunto de datos; una vez que se describe

cuantitativamente un conjunto de datos, puede analizarse más a fondo desde un

ángulo temporal (cuando se tomaron las imágenes), un ángulo geográfico (donde se

Page 30: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

30

tomaron las imágenes) o una perspectiva de producción (quién tomó y distribuyó las

imágenes).

Asimismo, ha habido varios estudios que probaron la teoría de Urry (1990),

quien resalta el "círculo cerrado de representación" (elemento que hace referencia al

significado que cada persona puede otorgar a aquello que captura) dentro del marco

de análisis de contenido. Otros estudios que aplicaron el análisis de contenido a las

fotografías obtenidas por los turistas, bajo la instrucción del investigador, la llamada

técnica de fotografía empleada por el visitante (VEP). Según Garrod (2008), se

evaluó las fotografías VEP y las postales de los visitantes de la localidad y

descubrió que las dos muestras de imágenes tenían características comunes en

términos de atracciones capturadas en las imágenes, ubicaciones a partir del cual se

representaron estas atracciones, así como la composición general de la imagen. Otro

estudio de Garrod (2009), comparó las fotografías de turistas y residentes de

Aberystwyth; el resultado fue que tanto los turistas como los residentes adoptaron la

misma forma de "leer" el destino; el autor especuló que estas "lecturas" habían sido

inducidas por las representaciones de destino producidas por DMO. Asimismo,

MacKay y Couldwell (2004) compararon fotografías de un sitio histórico nacional

en la provincia de Saskatchewan, Canadá, obtenidas usando VEP, con imágenes

usadas en un esfuerzo promocional dado en ese momento. Como se puede apreciar,

cada uno de los tres estudios empíricos confirmó hasta cierto punto la existencia del

“círculo cerrado de representación” de Urry; sin embargo, también registraron

diferencias en las imágenes proyectadas y percibidas.

El análisis semiótico considera la imagen como un todo y se ocupa de investigar

cómo el contenido y la composición de una imagen comunican los mensajes

Page 31: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

31

deseados, a través de signos y símbolos sobre el lugar o el objeto que representan

(Stepchenkova & Zhan, 2012). Como enfoque de la comunicación, que se centra en

el significado y la interpretación, la semiótica desafía el modelo de transmisión

considerado por algunos como reduccionista, que equipara el “significado” con el

"mensaje", es decir, el contenido. El análisis semiótico "trata cada imagen como una

marca de totalidad en las relaciones pautadas en su contenido, conectándolas con

estructuras paralelas y contrastantes en otras imágenes, y relacionándolas con las

narraciones escritas que las acompañan” (Albers & James, 1988).

La teoría de Urry, también se ha probado con análisis semiótico. Caton y Santos

(2008), analizaron fotografías tomadas por estudiantes en un viaje de crucero al

extranjero a un país del Tercer Mundo, a través de cinco dimensiones:

tradicional/moderno, sujeto/objeto, maestro/ servidor, centro/periferia y desviado-

vago/moral-trabajador, llegando a la conclusión de que las fotografías completan el

“círculo cerrado de representación” y se ajustan a las ideologías socioculturales del

poder y el dominio occidental.

Por otro lado, Markwick (2001), analizó imágenes de postales de Malta, su

contexto y complejidad, a través de la motivación y deseo del turista; el análisis

incluyó perspectivas tales como "sol y mar", "pasión por los viajes", “autenticidad y

realismo”. El autor identificó los circuitos complejos de consumo y producción

evidenciados en postales, destacando la importancia de los contextos en los que

operan estos circuitos.

Finalmente, el análisis de contenido se seleccionó como el método principal

debido a su capacidad para gestionar material cualitativo de manera sistemática,

verificable y replicable (Krippendorff, 2004). Aunque el análisis de contenido pueda

Page 32: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

32

considerarse como adecuado, no permite la misma complejidad y riqueza de

interpretación que el análisis semiótico, en aquellas investigaciones que involucren

fotografías (Stepchenkova y Zhan, 2012).

2.2.9. El análisis de imágenes con soporte computacional

De acuerdo a lo mencionado en la sección anterior, el análisis pictórico puede

realizarse desde una perspectiva cuantitativa; el uso de métodos que involucren

procesos computacionales puede contribuir a la minimización de sesgos pues una

máquina carece de sesgos y obedece a procesos lógicos (Solomon & Breckon,

2011).

El análisis de imágenes es la extracción de información significativa de

imágenes; principalmente de imágenes digitales mediante técnicas de procesamiento

de imágenes digitales (Solomon & Breckon, 2011). Las tareas de análisis de

imágenes pueden ser tan simples como leer las etiquetas codificadas en barras o tan

sofisticadas como identificar el rostro de una persona (Dehghan, Ortiz, Shu & Zain,

2017).

Las computadoras son indispensables para el análisis de grandes cantidades de

datos, para tareas que requieren computación compleja o para la extracción de

información cuantitativa (Zhang, 2019). Por otro lado, la corteza visual humana es

un excelente aparato de análisis de imagen, especialmente para extraer información

de nivel superior, y para muchas aplicaciones incluyendo medicina, seguridad y

teledetección; los analistas humanos aún no pueden ser reemplazados por

computadoras (Dehghan,et al., 2017). Las herramientas importantes para el análisis

Page 33: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

33

de imágenes, como los detectores de bordes y las redes neuronales, están inspiradas

en modelos de Computer Vision, basados en los mecanismos artificiales que

pretenden emular la percepción visual humana (Forsyth & Ponce, 2012). En el

ámbito académico de habla hispana, el proceso se conoce como Visión Artificial, la

cual también puede ser considerada como una herramienta consolidada que emplea

diversos sectores productivos, para la inspección de calidad, monitoreo y control,

tanto para productos como servicios (Cavanzo, Pérez & Villavisan, 2017). La

Visión Artificial integra tres áreas de la ingeniería: óptica, electrónica e informática.

El objetivo es la captura de imágenes de objetos o entorno, procesarlas y extraer

información relevante del estado de los productos, servicios y procesos, todo de

manera objetiva y automática.

La minería de imágenes (Image Mining) tiene como objetivo extraer relaciones y

patrones que no están explícitamente almacenados en la base de datos de imágenes

sin procesar (Zhang, 2019). La minería de imágenes es una técnica bien estructurada

basada en la minería de datos, la inteligencia artificial, el aprendizaje automático, la

recuperación y procesamiento de imágenes, la visión de ordenador y el manejo de

base de datos (Solomon & Breckon, 2011).

La capacidad de la minería de imágenes consiste en descubrir patrones de

imágenes útiles y abrir varios campos de investigación a las nuevas fronteras;

asimismo, la Big Data y Data Mining combinados de grandes colecciones de

imágenes con datos alfanuméricos asociados son los dos temas importantes de la

minería de imágenes (Solomon & Breckon, 2011). La capacidad de la minería de

imágenes para inferir el conocimiento de los datos de una imagen automática

Page 34: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

34

constituye la razón principal de su creciente popularidad, como se muestra en la

Figura 2.

Figura 2. Interés mundial hacia la Visión Artificial entre marzo del 2015 y marzo del 2019.

Fuente: Google Trends (2020b)

2.2.10. Isla Taquile

Es una de las islas que conforman el circuito del lago Titicaca, ubicada a 36 km

al Este de la ciudad de Puno, tiene una extensión aproximada de 5.72 km2 y la

altitud entre el puerto y el pueblo varía de 3,810 a 3,950 m.s.n.m (PROMPERÚ,

2016). Está conformada por seis suyos: Kollata, Huayllano, Kollino, Chuño Pampa,

Estancia y Lakano, división relacionada con la actividad agrícola. Su clima es

templado, con temperatura máxima de 23 ºC (66 °F) y la mínima de 7 °C (37 °F)

(PROMPERÚ, s.f.).

Asimismo, según el Sistema de Información Georeferencial de MINCETUR

(SIGMINCETUR), la Isla Taquile está ubicada en la categoría 1 “Sitios Naturales”

Page 35: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

35

de la fase de categorización de los Recursos Turísticos, de tipo “Costa”, subtipo

“Islas” y con jerarquía “2”, debido a que cuenta con algunos rasgos llamativos que

pueden ser de interés a visitantes que hubiesen llegado al lugar por otros motivos

turísticos o de motivar flujos turísticos regionales o locales (MINCETUR, 2017).

Por otro lado, la Isla Taquile tiene una población de aproximadamente dos mil

doscientas personas, descendientes de la comunidad quechua, que aún conserva la

mayoría de sus costumbres antiguas, valores, folclore y vestimenta original y

vistosa. La base de su economía es la agricultura, arte textil y turismo, siendo las

dos últimas su principal fuente de ingresos (EcuRed, 2012).

Sobre el arte textil de la Isla Taquile, según PROMPERÚ se caracteriza por sus

coloridos textiles hechos por los pobladores expertos en la práctica textil tradicional,

los finos textiles hechos por los pobladores, resaltan sus decoraciones simétricas,

simbólicas y de colores fuertes, que reflejan la forma de vida, costumbres y

creencias andinas, así conservan sus tradiciones. Su arte textil es considerado

Patrimonio Cultural Inmaterial de la Humanidad por la UNESCO (PROMPERÚ,

s.f.); esta actividad es realizada por hombres y mujeres de todas las edades;

contando con una escuela especializada para la enseñanza de su arte textil,

contribuyendo a su preservación y continuidad de la tradición (UNESCO, s.f.).

Con relación al turismo de la Isla Taquile, su principal atractivo es el turismo

comunitario, que comprende experimentar sus costumbres como: convivencia con

los pobladores para aprender y realizar actividades agrícolas aprovechando el clima

beneficioso y los recursos hídricos del lago Titicaca, conocer los ritos y creencias y

realizar los rituales andinos como el tributo a la Pachamama (MINCETUR, 2015).

En Taquile, también existen sitios turísticos arqueológicos y sitios naturales para el

Page 36: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

36

esparcimiento como las playas Huayllano y Collata (en esta es posible hallar

petroglifos).

En lo que respecta a los arribos totales de turistas (extranjeros y nacionales) a la

Isla Taquile, según data proporcionada por MINCETUR (2020), resulta posible

afirmar que entre los años 2015 y 2019, la cantidad de arribos mantuvo una

tendencia creciente, con una contracción en el 2018, como se puede apreciar en la

Figura 3.

Figura 3. Arribos a la Isla Taquile durante el 2015-2019.

Fuente: MINCETUR (2020) – Elaboración propia

Al respecto, de emplearse el medio de regresión lineal, es posible inferir que, por

cada año transcurrido, la cantidad de arribos en la Isla Taquile creció en 9,735.

Por otro lado, la distribución mensual de los arribos nacionales y extranjeros de

la Isla Taquile en el periodo 2015 al 2019, se muestra en la Figura 4 y Figura 5,

respectivamente.

69,194

84,483

105,733

86,890

116,663 y = 9734.5x + 63389 R² = 0.6779

0

20,000

40,000

60,000

80,000

100,000

120,000

140,000

2015 2016 2017 2018 2019

Page 37: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

37

Figura 4. Distribución mensual de arribos nacionales a la Isla Taquile durante el 2015-2019.

Fuente: MINCETUR (2020) – Elaboración propia

De acuerdo a la figura anterior, se puede inferir que en el periodo del 2015 al

2019, la Isla Taquile fue más visitada en los meses de febrero y julio por turistas

nacionales.

Figura 5. Distribución mensual de arribos internacionales a la Isla Taquile durante el 2015-2019.

Fuente: MINCETUR (2020) – Elaboración propia

7.58%

10.89%

5.67%

7.42% 7.13% 6.36%

10.50%

8.77% 8.09% 8.31%

9.66% 9.62%

0.00%

2.00%

4.00%

6.00%

8.00%

10.00%

12.00%

4.76%

7.33% 6.22%

7.51%

10.09%

8.02%

11.01% 11.65%

9.27% 8.83% 8.09%

7.23%

0.00%

2.00%

4.00%

6.00%

8.00%

10.00%

12.00%

14.00%

Page 38: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

38

Asimismo, de la figura anterior se puede determinar que en el periodo 2015 al

2019, la Isla Taquile fue más visitada en los meses de julio y agosto por turistas

internacionales.

Finalmente, la proporción de arribos de la Isla Taquile, teniendo en cuenta el

origen (nacional y extranjero) de los turistas se muestra en la Figura 6.

Figura 6: Proporción de arribos a la Isla Taquile de acuerdo a origen (nacional-extranjero).

Fuente: MINCETUR (2020) – Elaboración propia

De la figura anterior, se puede determinar que la Isla Taquile es visitada

principalmente por turistas extranjeros en un promedio general del 81% con

respecto al total de visitantes.

17.66% 20.97% 17.27% 18.32% 20.45%

82.34% 79.03% 82.73% 81.68% 79.55%

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

2015 2016 2017 2018 2019

Nacionales Extranjeros

Page 39: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

39

2.3. Objetivos

Objetivo general: Determinar si el modelo que relaciona el engagement de fotografías

y sus atributos visuales en la red social Instagram para el caso de la Isla Taquile resulta

significativo.

Objetivo específico 1: Determinar si el modelo de regresión lineal que relaciona el

engagement de fotografías y sus atributos visuales en la red social Instagram para

el caso de la Isla Taquile cumple con las condiciones de validez necesarias.

Objetivo específico 2: Determinar si el modelo de redes neuronales que relaciona

el engagement de fotografías y sus atributos visuales en la red social Instagram

para el caso de la Isla Taquile supera en precisión al modelo de regresión lineal.

2.4. Hipótesis

Hipótesis General: El modelo que relaciona el engagement de fotografías y sus

atributos visuales en la red social Instagram para el caso de la Isla Taquile resulta

significativo.

Hipótesis específica 1: El modelo de regresión lineal que relaciona el engagement

de fotografías y sus atributos visuales en la red social Instagram para el caso de la

Isla Taquile cumple con las condiciones de validez necesarias.

Hipótesis específica 2: El modelo de redes neuronales que relaciona el engagement

de fotografías y sus atributos visuales en la red social Instagram para el caso de la

Isla Taquile supera en precisión al modelo de regresión lineal.

Page 40: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

40

CAPÍTULO III: MÉTODO

3.1. Tipo de investigación

La presente investigación se basa en modelos predictivos similares donde el engagement

en Instagram es la variable respuesta. Por esa razón, se considera esta investigación como

explicativa ya que busca establecer causas posibles para un fenómeno ya estudiado

(Hernández, Fernández & Baptista, 2014). En este caso, la investigación se orienta a

conocer una serie de atributos visuales que pueden explicar el engagement de las

fotografías de la Isla Taquile en Instagram. Por otro lado, cabe mencionar que los objetivos

y valores de verdad de las hipótesis de investigación serán alcanzados mediante el uso de

métodos estadístico-matemáticos. Esta es una característica distintiva de las investigaciones

cuantitativas (Kothari, 2004).

3.2. Diseño de Investigación

Por su naturaleza, la investigación es correlacional y no experimental. Los estudios

correlacionales aportan una gran utilidad ya que permite conocer cómo se puede comportar

un concepto o una variable al conocer el comportamiento de otras variables vinculadas

(Hanneman, Kposowa & Riddle, 2013). Esta correlación puede ser positiva o negativa, si es

positiva, significa que los valores altos en una variable tenderán también a mostrar valores

elevados en la otra y si es negativa o no existe correlación alguna entre las variables, indica

que fluctúan sin seguir un patrón sistemático común (Hernández, et al., 2014). Esto quiere

decir, que, con este tipo de estudio, se puede determinar cómo y cuánto es que una variable

se puede vincular o relacionar con otra de manera positiva o negativa.

Page 41: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

41

Cabe resaltar, que las mediciones de las variables que se van a correlacionar deben

provenir de los mismos casos o participantes, pues no es común que se correlacionen

mediciones de una variable realizadas en ciertas personas o participantes, con mediciones

de otra variable realizadas en otras personas (Hernández, et al., 2014). Por otro lado, los

estudios correlacionales procuran medir el grado de relación entre variables, mientras que

los estudios descriptivos se orientan a medir con exactitud las mismas individualmente

(Kothari, 2004).

Además, la investigación es no experimental. El investigador no controla las variables ni

pretender hacerlo, únicamente se limita a recolectar datos (Sánchez & Reyes, 2015). Dicho

de otra forma, quienes asumen el rol de investigador no pretende manipular

intencionalmente las variables independientes para ver el efecto sobre otras (Hernández, et

al., 2014). Si bien es cierto que se transforman las fotografías en patrones numéricos, cabe

recalcar que dichas imágenes como tal han sido capturadas por terceros que se han

desplazado hasta la Isla Taquile. Un estudio experimental implicaría que el investigador

publique un contenido previamente establecido para medir el engagement generado

(Vignisdóttir, 2016).

El estudio es transversal. Ello implica obtener información una sola vez de cualquier

muestra de la población. Esto quiere decir, que se analiza la información en un solo

momento y no depende del factor “tiempo” como en el caso del Diseño Longitudinal. La

clasificación del Diseño Transversal se divide en Diseño Transversal Simple, aquel en

donde se obtiene por única vez información de una muestra extraída de una determinada

población, y Diseño Transversal Múltiple, definido como aquel en dónde hay más de dos

muestras de encuestados y de cada muestra se obtiene información una sola vez (Malhotra,

2008). Para este trabajo de investigación se aplicará el Diseño Transversal Simple: se

Page 42: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

42

analizó una muestra de fotografías sustraídas de la red social Instagram y posteriormente se

obtendrá por única vez información a partir del análisis de las mismas.

3.3. Variables

Las variables de estudio se muestran en la Tabla 2 y son propias del modelo previamente

indicado en las secciones 2.2.2, es decir:

Log(Engagement) = f(seguidores, hashtags, tipo_usuario, presencia_texto,

cantidad_dias, belleza, sorprendente, paisaje_natural, personas, sitios_arqueológicos,

estilo_vida, vestimenta_tradicional, arquitectura, vida_salvaje, aventura, objeto_arte,

instalaciones_turísticas)

Page 43: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

43

Tabla 2

Variables de Estudio

Variable Descripción Operacionalización

Engagement Variable dependiente del estudio. Representa a las interacciones de los usuarios. Observación directa (suma de likes y comentarios) a la que se aplica el logaritmo en

base 10.

Seguidores Número de seguidores de la cuenta del usuario de Instagram. Observación directa al momento de recolectar la data.

Hashtags Número de hashtags empleados en la publicación. Observación directa al momento de recolectar la data.

Tipo_usuario Variable dicotómica que hace referencia a si la fotografía fue compartida por una organización

(1) o persona (0). Observación directa al momento de recolectar la data.

Presencia_texto Variable dicotómica que hace referencia a si la fotografía presenta texto (1) o no (0). Observación directa al momento de recolectar la data.

Cantidad_días Cantidad de días que ha permanecido la fotografía en la red social Instagram. Observación directa al momento de recolectar la data (diferencial de la fecha de

publicación y recolección).

Belleza Representa el nivel de belleza de la fotografía. Es un porcentaje, es decir va desde 0 hasta

100%. Procesamiento de cada fotografía con Eyeem Vision.

Sorpredente (awesome) Representa el nivel en que la fotografía puede ser calificada como asombrosa. Es un

porcentaje que va desde 0 hasta 100%. Procesamiento de cada fotografía con EveryPixel.

Paisaje_natural Corresponde al nivel de presencia paisajística natural existente en la fotografía. Admite

valores a partir de 0. Procesamiento de cada fotografía con Google Visual AI.

Vestimenta_tradicional Corresponde al nivel de presencia de vestimenta tradicional existente en la fotografía. Admite

valores a partir de 0. Procesamiento de cada fotografía con Google Visual AI.

Arquitectura Corresponde al nivel de presencia de estructuras arquitectónicas existentes en la fotografía.

Admite valores a partir de 0. Procesamiento de cada fotografía con Google Visual AI.

Sitios_arqueológicos Hace referencia al nivel de presencia de sitios arqueológicos existentes en la fotografía.

Admite valores a partir de 0. Procesamiento de cada fotografía con Google Visual AI.

Objeto_arte Hace referencia al nivel de presencia de objetos de arte presentes en la fotografía. Admite

valores a partir de 0. Procesamiento de cada fotografía con Google Visual AI.

Estilo_vida Corresponde al nivel de presencia de escenarios asociados a un estilo de vida presente en la

fotografía. Admite valores a partir de 0. Procesamiento de cada fotografía con Google Visual AI.

Vida_salvaje Corresponde al nivel de presencia de vida salvaje presente en la fotografía. Admite valores a

partir de 0. Procesamiento de cada fotografía con Google Visual AI.

Personas Corresponde al nivel de presencia de personas presente en la fotografía. Admite valores a

partir de 0. Procesamiento de cada fotografía con Google Visual AI.

Aventura Corresponde al nivel de presencia de actividades vinculadas a la aventura presente en la

fotografía. Admite valores a partir de 0. Procesamiento de cada fotografía con Google Visual AI.

Instalaciones_turísticas Corresponde al nivel de presencia de instalaciones para turistas presente en la fotografía. Admite valores a partir de 0.

Procesamiento de cada fotografía con Google Visual AI.

Fuente: Elaboración propia

Page 44: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

44

3.4. Universo

El universo estuvo compuesto por el conjunto total de fotografías de la red social

Instagram en las que se ha retratado la Isla Taquile. No resulta posible estimar el tamaño

del universo con la exactitud necesaria.

3.5. Muestra

Si se considera que el universo supera las 100,000 unidades (población infinita) y el

muestreo fuera aleatorio se utilizaría la siguiente fórmula:

Donde Z = 1.96 (asociado al 95% de confianza); mientras que p = q = 0.05

(p=probabilidad de éxito y q =probabilidad de fracaso) y e = error (0.05). Con dichos

valores n registra un valor de 384. Dichos parámetros son habituales en las investigaciones

científicas.

Los datos geolocalizados resultan de mayor fiabilidad para obtener información acerca

de un determinado lugar debido a que es una función automática y corroborada por el

dispositivo de captura (Kádár, 2014). La data considerada incluyó 439 fotografías desde

mayo del 2015 hasta setiembre del 2019, debido a que se cuentan con datos de los

seguidores de cada cuenta desde dicho mes y año. Además, se empleó el muestreo no

probabilístico, pues de todas las fotografías que se encuentran en Instagram, como criterios

de exclusión se han seleccionado aquellas que cuentan con el geolocalizador “Isla Taquile

– Puno”, además, se consideraron fotografías nítidas y no fragmentadas. Todo ello

evidencia que las fotografías de la Isla Taquile en Instagram no tuvieron la misma

probabilidad de ser elegidas.

Page 45: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

45

En el muestreo no probabilístico son seleccionados elementos muestrales que no son

estadísticamente representativos de una población determinada, es decir, la elección de la

muestra no tiene la misma posibilidad de ser elegidos, sino que parte de la decisión de un

investigador o grupo de recolectores de datos (Hernández, et al., 2014). Además, fue

necesario emplear el muestreo por conveniencia: al momento de extraer la muestra, se

eligieron fotografías de perfiles públicos, debido a que en un determinado momento un

perfil puede figurar público y en otro momento, por políticas de privacidad, puede figurar

como privado, lo que limitaría la extracción de las fotografías. El muestreo no

probabilístico por conveniencia permite seleccionar la muestra de acuerdo a la

conveniencia o proximidad de los sujetos para el investigador (Otzen & Manterola, 2017).

3.6. Instrumentos de Investigación

3.6.1. Downloader for Instagram

Forma parte de la aplicación Instagram y permite descargar fotografías de dicha

red social en formato jpeg. Esta aplicación es de fácil uso pues solo requiere

descargarla sin costo alguno, agregarla como extensión de Chrome e ingresar a

Instagram desde un ordenador (Chrome Web Store, 2020). En la presente

investigación fue empleada para descargar las fotografías de la Isla Taquile, previa

delimitación geográfica de los resultados a partir de “Isla Taquile- Puno”,

posteriormente se colocó el cursor encima del botón “descargar” de cada fotografía.

La pantalla interactiva de la aplicación Downloader for Instagram se muestra en la

Figura 7.

Page 46: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

46

Figura 7. Modo de uso de Downloader for Instagram.

Fuente: Instagram (2020)

3.6.2. Google Vision AI

Inteligencia Artificial diseñada por Google es especializada en el análisis de

imágenes (Stokman, 2014). El algoritmo ha sido entrenado en parte por las propias

búsquedas realizadas por personas que usan el mencionado navegador (Stokman,

2014). Cuenta con una versión gratuita y otra de pago. En la investigación se

empleó para poder medir las “variables contenidos en la Tabla 1”, planteados por

Stepchenkova y Zhan (2012). Google Vision AI funciona con el mecanismo drag &

drop (arrastra y suelta); es decir, solo es necesario arrastrar la imagen hacia la zona

Try the API para su análisis. La pantalla interactiva de la aplicación Google Vision

AI se muestra en la Figura 8.

Page 47: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

47

Figura 8. Interface de uso de Google Vision AI.

Fuente: Google Vision AI (2020)

Los resultados son inmediatos, para poder visualizarlos en su totalidad es

necesario desplegar el achivo JSON, cuyo formato se muestra en la Figura 9.

Figura 9. Formato de resultados del instrumento Google Vision AI.

Fuente: Google Vision AI (2020)

Nota: En este caso pueden observarse dos resultados: uno correspondiente a Paisaje_Natural

(Natural Landscape) y otro para Arquitectura (Architecture).

Page 48: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

48

3.6.3. EyeEm Vision

Constituye una tecnología de reconocimiento de imágenes, cuya función

principal es detectar conceptos y emociones en las fotografías. Esta herramienta se

creó a fin de resolver los problemas que la mayoría de los fotógrafos y compradores

tenían como el de querer que descubran sus fotografías y descubrir las mejores,

respectivamente. De esta manera es como EyeEm Vision nació como un motor de

visión por computadora que etiqueta fotografías según lo que se detecta en cada

imagen (EyeEm Vision, 2019).

Además de la función de etiquetar, EyeEm Vision da un paso más allá del

etiquetado automático y reconoce la intención de un fotógrafo, que puede ser un

concepto o una emoción, generando así que gran parte de las fotografías sean

descubiertas a través de conexiones instantáneas con fotógrafos y compradores de

fotografías (EyeEm Vision, 2019). Este instrumento tiene una versión gratuita y ha

sido utilizado para medir la variable “belleza” de las fotografías, la cual puede

usarse mediante el mecanismo drag & drop (arrastra y suelta). La pantalla

interactiva de la aplicación EyeEm Vision se muestra en la Figura 10.

Figura 10. Interface y resultados del instrumento EyeEm Vision.

Fuente: EyeEm Vision (2020)

Nota: El resultado para la fotografía empleada fue de 51% de belleza.

Page 49: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

49

3.6.4. Everypixel

Aplicación basada en una red neuronal, que simula una secuencia de neuronas.

Es un algoritmo basado en una inteligencia artificial que tiene como tarea analizar la

fotografía y determinar el nivel en que esta puede ser calificada como awesome

(sorprendente). Su resultado se obtiene en un rango de 0% hasta 100%, siendo esta

precisamente la característica empleada en la investigación. La estructura de la red

neuronal vino directamente de la biología al mundo de la programación. Gracias a

ello, la máquina adquiere la capacidad de analizar e incluso memorizar una variedad

de información (Everypixel, 2019). La Figura 11 muestra la interface de uso de la

aplicación Everypixel.

Figura 11. Interface de Uso para el software Everypixel.

Fuente: Everypixel (2020)

Everypixel, al igual que Google Vision AI y EyeEm Vision, funciona con el

mecanismo drag & drop (arrastra y suelta). El resultado obtenido de medir la

variable awesome (sorprendente) en una determinada fotografía, se muestra en la

figura 12:

Page 50: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

50

Figura 12. Resultados de la aplicación Everypixel.

Fuente: Everypixel (2020)

Nota: El resultado para la fotografía empleada fue de 18.2% awesome.

3.6.5. SPSS Modeler

Constituye un software orientado al Data Mining cuya interfaz se basa en un

flujo que debe ser elaborado por el usuario (Wendler & Gröttrup, 2016), cuya

interfaz se muestra en la Figura 13.

Figura 13. Interface inicial del SPSS Modeler.

Fuente: Wendler & Gröttrup (2016)

Page 51: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

51

En la zona inferior de la interfaz mostrada se encuentran las herramientas que

deben ser utilizadas para el proceso de modelado, los mismos que deberán ser

seleccionados y arrastrados en el lienzo en blanco (IBM, 2017). Las herramientas

representan procesos lógicos-computacionales (Wendler & Gröttrup, 2016). El

software fue desarrollado tomando en consideración la metodología CRISP-DM

(del inglés Cross Industry Standard Process for Data Mining) (Almahadeen,

Akkaya & Sari, 2017). A continuación la Figura 14 muestra la interface aplicado en

la investigación.

Figura 14. Interface del SPSS Modeler empleado en la investigación.

Fuente: Adaptado de Wendler & Gröttrup (2016) – Elaboración propia

Existe un origen de datos (dataset) (1), a los que es necesario asignar un tipo, es

decir, variable dependiente o independiente (2). El modelo de redes neuronales

requiere particionar la data en datos de entrenamiento y testeo (3). Una opción de

Page 52: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

52

modelado es la regresión lineal (4) y otra el uso de las redes neuronales (5). Los

resultados de cada modelo constituyen el output del modelado ((6) y (7)).

3.7. Recolección de datos

La recolección de datos es polietápica; implica una serie de etapas, que se describen a

continuación:

a) Usar la herramienta de geolocalización “Isla Taquile – Puno” para obtener la data

(fotografías) en su estado original.

b) Registrar los datos que se puedan obtener mediante observación directa como:

fecha en la que se compartió el contenido y la fecha en la que fue incorporado el

elemento (fotografía) a la muestra, lo que permitirá determinar la cantidad de días

de publicación en Instagram; cantidad de seguidores de la cuenta, likes y

comentarios que ha generado la fotografía de la Isla Taquile. Asimismo, fue posible

medir la cantidad de hashtags empleados y establecer si la fotografía contenía

texto. Del mismo modo se pudo identificar si la cuenta pertenecía a una persona u

organización, si existía alguna duda sobre cualquier caso a recolectar (por ejemplo,

no saber si la fotografía pertenecía a un individuo o una organización),

simplemente se eliminó el elemento de la muestra.

c) Descargar las fotografías empleando la aplicación Downloader for Instagram y

almacenarlas para el posterior análisis con los instrumentos propios de Image

Analytics, es decir, Google Vision AI, EyeEm Vision y EveryPixel; esta actividad se

realiza en paralelo al registro de datos. Los atributos que forman parte del

contenido visual de una fotografía digital no cambian con el tiempo (Ordenes &

Page 53: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

53

Zhang, 2019). En contraste, lo que puede ocurrir es que los algoritmos sean

actualizados (Shukla & Vala, 2016).

d) Consolidar el dataset, de tal modo que para cada elemento muestral, se tenga

registrado el engagement (suma de likes y comentarios) junto a todos los atributos

de contenido visual y aquellas variables que han podido ser medidas mediante

observación directa.

e) Emplear el software de análisis automático de datos SPSS Modeler importando el

dataset consolidado y posteriormente construir los modelos de predicción: Redes

Neuronales y Regresión Lineal.

3.8. Plan de análisis

3.8.1. Regresión Lineal Múltiple

Una vez completada la base de datos, se procedió a emplear el SPSS Modeler.

Dada la naturaleza de la variable dependiente (engagement) que constituye una

variable cuantitativa continua; y al hecho de que las variables independientes podían

ser expresadas como números, se optó por usar la regresión lineal múltiple

(Montgomery, Peck & Vining, 2012). Fue empleada la versión step forward; este es

un método de ajuste de modelos de regresión en el que la elección de variables

independiente (también llamadas variables predictoras o explicativas), se realiza

mediante un procedimiento automático. En cada paso, se considera una variable

dependiente (o variable de respuesta) para la suma o la resta del conjunto de

variables independientes, en función de algún criterio preespecificado (Loftus &

Taylor, 2014). El software irá agregando variables al modelo hasta mientras el valor

Page 54: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

54

R-cuadrado y R-cuadrado ajustado aumente y al punto de que el error medio no

pueda disminuirse más (Loftus & Taylor, 2014). El objetivo de esta fase es

identificar variables que aportan al modelo.

Por otro lado, es necesario mencionar que existen ciertas condiciones de validez

para considerar que la regresión lineal es un modelo adecuado (Harrell, 2015):

Aditividad y multicolinealidad: La aditividad significa que el modelo de

regresión lineal es aditivo. En otras palabras, cada variable independiente

por sí sola suma a la explicación de la variable dependiente (Osborne &

Waters, 2002). Esto implica que no haya relación entre las variables

independentes (predictoras). Si así ocurriese, se estaría dando la

multicolinealidad; esta se produce cuando dos o más variables predictoras

están relacionadas entre sí. Para verificar que no se produzca la

multicolinealidad fue empleado el VIF (Factor Inflación de Varianza); este

indicador no debe superar el valor de 5, de acuerdo a lo planteado por

(Kutner, Nachtsheim, Neter & Li, 2004).

Autocorrelación entre los residuos (diferencias entre el valor real y

pronosticado): En la regresión lineal múltiple, lo que se espera es que los

residuos sean independientes, si esta condición no llegara a darse, puede

que la ecuación encontrada presente sesgos (Osborne & Waters, 2002).

Para que la regresión lineal múltiple sea un modelo adecuado debe

verificarse el estadístico de Durbin Watson, valores próximos a dos

favorecen al modelo (Kutner, et al., 2004).

Page 55: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

55

Normalidad: Los residuos deben tener una distribución normal (Osborne &

Waters, 2002). A fin de que esta condición sea cumplida fue aplicado la

prueba de Kolmogórov-Smirnov (Kutner, et al., 2004)

La regresión lineal es ampliamente usada, debido a que resulta sumamente

práctica. De acuerdo a Belsley (1991), una vez determinado el modelo, el mismo

puede ser replicado empleando procedimientos aritméticos sencillos. Esta posición

también es compartida por Osborne & Waters (2002), quienes indican que el

proceso puede ser llevado a mano con una hoja de cálculo. En cambio, otros

métodos no son fácilmente replicables como: la regresión PLS, por ejemplo, que

incluye otros métodos más sofisticados que exceden los límites de la investigación.

Por otro lado, las redes neuronales podrían ser empleadas, lamentablemente dicho

método computacional no permite comprobar hipótesis para cada una de las

variables, ya que el computador busca la manera de combinar las variables de

entrada mediante diferentes algoritmos para llegar a una variable respuesta

(Osborne & Waters, 2002). Finalmente, el modelo de regresión lineal múltiple ha

sido de amplio uso empleados en distintas investigaciones relacionadas a servicios

(Osborne & Waters, 2002).

3.8.2. Redes Neuronales

En las ciencias duras, el uso de las redes neuronales ha aumentado en los últimos

años. Por ejemplo, se utiliza como una poderosa técnica de análisis para detectar el

cáncer de seno, modelar la actividad antioxidante y predecir la progresión y

mortalidad de una enfermedad (Hassan, Negm, Zahran & Saavedra, 2015). La

Page 56: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

56

popularidad de las redes neuronales se cimenta en dos hechos clave; en primer

lugar, las computadoras personales ahora son lo suficientemente potentes como para

ejecutar programas de redes neuronales a través de softwares fácilmente obtenibles

(DeTienne & DeTienne, 2017). Luego, las redes neuronales pueden superar la

mayoría de las deficiencias de las técnicas de regresión tradicionales como: el

análisis de ruidos, datos incompletos, datos no lineales y datos con valores atípicos

(DeTienne & DeTienne, 2017).

La primera investigación importante sobre redes neuronales fue realizada en

1943 por McCollough y Pitts. Rosenblatt siguió en 1962 creando un algoritmo de

aprendizaje para un modelo conocido como el perceptrón (DeTienne & DeTienne,

2017). El interés en la investigación de redes neuronales aumentó constantemente

hasta 1969, cuando un libro de Minsky y Papert indicó que las redes neuronales

podrían usarse para evaluar solo una variedad limitada de funciones (Pérez & De

Paz, 2007). Las redes neuronales se han utilizado en pocos estudios de negocios y

marketing. En el artículo de Bainbridge (2006), sobre diferentes tipos de avances en

marketing sociométrico computarizado, se señala que se ha desarrollado potentes

softwares informáticos que mejoran significativamente las oportunidades

metodológicas.

Una red neuronal artificial (Artificial Neural Network o ANN) se compone de

varias unidades interconectadas, llamadas neuronas o nodos (IBM, s.f.). Cada nudo

realiza una operación simple en una entrada para generar una salida que se reenvía a

los siguientes nodos en la secuencia (Pérez & De Paz, 2007). Este procesamiento

paralelo permite grandes ventajas en el análisis de datos. Asimismo, las tres

Page 57: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

57

características esenciales de una red neuronal son: topología de la red, ubicación y

función de sus elementos y el entrenamiento de la red (Pérez & De Paz, 2007).

La topología de la red; se refiere al número y organización de las unidades

informáticas, el tipo de conexiones entre neuronas y la dirección del flujo de

información en la red (Ciaburro & Venkateswaran, 2017). La neurona (perceptrón)

es la unidad organizativa básica de una red neuronal, y están dispuestos en una serie

de capas para crear las redes neuronales artificiales (Ciaburro & Venkateswaran,

2017).

Según su ubicación y función dentro de la red, los nodos (neuronas) se clasifican

como nodos de entrada, salida o capa oculta (Pérez & De Paz, 2007). Los nodos de

la capa de entrada reciben información de fuentes externas a la red neuronal; los

nodos de la capa de salida transmiten información fuera de la red neuronal; y los

nodos de la capa oculta actúan como los nodos computacionales en la red neuronal,

comunicándose entre nodos de entrada y otros nodos de capa oculta y nodos de

salida (Pérez & De Paz, 2007). Al respecto, la Figura 15 muestra la arquitectura de

una red neuronal.

Page 58: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

58

Figura 15. Arquitectura de una red neuronal.

Fuente: Hassan, et al., (2015)

Nota: Los 4 inputs de la capa de entrada (Input Layer) son las variables independientes

(predictoras), mientras que en la capa oculta (Hidden Layer) se han formado 5 nodos

intermedios. La capa de salida (Output Layer) se ubica la variable dependiente (resultado)

de la red neuronal .

El número de nodos en la capa de entrada es igual al número de variables

independientes ingresadas en la red y el número de nodos en la capa salida

corresponde al número de variables dependientes (Taylor, 2017). Las conexiones

entre las neuronas se clasifican como excitatorias o inhibitorias, tomando en cuenta

si los pesos de las neuronas son negativos o positivos, respectivamente (DeTienne &

DeTienne, 2017). La dirección del movimiento de la información también distingue

a las redes neuronales como: redes de alimentación y de retroalimentación. Las

redes de alimentación permiten la transferencia de datos en una sola dirección a

través de la red, mientras que las redes de retroalimentación permiten que los datos

circulen por la red (Stern, 1996). El número de capas y nodos ocultos utilizados

Page 59: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

59

dentro de la capa oculta varía según la complejidad de la tarea que debe realizar la

red (Nazari, Hajiallahyari, Rahimi, Khanmohammadi & Amini, 2019).

Hasta esta etapa aún no existen reglas o funciones rigurosas para determinar la

configuración óptima de una red neuronal para resolver un problema específico.

Demasiados o muy pocos nodos en la capa oculta evitarán que la red genere los

resultados deseados (Yang, 2019). Esencialmente, las redes neuronales a menudo

dependen de prueba y error para determinar la topología de red correcta para un

problema dado, aunque es frecuente encontrar complicaciones similares con

cualquier procedimiento de análisis de datos (Stern, 1996).

Una vez que se establecen la topología de la red y la ubicación y funciones

computacionales de la misma, se debe determinar la estrategia de entrenamiento o

aprendizaje adaptativo de la red (Stern, 1996). Las redes neuronales deben

"aprender" para generar valores consistentes con los patrones en un conjunto de

datos dado para hacer proyecciones precisas (Yang, 2019). El proceso de

aprendizaje es cuando los pesos de la red cambian en respuesta a un conjunto de

datos de capacitación. Las redes neuronales aprenden de dos maneras: aprendizaje

supervisado y no supervisado, que difieren según se usen o no las respuestas

conocidas para capacitar a la red (DeTienne & DeTienne, 2017).

El aprendizaje supervisado se usa cuando el conjunto de datos contiene valores

de salida asociados con cada entrada en el conjunto de datos. La red compara los

valores que genera con los valores de salida (target) y minimiza los errores al

descubrir las características de conducción en los datos y ajustar los pesos

(DeTienne & DeTienne, 2017). Una vez capacitada, la red podrá descubrir patrones

y hacer predicciones con datos no utilizados en el conjunto de capacitación. El

Page 60: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

60

algoritmo más común utilizado para ajustar los pesos en el aprendizaje supervisado

se llama retropropagación (Backpropagation) (DeTienne & DeTienne, 2017).

El algoritmo de aprendizaje supervisado de retropropagación se utiliza para

encontrar pesos en redes de alimentación de múltiples capas (Taylor, 2017). El

algoritmo de retropropagación es el modelo más práctico y comúnmente utilizado

para las redes neuronales. Adya y Collopy (1998) descubrieron que el 88% de los

análisis de investigación de negocios de redes neuronales durante un período de seis

años utilizaron el algoritmo de retropropagación, cuyo desarrollo es una de las

principales razones para el resurgimiento del interés en las redes neuronales. El

algoritmo retropropagación es conceptualmente simple: tomando en cuenta los

valores de entrada el rendimiento de la red se evalúa en los valores objetivo en el

conjunto de validación. Los errores resultantes de la comparación de los valores de

salida real y objetivo se propagan hacia atrás a través de la red, y los pesos se

ajustan para minimizar el error (Taylor, 2017).

Mientras la red continúe generando valores más cercanos a los valores de

validación, el aprendizaje continuará. El proceso de simulación de entrenamiento

finaliza cuando todos los patrones se clasifican correctamente dentro de un rango

seleccionado de precisión, o la red comienza a presentar un peor funcionamiento en

un proceso llamado sobreajuste o sobre entrenamiento (DeTienne & DeTienne,

2017). Si la red no puede aprender todos los patrones, la topología de la red se

puede ajustar (Taylor, 2017). Con respecto a las redes neuronales, el criterio de

rendimiento es la minimización del error al cuadrado (Taylor, 2017).

Cuando el conjunto de entrenamiento carece de valores de salida objetivo, se usa

el aprendizaje no supervisado, el cual realiza ajustes de peso con respecto a las

Page 61: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

61

correlaciones en las variables de entrada, que en realidad son tanto variables de

entrada como de destino (Cross, Harrison & Kennedy, 1995). La red se ajusta para

que las entradas similares generen salidas similares. Esta capacitación se lleva a

cabo mediante la construcción de variables de características a partir de las cuales se

pueden predecir variables (Sarle, 1994). Durante el aprendizaje no supervisado de

redes, la capa de salida no se utiliza; los nodos de salida solo se utilizan al

interpretar los resultados (Sarle, 1994). Debido a que las redes no supervisadas se

centran solo en los valores de entrada en un conjunto de datos para descubrir las

características predictivas, se entrenan rápidamente y se usan con frecuencia como

preprocesadores para la creación de redes supervisadas (DeTienne & DeTienne,

2017). Esto se debe a que el aprendizaje supervisado se simplifica cuando las

características clave del conjunto de datos se han identificado previamente y solo

estas características son utilizadas como variables de entrada (Cross, et al., 1995).

Las redes no supervisadas son ideales para casos en que las salidas conocidas no

están disponibles (Demsar, et al., 2013).

Los métodos de análisis basados en redes neuronales no requieren suposiciones

de que las variables independientes no están correlacionadas, resolviendo así el

problema de multicolinealidad encontrado en la regresión lineal múltiple. Por

ejemplo, el estudio realizado por Pechmann y Knight (2002) sobre las creencias e

intenciones de los adolescentes acerca del consumo de cigarrillos utilizó un modelo

de dos pasos que combina la publicidad y el comportamiento de adolescentes para

producir un resultado en el que cualquiera de los factores sería inconsistente. El

estudio evidenció anuncios de fumar y videos de adolescentes que no se conocían y

monitoreó los efectos combinados de estos estímulos en las creencias. Este estudio

Page 62: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

62

utilizó diferentes variables bajo los supuestos de la regresión lineal para sacar

conclusiones. Sin embargo, fuera de un mundo perfecto, las variables

verdaderamente independientes son casi imposibles de obtener.

3.8.3. Comparación de ambos modelos

De ambos modelos se requiere conocer su precisión (accuracy). En el caso de la

red neuronal el accuracy es una salida del SPSS, mientras que, en la regresión lineal

múltiple, la precisión es el R-cuadrado. A fin de alcanzar una mejor comprensión de

la diferencia entre los dos modelos se presenta el comparativo gráfico entre los

valores observados y predichos para cada una de las dos opciones de modelado.

Finalmente comparar la importancia de las variables predictoras dentro de cada

modelo (IBM, s.f.). Ello es necesario porque lo esperable es que las variables

independientes (predictoras) no tengan la misma importancia en dos algoritmos

distintos.

Page 63: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

63

CAPÍTULO IV: RESULTADOS

4.1. Resultados

Los resultados del modelo de regresión lineal múltiple automático (step forward) fueron

los siguientes:

Tabla 3

ANOVA de la regresión lineal múltiple automática

Modelo

Suma de

cuadrados

Gl

Media

cuadrática

F Sig.

Regresión 62.649 11 5.695 52.788 .000l

Residuo 46.069 427 .108

Total 108.718 438

Variables Predictoras: (Constante), paisaje_natural, arquitectura, hashtags,

sitios_arqueológicos, seguidores, estilo_vida, belleza, vestimenta_tradicional, objeto_arte,

vida_salvaje, cantidad_días

Luego de haber empleado el análisis de varianza (ANOVA), de la Tabla 3 se puede

inferir que el modelo de regresión lineal múltiple ha resultado significativo (.000 inferior a

.05). Además, los resultados del Análisis de Coeficientes y Test de Colinealidad de las

variables fueron los siguientes:

Page 64: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

64

Tabla 4

Análisis de coeficientes (aditividad) y test de multicolinealidad

Modelo

Coeficientes no

estandarizados

Coeficientes

estandarizados

t Sig.

Estadísticas de

colinealidad

B

Error

estándar

Beta Tolerancia VIF

(Constante) -.810 .128 -6.332 .000

paisaje_natural 1.454 .211 .241 6.894 .000 .813 1.230

arquitectura 1.368 .207 .223 6.619 .000 .877 1.141

hashtags .012 .001 .257 8.057 .000 .976 1.024

sitios_arqueológicos 1.292 .207 .209 6.244 .000 .888 1.127

seguidores 9.345E-06 .000 .201 6.190 .000 .939 1.065

estilo_vida 1.313 .231 .207 5.686 .000 .751 1.332

belleza .533 .098 .173 5.432 .000 .976 1.024

vestimenta_tradicional 4.568 1.041 .143 4.388 .000 .937 1.068

objeto_arte .615 .221 .091 2.783 .006 .932 1.073

vida_salvaje -.293 .129 -.078 -2.268 .024 .839 1.192

cantidad_días .000 .000 .068 2.117 .035 .954 1.048

De la Tabla 4, se ha determinado las variables que permanecen en el modelo de

regresión, por tener un nivel de significancia menor a .05. Asimismo, con la información de

la Tabla, es posible construir la ecuación de regresión, la cual adopta la siguiente forma:

Page 65: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

65

log(engagement) = -.810 + 1.454*paisaje_natural + 1.368*arquitectura + .012*hashtags +

1.292* sitios_arqueologicos + 9.345E-06*seguidores + 1.313*estilo_vida + .533*belleza +

4.568*vestimenta_tradicional + .615*objeto_arte - .293*vida_salvaje +.000*cantidad_dias

De la expresión anterior queda evidencia de la relación entre el log(engagement) y

paisaje_natural, arquitectura, hashtags, sitios_arqueologicos, seguidores, estilo_vida,

belleza, vestimenta_tradicional, objeto_arte. Dicha relación entre ellas es directa a

excepción de vida_salvaje pues arroja un valor negativo en beta (-0.293). Luego,

cantidad_dias es una variable que tiene incidencia en la variable dependiente (engagement),

pero de forma marginal considerando que su coeficiente beta tiende a 0.

Por otro lado, cabe mencionar que se ha cumplido una de las condiciones de la regresión

lineal múltiple. Los valores VIF (Factor Inflación de Varianza) del modelo son inferiores a

2, lo que significa que no hay una relación de dependencia entre las variables

independientes (predictoras) que distorsione los resultados de la regresión; es decir, no hay

colinealidad.

A continuación, luego de haber analizado las variables que permanecen en el modelo; se

han identificado las variables a ser retiradas del modelo, por tener un nivel de significancia

mayor a 0.05, como se muestra en la Tabla 5:

Page 66: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

66

Tabla 5

Análisis de variables retiradas del modelo

Modelo En beta T Sig.

Estadísticas de colinealidad

Tolerancia VIF

Tolerancia

mínima

tipo_usuario -.034 -1.062 .289 .982 1.018 .749

presencia_texto .049 1.538 .125 .981 1.020 .751

sorprendente .044 1.307 .192 .893 1.120 .750

personas -.020 -.630 .529 .977 1.024 .750

aventura -.044 -1.365 .173 .973 1.028 .747

instalaciones_turisticas .026 .802 .423 .968 1.033 .750

Para determinar la precisión del modelo y el cumplimiento de otra de las condiciones de

la regresión lineal múltiple (no autocorrelación entre los residuos), se ha calculado el R

cuadrado y el Test de Durbin Watson respectivamente, tal y como se muestra en la Tabla 6:

Tabla 6

Resumen del modelo y Test de Durbin Watson

Modelo R

R

cuadrado

R cuadrado

ajustado

Error

estándar de

la estimación

Durbin-

Watson

0.759 .576 .565 0.328 2.078

Page 67: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

67

De la tabla anterior, es posible inferir que la variable dependiente log(engagement) ha

quedado determinada en un 57.6% por las variables predictoras: paisaje_natural,

arquitectura, hashtags, sitios_arqueologicos, seguidores, estilo_vida, belleza,

vestimenta_tradicional, objeto_arte, vida_salvaje y cantidad_dias. El R cuadrado es

considerado como un indicador de precisión del modelo.

Lo adecuado es evitar la autocorrelación entre residuos, esto se verifica con el

estadístico de Durbin Watson (Montgomery, et al., 2012). El Test de Durbin-Watson

permite evaluar si existe autocorrelación en una regresión lineal, sea simple o múltiple

(Harrell, 2015). Con ello se pretende ver si los valores presentan algún tipo de dependencia

en cuanto al orden de obtención, si fuera así se estaría incumpliendo una de las condiciones

del modelo de regresión lineal. Valores cercanos a 2 son los óptimos para afirmar que no se

presenta la autocorrelación entre residuos; lo que finalmente ha ocurrido, teniendo en

cuenta que el Durbin-Watson es de 2.078. Caso contrario se cae en un sesgo. En este caso

se verifica que el modelo de regresión lineal múltiple cumple con esta condición.

Otra de las condiciones de la regresión lineal múltiple es la distribución normal de los

residuos. Para facilitar la estimación por intervalo del modelo de regresión es exigible la

normalidad de la distribución de los errores. Ello se verifica usando el test de Kolmogórov-

Smirnov, tal como se muestra en la siguiente Tabla 7:

Page 68: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

68

Tabla 7

Prueba de Kolmogórov-Smirnov para los residuos no estandarizados

Residual no estandarizado

N 439

Parámetros

normalesa,b

Media 0.000

Desviación

estándar 0.324

Máximas

diferencias

extremas

Absoluta 0.057

Positivo 0.057

Negativo -0.033

Estadístico de prueba .057

Sig. asintótica (bilateral) .002c

Dado que el nivel de significancia es de .002 (inferior a .05), no se puede aceptar que los

residuos no tengan una distribución normal. Ello es apreciable también en la Figura 16:

Figura 16. Valores observados y predichos en la distribución normal.

Page 69: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

69

El hecho de que los residuos no tengan una distribución normal es una situación que no

favorece a la regresión múltiple como modelo. Por ello es necesario buscar otra alternativa.

Precisamente por ello se ha empleado otro algoritmo predictivo.

Con respecto a los valores observados y predichos del engagement en la regresión lineal

se muestra en la Figura 17:

Figura 17. Valores observados y predichos del engagement en la regresión lineal.

0

0.5

1

1.5

2

2.5

3

3.5

4

4.5

5

0 0.5 1 1.5 2 2.5 3 3.5 4

Val

or

Pre

dic

ho

Valor Observado

Page 70: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

70

Por otro lado, en cuanto a los resultados de la red neuronal se muestra la topologia (o

arquitectura) en la Figura 18:

Figura 18. Arquitectura de la red neuronal.

Page 71: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

71

De la figura anterior, cabe mencionar el hecho que las variables independientes

(predictoras) se combinan usando dos funciones: tangente hiperbólica

) en

la capa oculta e identidad ( en la capa de salida (estructura análoga a la regresión

lineal). Con respecto a los parámetros de la red neuronal se muestran en la Tabla 8:

Page 72: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

72

Tabla 8

Parámetro del modelo

Predictor

Pronosticado

Capa oculta 1 Capa de salida

H(1:1) H(1:2) H(1:3) H(1:4) H(1:5) H(1:6) H(1:7) engagement

Capa de

entrada

(Sesgo) -.435 .471 -.110 -.366 -.516 -.244 .113

Seguidores -.156 -.301 -.613 .470 -.235 .767 -.292

Hashtags .203 -.349 -.539 .055 .002 .091 .109

tipo_usuario .401 .211 -.271 -.249 -.193 -.226 -.137

presencia_texto .219 .012 -.289 .201 .269 -.046 -.040

cantidad_días -.180 .229 -.055 -.265 .393 .233 -.236

Belleza .331 .248 -.225 -.307 -.438 .389 .079

Sorprendente .113 .402 .095 -.436 .131 .137 -.275

paisaje_natural -.413 .316 -.567 .438 -.304 .085 .265

vestimenta_tradicional .421 .195 -.255 .297 .257 .033 .343

Arquitectura .093 .627 .150 .173 -.274 .332 .353

sitios_arqueológicos -.269 .588 -.215 .380 -.188 .030 .440

objeto_arte .345 .324 -.201 -.110 -.477 -.047 .119

estilo_vida .182 -.054 -.293 -.143 .576 .605 -.107

vida_salvaje .340 .012 .184 -.314 .043 .017 .181

Personas .278 -.180 -.177 .202 .307 -.097 -.018

Aventura -.247 .340 .153 -.327 -.444 .174 -.147

instalaciones_turísticas .430 .188 -.244 -.430 -.130 -.039 -.429

Capa oculta 1 (Sesgo) .177

H(1:1) .014

H(1:2) .009

H(1:3) -.541

H(1:4) .370

H(1:5) -.058

H(1:6) .682

H(1:7) -.249

Page 73: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

73

Con respecto a la resultados generales del modelo basado en redes neuronales se tiene:

Tabla 9

Resumen del modelo basado en una red neuronal

'División' 1_Entrenamiento 2_Testeo

Error mínimo -0.792 -0.802

Error máximo 1.268 1.177

Error medio -0.008 -0.020

Error absoluto medio 0.233 0.273

Desviación estándar 0.294 0.337

Correlación Lineal 0.817 0.716

Ocurrencia 299.0 141.0

Precisión 66.40%

La red neuronal, entonces, alcanzó una precisión de 66.40%

Page 74: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

74

En lo que respecta a los valores obervados y predichos de la red neuronal se obtuvo:

Figura 19. Valores observados y predichos del engagement en la red neuronal.

0

0.5

1

1.5

2

2.5

3

3.5

0 0.5 1 1.5 2 2.5 3 3.5 4

Val

or

Pre

dic

ho

Valor Observado

Page 75: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

75

En lo que respecta a la importancia de la variable predictora de cada modelo se obtuvo lo siguiente:

Figura 20. Importancia de cada variable predictora dentro de cada modelo.

Independientemente del modelo empleado, la cantidad de seguidores, hashtags, paisaje natural y estilo de vida, son las variables

predictoras que predominan, siendo la primera la variable predictora de mayor importancia.

25%

6% 4%

6%

3% 3% 3%

10%

3%

7% 5%

3%

11%

2% 2% 4% 3%

41%

11%

0% 0% 2%

5%

0%

9%

5%

8% 7%

1%

10%

1% 0% 0% 0% 0%

5%

10%

15%

20%

25%

30%

35%

40%

45%

Red Neuronal

Reg. Lineal

Page 76: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

76

Si se compara los valores observados y predichos de cada modelo se obtiene:

Regresión Lineal Red Neuronal

Figura 21. Comparación de los valores predichos y observados en la regresión lineal y red neuronal.

Page 77: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

77

De la Figura anterior, es posible inferir que la red neuronal ha alcanzado mejores resultados (menor dispersión entre los valores

predichos y observados). Ello se puede verificar si se compara el accuracy de ambos modelos, cuyos resultados se evidencian en la

Tabla 10.

Tabla 10

Precisión de cada modelo

Modelo Regresión Lineal Red Neuronal

Precisión (Accuracy) 57.60% 66.40%

La red neuronal ha registrado una mayor precisión que la regresión lineal.

Page 78: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

78

4.2. Discusión

Belk & Yeh (2011), indican que el nivel de actividad humana incide en el hecho de que

una fotografía sea capturada. En el caso de la Isla Taquile, la actividad humana propia de

los locales tiene relación con el “estilo de vida”. Ocurre también que esta última tiene

relación con el engagement. La diferencia se encuentra en la naturaleza del estudio, ya que

el capturar una foto no necesariamente implica compartirla en redes sociales. Entonces

debe entenderse que pueda existir algún tipo de relación entre el contenido que decide

capturarse y aquel que genera reacciones (likes y comentarios) en las redes sociales.

Cabe resaltar que la clasificación del contenido visual indicada por Stepchenkova y

Zhan (2012) ha resultado ser adecuada para la tesis, debido a que a partir de ella se han

construido variables que han permitido aproximarse al engagement. De ello queda

evidencia en el hecho de que el modelo de regresión lineal múltiple haya resultado

significativo; caso contario, era posible afimar que ninguno de los elementos visuales

contribuye significativamente a predecir el engagement, al igual que las variables auxiliares

(seguidores, cantidad de días que ha permanecido la publicación online, etc).

Cahyanto, et al., (2012) emplearon un análisis cualitativo orientado a categorizar los

atributos visuales de Sambi. Las categorías fueron 5: características ambientales,

estructuras construidas, personas, ceremonias tradicionales y artes; mientras que en la

presente investigación se recurre a la categorización de Stepchenkova y Zhan (2012) en su

trabajo Visual destination images of Peru: Comparative content analysis of DMO and user-

generated photography, el cual incluye diez dimensiones. Ciertamente el trabajo de estas

últimas adecuado para el contexto peruano, pero no solo a nivel cualitativo, sino también

desde una perspectiva cuantitativa. De ello queda evidencia en el hecho de que el modelo

Page 79: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

79

de regresión contenga elementos que pueden ser significativos para pronosticar el

engagement; caso contrario lo adecuado era emplear otra categorización de contenido

visual.

Haussmann, et al. (2017), indicaron que para el caso del Parque Nacional Kruger, la

fauna de gran tamaño tenga relación con las preferencias de los viajeros. En el caso de la

Isla Taquile, ciertamente la “vida salvaje” no aporta significativamente al engagement. Por

el contrario, puede disminuirlo. Esto bajo el modelo de regresión lineal múltiple. No

obstante, es una variable que no tiene una mayor importancia dentro ambas opciones de

modelado. La diferencia probablemente quede explicada por el hecho de que Taquile se

asocia al turismo rural, mientras que el Parque Nacional Kruger destaca por su vida salvaje.

Thommes y Hubner (2018), emplearon una escala de Likert para medir la “belleza” de

fotografías arquitectónicas. Como se ha evidencia en la investigación, el uso de un software

especializado es viable, e incluso puede ser empleado un indicador de belleza para construir

un modelo predictivo. Ello implica que una encuesta (instrumento) puede ser

eventualmente reemplazado por instrumentos artificiales en el caso de análisis de imágenes,

lo cual contribuye a la disminución de sesgos, ya que las herramientas han sido

programadas siguiendo procesos lógico-matemáticos.

De, et al. (2017), evidencia el uso de las redes neuronales como método predictor de un

“número de reacciones web” (cantidad de likes) en lo que a estilos de vida de los hindúes se

refiere. El engagement para el caso de las fotografías de la Isla Taquile ha podido emplear

el mencionado algoritmo. A diferencia de la regresión lineal, con la red neuronal no ha sido

necesario verificar una serie de condiciones de validez; además ha resultado de mayor

precisión; sin embargo, si se observan los parámetros de ambos modelos, es evidente que la

regresión es de más fácil de comprender.

Page 80: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

80

Ruiz y Calero (2019), evidenciaron que la “belleza” y “nivel de asombro” pueden incidir

en el precio de alquiler de una habitación de Airbnb. En la presente investigación, el

atributo “belleza” tiene relación directa con el engagement; sin embargo, el atributo

“sorprendente” puede incidir también, pero empleando las redes neuronales. Por otro lado,

cabe destacar que para el caso de Airbnb únicamente se hizo uso de la regresión lineal

múltiple, en el caso de Taquile, ciertamente se puede usar dicho algoritmo, pero no resulta

totalmente adecuado desde una perspectiva estrictamente matemática.

Page 81: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

81

CAPÍTULO V: CONCLUSIONES

5.1. Conclusiones

Tanto el modelo de regresión lineal múltiple como el modelo basado en redes neuronales

permiten aproximarse al engagement de fotografías de la Isla Taquile en Instagram. Sin

embargo, la regresión lineal múltiple no cumple con todas las condiciones de validez: las

variables predictoras son independientes y no se presenta la autocorrelación entre los

residuos; no obstante, los residuos no poseen una distribución normal. La hipótesis general

es verdadera: el modelo de regresión lineal múltiple es significativo, aunque no es idóneo al

no cumplir las condiciones antes mencionadas.

La primera hipótesis específica es falsa: como se ha mencionado anteriormente, la

regresión lineal múltiple no cumple con todas las condiciones de validez. Es un modelo

significativo, pero en un sentido estrictamente matemático posee sesgos.

La segunda hipótesis especifica es verdadera: las redes neuronales como modelo ha

registrado una mayor precisión que la regresión lineal múltiple (66.40% > 57.60%), por

otro lado, la red neuronal no requiere de condiciones de validez.

Por otro lado, la variable de mayor importancia es la “cantidad de seguidores”

(followers), independientemente de que modelo se use, se espera que dicha variable tenga

una relación directa. Otra variable a tomar en consideración es la “cantidad de hashtags”

empleados en la descripción y que tiene incidencia directa sobre el engagement.

Dentro de las variables de contenido visual propiamente dichos, el “estilo de vida” es la

de mayor relevancia, independientemente de que modelo sea usado. A ella le siguen en

Page 82: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

82

importancia la presencia de “paisajes naturales”. La variable que menos aporta es la

presencia de “personas”. Las variables “belleza” y “sorprendente” son menos relevantes

dentro de las variables de contenido visual.

De los dos modelos presentados, el modelo de regresión lineal múltiple no solo incluye

una menor cantidad de variables, sino también es el que se puede implementar con mayor

facilidad. Las redes neuronales, en este sentido, resultan ser una estructura de mayor

complejidad, pero en un sentido estrictamente matemático, estas redes no tienen sesgos.

El engagement en fotografías de Instagram, que involucran a las de la Isla Taquile es

adecuado. Si es que uno de los objetivos de un gestor turístico es maximizar el engagement,

entonces no basta con que una fotografía sea bella o sorprendente (o tenga una combinación

de ambas). Es posible medir la presencia de otros atributos y aproximarse a los niveles de

engagement dada una serie de características propias de las fotografías.

5.2. Recomendaciones

En turismo, los datos no estructurados como son las fotografías que comparten los

turistas en sus redes sociales, pueden ser estudiados de forma cuantitativa siempre y cuando

sean estructurados con softwares especializados, por lo que se recomienda seguir

empleando estas herramientas. La construcción de un modelo predictivo orientado a medir

el engagement es una prueba de que estructurar atributos fotográficos no resulta una tarea

de la cual no se pueda obtener provecho académico.

Implementar el modelo resulta factible. Es recomendable guardar un registro de los

valores observados y predichos y ajustar los indicadores del modelo, con el fin de poder

Page 83: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

83

actualizar los parámetros del mismo, dado que las preferencias pueden variar con el tiempo,

esto tiene que ver con el monitoreo de las variables asociadas al contenido de las

fotografías; por ejemplo, existen variaciones a lo largo del tiempo, respecto a si el nivel de

presencia de la paisajística natural aumenta o si la presencia de objetos de arte disminuye;

esto se denomina análisis de preferencias a lo largo del tiempo y puede emplearse en una

investigación de tipo longitudinal.

El nivel en que una fotografía pueda ser calificada como asombrosa o bella es relevante.

No obstante, no son los atributos de mayor importancia, al menos para la muestra

analizada. El contenido fotográfico es el mayor condicionante del engagement, pero por lo

general, si dos fotografías tienen un mismo contenido, se recomienda publicar aquella que

posea un mayor nivel de estética o capacidad de causar asombro; esto puede controlarse

mediante elementos como los efectos, balance de colores, entre otros.

La investigación puede complementarse con estudios cualitativos que pueden ayudar a

comprender por qué existe relación entre determinados atributos visuales y el engagement.

Este estudio puede realizarse entre usuarios de Instagram que hayan visitado la Isla Taquile.

Para investigaciones futuras, cabe destacar la posibilidad de construir modelos

segmentando a los viajeros de acuerdo a características personales; por ejemplo, se pueden

hacer divisiones de acuerdo al género de los usuarios de Instagram o según su origen

(nacional o extranjero).

Existen otras variables que pueden ser consideradas en investigaciones futuras como por

ejemplo, los datos en formato de texto que pueden ser aprovechados mediante el proceso de

Text Mining. Estos datos pueden contribuir a conocer la polaridad de las emociones

presentes en un contenido de formato textual.

Page 84: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

84

El modelo puede ser replicado para destinos que sean comparables a la Isla Taquile a fin

de comprobar diferencias y similitudes en el modelado.

5.3. Limitaciones

Entre las limitaciones de la investigación es necesario mencionar que los instrumentos

utilizados son brindados por terceros que constantemente los actualizan. Ello, incluso, se

puede relacionar con lo que es considerado bello o hermoso a lo largo del tiempo. Los

algoritmos o modelos como la regresión lineal y redes neuronales son actualizados cada

cierto tiempo por lo que es posible que los resultados varíen incluso si se utiliza la misma

muestra de fotografías.

Por otro lado, existen quienes afirman que las computadoras están todavía lejos de

percibir significados como lo hace el cerebro humano. En las fotografías, por ejemplo, no

todo el contenido es literal. Un ejemplo de ello son los “memes”, representaciones en

donde existen otros significados que difieren del significado literal. Existen, además, otros

significados ocultos que no son tan evidentes.

La investigación ha recurrido a un muestreo abierto y por conveniencia; ello no quiere

decir que los resultados carezcan de validez, pero es necesario aclarar que el modelo es

significativo para la muestra analizada; los resultados mostrados poseen validez y es

tentativo creer que deben tener similitudes con un estudio poblacional.

Page 85: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

85

BIBLIOGRAFIA

Adya, M., & Collopy, F. (1998). How effective are neural networks at forecasting and

prediction? A review and evalutation. Journal of Forecasting, 17, 481-495.

Aggarwal, C. (2019). Neural Networks and Deep Learning A Textbook. New York:

Springer.

Albers, P., & James, W. (1988). Travel photography: a methodological approach. Annals of

Tourism Research, 15, 134-158.

Almahadeen, L., Akkaya, M., & Sari, A. (2017). Mining Student Data Using CRISP-DM

Model. International Journal of Computer Science and Information Security, 15(2),

305-316.

Amornpashara, N., Rompho, N., & Phadoongsitthi, M. (2015). A study of the relationship

between using Instagram and purchase intention. Journal for Global Business

Advancement, 8(3), 354-370. doi:10.1504/JGBA.2015.071330

Bainbridge, W. (2006). God from the Machine: Artificial Intelligence Models of Religious

Cognition. Lanham, MD: AltaMira Press.

Bakshi, S., Shamma, D., & Gilbert, E. (2014). Faces engage us: photos with faces attract

more likes and comments on Instagram. CHI '14: Proceedings of the SIGCHI

Conference on Human Factors in Computing Systems, (págs. 965-974). Toronto .

doi:10.1145/2556288.2557403

Ballesteros, C. (2019). La representación digital del engagement: hacia una percepción del

compromiso a través de acciones simbólicas. Revista de Comunicación. 18(1). 227.

http://dx.doi.org/10.26441/RC18.1-2019-A11.

Belk, R., & Yeh, J. (2011). Tourist photographs: signs of self. International Journal of

Culture Tourism and Hospitality Research, 5(4), 345-353.

doi:10.1108/17506181111174628

Belsley, D. (1991). Conditioning Diagnostics: Collinearity And Weak Data In Regression.

New York: Wiley-Interscience.

Brandwatch. (20 de enero de 2019). 50 Incredible Instagram Statistics. Recuperado el 10 de

enero de 2019, de https://www.brandwatch.com/blog/instagram-stats/

Bowden, J. (2009). The Process of Customer Engagement: A Conceptual Framework. The

Journal of Marketing Theory and Practice, 17(1), 63–74.

doi.org/10.2753/MTP1069-6679170105

Cahyanto, I., Pennington-Gray, L., & Thapa, B. (2012). Tourist–resident interfaces: using

reflexive photography to develop responsible rural tourism in Indonesia. Journal of

Sustainable Tourism, 21(5), 1-18. doi:10.1080/09669582.2012.709860

Casanueva, C., Gallego, Á., & García-Sánchez, M. (2014). Current Issues in Tourism.

Social network analysis in tourism. doi:10.1080/13683500.2014.990422

Caton, K., & Santos, C. (2008). Closing the hermeneutic circle? Photographic encounters

with the other. Annals of Tourism Research, 35(1), 7-26.

Page 86: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

86

Cavanzo, G., Pérez, M., & Villavisan, F. (2017). Medición de eficiencia de algoritmos de

visión artificial implementados en raspberry pi y ordenador personal mediante

python. Ingenium, 18(35), 105-119.

Chalfen, R. (1989). Snapshot Versions of Life. University of Wisconsin Press.

Chatzopolou, G., Sheng, C., & Faloutsos, M. (2010). A First Step Towards Understanding

Popularity in YouTube. NFOCOM IEEE Conference on Computer Communications

Workshop. doi:10.1109/INFCOMW.2010.5466701

Chrome Web Store. (2020). Downloader for Instagram - Descripción. Recuperado el 14 de

Marzo de 2020, de https://chrome.google.com/webstore/detail/downloader-for-

instagram/olkpikmlhoaojbbmmpejnimiglejmboe?hl=en

Ciaburro, G., & Venkateswaran, B. (2017). Neural Networks with R. Birmingham-Mumbai:

Packt Publishing.

Cross, S., Harrison, R., & Kennedy, R. (1995). Introduction to neural networks. The

Lancet, 346, 1075-1079.

Custodio, M. (2017). #Hashtag: ¿Qué significa y cómo utilizarlo de manera adecuada?

Recuperado el 27 de marzo de 2019, de https://www.rdstation.com/co/blog/hashtag-

significado-uso/

De, S., Maity, A., Goel, V., Shitole, S., & Bhattacharya, A. (2017). Predicting the

Popularity of Instagram Posts for a Lifestyle Magazine Using Deep Learning.

Recuperado de

https://www.researchgate.net/publication/319108587_Predicting_the_Popularity_of

_Instagram_Posts_for_a_Lifestyle_Magazine_Using_Deep_Learning

Dehghan, A., Ortiz, E., Shu, G., & Zain, S. (2017). DAGER: Deep Age, Gender and

Emotion Recognition Using Convolutional Neural Networks. Computer Vision and

Pattern Recognition.

Demsar, J., Curk, T., Erjavec, A., Gorup, C., Hocevar, T., Milutinovic, M., Mozina, M.,

Polajnar, M., Toplak, M., Staric, A., Stajdohar, M., Umek, L., Zagar, L., Zbontar, J.,

Zitnik, M. & Zupan, B. (2013). Orange: Data Mining Toolbox in Python. Journal of

Machine Learning, 2349-2353.

DeTienne, K., & DeTienne, D. (2017). Neural networks in strategic marketing: exploring

the possibilities. Journal of Strategic Marketing, 25(4), 289-300.

doi:10.1080/0965254X.2015.1076881

EcuRed. (2012). EcuRed. Recuperado el 27 de marzo de 2019, de

https://www.ecured.cu/Islas_Taquile

eDreams. (2019). eDreams Reveals New Study on the Insta-worthiness of Travel. Cision PR

Newswire. Recuperado de: https://www.prnewswire.com/news-releases/edreams-

reveals-new-study-on-the-insta-worthiness-of-travel-300829924.html

eMarketer. (2013). Social Networ Users Worldwide 2011 - 2017. Recuperado el 16 de

junio de 2019, de

https://i.pinimg.com/originals/57/1f/de/571fde7571b0cd30d3bb25c1ee1ba556.jpg?_

ga=2.222915417.318388950.1566224556-581713151.1565109707

Page 87: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

87

Escobar, C. (2019). Estadísticas de Instagram que debes conocer. Sproutsocial. Recuperado

de: https://sproutsocial.com/insights/estadisticas-de-instagram-para-marketeros/

Everypixel. (2020). Resultados de demo para Everypixel. Recuperado el 13 de Marzo de

2020, de https://www.everypixel.com/aesthetics

Everypixel. (2019). About - What's the feature? Recuperado el 10 de marzo de 2019, de

https://www.everypixel.com/about

EyeEm Vision. (2020). Recuperado el 11 de Marzo de 2020, de

https://www.eyeem.com/eyeem-vision

EyeEm Vision. (2019). Introducing EyeEm Vision. Recuperado el 15 de marzo de 2019, de

https://www.eyeem.com/blog/introducing-eyevision

Fahmy, S., Bock, M., & Wanta, W. (2014). Visual Communication Theory and Research,

A mass communication perspective. Nueva York, Estados Unidos: Palgrave

Macmillan. Recuperado el 23 de agosto de 2019, de

https://books.google.com.pe/books?id=PZqxAwAAQBAJ&printsec=frontcover&hl

=es&source=gbs_ge_summary_r&cad=0#v=onepage&q&f=false

Fakeye, P., & Crompton, J. (1991). Image Differences between Prospective, First-Time,

and Repeat Visitors to the Lower Rio Grande Valley. 16. Sage. Recuperado el 20 de

agosto de 2019, de

https://www.researchgate.net/publication/249700751_Image_Differences_Between

_Prospective_First-Time_and_Repeat_Visitors_to_the_Lower_Rio_Grande_Valley

Fontcuberta, J. (1997). El beso de Judas - Fotografía y verdad. En J. Fontcuberta.

Recuperado de https://es.calameo.com/read/0024478948667869f7687

Forrester. (2015). Instagram Is The King Of Social Engagement. Recuperado el 10 de junio

de 2019, de https://go.forrester.com/blogs/14-04-29-

instagram_is_the_king_of_social_engagement/

Forsyth, D., & Ponce, J. (2012). Computer Vision, a modern approach (segunda ed.).

Pearson. Recuperado de:

https://eclass.teicrete.gr/modules/document/file.php/TM152/Books/Computer%20V

ision%20-%20A%20Modern%20Approach%20-

%20D.%20Forsyth,%20J.%20Ponce.pdf

Garrod, B. (2008). Exploring place perception: a photo-based analysis. Annals of Tourism

Research, 35(2), 381-401.

Garrod, B. (2009). Understanding the relationship between tourism destination imagery and

tourist photography. Journal of Travel Research, 47(3), 346-358.

Google Trends. (2020a). Resultados para consulta acerca de Instagram. Recuperado de

https://trends.google.es/trends/?geo=ES

Google Trends. (2020b). Resultados para consulta Visión Artificial. Recuperado de

https://trends.google.es/trends/?geo=ES

Google Vision AI. (2020). Resultados demo. Recuperado el 12 de Marzo de 2020, de

https://cloud.google.com/vision/?&utm_source=google&utm_medium=cpc&utm_c

ampaign=latam-PE-all-es-dr-bkws-all-all-trial-b-dr-1008075-

Page 88: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

88

LUAC0009175&utm_content=text-ad-none-none-DEV_c-CRE_402089885181-

ADGP_BKWS+%7C+Multi+~+Machine+Learning+%7C+Cloud+Vision+API

Hanneman, R., Kposowa, A., & Riddle, M. (2013). Research Methods for the Social

Sciences: Basic Statistics for Social Research. Wiley.

Harrell, L. (2015). Regression Modeling Strategies (Segunda ed.). Springer.

Hassan, M., Negm, A., Zahran, M., & Saavedra, L. (2015). Assessment of Artificial Neural

Network for bathymetry estimation using High Resolution Satellite imagery in

Shallow Lakes: Case Study El Burullus Lake. Eighteenth International Water

Technology Conference, IWTC18. Sharm ElSheikh.

Haussmann, A., Toivonnen, T., Slotow, R., Tenkanen.H, Moilanen, A., Heikinheimo, V., &

Di Minin, E. (2017). Social Media Data Can Be Used to Understand Tourists‟

Preferences for Nature-Based Experiences in Protected Areas. Conservation Letters.

doi:10.1111/conl.12343

Heraldo. (2019). Instagram registra más de 70 millones de fotos diariamente. Zaragoza.

Recuperado de https://www.heraldo.es/noticias/sociedad/2015/09/22/instagram-

registra-mas-de-70-millones-de-fotos-diariamente-487574.html#

Hernández, R., Fernández, C., & Baptista, P. (2014). Metodología de la investigación.

(Sexta). Recuperado el 1 de abril de 2019

Hootsuite. (2019). Todos los datos y tendencias que necesitas para entender los

componentes en Internet, Redes Sociales, Móvil y Comercio Electrónico. España.

Recuperado el 20 de enero de 2019, de https://es.slideshare.net/t2omedia/digital-

2019-estudio-hootsuite

IBM. (2017). SPSS Modeler. Recuperado el 30 de Enero de 2020, de

https://www.ibm.com/pe-es/marketplace/spss-modeler

IBM. (2019). Watson Visual Recognition. Recuperado el 28 de mayo de 2019, de

Características de Watson Visual Recognition: https://www.ibm.com/pe-

es/cloud/watson-visual-recognition

IBM. (s.f.). IBM SPSS Neural Networks 21. Recuperado el Febrero de 2020, de

ftp://public.dhe.ibm.com/software/analytics/spss/documentation/statistics/21.0/es/cli

ent/Manuals/IBM_SPSS_Neural_Network.pdf

Instagram. (2020). Resultado para búsqueda Isla Taquile - Puno. Recuperado el 13 de

Marzo de 2020, de https://www.instagram.com/explore/locations/661454483/isla-

taquile-puno/

Internet World Stats. (2019). Internet Users in the World by Regions 2019. Recuperado el 3

de mayo de 2019, de

https://www.internetworldstats.com/stats.htm?_ga=2.136139127.717387088.15651

09707-581713151.1565109707

Kádár, B. (2014). Measuring tourist activities in cities using geotagged photography. An

International Journal of Tourism Space, Place and Environment, 16(1), 88-104.

doi:10.1080/14616688.2013.868029

Page 89: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

89

Kavuncuoglu, H., Kavuncuoglu, E., Karatas, S., Benli, B., Sagdic, O., & Yalcin, H. (2018).

Prediction of the antimicrobial activity of walnut (Juglans regia L.) kernel aqueous

extracts using artificial neural network and multiple linear regression. Journal of

microbiological methods, 148, 78-86.

Kim, J., Rasouli, S., & Timmermans, H. (2018). Social networks, social influence and

activity-travel behaviour: a review of models and empirical evidence. Transport

Reviews, 38(4), 499-523. doi:10.1080/01441647.2017.1351500

Kothari, C. (2004). Research Methodology, Methods and Techniques (Segunda ed.). New

Age International.

Krippendorff, K. (2004). Content analysis: An introduction to its methodology. Thousand

Oaks, California: Sage Publications.

Kuhn, M., & Johnson, K. (2013). Applied Predictive Modeling. New York: Springer.

doi:10.1007/978-1-4614-6849-3

Kutner, M., Nachtsheim, C., Neter, J., & Li, W. (2004). Applied Linear Statistical Models

(Quinta ed.). McGraw-Hill.

Loftus, J., & Taylor, J. (2014). A significance test for forward stepwise. Cornell University.

Recuperado el 2 de agosto de 2019, de https://arxiv.org/abs/1405.3920

Lonely Planet. (2016). Young travellers more likely to find holiday inspiration on social

media. Recuperado el 10 de febrero de 2020, de

https://www.lonelyplanet.com/articles/travellers-holiday-inspiration-social-media

MacKay, J., & Couldwell, C. (2004). Using visitor-employed photography to investigate

destination image. Journaol of Travel Research, 42(4), 390-396.

Malhotra, N. (2008). Investigación de mercados (Quinta ed.). México: Pearson Educación.

Recuperado el 19 de julio de 2019, de

https://www.academia.edu/11400390/Investigacion_de_Mercados_5ta_Edicion_-

_Naresh_K._Malhotra

Markwick. (2001). Postcards from Malta: image, consumption, contex. Annals of Tourism

Research, 28(2), 417-438.

Martorell, S. (2016). Las redes sociales como medio de promoción de la práctica artística.

20. Valencia, España. Recuperado el 22 de mayo de 2019, de

https://dialnet.unirioja.es/servlet/articulo?codigo=5901088

Megasari, N., & Wayan, I. (2015). Beyond User Gaze: How Instagram Creates Tourism

Destination Brand? Recuperado el 27 de julio de 2019, de

https://www.sciencedirect.com/science/article/pii/S1877042815054853

MINCETUR. (2015). Memorial de Turismo Rural Comunitario en el Perú. Recuperado el

10 de junio de 2019, de http://media.peru.info/koha/Memorial-Turismo-Rural-

Comunitario-en-el-Peru.pdf

MINCETUR. (2017). Sistema de Información Georeferencial de MINCETUR . Recursos

Turísticos. Recuperado el 22 de mayo de 2019, de

http://ficha.sigmincetur.mincetur.gob.pe/index.aspx?cod_Ficha=959

Page 90: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

90

MINCETUR. (2020). Reportes Estadísticos de Turismo. Recuperado el 10 de Marzo de

2020, de https://www.mincetur.gob.pe/turismo/reportes-estadisticos-de-turismo/

Mitchell, M. (2020). Selecting the Correct Predictive Modeling Technique. Recuperado el

15 de Marzo de 2020, de Towards Data Science:

https://towardsdatascience.com/selecting-the-correct-predictive-modeling-

technique-ba459c370d59

Molen, A., & Wilson, H. (2010). Engagement, telepresence and interactivity in online

consumer experience: Reconciling scholastic and managerial perspectives.

Recuperado el 22 de mayo de 2019, de

https://www.sciencedirect.com/science/article/abs/pii/S0148296309002100?via%3

Dihub

Molero, R., & Milano, C. (2019). De dos orillas: imagen y experiencia en el turismo. Pasos

edita. Recuperado el 19 de mayo de 2019, de

http://www.pasosonline.org/Publicados/pasosoedita/PSEdita23.pdf

Montgomery, D., Peck, E., & Vining, G. (2012). Introduction to Linear Regression (Quinta

ed.). Wiley.

Nazari, A., Hajiallahyari, H., Rahimi, A., Khanmohammadi, H., & Amini, A. (2019).

Prediction compressive strength of Portland cement-based geopolymers by artificial

neural networks. En Neural Computing and Applications. doi:DOI 10.1007/s00521-

012-1082-3

Ngobo. (2011). La imagen de un destino turístico como herramienta de marketing. En O.

Femenía, La imagen de un destino turístico como herramienta de marketing (pág.

38). Recuperado el 20 de agosto de 2019, de

https://dialnet.unirioja.es/servlet/libro?codigo=482050

Nuñez, V. (2017). Fórmula para calcular engagement en redes sociales y CTR. Recuperado

el 15 de marzo de 2019, de https://vilmanunez.com/formula-engagement-redes-

sociales-ctr/

Oldon, D., & Wu, D. (2020). Predictive Data Mining Models (Segunda ed.). New York:

Springer.

Ordenes, F., & Zhang, S. (2019). From words to pixels: text and image mining methods for

service research. Journal of Service Management. doi:10.1108/JOSM-08-2019-

0254

Origami Logic. (2016). The Marketers Guide To Measuring Social Engagement.

Recuperado de http://docplayer.net/14260996-The-marketers-guide-to-measuring-

social-engagement.html

Osborne, J., & Waters, E. (2002). Four Assumptions of Multiple Regression That

Researchers Should Always Test. Practical Assessment, Research and Evaluation,

8(8). doi:10.7275/r222-hv23

Otzen, T., & Manterola, C. (2017). Técnicas de Muestreo sobre una Población a Estudio.

International journal of morphology, 35(1), 227-232.

Page 91: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

91

Pechmann, C., & Knight, S. (2002). An experimental investigation of the joint effects of

advertising and peers on adolescents‟ beliefs and intentions about cigarette

consumption. Journal of Consumer Research, 29, 5-19.

Pérez, M., & De Paz, Y. (2007). Cuadernos de Estadística - Aplicación de las Redes

Neuronales artificiales a la regresión (Vol. 35). Madrid: La Muralla.

Perezbolde, G. (2010). Engagement... El término del que todos hablan, pero pocos

entienden. Recuperado el 15 de junio de 2019, de

https://www.merca20.com/engagement-el-termino-del-que-todos-hablan-pero-

pocos-entienden/

PROMPERÚ. (2018). Perfil del Turista Extranjero 2018: Turismo In. Recuperado de:

https://www.promperu.gob.pe/TurismoIN/sitio/PerfTuristaExt

PROMPERÚ. (s.f.). El Lago Titicaca. Recuperado de https://www.peru.travel/es-es/que-

hacer/naturaleza/lagos-lagunas-cataratas-y-rios/lago-titicaca.aspx

PROMPERÚ. (2018). Perfil del Turista Extranjero que visita Puno - 2018: Turismo In.

Recuperado de:

https://www.promperu.gob.pe/TurismoIN/sitio/VisorDocumentos?titulo=Lugar%20

visitado%20-

%20Puno&url=~/Uploads/perfiles_extranjeros/41/tips/2615/PTE18Puno.pdf&nomb

Objeto=PerfTuristaExt&back=/TurismoIN/sitio/PerfTuristaExt&peso=98417

PROMPERÚ. (s.f.). Y tú qué planes. Recuperado de

https://www.ytuqueplanes.com/destinos/puno/215_isla-de-taquile

Quintly. (2018). The 2018 Instagram Study. Recuperado el 10 de junio de 2019, de

https://info.quintly.com/instagram-study/view

Rodríguez, V. (2016). Marcas de moda en las redes sociales : el poder de Instagram para

generar engagement dentro de la comunidad. Barcelona, España. Recuperado el 15

de abril de 2019, de https://ddd.uab.cat/record/170114

Ruiz, G., & Calero, O. (2019). Relación entre los elementos de la discriminación digital y

el precio de alquiler por noche asignado a habitaciones privadas en Airbnb en

Lima Moderna. Universidad San Ignacio de Loyola, Facultad de Ciencias

Empresariales. Recuperado de http://repositorio.usil.edu.pe/handle/USIL/9014

Salem, V. (2012). Amixer está en Facebook, una investigación sobre la choledad virtual.

Tesis de maestría, Pontificia Universidad Católica del Perú, Lima. Recuperado de

http://tesis.pucp.edu.pe/repositorio/bitstream/handle/123456789/4643/SALEM_VE

RONICA_AMIXER.pdf?sequence=1

Salinas, A. (11 de agosto de 2017). Historia, servicios y características de la red social

Instagram. Recuperado el 29 de mayo de 2019, de

https://mott.marketing/informacion-sobre-la-historia-servicios-caracteristicas-de-la-

red-social-instagram/

Sánchez, H., & Reyes, C. (2015). Metodología y Diseños en la Investigación Científica

(Quinta ed.). Lima: Business Suport.

Page 92: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

92

Sarle, W. (1994). Neural networks and statistical models. Proceedings of the 19th Annual

SAS Group conference, Cary, NC. pp. 1.538-1.550.

Schofield, P. (2017). Two fifths of millennials choose their holiday destination based on

how „Instagrammable‟ the holiday pics will be. Schofields Insurance. Recuperado

de https://www.schofields.ltd.uk/blog/5123/two-fifths-of-millennials-choose-their-

holiday-destination-based-on-how-instagrammable-the-holiday-pics-will-be/

Shukla, V., & Vala, J. (2016). A Survey on Image Mining, its Techniques and Application.

International Journal of Computer Applications, 133(9), 12-15.

Smith, S. (2018). Instagram abroad: performance, consumption and colonial narrative in.

Postcolonial Studies, 21(2), 172-191. Recuperado el 20 de mayo de 2019, de

http://hub.hku.hk/bitstream/10722/263767/1/Content.pdf

Solomon, C., & Breckon, T. (2011). Fundamental of Digital Image Process. Oxford:

Willey-Blackwell.

Stepchenkova, S., & Zhan, F. (2012). Visual destination images of Peru: Comparative

content analysis of DMO and user-generated photography. 36. Recuperado el 23 de

agosto de 2019, de

https://www.sciencedirect.com/science/article/abs/pii/S0261517712001422

Stern, H. (1996). Neural networks in applied statistics. Technometrics, 38, 205-214.

Stokman, H. (2014). The Future of Smart Photography. IEEE MultiMedia, 21(3), 66-71.

Strinati, D. (1995). An introduction to theories of popuar culture. London: Routledge.

Szelizki, R. (2010). Computer Vision: Algorithms and Applications. Recuperado de:

http://szeliski.org/Book/drafts/SzeliskiBook_20100903_draft.pdf

Taylor, M. (2017). Make Your Own Neural Network: An In-depth Visual Introduction For

Beginners .

Thommes, K., & Hubner, R. (2018). Instagram Likes for Architectural Photos Can Be

Predicted by Quantitative Balance Measures and Curvature. Recuperado el 19 de

mayo de 2019, de

https://www.frontiersin.org/articles/10.3389/fpsyg.2018.01050/full

Toivonen, T., Heikinheimo, V., Fink, C., Hausmann, A., Hiipala, T., Jarv, O., Tenkanen,

H., & Di Minin E., (2019). Social media data for conservation science: A

methodological overview. Biological Conservation, 233, 298-315. Recuperado el 2

de junio de 2019, de

https://www.sciencedirect.com/science/article/pii/S0006320718317609

UNESCO. (s.f.). El arte textil de Taquile. Recuperado el 17 de mayo de 2019, de Inscrito

en 2008 en la Lista Representativa del Patrimonio Cultural Inmaterial de la

Humanidad (originalmente proclamado en 2005): https://ich.unesco.org/es/RL/el-

arte-textil-de-taquile-00166

Urry, J. (1990). The tourist gaze. London: Sage Publications.

Vignisdóttir, A. (2016). CUSTOMER ENGAGEMENT ON INSTAGRAM BRAND PAGES

IN THE MAKE-UP COSMETICS INDUSTRY. Recuperado el 12 de Junio de 2018,

de

Page 93: MODELAMIENTO PREDICTIVO DEL ENGAGEMENT DE ...repositorio.usil.edu.pe/bitstream/USIL/10281/1/2020...redes sociales más usadas están Facebook, Instagram y YouTube (Hootsuite, 2019),

93

https://skemman.is/bitstream/1946/26717/1/MAR0117_Thesis_Annika_Vignisdottir

_Customer%20Engagement%20on%20Instagram%20Brand%20Pages%20In%20th

e%20Make-up%20Cosmetics%20Industry.pdf

Wendler, T., & Gröttrup, S. (2016). Data Mining with SPSS Modeler, Theory, Exercises

and Solutions. Berlin: Springer.

Yang, X. (2019). Introduction to Algorithms for Data Mining and Machine Learning.

Academic Press.

Zhang, D. (2019). Fundamentals of Image Data Mining: Analysis, Features, Classification

and Retrieval. Springer.

Zohourian, A., Sajedi, H., & Yavary, A. (2018). Popularity prediction of images and videos

on Instagram. 2018 4th International Conference on Web Research (ICWR), (págs.

111-117). Tehran.