Introducción a la Visualización de datos y el uso de ...
Transcript of Introducción a la Visualización de datos y el uso de ...
Introducción a la
Visualización de datos y
el uso de Tableau Public
Yusnelkis Milanes Guisado. PhD
Analista de datos y asesor en Unidad de
Estadística. Hospital Virgen del Rocío /
Instituto de Biomedicina de Sevilla. España.
Email: [email protected]
Webinar
• Visualización de datos: influencias, conceptos, procesos, tipos
• ¿ Cómo alcanzar una visualización efectiva ?
• Tips para mejorar tus gráficos
• Herramientas para la visualización de datos
• Tableau Public
• Conectando a las fuentes de datos
• Comprobar calidad y estructura de los datos
• Crear visualizaciones simples
• Creando un Dashasboard (DB). Caso práctico.
Agenda
✓ Le podemos dar forma, contexto,
para innovar, transformarlos en
información y conocimiento, en
decisiones, que generan un impacto
a diferentes niveles
✓ Los datos son sólo un medio para
plasmar la realidad . Siempre se usan
como sustitutos de algo.
✓ Para comprender los datos, debemos
mirar a través de ellos, darles valor.
Porqué La Visualización ?
Comunicación efectiva a través de la Visualización
Porqué La Visualización ?
Grupo de pacientes: Discordantes
✓ Dificultad para detectar
relaciones
✓ Dificultad para comparar,
extraer diferencias…Grupo de pacientes: Sanos
Working paper. HIV Research group. Virgen del Rocio Hospital.
Comunicación efectiva a través de la Visualización
Porqué La Visualización ?
Discordantes
✓ Facilidad para detectar patrones (Relaciones positivas y negativas, color y orientación)
✓ Comparación entre grupos (Más relaciones negativas en Sanos, etc)
Sanos
Working paper. HIV Research group. Virgen del Rociío Hospital.
La visualización ataca nuestros sentidos, los que utilizan la “Working memory”.
El cerebro humano sólo puede retener y almacenar entre 5 y 8 números, elementos …
Somos buenos comparando alturas, distancias..
“Working Memory”
Porqué La Visualización ?
Pensar es lento vs La vista es más rápida
Cortesa Visual (Vista)
Cortesa Cerebral (Pensar)
Porqué La Visualización ?
EL ojo es sensible a los patrones de variacionesde los colores, las formas, las distancias, etc.
La visualización utiliza primero los ojos, luego surgen los conceptos.
¿ Cómo ocurre esto ?
…Si se combina ese lenguaje visual con el lenguaje de la mente, que se
resume en conceptos, palabras , números, se empieza a hablar dos idiomas
simultáneamente, uno mejorando incluso al otro (David McCandless)
Porqué La Visualización ?
• Un resumen estadístico puede no contemplar tendencias importantes enun dataset.
• Puede preservar la complejidad, o presentar las multiples miradas de un dataset.
• Puede funcionar como una importanteprimera etapa de investigación en una nueva área de estudio
Porqué La Visualización ?
APRNOV
APR APRNOV APR
NOVNOV APR NOV
APR NOVAPR NOV
APR NOVAPR
NOVAPR NOV
Porqué La Visualización ?
Mountains Out of MolehillsA timeline of global media scare stories
Snake oilThe evidence fornutricional complements
https://www.informationisbeautiful.net/visualizations/snake-oil-scientific-evidence-for-nutritional-supplements-vizsweet/
Porqué La Visualización ?
• Exploración de los datos
• Se busca entender los datos
• Detectar patrones y relaciones
. Uno es el productor y consumidor de
las visualizaciones
• Comunicar los resultados
• Ayudar a otros a entender el mensaje
• Produces las visualizaciones para una
audiencia
Analíticas o exploratorias Presentar o explanatorias
Tipos de Visualización
Tipos de Visualización
Exploración de los datos (EDA)
• Exploracion de los datos. (E.D.A. exploratory data analysis, J.Tukey)
El objetivo de este analisis exploratorio es:
a) Buscar posibles relaciones de la variable respuesta/dependiente con la(s) variable(s) explicativa(s);
b) Considerar la necesidad de aplicar transformaciones de las variables;
c) Eliminar variables explicativas que esten altamente correlacionadas.
Tipos de Visualización
ESTÁTICAS
• Nos ayudan a detectar patrones
• Visualizar outliers
• Útil en formatos físicos
(periódicos)
• Publicaciones científicas
• Explorar datos
• No formato físico
• Nos permiten jugar con los datos
• Facilitan el análisis propio
• Permiten personalizar la información y
la búsqueda de conocimiento
DINÁMICAS / INTERACTIVAS
Tipos de Visualización
https://www.omnisci.com/demos/tweetmap
https://covid19.who.int/?gclid=Cj0KCQjwtsv7BRCmARIsANu-CQfqRn1hWBm8zYRHg5_-LTw5dLnB5yFWBwFVKVRPPVjETDQFCPpiBUYaAgImEALw_wcB
DINÁMICAS / INTERACTIVAS
Tipos de Visualización
¿ Cómo alcanzar una visualización efectiva ?
• Tips para conseguirla?
• “bonita” o funcional?
• Es el color importante ?
• Influencias científicas y/o psicológicas?
¿ Cómo alcanzar una visualización efectiva ?
https://www.nabler.com/articles/the-data-visualization-manual-that-you-will-want-to-bookmark/
Pueden ver un perro ?
Formar patrones complejos a partir de reglas simples…
Percepción visual y principios de Gestalt
Psicología Gestalt (Berlin, años 20)
Gestalt: Significa en alemán forma, patrón, figura o estructura unificada
Grupo de leyes que incluyen en como percibimos o intuimos patrones y
conclusiones significativas de aquello que vemos
Permite:
• Mejor comprensión de la percepción humana
• Obtener mejores visualizaciones
• Acelerar el desarollo eliminando ensayo /error
¿ Cómo alcanzar una visualización efectiva ?
¿ Cómo alcanzar una visualización efectiva ?
• Ley de la Proximidad*
• Ley de Similaridad*
• Ley de clausura*
• Ley de la Simetría*
• Ley de la misma dirección
• Ley de la inclusividad o figura de
fondo*
• Ley de la continuidad*
• Ley de un buen Gestalt
• Experiencia pasada(Correspondencia isomórfica)
• Continuidad uniforme
• Regiones comunes
Psicología Gestalt (Berlin, años 20)
¿ Cómo alcanzar una visualización efectiva ?
Psicología Gestalt (Berlin, años 20)
• La ley de la figura-fondo: no podemos percibir una misma forma como
figura y a la vez como fondo de esa figura. El fondo es todo lo que no se
percibe como figura.
• Ley de la continuidad: si varios elementos parecen estar colocados
formando un flujo orientado hacia alguna parte, se percibirán como un
todo.
• Ley de la simplicidad: nuestra mente percibe todo en su forma más
simple
• Ley de la proximidad: los elementos próximos entre sí tienden a
percibirse como si formaran parte de una unidad.
¿ Cómo alcanzar una visualización efectiva ?
Psicología Gestalt (Berlin, años 20)
• Ley de la similitud: los elementos parecidos son percibidos como si
tuvieran la misma forma. Muy afectado por el color.
• La ley de cierre: una forma se percibe mejor cuanto más cerrado está su
contorno.
• Ley de la simetría: los elementos simétricos se perciben como parte del
mismo grupo
• Ley de la región común: varios elementos que forman parte de una sola
región, los asociamos como un solo grupo.
• Ley de la conectividad: Elementos que estan visualmente conectados,
son percebidos más relacionados entre ellos., que los no conectados.
¿ Cómo alcanzar una visualización efectiva ?
Pragnanz _ La simplicidad es la clave
European Commission. 2017. 15TH JRC TRAINING ON COMPOSITE INDICATORS AND ANNUAL MEETING OF COP ON INDICES & SCOREBOARDS.
¿ Cómo alcanzar una visualización efectiva ?
Algunos tips para mejorar los gráficos
• Comienza con tu mensaje en mente. Cuál es tu mensaje?
• Intentar gráficos auto-explicativos
• Prepara bien los datos. Tipos de datos
• Facilita la lectura. Destaca lo importante
• Importancia del color
• La forma y el orden, según tipo de dato
• Agrega etiquetas estratégicas
• Cortar o no cortar el eje Y ? Controversias.
• No forzar las escalas…
Tips para mejorar los gráficos
Ten claro el mensaje. ¿Qué quieres trasmitir ?
• Rigurosidad vs Belleza ( o ambos)
• Audiencia
• Autoexplicativos
• Ideal = Algo bello + Algo que comunique
• Escribe el mensaje principal
• Un subtítulo puede agregar claridad
Tips para mejorar los gráficos
Ten claro el mensaje. ¿Qué quieres trasmitir ?
✓ No comunica. No es auto-explicativo.
✓ Probablemente una tabla bien
elaborada trasmitiera mejor el
mensaje…
• Es una serie temporal ? Una jerarquía?
• Cuántas dimensiones tengo , cuáles son
las más importantes ?
• Tipos de datos: Categóricas, Numéricas,
Ordinales, Ranking, Discretas.
• Siguen una distribución lineal o no –
lineal ?
• Son correctos ? Outliers ? Valores
ausentes ?
Conoce tus datos, asegura su calidad.
• Debe satisfacer tus objetivos
• Útil para la audiciencia
• Debe estar estructurada
adecuadamente
• Libre de ruido
Tips para mejorar los gráficos
Relevancia de las formas.
Tips para mejorar los gráficos
✓ En función de mis datos y mis
objetivos, cuál tipo de gráfico es más
adecuado ?
Relevancia de las formas.
Tips para mejorar los gráficos
https://medium.economist.com/mistakes-weve-drawn-a-few-8cdd8a42d368
Views on Brexit almost as erratic as its negotiations
✓ Escoger el método adecuado…
Relevancia de las formas.
Tips para mejorar los gráficos
✓ Evite 3D✓ Evite gráficos de pastel
(Especialmente en 3D)
EL ojo humano es malo leyendo
ángulos.
Importancia del color.
Tips para mejorar los gráficos
• Use el color con moderación
• El gris es tu amigo
• Elementos realcionados tienen
colores relacionados
• Evitar:
• Fusionar rojo y gris (Se usa para daltónicos)
• Estereotipos (Rosa-Mujer, Azul_Niño)
Importancia del color.
Tips para mejorar los gráficos
• Limite el uso de muchos colores, a no ser q sea
necesario.
• Legibilidad: Suficiente contraste entre fondo y
figura
• Uso estratégico del color para destacar mensajes
• Mantener colores culturales en mente (Ej:
Semáforo)
Importancia del color.
Tips para mejorar los gráficos
Herramientas para La selección del color y sus relaciones
http://colorbrewer2.org/#type=diverging&scheme=RdBu&n=5
El orden importa.
Tips para mejorar los gráficos
• Ordena visualmente
• Cuidado con los datostemporales,
Un gráfico ordenado es más fácil de leer .
Agrega etiquetas
Tips para mejorar los gráficos
Hospitalizaciones Incremento Anual. Variaciones temporales (n = 75 000
hospitalizaciones )
De la Torre et al. 2019. Diagnósticos al ingreso en población VIH en Andalucía. Análisis evolutivo a lo largo de los últimos 25 años. Congreso SAEI. Sevilla.
Cortar o no cortar (El eje Y) ? Controversias
Tips para mejorar los gráficos
En los de barra:
• Intentar, no cortar el eje Y (El ojo humanotiende a comparar alturas…)
• Dan sensación de una mayor diferencias, que en realidad no es …
• Proporciones distorcionadas…
• Si interesa mostrar pequeñas diferencias, utilizar otra estrategia
Gráfico de línea:
No hay consenso. “In general, in a time-series, use a baseline that shows the data not the zero point” - Edward Tufte
No forzar las escalas…
Tips para mejorar los gráficos
https://medium.economist.com/mistakes-weve-drawn-a-few-8cdd8a42d368
Forzar las escalas puede llevarnos ainterpretaciones incorrectas.
Una correlacion muy fuere? No realmente.
TABLEAU PUBLIC
✓ FREE
✓ CREA BONITAS
VISUALIZACIONES
✓ FORMATO DE DATOS (FICHEROS
CSV, EXCEL, TEXT)
✓ GUARDAR ONLINE
✓ 15 MILLONES REGISTROS DE
DATOS
TABLEAU COMERCIAL
✓ PAGO (LICENCIAS FREE PARA
DOCENTES ?)
✓ CREA BONITAS VISUALIZACIONES
✓ TODO TIPO DE FICHEROS DE DATOS
✓ GUARDAR LOCAL
✓ REGISTROS DE DATOS ILIMITADOS
Versiones
✓ ACCESIBLE Y COMPLETO
✓ FLEXIBLE
✓ INTUITIVO
✓ RAPIDO Y PROTOTIPOS ROBUSTOS
✓ IMPORTAR Y LIMPIEZA DE DATOS (PRE TABLEAU)
✓ ANÁLISIS Y VISUALIZACIÓN DE DATOS
✓ PESENTAR HALLAZGOS
Tableau Public
Plataforma de aprendizaje en línea
https://www.tableau.com/es-es/learn/training/20203
Plataforma de aprendizaje en línea
Author: Thi Ho. Originally published on: Tableau Public
Seguimiento de pandemias Inteligencia competitiva
CASO: RENDIMIENTO CIENTÍFICO POR PAISES_ VIH/SIDA. DATOS INCITES.
Conectando con las fuentes de datos
✓ Tipo de variables (Numéricas, Nominales, Fecha)
✓ Datos correctos (Nombres , valores, tipos )
✓ Estructura de datos alineada con los objetivos del análisis (Ej: Si los cuartiles de la revista vienen como columnas separadas, y quiero tenerla en una única variable).
✓ Establecer relaciones con otra tablas de datos vinculadas por un Id en común.
✓ Crear campos nuevos (Tablas dinámicas, pivotar)
Comprobar…
Asegurar la calidad de los datos
✓ Seleccionamos las columnas que quiero agrupar para construir una sola variable..
✓ Ejemplo: Quartil de la revista (Q1, Q2, Q3, Q4) y el valor asociado
✓ También podría ser, por ejemplo, que los años estén distribuidos en variables separadas y quiera agruparlos en una sola
Transformar los datos
✓ Cambiamos los nombres de la variable categórica formada (Cuartil de la revista) , y la medida asociada (Número de trabajos por cuartil de la revista)
Transformar los datos
• Representan los campos que contienen información cualtitativa ocategórica (Ejemplo: País, Tipo documental, Quartil de la revista,etc).
• Suelen ser en Tableau los campos de tipo discreto (AZUL).• Sirven para segmentar, agrupar los datos (Ejemplo N.Doc
publicados por países)
• Representa un campo que contiene información de tipocuantitativa. (Ejemplo: Número de documentos publicados;Número de citas; % de documentos en colaboración).
•
• En Tableau suelen ser campos de tipo Continuo (VERDE).
DIMENSIONES
MEDIDAS
Términos importantes en Tableau
Med
idas
Dim
ensi
on
es
Marcas (Color, forma, Tamaño, etc)
Columnas y filas
Filtros
Interfaz Tableau _Visualizaciones
Cambiar tipo de gráfico
Dimensiones y medidas por tipo de gráfico
activado
Tableau es intuitivo, solo se activan los tipos de visualizaciones que los
datos en el panel permiten
Interfaz Tableau _Visualizaciones
Guardar t recuperar libro de trabajo
Ir a la web El libro de trabajo se puede
descargar en varios formatos
Referencias útiles
• Evergreen, S. D. H. (2017). Effective data visualization: The right chart for the right data.
• Tufte, E. R. (1985). The visual display of quantitative information. Cheshire, Conn: Graphics Press.
• Real Chart Rules to Follow: http://bit.ly/1MhsGNv• Ten Simple Rules for Better Figures: http://bit.ly/1cH1Pfh• When Pie Charts are Okay (Seriously): http://annkemery.com/pie-chart-
guidelines/• Data Visualization: Chart Dos and Don'ts.
https://guides.library.duke.edu/datavis/topten• The Science of Data Visualization.
https://www.youtube.com/watch?v=l7cAdp0f4X0
• www.vpascual.org. Blog personal de Victor Pascual.
• Pascual, V. Introducción a la visualización de datos. Curso. Domestika.
http://www.sirislab.com/tools/: Repositorio de visualizaciones enfocadas a analizar rankings de universidades y la ciencia en general.
•www.flowingdata.com: Principal blog en Visualización de Datos. Bueno para inspiraciones selección de tipos de gráficos, tutoriales, etc.
•www.d3js.org: La página principal de la librería D3.js, una librería de programación de Visualización de Datos. Contiene una grandísima variedad de ejemplos y visualizaciones.
• Leho, S. Mistakes, we’ve drawn a few. Learning from our erros in data visualization. https://medium.economist.com/mistakes-weve-drawn-a-few-8cdd8a42d368
• A collection of dataviz caveats by data-to-viz.com. https://www.data-to-viz.com/caveats.html
• Tableau Dashboard Cookbook. Over 40 recipes on designing professional dashboards by implementing data visualization principles. 2014. URL [http://1.droppdf.com/files/RiJNe/packt-publishing-tableau-dashboard-cookbook-2014.pdf
Referencias útiles
• The Visual Display of Quantitative Information, Eduard Tufte
•Design for Information, Isabel Meirelles
•Now You See It, Stephen Few
•El Arte funcional, Alberto Cairo (castellano)
• Giorgia Lupi. Dear Data.
Referencias útiles / Libros de referencia