Donostia - San SebastiánWikidata Editathon
#dssenwikidata
Evento organizado por investigadores de Universität Koblenz-LandauUniversidad del País Vasco / Euskal Herriko UnibertsitateaUniversidad de Zaragoza
Con la colaboración de Wikimedia España
Wikimedia Deutschland
Con la Colaboración deWikimedia
Introducción a WikidataCristina Sarasua
WeST, Universität Koblenz-Landau
¿Qué es Wikidata?
Sitio Web: goo.gl/KxbLtE
https://www.wikidata.org/
conocimientohumano
conocimientohumano
colaboraciónvoluntaria
datosestructurados
conocimientohumano
colaboraciónvoluntaria
libre
conocimientohumano
colaboraciónvoluntaria
libredatos
estructurados
wikidata:Q10313
● Semantic MediaWiki (2005)
Origen de Wikidata
● +33Millones artículos
● +1.5Billones ediciones
● +49Millones usuarios
● +2Milllones imágenes
● 285 idiomas
(datos julio 2015)+donaciones (2012)
Imaginad una aplicación que consulta la información
de Wikipedia
Donostia-San Sebastián (DSS) https://es.wikipedia.org/wiki/San_Sebasti%C3%A1n
Wikipedia -> Editar DSS
Wikipedia -> Editar DSS
Es difícil de reutilizar contenido textual
Wikipedia DSS ficha ES
Wikipedia DSS ficha EU
Wikipedia DSS ficha DE
Falta consistenciaDiferente cobertura de info en distintos idiomas
Visualización de datos por idiomas
Presentada por Markus Krötzsch en SWIB2014 y creada por Denny Vrandečić
http://swib.org/swib14/slides/kroetzsch_swib14_53.pdf
CONSULTA:
¿Cuál es el nombre de pila del alcalde de la ciudad de San Sebastián?
Datos estructurados
San SebastiánQ10313
Q12256843
@es
P6
P1705
Eneko
P735
P1705 etiqueta; P31 instancia de; P6 jefe de gobierno; P735 nombre
Q515P31
CONSULTA:
¿Cuál es el nombre de pila del alcalde de la ciudad de San Sebastián?
Datos estructurados
San SebastiánQ10313
Q12256843
@es
P6
P1705
Eneko
P735
P1705 etiqueta; P31 instancia de; P6 jefe de gobierno; P735 nombre
Q515P31
CONSULTA:
¿Cuál es el nombre de pila del alcalde de la ciudad de San Sebastián?
Datos estructurados
San SebastiánQ10313
Q12256843
@es
P6
P1705
Eneko
P735
P1705 etiqueta; P31 instancia de; P6 jefe de gobierno; P735 nombre
Q515P31
CONSULTA:
¿Cuál es el nombre de pila del alcalde de la ciudad de San Sebastián?
Datos estructurados
San SebastiánQ10313
Q12256843
@es
P6
P1705
Eneko
P735
P1705 etiqueta; P31 instancia de; P6 jefe de gobierno; P735 nombre
Q515P31
CONSULTA:
¿Cuál es el nombre de pila del alcalde de la ciudad de San Sebastián?
Datos estructurados
San SebastiánQ10313
Q12256843
@es
P6
P1705
Eneko
P735
P1705 etiqueta; P31 instancia de; P6 jefe de gobierno; P735 nombre
Q515P31CONSULTA:
¿Cuál es el edad media en la que escritores donostiarras publican su primer libro?
● +14Millones elementos● +225Millones ediciones● +15.000 usuarios activos● idiomas de Wikipedia
Estadísticas de Wikidata
Procedencia de las ediciones
Ver [Steiner,2014] para comparación Bots vs Wikidatans
Botsedición automática
política de botsenlaces interwiki, etiquetas, descripciones, declaraciones, fuentes, items
Usuariosedición manuallibertad
>>>
proyecto WIKIdata
http://stats.wikimedia.org/wikispecial/EN/TablesWikipediaWIKIDATA.htm#editor_activity_levels
● Información editada, revisada por usuarios humanos
● Herramientas que ayudan a la comprobación automática
Calidad de los datos
Wikidata Quality Team
fuente: http://blog.wikimedia.de/2015/03/13/improving-data-quality-on-wikidata-checking-what-we-have/
● Información editada, revisada por usuarios humanos
● Herramientas que ayudan a la comprobación automática
Calidad de los datos
Wikidata Quality Team
fuente: http://blog.wikimedia.de/2015/03/13/improving-data-quality-on-wikidata-checking-what-we-have/
Fuentes de referencia para los datos
https://tools.wmflabs.org/wikidata-todo/stats.php
● P214: identificador de VIAF● P1566: identificador de GeoNames● P727: identificador de Europeana
Integración de datos
Q64
122530980
P214(Berlin)
Integración de datos (II)
"Linking Open Data cloud diagram 2014, by Max Schmachtenberg, Christian Bizer, Anja Jentzsch and Richard Cyganiak. http://lod-cloud.net/"
Existen otros esfuerzos por publicar datos abiertos e integrarlos: Linked Open Data
http://dbpedia.org/page/San_Sebasti%C3%A1n
● Wikidata y DBpedia son proyectos diferentes con cosas en común [Krötzsch, 2014]○ Wikipedia
■ los dos tienen relación con Wikipedia○ Identificadores
■ los dos utilizan URIs○ Idiomas
■ Wikidata repositorio de datos multi-idioma■ DBpedia repositorios separados (chapters) por idioma
○ Creación de datos■ Wikidata edición manual ■ DBpedia extracción automática → problemas de calidad
● Wikidata integrada con datos de LOD, RDF dump, consulta SPARQL
● Integración DBpedia - Wikidata
Integración de datos (III)
https://meta.wikimedia.org/wiki/Wikidata/Notes/DBpedia_and_Wikidata
● Base de conocimiento colaborativa● Google compra Freebase a Metaweb● Folksonomía● Principalmente inglés● Diferencias de implementación y comunidad
Freebase
Freebase
Transferencia de Freebase a Wikidata
fuente:https://plus.google.com/109936836907132434202/posts/bu3z2wVqcQc
Transferencia de Freebase a Wikidata
fuente:https://plus.google.com/109936836907132434202/posts/bu3z2wVqcQc
HOY, 14:00 Thomas Steiner
(Google, Inc.)
Gestión de Wikidata
Sitio Web: goo.gl/KxbLtE
Herramientas de apoyo a la edición
Ver: https://tools.wmflabs.org/wikidata-todo/tour.html#slide=0
wiki
usuario Wikidata
L E L
UI amigable Wikidata Game
L E
list generatorL E
navegador clases y propiedades L E
L
mapas
Herramientas de apoyo a la edición
Ver: https://tools.wmflabs.org/wikidata-todo/tour.html#slide=0
wiki
usuario Wikidata
L E L
UI amigable Wikidata Game
L E
list generatorL E
navegador clases y propiedades L E
L
mapas
Acceso y reutilización
Ver: https://www.wikidata.org/wiki/Wikidata:Data_access
Query APIs- MediaWiki API- Wikidata Query
Dereferencable URIs- MediaWiki API- Interfaz Linked
Data
SW Query- RDF dump- SPARQL
endpoints- LDF
L
LL
Comunidad de Wikidata
usuariosanónimos
usuariosregistrados
usuariosregistradosburócratas
usuariosregistradosadministradores
usuariosregistradosadministradores de traducción
Comunicación entre usuarios
Wikidata Café (Wiki)https://www.wikidata.org/wiki/Wikidata:Café
Listas de correo de Wikidatahttps://lists.wikimedia.org/mailman/listinfo/Wikidata-l
Páginas de discusión de usuarios, propiedades ...https://www.wikidata.org/wiki/User_talk:username
IRChttp://webchat.freenode.net/?channels=#wikidata
Eventos (hackathons, conferencias, talleres)https://www.wikidata.org/wiki/Wikidata:Events
Potencial de Wikidata
Editar para ...apoyar el
#FreeKnowledge
Mejorar la gestión de Wikipedia
https://en.wikipedia.org/wiki/Category:Templates_using_data_from_Wikidata
Wikidata, como repositorio de datos de Wikipedia
Periodismo de datos
screenshot of Goole Charts: https://developers.google.com/chart/interactive/docs/gallery?hl=esData Journalism Handbook http://interactivos.lanacion.com.ar/manual-data/index.html
análisis e interpretación de datosinfografías
Open Science, Integración de datosCiencia ciudadana y ciencia profesional
Proyecto “Wikidata for research”
https://www.wikidata.org/wiki/Wikidata:WikiProject_Wikidata_for_research
Web Science
Entender procesos colaborativos
autor: Steffen Staab
●
Apoyo a sistemas: OQA
http://blog.wikimedia.de/2015/02/23/platypus-a-speaking-interface-for-wikidata/
sistema de respuesta de preguntas abiertas
Editar para ...ofrecer información
multilingüe e integrada en aplicaciones
Histropedia
Podría ser
fuente: http://www.sansebastianturismo.com/en/thematic/tourism/1392-mobile-apps
Editar porque ...es divertido
es útilentre todos lo mejoramos
Editar Wikidata
https://www.wikidata.org/wiki/Q10313
Un paseo por la Wiki
Básicos de WikidataElemento
Etiqueta
Identificador
Descripción
Alias
Página del elemento
Básicos de Wikidata (II)
https://www.wikidata.org/wiki/Wikidata:Introduction/es
● Pueden referirse a ○ un tema (p.ej. política)○ una clase (p.ej. ciudad)○ una instancia, objeto concreto (p.ej. San Sebastián)
● Tienen que ser relevantes y únicos● Borrado de páginas de elemento
(administradores)
Elementos
ayuda: https://www.wikidata.org/wiki/Help:Items/es
● Etiquetas: nombre (único par etiq-desc)○ empiezan por minúscula (salvo nombres propios
etc.)○ desambiguación en descripción, no en etiqueta!○
● Alias: otros nombres comunes
Etiquetas y alias
ayuda: https://www.wikidata.org/wiki/Help:Label/eshttps://www.wikidata.org/wiki/Help:Aliases/es
https://www.wikidata.org/wiki/Help_talk:Label#No_page_in_English
● Descripciones: textos cortos○ sin artículo○ comienzo minúscula
Descripciones
ayuda: https://www.wikidata.org/wiki/Help:Description/es
● propia página● se pueden proponen, pero se supervisan, votan, y los
burócratas crean● forman afirmaciones junto con valores● autocompletado (muy útil)● tipos de valor concretos (def. en propiedad)
○ elemento○ enlace a Wikimedia Commons○ texto○ dato temporal○ coordenada○ URL○ calificadores
Propiedades
https://www.wikidata.org/wiki/Help:Properties
● La información que conocemos de los elementos“San Sebastián, es una (instancia de), ciudad”
● Contienen: propiedad-valor + calificador● Una propiedad puede tener múltiples valores
“Lola, ocupación, profesora” “Lola, ocupación, investigadora”
● Declarar información que se pueda verificar (fuentes)● Inconsistencia → ranking, consenso● no enlazar con páginas desambiguación
Declaraciones
https://www.wikidata.org/wiki/Help:Statements/es
● Para refinar información de una afirmación“Lola, ocupación, profesora” durante 2005
Calificadores
https://www.wikidata.org/wiki/Help:Qualifiers/es
screenshot: https://www.wikidata.org/wiki/Help:Qualifiers/es#/media/File:Statement_with_multiple_values_-_Hillary_Clinton.png
● Acreditan la veracidad de las afirmaciones○ Libros, publicaciones, artículos de periódicos○ enlaces de sitio (importado de, mejor)
● No son necesarias si ...○ conocimiento común○ si el elemento referencia a una fuente de datos
verificada (identificador de VIAF)○ el elemento lo explica (autor del libro)
Fuentes
https://www.wikidata.org/wiki/Help:Sources/es
● Enlaces de elementos de Wikidata a sitio Wikimedia○ Wikipedia○ Wikivoyage○ Wikisource
● Idioma
Enlaces de sitio (sitelinks/interwiki links)
https://www.wikidata.org/wiki/Help:Sitelinks/es
Casos de uso
● Asegurarse de que no existe○ buscar○ elemento por título
● Si vemos a posteriori que hay elementos repetidos:https://www.wikidata.org/wiki/Special:MergeItemshttps://www.wikidata.org/wiki/Wikidata:Interwiki_conflicts
Crear un elemento
● Asegurarse de que no existe○ buscar○ elemento por título (ES/EU/EN, texto exacto)
● Si vemos a posteriori que hay elementos repetidos:https://www.wikidata.org/wiki/Special:MergeItemshttps://www.wikidata.org/wiki/Wikidata:Interwiki_conflicts
Crear un elemento
https://www.wikidata.org/wiki/Special:NewItem
● Encontrar un elemento○ al azar: https://www.wikidata.org/wiki/Q17151668○ necesitado de edición: https://tools.wmflabs.
org/wikidata-terminator/○ http://tools.wmflabs.org/wikidata-game/○ uno que os interese:
■ buscar■ elemento por título
○● Editar incluyendo nuevas afirmaciones,
fuentes, calificadores, idiomas!
Enriquecer un elemento
●
Enlazar con datos externos
http://tools.wmflabs.org/mix-n-match/
● Sugerir propiedades y catálogo● GLAM
Enlazar con datos externos
preferencias / accesorios
Revisar importación de Freebase
Revisar importación de Freebase (II)
● Antes de pasar a editar en el repositorio real
Sandbox: banco de pruebas
https://www.wikidata.org/wiki/Wikidata:Sandbox
Demo
Ediciones DSS
recomendación:
1) 20 min: probar varias de las cosas descritas
2) resto: editar sobre DSS
Sugerencias
Tenemos:● Enlazar siempre con Q10313● Instancias de● Varias temáticas ● Sugerencias de qué propiedades incluir en
tipos de elementos● Sugerencias de fuentes de datos que utilizar
○ inspiración○ fuente
3 docs públicos (L/E)https://sites.google.
com/site/donostiasansebastianenwikidata/sugerencias
ViziData: en Donostia
http://wwwpub.zih.tu-dresden.de/~s5219191/vizidata/#d=0&m=items&l=en&f=false&e=0,278&g=1.2&h=1.2&o=1&p=3&x=-1.921234130859375&y=43.280329674434135&z=12
¿Estáis ya registrad@s en Wikidata?
wikidata:Q20155196
Gracias por la atención
Estadísticas de Wikipedia:http://s23.org/wikistats/wikipedias_html.phpEstadísticas de Wikidata: https://www.wikidata.org/wiki/Wikidata:StatisticsKrötzsch, M. (2014). Wikidata: A Free Collaborative Knowledge Base (presentation) In: SWIB 2014.http://swib.org/swib14/slides/kroetzsch_swib14_53.pdfEjemplos de aplicacioneshttp://blog.wikimedia.de/tag/Wikidata/
Referencias (I)
Steiner, T. (2014). Bots vs. Wikipedians, Anons vs. Logged-Ins (Redux): A Global Study of Edit Activity on Wikipedia and Wikidata. In:
Proceedings of The International Symposium on Open Collaboration 2014
Referencias (II)
Ayuda Wikidatahttps://www.wikidata.org/wiki/Help:Contents/esHerramientas externas https://www.wikidata.org/wiki/Wikidata:Tools/External_tools/eshttps://www.wikidata.org/wiki/Help:Navigating_Wikidata/eshttps://www.wikidata.org/wiki/Help:Contents/esglosario de términos: https://www.wikidata.org/wiki/Wikidata:Glossary/eshttps://www.wikidata.org/wiki/Help:FAQ/es
Referencias (III)
Top Related