Practicando análisis cibermétrico en redes de investigadores
-
Upload
elwin-huaman-quispe -
Category
Data & Analytics
-
view
144 -
download
0
Transcript of Practicando análisis cibermétrico en redes de investigadores
Huaman Quispe Elwin Luis. Universidad de Salamanca - Abril. 2014. España.
Revistas, autores y palabras clave: Un análisis cibermétrico
Elwin Luis Huaman Quispe
Resumen
El presente trabajo realiza un análisis cibermetrico de una red de investigadores, una red de revistas y una red de palabras claves, este análisis se realiza con carácter práctico y exploratorio. La metodología empleada en la cual se apoya este trabajo es la cibermetria el cual permite la obtención de medidas de densidad, grados de centralidad, grados de intermediación, grados de cercanía de los actores en general de los cuales se deducen el análisis de comunidades. Los resultados obtenidos de las redes analizadas se representan gráficamente para una mejor comprensión.
Palabras Clave: Cibermetria, análisis de redes, pajek, gephi
Créditos: Para realizar este trabajo, se ha revisado literatura científica de: F Sánchez-Pita, JL Alonso-Berrocal (2013): “Los
sitios Web de centros de investigación biosanitaria de Castilla y León. Un análisis cibermétrico”, en Revista Latina de Comunicación Social, 68. La Laguna (Tenerife): Universidad de La Laguna, páginas 383 a 419, Retrieved April, 24 from http://www.revistalatinacs.org/068/paper/982_Salamanca/16_Sanchez.html
1. Introducción
Desde siempre hay una preocupación por saber cuál es el comportamiento de las redes sociales, no solo en el ámbito del ciberespacio sino también en el ámbito de la sociedad, hoy en día y cada vez más existe un importante avance por comprender y analizar estas relaciones, para ello muchos investigadores emplean la Cibermetría para intentar comprender y desvelar este comportamiento, también cabe mencionar que este análisis parte del concepto de redes y este se aplica a todo los ámbitos de la humanidad en el que existan más de 1 participante. En este informe se pretende en concreto comprender y analizar desde una perspectiva practica el grado de relaciones que se tiene dentro de la red Author.net más que en las otras redes.
Teniendo en cuanta la investigación como punto de partida, podemos decir que existe una estrecha relación dentro de los investigadores, es decir uno puede estar relacionado con otro o no lo puede estar, pero un investigador puede tener muchas relaciones así como tampoco las puede tener, entonces ahí nace la premisa de saber quién tiene más poder, mas relaciones, más comunicación dentro de la dimensión investigadora, es por eso que se necesita saber esta información porque a simple vista no se puede ver, para ello existe el análisis de redes. Una vez que comprendemos estos conceptos podemos hablar de medidas que nos dicen en qué grado mayor o menor es importante un investigador o que pasa si este investigador se va. Para muchas Universidades es muy importante el campo de la investigación, porque pueden mejorar sus objetivos si sabes esta información o quizá también tomar mejores decisiones.
Por todo esto este informe pretende reforzar la capacidad práctica, de comprensión, análisis e interpretación. Todo esto bajo una perspectiva Cibermétrica así como su representación gráfica.
1.1. Justificación
El presente análisis cibermétrico se fundamenta en el estudio y comprensión de medidas que ayuden la representación de los datos; Journal, Author, Keyword.
Estas redes fueron proporcionadas por terceros, de los cuales se pudieron extraer los datos de los autores, las revistas y palabras claves.
Por lo tanto el análisis cuantitativo que se pretende realizar se apoya completamente en la cibermetria y dentro de ello la posibilidad de analizar las comunidades que se han podido establecer.
1.2. Objeto y objetivos de la investigación
Analizar bajo parámetros cibermetricos los datos; Journal.net, Author.net, Keyword.net proporcionadas por JL Alonso-Berrocal.
Dicho esto se pretende desde una perspectiva cuantitativa obtener medidas cibermetricas y su respectiva representación gráfica, lo cual facilitara la comprensión.
1.3. Cibermetría y antecedentes
El termino Cibermetría se definió por Shiri en 1998 y a partir de ello se establece otro aspecto a investigar en el ciberespacio.
Hoy la Cibermetría centra su aplicación como una solución que aborda la explosión documental, basado en las conexiones y estructuras web. Y así
2
Huaman Quispe Elwin Luis. Universidad de Salamanca - Abril. 2014. España.
poder determinar que documentos son más relevantes y tiene más valor respecto de los demás en función de las medidas establecidas en la Cibermetría.
2. Método
2.1. Planteamiento y metodología
Se empleó una metodología cuantitativa para obtener las medidas, índices, comunidades y su representación gráfica, Para nuestro caso se aplican a Autores, Revistas y Palabras claves.
2.2. Software utilizado
2.2.1. Pajek
Es un programa que permite el análisis y la visualización de redes mediante algoritmo (Pajek, 2014). Pajek permite el cálculo de las medidas como; Densidad, Diámetro, Grado de centralidad de entrada, Grado de centralidad de salida, Relación de nodos en función de la teoría Bow-Tie y su representación gráfica.
Las acciones realizadas con Pajek consisten en cargar los ficheros autor.net, journal.net, keyword.net, esto nos permitirá la obtención de las medidas y nodos representativos.
Para el proceso de representación de los gráficos se utilizó del algoritmo Fruchterman Reingold.
2.2.2. Gephi
Gephi es un programa que permite analizar redes y sobre todo está enfocado en su presentación gráfica, también nos permite calcular las medidas; Nodos con mayor grado de entrada, Nodos con mayor grado de salida, nodos con mayor grado de intermediación, Nodos con mayor grado de cercanía.
Debo mencionar que se ha encontrado problemas durante el desarrollo de su representación en redes grandes, puesto que la red Journals.net no puede procesarla.
2.3. Índices y medidas aplicables
2.3.1. Densidad
La Densidad mide la proporción de enlaces que existen entre las relaciones posibles de una red en concreto. Los valores varían entre 0 y 1, siendo mejor los cercanos a 1. También cabe mencionar el diámetro que es el número de clicks necesarios que se deben dar para llegar de un nodo en concreto al nodo más lejano.
2.3.2. Diámetro
Esta medida permite conocer el número de clicks necesario que se debe dar para llegar de un nodo en concreto al nodo más lejano.
2.3.3. Grado
El grado permite medir el número de enlaces directos que tiene un nodo que puede ser; grado de entrada o grado de salida.
2.3.4. Grado de Entrada
El grado de entrada o indegree, indica la cantidad de nodos que apuntan a este.
2.3.5. Grado de Salida
El grado de salida o outdegree, indica la cantidad de nodos a los que apunta este.
2.3.6. Grado de intermediación
También conocido como betweenness, este grado permite detallar que punto en concreto un nodo de la red se encuentra en una posición intermedia con respecto de la red. A mayor grado mejor. Es decir mide el número de veces que un nodo aparece en las rutas existentes en la red.
2.3.7. Grado de cercanía
Este grado es llamado también closeness, permite mostrar la distancia media de cada nodo con el conjunto de nodos que conforman la red, es decir un nodo con mejor capacidad para el envió y la recepción de información. A mayor grado mejor.
2.3.8. Pagerank
Esta medida determina la valoración de una página web a través del número de enlaces que recibe desde otras páginas y también por la importancia de las páginas que le enlazan.
2.3.9. Hubs-autoridades
Permite obtener información de cómo se dirigen las relaciones en sentido global. Los Hubs, son nodos de los cuales parten muchas relaciones es decir tiene un grado de salida mayor. Las Autoridades, son los nodos que reciben muchas relaciones, es decir que tiene un grado de entrada muy grande.
2.3.10. Comunidades
Nos permite hallar las redes de comunidades, para ello utiliza dos parámetros que son; La modularidad y el número de Clusters.
2.4. Representación gráfica de redes
Entendiendo un grafo como un conjunto de puntos y líneas que pueden determinar una dirección y/o camino y llegan a ser dirigidos o no dirigidos. (Sánchez-Pita & Alonso-Berrocal, 2013)
3
Huaman Quispe Elwin Luis. Universidad de Salamanca - Abril. 2014. España.
Figura. 1. Grafo dirigido y no dirigido
Estas representaciones gráficas favorecen la visualización y la correcta interpretación de los datos, esta representación de los datos también permite su visualización por una matriz de adyacencia.
Para la representación gráfica de los grafos de los datos se utiliza el software Gephi, bajo la visualización del algoritmo Fruchterman & Reingold que permite la colocación de los nodos según su fuerza de repulsión.
Figura. 2. Algoritmos
Fuente: www.revistalatinacs.org
También cabe mencionar que para la representación y análisis de comunidades tendremos que utilizar el algoritmo Force Atlas.
Figura. 3. Algoritmo forcé Atlas
3. Resultados
3.1. Propiedades de las redes
Como bien dijimos en las medidas e índices, que la mejor densidad se acerca más a 1, sin embargo podemos apreciar que las tres redes; Author, Journal y Keywords tiene una densidad inferior a 0,30 lo que indica que se debería trabajar más en establecer las relaciones y comunicaciones entre sus distintos nodos.
Figura. 4. Densidad
Respecto del diámetro podemos mencionar que la red journal necesita de 37 pasos para llegar de un nodo.journal al nodo.journal más alejado.
Figura. 5. Diámetro de redes
3.2. Centralidad de las redes
El grado de centralidad indica cuanto más próximo a 0 es mucho mejor. Sin embargo podemos apreciar que todo el conjunto de redes oscila entre 0,57 y 0,60.
0,270,25
0,11
0,00
0,05
0,10
0,15
0,20
0,25
0,30
Author Journal Keyword
Densidad
6
37
10
0
10
20
30
40
Author Journal Keyword
Diametro
4
Huaman Quispe Elwin Luis. Universidad de Salamanca - Abril. 2014. España.
Figura. 6. Centralidad de Entrada
Figura. 7. Centralidad de Salida
3.3. Representación gráfica de las redes
A continuación se representan gráficamente las
redes especificando su clasificación.
3.3.1. Grafos de Authors.net
En este grafo se puede apreciar al ID 13, que pertenece al autor BAR-ILAN, J con un grado de entrada de 247.
Figura. 8. Grado de Entrada
Figura. 9. Lista top 5 con mayor grado de entrada
En el siguiente grafico podemos apreciar al ID 333 que pertenece a SPINK, A con un grado de salida de 275.
Figura. 10. Grado de salida
Figura. 11. Lista top 5 con mayor grado de salida
En los siguientes gráficos podemos apreciar los grados de intermediación y cercanía.
0,58
0,57
0,60
0,55
0,56
0,57
0,58
0,59
0,60
0,61
Author Journal Keyword
InDegree
0,58
0,57
0,60
0,55
0,56
0,57
0,58
0,59
0,60
0,61
Author Journal Keyword
OutDegree
5
Huaman Quispe Elwin Luis. Universidad de Salamanca - Abril. 2014. España.
Figura. 12. Grado de Intermediación
Figura. 13. Lista top 5 con mayor grado de intermediación
Figura. 14. Grado de Cercanía
Figura. 15. Lista top 5 con mayor grado de Cercanía
3.3.2. Grafos de Keywords.net
En este grafo se puede apreciar al ID 1, que pertenece al keyword RESEARCH con un grado de entrada de 585.
Figura. 16. Grado de Entrada
Figura. 17. Lista top 5 con mayor grado de entrada
En el siguiente grafico podemos apreciar al ID 445 que pertenece al Keyword PROGRAMMING con un grado de salida de 189.
6
Huaman Quispe Elwin Luis. Universidad de Salamanca - Abril. 2014. España.
Figura. 18. Grado de salida
Figura. 19. Lista top 5 con mayor grado de salida
En los siguientes gráficos podemos apreciar los grados de intermediación y cercanía.
Figura. 20. Grado de Intermediación
Figura. 21. Lista top 5 con mayor grado de intermediación
Figura. 22. Grado de Cercanía
Figura. 23. Lista top 5 con mayor grado de Cercanía
3.4. Posicionamiento de las redes
A continuación se muestran listas top 5 con mejores valores, que indican el pagerank de los authors y Keywords respectivamente. Sin embargo estos datos son demostrativos y prácticos.
7
Huaman Quispe Elwin Luis. Universidad de Salamanca - Abril. 2014. España.
Figura. 24. Authors, Lista Top 5 de Pagerank
Figura. 25. Keywords, lista Top 5 de Pagerank.
3.5. Análisis de comunidades
A continuación se presenta la representación gráfica de las comunidades que existen dentro de authors.net y dentro de keywords.net. Luego de su análisis.
3.5.1. Comunidades authors.net
En esta red se puede apreciar un grado de modularidad de 0,38 y 5 comunidades o cluster.
Figura. 26. Porcentaje de comunidades
Figura. 27. Comunidades
3.5.2. Comunidades keywords.net
En esta red se puede apreciar un grado de modularidad de 0,39 y 7 comunidades o cluster.
Figura. 28. Porcentaje de comunidades
8
Huaman Quispe Elwin Luis. Universidad de Salamanca - Abril. 2014. España.
Figura. 29. Comunidades
3.6. Resumen
ÍNDICES AUTHOR JOURNAL KEYWORD
Vertices 405 2079 831
Lines 21742 537217 36654
Densidad 0,27 0,25 0,11
Diametro 6 37 10
InDegree 0,58 0,57 0,60
OutDegree 0,58 0,57 0,60
Betweenness 0,04 0,01 0,05
Closeness Input 0,58 0,54 0,50
Closeness Output 0,58 0,54 0,50
Hubs Authori 0,09 0,06 0,10
Modularidad 0,38 0,46 0,39
Cluster 5 7 7
4. Conclusiones
Luego del análisis cibermetrico realizado a las redes authors.net, journals.net y keywords.net se puede decir que el análisis se ha enfocado cuantitativamente, y que ha permite el cumplimiento de los objetivos. También se menciona lo siguiente:
Primero: de las 3 redes analizadas 1 es lista de autores, otra lista de revistas y la tercera es una lista de palabras clave, entonces los análisis no son comparativos, pero si apreciativos.
Segundo: la red journals.net tiene mejores relaciones ya que en las medidas de grado y densidad mantiene mejores valores respecto de los demás.
Tercero: El único autor que presenta mayor grado de intermediación y grado de salida es el ID 333 del autor Spink, A. debe ser considerado importante.
Cuarto: Basado en resultados podemos decir que la red de authors.net tiene una conectividad buena ya que contiene un valor de 6 en el diámetro de su red.
El presente trabajo se ha realizado como trabajo 2 de la asignatura: Gestión de contenidos y análisis de redes en entornos digitales del master en sistemas de información digital.
5. Bibliografía
Pajek. (2014). pajek [Pajek Wiki]. Retrieved April 24, 2014, from http://pajek.imfm.si/doku.php?id=pajek
Sánchez-Pita, F., & Alonso-Berrocal, J. L. (2013). Los sitios Web de centros de investigación biosanitaria de Castilla y León. Un análisis cibermétrico. doi:10.4185/RLCS-2013-982
6. Anexos
Los anexos considerados para el trabajo, son los siguientes:
Authors.gephi
Authors.net
Authros.paj
Journals.paj
Journals.net
Keyword.gephi
Keywords.net
Keywords.paj
También se incluyen las imagines para su mejor visualización a zoom completo:
Author Comunidades.png
Keyword Comunidades.png
9
Huaman Quispe Elwin Luis. Universidad de Salamanca - Abril. 2014. España.
6.1. Anexo: Author comunidades
10
Huaman Quispe Elwin Luis. Universidad de Salamanca - Abril. 2014. España.
6.2. Anexo: Keywords comunidades
11
Huaman Quispe Elwin Luis. Universidad de Salamanca - Abril. 2014. España.
12
Huaman Quispe Elwin Luis. Universidad de Salamanca - Abril. 2014. España.