☞ Esquema del curso
- Objeto de trabajo
- Redes
- Formalización y formatos
- Métricas
- Herramientas
- Datos
- Prácticas paso a paso
- Tutoriales, manuales, bibliografía
- Redes de personajes:
- Coaparición en teatro: Dracor
- Coaparición en cine: Movie Galaxies. Data DOI. 10.7910/DVN/T4HBA3
- Coaparición en novela: Les Miserables (red); Les Miserables (matriz)
- Dinámicas: Visualising the dynamics of character networks
- Paratextos: Proyecto Bieses
- Redes textuales:
- Redes históricas:
- Redes espaciales:
- Redes bibliográficas:
- Citación: Vosviewer
- Similitud de contenido: Connected Papers
- Redes culturales:
- Redes semánticas:
red | nodos | aristas |
---|---|---|
Obra teatral | Personajes | Coaparición en escena |
Estilometría | Obras | Semejanza estilística |
Colaboración científica | Autores | Coautoría de trabajos |
... | ... | ... |
-
Método de representación de patrones de conexión o interacción entre partes de un sistema.
-
El concepto de red supone una estructura relacional que puede ser estudiada (1) de forma lógica y matemática: Teoría de grafos (disciplina). Historia: Euler y los siete puentes de Königsberg.
-
(2) Exploración por medio de la visualización.
- Red: puntos unidos por líneas.
- Puntos: nodos o vértices (nodes o vertices).
- Líneas: aristas o enlaces (edges o links).
- Atributos: información extra sobre nodos o aristas
- Tipos de redes:
- Definen los nodos: bipartitas, simples, desconectadas
- Definen las aristas: múltiples, dirigidas, ...
Lista de aristas, matrices, lista de adyacencia, ...
Lista de aristas (edgelist): es conjunto de datos estructurados que contiene como mínimo dos columnas: una columna de nodos que son el origen de una conexión (source) y otra columna de nodos que son el destino de la conexión (target). El resto de columnas corresponden a los atributos.
source | target | weight | lang | type |
---|---|---|---|---|
Juan | Elena | 4 | esp | undirected |
Juan | Hans | 2 | de | undirected |
Juan | Marta | 1 | eng | undirected |
Juan | Marek | 1 | de | undirected |
... | ... | ... | ... | ... |
Matriz de adyacencia (Adjacency matrix): una matriz cuadrada (igual número de columnas y filas)
Juan | Hans | Elena | Marta | Marek | |
---|---|---|---|---|---|
Juan | 0 | 1 | 1 | 1 | 1 |
Hans | 1 | 0 | 0 | 1 | 1 |
Elena | 1 | 0 | 0 | 0 | 0 |
Marta | 1 | 1 | 0 | 0 | 0 |
Marek | 1 | 1 | 0 | 0 | 0 |
[...]
CSV
. Lista de aristas en CSV:
source,target,lengua,weight
Juan,Elena,esp,4
Juan,Hans,de,2
Juan,Marta,eng,1
Juan,Marek,de,1
Juan,Marek,esp,1
Juan,Marek,pol,5
Hans,Marta,eng,1
Hans,Marek,de,1
CSV
. Lista de Aristas + Nodos en CSV:
source,target
1,4
1,2
1,3
id,Label
1,Juan
2,Hans
3,Marta
4,Elena
Es recomendable guardar los datos estructurados en CSV, aunque Gephi acepta tablas en Excel.
gexf
(XML)
[...]
<node id="Marek" label="Marek">
<attvalues>
<attvalue for="att1" value="2.0"/>
</attvalues>
<viz:size value="4.0"/>
<viz:position x="-22.013721" y="26.080078"/>
<viz:color r="255" g="99" b="71"/>
</node>
</nodes>
<edges>
<edge id="0" source="Juan" target="Hans" weight="2.0"/>
<edge id="1" source="Juan" target="Elena" weight="4.0"/>
<edge id="2" source="Juan" target="Marta"/>
<edge id="3" source="Juan" target="Marek" weight="7.0"/>
<edge id="4" source="Hans" target="Marta"/>
<edge id="5" source="Hans" target="Marek"/>
</edges>
</graph>
</gexf>
- Más formatos (reconocidos por Gephi)
Misma red, distinta disposición.
Red bipartita
- Clásicos en Gephi: Force Atlas, Fruchterman Reingold,...
- Degree centrality: nº de conexiones.
- Betweenness centrality: nodos puente.
- Eigenvector centrality: nodos conectados a nodos bien conectados.
- Modularity (Louvain, Leiden algorithms): agrupaciones de nodos.
- ...
Flujo de trabajo: del dato a la visualización.
- Lenguajes de programación (flujo completo) : R, Python, JavaScript,...
- OpenRefine, Table2net,...
- Tableau, Nodegoat,...
- Gephi, Cytoscape, VOSviewer,...
Gephi ha retomado su desarrollo después de una fase sin actualizaciones. Se puede descargar desde su página https://gephi.org o directamente del repositorio en github gephi/releases.
Una de las ventajas de las nuevas versiones (desde 0.9.3) es que viene ya con Java (lenguaje de programación y entorno de ejecución para programas como Gephi). Más sobre la instalación en https://gephi.org/users/install/
Se encuentran en Tools > Plugin. Añaden a Gephi funcionalidades extra (métricas, importación, exportación, espacializaciones, ...).
-
Multimode networks transformation: Proyecta una red bipartita a una simple.
-
Sigma exporter: Exporta el grafo para visualizarlo dinámicamente usando javascript y html.
-
Leiden algorithm: Algoritmo de modularidad.
Los archivos en formato CSV y GEXF se encuentran en la carpeta /data
de este repositorio.
Redes de caracteres de coaparición en el teatro. La fuente es http://www.dracor.org, desde donde se pueden descargar; los añado a /data
como respaldo.
calderon_VidaEsSueno_ezlinavis.csv
span000014-valle-luces.gexf
35 premios literarios y 1325 autores premiados: datos obtenidos de Wikidata. Tabla en CSV con 3 variables: premios, premiados y género (masc./fem.); red bipartita y redes simples en formato gexf.
autoresypremios.csv
autoresypremios.gexf
autores.gexf
premios.gexf
El set de datos (+ listas de nodos y aristas) está en editio/premios-literarios y Zenodo: José Luis Losada (2022)
Red de estilometría de obras teatrales del Siglo de Oro. Los nodos representan obras teatrales unidos según su cercanía estilística. Análisis realizado usando el árbol de consenso (2000-5000 MFW) y la distancia Delta con el paquete de R, stylo (Eder, Rybicki y Kestemont, 2016), sobre un corpus de aproximadamente 700 obras y 50 autores. Visualización interactiva en: Estilometría de obras teatrales
estilometria_teatro.gexf
Red de coautoría de 3500 publicaciones sobre Estilometría. La bibliografía ha sido recopilada por Christof Schöch, Bibliography on Stylometry, 2017, DOI: 10.5281/zenodo.835190
Las entradas bibliográficas se han formalizado en red de coautoría usando VOSviewer. La red final de coautoría tiene 523 nodos (autores).
biblio_stylo.gexf
Red de lugares de la Odisea de Homero basada en una triangulación de Delaunay, para mostrar los lugares periféricos y centrales. Parte del proyecto Digital mapping of literature (Spatial Networks).
homero_odisea.gexf
☞ Practicar los fundamentos de una lista de aristas, cómo cargarla en Gephi y realizar los primeros pasos de visualización y métricas.
- Dracor > tools > https://ezlinavis.dracor.org > Examples > Calderón > descarga edge list.
- Gephi > Import spreadsheet (CSV) > next > finish.
- Layout: Fruchterman Reingold.
- Tamaño de nodos según el degree: Appearance > nodes > size [icono círculos] > Ranking > Choose an attribute > Degree [min. 10 - max. 50].
- Etiquetas de los nodos (label): "copy data to other column" (Data laboratory). Alternativa: "select attributes to display as labels" (Overview).
- Medidas de centralidad (Betweenness/Eigenvector): Segismundo frente a Clarín (statistics > Network Diameter; Eigenvector Centrality).
☞ Conocer el archivo en formato gexf, abrir en Gephi, atributos de los nodos (masculino/femenino).
- Dracor > corpora > Spanish Drama Corpus > Valle Inclán, Luces de bohemia > Downloads > Archivo en gexf.
- Gephi > open > [sin cambios] > ok.
- Exploración de datos: label, gender (Data laboratory).
- Appearance > nodes > color [icono paleta] > Partition > Choose an attribute > gender
- Layout: Force Atlas 2 [Prevent overlap, Disuade Hubs, Scaling = 40] > run|stop.
☞ Pasar de datos estructurados (tabla de datos) a una formalización de una lista de aristas (gexf)
- Materiales en Github > data >
autoresypremios.csv
- table2net (conversión en el navegador).
- Load table > Type of Network > Nodes > Build the network > Download.
- 3.1 Tipo de red: bipartita.
- 3.2 Nodos 1: autores | atributo: masc/fem.
- 3.3 Nodos 2: premios.
☞ Explorar redes bipartitas.
- Gephi > open
autoresypremios.gexf
.
- Layout: Force Atlas 2 > run|stop; > Prevent overlap > run|stop; Zoom
- Appearance > nodes > color [icono paleta] > Partition > Choose an attribute > Type
- Appearance > nodes > size [icono círculos] > Ranking > Choose an attribute > Degree [min. 10 - max. 50] (nº de autores por premio).
- Nodes Labels: Show node Labels; More settings > Labels > Hide non-selected.
- [reset colors] > Appearance > nodes > color [icono paleta] > Partition > Choose an attribute > sexlabel.
☞ Explorar redes simples (premios, autores).
Los archivos ya están listos en /data/premios.gexf
; /data/autores.gexf
. Se pueden asimismo crear desde la tabla de datos (table2net) o usando una transformación desde la red bipartita (☞ vide infra).
- Gephi > open
premios.gexf
-
Layout: Force atlas 2 [Prevent overlap, Disuade Hubs, Scaling = 50]
-
Appearance > nodes > size [icono círculos] > Ranking > Choose an attribute > Degree [min. 5 - max. 30].
-
Modularidad: Community detection > Modularity > run.
-
Appearance > nodes > color [icono paleta] > Partition > Choose an attribute > Modularity Class.
-
Comprobar centralidad:
- statistics > eigenvector Centrality.
- Appearance > nodes > size [icono círculos] > Ranking > Choose an attribute > eigenvector Centrality.
- Gephi > open
autores.gexf
- Layout: Layout: Fruchterman Reingold.
- Appearance > nodes > color [icono paleta] > Partition > Choose an attribute > sexlabel.
- Appearance > nodes > size [icono círculos] > Ranking > Choose an attribute > Degree [min. 5 - max. 30].
☞ Pasar de un tipo de red a otro (proyeción).
- Plugin: multimode networks transformation.
- Red bipartita.
- Load attributes > type:
- Premio > Autor / Autor > Premio (Red simple de premios)
- Autor > Premio / Premio > Autor (Red simple de autores)
- Remove nodes, edges.
- Run.
☞ Explorar redes textuales
- Gephi > open
estilometria_teatro.gexf
.
- Layout: Force atlas 2 [Prevent overlap, Disuade Hubs, Scaling = 200].
- Appearance > nodes > color [icono paleta] > Partition > Choose an attribute > Classes (autores) > Palette > Generate [Limit number of colors: unchecked] > generate.
- Appearance > nodes > size [icono círculos] > Unique > size = 20.
- Nodes Labels: Show node Labels; More settings > Labels > Hide non-selected.
Contrastar con la modularidad:
- Modularidad: Community detection > Modularity > run.
- Appearance > nodes > color [icono paleta] > Partition > Choose an attribute > Modularity Class.
☞ Explorar redes espaciales
Gephi no es el mejor entorno para trabajar con redes y mapas, pero es posible disponer los nodos siguiendo coordenadas geográficas. Es necesario contar con la latitud y la longitud de los lugares.
- Gephi > open
homero_odisea.gexf
. - Layout Plugin: Geo Layout.
☞ Explorar redes desconectadas
- Gephi > open
biblio_stylo.gexf
.
- Layout: Layout: Fruchterman Reingold (comparar con Force atlas 2).
- Comparar algoritmos de modularidad.
☞ Formas de representación estática y dinámica de los grafos.
- Panel Overview: Screeshot (izquierda), More settings (derecha)...
- Panel Preview: exportar svg, png, pdf.
- Plugin: Sigma Exporter. Crea una carpeta con las librerías, datos y ficheros para mostrar el grafo de forma interactiva en un navegador. Es necesario subirlo a un servidor web, por ejemplo, usando Github Pages. Se puede lanzar un servidor web local para realizar pruebas en local: Instrucciones.
- Retina (Web app, beta): Visualización en el navegador (offline / online) a partir de un archivo GEXF
-
Albert-László Barabási, Network Science, 2016.
-
Mathieu Bastian, Sebastien Heymann, Mathieu Jacomy, “Gephi: An Open Source Software for Exploring and Manipulating Networks”, International AAAI Conference on Weblogs and Social Media, 2009, pp. 361-362.
-
Gephi, Learn how to use Gephi.
-
Martin Grandjean, Gephi: Introduction to Network Analysis and Visualization, 14/10/2015.
-
Mathieu Jacomy, “A standard for presenting network visualizations”, Reticular, 01/03/2019, https://reticular.hypotheses.org/834.
-
Clément Levallois, Gephi tutorials, Last update: 2022.
-
Mark Newman, Networks: An Introduction, Oxford University Press, 2010.
-
Katherine Ognyanova, Static and dynamic network visualization with R, 2021
-
Katharina A. Zweig, Network Analysis Literacy: A Practical Approach to the Analysis of Networks, Springer, 2016.