Les graphiques font partie des formats d’affichage, et se construisent à l’aide du flux JSON renvoyé par les routines.
Le choix du graphique et son paramétrage s’effectuent pendant la création du modèle. Ceci étant, ces choix peuvent être modifiés par la suite, notamment dans le cadre de l’adaptation d’un modèle à un nouveau jeu de données.
En fonction du graphique choisi, la routine utilisée n’est pas la même, et le paramétrage peut également varier.
Dans cette partie, les graphiques disponibles dans LODEX ont été répertoriés avec les routines utilisables pour chaque visualisation : des exemples de diagrammes, ainsi que leur paramétrage possible, sont présentés avec la routine la plus couramment utilisée. L’ensemble des graphiques illustrés dans cette partie sont disponibles dans l’instance d’exemples disponible dans la galerie de modèle : Exploitation d’un export BibTex d’une bibliothèque Zotero.
La liste des différents graphiques disponibles dans LODEX se trouve dans le menu déroulant « Afficher avec un format » (et accessible via le bouton vert encadré ci-dessous) dans l’onglet « AFFICHAGE » lors de la création d’un champ de type « Graphiques ».
Aster Plot
C’est un « graphique » qui ne s’adapte pas à l’ensemble d’un jeu de données, mais qui permet de comparer des ressources au sein d’un jeu de données sur la base des champs sur les quels la routine associée s’applique. Il est préférable de créer ce type de champ dans la partie « Resource principale », pour pouvoir naviguer d’ne ressource à une autre en fonction de le leur % de similarité au niveau des champs indiqués dans la routine..
Routines utilisables
- close-by
- distance-with
- sub-resources-asterplot
Paramétrages disponibles
Comme pour tous les graphiques, les paramètres des données ajustables sont : le nombre max de champs, la valeur minimum à afficher, la valeur maximum à afficher, ainsi que des options de triage et le choix des couleurs.
Dans le cadre de cette visualisation, le plus important est de fixer le nombre maximum de champs pour garder une visualisation lisible, ainsi que la valeur minimale à afficher pour exclure les ressources peu similaires (un seuil est donc à définir si le jeu de données comporte un grand nombre de publications similaires en fonction des champs comparés).
Exemple
Voici ci-dessous un exemple « d’Asterplot » pour un corpus de 63 documents. Le graphique est paramétré pour afficher tous les % de similarité entre 0 et 100 pour 30 ressources maximum.
La comparaison se fait sur la base des champs « Domaines », « Disciplines » et « Sous-champs disciplinaires ».
Il est à noter que cliquer sur un segment de ce graphique renvoie à la publication auquel le % de similitude visible dans l’info-bulle correspond (voir Diagramme « Coordonnées parallèles » pour visualiser les % de similarité pour chaque champ comparé).
Carte de chaleur ou « HeatMap »
Une carte de chaleur, est un outil de visualisation de données qui utilise des couleurs pour représenter des valeurs. Chaque cellule indique l’ampleur de la valeur qu’elle représente, généralement avec des teintes plus foncées pour des valeurs plus élevées et plus claires pour des valeurs plus faibles. LODEX permet aussi de visualiser directement la valeur associée.
Routines utilisables
- pairing-with
- graph-by
- cross-by
- decompose-by
Paramétrages disponibles
- Nombre max de champs
- Valeur minimum à afficher & Valeur maximum à afficher
- Encadrement des valeurs retournées par la routine, vide et équivalent à l’infini [-∞, +∞] (si la routine le permet)
- Trier par
- Trie les données retournées par la routine sur leur intitulé ou leur valeur (si la routine le permet)
- Note : le tri par valeur peut ne pas fonctionner car il s’agit d’association de valeurs
- Afficher l’info-bulle
- permet de mettre une info-bulle sur les données du graphique avec un titre sur les intitulés et valeurs des données.
- Jeu de couleurs
- Sélection d’une palette de couleur en dégradé
- Inverser les axes
- Inverser les deux axes la source devient la destination et la destination devient la source : les éléments préalablement affichés à l’horizontale sont affichés à la verticale, et inversement.
Exemple
Carte de chaleur où les valeurs des deux axes (source et cible) sont différents : visualisations du nombre d’articles par pays en fonction des années de publication.
- Onglet « GÉNÉRAL »
- Onglet « AFFICHAGE »
- Résultat
Cartographie
Le format « Graphique – Cartographie » projette des données numériques sur une carte géographique du Monde, de l’Europe ou de la France.
Routines utilisables
- distinct-by
- distinct-ISO3166-1-alpha3-from
- distinct-alpha-2-alpha3-from
Paramétrages disponibles
Les paramètres Nombre max de champs, Valeur minimum à afficher et Valeur maximum à afficher permettent de définir, pour le champ représenté, les éléments à afficher.
- Seuls sont affichés les éléments dont le nombre d’apparitions est :
- supérieur à la valeur définie dans le paramètre Valeur minimum à afficher
- inférieur à la valeur définie dans le paramètre Valeur maximum à afficher
- Nombre max de champs
- Détermine le nombre maximum d’éléments à afficher
- Valeur minimum à afficher & Valeur maximum à afficher
- Définit le nombre minimum ou maximum d’apparitions d’un élément dans le corpus pour qu’il soit affiché
- Projection du Monde
- Ce paramètre correspond au zoom effectué sur la carte, 3 zooms sont disponibles
- Projection mondiale : Affiche le Monde
- Projection européenne : Affiche l’Europe géographique
- Projection française : Afficher la France avec ses départements
- Ce paramètre correspond au zoom effectué sur la carte, 3 zooms sont disponibles
- Trier par :
- Valeur ascendante (dans ce cas, plus l’entité géographique aura un poids important, plus le dégradé de couleur foncera) ou valeur descendante (dégradé de couleur du plus foncé au moins foncé)
- Dégradé de couleur qui est appliqué au poids d’un pays (projection européenne ou mondiale) ou d’un département (dans le cas de la projection française)
- Afficher l’info-bulle
- permet de mettre une info-bulle sur les données du graphique lorsqu’on passe le curseur sur le graphique, avec un titre sur les intitulés et valeurs des données.
Si le corpus de données comporte un champ avec les codes ISO 3 des pays, ce format nécessite l’utilisation de la routine distinct-by, appliquée à l’identifiant du champ représenté.
Si le corpus de données ne comporte pas les codes ISO 3 des pays, ce format nécessite l’utilisation de la routine distinct-ISO3166-1-alpha3-from, appliquée à l’identifiant du champ contenant les pays verbalisés, (ou la routine distinct-alpha-2-alpha3-from, appliquée à l’identifiant du champ contenant les codes ISO 2 des pays) selon :/api/run/distinct-ISO3166-1-alpha3-from/identifiant/ (ou /api/run/distinct-alpha-2-alpha3-from/identifiant/).
Exemple
Paramétrage d’une carte mondiale (nombre de publications par pays ; utilisation de la routine distinct-alpha2-alpha3-from appliqué sur un champ contenant les codes des pays au format ISO 2).
- Onglet « GÉNÉRAL »
- Onglet « AFFICHAGE »
- Résultat
Cartographie de flux
Le graphique Cartographie de flux permet la géo-visualisation de données sur une carte. C’est une cartographie web dynamique : le passage de la souris sur les pays met en évidence les liens entre les pays (flèches simples incurvées, dont la largeur est proportionnelle à l’importance des collaborations entre pays) et affiche également le « poids » de chaque pays par un point dont le dégradé de couleur est plus ou moins prononcé.
Routines utilisables
- pairing-with
- graph-by
- cross-by
- decompose-by
Paramétrages disponibles
Les paramètres Nombre max de champs, Valeur minimum à afficher et Valeur maximum à afficher permettent de définir, pour le champ représenté, les éléments à afficher.
- Seuls sont affichés les éléments dont le nombre d’apparitions est :
-
- supérieur à la valeur définie dans le paramètre Valeur minimum à afficher
- inférieur à la valeur définie dans le paramètre Valeur maximum à afficher
- Nombre max de champs
- Détermine le nombre maximum d’éléments à afficher
- Valeur minimum à afficher & Valeur maximum à afficher
- Définit le nombre minimum ou maximum d’apparitions d’un élément dans le corpus pour qu’il soit affiché
- Trier par
- Trie les données retournées par la routine sur leur intitulé ou leur valeur (si la routine le permet)
- Note : le tri par valeur peut ne pas fonctionner car il s’agit d’association de valeur
- Afficher l’info-bulle
- permet de mettre une info-bulle sur les données du graphique avec un titre sur les intitulés et valeurs des données
- Jeu de couleurs
- Dégradé de couleur sur les points (les points sont plus ou moins foncés, en fonction de la valeur)
- Couleur
- Couleur des liens entre les lieux géographiques (flèches simples incurvées), donnée en code hexadécimal
Exemple
Paramétrage d’une cartographie de flux (géo-visualisation des relations entre pays co-publiants ; utilisation de la routine pairing-with appliquée à deux champs identiques contenant la liste des codes ISO 3 des pays d’un article au format tableau « Array »).
- Onglet « GÉNÉRAL
- Onglet « AFFICHAGE »
- Résultat
Coordonnées parallèles (Statut : expérimental)
Ce type de diagramme permet de visualiser des données numériques à plusieurs variables à titre de comparaison et pour éventuellement repérer des relations qui pourraient exister entre elles. Dans le cas présent, ce type de graphique n’est pas adapté à la page « Graphiques » mais doit être placé en tant que champ dans la catégorie « Ressource principale » pour faire partie de la « fiche de la ressource. En effet, dans LODEX, cette visualisation peut être utilisée comme « l’Aster Plot » pour isoler et accéder à des ressources similaires ou non (en fonction des paramètres de données entrés). Le % de similarité correspond à la moyenne des similitudes observées pour chaque champ auquel la routine s’applique, et contrairement à « l’Aster Plot », ces dernières peuvent être visualisées pour chaque champ comparé.
Routine utilisable
- distance-with
Paramétrages disponibles
Outre le paramétrage des couleurs des droites, il est possible de limiter le nombre de ressources à comparer et de fixer des seuils de similarités pour ne pas surcharger le diagramme en fonction de la taille du jeu de données.
Exemple
Paramétrage d’un diagramme en coordonnées parallèles pour un corpus de 63 documents sélectionnant les ressources les plus similaires sur la base des champs « Domaines » et « Disciplines ».
- Onglet « GÉNÉRAL (remarque : à l’heure de la rédaction de cette notice, la routine utilisée n’est pas encore incorporée dans la liste déroulante « CHOIX DE LA ROUTINE », mais il est possible de l’utiliser en utilisant « VALEUR ARBITRAIRE » en tant que « Source de la valeur »)
- Onglet « AFFICHAGE »
- Résultat (Rq : une correction est prévue pour borner le % de similarité à zéro dans le cadre de comparaison de ressources pour certains champs donnant des ratios de similitude négatifs) :
- Il est possible d’accéder à une ressource particulière en cliquant sur la droite segmentée lui correspondant.
Carte proportionnelle ou « TreeMap »
Cette visualisation s’apparente au graphe à bulles mais se présente sous la forme d’une carte à cases dont les tailles sont proportionnelles aux valeurs qu’elles représentent.
Routines utilisables
- distinct-by
- distinct-by-fields
Paramétrages disponibles
En cliquant sur « Mode avancé », on accède à une console interprétant la syntaxe Vega-Lite » permettant de paramétrer toutes les options de ce type de graphique (un exemple est donné dans la partie « Pour aller plus loin. » : Vega-Lite : carte proportionnelle non hiérarchique.
Il est aussi possible de construire des « TreeMap » hiérarchiques en activant le curseur « Données hiérarchiques », l’activation du « Mode avancé » est alors nécessaire pour configurer le l’affichage du graphique de façon idoine.
Exemple
Paramétrage d’une carte proportionnelle pour un corpus de 63 documents mettant en valeur l’importance de chaque voie d’accès à la « science ouverte ».
- Onglet « GÉNÉRAL
- Onglet « AFFICHAGE »
- Résultat
Copie d’un champ existant
Ce format n’est pas un graphique à proprement à parler, il permet simplement de copier un graphique sur la page d’accueil. Pour cela, il suffit de renseigner le nom du champ destiné à recevoir la copie du graphique dans l’onglet « GÉNÉRAL » puis de sélectionner le format « Graphique -Copie d’un champ existant » et de choisir le graphique à copier dans la liste déroulante « Nom du champ à copier » à partir de l’onglet « AFFICHAGE ».
Diagramme à barres
Le diagramme à barres est souvent utilisé pour visualiser des variations quantitatives dans le temps ou par catégories.
Routines utilisables
- distinct-by
- distinct-by-field
- distribute-by-date
- distribute-by-decadal
- distribute-by-interval
Paramétrages disponibles
Les paramètres Nombre max de champs, Valeur minimum à afficher et Valeur maximum à afficher permettent de définir, pour le champ représenté, les éléments à afficher.
Seuls sont affichés les éléments dont le nombre d’apparitions est :
- supérieur à la valeur définie dans le paramètre Valeur minimum à afficher
-
- inférieur à la valeur définie dans le paramètre Valeur maximum à afficher
- Nombre max de champs
- Détermine le nombre maximum d’éléments à afficher
- Valeur minimum à afficher & Valeur maximum à afficher
- Définit le nombre minimum ou maximum d’apparitions d’un élément dans le corpus pour qu’il soit affiché
- Trier par
- Trie les données retournées par la routine sur leur intitulé (Label) ou leur valeur : un tri par Label ascendant permet un affichage par ordre alphabétique ou numérique croissant (année de publication, …) ; un tri par valeur met en évidence les valeurs des données
- Afficher l’info-bulle
- Permet de mettre une info-bulle sur les données du graphique avec un titre sur les intitulés et valeurs des données. L’affichage de l’info-bulle sera visible en passant la souris sur le graphique
- Jeu de couleurs
- Couleur du graphique donnée en code hexadécimal
- Direction
- Direction des barres du graphique (barres horizontales ou verticales)
- Afficher l’axe des catégories en diagonale / afficher l’axe des valeurs en diagonale
- Passe l’angle des intitulés des axes de 0° à 45°
- Arrondir les valeurs sur l’axe
- Arrondit les valeurs de l’axe (sans virgule)
- Afficher les valeurs
- Supprime l’axe des valeurs pour le remplacer par un affichage des valeurs sur les barres
- Éviter le chevauchement des étiquettes
- Échelle
- Type de représentation du graphique (linéaire ou logarithmique)
- Largeur des barres
- Taille maximum des barres
- Largeur
- La largeur est exprimée en pourcentage et correspond à la largeur du graphique par rapport à la largeur de sa représentation sur la page entière. Par défaut la largeur est de 100 %. Si on souhaite que le graphique n’occupe que la moitié de la largeur de la page par exemple, on réduit la largeur à 50 %.
Exemple
Paramétrage d’un graphique diagramme en barre pour les années de publication d’un corpus de 63 documents (utilisation de la routine distinct-by-field) pour visualiser les volumes de publications par ordre chronologique (années sans publications non représentées).
- Onglet « GÉNÉRAL
- Onglet « AFFICHAGE »
- Résultat
Diagramme à barres groupées
À venir…
Diagramme à bulles ou « bubble plot »
Le diagramme à bulles s’apparente à une carte de chaleur où l’intensité ou l’amplitude d’un cluster de croisement de deux champs est proportionnelle à la taille de chaque bulle. Les bulles peuvent aussi être colorées différemment selon les valeurs catégorielles représentées sur l’axe des abscisses ou des ordonnées.
Routines utilisables
- pairing-with
- cross-by
- graph-by
- decompose-by
Paramétrages disponibles
- Nombre max de champs
- Nombre de champs maximum retournés par la routine, vide et équivalent à l’infini (si la routine le permet)
- Valeur minimum à afficher & Valeur maximum à afficher
- Encadrement des valeurs retournées par la routine, vide et équivalent à l’infini [-∞, +∞] (si la routine le permet)
- Trier par
- Trie les données retournées par la routine sur leur intitulé ou leur valeur (si la routine le permet)
- Note : le tri par valeur peut ne pas fonctionner car il s’agit d’association de valeurs
- Afficher l’info-bulle
- permet de mettre une info-bulle sur les données du graphique avec un titre sur les intitulés et valeurs des données.
- Jeu de couleurs
- Couleur du graphique donnée en code hexadécimal
- Inverser les axes
- Inverser les deux axes la source devient la destination et la destination devient la source
Exemple
Paramétrage d’un diagramme à bulles (utilisation de la routine pairing-with).
- Onglet « GÉNÉRAL
- Onglet « AFFICHAGE »
- Résultat
Diagramme circulaire
Le diagramme circulaire, aussi appelé graphique sectoriel, est principalement pour comparer des proportions ou des valeurs absolues lorsque les catégories correspondantes sont peu nombreuses.
Routines utilisables
- distinct-by
- distinct-by-field
- distribute-by-interval
Paramétrages disponibles
Les paramètres Nombre max de champs, Valeur minimum à afficher et Valeur maximum à afficher permettent de définir, pour le champ représenté, les éléments à afficher.
- Seuls sont affichés les éléments dont le nombre d’apparitions est :
-
- supérieur à la valeur définie dans le paramètre Valeur minimum à afficher
- inférieur à la valeur définie dans le paramètre Valeur maximum à affiche
- Nombre max de champs
- Détermine le nombre maximum d’éléments à afficher
- Valeur minimum à afficher & Valeur maximum à afficher
- Définit le nombre minimum ou maximum d’apparitions d’un élément dans le corpus pour qu’il soit affiché
- Trier par :
- Trie les données retournées par la routine sur leur intitulé (ordre alphabétique) ou leurs valeurs (valeur croissante ou décroissante)
- Afficher les valeurs
- Affiche les valeurs des données sur le graphique
- Afficher l’info-bulle
- Permet de mettre une info-bulle sur les données du graphique, avec un titre pour les catégories du diagramme et un titre des valeurs des données.
- Jeu de couleurs
- Couleur du graphique donnée en code hexadécimal
- Largeur
- La largeur est exprimée en pourcentage et correspond à la largeur du graphique par rapport à la largeur de la page entière. Par défaut la largeur est de 100 %. Si on souhaite que le graphique n’occupe que la moitié de la largeur de la page par exemple, on réduit la largeur à 50 %.
Exemple
Paramétrage d’un diagramme circulaire (utilisation de la routine distinct-by-field)
- Onglet « GÉNÉRAL
- Onglet « AFFICHAGE »
- Résultat
Diagramme de Venn
Le diagramme de Venn, aussi appelé diagramme d’ensembles ou diagramme logique, est une visualisation pour illustrer les relations logiques entre des ensembles d’éléments
Routines utilisables
- cross-by
- ventilate-by ?
Paramétrages disponibles
- Nombre max de champs
- Nombre de champs maximum retourné par la routine, vide et équivalent à l’infini (si la routine le permet)
- Valeur minimum à afficher & Valeur maximum à afficher
- Encadrement des valeurs retournées par la routine, vide et équivalent à l’infini [-∞, +∞] (si la routine le permet)
- Trier par
- Trie les données retournées par la routine sur leur intitulé ou leur valeur (si la routine le permet)
- Jeu de couleurs
- Couleurs des ensembles données en code hexadécimal
Exemple
Paramétrage d’un diagramme de Venn (utilisation de la routine cross-by) illustrant la disponibilité des documents d’un corpus dans une ou plusieurs bases de données : la routine est appliquée sur un champ au format tableau (« Array ») dont les valeurs peuvent être uniques ou multiples.
- Onglet « GÉNÉRAL
- Onglet « AFFICHAGE »
- Résultat
Dans cet exemple appliqué à un corpus de 63 documents, les info-bulles affichables au passage de la souris sur les différents ensembles nous donne les informations suivantes :
- tous les documents sont disponibles via « crossref » (63)
- 4 documents sont aussi disponibles via « doaj » dont 2 également indexés sur « pubmed » qui en recense 4 au total
- 4 documents sont aussi disponibles via « arxiv » dont 3 également disponibles via « datacite »
Diagramme radar
Le diagramme « radar », aussi diagramme de « Kiviat » permet de représenter plusieurs critères ou dimensions sur un seul visuel, facilitant ainsi la comparaison de plusieurs ensembles de données.
Routines utilisables
- distinct-by
- distinct-by-field
Paramétrages disponibles
- Nombre max de champs
- Nombre de champs maximum retourné par la routine, vide et équivalent à l’infini (si la routine le permet)
- Valeur minimum à afficher & Valeur maximum à afficher
- Encadrement des valeurs retournées par la routine, vide et équivalent à l’infini [-∞, +∞] (si la routine le permet)
- Trier par
- Trie les données retournées par la routine sur leur intitulé ou leur valeur (si la routine le permet)
- Afficher l’info-bulle
- Permet de mettre une info-bulle sur les données du graphique avec un titre sur les intitulés et valeurs des données.
- Couleur
- Couleur du graphique donnée en code hexadécimal
- Arrondir les valeurs sur l’axe
- Arrondit les valeurs de l’axe
- Échelle
- Type de représentation du graphique (linéaire ou logarithmique)
Exemple
Paramétrage d’un diagramme radar (utilisation de la routine distinct-by-field) représentant la couverture thématique en terme de disciplines scientifiques pour l’ensemble d’un corpus.
- Onglet « GÉNÉRAL
- Onglet « AFFICHAGE »
- Résultat
-
Graphe à bulles
Le format Graphique – Graphe à bulles (BubbleMap) montre les corrélations (regroupement de bulles) et les poids (taille des bulles) des différents éléments du champ représenté, montrant ainsi les proportions des différentes valeurs à la manière d’une carte proportionnelle..
Routines utilisables
- distinct-by
- distinct-by-field
- sparql-query
Paramétrages disponibles
Les paramètres Nombre max de champs, Valeur minimum à afficher et Valeur maximum à afficher permettent de définir, pour le champ représenté, les éléments à afficher.
- Seuls sont affichés les éléments dont le nombre d’apparitions est :
-
- supérieur à la valeur définie dans le paramètre Valeur minimum à afficher
- inférieur à la valeur définie dans le paramètre Valeur maximum à afficher
- Nombre max de champs
- Détermine le nombre maximum d’éléments à afficher
- Valeur minimum à afficher & Valeur maximum à afficher
- Définit le nombre minimum ou maximum d’apparitions d’un élément dans le corpus pour qu’il soit affiché
- Trier par
- Trie les données retournées par la routine sur leur intitulé ou leur valeur (si la routine le permet)
- Couleur
- Couleur du graphique donnée en code hexadécimal
- Diamètre des bulles : nombre en pixels
Exemple
- Onglet « GÉNÉRAL »
- Onglet « AFFICHAGE »
- Résultat
Graphique de flux
À venir…
- classif-by
Graphique hiérarchique
À venir…
- tree-by
Graphique réseaux
Pour le format Réseaux, la largeur des liens est calculée automatiquement en fonction de leurs poids correspondant aux nombres publications copubliées par les entités représentées par les nœuds.
La taille d’un nœud est fonction de son degré, c’est-à-dire du nombre de liens le reliant à d’autres nœuds.
On peut cliquer sur un nœud pour griser tous les nœuds qui ne lui sont pas liés (et leurs liens).
La position des nœuds est calculée automatiquement, et est dynamique (cela peut mettre un peu de temps pour se stabiliser).
Routines utilisables
- cross-by
- decompose-by
- graph-by
- pairing-with
Paramétrages disponibles
Si le réseau est unimodal (un seul champ représenté), ce format nécessite l’utilisation de la routine graph-by ou decompose-by, appliquée à l’identifiant du champ représenté, qui doit être déclarée dans valeur (value) selon :
/api/run/graph-by/identifiant/ ou /api/run/decompose-by/identifiant/
où identifiant est le code attribué par LODEX au champ représenté.
Si le réseau est multimodal (plusieurs champs représentés), ce format nécessite l’utilisation de la routine pairing-with, appliquée aux identifiants des champs représentés, qui doit être déclarée dans valeur (value) selon :
/api/run/pairing-with/identifiant1/identifiant2/
où identifiant1 et identifiant2 sont les codes attribués par LODEX aux champs représentés.
Exemple de paramétrage d’un graphique en format réseaux (réseau unimodal)
- Onglet « GÉNÉRAL
- Onglet « AFFICHAGE »
- Résultat
Syntaxe Vega-Lite
La syntaxe Vega-Lite peut être utile si on souhaite réaliser des graphiques un peu plus élaborés que ceux précédemment décrits.
Elle permet la réalisation de tout type de graphiques (graphique à barres, carte de chaleur, etc…). Comme expliqué précédemment, la routine utilisée est fonction du graphique.
Pour aller se familiariser avec la syntaxe Vega-lite : https://vega.github.io/vega-lite/docs/.
De plus, quelques exemples de graphiques dits « avancés » sont présentés dans la section « Pour aller plus loin…« .