Les graphiques

Sommaire

Les graphiques font partie des formats d’affichage, et se construisent à l’aide du flux JSON renvoyé par les routines.

Le choix du graphique et son paramétrage s’effectuent pendant la création du modèle. Ceci étant, ces choix peuvent être modifiés par la suite, notamment dans le cadre de l’adaptation d’un modèle à un nouveau jeu de données.

En fonction du graphique choisi, la routine utilisée n’est pas la même, et le paramétrage peut également varier.

Dans cette partie, les graphiques disponibles dans LODEX ont été répertoriés avec les routines utilisables pour chaque visualisation : des exemples de diagrammes, ainsi que leur paramétrage possible, sont présentés avec la routine la plus couramment utilisée. L’ensemble des graphiques illustrés dans cette partie sont disponibles dans l’instance d’exemples disponible dans la galerie de modèle : Exploitation d’un export BibTex d’une bibliothèque Zotero.

La liste des différents graphiques disponibles dans LODEX se trouve dans le menu déroulant « Afficher avec un format » (et accessible via le bouton vert encadré ci-dessous) dans l’onglet « AFFICHAGE » lors de la création d’un champ de type « Graphiques ».

Aster Plot

C’est un « graphique » qui ne s’adapte pas à l’ensemble d’un jeu de données, mais qui permet de comparer des ressources au sein d’un jeu de données sur la base des champs sur les quels la routine associée s’applique. Il est préférable de créer ce type de champ dans la partie « Resource principale », pour pouvoir naviguer d’ne ressource à une autre en fonction de le leur % de similarité au niveau des champs indiqués dans la routine..

Routines utilisables

close-by
distance-with
sub-resources-asterplot

Paramétrages disponibles

Comme pour tous les graphiques, les paramètres des données ajustables sont : le nombre max de champs, la valeur minimum à afficher, la valeur maximum à afficher, ainsi que des options de triage et le choix des couleurs.

Dans le cadre de cette visualisation, le plus important est de fixer le nombre maximum de champs pour garder une visualisation lisible, ainsi que la valeur minimale à afficher pour exclure les ressources peu similaires (un seuil est donc à définir si le jeu de données comporte un grand nombre de publications similaires en fonction des champs comparés).

Exemple

Voici ci-dessous un exemple « d’Asterplot » pour un corpus de 63 documents. Le graphique est paramétré pour afficher tous les % de similarité entre 0 et 100 pour 30 ressources maximum.

La comparaison se fait sur la base des champs « Domaines », « Disciplines » et « Sous-champs disciplinaires ».

Il est à noter que cliquer sur un segment de ce graphique renvoie à la publication auquel le % de similitude visible dans l’info-bulle correspond (voir Diagramme « Coordonnées parallèles » pour visualiser les % de similarité pour chaque champ comparé).

Carte de chaleur ou « HeatMap »

Une carte de chaleur, est un outil de visualisation de données qui utilise des couleurs pour représenter des valeurs. Chaque cellule indique l’ampleur de la valeur qu’elle représente, généralement avec des teintes plus foncées pour des valeurs plus élevées et plus claires pour des valeurs plus faibles. LODEX permet aussi de visualiser directement la valeur associée.

Routines utilisables

pairing-with
graph-by
cross-by
decompose-by

Paramétrages disponibles

Nombre max de champs
- Nombre de champs maximum retourné par la routine : le nombre maximum de champs indiqué par défaut est 200. Pour la carte de chaleur, il est souhaitable d’indiquer un nombre élevé de champs (20000000 par exemple), sinon toutes les données ne seront pas visibles sur le graphique.
Valeur minimum à afficher & Valeur maximum à afficher
- Encadrement des valeurs retournées par la routine, vide et équivalent à l’infini [-∞, +∞] (si la routine le permet)
Trier par
- Trie les données retournées par la routine sur leur intitulé ou leur valeur (si la routine le permet)
- Note : le tri par valeur peut ne pas fonctionner car il s’agit d’association de valeurs
Afficher l’info-bulle
- permet de mettre une info-bulle sur les données du graphique avec un titre sur les intitulés et valeurs des données.
Jeu de couleurs
- Sélection d’une palette de couleur en dégradé
Inverser les axes
- Inverser les deux axes la source devient la destination et la destination devient la source : les éléments préalablement affichés à l’horizontale sont affichés à la verticale, et inversement.

Exemple

Carte de chaleur où les valeurs des deux axes (source et cible) sont différents : visualisations du nombre d’articles par pays en fonction des années de publication.

Onglet « GÉNÉRAL »

Onglet « AFFICHAGE »

Résultat

Cartographie

Le format « Graphique – Cartographie » projette des données numériques sur une carte géographique du Monde, de l’Europe ou de la France.

Routines utilisables

distinct-by
distinct-ISO3166-1-alpha3-from
distinct-alpha-2-alpha3-from

Paramétrages disponibles

Les paramètres Nombre max de champs, Valeur minimum à afficher et Valeur maximum à afficher permettent de définir, pour le champ représenté, les éléments à afficher.

Seuls sont affichés les éléments dont le nombre d’apparitions est :
- supérieur à la valeur définie dans le paramètre Valeur minimum à afficher
- inférieur à la valeur définie dans le paramètre Valeur maximum à afficher

Nombre max de champs
- Détermine le nombre maximum d’éléments à afficher
Valeur minimum à afficher & Valeur maximum à afficher
- Définit le nombre minimum ou maximum d’apparitions d’un élément dans le corpus pour qu’il soit affiché

Projection du Monde
- Ce paramètre correspond au zoom effectué sur la carte, 3 zooms sont disponibles
  - Projection mondiale : Affiche le Monde
  - Projection européenne : Affiche l’Europe géographique
  - Projection française : Afficher la France avec ses départements
Trier par :
- Valeur ascendante (dans ce cas, plus l’entité géographique aura un poids important, plus le dégradé de couleur foncera) ou valeur descendante (dégradé de couleur du plus foncé au moins foncé)
Dégradé de couleur qui est appliqué au poids d’un pays (projection européenne ou mondiale) ou d’un département (dans le cas de la projection française)
Afficher l’info-bulle
- permet de mettre une info-bulle sur les données du graphique lorsqu’on passe le curseur sur le graphique, avec un titre sur les intitulés et valeurs des données.

Si le corpus de données comporte un champ avec les codes ISO 3 des pays, ce format nécessite l’utilisation de la routine distinct-by, appliquée à l’identifiant du champ représenté.

Si le corpus de données ne comporte pas les codes ISO 3 des pays, ce format nécessite l’utilisation de la routine distinct-ISO3166-1-alpha3-from, appliquée à l’identifiant du champ contenant les pays verbalisés, (ou la routine distinct-alpha-2-alpha3-from, appliquée à l’identifiant du champ contenant les codes ISO 2 des pays) selon :/api/run/distinct-ISO3166-1-alpha3-from/identifiant/ (ou /api/run/distinct-alpha-2-alpha3-from/identifiant/).

Exemple

Paramétrage d’une carte mondiale (nombre de publications par pays ; utilisation de la routine distinct-alpha2-alpha3-from appliqué sur un champ contenant les codes des pays au format ISO 2).

Onglet « GÉNÉRAL »

Onglet « AFFICHAGE »

Résultat

Cartographie de flux

Le graphique Cartographie de flux permet la géo-visualisation de données sur une carte. C’est une cartographie web dynamique : le passage de la souris sur les pays met en évidence les liens entre les pays (flèches simples incurvées, dont la largeur est proportionnelle à l’importance des collaborations entre pays) et affiche également le « poids » de chaque pays par un point dont le dégradé de couleur est plus ou moins prononcé.

Routines utilisables

pairing-with
graph-by
cross-by
decompose-by

Paramétrages disponibles

Les paramètres Nombre max de champs, Valeur minimum à afficher et Valeur maximum à afficher permettent de définir, pour le champ représenté, les éléments à afficher.

Seuls sont affichés les éléments dont le nombre d’apparitions est :
- supérieur à la valeur définie dans le paramètre Valeur minimum à afficher
- inférieur à la valeur définie dans le paramètre Valeur maximum à afficher

Nombre max de champs
- Détermine le nombre maximum d’éléments à afficher
Valeur minimum à afficher & Valeur maximum à afficher
- Définit le nombre minimum ou maximum d’apparitions d’un élément dans le corpus pour qu’il soit affiché
Trier par
- Trie les données retournées par la routine sur leur intitulé ou leur valeur (si la routine le permet)
- Note : le tri par valeur peut ne pas fonctionner car il s’agit d’association de valeur
Afficher l’info-bulle
- permet de mettre une info-bulle sur les données du graphique avec un titre sur les intitulés et valeurs des données

Jeu de couleurs
- Dégradé de couleur sur les points (les points sont plus ou moins foncés, en fonction de la valeur)
Couleur
- Couleur des liens entre les lieux géographiques (flèches simples incurvées), donnée en code hexadécimal

Exemple

Paramétrage d’une cartographie de flux (géo-visualisation des relations entre pays co-publiants ; utilisation de la routine pairing-with appliquée à deux champs identiques contenant la liste des codes ISO 3 des pays d’un article au format tableau « Array »).

Onglet « GÉNÉRAL

Onglet « AFFICHAGE »

Résultat

Coordonnées parallèles (Statut : expérimental)

Ce type de diagramme permet de visualiser des données numériques à plusieurs variables à titre de comparaison et pour éventuellement repérer des relations qui pourraient exister entre elles. Dans le cas présent, ce type de graphique n’est pas adapté à la page « Graphiques » mais doit être placé en tant que champ dans la catégorie « Ressource principale » pour faire partie de la « fiche de la ressource. En effet, dans LODEX, cette visualisation peut être utilisée comme « l’Aster Plot » pour isoler et accéder à des ressources similaires ou non (en fonction des paramètres de données entrés). Le % de similarité correspond à la moyenne des similitudes observées pour chaque champ auquel la routine s’applique, et contrairement à « l’Aster Plot », ces dernières peuvent être visualisées pour chaque champ comparé.

Routine utilisable

distance-with

Paramétrages disponibles

Outre le paramétrage des couleurs des droites, il est possible de limiter le nombre de ressources à comparer et de fixer des seuils de similarités pour ne pas surcharger le diagramme en fonction de la taille du jeu de données.

Exemple

Paramétrage d’un diagramme en coordonnées parallèles pour un corpus de 63 documents sélectionnant les ressources les plus similaires sur la base des champs « Domaines » et « Disciplines ».

Onglet « GÉNÉRAL (remarque : à l’heure de la rédaction de cette notice, la routine utilisée n’est pas encore incorporée dans la liste déroulante « CHOIX DE LA ROUTINE », mais il est possible de l’utiliser en utilisant « VALEUR ARBITRAIRE » en tant que « Source de la valeur »)

Onglet « AFFICHAGE »

Résultat (Rq : une correction est prévue pour borner le % de similarité à zéro dans le cadre de comparaison de ressources pour certains champs donnant des ratios de similitude négatifs) :

Il est possible d’accéder à une ressource particulière en cliquant sur la droite segmentée lui correspondant.

Carte proportionnelle ou « TreeMap »

Cette visualisation s’apparente au graphe à bulles mais se présente sous la forme d’une carte à cases dont les tailles sont proportionnelles aux valeurs qu’elles représentent.

Routines utilisables

distinct-by
distinct-by-fields

Paramétrages disponibles

En cliquant sur « Mode avancé », on accède à une console interprétant la syntaxe Vega-Lite » permettant de paramétrer toutes les options de ce type de graphique (un exemple est donné dans la partie « Pour aller plus loin. » : Vega-Lite : carte proportionnelle non hiérarchique.

Il est aussi possible de construire des « TreeMap » hiérarchiques en activant le curseur « Données hiérarchiques », l’activation du « Mode avancé » est alors nécessaire pour configurer le l’affichage du graphique de façon idoine.

Exemple

Paramétrage d’une carte proportionnelle pour un corpus de 63 documents mettant en valeur l’importance de chaque voie d’accès à la « science ouverte ».

Onglet « GÉNÉRAL

Onglet « AFFICHAGE »

Résultat

Copie d’un champ existant

Ce format n’est pas un graphique à proprement à parler, il permet simplement de copier un graphique sur la page d’accueil. Pour cela, il suffit de renseigner le nom du champ destiné à recevoir la copie du graphique dans l’onglet « GÉNÉRAL » puis de sélectionner le format « Graphique -Copie d’un champ existant » et de choisir le graphique à copier dans la liste déroulante « Nom du champ à copier » à partir de l’onglet « AFFICHAGE ».

Diagramme à barres

Le diagramme à barres est souvent utilisé pour visualiser des variations quantitatives dans le temps ou par catégories.

Routines utilisables

distinct-by
distinct-by-field
distribute-by-date
distribute-by-decadal
distribute-by-interval

Paramétrages disponibles

Les paramètres Nombre max de champs, Valeur minimum à afficher et Valeur maximum à afficher permettent de définir, pour le champ représenté, les éléments à afficher.

Seuls sont affichés les éléments dont le nombre d’apparitions est :

supérieur à la valeur définie dans le paramètre Valeur minimum à afficher
- inférieur à la valeur définie dans le paramètre Valeur maximum à afficher
Nombre max de champs
- Détermine le nombre maximum d’éléments à afficher
Valeur minimum à afficher & Valeur maximum à afficher
- Définit le nombre minimum ou maximum d’apparitions d’un élément dans le corpus pour qu’il soit affiché

Trier par
- Trie les données retournées par la routine sur leur intitulé (Label) ou leur valeur : un tri par Label ascendant permet un affichage par ordre alphabétique ou numérique croissant (année de publication, …) ; un tri par valeur met en évidence les valeurs des données
Afficher l’info-bulle
- Permet de mettre une info-bulle sur les données du graphique avec un titre sur les intitulés et valeurs des données. L’affichage de l’info-bulle sera visible en passant la souris sur le graphique
Jeu de couleurs
- Couleur du graphique donnée en code hexadécimal
Direction
- Direction des barres du graphique (barres horizontales ou verticales)
Afficher l’axe des catégories en diagonale / afficher l’axe des valeurs en diagonale
- Passe l’angle des intitulés des axes de 0° à 45°
Arrondir les valeurs sur l’axe
- Arrondit les valeurs de l’axe (sans virgule)
Afficher les valeurs
- Supprime l’axe des valeurs pour le remplacer par un affichage des valeurs sur les barres
Éviter le chevauchement des étiquettes
Échelle
- Type de représentation du graphique (linéaire ou logarithmique)
Largeur des barres
- Taille maximum des barres
Largeur
- La largeur est exprimée en pourcentage et correspond à la largeur du graphique par rapport à la largeur de sa représentation sur la page entière. Par défaut la largeur est de 100 %. Si on souhaite que le graphique n’occupe que la moitié de la largeur de la page par exemple, on réduit la largeur à 50 %.

Exemple

Paramétrage d’un graphique diagramme en barre pour les années de publication d’un corpus de 63 documents (utilisation de la routine distinct-by-field) pour visualiser les volumes de publications par ordre chronologique (années sans publications non représentées).

Onglet « GÉNÉRAL

Onglet « AFFICHAGE »

Résultat

Groupement de diagrammes à barres

À ne pas confondre avec le diagramme à barres groupées (accessible via la syntaxe Vega-Lite), il s’agit ici d’un groupement de diagrammes à barres (« clustered bar charts »). Ce graphique permet de visualiser le nombre d’occurrences de la valeur d’un champ sous la forme d’un diagramme à barre en fonction d’un autre élément. Les éléments comptés pour constituer les diagrammes correspondent au deuxième champ indiqué dans la routine et ces graphiques sont reproduits autant de fois qu’il y a de valeurs différentes pour le premier champ renseigné.

Routines utilisables

pairing-with
cross-by
graph-by
decompose-by

Paramétrages disponibles

Nombre max de champs
- Nombre de champs maximum retournés par la routine, vide et équivalent à l’infini (si la routine le permet)
Valeur minimum à afficher & Valeur maximum à afficher
- Encadrement des valeurs retournées par la routine, vide et équivalent à l’infini [-∞, +∞] (si la routine le permet)
Trier par
- Trie les données retournées par la routine sur leur intitulé ou leur valeur (si la routine le permet)
- Note : le tri par valeur peut ne pas fonctionner car il s’agit d’association de valeurs
Afficher l’info-bulle
- permet de mettre une info-bulle sur les données du graphique avec un titre sur les intitulés et valeurs des données.
Jeu de couleurs
- Couleur du graphique donnée en code hexadécimal
Inverser les axes
- Inverser les deux axes la source devient la destination et la destination devient la source

Exemple

Paramétrage d’un groupement de diagramme à barres (utilisation de la routine graph-by).

Onglet « GÉNÉRAL

Onglet « AFFICHAGE »

Résultat

Diagramme à bulles ou « bubble plot »

Le diagramme à bulles s’apparente à une carte de chaleur où l’intensité ou l’amplitude d’un cluster de croisement de deux champs est proportionnelle à la taille de chaque bulle. Les bulles peuvent aussi être colorées différemment selon les valeurs catégorielles représentées sur l’axe des abscisses ou des ordonnées.

Routines utilisables

pairing-with
cross-by
graph-by
decompose-by

Paramétrages disponibles

Nombre max de champs
- Nombre de champs maximum retournés par la routine, vide et équivalent à l’infini (si la routine le permet)
Valeur minimum à afficher & Valeur maximum à afficher
- Encadrement des valeurs retournées par la routine, vide et équivalent à l’infini [-∞, +∞] (si la routine le permet)
Trier par
- Trie les données retournées par la routine sur leur intitulé ou leur valeur (si la routine le permet)
- Note : le tri par valeur peut ne pas fonctionner car il s’agit d’association de valeurs
Afficher l’info-bulle
- permet de mettre une info-bulle sur les données du graphique avec un titre sur les intitulés et valeurs des données.
Jeu de couleurs
- Couleur du graphique donnée en code hexadécimal
Inverser les axes
- Inverser les deux axes la source devient la destination et la destination devient la source

Exemple

Paramétrage d’un diagramme à bulles (utilisation de la routine pairing-with).

Onglet « GÉNÉRAL

Onglet « AFFICHAGE »

Résultat

Diagramme circulaire

Le diagramme circulaire, aussi appelé graphique sectoriel, est principalement pour comparer des proportions ou des valeurs absolues lorsque les catégories correspondantes sont peu nombreuses.

Routines utilisables

distinct-by
distinct-by-field
distribute-by-interval

Paramétrages disponibles

Les paramètres Nombre max de champs, Valeur minimum à afficher et Valeur maximum à afficher permettent de définir, pour le champ représenté, les éléments à afficher.

Seuls sont affichés les éléments dont le nombre d’apparitions est :
- supérieur à la valeur définie dans le paramètre Valeur minimum à afficher
- inférieur à la valeur définie dans le paramètre Valeur maximum à affiche
Nombre max de champs
- Détermine le nombre maximum d’éléments à afficher
Valeur minimum à afficher & Valeur maximum à afficher
- Définit le nombre minimum ou maximum d’apparitions d’un élément dans le corpus pour qu’il soit affiché

Trier par :
- Trie les données retournées par la routine sur leur intitulé (ordre alphabétique) ou leurs valeurs (valeur croissante ou décroissante)
Afficher les valeurs
- Affiche les valeurs des données sur le graphique
Afficher l’info-bulle
- Permet de mettre une info-bulle sur les données du graphique, avec un titre pour les catégories du diagramme et un titre des valeurs des données.
Jeu de couleurs
- Couleur du graphique donnée en code hexadécimal
Largeur
- La largeur est exprimée en pourcentage et correspond à la largeur du graphique par rapport à la largeur de la page entière. Par défaut la largeur est de 100 %. Si on souhaite que le graphique n’occupe que la moitié de la largeur de la page par exemple, on réduit la largeur à 50 %.

Exemple

Paramétrage d’un diagramme circulaire (utilisation de la routine distinct-by-field)

Onglet « GÉNÉRAL

Onglet « AFFICHAGE »

Résultat

Diagramme de Venn

Le diagramme de Venn, aussi appelé diagramme d’ensembles ou diagramme logique, est une visualisation pour illustrer les relations logiques entre des ensembles d’éléments

Routines utilisables

cross-by

Paramétrages disponibles

Nombre max de champs
- Nombre de champs maximum retourné par la routine, vide et équivalent à l’infini (si la routine le permet)
Valeur minimum à afficher & Valeur maximum à afficher
- Encadrement des valeurs retournées par la routine, vide et équivalent à l’infini [-∞, +∞] (si la routine le permet)
Trier par
- Trie les données retournées par la routine sur leur intitulé ou leur valeur (si la routine le permet)
Jeu de couleurs
- Couleurs des ensembles données en code hexadécimal

Exemple

Paramétrage d’un diagramme de Venn (utilisation de la routine cross-by) illustrant la disponibilité des documents d’un corpus dans une ou plusieurs bases de données : la routine est appliquée sur un champ au format tableau (« Array ») dont les valeurs peuvent être uniques ou multiples.

Onglet « GÉNÉRAL

Onglet « AFFICHAGE »

Résultat

Dans cet exemple appliqué à un corpus de 63 documents, les info-bulles affichables au passage de la souris sur les différents ensembles nous donnent les informations suivantes :

tous les documents sont disponibles via « crossref » (63)
4 documents sont aussi disponibles via « doaj » dont 2 également indexés sur « pubmed » qui en recense 4 au total
4 documents sont aussi disponibles via « arxiv » dont 3 également disponibles via « datacite »

Diagramme radar

Le diagramme « radar », aussi diagramme de « Kiviat » permet de représenter plusieurs critères ou dimensions sur un seul visuel, facilitant ainsi la comparaison de plusieurs ensembles de données.

Routines utilisables

distinct-by
distinct-by-field

Paramétrages disponibles

Nombre max de champs
- Nombre de champs maximum retourné par la routine, vide et équivalent à l’infini (si la routine le permet)
Valeur minimum à afficher & Valeur maximum à afficher
- Encadrement des valeurs retournées par la routine, vide et équivalent à l’infini [-∞, +∞] (si la routine le permet)
Trier par
- Trie les données retournées par la routine sur leur intitulé ou leur valeur (si la routine le permet)
Afficher l’info-bulle
- Permet de mettre une info-bulle sur les données du graphique avec un titre sur les intitulés et valeurs des données.
Couleur
- Couleur du graphique donnée en code hexadécimal
Arrondir les valeurs sur l’axe
- Arrondit les valeurs de l’axe
Échelle
- Type de représentation du graphique (linéaire ou logarithmique)

Exemple

Paramétrage d’un diagramme radar (utilisation de la routine distinct-by-field) représentant la couverture thématique en terme de disciplines scientifiques pour l’ensemble d’un corpus.

Onglet « GÉNÉRAL

Onglet « AFFICHAGE »

Résultat

Graphe à bulles

Le format Graphique – Graphe à bulles (BubbleMap) montre les corrélations (regroupement de bulles) et les poids (taille des bulles) des différents éléments du champ représenté, montrant ainsi les proportions des différentes valeurs à la manière d’une carte proportionnelle..

Routines utilisables

distinct-by
distinct-by-field
sparql-query

Paramétrages disponibles

Les paramètres Nombre max de champs, Valeur minimum à afficher et Valeur maximum à afficher permettent de définir, pour le champ représenté, les éléments à afficher.

Seuls sont affichés les éléments dont le nombre d’apparitions est :
- supérieur à la valeur définie dans le paramètre Valeur minimum à afficher
- inférieur à la valeur définie dans le paramètre Valeur maximum à afficher
Nombre max de champs
- Détermine le nombre maximum d’éléments à afficher
Valeur minimum à afficher & Valeur maximum à afficher
- Définit le nombre minimum ou maximum d’apparitions d’un élément dans le corpus pour qu’il soit affiché
Trier par
- Trie les données retournées par la routine sur leur intitulé ou leur valeur (si la routine le permet)
Couleur
- Couleur du graphique donnée en code hexadécimal
Diamètre des bulles : nombre en pixels

Exemple

Paramétrage d’un graphique à bulles (utilisation de la routine distinct-by) représentant le volume de publications par pays dans un corpus donné.

Onglet « GÉNÉRAL »

Onglet « AFFICHAGE »

Résultat

Graphique de flux

Le graphique de flux est un type de visualisation destiné notamment à visualiser les évolutions des poids diachroniques du poids des thématiques contenues dans les documents d’un corpus. Par opposition à la synchronie qui décrit un objet à un instant t, la diachronie intègre son évolution dans le temps dans sa représentation. Ce type de graphique permet ainsi grâce au survol de la souris d’isoler un caractère donné (une thématique, un mot-clé, une voie d’accès à la science ouverte…) et de visualiser isolément son évolution dans le temps.

Routines utilisables

classif-by ?
pairing-with

Paramétrages disponibles

Le paramètre Nombre max de champs, permet de définir, pour le champ représenté, le nombre d’éléments maximum à afficher.

Nombre max de champs
- Détermine le nombre maximum d’éléments à afficher
Trier par
- Trie les données retournées par la routine sur leur intitulé ou leur valeur (si la routine le permet)
Jeu de couleurs
- Couleurs du graphique données en code hexadécimal
Nombre max de caractères pour les légendes
Hauteur en pixel

Exemple

Paramétrage d’un graphique de flux (routine « pairing-with ») montrant pour chaque voie d’accès à la science ouverte (statut OA) l’évolution temporelle du nombre de documents correspondant dans le corpus.

Onglet « GÉNÉRAL »

Onglet « AFFICHAGE »

Résultat

Au survol d’une catégorie avec la souris (voie d’accès « gold »)

Graphique hiérarchique

Le graphique hiérarchique permet de compter les occurrences de valeurs pour des champs différents présentant des valeurs exclusives pour chacun d’entre eux. La visualisation se fait de manière hiérarchique sous la forme d’un arbre et est particulièrement utilisée lorsque les champs présentent une dépendance de type « verticale » comme par exemple la classification des espèces de Carl von Linné (Règne > Embranchement > Classe > Ordre > Famille > Genre > Espèce). Les « noeuds » générant l’arbre sont dépliables et repliables par un simple clic sur ces derniers.

Routine utilisable

tree-by

Paramétrages disponibles

Le paramètre Nombre max de champs, permet de définir, pour le champ représenté, le nombre d’éléments maximum à afficher.

Nombre max de champs
- Détermine le nombre maximum d’éléments à afficher
Trier par
- Trie les données retournées par la routine sur leur intitulé ou leur valeur (si la routine le permet)
Couleur
- Couleur du graphique donnée en code hexadécimal
Nombre max de caractères pour les intitulés des « noeuds »
Décalage du label à gauche (en px) : permet de déplacer les intitulés des « noeuds » vers la gauche
Valeur minimum pour l’échelle : permet de fixer la taille des barres représentant le nombre d’occurrences à la fin de l’arbre (plus la valeur est faible et plus longues seront les barres)

Exemple

Paramétrage d’un arbre hiérarchique donnant le nombre de publications par éditeurs, journaux et statuts OA (« Open Access »).

Il est à noter que la routine tree-by ne peut s’appliquer que sur des objets de type JSON. Par exemple, si une colonne contient beaucoup de champs stockés dans un objet JSON (par exemple une colonne issue d’un enrichissement via le web service « doiEnrich », il est possible de récupérer les données voulues grâce au « transformer » GET en renseignant les champs requis espacés par un point-virgule (cf. ci-dessous). Une autre possibilité peut consister à créer la colonne avec les données voulues via un script d’enrichissement Lodash grâce à la méthode « fix{} ».

Préparation du champ à partir d’une colonne contenant des objets JSON issus de la base OpenAlex

Onglet « GÉNÉRAL »

Onglet « AFFICHAGE »

Résultat

Graphique réseaux

Pour le format Réseaux, la largeur des liens est calculée automatiquement en fonction de leurs poids correspondant aux nombres publications copubliées par les entités représentées par les nœuds.

La taille d’un nœud est fonction de son degré, c’est-à-dire du nombre de liens le reliant à d’autres nœuds.

On peut cliquer sur un nœud pour griser tous les nœuds qui ne lui sont pas liés (et leurs liens).

La position des nœuds est calculée automatiquement, et est dynamique (cela peut mettre un peu de temps pour se stabiliser).

Routines utilisables

cross-by
decompose-by
graph-by
pairing-with

Paramétrages disponibles

Si le réseau est unimodal (un seul champ représenté), ce format nécessite l’utilisation de la routine graph-by ou decompose-by, appliquée à l’identifiant du champ représenté, qui doit être déclarée dans valeur (value) selon :

/api/run/graph-by/identifiant/ ou /api/run/decompose-by/identifiant/

où identifiant est le code attribué par LODEX au champ représenté.

Si le réseau est multimodal (plusieurs champs représentés), ce format nécessite l’utilisation de la routine pairing-with, appliquée aux identifiants des champs représentés, qui doit être déclarée dans valeur (value) selon :

/api/run/pairing-with/identifiant1/identifiant2/

où identifiant1 et identifiant2 sont les codes attribués par LODEX aux champs représentés.

Exemple

Paramétrage d’un graphique en format réseaux (réseau unimodal)

Onglet « GÉNÉRAL »

Onglet « AFFICHAGE »

Résultat

Syntaxe Vega-Lite

La syntaxe Vega-Lite peut être utile si on souhaite réaliser des graphiques un peu plus élaborés que ceux précédemment décrits.

Elle permet la réalisation de tout type de graphiques (graphique à barres, carte de chaleur, etc…). Comme expliqué précédemment, la routine utilisée est fonction du graphique.

Pour aller se familiariser avec la syntaxe Vega-lite : https://vega.github.io/vega-lite/docs/.

De plus, quelques exemples de graphiques dits « avancés » sont présentés dans la section « Pour aller plus loin…« .

Documentation

Aster Plot

Routines utilisables

Paramétrages disponibles

Exemple

Carte de chaleur ou « HeatMap »

Routines utilisables

Paramétrages disponibles

Exemple

Carte de chaleur où les valeurs des deux axes (source et cible) sont différents : visualisations du nombre d’articles par pays en fonction des années de publication.

Cartographie

Routines utilisables

Paramétrages disponibles

Exemple

Paramétrage d’une carte mondiale (nombre de publications par pays ; utilisation de la routine distinct-alpha2-alpha3-from appliqué sur un champ contenant les codes des pays au format ISO 2).

Cartographie de flux

Routines utilisables

Paramétrages disponibles

Exemple

Paramétrage d’une cartographie de flux (géo-visualisation des relations entre pays co-publiants ; utilisation de la routine pairing-with appliquée à deux champs identiques contenant la liste des codes ISO 3 des pays d’un article au format tableau « Array »).

Coordonnées parallèles (Statut : expérimental)

Routine utilisable

Paramétrages disponibles

Exemple

Paramétrage d’un diagramme en coordonnées parallèles pour un corpus de 63 documents sélectionnant les ressources les plus similaires sur la base des champs « Domaines » et « Disciplines ».

Carte proportionnelle ou « TreeMap »

Routines utilisables

Paramétrages disponibles

Exemple

Paramétrage d’une carte proportionnelle pour un corpus de 63 documents mettant en valeur l’importance de chaque voie d’accès à la « science ouverte ».

Copie d’un champ existant

Diagramme à barres

Routines utilisables

Paramétrages disponibles

Exemple

Paramétrage d’un graphique diagramme en barre pour les années de publication d’un corpus de 63 documents (utilisation de la routine distinct-by-field) pour visualiser les volumes de publications par ordre chronologique (années sans publications non représentées).

Groupement de diagrammes à barres

Routines utilisables

Paramétrages disponibles

Exemple

Paramétrage d’un groupement de diagramme à barres (utilisation de la routine graph-by).

Diagramme à bulles ou « bubble plot »

Routines utilisables

Paramétrages disponibles

Exemple

Paramétrage d’un diagramme à bulles (utilisation de la routine pairing-with).

Diagramme circulaire

Routines utilisables

Paramétrages disponibles

Exemple

Paramétrage d’un diagramme circulaire (utilisation de la routine distinct-by-field)

Diagramme de Venn

Routines utilisables

Paramétrages disponibles

Exemple

Paramétrage d’un diagramme de Venn (utilisation de la routine cross-by) illustrant la disponibilité des documents d’un corpus dans une ou plusieurs bases de données : la routine est appliquée sur un champ au format tableau (« Array ») dont les valeurs peuvent être uniques ou multiples.

Diagramme radar

Routines utilisables

Paramétrages disponibles

Exemple

Paramétrage d’un diagramme radar (utilisation de la routine distinct-by-field) représentant la couverture thématique en terme de disciplines scientifiques pour l’ensemble d’un corpus.

Graphe à bulles

Routines utilisables

Paramétrages disponibles

Exemple

Paramétrage d’un graphique à bulles (utilisation de la routine distinct-by) représentant le volume de publications par pays dans un corpus donné.

Graphique de flux

Routines utilisables

Paramétrages disponibles

Exemple

Paramétrage d’un graphique de flux (routine « pairing-with ») montrant pour chaque voie d’accès à la science ouverte (statut OA) l’évolution temporelle du nombre de documents correspondant dans le corpus.

Graphique hiérarchique

Routine utilisable

Paramétrages disponibles

Exemple

Paramétrage d’un arbre hiérarchique donnant le nombre de publications par éditeurs, journaux et statuts OA (« Open Access »).

Graphique réseaux

Routines utilisables

Paramétrages disponibles

Exemple