Le c@fé Renatis du 10 décembre 2024, dédié aux retours d’usages de la base OpenAlex à l’Inist-CNRS a permis à Carine Bach, Lucile Bourguignon, Christa Guele, Philippe Houdry et Anaël Kremer du service « Appui au pilotage scientifique » de proposer un modèle pour exploiter les données OpenAlex avec Lodex.
Ce modèle vise à disposer rapidement (sous 24h) d’une étude bibliométrique minimale à l’échelle d’un laboratoire ou d’une institution à partir de la base OpenAlex via la conception d’un modèle de structuration des données et d’un « loader » (script de chargement des données) interrogeant directement l’API OpenAlex à partir de LODEX.
- Un première version de ces « livrables » avait été publiée et détaillée au mois de juin 2024 (article sur le site Inist introduisant la première version du modèle).
- Une deuxième version du modèle et du « loader » a été présenté lors du c@fé Renatis du 10 décembre 2024 avec entre autres les améliorations/nouveautés suivantes.
Mises à jour du « loader » pour exploiter les données OpenAlex et du modèle de structuration des données associé.
Au niveau du « loader » (utilisable à partir de la version 14.0.67 de LODEX) :
- reconstruction de l’abstract (l’API renvoie nativement le résumé sous la forme d’une liste de mots avec leur index de position inversé)
- quelques traitements de curation :
- récupération de la classification thématique sous la forme « domain », « field », « subfield » et « topics »
- ajout de la vérification de la présence des documents dans la base HAL
- détermination de l’éditeur ayant « le plus au niveau hiérarchique » (identification parmi les éditeurs, leurs filiales et sous-filiales)
- nettoyage des erreurs d’affiliation
- détection des affiliations uniques
- détection des anomalies auteurs
Au niveau du modèle :
-
-
- prêt à l’emploi
- disponible sur GitHub
- disponible dans la galerie de modèles de la documentation LODEX
-
Le support de la présentation lors du c@fé Renatis du 10/12/24 est disponible via le lien suivant : présentation-cafe-renatis-10122024.pdf
Le replay de la présentation est disponible sur canal U : https://www.canal-u.tv/chaines/renatis/cfe-renatis-openalex-a-inist-cnrs
Yann pour l’équipe LODEX