Interrogation de l’API d’OpenAlex à partir de LODEX et de son modèle associé
21/01/2025

Le c@fé Renatis du 10 décembre 2024, dédié aux retours d’usages de la base OpenAlex à l’Inist-CNRS a permis à Carine Bach, Lucile Bourguignon, Christa Guele, Philippe Houdry et Anaël Kremer du service « Appui au pilotage scientifique » de proposer un modèle pour exploiter les données OpenAlex avec Lodex.

Ce modèle vise à disposer rapidement (sous 24h) d’une étude bibliométrique minimale à l’échelle d’un laboratoire ou d’une institution à partir de la base OpenAlex via la conception d’un modèle de structuration des données et d’un « loader » (script de chargement des données) interrogeant directement l’API OpenAlex à partir de LODEX.

  • Un première version de ces « livrables » avait été publiée et détaillée au mois de juin 2024 (article sur le site Inist introduisant la première version du modèle).
  • Une deuxième version du modèle et du « loader » a été présenté lors du c@fé Renatis du 10 décembre 2024 avec entre autres les améliorations/nouveautés suivantes.

Mises à jour du « loader » pour exploiter les données OpenAlex et du modèle de structuration des données associé.

Au niveau du « loader » (utilisable à partir de la version 14.0.67 de LODEX) :

  • reconstruction de l’abstract (l’API renvoie nativement le résumé sous la forme d’une liste de mots avec leur index de position inversé)
  • quelques traitements de curation :
    • récupération de la classification thématique sous la forme « domain », « field », « subfield » et « topics »
    • ajout de la vérification de la présence des documents dans la base HAL
    • détermination de l’éditeur ayant « le plus au niveau hiérarchique » (identification parmi les éditeurs, leurs filiales et sous-filiales)
    • nettoyage des erreurs d’affiliation
    • détection des affiliations uniques
    • détection des anomalies auteurs

Au niveau du modèle :

    Le support de la présentation lors du c@fé Renatis du 10/12/24 est disponible via le lien suivant : présentation-cafe-renatis-10122024.pdf

    Le replay de la présentation est disponible sur canal U : https://www.canal-u.tv/chaines/renatis/cfe-renatis-openalex-a-inist-cnrs

     

    Yann pour l’équipe LODEX