Toulet Anne, Michel Franck, Tchechmedjiev Andon. 2022. Rapport scientifique du Projet ISSA. Montpellier : CIRAD-DG-DIST, 11 p.
|
Version publiée
- Français
Sous licence . Rapport-scientifique-ISSA_CIRAD_aap19-20.pdf Télécharger (1MB) | Prévisualisation |
Résumé : Les services d'information scientifique et technique ont toujours été confrontés aux questions de gestion documentaire. Leur mission leur confère une responsabilité dans la conservation, la mise à disposition et la valorisation de ressources culturelles ou issues de la recherche. Dans cette optique, ce projet s'intéresse à l'indexation sémantique des publications dans une archive ouverte et à l'exploitation de cette indexation pour développer des services aux chercheurs et aux documentalistes dans une perspective de science ouverte. La méthodologie mise en oeuvre, adossée aux principes FAIR, se veut résolument générique : elle est exploitable par toute communauté adoptant ces mêmes principes au travers de métadonnées interopérables, en particulier dans le cadre de systèmes de gestion de ressources documentaires. L'objectif du projet est triple : (1) Fournir un pipeline générique, réutilisable et extensible pour l'analyse des documents d'une archive scientifique ouverte ; (2) Traduire les résultats en un index sémantique sous la forme d'un graphe de connaissances RDF ; (3) Développer des services innovants de recherche et de visualisation exploitant cet index. Les traitements font appel à diverses techniques d'intelligence artificielle : TALN, ingénierie des connaissances, web sémantique. Les métadonnées et le texte intégral des publications sont traités afin d'en extraire des descripteurs thématiques et des entités nommées . Pour exploiter au mieux la puissance du web sémantique, les descripteurs thématiques et les entités nommées sont liés à des référentiels sémantiques (bases de connaissance, ontologies, thésaurus) tels que Wikidata, DBpedia et GeoNames. Le graphe de connaissances résultant sert de clé de voûte au développement de services de recherche et de visualisation. Agritrop, l'archive ouverte des publications du Cirad, a servi de cas d'usage et de preuve de concept tout au long du projet.
Mots-clés libres : Indexation, Métadonnées, Web des données, Web sémantique, Science ouverte, Visualisation
Agences de financement hors UE : CollEx-Persée
Projets sur financement : (FRA)Indexation Sémantique d'une archive scientifique et Services Associés pour la science ouverte
Auteurs et affiliations
- Toulet Anne ORCID: 0000-0003-0463-0854
- Michel Franck, INRIA (FRA)
- Tchechmedjiev Andon, Ecole des mines d'Alès (FRA)
Source : Cirad-Agritrop (https://agritrop.cirad.fr/603282/)
[ Page générée et mise en cache le 2023-04-26 ]