Roche Mathieu, Fortuno Sophie, Lossio Ventura Juan Antonio, Akli Amira, Belkebir Salim, Lounis Thinhinan, Toure Serigne. 2015. Extraction automatique des mots-clés à partir de publications scientifiques pour l'indexation et l'ouverture des données en agronomie. Cahiers Agricultures, 24 (5) : 313-320.
|
Version publiée
- Français
Utilisation soumise à autorisation de l'auteur ou du Cirad. Roche_CA_2015.pdf Télécharger (480kB) | Prévisualisation |
Url - jeu de données - Dataverse Cirad : https://doi.org/10.18167/DVN1/YMCUEY / Url - jeu de données - Dataverse Cirad : https://doi.org/10.18167/DVN1/0SD5SL
Titre anglais : Automatic extraction of keywords from scientific publications for indexing and open data in agronomy
Quartile : Q4, Sujet : AGRICULTURE, MULTIDISCIPLINARY / Quartile : Q4, Sujet : AGRONOMY
Liste HCERES des revues (en SHS) : oui
Thème(s) HCERES des revues (en SHS) : Géographie-Aménagement-Urbanisme-Architecture
Résumé : Dans le contexte des masses de données textuelles liées à l'agriculture aujourd'hui disponibles, leur indexation devient un enjeu crucial pour les organismes de recherche. Une manière d'indexer au mieux les documents consiste à en extraire la terminologie. Cet article explore l'utilisation et la combinaison de méthodologies de fouille de textes afin de mettre en exergue, puis de publier dans des systèmes d'open data, les termes les plus adaptés issus de documents. Des expérimentations menées sur des données du CIRAD (Centre de coopération internationale en recherche agronomique pour le développement), montrent le bien-fondé de la démarche qui a permis d'extraire des termes à la fois nouveaux et pertinents.
Résumé (autre langue) : With the large amounts of textual data related to agriculture now available, indexing becomes a crucial issue for research organizations. One way to index documents consists in extracting terminology. This paper investigates the use and combination of text mining methodologies to highlight and publish the most appropriate terms from documents in open data systems. Experiments conducted on CIRAD data, show the validity of the approach used to extract new and relevant terms.
Mots-clés Agrovoc : documentation, indexation d'information, traitement de l'information, analyse de données, méthodologie, automatisation, agronomie, terminologie, publication, recherche agronomique
Mots-clés libres : Documentation, Gestion des connaissances, Indexation d’information, Méthodes, Traitement des données
Classification Agris : C30 - Documentation et information
U30 - Méthodes de recherche
Champ stratégique Cirad : Hors axes (2014-2018)
Auteurs et affiliations
- Roche Mathieu, CIRAD-ES-UMR TETIS (FRA) ORCID: 0000-0003-3272-8568
- Fortuno Sophie, CIRAD-ES-UMR TETIS (FRA) ORCID: 0000-0002-4650-6627
- Lossio Ventura Juan Antonio, LIRMM (FRA)
- Akli Amira, Université de Montpellier (FRA)
- Belkebir Salim, Université de Montpellier (FRA)
- Lounis Thinhinan, Université de Montpellier (FRA)
- Toure Serigne, Université de Montpellier (FRA)
Source : Cirad-Agritrop (https://agritrop.cirad.fr/578082/)
[ Page générée et mise en cache le 2024-12-04 ]