Kergosien Eric, Bessagnet Marie-Noëlle, Teisseire Maguelonne, Schöpfel Joachim, Farvardin Mohammad Amin, Chaudiron Stephane, Jacquemin Bernard, Le Parc Lacayrelle Annig, Roche Mathieu, Sallaberry Christian, Tonneau Jean-Philippe. 2017. Méthodologie pour identifier les terrains d'étude dans des corpus scientifiques. Document Numérique, 20 (2-3) : 11-30.
Version publiée
- Français
Accès réservé aux personnels Cirad Utilisation soumise à autorisation de l'auteur ou du Cirad. Kergosien_et_al_DN_2017_vfinale.pdf Télécharger (1MB) | Demander une copie |
Url - éditeur : https://www.cairn.info/revue-document-numerique-2017-2-page-11.htm / Url - éditeur : https://dn.revuesonline.com/article.jsp?articleId=39554
Résumé : Le projet interdisciplinaire TERRE-ISTEX a pour objectif d'identifier l'évolution des fronts de recherche en relation avec les territoires d'études, les croisements disciplinaires ainsi que les modalités concrètes de recherche à partir des contenus numériques hétérogènes disponibles dans les corpus scientifiques. Le projet se décompose en trois actions principales : (1) identifier les périodes et les lieux qui ont fait l'objet d'études empiriques et dont rendent compte les publications issues des corpus analysés, (2) identifier les thématiques traitées dans le cadre de ces études et enfin (3) développer un démonstrateur web de recherche d'information géographique (RIG). Les deux premières actions font intervenir des approches combinant des patrons du traitement automatique du langage naturel à des méthodes de fouille de textes. En croisant les trois dimensions (spatial, thématique et temporel) dans un moteur de RIG, il sera ainsi possible de comprendre quelles recherches ont été menées sur quels territoires et à quel moment. Dans le cadre du projet, les expérimentations sont menées sur un corpus hétérogène constitué de thèses électroniques et d'articles scientifiques provenant des bibliothèques numériques d'ISTEX et du centre de recherche CIRAD.
Résumé (autre langue) : The TERRE-ISTEX project aims at identifying the evolution of research working relation to study areas, disciplinary crossings and concrete research methods based on the heterogeneous digital content available in scientific corpora. The project is divided into three main actions : (1) to identify the periods and places which have been the subject of empirical studies, and which reflect the publications resulting from the corpus analyzed, (2) to identify the thematics addressed in these works and (3) to develop a web-based geographical information retrieval tool (GIR). The first two actions involve approaches combining Natural languages processing patterns with text mining methods. By crossing the three dimensions (spatial, thematic and temporal) in a GIR engine, it will be possible to understand what research has been carried out on which territories and at what time. In the project, the experiments are carried out on a heterogeneous corpus including electronic thesis and scientific articles from the ISTEX digital libraries and the CIRAD research center.
Mots-clés libres : Fouille de textes, Recherche d’information géographique, Traitement automatique du langage naturel, Scientométrie, Analyse de documents
Classification Agris : C30 - Documentation et information
A50 - Recherche agronomique
B10 - Géographie
Champ stratégique Cirad : Hors axes (2014-2018)
Auteurs et affiliations
- Kergosien Eric, Université de Lille (FRA)
- Bessagnet Marie-Noëlle, UPPA (FRA)
- Teisseire Maguelonne, IRSTEA (FRA)
- Schöpfel Joachim, Université de Lille (FRA)
- Farvardin Mohammad Amin, Université de Lille (FRA)
- Chaudiron Stephane, Université de Lille (FRA)
- Jacquemin Bernard, Université de Lille (FRA)
- Le Parc Lacayrelle Annig, UPPA (FRA)
- Roche Mathieu, CIRAD-ES-UMR TETIS (FRA) ORCID: 0000-0003-3272-8568
- Sallaberry Christian, UPPA (FRA)
- Tonneau Jean-Philippe, CIRAD-ES-UMR TETIS (FRA) ORCID: 0000-0003-4331-7238
Source : Cirad-Agritrop (https://agritrop.cirad.fr/588570/)
[ Page générée et mise en cache le 2024-11-28 ]