Agritrop
Home

Méthodologie pour identifier les terrains d'étude dans des corpus scientifiques

Kergosien Eric, Bessagnet Marie-Noëlle, Teisseire Maguelonne, Schöpfel Joachim, Farvardin Mohammad Amin, Chaudiron Stephane, Jacquemin Bernard, Le Parc Lacayrelle Annig, Roche Mathieu, Sallaberry Christian, Tonneau Jean-Philippe. 2017. Méthodologie pour identifier les terrains d'étude dans des corpus scientifiques. Document Numérique, 20 (2-3) : pp. 11-30.

Journal article ; Article de recherche ; Article de revue à comité de lecture
[img] Published version - Français
Access restricted to CIRAD agents
Use under authorization by the author or CIRAD.
Kergosien_et_al_DN_2017_vfinale.pdf

Télécharger (1MB) | Request a copy

Url - éditeur : https://www.cairn.info/revue-document-numerique-2017-2-page-11.htm / Url - éditeur : https://dn.revuesonline.com/article.jsp?articleId=39554

Abstract : Le projet interdisciplinaire TERRE-ISTEX a pour objectif d'identifier l'évolution des fronts de recherche en relation avec les territoires d'études, les croisements disciplinaires ainsi que les modalités concrètes de recherche à partir des contenus numériques hétérogènes disponibles dans les corpus scientifiques. Le projet se décompose en trois actions principales : (1) identifier les périodes et les lieux qui ont fait l'objet d'études empiriques et dont rendent compte les publications issues des corpus analysés, (2) identifier les thématiques traitées dans le cadre de ces études et enfin (3) développer un démonstrateur web de recherche d'information géographique (RIG). Les deux premières actions font intervenir des approches combinant des patrons du traitement automatique du langage naturel à des méthodes de fouille de textes. En croisant les trois dimensions (spatial, thématique et temporel) dans un moteur de RIG, il sera ainsi possible de comprendre quelles recherches ont été menées sur quels territoires et à quel moment. Dans le cadre du projet, les expérimentations sont menées sur un corpus hétérogène constitué de thèses électroniques et d'articles scientifiques provenant des bibliothèques numériques d'ISTEX et du centre de recherche CIRAD.

Résumé (autre langue) : The TERRE-ISTEX project aims at identifying the evolution of research working relation to study areas, disciplinary crossings and concrete research methods based on the heterogeneous digital content available in scientific corpora. The project is divided into three main actions : (1) to identify the periods and places which have been the subject of empirical studies, and which reflect the publications resulting from the corpus analyzed, (2) to identify the thematics addressed in these works and (3) to develop a web-based geographical information retrieval tool (GIR). The first two actions involve approaches combining Natural languages processing patterns with text mining methods. By crossing the three dimensions (spatial, thematic and temporal) in a GIR engine, it will be possible to understand what research has been carried out on which territories and at what time. In the project, the experiments are carried out on a heterogeneous corpus including electronic thesis and scientific articles from the ISTEX digital libraries and the CIRAD research center.

Mots-clés libres : Fouille de textes, Recherche d’information géographique, Traitement automatique du langage naturel, Scientométrie, Analyse de documents

Classification Agris : C30 - Documentation and information
A50 - Agricultural research
B10 - Geography

Champ stratégique Cirad : Hors axes (2014-2018)

Auteurs et affiliations

  • Kergosien Eric, Université de Lille (FRA)
  • Bessagnet Marie-Noëlle, UPPA (FRA)
  • Teisseire Maguelonne, IRSTEA (FRA)
  • Schöpfel Joachim, Université de Lille (FRA)
  • Farvardin Mohammad Amin, Université de Lille (FRA)
  • Chaudiron Stephane, Université de Lille (FRA)
  • Jacquemin Bernard, Université de Lille (FRA)
  • Le Parc Lacayrelle Annig, UPPA (FRA)
  • Roche Mathieu, CIRAD-ES-UMR TETIS (FRA) ORCID: 0000-0003-3272-8568
  • Sallaberry Christian, UPPA (FRA)
  • Tonneau Jean-Philippe, CIRAD-ES-UMR TETIS (FRA) ORCID: 0000-0003-4331-7238

Source : Cirad-Agritrop (https://agritrop.cirad.fr/588570/)

View Item (staff only) View Item (staff only)

[ Page générée et mise en cache le 2021-02-23 ]