Agritrop
Accueil

Désambiguïsation des entités spatiales par apprentissage actif

Chihaoui Amal, Bouhafs Hafsia Asma, Roche Mathieu, Teisseire Maguelonne. 2018. Désambiguïsation des entités spatiales par apprentissage actif. Revue Internationale de Géomatique, 28 (2), dossier Traitement et analyse de données spatiales et temporelles : 163-189.

Article de revue ; Article de recherche ; Article de revue à comité de lecture
[img] Version publiée - Français
Accès réservé aux agents Cirad
Utilisation soumise à autorisation de l'auteur ou du Cirad.
Chihaoui_et_al_RIG_2018.pdf

Télécharger (1MB) | Demander une copie

Liste HCERES des revues (en SHS) : oui

Thème(s) HCERES des revues (en SHS) : Géographie-Aménagement-Urbanisme-Architecture

Résumé : L'extraction de connaissances spatiales à partir de documents textuels peut être une tâche difficile du fait de l'ambiguïté propre au langage naturel. L'indisponibilité de gros volumes de données étiquetées rend difficile la mise-en-oeuvre d'un processus de découverte automatique. Dans ce contexte, nous abordons le problème de la désambiguïsation des entités spatiales, entre " localisation " et " organisation ", par apprentissage actif. D'abord, nous introduisons une méthode de résolution des toponymes basée sur une analyse lexicale et contextuelle. Ensuite, nous proposons une amélioration en intégrant un modèle d'apprentissage actif. Celui-ci permet de sélectionner automatiquement les données non étiquetées les plus informatives pour l'annotation humaine. Les expérimentations sont réalisées sur un corpus de " SemEval-2007 " en anglais et soulignent l'amélioration du modèle d'apprentissage initial avec un étiquetage réduit.

Résumé (autre langue) : Discovering spatial knowledge from texts could be a difficult task due to the ambiguity of textual documents written on natural language and the lack of large amounts of annotated data for the learning process. In this context, we address the problem of spatial entity desambiguation between “location” and “organisation” with active learning methods. First, we introduce a method based on lexical and contextual analysis. Second, we improve it by adding an active learning model, in order to automatically select the most informative unlabeled data to be annotated. Experimental setups are conducted on an english “SemEval-2007” corpus and demonstrate the effectiveness of the active learning methods to improve the initial learning model with small amounts of annotations.

Mots-clés libres : Fouille de textes, Apprentissage automatique, Information spatiale

Classification Agris : 000 - Autres thèmes
C10 - Enseignement

Champ stratégique Cirad : Hors axes (2014-2018)

Auteurs et affiliations

  • Chihaoui Amal, IHEC (TUN)
  • Bouhafs Hafsia Asma, IHEC (TUN)
  • Roche Mathieu, CIRAD-ES-UMR TETIS (FRA) ORCID: 0000-0003-3272-8568
  • Teisseire Maguelonne, IRSTEA (FRA)

Source : Cirad-Agritrop (https://agritrop.cirad.fr/588530/)

Voir la notice (accès réservé à la Dist) Voir la notice (accès réservé à la Dist)

[ Page générée et mise en cache le 2021-11-10 ]