Fertas Yasmina, Younsi Imane. 2016. Extraction d'entités spatiales dans les textes guidée par des ressources linguistiques. Constantine : Université Abdelhamid Mehri Constantine 2, 70 p. Mémoire de fin d'études : STIC : Université Abdelhamid Mehri Constantine 2
Version publiée
- Français
Accès réservé aux agents Cirad Utilisation soumise à autorisation de l'auteur ou du Cirad. Mémoire Master Extraction.pdf Télécharger (3MB) | Demander une copie |
Encadrement : Belhadef, Hacenne ; Roche, Mathieu
Résumé : Face à la masse d'information en croissance continue disponible sur la toile, une multitude de disciplines aspirant à une meilleure gestion et une meilleure compréhension de ces données sont apparues. L'extraction d'information (EI) est une discipline assez récente qui consiste à analyser des textes écrits en langage naturel afin d'en extraire des informations spécifiques. Les informations géographiques sont parmi les informations qui peuvent être extraites du texte en utilisant les techniques du traitement automatique des langues naturelles (TALN). L'espace géographique est une dimension omniprésente et la façon de se référer à un lieu dans cet espace, peut être formelle basée sur les coordonnées spatiales, ou informelle, que nous employons dans la langue naturelle en utilisant les toponymes (les noms des lieux). Nous présentons dans ce mémoire des règles linguistiques d'extraction de toponymes en utilisant un outil de traitement de corpus textuel. Ces règles sont applicables sur les textes en Anglais, et ont été évaluées sur le corpus GeoSemCor en utilisant des mesures d'évaluation telles que : le rappel, la précision et la F-mesure.
Mots-clés libres : Fouille de textes, TALN, Entités spatiales
Classification Agris : C30 - Documentation et information
U30 - Méthodes de recherche
B10 - Géographie
000 - Autres thèmes
Auteurs et affiliations
- Fertas Yasmina, Université Abdelhamid Mehri Constantine 2 (DZA)
- Younsi Imane, Université Abdelhamid Mehri Constantine 2 (DZA)
Source : Cirad-Agritrop (https://agritrop.cirad.fr/581371/)
[ Page générée et mise en cache le 2022-04-21 ]