Agritrop
Accueil

Désambiguïsation des toponymes guidée par des ressources géographiques

Bougriou Naouel, Milat Soumia. 2016. Désambiguïsation des toponymes guidée par des ressources géographiques. Constantine : Université Abdelhamid Mehri Constantine 2, 86 p. Mémoire de fin d'études : RDS : Université Abdelhamid Mehri Constantine 2

Mémoire
[img] Version publiée - Français
Accès réservé aux agents Cirad
Utilisation soumise à autorisation de l'auteur ou du Cirad.
Mémoire Master Désambiguisation.pdf

Télécharger (2MB) | Demander une copie

Résumé : Les humains ont la capacité de distinguer les différents sens des mots en langage naturel à travers l'expérience acquise dans la vie quotidienne. Nous comprenons ce que l'autre personne nous dit en utilisant le contexte dans lequel un mot est utilisé sans avoir une ambiguïté dans son sens. Tandis que l'ordinateur ne comprend pas le langage naturel parce que la base de ses traitements est présentée d'une manière formelle, par exemple en utilisant des textes (généralement écrits dans un langage naturel) comme une source de données, nous allons avoir forcément des problèmes dans le traitement et la compréhension des sens des mots. Les toponymes (noms des lieux) sont parmi les mots les plus vulnérables à l'ambiguïté. En effet un seul toponyme peut se référer à plusieurs lieux dans le monde, comme il peut représenter des personnes ou des entités ne disposant pas d'une indication géographique, pour traiter ce problème et dans le but d'enlever l'ambiguïté, des méthodes de désambiguïsation des toponymes ont été adoptées. Ces dernières années la désambiguïsation des toponymes est devenue une tâche primordiale dans plusieurs domaines tels que le web sémantique, traitement automatique des langages naturels "TALN"... Dans ce mémoire, nous avons introduit un système pour la désambiguïsation des toponymes. Ce système est basé sur deux phases, la première a pour but d'extraire les toponymes à partir d'un corpus annoté en se basant sur des méthodes d'extraction d'information, ensuite une deuxième phase en appliquant l'approche de Clustering pour la désambiguïsation des toponymes extraits.

Mots-clés libres : Fouille de textes, TALN, Désambiguïsation, Entités spatiales

Classification Agris : C30 - Documentation et information
U30 - Méthodes de recherche
U10 - Informatique, mathématiques et statistiques
B10 - Géographie

Auteurs et affiliations

  • Bougriou Naouel, Université Abdelhamid Mehri Constantine 2 (DZA)
  • Milat Soumia, Université Abdelhamid Mehri Constantine 2 (DZA)

Source : Cirad-Agritrop (https://agritrop.cirad.fr/581372/)

Voir la notice (accès réservé à la Dist) Voir la notice (accès réservé à la Dist)

[ Page générée et mise en cache le 2021-01-06 ]