Agritrop
Home

Spatial Textual Representation (STR) ou comment représenter la spatialité des données textuelles

Fize Jacques, Roche Mathieu, Teisseire Maguelonne. 2017. Spatial Textual Representation (STR) ou comment représenter la spatialité des données textuelles. In : Spatial Analysis and GEOmatics. Université de Rouen Normandie, INSA. Rouen : Université de Rouen Normandie, 15 p. SAGEO 2017, Rouen, France, 6 November 2017/9 November 2017.

Paper with proceedings
[img]
Preview
Published version - Français
Use under authorization by the author or CIRAD.
jacques_fize_sageo_17.pdf

Télécharger (730kB) | Preview

Abstract : De nos jours, la majorité des systèmes de recherche d'information (RI) basent leurs algorithmes de recherche et d'indexation de document sur leur dimension thématique. Dans le cadre de l'étude de la mise en correspondance de données textuelles hétérogènes, nous proposons une approche permettant d'exploiter la dimension spatiale des données textuelles à travers une structure appelée STR ou Spatial Textual Representation. STR est une structure de graphe qui permet de représenter la configuration spatiale d'un document à l'aide d'informations du texte et de sources externes (gazetier). Pour créer ces graphes, nous extrayons tout d'abord les entités spatiales. Puis, nous relions les entités spatiales selon différentes relations (adjacence, inclusion, .. .). Enfin, nous évaluons plusieurs mesures de similarités, propres aux graphes, sur la structure proposée. Les expérimentations sont menées sur 3 corpus distincts. (Résumé d'auteur)

Résumé (autre langue) : Nowadays, many Information Retrieval (IR) systems base their research and indexation algorithm on the thematic dimension of the text. As part of the study of matching heterogeneous textual documents, we investigate the spatial dimension of textual data using an original approach called STR. STR or Spatial Textual Representation is a graph structure which allows to represent spatial configuration in text using intern and external sources of information. In order to create such graph, we extract spatial entities in documents. Then we link the spatial entities using different relationships (i.e neighbor, inclusion, .. .). Finally, we evaluate different similarity measures related to graph on the proposed structure. The experiments were realized using 3 corpora.

Mots-clés libres : Fouille de textes, Information spatiale, Données hétérogènes

Classification Agris : C30 - Documentation and information
U30 - Research methods
U10 - Computer science, mathematics and statistics
000 - Other themes

Auteurs et affiliations

Source : Cirad-Agritrop (https://agritrop.cirad.fr/586145/)

View Item (staff only) View Item (staff only)

[ Page générée et mise en cache le 2021-01-10 ]