Agritrop
Home

Exploitation de l'hétérogénéité dans les données textuelles. Utilisation de données produites à Madagascar

Fize Jacques, Roche Mathieu, Teisseire Maguelonne. 2019. Exploitation de l'hétérogénéité dans les données textuelles. Utilisation de données produites à Madagascar. Recherche d'information, Document et Web Sémantique, 2 (1), 5 p.

Journal article ; Article de recherche ; Article de revue à comité de lecture Revue en libre accès total
[img]
Preview
Published version - Français
Use under authorization by the author or CIRAD.
Fize_et_al_RIDoWS_2019.pdf

Télécharger (1MB) | Preview

Url - jeu de données : https://doi.org/10.18167/DVN1/JLXBLA

Titre anglais : Harness the hetorogeneity in textual data. Use of data produced in Madagascar

Abstract : Depuis plusieurs décennies, on observe une utilisation croissante des systèmes d'information, ce qui provoque une augmentation exponentielle des données textuelles. Bien que l'aspect volumétrique de ces données textuelles soit résolu, sa dimension hétérogène reste un défi pour la communauté scientifique. La maitrise de ces données hétérogènes offre de nombreuses opportunités par un accès à une information plus riche. Dans nos travaux, nous concevons un processus de mise en correspondance de données textuelles hétérogènes, basé sur leur spatialité. Dans cet article, nous présentons les résultats retournés par ce processus sur des données produites à Madagascar dans le cadre du projet BVLAC, dirigé par le CIRAD. En se basant sur un ensemble de 4 critères de qualité, nous obtenons de bonnes correspondances spatiales entre ces documents.

Résumé (autre langue) : Over the last decades, there has been an increasing use of information systems, resulting in an exponential increase in textual data. Although the volumetric dimension of these textual data has been resolved, its heterogeneous dimension remains a challenge for the scientific community. The management of the heterogeneity in data offers many opportunities through an access to a richer information. In our work, we design a process for mapping heterogeneous textual data, based on their spatiality. In this article, we present the results returned by this process on data produced in Madagascar as part of the BVLAC project, led by CIRAD. Based on a set of 4 quality criteria, we obtain good spatial correspondence between these documents.

Mots-clés Agrovoc : fouille de données, Géographie, Informatique

Mots-clés géographiques Agrovoc : Madagascar

Mots-clés complémentaires : Représentation graphique

Mots-clés libres : Fouille de textes, Données hétérogènes, Données spatiales, Similarités spatiales, Représentations spatiales

Classification Agris : C30 - Documentation and information
B10 - Geography

Champ stratégique Cirad : CTS 7 (2019-) - Hors champs stratégiques

Auteurs et affiliations

Source : Cirad-Agritrop (https://agritrop.cirad.fr/591447/)

View Item (staff only) View Item (staff only)

[ Page générée et mise en cache le 2021-06-02 ]