Agritrop
Accueil

Exploitation de l'hétérogénéité dans les données textuelles. Utilisation de données produites à Madagascar

Fize Jacques, Roche Mathieu, Teisseire Maguelonne. 2019. Exploitation de l'hétérogénéité dans les données textuelles. Utilisation de données produites à Madagascar. Recherche d'information, Document et Web Sémantique, 2 (1), 5 p.

Article de revue ; Article de recherche ; Article de revue à comité de lecture Revue en libre accès total
[img]
Prévisualisation
Version publiée - Français
Utilisation soumise à autorisation de l'auteur ou du Cirad.
Fize_et_al_RIDoWS_2019.pdf

Télécharger (1MB) | Prévisualisation

Url - jeu de données - Dataverse Cirad : https://doi.org/10.18167/DVN1/JLXBLA

Titre anglais : Harness the hetorogeneity in textual data. Use of data produced in Madagascar

Résumé : Depuis plusieurs décennies, on observe une utilisation croissante des systèmes d'information, ce qui provoque une augmentation exponentielle des données textuelles. Bien que l'aspect volumétrique de ces données textuelles soit résolu, sa dimension hétérogène reste un défi pour la communauté scientifique. La maitrise de ces données hétérogènes offre de nombreuses opportunités par un accès à une information plus riche. Dans nos travaux, nous concevons un processus de mise en correspondance de données textuelles hétérogènes, basé sur leur spatialité. Dans cet article, nous présentons les résultats retournés par ce processus sur des données produites à Madagascar dans le cadre du projet BVLAC, dirigé par le CIRAD. En se basant sur un ensemble de 4 critères de qualité, nous obtenons de bonnes correspondances spatiales entre ces documents.

Résumé (autre langue) : Over the last decades, there has been an increasing use of information systems, resulting in an exponential increase in textual data. Although the volumetric dimension of these textual data has been resolved, its heterogeneous dimension remains a challenge for the scientific community. The management of the heterogeneity in data offers many opportunities through an access to a richer information. In our work, we design a process for mapping heterogeneous textual data, based on their spatiality. In this article, we present the results returned by this process on data produced in Madagascar as part of the BVLAC project, led by CIRAD. Based on a set of 4 quality criteria, we obtain good spatial correspondence between these documents.

Mots-clés Agrovoc : fouille de données, géographie, informatique

Mots-clés géographiques Agrovoc : Madagascar

Mots-clés complémentaires : Représentation graphique

Mots-clés libres : Fouille de textes, Données hétérogènes, Données spatiales, Similarités spatiales, Représentations spatiales

Classification Agris : C30 - Documentation et information
B10 - Géographie

Champ stratégique Cirad : CTS 5 (2019-) - Territoires

Auteurs et affiliations

Source : Cirad-Agritrop (https://agritrop.cirad.fr/591447/)

Voir la notice (accès réservé à Agritrop) Voir la notice (accès réservé à Agritrop)

[ Page générée et mise en cache le 2024-01-29 ]