Fize Jacques, Roche Mathieu, Teisseire Maguelonne. 2019. Exploitation de l'hétérogénéité dans les données textuelles. Utilisation de données produites à Madagascar. Recherche d'information, Document et Web Sémantique, 2 (1), 5 p.
|
Version publiée
- Français
Utilisation soumise à autorisation de l'auteur ou du Cirad. Fize_et_al_RIDoWS_2019.pdf Télécharger (1MB) | Prévisualisation |
Url - jeu de données - Dataverse Cirad : https://doi.org/10.18167/DVN1/JLXBLA
Titre anglais : Harness the hetorogeneity in textual data. Use of data produced in Madagascar
Résumé : Depuis plusieurs décennies, on observe une utilisation croissante des systèmes d'information, ce qui provoque une augmentation exponentielle des données textuelles. Bien que l'aspect volumétrique de ces données textuelles soit résolu, sa dimension hétérogène reste un défi pour la communauté scientifique. La maitrise de ces données hétérogènes offre de nombreuses opportunités par un accès à une information plus riche. Dans nos travaux, nous concevons un processus de mise en correspondance de données textuelles hétérogènes, basé sur leur spatialité. Dans cet article, nous présentons les résultats retournés par ce processus sur des données produites à Madagascar dans le cadre du projet BVLAC, dirigé par le CIRAD. En se basant sur un ensemble de 4 critères de qualité, nous obtenons de bonnes correspondances spatiales entre ces documents.
Résumé (autre langue) : Over the last decades, there has been an increasing use of information systems, resulting in an exponential increase in textual data. Although the volumetric dimension of these textual data has been resolved, its heterogeneous dimension remains a challenge for the scientific community. The management of the heterogeneity in data offers many opportunities through an access to a richer information. In our work, we design a process for mapping heterogeneous textual data, based on their spatiality. In this article, we present the results returned by this process on data produced in Madagascar as part of the BVLAC project, led by CIRAD. Based on a set of 4 quality criteria, we obtain good spatial correspondence between these documents.
Mots-clés Agrovoc : fouille de données, géographie, informatique
Mots-clés géographiques Agrovoc : Madagascar
Mots-clés complémentaires : Représentation graphique
Mots-clés libres : Fouille de textes, Données hétérogènes, Données spatiales, Similarités spatiales, Représentations spatiales
Classification Agris : C30 - Documentation et information
B10 - Géographie
Champ stratégique Cirad : CTS 5 (2019-) - Territoires
Auteurs et affiliations
- Fize Jacques, CIRAD-ES-UMR TETIS (FRA) ORCID: 0000-0003-1783-934X
- Roche Mathieu, CIRAD-ES-UMR TETIS (FRA) ORCID: 0000-0003-3272-8568
- Teisseire Maguelonne, IRSTEA (FRA)
Source : Cirad-Agritrop (https://agritrop.cirad.fr/591447/)
[ Page générée et mise en cache le 2024-01-29 ]