Agritrop
Home

Mise en correspondance de données textuelles hétérogènes à partir d'informations sémantiques

Yahi Nourelhouda, Belhadef Hacene, Roche Mathieu. 2016. Mise en correspondance de données textuelles hétérogènes à partir d'informations sémantiques. In : Atelier qualité des données du Web (QLOD'16). Samira Si-said Cherfi (ed.), Fayçal Hamdi (ed.). Reims : Université de Reims Champagne-Ardenne, pp. 1-6. Conférence Internationale Francophone sur l'Extraction et la Gestion des Connaissances. 16, Reims, France, 18 November 2016/22 November 2016.

Paper with proceedings
[img]
Preview
Published version - Français
Use under authorization by the author or CIRAD.
article_QLOD_workshopEGC16.pdf

Télécharger (381kB) | Preview

Abstract : Dans cet article, nous présentons une approche pour mesurer la similarité sémantique entre des textes hétérogènes et de qualité différente provenant de différentes sources Web. Notre approche commence par extraire le contenu des textes par deux méthodes : (i) utilisation d'un système d'extraction que nous avons implanté et qui identifie tous les mots contenus dans un texte donné, (ii) utilisation d'un thésaurus multilingue (AGROVOC). Ensuite, nous combinons les résultats des deux approches afin de mesurer la similarité entre les représentations textuelles des documents. Afin d'évaluer les résultats, nous nous appuyons sur deux ensembles de données hétérogènes issus du Web (tweets et articles scientifiques). (Résumé d'auteur)

Classification Agris : C30 - Documentation and information
U10 - Mathematical and statistical methods
U30 - Research methods

Auteurs et affiliations

  • Yahi Nourelhouda, Université Abdelhamid Mehri Constantine 2 (DZA)
  • Belhadef Hacene, Université Abdelhamid Mehri Constantine 2 (DZA)
  • Roche Mathieu, CIRAD-ES-UMR TETIS (FRA) ORCID: 0000-0003-3272-8568

Source : Cirad-Agritrop (https://agritrop.cirad.fr/579656/)

View Item (staff only) View Item (staff only)

[ Page générée et mise en cache le 2019-10-01 ]