Agritrop
Home

Prédiction de la polysémie pour un terme biomédical

Lossio Ventura Juan Antonio, Jonquet Clément, Roche Mathieu, Teisseire Maguelonne. 2015. Prédiction de la polysémie pour un terme biomédical. In : Conférence en recherche d’information et applications. Association ARIA, LIMSI, LIP6, CNRS, UPMC. Paris : Association ARIA, pp. 437-452. CORIA. 12, Paris, France, 18 March 2015/20 March 2015.

Paper with proceedings
[img]
Preview
Published version - Français
Use under authorization by the author or CIRAD.
Roche-Prediction_de_la_polysemie-Com_2015.pdf

Télécharger (384kB) | Preview

Abstract : La polysémie est la caractéristique d'un terme à avoir plusieurs significations. La prédiction de la polysémie est une première étape pour l'Induction de Sens (IS), qui permet de trouver des significations différentes pour un terme, ainsi que pour les systèmes d'extraction d'information. En outre, la détection de la polysémie est importante pour la construction et l'enrichissement de terminologies et d'ontologies. Dans cet article, nous présentons une nouvelle approche pour prédire si un terme biomédical est polysémique ou non, avec l'objectif à long terme d'enrichir les ontologies biomédicales après avoir désambiguïser les termes candidats. Cette approche est basée sur l'utilisation de techniques de méta-apprentissage, plus précisément sur des méta-descripteurs. Dans ce contexte, nous proposons la définition de nouveaux méta-descripteurs, extraits directement du texte, et d'un graphe de co-occurrences des termes. Notre méthode donne des résultats très satisfaisants, avec une exactitude et F-mesure de 0.978. (Résumé d'auteur)

Résumé (autre langue) : Polysemy is the capacity for a term to have multiple meanings. Polysemy prediction is a first step for Word Sense Induction (WSI), which allows to find different meanings for a term, as well as for Information Extraction (IE) systems. In addition, the polysemy detection is important for building and enriching terminologies and ontologies. In this paper, we present a novel approach to detect if a biomedical term is polysemic or not, with the long term goal of enriching biomedical ontologies after disambiguation of candidate terms. This approach is based on meta-learning techniques, more precisely on meta-features. We propose the definition of novel meta-features, extracted directly from the text dataset, as well as from a graph of coc- current terms. Our method obtains very good results, with an Accuracy and F-mesure of 0.978. (Résumé d'auteur)

Classification Agris : C30 - Documentation and information
000 - Autres thèmes

Auteurs et affiliations

  • Lossio Ventura Juan Antonio, LIRMM (FRA)
  • Jonquet Clément, LIRMM (FRA)
  • Roche Mathieu, CIRAD-ES-UMR TETIS (FRA) ORCID: 0000-0003-3272-8568
  • Teisseire Maguelonne, LIRMM (FRA)

Source : Cirad-Agritrop (https://agritrop.cirad.fr/576045/)

View Item (staff only) View Item (staff only)

[ Page générée et mise en cache le 2019-10-05 ]