Corniaux Christian, Chatellier Vincent, Dia Djiby, Duteurtre Guillaume.
2020. De l'huile de palme dans le lait : comment l'Union européenne renforce sa présence sur le marché laitier Ouest africain en vendant un succédané de poudre de lait.
In : Actes Rencontres Recherches Ruminants 2020. INRAE, IDELE
|
Version publiée
- Français
Sous licence CC0 1.0 Sans restriction de droits pour le monde entier. 3R-2020-Corniau&al.pdf Télécharger (1MB) | Prévisualisation |
Titre anglais : Palm oil in milk: how the European Union strengthens its presence on the West African dairy market by selling a milk powder substitute
Résumé : Le français du Burkina est marqué par le multilinguisme national. Dans l'objectif d'extraire automatiquement des néologismes sur des données textuelles, nous avons développé l'approche Extranéo. Celle-ci intègre des outils de Traitement automatique du langage naturel (TALN) pour détecter les néologismes formels et leurs contextes d'utilisation. Extranéo combine un étiqueteur morphosyntaxique et un lexique flexionnel pour identifier les néologismes candidats, validés ensuite manuellement. L'usage de patrons de glose permet enfin d'accéder aux contextes des néologismes validés. Dans cet article, quatre étiqueteurs morphosyntaxiques, cinq lexiques flexionnels et des marqueurs de glose sont évalués afin de détecter les plus performants. Les résultats montrent que sur les articles de journaux, l'étiqueteur TreeTagger obtient la plus forte F-mesure, 0.86 en matière d'étiquetage. Sur l'identification des néologismes candidats, les lexiques DELA et Morphalou obtiennent la Fmesure la plus élevée, 0.52. La mise en relief des contextes des néologismes validés révèle que le contexte définitoire détient la précision la plus élevée, à savoir 0.49, devant les contextes de dénomination (0.22) et d'équivalence (0.24).
Résumé (autre langue) : The French language of Burkina is marked by national multilingualism. In order to extract automatically neologisms from textual data, we have developed the Extranéo approach. This approach integrates Automatic Natural Language Processing (NLP) tools to detect formal neologisms and their contexts of use. Extranéo combines a morphosyntactic labeler and an inflectional lexicon to identify candidate neologisms, which are then validated manually. The use of gloss patterns finally allows access to the contexts of validated neologisms. In this paper, four morphosyntactic labelers, five inflectional lexicons, and gloss markers are evaluated in order to detect the most efficient ones. The results show that on newspaper articles, TreeTagger obtains the highest Fmeasure, i.e. 0.86, for labelling. To identify candidate neologisms, the DELA and Morphalou lexicons obtain the highest F-measure, i.e. 0,52. Highlighting the context of the validated neologisms reveals that the defining context has the highest accuracy, i.e. 0.49, ahead of the naming (0.22) and equivalence (0.24) contexts.
Mots-clés libres : Poudre de lait, Marché mondial, Afrique de l'Ouest, Union européenne, Huile de palme
Auteurs et affiliations
- Corniaux Christian, CIRAD-ES-UMR SELMET (SEN) ORCID: 0000-0002-0046-5989
- Chatellier Vincent, INRAE (FRA)
- Dia Djiby, ISRA (SEN)
- Duteurtre Guillaume, CIRAD-ES-UMR SELMET (FRA) ORCID: 0000-0002-5223-2589
Source : Cirad-Agritrop (https://agritrop.cirad.fr/597717/)
[ Page générée et mise en cache le 2024-06-30 ]