Duperier Sandy, Grosdidier Marie, Louvet Jean-Baptiste, Pieretti Isabelle, Quillévéré-Hamard Anne. 2023. Un pipeline de traitement d'informations issues du web pour anticiper les dangers en santé des plantes. Méthodologie développée par la Plateforme ESV dans le cadre de la "Veille Sanitaire Internationale". NOV’Ae. Numéro Régulier:11 : 1-15.
|
Version publiée
- Français
Sous licence . novae-2023-NO-art11.pdf Télécharger (1MB) | Prévisualisation |
Url - éditeur : https://novae.hub.inrae.fr/les-articles-parus/les-n-reguliers/2023/art11-2023
Titre anglais : A pipeline for processing web data for anticipating plant health risks. Methodology developed by the ESV Platform in the framework of "Global Health Monitoring"
Résumé : Dans un contexte de changement climatique et d'intensification des échanges internationaux, les situations sanitaires des végétaux peuvent évoluer rapidement, avec un risque sanitaire accru. Afin d'informer au mieux les gestionnaires des risques sanitaires, la Plateforme d'Épidémiosurveillance en Santé Végétale (ESV) a mis en place une Veille Sanitaire Internationale (VSI) qui condense les éléments d'intérêt dans des bulletins publics. Cette veille relaie des informations médiatiques et scientifiques permettant d'identifier et/ou de suivre les évolutions de foyers épidémiques dans une zone géographique donnée, ainsi que des avancées scientifiques qui présentent un intérêt opérationnel. Pour répondre à ces objectifs, la Plateforme ESV a développé sa propre méthode de veille, pour laquelle la collecte d'informations est basée notamment sur le Web scraping. La chaîne de traitement des articles est semi-automatique, hybridant codes informatiques, système d'information et apports humains, permettant la diffusion de ces derniers à travers des bulletins. À ce jour, les articles diffusés par la VSI de la Plateforme ESV représentent environ 1 % de la totalité des articles collectés. Ce taux de pertinence est en lien avec les méthodes utilisées. Dans le futur, un des enjeux de l'évolution de la chaîne de traitement sera d'améliorer les processus de collecte et de tri des articles sans dénaturer la qualité des informations récupérées puis diffusées. Pour ce faire, la VSI souhaite s'appuyer sur le développement d'outils informatiques opérationnels, notamment issus de travaux de recherche.
Résumé (autre langue) : The context of climate change and the intensification of international trade leads to increasing risks for plant health as well as rapid changes in the latter. To improve the information available to those responsible for managing health risks, the French Epidemiological Plant Health Surveillance Plateform (named Plateforme ESV in french) has set up a global health monitoring system ( named VSI in french) that synthetises items of interest in the public press. This monitoring relays links media and scientific information allowing to identify and/or monitor outbreaks progress in a given geographical area, as well as scientific progress of operational interest. To obtain these goals, the ESV Platform has developed its own monitoring method in which the collecting part is mainly based on web scraping. To process articles, the pipeline is semi-automatic, combining computer codes, information systems and human contributions, leading to their dissemination in newsletters. To date, the articles disseminated by the VSI of the ESV Platform make up about 1% of all the articles collected. This rate of pertinence is linked to the methods used. In the future, one of the challenges of the pipeline will be to improve article collection and sorting process without degrading information quality collected and then disseminated. To do this, the VSI wants to focus on developing operational computing tools, in particular resulting from research activities.
Mots-clés Agrovoc : santé des plantes, surveillance épidémiologique, surveillance des cultures, maladie des plantes, traitement de l'information, ravageur des plantes, changement climatique
Mots-clés complémentaires : veille sanitaire
Mots-clés libres : Veille sanitaire, Web scraping, Média-scanning, Santé végétale, Organismes nuisibles, Epidémiosurveillance
Classification Agris : H01 - Protection des végétaux - Considérations générales
H10 - Ravageurs des plantes
H20 - Maladies des plantes
C30 - Documentation et information
Champ stratégique Cirad : CTS 4 (2019-) - Santé des plantes, des animaux et des écosystèmes
Auteurs et affiliations
- Duperier Sandy, INRAE (FRA)
- Grosdidier Marie, INRAE (FRA)
- Louvet Jean-Baptiste, INRAE (FRA)
- Pieretti Isabelle, CIRAD-BIOS-UMR PHIM (FRA) ORCID: 0009-0003-3498-1230
- Quillévéré-Hamard Anne, Université de Lyon (FRA)
Source : Cirad-Agritrop (https://agritrop.cirad.fr/610067/)
[ Page générée et mise en cache le 2024-09-02 ]