Valentin Sarah. 2020. Extraction and combination of epidemiological information from informal sources for animal infectious diseases surveillance. Montpellier : Université de Montpellier, 2017 p. Thèse de doctorat : Informatique : Université de Montpellier
Version publiée
- Anglais
Accès réservé aux personnels Cirad Utilisation soumise à autorisation de l'auteur ou du Cirad. ID598242.pdf Télécharger (13MB) | Demander une copie |
Url - jeu de données - Dataverse Cirad : https://doi.org/10.18167/DVN1/YGAKNB
Titre français : Extraction et combinaison d'informations épidémiologiques à partir de sources informelles pour la veille des maladies infectieuses animales
Encadrement : Roche, Mathieu ; Lancelot, Renaud
Résumé : Epidemic intelligence aims to detect, investigate and monitor potential health threats while relying on formal (e.g. official health authorities) and informal (e.g. media) information sources. Monitoring of unofficial sources, or so-called event-based surveillance (EBS), requires the development of systems designed to retrieve and process unstructured textual data published online. This manuscript focuses on the extraction and combination of epidemiological information from informal sources (i.e. online news), in the context of the international surveillance of animal infectious diseases. The first objective of this thesis is to propose and compare approaches to enhance the identification and extraction of relevant epidemiological information from the content of online news. The second objective is to study the use of epidemiological entities extracted from the news articles (i.e. diseases, hosts, locations and dates) in the context of event extraction and retrieval of related online news. This manuscript proposes new textual representation approaches by selecting, expanding, and combining relevant epidemiological features. We show that adapting and extending text mining and classification methods improve the added value of online news sources for event-based surveillance. We stress the role of domain expert knowledge regarding the relevance and the interpretability of methods proposed in this thesis. While our researches are conducted in the context of animal disease surveillance, we discuss the generic aspects of our approaches regarding unknown threats and One Health surveillance.
Résumé (autre langue) : L'intelligence épidémiologique a pour but de détecter, d'analyser et de surveiller au cours du temps les potentielles menaces sanitaires. Ce processus de surveillance repose sur des sources dites formelles, tels que les organismes de santé o ciels, et des sources dites informelles, comme les médias. La veille des sources informelles est réalisée au travers de la surveillance basée sur les événements (event-based surveillance en anglais). Ce type de veille requiert le développement d'outils dédiés à la collecte et au traitement de données textuelles non structurées publiées sur le Web. Cette thèse se concentre sur l'extraction et la combinaison d'informations épidémiologiques extraites d'articles de presse en ligne, dans le cadre de la veille des maladies infectieuses animales. Le premier objectif de cette thèse est de proposer et de comparer des approches pour améliorer l'identification et l'extraction d'informations épidémiologiques pertinentes à partir du contenu d'articles. Le second objectif est d'étudier l'utilisation de descripteurs épidémiologiques (i.e. maladies, hôtes, localisations et dates) dans le contexte de l'extraction d'événements et de la mise en relation d'articles similaires au regard de leur contenu épidémiologique. Dans ce manuscrit, nous proposons de nouvelles représentations textuelles fondées sur la sélection, l'expansion et la combinaison de descripteurs épidémiologiques. Nous montrons que l'adaptation et l'extension de méthodes de fouille de texte et de classification permet d'améliorer l'utilisation des articles en ligne tant que source de données sanitaires. Nous mettons en évidence le rôle de l'expertise quant à la pertinence et l'interprétabilité de certaines des approches proposées. Bien que nos travaux soient menés dans le contexte de la surveillance de maladies en santé animale, nous discutons des aspects génériques des méthodes proposées, vis-à-vis de de maladies inconnues et dans un contexte One Health (" une seule santé ").
Mots-clés Agrovoc : surveillance épidémiologique, épidémiologie, maladie des animaux, maladie infectieuse, fouille de textes, traitement de l'information
Mots-clés libres : Epidemic intelligence, Text Mining, Online news, Animal health, Unstructured textual data
Classification Agris : L73 - Maladies des animaux
C30 - Documentation et information
Auteurs et affiliations
- Valentin Sarah, CIRAD-BIOS-UMR ASTRE (FRA) ORCID: 0000-0002-9028-681X
Source : Cirad-Agritrop (https://agritrop.cirad.fr/598242/)
[ Page générée et mise en cache le 2024-01-29 ]