Deleglise Hugo. 2021. Mise en relation de données hétérogènes pour le renforcement des systèmes de sécurité alimentaire - Cas de la production agricole en Afrique de l'Ouest. Montpellier : Université de Montpellier, 187 p. Thèse de doctorat : Informatique : Université de Montpellier
|
Version publiée
- Français
Utilisation soumise à autorisation de l'auteur ou du Cirad. ID600825.pdf Télécharger (6MB) | Prévisualisation |
Url - jeu de données - Dataverse Cirad : https://doi.org/10.18167/DVN1/IEJ2FH / Url - jeu de données - Dataverse Cirad : https://doi.org/10.18167/DVN1/SDMJWZ
Titre anglais : Improving food security systems by linking heterogeneous data - The case of agricultural production in West Africa
Encadrement : Roche, Mathieu ; Teisseire, Maguelonne ; Interdonato, Roberto ; Maître d'Hôtel, Elodie
Résumé : Les progrès dans la lutte contre la faim ont été significatifs en Afrique de l'Ouest et au Burkina Faso entre 2000 et 2014, avant que la situation alimentaire ne se détériore à nouveau. Les raisons sont multiples et interdépendantes : des phénomènes météorologiques extrêmes plus fréquents et l'augmentation de la population tendent à réduire la disponibilité alimentaire par habitant ; les déplacements de population dus aux conflits ont pour conséquence la chute de la production agricole et la désorganisation des circuits de distribution ; la pauvreté structurelle des populations est aggravée par un contexte économique mondial difficile. Pour suivre, analyser et prévoir les situations d'insécurité alimentaire aux échelles locales à sub-nationales, les systèmes de sécurité alimentaire (SSA) intègrent principalement des données agroclimatiques issues d'images satellites et des indicateurs de nutrition, de production et d'économie issus d'enquêtes ménages. Ces enquêtes sont essentielles à la production d'indicateurs clés pour mesurer la sécurité alimentaire (SA), mais sont coûteuses économiquement et en temps. L'objectif de cette thèse est de fournir des approches innovantes pour l'estimation d'indicateurs de SA et de leurs déterminants, en utilisant des données hétérogènes publiquement accessibles et des approches fondées sur l'intelligence artificielle, dans la perspective d'appuyer les méthodes utilisées par les SSA. Pour cela, plusieurs questions de recherche sont traitées : sur quels indicateurs s'appuyer pour mesurer la SA et quelles en sont les limites ? Comment traiter l'hétérogénéité thématique, temporelle et spatiale des données ? Comment extraire des données leur aspect explicatif, i.e., être capable d'identifier les facteurs d'augmentation ou de diminution de la SA à partir des données ? Pour répondre à ces problématiques, cette thèse propose trois contributions. Premièrement, nous faisons un état des lieux des nombreux indicateurs utilisés pour quantifier cette notion complexe qu'est la SA. Puis, nous nous concentrons sur des indicateurs de SA issus d'enquêtes ménages (i.e., le score de consommation alimentaire, le score de diversité alimentaire des ménages et l'indice des stratégies de survie réduit) et étudions ce qu'ils nous révèlent sur la SA, leur validité spatiale et temporelle, ainsi que les biais auxquels ils peuvent être sujets. Nous montrons que malgré leurs biais inhérents, ces indicateurs contiennent des informations spatiales et interannuelles cohérentes qui peuvent être exploitées pour le suivi des crises alimentaires au niveau sub-national. Deuxièmement, nous proposons des approches originales combinant des méthodes d'apprentissage automatique et profond (i.e., forêts aléatoires, réseaux de neurones convolutifs, réseaux de neurones récurrents à mémoire court-terme et long terme) pour obtenir des approximations d'indicateurs de SA issus d'enquêtes ménages. Ces approches intègrent et combinent des données explicatives hétérogènes. Les données explicatives sont des variables quantitatives (e.g., données météorologiques), des images (e.g., densités de population, occupation des sols), des points GPS (e.g., hôpitaux, écoles, événements violents) et des vecteurs (cours d'eau) avec différentes granularités temporelles et spatiales (e.g., séries temporelles, images à haute résolution spatiale). Nous mettons en évidence la pertinence des approches d'apprentissage automatique selon les données à traiter et constatons l'apport significatif de variables issues de nombreux domaines dans une approche globale. Troisièmement, nous étudions l'apport des données textuelles, possédant un fort potentiel explicatif, pour effectuer une analyse qualitative de la SA en nous basant sur un corpus de journaux burkinabés. Nous examinons la capacité des méthodes de fouille de textes à extraire automatiquement des informations qualitatives sur la situation alimentaire globale, régionale et annuelle à partir de ce corpus. Ce travail a permis d'obtenir des informations qualitatives spécifiques sur la thématique de la SA et sur ses caractéristiques spatiale et temporelle. A travers ces trois contributions, cette thèse considère la problématique de l'hétérogénéité des données liées à la SA en mettant l'accent sur les dimensions spatio-temporelles et thématiques qu'elles véhiculent. Les cadres méthodologiques génériques proposés pourront être étendus et adaptés à d'autres domaines.
Résumé (autre langue) : Progress in the fight against hunger was significant in West Africa and Burkina Faso between 2000 and 2014, before the food situation deteriorated again. The reasons are multiple and interrelated : more frequent extreme weather events and population growth tend to reduce per capita food availability ; population displacements due to conflicts result in a drop in agricultural production and the disorganization of distribution channels ; structural poverty of populations is aggravated by a difficult global economic context. To monitor, analyze and forecast food insecurity situations at local to sub-national scales, food security systems (FSS) mainly integrate agro-climatic data from satellite images and nutrition, production and economic indicators from household surveys. These surveys are essential for producing key indicators for measuring food security (FS), but are costly in terms of time and money. The objective of this thesis is to provide innovative approaches for the esti- mation of FS indicators and their determinants, using publicly available heteroge- neous data and artificial intelligence-based approaches, with a view to supporting the methods used by SSA. To this end, several research questions are addressed : which indicators should be used to measure FS and what are their limitations ? How to deal with the thematic, temporal and spatial heterogeneity of the data ? How to extract the explanatory aspect of the data, i.e., to be able to identify the factors of increase or decrease of FS from the data ? To address these issues, this thesis proposes three contributions. First, we review the numerous indicators used to quantify the complex notion of FS. Then, we focus on FS indicators derived from household surveys (i.e., the food consumption score, the household dietary diversity score, and the reduced coping strategies index) and study what they tell us about FS, their spatial and temporal validity, and the biases to which they may be subject. We show that despite their inherent biases, these indicators contain consistent spatial and inter- annual information that can be exploited for monitoring food crises at the sub- national level. Second, we propose novel approaches combining machine and deep learning methods (i.e., random forests, convolutional neural networks, recurrent neural net- works with short-term and long-term memory) to approximate FS indicators from household surveys. These approaches integrate and combine heterogeneous explanatory data. The explanatory data are quantitative variables (e.g. World Bank economic variables, weather data), images (e.g. population densities, land use), GPS points (hospitals, schools, violent events, weather stations, markets) and vec tors (rivers) with different temporal and spatial granularities (e.g. quantitative data, time series, high spatial resolution images). We highlight the relevance of machine and deep learning approaches depending on the data to be processed and note the significant contribution of variables from many domains in a global approach. Third, we study the contribution of textual data, with a strong explanatory potential, to perform a qualitative analysis of FS based on a corpus of Burkinabe newspapers. We examine the ability of text mining methods to automatically ex- tract qualitative information on the global, regional and annual food situation from this corpus. This work has provided specific qualitative information on the theme of FS and its spatial and temporal characteristics. Through these three contributions, this thesis considers the problem of the heterogeneity of data related to FS by focusing on the spatio-temporal and thematic dimensions that they convey. The proposed generic methodological frameworks can be extended and adapted to other domains.
Mots-clés Agrovoc : sécurité alimentaire, systèmes alimentaires, production agricole, production alimentaire, indicateur, fouille de textes, analyse de données
Mots-clés géographiques Agrovoc : Afrique occidentale, Burkina Faso
Classification Agris : E10 - Économie et politique agricoles
C30 - Documentation et information
U10 - Informatique, mathématiques et statistiques
Auteurs et affiliations
- Deleglise Hugo, CIRAD-ES-UMR TETIS (FRA)
Source : Cirad-Agritrop (https://agritrop.cirad.fr/600825/)
[ Page générée et mise en cache le 2024-01-29 ]