Grimaj Meryem. 2024. Utilisation du Machine Learning pour la cartographie de la répartition annuelle des espèces végétales sur le Sahel selon les facteurs environnementaux. Rabat : IAV Hassan II, 124 p. Mémoire d'ingénieur d'état : Agronomie. Ingénierie data science en agriculture : Institut agronomique et vétérinaire Hassan II
|
Version publiée
- Français
Utilisation soumise à autorisation de l'auteur ou du Cirad. RapportGRIMAJMeryem.pdf Télécharger (3MB) | Prévisualisation |
Encadrement : Taugourdeau, Simon ; Bensiali, Saloua
Résumé : La région du Sahel, une bande semi-aride située entre le désert du Sahara et la savane soudanienne, est soumise à des conditions environnementales extrêmes. Elle se caractérise par des précipitations irrégulières et souvent insuffisantes, entrainant des périodes de sècheresse récurrentes et une dégradation significative des sols. Ces conditions exacerbent les problèmes existants tels que l'insécurité alimentaire, la perte de biodiversité et la dégradation des terres, rendant la région particulièrement vulnérable aux changements climatiques. Or, la végétation sahélienne joue un rôle crucial dans la stabilisation des sols, la régulation du climat local et le soutien des moyens de subsistance des populations locales. Ainsi, prédire la répartition des espèces végétales dans une région aussi vaste et variée est essentiel. Pour répondre à cette problématique, notre étude vise à atteindre trois objectifs principaux. Notamment, prédire la répartition spatiale et temporelle des espèces végétales dominantes dans le Sahel, tester différents modèles de Machine Learning pour la spatialisation des données de présence des espèces végétales, et trouver le modèle de distribution adéquat pour chaque type de végétation (herbacées et arborées). Des cartes de distribution annuelles exploitables seront générées. Les données utilisées proviennent principalement de la base de données FLOTROP (Taugourdeau et al, 2019), contenant huit herbacées et deux arbres. Nous l'avons enrichie de variables environnementales telles que les précipitations, la température et le type de sol ainsi que l'indice de pluviométrie. Les techniques de modélisation incluent des méthodes de Machine Learning tels que les forêts aléatoires, MaxEnt, SVM, GLM, GAM et CNN, avec une validation des résultats à partir de données de l'herbier disponible au CIRAD. La méthodologie repose sur la collecte, le prétraitement et l'analyse de données environnementales et d'occurrence des espèces végétales pour modéliser leur distribution. Les résultats montrent que les forêts aléatoires (RF) sont particulièrement adaptées pour modéliser la distribution des herbacées, tandis que les réseaux de neurones convolutifs (CNN) sont plus performants pour les espèces arborées. Cependant, les deux modèles peuvent être utilisés pour les deux types d'espèces. Les modèles prédictifs ont permis de générer des cartes de distribution annuelles détaillées et exploitables, indiquant les zones où les conditions environnementales sont favorables ou défavorables à la présence des espèces. Ces cartes sont essentielles pour la gestion et la conservation des ressources végétales dans le Sahel.
Résumé (autre langue) : The Sahel region, a semi-arid strip located between the Sahara Desert and the Sudanian savanna, is subject to extreme environmental conditions. It is characterized by irregular and often insufficient precipitation, leading to recurrent drought periods and significant soil degradation. These conditions exacerbate existing problems such as food insecurity, biodiversity loss, and land degradation, making the region particularly vulnerable to climate change. Sahelian vegetation plays a crucial role in soil stabilization, local climate regulation, and supporting the livelihoods of local populations Therefore, predicting the distribution of plant species in such a vast and varied region is essential. To address this issue, our study aims to achieve three main objectives. Specifically, to predict the spatial and temporal distribution of dominant plant species in the Sahel, to test different Machine Learning models for spatializing the presence data of plant species, and to find the appropriate distribution model for each type of vegetation (herbaceous and tree species). Additionally, usable annual distribution maps will be generated. The data used come mainly from the FLOTROP database (Taugourdeau et al., 2019). It contains eight herbaceous species and two trees. We enriched it with environmental variables such as precipitation, temperature, soil type, and rainfall index. The modeling techniques include machine learning methods such as random forests, MaxEnt, SVM, GLM, GAM, and CNN, with validation of results using herbarium data available from CIRAD. The methodology involves the collection, preprocessing, and analysis of environmental and occurrence data to model the distribution of plant species. The results show that Random Forests (RF) are particularly well-suited for modeling the distribution of herbaceous species, while Convolutional Neural Networks (CNN) perform better for tree species. However, either model can be used for both types of species. The predictive models have enabled the generation of detailed and usable annual distribution maps, indicating areas where environmental conditions are favorable or unfavorable for species presence. These maps are essential for the management and conservation of plant resources in the Sahel.
Mots-clés libres : Machine Learning, Sahel
Agences de financement hors UE : Centre de Coopération Internationale en Recherche Agronomique pour le Développement
Auteurs et affiliations
- Grimaj Meryem, IAV Hassan II (MAR)
Source : Cirad-Agritrop (https://agritrop.cirad.fr/610135/)
[ Page générée et mise en cache le 2024-08-27 ]