Metz Maxime, Lesnoff Matthieu, Roger Jean-Michel.
2019. Un algorithme big-data pour la local-PLS.
In : Livret des résumés des 20èmes Rencontres HélioSPIR. HélioSPIR
|
Version publiée
- Français
Utilisation soumise à autorisation de l'auteur ou du Cirad. ID593675.pdf Télécharger (522kB) | Prévisualisation |
Résumé : La spectrométrie proche infrarouge peut fournir d'énormes quantités de données à l'agriculture numérique. Un des outils principaux utilisé pour analyser les spectres est la PLS. La méthode a prouvé sa pertinence pour les petites bases de données homogènes. Son extension aux bases de taille moyenne est la "local-PLS" : elle détermine un voisinage de l'individu à prédire, puis réalise une PLS sur ce voisinage. Cette méthode combine la puissance de la méthode des k plus proches voisins et de la PLS. Cependant, cette méthode n'est pas capable de traiter de grandes bases de données qui apparaîtront dans un futur proche. Les algorithmes local-PLS actuels utilisent tous des algorithmes k-NN (méthode force brute) pour lesquels les temps de calcul deviennent irréalistes ; d'autres algorithmes doivent être considérés. Nous proposons d'étudier un algorithme de réduction de dimensionnalité et de recherche rapide du voisinage utilisé pour traiter de grands ensembles de séries chronologiques (ayant une structure de données similaire aux spectres NIR) : ParSketch. Dans cette présentation, nous allons étudier la méthode ParSketch et la comparer à la méthode k-nn. Pour cela, nous avons traité un problème de classification et étudié les résultats des méthodes ParSketch-PLS-DA, Knn(force brute)-PLS-DA et PLS-DA.
Auteurs et affiliations
- Metz Maxime, IRSTEA (FRA)
- Lesnoff Matthieu, CIRAD-ES-UMR SELMET (FRA) ORCID: 0000-0002-5205-9763
- Roger Jean-Michel, IRSTEA (FRA)
Source : Cirad-Agritrop (https://agritrop.cirad.fr/593675/)
[ Page générée et mise en cache le 2022-01-13 ]