Wentzell Peter D., Wicks Chelsi C., Braga Jez W.B., Soares Liz F., Pastore Tereza C.M., Coradin Vera.T.R., Davrieux Fabrice. 2018. Implications of measurement error structure on the visualization of multivariate chemical data: hazards and alternatives. Canadian Journal of Chemistry, 96 (7) : 738-748.
Version publiée
- Anglais
Accès réservé aux personnels Cirad Utilisation soumise à autorisation de l'auteur ou du Cirad. 599877.pdf Télécharger (1MB) | Demander une copie |
Quartile : Q3, Sujet : CHEMISTRY, MULTIDISCIPLINARY
Résumé : The analysis of multivariate chemical data is commonplace in fields ranging from metabolomics to forensic classification. Many of these studies rely on exploratory visualization methods that represent the multidimensional data in spaces of lower dimensionality, such as hierarchical cluster analysis (HCA) or principal components analysis (PCA). However, such methods rely on assumptions of independent measurement errors with uniform variance and can fail to reveal important information when these assumptions are violated, as they often are for chemical data. This work demonstrates how two alternative methods, maximum likelihood principal components analysis (MLPCA) and projection pursuit analysis (PPA), can reveal chemical information hidden from more traditional techniques. Experimental data to compare different methods consists of near-infrared (NIR) reflectance spectra from 108 samples of wood that are derived from four different species of Brazilian trees. The measurement error characteristics of the spectra are examined and it is shown that, by incorporating measurement error information into the data analysis (through MLPCA) or using alternative projection criteria (i.e., PPA), samples can be separated by species. These techniques are proposed as powerful tools for multivariate data analysis in chemistry.
Résumé (autre langue) : L'analyse de données chimiques à plusieurs variables est couramment employée dans divers domaines allant de la métabolomique à la classification criminalistique. Bon nombre de ces études reposent sur des méthodes exploratoires de représentation des données multidimensionnelles dans des espaces de faible dimensionnalité, comme la classification hiérarchique (CH) ou l'analyse en composantes principales (ACP). Cependant, de telles méthodes ne sont fiables que si l'on admet que les erreurs de mesure sont indépendantes et que la variance est uniforme. Elles peuvent donc faillir à mettre en lumière d'importantes informations si ces suppositions devaient être erronées, ce qui est souvent le cas des données en chimie. Ces travaux démontrent comment deux autres méthodes, l'analyse en composantes principales à probabilité maximale (ACPPM) et la poursuite de projection (PP), permettent révéler des informations chimiques omises par des techniques plus traditionnelles. Afin de comparer expérimentalement les différentes méthodes, nous avons recueilli les spectres de réflectance dans le proche infrarouge (NIR) de 108 échantillons de bois provenant de quatre espèces d'arbres brésiliens. Nous avons examiné les caractéristiques des erreurs de mesure des spectres et nous avons observé que, en incorporant ces informations d'erreur de mesure dans l'analyse des données (par ACPPM) ou en utilisant d'autres critères de projection (c.-à-d. la PP), nous pouvons distinguer les échantillons selon l'espèce d'arbre. Ces techniques peuvent constituer de puissant outils pour l'analyse multidimensionnelle de données en chimie.
Mots-clés Agrovoc : mesure (activité), analyse de données, bois, analyse multivariée, structure chimique, classification, spectroscopie infrarouge
Mots-clés libres : Chemometrics, Exploratorry data analysis, Near-infrared spectroscopy, Measurement errors, Projection pursuit
Auteurs et affiliations
- Wentzell Peter D., Dalhousie University (CAN) - auteur correspondant
- Wicks Chelsi C., Dalhousie University (CAN)
- Braga Jez W.B., UNB [Universidade de Brasilia] (BRA)
- Soares Liz F., UNB [Universidade de Brasilia] (BRA)
- Pastore Tereza C.M., UNB [Universidade de Brasilia] (BRA)
- Coradin Vera.T.R., Serviço florestal (BRA)
- Davrieux Fabrice, CIRAD-PERSYST-UMR Qualisud (REU)
Source : Cirad-Agritrop (https://agritrop.cirad.fr/599877/)
[ Page générée et mise en cache le 2024-11-18 ]