Roche Mathieu. 2023. Text and Data Mining. Montpellier : CIRAD, 1 p.
Version publiée
- Français
Accès réservé aux personnels Cirad Utilisation soumise à autorisation de l'auteur ou du Cirad. Resume_DU_SDM_2022-23_final.pdf Télécharger (68kB) | Demander une copie |
|
Version publiée
- Anglais
Accès réservé aux personnels Cirad Utilisation soumise à autorisation de l'auteur ou du Cirad. STM_MR_Jan2023_final.pdf Télécharger (79MB) | Demander une copie |
Url - jeu de données - Dataverse Cirad : https://doi.org/10.18167/DVN1/POIZMA
Matériel d'accompagnement : 1 diaporama (109 vues)
Résumé : L'analyse des masses de données textuelles nécessite l'utilisation de méthodes mêlant harmonieusement différentes disciplines comme l'informatique, la linguistique ou les statistiques. L'ensemble de ces méthodes utiles pour traiter de telles données, souvent hétérogènes, forme le socle de la Science des Données Textuelles. Dans ce cadre, les approches de fouille de textes permettent de découvrir des connaissances utiles pour des experts issus généralement de différents domaines (santé, agriculture, etc.). Ce module présentera les fondements des approches proposées et leur mise en oeuvre à travers l'utilisation de différents outils et méthodologies dans le contexte de plusieurs projets pluridisciplinaires autour des thématiques de sécurité alimentaire et One Health (une seule santé). Les méthodes de fouille de textes mobilisent les approches éprouvées de fouille de données (cf. première partie du module) en y intégrant des traitements dédiés et des représentations spécifiquement adaptées aux données textuelles. Cet enseignement décrira des méthodes de fouille de textes qui seront appliquées à deux tâches spécifiques, à savoir l'extraction de la terminologie à partir de textes et la classification automatique de données textuelles. L'enseignement permettra d'acquérir des compétences sur les concepts fondamentaux de Science des Données Textuelles en y adossant un volet applicatif via la présentation d'outils et méthodes dédiées.
Mots-clés libres : Text Mining, Information Retrieval, Classsification, BERT, One Health, Food Security
Auteurs et affiliations
- Roche Mathieu, CIRAD-ES-UMR TETIS (FRA) ORCID: 0000-0003-3272-8568
Source : Cirad-Agritrop (https://agritrop.cirad.fr/603458/)
[ Page générée et mise en cache le 2023-02-04 ]