Agritrop
Accueil

Text and Data Mining

Roche Mathieu. 2023. Text and Data Mining. Montpellier : CIRAD, 1 p.

Support de cours
[img] Version publiée - Français
Accès réservé aux personnels Cirad
Utilisation soumise à autorisation de l'auteur ou du Cirad.
Resume_DU_SDM_2022-23_final.pdf

Télécharger (68kB) | Demander une copie
[img] Version publiée - Anglais
Accès réservé aux personnels Cirad
Utilisation soumise à autorisation de l'auteur ou du Cirad.
STM_MR_Jan2023_final.pdf

Télécharger (79MB) | Demander une copie

Url - jeu de données - Dataverse Cirad : https://doi.org/10.18167/DVN1/POIZMA

Matériel d'accompagnement : 1 diaporama (109 vues)

Résumé : L'analyse des masses de données textuelles nécessite l'utilisation de méthodes mêlant harmonieusement différentes disciplines comme l'informatique, la linguistique ou les statistiques. L'ensemble de ces méthodes utiles pour traiter de telles données, souvent hétérogènes, forme le socle de la Science des Données Textuelles. Dans ce cadre, les approches de fouille de textes permettent de découvrir des connaissances utiles pour des experts issus généralement de différents domaines (santé, agriculture, etc.). Ce module présentera les fondements des approches proposées et leur mise en oeuvre à travers l'utilisation de différents outils et méthodologies dans le contexte de plusieurs projets pluridisciplinaires autour des thématiques de sécurité alimentaire et One Health (une seule santé). Les méthodes de fouille de textes mobilisent les approches éprouvées de fouille de données (cf. première partie du module) en y intégrant des traitements dédiés et des représentations spécifiquement adaptées aux données textuelles. Cet enseignement décrira des méthodes de fouille de textes qui seront appliquées à deux tâches spécifiques, à savoir l'extraction de la terminologie à partir de textes et la classification automatique de données textuelles. L'enseignement permettra d'acquérir des compétences sur les concepts fondamentaux de Science des Données Textuelles en y adossant un volet applicatif via la présentation d'outils et méthodes dédiées.

Mots-clés libres : Text Mining, Information Retrieval, Classsification, BERT, One Health, Food Security

Auteurs et affiliations

Source : Cirad-Agritrop (https://agritrop.cirad.fr/603458/)

Voir la notice (accès réservé à la Dist) Voir la notice (accès réservé à la Dist)

[ Page générée et mise en cache le 2023-02-04 ]