Panckhurst Rachel, Détrie Catherine, Lopez Cédric, Moïse Claudine, Roche Mathieu, Verine Bertrand. 2014. Une grande collecte de SMS authentiques en français : démarche, remarques et conseils. Le Français à l'Université, 19 (3), 5 p.
Version publiée
- Français
Accès réservé aux personnels Cirad Utilisation soumise à autorisation de l'auteur ou du Cirad. document_574012.pdf Télécharger (73kB) |
Url - jeu de données - Entrepôt autre : http://88milsms.huma-num.fr/
Résumé : En 2011, à Montpellier, un groupe de six universitaires linguistes et informaticiens (Rachel Panckhurst, Catherine Détrie, Cédric Lopez, Claudine Moïse, Mathieu Roche et Bertrand Verine) a décidé d'effectuer un recueil de SMS authentiques, en français, auprès du grand public, dans le respect des règles juridiques en vigueur. La collecte, qui a duré trois mois, s'est déroulée dans le cadre d'un projet intitulé sud4science LR (www.sud4science.org) et a permis de recueillir plus de 90 000 SMS (Panckhurst et al., 2013; Panckhurst, 2013; Panckhurst & Moïse, 2014). Après un travail très important de vérification, d'épuration et d'anonymisation des données par 8 stagiaires étudiants (à partir de soutiens de la MSH-M [Maison des Sciences de l'Homme de Montpellier], de la DGLFLF [Délégation générale à la langue française et aux langues de France] et du CNRS [PEPS ECOMESS, HuMaIn]), sur une période conséquente de 21 mois, les quelque 88 000 SMS restants ont été organisés en un corpus, intitulé 88milSMS. Depuis fin juin 2014, notre corpus est disponible sur la grille de services d'Huma-Num : http://88milsms.huma-num.fr/ (Panckhurst et al. 2014a, 2014b). Notre projet fait partie d'un grand projet international lancé en Belgique en 2004, sms4science, (www.sms4science.org, Fairon et al., 2006 ; Cougnon, 2014 ; Cougnon et Fairon, éd. 2014), qui avait un triple objectif : recueillir, organiser et analyser des SMS authentiques.
Classification Agris : C30 - Documentation et information
U30 - Méthodes de recherche
Champ stratégique Cirad : Hors axes (2014-2018)
Auteurs et affiliations
- Panckhurst Rachel, CNRS (FRA)
- Détrie Catherine, CNRS (FRA)
- Lopez Cédric, VISEO (FRA)
- Moïse Claudine, Objet Direct (FRA)
- Roche Mathieu, CIRAD-ES-UMR TETIS (FRA) ORCID: 0000-0003-3272-8568
- Verine Bertrand, CNRS (FRA)
Source : Cirad - Agritrop (https://agritrop.cirad.fr/574012/)
[ Page générée et mise en cache le 2024-12-05 ]