Agritrop
Home

Une grande collecte de SMS authentiques en français : démarche, remarques et conseils

Panckhurst Rachel, Détrie Catherine, Lopez Cédric, Moïse Claudine, Roche Mathieu, Verine Bertrand. 2014. Une grande collecte de SMS authentiques en français : démarche, remarques et conseils. Le Français à l'Université, 19 (3), 5 p.

Journal article ; Article de revue sans comité de lecture
[img] Published version - Français
Access restricted to CIRAD agents
Use under authorization by the author or CIRAD.
document_574012.pdf

Télécharger (73kB)

Url - jeu de données : http://88milsms.huma-num.fr/

Abstract : En 2011, à Montpellier, un groupe de six universitaires linguistes et informaticiens (Rachel Panckhurst, Catherine Détrie, Cédric Lopez, Claudine Moïse, Mathieu Roche et Bertrand Verine) a décidé d'effectuer un recueil de SMS authentiques, en français, auprès du grand public, dans le respect des règles juridiques en vigueur. La collecte, qui a duré trois mois, s'est déroulée dans le cadre d'un projet intitulé sud4science LR (www.sud4science.org) et a permis de recueillir plus de 90 000 SMS (Panckhurst et al., 2013; Panckhurst, 2013; Panckhurst & Moïse, 2014). Après un travail très important de vérification, d'épuration et d'anonymisation des données par 8 stagiaires étudiants (à partir de soutiens de la MSH-M [Maison des Sciences de l'Homme de Montpellier], de la DGLFLF [Délégation générale à la langue française et aux langues de France] et du CNRS [PEPS ECOMESS, HuMaIn]), sur une période conséquente de 21 mois, les quelque 88 000 SMS restants ont été organisés en un corpus, intitulé 88milSMS. Depuis fin juin 2014, notre corpus est disponible sur la grille de services d'Huma-Num : http://88milsms.huma-num.fr/ (Panckhurst et al. 2014a, 2014b). Notre projet fait partie d'un grand projet international lancé en Belgique en 2004, sms4science, (www.sms4science.org, Fairon et al., 2006 ; Cougnon, 2014 ; Cougnon et Fairon, éd. 2014), qui avait un triple objectif : recueillir, organiser et analyser des SMS authentiques. (Résumé d'auteur)

Classification Agris : C30 - Documentation and information
U30 - Research methods

Champ stratégique Cirad : Hors axes (2014-2018)

Auteurs et affiliations

  • Panckhurst Rachel, CNRS (FRA)
  • Détrie Catherine, CNRS (FRA)
  • Lopez Cédric, VISEO (FRA)
  • Moïse Claudine, Objet Direct (FRA)
  • Roche Mathieu, CIRAD-ES-UMR TETIS (FRA) ORCID: 0000-0003-3272-8568
  • Verine Bertrand, CNRS (FRA)

Source : Cirad - Agritrop (https://agritrop.cirad.fr/574012/)

View Item (staff only) View Item (staff only)

[ Page générée et mise en cache le 2021-01-08 ]