Agritrop
Accueil

De la collecte à l'analyse d'un corpus de SMS authentiques : une démarche pluridisciplinaire

Panckhurst Rachel, Roche Mathieu, Lopez Cédric, Verine Bertrand, Détrie Catherine, Moïse Claudine. 2016. De la collecte à l'analyse d'un corpus de SMS authentiques : une démarche pluridisciplinaire. Histoire Epistémologie Langage, 38 (2) : 73-85.

Article de revue ; Article de recherche ; Article de revue à comité de lecture
[img] Version publiée - Français
Accès réservé aux personnels Cirad
Utilisation soumise à autorisation de l'auteur ou du Cirad.
Cirad_HEL-scan-r.pdf

Télécharger (1MB) | Demander une copie

Url - jeu de données - Entrepôt autre : http://88milsms.huma-num.fr/

Résumé : Nous présentons notre approche fondée sur les données authentiques, en nous concentrant sur des recherches récentes, portant sur le recueil, le traitement et l'analyse d'un grand corpus de SMS en français, intitulé 88milSMS (http://88milsms.huma-num.fr/, Panckhurst, Détrie, Lopez, Moïse, Roche, Verine, 2014), incluant un questionnaire sociolinguistique soumis aux donateurs au moment de la collecte ainsi que leurs réponses. Puis nous expliquons pourquoi, dans une démarche pluridisciplinaire (située entre sciences du langage, informatique et traitement automatique du langage naturel), nous avons décidé de fournir à la communauté scientifique et au grand public le corpus de SMS.

Résumé (autre langue) : This article highlights an approach based on authentic data, by focusing on recent research related to collection, processing and analysis of a large French text-message corpus, entitled 88milSMS (http://88milsms.huma-num.fr/, Panckhurst, Détrie, Lopez, Moïse, Roche, Verine, 2014), including a sociolinguistic questionnaire submitted to donors (with their answers). The authors, using a pluridisciplinary approach (linguistics/language sciences, computer science, Natural Language Processing), explain why they chose to give the scientific community and the general public access to the SMS corpus.

Mots-clés Agrovoc : informatique, recherche, collecte de données, concentration

Mots-clés géographiques Agrovoc : France

Mots-clés libres : TALN

Classification Agris : C30 - Documentation et information
000 - Autres thèmes
U10 - Informatique, mathématiques et statistiques
U30 - Méthodes de recherche

Champ stratégique Cirad : Hors axes (2014-2018)

Auteurs et affiliations

  • Panckhurst Rachel, CNRS (FRA)
  • Roche Mathieu, CIRAD-ES-UMR TETIS (FRA) ORCID: 0000-0003-3272-8568
  • Lopez Cédric, VISEO (FRA)
  • Verine Bertrand, CNRS (FRA)
  • Détrie Catherine, CNRS (FRA)
  • Moïse Claudine, Université de Grenoble (FRA)

Source : Cirad-Agritrop (https://agritrop.cirad.fr/584143/)

Voir la notice (accès réservé à Agritrop) Voir la notice (accès réservé à Agritrop)

[ Page générée et mise en cache le 2024-01-29 ]