Agritrop
Home

La néographie dans un grand corpus de SMS français : 88milSMS

Roche Mathieu, Verine Bertrand, Lopez Cédric, Panckhurst Rachel. 2016. La néographie dans un grand corpus de SMS français : 88milSMS. In : La neología en las lenguas románicas: recursos, estrategias y nuevas orientaciones. García Palacios Joaquín (ed.), De Sterck Goedele (ed.), Linder Daniel (ed.), Maroto Nava (ed.) , Sánchez Ibáñez Miguel (ed.), Torres del Rey Jesús (ed.). Francfort : Peter Lang, pp. 279-302. (Studien zur romanischen Sprachwissenschaft und interkulturellen Kommunikation, 110) ISBN 978-3-631-69862-4

Book chapter
[img] Post-print version - Français
Access restricted to CIRAD agents
Use under authorization by the author or CIRAD.
Roche_Cineo_Neologia_2016.pdf

Télécharger (548kB) | Request a copy
[img] Published version - Français
Access restricted to CIRAD agents
Use under authorization by the author or CIRAD.
ID583197.pdf

Télécharger (7MB) | Request a copy

Url - jeu de données : http://88milsms.huma-num.fr

Abstract : Depuis 2014, le corpus 88milSMS est disponible en téléchargement public (Panckhurst et al., 2014, http://88milsms.huma-num.fr/). Contenant plus de 88 000 SMS authentiques en français recueillis dans le cadre du projet sud4scienceLR (http://www.sud4science.org/), ce corpus anonymisé permet aux chercheurs d'analyser, en employant ou non des techniques de traitement automatique des langues (TAL), l'évolution de l'une des facettes de la langue française, l'écriture SMS (eSMS). Dans cet article, nous laisserons de côté la néologie dans sa dimension de créativité lexicale — dérivation, les mots-valises (cinglicité), les emprunts (now, wesh), l'écriture non intentionnée, correspondant souvent à des erreurs de saisie (tladucteur), ou l'écriture incluant des caractères spéciaux, des chiffres (resto+cine, Ar5gggggggh), (Détrie 2015), pour aborder plus spécifiquement la néographie, ou la créativité scripturale, bien que les frontières entre néologie (" une réalité difficile à cerner " selon Pruvost/Sablayrolles, 2012) et néographie soient parfois ténues (Cougnon 2015). Comme Anis (1998), nous désignons par néographie des variantes de graphie qui s'éloignent de la langue standardisée, souvent de manière délibérée, ludique, et qui sont très présentes et instables dans l'eSMS. Dans des travaux préliminaires, nous avons rencontré, entre autres, des phénomènes néographiques de substitution (o/eau, ossi/aussi, kikou/coucou, twa/toi), d'ajout (répétition de caractères/signes de ponctuation : booooooooof/bof, j'arrriiiiiiivvve !!!!!, ajouts de caractères : les zamours, représentations sémiologiques/frimousses/emoji, :), ^^, J), de suppression (signes diacritiques : europeen/européen, ponctuation), et de réduction, (abrègements morpho-lexicaux : mdr/mort de rire, apocopes : ordi/ordinateur, aphérèses : zou/bisou, suppression de consonnes doubles : ele/elle, fins de mots effacées : tro/trop, agglutinations : tetrangle, squelettes consonantiques : slt/salut, abréviations : qd/quand, abréviations sémantisées : f=fais/fera(i)s/faisais : tu f koi ?). Nous confronterons notre typologie, § 1 (Panckhurst 2009, Panckhurst et al. 2013), au corpus 88milSMS à partir d'un fichier généré informatiquement (Lopez/Roche/Panckhurst 2015), après exclusion des mots apparaissant au sein du Lexique Électronique des Formes Fléchies du Français (LEFFF, (Sagot 2010)). Il s'agit de mieux comprendre quelles sont les pratiques scripturales de l'eSMS qui sont les plus redondantes au sein de 88milSMS. Outre une étude statistique § 2, nous focaliserons cette communication sur les lettres uniques qui renvoient à un mot (" tu f koi ? "), en étudiant dans quelle mesure un même scripteur varie ses pratiques, et en corrélant les usages aux caractéristiques sociologiques indiquées dans le questionnaire annexé à la collecte § 3. (Résumé d'auteur)

Mots-clés libres : TAL, Néologie, SMS, Fouille de textes

Classification Agris : C30 - Documentation and information
U30 - Research methods
000 - Other themes

Champ stratégique Cirad : Hors axes (2014-2018)

Auteurs et affiliations

  • Roche Mathieu, CIRAD-ES-UMR TETIS (FRA) ORCID: 0000-0003-3272-8568
  • Verine Bertrand, CNRS (FRA)
  • Lopez Cédric, VISEO (FRA)
  • Panckhurst Rachel, CNRS (FRA)

Autres liens de la publication

Source : Cirad-Agritrop (https://agritrop.cirad.fr/583197/)

View Item (staff only) View Item (staff only)

[ Page générée et mise en cache le 2021-01-08 ]