Agritrop
Accueil

De nouvelles pondérations adaptées à la classification de petits volumes de données textuelles

Bouillot Flavien, Poncelet Pascal, Roche Mathieu. 2014. De nouvelles pondérations adaptées à la classification de petits volumes de données textuelles. In : Extraction et gestion des connaissances : EGC 2014. Paris : Hermann Ed., 131-142. (Revue des Nouvelles Technologies de l'Information, E.26) ISBN 978-2-7056-8841-7 Journées Francophones "Extraction et Gestion des Connaissances". 14, Rennes, France, 28 Janvier 2014/31 Janvier 2014.

Communication avec actes
[img] Version publiée - Français
Accès réservé aux personnels Cirad
Utilisation soumise à autorisation de l'auteur ou du Cirad.
document_572672.pdf

Télécharger (575kB)

Résumé : Un des défis actuels dans le domaine de la classification supervisée de documents est de pouvoir produire un modèle fiable à partir d'un faible volume de données. Avec un volume conséquent de données, les classifieurs fournissent des résultats satisfaisants mais les performances sont dégradées lorsque celui-ci diminue. Nous proposons, dans cet article, de nouvelles méthodes de pondérations résistant à une diminution du volume de données. Leur efficacité, évaluée en utilisant des algorithmes de classification supervisés existants (Naive Bayes et Class-Feature-Centroid) sur deux corpus différents, est supérieure à celle des autres algorithmes lorsque le nombre de descripteurs diminue. Nous avons étudié en parallèle les paramètres influençant les différentes approches telles que le nombre de classes, de documents ou de descripteurs.

Classification Agris : C30 - Documentation et information
U10 - Informatique, mathématiques et statistiques

Auteurs et affiliations

Autres liens de la publication

Source : Cirad - Agritrop (https://agritrop.cirad.fr/572672/)

Voir la notice (accès réservé à Agritrop) Voir la notice (accès réservé à Agritrop)

[ Page générée et mise en cache le 2024-03-30 ]