Agritrop
Accueil

A manually annotated corpus in French for the study of urbanization and the natural risk prevention

Koptelov Maksim, Holveck Margaux, Crémilleux Bruno, Reynaud Justine, Roche Mathieu, Teisseire Maguelonne. 2023. A manually annotated corpus in French for the study of urbanization and the natural risk prevention. Scientific Data, 10:818, 14 p.

Article de revue ; Data paper ; Article de revue à facteur d'impact Revue en libre accès total
[img]
Prévisualisation
Version publiée - Anglais
Sous licence Licence Creative Commons.
Koptelov_Scientific_Data_2023.pdf

Télécharger (3MB) | Prévisualisation

Url - jeu de données - Entrepôt autre : https://doi.org/10.57745/XIVJ65

Résumé : Land artificialization is a serious problem of civilization. Urban planning and natural risk management are aimed to improve it. In France, these practices operate the Local Land Plans (PLU – Plan Local d'Urbanisme) and the Natural risk prevention plans (PPRn – Plan de Prévention des Risques naturels) containing land use rules. To facilitate automatic extraction of the rules, we manually annotated a number of those documents concerning Montpellier, a rapidly evolving agglomeration exposed to natural risks. We defined a format for labeled examples in which each entry includes title and subtitle. In addition, we proposed a hierarchical representation of class labels to generalize the use of our corpus. Our corpus, consisting of 1934 textual segments, each of which labeled by one of the 4 classes (Verifiable, Non-verifiable, Informative and Not pertinent) is the first corpus in the French language in the fields of urban planning and natural risk management. Along with presenting the corpus, we tested a state-of-the-art approach for text classification to demonstrate its usability for automatic rule extraction.

Mots-clés Agrovoc : utilisation des terres, gestion du risque, monument naturel

Mots-clés géographiques Agrovoc : France

Mots-clés libres : Urban planning, Natural risk managment, Land use planning, Plan de Prévention des Risques naturels, Plan Local d’Urbanisme, Corpus, Text Mining

Classification Agris : E11 - Économie et politique foncières
U10 - Informatique, mathématiques et statistiques

Champ stratégique Cirad : CTS 5 (2019-) - Territoires

Agences de financement hors UE : Agence Nationale de la Recherche

Projets sur financement : (FRA) Hétérogénéité des données - Hétérogénéité des méthodes : un cadre collaboratif unifié pour l'analyse interactive de données temporelles

Auteurs et affiliations

  • Koptelov Maksim, UNICAEN (FRA) - auteur correspondant
  • Holveck Margaux, Université de Strasbourg (FRA)
  • Crémilleux Bruno, UNICAEN (FRA)
  • Reynaud Justine, UNICAEN (FRA)
  • Roche Mathieu, CIRAD-ES-UMR TETIS (FRA) ORCID: 0000-0003-3272-8568 - auteur correspondant
  • Teisseire Maguelonne, INRAE (FRA)

Source : Cirad-Agritrop (https://agritrop.cirad.fr/607243/)

Voir la notice (accès réservé à Agritrop) Voir la notice (accès réservé à Agritrop)

[ Page générée et mise en cache le 2024-02-03 ]