[Grammaires Créoles] Alice Missud (Nanterre)

15
oct.
2018.
14h00
16h30
Un corpus de créoles à base française issu du web pour l’extraction de paires base-dérivé

Salle 124

Alice Missud (Paris-Nanterre)
Un corpus de créoles à base française issu du web pour l’extraction de paires base-dérivé

Je présenterai la constitution d'un corpus de créoles à base française (guadeloupéen, martiniquais et haïtien) à partir du web. L'objectif de ce travail a consisté à constituer les corpus de textes et les lexiques les plus larges possibles dans le but de pouvoir en extraire automatiquement les paires morphologiques base-dérivé et d'annoter les relations syntaxiques, sémantiques et phonologiques que ces paires entretiennent. Cette tâche a permis de soulever un certain nombre de problèmes techniques et linguistiques.
Dans un premier temps, j'aborderai les différentes approches qui ont mené à la constitution des corpus et détaillerai leur contenu. Nous verrons ensuite comment les données du corpus du créole guadeloupéen ont été traitées informatiquement pour extraire les lexèmes construits et leurs bases. Pour finir, je présenterai le set d'annotation et l'inventaire de ce qui a été catégorisé pour chaque procédé morphologique extrait dans cette langue.