Morfetik : Une ressource lexicale morphologique extensible et modulaire pour le français
Résumé
Les ressources lexicales morphologiques, décrivant la structure interne
des mots et leurs formes fléchies, sont essentielles pour le traitement automatique
des langues (TAL) et la linguistique computationnelle.
Nous présentons MORFETIK, une ressource lexicale open-source complète pour
le français, capable de générer et d'identifier automatiquement toutes les formes
fléchies des mots (noms, verbes, adjectifs, locutions, etc.). Il offre une couverture
large du lexique contemporain et spécialisé, une architecture extensible et
modulaire, et une intégration aisée avec des ressources externes.
De même, nous illustrons son utilisation à travers deux études de cas et détaillons
son architecture, montrant comment sa modularité et son interopérabilité facilitent
l'analyse de corpus, et le développement d'applications TAL.