Choix du taux d'élagage pour l'extraction de la terminologie. Une approche fondée sur les courbes ROC
Abstract
Le choix du taux d'élagage est crucial dans le but d'acquérir une terminologie
de qualité à partir de corpus de spécialité. Cet article présente une
étude expérimentale consistant à déterminer le taux d'élagage le plus adapté.
Plusieurs mesures d'évaluation peuvent être utilisées pour déterminer ce taux
tels que la précision, le rappel et le Fscore. Cette étude s'appuie sur une autre
mesure d'évaluation qui semble particulièrement bien adaptée pour l'extraction
de la terminologie : les courbes ROC (Receiver Operating Characteristics).