Extraction des séquences fermées fréquentes à partir de corpus parallèles : Application à la traduction automatique
Résumé
Dans cet article, nous abordons la problématique d'extraction de séquences
fréquentes à partir de corpus de textes parallèles en prenant en compte
l'ordre d'apparition des mots dans une phrase. Notre finalité est d'exploiter ces
séquences dans la traduction automatique (TA). Nous introduisons ainsi la notion
de règles associatives inter-langues (RAIL) et nous définissons notre modèle
de traduction à base de ces associations. Nous décrivons également les différentes
expérimentations conduites sur le corpus EUROPARL afin de construire à
partir des RAIL une table de traduction bilingue qui est intégrée par la suite dans
un processus complet de TA.