Étude lexicographique de sous-graphes pour l'élaboration de modèles structures à activité – cas de la chimie organique
Résumé
Les modèles structure–activité (QSAR) cherchent à extraire de l'infor-
mation utile dans des observations relatives à des structures, dans le but d'asso-
cier des éléments structurels à une activité d'ordre macroscopique. Un exemple
typique est celui de la chimie organique, où certaines propriétés physiques et
chimiques d'une molécule sont fonction de son agencement interne (conforma-
tion). On retrouve en particulier des sous-structures caractéristiques, nommées
groupements fonctionnels ou fragments qui s'apparentent à des sous-graphes,
ainsi que des structures de liaison. Nous proposons une analyse lexicographique
de ces fragments et montrons que ceux-ci suivent approximativement des lois
de puissance, proches des lois de Zipf observées dans le cadre des langues na-
turelles. En poursuivant cette analogie, nous développons la notion de "plon-
gement" de fragment (fragment-embedding). Nous montrons l'intérêt de cette
notion et en déduisons quelques perspectives.