RNTI

MODULAD
Étude lexicographique de sous-graphes pour l'élaboration de modèles structures à activité – cas de la chimie organique
In EGC 2019, vol. RNTI-E-35, pp.303-308
Résumé
Les modèles structure–activité (QSAR) cherchent à extraire de l'infor- mation utile dans des observations relatives à des structures, dans le but d'asso- cier des éléments structurels à une activité d'ordre macroscopique. Un exemple typique est celui de la chimie organique, où certaines propriétés physiques et chimiques d'une molécule sont fonction de son agencement interne (conforma- tion). On retrouve en particulier des sous-structures caractéristiques, nommées groupements fonctionnels ou fragments qui s'apparentent à des sous-graphes, ainsi que des structures de liaison. Nous proposons une analyse lexicographique de ces fragments et montrons que ceux-ci suivent approximativement des lois de puissance, proches des lois de Zipf observées dans le cadre des langues na- turelles. En poursuivant cette analogie, nous développons la notion de "plon- gement" de fragment (fragment-embedding). Nous montrons l'intérêt de cette notion et en déduisons quelques perspectives.