В ИОХ РАН создан подход для количественной оценки молекулярной сложности
Молекулярная сложность является фундаментальным свойством каждой молекулы. Оценка молекулярной сложности особенно ценна в области медицинской химии, где было экспериментально подтверждено, что молекулы, подобные лекарствам, имеют тенденцию иметь более сложные структуры. Однако количественное измерение молекулярной сложности довольно затруднительно, т.к. для этого необходима экспертная оценка человеком, которая зачастую очень субъективна. Создание численно беспристрастного метода определения молекулярной сложности принесло бы большую пользу в области химии и предоставило бы ценный исследовательский инструмент.
Учеными Лаборатории металлокомплексных и наноразмерных катализаторов создан новый подход для количественной оценки молекулярной сложности на основе машинного обучения. В основу обучения модели лег человеческий опыт, а именно данные об оценке 164.000 молекул более чем 50 химиками. Полученный большой набор данных и активный процесс обучения обеспечили разнообразие и точность, что позволило модели обобщать различные химические структуры. Наиболее влиятельными молекулярными характеристиками при оценке молекулярной сложности были определены молекулярная масса, количество ароматических циклов и топологическая полярная площадь поверхности. Проведенное исследование представляет собой шаг вперед в количественной оценке молекулярной сложности, предлагая универсальный и основанный на данных инструмент для анализа химических структур. Преобразование молекулярной сложности в измеримую характеристику открывает новые возможности для оптимизации синтетических методов и создания новых лекарств.
Источник:
Andrei S. Tyrin, Daniil A. Boiko, Nikita I. Kolomoets, Valentine P. Ananikov Digitization of molecular complexity with machine learning Chem. Sci., 2025, 16, 6895–6908. DOI: 10.1039/D4SC07320G.