Гликоинформатика: революция в исследовании углеводов
Биологическая роль углеводов — одного из самых химически разнообразных классов биомакромолекул — была осознана позже, чем роль белков и нуклеиновых кислот. В 21-м веке, с развитием современных компьютерных методов, научное сообщество продемонстрировало взрывной рост интереса к гликомике — науке об углеводах. Эта дисциплина позволяет объяснять межклеточные взаимодействия и формирование иммунитета, разрабатывать углеводные и конъюгатные вакцины, и понимать гликом как одну из молекулярных основ жизни.
В отличие от других «–омик», гликомике много лет не хватало компьютерных инструментов исследований. Коллектив ученых из Института органической химии им. Н. Д. Зелинского РАН (ИОХ РАН), начиная с 2004 года, разрабатывал и совершенствовал информационный продукт для ученых, исследующих природные углеводы. Этот проект, начавшийся как база данных углеводных структур, трансформировался в универсальную платформу хемо- и биоинформатики, став одним из ведущих мировых ресурсов для углеводных исследований. Он помогает устанавливать химическую и пространственную структуру этих важнейших биомакромолекул, исследовать их билогические функции, и аккумулирует накопленные структурные, биохимические, медицинские и другие знания об углеводах. Для углеводов прокариот и других микробов этот проект предоставляет уникальные данные и сервисы, недоступные ни в одном другом мировом проекте.
Группа гликоинформатики Лаборатории углеводов и биоцидов им. академика Н.К. Кочеткова ИОХ РАН внесла значительный вклад в гликомику, в том числе предоставив современный уровень информационной обеспеченности и заложив основы новой области знаний — гликоинформатики, т.е. науки о применении информатики в исследовании углеводов. Теперь ученым-гликохимикам и гликобиологам доступны разнообразные базы данных и инструменты для поиска, обработки, визуализации и интерпретации знаний об углеводах. Среди этих инструментов выделяется уникальный по точности предсказаний инструмент автоматического анализа спектров ядерного магнитного резонанса (ЯМР) сложных углеводов природного происхождения.
Все разработки, как прикладные, так и теоретические, отражены на бесплатном интернет-портале Carbohydrate Structure Database (CSDB), который базируется в ИОХ РАН.
В июне 2024 вышел обзор[1] новых аспектов развития этого проекта за последние восемь лет, в том числе:
- Полное покрытие: размещение в базе данных всех когда-либо опубликованных структур углеводов микроорганизмов, включая бактерии, археи, одноклеточные грибы и простейших.
- Онлайн-редактор углеводных структур: возможность ввода первичной и моделирования трехмерной структур, графической визуализации сложных гликанов и экспорта структур в различные форматы хемо- и гликоинформатики.
- База данных конформаций: модуль для работы с конформационными картами олигосахаридов.
- Генератор структурных дескрипторов: создание дескрипторов и изомеров для не полностью определенных структур на атомарном уровне и работа с углеводной семантикой.
- Универсальный язык описания углеводов: онтология и формальное описание всего многообразия природных гликанов и их производных.
- База данных гликозилтрансфераз: экспериментально подтвержденные активности ферментов биосинтеза для самых изучаемых видов каждого царства (E. coli, A. thaliana. S. cerevisiae).
- Модуль моделирования двумерных спектров ЯМР: высокоточная симуляция спектров ЯМР биогликанов, намного обгоняющая существующие аналоги.
- Автоматическое предсказание структуры: предсказание первичной структуры биогликанов по неотнесенным данным ЯМР и хроматографии.
ИОХ РАН продолжает вносить значительный вклад в мировую науку, делая исследования в области гликомики более доступными и эффективными. База данных по структуре углеводов постоянно развивается и обновляется, обеспечивая полное покрытие по гликанам микроорганизмов и грибов. Будучи платформой гликоинформатики, CSDB предоставляет аналитические, статистические и вычислительные сервисы, связанные с гликанами и их производными. Она способствует дальнейшему развитию гликомики и поддерживает исследователей по всему миру.
[1] Ph. Toukach. Carbohydrate Structure Database: current state and recent developments, Analytical and Bioanalytical Chemistry, 2024. DOI: 10.1007/s00216-024-05383-w