РУС ENG
Министерство науки и высшего образования Российской Федерации
Российская Академия Наук

Молодые учёные ИОХ РАН: Козлов Константин / Бойко Даниил

5 июля 2023 г.

студент / аспирант

 
 
 

Области исследований: машинное обучение в химии / машинное обучение, масс-спектрометрия

 
 
 

Лаборатория металлокомплексных и наноразмерных катализаторов №30

 
 
 

Полностью автоматизированный анализ масс-спектров высокого разрешения с помощью машинного обучения

 
 
 

               

         Boiko D.A., Kozlov K.S., Burykina J.V.,

         Ilyushenkova V.V., Ananikov V.P. "Fully

         Automated Unconstrained Analysis of

         rich  High-Resolution Mass Spectrometry Data

         with Machine Learning", J. Am. Chem.

         Soc., 2022, 144, 14590-14606.

         DOI: 10.1021/jacs.2c03631

 
 
 
 
- Чему посвящены Ваши научные исследования в целом? Какую фундаментальную научную или практическую задачу Вы пытаетесь решить?

КК: Наши научные исследования посвящены разработке и внедрению алгоритмов машинного обучения в процессы исследовательской деятельности в химии. Зачастую исследователям приходится тратить много времени на вещи, которые можно было бы доверить компьютеру: будь то поиск ионов в спектре или подсчет числа наночастиц на электронном снимке. Мы верим, что современный химик заслуживает того, чтобы концентрироваться на важных и сложных проблемах, а наши разработки помогут повысить эффективность их исследований.

ДБ: Помимо повышения эффективности исследований, в перспективе, хотелось бы добиться тех открытий, которые невозможно было бы сделать без использования машинного обучения. Очень сильно хочется приблизить будущее, в котором искусственный интеллект занимается наукой, а люди просто решают интересные задачи для удовольствия.

 
- Расскажите о Вашей последней высокорейтинговой работе, опубликованной в 2022 году. В чем её основная идея?

КК: Я пока что еще слишком молод, и моя первая статья вышла лишь в 2022 году. Ее основная идея заключалась в том, что мы смогли придумать подход, позволяющий автоматически решать обратную задачу масс-спектрометрии (определение элементного состава ионов по виду их изотопных распределений), используя модели машинного обучения, натренированные на искусственно сгенерированных данных. Такой подход позволяет не тратить много времени на разметку для обучения нейросетей, что существенно повышает их внедрение в рабочие процессы.

ДБ: На самом деле людям, не связанным с масс-спектрометрией, может быть не очевидно почему эта задача важна. Но если вы хоть раз пытались сами разгадать масс-спектр, то наверняка первое, что вы пытались подобрать — это была молекулярная формула иона. В этой работе мы сфокусировались на данных ПФ ИЦР МС используя уникальное оборудование доступное в ЦКП ИОХ РАН. Многие ученые сходятся на мнении, что решение этой задачи для ПФ ИЦР МС данных — это самая главная проблема в их обработке.

 
- Где и каким образом могут быть использованы полученные в этой работе результаты?

КК: Из того, что первое приходит на ум – это исследование каталитических систем. Регистрация масс-спектров высокого разрешения органических реакций позволяет получать информацию о сотнях уникальных ионах. Однако ручная расшифровка каждого отдельного изотопного распределения – небыстрый процесс, что делает полную интерпретацию спектра физически неосуществимой. Наши алгоритмы позволяют обойти эту сложность.

Дополнительно мы реализовали алгоритм для автоматического поиска ионов в масс-спектрах. Его область применения можно масштабировать на большие базы данных масс-спектров. Например, используя такой поиск, мы смогли обнаружить ранее неопубликованные продукты каталитических превращений, зарегистрированные несколько лет назад.

ДБ: Помимо этого, в самой статье мы показали, что используя разработанный программный пакет можно решать задачи идентификации сложных смесей и проводить de novo секвенирование пептидов. К сожалению, все это возможно только на приборах, которые есть далеко не в каждом научном заведении, но и эту проблему стараемся решить.

 
- В чем сложность, и с какими трудностями Вы столкнулись во время выполнения этого исследования?

КК: Главная сложность, c которой я столкнулся – это умение мыслить оптимально. Ведь от того, как реализуешь алгоритм, сильно зависит время его работы и вычислительная стоимость. Так как исследование междисциплинарное, то приходилось разбираться во многих вещах с нуля. Поэтому умение выйти из зоны комфорта – то, что помогло мне осуществить этот интересный проект.

ДБ: Для меня это было скорее планирование проекта. Всегда хочется сделать очень много разных вещей, но если расплыться, то в итоге сделать ничего не получится.

 
- Помогал ли Вам кто-нибудь в решении возникающих проблем?

КК: Конечно! В нашей лаборатории работают первоклассные специалисты по масс-спектрометрии. Благодаря их помощи и экспертизе, а также умению оценить результат с пользовательской стороны, исследование значительно улучшилось.

ДБ: Также хочется сказать спасибо всему коллективу лаборатории. Многие проблемы, которые мы стараемся решить — это те проблемы, с которыми сталкиваются наши коллеги.

 
- Есть ли у Вас дальнейшие планы по развитию этого направления исследования?

КК: На данный момент мы создаем модели, которые будут работать на масс-спектрометрах с более низким разрешением. Также в планах научиться автоматизировать процессы интерпретации белковых масс-спектров. Наконец, хотелось бы создать сайт, куда любой желающий смог бы загрузить свой спектр и воспользоваться функционалом нашего программного пакета.

ДБ: Более того, помимо дальнейших улучшений программного пакета и развития моделей, хочется больше работать над применением этой технологии в различных проектах лаборатории.

 
- Каким образом Вы попали в химию?

КК: Мое увлечение химией началось с того, как в подростковом возрасте я посмотрел сериал “Во все тяжкие”. После этого мне стало интересно решать олимпиадные задачи, ради чего я поступил в СУНЦ МГУ. Став победителем нескольких перечневых олимпиад, я пошёл на химический факультет МГУ, где и началась моя научная карьера.

ДБ: Я, конечно, как и Костя тоже смотрел «Во все тяжкие», но попал в химию не из-за этого. В средней школе очень сильно хотел поступить на ФФМ МГУ, куда по ЕГЭ поступить практически невозможно. В итоге решил попробовать через олимпиады, а химия получалась лучше, чем биология. В процессе этого тоже поступил в СУНЦ, стал призёром ВсОШ по химии, а поступать на ФФМ передумал.

 
- Как оказались в ИОХе?

КК: Находясь летом в поиске научной работы, я откликнулся на объявление в МГУшном телеграм-канале о вакансиях в лабораторию металлокомплексных и наноразмерных катализаторов ИОХ РАН.

ДБ: При поступлении на химический факультет МГУ пошел в академическую группу 109, где лабораторию надо было выбирать на первом курсе. Лаборатория №30 ИОХ РАН оказалась наиболее близкой мои научным интересам.

 
- Какими, на Ваш взгляд, качествами должен обладать современный ученый?

КК: На мой взгляд, ученый должен в первую очередь гореть тем, что он делает. Если процесс работы не приносит удовольствия, то результат практически всегда окажется неудовлетворительным. Во-вторых, нужно уметь проявлять упорство и усидчивость, так как практически никогда работа не будет идти как по маслу.

ДБ: Помимо гибких навыков не стоит забывать и про профессиональные качества. Современный ученый-химик — это тот, кто способен использовать большое количество физико-химических методов, владеет методами компьютерного моделирования, обладает развитым математическим аппаратом и умеет применять все это для решения научных задач.

 
- Какой совет можете дать своим коллегам?

КК: Наверное, из меня не лучший советчик, но мой совет – пытаться смотреть на мир шире. Когда ты вкладываешь все силы во что-то одно, то очень легко не заметить то, что тебе действительно может быть полезно и интересно. Умение смотреть на вещи по-разному делает тебя более гибким, а это один из ключевых навыков хорошего исследователя.

ДБ: На самом деле всегда даю один и тот же совет. Многие люди хотят сделать что-то новое, взяться за интересный проект, попробовать какую-то свежую идею, однако боятся, что у них не получится. Мой опыт и опыт многих знакомых людей говорит о том, что бояться точно не стоит.