Классификация применения искусственного интеллекта в химии: от автоматизации к цифровому научному мышлению
В.П.Анаников, Классификация применения искусственного интеллекта в химии: от автоматизации к цифровому научному мышлению, Аналитика, 2025, т.15, №4, c. 246-260. [ссылка] [загрузить PDF]
В.П. Анаников
УДК 004.8, 004.89, 543, 544, 546, 547
Предложена трехуровневая классификация применения искусственного интеллекта (ИИ) в химических науках, отражающая возрастающую степень вовлеченности технологий в научный и производственный процессы: от автоматизации рутинных задач (уровень ИИ-ассистент), к созданию специализированных аналитических решений для обработки экспериментальных данных (уровень ИИ-аналитик) и далее к перспективе интеллектуальных систем, способных формировать научные гипотезы и проектировать вещества и процессы (уровень ИИ-исследователь). Представленная классификация может служить основой для формирования дорожных карт цифровой трансформации химических наук, а также для реализации программ научно-технологического развития в рамках приоритетных направлений. Впервые вводится термин «технология-участник» как обозначение новой формы взаимодействия человека и ИИ, при которой цифровая система становится частью научного процесса, а не просто инструментом.
Ключевые слова: искусственный интеллект, химия, цифровизация, ИИ-ассистент, ИИ-аналитик, ИИ-исследователь, обработка данных, научная автоматизация, технологическое развитие, промышленные химические технологии.
Введение
Искусственный интеллект (ИИ) все глубже проникает в научную практику, трансформируя подходы к анализу, обработке информации и даже формированию новых научных идей [1-5]. Химия как наука, основанная на объемных и разнообразных типах данных, стала одной из первых дисциплин, ощутивших потенциал ИИ-инструментов – от автоматизации рутинных задач до создания промышленных технологий [6-8], проектов устойчивого развития [9-12], дизайна новых материалов и лекарств [13-16] и оптимизации синтетических маршрутов [17-19]. Однако способы и глубина применения ИИ в химических науках могут значительно различаться, и возникает необходимость в систематизации этих подходов.
Современное применение ИИ в химии можно классифицировать в виде трехуровневой системы, демонстрирующей возрастающую степень как технологической сложности инструмента, так и характера вовлеченности в исследование. Эти уровни отражают изменение роли ИИ – ассистент, аналитик, исследователь – и описывают эволюцию его использования от применения готовых инструментов к созданию специализированных решений [20-22] и далее к попыткам имитировать научное мышление (табл. 1). Каждый уровень основан на определенном наборе технологий, требует специфических компетенций и по-своему влияет на прогресс химической науки.
Таблица 1. Трехуровневая система применения искусственного интеллекта в химии
Уровень |
ИИ-технология |
Описание |
1 |
Ассистент (автоматизация) |
Использование готовых инструментов для рутинных задач, ускорение и автоматизация часто выполняемых процедур, интеграция в ежедневную рабочую практику |
2 |
Аналитик (моделирование, инструментализация и инженерия данных) |
Создание собственных алгоритмов, работа с экспериментальными данными и исходной химической информацией. Быстрая разработка или адаптация специализированных алгоритмов для решения конкретных научных или технологических задач |
3 |
Исследователь (цифровой хемоинтеллект) |
Имитация химического мышления, стратегическое принятие решений, зарождение творческого ИИ. Разработка алгоритмов, способных действовать в сложных пространствах химических знаний и данных |
Такая классификация позволяет не только описывать текущее состояние дел, но и планировать развитие научной инфраструктуры, образовательных программ и исследовательских стратегий. Далее подробно рассмотрим каждый из трех уровней: какие технологии лежат в их основе, как они применяются в химии и какие перспективы открываются на каждом из них. Важную часть общего обсуждения составляет понимание рисков и этических аспектов [23-25].
В качестве иллюстрации практических приложений ИИ будут приведены примеры исследований, выполненных в лаборатории автора при реализации конкретных научных проектов. Это целесообразно с точки зрения демонстрации реальных сценариев внедрения ИИ в рабочие процессы химической лаборатории, а также для оценки применимости предложенной классификации в условиях практико-ориентированной научной деятельности.
В рамках статьи предлагается новая концепция и термин – «технология-участник», отражающая качественный сдвиг в характере взаимодействия между исследователем и ИИ. Если ранее технологии рассматривались как внешние инструменты, то современные интеллектуальные системы все чаще выступают в роли участников научного поиска. Они способны не только выполнять узкие задачи, но и предлагать собственные пути анализа, интерпретации данных, формулирования гипотез. Это открывает перспективу возникновения новой модели научного процесса – цифрового сотворчества, где граница между машинной и человеческой инициативой становится все более гибкой.
Обсуждение
Уровень 1: ИИ-ассистент
На первом уровне программные продукты, полученные с помощью искусственного интеллекта, выступают в роли ассистента, выполняющего рутинные, но трудоемкие задачи, связанные преимущественно с обработкой, трансформацией и представлением информации. Этот уровень не требует от пользователя специальных навыков программирования или глубокого понимания алгоритмических принципов работы ИИ. В случае текстовых данных, например, достаточно сформулировать задачу на естественном языке, после чего готовый инструмент на базе большой языковой модели (LLM) способен предложить решение или направление работ для поиска решения. Такая автоматизация освобождает исследователя от множества вспомогательных процедур и позволяет сосредоточиться на содержательной стороне научной работы.
Основу этого уровня составляют большие языковые модели (GPT, Claude, Gemini и др.), обладающие способностью генерировать связный и грамматически корректный текст, структурировать информацию, распознавать смысл и намерения в сообщениях пользователя. В химических науках эти технологии успешно применяются для:
- перевода научных текстов и документов, в том числе со сложной терминологией;
- написания черновиков статей, отчетов, аннотаций, тезисов;
- подготовки презентаций, постеров и научных резюме;
- анализа литературных источников и составления рефератов по заданной теме;
- генерации ключевых слов, аннотаций и индексирования текстов;
- автоматического поиска релевантных публикаций по ключевым словам или вопросам;
- извлечения структурированных данных из статей (например, таблиц и экспериментальных условий);
- и множества других приложений.
Кроме того, ИИ-ассистенты используют для составления лабораторных протоколов, автоматического формирования документации, ведения лабораторных журналов и генерации чек-листов к экспериментам. Все эти задачи ранее требовали значительного времени, внимания и, как правило, не создавали научной новизны. Передача их выполнения искусственному интеллекту существенно разгружает исследователя (если не вносит неточностей).
Уровень «ассистент» уже изменил повседневную работу исследователей. ИИ-ассистент позволяет быстро обрабатывать информацию, повышает продуктивность научного труда и снижает барьер входа для молодых специалистов, не владеющих в совершенстве, например, иностранными языками или навыками научного письма. В то же время, широкое распространение ИИ-инструментов требует формирования новых этических и методологических норм, включая указание на использование ИИ при подготовке текстов, а также выработку критериев оценки достоверности получаемой информации.
В перспективе ИИ-ассистенты будут интегрированы во все этапы научного процесса: от автоматизированного поиска источников до помощи в визуализации данных и создании адаптивных обучающих материалов [26-29]. Их роль постепенно расширяется, особенно по мере того, как языковые модели будут приобретать способность работать с мультимодальными данными (текст, изображения, схемы, таблицы) и подключаться к специализированным химическим базам знаний. Таким образом, уровень «ассистент» становится отправной точкой на пути к более глубокой цифровизации научной деятельности.
Рис. 1. Взаимосвязь различных сценариев цифрового развития химии и изменение глубины трансформации науки и темпов накопления новых знаний в зависимости от выбранной стратегии цифровизации. Воспроизводится из статьи [1] по лицензии CC BY 4.0
Например, в нашей исследовательской практике ИИ уже применялся на уровне «ассистент» при подготовке аналитического обзора по цифровым технологиям в химии (рис. 1) [1]. При подготовке обзора было необходимо рассмотреть и проанализировать свыше 100 000 публикаций по теме применения ИИ в химии. Скорость чтения и первичного анализа научной статьи человеком составляет примерно 30 минут на один источник. Это означает, что человек затратил бы на обработку всего массива данных более 50 тыс. часов, или более 5,7 лет непрерывной работы без выходных.
С использованием больших языковых моделей и инструментов обработки текстов на базе ИИ, весь массив литературы обработан в течение одних суток, включая автоматическое извлечение ключевых понятий, выделение наиболее релевантных направлений, тематическую кластеризацию и отбор 20 наиболее значимых технологий [1]. Подобная автоматизация позволила не только сократить время подготовки статьи, но и обеспечить системность и полноту охвата, которой невозможно достичь, обрабатывая источники вручную.
Таким образом, ИИ на уровне «ассистент» стал не просто вспомогательным инструментом, в 2000 раз ускорившим анализ (с 5,7 лет до 1 суток), а необходимым условием для проведения анализа столь крупного масштаба и позволил перейти от точечных обзоров к всесторонней и объективной оценке состояния целой научной области. Без использования ИИ масштабные аналитические проекты рискуют устареть еще до своего завершения.
Важно отметить, что проверку результатов анализа провести существенно быстрее, чем его первичное выполнение. В данном случае верификация итогов, отобранных и структурированных ИИ, выполнена экспертом-химиком вручную. Результаты подтвердили высокую точность и обоснованность автоматизированного отбора.
Уровень 2: ИИ-аналитик
Второй уровень применения ИИ в химии требует более глубокой вовлеченности исследователя и базовых навыков программирования – прежде всего, на языке Python. Алгоритмы на основе искусственного интеллекта становятся инструментом расширенного анализа, позволяющим извлекать новые закономерности из экспериментальных данных, обрабатывать нестандартную информацию и создавать собственные модели для решения конкретных научных задач. Исследователь сам выбирает методы, разрабатывает алгоритмы и формирует пайплайны для обработки – от ввода «сырых» результатов измерений до получения интерпретируемых результатов.
Этот уровень особенно актуален в химии, поскольку большая часть данных – спектры, хроматограммы, изображения с микроскопов, масс-спектры, реакционные профили, кинетические закономерности и т.д. – представляет собой сложные многоформатные массивы, которые требуют нестандартного подхода к анализу. Типовых офисных и текстовых ИИ-инструментов тут уже недостаточно или они полностью неприменимы.
ИИ и вспомогательное программное обеспечение представляет собой набор модульных настраиваемых решений, создаваемых исследователем с использованием современных библиотек машинного обучения (Scikit-learn, TensorFlow, PyTorch), обработки изображений (OpenCV, PIL), численных расчетов (NumPy, SciPy), визуализации (Matplotlib, Seaborn, Plotly) и структур химических соединений (RDKit, Open Babel).
Практическое применение ИИ в химии на этом уровне охватывает:
- обработку изображений с электронных, оптических и зондовых микроскопов (например, автоматический подсчет наночастиц, распознавание морфологии, слежение за ростом кристаллов);
- интерпретацию спектров ЯМР, ИК, УФ, видимой области и масс-спектров – автоматическое выравнивание, шумоподавление, деконволюция сигналов;
- объединение многоканальных данных (например, синхронизация хроматограмм с масс-спектрами или временными рядами из каталитических процессов);
- построение эмпирических моделей свойств соединений, предсказание активности, токсичности, растворимости и других параметров на основе доступных экспериментальных и теоретических данных;
- хемоинформатику и статистический анализ химических библиотек, включая кластеризацию, выявление корреляций, сопоставление структурных фрагментов и свойств;
- и множество других областей применения.
В качестве примера из нашей практики можно привести работу по исследованию наночастиц палладия в гетерогенном катализе [20]. ИИ-алгоритмы использовали для автоматической обработки изображений, полученных при помощи электронного микроскопа. Обработка включала сегментацию, распознавание формы и статистический анализ распределения частиц, что позволило количественно описать эволюцию катализатора в ходе реакции.
Разработан и реализован ИИ-подход к автоматическому анализу масс-спектрометров с высоким разрешением [21]. Основой методологии стала система MEDUSA, в которой машинное обучение используется на всех ключевых этапах: для кластеризации сигналов применены алгоритмы градиентного бустинга, а для распознавания элементного состава и определения молекулярных формул – рекуррентные нейросети типа LSTM. Такой подход позволил существенно упростить и ускорить анализ сложных смесей, сделать его полностью автоматическим и независимым от предварительных предположений о составе образца [21]. В результате задача нахождения формул веществ по спектрам, ранее считавшаяся крайне трудной для многокомпонентных смесей и сложных спектров, успешно решена средствами искусственного интеллекта.
Рис. 2. Исследование биопленок с использованием СЭМ: а – процесс подготовки данных для обучения нейросети; б – примеры аннотированных данных на различных изображениях; в – биопленки S. aureus ATCC 6538: биопленка, полученная после 24 ч инкубации на поверхности плотной питательной среды (слева); биопленка после 72 часов инкубации (справа); г – динамика формирования биопленки S. aureus с отображением статистики по площадям: клетки, матрикс, каналы и зоны без клеток; результаты получены с использованием нейросети для сегментации изображений на базе архитектуры U-Net. Воспроизводится из статьи [22] по лицензии CC BY 3.0.
Для изучения проблемы антибиотикорезистентности применены алгоритмы глубокого обучения, в частности, сегментационные нейросети U-Net, для автоматического анализа изображений биопленок, полученных с помощью сканирующей электронной микроскопии (СЭМ) [22]. Использование ИИ позволило сегментировать изображения на клетки, матрикс, каналы и свободные зоны, а также выполнить статистический подсчет более 70 тыс. клеток и оценку морфологии с макромасштабным охватом. Это дало возможность в 1000–1500 раз ускорить анализ по сравнению с ручной обработкой и впервые построить кинетическую модель роста биопленки на основе СЭМ-данных (рис. 2).
Таким образом, ИИ на уровне «аналитик» позволяет химикам выйти за пределы традиционных ограничений ручной интерпретации накопленной информации. Этот уровень дает новое качество научного анализа — выявляются скрытые зависимости, снижается доля потерянных и “спящих” данных, сокращается число ненужных экспериментов и повышается воспроизводимость. Особенно важна возможность создания решений, адаптированных под специфику конкретного исследования или задачи, — это позволяет быстрее достигать научных результатов даже в условиях недостаточных ресурсов.
Уровень 3: ИИ-исследователь
Третий уровень представляет собой наиболее амбициозную и концептуально новую форму применения искусственного интеллекта в химии. Здесь ИИ рассматривается не как вспомогательный инструмент или аналитический модуль, а как потенциальный участник научного поиска, основная задача которого – оцифровка научного мышления, включая формулирование гипотез, стратегический выбор направлений исследования и выявление скрытых закономерностей в слабо структурированных пространствах знаний.
Этот уровень требует интеграции множества ИИ-компонентов: языковых моделей, онтологий, логических выводов, стохастических и причинно-следственных моделей, а также механизмов самообучения. Важная особенность этой роли ИИ – переход от работы с явными входными данными (текстами, изображениями, спектрами) к моделированию намерений, целей и эвристических посылов исследователя, что предполагает новое качество взаимодействия между человеком и машиной.
Несмотря на то, что уровень пока находится в стадии становления, уже разрабатывают отдельные прототипы интеллектуальных агентов, способных:
- генерировать и ранжировать научные гипотезы на основе анализа литературы и экспериментальных данных;
- проектировать молекулы и материалы с заданными свойствами с учетом синтетической доступности и термодинамической стабильности;
- предлагать стратегии синтеза, адаптированные под конкретные условия;
- определять наиболее информативные эксперименты для ускоренного получения знаний;
- автоматически выявлять противоречия, пробелы и потенциальные ошибки в научных публикациях;
- осуществлять непрерывное самообучение на новых наборах данных и результатах экспериментов;
- осваивать другие области приложения, число которых быстро растет.
Как пример можно привести системы для автономного планирования и выполнения химических экспериментов (роботизированные лаборатории), алгоритмы генерации механизмов реакций, а также платформы, интегрирующие базы знаний с логикой научного рассмотрения. Такие системы уже начали применять в ускоренном поиске катализаторов, оптимизации фотоматериалов, дизайне лекарственных молекул и автоматическом открытии новых синтетических маршрутов.
Рис. 3. Различия в подходах человека и природы к синтезу сложных молекул с точки зрения молекулярной сложности: а – график зависимости молекулярной сложности от метода синтеза; б – варьирование молекулярной сложности химических соединений; в – сравнение синтетических подходов человека и природы. Воспроизводится из статьи [30] по лицензии CC BY 3.0.
Важным вкладом является оцифровка интуитивного восприятия молекулярной сложности с помощью алгоритма машинного обучения Learning-to-Rank. Алгоритм обучен на почти 300 тыс. сравнений, выполненных экспертами [30]. Используя градиентный бустинг деревьев решений, модель извлекла скрытые закономерности, отражающие экспертные оценки исследуемого интуитивного понятия. Это первый пример моделирования интуиции человека при восприятии молекулярной сложности с помощью искусственного интеллекта. Такой подход позволит количественно оценивать этот параметр и применять численные характеристики в анализе лекарств, реакций и стратегий синтеза [30]. В частности, природный путь синтеза характеризуется неравномерными изменениями сложности молекул и использованием многофункциональных промежуточных соединений (рис. 3). Напротив, современные синтезы, разработанные человеком, направлены на постепенное и монотонное увеличение сложности молекул с минимизацией количества стадий. Это отражает разный образ мышления: гибкость и универсальность у природы против линейной эффективности у человека.
Ключевая возможность, ожидаемая на третьем уровне применения искусственного интеллекта в химии – генерация гипотез. В недавнем исследовании ИИ использовали для генерирования гипотез о новых химических реакциях на основе ранее выполненных масс-спектрометрических исследований [31].
Типичный экспериментальный рабочий процесс в органическом синтезе прошлого исторического периода (до внедрения ИИ) сопряжен с ограничениями ручной интерпретации, где значительная часть информации, содержащейся, например, в масс-спектрометрах высокого разрешения (HRMS), остается неиспользованной (рис. 4). ИИ позволяет провести глубокий анализ ранее накопленных данных HRMS и на его основе автоматически генерировать гипотезы о возможных реакциях. При комбинировании автоматической генерации гипотез-кандидатов с ML-моделями анализа спектров, обнаружены ранее неизвестные продукты и пути реакций без проведения новых экспериментов. Это позволило выявить трансформации, оставшиеся незамеченными при традиционном ручном анализе [31].
Рис. 4. Интеграция ИИ-исследователя в химии: исторически сложившаяся практика (а) и генерация гипотез с использованием ИИ на основе ранее проведенных экспериментов (б). Воспроизводится из статьи [31] по лицензии CC BY 4.0.
ИИ на уровне «исследователь» открывает принципиально новый этап в развитии химии, поскольку затрагивает творческую и эвристическую составляющую научной деятельности, ранее считавшуюся исключительно человеческой прерогативой. Возникает возможность масштабировать не только рутинную работу, но и научное мышление, превращая ИИ в партнера по исследованию.
Потенциальные перспективы включают: а) создание цифровых научных агентов, способных формировать исследовательские программы и взаимодействовать с человеком на уровне постановки задач; б) автономное открытие новых классов веществ и реакций за счет нестандартных стратегий поиска; в) ускоренное освоение «темных областей» химического пространства, недоступных логике пошаговых переборов; г) интеграцию с подходом “наука как данные”, где ИИ помогает трансформировать исследования в обобщенные формы знания и открывает другие нестандартные возможности.
Однако такой уровень ставит перед научным сообществом серьезные вызовы: необходимость верификации результатов, этические аспекты авторства и ответственности, переосмысление роли человека в исследовательском процессе. Тем не менее, именно ИИ-исследователь формирует наиболее далекое, но перспективное направление движения всей цифровой химии.
Следует отметить, что уровни 1 и 2 (ИИ-ассистент и ИИ-аналитик) уже получили широкое признание в научном сообществе и активно применяются на практике. Однако перспективы третьего уровня (ИИ-исследователь) остаются предметом дискуссий. Не все специалисты согласны с тем, что искусственный интеллект способен воспроизводить элементы научного мышления даже в отдельных аспектах. Некоторые считают, что творческое и интуитивное начало, присущее человеку, невозможно формализовать алгоритмически. Другие, напротив, полагают, что при наличии достаточного объема данных и вычислительных мощностей аналогичные механизмы могут быть смоделированы. Более точная оценка этих подходов и границ применимости ИИ в научном мышлении требует дальнейших исследований.
Контекст и вызовы внедрения ИИ в химические науки
Помимо непосредственных технологических и научных характеристик каждого уровня интеграции ИИ в химию существует ряд важных аспектов, которые влияют на успешность и устойчивость цифровой трансформации в целом.
Порог входа и навигация между уровнями. Каждый из трех уровней требует от человека-исследователя различной степени подготовки и вовлеченности. Для работы на уровне ассистента достаточно базовых цифровых навыков. Уровень аналитика уже предполагает владение языками программирования, знание методов обработки данных и опыт работы с программными библиотеками. Уровень исследователя, в свою очередь, требует понимания принципов машинного обучения, логических моделей, а также способности к формализации научного мышления. Важно учитывать, что границы между уровнями не всегда четкие: многие лаборатории и проекты комбинируют элементы разных подходов, постепенно переходя от одного уровня к другому.
Методологические вызовы имеют значение на всех уровнях, но особенно актуальны на третьем уровне, где ИИ потенциально способен генерировать научные гипотезы и решения. Возникает вопрос о достоверности таких предложений и необходимости их верификации человеком. Проблема “черного ящика” в алгоритмах и невозможность полной интерпретации машинных решений требует разработки новых стандартов научной прозрачности и воспроизводимости. Важной методологической проблемой является недостаток достоверных обучающих данных. Модели, обученные на неполных или некачественных данных, будут предлагать ненадежные решения.
Обратная связь и обучение ИИ на ошибках. Для эффективного применения ИИ в химии критически важна организация механизма обратной связи, позволяющего системам учиться на собственных ошибках и корректировать работу на основе реальных результатов. Во многих случаях ИИ-алгоритмы используют как «одноразовые» решения без последующего анализа их точности и причин возможных отклонений. Отсутствие систематической обратной связи ограничивает адаптивность моделей и повышает риск воспроизведения ошибок. Для повышения надежности ИИ-инструментов необходимо внедрять практики регулярной валидации, корректировки моделей на основе новых результатов, а также участия исследователя в интерпретации и уточнении выводов.
Инфраструктура и цифровая экосистема. Для полноценного внедрения ИИ требуется развитая инфраструктура: доступ к качественным открытым данным, соблюдение принципов FAIR (Findable, Accessible, Interoperable, Reusable), наличие вычислительных ресурсов и облачных платформ. Без системной поддержки на уровне научных институтов, университетов и национальных стратегий развитие цифровой химии будет носить фрагментарный характер.
Междисциплинарное взаимодействие. Успех ИИ в химии невозможен без тесного сотрудничества между химиками, программистами, инженерами и математиками. Необходимы команды, объединяющие знания из разных областей, а также образовательные программы, готовящие исследователей нового типа – способных мыслить химически и на продвинутом уровне работать со сложными данными. Такая интеграция знаний создает основу для устойчивого развития ИИ в химических науках.
Психологические и культурные барьеры. Одним из препятствий для внедрения ИИ остается настороженность со стороны исследователей. Это связано с опасениями утраты контроля, недоверием к результатам, полученным машиной, и восприятием ИИ как угрозы профессиональной идентичности. В академической среде, где традиционно ценится ручной анализ и личная экспертиза, автоматизация может восприниматься как упрощение научной работы. Также играет роль инерционность научной культуры и нехватка примеров успешного применения ИИ на практике.
Этические проблемы и дисбаланс. Применение ИИ в химии сопровождается рисками этического и социального характера. Одним из вызовов является неравномерный доступ к ИИ-инструментам: вычислительные ресурсы и качественные модели сосредоточены в крупных центрах, что усиливает научный дисбаланс между странами и учреждениями. Серьезную проблему вызывает и вопрос авторства при участии ИИ в создании научного результата. Не всегда ясно, кому принадлежит идея, гипотеза или открытие, а также какой вклад в их формулировку внес алгоритм. Это требует обновления подходов к научной атрибуции и оформления публикаций. Также существует опасность использования ИИ без должной верификации, что может подорвать научную достоверность. Возникают риски неэтичного применения ИИ – от создания опасных веществ до манипуляции данными. Для устойчивого развития цифровой химии необходимо достижение прозрачности, ответственности и этического баланса.
Правовые и регуляторные барьеры. Интеграция ИИ в химические исследования сопровождается нерешенными вопросами правового регулирования. Возникают сложности с определением авторства и интеллектуальных прав на результаты, созданные с участием ИИ, особенно на уровне генерации гипотез и проектирования новых веществ. Пока неясен статус таких результатов при патентовании и в рамках научных публикаций. Кроме того, остается открытым вопрос о распределении ответственности за решения, принятые ИИ в случае, например, ошибки ИИ, приведшей к недостоверным результатам или небезопасным рекомендациям. Отсутствие четких регуляторных рамок затрудняет внедрение ИИ и требует обновления нормативно-правовой базы, а также разработки новых стандартов оценки, верификации и распределения ответственности при использовании цифровых решений в науке.
Опасности и риски
Несмотря на высокий потенциал и очевидные преимущества, внедрение искусственного интеллекта в химию сопряжено с рядом рисков, которые возрастают по мере продвижения от базового к продвинутому уровню интеграции. Эти риски касаются как научной достоверности, так и технологической устойчивости всей системы.
Уровень 1: ИИ-ассистент
Основным риском является некритичное использование автоматически сгенерированных материалов. Лингвистические и стилистические ошибки, некорректная интерпретация терминов, устаревшие или ложные сведения могут быть восприняты как достоверные, особенно при отсутствии достаточной проверки. Это создает риск текстовых и коммуникационных искажений, особенно при подготовке отчетности, нормативной документации, переводов и описаний процессов. Кроме того, злоупотребление ИИ-инструментами может снизить навыки самостоятельного анализа и критического мышления самих исследователей.
Уровень 2: ИИ-аналитик
Главная угроза – это ошибки в обработке и интерпретации экспериментальных данных. Некорректные параметры модели, неполные или искаженные обучающие выборки, игнорирование физико-химических ограничений могут привести к созданию ложных закономерностей или переобучению моделей, что влечет за собой введение в научный оборот недостоверных результатов, особенно при автоматическом анализе больших массивов информации. Также возникает риск снижения воспроизводимости, если модели не документированы или зависят от локальных условий, недоступных другим исследователям.
Уровень 3: ИИ-исследователь
Риски становятся наиболее значимыми, поскольку речь идет о системах, участвующих в формулировании научных гипотез и проектировании новых веществ и процессов. Главная опасность – отсутствие верифицируемости предложений, формируемых ИИ без прозрачного логического обоснования. Риск заключается в создании псевдонаучного знания, которое внешне выглядит логичным и научным, но не проходит проверку экспериментом. Кроме того, возможна утрата контроля над направлением исследования, особенно при автономных или самообучающихся системах, когда формируются приоритеты, не согласованные с научной и технологической целесообразностью.
Общие для науки и химической отрасли в более широком контексте риски применения ИИ включают в себя:
- эрозию научной ответственности: размытие границ между вкладом человека и машины в научный результат, вопросы авторства, контроля и рецензирования;
- этические дилеммы: использование ИИ для проектирования потенциально опасных веществ (токсиканты, прекурсоры, агрессивные реагенты), а также риски проектирования веществ двойного назначения;
- неравномерность доступа: концентрация продвинутых ИИ-технологий в руках ограниченного числа стран, корпораций или центров, что может усугубить глобальные дисбалансы в научном и промышленном развитии;
- зависимость от закрытых платформ: отсутствие контроля над исходным кодом и принципами работы коммерческих ИИ-систем затрудняет проверку результатов и долгосрочную устойчивость научной инфраструктуры;
- интеллектуальную инерцию: замещение человеческого поиска стандартными машинными шаблонами может привести к снижению научной оригинальности и фрагментации знания;
- множество других рисков, список которых постоянно пополнятся.
Таким образом, реализация преимуществ ИИ в химии невозможна без осознанного управления рисками, институциональной поддержки, прозрачных стандартов и сохранения ведущей роли человека как критически мыслящего участника научного процесса. Следует подчеркнуть, что приведенный выше перечень рисков и примеров использования не является исчерпывающим, и по мере развития ИИ-систем могут проявиться новые, ранее не предсказанные угрозы.
Применение ИИ в науке, образовании и промышленности
В табл. 2-4 отражен обобщенный анализ текущей ситуации в применении искусственного интеллекта на различных уровнях – ИИ-ассистент (табл. 2), ИИ-аналитик (табл. 3) и ИИ-исследователь (табл. 4) – в науке, образовании, разработке технологий и промышленности. Описанные задачи, функции и сценарии внедрения основаны на актуальных примерах и наблюдениях, демонстрирующих траектории цифровой трансформации химической отрасли.
Таблица 2. ИИ-ассистент: ключевые сценарии применения
Сфера |
Задачи и функции |
Эффекты и примеры |
Наука и образование |
• Подготовка черновиков и аннотаций |
• Помощь студентам и ученым • Автоматизация подготовки материалов |
Разработка технологий |
• Формирование лабораторных протоколов |
• Повышение воспроизводимости |
Промышленность |
• Подготовка документация и выполнение переводов • Обработка отчетов • Работа с данными поставщиков • Оформление инструкций и стандартов • Обработка текстов и изображений |
• Снижение административной нагрузки |
Таблица 3. ИИ-аналитик: ключевые сценарии применения
Сфера |
Задачи и функции |
Эффекты и примеры |
Наука и образование |
• Анализ экспериментальных данных (спектры, изображения и др.) |
• Автоматизация обработки данных |
Разработка технологий |
• Предсказание свойств соединений |
• Ускорение разработки материалов и катализаторов |
Промышленность |
• Цифровой контроль качества • Цифровые двойники процессов • Предиктивное обслуживание установок • Интеграция ИИ в R&D и контроль • Оптимизация производства через моделирование |
• Стабильность и снижение потерь |
Таблица 4. ИИ-исследователь: ключевые сценарии применения
Сфера |
Задачи и функции |
Эффекты и примеры |
Наука и образование |
• Генерация и отбор научных гипотез |
• Ускорение появления оригинальных идей |
Разработка технологий |
• Автономный дизайн новых веществ и процессов |
• Прямой переход от данных к инновациям |
Промышленность |
• Стратегическое ИИ-планирование • Предсказание технологических сдвигов • Поиск инноваций в промышленных данных • Цифровое проектирование отраслевых стратегий • Адаптация бизнес-моделей к будущим вызовам |
• Управление на опережение |
Важно подчеркнуть, что проведенный анализ не является исчерпывающим. Сфера ИИ-технологий крайне динамична: инструменты быстро развиваются, появляются новые архитектуры, методологии и области применения. Многие из применений, находящихся сейчас на стадии эксперимента или пилота, уже в ближайшие годы могут стать промышленным решением.
Следует постоянно отслеживать актуальные изменения, поскольку внутри обозначенных направлений (ИИ-ассистент, ИИ-аналитик, ИИ-исследователь) будут возникать новые задачи, тренды и технологии, способные существенно преобразовать баланс научных и технологических инициатив. Для эффективного развития необходимо не только внедрение текущих решений, но и активная адаптация к быстро меняющемуся ландшафту ИИ в науке, образовании и промышленности.
Заключение
Достижения в области искусственного интеллекта открывают перед химией новые горизонты как в организации исследовательского процесса, так и в характере научного мышления. Представленная в статье трехуровневая классификация применения ИИ в химии (ассистент, аналитик, исследователь) позволяет систематизировать существующие подходы и задать ориентиры для дальнейшего развития.
Каждый уровень отражает определенную ступень цифровизации химических исследований. На первом уровне ИИ автоматизирует рутинные текстовые задачи, позволяя существенно сэкономить время и повысить продуктивность работы ученых. Второй уровень предполагает активное участие исследователя в разработке алгоритмов и аналитических инструментов для обработки химических данных – от спектров до изображений. Третий уровень является наиболее амбициозным: он включает формализацию элементов научного мышления, генерацию гипотез, выбор стратегий исследования и проектирование синтетических маршрутов в условиях высокой неопределенности.
Данная классификация может быть представлена в виде пирамиды, основание которой составляют широко доступные ИИ-инструменты, применимые практически в любой научной группе. Средний уровень требует технической подготовки и инфраструктурной поддержки, а вершина связана с прорывными задачами на стыке химии, информатики и осмысления науки. Такое пирамидальное построение обеспечивает масштабируемость: от локальных решений к системным преобразованиям научной деятельности.
Каждый уровень демонстрирует значимый вклад в химию. Вместе с тем успешное продвижение по ступеням развития ИИ требует осознания целого ряда факторов. Среди них подготовка кадров с гибридными компетенциями, развитие инфраструктуры открытых и достоверных данных, обеспечение междисциплинарного взаимодействия, а также разработка новых этических и методологических стандартов. Особенно остро такие вопросы стоят при переходе к третьему уровню, где ИИ может формировать научные предложения, подлежащие обязательной верификации и интерпретации человеком. На всех уровнях важным условием является осмысление и отработка возникающих опасностей и рисков до практического внедрения продуктов на основе ИИ.
В совокупности, ИИ-инструменты не заменяют исследователя, но трансформируют практику научной деятельности. Они становятся не просто средствами ускорения работы, а потенциальными факторами прогресса в науке и создания промышленных технологий. Развитие цифровой химии идет от автоматизации к сотворчеству. Грамотная реализация и внедрение ИИ-инструментов всех трех уровней при сохранении научной критичности и методологической строгости открывает широчайшие возможности для будущих достижений.
Эволюция искусственного интеллекта в химии приводит к появлению новой категории – «технология-участник» – способной взаимодействовать с человеком на уровне целей, гипотез и научных решений. Это требует не только переосмысления роли ИИ, но и пересмотра методологических, этических и юридических оснований научного процесса. Технология становится не просто средством, а активным участником коллективного познания. Такое расширение парадигмы открывает принципиально новые горизонты науки и формирует основу для концепции интеллектуальной кооперации между человеком и машиной в будущем научном исследовании.
Методологическая справка
Статья подготовлена с использованием современных цифровых технологий и искусственного интеллекта, включая методы контекстного анализа, выявления научных трендов и автоматизированной обработки научной литературы. В работе применяли алгоритмы обработки естественного языка, семантического анализа и кластеризации тематики публикаций, а также цифровые инструменты структурирования и оптимизации текстовых данных. Использованы цифровые методы оценки аналитической обоснованности классификации и привязка к актуальным направлениям развития химической науки.
Литература/References
- Ananikov V.P. Top 20 Influential AI-Based Technologies in Chemistry. Art. Int. Chem. 2024; 2(2): 100075. https://doi.org/10.1016/j.aichem.2024.100075.
- Ding H., Hua P., Huang Z. Survey on Recent Progress of AI for Chemistry: Methods, Applications, and Opportunities. arXiv, 2025; arXiv:2502.17456. https://doi.org/10.48550/arXiv.2502.17456.
- Berber S., Brückner M., Maurer N., Huwer J. Artificial Intelligence in Chemistry Research─Implications for Teaching and Learning. J. Chem. Educ. 2025; 102(4):1445-1456. https://doi.org/10.1021/acs.jchemed.4c01033.
- Dabas R. Twenty ways AI is advancing chemistry. Chemistry World, 17 October 202 28.05.2025. URL: https://www.chemistryworld.com/news/twenty-ways-ai-is-advancing-chemistry/4020269.article.
- Ramos M.C., Collison C.J., White A.D. A Review of Large Language Models and Autonomous Agents in Chemistry. Chem. Sci. 2025; 16:2514–2572. https://doi.org/10.1039/D4SC03921A.
- Kumar A., Zavala V.M. Editorial for the AI/ML in Chemical Engineering Special Issue. Ind. Eng. Chem. Res. 2025; 64(19): 9441–9442. https://pubs.acs.org/doi/10.1021/acs.iecr.5c01582.
- Romagnoli J.A., Briceño-Mena L., Manee V. AI in Chemical Engineering. Edition 1, CRC Press, Boca Raton, 2024, 308 p. https://doi.org/10.1201/9781003455905.
- Caccavale F., Gargalo C.L., Kager J., Larsen S., Gernaey K.V., Krühne U. ChatGMP: A Case of AI Chatbots in Chemical Engineering Education Towards the Automation of Repetitive Tasks. Comput. Educ.: Artif. Intell. 2025; 8: 100354. https://doi.org/10.1016/j.caeai.2024.100354.
- Ghasemlou M., Nguyen H. C., Talekar S., Pfeffer F. M., Barrow C. J. Artificial Intelligence (AI) for More Sustainable Chemistry and a Greener Future. ACS Sustain. Chem. Eng. 2025; 13: 3830-3833. https://doi.org/10.1021/acssuschemeng.5c00853.
- Artificial Intelligence for Chemical Sciences, ed. Kulkarni S., Bhandari S., Varshney D., William P., Apple Academic Press, New York, 2025. 414 p. https://doi.org/1201/9781003569282.
- Yuan M., Guo Q., Wang Y. The current research status and prospects of AI in chemical science. Prog. Nat. Sci.: Mater. Int. 2024; 34: 859-872. https://doi.org/10.1016/j.pnsc.2024.08.003.
- Vu V.-H., Bui K.-H., Dang K. D. D., Duong-Tuan M., Le D. D., Nguyen-Dang T. Finding Environmental-Friendly Chemical Synthesis with AI and High-Throughput Robotics. J. Sci.: Adv. Mater. Devices. 2025; 10: 100818. https://doi.org/10.1016/j.jsamd.2024.100818.
- Bienstock R.J. AI/ML Methodologies and the Future-will They be Successful in Designing the Next Generation of New Chemical Entities? J. Cheminform. 2025; 17, 46. https://doi.org/10.1186/s13321-025-00995-5.
- Ishida S., Sato T., Honma T., Terayama K. Large Language Models Open New Way of AI-Assisted Molecule Design for chemists. J. Cheminform. 2025; 17, 36. https://doi.org/10.1186/s13321-025-00984-8.
- Han R., Yoon H., Kim G., Lee H., Lee Y. Revolutionizing Medicinal Chemistry: The Application of Artificial Intelligence (AI) in Early Drug Discovery. Pharmaceuticals. 2023; 16(9): 1259. https://doi.org/10.3390/ph16091259.
- Liu C., Chen Y., Mo F. Transforming organic chemistry research paradigms: moving from manual efforts to the intersection of automation and artificial intelligence, arXiv. 2023; arXiv:2312.00808. https://doi.org/10.48550/arXiv.2312.00808.
- Boiko D.A., MacKnight R., Kline B., Gomes G. Autonomous Chemical Research with Large Language Models. Nature. 2023; 624: 570-578. https://doi.org/10.1038/s41586-023-06792-0.
- Song T., Luo M., Zhang X., Chen L., Huang Y., Cao J. et al. A Multiagent-Driven Robotic AI Chemist Enabling Autonomous Chemical Research on Demand. J. Am. Chem. Soc. 2024; 147(15):12534-12545. DOI: 10.1021/jacs.4c17738.
- Ma K. AI Agents in Chemical Research: An Intelligent Research Assistant System. ChemRxiv., 2024; https://doi.org/10.26434/chemrxiv-2024-6tv8c-v2.
- Eremin D.B., Galushko A.S., Boiko D.A., Pentsak E.O., Chistyakov I.V., Ananikov V. P. Toward Totally Defined Nanocatalysis: Deep Learning Reveals the Extraordinary Activity of Single Pd/C Particles. J. Am. Chem. Soc. 2022; 144(13): 6071–6079. https://doi.org/10.1021/jacs.2c01283.
- Boiko D.A., Kozlov K.S., Burykina J.V., Ilyushenkova V.V., Ananikov V.P. Fully Automated Unconstrained Analysis of High-Resolution Mass Spectrometry Data with Machine Learning. J. Am. Chem. Soc. 2022; 144(32): 14590-14606. https://doi.org/10.1021/jacs.2c03631.
- Kozlov K.S., Boiko D.A., Detusheva E.V., Detushev K.V., Pentsak E.O., Vereshchagin A.N., Ananikov V.P. Digital Biology Approach for Macroscale Studies of Biofilm Growth and Biocide Effects with Electron Microscopy. Dig. Discov. 2023; 2: 1522-1539. https://doi.org/10.1039/D3DD00048F.
- Daniel T., Xuan J. Responsible Use of Generative AI in Chemical Engineering. Digit. Chem. Eng. 2024; 12: 100168. https://doi.org/10.1016/j.dche.2024.100168.
- Yuan Y., Chaffart D., Wu T., Zhu J. Transparency: The Missing Link to Boosting AI Transformations in Chemical Engineering. Engineering. 2024; 39, 45-60. https://doi.org/10.1016/j.eng.2023.11.024.
- Ruff E.F., Zemke J.M.O. Discussing the Ethics of Professional AI Use in Undergraduate Chemistry Courses. J. Chem. Educ. 2025; 102(4): 1457-1464. https://doi.org/10.1021/acs.jchemed.4c01038.
- Guo T., Guo K., Nan B., Liang Z., Guo Z., Chawla N.V., Wiest O., Zhang X. What Can Large Language Models Do in Chemistry? A Comprehensive Benchmark on Eight Tasks. arXiv, 2023; arXiv:2305.18365. https://doi.org/10.48550/arXiv.2305.18365.
- Zimmermann Y., Bazgir A., Al-Feghali A. et al. 34 Examples of LLM Applications in Materials Science and Chemistry: Towards Automation, Assistants, Agents, and Accelerated Scientific Discovery. arXiv, 2025; arXiv:2505.03049. https://doi.org/10.48550/arXiv.2505.03049.
- Han Y., Wan Z., Chen L., Yu K., Chen X. From Generalist to Specialist: A Survey of Large Language Models for Chemistry. arXiv, 2024; arXiv:2412.19994. https://doi.org/10.48550/arXiv.2412.19994.
- Jablonka K.M., Ai Q., Al-Feghali A. et al. 14 Examples of How LLMs Can Transform Materials Science and Chemistry: a Reflection on a Large Language Model Hackathon. Digit. Discov. 2023; 2: 1233-1250. https://doi.org/10.1039/D3DD00113J.
- Tyrin A.S., Boiko D.A., Kolomoets N.I., Ananikov V.P. Digitization of Molecular Complexity with Machine Learning. Chem. Sci. 2025; 16: 6895-6908. https://doi.org/10.1039/D4SC07320G.
- Kozlov K.S., Boiko D.A., Burykina J.V., Ilyushenkova V.V., Kostyukovich A.Yu., Patil E.D., Ananikov V.P. Discovering Organic Reactions with a Machine-Learning-Powered Deciphering of Tera-Scale Mass Sspectrometry Data. Nat. Commun. 2025; 16: 2587. https://doi.org/10.1038/s41467-025-56905-8.
______________________________________________________________________________________________________________________________________________________
"Как цитировать:
В.П.Анаников, Классификация применения искусственного интеллекта в химии: от автоматизации к цифровому научному мышлению, Аналитика, 2025, т.15, №4, c. 246-260.
[ссылка] [загрузить PDF]"