
Ученые Института общей и неорганической химии им. Н.С. Курнакова РАН, Московского государственного университета имени М.В. Ломоносова и Национального исследовательского университета "Высшая школа экономики" разработали базу данных растворимости органических соединений в бинарных смесях растворителей MixtureSolDB. Они также создали онлайн-приложение для интерактивной визуализации данных. Эта база позволяет прогнозировать растворимость веществ в бинарных смесях с использованием алгоритмов искусственного интеллекта. Инструмент крайне перспективен для разработки новых лекарств и материалов.
Значение растворимости в науке и промышленности
Растворимость — ключевое свойство соединений, определяющее их применение в химическом синтезе, материаловедении и фармацевтике. Использование смесей растворителей в технологических процессах значительно усложняет оценку этого параметра. Предсказание растворимости в смесях остается сложной задачей для хемоинформатики, главным образом из-за нехватки больших и разнообразных экспериментальных наборов данных. Методы машинного обучения предлагают решение, позволяя предсказывать свойства без дорогостоящих экспериментов.
MixtureSolDB: Мировой лидер по объему данных
Московские ученые создали крупнейшую в мире базу данных растворимости органических соединений в бинарных смесях растворителей, содержащую свыше 175 тысяч экспериментальных значений. Лев Краснов, младший научный сотрудник ИОНХ РАН, пояснил: "Мы обработали 1115 научных публикаций, систематизировав 175166 значений растворимости для 810 соединений в 750 уникальных смесях при температурах 252-383 K. Каждая запись прошла строгую проверку. Структуры представлены в формате SMILES, что идеально для машинного обучения. Также создано онлайн-приложение для визуализации и поиска данных".
Прорыв в машинном обучении
Созданная база решает критическую проблему отсутствия всеобъемлющих данных по растворимости в смесях растворителей, что ранее сдерживало развитие методов машинного обучения в этой области. В отличие от предыдущих исследований, фокусировавшихся на индивидуальных растворителях, MixtureSolDB впервые предоставляет масштабный систематизированный набор для бинарных смесей.
Практическая ценность для инноваций
База включает как распространенные системы (вода-этанол, вода-ацетонитрил, этанол-ацетон), так и другие важные комбинации. Точное знание растворимости в смесях критически важно для разработки инновационных химико-технологических процессов, выбора условий синтеза, создания лекарственных форм и эффективных методов кристаллизации и экстракции.
Вклад молодых ученых
Авторы особо отметили вклад студентов-первокурсников химфака МГУ Фёдора Кузнецова, Владимира Елистратова и Матвея Васиярова, для которых эта работа стала первой научной публикацией. Кузнецов и Елистратов — победители Международной химической олимпиады 2025 года (IChO-2025), Васияров — победитель IChO-2024.
Финансовая поддержка
Исследование выполнено при финансовой поддержке Минобрнауки России в рамках государственного задания ИОНХ РАН.
Источник: scientificrussia.ru






