
Специалисты Сибирского федерального университета разработали инновационный метод для стремительного поиска схожих последовательностей в геномах, что способно повысить скорость анализа данных в десятки раз. Один из создателей проекта, доктор физико-математических наук, профессор Сергей Царев, рассказал о перспективах и возможностях этой технологии.
Передовые подходы к анализу геномных данных
Современные базы данных, содержащие генетическую информацию, открывают широкие возможности для исследователей со всего мира. Однако при поиске идентичных или похожих участков генома через онлайн-запросы, ученые сталкиваются с необходимостью ждать готового результата сутками. Особенно это заметно при работе с полными геномами сложных организмов, например хвойных растений, в геномах которых встречается множество повторов. Соответственно, сборка полной картины требует массивных вычислительных мощностей и продолжительной работы.
Сегодня математики по всему миру стремятся разработать ускоренные алгоритмы для поиска совпадающих участков среди огромных массивов текстовых или геномных данных. Эффективные решения способны преобразить сферу биоинформатики и ускорить научные открытия.
Уникальный алгоритм: как работает инновация СФУ
По словам Сергея Царева, новый подход получил название "оперативный поиск с использованием обобщенной шкалы нониуса". Принцип работы напоминает устройство штангенциркуля: главная шкала задает основной диапазон, а нониус — позволяет точнее определять положение искомого элемента. Такой метод в разы ускоряет обработку данных — во многих случаях время анализа сокращается в десять раз и более.
Особое преимущество новой технологии — способность выявлять схожие фрагменты ДНК даже там, где традиционные алгоритмы, например более старый и массово применяемый BLAST, могли бы не обнаружить соответствия. Это открывает новые горизонты в поиске уникальных признаков и закономерностей в геномах различных организмов.
Актуальность быстрых алгоритмов для разных сфер
Быстрая обработка текстовой информации чрезвычайно важна для современного общества. Почти всё, что связано с поиском — будь то поиск в интернете, проверка на уникальность текстов, анализ ошибок в письменных работах, — требует молниеносных решений. Например, благодаря оптимизированным алгоритмам, поисковые системы предоставляют результаты за доли секунды, а антиплагиат-сервисы способны сравнивать огромные массивы документов в короткие сроки.
Разработанный учеными СФУ алгоритм уже успешно проходит апробацию в разных областях и имеет большой потенциал для внедрения не только в биоинформатике, но и в сферах вычислительной лингвистики, цифрового поиска и обработки больших данных.
История разработки и перспективы
Работа над инновационным алгоритмом началась девять лет назад. К исследованию присоединился красноярский биофизик, профессор Михаил Садовский. Уже в 2016 году коллектив получил первые результаты, проведя тесты на человеческом геноме и геноме дрозофилы. Сравнительный анализ показал, что их метод значительно превосходит имеющиеся алгоритмы, в частности классический BLAST, по скорости и эффективности поиска.
Теперь перед командой стоит задача интеграции собственной разработки в существующие платформы для анализа геномных данных, чтобы ускорить и повысить точность биологических исследований во всем мире. Кроме того, ученые планируют применить этот подход для совершенствования процессов поиска и анализа текстов, что потенциально может оказать большое влияние на интернет-технологии и образовательную сферу.
Вдохновляющие перспективы для науки и технологий
Коллектив СФУ с оптимизмом смотрит в будущее, отмечая, что их методика найдет применение во многих отраслях. Улучшение алгоритмов поиска вдохновляет на новые эксперименты и исследования, а значит, уже в ближайшие годы мы станем свидетелями множества научных открытий, а также роста эффективности вычислительных процессов в самых разных областях жизни.
Изображение предоставлено фотобанком Freepik
Источник: scientificrussia.ru






