С помощью искусственного интеллекта ученые обнаружили 70 500 вирусов, ранее неизвестных науке, многие из которых были странными и не похожими на известные виды, сообщает служба новостей Nature. Научная статья вышла в Cell. РНК-вирусы были идентифицированы с помощью метагеномики, когда ученые берут образцы всех геномов, присутствующих в среде.
Вирусы — вездесущие микроорганизмы, которые заражают животных, растения, бактерии, однако лишь малая их часть была идентифицирована и описана.
Распространенный метод идентификации новых вирусов заключается в поиске части генома, которая кодирует ключевой белок, используемый в репликации (копировании) РНК. Он называется «РНК-зависимой РНК-полимеразой» (RdRps). Но если последовательность, кодирующая этот белок в вирусе, сильно отличается от любой известной, хранящейся в базах данных, исследователи не узнают ее.
Авторы нового исследования разработали алгоритм LucaProt, используя архитектуру, лежащую в основе ChatGPT, и снабдили ее данными прогнозирования белков (открытие, за которое в 2024 году вручили Нобелевскую премию). Затем модель обучили распознавать вирусные RdRps и использовали ее для поиска геномных последовательностей, кодирующих эти ферменты, в больших базах данных.
Используя этот метод, идентифицировали около 160 000 РНК-вирусов, включая обладателей исключительно длинных последовательностей и тех, что живут в экстремальных условиях, таких как горячие источники, соленые озера и высокие слои атмосферы. Чуть меньше половины из них ранее никогда не были описаны.
Расширение пула известных вирусов облегчит поиск других. Правда, этим методом не удается определить, кого именно заражают вновь найденные вирусы. Авторы разрабатывают новые алгоритмы ИИ, которые помогут понять это. Они надеются, что это поможет исследовать роли, которые вирусы играют в своих экологических нишах.