Ученые из Гарвардского университета под руководством кандидата в доктора философии Юнха Хванга создали систему искусственного интеллекта, способную разбираться в сложном языке геномики, «исходного кода биологии».
Они разработали модель геномного языка (gLM), которая научилась понимать функциональную «семантику» и регулятивный «синтаксис» каждого гена, анализируя огромный и разнообразный набор данных микробиома. Модель gLM, подобно крупным языковым моделям, обучается на основе самонаблюдения, то есть она изучает осмысленные представления генов из данных, не требуя человеческих меток.
Исследователи обнаружили, что модель gLM способна узнавать функции ферментов, модули генов, регулируемые вместе, и предоставлять геномический контекст, который может предсказать функции генов. Это позволяет получить более точное представление о функциях генов и их взаимосвязях.
Модель gLM представляет собой значительное достижение в области биоинформатики и машинного обучения, которое может ускорить обнаружение новых биологических механизмов и улучшить понимание геномной информации.