ИИ-модель Evo 2 обучили проектировать геномы

Поделиться

ИИ AI искусственный интеллект artificial intelligence 2

Исследователи Arc Institute разработали модель Evo 2, способную анализировать генетический код, прогнозировать заболевания и мутации, а также проектировать новые геномы длиной как у простых бактерий.

Эксперты сотрудничают с Nvidia, Стэнфордским университетом, Калифорнийским университетом в Беркли и Калифорнийским университетом в Сан-Франциско. Их нейросеть обучена на ДНК более 100 000 видов.

Код Evo 2 находится в открытом доступе на GitHub, а также интегрирован во фреймворк Nvidia BioNeMo.

Arc Institute сотрудничал с исследовательской лабораторией искусственного интеллекта Goodfire для разработки визуализатора механистической интерпретируемости, который раскрывает ключевые биологические особенности и паттерны. Модель учится распознавать их в геномных последовательностях.

«Evo 2 является крупнейшей на сегодняшний день ИИ-моделью в биологии, обученной на более чем 9,3 трлн нуклеотидов — строительных блоков, составляющих ДНК или РНК. […] Evo 2 включает информацию о человеке, растениях и других одноклеточных и многоклеточных видах эукариотической области жизни», — говорится в объявлении.

Нейросеть «обладает универсальным пониманием древа жизни», которое полезно для решения множества задач вроде предсказания мутаций и разработки кода для искусственной жизни.

«Эволюция закодировала биологическую информацию в ДНК и РНК, создав паттерны, которые Evo 2 может обнаружить и использовать», — подчеркнули авторы работы.

Для обучения ИИ применили более 2000 графических процессоров Nvidia H100. Она способна обрабатывать генетические последовательности до 1 млн нуклеотидов одновременно, что позволяет ей понимать взаимосвязи между удаленными частями генома.

В тестах с вариантами гена BRCA1, связанного с раком молочной железы, Evo 2 с точностью более 90% предсказала, какие мутации являются доброкачественными, а какие — потенциально патогенными.

Исследовательская группа считает, что на основе Evo 2 можно создавать более специфические ИИ-модели.

Напомним, в июле 2024 года китайские ученые разработали робота с выращенным в лабораторных условиях искусственным мозгом, способного обучаться выполнению различных задач.

Ранее Meta AI выпустила «модель белкового языка» ESM-2 с 15 млрд параметров и базу данных ESM Metagenomic Atlas, содержащую более 600 млн прогностических структур метагеномных соединений.

Это интересно

Похожие новости