Открытая ИИ-модель научилась читать геномы от бактерий до человека

Открытая ИИ-модель научилась читать геномы от бактерий до человека

Открытая ИИ-модель научилась читать геномы от бактерий до человека

Команда Arc Institute вместе с инженерами NVIDIA представила Evo 2 — геномную ИИ-модель, которая умеет не только предсказывать следующий символ в ДНК, но и в целом довольно неплохо понимать генетический код во всех доменах жизни — от бактерий до человека.

Самое приятное для науки: проект выложили полностью открыто — с весами модели, кодом и датасетом.

Если первая Evo отлично чувствовала себя на бактериальных геномах (там гены часто стоят кучками по смыслу), то с эукариотами всё куда хаотичнее: интроны, сплайсинг, регуляторные участки, которые могут быть далеко от гена, и море слабых статистических сигналов. Evo 2 как раз и задумали как ответ на эту сложную логику больших геномов.

Технически это модель на архитектуре StripedHyena 2, которая умеет работать с очень длинным контекстом — до 1 млн нуклеотидов за раз. Обучали её на OpenGenome2: это почти 9 трлн пар оснований/«токенов» ДНК из всех доменов жизни (включая бактериофаги).

При этом датасет, по описанию авторов, специально «подрезали» по части вирусов, заражающих эукариот, чтобы снизить риски потенциального злоупотребления.

Интереснее всего даже не масштаб, а то, что модель «нащупала» сама. В аннотациях к работе описывают, что Evo 2 выучила признаки вроде границ экзонов / интронов (сплайс-сайтов), участков связывания транскрипционных факторов, даже некоторые структурные элементы белков — то есть куски биологии, которые человеку часто приходится ловить отдельными инструментами и с погрешностями.

А в прикладной части авторы показывают, что Evo 2 может оценивать влияние вариантов в геноме без дообучения под конкретную задачу — например, для вариантов гена BRCA1 в тестах заявляется точность выше 90% в классификации «похоже на доброкачественный» против «потенциально патогенный». Это ровно тот случай, когда модель может стать полезным фильтром: подсказать, на какие мутации тратить время в лаборатории в первую очередь.

R-Vision КИИ обновили под новые требования ФСТЭК России

Компания R-Vision выпустила обновление продукта R-Vision КИИ, предназначенного для автоматизации процессов категорирования объектов критической информационной инфраструктуры и подготовки отчётности для регуляторов.

Обновление связано с масштабными изменениями нормативной базы, которые произошли за последний год.

Были скорректированы правила категорирования объектов КИИ, обновлены требования к ведению реестра значимых объектов и утверждён единый перечень типовых объектов критической инфраструктуры.

В новой версии переработаны интерфейсы, карточки объектов, шаблоны отчётности и механизмы расчёта категории значимости. Теперь критерии значимости определяются непосредственно на уровне групп ИТ-активов, а часть ранее использовавшихся разделов и отчётов исключена как утратившая актуальность.

Карточки объектов КИИ получили новые поля. В них можно указывать федеральный округ, сферу деятельности, тип объекта, регистрационный номер, доменное имя и внешний сетевой адрес. При этом система автоматически формирует регистрационный номер на основе введённых данных, что позволяет сократить объём ручной работы.

Серьёзные изменения затронули и механизм категорирования. Калькулятор автоматически определяет применимые критерии оценки в зависимости от сферы деятельности объекта и рассчитывает итоговую категорию значимости. При необходимости результаты можно скорректировать вручную.

Кроме того, в продукте появились инструменты для расчёта коэффициента защищённости Кзи. Этот показатель характеризует состояние защиты значимых объектов КИИ и рассчитывается по методике ФСТЭК России. Для этого в системе добавлен готовый шаблон аудита с преднастроенными формулами и логикой вычислений.

Согласно действующим требованиям, субъекты КИИ должны проводить такую оценку не реже одного раза в полгода и направлять результаты во ФСТЭК в течение пяти рабочих дней после завершения расчётов.

Также в R-Vision КИИ обновлены шаблоны документов «Акт о категорировании КИИ» и «Сведения о присвоении категории», приведённые в соответствие с актуальными нормативными требованиями.

В результате обновление позволяет организациям сократить количество ручных операций при ведении реестра объектов КИИ, подготовке отчётности и выполнении регуляторных процедур, связанных с соблюдением требований законодательства о безопасности критической информационной инфраструктуры.

RSS: Новости на портале Anti-Malware.ru