Открытая ИИ-модель научилась читать геномы от бактерий до человека

Открытая ИИ-модель научилась читать геномы от бактерий до человека

Открытая ИИ-модель научилась читать геномы от бактерий до человека

Команда Arc Institute вместе с инженерами NVIDIA представила Evo 2 — геномную ИИ-модель, которая умеет не только предсказывать следующий символ в ДНК, но и в целом довольно неплохо понимать генетический код во всех доменах жизни — от бактерий до человека.

Самое приятное для науки: проект выложили полностью открыто — с весами модели, кодом и датасетом.

Если первая Evo отлично чувствовала себя на бактериальных геномах (там гены часто стоят кучками по смыслу), то с эукариотами всё куда хаотичнее: интроны, сплайсинг, регуляторные участки, которые могут быть далеко от гена, и море слабых статистических сигналов. Evo 2 как раз и задумали как ответ на эту сложную логику больших геномов.

Технически это модель на архитектуре StripedHyena 2, которая умеет работать с очень длинным контекстом — до 1 млн нуклеотидов за раз. Обучали её на OpenGenome2: это почти 9 трлн пар оснований/«токенов» ДНК из всех доменов жизни (включая бактериофаги).

При этом датасет, по описанию авторов, специально «подрезали» по части вирусов, заражающих эукариот, чтобы снизить риски потенциального злоупотребления.

Интереснее всего даже не масштаб, а то, что модель «нащупала» сама. В аннотациях к работе описывают, что Evo 2 выучила признаки вроде границ экзонов / интронов (сплайс-сайтов), участков связывания транскрипционных факторов, даже некоторые структурные элементы белков — то есть куски биологии, которые человеку часто приходится ловить отдельными инструментами и с погрешностями.

А в прикладной части авторы показывают, что Evo 2 может оценивать влияние вариантов в геноме без дообучения под конкретную задачу — например, для вариантов гена BRCA1 в тестах заявляется точность выше 90% в классификации «похоже на доброкачественный» против «потенциально патогенный». Это ровно тот случай, когда модель может стать полезным фильтром: подсказать, на какие мутации тратить время в лаборатории в первую очередь.

У клиентов LastPass украли личные данные через подрядчика

Разработчик менеджера паролей LastPass вновь вынужден объясняться из-за утечки данных. Правда, в этот раз взломали не сам LastPass, а компанию-подрядчика Klue, которая занимается маркетинговой аналитикой. Тем не менее последствия коснулись клиентов LastPass.

Компания начала рассылать уведомления пользователям о том, что злоумышленники получили доступ к персональным данным клиентов и материалам обращений в службу поддержки.

Среди скомпрометированной информации можно найти имена, номера телефонов, адреса электронной почты, а также данные, содержащиеся в тикетах техподдержки и документах, связанных с продажами.

В LastPass подчёркивают, что собственная инфраструктура компании не пострадала. Хранилища паролей пользователей и учётные записи остались вне зоны компрометации.

Однако эксперты отмечают, что содержимое обращений в поддержку тоже может представлять интерес для злоумышленников. В подобных заявках пользователи нередко указывают конфиденциальные данные, информацию об аккаунтах, а иногда даже документы, удостоверяющие личность.

Источником проблемы стала компания Klue. По данным ее руководства, следы присутствия киберпреступников в инфраструктуре были обнаружены 12 июня. Ответственность за атаку взяла на себя группировка Icarus, которая уже пригрозила публикацией похищенных данных в случае отказа платить выкуп.

LastPass оказался далеко не единственной жертвой инцидента. Среди компаний, пострадавших из-за взлома Klue, также фигурируют HackerOne, Recorded Future и Tanium.

Для LastPass эта история особенно болезненна на фоне событий 2022 года. Тогда злоумышленники получили доступ к резервным копиям пользовательских хранилищ паролей. Хотя данные были зашифрованы мастер-паролями, часть хранилищ впоследствии удалось взломать методом перебора. Позже с тем инцидентом связывали ряд крупных краж криптовалюты.

Сейчас компания утверждает, что пароли клиентов находятся в безопасности. Однако сам факт очередной утечки, пусть и через стороннего подрядчика, вряд ли добавит пользователям уверенности.

RSS: Новости на портале Anti-Malware.ru