Открытая ИИ-модель научилась читать геномы от бактерий до человека

Открытая ИИ-модель научилась читать геномы от бактерий до человека

Открытая ИИ-модель научилась читать геномы от бактерий до человека

Команда Arc Institute вместе с инженерами NVIDIA представила Evo 2 — геномную ИИ-модель, которая умеет не только предсказывать следующий символ в ДНК, но и в целом довольно неплохо понимать генетический код во всех доменах жизни — от бактерий до человека.

Самое приятное для науки: проект выложили полностью открыто — с весами модели, кодом и датасетом.

Если первая Evo отлично чувствовала себя на бактериальных геномах (там гены часто стоят кучками по смыслу), то с эукариотами всё куда хаотичнее: интроны, сплайсинг, регуляторные участки, которые могут быть далеко от гена, и море слабых статистических сигналов. Evo 2 как раз и задумали как ответ на эту сложную логику больших геномов.

Технически это модель на архитектуре StripedHyena 2, которая умеет работать с очень длинным контекстом — до 1 млн нуклеотидов за раз. Обучали её на OpenGenome2: это почти 9 трлн пар оснований/«токенов» ДНК из всех доменов жизни (включая бактериофаги).

При этом датасет, по описанию авторов, специально «подрезали» по части вирусов, заражающих эукариот, чтобы снизить риски потенциального злоупотребления.

Интереснее всего даже не масштаб, а то, что модель «нащупала» сама. В аннотациях к работе описывают, что Evo 2 выучила признаки вроде границ экзонов / интронов (сплайс-сайтов), участков связывания транскрипционных факторов, даже некоторые структурные элементы белков — то есть куски биологии, которые человеку часто приходится ловить отдельными инструментами и с погрешностями.

А в прикладной части авторы показывают, что Evo 2 может оценивать влияние вариантов в геноме без дообучения под конкретную задачу — например, для вариантов гена BRCA1 в тестах заявляется точность выше 90% в классификации «похоже на доброкачественный» против «потенциально патогенный». Это ровно тот случай, когда модель может стать полезным фильтром: подсказать, на какие мутации тратить время в лаборатории в первую очередь.

Бесплатный Wi-Fi в мышеловке: мошенники расклеили опасные QR-коды в парках

Лето принесло не только сезон прогулок и отдыха на свежем воздухе, но и новую схему мошенничества. Аферисты начали расклеивать в парках, скверах и возле летних веранд поддельные QR-коды, обещающие бесплатный Wi-Fi.

О новой уловке предупредили специалисты платформы «Мошеловка» Народного фронта.

Человек замечает на скамейке, урне, столике кафе или информационном стенде наклейку с QR-кодом и предложением быстро подключиться к бесплатному интернету. На первый взгляд всё выглядит как обычный городской сервис. Но после сканирования начинается совсем другая история.

Вместо страницы подключения к Wi-Fi пользователь попадает на фишинговый сайт. Дальше злоумышленники могут действовать по-разному: предложить ввести данные банковской карты для подтверждения личности, аутентифицироваться через аккаунт или загрузить на устройство вредоносный файл.

По словам экспертов, рост подобных схем напрямую связан с началом теплого сезона. Парки, набережные и летние веранды становятся местами массового скопления людей, а значит, идеальной площадкой для охоты на доверчивых пользователей.

В «Мошеловке» рекомендуют с осторожностью относиться к любым QR-кодам, найденным на улице, особенно если наклейка выглядит кустарно или наклеена поверх официальной информации.

Даже если код уже отсканирован, специалисты советуют внимательно проверять адрес сайта, на который происходит переход. Если домен выглядит подозрительно или требует ввести личные данные без понятной причины, лучше сразу закрыть страницу.

Для подключения к городским сетям Wi-Fi, покупки билетов или получения муниципальных услуг эксперты рекомендуют использовать только официальные приложения и проверенные сайты.

Иначе попытка сэкономить мобильный трафик может закончиться куда более серьезными потерями — от доступа к банковскому счету до полного заражения устройства.

RSS: Новости на портале Anti-Malware.ru