94 миллиона конфиденциальных записей под угрозой

94 миллиона конфиденциальных записей под угрозой

Компания Rapid7 опубликовала результаты исследования по утечкам данных в правительственном секторе. В период с 1 января 2009 по 31 мая 2012 было зафиксировано 268 случаев утечки информации, риску были подвергнуты более 94 миллионов записей, содержащих личную информацию. Согласно проведенному исследованию, количество зафиксированных случаев утечки данных в правительственном секторе с 2009 по 2010 год возросло на 50 %, тогда как в период с 2010 по 2011 это число увеличилось втрое. 

А количество раскрытых личных данных увеличилось на 168, 69% в период с 2010 по 2011, и на 138,3% с 2011 по 31 мая 2012. Неумышленное разглашение конфиденциальной информации, утеря или кража портативных устройств, физическая потеря и хакерские атаки являются наиболее частыми причинами утечки данных. Причем, более 80,7 млн записей с конфиденциальной информацией скомпрометированы из-за утери или кражи мобильных устройств. На втором и третьем месте причин утечки данных находится неумышленное раскрытие (более 11, 7 млн записей) и взлом (1,1 млн записей), сообщает infowatch.ru.

Исследователи Rapid7 отметили, что в период с 1 января 2012 по 31 мая 2012 количество хакерских атак превысило количество всех прочих причин утечки информации. Наибольшее количество случаев хакерских атак по стране зафиксировано в Калифорнии (21), округе Колумбия (20) и Техасе (16).

ИИ учится задавать вопросы сам себе — и от этого становится умнее

Даже самые продвинутые ИИ-модели пока что во многом лишь повторяют — учатся на примерах человеческой работы или решают задачи, которые им заранее придумали люди. Но что если искусственный интеллект сможет учиться почти как человек — сам задавать себе интересные вопросы и искать на них ответы?

Похоже, это уже не фантазия. Исследователи из Университета Цинхуа, Пекинского института общего искусственного интеллекта (BIGAI) и Университета штата Пенсильвания показали, что ИИ способен осваивать рассуждение и программирование через своеобразную «игру с самим собой».

Проект получил название Absolute Zero Reasoner (AZR). Его идея проста и изящна одновременно. Сначала языковая модель сама придумывает задачи по программированию на Python — достаточно сложные, но решаемые. Затем она же пытается их решить, после чего проверяет себя самым честным способом: запускает код.

 

Если решение сработало — отлично. Если нет — ошибка становится сигналом для обучения. На основе успехов и провалов система дообучает исходную модель, постепенно улучшая и умение формулировать задачи, и способность их решать.

Исследователи протестировали подход на открытой языковой модели Qwen с 7 и 14 миллиардами параметров. Оказалось, что такой «самообучающийся» ИИ заметно улучшает навыки программирования и логического мышления — и в некоторых тестах даже обгоняет модели, обученные на вручную отобранных человеческих данных.

 

По словам аспиранта Университета Цинхуа Эндрю Чжао, одного из авторов идеи, подход напоминает реальный процесс обучения человека:

«Сначала ты копируешь родителей и учителей, но потом начинаешь задавать собственные вопросы. И в какой-то момент можешь превзойти тех, кто тебя учил».

Идея «самоигры» для ИИ обсуждается не первый год — ещё раньше её развивали такие исследователи, как Юрген Шмидхубер и Пьер-Ив Удейер. Но в Absolute Zero особенно интересно то, как растёт сложность задач: чем умнее становится модель, тем более сложные вопросы она начинает ставить перед собой.

«Уровень сложности растёт вместе с возможностями модели», — отмечает исследователь BIGAI Цзилун Чжэн.

Сейчас подход работает только там, где результат можно легко проверить — в программировании и математике. Но в будущем его хотят применить и к более «жизненным» задачам: работе ИИ-агентов в браузере, офисных сценариях или автоматизации процессов. В таких случаях модель могла бы сама оценивать, правильно ли агент действует.

«В теории это может стать путём к суперинтеллекту», — признаёт Чжэн.

RSS: Новости на портале Anti-Malware.ru