ИИ учится задавать вопросы сам себе — и от этого становится умнее

ИИ учится задавать вопросы сам себе — и от этого становится умнее

ИИ учится задавать вопросы сам себе — и от этого становится умнее

Даже самые продвинутые ИИ-модели пока что во многом лишь повторяют — учатся на примерах человеческой работы или решают задачи, которые им заранее придумали люди. Но что если искусственный интеллект сможет учиться почти как человек — сам задавать себе интересные вопросы и искать на них ответы?

Похоже, это уже не фантазия. Исследователи из Университета Цинхуа, Пекинского института общего искусственного интеллекта (BIGAI) и Университета штата Пенсильвания показали, что ИИ способен осваивать рассуждение и программирование через своеобразную «игру с самим собой».

Проект получил название Absolute Zero Reasoner (AZR). Его идея проста и изящна одновременно. Сначала языковая модель сама придумывает задачи по программированию на Python — достаточно сложные, но решаемые. Затем она же пытается их решить, после чего проверяет себя самым честным способом: запускает код.

 

Если решение сработало — отлично. Если нет — ошибка становится сигналом для обучения. На основе успехов и провалов система дообучает исходную модель, постепенно улучшая и умение формулировать задачи, и способность их решать.

Исследователи протестировали подход на открытой языковой модели Qwen с 7 и 14 миллиардами параметров. Оказалось, что такой «самообучающийся» ИИ заметно улучшает навыки программирования и логического мышления — и в некоторых тестах даже обгоняет модели, обученные на вручную отобранных человеческих данных.

 

По словам аспиранта Университета Цинхуа Эндрю Чжао, одного из авторов идеи, подход напоминает реальный процесс обучения человека:

«Сначала ты копируешь родителей и учителей, но потом начинаешь задавать собственные вопросы. И в какой-то момент можешь превзойти тех, кто тебя учил».

Идея «самоигры» для ИИ обсуждается не первый год — ещё раньше её развивали такие исследователи, как Юрген Шмидхубер и Пьер-Ив Удейер. Но в Absolute Zero особенно интересно то, как растёт сложность задач: чем умнее становится модель, тем более сложные вопросы она начинает ставить перед собой.

«Уровень сложности растёт вместе с возможностями модели», — отмечает исследователь BIGAI Цзилун Чжэн.

Сейчас подход работает только там, где результат можно легко проверить — в программировании и математике. Но в будущем его хотят применить и к более «жизненным» задачам: работе ИИ-агентов в браузере, офисных сценариях или автоматизации процессов. В таких случаях модель могла бы сама оценивать, правильно ли агент действует.

«В теории это может стать путём к суперинтеллекту», — признаёт Чжэн.

152-ФЗ и нейросети: какие данные нельзя бездумно отдавать ChatGPT

Пока компании массово подключают ChatGPT, Claude, DeepSeek и другие LLM к работе с договорами, тикетами, CRM и корпоративной почтой, многие забывают об одной неприятной детали: вместе с документами в нейросети часто отправляются персональные данные. А значит, в игру вступает 152-ФЗ.

Пользователь Хабра под ником lnk опубликовал подробный разбор того, как российское законодательство смотрит на использование ИИ при обработке данных клиентов, сотрудников и контрагентов.

По его словам, проблема возникает гораздо раньше, чем многие думают. Персональными данными могут считаться не только ФИО, телефоны и паспортные данные, но и ИНН физлица, который сам по себе позволяет идентифицировать человека.

Даже данные из открытых источников вроде ЕГРЮЛ не перестают быть персональными данными только потому, что они опубликованы в интернете.

Автор обращает внимание, что отправка таких данных в зарубежные ИИ-сервисы автоматически поднимает вопросы трансграничной передачи данных. При этом главная проблема, по его мнению, даже не уведомления Роскомнадзора, а отсутствие договора поручения на обработку персональных данных с большинством зарубежных поставщиков LLM.

В качестве относительно безопасных вариантов он называет использование российских облачных платформ с соответствующими договорами либо развёртывание моделей в собственном контуре компании. Ещё один путь — предварительное обезличивание данных перед отправкой в модель.

Отдельно автор подчёркивает, что простая замена имён на идентификаторы вроде user_123 не всегда решает проблему. Если связь между токеном и человеком можно восстановить, такие данные всё ещё могут считаться персональными.

RSS: Новости на портале Anti-Malware.ru