ИИ учится задавать вопросы сам себе — и от этого становится умнее

ИИ учится задавать вопросы сам себе — и от этого становится умнее

ИИ учится задавать вопросы сам себе — и от этого становится умнее

Даже самые продвинутые ИИ-модели пока что во многом лишь повторяют — учатся на примерах человеческой работы или решают задачи, которые им заранее придумали люди. Но что если искусственный интеллект сможет учиться почти как человек — сам задавать себе интересные вопросы и искать на них ответы?

Похоже, это уже не фантазия. Исследователи из Университета Цинхуа, Пекинского института общего искусственного интеллекта (BIGAI) и Университета штата Пенсильвания показали, что ИИ способен осваивать рассуждение и программирование через своеобразную «игру с самим собой».

Проект получил название Absolute Zero Reasoner (AZR). Его идея проста и изящна одновременно. Сначала языковая модель сама придумывает задачи по программированию на Python — достаточно сложные, но решаемые. Затем она же пытается их решить, после чего проверяет себя самым честным способом: запускает код.

 

Если решение сработало — отлично. Если нет — ошибка становится сигналом для обучения. На основе успехов и провалов система дообучает исходную модель, постепенно улучшая и умение формулировать задачи, и способность их решать.

Исследователи протестировали подход на открытой языковой модели Qwen с 7 и 14 миллиардами параметров. Оказалось, что такой «самообучающийся» ИИ заметно улучшает навыки программирования и логического мышления — и в некоторых тестах даже обгоняет модели, обученные на вручную отобранных человеческих данных.

 

По словам аспиранта Университета Цинхуа Эндрю Чжао, одного из авторов идеи, подход напоминает реальный процесс обучения человека:

«Сначала ты копируешь родителей и учителей, но потом начинаешь задавать собственные вопросы. И в какой-то момент можешь превзойти тех, кто тебя учил».

Идея «самоигры» для ИИ обсуждается не первый год — ещё раньше её развивали такие исследователи, как Юрген Шмидхубер и Пьер-Ив Удейер. Но в Absolute Zero особенно интересно то, как растёт сложность задач: чем умнее становится модель, тем более сложные вопросы она начинает ставить перед собой.

«Уровень сложности растёт вместе с возможностями модели», — отмечает исследователь BIGAI Цзилун Чжэн.

Сейчас подход работает только там, где результат можно легко проверить — в программировании и математике. Но в будущем его хотят применить и к более «жизненным» задачам: работе ИИ-агентов в браузере, офисных сценариях или автоматизации процессов. В таких случаях модель могла бы сама оценивать, правильно ли агент действует.

«В теории это может стать путём к суперинтеллекту», — признаёт Чжэн.

Telegram перестал доставлять пуш-уведомления россиянам

Если Telegram вдруг перестал присылать уведомления, а новые сообщения обнаруживаются только после открытия приложения, вы не одиноки. На проблему массово жалуются пользователи по всей России, и дело, как выясняется, вовсе не в самом мессенджере.

Директор департамента расследований компании T.Hunter Игорь Бедеров объяснил, что большинство пользователей неправильно представляет себе работу пуш-уведомлений.

На первый взгляд всё выглядит просто: кто-то отправил сообщение — Telegram доставил уведомление на смартфон. Но в реальности между этими событиями есть ещё один важный посредник.

На Android за доставку уведомлений отвечает сервис Google Firebase Cloud Messaging (FCM), а на iPhone — Apple Push Notification Service (APNs). Когда приходит новое сообщение, Telegram сначала отправляет сигнал на серверы Google или Apple, а уже они будят приложение на устройстве пользователя и показывают уведомление.

Проблема в том, что именно инфраструктура этих сервисов уже длительное время сталкивается с ограничениями на сетях российских операторов связи.

По словам Бедерова, Telegram умеет поддерживать работу через собственные механизмы подключения и прокси-протоколы, однако системная доставка уведомлений от них не зависит.

В результате возникает странная ситуация. Если Telegram открыт или недавно работал в фоне, сообщение может прийти напрямую, а уведомление появится практически мгновенно. Но стоит заблокировать смартфон и выгрузить приложение из памяти, и всё начинает зависеть от Google или Apple.

Если этот канал недоступен, пользователь получает знакомый эффект: новые сообщения есть, а уведомлений нет.

Эксперт называет происходящее примером архитектурного конфликта между глобальным сервисом и локальными сетевыми ограничениями.

По его словам, Telegram знает о проблеме и уже работает над собственным механизмом доставки уведомлений, который не будет зависеть от инфраструктуры Google и Apple. Однако пока эта система остаётся нестабильной и поддерживается не на всех устройствах.

RSS: Новости на портале Anti-Malware.ru