Тесты показали слабые места ChatGPT в научных заметках

Тесты показали слабые места ChatGPT в научных заметках

Тесты показали слабые места ChatGPT в научных заметках

Американская ассоциация содействия развитию науки (AAAS) решила проверить, может ли ChatGPT писать короткие научные заметки в стиле SciPak — это такие специальные брифы для журналистов, которые обычно готовит команда при журнале Science и сервисе EurekAlert.

Эксперимент длился целый год: с декабря 2023-го по декабрь 2024-го журналисты давали модели по одному–двум сложным научным исследованиям в неделю.

Задача была простая — пересказать их так, чтобы получилось удобно для коллег-журналистов: минимум терминов, чёткая структура и понятный контекст. В итоге ChatGPT обработал 64 работы.

Результат? В целом модель научилась «копировать» форму SciPak-заметки, но не дотянула по содержанию. По словам автора исследования, журналистки AAAS Абигейл Айзенштадт, тексты ChatGPT были слишком упрощёнными и часто неточными. Приходилось буквально перепроверять каждый факт, так что времени это отнимало не меньше, чем написать заметку с нуля.

 

Цифры тоже говорят сами за себя. Когда редакторов спросили, могли бы такие резюме затеряться среди настоящих SciPak-брифов, средняя оценка составила всего 2,26 балла из 5. «Увлекательность» текстов оценили ещё ниже — 2,14. И лишь одна работа за весь год получила от журналиста высший балл.

Чаще всего ChatGPT путал корреляцию и причинно-следственные связи, забывал упоминать важные ограничения исследований (например, что мягкие актуаторы работают очень медленно) и иногда слишком рассыпался в похвалах про «прорывы» и «новизну».

Авторы эксперимента подытожили: пока что ChatGPT не соответствует стандартам SciPak. Но полностью ставить крест на идее они не стали. AAAS отмечает, что к тестам можно вернуться, если модель серьёзно обновится. А в августе, напомним, как раз вышла GPT-5, в которой, к сожалению, нашли уязвимость.

Плата за зарубежный трафик не поможет ограничить использование VPN

Введение платы за зарубежный трафик не поможет ограничить использование средств обхода блокировок. Многие из них уже давно научились маскировать свой трафик под российский, пропуская его через промежуточные узлы внутри страны.

Об этом сетевой «Газете.Ru» рассказал программный инженер и эксперт в области информационной безопасности Пётр Осетров. По его словам, крупные сервисы уже больше года используют маршрутизацию трафика через промежуточные узлы в России.

«Оператор просто не видит следующие узлы при дальнейшей маршрутизации трафика и технически видеть этого не может. Зарубежный маршрут будет обслуживаться уже не мобильным оператором, а промежуточным сервером, который находится вне его контроля — как правило, где-то в российском дата-центре», — уточнил эксперт.

Такой обход появился не как реакция на возможное введение платы за зарубежный трафик, а как способ обойти ограничения прямого доступа ко многим зарубежным сервисам, которые блокируются на уровне систем глубокой фильтрации пакетов (DPI). Этот подход известен как TCP 16–20.

В результате пользователи таких VPN, скорее всего, не почувствуют введения платы за зарубежный трафик: необходимые механизмы обхода разработчики реализовали уже давно.

Информация о возможном введении платы за зарубежный трафик в России начала появляться с конца марта. В апреле она получила подтверждение применительно к мобильным сетям. Однако операторы, как сообщалось ранее, оказались технически не готовы к таким изменениям.

RSS: Новости на портале Anti-Malware.ru