Тесты показали слабые места ChatGPT в научных заметках

Тесты показали слабые места ChatGPT в научных заметках

Тесты показали слабые места ChatGPT в научных заметках

Американская ассоциация содействия развитию науки (AAAS) решила проверить, может ли ChatGPT писать короткие научные заметки в стиле SciPak — это такие специальные брифы для журналистов, которые обычно готовит команда при журнале Science и сервисе EurekAlert.

Эксперимент длился целый год: с декабря 2023-го по декабрь 2024-го журналисты давали модели по одному–двум сложным научным исследованиям в неделю.

Задача была простая — пересказать их так, чтобы получилось удобно для коллег-журналистов: минимум терминов, чёткая структура и понятный контекст. В итоге ChatGPT обработал 64 работы.

Результат? В целом модель научилась «копировать» форму SciPak-заметки, но не дотянула по содержанию. По словам автора исследования, журналистки AAAS Абигейл Айзенштадт, тексты ChatGPT были слишком упрощёнными и часто неточными. Приходилось буквально перепроверять каждый факт, так что времени это отнимало не меньше, чем написать заметку с нуля.

 

Цифры тоже говорят сами за себя. Когда редакторов спросили, могли бы такие резюме затеряться среди настоящих SciPak-брифов, средняя оценка составила всего 2,26 балла из 5. «Увлекательность» текстов оценили ещё ниже — 2,14. И лишь одна работа за весь год получила от журналиста высший балл.

Чаще всего ChatGPT путал корреляцию и причинно-следственные связи, забывал упоминать важные ограничения исследований (например, что мягкие актуаторы работают очень медленно) и иногда слишком рассыпался в похвалах про «прорывы» и «новизну».

Авторы эксперимента подытожили: пока что ChatGPT не соответствует стандартам SciPak. Но полностью ставить крест на идее они не стали. AAAS отмечает, что к тестам можно вернуться, если модель серьёзно обновится. А в августе, напомним, как раз вышла GPT-5, в которой, к сожалению, нашли уязвимость.

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

Минцифры начало отбор особо значимых проектов

25 сентября стартовал новый этап отбора проектов, претендующих на статус особо значимых (ОЗП). Подать заявку могут разработчики решений, направленных на импортозамещение. Приём заявок продлится до 26 октября, а их рассмотрение завершится 15 декабря.

Проекты, получившие статус ОЗП, смогут рассчитывать на грантовое финансирование до 50% от заявленной стоимости. Дополнительно заказчики продуктов или консорциумы смогут получить поддержку в размере от 100 млн до 2 млрд рублей.

Для получения статуса ОЗП необходимо соответствие следующим условиям:

  • соответствие приоритетным направлениям;
  • отсутствие зрелых российских аналогов;
  • высокий потенциал для тиражирования;
  • наличие экспортных перспектив;
  • срок реализации проекта — до 4 лет;
  • отсутствие аффилированности между разработчиком и заказчиком (заказчиками);
  • сохранение исключительных прав у разработчиков;
  • экономическая окупаемость проекта.

Дополнительные преимущества при отборе получат проекты, представленные организациями оборонного комплекса, а также решения, направленные на обеспечение функционирования критической информационной инфраструктуры, использующие технологии искусственного интеллекта, комплексные платформенные решения на открытой архитектуре или средства проектирования композитов, оптики и фотоники.

Как отмечает Минцифры, с 2022 года поддержку уже получили 49 проектов. В 2025 году на финансирование ОЗП выделено 8,3 млрд рублей.

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

RSS: Новости на портале Anti-Malware.ru