В Уфимском университете открыт учебный класс на базе решений InfoWatch

В Уфимском университете открыт учебный класс на базе решений InfoWatch

Компания InfoWatch, лидер российского рынка систем защиты корпоративной информации от внутренних угроз, помогла развернуть учебный класс на базе продуктов InfoWatch Traffic Monitor Enterprise и InfoWatch EndPoint Security на кафедре вычислительной техники и защиты информации Уфимского Государственного Авиационного Технического Университета (УГАТУ).

Уфимский государственный авиационный технический университет – крупнейший технический вуз города Уфы и Республики Башкортостан, центр науки и культуры в регионе. Университет был основан более 80 лет назад и является одним из старейших университетов Башкортостана. В университете ведется подготовка по 61 специальности и 25 направлениям.

При формировании учебной программы УГАТУ делает ставку на инновации, изучение наиболее передовых технологий, применяемых в каждой из отраслей. Успехи УГАТУ в этом направлении подтверждены победой во всероссийском конкурсе, проведенном Министерством образования и науки РФ среди вузов, внедряющих инновационные образовательные программы.

Подготовка выпускников кафедры вычислительной техники и защиты информации также базируется на изучении современных и передовых технологий и их практическом освоении. В связи с этим ректорат УГАТУ принял решение о том, что начиная с 2014 года обучение практическим навыкам инфраструктурной и контентной защиты информации будет осуществляться на базе продуктов ГКInfoWatch.

В качестве образца DLP-системы студенты будут использовать решение InfoWatch Traffic Monitor Enterprise, известное широкой функциональностью и уникальными для российского рынка технологиями, такими как лингвистический анализ данных с учетом морфологии, детектор печатей, детектор сканов паспортов, кредитных карт, заполненных форм, а также другими инновационными возможностями.

Система обеспечивает контроль информации, уходящей за пределы защищенного периметра компании через почтовые системы, Интернет, Skype, программы обмена сообщениями, отправку на печать и другие каналы. В случае если InfoWatch Traffic Monitor Enterprise обнаруживает нарушение политик безопасности, он может предотвратить утечку конфиденциальных данных путем блокирования их передачи. Для дальнейшего анализа инцидентов и проведения расследований в продукте реализована функция безопасного хранения данных.

Ключевые принципы эффективной защиты конечных точек сети планируется изучать на примере InfoWatch EndPoint Security. Продукт позволяет управлять правами пользователей, контролировать использование внешних носителей информации и запуск приложений, обеспечивает шифрование на мобильных носителях и многое другое.

«Это уже не первый проект InfoWatch по поддержке вузов в сфере подготовки ИБ-специалистов. Учебные классы на базе современных продуктов позволяют осваивать передовые технологии защиты информации еще в университете, что повышает уровень знаний выпускников, и, как следствие, их востребованность на рынке труда, – комментирует Амир Даутов, руководитель направления по развитию бизнеса InfoWatch в ПФО, ЮФО, СКФО и Азербайджане. – Впоследствии эти выпускники могут работать в компаниях, разрабатывающих ИБ-решения, или же на стороне заказчика – но, в любом случае, они будут уже грамотными и опытными специалистами. Это очень важно, так как обеспечение информационной безопасности многих предприятий России будет лежать именно на их плечах, и именно они будут формировать завтрашний рынок ИБ в России».

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

Языковые модели тупеют от мусорных данных из интернета

Группа исследователей из Университета Техаса и Университета Пердью предложила необычную идею: большие языковые модели (LLM), вроде ChatGPT, могут «тупить» от некачественных данных примерно так же, как люди — от бесконечных часов в соцсетях.

В отчёте специалисты выдвигают «гипотезу гниения мозга LLM». Суть проста: если продолжать дообучать языковую модель на «мусорных» текстах из интернета, она со временем начнёт деградировать — хуже запоминать, терять логику и способность к рассуждению.

Авторы понимают, что отличить хороший контент от плохого сложно. Поэтому они решили изучить 100 миллионов твитов с HuggingFace и отобрать те, что подходят под определение «junk».

В первую группу попали короткие твиты с большим количеством лайков и репостов — те самые, которые вызывают максимальное вовлечение, но несут минимум смысла. Во вторую — посты с «низкой семантической ценностью»: поверхностные темы, кликбейт, громкие заявления, конспирология и прочие «триггерные» темы.

 

Чтобы проверить качество отбора, результаты GPT-4o сверили с оценками трёх аспирантов — совпадение составило 76%.

Учёные обучили четыре разные языковые модели, комбинируя «мусорные» и «качественные» данные в разных пропорциях. Потом прогнали их через тесты:

  • ARC — на логическое рассуждение,
  • RULER — на память и работу с длинным контекстом,
  • HH-RLHF и AdvBench — на этические нормы,
  • TRAIT — на анализ «личностного стиля».

Результаты оказались любопытными: чем больше в обучающем наборе было «интернет-мусора», тем хуже модель справлялась с задачами на рассуждение и память. Однако влияние на «этичность» и «черты личности» было неоднозначным: например, модель Llama-8B с 50% «мусора» даже показала лучшие результаты по «открытости» и «низкой тревожности».

Исследователи сделали вывод: переизбыток интернет-контента может привести к деградации моделей и призвали разработчиков тщательнее отбирать данные для обучения. Особенно сейчас, когда всё больше онлайн-текста создаётся уже самими ИИ — и это может ускорить эффект так называемого model collapse, когда модели начинают обучаться на собственных ошибках.

Учёные шутят: если так пойдёт и дальше, возможно, придётся вернуться к книгам — хотя бы ради того, чтобы «накормить» модели чем-то действительно качественным.

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

RSS: Новости на портале Anti-Malware.ru