DLP система InfoWatch внедрена в ЗАО «Райффайзенбанк»

DLP система InfoWatch внедрена в ЗАО «Райффайзенбанк»

InfoWatch Traffic Monitor предназначен для защиты основных каналов утечки информации (HTTP, SMTP, Instant Messengers, сетевая печать) в компьютерных сетях крупных предприятий. Модуль Device Monitor защищает данные на локальных компьютерах корпоративных пользователей (съемные носители информации – CD, DVD, flash, локальная печать).

Система интегрирована с единой консолью управления политиками и инцидентами, а также с единым хранилищем инцидентов.

Различные сценарии реакции на инцидент позволяют блокировать вынос или пересылку информации за пределы компании или оповещать о ней ответственных сотрудников. Копии всех данных, покинувших корпоративную сеть через электронную почту и Интернет, скопированных на сменные носители и отправленных на печать, поступают в специализированное хранилище InfoWatch Storage для возможности последующего ретроспективного анализа информации в случае выявления инцидента, связанного с утечкой данных.

Светлана Белялова, Директор по информационной безопасности ЗАО «Райффайзенбанк»: «Для компаний банковского сектора наиболее важны репутационные риски, связанные с утечкой конфиденциальной информации, поскольку репутация – это главный актив финансовой организации. Нет репутации – нет клиентов, нет будущего. На сегодняшний день наиболее эффективными системами защиты чувствительной информации от утечки являются DLP системы.

Мы остановили свой выбор на решении компании InfoWatch, поскольку оно объединяет в себе передовые технологии лингвистический анализа, fingerprints, анализ файловых атрибутов и детектор объектов, которые в комплексе обеспечивают необходимый банку уровень безопасности конфиденциальных данных.

Система InfoWatch позволила осуществить полный контроль за исходящей почтой по каналу SMTP. Качественная категоризация сообщений позволяет обслуживать систему нескольким офицерам безопасности при обработке исходящей почты филиалов Банка со всей России. За полгода промышленной эксплуатации системы были обработаны 369 инцидентов нарушения информационной безопасности».

Светлана Ашкинази, Директор по продуктам компании InfoWatch: «Комплексное решение InfoWatch Traffic Monitor разрабатывалось для защиты конфиденциальной информации компаний от вредоносных действий инсайдеров и достижения совместимости с положениями государственных и отраслевых нормативных актов. Это два основных аргумента в пользу внедрения DLP решений на предприятиях финансового сектора. Наш продукт позволит «Райффайзенбанку» обеспечить всесторонний контроль над обращением чувствительной информации в корпоративной среде, минимизировать риски искажения, уничтожения, кражи, утечки и нецелевого использования информационных активов компании - финансовых отчетов, интеллектуальной собственности, приватных записей».

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

Языковые модели тупеют от мусорных данных из интернета

Группа исследователей из Университета Техаса и Университета Пердью предложила необычную идею: большие языковые модели (LLM), вроде ChatGPT, могут «тупить» от некачественных данных примерно так же, как люди — от бесконечных часов в соцсетях.

В отчёте специалисты выдвигают «гипотезу гниения мозга LLM». Суть проста: если продолжать дообучать языковую модель на «мусорных» текстах из интернета, она со временем начнёт деградировать — хуже запоминать, терять логику и способность к рассуждению.

Авторы понимают, что отличить хороший контент от плохого сложно. Поэтому они решили изучить 100 миллионов твитов с HuggingFace и отобрать те, что подходят под определение «junk».

В первую группу попали короткие твиты с большим количеством лайков и репостов — те самые, которые вызывают максимальное вовлечение, но несут минимум смысла. Во вторую — посты с «низкой семантической ценностью»: поверхностные темы, кликбейт, громкие заявления, конспирология и прочие «триггерные» темы.

 

Чтобы проверить качество отбора, результаты GPT-4o сверили с оценками трёх аспирантов — совпадение составило 76%.

Учёные обучили четыре разные языковые модели, комбинируя «мусорные» и «качественные» данные в разных пропорциях. Потом прогнали их через тесты:

  • ARC — на логическое рассуждение,
  • RULER — на память и работу с длинным контекстом,
  • HH-RLHF и AdvBench — на этические нормы,
  • TRAIT — на анализ «личностного стиля».

Результаты оказались любопытными: чем больше в обучающем наборе было «интернет-мусора», тем хуже модель справлялась с задачами на рассуждение и память. Однако влияние на «этичность» и «черты личности» было неоднозначным: например, модель Llama-8B с 50% «мусора» даже показала лучшие результаты по «открытости» и «низкой тревожности».

Исследователи сделали вывод: переизбыток интернет-контента может привести к деградации моделей и призвали разработчиков тщательнее отбирать данные для обучения. Особенно сейчас, когда всё больше онлайн-текста создаётся уже самими ИИ — и это может ускорить эффект так называемого model collapse, когда модели начинают обучаться на собственных ошибках.

Учёные шутят: если так пойдёт и дальше, возможно, придётся вернуться к книгам — хотя бы ради того, чтобы «накормить» модели чем-то действительно качественным.

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

RSS: Новости на портале Anti-Malware.ru