Symantec анонсировала самообучающуюся DLP-систему

Symantec анонсировала самообучающуюся DLP-систему

В первом полугодии наступающего года на рынок выйдет продукт Symantec Data Loss Prevention 11. Одной из его ключевых особенностей будет т.н. технология целенаправленного самообучения, которая призвана упростить обработку и классификацию важных сведений.



В Symantec уверены, что новая технология представляет собой значительный шаг вперед в сравнении с существующими методами определения тайной информации. Напомним, что это довольно важно для систем предотвращения утечек данных, поскольку им нужно уметь отличать конфиденциальную информацию от обычной. В какой-то степени технологию целенаправленного самообучения (ТЦС) можно назвать средством разработки политик безопасности, которые определяют подлежащие защите сведения.


Принцип работы самообучающейся системы, использованный Symantec, неплохо известен: он нередко применяется, скажем, при создании спам-фильтров. Суть его в том, что программное обеспечение учится определять информацию того или иного рода, сравнивая предложенные ему 'правильные' и 'неправильные' образцы данных. Ведущий менеджер Symantec по маркетинговой политике Роберт Хэмилтон разъяснил сущность этого принципа следующим образом:


"Допустим, разработчик программного обеспечения хочет защитить написанные им исходные коды для какого-либо приложения от утечки посредством электронной почты или съемных носителей. В то же время ему требуется, чтобы DLP-система не оказывала воздействия на передачу некоторых иных участков кода - положим, они относятся к типу open source, в силу чего являются общедоступными, и охранять их бессмысленно. Тогда он вводит в систему образцы своего кода как "правильные" примеры, а экземпляры открытых исходников - как "неправильные". Изучив их, ТЦС сформирует нужный профиль и настроит политику безопасности."


Аналитики отмечают, что в перспективе такая DLP-система сможет автоматически создавать политики для различных документов и прочих сведений. В целом предложенный Symantec подход может сделать защиту от утечек более гибкой и эффективной.


Помимо ТЦС, в продукте Data Loss Prevention 11 можно будет увидеть и иные нововведения. В частности, в его состав войдут средство контроля доступа приложений к файлам (оно позволит удостовериться, что сторонние программы вроде iTunes или Skype не передают за пределы корпоративного брандмауэра важные сведения), функционал под названием FlexResponse, обеспечивающий взаимодействие с клиентскими средствами защиты от других производителей, подсистема Risk Scoring, осуществляющая приоритезацию информационных активов в зависимости от степени важности данных и количества пользователей, авторизованных для работы с ними.


Подробная информация (на английском языке) изложена в пресс-релизе Symantec.

Энтузиаст запустил чат-бот на процессоре Z80 1976 года

Легендарный процессор Zilog Z80, которому в этом году почти 50 лет, внезапно получил собственный «ИИ». Разработчик под ником HarryR представил проект Z80-μLM — крошечную «разговорную модель», которая реально работает на 8-битном Z80 с 64 КБ памяти.

Сразу расставим точки над i: тест Тьюринга этот ИИ не пройдёт, мир не захватит и цены на Z80 из-за него не взлетят. Сам автор честно говорит, что это эксперимент и «развлечение для души». Но эксперимент крайне изящный, именно этим он и цепляет.

Z80-μLM — это минималистичная «разговорная ИИ-модель», которая генерирует ответы посимвольно. Вся система, включая инференс и простой чат-интерфейс, уместилась примерно в 40 КБ. Для наглядности: это обычный .COM-файл, который спокойно запускается в CP/M и помещается в стандартную область памяти TPA.

Внутри сплошная инженерная магия старой школы. Никаких чисел с плавающей точкой, только целочисленная арифметика, заточенная под возможности Z80. Веса квантованы до 2 бит (значения от −2 до +1), четыре веса упакованы в один байт.

Входной текст кодируется через хеширование триграмм в 128 «корзин» — это делает модель устойчивой к опечаткам и нечувствительной к порядку слов. Всё максимально просто, жёстко и эффективно.

HarryR подчёркивает, что его цель была не «ум», а минимальный размер при сохранении ощущения характера. И, как ни странно, это работает. Ответы у чат-бота короткие, иногда нарочито сухие или уклончивые:

  • OK — нейтральное подтверждение,
  • WHY? — сомнение в вашем вопросе,
  • R U? — философский ответ с намёком,
  • MAYBE — честная неопределённость,
  • AM I? — вопрос в ответ.

Из-за этой лаконичности общение превращается в своеобразную игру: приходится угадывать, «понял» ли бот вопрос, и достраивать смысл самому. И тут невольно ловишь себя на мысли, что мозг начинает приписывать этой кучке байтов некую личность. Или это просто классическая человеческая склонность к антропоморфизму — вопрос открытый.

В проекте есть два готовых примера. Первый — Tinychat, простой чат-бот, который отвечает на приветствия и вопросы о себе. Второй — Guess, вариация игры «20 вопросов», где модель загадывает нечто, а пользователь пытается это угадать. Оба варианта доступны в виде готовых бинарников: для CP/M — стандартные .COM-файлы, для ZX Spectrum — .TAP-образы кассет, которые можно загрузить в эмулятор или даже на реальное железо.

Отдельная ирония ситуации в том, что Z80 как раз недавно официально отправили «на пенсию». В апреле 2024 года Zilog объявила о прекращении поддержки чипа (PDF) из-за закрытия производства на стороне фабрики. Правда, почти сразу энтузиасты взялись за замену, и в рамках проекта Tiny Tapeout появился рабочий совместимый клон.

RSS: Новости на портале Anti-Malware.ru