InfoWatch открыла новый зарубежный офис в Куала-Лумпуре

InfoWatch открыла новый зарубежный офис в Куала-Лумпуре

InfoWatch открыла новый зарубежный офис в Куала-Лумпуре

Группа компаний (ГК) InfoWatch сообщает о начале работы локального представительства полного цикла InfoWatch SDN BHD в Куала-Лумпуре, которое будет работать на рынках Малайзии, Индонезии и Вьетнама с целью выстроить комплексное присутствие в Юго-Восточной Азии. Это уже второй зарубежный офис компании: первый открылся в Дубае (ОАЭ) и с 15 августа начал свою работу.

В задачи компании в Малайзии войдет развитие прямых продаж, расширение партнерской сети и рост клиентской базы в регионе присутствия, техническая поддержка действующих заказчиков InfoWatch, а также обучение клиентов и партнеров из Юго-Восточной Азии работе с продуктами компании.

В организационную структуру локального представительства InfoWatch в Куала-Лумпуре войдут менеджеры по продажам и инженеры из России, а также местные специалисты. Подразделение будет ориентировано на организации государственного и финансового секторов, а также на крупный бизнес, страховые компании и медицинские учреждения. 

Директор локального офиса InfoWatch SDN BHD Владимир Шутемов отметил, что в настоящее время компания ведет работу с рядом ключевых клиентов в Малайзии, в том числе с банком Koperasi Bank Persatuan Malaysia Berhad.  

«На рынке Малайзии InfoWatch присутствует с 2013 года, имеет клиентскую базу и опыт работы с партнерами, поэтому местом расположения локального офиса был выбран именно Куала-Лумпур. Мы рассчитываем, что малазийский рынок станет стартовой площадкой для продвижения и развития компании в других странах Юго-Восточной Азии», — рассказал Владимир Шутемов. 

Об открытии локального представительства сообщила глава группы компаний Наталья Касперская в рамках международной выставки IFSEC Southeast Asia 2017 в Куала-Лумпуре. Мероприятие, которое проходит с 6 по 8 сентября, собрало на своей площадке представителей более 350 компаний, работающих в сфере информационной безопасности из ЮВА, Индии, Китая и Европы.

В рамках деловой программы конференции глава InfoWatch выступила с мастер-классом перед представителями органов власти и местного бизнеса. Наталья Касперская рассказала о наиболее эффективных подходах в работе с DLP-системами и представила исследование утечек конфиденциальных данных из организаций стран Юго-Восточной Азии в сравнении с глобальными утечками, подготовленное Аналитическим центром InfoWatch. Большая часть статистики по утечкам данных из организаций стран ЮВА совпадает с глобальными тенденциями. Однако есть принципиальные различия. Так, если в мире в среднем число утечек данных через браузер и облачные хранилища составляет 61%, то в ЮВА это число выше – 74%. При этом в ЮВА полностью отсутствуют каналы утечки данных через съемные носители. Возможно, это связано с высокой динамикой развития местных ИТ-систем. Более того, мобильные устройства являются самым распространенным средством коммуникации в организациях Малайзии.

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

Языковые модели тупеют от мусорных данных из интернета

Группа исследователей из Университета Техаса и Университета Пердью предложила необычную идею: большие языковые модели (LLM), вроде ChatGPT, могут «тупить» от некачественных данных примерно так же, как люди — от бесконечных часов в соцсетях.

В отчёте специалисты выдвигают «гипотезу гниения мозга LLM». Суть проста: если продолжать дообучать языковую модель на «мусорных» текстах из интернета, она со временем начнёт деградировать — хуже запоминать, терять логику и способность к рассуждению.

Авторы понимают, что отличить хороший контент от плохого сложно. Поэтому они решили изучить 100 миллионов твитов с HuggingFace и отобрать те, что подходят под определение «junk».

В первую группу попали короткие твиты с большим количеством лайков и репостов — те самые, которые вызывают максимальное вовлечение, но несут минимум смысла. Во вторую — посты с «низкой семантической ценностью»: поверхностные темы, кликбейт, громкие заявления, конспирология и прочие «триггерные» темы.

 

Чтобы проверить качество отбора, результаты GPT-4o сверили с оценками трёх аспирантов — совпадение составило 76%.

Учёные обучили четыре разные языковые модели, комбинируя «мусорные» и «качественные» данные в разных пропорциях. Потом прогнали их через тесты:

  • ARC — на логическое рассуждение,
  • RULER — на память и работу с длинным контекстом,
  • HH-RLHF и AdvBench — на этические нормы,
  • TRAIT — на анализ «личностного стиля».

Результаты оказались любопытными: чем больше в обучающем наборе было «интернет-мусора», тем хуже модель справлялась с задачами на рассуждение и память. Однако влияние на «этичность» и «черты личности» было неоднозначным: например, модель Llama-8B с 50% «мусора» даже показала лучшие результаты по «открытости» и «низкой тревожности».

Исследователи сделали вывод: переизбыток интернет-контента может привести к деградации моделей и призвали разработчиков тщательнее отбирать данные для обучения. Особенно сейчас, когда всё больше онлайн-текста создаётся уже самими ИИ — и это может ускорить эффект так называемого model collapse, когда модели начинают обучаться на собственных ошибках.

Учёные шутят: если так пойдёт и дальше, возможно, придётся вернуться к книгам — хотя бы ради того, чтобы «накормить» модели чем-то действительно качественным.

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

RSS: Новости на портале Anti-Malware.ru