СёрчИнформ оценит будущих ИБ-специалистов на Инфотелеком-2017

СёрчИнформ оценит будущих ИБ-специалистов на Инфотелеком-2017

Компания «СёрчИнформ» в третий раз выступит партнером международной студенческой олимпиады в области информационных технологий и телекоммуникаций. Эксперты компании помогут оценить уровень знаний и подготовки участников олимпиады в области информационной безопасности.

Организатор V Международной студенческой олимпиады в области информационных технологий и телекоммуникаций «Инфотелеком-2017» – Санкт-Петербургский государственный университет телекоммуникаций имени профессора М.А. Бонч-Бруевича (СПбГУТ). Поддержку мероприятию оказывает Федеральное агентство связи (Россвязь).

«СёрчИнформ» курирует направление «Информационная безопасность»: готовит задания на заочный и очный туры, выступает спонсором, дарит ценные призы победителям олимпиады. Специалисты компании оценивают выполненные задания, оказывают информационную поддержку, а также помогают будущим выпускникам в трудоустройстве.

«Подобные мероприятия крайне важны для отрасли. Сегодня информационную безопасность компаний лишь в половине случаев (42%) обеспечивают ИБ-подразделения. При этом только 63% сотрудников ИБ-отделов имеют профильное образование. Особенно остро кадровый голод ощущается в регионах. Олимпиады подобные «Инфотелеком-2017» способствуют появлению высококлассных молодых специалистов. И мы рады, что можем активно этому содействовать», – прокомментировал руководитель Учебного центра «СёрчИнформ» Алексей Дрозд.

Ежегодно олимпиада «Инфотелеком» привлекает студентов из различных регионов России и стран ближнего зарубежья – в 2017 году в заочном туре приняло участие более 800 студентов из 20 городов. Заочный тур олимпиады завершился 20 марта, очный тур пройдет 19 и 20 апреля в СПбГУТ имени Бонч-Бруевича.

«Такие мероприятия дают шанс студентам показать уровень теоретических знаний и навыков решения практических задач, быть замеченными крупными компаниями отрасли и в дальнейшем найти интересную, престижную и высокооплачиваемую работу. Этому способствуют и «Дни карьеры» от ведущих телекоммуникационных компаний – спонсоров олимпиады, которые проходят в рамках очного тура. На них студенты не только узнают о предприятиях, знакомятся с представителями HR-отделов, но и могут заполнить анкеты для прохождения стажировок и будущего трудоустройства», – отметил заведующий кафедрой защищенных систем связи СПбГУТ Андрей Красов.

«СёрчИнформ» сотрудничает более чем с 60 вузами в России, Беларуси, Казахстане. При этом партнерство с СПбГУТ длится четвертый год. За это время компания оснастила учебно-научную лабораторию вуза DLP-системой «КИБ Сёрчинформ», было издано совместное пособие «Технологии программной защиты в Интернет» в двух частях, специалисты помогли сформировать практикум по одноименной дисциплине.

Эксперты компании ежегодно проводят лекции и семинары, выступают консультантами в ходе дипломного проектирования, используют лучшие практики компании для создания учебных программ. Учебный центр «СёрчИнформ» вместе с СПбГУТ провел межвузовский семинар по теме «Практика применения DLP-систем» для преподавателей практически всех Санкт-Петербургских университетов, ведущих подготовку специалистов в области ИБ.

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

Языковые модели тупеют от мусорных данных из интернета

Группа исследователей из Университета Техаса и Университета Пердью предложила необычную идею: большие языковые модели (LLM), вроде ChatGPT, могут «тупить» от некачественных данных примерно так же, как люди — от бесконечных часов в соцсетях.

В отчёте специалисты выдвигают «гипотезу гниения мозга LLM». Суть проста: если продолжать дообучать языковую модель на «мусорных» текстах из интернета, она со временем начнёт деградировать — хуже запоминать, терять логику и способность к рассуждению.

Авторы понимают, что отличить хороший контент от плохого сложно. Поэтому они решили изучить 100 миллионов твитов с HuggingFace и отобрать те, что подходят под определение «junk».

В первую группу попали короткие твиты с большим количеством лайков и репостов — те самые, которые вызывают максимальное вовлечение, но несут минимум смысла. Во вторую — посты с «низкой семантической ценностью»: поверхностные темы, кликбейт, громкие заявления, конспирология и прочие «триггерные» темы.

 

Чтобы проверить качество отбора, результаты GPT-4o сверили с оценками трёх аспирантов — совпадение составило 76%.

Учёные обучили четыре разные языковые модели, комбинируя «мусорные» и «качественные» данные в разных пропорциях. Потом прогнали их через тесты:

  • ARC — на логическое рассуждение,
  • RULER — на память и работу с длинным контекстом,
  • HH-RLHF и AdvBench — на этические нормы,
  • TRAIT — на анализ «личностного стиля».

Результаты оказались любопытными: чем больше в обучающем наборе было «интернет-мусора», тем хуже модель справлялась с задачами на рассуждение и память. Однако влияние на «этичность» и «черты личности» было неоднозначным: например, модель Llama-8B с 50% «мусора» даже показала лучшие результаты по «открытости» и «низкой тревожности».

Исследователи сделали вывод: переизбыток интернет-контента может привести к деградации моделей и призвали разработчиков тщательнее отбирать данные для обучения. Особенно сейчас, когда всё больше онлайн-текста создаётся уже самими ИИ — и это может ускорить эффект так называемого model collapse, когда модели начинают обучаться на собственных ошибках.

Учёные шутят: если так пойдёт и дальше, возможно, придётся вернуться к книгам — хотя бы ради того, чтобы «накормить» модели чем-то действительно качественным.

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

RSS: Новости на портале Anti-Malware.ru