Умные часы следят за каждым движением пользователя

Умные часы следят за каждым движением пользователя

Умные часы следят за каждым движением пользователя

Куда деть в спортзале телефон, банковскую карту, паспорт и наличные? Платёжный оператор Visa недавно выяснил, что 32% опрошенных прячут деньги и ценные вещи в носках и обуви, 24% – в нижнем белье, а 18% попросту держат их в руках.

В этой ситуации очень полезно было бы избавиться хотя бы от телефона. К счастью, "умные" часы (смарт-часы) давно переместились из научно-фантастического кино в повседневность. Крошечный гаджет на запястье неплохо заменяет смартфон: он умеет проверять почту и социальные сети и делать много других полезных вещей. Например, считать пульс или количество шагов, что очень важно для поклонников фитнеса, пишет vesti.ru.

До сих пор такие гаджеты умели распознавать только очень ограниченный набор видов физической активности – например, ходьбу или определённые упражнения. Дело в том, что девайс мог только сравнивать поступающие данные с образцами, которые были загодя вложены в него программистами. Между тем человеческая активность очень разнообразна и к тому же изменчива, она плохо укладывается в заранее заготовленные шаблоны.

В то же время давно существуют технологии машинного обучения, позволяющие компьютеру самостоятельно строить "картину мира" на основе поступающих данных. Нейронные сети пишут музыку, сортируют гербарии и даже следят за тем, чтобы медперсонал обрабатывал руки. Теперь они могут ещё и научиться отличать чистку зубов от нарезки овощей.

Новый подход к распознаванию движений был разработан исследовательской группой под руководством Дэниэля Роггена (Daniel Roggen) из Университета Сассекса. Алгоритм отслеживает движения тела в реальном времени и накапливает опыт, отмечая, когда человек начинает заниматься новым видом деятельности. Он различает даже то, сидит тот или лежит. Кроме того, система не обращает внимания на паузы: несколько серий шагов, прерванные небольшими периодами отдыха, будут восприниматься как одна прогулка, а не как разные.

"Этот новый метод обнаружения активности рисует гораздо более богатую, точную картину повседневной жизни человека", – отмечает Рогген.

Такая информация будет полезна не только спортсменам, но и врачам, в частности нейробиологам. В эпоху экзоскелетов и кибернетических протезов детальное изучение человеческих движений актуально как никогда.

Подробности исследования будут представлены на Международном симпозиуме по носимым компьютерам (International Symposium on Wearable Computers), который пройдёт 11–17 сентября 2017 года на Гавайях, США.

Отметим, что распознавание движений – это огромная и быстро развивающаяся область. Например, уже существует система, которая отслеживает движения головы водителя и может предвидеть его ошибки. Однако это технология не так уж безобидна: не так давно была продемонстрирована троянская программа, которая определяет набираемые PIN-коды по движениям руки владельца "умных часов". Впрочем, конкретно эта проблема легко решаема: достаточно носить часы на ноге.

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

Языковые модели тупеют от мусорных данных из интернета

Группа исследователей из Университета Техаса и Университета Пердью предложила необычную идею: большие языковые модели (LLM), вроде ChatGPT, могут «тупить» от некачественных данных примерно так же, как люди — от бесконечных часов в соцсетях.

В отчёте специалисты выдвигают «гипотезу гниения мозга LLM». Суть проста: если продолжать дообучать языковую модель на «мусорных» текстах из интернета, она со временем начнёт деградировать — хуже запоминать, терять логику и способность к рассуждению.

Авторы понимают, что отличить хороший контент от плохого сложно. Поэтому они решили изучить 100 миллионов твитов с HuggingFace и отобрать те, что подходят под определение «junk».

В первую группу попали короткие твиты с большим количеством лайков и репостов — те самые, которые вызывают максимальное вовлечение, но несут минимум смысла. Во вторую — посты с «низкой семантической ценностью»: поверхностные темы, кликбейт, громкие заявления, конспирология и прочие «триггерные» темы.

 

Чтобы проверить качество отбора, результаты GPT-4o сверили с оценками трёх аспирантов — совпадение составило 76%.

Учёные обучили четыре разные языковые модели, комбинируя «мусорные» и «качественные» данные в разных пропорциях. Потом прогнали их через тесты:

  • ARC — на логическое рассуждение,
  • RULER — на память и работу с длинным контекстом,
  • HH-RLHF и AdvBench — на этические нормы,
  • TRAIT — на анализ «личностного стиля».

Результаты оказались любопытными: чем больше в обучающем наборе было «интернет-мусора», тем хуже модель справлялась с задачами на рассуждение и память. Однако влияние на «этичность» и «черты личности» было неоднозначным: например, модель Llama-8B с 50% «мусора» даже показала лучшие результаты по «открытости» и «низкой тревожности».

Исследователи сделали вывод: переизбыток интернет-контента может привести к деградации моделей и призвали разработчиков тщательнее отбирать данные для обучения. Особенно сейчас, когда всё больше онлайн-текста создаётся уже самими ИИ — и это может ускорить эффект так называемого model collapse, когда модели начинают обучаться на собственных ошибках.

Учёные шутят: если так пойдёт и дальше, возможно, придётся вернуться к книгам — хотя бы ради того, чтобы «накормить» модели чем-то действительно качественным.

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

RSS: Новости на портале Anti-Malware.ru