Apple учит Siri писать письма, не заглядывая в вашу переписку

Apple учит Siri писать письма, не заглядывая в вашу переписку

Apple учит Siri писать письма, не заглядывая в вашу переписку

Apple решила подтянуть интеллект Siri, но с умом — чтобы помощник стал полезнее, а ваша переписка осталась приватной. С выходом iOS 18.5 и macOS 15.5 появятся улучшенные фишки Apple Intelligence, и вот как их тренируют.

Как объяснила Apple в блоге, обычно модели обучаются на специально сгенерированных выдуманных письмах. В Bloomberg также подтверждают новые практики техногиганта.

Например:

«Хочешь поиграть в теннис завтра в 11:30?»

Но такие сообщения не всегда отражают настоящую манеру общения. Поэтому Apple придумала хитрый способ, как сделать синтетику более «живой».

Теперь модель будет сравнивать эти выдуманные письма с небольшим набором реальных сообщений, которые лежат на устройствах пользователей, согласившихся участвовать в анонимной аналитике. Сами письма никуда не уходят — устройство просто считает вектор, описывающий суть письма: тему, стиль, длину.

Затем этот вектор сравнивается с векторами выдуманных писем. И если, например, сообщение про теннис часто «совпадает» с реальными письмами, то в следующий раз модель создаст похожее, но про футбол. Так появляется всё более релевантный и реалистичный набор писем для обучения — и всё это без вреда для конфиденциальности.

Apple подчёркивает: конкретные письма никто не читает. Даже сами векторы не уходят с устройства. Apple видит только статистику — какие типы синтетических писем чаще «всплывают» у пользователей, так что никакой личной информации в процесс не попадает.

Ранее мы рассуждали, является ли Apple Intelligence ИИ-прорывом или кошмаром для конфиденциальности владельцев iPhone.

В Сеть выложили базу с 6,8 млрд адресов электронной почты

На одном из популярных форумов для киберпреступников появился интересный пост: пользователь под ником Adkka72424 заявил, что собрал базу из 6,8 млрд уникальных адресов электронной почты. По его словам, на это ушло несколько месяцев; он выгружал данные из логов инфостилеров, ULP-коллекций и различных баз, циркулирующих в Сети.

Цифра звучит почти фантастически. Однако исследователи Cybernews изучили массив объёмом около 150 ГБ и пришли к несколько иным выводам.

Формально автор не соврал: в файле действительно более 6,8 млрд строк. Но внутри оказалось множество дубликатов и откровенно невалидных адресов. После «очистки» реальное количество рабочих имейлов, по оценке экспертов, может составлять около 3 млрд.

 

Даже если это «всего лишь» 3 млрд, масштаб всё равно впечатляющий. В эпоху автоматизации фишинговых кампаний и атак вида «credential stuffing» объём решает многое. При конверсии всего 0,001% из трёх миллиардов злоумышленники теоретически могут получить около 30 тысяч потенциальных жертв. Для массовых рассылок этого более чем достаточно.

 

Сам автор публикации утверждает, что хотел «повысить осведомлённость» и привлечь внимание эксперта по утечкам Троя Ханта. Параллельно он дал традиционный совет пользователям: сменить пароли и включить двухфакторную аутентификацию. Впрочем, по комментариям на форуме видно, что аудитория интересуется базой прежде всего как инструментом для кросс-проверки других утечек: сопоставляя записи, злоумышленники могут быстрее находить «свежие» скомпрометированные аккаунты и экономить время.

RSS: Новости на портале Anti-Malware.ru