Apple обвинили в использовании пиратских книг для обучения ИИ

Екатерина Быстрова 08 Сентября 2025 - 09:17

GenAI (генеративный искусственный интеллект)

...

Apple обвинили в использовании пиратских книг для обучения ИИ

Apple оказалась в центре нового скандала вокруг авторских прав и искусственного интеллекта. На компанию подали коллективный иск два американских писателя — Грэйди Хендрикс и Дженнифер Роберсон. Они утверждают, что Apple использовала пиратские библиотеки электронных книг для обучения своих ИИ-моделей, включая те, что работают в сервисе Apple Intelligence.

По словам авторов, их произведения оказались в обучающих датасетах без разрешения и без выплаты лицензий.

Более того, иск утверждает, что Apple фактически копировала и эксплуатировала защищённые работы, чтобы создавать ИИ-модели, которые конкурируют с оригинальными текстами и снижают их рыночную ценность.

Если дело признают коллективным иском, оно может затронуть тысячи писателей.

Подобные конфликты для индустрии уже стали привычными: OpenAI продолжает судиться с The New York Times, а Anthropic в этом году согласилась выплатить $1,5 млрд по делу, охватившему полмиллиона авторов.

Для Apple же ситуация особенно чувствительна. Компания традиционно делает упор на конфиденциальность и прозрачность работы с данными, но если суд докажет использование пиратских источников, её стратегия в области AI может оказаться под угрозой.

Эксперты считают, что это дело способно стать прецедентом и подтолкнуть индустрию к более чётким правилам лицензирования и компенсаций авторам.

Следующая главная новость »

Резервные копии не работают? Расскажем в эфире AM Live, как делать по уму. Регистрируйтесь! »

Екатерина Быстрова 12 Февраля 2026 - 11:22

Утечки информации Умышленные утечки информации Кража данных Общее

В Сеть выложили базу с 6,8 млрд адресов электронной почты

На одном из популярных форумов для киберпреступников появился интересный пост: пользователь под ником Adkka72424 заявил, что собрал базу из 6,8 млрд уникальных адресов электронной почты. По его словам, на это ушло несколько месяцев; он выгружал данные из логов инфостилеров, ULP-коллекций и различных баз, циркулирующих в Сети.

Цифра звучит почти фантастически. Однако исследователи Cybernews изучили массив объёмом около 150 ГБ и пришли к несколько иным выводам.

Формально автор не соврал: в файле действительно более 6,8 млрд строк. Но внутри оказалось множество дубликатов и откровенно невалидных адресов. После «очистки» реальное количество рабочих имейлов, по оценке экспертов, может составлять около 3 млрд.

Даже если это «всего лишь» 3 млрд, масштаб всё равно впечатляющий. В эпоху автоматизации фишинговых кампаний и атак вида «credential stuffing» объём решает многое. При конверсии всего 0,001% из трёх миллиардов злоумышленники теоретически могут получить около 30 тысяч потенциальных жертв. Для массовых рассылок этого более чем достаточно.

Сам автор публикации утверждает, что хотел «повысить осведомлённость» и привлечь внимание эксперта по утечкам Троя Ханта. Параллельно он дал традиционный совет пользователям: сменить пароли и включить двухфакторную аутентификацию. Впрочем, по комментариям на форуме видно, что аудитория интересуется базой прежде всего как инструментом для кросс-проверки других утечек: сопоставляя записи, злоумышленники могут быстрее находить «свежие» скомпрометированные аккаунты и экономить время.