Миллионы данных избирателей Техаса были найдены на незащищенном сервере

Миллионы данных избирателей Техаса были найдены на незащищенном сервере

Миллионы данных избирателей Техаса были найдены на незащищенном сервере

В интернете было обнаружено большое количество персональных данных избирателей. Утекшие записи содержали личную информацию миллионов жителей Техаса. Все это хранилось на незащищенном сервере, где даже не был установлен пароль.

Персональные сведения содержались в единственном файле и насчитывали около 14,8 миллионов записей. Для сравнения — всего в Техасе зарегистрировано 19,3 миллионов избирателей.

Это очередная утечка ставит под сомнение возможности политических партий, касающиеся хранения данных избирателей. Такая ситуация особенно опасна на фоне информационных войн, когда одно государство постоянно обвиняет другое во вторжении в выборы и влиянии на их результаты.

Утекшие персональные данные обнаружил специализирующийся на утечках исследователь из Новой Зеландии, известный под псевдонимом Flash Gordon. На данный момент неизвестно, кому именно принадлежит сервер, на котором хранилась незащищенная конфиденциальная информация. Есть лишь предположения, что он был скомпилирован Data Trust.

Стоит отметить, что представители Data Trust отказались как-либо прокомментировать наличие сервера с личной информацией избирателей.

Крис Викери, специалист компании UpGuard, проанализировал скомпрометированные персональные данные: один файл, размером около 16 гигабайт, содержит десятки полей, включающих личную информацию.

Среди этих данных: имя избирателя, адрес, пол, а также история голосования за несколько лет (включая отданный голос на президентских выборах).

Со своей стороны, власти Техаса подчеркнули, что эти данные не могут использоваться в коммерческих целях. Например, для таргетированной рекламы. Однако узнать политические предпочтения отдельных людей, при этом прочно связав их с конкретными личностями, вполне можно.

Среди утекших данных, например, есть сведения о взглядах человека на вопрос иммиграции, охоты, абортов, государственных расходов, а также на Вторую поправку к Конституции США. Помимо этого, там же можно найти номера телефонов, этническую принадлежность и расу.

Пока остается неясным, к какому именно периоду относятся скомпрометированные персональные данные.

На Википедии нашли галлюцинации в ИИ-переводах и ввели ограничения

У Википедии снова случился спор про ИИ, на этот раз из-за переводов. Редакторы ввели новые ограничения для части переводчиков, связанных с Open Knowledge Association (OKA), после того как в ряде ИИ-переводов нашли галлюцинации: подменённые источники, неподтверждённые фразы и даже абзацы, опиравшиеся на материалы, не связанные с темой статьи.

Сама OKA — это швейцарская некоммерческая организация, которая платит стипендии переводчикам и прямо пишет на своём сайте, что использует большие языковые модели, чтобы автоматизировать значительную часть работы.

В англоязычном сегменте Википедии у проекта есть отдельная страница, там сказано, что OKA финансирует переводчиков и работает с несколькими языками, включая русский, испанский, французский и немецкий.

Проблему заметили не «в теории», а на конкретных статьях. Один из редакторов, Ильяс Леблё, рассказал 404 Media, что при выборочной проверке быстро нашёл ошибки: где-то источники были перепутаны, где-то появлялись фразы без верификации, а в одном случае в статью про выборы во французский Сенат попали абзацы, вообще не подтверждавшиеся указанными материалами.

Отдельно редакторов смутило, как именно была организована работа. Публичные инструкции OKA для переводчиков на Meta-Wiki подтверждают, что организация обучает новичков и публикует свои рекомендации открыто. В обсуждении вокруг инцидента также всплывали указания использовать популярные LLM для чернового перевода и правки лидов статей; 404 Media пишет, что раньше в инструкциях фигурировал и Grok, хотя позднее акцент сместили на другие модели.

В итоге Википедия не стала запрещать ИИ-переводы целиком, но решила ужесточить подход именно к переводчикам OKA. По правилам, которые цитирует 404 Media, если такой переводчик за шесть месяцев получает четыре корректно вынесенных предупреждения за непроверяемый контент, то при следующем нарушении его могут заблокировать без дополнительных предупреждений. А материалы, добавленные таким участником, могут удалить, если за них не возьмёт ответственность другой редактор с хорошей репутацией.

У самой OKA своя версия истории. Основатель организации Джонатан Циммерманн заявил, что переводчикам платят почасово, а не за количество статей, и что фиксированной нормы публикаций у них нет. По его словам, организация делает ставку на качество, признаёт, что ошибки случаются, и уже усиливает контроль: вводит второй независимый этап проверки через другую LLM, но не как замену человеку, а как дополнительный фильтр перед ручной верификацией.

RSS: Новости на портале Anti-Malware.ru