АНБ создало Google for Voice для перевода телефонных разговоров в текст

АНБ создало Google for Voice для перевода телефонных разговоров в текст

На протяжении десяти лет АНБ США совершенствовало свои возможности по прослушиванию телефонных переговоров. Для этого были созданы специальные компьютерные системы и программы, позволявшие агентам отслеживать миллионы бесед, по ключевым словам выявлять «подозрительные» разговоры и в текстовом формате осуществлять их перевод с различных иностранных языков.

Об этом свидетельствуют данные в документах, предоставленных бывшим сотрудником американских спецслужб Эдвардом Сноуденом, который ныне проживает в России.

Согласно документам, переданным в СМИ Эдвардом Сноуденом, программы, которые использовали в АНБ для прослушки телефонных переговоров, умели «автоматически распознавать содержание бесед, переводить их в текстовой формат и записывать так, чтобы их было удобно хранить и находить в базе данных», пишет издание The Intercept, сообщает russian.rt.com.

Американские спецслужбы начали использовать программу под кодовым названием RHINEHART ещё в 2004 году. Она была специально разработана для поиска информации в реальном времени с использованием определённого набора словарей. А также для так называемого «ретроспективного поиска», когда требуется найти запись, сделанную несколько месяцев назад.

Два года спустя в Ираке была апробирована новая система, «предназначенная для занесения в базу данных и создания меток в телефонных переговорах». Как сообщает The Intercept, эта обновлённая система могла обработать до 1 млн записей в день. При этом АНБ навязчиво предлагало использовать свою собственную разработку — программу «Голосовой Google» (Google for Voice) для перехвата сигнала в реальном времени.

Ещё через два года, в 2008, АНБ запустило программу под названием «Усовершенствованная обработка видео, аудио и текстовой информации», которая предоставляла агентам спецслужб полностью автоматизированный сервис. Её особенностью была возможность перевода на английский в реальном времени телефонных переговоров с таких языков, как арабский, китайский, русский, испанский и фарси. Перевод предоставлялся в письменной форме. Это помогало агентам преодолевать языковой барьер.

В одном из документов сообщается, что программа распознавания человеческого голоса была внедрена в Ираке и Афганистане. Однако в полном объёме потенциал программы ещё не реализован.

«Поскольку такие возможности у спецслужб уже есть, то возникает вопрос: как они будут воплощаться в жизнь? Возможно ли постоянно отслеживать и хранить все телефонные переговоры американцев, записывать их содержание на бумаге и отыскивать в тексте нужное?» — задаётся вопросом Дженнифер Граник, сотрудник Центра интернета и общества в Стэнфорде. «Может быть, они и не занимаются этим прямо сейчас, но они могут это сделать», — считает она. Другой вопрос — сколько невинных людей могут от этого пострадать.

OOXML — фикция: LibreOffice обвинила Microsoft в манипуляциях

Проблемы совместимости остаются одной из главных причин, по которым пользователи не спешат переходить с Microsoft Office на LibreOffice. Формально всё работает, но на практике время от времени всплывают странности с вёрсткой, форматированием и отображением данных. И, как считают в The Document Foundation (TDF), дело тут вовсе не в LibreOffice.

Фонд, стоящий за LibreOffice, снова выступил с жёсткой критикой Microsoft. В блоге Итало Виньоли — одного из основателей TDF — корпорация из Редмонда обвиняется в том, что она игнорирует интересы отрасли ради собственных коммерческих целей.

По его словам, утверждение «OOXML — это стандарт, и его просто нужно принять» выглядит, мягко говоря, странно.

Виньоли настаивает: Office Open XML (OOXML) не может считаться полноценным стандартом, пока Microsoft не готова радикально переработать сами приложения Office. В качестве примера он напомнил о давней проблеме Excel с автопреобразованием данных — истории, которая напрямую затронула научное сообщество.

Excel годами автоматически превращал текстовые значения в даты. Для обычных таблиц это удобно, но для генетиков — катастрофа. Названия генов вроде MARCH1, SEPT1 или DEC1 Excel воспринимал как даты и превращал их в «1-Mar», «1-Sep» и «1-Dec».

В 2016 году журнал Genome Biology проанализировал почти 3,6 тысячи научных работ с Excel-файлами и выяснил, что примерно в каждой пятой были ошибки, вызванные именно автозаменой форматов.

Долгое время Microsoft считала проблему нишевой и не давала возможность отключить такое поведение. Лишь в 2023 году компания добавила соответствующую настройку; уже после того, как Комитет по номенклатуре генов человека (HGNC) был вынужден переименовать около 27 генов, чтобы избежать ошибок. К тому моменту ущерб для исследований уже был нанесён.

По словам Виньоли, OOXML «открыт» лишь формально. Спецификация формата занимает около 7 000 страниц, что делает полноценную и корректную реализацию сторонними разработчиками почти невозможной.

Кроме того, Microsoft Office сам не использует строгую версию стандарта (Strict OOXML), предпочитая так называемый Transitional-вариант. В нём до сих пор есть зависимости от старых, проприетарных форматов и поведения древних версий Word — вплоть до элементов с названиями вроде autoSpaceLikeWord95 или shapeLayoutLikeWW8.

Отдельно Виньоли критикует рекомендации использовать Windows Metafile для графики вместо открытых и кросс-платформенных форматов вроде SVG.

Для пользователей всё это выливается в знакомую проблему: документы между Office и LibreOffice открываются, но не всегда так, как ожидалось. Для TDF же это очередное подтверждение того, что формат Office по-прежнему работает как инструмент удержания пользователей внутри экосистемы Microsoft.

Спор вокруг OOXML длится уже много лет, и новый выпад со стороны LibreOffice ясно показывает: вопрос совместимости и «открытых стандартов» по-прежнему далёк от закрытия.

RSS: Новости на портале Anti-Malware.ru