Борчес (borches) wrote,
Борчес
borches

Lorem Ipsum, господа... Lorem Ipsum...

Сегодня в сети наблюдаю очередную "сенсацию", построенную любителями теории заговора, и успешно тиражируемую отечественной прессой, которая даже не хочет вникнуть в подробности происходящего.

Вчера ИТАР-ТАСС публикует новость под заголовком "В переводчике Google обнаружили тайный шифровальный алгоритм" (http://itar-tass.com/obschestvo/1387276), и вслед за этим многие издания начинают состязаться в искусстве заголовкопостроения: Переводчик Google шифровал запросы пользователей (http://www.rg.ru/2014/08/20/perevodchik-site.html) или Тайный шифр обнаружили в переводчике Google (http://www.vz.ru/news/2014/8/19/701046.html).

Все пишут о том, что "американские эксперты полагают" и что об этом "в понедельник сообщили представители сайта FireEye". Суть сообщения в том, что Google Translate бессмысленно переводит слова из знаменитой болванки "Lorem Ipsum" с латыни, и главное, что результаты перевода имеют "геополитический подтекст", да еще и подозрительно изменяются со временем. Из чего авторы делают вывод, что в продукте Гугла был заложен тайный алгоритм, который понятно какие службы используют для передачи друг другу своих тайных посланий.

Все это, конечно, полная чушь, кроме того факта, что бессмысленные сочетания слов из известной фразы, действительно, переводятся странно и очень разнообразно. Правда, перевод непосредственно Lorem Ipsum Google уже пофиксил, зато остальные куски из этого текста по-прежнему не могут не повеселить.

dolor-sit-sit

Хочется спросить, а какого sense, господа, вы вообще хотели от перевода бессмысленных текстов?

Ведь объясняется все крайне просто. Как известно, алгоритм перевода у всех производителей из поисковой троицы (Google, Яндекс, Bing) статистический, и основывается он на параллельных текстах, которые они черпают в том числе и из индексируемых ими страниц и документов в интернете (откровение, правда?). Поскольку часто там, где нет подходящего контента на другом языке, разработчики сайтов лепят "Lorem ipsum dolor sit amet...", то не исключено, что оно попадает в паблик, а затем и в поисковый индекс, и оттуда уже в переводы.

Этим и объясняется и тот факт, что разные сочетания одних и тех же слов переводятся по-разному, и также тот, что сами переводы меняются со временем.

Так что, ни шифра, ни всемирного заговора по-прежнему нет. А есть как всегда глупость журналистов и редакторов, которые поленились даже проверить первоисточники. Представители сайта FireEye ничего особенно в понедельник не сообщали, поскольку это вообще не СМИ, а разработчики систем безопасности. Они просто дали в ленту новостей ссылку на ZDNet.com, где, кстати, подробно разжеваны все вопросы обработки Big Data и параллельных текстов, которые в свою очередь ссылаются на блог Брайана Кребса, где тот рассказывает, как несколько месяцев назад некие Lance James из Deloitte и Michael Shoukry и FireEye (Ба-Бах! Круг замкнулся!) представили ему свои наблюдения об этих переводах.

Конечно, там отмечаются странности, что в тексте фигурируют ‘China,’ ‘NATO,’ and ‘The Free Internet,’ и задаются вопросом, а не секретный ли это канал коммуникаций, но подробный анализ при этом все-таки дается, и мыслящий читатель легко может разобраться, что к чему.

Кстати, есть в сети и более ранние заметки по данному поводу: http://www.zagg.com/community/blog/lorem-ipsum-text-translation-funny/, - так что Майкл Шукри, возведенный в ранг американского эксперта (не исключаю, что он таковой и есть), возможно, не первый искатель тайных шифров.
Subscribe

  • про медведев

    В любой другой стране, кроме странных азиоафриканских режимов, политик, наговоривший столько, сколько наш нынешний премьер, давно бы был отправлен…

  • Volver

    Раз в несколько лет на волне какой-нибудь новости я откапываю стюардессу мучительно пытаюсь восстановить пароль к живому журналу и осознать,…

  • Техническое бурчание

    Большой fuck up приложений Livejournal для мобильных, что они не синхронизируют черновики с веб-версией и между собой. Казалось бы очевидно, что в…

  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your IP address will be recorded 

  • 0 comments