Google оказался главным шпионом в Интернете

Исследование, проведённое группой аспирантов Калифорнийского университета, выявило ряд ключевых несоответствий между тем, какую защиту персональной информации пользователи ожидают от веб-сервисов, и тем, как веб-сервисы собирают и обмениваются с третьими сторонами этой информацией.

Исследователи пользовались Firefox-плагином Ghostery, вычисляющим всевозможные cookies и счётчики, с помощью которых сайты собирают информацию о посетителях. Выяснилось, в частности, что каждый из 50 наиболее посещаемых сайтов содержит хотя бы по одному счётчику, при этом, к примеру, на блогхостинге Blogspot таких счётчиков насчитали ровно 100 штук.

Наиболее популярными оказались Google Analytics, DoubleClick и другие счётчики от Google. Из сотни топ-сайтов 92 пользуются хотя бы одним из таких счётчиков (Google Analytics стоит на 81 из них). Исследователи не ограничились только «топом», а изучили более 390 тысяч доменов, и выяснили, что гуглосчётчики встречаются на 88,4% из них (тут, правда, нужно учитывать, что на одном домене может быть не один — и далеко не один — сайт).

Доминирование Google в процессе сбора информации несомненно: эта компания собирает о вас данные, даже если вы не пользуетесь её сервисами. Правда, это не означает, что все эти данные собираются в одну центральную базу.

Собственно, представитель Google, к которому с этим вопросом обратился журналист New York Times, уверил, что, согласно договорам, которые компания заключает с потребителями, у неё нет прав на такое объединение данных из разных сервисов вроде DoubleClick и AdSense, равно как и на связывание этих данных с персональной информацией, которую Google собирает, когда пользователь регистрируется на его сервисах.

Исследование выявило и другие любопытные факты. Особый интерес представляет политика конфиденциальности, которую используют веб-сервисы. Соглашения об использовании обычно написаны на малопонятном для простых смертных «юридическом жаргоне», но если найти силы и время на то, чтобы их прочитать, то там обычно очень мутно говорится — если говорится вообще — о том, как сохраняются данные, приобретаются ли данные о пользователях «на стороне», а также что произойдёт с пользовательскими данными в случае, если компания сольётся с другой фирмой или обанкротится.

Часто на сайтах утверждается, что данные не передаются третьим сторонам, что является неправдой — возможно, неосознанной. Ведь в коде всех этих сайтов присутствует несколько счётчиков, которые как раз принадлежат третьим сторонам и собирают данные.

Кроме того, бывает, оговаривается возможный обмен данными с партнёрскими компаниями. Ни одна из 50 топ-компаний, в которую обратились исследователи, не предоставила список этих партнёров. Аспирантам пришлось пойти на хитрость: они вычисляли родительские компании и подсчитывали у них число «дочек», справедливо полагая, что именно они могут являться первыми кандидатами на роль партнёров. В среднем таких «родственничков» у одного веб-сервиса оказалось ни много ни мало 93 (в одном случае их было 297!).

В заключение исследователи рекомендуют владельцам веб-сервисов предоставлять своим пользователями всю информацию о сборе данных, позволять им самим решать, передавать ли свои данные «партнёрам», и записывать соглашения об использовании человеческим языком. Также было бы неплохо, считают исследователи, если бы создатели браузеров предусматривали функции, позволяющие пользователям получать информацию об используемых на сайтах счётчиках.