Даже обезличенные базы данных представляют опасность

В США действует Закон о свободном доступе к информации, согласно которому власти должны обеспечить беспрепятственное получение любой информации, если она не является секретной и ее раскрытие не наносит ущерб национальной безопасности. Власти Нью-Йорка в качестве эксперимента выложили базу данных о перемещениях такси в свободный доступ и очень скоро поняли, что сделали это зря.

База содержит номер лицензии таксиста, время и место загрузки пассажира, время и место выгрузки, количество пассажиров, стоимость проезда и т.д. Специалисты по Big Data посмотрели на данные, немного поколдовали над базой и начались настоящие чудеса.

Хотя имен в базе нет, аналитики очень быстро их вычислили, сопоставив координаты начала маршрута с адресной книгой. Далее удалось на каждого отдельного гражданина составить профиль: где обедает, с кем встречается, где развлекается.

Дальше — больше. Сопоставив протяженность маршрута с фактической оплатой можно вычислить размер оставляемых чаевых. Другими словами, можно вычислить зажиточных граждан. Учитывая, что известны их адреса и примерный распорядок дня, базой наверняка заинтересуются криминальные элементы, ведь это идеальный список претендентов на визит вора-домушника.

По конечным точкам маршрута можно вычислить ФИО завсегдатаев борделей и других злачных мест с целью последующего шантажа.

Не обошлось и без курьезов. Специалисты вдоволь посмеялись над тем, как власти «защитили» приватную информацию о номерах машин и водительских лицензий. Для каждого номера вычислялось значение хэш-функции MD5, которое и сохранялось в базе вместо фактического номера. Учитывая, что и диапазон номеров машин, и диапазон номеров водительских лицензий известен заранее, специалисты подсчитали MD5 для всего диапазона, а потом прошлись по базе в поисках совпадений. В результате легко удалось восстановить исходные значения.

Специалисты предупреждают: даже обезличенные данные в руках аналитиков легко превращаются в персонализированные, которые уже могут создавать угрозу для безопасности отдельной личности.

Ваша оценка: Нет Средняя оценка: 5 (4 votes)
11
pomodor

Самое неприятное, что коммерсы кинулись накапливать свои базы, а надежно защищать их так и не научились. Чего стоят одни логи сотовых операторов, с детальным маршрутом перемещений с привязкой к ФИО. Хорошо, что данные получают только полицаи и чекисты. А если БД нечаяно или нарочно сольют в сеть? Будем знать друг о друге всё? А есть еще БД у провайдера, БД с портала госуслуг и т.д. Опытный спец по Big Data, если получит доступ, вытянет из массива цифр такое, о чем даже сам владелец данных не догадывался. ;)

Ваша оценка: Нет Средняя оценка: 5 (2 votes)
Отправить комментарий
КАПЧА
Вы человек? Подсказка: зарегистрируйтесь, чтобы этот вопрос больше никогда не возникал. Кстати, анонимные ссылки запрещены.
CAPTCHA на основе изображений
Enter the characters shown in the image.
Linux I класса
Linux II класса
Linux III класса
Счетчики
  • Самый популярный сайт о Linux и Windows 10
О Либератуме

Liberatum — это новости мира дистрибутивов Linux, обзоры, сборки, блоги, а также лучший сайт об Ubuntu*.