Голландский студент собрал данные 35 млн. пользователей Google
В подтверждении тезиса о том, что оставленная в интернете информация остается в нем навсегда, студент Амстердамского Университета с нелегким именем Matthijs R. Koot составил огромную базу данных интернет-пользователей.
Его справочник включает имена, почтовые адреса, а также биографию 35 миллионов самых разных людей. Свою базу он собрал за один месяц.
Наградой трудолюбивому нидерландцу стал бесценный экзистенциальный опыт. Пытливому юноше было интересно узнать как легко собираются данные в интернете, каких трудов стоит какому-нибудь частному детективу насобирать персональной информации, к примеру, на Google Profiles, в объеме, достаточном для вознаграждения трудов. Ответ перед нами: проще простого! Сами Google Profiles открыты для всех и совершенно не против индексации информации, в отличие, например, от Facebook, чья политика запрещает вышеупомянутое под страхом смерти через отрубание головы.
Успех предприятия мистера Кута в том, что инженеры Google не отказывают в доступе к информации, фактически все записи о клиентах собраны в одном файле, названном profiles-sitemap.xml. Сам код голландского студента, используемый для сбора данных, находится здесь.
"Как все это началось? Мне было скучно и я написал небольшой скриптик чтобы скачать все файлы типа sitemap-NNN(N).txt – сначала скачал 10 000, потом 100 000, пока не добрался до 1 000 000. Я был удивлен не встретив никакого сопротивления или CAPTCHA. Воодушевленный, я выпил зеленого чаю и скачал остальные 34 000 000".
В своем блоге на Blogger простой парень из Амстердама написал, что его действия служат высокой исследовательской цели и попросил не искать в них подводных камней.
"Я очень любопытный, – делится Koot, – а сейчас мне любопытнее всего, например, что может остановить другого любопытного человека от скачивания целых архивов пользовательских данных. Интересно посмотреть как отреагирует Google: предпримут ли действия для защиты персональной информации своих пользователей или продолжат делать вид, что это не важно".
Google выступил с официальным заявлением: "Буду краток: общедоступная пользовательская информация легко находится нажатием кнопки поиска. Для получения доступа к ней не нужно быть и трех пядей во лбу. Информация, полученная таким образом, не нарушает ничьих прав. Ну вы знаете, – подмигнул сотрудник, – публичная информация такая публичная...".
А между тем, Google – не единственные безалаберные стражи пользовательских данных, у которых дудочники вроде Р. Кута уводят клиентов из-под самого носа. В июне, например, независимый (имя им – легион) исследователь скомпилировал в один файл имена и URL 100 000 000 пользователей Facebook и разместил для свободного скачивания. Все загрузившие релиз независимого исследователя получили доступ к этим самым страницам безотносительно того, закрыли свои профили пользователи или нет.
Аналогично Google, Facebook позволяет настроить профиль таким образом, чтобы страница не индексировалась, но – увы – для жертв независимого исследователя по-прежнему нет хороших новостей.
"Всю базу я загрузил с одного IP. Хочу, чтобы впредь люди думали, прежде чем постить что-нибудь на Google, Twitter, Facebook или других Web 2.0 сервисах: не будете осторожными – окажетесь в ежовых рукавицах".
УИЗПД (27.05.2011 в 10:13) | вверх страницы | к списку новостей
|