ГлавнаяО насНовостиСтатьиРешенияКонтакты
Украинский интегратор защиты персональных данных

Переосмысление общества на заре эпохи "Больших данных"

Большие данные

С приходом эпохи "Больших данных" мы сможем, наконец, начать по-настоящему наблюдать за деталями межличностного взаимодействия, за происхождением социальных связей. Мы более не будем ограничены усредненными показателями, такими как рыночные индексы и результаты голосования на выборах. Это просто неслыханная перемена!

Способность увидеть составные части рынков, политических революций, уметь предсказывать и контролировать их, очевидно, сравнимо с огнем Прометея. Этим можно воспользоваться как на благо, так и во зло. Поэтому эпоха "Больших данных" обещает быть интересной. Одно можно утверждать точно: она обязательно приведет к переосмыслению понимания самого понятия «человеческое сообщество».

Сэнди Пентланд: Похоже, что в последнее время я стал знаменитостью в Массачусетском технологическом институте (далее – МТИ), экспертом в области "Больших данных". Тим О-Рейлли и журнал "Форбс" даже назвали меня одним из семи самых влиятельных ученых в области информационных технологий. Я не очень понимаю, что все это значит, но у меня действительно есть особое понимание идеи "Больших данных" и, возможно, как раз это люди и хотят услышать.

Я уверен, что сила "Больших данных" состоит в том, что они дают информацию о поведении людей, а не об их убеждениях. Речь идет о поведении покупателей и сотрудников компаний, а также о том, какое значение это может иметь для вашего бизнеса.

"Большие данные" предлагают информацию о множестве конкретных вещей, например, геолокации абонентов сотовой связи и использовании кредитной карты, все эти маленькие хлебные мякиши, которые мы бросаем на всем нашем пути. По этим хлебным мякишам можно проследить историю нашей жизни. Они расскажут, что мы выбрали на самом деле. Вот почему это существенно отличается от информации, которую мы можем написать на стене в Фейсбуке. Что мы пишем в социальных сетях – это лишь отражение наших мыслей, которыми мы хотели бы поделиться, отредактированные в соответствии с действующими стереотипами. В противовес этому информация о нашем местонахождении, времяпрепровождении, наших покупках – "Большие данные" – имеют дело с тем, что мы есть на самом деле. Проанализировав эту информацию, социологи смогут рассказать очень многое. Например, они смогут сказать, какова вероятность того, что тот или иной человек заплатит по долгам или заболеет диабетом.

Они смогут это сделать, потому что социальный контекст во многом позволяет определить тип человеческой личности. Наблюдая за отдельными поступками, ученые смогут сделать умозаключения относительно всего остального просто на основе сравнения с другими лицами той же самой социальной группы. Можно будет многое рассказать об отдельных чертах индивида, даже в том случае, если этих подробностей не содержится в самих "Больших данных", поскольку люди так плотно вплетены в ткань окружающего их социума, что одно это уже определяет все виды взглядов и поступков, которые они считают нормальными, а также поведение, которое они копируют друг у друга.

Как следствие, анализ "Больших данных", в основном, представляет собой отслеживание социальных связей: ваших связей с окружающими, а также взаимосвязей между поведением и его последствиями. Это применимо ко всем сферам жизни.

К примеру, одно из направлений исследования "Больших данных" связано с финансовой информацией. Причем речь идет не только о больших событиях, как Великая депрессия, но и о всех других возможных финансовых трудностях. В конечном итоге, речь идет о системах, состоящих из людей, контактов, решений, которые могут привести к тем или иным негативным последствиям. "Большие данные" позволяют выстроить причинно-следственные цепочки, позволяющие понять эти факты. "Большие данные" дают нам возможность разобраться, как работают эти связки из людей и машин, определить их надежность.

Ключевым является понимание важности связей между людьми. Раньше ученые стремились объяснить такие феномены, как финансовые пузыри, посредством науки о поведении сложных систем, а также через науки о сети. Эти устаревшие методы мышления о "Больших данных" оставляли человека за рамками уравнения. Становится понятно, что связь людей устройства оказывает огромное влияние на современные финансовые рынки, правительства, компании и другие социальные структуры.

Исходя из понимания важности таких связей мы совместно с Асу Оздагларом недавно создали специальный Центр МТИ по исследованиям в этой области. Это один из самых первых исследовательских центров, чья деятельность распространяется на все департаменты и факультеты МТИ, потому что люди самых разных специальностей приходят к нам за пониманием важности связей между людьми для рационального функционирования транспортных систем, эффективности потребления энергии, стабильности финансовых систем, которые не ограничиваются лишь правилами и алгоритмами, но включают в себя и человеческий фактор.

В понимании систем, состоящих из людей и устройств, залог стабильности и безопасности социальных структур в будущем. Используя человека в качестве смыслового центра систем, мы выходим за рамки всех действовавших до этого социальных наук. Миссия "Больших данных" состоит в подлинном понимании систем, лежащих в основе нашего технологического общества. Это надежда на построение финансовых систем, которые не обваливаются, правительств, которые не погрязают в бездействии, действительно эффективных систем здравоохранения и т.д., и т.п.

Вопреки расхожим представлениям, преградами на пути к более совершенным социальным структурам являются не скорость и объем передачи данных. Проблема состоит в том, чтобы понять, как правильно анализировать связи между людьми в этом неизмеримом потоке информации.

Изменить способ построения систем

На фоне "Больших данных" традиционные способы строительства социальных структур выглядят неполными. Информации стало настолько много, что на любой вопрос можно получить статистически обоснованный ответ. Удивительно, но это делает научный метод в том виде, в каком мы его привыкли применять, неработоспособным, потому что существенным становится все подряд! Многовековые, традиционные исследовательские методологии, построенные на лабораторном анализе, отныне нельзя считать адекватными.

"Большие данные" и понятие сетевой науки находятся за гранью обычных подходов к проектированию социальных структур. Фундаментом нашего мира являются столетия научных изысканий, благодаря которым все существующие способы строения систем, правительств, организаций и т.п. имеют точные определения. Открыть что-то новое в рамках этой парадигмы практически невозможно. Однако с приходом эпохи "Больших данных" мы в скором времени будем вынуждены играть далеко за пределами знакомой нам площадки.

"Большие данные" могут ввести исследователей в заблуждение, выводя на поверхность ложные совпадения. Например, утверждение "люди, которые по понедельникам едут на работу, чаще подвержены простудным заболеваниям", вероятно, сможет найти подтверждение в условиях применения традиционных методов сбора данных. Но нам не дано знать, это правило или случайное совпадение? Обычные методы анализа не позволяют ответить на этот вопрос. Однако в скором времени у нас будут инструменты для достоверной проверки причинно-следственных связей совпадений в реальной жизни, которые серьезно превзойдут все имевшиеся ранее. Мы больше не будем полагаться на результаты лабораторных исследований, мы сможем экспериментировать в реальном мире.

Отдельной проблемой "Больших данных" является человеческое восприятие фактов. Как только обнаруживается совпадение, которое может быть использовано при проектировании социальных структур, необходимо будет донести до людей его смысл. Нужно разъяснить владельцами и управленцам, что может означать это совпадение. Возникнет потребность в установлении диалога между человеческой интуицией и информацией, полученной благодаря "Большим данным". В современных системах управления такая задача не стоит. Пока еще наши менеджеры не знакомы с принципами анализа информации из "Больших данных", недооценивают ее значение и не знают, стоит ли ей доверять.

В действительности даже сами ученые, занимающиеся исследованиями в этой области, еще не выработали концепции восприятия "Больших данных". И это тоже одна из проблем. Мне недавно довелось читать исследование, в котором утверждалось, что от 70% до 80% информации машинного самообучения, которая является важным источником пополнения "Больших данных", является некорректной, поскольку исследователи, закладывавшие ее, делали выводы, основанные на ложных предпосылках. Они не смогли установить связь между интуитивным восприятием и причинно-следственной материей процессов. Вместо этого, ученые просто "вписались" в действующую методологию, получили интересные цифры и с радостью их опубликовали, а их читатели не заметили подвоха. Это довольно-таки прискорбно, потому что если мы начнем строить наш мир, основываясь на такой ненадежной информации, мы закончим тем, что поезда будут врезаться в стены или еще во что похуже. Потому что умение управлять информацией, полученной из "Больших данных", радикально все изменяет.

В прошлом году в Давосе я провел несколько круглых столов по проблематике "Больших данных" с топ-менеджерами крупнейших компаний, работающих в сфере компьютерных технологий. В ходе этих встреч стало ясно, что на свет появляется совершенно революционный подход к информации. Представители некоторых компаний, например, "Палантир" или "ТИБКО", уже добились определенных успехов на данном направлении, однако для большинства присутствовавших "Большие данные" – это что-то неслыханное, за чем они еще не поспели.

Другим важным аспектом "Больших данных" является сложность их получения, потому что они напрямую связаны с частной информацией. На практике, использование "Больших данных" позволит вторгаться в частную жизнь настолько, что даже Большой Брат из романа Оруэлла покажется довольно невинным.

На протяжении нескольких предшествующих лет я помогал проводить круглые столы в рамках Всемирного экономического форума по проблемам использования индивидуальных данных и прав собственности на информацию. В результате, к большой удаче, было заключено так называемое "Новое соглашение о данных". Председатель Федеральной комиссии по торговле США, который входил в эту группу, выдвинул предложение принять закон о защите персональных данных, а комиссар по вопросам юстиции ЕС объявил, что отдельные положения "соглашения" будут включены в список основополагающих прав человека.

Все эти правовые декларации наделяют индивидов большими возможностями по защите относящейся к ним информации. Это важный шаг на пути создания безопасной и прозрачной системы исследования "Больших данных", который делает информацию более текучей и доступной благодаря тому, что люди теперь сами смогут принимать решения в отношении персональных данных. Это значительный прогресс по сравнению с действующей практикой хранения информации в архивных бункерах компьютерной индустрии, когда никто даже не знает о ее существовании.

Адам Смит и Карл Маркс ошибались

Проблемы, связанные с исследованием "Больших данных", безусловно, важны. Однако впереди нас ожидают совершенно неслыханные открытия. Если задуматься об обществах, в основу которых положены "Большие данные", станет ясно, что речь может идти только о радикальных переменах восприятия действительности.

Адам Смит и Карл Маркс ошибались, или, по меньшей мере, предлагали только половинчатые решения. Почему? Потому что они строили свои теории на основе усредненных понятий рынка и классов. И хотя, безусловно, рассуждения в таких терминах тоже может быть полезным, однако очевидно, что социальные феномены на деле состоят из миллионов мелких транзакций между индивидами. Существуют отдельные примеры межличностных взаимодействий, которые не просто не укладываются в усредненные параметры, а являются причиной социальных вспышек и потрясений, таких как "Арабская весна". Придется снизойти до этих мельчайших примеров, этих микропримеров, потому что они позволяют понять социальное устройство вне усредненных показателей. Мы вступаем в новую эру социальной физики, где решающий исход будет зависеть от деталей и частичек, от тебя и меня.

Понимание теории рынка и классов может дать вам только общее, половинчатое понимание ситуации, но теперь, благодаря "Большим данным", нам открываются частности, которые позволят разобраться в оставшейся половине. Потенциально мы будем способны создавать более справедливые, стабильные и эффективные компании, организации и общества. Все это на основе настоящего понимания нюансов физики межчеловеческого взаимодействия. Эта новая вычислительная наука открывает невероятные возможности.

Впервые в человеческой истории мы получим возможность узнать о себе все, что необходимо, чтобы построить социальные системы, качественно отличающиеся от всех, существовавших прежде. Это настоящие перемены. Это новый этап, сравнимый с изобретением письменности, становлением системы всеобщего образования и соединения людей посредством Интернета.

Сам факт того, что мы теперь сможем отслеживать динамику социальных взаимодействий и их происхождение, что мы больше не будем ограничены усреденными показателями, как рыночные индексы, вызывает во мне трепет. Способность увидеть составные части рынков, политических революций, уметь предсказывать и контролировать их, очевидно, сравнимо с огнем Прометея. Этим можно воспользоваться как на благо, так и во зло. Поэтому эпоха "Больших данных" обещает быть интересной. Одно можно утверждать точно: она обязательно приведет к переосмыслению понимания самого понятия "человеческое сообщество".

Создание социума на основе данных

Один из величайших вопросов современности состоит в следующем: на чьей стороне будет новый мир, основанный на "Больших данных", и как он будет выглядеть? Люди интересуются, будет ли он для участников Давоса или для всех? Этот вопрос волнует всех уже сейчас, потому что он о ценностях и этике. Я настаиваю на необходимости такого обсуждения. Отрадно, что все дискуссии в рамках Давоса, в которых мне приходилось принимать участие, имели отчетливый характер равноправия: большинство заступается за бедных, многие представляют развивающиеся страны (их присутствие значительно, а вовсе не формально). Люди действительно заинтересованы в строительстве устойчивого будущего, при котором значительной части населения планеты не придется испытывать нужды. Безусловно, такая повестка не может заинтересовать всех, но большинство ее разделяет.

Важно понять, что ваши индивидуальные данные приобретают большую стоимость, если вы решите ими поделиться, потому что это позволит создать такие социальные системы, как общественное здравоохранение. Информация о том, что вы делаете и куда ходите, например, может помочь остановить распространение опасной инфекции. Если у вас есть дети, вы, естественно, не хотели бы, чтобы они умерли от птичьего гриппа. Но как вы сможете это предотвратить? Выясняется, что существует возможность в реальном времени наблюдать за поведением людей, чтобы определить, когда тот или иной индивид заболевает. Наблюдая за распространением инфекции от человека к человеку, на индивидуальном уровне, можно остановить этот процесс. Итак, теперь можно начать создавать мир, в котором инфекции не представляют серьезной угрозы.

Если вы, например, обеспокоены глобальным потеплением, необходимо установить взаимосвязь между перемещениями и производительностью (мы сейчас проводим потрясающие исследования в этой области), после чего появится возможность спроектировать более эффективные, более человечные города, для жизнеобеспечения которых потребуется в разы меньше энергии. Чтобы добиться таких результатов, потребуются данные о человеческих перемещениях. Вот пример того, как распространение индивидуальной информации может оказать вам неоценимую услугу. Если каждый поделится данными о своих перемещениях, мы сможем создать более экологичный мир, сама ценность которого будет намного выше, чем если пытаться заработать на продаже этих данных.

Однако пока еще эти данные спрятаны за семью печатями и недоступны для изучения. Это была одна из причин, по которым я предложил заключить "Новое соглашение о данных" в рамках Всемирного экономического форума. С тех пор эта идея обсуждалась на множестве площадок и вылилась в принятие закона о защите персональных данных в США и декларации о правах на информацию в ЕС. Проблема в том, что когда данные спрятаны, мы не знаем, используются ли они во благо или во зло. А хотелось бы, чтобы они использовалась именно во благо. Нам нужно остановить инфекции, нам нужен более экологичный мир, нам нужен более честный мир.

Кому принадлежит информация в информационном обществе?

Как нам извлечь информацию из закромов на поверхность? Первое, что нужно понять – кому она принадлежит. Телефонным компаниям, просто на том основании, что они смогли ее собрать в тот момент, когда вы взяли свой телефон на прогулку? Может быть, у них и есть какие-то права на ее использование. Но в ходе упомянутых дискуссий все участники, в том числе и телефонные компании, соглашались с тем, что право собственности на личную информацию принадлежит индивиду. Компании могут иметь право хранить копии собранных данных, чтобы предложить услуги, которые вам потребуются, но конечное решение должно оставаться за вами.

В некоторых случаях, конечно же, все немного сложнее. Что если под "информацией" понимаются ваши расчеты с продавцом? В таком случае, очевидно, у этих данных будет несколько собственников. Однако, как представляется, передача прав собственности на информацию индивидам (что, в принципе, не совсем то же самое, что юридическая собственность) дает возможность извлечь ее из тайников и хранилищ. Потому что в этом случае она становится частной собственностью, которая приобретает ценность благодаря своему обменному потенциалу. Человек сможет по своему усмотрению передавать эту собственность, например, чтобы создать новые, более эффективные правительственные, социальные или некоммерческие системы. Вот мир, к которому мы движемся.

Существуют ли какое-нибудь противодействие на этом пути? Как ни странно, почти нет. Крупнейшие интернет-компании, возможно, можно отнести к главным оппонентам этой тенденции, потому что (не хочу показывать пальцами) Фейсбук и Гугл выросли на совершенно нерегулируемом пространстве. Для них контроль над личными данными является совершенно само собой разумеющимся. Но теперь им приходится шаг за шагом мириться с пониманием, что им придется идти на компромисс.

Наиболее ценной информацией владеют банки, телефонные компании, медицинские компании – все они являются объектами интенсивного регулирования. В результате, несмотря на все свое стремление, они не имеют возможности воспользоваться данными, которые им приходится покупать у их покупателей и у регуляторов. В этой связи, такие компании выступают за установление процедуры, при которой они передадут покупателям контроль за информацией в обмен на право предлагать им услуги по ее легальной покупке и использованию.

Это позволит компаниям сойти с крючка регуляторов и остаться незапятнанными, поскольку они будут открыто обращаться к владельцам за разрешением на использование информации в обмен на вознаграждение. Как представляется, если передать людям ответственность самостоятельно распоряжаться информацией, они станут делиться ей более охотно. Таким образом, это win-win-win для решения проблемы обеспечения неприкосновенности частной жизни, которому противостоят только компании, выросшие на почве отсутствия регулирования, а также организации, ныне действующие на теневом рынке и желающие выйти сухими из воды.

Постепенно появляются услуги, предлагающие ответственно распорядиться персональными данными. Речь идет о действительно индивидуальных рекомендациях, возможности подтверждения идентичности без запроса пароля, а также индивидуальных услугах общественного транспорта, медицинского обеспечения и т.п. Во всех этих сферах сейчас уже происходят тектонические сдвиги, и чем больше у нас появится возможностей пользоваться индивидуальными данными, тем больше будет шансов создать работоспособные системы.

Потенциальные улучшения в социальных системах отсылают нас к тому, о чем я уже говорил: современные социальные структуры построены на усредненных показателях, индексах и т.п. Например, на предположениях о том, что людям такого-то класса свойственно делать то-то и то-то, индексы рынка движутся таким-то образом. Но в реальности все эти тенденции складываются из миллионов и миллионов маленьких деталей межчеловеческого взаимодействия. "Большие данные" позволят нам увидеть эти детали и спроектировать системы, которые работают на индивидуальном уровне. Нас больше не будут воспринимать усредненными единицами.

Организациям, имеющим дело с жесткими ограничениями на информацию, придется исчезнуть

Я пришел к пониманию всего этого долгим и сложным путем. Я начинал с того, что создавал автоматизированные системы распознавания сигналов. У меня есть, в том числе, образование в области психологии и меня интересует, как взаимодействуют люди и данные в социальных системах. Например, мы разрабатывали одни из первых устройств, которые можно носить на себе. Создатели проекта "Гугл Гласс" являются выходцами из моей группы – это мои бывшие студенты. В результате всех этих проектов мне стало понятно, что ключевым моментом являются не устройства или их интерфейс, а данные о людях. Позже, когда мобильные телефоны распространились повсеместно, стало ясно, что именно они станут основным источником данных в мире.

Если бы мы смогли в любое время увидеть любого человека в мире – чем он занимается, где находится, с кем проводит время, мы бы создали совсем другой мир. Мы бы спроектировали эффективные системы транспорта, энергоснабжения и здравоохранения. Когда я сопоставил людей и сигналы, то, как люди работают посредством компьютерных систем, когда я задумался, что нам могут дать данные о человеческом поведении, я понял, что мы находимся в стадии перехода от мышления, основанного на средних показателях классов и рынков к пониманию конкретных взаимодействий между индивидами, к системам, основанным на собирании данных по крупицам.

Этот новый мир сделает роман Джорджа Оруэлла невинной шуткой. Теперь становится понятно, что нужно всерьез отнестись к вопросам, связанным с личными данными и правами собственности на них. Оруэлл даже не догадывался, что следя за межчеловеческими взаимодействиями можно с легкостью предсказать, за кого будут отданы их голоса на выборах, как отреагируют на те или иные новости, связанные, например, с изменением законодательства и т.п. Это откроет возможности для создания настоящей империи зла. Уверен, найдутся люди, которые попытаются этим воспользоваться.

В то же время, обществам, построенным на распространении информации, свойственно стремление к определенной прозрачности и свободе выбора индивидов, которые, как мне кажется, выступят против централизованного контроля. Такие общества будут стремиться к уменьшению роли власти со стороны государства и больших корпораций, потому что структуры без жестких информационных границ (в отличие от действующих ныне), намного более эффективны и жизнеспособны.

Это означает, что правительства и компании, ориентированные на предоставления услуг, будут стремиться предложить лучшее качество за меньшие деньги. В противовес существующим, стремящихся к контролю за гражданином и покупателем. В результате, я ожидаю, что организациям, имеющим дело с жесткими ограничениями на информацию, придется исчезнуть под натиском со стороны более эффективных организаций без таких ограничений, не стремящихся воспользоваться вашей информацией без спроса.

Автор статьи: Сэнди Пентланд


ru-philosophy (09.01.2013 в 09:41) | вверх страницы | к списку статей

Общие вопросы:

Что нас ждет в 2011 году и о чем необходимо задуматься сегодня?
Что такое защита персональных данных?
Для чего это необходимо?
Если не выполнять требования Закона?
Типовые нарушения
Какие риски неисполнения требований законодательства?
Сколько потребуется времени и средств?
Что необходимо делать?
Кому доверить внедрение защиты персональных данных?
ГлавнаяО насНовостиСтатьиРешенияКонтакты
Контактная информация
© 2003-2013 ООО "Ди Эй Кей продакшн"