Алексей Губин

Big Data: высокоточное будущее или деградация?

Одна из любимых тем научной фантастики прошлого века — каким станет мир, когда машины будут умнее человека? Похоже, мы сами не заметили, что это уже реальность. Мы стоим на пороге эпохи массового применения Big Data (большие данные). Чем это обернется для бизнеса, граждан и государства?
Big Data: высокоточное будущее или деградация?

Google может с 90-процентной вероятностью определить человека даже после смены сим-карты и телефона. А также с 80-процентной вероятностью предсказать, куда вы пойдете и с кем встретитесь. Иногда – до того, как вы сами приняли это решение.

 
Алексей Губин_200_директор по информационным технологиям «ЭНКО Групп».jpg
Алексей Губин,
директор по информационным
технологиям «ЭНКО Групп»

Ответы на все вопросы

Активное развитие и внедрение Big Data крупными корпорациями и органами государственной власти породило массу новых возможностей для оперативного анализа ситуации. С одной стороны, это способствует снижению затрат на производство, уменьшению издержек и рисков, с другой – порождает новые проблемы. Среди них общественная безопасность, конфиденциальность частной жизни, а также морально-этические нормы.

В весьма недалеком будущем нам, как обычным гражданам, придется встретиться с очень высоким уровнем проникновения Big Data в нашу личную жизнь – для изучения наших действий и поступков. Специалисты в области информационных технологий получат доступ к огромной базе неструктурированных данных, которые, подобно древнему сказочному мудрецу, способны дать ответы на все вопросы. Главное – умение их правильно задать. 

Big Data позволяют на основе анализа покупок ответить на вопросы: женат человек или нет, следит ли он за своим здоровьем, есть ли у него дети, каков уровень его зарплаты

Когда мы заходим в торговый центр и покупаем продукты по карте постоянного покупателя, информация о наших покупках поступает в Центр обработки данных торговой сети. Математический анализ поведения сотен тысяч покупателей на протяжении длительного времени значительно облегчает задачи менеджерам и логистам компании. Они могут точно определить покупательский интерес к определенным видам товаров, отследить сезонный рост продаж, заблаговременно заказать и завезти в торговые центры наиболее востребованные продукты. Безусловно, это снижает издержки торговой сети и, соответственно, стоимость товаров для покупателя. Более того, Big Data позволяют на основе анализа покупок ответить на вопросы: женат человек или нет, следит ли он за своим здоровьем, есть ли у него дети, каков уровень его зарплаты. А также проанализировать десятки других персональных показателей, которые коммерческие компании могут использовать для извлечения прибыли, а органы государственной власти – для контроля и наблюдения. Системы сбора и обработки информации работают эффективно, благодаря непрерывному поступлению огромного объема разнообразных данных, на основе которых они могут строить свои прогнозы. Более того, системы проектируются таким образом, чтобы со временем совершенствоваться.

Роботизация

Так как же Big Data изменят мир? В ближайшем будущем многие грани нашей жизни, которые пока входят в сферу исключительно человеческих суждений, будут дополнены или замещены компьютерными системами. Уже сейчас сервис Watson от компании IBM в состоянии эффективно диагностировать заболевания и прописывать курс лечения, опираясь на огромную, постоянно пополняемую базу профильной информации. В долгосрочной перспективе это позволит отказаться от врачей – как в начале позапрошлого века, когда холодильники заменили продавцов льда. Уже сейчас место брокеров на биржах занимают информационно-аналитические системы, они гораздо быстрее человека анализируют потоки поступающей информации и принимают решения. Amazon вместо продавца в магазине может порекомендовать идеально подходящую вам книгу, ориентируясь не только на историю ваших запросов на интернет-площадке, но и на данные компании Google, любезно предоставляемые своим партнерам (компании Amazon в том числе).

Главные сборщики информации

Считается, что структуры вроде Google и Amazon были первопроходцами в области Big Data, но это не так. Первоначальными сборщиками информации были органы государственной власти, и они по-прежнему дадут фору любой крупной корпорации в части сбора огромного объема управляемых данных (но не анализа!). При этом до 2010 года в России государственные органы, как правило, обязывали людей предоставить личные сведения исключительно для своих внутренних недр, собирая огромные базы данных.

Успеха добьются компании, которые смогут оказаться в центре потоков информации и, главное, научатся их собирать и анализировать

Однако после 2010 года ситуация в России кардинально поменялась в связи с принятием Федерального Закона №210 «Об организации предоставления государственных и муниципальных услуг». Согласно документу, органы власти не имеют права запрашивать у гражданина информацию и документы, имеющиеся в других органах государственной власти. Это значительно уменьшило объём бумажной волокиты для людей. Однако факт остается фактом: государственные органы, в отличие от коммерческих организаций, ценящих каждую вложенную копейку, накапливает огромные объемы информации и при этом испытывают очевидные трудности с ее хранением и анализом. Для плодотворного внедрения систем обработки больших данных требуются глубокие технические навыки, знания в смежных отраслях (в которых производится сбор сведений), а также креативное масштабное воображение – мышление категориями Big Data.

Самый ценный актив

Сегодня руководство многих компаний принимает ключевые решения, опираясь на свое внутреннее чутье, личные и профессиональные навыки, накопленный с годами опыт. С приходом массового использования Big Data «каждая кухарка сможет управлять государством», большие данные уже сейчас вносят значительные коррективы в экономические и маркетинговые модели бизнеса, рынков и общества.

C начала века особое значение придается нематериальным активам – важность физической инфраструктуры и материальные ценности уходят на второй план. Интеллектуальная собственность и информация по своей значимости сегодня не уступают земле или заводам. Общество идет к тому, что более ценным активом становится не вычислительная производительность программно-аппаратного комплекса, а получаемые им данные, методы и скорость их анализа. Информация постепенно становится важнейшим корпоративным ресурсом. И хотя данные еще не вносятся в балансовые отчеты компаний, это вопрос времени, поскольку методика точного подсчёта стоимости такого актива уже разрабатывается.

Успеха добьются компании, которые смогут оказаться в центре потоков информации и, главное, научатся их собирать и анализировать (такие как Google, Yandex, Facebook, Amazon). Социальные сети в этом списке вообще можно вынести в отдельную нишу, поскольку они сами, по сути, являются Big Data, генерирующими информационные потоки с наиболее дешевым методом организации сбора информации. Так, пользователи самостоятельно, без принуждения, сообщают свои персональные данные, предпочтения, суждения, связи.

Социальные сети реализовали механизмы анализа поведения пользователя в социальной сети и его взаимодействия с контентом. Во-первых, это позволяет им выводить какую-либо рекламу, сфокусированную на определенную целевую аудиторию, например, контент-реклама в поисковой системе Yandex. Во-вторых, дает возможность в будущем (если не в настоящем) превратиться в полноценный механизм контроля за социумом. Уже сейчас все крупные социальные сети используются спецслужбами государств для предотвращения терактов, изучения общественного мнения, выявления и подавления оппозиционно настроенных граждан. Они сообщают о человеке значительно больше, чем он сам готов транслировать окружающему миру.

Не спрятаться

Повсеместное внедрение методов сбора и анализа больших данных хранит в себе серьезные угрозы. Big Data разрушают правовые и технические границы, с помощью которых мы стараемся обеспечить свою конфиденциальность. Раньше было четко ясно, что является информацией, позволяющей установить личность: ФИО, паспортные данные, возраст, религиозные предпочтения, медицинские показатели и прочее. Оградить доступ к таким сведениям в рамках требований Федерального закона РФ № 152-ФЗ «О персональных данных» было относительно нетрудно.

С приходом массового использования больших данных «каждая кухарка сможет управлять государством» Сегодня даже с помощью самой безобидной информации, если ее собрано достаточно много, можно гарантированно установить личность человека, его предпочтения, социальный статус и многое другое. Попытки придать персональным сведениям анонимную форму или скрыть их становятся все менее эффективными. В эпоху больших данных три основные столпа обеспечения конфиденциальности (индивидуальное «уведомление и согласие», возможность отказа от участия и анонимизация) фактически утратили свою эффективность.

Массовая деградация?

Помимо того, что Big Data серьезно угрожают конфиденциальности личной информации, в перспективе возникнет другая серьезная проблема. Прогнозы Big Data с каждым годом становятся все более точными, их можно использовать для прогнозирования правонарушений определенными людьми, группами лиц. Однако если мы сможем предсказывать вероятные правонарушения, то вряд ли наше общество ограничится профилактикой преступлений. Вполне вероятно, мы захотим наказать потенциальных «возмутителей спокойствия». Это логично. Если мы просто вмешаемся, чтобы не допустить незаконных действий, предполагаемый преступник в следующий раз может попробовать еще раз.

Более того, возможно наказание отдельных государств за их предполагаемую внешнюю и внутреннюю политику, вплоть до превентивного военного вмешательства (тем более, что такие случаи уже есть). Это, безусловно, создаст поле для злоупотреблений, информационного терроризма. Возможно, с такими юридическими, техническими и аналитическими механизмами контроля и общество стало бы более безопасным и комфортным, но утратилась бы существенная часть того, что делает человека личностью, — возможность принимать решения и нести за них персональную ответственность. Больше данные стали бы инструментом коллективизации человеческого выбора и отказа от свободы волеизъявления в нашем обществе. Big Data могут изменить саму суть человеческого мышления, привести к массовой деградации и безответственности, поскольку будущее из прогнозируемого может превратиться в предопределённое, причем предопределенное не человеком, а машиной.

Резюме

В заключении хочу отметить, что Big Data имеют огромное практическое значение как технология, служащая решению повседневных проблем, высокоточному прогнозированию будущего. Для бизнеса внедрение Big Data – это возможность разработки более эффективных маркетинговых программ, максимальная информированность при принятии ключевых бизнес-решений, прогнозирование рынка, повышение конкурентоспособности и разработка стратегий развития. Для государства – это повышение прозрачности, производительности работы госучреждений, возможность осуществления контроля за деятельностью граждан без прямого вмешательства.

Для обычного гражданина Big Data способны изменить образ жизни и труда, обесценить самостоятельное принятие решений. Ведь Google уже догадывается, где вы будете отдыхать в пятницу, хотя вы еще только предполагаете.