И все же иногда мы невольно делимся информацией, которой не собирались делиться. Например, загрузка фотографии в интернет часто включает скрытые метаданные, такие как точное местоположение GPS и время, которые могут быть сопоставлены с фотографиями других людей, чтобы точно определить, с кем вы были и даже что вы делали. Вероятность злоупотреблений технологией отслеживания лиц настолько велика, что Сан-Франциско и несколько других городов уже запретили ее применение230
.В дополнение ко всем этим данным, собранным организациями, и информации, распространяемой в интернете отдельными лицами, существует еще один источник важных данных, который все чаще становится общедоступным: «открытые данные». Этот термин относится к обширным хранилищам данных, выгружаемых в интернет компаниями и правительствами во имя прозрачности или соблюдения нормативных требований. Это сочетание создало путаницу, которую я описал в 2018 году, назвав тенденцию
По некоторым экспертным оценкам, колоссальные 90 процентов данных, которые в настоящее время существуют в мире, были созданы за последние два года, и они будут продолжать экспоненциально умножаться231
.В современном мире
Хорошие данные и бесполезные данные
Сельское хозяйство, в настоящее время переполненное данными, может дать некоторые ответы.
Сегодня всего лишь одна ферма способна предоставить горы сведений от датчиков в почве, портативных трекеров на сельскохозяйственных животных и воздушных дронов, контролирующих урожай. Эта информация дает возможность грамотно вести земледелие – посадить нужные растения в нужном месте и собрать урожай в нужное время.
Некоторые группы объединяют данные из многих источников, чтобы создать нечто, имеющее ценность для всей отрасли. Калифорнийская фермерская бизнес-сеть является одним из таких примеров232
. Сеть просит фермеров поделиться данными о ценах на химикаты, размерах полей и урожайности сельскохозяйственных культур. Эта информация от тысяч участвующих фермеров, коллективно обрабатывающих более чем 9 тысяч гектаров сельскохозяйственных угодий по всей территории Соединенных Штатов и Канады, вводится в систему, чтобы любой участник мог видеть справедливые рыночные цены на сырье, реальную урожайность семян и оптимальные точки доставки зерна.Точно так же открытые сети появляются и в других отраслях. В области медицины, например, приложение под названием Figure 1 привлекло почти 2,5 миллиона медицинских работников для обмена изображениями пациентов (с удаленными личными данными), чтобы помочь своим коллегам диагностировать сложные или редкие заболевания. Это приложение, получившее название «Instagram для врачей»233
, помогло сотням профессионалов лучше лечить пациентов с помощью идей коллег-медиков со всего мира.Распространение открытых сетей оказывается чрезвычайно полезным для тех, кто делится данными. Однако это верно только в случае, если данные хороши – актуальны, понятны и управляемы. Больше не всегда означает лучше.
Обширные массивы данных от правительственных и неправительственных групп становятся доступными для других пользователей интернета. Теоретически это может показаться положительным моментом, но, к сожалению, не все данные пригодны для использования. Индекс GovLab234
, который отслеживает тенденции открытых данных и публикует ежегодные отчеты об уровне их использования правительствами во всем мире, выявил некоторые отрезвляющие моменты:● Более 1 миллиона наборов данных были открыты правительствами по всему миру.
● Менее 7 % этих наборов данных публикуются как в машиночитаемых формах, так и по открытым лицензиям.
● 96 % стран обмениваются наборами данных, которые не обновляются регулярно.
Когда дело касается данных, качество гораздо важнее, чем количество, как поняли те, кто вкладывает свои рекламные доллары в социальные медиаплатформы.
Когда поддельные аккаунты портят данные
Facebook получил огромную прибыль от ошеломляющего количества данных, которые он собирает от пользователей. Рекламодатели стекались в Facebook, чтобы получить доступ к данным. Количество пользователей и детали, которые Facebook знает о каждом из них, дают рекламодателям огромную возможность таргетированной рекламы в зависимости от того, во что люди верят, кого слушают, что им нравится и что они ищут.
Другие онлайн-платформы также предлагают аналогичный вариант брендам, но все они сталкиваются с реальной и растущей проблемой: многие пользователи на их платформах на самом деле являются троллями, ботами или скрываются за поддельными учетными записями.