Наше открытие было принято городскими чиновниками без всякого энтузиазма. Для встречи в мэрии наша группа подготовила презентацию, посвященную положению бездомных в Нью-Йорке. После того как мы продемонстрировали слайд со статистикой рецидива и эффективности «Секции 8», у нас состоялся чрезвычайно неловкий (и весьма недолгий) разговор. От нас потребовали удалить этот слайд. Линия партии осталась неизменной. Большие данные, которые при мудром с ними обращении могут помочь сделать важные открытия, снова продемонстрировали свою разрушительную силу. В конце концов, они направлены на поиски закономерностей, невидимых человеческому глазу. Сложная задача для специалистов по данным заключается в том, чтобы разобраться в экосистемах, которые создают эти данные, и выявить не только проблемы, но и их возможные решения. Простой анализ трудового процесса в компании может показать, что в штатном расписании есть пятеро явно лишних работников. Но если команда по анализу данных пригласит эксперта, тот разработает более конструктивную версию модели, которая не уволит этих людей, а предложит им работу в оптимизированной системе, а заодно определит, какая переподготовка им понадобится, чтобы занять эти рабочие места. Иногда работа специалиста по анализу данных заключается в том, чтобы знать, когда ты недостаточно знаешь.
Исследуя экономику данных, я вижу множество математических моделей, которые могут быть использованы для благих целей, и не меньше моделей с большим потенциалом стать таковым – если их не применять во вред. Возьмите для примера работу Миры Бернштейн, которая занимается трудовым рабством. Гарвардский доктор математики Бернштейн построила модель, которая сканирует масштабные производственные цепочки – например, сборку мобильных телефонов, изготовление кроссовок, автомобильный конвейер – и обнаруживает в них эпизоды принудительного труда. Бернштейн построила свою модель рабства для некоммерческой организации «Сделано в свободном мире» (
Бернштейн собрала данные из нескольких источников – экономическая информация ООН, статистика по регионам с наивысшим процентом принудительного труда, детальная информация о компонентах тысяч промышленных товаров – и внесла все это в модель, оценивающую вероятность того, что определенный продукт из определенного региона может быть изготовлен с участием рабского труда. В интервью журналу
Некоторые компании, несомненно, обнаружат, что казавшийся подозрительным поставщик действует в рамках закона (все модели таки или иначе производят ложноположительные результаты). Вся информация возвращается в организацию «Сделано в свободном мире», где Бернштейн изучает обратную связь.
Еще одна модель, нацеленная на общественное благо, появилась в сфере социальной помощи. Это предиктивная модель, которая указывает на семьи, где дети с наибольшей вероятностью могут подвергаться насилию. Модель, разработанная некоммерческой организацией