Как работает алгоритм? В книге «Убийственные большие данные»[252]
американский математик и писательница Кэти О’Нил объясняет принципы его работы на практическом примере: как она готовит для своей семьи[253]. Ей хочется, чтобы ее родные: а) ели в достаточном количестве, б) ели то, что им нравится, и в) получали достаточно питательных веществ. Оценивая эти три фактора каждый вечер, она узнает, как прошел ужин и как его можно сделать лучше. Тот установленный путем наблюдений факт, что ее дети не притрагиваются к шпинату, но жадно поглощают брокколи, помогает ей кормить их полезной едой. Однако при достижении поставленных целей ей приходится учитывать несколько ограничивающих факторов. Ее мужу противопоказана соль, а один из сыновей терпеть не может гамбургеры (зато обожает курятину). Кроме того, ее бюджет, свободное время и желание готовить небезграничны.Благодаря многолетнему опыту О’Нил научилась искусно справляться с этой задачей. Она, отчасти бессознательно, разработала строгий пошаговый план оптимального питания семьи. Предположим теперь, что за эту работу берется компьютер. Как передать машине решения, касающиеся меню? Для начала можно придумать способ
Решив, что и как стандартизировать, можно приступить к
Имея эти данные, О’Нил могла бы написать программу, в точности указывающую, что ее семье следует есть каждый день. Но она может написать и самообучающуюся программу. Если все выражено в числах, компьютер может самостоятельно
Короче говоря, О’Нил должна стандартизировать свою кулинарную работу, собрать данные и поручить программе проанализировать их. Где мы уже встречали эти этапы? Они в точности совпадают с тем, что делали Флоренс Найтингейл, Арчи Кокран и другие. Мы обо всем этом уже говорили, но стоит сказать и о том, что при использовании алгоритмов на каждом из этих трех этапов имеется масса возможностей допустить ошибку.
В финансовом секторе есть компании наподобие Tala, которые используют большие данные для оценки платежеспособности заемщиков. К таким относится, например, компания ZestFinance, которая с 2009 года присвоила кредитные рейтинги более чем 300 миллионам человек. Ее основал Дуглас Меррил, бывший директор Google по информационным технологиям. ZestFinance утверждает, что традиционную систему кредитных рейтингов сдерживают «малые данные»[255]
. В привычных кредитных рейтингах, разработанных много лет назад Фэйром и Айзеком, используют «менее 50 единиц информации», что соответствует «лишь малой части общедоступных данных о каждом человеке». Напротив, Zest использует в каждой своей оценке более трех тысяч переменных[256].В Нидерландах тоже есть бесчисленные компании, которые при помощи больших данных измеряют отношение клиентов к платежам. Нидерландская фирма Focum, торгующая данными, присваивает рейтинг от одного до одиннадцати[257]
. Вы еще не оплатили счет? Теряете десять баллов, и не важно, идет ли речь о двадцати или о двадцати тысячах евро. Такие создатели кредитных рейтингов продают их всем желающим, от страховщиков до жилищных корпораций, от Vattenfall до Vodafone[258]. Низкий кредитный рейтинг может привести к тому, что вам не продадут абонемент телефонной связи или что вам придется заплатить крупный залог при заключении договора с новым поставщиком электроэнергии. Компания утверждает, что располагает данными 10,5 миллиона голландцев. Для страны с населением всего 17 миллионов это очень много.