Традиционный кредитный рейтинг, например FICO, основан исключительно на данных о вас лично. Занимали ли вы деньги, сколько именно, насколько своевременно возвращали кредиты… Считается, что эти факторы позволяют предсказать, вернете ли вы будущий заем.
Есть веские основания считать такую логику несправедливой. Долги часто появляются в связи с медицинскими расходами или потерей работы. Некоторым удается пережить такие затруднения за счет сбережений, но не у всех имеются достаточные для этого средства. Таким образом, кредитный рейтинг – это мера не только благонадежности, но и просто-напросто удачи[273]
.Вычисление кредитного рейтинга с использованием больших данных обещает более глубокий подход. Вернемся к Дженифер и ее продуктовому ларьку. По каким критериям компания Tala решала, дать ли ей кредит? Дженифер должна была предоставить сотрудникам компании доступ к своему телефону через соответствующее приложение, а в телефоне содержится целый кладезь данных, только и ждущих, чтобы их проанализировали. История ее перемещений показала, что она часто передвигалась, но следовала по одним и тем же маршрутам. Она бывала либо дома, либо в своем ларьке. Из данных телефонных переговоров было видно, что она часто созванивалась с родными в Уганде. Помимо этого, в круг ее общения входили целых 89 человек.
С точки зрения алгоритма Tala, каждый из этих факторов увеличивал вероятность того, что Дженифер вернет кредит. К примеру, тот факт, что она регулярно общается с близкими, увеличивал эту вероятность на 4 процента. Регулярность ежедневных перемещений и наличие более 58 человек, с которыми она находилась в контакте, тоже считались позитивными признаками.
Пример Дженифер показывает, чем рейтинги на основе больших данных отличаются от рейтингов традиционных. Алгоритмы смотрят не только на то, что делаете
Даже слова, использованные в заявке, могут иметь значение. Дуглас Меррил из ZestFinance утверждал в 2013 году, что заявка, написанная заглавными – или, наоборот, одними строчными – буквами, может быть признаком неадекватного поведения в отношении платежей[274]
.Покупательские привычки также могут показывать, вернет ли человек свой долг. В 2008 году компания American Express решила аннулировать кредитные карты некоторых клиентов-американцев[275]
. «В заведениях, в которых вы недавно совершали покупки, расплачивались кредитными картами другие посетители, имеющие неблагоприятную историю погашения обязательств перед American Express», – писала компания. Впоследствии American Express отрицала, что вносила некоторые магазины в черный список, но признала, что следит за платежеспособностью клиентов, используя «сотни единиц информации».Другая сокровищница данных – социальные сети. В 2015 году компания Facebook[276]
получила патент на вычисление кредитных рейтингов по данным пользователей социальных сетей[277]. Какая тут логика? Если у ваших друзей плохая кредитная история, то и вам, вероятно, не следует доверять деньги в долг. Компания NEO Finance уже использует данные сети LinkedIn для оценки «характера и потенциала» людей, проверяя, правдивы ли их резюме[278].Было время, когда банкиры позволяли себе принимать решения под влиянием расовых, гендерных и классовых предрассудков. Рейтинги FICO должны были покончить с этим. Но когда дело доходит до кредитных рейтингов на основе больших данных, мы, кажется, поступаем так же, как и банкиры былых времен: судим о людях по тем группам, к которым они принадлежат. Только теперь эти группы определяются иначе: пишущие заглавными буквами; покупающие по дешевке; не имеющие друзей. Но если всмотреться, оказывается, что в них нет почти ничего нового. Привычка писать большими буквами, вероятно, связана с уровнем образования, число контактов в LinkedIn – с наличием работы, а выбор магазинов, в которых вы совершаете покупки, красноречиво говорит об уровне ваших доходов. Так что алгоритмы разделяют людей точно так же, как в давние времена – банкиры: на бедных и богатых, работающих и безработных, образованных и неквалифицированных. Статистики называют это корреляциями, другие люди – предрассудками.