Но подумайте об отвратительных петлях обратной связи, которые создают
Большая часть хищнической рекламы, которую мы уже обсуждали, включая рекламу кредита «до зарплаты» и коммерческих колледжей, генерируется с помощью таких
В этом запрете есть определенная логика. В конце концов, наша кредитная история включает в себя очень личную информацию, и имеет смысл контролировать к ней доступ. Однако в результате компании ныряют в по большей части не регулируемые источники данных, такие как история посещений сайтов и геотеги, для того чтобы создать параллельный рынок информации. В процессе они могут по большей части избежать внимания правительства. Затем они измеряют успех по достижениям в эффективности, притоке наличности и прибыли. За немногими исключениями такие понятия, как справедливость и прозрачность, не входят в их алгоритмы.
Давайте сравним на секунду эту ситуацию с размышлениями банкира пятидесятых годов. Сознательно или нет, этот банкир взвешивал различные данные, которые имели совсем никакое или небольшое влияние на способность потенциального заемщика выплатить ипотеку. Он смотрел на посетительницу, сидевшую напротив него, видел ее расовую принадлежность и делал из этого выводы. Криминальное прошлое ее отца могло быть использовано против нее, в то время как регулярное посещение церкви, наоборот, считалось плюсом.
Все эти данные были прокси. В поисках ответа на вопрос о финансовой ответственности посетительницы банкир мог бы бесстрастно исследовать цифры (как некоторые образцовые банкиры, несомненно, и поступали). Но вместо этого он проводил корреляцию с расой, религией и семейными связями. Тем самым банкир избегал изучения заемщицы как конкретного человека и помещал ее в определенную группу людей – то, что специалисты по статистике называют интервалом. «Людям вроде нее», решал он, можно или нельзя доверять.
Главной заслугой Фэйра и Айзека было решение отбросить прокси и использовать релевантную финансовую информацию, например историю платежей по прошлым кредитам. Они сосредоточили свой анализ на конкретных людях, а не других, чем-то на них похожих.
Время от времени меня спрашивают, как преподавать этику специалистам по обработке данных. Я обычно начинаю с обсуждения того, как построить модель, подсчитывающую
Другими словами, составители моделей для
Разница между этими двумя вопросами огромна. Представьте себе, что ответственный человек с высокой мотивацией, но скромного иммигрантского происхождения пытается начать собственный бизнес – и он вынужден зависеть от такой системы в вопросе первоначальных вложений. Кто рискнет и даст такому человеку кредит? Уж точно не модель, основанная на подобной демографической и поведенческой информации.
Я должна признать, что в статистической вселенной, которую населяют прокси, они часто работают. Люди достаточно часто оказываются похожи на других людей из той же группы. Богачи чаще покупают круизы и БМВ. Бедняки чаще нуждаются в деньгах до зарплаты. И учитывая то, что статистические модели чаще всего работают, эффективность повышается, а прибыли растут. Инвесторы удваивают спрос на научные системы, которые размещают тысячи людей в том, что им кажется правильными интервалами. Это – триумф Больших данных.