Банды киберпреступников начали создавать сайты с порнографией{97}
. Сами сайты были бесплатными – не нужно было ни регистрироваться, ни становиться членами сообщества. Все, что требовалось, – ввести несколько CAPTCHA, для того чтобы увидеть следующее изображение или видео. Схема была простой и гениальной. CAPTCHA брались с тех самых сайтов, которые преступники жаждали взломать. Как только их робот наталкивался на узкое место, связанное с CAPTCHA, он брал картинку с непонятным словом и размещал ее на заставке своего порносайта. На некоторых из этих сайтов даже существовало подобие контроля качества – они брали одну и ту же картинку CAPTCHA и показывали ее пяти различным охотникам за порно. Ответ считался правильным только тогда, когда все пять людей давали один и тот же ответ. По некоторым расчетам, на пике борьбы между порно и CAPTCHA за каждую пару минут ничего не подозревавшие и отлично мотивированные пользователи порносайтов решали до нескольких тысяч CAPTCHA. Такое решение позволило преодолеть узкое место. Причем оно актуально и сейчас – вне зависимости от того, насколько сложную CAPTCHA вы сделали, всегда найдется достаточно мотивированный человек, желающий бесплатно разгадать ее содержимое.В этой битве добра со злом, появлением узких мест и их преодолением CAPTCHA продолжают развиваться и расширять границы человеческих способностей к вычислению. Ирония судьбы в том, что человек, ответственный за создание одного из мощнейших крупнейших узких мест в борьбе с киберпреступностью, Луис фон Ан, поменял круг своих интересов (возможно, руководствуясь чувством вины?) и занялся решением проблемы узкого места в совершенно иной области – оцифровкой старых книг.
Если вы еще не поняли, Луис фон Ан любит разгадывать головоломки. После того как CAPTCHA начал появляться практически повсеместно, он заметил, что и другие люди готовы заниматься этой малоосмысленной работой. Можно ли было найти их усилиям лучшее применение? Ежедневно заполняется свыше 200 миллионов CAPTCHA – иными словами, на разгадку этих головоломок ежедневно тратится свыше 150 тысяч человеко-часов{98}
. Можно ли было объединить разгадку всех этих небольших головоломок в нечто единое, позволявшее достичь более масштабной цели? Именно из этого желания и родился проект reCAPTCHA.Перед тем как перейти к рассказу о reCAPTCHA, давайте немного поговорим о проблемах, с которыми сталкиваются компьютеры в попытках прочитать написанное или напечатанное слово. В течение нескольких прошлых десятилетий компьютерные системы научились с довольно высокой эффективностью распознавать напечатанные слова в чистых электронных документах. Но как быть со старыми бумажными документами и книгами, испачканными кофейными пятнами, пестрящими зачеркиваниями и помарками или просто плохо напечатанными? В таких условиях программы оказываются менее надежными, а результат распознавания выглядит полной чепухой. Рано или поздно в процесс должен вмешаться человек, изучить страницу и понять, что написано на ней на самом деле. И вот тут на сцене появляются Луис фон Ан и reCAPTCHA.
Вместо полностью выдуманных текстовых головоломок reCAPTCHA просит пользователя ввести свой вариант для двух коряво написанных слов – для одного из них сайт знает правильный ответ, а другое представляет собой изображение слова из старой книги. Пользователи не знают, какое из двух слов фальшивое, а какое – правильное, поэтому изо всех сил пытаются разгадать оба. Затем reCAPTCHA собирает данные и проводит перекрестное сравнение версий слов из старых отсканированных книг, предложенных разными пользователями. Если определенный вариант ввело достаточное количество людей, то ура! Вы только что помогли сохранить историю, превратив старый шедевр в цифровой документ, который может жить вечно.
reCAPTCHA делает и еще один шаг вперед. Программа дает вам возможность не только изучить слово визуально, но и послушать немного искаженное аудио и записать услышанные вами слова. Это сделало концепцию CAPTCHA применимой для работы людей, имеющих проблемы со зрением (в рамках концепции reCAPTCHA), а также создало возможность для превращения старых записей в электронные документы.
Технология reCAPTCHA стала настоящим прорывом. Она позволила избавиться от узкого места в процессе оцифровки документов и записей неидеального качества. В наши дни reCAPTCHA позволяет решить более 30 миллионов головоломок в день, и с ее помощью уже оцифрованы миллионы старых книг и документов. Она быстро привлекла внимание Google – ключевого игрока на рынке оцифровки книг, и в 2009 году интернет-джаггернаут приобрел компанию – производителя reCAPTCHA.
Преодоление узких мест носит трансформационный характер. Самая главная задача состоит в том, чтобы определить, где находится узкое место, и творчески проложить новый путь вокруг него (желательно при этом не связавшись с порнобизнесом).
Эрозия