Даббала Раджагопал «Радж» Редди родился в 1937 году в деревеньке с населением в пятьсот человек к югу от Мадраса, в Индии. В то время регион страдал от семилетней засухи и последующего голода. По словам Редди, он научился писать, выводя буквы на песке. Позже он испытывал языковые трудности, когда ему приходилось переключаться с родного диалекта на английский язык – единственный язык, на котором преподавали в колледже, где профессора говорили с ирландским, шотландским и итальянским акцентами. Редди пошёл в инженерный колледж при Университете Мадраса, а после отправился на стажировку в Австралию. Именно тогда, в 1959 году, он впервые познакомился с компьютером.
Он закончил магистратуру в Университете Нового Южного Уэльса, работал три года в IBM, а затем переехал в Стэнфорд, где в итоге защитил докторскую диссертацию. У него пробудилась тяга к изучению искусственного интеллекта, и когда профессор попросил его выбрать тему исследования, он склонился к одной особенно интересной для него: распознаванию речи.
«Я выбрал именно её, потому что меня интересовали различные языки сами по себе, так как я приехал из Индии и должен был выучить три или четыре языка, – рассказывал Редди в интервью 1991 года Институту Чарльза Бэббиджа. – Речь – это то общее, что есть у человечества… Чего я не знал на тот момент, так это того, что исследование обернётся делом всей моей жизни. Я думал, это всего лишь учебный проект».
На протяжении последующих нескольких лет он пытался создать систему для распознавания отдельно произносимых слов – компьютер, который мог бы понимать слова, которые ему говорят люди. Система, которую Редди со своими коллегами создал в шестидесятых годах, по его словам, «была самой обширной из всех, которые я только знал – где-то 560 слов или около того – с приличной точностью около 92 %». Как и в случае с большинством прогрессивных компьютерных исследований, крутившихся вокруг Стэнфорда в то время, финансирование осуществлялось Управлением перспективных исследовательских проектов (ARPA). Можно отметить нарастающий интерес к области ИИ со стороны управления, которое проспонсировало в семидесятых годах огромное множество проектов по распознаванию речи. В 1969 году Редди перебрался в Университет Карнеги-Меллона и продолжил свою работу. Там, опять же при поддержке ARPA, он запустил проект Hearsay – по сути, Siri в зачаточной форме. «Забавно, что это был речевой интерфейс, – говорит Грубер. – Нечто сродни Siri. 1975 год, кажется; для тех времён что-то невероятное».
Hearsay II могла верно распознать тысячу слов английского языка и почти не делала ошибок.
«Полагаю, человеческий разум – самая интересная вещь на планете», – говорит Том Грубер. Он отправился в Университет Лойола в Новом Орлеане, где занимался изучением психологии, прежде чем обнаружил в себе склонность к компьютерной сфере, которая тогда только начала проникать в научную жизнь. Когда в университете появился синтезатор Муга, Грубер на скорую руку сделал для него компьютерный интерфейс. Также он создал систему машинного обучения, которая используется на факультете психологии Университета Лойола и по сей день. Затем Груберу попалась работа, опубликованная группой учёных из Университета Карнеги-Меллона: той самой, которую возглавлял Радж Редди.
Грубер разглядел в этой работе пробивающиеся ростки ИИ – систему распознавания речи, способную к формированию рассуждений путём логического манипулирования символами. Именно из неё десятки лет спустя вырастет Siri. Одно дело – учить компьютер распознавать звуки и сравнивать их с данными, хранящимися в базе знаний. Команда Редди пошла дальше, она пыталась выяснить, каким образом можно представить язык в компьютере так, чтобы машина могла использовать его для чего-то полезного. Для этого её нужно было научить распознавать и разбивать на куски различные части предложения.
Символьный искусственный интеллект описывает то, как человеческий разум использует символы для представления чисел и логических связей, чтобы решать как простые, так и сложные задачи.