Они приступили к работе. С точки зрения Грубера, у них подобралась идеальная команда. Чейер был инженером мирового класса, Киттлаус – великим шоуменом, а Грубер умел создавать высокотехнологичные демоверсии, приводившие в восторг зрителей. Они знали, как позиционировать свой проект и для инвесторов, и для потребителей. Они не только предвидели вопросы, которые им будут задавать во время демонстраций, но и целенаправленно работали над идеями и технологиями, которые сильнее всего привлекали публику. Внушение наблюдателю мысли о том, что будущее уже рядом, превратилось в Кремниевой долине в уникальную форму искусства, где главным было не переборщить. Обещать слишком много – прямой путь к провалу. Предыдущие попытки создать персонального помощника закончились неудачей, а Джон Скалли детально расписал идею Knowledge Navigator, который так и не появился. Когда работа над Siri уже шла полным ходом, Грубер откопал копию видео о Knowledge Navigator. После того как Apple продемонстрировала его несколько лет назад, среди разработчиков пользовательских интерфейсов развернулись горячие споры. Некоторые высказывались и продолжали высказываться против персонификации виртуальных помощников. Бен Шнейдерман и другие критики настаивали на технической и этической ущербности программных помощников. Они ратовали за то, чтобы непосредственный контроль оставался за пользователем, а принятие решений не передавалось программному слуге.
Команда Siri не уклонялась от дискуссии и вскоре после этого немного приоткрыла завесу тайны над своим проектом. Если в конце весны 2009 г. Грубер уклончиво говорил о новой технологии, то летом того же года на конференции Semantic Web он уже детально описывал, как футуристические технологии Knowledge Navigator становятся действительностью. Он акцентировал внимание на появлении сенсорных экранов и реализации так называемого жестового интерфейса, на существовании глобальной сети для совместного использования информации и сотрудничества, на разработке программ, способных взаимодействовать с людьми, на достижениях в области распознавания естественной и слитной речи. «Это большая проблема, над которой исследователи бьются уже давно, и в ее решении наметился определенный прогресс», – сказал он аудитории. Грубер также упомянул новшества, маячившие на горизонте, вроде диалога между программным агентом и человеком и устного ввода задач в компьютер. Наконец, он отметил существование проблемы доверия. В видео о Knowledge Navigator преподаватель позволял программному агенту отвечать на звонки матери. Разве это не признак доверия? Грубер надеялся, что его технология обеспечит такой же уровень взаимодействия.
После обсуждения технологий, предсказанных в видео о Knowledge Navigator, Грубер подразнил аудиторию. «Как вы считаете, такая система Knowledge Navigator возможна сегодня?» – спросил он. «Я хочу заявить, – он сделал паузу для большего эффекта, – что ответ все еще НЕТ». Аудитория разразилась смехом и взорвалась аплодисментами. Он добавил: «Но мы приближаемся к этому».
Разработчики Siri быстро обнаружили, что можно улучшить распознавание речи на основе облачных технологий. В то время они использовали не технологию Nuance SRI, а конкурирующую систему под названием Vlingo. Чейер заметил, что стоит разместить систему распознавания речи в сети, как на них обрушивается поток откликов в форме миллионов пользовательских запросов и исправлений. Иначе говоря, они получали эффективную обратную связь, позволяющую обучать и улучшать Siri.
Разработчики продолжали видеть конкурентное преимущество Siri в кардинальном отходе от доминирующей парадигмы поиска информации в сети, олицетворением которой являлась очень успешная поисковая система Google. Siri был не поисковой системой, а интеллектуальным агентом в форме виртуального помощника, способным к социальному взаимодействию с людьми. Грубер, который был также техническим директором в Siri, изложил лежащие в основе сервиса концепции в форме технических презентаций. Поиск информации, по его мнению, должен был выглядеть как разговор, а не как ввод поискового запроса. Программа должна была справляться с неоднозначностью вопросов, чтобы давать правильные ответы. Siri должен был предоставлять услуги, например подбор фильмов и ресторанов, а не контент. Для пользователя он должен стать высокоперсонализированным агентом. В начале 2010 г. команда Siri подготовила демонстрацию на iPhone для своего совета директоров. Siri еще не мог говорить, но программа умела интерпретировать речевые запросы и вести разговор, отвечая на вопросы предложениями на естественном языке, которые выводились на экран в мультяшных пузырях. Совет воспринял это с энтузиазмом и дал разработчикам дополнительное время на доработку программы.