Читаем Итоги № 36 (2013) полностью

— Я взял телефонный справочник Академии наук, звонил в каждый институт и предлагал программу-переводчик — словарь Lingvo за 700 рублей. Вначале меня слушали, а к концу первого бизнес-года в каждом третьем месте, куда мы звонили, отвечали, что у нас уже есть Lingvo и не надо нам говорить, что вы ее разработали. Украли, наверное, и пытаетесь продать. Нам, конечно, льстило, что программой уже пользуются… И еще мы поняли, что словарь словарем, а источник того, что надо переводить, — на бумаге. И человеку без знания английского языка достаточно сложно набрать на клавиатуре текст для перевода. Вот было бы здорово сделать всеобъемлющий продукт — от бумажного листа на одном языке до бумажного листа на другом языке! Скажем, вставляешь в сканер книжку на английском языке, нажимаешь несколько кнопок на компьютере, и из принтера выходит книга, распечатанная на русском. Это была мечта. Но мы попытались ее реализовать.

— Каким образом?

— Объединили четыре программы, три из которых лицензировали у других производителей. Первая — программа сканирования. Вторая — корректор, проверяла орфографические ошибки после сканирования. Еще одна не наша программа делала подстрочник, и, наконец, четвертая — собственно Lingvo. С ее помощью можно было сделать нормальный перевод. Весь этот комплекс мы назвали Lingvo Systems, и он начал продаваться еще лучше. В разы. И стоил в разы дороже.

Однако вскоре мы поняли, что качество работы распознавалки текстов нас не устраивает. Константин Анисимович, один из авторов Lingvo, предложил сделать свою распознавалку. Первая реакция была: ты сошел с ума — целые научные школы занимаются этим десятки лет. Но он объяснил, как это сделать лучше: программу не надо будет учить каждому новому шрифту. Ведь тогда, прежде чем распознать, скажем, «Войну и мир», нужно первые десять страниц обработать в режиме обучения системы. Но если где-то в середине встретится что-то напечатанное другим шрифтом, программа опять этого не поймет, вновь придется обучать. А наша будет понимать все шрифты сразу. И мы решили такую программу сделать. Начали проект в 1992 году, а в 1993-м выпустили первый продукт. И в первый день продали 40 коробок с ПО FineReader, а за первый месяц — 800! Это было просто немыслимо по тем временам.

Теперь-то у нас лучшие ученые в компании работают, и тот первый FineReader 1993 года не идет ни в какое сравнение с сегодняшним. Сегодня, если взять листок с текстом, программа его не просто распознает, но и сверстает в точно таком же виде в формате файла pdf с такими же картинками, такими же заголовками и т. д. Но в 1993 году это был прорыв.

И еще одна новинка, которую мы тогда реализовали: мы научились отличать русскую букву «р» от латинской буквы p, буквы «о» английские и русские, заглавные и строчные, а также цифру 0. Эти пять символов, хотя и выглядят одинаково, имеют совершенно разные коды для использования в компьютерных программах.

— Долго почивали на лаврах лучшей распознавалки?

— Это не совсем так. В первой версии мы уступали конкурентам по точности распознавания. Но зато она умела распознавать двуязычные тексты, и ее не надо было обучать. И в тот момент это оказалось важнее. К 1995—1997-м годам программа начала побеждать не только в России, но и в Америке, и в Европе на английских текстах. Тогда мы приняли решение о выходе на зарубежный рынок и ребрендинге компании. Мы стали называться ABBYY.

— Давид, а что было в это время с учебой?

— Вся эта история началась на летних каникулах после четвертого курса. И пятый курс я проучился, почти не посещая институт. Мой шеф Гантмахер был очень недоволен. Он сказал: «Давид, вам надо определиться». Я пришел в деканат и попросил академический отпуск, обещая, что завершу за год историю с Lingvo и защищу диплом. Прозорливый декан сказал: «Вы за год ничего не закончите. Не надо себя обманывать. Мы вас отчислим, а когда завершите свои дела, приходите, восстановим». Он сдержал слово, меня отчислили в 1990 году. Через два года я понял, что появилось время для продолжения занятий в вузе, и вернулся в институт защитить диплом.

— По физике?

— Нет, по математике. Тот самый язык описания словарей, который начался с первых пяти страничек, лег в основу диплома. А кандидатскую диссертацию по физматнаукам я защитил по рукописному распознаванию. Тоже в МФТИ. С одной стороны, я бросил физику. С другой стороны, меня радует, что мы все не бросили науку. То, что делаем, как выяснилось, это серьезная наука, которая называется Computer Science и Artificial Intelligence (искусственный интеллект). Распознавание, семантика текстов — это сегодня очень горячие темы.

— Вы сами к этому пришли или рядом оказался кто-то из научной среды?

— Сами. Руководит разработками по-прежнему Костя Анисимович. Возглавляет компанию Сергей Андреев. Они пришли в компанию в 1990—1991 годах.

Перейти на страницу:
Нет соединения с сервером, попробуйте зайти чуть позже