Лето 1966 года должно было стать летом, когда группа профессоров Массачусетского технологического института решила проблему искусственного зрения. В качестве "летних работников", которых они планировали эффективно использовать для этого проекта, выступала группа из дюжины или около того студентов-бакалавров университета. В своей записке, излагающей план проекта, профессора указали несколько конкретных навыков, которые должна была выполнять компьютерная система, разрабатываемая студентами. Она должна уметь определять различные текстуры и освещение на изображении, обозначать части изображения как передний план, а части как фон, и идентифицировать любые объекты. Один из профессоров якобы описал цели более упрощенно: "Подключить камеру к компьютеру и заставить компьютер описать то, что он видит".
Цели этого проекта не были достигнуты тем летом. Ни следующим. И многие последующие. Более того, некоторые из основных вопросов, поднятых в описании летнего проекта, остаются открытыми проблемами и по сей день. Спесь, проявленная в этом меморандуме, не удивительна для своего времени. Как уже говорилось в главе 3, 1960-е годы ознаменовались бурным ростом вычислительных возможностей и, в свою очередь, наивными надеждами на автоматизацию даже самых сложных задач. Компьютеры теперь могли делать все, что от них требовалось, нужно было только знать, о чем просить. А если речь идет о чем-то столь простом и непосредственном, как зрение, насколько это сложно?
Ответ очень сложен. Процесс обработки зрительного сигнала - восприятия света глазами и осмысления отраженного в нем внешнего мира - чрезвычайно сложен. Распространенные поговорки вроде "прямо перед глазами" или "на виду", которые используются для обозначения легкости зрения, обманчивы. Они затушевывают значительные трудности, с которыми сталкивается мозг при восприятии даже самых простых зрительных объектов. Любое чувство легкости, которое мы испытываем в отношении зрения, - это иллюзия, с трудом завоеванная миллионами лет эволюции.
Проблема зрения - это проблема обратной инженерии. В задней части глаза, в сетчатке, широкий плоский лист клеток, называемых фоторецепторами. Эти клетки чувствительны к свету. Каждая из них указывает на наличие или отсутствие (и, возможно, длину волны) света, попадающего на нее в каждый момент времени, посылая сигнал в виде электрической активности. Эта двумерная мерцающая карта клеточной активности - единственная информация, на основе которой мозг может воссоздать трехмерный мир перед собой.
Даже такое простое дело, как поиск стула в комнате, представляет собой технически сложную задачу. Стулья могут быть самых разных форм и цветов. Они также могут находиться рядом или далеко, что делает их отражение на сетчатке глаза больше или меньше. Светло в комнате или темно? С какого направления падает свет? Кресло повернуто к вам или от вас? Все эти факторы влияют на то, как именно фотоны света попадают на сетчатку. Но триллионы различных световых картин в итоге могут означать одно и то же: стул на месте. Зрительная система каким-то образом находит способ решить эту проблему сопоставления многих и одного менее чем за десятую долю секунды.
В то время, когда студенты Массачусетского технологического института работали над тем, чтобы подарить зрение компьютерам, физиологи использовали свои собственные инструменты, чтобы разгадать тайны зрения. Началось все с регистрации нейронной активности сетчатки глаза, а затем нейроны перешли к нейронам всего мозга. Поскольку, по оценкам, 30 процентов коры головного мозга приматов играет ту или иную роль в обработке зрительных сигналов, это было немалым делом.2В середине XX века многие ученые, проводившие эти эксперименты, базировались в Бостоне (многие в самом Массачусетском технологическом институте или чуть севернее, в Гарварде), и у них быстро накапливался большой объем данных, которые нужно было как-то осмыслить.
Возможно, дело в физической близости. Возможно, это было молчаливое признание огромной задачи, которую каждый из них поставил перед собой. Возможно, на первых порах сообщества были слишком малы, чтобы держаться в тени. Какова бы ни была причина, неврологи и компьютерные ученые долгое время сотрудничали в попытках понять фундаментальные вопросы зрения. Изучение зрения - того, как можно найти закономерности в световых точках, - наполнено прямым влиянием биологического на искусственное и наоборот. Гармония, возможно, не была постоянной: когда компьютерная наука начала использовать методы, которые были полезны, но не напоминали мозг, области разошлись. А когда нейробиологи вникали в мельчайшие детали клеток, химических веществ и белков, обеспечивающих биологическое зрение, компьютерщики в основном отворачивались. Но последствия взаимного влияния по-прежнему неоспоримы и хорошо видны в самых современных моделях и технологиях.
* * *