Действительно, предположим, что в качестве второго параметра мы избрали нечто, совершенно не содержащее малейшего намека на принадлежность ребенка той или иной группе — скажем, номер квартиры, в которой он проживает. В этом случае наш график будет выглядеть следующим образом: ближе к началу координат вертикальной полосой расположатся зеленые точки, к ней будет примыкать и частично пересекаться же полоса зеленых точек. Часто будет наблюдаться такая ситуация: точка близка «своему» центру по существенному параметру — росту, но сильно удалена по значению параметра несущественного — номеру квартиры. В результате различие в расстояниях от нее до каждого из центров станет незначительным, а из-за небольшой даже разницы средних значений второго параметра в двух группах возможны неправильные отнесения. Введение второго, несущественного параметра, таким образом, ухудшает качество предсказания «Под влиянием таких параметров может происходить разнесение объектов одного класса и сближение объектов разных классов. Это явление лежит в основе так называемой „теоремы о гадком утенке“… (Ее доказательство и название принадлежит японскому ученому Ватанабэ. —
Не счесть всех постыдных поражений и глупейших конфузов, кошмарных провалов и опереточных таки ошибок, выпавших на долю тех мужественных и изобретательных людей, которые впервые взялись за внедрение методов теории распознавания образов в различных прикладных областях.
Социология, лингвистика, экономика, геология, ботаника — где только не пробовали они свои силы; как мы знаем, в фармакологии и токсикологии тоже. Их приход в каждую из этих областей встречался сначала с большим энтузиазмом, затем следовали первые результаты — и они решительно всех разочаровывали. ЭВМ, напичканная массой всяческой информации и снабженная программами, в которых реализовались мудреные алгоритмы, с трудом отличала, образно говоря, зайца от барашка (есть абхазская пословица: «Похож, как заяц на барашка») и уж полностью была бессильна в ситуациях менее очевидных, хотя все еще тривиальных с точки зрения специалистов. В шестидесятые годы, когда происходило становление теории распознавания образов, часто с эстрады звучала басня о некоем незадачливом руководящем Медведе, привыкшем подбирать кадры исключительно на основании анкеты:
При ближайшем рассмотрении обладатель анкеты оказался ослом. В этой истории, как в капле воды, отражены неприятности, подстерегающие авторов распознающих программ; в частности, сразу бросается в глаза использование малоинформативных признаков: «ноги четыре» и в особенности «уха два».
За прошедшие с тех пор два с лишним десятилетия теория распознавания образов значительно шагнула вперед, и во многих сферах использование ее методов для решения различных прикладных задач стало повседневной практикой. К сожалению, этого нельзя пока сказать о задачах выявления связи структура — активность, хотя и на этом пути достигнут определенный прогресс.
Один из важнейших уроков истории развития методов теории распознавания образов заключается, по-видимому, в выводе, что нет надежд на получение универсальных, пригодных в равной степени для всех задач методов; каждый узкий класс задач требует создания строго ориентированных процедур, учитывающих специфику задачи. Даже при исследовании проблемы связи структура — активность наметилось несколько направлений, требующих развития различных подходов в зависимости от поставленных целей и круга изучаемых соединений; при этом именно в силу специфики задачи некоторые из них выходят за традиционные рамки методов теории распознавания образов.
Рассмотрим подробнее в качестве примера так называемый логико-структурный подход к изучению связи структура — активность, развиваемый упоминавшимся А. Б. Розенблитом и В. Е. Голендером.