И все тексты: все страницы всех книг, которые были и будут написаны, переведенные на все языки, существующие, забытые и инопланетные. Изложены словами разгадки всех тайн и секретов. Описания, технические схемы и формулы еще неоткрытых изобретений. Учебники, которые содержат полные сведения об устройстве вселенной. Книги судеб, в которых описано все, что произойдет с нами в будущем. Продолжать можно бесконечно.
Но, увы! В этом же пространстве находятся изображения всех видов шумов. Картины, фотографии и портреты, изуродованные всевозможными способами. Бессмысленные тексты. Теоремы, содержащие все мыслимые ошибки. И так далее.
В этом-то пространстве какая-то часть точек соответствует пейзажам.
Что можно сказать о форме этой части? Ясно, что в окрестности любой точки, изображающей пейзаж, найдется хотя бы несколько точек-пейзажей. Потому что в любое изображение пейзажа можно внести как угодно малое изменение такое, что получится тоже пейзаж. Некоторые малые изменения, например, маленький красный треугольник, создадут изображение, уже не являющееся пейзажем в строгом смысле. Если соединить линией две точки-пейзажа, и двигаться вдоль нее, то один пейзаж плавно преобразуется в другой, но не ясно, можно ли
В общем, без компьютера понять свойства множества точек-пейзажей, видимо, нельзя. И методы, перечисленные выше, позволяют кое-что увидеть в структуре этого множества. Но сначала нужно преодолеть два препятствия, что, впрочем, делается достаточно легко.
Во-первых, компьютеру нельзя предъявить математически строгое определение того, что есть пейзаж, а что – нет, потому что такого определения не существует. Но вместо этого можно показать набор картинок, которые будут служить примерами пейзажей. Чем больше такой набор, тем лучше определено, что такое пейзаж.
Вторую сложность внимательный читатель уже мог заметить. Если указанное пространство строить для яркости пикселя, то часть пространства для отрицательных яркостей не будет соответствовать никаким картинкам. Поэтому при разложении изображения пейзажа на части, эти части могут содержать отрицательные яркости, что не очень наглядно. Эта трудность обходится легко, например, вместо яркости можно использовать ее логарифм. В полученном пространстве любая конечная точка соответствует реально изображаемой картинке.
Имея набор изображений разных пейзажей, с помощью перечисленных методов любой цветовой канал каждого из этих пейзажей можно представить в виде суммы базовых картинок (одних и тех же для всех пейзажей из набора) таких, что:
• сложив попиксельно все базовые картинки, каждую со своим весом, мы получим исходный цветовой канал (веса для разных пейзажей будут разные);
• множество полученных базовых картинок будет обладать некоторыми привлекательными свойствами (для каждого примененного метода своими).
Каждый из перечисленных выше методов строит такие картинки по-своему.
Метод главных компонент дает картинки, максимально отличающиеся друг от друга и упорядоченные по «информативности». При этом основной вклад в исходное изображение вносят наиболее «информативные» картинки, соответствующие большим собственным числам (а таких сравнительно немного). Остальные картинки содержат мало информации о пейзаже и много шума. Для математиков скажу, что «максимально отличающиеся» – это значит, что скалярное произведение двух векторов-картинок равно нулю.
Метод независимых компонент дает картинки, статистически независимые друг от друга (или зависимые в минимальной степени). Такие компоненты представляют собой элементарные кусочки изображений, из которых состоит любой пейзаж. А независимость проявляется в том, что для любых двух кусочков присутствие (или отсутствие) в пейзаже одного кусочка не влияет на то, содержится ли в этом пейзаже другой кусочек. И снова малые фрагменты полученных элементарных картинок оказываются похожими на картинки, на которые настроены рецептивные поля нейронов зрительной коры человека (см. главу 1)!
Поиск проекций дает картинки, различающиеся максимальным образом в смысле некоторого критерия. Задавая этот критерий по-разному, можно получать картинки, содержащие различные яркостные или цветовые структуры, присутствующие в пейзажах.
Далее в этой главе рассмотрим основные из перечисленных способов разложения изображения на части подробнее.
5.2. Фурье-анализ