Читаем Ю полностью

Поясним ее суть. Коль скоро мы ставим перед собой задачу распознавания ситуации, то мы вынуждены ее фиксировать на некоторый момент времени. В результате для системы распознавания она представляет собой состояние, характеризующееся некоторым набором признаков. Задача состоит в том, чтобы это состояние было привязано к существующей модели, в большинстве случаев предстающей в виде набора связанных функциональными и логическими отношениями дискретных состояний системы. То есть, вектор текущего состояния системы в результате поочередного сравнения с состояниями, помещенными в узлах модели (эталонами), должно быть классифицирован и отнесен к некоторой «окрестности» узла. Задача сложная, даже если представить себе, что анализу подвергается поток сообщений, релевантных тематике исследования.

Соответственно, границы каждого состояния, зафиксированного в модели, должны быть некоторым образом описаны, что крайне сложно сделать без четких критериев (особенно, если значения многих параметров описываются терминами естественного языка). Должны существовать критерии, которые позволили бы определить где в данном конкретном случае пролегает граница между «много» и «мало» и методы, с помощью которых эти слова приобретают свойства терминов, с заданной точностью описывающих значение параметра.

Почему мы все время вращаемся вокруг проблем, связанных с использованием естественного языка? — Это легко объяснить: аналитика практически никогда не имеет дела с чисто техническими феноменами (хотя там тоже следует выделять некие границы критических состояний). В результате многие сведения о системе представляются в виде лингвистических переменных — именно таких переменных, относительно значения которых существует лишь некая оценка, полученная либо в результате предварительно проведенного анализа значения представительной выборки сходных высказываний о феноменах, подобных рассматриваемому, либо в результате экспертного опроса ограниченной группы экспертов, чей опыт полагается гарантией точности. Соответственно, при появлении на входе системы анализа слова «несколько» можно с некоторой вероятностью утверждать, что это слово соответствует значению, лежащему в пределах диапазона от четырех до десяти (но этот пример достаточно прост, и поэтому он создает иллюзию легкости, с которой может быть определены квантитативные параметры для каждого слова естественного языка).

Это означает, что система не только должна располагать иерархически организованным тезаурусом, но и набором метрик, обеспечивающих возможность сравнения однотипных феноменов, описываемых различными наборами терминов. Существует два полярных подхода к введению границ значения — аналитический (о котором мы только что говорили) и директивный, когда аксиомы формулируются по произволу некоторого лица. Логическое обоснование этих аксиом невозможно, однако существует возможность логическими средствами определить целостность и непротиворечивость предложенной системы. Между этими полюсами лежит множество альтернативных подходов — от синтеза дискретных шкал, маркированных терминами, до адаптивных алгоритмов коррекции системы аксиоматических утверждений, на начальном этапе установленных по произволу, а далее — настраиваемой (обучаемой) тестовыми последовательностями.

А как быть в случае, когда осуществление метризации не представляется возможным, а потребность в фиксации факта смены состояния все-таки существует? — Одним из путей является переход от терминов, с той или иной точностью обозначающих качество или количество (а значит, обладающих некоторой метрикой и точностью), к терминам, которые могут принимать только значения «истина» или «ложь», к числу которых могут быть отнесены термины, выполняющие предикативные функции (отглагольные существительные, глаголы, причастия, деепричастия и соответствующие концепты, выражающие их сущность). Точность описания состояния снижается, однако вероятность пребывания системы в определяемом такими терминами состоянии оказывается значительно выше.

В результате ситуация будет описываться моделью, в которой будут присутствовать предикативные цепочки и идентификаторы объектов, либо классов объектов. Такая модель может быть приведена к наивысшей степени абстракции (концепты предикатов плюс идентификаторы классов) либо детализирована с тем, чтобы обеспечивалась необходимая точность распознавания. Проблема определения множества терминов, обладающих высокой информативностью (обеспечивающих высокую избирательность распознающей системы) зачастую решается эвристическими методами, хотя при условии частой повторяемости феномена словарь может быть сформирован с применением аппарата математической статистики (анализа тех же частотноранговых распределений, но уже для других классов терминов).

Перейти на страницу:

Похожие книги

Эволюция Вселенной и происхождение жизни
Эволюция Вселенной и происхождение жизни

Сэр Исаак Ньютон сказал по поводу открытий знаменитую фразу: «Если я видел дальше других, то потому, что стоял на плечах гигантов».«Эволюция Вселенной и происхождение жизни — описывает восхождение на эти метафорические плечи, проделанное величайшими учеными, а также увлекательные детали биографии этих мыслителей. Впервые с помощью одной книги читатель может совершить путешествие по истории Вселенной, какой она представлялась на всем пути познания ее природы человеком. Эта книга охватывает всю науку о нашем происхождении — от субатомных частиц к белковым цепочкам, формирующим жизнь, и далее, расширяя масштаб до Вселенной в целом.«Эволюция Вселенной и происхождение жизни» включает в себя широкий диапазон знаний — от астрономии и физики до химии и биологии. Богатый иллюстративный материал облегчает понимание как фундаментальных, так и современных научных концепций. Текст не перегружен терминами и формулами и прекрасно подходит для всех интересующихся наукой и се историей.

Пекка Теерикор , Пекка Теерикорпи

Научная литература / Физика / Биология / Прочая научная литература / Образование и наука
Юрий Олеша и Всеволод Мейерхольд в работе над спектаклем «Список благодеяний»
Юрий Олеша и Всеволод Мейерхольд в работе над спектаклем «Список благодеяний»

Работа над пьесой и спектаклем «Список благодеяний» Ю. Олеши и Вс. Мейерхольда пришлась на годы «великого перелома» (1929–1931). В книге рассказана история замысла Олеши и многочисленные цензурные приключения вещи, в результате которых смысл пьесы существенно изменился. Важнейшую часть книги составляют обнаруженные в архиве Олеши черновые варианты и ранняя редакция «Списка» (первоначально «Исповедь»), а также уникальные материалы архива Мейерхольда, дающие возможность оценить новаторство его режиссерской технологии. Публикуются также стенограммы общественных диспутов вокруг «Списка благодеяний», накал которых сравним со спорами в связи с «Днями Турбиных» М. А. Булгакова во МХАТе. Совместная работа двух замечательных художников позволяет автору коснуться ряда центральных мировоззренческих вопросов российской интеллигенции на рубеже эпох.

Виолетта Владимировна Гудкова

Драматургия / Критика / Научная литература / Стихи и поэзия / Документальное
6000 изобретений XX и XXI веков, изменившие мир
6000 изобретений XX и XXI веков, изменившие мир

Данное издание представляет собой энциклопедию изобретений и инноваций, сделанных в XX и XXI веках. Точные даты, имена ученых и новаторов и названия изобретений дадут полное представление о том, какой огромный скачок человечество сделало за 110 лет. В этой энциклопедии читатель найдет год и имя изобретателя практически любой вещи, определившей привычный бытовой уклад современного человека. В статьях от «конвейерного автомобилестроения» до «фторографен» раскрыты тайны изобретений таких вещей, как боксерские шорты, памперсы, плюшевый медвежонок, целлофан, шариковый дезодорант, титан, акваланг, компьютерная мышь и многое другое, без чего просто немыслима сегодняшняя жизнь.Все изобретения, сделанные в период с 1901 по 2010 год, отсортированы по десятилетиям, годам и расположены в алфавитном порядке, что делает поиск интересующей статьи очень легким и быстрым.

Юрий Иосифович Рылёв

Научная литература / Прочая научная литература / Образование и наука
Она смеётся, как мать. Могущество и причуды наследственности
Она смеётся, как мать. Могущество и причуды наследственности

Книга о наследственности и человеческом наследии в самом широком смысле. Речь идет не просто о последовательности нуклеотидов в ядерной ДНК. На то, что родители передают детям, влияет целое множество факторов: и митохондриальная ДНК, и изменяющие активность генов эпигенетические метки, и симбиотические микроорганизмы…И культура, и традиции, география и экономика, технологии и то, в каком состоянии мы оставим планету, наконец. По мере развития науки появляется все больше способов вмешиваться в разные формы наследственности, что открывает потрясающие возможности, но одновременно ставит новые проблемы.Технология CRISPR-Cas9, используемая для редактирования генома, генный драйв и создание яйцеклетки и сперматозоида из клеток кожи – список открытий растет с каждым днем, давая достаточно поводов для оптимизма… или беспокойства. В любом случае прежним мир уже не будет.Карл Циммер знаменит своим умением рассказывать понятно. В этой важнейшей книге, которая основана на самых последних исследованиях и научных прорывах, автор снова доказал свое звание одного из лучших научных журналистов в мире.

Карл Циммер

Научная литература