Читаем Аналитика полностью

Почему мы все время вращаемся вокруг проблем, связанных с использованием естественного языка? — Это легко объяснить: аналитика практически никогда не имеет дела с чисто техническими феноменами (хотя там тоже следует выделять некие границы критических состояний). В результате многие сведения о системе представляются в виде лингвистических переменных — именно таких переменных, относительно значения которых существует лишь некая оценка, полученная либо в результате предварительно проведенного анализа значения представительной выборки сходных высказываний о феноменах, подобных рассматриваемому, либо в результате экспертного опроса ограниченной группы экспертов, чей опыт полагается гарантией точности. Соответственно, при появлении на входе системы анализа слова «несколько» можно с некоторой вероятностью утверждать, что это слово соответствует значению, лежащему в пределах диапазона от четырех до десяти (но этот пример достаточно прост, и поэтому он создает иллюзию легкости, с которой может быть определены квантитативные параметры для каждого слова естественного языка).

Это означает, что система не только должна располагать иерархически организованным тезаурусом, но и набором метрик, обеспечивающих возможность сравнения однотипных феноменов, описываемых различными наборами терминов. Существует два полярных подхода к введению границ значения —аналитический (о котором мы только что говорили) и директивный, когда аксиомы формулируются по произволу некоторого лица. Логическое обоснование этих аксиом невозможно, однако существует возможность логическими средствами определить целостность и непротиворечивость предложенной системы. Между этими полюсами лежит множество альтернативных подходов — от синтеза дискретных шкал, маркированных терминами, до адаптивных алгоритмов коррекции системы аксиоматических утверждений, на начальном этапе установленных по произволу, а далее — настраиваемой (обучаемой) тестовыми последовательностями.

А как быть в случае, когда осуществление метризации не представляется возможным, а потребность в фиксации факта смены состояния все-таки существует? — Одним из путей является переход от терминов, с той или иной точностью обозначающих качество или количество (а значит, обладающих некоторой метрикой и точностью), к терминам, которые могут принимать только значения «истина» или «ложь», к числу которых могут быть отнесены термины, выполняющие предикативные функции (отглагольные существительные, глаголы, причастия, деепричастия и соответствующие концепты, выражающие их сущность). Точность описания состояния снижается, однако вероятность пребывания системы в определяемом такими терминами состоянии оказывается значительно выше.

В результате ситуация будет описываться моделью, в которой будут присутствовать предикативные цепочки и идентификаторы объектов, либо классов объектов. Такая модель может быть приведена к наивысшей степени абстракции (концепты предикатов плюс идентификаторы классов) либо детализирована с тем, чтобы обеспечивалась необходимая точность распознавания. Проблема определения множества терминов, обладающих высокой информативностью (обеспечивающих высокую избирательность распознающей системы) зачастую решается эвристическими методами, хотя при условии частой повторяемости феномена словарь может быть сформирован с применением аппарата математической статистики (анализа тех же частотноранговых распределений, но уже для других классов терминов).

Один из вариантов реализации такого подхода — некоторое подобие CRA-карт (см. предыдущий пункт), но построенных в терминах более высокого уровня абстракции. Очевидным недостатком характерного для CRA-карт способа отображения является то, что он указывает лишь на наличие связи (по сути — предиката, выражающего некоторое отношение между идентификаторами объектов и классов объектов). Вероятно, над дугами следовало бы указывать тип отношения (предикат, его выражающий), однако число предикатов может оказаться достаточно большим для того, чтобы их можно было отобразить. Еще один, менее явный, недостаток заключается в том, что эти отношения не развернуты в пространстве-времени. Модель ситуации, отображаемая с помощью CRA-карты (и ее усовершенствованного аналога), не будет обладать избирательностью по отношению к временному аспекту существования системы, и вследствие этого будет иметь исключительно интегральный характер. Перечисленные недостатки не мешают применению таких методов для синтеза словарей, однако, при попытке перенести их на задачи распознавания ситуаций, эти недостатки становятся уже ощутимыми — ведь ситуация — это некоторое состояние, привязанное к «временным координатам».

Перейти на страницу:

Похожие книги

Биология добра и зла. Как наука объясняет наши поступки
Биология добра и зла. Как наука объясняет наши поступки

Как говорит знаменитый приматолог и нейробиолог Роберт Сапольски, если вы хотите понять поведение человека и природу хорошего или плохого поступка, вам придется разобраться буквально во всем – и в том, что происходило за секунду до него, и в том, что было миллионы лет назад. В книге автор поэтапно – можно сказать, в хронологическом разрезе – и очень подробно рассматривает огромное количество факторов, влияющих на наше поведение. Как работает наш мозг? За что отвечает миндалина, а за что нам стоит благодарить лобную кору? Что «ненавидит» островок? Почему у лондонских таксистов увеличен гиппокамп? Как связаны длины указательного и безымянного пальцев и количество внутриутробного тестостерона? Чем с точки зрения нейробиологии подростки отличаются от детей и взрослых? Бывают ли «чистые» альтруисты? В чем разница между прощением и примирением? Существует ли свобода воли? Как сложные социальные связи влияют на наше поведение и принятие решений? И это лишь малая часть вопросов, рассматриваемых в масштабной работе известного ученого.

Роберт Сапольски

Научная литература / Биология / Образование и наука
Эволюция: Триумф идеи
Эволюция: Триумф идеи

Один из лучших научных журналистов нашего времени со свойственными ему основательностью, доходчивостью и неизменным СЋРјРѕСЂРѕРј дает полный РѕР±Р·ор теории эволюции Чарльза Дарвина в свете сегодняшних представлений. Что стояло за идеями великого человека, мучительно прокладывавшего путь новых знаний в консервативном обществе? Почему по сей день не прекращаются СЃРїРѕСЂС‹ о происхождении жизни и человека на Земле? Как биологи-эволюционисты выдвигают и проверяют СЃРІРѕРё гипотезы и почему категорически не РјРѕРіСѓС' согласиться с доводами креационистов? Р' поисках ответа на эти РІРѕРїСЂРѕСЃС‹ читатель делает множество поразительных открытий о жизни животных, птиц и насекомых, заставляющих задуматься о людских нравах и Р­РўР

Карл Циммер

Научная литература / Биология / Образование и наука
Бог как иллюзия
Бог как иллюзия

Ричард Докинз — выдающийся британский ученый-этолог и популяризатор науки, лауреат многих литературных и научных премий. Каждая новая книга Докинза становится бестселлером и вызывает бурные дискуссии. Его работы сыграли огромную роль в возрождении интереса к научным книгам, адресованным широкой читательской аудитории. Однако Докинз — не только автор теории мемов и страстный сторонник дарвиновской теории эволюции, но и не менее страстный атеист и материалист. В книге «Бог как иллюзия» он проявляет талант блестящего полемиста, обращаясь к острейшим и актуальнейшим проблемам современного мира. После выхода этой работы, сегодня уже переведенной на многие языки, Докинз был признан автором 2006 года по версии Reader's Digest и обрел целую армию восторженных поклонников и непримиримых противников. Споры не затихают. «Эту книгу обязан прочитать каждый», — считает британский журнал The Economist.

Ричард Докинз

Научная литература