Читаем Ю полностью

Допустим, что некое СМИ отслеживает события, влияющие на финансовую ситуацию в США. Вполне вероятно, что, используя технологию отбора по ключевым словам, такое СМИ упустило бы из вида первые оперативные сообщения о террористической атаке на здания Всемирного Торгового Центра. Действительно, совершенно не очевидно, что слова «захват» и «авиалайнер» должны присутствовать в перечне ключевых слов автоматизированной системы отбора сообщений, релевантных финансовой тематике. Упоминания же о возможности наступления финансовых последствий для США (в которых наиболее вероятно появление «финансовой» терминологии) в связи с этими событиями появились значительно позже — в аналитических сообщениях. Используя же технологию пополнения словаря на основе анализа частотно-ранговых распределений слов и устойчивых словосочетаний, такое СМИ могло бы быстро отреагировать на изменение информационной обстановки (прежде, чем аналитик позаботится о внесении ключевого слова в словарь и снабдит его соответствующей интерпретантой).

Результат работы системы, использующей анализ потока сообщений для выявления повестки дня СМИ, может быть продемонстрирован на примере фрагмента карты семантических отношений для событий 11.09.2002.

Представленная на приводимом ниже рисунке карта семантических

120

отношений получена с применением подхода, реализованного специалистами из Лаборатории по исследованию проблем организации, коммуникации и познания (LOCKS) при университете штата Аризона (Arizona State University, США). Подход получил наименование Centering Resonance Analysis (CRA), основан на применении статистического аппарата для анализа интенсивности откликов прессы. Он позволяет выделить термины, релевантные основной тематике сообщений, и семантические связи между ними на основе анализа частотно-рангового распределения как отдельных слов, так и их устойчивых сочетаний.

Степень актуальности той или иной темы определяется частотой упоминания терминов, описывающих ее, при этом может быть задано ядро семантической сети, вокруг которого в некотором диапазоне частот размещаются термины, связанные с ним и релевантные тематике сообщений.

Как видим, метод CRA позволяет выделить основные слова, служащие для обозначения основных объектов внимания прессы, отследить семантические связи между ними и степень устойчивости этих связей. А значит, локализовать ту предметную область, в которой происходят значимые или целенаправленно акцентируемые события, перенастроить словари, используемые для осуществления фильтрации сообщений.

Использование аналогичных методов на этапе формирования словаря позволяет придать словарям ключевых слов динамические свойства, обеспечить их релевантность текущей ситуации. Кроме того, могут быть активизированы именно те группы эталонов, которые могут попасть в рабочее подмножество в ходе дальнейшего развития ситуации. То есть, может быть сокращена размерность задачи перебора массива эталонных моделей и предварительно определен уровень детализации эталонных описаний, который, скорее всего, будет превышен в ходе дальнейшего освещения в источниках развития ситуации.

Заметим, что свое применение методы управления поисковыми и «ключевыми» словарями на основе анализа статистических распределений могут найти не только в секторе СМИ, служб мониторинга социальнополитической, криминальной и военной обстановки, но и при проведении масштабных научных исследований, а также в бизнесе и финансовоэкономической сфере. Одним из очевидных приложений является анализ эффективности рекламных кампаний и иные задачи, сопряженные с анализом больших массивов текстовой информации. Некоторые элементы такой технологии могут быть использованы при выработке направлений инновационной политики при проведении анкетирования сотрудников предприятия (как это делается на японских предприятиях, когда работникам предлагается в свободной форме высказывать предложения и пожелания по совершенствованию системы управления и технологического процесса).

ФИКСАЦИЯ ГРАНИЦ РАСПОЗНАВАЕМЫХ СОСТОЯНИЙ

Казалось бы, дело сделано... После того, как сформированы эталонные модели и реализован алгоритм автоматического выделения текущих векторов признаков, задача распознавания ситуации решается относительно просто — методом сравнения текущей ситуации (вернее, ее вектора признаков) с эталоном. Однако и здесь есть проблема...

Перейти на страницу:

Похожие книги

Эволюция Вселенной и происхождение жизни
Эволюция Вселенной и происхождение жизни

Сэр Исаак Ньютон сказал по поводу открытий знаменитую фразу: «Если я видел дальше других, то потому, что стоял на плечах гигантов».«Эволюция Вселенной и происхождение жизни — описывает восхождение на эти метафорические плечи, проделанное величайшими учеными, а также увлекательные детали биографии этих мыслителей. Впервые с помощью одной книги читатель может совершить путешествие по истории Вселенной, какой она представлялась на всем пути познания ее природы человеком. Эта книга охватывает всю науку о нашем происхождении — от субатомных частиц к белковым цепочкам, формирующим жизнь, и далее, расширяя масштаб до Вселенной в целом.«Эволюция Вселенной и происхождение жизни» включает в себя широкий диапазон знаний — от астрономии и физики до химии и биологии. Богатый иллюстративный материал облегчает понимание как фундаментальных, так и современных научных концепций. Текст не перегружен терминами и формулами и прекрасно подходит для всех интересующихся наукой и се историей.

Пекка Теерикор , Пекка Теерикорпи

Научная литература / Физика / Биология / Прочая научная литература / Образование и наука
Юрий Олеша и Всеволод Мейерхольд в работе над спектаклем «Список благодеяний»
Юрий Олеша и Всеволод Мейерхольд в работе над спектаклем «Список благодеяний»

Работа над пьесой и спектаклем «Список благодеяний» Ю. Олеши и Вс. Мейерхольда пришлась на годы «великого перелома» (1929–1931). В книге рассказана история замысла Олеши и многочисленные цензурные приключения вещи, в результате которых смысл пьесы существенно изменился. Важнейшую часть книги составляют обнаруженные в архиве Олеши черновые варианты и ранняя редакция «Списка» (первоначально «Исповедь»), а также уникальные материалы архива Мейерхольда, дающие возможность оценить новаторство его режиссерской технологии. Публикуются также стенограммы общественных диспутов вокруг «Списка благодеяний», накал которых сравним со спорами в связи с «Днями Турбиных» М. А. Булгакова во МХАТе. Совместная работа двух замечательных художников позволяет автору коснуться ряда центральных мировоззренческих вопросов российской интеллигенции на рубеже эпох.

Виолетта Владимировна Гудкова

Драматургия / Критика / Научная литература / Стихи и поэзия / Документальное
6000 изобретений XX и XXI веков, изменившие мир
6000 изобретений XX и XXI веков, изменившие мир

Данное издание представляет собой энциклопедию изобретений и инноваций, сделанных в XX и XXI веках. Точные даты, имена ученых и новаторов и названия изобретений дадут полное представление о том, какой огромный скачок человечество сделало за 110 лет. В этой энциклопедии читатель найдет год и имя изобретателя практически любой вещи, определившей привычный бытовой уклад современного человека. В статьях от «конвейерного автомобилестроения» до «фторографен» раскрыты тайны изобретений таких вещей, как боксерские шорты, памперсы, плюшевый медвежонок, целлофан, шариковый дезодорант, титан, акваланг, компьютерная мышь и многое другое, без чего просто немыслима сегодняшняя жизнь.Все изобретения, сделанные в период с 1901 по 2010 год, отсортированы по десятилетиям, годам и расположены в алфавитном порядке, что делает поиск интересующей статьи очень легким и быстрым.

Юрий Иосифович Рылёв

Научная литература / Прочая научная литература / Образование и наука
Она смеётся, как мать. Могущество и причуды наследственности
Она смеётся, как мать. Могущество и причуды наследственности

Книга о наследственности и человеческом наследии в самом широком смысле. Речь идет не просто о последовательности нуклеотидов в ядерной ДНК. На то, что родители передают детям, влияет целое множество факторов: и митохондриальная ДНК, и изменяющие активность генов эпигенетические метки, и симбиотические микроорганизмы…И культура, и традиции, география и экономика, технологии и то, в каком состоянии мы оставим планету, наконец. По мере развития науки появляется все больше способов вмешиваться в разные формы наследственности, что открывает потрясающие возможности, но одновременно ставит новые проблемы.Технология CRISPR-Cas9, используемая для редактирования генома, генный драйв и создание яйцеклетки и сперматозоида из клеток кожи – список открытий растет с каждым днем, давая достаточно поводов для оптимизма… или беспокойства. В любом случае прежним мир уже не будет.Карл Циммер знаменит своим умением рассказывать понятно. В этой важнейшей книге, которая основана на самых последних исследованиях и научных прорывах, автор снова доказал свое звание одного из лучших научных журналистов в мире.

Карл Циммер

Научная литература