Читаем Аналитика: методология, технология и организация полностью

I /К 1 задач (классы задач по уровню структурной организации информации на входе/выходе):

1. Задачи преобразования неструктурированного ЕЯ-текста в ЕЯ-текст с разбиением на рубрики;

2. Задачи преобразования ЕЯ-текста с разбиением на рубрики в структурированный ЕЯ текст с элементами логического формализма;

3. Задачи преобразования структурированного ЕЯ текста с элементами логического формализма в символьную модель, использующую формализм теории графов с ЕЯ-маркировкой вершин (узлов) и связей (дуг);

4. Задачи преобразования символьной модели, использующей формализм теории графов с ЕЯ-маркировкой вершин (узлов) и связей (дуг), в символьную модель, использующую формализм теории графов с ИЯ-маркировкой вершин (узлов) и связей (дуг);

5. Задачи преобразования символьной модели, использующей формализм теории графов с ИЯ-маркировкой вершин (узлов) и связей (дуг), в строгую символьную ИЯ-модель.

В принципе, уже после решения задачи второго типа, может осуществляться переход от ЕЯ-представлений к некоторой промежуточной системе обозначений (имен), как это делается при разработке программ. Однако такой переход имеет смысл только при условии, что уже произведена декомпозиция на элементарные термины, выражающие свойства и функции объектов, с тем, чтобы в дальнейшем для них не потребовалось осуществлять процедуру восстановления ЕЯ-представления. Если это условие выполняется, то становится возможен даже автоматизированный переход от промежуточной системы имен к ИЯ-представлению (при условии существования тезауруса соответствующего уровня). В общем же случае, операция детальной декомпозиции осуществляется лишь при решении задачи четвертого типа. Впрочем, жесткий стандарт здесь установить трудно, да и не может он быть жестким, поскольку специфику алгоритма структуризации определяют цели деятельности.

Более того, в случае, когда достигнутая степень формализации не удовлетворяет требованиям, предъявляемым спецификой деятельности, полученное формальное описание может быть повторно подвергнута процедурам, которые ранее осуществлялись в отношении представления иного типа.

Заметим, что структурированию может подвергаться и /1 | рД информация, представленная в нетекстовом виде, однако и здесь могут быть выделены задачи, по своему содержанию —- равносильные перечисленным.

Например, рассматривая в качестве исходного массива данных массив графических изображений различных фрагментов некоторого объекта/процесса, относящихся к разным моментам времени и полученных с разных ракурсов, можно решить задачу структурирования, воспользовавшись теми же этапами/задачами. Для чего можно воспользоваться одной из двух стратегий:

- осуществить предварительную трансляцию в текстовую форму (составление подробных описаний изображений на ЕЯ с указанием пространственных и временных отношений между описываемыми объектами), после чего воспользоваться ранее описанными процедурами;

- интерпретировать изображение, как разновидность текста, с применением альтернативной знаковой системы, позволяющей осуществить процесс структуризации в другой знаковой системе.

В качестве теоретического основания для применения такого подхода выступает семиотика, интерпретирующая любой способ представления информации как разновидность текста, представленного средствами некоторой знаковой системы. Для графического представления информации разработан ряд методов, позволяющих перейти от обычного цветного тонального изображения к контурным и иным представлениям, упрощающим процедуры распознавания и трансляции к иным знаковым системам. Однако, поскольку графические модели, получаемые методом последовательной фиксации состояния объектов реального мира, способны отражать лишь пространственно-временные и атрибутивные характеристики наблюдаемых объектов/процессов, постольку извлечение из них системы причинноследственных отношений становится возможным только с привлечением внешней (чаще всего — экспертной) модели интерпретации.

Перейти на страницу:

Похожие книги

Сумма биотехнологии. Руководство по борьбе с мифами о генетической модификации растений, животных и людей
Сумма биотехнологии. Руководство по борьбе с мифами о генетической модификации растений, животных и людей

«Сумма биотехнологии» Александра Панчина — это увлекательный научно-популярный рассказ о генетически модифицированных организмах (ГМО), их безопасности и методах создания, а также о других биотехнологиях, которые оказались в центре общественных дискуссий. Из книги вы узнаете все самое интересное о чтении молекул ДНК, возможности клонирования человека, создании химер, искусственном оплодотворении и генетической диагностике, о современных методах лечения наследственных заболеваний с помощью генной терапии, о перспективах продления человеческой жизни и победы над старением. В то же время в книге подробно разобраны популярные в обществе мифы, связанные с внедрением биотехнологий в практику, и причины возникновения ложных опасений.

Александр Панчин , Александр Юрьевич Панчин

Научная литература / Химия / Биология / Прочая научная литература / Образование и наука