Поэтому самое простое и, возможно, интуитивно очевидное правило "перевода", которое мы можем сформулировать, звучит следующим образом: "Если в интерпретационной модели данных существует идентифицированная когнитивная категория CI, то в дизайне хранилища данных будет существовать отношение RI вместе с некоторым атрибутом Rl-id, который выступает в качестве первичного ключа для этого отношения и однозначно идентифицирует отдельные кортежи этого отношения".
Поэтому первым шагом на пути перехода от интерпретационной модели данных к проектированию хранилища данных является создание отношения для каждой когнитивной категории и введение в качестве атрибута этого отношения первичного ключа. Некоторые из созданных таким образом отношений могут исчезнуть или быть изменены по мере применения дальнейших правил.
РАБОЧИЕ ОБЪЕДИНЕНИЯ
Для точного определения значения когнитивной категории может потребоваться детализация действий, которые ожидаются от примеров этой категории. Например, при построении системных определений, относящихся к строительной отрасли, мы можем определить значение "рабочей команды" как нечто большее, чем просто группа работников, возглавляемая руководителем группы. Оно может включать в себя то, что такие рабочие бригады выполняют определенные задания. Это может быть зафиксировано в определении словаря данных WORK-TEAM и путем демонстрации потенциала для выполнения определенных задач с помощью ассоциации действий.
При переходе к проектированию хранилища необходимо учитывать временные факторы, фокусироваться на том, что уже произошло, а не на том, что может произойти, и делать записи о выполнении одной и той же рабочей группой множества различных заданий в течение определенного времени. Необходимость отношений, способных хранить исторические данные, удовлетворяется правилом: "Если в интерпретационной модели данных существуют две категории, CI и C2, и ассоциация действий, Ax, между C I и C2, то в проекте хранилища данных будут присутствовать: отношение RI, имеющее некоторый атрибут Rl-id, который выступает в качестве первичного ключа этого отношения; отношение R2, имеющее некоторый атрибут R2-id, который выступает в качестве первичного ключа этого отношения; и отношение R3, которое записывает событие выполнения действия Ax, причем первичным ключом R3 является конкатенация Rl-id, R2-id и даты/времени этого события".
Заметим, что в приведенном выше примере штамп даты/времени может быть излишним, но в других случаях он не нужен, и правила всегда должны учитывать наиболее общий случай. Избыточность может быть устранена при последующем уточнении схемы. Также следует отметить, что ассоциации действий не обязательно должны быть бинарными и могут включать более двух категорий; например, можно определить, что бригады рабочих выполняют спецификации заданий, используя материалы. Это можно сделать аналогично описанному выше, но в бинарном виде. Например, для ассоциации действий, включающей три категории, можно рассматривать ее как состоящую из двух отдельных бинарных ассоциаций, создав два дополнительных отношения, в каждом из которых ключ другой задействованной категории включен в качестве неключевого атрибута.
СПЕЦИАЛИЗИРОВАННЫЕ ОБЪЕДИНЕНИЯ
Описанные до сих пор правила могут показаться достаточно очевидными. Это объясняется тем, что реляционная модель предоставляет подходящие эквиваленты для категорий и ассоциаций действий. Однако это не так, когда мы переходим к ассоциациям специализации, которые могут существовать в интерпретируемой модели данных.
При интерпретационном анализе данных можно использовать ассоциации специализации для определения одной категории как специализированной подкатегории другой. Например, может показаться уместным провести различие между сотрудниками, работающими на постоянной основе, и сотрудниками, работающими по временным контрактам, несмотря на то, что оба типа сотрудников имеют, по большей части, схожие характеристики. Определено, что категории "ПОЛНЫЙ РАБОТНИК" и "РАБОТНИК ПО КОНТРАКТУ" являются подтипами категории "РАБОТНИК", при этом допускается более тонкое разграничение того, что каждый из них может делать или не делать по определению. Только работники, занятые полный рабочий день, могут делать пенсионные взносы.
Реляционная схема не допускает реальных эквивалентов для таких ассоциаций специализации, и как бы мы ни преобразовывали ее в реляционную схему, часть смысла будет потеряна или плохо передана. Для того чтобы убедиться в этом, полезно рассмотреть альтернативные способы преобразования.