Системный подход к изучению языка позволяет выделить определенные наборы элементов языка, которые связаны системными отношениями и образуют определенные субсистемы, представляющие собой часть соответствующего уровня языка [11]. Так, при исследовании лексического уровня русского языка Э.Ф. Скороходько в отдельную субсистему выделяет терминологию [23]. В данном случае для нас представляет интерес способ установления связей и определение степени связности терминов в пределах выделенной субсистемы. Исследователь раскрывает качественные характеристики терминологии через установление количественных отношений между единицами субсистемы. Системность терминологии, по мнению автора, предполагает системность плана содержания, то есть системность семантического наполнения терминологии; системность плана выражения, то есть системность словесного наполнения терминологии, и системность соответствия плана выражения плану содержания.
Значения терминов соотносятся с соответствующими единицами действительности, взаимосвязанными между собой. Отсюда, значения лексических единиц тоже взаимосвязаны. Среди связей каждого предмета есть такие, которые однозначно выделяют данный предмет. Фиксируются эти связи в словарных статьях (определениях) толковых или терминологических словарей как отношения между значениями слов – семемами. Совокупность семем и существующих между ними отношений образует семантическую сеть языка. В качестве одного из признаков лексической системы языка, в частности ее терминологической субсистемы, может быть выбран показатель степени взаимосвязи между значениями ее единиц, определять который Э.Ф. Скороходько предлагает на основе соотношения количества семантически связанных пар терминов, то есть таких, значения которых, отраженные в определениях, прямо или опосредствованно производны от одного и того же значения (от одной и той же семемы), и общего числа терминов в системе. Сила семантической взаимосвязи терминов определяется длиной цепочки семем, связывающих в семантической сети сопоставляемые термины с общим компонентом в их значении. Указанные параметры, вычисленные для различных терминологических субсистем, могут свидетельствовать о степени однородности выбранных субсистем. Например, низкий показатель семантической связанности терминов означает или то, что система внутренне разнородна, то есть в нее включены термины других областей, или то, что при определении некоторых из ее терминов не отображены существенные связи внеязыковой действительности. Эти же показатели являются количественными характеристиками отличия любой терминологической субсистемы от общеупотребительной лексики. (В системе общеупотребительной лексики они будут значительно ниже.)
Метод установления смысловых связей слов на основе статистических показателей совместной встречаемости их в тексте, разработанный А.Я. Шайкевичем [27], оказался эффективным способом построения автоматических тезаурусов [10]. По этой методике семантическая связь слов (в тезаурусе такие слова объединяются в один класс) выводится на основе наблюдения их совместной встречаемости в текстах без обращения к значению этих слов. Для анализируемых слов вычисляется абсолютная частота их в тексте и относительная в заданном интервале, при этом фиксируются все слова, встретившиеся с анализируемыми. По формуле
Кэмбриджская группа, работающая над автоматизацией информационного поиска, применив подобную методику для выявления связей слов, предложила вычислять коэффициент интенсивности (