Не противопоставлять количественный анализ качественному, не игнорировать количественную методику, а сочетать качественный и количественный методы исследования языкового материала – вот задачи языковеда. Этот союз необходим хотя бы потому, что сначала надо определить строго однозначно единицы счета. Если такого определения не будет, то и результаты исследования будут несопоставимы. С помощью качественного лингвистического анализа мы получаем качественные характеристики единиц языка: фонем, морфем, слов, частей речи и т.д. Опираясь на результаты проведенного качественного анализа единиц, с помощью количественного метода исследователь раскрывает закономерности функционирования этих единиц и новые данные для качественных оценок на новом уровне исследования [9, 17].
О первых попытках применения количественных методов к речевому материалу, в частности к лексическому, свидетельствует история составления частотных словарей, количество которых уже сегодня составляет более 300.
Частотный словарь отличается от других типов словарей тем, что, во-первых, он включает лишь те лингвистические единицы, которые встретились в исследованном тексте (или текстах); во-вторых, указывает при лингвистических единицах частоты их употребления в этом тексте (или текстах).
С каждым годом растет внимание ученых к частотным словарям, они составлены для более чем 17 языков. В них исследователи находят материал для типологии и текстов и языков. Идею количественного подхода к типологии сформулировал Дж. Гринберг [12]: сравнивая отрывки текста фиксированной длины, написанные на разных языках, можно сделать вывод о близости или отдаленности строения языков на основе количественных соотношений между словами этих текстов и компонентами их морфологического строения.
На основе частотных словарей изучаются статистические закономерности функционирования словарного состава языка. В связи с этим особое значение приобретают способы интерпретации данных частотного словаря: например, разные пласты частотной лексики отражают структуру текста.
Особенности функционирования словарного состава языка в стилевых и авторских разновидностях речи интересуют как лексикологов, так и стилистов.
Представители точных и инженерных специальностей используют частотные словари как источник статистических данных о некоторых лингвистических единицах для обеспечения эффективности передачи сообщений по каналам связи.
Специалисты в области автоматической обработки языковой информации опираются на количественные описания подъязыков некоторых отраслей для образования системы поиска и реферирования текста при помощи ЭВМ [3; 18; 21; 22; 30].
Особенно следует подчеркнуть большое значение частотных словарей в методике изучения языка, поскольку преподаватель языка обращается к частотному словарю в поисках объективно отобранного учебного материала. Поэтому целью большинства частотных словарей иностранных языков было обеспечить методику изучения языка теми, для кого этот язык является неродным.
Одновременно отметим возможность применения статистики при изучении языка учащегося. Ведь наша школа до сих пор еще не имеет объективных данных, что такое хороший, посредственный или плохой язык учащихся разных классов, какой необходим запас слов, грамматических форм и конструкций [9; 27].
Кроме того, особенно важной и актуальной в педагогике, психологии (а также в филологии и информатике) является проблема измерения сложности текста. Объективные количественные методы измерения сложности текста имеют первостепенное значение для определения понятности, доступности учебных текстов, публицистических материалов, научной, научно-популярной информации [26].
Вообще частотные словари преследуют цель получения материала для всестороннего лингвистического анализа текста на лексическом, морфологическом и графемном уровнях. Авторы словарей проводят не только лексикологический анализ текста, но и исследуют его на других лингвистических уровнях. Таким образом, частотный словарь является лишь первоначальным этапом тщательного изучения структуры текста.
Частотные словари регистрируют функционирование единиц языка в речи. Но речь характеризуется не только функционированием в ней единиц языка, но и своими речевыми единицами. В литературе дискутируется вопрос о том, что считать единицей речи. Единицей речи можно считать такую цепочку единиц языка, которая не относится к языковым единицам. Составители частотного словаря сочетаемости современного английского языка [6; 7; 8] считают необходимым регистрировать как частоту единиц языка в текстах, то есть слов, так и частоту единиц речи, к которым они относят цепочки связей некоторого слова в предложении.