Пока наиболее перспективным представляется исследование сущностных характеристик языка при помощи аппарата теории вероятностей и математической статистики – квантитативная лингвистика. Собственно говоря, связь математики с языкознанием началась с попыток установить статистические свойства речи, поскольку языку присущи объективные количественные характеристики. Благодаря вероятностной природе языковой структуры, она легко поддается изучению математическим аппаратом теории вероятностей и математической статистики. Основа тому – регулярность, упорядоченность языковых явлений. Уже существует большая специальная литература, отразившая результаты применения статистических методик в исследовании различных ярусов языковой системы.
Статистически исследуется фонетика, закладываются основы статистического изучения морфемного состава слова и морфологических категорий. В частности, установлена связь между числом фонем и средней длиной морфемы, стало известно, что количество фонем отражается на качестве морфем и слов, а количество морфем на качестве слов. Интересна попытка количественно выразить степень силы управления. Намечается статистическая классификация синтаксических конструкций, обследуются закономерности связи размера предложения с характером текста. Выявлено, что с XI до XX в. вероятность использования предлогов увеличилась с 0,096 (XI–XIII вв.) до 0,123 (XX в.), а союзов уменьшилась с 0,126 (XI–XIII вв.) до 0,085 (XX в.) [Русинов 1983: 37]. Количественной интерпретации подвергается даже такая «качественная» сторона языка, как семантика. Особенно эффективны статистические подсчеты в стилистике. Количественными параметрами обладают такие явления, как ритм и рифма. С применением статистики увеличивается надежность типологических разысканий. С помощью статистических методов устанавливается мера генетической близости между славянскими языками, сохраняемой, по данным праславянской лексики, каждым из них [Журавлев 1994].
С помощью формально-количественных методов изучается авторский идиостиль, под которым В.П. Григорьев понимает взаимосвязь между языковыми средствами и особенностями творческой позиции писателя, его взгляда на мир, на окружающую действительность [Баранов 1998: 121]. Замечено, например, что частицы
Шире всего количественные методики используются при описании лексического уровня языковой системы. Лингвисты убеждены, что лексемный ярус системен, но его системность особого рода. В лексике целостность и устойчивость системы сочетается с автономностью частей (подсистем). В ней заметна массовость и случайность и одновременно господствует необходимость. Всё это характерно для вероятностных систем. Известен вывод Б.Н. Головина: «Язык вероятностен, речь частотна». Квантитативная лингвистика возможна потому, что для речи характерна относительная стабильность частот отдельных элементов или групп элементов и устойчивое распределение элементов, выражающее наличие внутренней упорядоченности в системе. Единицами и уровнями квантитативного анализа являются словоформы, лексема и словоупотребление [Тулдава 1987].
Практическим результатом статистического изучения лексики являются частотные словари, отличающиеся от обычных лингвистических (толковых, орфографических и других) тем, что словарные единицы располагаются в них не только в алфавитном порядке, но и в порядке убывающей частотности. В первом случае это будет алфавитный частотный словарь, а во втором – ранговый частотный словарь. Частотные словари характеризуются следующими параметрами: объём текста (число словоупотреблений), объём словаря словоформ, объём словаря лексем.