МАТЕМАТИЧЕСКАЯ ЛИНГВИСТИКА, математическая дисциплина, разрабатывающая формальный аппарат для описания строения естественных и нек-рых искусственных языков. Возникла в 50-х гг. 20 в. в связи с назревшей в языкознании потребностью уточнения его осн. понятий. В М. л. используются по преимуществу идеи и методы алгебры, .алгоритмов теории и автоматов теории. Не являясь частью лингвистики, М. л. развивается в тесном взаимодействии с ней. М. л. называют иногда лингвистич. исследования, в к-рых применяется к.-л. математич. аппарат.
Математич. описание языка основано на восходящем к Ф. де Соссюру представлении о языке как механизме, функционирование к-рого проявляется в речевой деятельности его носителей; её результатом являются «правильные тексты» - последовательности речевых единиц, подчиняющиеся определённым закономерностям, мн. из к-рых допускают математич. описание. Изучение способов математич. описания правильных текстов (в первую очередь предложений) составляет содержание одного из разделов М. л. - теории способов описания синтаксической структу-р ы. Для описания строения (синтак-сич. структуры) предложения можно либо выделить в нём «составляющие» -группы слов, функционирующие как цельные синтаксические единицы, либо указать для каждого слова те слова, к-рые от него непосредственно зависят (если такие есть). Так, в предложении «Лошади кушают овёс» при описании по 1-му способу составляющими будут: всё предложение /, каждое отд. слово и словосочетание С = «кушают овёс» (рис. 1; стрелки означают «непосредственное вложение»); описание по 2-му способу даёт схему, показанную на рис. 2
. Математические объекты, возникающие при таком описании структуры предложения, наз. деревом составляющих (1-й способ) и деревом синтаксического подчинения (2-й способ).
Другой раздел М. л., занимающий в ней центр, место,- теория формальных грамматик, возникшая гл. обр. благодаря работам Н. Хамского. Она изучает способы описания закономерностей, к-рые характеризуют уже не отд. текст, а всю совокупность правильных текстов того или иного языка. Эти закономерности описываются путём построения «формальной грамматики» -абстрактного «механизма», позволяющего с помощью единообразной процедуры получать правильные тексты данного языка вместе с описаниями их структуры. Наиболее широко используемый тип формальной грамматики — т. н. порождающая грамматика, или грамматика Хомского,- упорядоченная система Г = <V,W,I,R>, где: V и W — непересекающиеся конечные множества; I — элемент W; R — конеч-
ное множество правил вида y -> ф, где y и ф - цепочки (конечные последовательности) элементов V и W. Если y -> ф -правило грамматики Г и w1, w2,- цепочки из элементов V и W, то говорят, что цепочка w1 ф w2 непосредственно выводима в Г из w1 y w2. Если E0, E1,...,En - цепочки и для каждого i = 1, ..., п цепочка E1 непосредственно выводима из Ei-1, то говорят, что En выводима из E0 в Г. Множество цепочек из элементов V, выводимых в Г из 1, наз. языком, порождаемым грамматикой Г. Если все правила грамматики Г имеют вид А -> ф, где А — элемент W, Г называется бесконтекстной, или контекстно-свободной. В лингвистич. интерпретации элементы V чаще всего представляют собой слова, элементы W — символы грамматич. категорий, I — символ категории «предложение». В бесконтекстной грамматике вывод предложения даёт для него дерево составляющих, в к-ром каждая составляющая состоит из слов, «происходящих» от одного элемента W, так что для каждой составляющей указывается её грамматич. категория. Так, если грамматика имеет в числе прочих правила I ->Sx, у, им Vy,
Vy -> VtySx, у‘ вин, S муж, ед, вин -> овёс, Sжен, мн, им-> лошади, Vtмн -> кушают, где Vy означает категорию «группа глагола в числе у», Vty - «переходный глагол в числе у», Sx,y,z - "существительное рода х в числе у и падеже Z" , то приведённое выше предложение имеет вывод, показанный на рис. 3, где стрелки идут из левых частей применяемых правил к элементам соответствующих правых частей.
Формальные грамматики используются для описания не только естественных, но и искусственных языков, в особенности языков программирования.
М. л. изучает также аналитические модели языка, в к-рых на основе тех или иных данных о речи, считающихся известными (напр., множества правильных предложений), производятся формальные построения, дающие нек-рые сведения о структуре языка. Приложение методов М. л. к конкретным языкам относится к области лингвистики (см. Языкознание).
Лит.: Хомский Н., Синтаксические структуры, в сб.: Новое в лингвистике, в. 2, М., 1962; Гладкий А. В.. Мельчук И. А., Элементы математической лингвистики, М., 1969; Маркус С., Теоретико-множественные модели языков, пер. с англ., М., 1970; Гладкий А, В., Формальные грамматики и языки, М., 1973. А. В. Гладкий.