В современной лингвистике, особенно среди ученых Запада, очень популярна теория принципов и параметров, разработанная примерно в 1980 годах в основном усилиями Ноама Хомского.
Суть этой теории заключается в следующем постулате: все современные языки являются результатом соединения и взаимодействия конечного числа элементарных правил (факторов), которые Хомский называет параметрами.
Любой из существующих ныне языков, таким образом, формируется путем определенной комбинации параметров. Существенным прикладным плюсом теории может являться предположение, что в основе множества человеческих языков может лежать небольшое число параметров.
Хомский предполагает, что, опираясь на понятие параметра, можно построить высокоструктурированную универсальную грамматику (грамматику, общую для всех языков), основанную на некоторых основополагающих принципах, в которых будут изложены механизмы функционирования параметрических конструкций того или иного языка.
Наличие специфических речевых центров в мозге подтверждает предположения Хомского о врожденном характере языка и наличии универсальной грамматики. Изучение области Брока (специфическая область в головном мозге, ответственная за речевую деятельность человека) выявило интересные особенности [3]. Оказывается, область Брока активируется только при конструировании предложений языка на основе иерархической структуры слов в предложениях (смысловое построение предложения) и не активируется при конструировании предложений языка, основанного на простом линейном порядке слов (бессмысленный поток слов), что является сильным аргументом в пользу существования универсальной грамматики.
Исторически идея универсальной грамматики восходит к идеям таких философов, как Роджер Бэкон и Рене Декарт, но в современном контексте она практически всегда ассоциируется с теориями американского лингвиста Ноама Хомского.
Наблюдения Хомского за развитием речи маленьких детей, начинающих осваивать родной язык, позволили ему выдвинуть гипотезу о том, что дети обладают врожденным механизмом усвоения языка, который действует на протяжении некоторого периода (примерно до 12 лет).
Основным аргументом для такой гипотезы Хомского стало отсутствие стимула для обучения: ребенок не получает информации о том, какие языковые конструкции возможны, а какие - невозможны. Как правило, ребенка специально никогда не обучают; да это и невозможно в том возрасте, когда он еще не говорит. Это обстоятельство делает процесс усвоения языка маленьким ребенком невозможным без наличия какой-то заранее заданной информации.
Значит, где-то на генетическом уровне существуют какие-то конечные правила (универсальная грамматика), которые ограничивают количество возможных вариантов в конструкциях языка; в противном случае ребенок должен был бы выбирать из бесконечного количества возможностей, что значительно усложняло бы процесс обучения. Однако известно, что освоение языка детьми происходит весьма быстро и легко.
Для ясности понимания сказанного выше приведем пример сравнения (весьма упрощенного и не претендующего на исчерпывающую полноту) особенностей некоторых языков, связанных с порядком слов в предложениях, приведенный в [4].
Особенность языка навахо (язык одного из племен (навахо) американских индейцев) состоит в том, что если индеец навахо на своем языке хочет сказать: «Мальчик увидел девочку», то в подстрочном переводе (формальный перевод слов в предложении, написанном на языке навахо) это будет звучать так: «Мальчик девочка увидел». Здесь прямое дополнение «девочка» следует за подлежащим и находится перед глаголом. Подстрочный перевод можно понять и как «Девочка увидела мальчика».
Аналогичное строение имеют предложения в японском языке. Так, например, предложение «Сестра Джона умерла» на японском языке содержит совершенно очевидную информацию (чья сестра; что с ней случилось). Расположение же слов в подстрочнике таково: «Джон сестра умер(ла)».
Следует, конечно, отметить, что ни индейцы, ни японцы не путаются при разговоре и письме, и этому способствуют различные средства их языков (и не только их языков) - суффиксы, префиксы, аффиксы и другие показатели согласованности. Их наличие делает речь или письмо непротиворечивыми, и носители языка хорошо понимают друг друга.
Если сравнивать японский язык или язык навахо с английским языком, то мы увидим их коренное отличие (в смысле порядка слов). Так, например, английская фраза «Джон думает, что он лжет», в подстрочном переводе выглядит по смыслу так же, как и само предложение «John believes that he is lying». Другими словами, порядок слов в английском языке соответствует смысловому значению слов, появляющихся в естественном порядке в предложении.
Иной порядок слов показывает язык навахо, в котором та же фраза в подстрочном переводе выглядит так: «Джон он лжет - думает».
Лингвисты - приверженцы теории параметров - относительно приведенных примеров сказали бы, что порядок слов в языке регулируется некоторым параметром, который можно назвать, например, параметром порядка. Так, английский язык задает порядок: подлежащее - глагол - дополнение. В японском же языке порядок определяется иначе: подлежащее - дополнение - глагол.
Можно по-разному задавать этот параметр (числами, схемами и т.д.), и тогда всякий язык характеризуется тем или иным значением этого параметра. Таким образом, японский и английский языки представляют две альтернативные возможности для порядка слов (для параметра порядка) в предложениях.
Если рассматривать другие особенности в конструкциях предложений различных языков, то можно заметить также и действие других параметров в языках [3, 4].
Рассмотренный способ введения параметров (например, параметра порядка), на первый взгляд, не представляет никакой ценности, так как в мире существует более 6000 различных изолированных друг от друга языков, и было бы удивительно, если бы в языках не встречались такие, как в английском или японском языках, альтернативы в порядке следования слов.
Основой для понимания роли параметров и их использования было то обстоятельство, что почти во всех существующих языках (более чем в 95%) порядок слов в предложениях либо такой, как в английском языке, либо такой, как в японском языке. Эти два порядка в построении предложения распределены по существующим языкам практически поровну.
Данные реалии, безусловно, таят в своей сути некоторые фундаментальные принципы функционирования любого языка. Именно поэтому к теории принципов и параметров лингвисты проявляют повышенный интерес.
Действительно, было бы совсем неудивительно, если бы принципы построения предложений в любом языке были одинаковы. Это означало бы, что язык как средство общения имеет генетическую основу, общую для всех людей.
С другой стороны, на практике могли бы наблюдаться также самые различные порядки слов в предложениях в разных языках, т.е. не два варианта, как есть на самом деле, а много разных вариантов в размещении слов. Тогда можно было бы объяснить такую палитру способов построения предложений тем, что все языки развивались независимо друг от друга (не взаимодействовали между собой), и каждый этнос использовал свою схему, опираясь на собственный опыт, на собственную уникальную культуру.
То, что на самом деле вариантов порядка слов только два, является загадочным явлением, и неудивительно, что многие лингвисты оказывают этому и подобным явлениям в языке так много внимания.
Сейчас имеется много данных и о других параметрах, характерных для любого языка. Мы же будем для конкретности рассматривать только параметр порядка.
Нужно сказать, что явление строгой упорядоченности речи и текста любого языка свидетельствует о некоторых биологических механизмах при формировании способности к речевой деятельности у пралюдей (предшественников людей). Можно выдвигать различные гипотезы о формировании того или иного параметра порядка, и, вероятно, найдется много различных объяснений параметризации языка, опирающихся и на биологическую (генетическую) природу, и на социальную структуру носителей языка. Наверное, антропологические исследования в данном направлении (феномен речи) могли бы пролить свет на механизмы формирования особенностей, общих для любого языка.
Наши же задачи более скромны, и целью наших исследований является описание механизмов действия параметров с использованием упомянутой ранее [1] теории байесовского подхода.
Основа этого подхода заключается в том, что атомарной единицей языка в [1] принято слово. Основная функция слова - нести некоторый смысл или оттенять этот смысл, делать его понятным (междометия, суффиксы и т.д. также включаются в понятие «слово»).
Важным свойством слова, несущего некоторый смысл, является его полиморфизм - всякое слово в речи или тексте имеет не одно, а несколько смысловых значений, причем правила, по которым словам приписывается некоторый конкретный смысл, формализовать не удается. Они имеют статистическую природу [5, 6].
Итак, взятое отдельно слово языка имеет множество смысловых значений, и на этом множестве существует некоторое вероятностное распределение (распределение смыслов). Это распределение смыслов называется априорным (персональным) распределением. Другими словами, априорное распределение f (x) - это плотность вероятностей смыслов x. При этом шкала смыслов - ось x - может быть как дискретной, так и непрерывной [1, 5, 6].
Изменение априорного распределения f (x) при восприятии текста или речи происходит в соответствии с формулой Байеса:
f (x|y) = k f (y|x) f (x), (1)
где условная плотность распределения f (y|x) играет роль фильтра текстовой системы. Величина k в (1) выполняет функцию нормирующего множителя. Она выбирается так, чтобы интеграл от плотности вероятностей f (x|y) по множеству смыслов был равен единице.
Таким образом, после опыта (прочтения слова) мы получаем апостериорную функцию распределения f (x|y) - обновленную информацию, которая на следующем этапе будет уже считаться априорным распределением. При следующем опыте (чтении) происходит такая же фильтрация исходной (априорной) информации и т.д.
В процессе чтения (человеком или некоторым устройством) происходит обновление (эволюция) априорной информации. Во время восприятия текста формируется и изменяется фильтрующая плотность распределения f (y|x). Ее формирование зависит в основном от алгоритмов комбинирования читаемого слова с другими знаками текста.
Для предложения, состоящего из слов, формула (1) сохраняет свою силу, если мы говорим о смысле предложения, который (смысл предложения) тоже имеет вероятностную природу.
Так, весьма кратко, можно описать процесс восприятия слова, или некоторого фрагмента текста в системе «текст - субъект, воспринимающий этот текст». Подробности данного подхода можно выяснить из [1, 5, 6].
Каждое слово языка может взаимодействовать с другими словами, образуя предложения. Обратимся к конструкции предложения, причем будем считать, что это предложение может быть либо произнесено кем-то, либо написано (или прочитано). Нас интересует, кроме смыслового наполнения данного предложения, также и его соответствие некоторым формальным правилам универсальной грамматики языка (любого языка). Через эти правила и происходит действие параметров Хомского.
Отметим, что любой фрагмент речи, так же как и отдельное слово, обладает свойством полиморфизма - одному и тому же словосочетанию можно приписать много разных смыслов. Восприятие речи носит вероятностный характер. Это относится не только к восприятию речи, но также и к передаче при помощи речи некоторой информации. Она всегда будет неточна и неполна. Крайним вариантом этого утверждения служат теоремы Гёделя о неполноте, которые относятся к математическому языку - предельной (в смысле строгости) реализации человеческого языка.
В соотношении (1) переменная x может обозначать не только слово, но и целое предложение, которое обладает не только смыслом, но и структурой.
Пусть предложение некоторого языка состоит из n слов (x1, x2, …, xn) = x. Взаимодействие слов в предложении можно описать совместной n-мерной плотностью распределения:
f (x1, x2, …, xn) = f (x),
и эту функцию (по отношению к предложению) естественно назвать априорной совместной плотностью вероятностей данного фрагмента речи (или письма). В априорной (персональной) плотности вероятностей собрана вся личная информация индивидуума о рассматриваемом фрагменте речи. Здесь также содержатся и сведения о структуре предложения, о различных параметрах, управляющих строением и стилистикой текста, которые индивидуум усвоил из предыдущего опыта. Короче говоря, индивидуум воспроизводит или воспринимает речь или текст, будучи уже в определенной степени подготовленным. Основой такой подготовки является весь его предыдущий жизненный опыт, а также его личностные качества, возможно, и его генетические особенности.
Понятие априорной плотности универсально; оно присуще не только предложению, но и всякому отдельному фрагменту речи, безотносительно к тому, является ли он осмысленным или представляет бессмысленный набор слов. В частном случае, когда фрагмент речи состоит из одного слова, априорная совместная плотность вероятностей превращается в персональную плотность распределения.
Если набор слов бессмыслен, то тогда, очевидно, нужно принять, что слова речи (вернее, их смыслы) не зависят друг от друга, и в этом случае, в соответствии с правилами теории вероятностей: