Статья: Статистический метод языкового профилирования носителя диалекта (на материале восточносербского идиома села Берчиновац)

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

Статистический метод языкового профилирования носителя диалекта (на материале восточносербского идиома села Берчиновац)

Д.В. Конёр

А.Л. Макарова

А.Н. Соболев

Разрабатывается статистический метод, позволяющий устанавливать частотность и правила дистрибуции диалектных различительных признаков в спонтанной речи носителей сербских (в дальнейшей перспективе - славянских и балканских) нестандартизированных идиомов и тем самым устанавливать внутрисистемные импликации между различными диалектными признаками и создавать языковые профили носителей диалекта. Объектом изучения является тимокский идиом из села Берчиновац в районе города Княжевац Заечарского округа в Восточной Сербии.

Ключевые слова: статистические методы в языкознании, языковое профилирование, носитель диалекта, балканославянские языки, сербские диалекты, тимокский диалект, идиолект носителя говора.

языковой диалектный сербский спонтанный

Linguistic/Dialectal Profiling of Dialect Speakers: The Method Presented on the Idiolect from Bercinovac, Eastern Serbia

Keywords: statistical methods in linguistics, dialectology, linguistic profiling, dialect speakers, Balkan Slavic languages, Serbian dialects, Timok dialect, idiolect of dialect speaker, village of BerCinovac, Eastern Serbia.

The aim of the undertaken research is to develop a statistical method that allows to estimate frequency and regularity for the distribution of distinctive dialect features in the spontaneous speech of speakers of non-standardized idioms, and thus to discover intrasystem implications between different dialect features creating linguistic profiles of dialect speakers. At a later stage of research, the achievement of this aim would mean obtaining a quantitative tool for assessing intrasystem coherence and degree of dialect preservation for any Slavic or Balkan dialect.

The object of study is Draginja Mikic's (b. 1906) idiolect. The narrative she produced was recorded in the village of Bercinovac, situated near Knjazevac in the Zajecar county (Eastern Serbia). This narrative of approximately 5,300 word tokens was published by A. Sobolev in the third volume of his work called Sprachatlas Ostserbiens und Westbulgariens [Dialectological Atlas of Eastern Serbia and Western Bulgaria]. The analyzed data were extracted from the dialect text using the continuous sampling method, and subsequently subjected to etymological, formal and functional semantic analysis. The comparison procedure itself consisted in counting the number of uses of the “correct” (i.e. corresponding to the conventional dialectal reference point) options for dialectal difference implementation. As a result, the authors could determine as a percentage how close this idiom is to the ideal model of Timok dialect, how “dialectal” it is in general, and how much different it is from the other Serbian dialects and from the standard language.

In order to obtain statistically relevant results based on a sufficient amount of text, the authors selected twelve most significant dialectal features, which allowed them to oppose all the dialects of the studied region of Eastern Serbia with the Neo-Stokavian dialects underlying the standard language.

Dependence of the experiment results on the frequency of certain lexemes used in the informant's speech can be observed. A dialect Timok word form often comes into opposition with a non-dialect (standard), according to not just one, but to a number of parameters. Thus, the form maceja `stepmother' corresponds to macehu-Acc.Sg not only with IcI, but also with the phoneme Ihl, which is not typical of the Timok dialects. Such an opposition is quite often implemented not in the same lexical material (cf. maceja ~ maceha, dsn ~ dan `day'), but in different groups of tokens (cf. vijuvali `(they)saw' ~ rojena `(she was) born'); and not in the same word form of the lexeme, but in different segments of its paradigm (the dative forms of pronouns in sg. mene, nemu against the background of analytical forms pl. na nas). The data reflect different relative frequency of correlative members pairs of different dialectal features and, therefore, a different degree of regularity of their implementation, regardless of the language level. The authors hope that applying various modern research methods to a sufficiently large amount of material, including linguogeographic, corpus and psycho- linguistic methods, can provide them with the desired result (including in the cases of negative statements concerning features that do not exist in a dialect).

Постановка проблемы

Цель предпринятого исследования - разработать статистический метод, позволяющий устанавливать частотность и правила дистрибуции диалектных различительных признаков в спонтанной речи носителей нестандарти- зированных идиомов и тем самым устанавливать внутрисистемные импликации между различными диалектными признаками и создавать языковые профили носителей диалекта. В статье изучается конкретный тимокский диалект в Восточной Сербии, но достижение финальной цели исследования, как можно надеяться, позволит получить количественный инструмент для оценки внутрисистемной диалектной когерентности и «степени диалектной аутентичности» (или «степени диалектной сохранности») для любого варианта сербской (в дальнейшей перспективе - славянской и балканской) диалектной речи.

Объектом изучения является тимокский идиом информантки Драгини Микич (1906 г. р.) из села Берчиновац в районе города Княжевац Заечарского округа в Восточной Сербии. Идиом представлен нарративом примерно в 5300 словоупотреблений, записанным в 1990-е гг. и опубликованным в третьем томе «Диалектологического атласа Восточной Сербии и Западной Болгарии» [1. БД 3, ОДзрипк 503. Бегстоуас. Б. 125].

Говоры призренско-тимокской области сербского диалектного комплекса [2. С. 210-253], с одной стороны, по историко-фонетическим и морфологическим особенностям (рефлекс праславянского *с? > и, совпадение рефлексов редуцированных, флексия -§а в местоименном склонении и мн.др.) относятся к западной части южнославянского диалектного континуума. Помимо ряда приграничных западноболгарских в генетически единый диалектный комплекс с сербской призренско-южноморавской группой можно объединять некоторые говоры Северной Македонии, прежде всего в областях Куманово и Скопска Црна Гора [3. С. 159-239]. С другой стороны, по инновационным морфосинтаксическим характеристикам (редукция падежной системы, наличие постпозитивного артикля, местоименное дублирование объекта и др.) призренско-тимокские сербские говоры относятся к балканославянскому, т. е. балканизированному южнославянскому ареалу [4. С. 103-106; 5]. «Новый слой [инноваций] составляют балканиз- мы, которые, несмотря на свое чаще всего неславянское происхождение, все же связывают эти говоры и с болгарским, и с македонским языком. Однако... в обоих случаях призренско-тимокские говоры остались обособленными, не усвоив полностью ни всех существенных штокавских инноваций, ни всех характерных балканизмов» [6. С. 212].

Согласно восходящей еще к А. Беличу классификации [7] призренско- тимокская область членится на три достаточно крупных диалектных типа: призренско-южноморавский, сврлигско-запланьский и тимокско-лужниц-кий [8. С. 114-116]. Сербский тимокско-лужницкий диалект делится, в свою очередь, на четыре группы: тимокскую, белопаланкскую, лужницкую и пирот- скую [9] (ср.: [2. С. 242-244]). Все эти говоры относятся к с, Сг-зоне, называющейся так по особым рефлексам праславянских *(], *сУ и охватывающей помимо сербских также и болгарские диалекты вокруг современной межгосударственной границы. Отнесение конкретного говора к сербскому или болгарскому языку осуществляется здесь в зависимости от национального самоопределения говорящих, соответственно сербского или болгарского.

В свою очередь, как было установлено в [10. БД 1. Б. 396-397] путем применения таких классификационных параметров, как рефлексы слогообразующего 1 и система постпозитивных артиклей, с, Сг-зона делится на несколько диалектных подгрупп:

Тимокско-заглавакский говор (^/?а `глотает', у/к `волк', 3 артикля - -эу -э?, -эи);

старопланинский говор (^а, у/к, 1 артикль - -э?);

лужницко-знепольский говор (§/э?а, уик, 3 артикля);

говор района Трынское Краиште ^ка, уик, 1 артикль);

говор района Кюстендилское Краиште (§/э/а, уик, 1 артикль).

Идиом села Берчиновац относится к тимокско-заглавскому говору с, Сг-зоны, что соответствует тимокскому говору сербской диалектологической традиции.

Метод

В данном исследовании нас интересуют закономерности проявления в анализируемом тексте ряда дифференциальных фонетико-фонологических и грамматических диалектных признаков, которые далее будут называться диалектными различиями. Согласно определению Р.И. Аванесова и В.Г. Орловой: «Диалектное различие есть такой элемент структуры языка, который в отдельных диалектных микросистемах выступает в разных своих соотносительных вариантах, в разных своих членах. Каждый из этих вариантов сам по себе является элементом той или иной отдельной микросистемы. Совокупность этих вариантов в их межсистемных отношениях образует соответственное явление как элемент макросистемы. Таким образом, соответственное явление всегда двучленно или многочленно. Члены соответственного явления находятся между собой в определенных закономерных отношениях» [11. С. 11].

Для предпринятого исследования релевантны следующие элементы структуры сербского языка (диалектные различия, изоглоссы), выступающие в разных соотносительных вариантах в новоштокавских идиомах (например шумадийско-воеводинских говорах, лежащих в основе сербского литературного языка экавского орфоэпического варианта) и в идиомах тимокского диалекта в Восточной Сербии:

прасл. * (/, *ку > с У8 с, *сУ > 5 У8. з (теса `свеча', те^а `межа' У8. ыеса, тейга);

прасл. *ь = *ъ > а У8 э (йап `день', san `сон' У8 йэп, sэn)^;

синтетическое (флективное) У8 аналитическое (предложное) маркирование косвенного объекта (10) и посессора (РОББ), выраженного существительным;

синтетическое (флективное) У8 аналитическое (предложное) маркирование периферийных падежных отношений при имени существительном (так называемый генитив, инструментал и локатив);

отсутствие открытого маркера категории определенности У8 наличие постпозитивного артикля (системы из одного или трех артиклей);

синтетический компаратив У8 аналитический компаратив прилагательных (с гипертрофированным употреблением аналитического маркера компаратива при именах существительных, местоимениях, глаголах, наречиях и предлогах);

однократное маркирование прямого (БО) и косвенного объекта (10) флексией У8 местоименная редупликация прямого и косвенного объекта;

наличие частицы конъюнктива (в традиционной грамматике - союза йа `что, чтобы') при модальных глаголах и в формах футура У8 опущение этой частицы (союза) [12];

акцентные ретракции У8 сохранение старого места ударения.

Для получения статистически релевантных результатов на достаточном объеме текста были отобраны наиболее весомые признаки, противопоставляющие все говоры изучаемого региона Восточной Сербии новоштокавским говорам, лежащим в основе литературного языка. Для диалектного ландшафта Сербии и других славянских стран «особенно характерно... наличие таких членов соответственного явления, один из которых является в собственном смысле диалектным, другой - свойственным литературному языку. С точки зрения генетической это результат влияния литературного языка на диалект или результат взаимодействия диалектов» [11. С. 11]. Изоглоссы, важные для диалектной микродифференциации внутри с, ^- зоны (уже упоминавшийся характер рефлексов праславянских слогообразующих сонантов в различных позициях и количество постпозитивных артиклей), в рамках предпринятого исследования не рассматриваются. Анализ диалектного текста был проведен «вручную», полному учету (т.е. статистически-ориентированному детальному качественному разбору и однозначному измерению) подверглись показатели по всем выделенным выше параметрам за исключением акцентологического. Мы полагаем, что в перспективе любое статистическое (квантитативное) исследование сербского (в дальнейшей перспективе - славянского и балканского) диалектного текста должно будет осуществляться автоматически, для чего в настоящее время, к сожалению, отсутствуют надежные программные средства.

Будем исходить из того, что степень диалектной аутентичности спонтанной речи информанта может быть однозначно измерена на фоне гипотетического «идеального», «канонического» (в современной языковой реальности Восточной Сербии не существующего) тимокско-заглавакского говора южнославянской с, ^-зоны. В таком говоре употреблялись бы те и только те члены соответственного явления (варианты реализации диалектного различия), которые локализуются именно в Тимокском крае, а их соответствия из других диалектных ареалов и из литературного языка не встречались бы ни в качестве «безразлично употребляемых в речи», ни в качестве «стилистически разграниченных» вариантов. «Степень диалектной аутентичности» такого говора по любому параметру составляет идеальные 100%. В рамках нашего метода проводится сравнение реально звучащей речи с этим «идеальным тимокским говором» по модели тестирования личностных характеристик в современной психологии личности [13].

Установление степени проявления диалектных признаков в речи собеседника - стандартная процедура, осуществляемая диалектологом в ходе полевой работы при отборе лиц, которые в дальнейшем будут рассматриваться в качестве информантов-носителей местного говора. На практике эта процедура обычно осуществляется на фонетическом, морфологическом и лексическом уровнях языковой структуры, затем имплицируется представление о том, что речь информанта внутренне когерентна, а «диалектность» морфосинтаксических и синтаксических характеристик как минимум не сильно отклоняется от остальных. Важно при этом установить, может ли информант порождать относительно длинные цепочки высказываний на диалекте или способен воспроизводить лишь отдельные диалектные словоформы. Эта же процедура позволяет проводить экспертизу текста, объявляемого «диалектным», в случае сомнений в последнем обстоятельстве.

Процедура сравнения заключается в непосредственном подсчете количества употреблений «правильных» (т. е. соответствующих диалектному «канону») вариантов реализации диалектного различия, в результате чего можно в процентном соотношении установить, насколько данный идиом близок к «идеалу», насколько он «диалектен» и насколько отдален от иных диалектов и от литературного языка. С точки зрения сравнения с поздним праславянским состоянием варианты реализации дифференциальных различий можно квалифицировать как внутриславянские архаизмы или инновации; на них наслаиваются балканизмы - инновации, появившиеся в результате вхождения призренско-тимокских диалектов в балканский языковой союз [14]. Если реализация диалектных различий совпадает с состоянием сербского литературного языка, то последний с изрядной долей обобщения признается источником влияния в данном случае. Предполагается, что реализация в речи информанта различных членов диалектных различий может зависеть от темы наррации (автобиография, история семьи, история и жизнь села, традиционное и современное хозяйство, прошлый и современный быт, календарная обрядность в прошлом и в настоящее время, обряды перехода, былички и др.), но в рамках настоящего исследования это обстоятельство не принимается во внимание.