РЕАЛИЗАЦИИ ИНТЕРВОКАЛЬНЫХ КОНСОНАНТНЫХ КЛАСТЕРОВ В ЧАСТОТНЫХ СЛОВАХ РУССКОГО ЯЗЫКА
Риехакайнен Елена Игоревна
Санкт-Петербургский государственный университет,
Россия, Санкт-Петербург
В статье анализируются особенности употребления частотных слов с интервокальными сочетаниями согласных [gd] и [ljk] в устной речи трех групп информантов: взрослых носителей русского языка, русскоязычных монолингвальных детей четырех-шести лет, а также китайцев, изучающих русский язык как иностранный. Рассматриваются 929 реализаций 11 слов. Полученные данные подтверждают гипотезу о том, что наиболее частотным видом редукции анализируемых сочетаний согласных у носителей русского языка является выпадение первого согласного, однако для большинства проанализированных слов нет оснований говорить о том, что вариант с редукцией консонантного кластера встречается в естественной устной речи чаще, чем полная реализация. У взрослых носителей русского языка прослеживается тенденция к сохранению консонантного кластера в тех случаях, когда слово находится в абсолютном начале межпаузального интервала. Большинство детей четырех-шести лет предпочитают один вариант реализации консонантного кластера (полный или редуцированный) в каждом из рассмотренных слов, что может свидетельствовать о наличии в ментальном лексиконе ребенка только одной (сформировавшейся под влиянием инпута) реализации для каждого слова. Главным отличием речи китайцев, изучающих русский язык, является многочисленность вариантов с заменами звуков в обоих рассмотренных интервокальных сочетаниях согласных, а также статистически значимое преобладание полного варианта произнесения над вариантом с выпадением первого согласного в интервокальном кластере для всех слов с сочетанием [ljk]. Полученные результаты могут быть использованы для совершенствования существующих автоматических систем распознавания речи, а также в практике преподавания русского языка как иностранного.
Ключевые слова: русская речь, сочетания согласных, редукция, русский язык как иностранный, детская речь.
устная речь частотные слова согласные интервокальные сочетания
Realization of intervocalic consonant clusters in frequency words of the Russian language
Elena I. Riekhakaynen
St. Petersburg State University,
St. Petersburg, Russia
The article describes the realization of frequent words with the intervocalic consonant clusters [gd] and [ljk] in the oral speech of three groups of informants: adult native speakers of the Russian language, children aged four to six years and Chinese students learning Russian as a second language (929 realizations of 11 words). The data obtained confirm the hypothesis that the most frequent form of reduction of the analyzed combinations of consonants in Russian speech is the loss of the first consonant. However, the variants with the reduction of the consonant and without it are equally probable in the speech of native Russian speakers for the majority of the analyzed words. In adult native speakers of Russian, there is a tendency to maintain a consonant cluster when the word is at the absolute beginning of the inter-pause interval. Children aged four to six years tend to use only one variant of the consonant clusters in each of the considered words. The main distinctive feature of Russian speech for Chinese students is the large number of sound changes in both intervocalic consonant combinations, as well as the statistically significant prevalence of the full pronunciation over the variant with the loss of the first consonant in the intervocalic cluster for all words with the [ljk] combination. The results can be used to improve existing automatic speech recognition systems, as well as in teaching Russian as a second language.
Keywords: Russian speech, consonant clusters, reduction, Russian as a foreign language, children's speech.
устная речь частотные слова согласные интервокальные сочетания
Введение. Предпосылки исследования
За последние 20 лет было опубликовано немало исследований, в которых отмечается необходимость изучения естественной устной речи как для понимания того, каким образом происходят процессы порождения и восприятия речи, так и для решения практических задач, связанных с автоматическим распознаванием и синтезом звучащего речевого сигнала (см., напр., [Jurafsky et al. 2000; Богданова 2001; Скрелин, Щербаков 2003; Кипяткова и др. 2013; Ernestos, Tucker 2016] и др.). Под естественной речью во всех этих работах прежде всего подразумевается неподготовленная по форме, спонтанная речь (casual speech), т. е. та речь, которую мы чаще всего порождаем и воспринимаем в ходе повседневного общения. Фонетическая неполнота, которая свойственна спонтанной речи в большей степени, чем подготовленной, ставит перед психолингвистами новые вопросы, касающиеся механизмов соотнесения фрагментов речевого сигнала с единицами ментального лексикона, а также является причиной ошибок автоматических систем распознавания речи.
На настоящий момент наиболее эффективными считаются интегральные (end-to-end) системы автоматического распознавания речи, которые «позволяют использовать глубокие нейронные сети (DNN)» [Марковников, Кипяткова 2019: 71]. Однако такие модели требуют для обучения большого объема материала, т. е. звучащих текстов [Марковников, Кипяткова 2019: 71]. Корпусы естественной русской устной речи начали создаваться только около 15 лет назад. На сегодняшний день общедоступными являются следующие из них: корпусы, собранные в рамках проекта «Рассказы о сновидениях и другие корпуса звучащей речи» [Рассказы о сновидениях], устный и мультимедийный подкорпусы Национального корпуса русского языка [Мультимедийный НКРЯ; Устный НКРЯ], Корпус русской устной речи, разрабатываемый в СПбГУ [Корпус русской устной речи], корпус, созданный в Лаборатории экспериментальной фонетики СПбГУ [Характеристика сегментных и просодических единиц]. Одним из наиболее существенных недостатков всех перечисленных корпусов с точки зрения современных подходов к автоматическому распознаванию речи является их ограниченный объем и жанровая специфика. Единственным достаточно представительным корпусом на данный момент можно считать корпус «Один речевой день» [Bogdanova-Beglarian et al. 2016], но он пока не является общедоступным. Как следствие, для обучения и тестирования автоматических систем распознавания русской речи по-прежнему используются специально подготовленные тексты (см., напр., [Потапова, Потапов 2018; Kipyatkova 2018: 296]), поэтому «большая часть современных речевых приложений рассчитана на голосовое управление техническими системами, для использования которых диктору приходится идти на ряд ограничений по стилю речи» [Кипяткова и др. 2013: 53]. По всей видимости, снять эти ограничения можно будет только тогда, когда автоматические системы распознавания научатся обрабатывать естественный речевой сигнал. О том, что только полный тип произнесения не встречается в обычной речи, писал еще Л. В. Щерба [Щерба 1957], поэтому трудно согласиться с выдвинутым в ряде работ тезисом о том, что из-за недостаточной четкости артикуляции звуков в спонтанной речи «за нормативное произношение для статистических измерений следует принять полный тип произнесения» [Потапова 2016: 142]. Однако задача сбора и аннотирования представительных корпусов спонтанной речи, объема которых было бы достаточно для обучения и тестирования нейронных сетей, является ресурсозатратной, поэтому решением на пути к совершенствованию автоматических систем распознавания речи может стать последовательное пошаговое описание функционирования отдельных составляющих системы спонтаннойречи, а именно то, как в ней реализуются те или иные сочетания звуков в определенных словах или фонетических позициях. Применение такого подхода к автоматическому синтезу речи, приближенной к разговорной, продемонстрировано в [Лобанов, Цырульник 2008], где приводится ряд преобразований «буква-фонема» и «фонема-аллофон», учет которых должен способствовать синтезированию более естественной речи.
Обоснование выбора объекта исследования
Поскольку объем записей русской спонтанной речи, находящихся в нашем распоряжении на сегодняшний день, ограничен, разработку правил редуцирования, которыми пользуется носитель языка и которые могут быть использованы для моделирования речевой деятельности и обучения языку, разумно начинать с тех явлений, которые типичны для устной речи, т. е. встречаются часто.
Многочисленные исследования показывают, что в наибольшей степени фонетической редукции подвержены частотные слова [Александров, Гейльман 1986; Земская 1973; Bybee et al. 1994: 19-21; Jurafsky et al. 2000; Богданова 2007; Касаткина 2007; и др.]. Среди часто редуцируемых слов можно выделить те, которые имеют общие фонетические особенности, а именно сходную слоговую и/или ритмическую структуру, одинаковые последовательности гласных или согласных. Гласные менее устойчивы к редукции в русской устной речи, чем согласные: они чаще подвергаются качественной и количественной редукции, происходят замены гласных, в том числе ударных; во многих случаях в безударной позиции определение качества гласного вызывает затруднения [Nigmatulina et al. 2016: 178-179]. В связи с этим представляется, что фонетические процессы, касающиеся согласных, для которых не характерна такая вариативность, проще поддаются алгоритмизации. Кроме того, как показывают результаты экспериментов на материале русского языка, именно по согласным носитель языка в случае необходимости восстанавливает редуцированное слово [Риехакайнен 2016].
Считается, что модификации согласных в спонтанной речи способствуют следующие факторы: 1) «встречаемость в частых словах или морфемах»; 2) «нахождение согласного в интервокальной позиции»; 3) положение в середине слова [Све- тозарова 1988: 28-29]. По этой причине в рамках статьи решено было рассмотреть, как реализуются интервокальные консонантные кластеры, которые встречаются в середине нескольких частотных слов русского языка и о которых из предыдущих исследований (см., напр., [Светозарова 1988: 240-245; Стойка 2017] и др.) известно, что они могут подвергаться фонетической редукции в частотных словах. А именно анализируется употребление слов, содержащих сочетания согласных [gd]1 (когда, тогда, всегда, иногда, никогда) и [ljk] (только, сколько, столько, несколько, настолько, насколько). Несмотря на то что многие из этих слов упоминаются в исследованиях редукции в русской устной речи, до сих пор отсутствуют количественные данные, опираясь на которые, можно было бы говорить о том, какие варианты реализации указанных сочетаний являются наиболее частотными в русской речи и какие факторы влияют на выбор того или иного варианта произнесения. Таким обра- Здесь и далее транскрипция приводится в символах Международного фонетического алфавита. зом, цель исследования заключается в выявлении закономерностей употребления сочетаний согласных [gd] и [ljk] в выбранных частотных словах.
Задачи и гипотезы исследования
Задачи и гипотезы исследования были сформулированы исходя из тех факторов, которые, на наш взгляд, могут влиять на произнесение сочетания согласных. Мы разделили эти факторы на внутренние и внешние.
К внутренним факторам мы отнесли частотность слов, их слоговую и ритмическую структуру. В наших предыдущих исследованиях было показано, что в словах типа ходит, водит, гладит частотность слова влияет как на вероятность полной количественной редукции интервокального [dj], так и на то, насколько успешно словоформа с такой редукцией будет восстанавливаться носителем языка при отсутствии достаточного контекста [Риехакайнен 2016: 178-180, 185-188]. Поэтому мы предположили, что этот фактор может оказаться существенным и для интервокальных консонантных кластеров, а не только для одиночных смычных согласных. Частотность всех анализируемых слов была проверена по устному подкорпусу Национального корпуса русского языка [Устный НКРЯ]. Хотя в данном корпусе нет возможности прослушать звук и не представлена фонетическая транскрипция, по объему он является самым представительным из тех корпусов русской устной речи, которые находятся в открытом доступе (его объем -- 12 243 660 словоупотреблений). Данные о частотности рассматриваемых в статье слов представлены в таблице 1 (частотность приводится в ipm -- количестве словоупотреблений на 1 млн вхождений).
Таблица 1. Частотность анализируемых слов
|
Группа с сочетанием [gd] |
Группа с сочетанием [ljk] |
|||
|
Слово |
Частотность, ipm |
Слово |
Частотность, ipm |
|
|
когда |
2454 |
только |
2410 |
|
|
тогда |
1235 |
сколько |
662 |
|
|
всегда |
689 |
несколько |
366 |
|
|
никогда |
439 |
столько |
190 |
|
|
иногда |
228 |
насколько |
150 |
|
|
настолько |
89 |
Отобранные слова различаются по частотности, поэтому в ходе исследования можно будет проверить гипотезу о влиянии частотности слова на вероятность возникновения редукции в рассматриваемом сочетании согласных.
В первой группе ударение во всех словах падает на последний слог, но представлены как двусложные, так и трехсложные слова, поэтому можно проверить гипотезу о влиянии количества слогов на вероятность возникновения редукции. Однако необходимо сразу обратить внимание на то, что в данной группе трехсложными являются наименее частотные слова. Соответственно, если эти два слова будут отличаться от остальных, сложно будет установить, какой именно фактор -- частотность или количество слогов -- оказал большее влияние. Во второй группе представлено по три двусложных и трехсложных слова. Кроме того, в слове несколько в отличие от настолько и насколько ударение падает на первый слог, поэтому на трехсложных словах можно попытаться проверить гипотезу о влиянии места ударения на реализацию сочетания согласных. Во всех двусложных словах ударение падает на первый слог.
К внешним факторам, которые могут оказывать влияние на степень редукции слов в устной речи, можно отнести различные контекстные факторы (прежде всего позицию во фразе), индивидуальные особенности говорящих (результатом чего могут являться единичные необычные реализации), а также влияние типа речи (естественная устная речь или подготовленная (напр., чтение)). Фактор индивидуальных особенностей говорящих среди прочего включает в себя и возраст информантов, а также их уровень владения языком. Как правило, описательные исследования естественной устной речи проводятся на взрослых здоровых носителях языка. Однако для совершенствования автоматических систем распознавания речи очевидна необходимость привлечения речевого материала, полученного от других групп информантов. Примерами таких групп могут быть дети -- носители языка, а также иностранцы, изучающие русский язык. В практическом плане важность изучения речи именно этих двух групп не вызывает сомнений, потому что нередко именно дети и иностранцы, которым проще озвучить сообщение, чем напечатать его, обращаются к голосовым помощникам для решения повседневных задач. Кроме того, описание речи тех, кто находится в процессе овладения языком, может приблизить исследователей к ответам на вопросы, касающиеся устройства ментального лексикона говорящего и слушающего, а также процесса обработки естественной устной речи человеком. В первую очередь это касается обсуждения статуса редуцированных реализаций в ментальном лексиконе носителя языка (хранятся ли они в нем в качестве самостоятельных вариантов и, если да, как они туда попадают) [Венцов 2014]. Однако лингвистических исследований, в которых бы описывались фонетические особенности детской речи или речи иностранцев, изучающих русский язык, чрезвычайно мало.
В отечественной онтолингвистике внимание уделяется преимущественно тому, в какой последовательности и на каком этапе ребенок овладевает различными звуками и их комбинациями, при этом до последнего времени наиболее популярным материалом оставались дневниковые записи, которые могут дать информацию о речи только отдельно взятых детей (см., напр., [Елисеева 2008; Рыко 2018] и др.). Представляется, что провести сравнение и сделать обобщение по такому материалу чрезвычайно сложно. Искажения фонетической структуры слова в детской речи, как правило, интересуют логопедов, однако они в своей практической деятельности в качестве эталона используют преимущественно речь взрослых носителей языка в полном произнесении. Анализ речи иностранцев, изучающих русский язык, -- это одно из развивающихся направлений современной коллоквиалистики и психолингвистики, однако эти дисциплины анализируют прежде всего фонетические аспекты, связанные с организацией дискурса в целом, поэтому рассматриваются, например, такие явления, как хезитации (см. [Чэн 2017; Прокаева 2019] и др.).