Правительство Российской Федерации
Федеральное государственное автономное образовательное учреждение высшего образования
Национальный исследовательский университет
«Высшая школа экономики»
Факультет гуманитарных наук
Образовательная программа «Компьютерная лингвистика»
Липунова Александра Евгеньевна
Анализ поведенческих особенностей ударения в русском языке в зависимости от морфемного состава слова
Выпускная квалификационная работа
студента 2 курса магистратуры группы МКЛ161
Москва 2018
Оглавление
1. Введение
2. Обзор литературы и существующие подходы и решения
2.1 Теоретические аспекты поведения ударения в русском языке
2.1.1 Основные свойства ударения
2.1.2 Вариативность ударения
2.1.3 Поведение ударения в разных частях речи
2.1.4 Отражение акцентной нормы в орфоэпических словарях
2.1.5 Связь места ударения и морфемного состава слова
2.2 Практические реализации расстановки ударений
2.2.1 Практические реализации расстановки ударений в русском языке
2.2.2 Практические реализации расстановки ударений в других языках
3. Морфемный подход к постановке ударения
3.1 Теоретическая база исследования
3.2 Акцентные типы в разных частях речи
3.2.1 Акцентные типы имён существительных
3.2.2 Акцентные типы имён прилагательных
3.2.3 Акцентные типы глаголов
3.3 Применимость морфемного подхода
3.4 Морфемы, указывающие на поведение ударения
3.4.1 Морфемы имён существительных, указывающие на место ударения
3.4.2 Морфемы имён прилагательных, указывающие на место ударения
3.4.3 Морфемы глаголов, указывающие на место ударения
4. Метод
4.1 Алгоритм работы программы
4.2 Пути улучшения алгоритма
5. Анализ качества системы
5.1 Создание базы данных с золотым стандартом слов
Заключение
Список источников
Приложение 1
Приложение 2
Приложение 3
Приложение 4
Приложение 5
1. ВВЕДЕНИЕ
ударение русский морфемный программа
Ударным элементом в русском языке называется такой элемент, который характеризуется наибольшей силой, отчётливостью и длительностью произношения. В зависимости от того, идёт ли речь о логическом или словесном ударении, элемент может быть группой слов, отдельным словом или слогом в слове. В рамках этого исследования мы сосредоточимся на исследовании словесного ударения.
Ударение - один из ключевых компонентов звуковой структуры слова. Для определения значения слова недостаточно обладать знанием о его фонемном составе. Словесное ударение является неотъемлемым признаком слова, поскольку в подавляющем большинстве случаев именно ударение может послужить маркером того, какое именно значение закладывается в слово говорящим. Во многих языках ударение является фиксированным, иными словами, его место чётко закреплено за определённым слогом в слове. Так, например, в французском языке ударение практически всегда падает на последний слог слова, в польском - на предпоследний слог, а в чешском языке - на первый слог. В отличие от этих и некоторых других языков, в русском языке отсутствует чёткая система правил, регламентирующих место постановки ударения в слове. Саму суть русского ударения можно описать следующими свойствами:
1. Разноместность или свободность русского ударения. Иными словами, ударение не закреплено за одним определенным слогом слова и может находиться на любом из его слогов. Как отмечал известный советский учёный Рубен Иванович Аванесов: «Разноместность ударения делает его в русском языке индивидуальным признаком каждого отдельно взятого слова».
2. Подвижность русского ударения. При изменении грамматической формы одного и того же слова (рода, числа, падежа и т.д.) или при образовании родственных слов ударение может как сместиться на другой слог слова, так и остаться на той же гласной в слове (ср.: стомл - столб, сиротам - сиромты, пунял - понялб, замговор - договомр; товамрищ - товамрища, вимдишь - вимдевший).
Из подвижности русского ударения также следует необходимость запоминать не только ударение в самом слове, но и ударение во всех его словоформах. Однако, как отмечалось в (Липунова, 2017), «нельзя утверждать, что способность носителей русского языка правильно определить место ударения основана лишь на запоминании словоформ, поскольку количество словоформ огромно. Кроме того, средний русский человек без труда сможет поставить ударение и в практически любом незнакомом ему слове. Отсюда можно сделать вывод, что бытовые, повседневные слова, безусловно, запоминаются носителем вместе с ударением, однако при необходимости поставить ударение в словах менее тривиальных задействуются правила системы ударений русского языка, выученные носителем на примере других слов. Из этого явно следует, что существуют определенные закономерности в том, как устроена акцентуация в русском языке. Тем не менее, современное русское ударение организовано чрезвычайно сложно и все его закономерности не могут быть сформулированы в виде набора простых фраз или тезисов, покрывающих всю систему ударений в русском языке».
Тем не менее, в системе акцентуации русского языка можно обнаружить тенденции и факторы, которые способны указать на местоположение ударения в слове. Одним из таких факторов является морфемный состав слова. Согласно закону аналогии, некоторые элементы языка способны образовывать продуктивную и более распространённую модель и влиять на элементы, схожие с элементами этой модели, но пока не включённые в неё. Каждый новый элемент языка присоединяется к языковой системе по уже сформированным моделям. К примеру, заимствованные слова в русском языке при включении в языковую систему принимают категории рода и склонения даже в том случае, если в языке, из которого слово заимствуется, такие категории отсутствуют. Система ударений также подчиняется закону аналогии. Так, заимствованные слова включаются в языковую систему с тем ударением, которое распространено в языке-источнике, но впоследствии уподобляются фонетически близким к ним словам. При возникновении новый языковых тенденций, ? к примеру, при смещении ударения к концу слова в определённом классе слов, ? сперва ударение смещается лишь у небольшой группы слов, но со временем все большее количество слов принимает новую систему ударений, подчиняясь закону аналогии.
В области акцентуации формирование моделей напрямую завязано на морфемный состав слов. Таким образом, из самой структуры слова можно получить информацию об общих тенденциях и правилах постановки ударения у целых классов слов.
Цель проводимого исследования ? создать полный обзорный анализ места расположения ударения в слове в зависимости от его морфемного состава среди основных частей речи в русском языке (глаголов, имён существительных и прилагательных). В рамках этой цели можно выделить следующие задачи:
? Формирование полного списка морфем для каждой из частей речи;
? Сбор информации о месте ударения в словах с определённым набором морфем;
? Анализ получившихся результатов;
? Создание автоматической системы, способной в случае обнаружения в слове морфем, однозначно указывающих на место положения ударения, выделить ударную гласную.
Объект исследования ? морфемика и система ударений русского языка, а предмет ? зависимость места ударения от его морфемного состава. В рамках исследования применяются такие методы, как: теоретический анализ, наблюдение, методы индукции и дедукции.
Функция автоматического определения места постановки ударения в русскоязычных текстах востребована в области компьютерной лингвистики, в частности, в системах синтеза речи и в системах распознавания и генерации стихотворных текстов. Также она может быть полезна и в других областях, например, при разработке акцентуированных текстов для обучения иностранных студентов русскому языку. Несмотря на значительные достижения учёных в области русской акцентологии, теория просодии является наименее исследованной разделом фонологии; многие проблемы описательной и теоретической акцентологии остаются нерешенными до сих пор. В частности, комплексные исследования в области выявления зависимостей между ударной позицией слова и его морфемным составам практически не проводились ранее. Это делает подобное исследование чрезвычайно актуальным.
Новизна исследования заключаются в том, что ранее не существовало системы, которая описывала бы всю систему зависимостей позиции ударения от морфемного состава слова. Впоследствии материал, полученный в ходе исследования, можно будет использовать в качестве базы для анализа других особенностей поведения морфем, а также для систематизации знаний об ударении в русском языке. Это обуславливает научную значимость данной работы.
Практическая значимость обуславливается тем, что по результатам исследования будет создан готовый продукт, способный разделять слово на морфемы и предсказывать место ударения в зависимости от того, обнаружились ли в слове морфемы, однозначно указывающие на положение ударения в слове. Кроме того, система будет способна объяснить, чем обусловлена ударная позиция гласного в слове. Это может быть использовано иноязычными студентами при изучении русского языка, а также может лечь в основу систем, в рамках которых необходима информация об ударении в слове.
В теоретическую основу дипломной работы легли материалы «Русской грамматики» (Грамматика, 1980), а также материалы книги «От праславянской акцентуации к русской» (Зализняк, 1985). В этих трудах описаны тенденции поведения ударения при разном наборе морфем в слове.
Структура дипломной работы обусловлена целью и задачами исследования. Работа состоит из введения, четырёх глав и заключения.
2. ОБЗОР ЛИТЕРАТУРЫ И СУЩЕСТВУЮЩИЕ ПОДХОДЫ И РЕШЕНИЯ
Эта глава состоит из двух частей: обзора лингвистической литературы, посвященной функционированию русского ударения, и обзора прикладных систем определения места ударения в русском и других языках.
2.1 Теоретические аспекты поведения ударения в русском языке
2.1.1 Основные свойства ударения
Ранее были описаны два ключевых свойства русского ударения, такие как разноместность и подвижность. Систематическое описание этих явлений содержится в «Русской грамматике» (Грамматика, 1980), а также легло в основу грамматического словаря А. А. Зализняка (Зализняк, 1977). Поскольку русское ударение разноместно, оно является индивидуальным признаком каждого слова и выполняет словоразличительную функцию. Ударение в русском языке способствует правильному толкованию омографов: слов, обладающих одинаковым написанием, но имеющих различное произношение. Такие слова могут возникать как при совпадении написания у слов, обладающих разным значением (ср.: атламс ? амтлас), так и между разных грамматических форм одного и того же слова (ср.: делам ? демла). В некоторых случаях оно также помогает различать дополнительные смысловые оттенки слова, к примеру, зумбчатый (похожий на зуб) и зубчамтый (состоящий из зубцов).
Отдельно стоит упомянуть слова, включающие в свой состав букву «ё», которая в настоящее время на письме очень часто заменяется буквой «е». В таких случаях может возникнуть ситуация, когда подобное слово при написании его с буквой «е» становится омографом другому слову (ср.: бемрег - берёг). Кроме того, существуют пары слов, которые точно также отличаются друг от друга наличием буквы «ё» в одном из слов, но ударение в них падает на один и тот же слог, а в зависимости от буквы меняется смысл слова (ср.: всем и всё, нембо и нёбо). Подробную информацию о явлении омографии и разных видах омографов можно получить из трудов (Барбук, 2013) и (Голев, 1999).
Свойства русского ударения не ограничиваются явлениями подвижности и разноместности. К примеру, во многих сложных словах может присутствовать не только основное, но и побочные ударения (веМчнозелёный, дМевятьсомт, аМвтомоМтоклумб). Помимо сложных слов побочное ударение может присутствовать в сложносокращенных словах (меМдсаМнчамсть, гоМсбамнк), в словах с рядом неодносложных приставками (аМнтиобщемственный, свеМрхпримбыль), а также в некоторых словах иноязычного происхождения (поМстскримптум). Тема побочного ударения затрагивается в работе «Современный русский язык. Активные процессы на рубеже XX-XXI веков» (Крысин, 2008), в которой автор отмечает явление акцентирования первых основ сложных слов и приводит ряд примеров, а также разбирает изменения, произошедшие в акцентуации сложных слов с середины XX века. Кроме того, тема побочного ударения широко освещается во второй главе книги «Просодический строй русской речи» (Каленчук, Касаткина, 1996).
Все слова в русском языке имеют своё ударение, однако в ряде случаев при примыкании одного слова к другому одно из них может стать неударным. Так происходит, например, при примыкании предлогов или частиц к именам существительным или числительным, причём безударным может становится как предлог (на домум), так и самостоятельная часть речи (нам дом). Этой тематике полностью посвящена статья «Stress Retraction in Phrases of the Type нб день, зб сорок, нй был in Modern Russian» (Ukiah, 1998), в которой на примере нескольких словосочетаний разбирается тенденции поведения ударения. Эта тема также освещается в (Крысин, 2008). Автор подробно разбирает случаи поведения ударения на разных языковых примерах, перечисляя как случаи уже закрепившихся в языке вариантов ударения, так и случаи, в которых допускается несколько вариантов ударения (нам год - на гомд, зам зиму - за зимму и др.). Согласно Л. П. Крысину, во всех подобных словосочетаниях «наблюдается одна отчетливо обозначенная тенденция ? отказ от исключений, от идиоматики в акцентуации, подчинение всех случаев сочетаний предлогов со знаменательными словами общему правилу безударного произношения предлогов» (Крысин, 2008: 379).