Среди морфем, указывающих на место падения ударения на первом слоге, выделяют: -менн- (нимзменный), -нин (брамтнин, мумжнин, зямтнин, демвернин, домчернин), -унск- (вымксунский). Две из этих морфем представлены только небольшими группами слова (-менн- и -унск-).
В случаях, указывающих на однозначное ударение на корне, была выделена одна морфема -ч- (пимсчий, ломвчий, кумпчий, гомнчий, пемвчий, комсчий) и одно морфемное образование за-...-анн- (запламканный, зарёванный, но замспанный).
Было выделено 5 морфем и 13 морфемных образований, указывающих на падение ударения на предсуффиксальный слог. Морфемы: -ем- (изменямемый, обтекамемый, осязамемый, угрожамемый, обитамемый), -ишн'- (бумднишний), -ом- (весоммый, знакоммый), -отн- (мемшкотный), -ственн- (двомйственный, тромйственный, сомбственный, демйственный, прочумвственный, отвемтственный, благодамрственный, но недумрственный, приямтельственный, ямвственный), без-...-тельн- (безотносимтельный, бездоказамтельный, безотлагамтельный). Морфемные образования: без-...-тельн- (безотносимтельный, бездоказамтельный, безотлагамтельный), вдоль-...-н- (вдольрямдный), до-...-н- (досломвный), не-...-ем- (незабывамемый, неиссякамемый, несгибамемый, несмолкамемый), не-...-чив- (неотвямзчивый), об-...-н- (обшимрный), при-...-ист- (приземмистый), про-...-лив- (прожомрливый), противо-...-очн- (противозачамточный), раз-...-ист- (разлампистый), рас-...-н- (расторомпный), чрез-...-н- (чрезмемрный). Из них 10 морфемных образований представлены только небольшими группами слов (вдоль-...-н-, до-...-н-, не-...-чив-, об-...-н-, при-...-ист-, про-...-лив-, противо-...-очн-, раз-...-ист-, рас-...-н-, чрез-...-н-).
Среди случаев, указывающих на однозначное ударение на суффиксе, выделяют 35 морфем и морфемных комплексов: -ав- (кровамвый, ржамвый, величамвый, моложамвый), -анск- (фихтеамнский, ницшеамнский), -арн- (одинамрный), -аст- (зубамстый, глазамстый, цветамстый), -ат- (усамтый, бородамтый, сопамтый, седамтый), -ацк- (хохламцкий), -ач- (лежамчий, кусамчий), -ащ- (пропамщий), -ебн- (лечембный, хвалембный, целембный), -евн- (душемвный, плачемвный, но дневномй), -евск- (кремлемвский), -ейн- (швемйный, плетемйный), -ейск- (гвардемйский, милицемйский, судемйский), -елив- (горделимвый), -ельн- (смертемльный, но пламтельный), -ецк- (простемцкий, неважнемцкий, мировемцкий, славнемцкий), -ийск- (артиллеримйский, латвимйский, буддимйский, гарибальдимйский), -им- (ощутиммый, примениммый, допустиммый, выполниммый), -имск- (уфиммский), -ит- (именимтый), -лезск- (анголемзский, конголемзский, тоголемзский), -ляв- (писклямвый, трухлямвый, костлямвый, вертлямвый), -обн- (съедомбный), -ощав- (худощамвый, сухощамвый), -уч- (жгумчий, плакумчий, скрипумчий), -ущ- (имумщий, загребумщий, большумщий), -эзск- (генуэмзский), -юч- (холоднюмчий, вонюмчий), -ющ- (толстюмщий, хитрумщий, длиннюмщий), -яв- (слюнямвый, кудрямвый, чернямвый, смуглямвый), -як- (всямкий, двоямкий, троямкий), -янск- (вольтерьямнский, лассальямнский, гегельямнский), -яст- (ноздрямстый, туфлямстый), -яч- (ходямчий, висямчий, стоямчий), -ящ- (болямщий, гулямщий, работямщий) и 6 морфемных образований: не-...-ив- (незлоблимвый), не-...-им- (невозвратиммый, невыносиммый, неизгладиммый), не-...-уч- (неминумчий), не-о-...-им- (необориммый), не-пре-о-...-им- (непреобориммый, непреодолиммый), среди-...-евн- (средиднемвный). Из них следующие морфемы и комплексы представлены лишь небольшими группами слов (-арн-, -ацк-, -елив-, -имск-, -ит-, -эзск-, не-...-ив-, не-...-уч-, не-о-...-им-, не-пре-о-...-им-, среди-...-евн-).
Также были рассмотрены морфемы, указывающие на однозначное ударение на первом и втором слоге суффикса - 16 и 11 случаев соответственно. Случаи падения ударения на первый слог суффикса представлены 15 морфемами: -абельн- (рентамбельный, коммуникамбельный, читамбельный), -ачий (индюшамчий, кошамчий, медвежамчий), -енек (тяжелемнек), -ибельн- (смотримбельный, носимбельный), -ированн- (экзальтимрованный, эрудимрованный, но привилегиромванный), -ительн- (впечатлимтельный, куримтельный, извинимтельный), -овенн- (солодомвенный), -овий (воломвий, кротомвий, слономвий), -онек- (далекомнек, долгомнек), -охоньк- (легомхонький), -ошеньк- (легомшенький), -усеньк- (такумсенький), -юсеньк- (малюмсенький, тонюмсенький), -янн- (деревямнный, оловямнный, стеклямнный), -ическ- (аналитимческий, каталитимческий, генетимческий, областнимческий) и одним морфемным комплексом: за-...-ованн- (заспиртомванный, закамышомванный, зашифромванный). Морфема -овенн- представлена лишь небольшой группой слов.
В случае падения ударения на второй слог суффикса было выделено 9 морфем: -еват- (кудревамтый, пылевамтый, оранжевамтый), -евит- (глянцевимтый), -иальн- (приципиамльный, бронхиамльный), -ианск- (соссюриамнский, кантиамнский, фейербахиамнский), -истическ- (табуистимческий), -овал- (годовамлый), -оват- (сиповамтый, слабовамтый, грубовамтый), -овит- (башковимтый, мозговимтый, мастеровимтый), -ональн- (профессионамльный, национамльный), 2 морфемных комплекса: под-...-оват- (подслеповамтый), про-...-оват- (продолговамтый). Из них морфемы -истическ-, -овал-, под-...-оват-, про-...-оват- представлены только небольшими группами слов.
3.4.3. Морфемы глаголов, указывающие на место ударения
В ходе исследования было рассмотрено поведение 154 морфем и морфемных образований глаголов (из них 23 суффикса, 40 префиксов и 91 префиксально-суффиксальный образований). В состав морфем также вошли их возможные сочетания с постфиксом -ся. Было выделено 50 морфем (32% от всего их количества), которые способны однозначно указывать на ударение в слове. Ниже рассмотрены следующие места возможного падения ударения в глаголах: на префикс, на корень, на предсуффиксальный слог и на суффикс.
Среди случаев, однозначно указывающих на падение ударения на префикс, была выделены морфема вы- (вымделить, вымписать) и 3 морфемных образования: вы-...-е- (вымзвездеть, вымтолщеть), вы-...-и- (вымместить), вы-...-ся (вымговориться, вымплакаться, вымспаться). Одно морфемное образование (вы-...-е-) из них представлено лишь небольшой группой слов.
Случаи, однозначно указывающие на падение ударения на корень, представлены тремя морфемными комплексами: с-...-и-...-ся (смимлостивиться, скапумтиться, скопымтиться), обез-...-е- (обездемнежеть, обезрымбеть, обезживомтеть), обез-...-и- (обезгламвить), среди которых образование с-...-и-...-ся представлено ограниченной группой слов.
На ударение в предсуффиксальном слоге однозначно указывает морфема -ка- (омйкать, вамнькать) и 16 следующих морфемных комплексов: за-...-и-...-ся (заимлиться, запаутимниться), из-...-и-...-ся (изнесчамститься, но изловчимться), при-...-ива-ся (придумриваться), вы-...-ива- (вызвамнивать), на-...-ива- (назвамнивать, накрумчивать, накрампывать), об-...-и-ся (обынтеллигемнтиться, объякумтиться), от-...-ива- (отплямсывать, отстумкивать, отсвемчивать, но откумпоривать), пере-...-ива- (перезвамнивать, перестумкивать), пере-...-ива-ся (переговамриваться, перезвамниваться, перекримкиваться), по-...-и-...-ся (посчастлимвиться, повитамимниться), по-...-ива- (побамливать, повимзгивать, подемргивать), под-...-ива- (подпамхивать, поддрамзнивать, подкамшливать), при-...-ива- (приговамривать, прикрямкивать), раз-...-ива- (разгумливать, но разжамлобливать), рас-...-ива- (раскумривать, расхамживать), у-...-и-...-ся (улетумчиться, удосумжиться), из них к небольшой группе слов относится 3 морфемных комплекса (за-...-и-...-ся, из-...-и-...-ся, при-...-ива-ся).
Среди случаев, однозначно указывающих на ударение на суффиксе, было выделено 7 морфем: -ану- (резанумть, мазанумть, секанумть), -и- (белимть, грузимть, даримть, дружимть, душимть, женимть, кормимть, косимть, крестимть, крошимть, кружимть, мочимть, мутимть, светимть, сердимть, солимть, ссудимть, сушимть, тупимть, хвалимть, двоимть, троимть), -ирова- (гримировамть, лакировамть, маршировамть), -ова- (адресовамть, титуловамть), -изирова- (автоматизимровать, витаминизимровать, механизимровать), -изова- (авторизовамть, стилизовамть), -я- (ровнямть, закреплямть, наполнямть), и 19 морфемных образований: а-...-ся (братамться, женихамться, нуждамться), -е-...-ся (виднемться), на-...-и-...-ся (наловчимться, накогтимться), -ова- (адресовамть, титуловамть), -ова-...-ся (почковамться, рубцевамться, столовамться), в-...-и-ся (вцепимться), вс-...-ну-ся (встрепенумться), за-...-а- (завожжамть, зауздамть, запоздамть), за-...-ну- (заснумть), о-...-а- (опоздамть, обеднямть), об-...-а- (обуздамть), пере-...-ова- (перефразимровать), по-...-а- (получшамть, потоньшамть, построжамть), про-...-ну-ся (проснумться), у-...-а- (утоньшамть), о-...-ну- (ополоснумть), при-...-ну- (прихворнумть, придремнумть, прилгнумть), про-...-ну- (простирнумть), с-...-ну- (сболтнумть, сгрустнумть, сполоснумть), у-...-ну- (уснумть). При этом практически все морфемные комплексы представлены небольшими группами слов.
4. МЕТОД
4.1 Алгоритм работы программы
В этой главе описывается алгоритм работы системы, созданной по итогам теоретической части исследования и способной автоматически расставлять ударение в тех словах, которые содержат в своём составе морфемы, однозначно указывающие на позицию ударения в слове. Программа реализована на языке Python 3 с использованием вспомогательных модулей, необходимых для токенизации текста (модуль nltk), определения грамматических характеристик и леммы слова (модуль pymorphy2), работы с текстом с помощью регулярных выражений (модуль re), создания пользовательского интерфейса (модуль flask), а также некоторых других дополнительных модулей.
В основе работы программы лежит морфемный подход, реализованный с помощью списков, содержащих полный список морфем, которые способны однозначно выделить ударный слог словоформы. Структура списков сформирована в соответствии с акцентными типами и стратегией поведения ударения в слове так же, как это было изложено в разделе «Морфемы, указывающие на поведение ударения». Для каждой из трёх рассматриваемых частей речи была собрана база, содержащая списки слов, являющиеся исключениями из описанных в списках правил.
Алгоритм работы программы условно разделяется на следующие этапы:
1. подготовка к работе и предобработка текста;
2. определение части речи и грамматических характеристик;
3. выделение морфемного состава начальной формы слова;
4. определение места ударения в словоформе в соответствии с акцентным типом слова;
5. обработка исключений.
В первую очередь система извлекает информацию о правилах в морфемах внутри каждой из частей речи, хранящуюся в виде списков внутри специальных директорий. Программа позволяет как определять позицию ударения в отдельных словах, так и расставлять ударения в рамках целого текста. На этапе предобработки производится токенизация текста, реализованная с помощью модуля nltk, в ходе которой текст разбивается на отдельные словоформы, последовательно обрабатывающиеся в ходе дальнейшей работы программы.
Для каждой такой словоформы автоматически определяется её часть речи, все грамматические характеристики, а также устанавливается начальная форма лексемы. Информация обо всех этих данных собирается с помощью дополнительной библиотеки pymorphy2, отвечающей за морфологический анализ языка. В случае возможной омонимии обрабатывается лексема, предложенная модулем первой. Так, при определении начальной формы в словоформе стали возможны 6 различных разборов, один из которых относит лексему к категории глагола, а остальные 5 ? к категории существительных в разных падежах. Поскольку вариант, относящий словоформу к категории глагола, предлагается модулем в первую очередь, система расстановки ударений сосредотачивается именно на этом варианте. На этом этапе не исключена вероятность ошибки, продиктованная невозможностью однозначно определить значение слова. Действительно, для определения точного значения словоформы потребовался бы контекстный анализ предложения, а также дополнительные инструменты для семантического анализа, что представляет собой отдельную масштабную задачу.