Инструменты корпусного анализа в обучении иностранному языку
О.Г. Горина
Рассматриваются инструменты корпусного анализа, обосновывается целесообразность привлечения их к обучению иностранному языку, раскрывается лингвометодический потенциал корпусного инструментария при формировании лингвистической компетенции, описываются пути интеграции корпусных исследований в процесс обучения. Приводятся примеры корпусных заданий. Используются материалы англоязычных лингвистических компьютерных корпусов.
Ключевые слова: корпусная лингвистика; корпусная лингвостатистика; корпусные инструменты лингвистического анализа; корпусная компетенция; конкорданс; коллокации; семантическая просодия; лексическая плотность; статистическая наглядность; английский язык.
Введение
Сегодня использование корпусов в лингводидак- тике еще только складывается. Однако целесообраз-ность содружества методики и лингвостатистики отмечалась многими авторами, начиная от И.В. Рахманова [1] и заканчивая сегодняшними корпусными лингводидактами (Н.Б. Гвишиани [2], R. Carter [3], D. Biber, R. Reppen [4, 5] и др.). Совершенно разумно, что достижения и наработки корпусной лингвистики, появление которой явилось значительным событием в истории науки, не может и не должно оставаться в рамках одной науки лингвистики. Одним из первых результатов интеграции корпусных методов стало изменение технологий создания словарей, вслед за которыми последовали значительные трансформации учебных материалов. Ни одно из уважаемых изданий учебной литературы на сегодняшний день уже не может обходиться без корпусов при отборе содержания учебника, устранения рассогласованности между содержанием обучения и объектами контроля, а также анализа ошибок обучаемых для непрерывного уточнения содержания обучения. Корпус как эффективная справочная система стал одним из обязательных форматов представления языковых данных в совокупности с более традиционными грамматиками и словарями. Более того, очевидно, что традиционный методический принцип наглядности под воздействием корпусных грамматик сегодня превращается в принцип статистической наглядности. Визуализация лингвостатистических результатов в виде гистограмм, графиков и словарных облаков стала неотъемлемой частью не только словарей, но и современных учебников английского языка. Таким образом, вслед за корпусной трансформацией в практике создания словарей существенно изменилась технология создания лингвометодических материалов, а также наметились новые лингвостатистические тенденции в способах предъявления языковой информации в учебной литературе.
Вместе с тем практика применения корпусных инструментов в аудиторной работе при обучении ино-странному языку не приживается так же стремительно. Поэтому целью данной статьи является популяризация идеи корпусного обучения, информирование профессиональной аудитории о потенциале корпусного инструментария при обучении иностранному языку. В разделе 1 статьи последовательно рассматриваются инструменты корпусного анализа и релевантные им вопросы на основе уже имеющегося опыта их применения. Обоснованность отрефлексированных нами элементов работы с опорой на корпус подтверждается результатами опытно-экспериментального исследования, которое проводилось в группах студентов уровня владения языком В2+ по шкале Совета Европы. Следует отметить, что применение корпусного подхода в обучении не ограничивается указанным уровнем и во многом зависит от желания преподавателя приобретать корпусную компетенцию и включать в процесс обучения задания с опорой на корпус. Как корпусные инструменты, так и основанные на них задания вариативны и обладают существенной гибкостью в плане их применения в обучении. Иллюстративный материал разделов 1 и 2 дает более полное представление о категориях обучающихся и типах корпусных заданий, которые могут обогатить как аудиторную практику, так и самостоятельную работу студентов. В заключении обсуждается необходимость развития корпусной компетенции у обучаемых, а также ее совершенствования у преподавателей, которым, мы надеемся, будет полезен как наш собственный опыт, так и реферативный анализ методической литературы по обучению с опорой на корпус.
1. Корпусные инструменты
Мы рассмотрим те инструменты корпусного анализа, пришедшие к нам из корпусной лингвистики, которые могут стать основой для создания лингводидактических материалов. Они могут быть полезны преподавателям иностранного языка, но в первую очередь статья адресована тем, кто обучает иностранному языку будущих лингвистов и преподавателей, а также ведет профессионально направленное обучение иностранному языку.
корпусный анализ обучение иностранный
1.1 Лингвистическая наглядность конкорданса
К корпусным инструментам анализа в рамках обучения с помощью баз данных (Ба1а-Дпуеп approach) традиционно относится генерирование строк конкорданса, которые представляют собой «нарезку текстов корпуса с рассматриваемой лексической единицей (ЛЕ)» [6. C. 13]. Т. Джонс, стоявший у истоков обучения с опорой на конкорданс, полагал, что обучаемый должен совершать «открытия» (discovery learning) в изучаемом языке, а преподаватель создает условия, в которых эти открытия могут состояться. Таким образом, была предложена модель обучения, опирающаяся на лингвистическую наглядность конкорданса. Обучаемый получает доступ к фактам состоявшихся, отработанных речевым сообществом употреблений и выступает в роли исследователя [7, 8]. Прием вертикального чтения [3], или сканирования, конкорданса позволяет обучаемому составить лексико грамматический профиль (ЛГК) ЛЕ, т.е. выявить наиболее вероятное грамматическое оформление слова и его типичную сочетаемость. Этот процесс также представляет собой конденсированное чтение, так как обучаемый фактически прочитывает много текстов одновременно, подмечая важные для собственной речепродукции особенности употребления лексических единиц в наиболее вероятностном грамматическом окружении, т. е. самостоятельно изучает колло- кационно-коллигационный профиль слова [9]. Кроме того, студент примеряет на себя роль исследователя, использует корпусные инструменты для развития навыков корпусного анализа. Пионеры корпусного подхода не указывали, что существует минимально возможный уровень, с которого можно начинать корпусное обучение. Вместе с тем упражнения на сортировку способны выполнять студенты и уровня владения языком A1-A2. Например, рассортировать строки конкорданса по заданным параметрам с целью усвоения лексико-грамматических особенностей употребления: на строки с существительным influence (on) и строки с глаголом influence.
1.2 Профилактика интерференции и фоссилизации ошибок
Изучая строки сочетаемости, студент также получает профилактику возможной интерференции. Н.Б. Гвишиани, на основании опыта обучения студентов-лингвистов с опорой на корпус, отмечает, что при контрастивном анализе речепродукции носителей языка и учащихся частотными оказываются ошибки, вызванные интерференцией родного и изучаемого языков. Так, по данным международного корпуса («английский как иностранный») речи обучающихся (The International Corpus of Learner English, ICLE), национально-специфической ошибкой русско- говорящих студентов является употребление possibility to do something (`возможность делать что-либо'). Если же обратиться к британскому компоненту кор-пуса (ICE-GB), то самым частым распространением выражения окажется possibility of, possibility that, possibility for, в то время как вариант possibility to do отсутствует вообще. На основе изучения 10-15 строк конкорданса обучаемый может самостоятельно прийти к выводу о том, что продиктованное схемой родного языка употребление possibility to следует исключить [2. С. 24]. В некоторых случаях ошибки и заблуждения обучаемых настолько укоренились в «русском» английском: to explain me; sorry me; to influence on; in the nearest future; highest education; the humanitarian department; you have two variants и т. д., - что требуется существенная доказательная база для их осознания. Так как закрепившиеся ошибки встречаются практически на всех уровнях обучения, то и отбор корпусных примеров может проводиться с учетом уровня сложности.
1.3 Расширенный контекст в корпусе
Еще одна функция корпусного инструментария - опция расширенный контекст, которая существует в каждом корпусе и дает доступ к нескольким предложениям исходного текста. Расширенный контекст способствует сохранению включенности ситуации, сообщает сведения о времени и обстоятельствах создания текста, авторе и источнике публикации. В профессиональной литературе высказывается достаточно радикальная точка зрения о том, что корпус, в особенности большой диверсифицированный корпус (например, БНК - Британский национальный корпус), является «музеем» текстов, в котором включенность ситуации потеряна. Текст оказывается оторванным от коммуникативной ситуации, поскольку «реальность текст не со-провождает» [10. P. 32-33]. Обозначенная функция расширенного контекста помогает представить ситуацию, в которой данное употребление слова состоялось, и в какой-то мере снять обозначенную трудность. Однако, возможно, полностью снять такие трудности может небольшой специализированный корпус, составление которого имеет целый ряд преимуществ [11].
1.4 К вопросу о преимуществах компиляции «малого» корпуса
В этой связи следует упомянуть возможность самостоятельного составления усилиями команды преподавателей небольшого корпуса, ориентированного на нужды будущих специалистов. Известно, что сегодня для таких языков, как английский, русский и другие созданы большие диверсифицированные и репрезентативные аннотированные корпусы. Вместе с тем ни один корпус не в состоянии эффективно служить всем целям сразу. Поэтому создание на базе университетов специализированных так называемых до-машних (home-made) языковых корпусов, ориентированных на нужды факультета, кафедры или университета, становится повседневной университетской практикой. Подобные университетские проекты могут ставить перед собой задачи по компиляции, например, таких профессионально ориентированных лингвистических баз данных, как корпус дискурса преподавателей в аудитории, корпус ошибок обучаемых, корпус изучаемой предметной области и т.д. При сегодняшнем развитии программного обеспечения по управлению лингвистическими базами данных (например, корпус- менеджер WordSmith Tools) создание малого корпуса становится как технически реализуемым, так и оправданным с точки зрения затрат усилий университетской команды специалистов. Примерами таких «малых» университетских корпусов могут служить мультимедийный корпус устных текстов и упражнений ELISA (English Language Interview Corpus as a Second- Language Application [12]), созданный в университете г. Тюбинген, Германия; корпус ошибок обучаемых, собранный в РГПУ им. А.И. Герцена [13]; ресурс LINGUATORIUM, созданный коллективом центра лингвистических исследований им. А.А. Худякова в Санкт-Петербургском государственном экономическом университете; корпус инженерных текстов на базе Томского политехнического университета [14]; корпус профессионально-направленных текстов, созданный нами для экспериментального обучения [6], и др.
1.5 Обзор корпусной статистики в применении к обучению
Сегодня, когда филологически компетентная текстовая база данных обладает разметкой и корпус-менеджером (управляющей программой),
к основным методам работы с корпусами текстов могут быть причислены все виды корпусной лингвоста- тистики: подсчет абсолютной частотности слов, выделение наиболее частотных содержательных (в отличие от служебных) слов по отдельным жанрам корпуса (включая профессионально релевантные), диаграмма частотности слова по различным жанрам корпуса, определение ключевых слов, выделение кластеров (статистически значимых цепочек слов, располо-женных контактно), корпусный поиск сочетаемости (коллокатов, которые могут располагаться дистант-но). Легко заметить, что многие из этих функций основаны на статистических показателях корпуса. Следует подчеркнуть, что до прихода компьютерного анализа больших массивов лингвистических данных основным индикатором верности и естественности высказывания служила интуиция носителей языка. Сегодня и у не-носителей появилась возможность оценить аутентичность речи как письменной, так устной с помощью лингвостатистических показателей.
1.6 Семантическая просодия и корпусная статистика
Многочисленные корпусные примеры да-ют возможность изучения еще более тонких особенностей употребления. Так, внимание корпусных лингвистов привлекло явление семантической просодии (semantic prosody), которая понимается как вероятное употребление слова в определенных контекстах, положительных или отрицательных [2. С. 24]. Например, отмечается, что глагол cause (`являться причиной') в более чем 90% случаев (автором изучались 250 вхождений в корпусе объемом в 1 млн словоупотреблений и 38 тыс. вхождений в корпусе объемом в 120 млн словоупотреблений) встречается с негативно коннотированными словами cancer, crisis, delay [15]. По корпусу LOB (The LancasterOslo/Bergen Corpus, LOB corpus) глагол сочетается с негативными словами в 80% употреблений, с нейтральными и позитивными - в 18% и в 2% употреблений соответственно [15].
В нашем исследовании кластер something of a выступает в препозиции: (i) к отрицательно коннотиро- ванным существительным - в 49% случаев; (ii) к нейтрально коннотированным существительным - в 39% случаев; (ii) к положительно коннотированным существительным - в 12% случаев. Если сопоставить процентное отношение отрицательных и положительных коннотаций существительных коллокатов, то явственна тенденция сочетания кластера something of a c отрицательными словами: 80 против 20%. Самые иллюстративные результаты представлены в таблице. Такое тяготение к отрицательным контекстам связывается с функцией кластера something of a как средства выражения коммуникативной стратегии смягчения негативности и категоричности высказывания, характерной для носителей английской линг- вокультуры [16].
Корпусная статистика сочетаемости кластера something of а с негативно окрашенными существительными
|
Слово |
Количество вхождений в БНК с кластером something of a |
Общее количество вхождений слова в БНК |
Процентное соотношение вхождений с кластером |
Коэффициент взаимного притяжения (MI) в БНК |
|
|
SHOCK |
29 |
4 163 |
0,70 |
7,60 |
|
|
PROBLEM |
22 |
28 251 |
0,08 |
4,44 |
|
|
MISNOMER |
19 |
93 |
20,43 |
12,47 |
|
|
DISAPPOINTMENT |
16 |
1 451 |
1,10 |
8,26 |
|
|
PARADOX |
11 |
651 |
1,69 |
8,87 |
|
|
CULT |
10 |
878 |
1,14 |
8,31 |
|
|
DILEMMA |
9 |
1 062 |
0,85 |
7,88 |