собаки к своему хозяину приобретет значимое значение, и станет
более, прочнее |
надежнее и обретет положительный мотив в |
|
стремлении |
выполнять это действие |
в очередной раз. |
Комплексное поощрение в этом случае будет являться таким
событием, |
в |
качестве |
которого |
выступает |
положительное |
|||
подкрепление. |
|
|
|
|
|
|
|
|
Отрицательное |
(негативное) |
подкрепление – это |
||||||
поведение |
направленное |
живым |
организмом, |
на избегание |
||||
любого неприятного |
события. |
Еще |
точнее, |
изменение |
||||
поведения, |
которое направленно на уменьшение |
неприятных |
||||||
ощущений. |
|
|
|
|
|
|
|
|
Отрицательное подкрепление |
не является физическим |
|||||||
наказанием, как мы привыкли его понимать. |
|
|
||||||
Отличие |
отрицательного подкрепления, |
от физического |
||||||
наказания заключается в том, что оно подобно положительному, происходит во время поведения, а не после него и включается за счет изменения поведения.
Например: При обучении собаки двигаться у левой ноги хозяина по команде «Рядом», дрессировщики часто прибегают к болевым воздействиям на собаку с использованием поводка, парфорса или удавки. Если собака двигается на одинаковом уровне со своим хозяином, она поощряется похвалой.
Когда собака тянет вперед, дрессировщик подает команду «Рядом» и прибегает к болевому воздействию. В результате нескольких таких повторений, животное начинает избегать
неприятные |
и |
болевые ощущения. |
Изменяя тем самым свое |
||||
поведение, за счет движения у левой ноги дрессировщика. |
|||||||
Данное |
изменение |
поведения, |
направлено |
на |
избегание |
||
неприятного |
события, |
которое |
выступает |
в |
качестве |
||
отрицательного подкрепления. |
|
|
|
|
|||
Отрицательное (негативное) подкрепление используется в |
|||||||
формировании |
нужного для нас поведения |
так же эффективно, |
|||||
как и положительное. |
|
|
|
|
|
||
Например: |
Если |
собака уклоняется |
и отвлекается от |
||||
рабочего объекта во время поисковой работы, или производит ошибочные (ложные) действия, дрессировщик сразу же старается включить отрицательное подкрепление.
11
При |
|
использовании |
отрицательного |
|
подкрепления, |
|||
дрессировщики |
часто |
ограничиваются |
не |
физическим |
||||
наказанием, |
а |
временной изоляцией собаки |
в |
клетке |
или в |
|||
вольере. |
Ограничивая тем самым, ее в пространстве, обществе, |
|||||||
общении |
со |
своими соплеменниками, |
общении со |
своим |
||||
хозяином, в свободе и т.д. Такой вид подкрепления способствует формированию у собак некоторых, выгодных для нас действий.
То есть |
поведение |
собаки строиться |
за счет того, что |
правильные |
действия |
закрепляются |
положительным |
подкреплением, а ненужные действия сопровождаются отрицательным.
Также в |
|
качестве |
отрицательного |
подкрепления |
дрессировщиками |
используется |
функция публичного «игнора», |
||
по отношению |
к |
нежелательным действиям. |
Которая, как |
|
правило, в конечном итоге будет побуждать животное,
направленно изменять свое поведение. |
|
|
|
||
При |
соблюдении |
выше перечисленных |
правил, |
||
формируется такое поведение, при котором животное |
выделяет |
||||
для себя |
определенные |
выводы, |
и |
стремится |
совершать |
действия, |
которые в последующем доставляют определенный |
||||
комфорт. |
По принципу: |
« Лучше |
я |
выполню определенное |
|
действие, и получу взамен многое!», чем «Ничего не выполню, или, выполню не правильно, и в конечном итоге останусь ни с чем….».
Своевременность подачи и величина подкрепления
Оба вида подкрепления соответствуют одинаковым правилам применения. И ошибка во времени подачи, как одного подкрепления, так и другого не принесет нужных результатов.
Подкрепление должно совершаться в одной связи с действием, которое предполагается видоизменить. Иначе говоря подкрепление является источником информации, потому как положительное подкрепление несет в себе позитивную информацию, а отрицательное подкрепление негативную информацию. С помощью этой информации мы можем говорить собаке то, что именно нам нравиться в ее поведении.
На стадии обучения, для собаки информационное
содержание |
подкрепления становится |
важнее самого |
подкрепления. |
Нельзя забывать, что запоздалое подкрепление |
|
12
является большим недочетом у начинающих дрессировщиков, точно также как и слишком раннее, которое является малоэффективным.
При работе с животным, величина каждого подкрепления должна быть не большой. Чем меньше подкрепление, тем быстрее собака съест его. Это не только будет экономить время, но и позволит делать большее количество повторений за одно упражнение, прежде чем животное насытиться.3
Маленькая величина подкрепления используется на начальных стадиях обучения, в дальнейшем дрессировщик использует получение животным, куша (сюрприза) который в 10 раз больше обычного подкрепления. Это является одним из наиболее полезных приемов пищевого или какого-либо другого комплексного поощрения.
Очень часто, особенно при работе с пищевыми раздражителями, мы подкрепляем нужные действия не в момент его совершения, а уже после того как собака его совершила.
Например: Если, мы приучаем собаку выполнять, определенное действие по команде «Сидеть», то выполнение собакой посадочного действия, нами подкрепляется не в момент его совершения, а уже после того, как она села. Речь идет о своевременности подкрепления нужного действия. Для того чтобы добиться более быстрого понимания, используется – условное подкрепление.
Условное подкрепление – представляет собой изначально ничего незначащий звуковой сигнал (щелчок) – который умышленно в последующем связывается с подачей истинного (натурального) подкрепления. Таким образом, возможность мгновенно подать информацию с помощью звукового сигнала (щелчка) представляет для нас, большую ценность.
Дрессировка с использованием положительного подкрепления всегда должна начинаться с выработки условного подкрепления
По принципу:
3 К. Прайор, « Не рычите на собаку!» книга о дрессировке людей, животных и самого себя.
13
щелчок – лакомство, игрушка; щелчок – лакомство, игрушка и т.д.
В результате этого, прежде чем формировать нужное поведение, мы даем возможность собаке осознать значимость условного подкрепления – сочетая его с пищей, поглаживанием, лаской, игрой и другим истинным подкреплением.
Со временем звуковой сигнал (щелчок) приобретает смысловое значение, и собака начинает реагировать на действие, данного условного подкрепления, после которого обязательно следует истинная награда. После выработки условного подкрепления, у нас в руках оказывается реальная возможность, доносить до собаки то, что нас больше всего интересует.
14
3. Понятие об оперантной дрессировке с использованием кликер-тренинга. Формы научения
Оперантная дрессировка с использованием кликер-тренинга
является общим составляющим |
в дрессировочном процессе, |
в |
||||||||||
основе которой заложен оперантный метод обучения. |
|
|
||||||||||
Под |
|
оперантным |
обучением |
|
понимается |
|||||||
целенаправленный |
отбор |
дрессировщиком |
тех или |
иных |
||||||||
желательных |
действий |
животного, |
за |
счет |
использования |
|||||||
положительного |
и |
отрицательного |
подкрепляющего |
|||||||||
воздействия. |
Причем |
желательные или нежелательные действия |
||||||||||
подкрепляются |
немедленно, а |
сформированный |
навык |
в |
||||||||
дальнейшем |
|
подводится |
под |
стимульный |
контроль. |
|||||||
Стимульный |
контроль означает, |
что |
на определенной стадии |
|||||||||
обучения |
используемая |
|
команда |
запускает |
навык, |
или |
||||||
санкционирует его выполнение. |
|
|
|
|
|
|
|
|||||
Эффективность |
обучения с |
использованием |
оперантного |
|||||||||
метода дрессировки, заключается |
не только в том, что животное |
|||||||||||
само стремится совершить |
|
какое – либо действие. |
Но и в том, |
|||||||||
что подкрепление – |
это |
|
не просто |
событие, |
|
связанное |
с |
|||||
последующей подачей какого – либо звукового сигнала, а
событие – всегда приводящее к удовлетворению |
доминирующей |
||
потребности. |
|
|
|
Оперантное |
обучение |
основано на |
положительном |
подкреплении. Оно учит собаку |
« работать, чтобы заслужить » |
||
награду за совершение определенного действия, без малейшего негативного оттенка.
Другими словами, дрессировщик не реагирует наказанием на то, что собака не выполнила действие. Он просто положительно реагирует на нужное действие, когда оно случается. Сначала это действие будет происходить случайно. Но, поскольку это действие приносит поощрение, приятное собаке, она будет выполнять его снова и снова. Со временем
собака будет обобщать полученный урок. |
Она |
начинает |
осознавать, что у нее появляется возможность |
влиять на |
|
происходящее: « Если сделать все правильно - |
то с тобой будут |
|
происходить хорошие вещи ». |
|
|
15