16. Теория положительного подкрепления

16. **Теория положительного подкрепления как важнейшее достижение бихевиоризма. Возможности ее практического применения.

Самой интересной для нас теорией обучения является теория подкрепления, разработанная профессором Гарвардского университета Б. Скиннером. Иначе она называется бихевиоризмом, модификацией поведения, психологией поведения, теорией подкрепления и т.д. Эта область психологии сейчас бурно прогрессирует. Именно на ее основе разработаны программы компьютерного обучения и аутотренинга, доказавшие свою высокую эффективность. В ней обучаемый является не только объектом применения своих сил обучающего, но и самостоятельной значимой величиной, принимающий в процессе обучения самое деятельное участие. В России была издана книга К. Прайор «Не рычите на собаку!», в которой эта теория очень подробно описывается.

Подкрепление

Положительное подкрепление (ПП)- это событие, совпадающее с каким-либо действием и ведущее к увеличению вероятности совершения этого действия.

Таким событием может быть не только дача лакомства, но любое, доставляющее удовольствие обучаемому. Самое главное здесь — то, что нельзя подкрепить поведение, которое не встречается.

Например, требуется добиться, чтобы какой-то человек вам почаще звонил (дети, родители, друзья).

Необходимо сделать так, чтобы каждый телефонный разговор с вами был ему приятен. Кто любит посплетничать — должен услышать последние новости из жизни знакомых, кто любит слушать себя — получить внимание и интерес собеседника. Если же позвонивший услышит упреки, что он так долго не звонил, его желание набрать ваш номер следующий раз появится нескоро.

Подкрепление не является абсолютным. То, что нравится одному, то может быть неприятно другому. Сытому безразлично предложенное угощение. Дрессировщик должен иметь очень широкий спектр ПП, от ласки и похвалы до лакомства и игры.

Отрицательное подкрепление (ОП) — то, что субъект старается избежать.

Оно может иметь градацию от очень сильных (удар электротоком) до слабых (сквозняк).

Отрицательное подкрепление имеет принципиальное отличие от наказания. Наказание следует после совершения проступка и не может уже его изменить. ОП может остановить ненужное действие или даже не допустить его.

При обучении львиная доля успеха зависит от верного времени подачи подкрепления. Если подкрепление запаздывает, то оно часто становится подкреплением не нужному действию, а уже совершенно другому. Например, дрессировщик дал команду «Сидеть!». Собака села. Он полез в карман за лакомством. Собака вскочила. Если он дает лакомство в это момент, он подкрепляет не посадку собаки, а ее вскакивание.

13 стр., 6483 слов

Психологические теории обучения

... эксплуатации техники и оружия. Характерной чертой ассоциативно-рефлекторной теории обучения является направленность на активизацию познавательной деятельности ... Понятие об ассоциации стало ключевым для многих психологических систем XVIII-XIX вв. (см. Ассоцианизм). Психофизиологической ... рассказ, объяснение и показ усвоенного товарищу, применение полученных знаний в практической деятельности. 4. ...

Если подкрепление дается слишком рано, до завершения необходимого действия, то тем самым подкрепляется его несовершение.

Например, дрессировщик дает лакомство, когда собака не успела зафиксировать посадку. Этим он увеличивает вероятность, что по команде «Сидеть!» собака будет присаживаться, вскакивать, но так и не сядет.

Условное подкрепление — изначально нейтральный сигнал (звук, свет, движение), который умышленно связывают с подачей подкрепления. Наиболее удобно использование свистка.

В жизни у людей очень много условных подкреплений. Для многих приятен звук телефонного звонка (вдруг звонит старый друг), приятно видеть заваленный письмами почтовый ящик. И хотя не все звонки и письма доставляют удовольствие, ассоциации с ними связаны очень хорошие.

Таким же условным подкреплением являются деньги. На самом деле, деньги обозначают только то, что на них можно купить — пищу, вещи, обслуживание. Многие богатые люди, имеющие денег больше, чем могут потратить, продолжают работать, хотя деньги уже, казалось бы, им не нужны. Для них условное подкрепление (получение денег) стало значимее реальных благ (полноценный отдых, крепкий сон).

Практическую дрессировку собак с использованием положительного подкрепления почти всегда следует начинать с выработки условного подкрепления. Дрессировщик учит животное понимать значимость условного подкрепления, сочетая его с пищей, поглаживанием, отдыхом, игрой и т.д. Чем с большим числом приятных вещей сочетается условный стимул, тем действеннее он работает.

Нельзя разбрасываться дачей условного подкрепления, иначе оно перестанет работать. Фальшивая или незначимая награда теряет всякую силу в качестве условного подкрепления.

Можно выработать и отрицательное условное подкрепление. Например, им пользовался Владимир Дуров, останавливая неправильные действия своих воспитанников тихим «тсс!».

Выработка навыка методом формирования поведения

Чтобы живое существо, человек или собака, не делало бы, оно это делает не всегда одинаково. Таким образом, формировать поведение можно, подкрепляя те действия животного, которые наиболее близки к требуемым. К. Прайор сформулировала 10 правил выработки, которые необходимо соблюдать.

1. Критерий дачи подкрепления повышается медленно.

2. В конкретный промежуток времени выработка идет только по одному критерию.

Можно расчленить задачу на несколько компонентов, тогда обучение пойдет быстрее.

3. Критерий повышается или вводится новый только после перехода на вариабельный режем подкрепления.

12 стр., 5965 слов

Выработка условного рефлекса в экспериментах И.П. Павлова

... собаки на безусловный раздражитель в виде пищи сопровождается безусловно-рефлекторным отделением слюны. Предъявление безусловного стимула вслед за условным в процессе эксперимента, называется «подкреплением». Если при выработке условного рефлекса применяется подкрепление, ...

Как только поведение усвоено, мы должны его подкреплять не каждый раз. Это правило составляет суть процесса выработки. Когда, подкрепляя собаку не каждый раз, мы уже становимся уверены в получении нужного действия, мы получаем свободу в использования подкрепления только за проявление самого лучшего поведения. Вариативное подкрепление сдвинет поведение в желаемую сторону. Только после перехода на вариативное подкрепление можно вводить новый критерий.

4. После введения нового критерия требования по старым критериям уменьшаются.

То, что раз было выучено, не забывается, но иногда временно уходит в сторону. Характерно, что на новом месте собака, кажется, забывает все команды. Но, привыкнув к новым условиям, начинает работать как ни в чем не бывало. Вводя новый критерий, т.е. ставя собаку в новые условия, мы не должны требовать от нее безукоризненной работы по старому критерию. Адаптировавшись к новому, она «вспомнит» и старый урок, тем более, мы опять применим вариативное подкрепление.

5. Дрессировщик должен быть готовым к неожиданно быстрой выработке.

6. Одному и тому же навыку не могут одновременно обучать разные дрессировщики.

7. Если одна процедура выработки не приносит успеха, нужно попробовать другую.

8. Дрессировщик уделяет все свое внимание собаке до конца занятия.

Одно из самых больших наказаний для ребенка — перестать обращать на него внимание, не отвечать на его вопросы.

9. Если навык начал ухудшаться, необходимо вернуться на более ранние стадии обучения.

Иногда проходит время, и мы с удивлением начинаем замечать, что казалось бы прекрасно отдрессированная собака все забывает. Это может произойти также в новой обстановке, после пережитого стресса. Самое разумное в этих условиях — вернуться к самым азам, пройти весь путь обучения утраченного навыка, но уже в быстром темпе. Затем постепенно нарастить высоту до 150 см.

10. Занятие заканчивается на «высокой ноте».

Неправильно думать, что собаки не переживают при ошибках. Поэтому окончание занятия должно быть мажорным, чтобы дрессировка у собаки ассоциировалась с приятным. Конечно, чтобы стать хорошим дрессировщиком, нужно знать гораздо больше, чем здесь написано. Но знания придут после практики.