Феномены оперантного обусловливания

Дифференцировочные условные рефлексы

Каждое животное и человек постоянно сталкивается с необходимосью дифференцировки похожих раздражителей. Так, например, первое время после приобретения мобильного телефона, человек остро реагирует на любую мелодию звонка, а также на любой, отдаленно его напоминающий звук. Со временем ориентировочная реакция на звонки чужих телефонов притупляется, и человек начинает слышать только свой звонок. Собака, впервые вышедшая на прогулку в новом месте, сначала просто находит пахучие метки, оставленные именно собаками, а позже научается определять их индивидуальную принадлежность.

Эксперименты по выработке дифференцировочных условных рефлексов часто проводят в лабораторных условиях, преследуя различные научные цели.

Данный эксперимент проводится в несколько этапов.

1. У животного вырабатывают нужный условный рефлекс. Как известно, в начале формирования условного рефлекса животное реагирует не только на строго конкретный условный стимул, но и на сходные с ним звуки, хотя и не полностью ему идентичные. Эта стадия выработки условного рефлекса называется генерализацией.

2. После того, как условный рефлекс выработан, экспериментатор продолжает подкреплять (пищей или избавлением от опасности) условную реакцию только на определенный сигнал и не подкрепляет ответов на сходные, и в результате они постепенно угасают.

Как было показано Л.Г. Ворониным (1984), при комбинации отдельных условных рефлексов возникают новые свойства, не сводимые к свойствам суммы исходных рефлексов. Происходит образование так называемых систем дифференцировочных условных рефлексов, или просто «систем». Такие системы Л. Г. Воронин считал целостными функциональными единицами, из которых складывается психическая деятельность.

В основе формирования дифференцировочных условных рефлексов лежит дифференцировочное торможение – один из видов внутреннего торможения.

Метод выработки дифференцировочных УР в разных его комбинациях является одним из ведущих в физиологии ВНД и используется как инструмент для исследования целого ряда проблем.

Выработки разнообразных дифференцировок широко используются для оценки когнитивных способностей животных и довербального мышления. С данными целями могут использоваться разные способы выработки дифференцировочных условных рефлексов.

Экспериментальные данные, полученные с помощью метода дифференцировочных условных рефлексов, создали основу для сравнительной оценки способности животных к обучению, и показали, что в процессе такого обучения, наряду с ассоциативными, участвуют и механизмы другого уровня – когнитивные.



Виды подкрепления и наказания, их использование при обучении животных. Особенности дрессировки с применением положительного и отрицательного подкрепления.

Подкрепление (punishment) – это любое событие (стимул), которое следует за реакцией и увеличивает вероятность ее появления.

Очень важным является то, что стимулы, которые изначально не являются подкреплениями, могут превратиться в таковые благодаря ассоциированию с другими подкреплениями. Некоторые стимулы, становятсягенерализованным подкреплением, поскольку они обеспечивают доступ ко множеству других видов подкрепления.

Здесь важно понимать, что подкрепление определяется через его воздействие на поведение – а именно через рост вероятности поведенческой реакции.

Выделяют два типа подкрепления — первичное и вторичное. Первичное подкрепление — это любое событие или объект, сами по себе обладающие подкрепляющими свойствами. Таким образом, они не требуют предварительной ассоциации с другими подкреплениями, чтобы удовлетворить биологическую потребность.

Вторичное, или усвоеное подкрепление, – это любое событие или объект, которые приобретают свойство осуществлять подкрепление посредством тесной ассоциации с первичным подкреплением, обусловленным прошлым опытом организма.

Феномены оперантного обусловливания

Логическим расширением принципа подкрепления является то, что поведение, усиленное в одной ситуации, с большой долей вероятности повторится, когда организм столкнется с другими ситуациями, напоминающими ее.

Генерализация стимулов. В теории Б.Ф. Скиннера тенденция подкрепленного поведения распространяться на множество схожих ситуаций называется генерализацией стимула. Обобщение стимула может быть результатом неприятного жизненного опыта. Характерным для условного подкрепления является то, что оно генерализуется, если объединяется с более чем одним первичным подкреплением



Угасание реакций. Когда подкрепление больше не поступает, реакция становится все менее и менее частой; этот процесс получил название «оперантного угашения».

Режимы подкрепления

Для Б.Ф. Скиннера подкрепить поведение означает осуществить манипуляцию, меняющую вероятность такого поведения в будущем. Поэтому его особый интерес был сосредоточен в основном на изучении особенностей (реакций и их связей с процентами подкреплений) и интервалами между ними, т.е. на изучениирежимов подкрепления.

Режим подкрепления — правило, устанавливающее вероятность, с которой подкрепление будет происходить. Режим подкрепления можно построить, опираясь на два параметра: задавая определенный временной интервал или определенный интервал реакций.

Режимы подкрепления изучались Б.Ф. Скиннером в экспериментах на голубях в специально оборудованной камере («ящике»)

Самым простым правилом, относящимся к первому параметру, является предъявление подкрепления каждый раз, когда организм дает желаемую реакцию. Это называется режимом непрерывного подкрепления и обычно используется на начальном этапе любого оперантного научения, когда организм учится производить правильную реакцию.

В случае если задается интервал времени или реакций, т.е. определенное соотношение времени и реакций или подкреплений и реакций, подкрепления появляются после того, как прошло какое–то время или выполнено определенное число реакций (например, нажатий на рычаг или на ключ) – режим интервального подкрепления.

Подкрепления могут подаваться в регулярном, или фиксированном, режиме – всегда через определенный интервал времени или всегда после определенного количества реакций, либо их можно подавать в переменном режиме – то через одну минуту, то через две, то после пары реакций, то после серии реакций. Каждая схема, или режим подкрепления, как правило, стабилизирует поведение по-разному.

Б.Ф. Скиннер тщательно изучал, как режим прерывистого, или частичного, подкрепления влияет на оперантное поведение. Хотя возможны многие различные режимы подкрепления, их все можно классифицировать в соответствии с двумя названными основными параметрами:

1) подкрепление может иметь место только после того, как истек определенный или случайный временной интервал с момента предыдущего подкрепления (так называемый режим временного подкрепления),

2) подкрепление может иметь место только после того, как с момента подкрепления было получено определенное или случайное количество реакций (режим пропорционального подкрепления).

1. Режим подкрепления с фиксированной пропорцией (ФП). В данном режиме организм подкрепляется по наличию заранее определенного или «постоянного» числа соответствующих реакций.

2. Режим подкрепления с фиксированным интервалом (ФИ). В режиме подкрепления с постоянным интервалом организм подкрепляется после того, как твердо установленный или «постоянный» временной интервал проходит с момента предыдущего подкрепления. Любопытно, что режим ФИ дает низкую скорость реагирования сразу после того, как получено подкрепление – феномен, названный паузой после подкрепления.

Еще одна особенность реагирования при режиме ФИ – это возрастание частоты реакций по мере приближения окончания периода

3. Режим подкрепления с вариативной пропорцией (ВП). В этом режиме организм подкрепляется на основе какого-то в среднем предопределенного, но не предсказуемого числа реакций. Этот режим считается наиболее эффективным, если необходимо поддерживать поведение в течении длительного времени.

4. Режим подкрепления с вариативным интервалом (ВИ). В этом режиме организм получает подкрепление после того, как проходит неопределенный временной интервал, длительность которого непредсказуема. Подобно режиму ФИ, подкрепление при этом условии зависит от времени. Однако время между подкреплениями по режиму ВИ варьирует вокруг какой-то средней величины, а не является точно установленным

Как отмечалось ранее, под подкреплением понимается какое–либо действие, призванное усилить определенную реакцию.

Позитивное подкрепление– это приятный стимул, который следуя за желательной реакцией, усиливает ее или поддерживает на том же уровне, т.е. повышает вероятность ее повторения.

Негативное подкрепление– это неприятный стимул, устранение которого усиливает желательную реакцию.

Вместе с тем существует и множество самих способов подкрепления. К наиболее распространенным относятся поощрение (предъявление приятных стимулов) и наказание (предъявление неприятных стимулов).

Следует указать на различия между терминами «поощрение» и «наказание», с одной стороны, и «позитивное» и «негативное подкрепление», с другой. Термин «поощрение» может использоваться синонимично с термином «позитивный подкрепляющий фактор», т.е. событие, которое увеличивает вероятность той или иной формы поведения, если оно следует за данной формой поведения. Однако наказание – это не то же самое, что негативный подкрепляющий фактор. Термин «негативное подкрепление» означает прекращение наступления нежелательных событий, следующих за той или иной формой поведения; как и позитивное подкрепление, оно увеличивает вероятность соответствующей формы поведения. Наказание же имеет противоположный эффект: оно уменьшает вероятность наказуемого поведения. Наказание также может быть как позитивным (воздействие неприятного стимула), так и негативным (лишение положительного стимула)

Как поощрение, так и наказание могут выполняться двумя способами, это зависит от того, что следует за реакцией: предъявление или устранение приятного или неприятного стимула. Обратите внимание на то, что подкрепление усиливает реакцию; наказание — ослабляет ее.

Таким образом, в практике воспитания чаще всего используются четыре разновидности подкрепления (Таблица 2):

1) если вслед за желательной реакцией ребенка следует вызывающее приятные ощущения и переживания подкрепляющий стимул, то результат – положительное поощрение;

2) если за нежелательной реакцией следует не вызывающий приятные ощущения и переживания подкрепляющий стимул, то результат – положительное наказание;

3) если вызывающий неприятные ощущения и переживания подкрепляющий стимул устраняется после получения желательной реакции, то результат– отрицательное поощрение;

4) если приятный стимул устраняется после той или иной нежелательной реакции ребенка, то результат– отрицательное наказание.


0002077462946959.html
0002135071812810.html
    PR.RU™