Отрицательное подкрепление: как заменить предмет?

18

Моему пастуху сейчас 9 месяцев, мы прошли несколько уроков по поведенческому воспитанию с личным тренером, и все прошло очень хорошо. Раньше собака делала так, как хотела, а сейчас просто слушает очень хорошо!

По предложению тренера, некоторые виды поведения были положительно подкреплены, а некоторые - отрицательными. Проблема, с которой мы сталкиваемся сейчас, заключается в поведении, которое мы усилили негативно. Мы используем металлический ящик, чтобы издавать звук, собака его ненавидит и слушается. Он всегда используется после «нет» в качестве второй санкции. Все работает отлично, и теперь нам больше не нужно использовать коробку, так как он ведет себя правильно.

Проблема в том, что мы думаем, что нам нужно будет заменить коробку чем-то другим, так как теперь он узнал, что если у нас нет коробки, не будет никакого звука, и поэтому он участвует в нежелательном поведении. Это начинает быть проблемой, так как теперь нам нужно носить коробку повсюду, потому что, если у нас ее нет, он будет использовать возможность.

Есть ли способ исправить это, заменив коробку своим телом или чем-то еще?

Примечание: он был отстранен от работы месяц назад и немного реже нас храбрится, но все же делает это, когда у нас нет под рукой коробки.

Спасибо

dogs behavior training

— Salketer
источник

1

Возможно, вам следует задать этот вопрос своему тренеру, но как только отрицательное подкрепление (металлическая коробка) сработало в сдерживании его нежелательного поведения, разве вы не должны начать усиливать хорошее поведение? Например, если моя собака продолжала подниматься на кушетку, я мог бы (1) встряхнуть металлическую коробку, чтобы отговорить ее, а затем, как только он узнал, что ходить на кушетку нежелательно, я (2) хвалю и буду щедро относиться к нему всякий раз, когда он лежал на полу возле дивана или аналогичного.

— Стив D

1

:) Мне нравится, как собаки могут изучать эти вещи самостоятельно, после некоторого наблюдения ... "Нет коробки, эй, я могу делать все, что я хочу!" :) :) :)

— woliveirajr

10

Всякий раз, когда обсуждается оперантная обусловленность, это помогает говорить на одном языке:

Усиление: действие, направленное на увеличение частоты поведения
Наказание: действие, направленное на снижение частоты поведения
Положительный: наличие стимула
Негатив: отсутствие стимула

Эти термины могут образовывать четыре разные комбинации ( примечание: примеры в скобках - это примеры, а не советы!):

Положительное подкрепление: предоставить стимул для увеличения частоты поведения (например, угощение, когда собака сидит по команде)
Отрицательное подкрепление: уберите стимул, чтобы увеличить частоту поведения (например, почтальон уходит после того, как собака лает на него)
Положительное наказание: предоставить стимул для уменьшения частоты поведения (например, ударить собаку, когда она мочится на ковер)
Отрицательное наказание: уберите стимул, чтобы уменьшить частоту поведения (например, покиньте комнату, когда собака подпрыгивает на вас)

На практике они могут запутаться. Например, вы делаете шум с помощью коробки - это стимул, предназначенный для уменьшения частоты поведения, поэтому это технически пример положительного наказания, но если вы прекратите шум, когда собака будет вести себя правильно, вы также уберете стимул для увеличьте частоту правильного поведения, привет, !, отрицательное подкрепление.

Но это предполагает, что у вашей собаки есть правильное поведение. Вы не указываете, что является нежелательным поведением, или есть ли желаемое альтернативное поведение, которое вы пытаетесь усилить. Если все, что вы делаете с шумом, пытается помешать ему что-то сделать, тогда вы предоставляете наказание, а не отрицательное подкрепление.

В любом случае, частью вашей проблемы, вероятно, является то, что вы используете только первичных подкрепителей и карателей, то есть тех, которые собаке не нужно изучать. Пища, например, является основным усилителем. Собака знает, что еда - это хорошая вещь без необходимости ее изучать. К тому же, шум является основным наказанием, так как собаке неудобно слышать. Вторичные усилители и каратели, напротив, это те, которые выучила собака.

Классический пример - колокол Павлова, что он звонил каждый раз, когда давал собаке еду. Последовательно соединяя первичный усилитель со стимулом, стимул может начать действовать как вторичный усилитель. То есть собака узнает, что колокол сигнализирует о прибытии еды и будет реагировать соответственно.

Вы упоминаете, что используете слово «нет» (мы надеемся, строгим голосом, что собаки прекрасно разбираются в интонациях), когда отговаривают свою собаку от шума. «Нет» должно действовать как вторичный каратель, так же, как похвала может работать как вторичный усилитель. Но вы, вероятно, не смогли постепенно устранить фактический шум, начав иногда просто говорить «нет», но не делать шум.

Проблема в том, что к настоящему моменту ваша собака осознала тот факт, что «нет» без рамки означает отсутствие главного наказателя, т. Е. Эти два понятия не связаны, и поэтому он спасен, когда его нет рядом.

Я предлагаю вам открыть новый вопрос, описывающий фактическое поведение (поведение), которое вы хотите отговорить, и мы могли бы лучше помочь вам найти способ, используя весь спектр оперантных состояний, чтобы ваша собака узнала, чего вы хотите. сделать.

— ThomasH
источник

5

@ThomasH является отличным ответом и очень точно затрагивает вопрос об использовании вторичных карателей.

Здесь я просто добавляю несколько комментариев по двум аспектам проблемы.

Наказывать неправильное поведение против усиливать правильное поведение

Даже если «теория» работает одинаково на «стороне подкрепления» и на «стороне карателя», и эффекты могут быть столь же эффективными, мы не должны забывать, что подавление поведения не учит собаке, что делать вместо этого, и сосредотачивается в основном на «Нет» часть обучения приводит к микроуправлению : вам постоянно нужно учить собаку тому, что он не должен делать. Даже если собака узнает, что ему не следует делать X в данной ситуации, она все равно может свободно выполнять Y, Z и т. Д. Если вы положительно научите его (подкрепите его) выполнять W вместо этого, это, вероятно, остановит какой-то порочный круг и сделать всех счастливыми

Переменное усиление / наказание

@ThomasH объяснил концепцию вторичного подкрепления или наказания.

Один аспект, который следует иметь в виду, состоит в том, что, в отличие от первичных подкреплений / наказаний, второстепенные должны быть вознаграждены (так или иначе), используя переменный график .

Пища является основным усилителем. Каждый раз, когда собака получает кусочек пищи, его усиливают.

Но ключевое слово типа «да» или «клик» может стать второстепенным фактором. Он связан с последующим первичным усилителем. Ключевым моментом является то, что это работает, потому что собака узнала, что вторичный усилитель награждается основным усилителем. Как только это узнается, ссылка должна поддерживаться с реальными наградами. В начале (во время обучения) награда будет приходить каждый раз, затем она может быть вознаграждена с помощью переменного графика. Переменный график на самом деле усиливает связь, поскольку собака не может предвидеть, когда придет основная награда.

Обратите внимание, что это обычно применяется к третичным усилителям: кий «sit» на самом деле является усилителем, так как он может привести к другому усилителю (например, щелчок), который затем приведет к фактическому вознаграждению.

Мы обычно никогда не отделяем вторичный усилитель (щелчок) от основного усилителя (например, награда за еду). Это сохраняет связь между двумя чрезвычайно сильными, и переменная скорость применяется между кием (третичный усилитель) и щелчком.

Однако в случае наказаний у вас нет реального «третичного наказания», поэтому переменный коэффициент «подкрепления» (в данном случае понимается как наказание) находится между вашим вторичным наказанием («нет») и фактическим наказанием ( коробка).

— Седрик Х.
источник