Rambler's Top100

Чем стирать нижнее бельё?

Положительное и отрицательное подкрепления

Положительное подкрепление - это событие, совпадающее с каким-либо действием и ведущее к увеличению вероятности повторного совершения этого действия. Запомните это положение. В нем заложен секрет успешного обучения. Существуют два вида подкрепления: положительное и отрицательное.
Положительное подкрепление - это нечто, желаемое субъектом: пища, ласка или похвала. Негативное подкрепление - это то, чего субъект хотел бы избежать: шлепок, нахмуривание бровей, неприятный звук предупреждающий зуммер в машинах, который раздается, если вы забыли пристегнуть ремень безопасности, - это отрицательное подкрепление.
Поведение, которое уже встречается вне зависимости от того, насколько часто, всегда можно усилить с помощью положительного подкрепления.
Если вы зовете щенка, и он подходит к вам, а вы его ласкаете, то в дальнейшем подход щенка на зов становится все более и более надежным даже безо всякого другого обучения. Предположим, что вы хотите, чтобы кто-то позвонил вам - ваш отпрыск, родитель или любимый. Если он или она не звонит, то тогда уж ничего не поделаешь. Самое главное в обучении с подкреплением то, что вы не можете подкрепить поведение, которое не встречается. С другой стороны, если вы всегда проявляете радость, когда любимые вам звонят, то это значит, что их поведение положительно подкрепляется, вероятность частоты их звонков, очевидно, увеличится.
Конечно, если вы примените отрицательное подкрепление - "Почему ты не позвонил, почему я должна тебе звонить, ты мне никогда не звонишь" и т.д., замечания, которые вызывают раздражение, - вы создаете ситуацию, при которой звонящий избегает неприятностей тем, что не звонит; фактически вы обучаете их не звонить. Простое введение положительного подкрепления за поведение является наиболее элементарной частью этого вида обучения.
Дождь является положительным подкреплением для уток, отрицательным для кошек, довольно безразличен, по крайней мере во влажную погоду, для коров. Пища не является положительным подкреплением, если вы сыты. Улыбки и похвалы могут быть непригодными в качестве подкрепления, если субъект хочет вывести вас из себя. В качестве подкрепления надо выбирать нечто желаемое субъектом. Для любой тренировочной ситуации полезно иметь набор подкреплений. Необходимость постоянного перехода от одного подкрепления к другому увлекательна и интересна и для тренеров.
Положительное подкрепление приносит пользу и при взаимоотношениях между людьми. Оно лежит в основе искусства делать подарки: точно угадать, что будет иметь подкрепляющее действие (правильный выбор является подкреплением и для делающего подарок).
В нашем мире человек, выработавший в себе наблюдательность в отношении положительного подкрепления, имеет большие преимущества перед другими.
Психологи спорят по поводу определения отрицательного подкрепления. Для наших целей отрицательное подкрепление можно определить как-то, что субъект будет стараться избегать. Отрицательные подкрепления имеют градации от слегка неприятных стимулов - едва заметный сквозняк от кондиционера в ресторане, который все-таки заставляет вас перейти за другой столик, - до
всевозможных крайностей, например удара электрическим током. Наказание происходит после поведения, на которое оно должно воздействовать. Таким образом, вы не можете избежать наказания, изменив взгляды или поступки, так как неправильное поведение уже осуществилось. Малыш, которого отшлепали за плохой табель успеваемости, может в дальнейшем учиться лучше или хуже, но уже не сможет изменить того табеля, который он уже принес. Напротив, отрицательное подкрепление можно остановить или избегнуть сиюминутным изменением поведения.
. Допустим, сидя в гостиной, гость положил ноги на кофейный столик. Хозяйка неодобрительно поднимает брови. Гость ставит ноги на пол. Ее лицо мягчеет. Человек чувствует облегчение. И поскольку он смог остановить сигнал не расположенности, совершившееся поведение было подкреплено. Гость усвоил: в этом доме держи ноги по дальше от мебели.
Поведение может быть полностью сформировано на основе отрицательного подкрепления, как в большинстве случаев традиционной дрессировки животных: лошадь учится поворачивать налево, когда тянут за левый повод, потому что поворот прекращает неприятное давление; лев вспрыгивает на тумбу, чтобы избежать назойливого хлыста или острой палки, которые держат около его
морды.
Оба вида подкрепления подчиняются одинаковым правилам применения. Например, ошибка во времени подачи подкрепления не даст результатов (или результаты будут плохими) при использовании как одного, так и другого метода подкрепления.

Время подачи подкрепления
Подкрепление должно совершаться в связи с действием, которое предполагается видоизменить. Подкрепление - это информация. Оно говорит субъекту, что именно вам нравится. Когда субъект пытается обучиться, информационное содержание подкрепления становится важнее самого подкрепления. В тренировке спортсменов или при обучении танцоров именно восклицания инструктора "Да!" или "Хорошо!", отмечающие нужное движение, а не разбор тренировки или репетиции в раздевалке дают требующуюся информацию. Запоздалое подкрепление является наибольшим недочетом начинающего дрессировщика. Собака садится, но к тому времени, когда хозяин говорит: "Хорошая собака", собака уже снова стоит. За что, думает животное, его хвалят? За то, что оно встает. Если у вас возникают трудности в дрессировке, первый вопрос, который надо себе задать, не запаздывает ли ваше подкрепление. Если вы при работе с животным вдруг застряли в самый разгар дела, то иногда полезно, чтоб кто-нибудь со стороны понаблюдал за запаздыванием подкреплений.
Мы всегда слишком запаздываем подкрепляя друг друга. "Послушай, дорогая, вчера вечером ты выглядела замечательно", - звучит совсем не так, как та же фраза, сказанная вовремя. Отсрочка подкрепления может даже оказать вреднее воздействие ("А что, разве я сейчас не выгляжу замечательно?"). Мы свято верим, что сила слов перекроет ошибки во времени подкрепления. Слишком раннее подкрепление тоже неэффективно. В зоопарке Бронкса служители замучились с гориллой. Им было нужно, чтобы она выходила в вольер, чтобы можно было почистить внутреннюю клетку, но она взяла манеру сидеть в дверном проеме, и, обладая недюжинной силой, не давала закрываться
скользящей двери. Когда же служители клали пищу снаружи или подманивали ее бананами, горилла либо не обращала на них внимания, либо хватала пищу и бежала обратно к своей двери, прежде чем ту успевали закрыть. Дрессировщика, работавшего при зоопарке, попросили разобраться. Он объяснил служителям, что размахивание бананами и подбрасывание пищи было попыткой подкрепить действие, которое еще не совершилось. Это называется взяточничеством. Надо было не замечать животное, пока оно сидело в дверях, но подкреплять пищей, если оно выйдет оттуда самостоятельно. Проблема была решена. Иногда и детей мы подкрепляем слишком рано, находясь под ложным впечатлением, будто мы их подбадриваем ("Молодец, хорошо, ты уже почти все сделала правильно"). Возможно, при этом мы подкрепляем попытки. Но существует разница между попыткой сделать что-то и выполнением этого. Причитания типа "я не могу" иногда отражают фактическое положение вещей, но они могут являться и признаками того, что часто подкреплялись просто попытки. Вообще, подкрепление поведения, которое еще не совершилось, - подарками, обещаниями, комплиментами или чем-нибудь в этом роде v ни капельки не подкрепляет это поведение. Если что-то и подкрепляется, так это поведение, совершающееся в данное время: вероятнее всего - выпрашивание подкрепления. Соблюдение времени очень важно и при обучении с отрицательным подкреплением. Лошадь учится поворачивать налево, когда тянут за левый повод, но только если после поворота натяжение ослабевает. Прекращение
натяжения является подкреплением. Вы садитесь на лошадь, пришпориваете ее, и она движется вперед - тогда вам надо перестать ее пришпоривать (если, конечно, вы не хотите, чтобы она двигалась быстрее). Начинающие наездники часто тычут лошадь в бока непрерывно, как будто шпоры это своего рода педаль газа в автомобиле, необходимая для движения. Пришпоривание не прекращается и тем самым не несет никакой информации для лошади. Так в школах верховой езды появляются лошади с железными боками, которые передвигаются черепашьим шагом независимо от того, как часто их пришпоривают.То же происходит и с людьми, к которым постоянно придираются и бранят родители, начальство или учителя. Если отрицательное подкрепление не прекращается в момент достижения желаемых результатов, то оно не является подкреплением и не несет информации. Оно становится как буквально, так и в терминах теории информации "шумом". Пример своевременности подкреплений: Как только забивают гол или бегун пересекает финишную линию, рев толпы сигнализирует полное одобрение; а только посмотрите на бешеный обмен взаимоподкреплений игроков в тот момент, когда счет открыт или игра выиграна. С артистами, особенно с киноактерами, дело обстоит совершенно иначе. Даже на сцене аплодисменты раздаются после того, как работа кончается. У артистов кино не существует своевременного подкрепления, за исключением редкого отзыва режиссера или оператора об их работе или рукопожатия; письма поклонников и положительные рецензии, приходящие спустя недели и месяцы, бледнеют в сравнении с неистовством американского стадиона в минуту успеха. Нет ничего удивительного, что некоторые звезды кино проявляют болезненную страсть к низкой лести, и сенсациям; работа может совершенно не удовлетворять, если подкрепления, даже самые блестящие, всегда опаздывают.
Величина подкрепления

Начинающие тренеры, использующие пищевое подкрепление при работе с животными, часто не знают, какова должна быть величина каждого подкрепления. Ответ таков: чем меньше, тем лучше. Чем меньше подкрепление, тем быстрее животное съест его. Это не только экономит время, но и позволяет дать большее количество подкреплений за один сеанс, прежде чем животное насытиться.Вообще, подкрепление величиной в один глоток животного вполне достаточно для поддержания его заинтересованности - одно-два зернышка для цыпленка, кубик мяса в 6 мм для кошки, половина яблока для слона. Особо любимой пищи можно давать и еще меньше v например: чайную ложку зерна для лошади.Служители Национального зоопарка обучали белых медведей многим полезным вещам, таким, как переход по команде в другую клетку, используя изюминки. Основное правило дрессировщика заключается в том, что если вы собираетесь
провести в день одно занятие, то можете рассчитывать на хорошую работу животного примерно за четверть его дневного рациона, остальное дается после окончания работы. Если же вам надо провести три или четыре занятия в день, то дневную порцию пищи надо разделить примерно на восемьдесят частей и за один сеанс давать двадцать или тридцать. Восемьдесят подкреплений, видимо, являются максимумом, способным заинтересовать субъекта в течение дня.(Может быть, поэтому слайдовая кассета содержит восемьдесят слайдов; по крайней мере, когда лектор просит демонстратора показать вторую кассету
слайдов, народ тяжело вздыхает.) Размер подкрепления зависит также от сложности задачи. В океанариуме "Жизнь моря" сочли необходимым давать каждому [дельфину] по большой макрели за их олимпийские 6-7-метровые вертикальные прыжки. Они просто отказывались делать это за обычное вознаграждение в виде двух маленьких корюшек. У людей почти всегда более трудная работа вознаграждается лучше. А если этого нет, то как мы ненавидим тяжелую работу, если нам приходится ее делать.

Большой куш
Одним из наиболее полезных приемов пищевого или какого-либо другого подкрепления для человека и животных является получение куша.
Это награда, которая во много, иногда в 10 раз больше обыкновенного подкрепления и являющаяся сюрпризом для субъекта. В одном рекламном агентстве, бывали официальные вечера на Рождество, а также неофициальные праздники по поводу окончания большой работы или заполучения нового клиента. Но у председателя правления была еще привычка устраивать в год один-два абсолютно неожиданных вечера. Внезапно в середине дня он проносился по всем комнатам конторы, крича, чтоб все кончали работу. Коммутаторы выключались, появлялась процессия поставщиков провизии, музыканты, буфетчики, шампанское, копченая семга, и все это только для сотрудников и безо всякой особенной причины. Это было неожиданным кушем для пятидесяти человек. Я думаю, что это очень способствовало поднятию духа коллектива. Куш можно использовать и для того, чтоб отметить внезапное озарение. Один
наездник, когда лошадь впервые проделывает какой-нибудь сложный маневр, соскакивает с нее, освобождает от седла и уздечки и свободно выпускает на манеж - куш полной свободы, который часто, по-видимому, может привести к образованию новой линии поведения. Как ни странно, получение всего одного куша может так же улучшить ответы непокорного, испуганного или сопротивляющегося субъекта, который вообще не проявлял нужного поведения. В океанариуме "Жизнь моря" проводили исследования по заданию ВМС США, в которых дельфин получал подкрепление за новые реакции, осуществляемые вместо старого, ранее выработанного поведения. Испытуемой была понятливая самочка по имени Хоу, которая редко давала новые ответы. Когда ей не стало удаваться получать подкрепления за свои действия, она стала неактивной, и в конце концов в течение одного занятия за двадцать минут не дала ни одного ответа. Наконец, тренер кинул ей пару рыбок "ни за что". Явно ошарашенная такой щедростью, Хоу снова стала активной и вскоре выполнила движение, которое можно было подкрепить, что привело к несомненному прогрессу на последующих занятиях. Как пишет Карен Прайор вспоминая детство: Когда мне было пятнадцать лет,
самым большим удовольствием для меня были уроки верховой езды. Конюшни, где я занималась, продавали билеты, каждый на десять уроков; по своим деньгам я могла позволить себе один билет в месяц. В то время я жила с отцом, Филиппом Уили, и мачехой, Рики; и хотя они относились ко мне очень хорошо, я вступила в один из тех периодов юности, когда беспрерывно целыми днями
бываешь невыносимо грубым и противным. Однажды вечером супруги Уйди, которые были любящими и изобретательными родителями, сказали, что они ужасно устали от моего поведения и поэтому решили меня наградить. И они презентовали мне ослепительно новый, дополнительный бесплатный билет на верховую езду. Один из них не поленился съездить на конюшни, чтобы купить его. Поразительно! Незаслуженный куш. Как мне помнится, я с ходу переменилась, и Рики Уйди подтвердила это много лет спустя. Почему назаработанный куш может оказать такое внезапное и далеко идущее влияние? Может быть, со временем кто-нибудь напишет диссертацию по этому поводу и объяснит нам это.


Условное подкрепление
Очень часто, особенно при работе с пищевым подкреплением, его невозможно дать в тот момент, когда субъект делает то, что хотели бы поощрить. Если учить дельфина прыгать, то никак не дать ему рыбку в тот момент, когда он находится в воздухе. Если за каждым прыжком следует брошенная рыбка (отставленное подкрепление), то у животного, в конце концов, образуется связь между прыжком и едой, и оно будет прыгать чаще. Однако это не несет информации о том, какой из аспектов прыжка мне нравится. На какую высоту? С
каким прогибом? Может, надо войти обратно в воду со всплеском? Таким образом, потребуется очень много повторений, чтобы животное установило, какой именно прыжок я имела в виду. Чтобы обойти эту трудность, используют условное подкрепление. Условное подкрепление представляет собой какой-либо изначально ничего незначащий сигнал - звук, свет, движение, - который умышленно связывают с подачей подкрепления. Тренеры дельфинов остановили свой выбор на полицейском свистке: его хорошо слышно даже под водой и он не связывает руки, чтобы можно было давать сигналы и бросать рыбу. С другими животными можно выбрать особые поощряющие слова, выбранные и приберегаемые для использования в качестве условного подкрепления: "хорошая собака", "хорошая лошадка". Школьные учителя часто прибегают к некоторым таким ритуальным и тщательно нормированным словам похвалы - "замечательно" или "очень хорошо", - за которые дети страстно работают и ждут их. Наша жизнь изобилует условными подкреплениями. Нам нравится слышать, как звонит телефон или видеть набитый почтовый ящик, даже если половина звонков неинтересна и большая часть корреспонденции - утиль, потому что множество случаев научили нас связывать звонок или конверт с хорошим. Нам нравится рождественская музыка, и мы ненавидим запах зубного кабинета. Мы храним окружающие нас вещи - картины, посуду, трофеи v не потому, что они красивы или полезны, а потому, что они напоминают нам о временах, когда мы были счастливы, или о людях, которых мы любили. Они представляют собой условные подкрепления. Практически дрессировка животных с использованием положительного подкрепления почти всегда должна начинаться с выработки условного подкрепления. Прежде чем начать выработку поведения как такового, пока субъект еще ничего особенного и не делает, вы учите его понимать значимость условного подкрепления, сочетая его с пищей, поглаживанием иди другим истинным подкреплением. Иногда, по крайней мере при работе с животными, вы можете уловить, когда субъект начинает узнавать ваш сигнал, означающий "Хорошо!". Видно, как животное вздрагивает при действии условного подкрепления и начинает искать истинное подкрепление. После выработки условного подкрепления в ваших руках оказывается реальный способ сообщения животному, что в его поведении вас интересует.
Условные подкрепления приобретают чрезвычайную силу. Так как информация "Ты прав" сама по себе представляет ценность, она не обязательно должна сопровождаться первичным подкреплением. Фактически использование пищи, ласки или чего-нибудь в этом роде можно практически свести к нулю, а условное подкрепление будет приносить прекрасные результаты.
Лошади и собаки работают по часу и более с маленьким или безо всякого безусловного подкрепления. Люди конечно же тоже могут бесконечно работать за деньги, являющиеся ничем иным как условным подкреплением, обозначением вещей, которые на них можно купить, особенно люди, которые уже заработали гораздо больше денег, чем они когда-либо смогут действительно потратить, и, следовательно, пристрастившиеся к условному подкреплению. Действие условного подкрепления можно усилить, сочетая его с несколькими безусловными подкреплениями. В данный момент субъект может не хотеть, скажем, есть, но если тот же подкрепляющий звук или слово были умышленно связаны еще и с водой или другими потребностями или приятными моментами, он сохраняет свое действие и в этом случае.
Кошки слышат слова "хорошая киса!", когда получают ужин, когда их гладят, когда их впускают в дом и выпускают из дома, когда они проделывают маленькие трюки и получают за них вознаграждение. В результате можно использовать эти слова для поощрения кошки, спрыгивающей с кухонного стола, и нет нужды сопровождать его каким-либо безусловным подкрепдением. Быть может, причина того, что деньги оказывают на нас такое подкрепляющее действие, кроется в том, "что они могут связываться практически с чем угодно. Это чрезвычайно обобщенное условное подкрепление. Как только вы выработали условное подкрепление, вы должны пользоваться им осторожно, не разбрасывать без толку, иначе его сила уменьшится. Можно и должно окружить заботой и вниманием детей, супруга, родителей, любимых и друзей безотносительно к какому-нибудь определенному поведению, но необходимо приберечь что-то специально в качестве условного подкрепления чего-либо определенного. Существует множество реальных событий, заслуживающих похвалы, подкрепления, которым щедро обмениваются в счастливых семьях. Однако фальшивая или незначимая награда вскоре вызывает негодование даже у маленьких детей и теряет всякую силу в качестве подкрепления. Можно выработать и условное отрицательное подкрепление, которое может быть очень полезным. Дети и многие животные часто моментально реагируют на резкое, громкое слово запрета, которое ничем не сопровождается. Возможно, оно является первичным или безусловным подкреплением. Но некоторые животные - особенно этим славятся кошки - игнорируют окрики и брань. Одна женщина совершенно безуспешно пыталась отучить свою кошку царапать кушетку, используя в качестве отрицательного подкрепления возглас "Нет!". Однажды в кухне она уронила большой латунный поднос, случайно упавший почти рядом с кошкой, и, когда раздался громкий грохот подноса, воскликнула: "Нет!". Кошка была страшно напугана, подпрыгнула вверх, подняв шерсть дыбом. В следующий раз, когда кошка начала драть кушетку, хозяйка крикнула: "Нет!", у кошки сделался испуганный вид, и она тотчас же перестала. Двух-трех повторений ставшего условным слова оказалось достаточно, чтобы навсегда прекратить это поведение.

Режимы подкреплений

Бытует неправильный взгляд, что если вы начали вырабатывать поведение с помощью положительного подкрепления, то должны продолжать его применение на протяжении всей дельнейшей жизни субъекта, если этого не будет, то поведение исчезнет. Это неверно: постоянное под крепление необходимо только на стадиях обучения. Вы можете несколько раз вознаградить годовалого ребенка за пользование горшком, но как только поведение заучено, предмет обучения сам о себе позаботится. Мы даем или должны давать начинающему множество подкреплений - обучение ребенка езде на велосипеде идет под настоящий поток: "Правильно, крепче держи руль, у тебя получилось, хорошо!" Но вы будете выглядеть довольно глупо (а ребенок решит, что вы сошли с ума), если вы будете продолжать хвалить его после того как навык установился. Для того чтобы поддерживать уже выученное поведение на определенном уровне надежности, не только не надо подкреплять его все время, а даже, наоборот, следует прекратить регулярные подкрепления и перейти на эпизодическое использование подкрепления, подаваемого в случайном и не предсказуемом порядке. Это и есть то, что психологи называют вариабельным режимом подкрепления. Вариабельный режим гораздо более эффективен для поддержания поведения, чем постоянный, предсказуемый. Один психолог объяснил это так: если у вас машина новая и всегда хорошо заводилась, а однажды, когда вы сели в нее, повернули ключ, она не завелась, то вы, может быть, и попробуете завести ее еще несколько раз, но скоро решите, что что-нибудь не в порядке, и позвоните в гараж. Поведение, состоящее в поворачивании ключа, при отсутствии ожидаемого немедленного подкрепления быстро угаснет. С другой стороны, если у вас вместо машины старая консервная банка, которая еще ни разу не заводилась с первой попытки, и каждый раз требуется целая вечность для того, чтобы привести ее в движение, вы можете продолжать попытки ее завести в течение получаса; ваше поведение по поворачиванию ключа происходит в низковероятностном режиме подкрепления и поэтому сильнейшим образом поддерживается. Но даже некоторые профессиональные дрессировщики не могут правильно использовать вариативный режим положительного подкрепления; многим эта концепция представляется особенно трудной, не укладывающейся в голове. Нам понято, что нет нужды продолжать наказывать за неправильное поведение, если оно прекратилось, но почему бы не вознаграждать постоянно за правильное поведение. Мы не так уверены в этом только когда ставим целью добиться с помощью положительного подкрепления улучшения дисциплины. Действенность вариатавного подкрепления лежит в основе всех азартных игр. Если каждый раз, опустив в автомат 5 центов, будете получать десять, то скоро вы потеряете к этому интерес. Да, вы будете делать деньги, но какой это нудный способ! Людям нравится играть с автоматом именно потому, что невозможно предугадать заранее, то ли ничего не получишь, то ли какую-то мелочь, то ли сразу кучу денег, и когда именно будет это подкрепление (это может быть только один самый первый раз). Почему одни люди втягиваются в азартную игру, а другие могут поиграть и бросить, это уже другой вопрос, но для тех, кто попался на крючок, этим крючком стал вариативный режим положительного подкрепления. Чем длительнее интервалы между подкреплениями в вариативном режиме, тем сильнее он стимулирует поведение. Однако режимы с длительными интервалами работают против вас, когда вы пытаетесь угасить поведение. Если поведение не подкреплять совсем, то скоро появится тенденция к его угасанию; но если оно все-таки время от времени подкрепляется – неважно сколь эпизодично - одна сигарета, одна рюмка, одна поблажка ворчуну или нытику - и поведение вместо того, чтобы угасаться, может быть значительно усилено режимом с длительными интервалами между подкреплениями. Всем встречались люди, которые непонятным образом привязаны к супругам или любовникам, которые с ними плохо обращаются. Мы привыкли думать, что так бывает только с женщинами - она чувствует влечение к тому, кто груб, невнимателен, эгоистичен и даже жесток, она его все равно любит, - но это случается и с мужчинами. Каждый знает людей, которые после развода или другого рода утраты одного негодяя находят другого, в точности похожего на предыдущего. Являются ли эти люди вечными жертвами по каким-либо глубоким психологическим причинам? Возможно. Но, может быть, они -- жертвы режима с длительными интервалами между подкреплениями? Если вы вступили в связь с очаровательным, обаятельным, интересным в сексуальном плане, веселым и внимательным человеком, а затем он становится все более несговорчивым, даже обидчивым, но все же время от времени проявляет свои хорошие качества, вы станете жить ради этих все более редких моментов, когда вы получаете это прекрасное подкрепление: полное очарования, обаяния, привлекательности и веселья внимание. И парадоксально с точки зрения здравого смысла, но закономерно с точки зрения теории обучения, что чем реже и непредсказуемей становятся такие моменты, тем сильнее становится их подкрепляющий эффект, и тем дольше ваша линия поведения будет сохраняться. Кроме того, легко понять, почему человек, однажды оказавшийся в таких отношениях, часто ищет их повторения: ему может казаться, что во взаимоотношениях с нормальным человеком, который сдержан и доброжелателен большую часть времени, не хватает остроты того редкого, страстно желаемого и потому вдвойне действенного подкрепления. Посмотрите на ситуацию с точки зрения человека, управляющего поведением: я могу держать ее (его) в безоговорочном подчинении, так, "Чтобы она (он) делала все, что я захочу, ради моего удобства и спокойствия, до тех пор пока я даю ей (ему) все, что она (он) хочет... изредка. Это один из способов, которыми сутенеры держат в повиновении своих девочек. Конечно, это крепкие путы, но однажды жертва осознает, что сила "очарования" по крайней мере отчасти зависит от режима подкрепления, и спокойно уйдет от этого типа отношений и поищет что-то другое.

Исключения из правила вариативного подкрепления

Лишь в одном случае не следует прибегать к вариативному режиму подкрепления, после того как поведение заучено, - это когда оно направлено на решение своего рода головоломки или теста. При одном из видов дрессировки собака должна выбирать из нескольких разнородных предметов тот, который побывал в руках у хозяина и хранит его запах. При этом необходимо каждый раз говорить собаке, что она выбрала правильно, чтобы в следующий раз она знала, что надо делать. В тестах на различение, - скажем, идентификация более высокого из двух звуков -- необходимо подкреплять каждый правильный ответ испытуемого, чтобы он был постоянно информирован о том, какую задачу он решает (подойдет, конечно, и условное подкрепление). Когда мы отгадываем Кроссворд или составляем картинку-загадку, мы получаем подкрепления за правильные догадки, так как только они являются "подходящими". Если бы при составлении картинки-загадки можно было вставить в одну ячейку несколько кусочков, то положительного подкрепления за правильный выбор, который является обязательной обратной связью в любой ситуации выбора, не получалось бы.

Долговременные программы поведения

В дополнение к вариативному режиму подкреплений можно ввести и закрепленный, при котором субъект знает, что он должен работать определенное время или выполнить определенный комплекс поведенческих реакций за каждое подкрепление. Например, подкрепляя каждый шестой прыжок, можно сделать так, что дельфин будет прыгать шесть раз подряд, и вскоре получим стабильные серии из шести прыжков. Трудность работы с фиксированным режимом подкрепления состоит в том, что первые ответы в сериях не подкрепляются и возникает тенденция к уменьшению затрачиваемых на них усилий. У прыгающего дельфина со временем все прыжки, кроме последнего, который действительно подкрепляется, уменьшаются. Это отрицательное влияние фиксированного режима подкреплений является важным фактором во многих видах человеческой деятельности - например на заводском конвейере. Чтобы получить подкрепление, необходимо работать в течение определенного времени, но так как подкрепление дается в фиксированном режиме, независимо от качества выполнения, человек совершенно естественно стремится делать то наименьшее количество работы, которое позволяет не выпасть из игры, особенно низкая производительность может быть в начальный период работы. Зарплата по пятницам является фиксированным подкреплением, делающим понедельник тяжелым днем. У дельфинов поддержать поведение поможет случайное подкрепление первого или второго прыжка, помимо шестого. У людей могут быть эффективны различные виды прогрессивных оплат или других подкреплений (например, награды), тесно связанные с качеством и количеством продукции и выдаваемые неодновременно с обычным подкреплением. Применяя либо фиксированный, либо вариативный режимы подкрепления можно оттренировать чрезвычайно длинные цепи поведенческих реакций. Можно добиться того, что цыпленок будет клевать кнопку сто и более раз за каждое зернышко пшеницы. Для людей также можно привести много примеров отставленного вознаграждения. Один психолог шутит, что самым длительным режимом неподкрепляемого поведения в человеческой жизни является учеба в школе.

При режимах подкрепления с чрезвычайно длительными интервалами иногда создаются ситуации, которые не приносят организму полезного результата. Для цыпленка это определяется обменными процессами: когда на клевание кнопки он начинает тратить больше энергии, чем может восстановить при получении пшеничного зерна, поведение начинает угасать - цена работы падает так низко, что ее просто становится незачем делать. Конечно, так часто бывает и с людьми. Другое явление, встречающееся при очень длительных интервалах между подкреплениями, - замедленный старт. Начав клевать, цыпленок совершает эти действия с постоянной частотой, так как каждый удар приближает его к подкреплению, но было отмечено, что по мере того, как увеличиваются интервалы между подкреплениями, он стремится "отложить" начало реакции на более длительный срок. Это и называется "отсроченное начало поведения с долговременной программой" и очень распространено в жизни людей. В любой долгосрочной задаче, начиная с уплаты подоходного налога и кончая уборкой гаража, можно придумать бесконечное количество причин для того, чтобы не начать дело безотлагательно. Написание чего-либо, иногда даже просто письма, тоже поведение с долгосрочной программой. Когда оно уже начато, все идет прекрасно. Но так трудно заставить себя сесть и начать!

Суеверия
В реальной жизни подкрепления возникают на каждом шагу и часто представляют собой лишь случайное стечение обстоятельств. Один биолог, изучавший ястребов, заметил, что если ястреб поймал под каким-либо кустом мышь, то в течение недели, а иногда и больше, он будет ежедневно проверять этот куст; вероятность его полета именно над этим местом обусловлена силой подкрепления. Попробуйте пройти мимо мусорной корзины, тщательно к ней не приглядываясь, если накануне - нашли в ней пять долларов. Случайное подкрепление полезно для ястреба; вообще можно сказать, что поведение животных эволюционировало так, что каждый вид обладает возможностью извлекать пользу из любого подкрепления. Однако многие случайные подкрепления не сопровождаются полезным результатом, но тем не менее могут оказать сильное влияние на поведение. Когда поведение не связано с последующими событиями, но в мозгу субъекта связывается с ними в качестве необходимого условия их осуществления, говорят о суеверном поведении. Пример этого - человек, грызущий карандаш. Если во время экзамена вам случится взять в рот карандаш и тут же вам придет в голову правильный ответ или хорошая мысль, то такое подкрепление может изменить ваше поведение: хорошие мысли пришли, когда грыз карандаш, таким образом, это действие подкрепляется. В действительности же это было всего лишь случайно обусловленное поведение. То же самое можно сказать отношении определенной одежды или совершении некого ритуала перед тем как взяться за какое-либо дело. "Суеверия" часто возникают при дрессировке животных. Животное можетруководствоваться в своих ответах такими критериями, которые вы и не собирались вводить, но которые часто случайно совпадали с подкреплениями и образовали условную связь. Например, животное может считать, что чтобы получить подкрепление, оно должно находиться в определенном месте, повернуться в какую-либо сторону или особым образом сидеть. Когда вы захотите, чтобы оно работало в новом месте или при другой ориентации, внезапно загадочным образом все поведение ломается, и пойди пойми почему это произошло. Поэтому гораздо лучше, как только поведение начинает формироваться, начинать разнообразить варианты условий, которые не представляются вам важными, чтобы не возникло какого-либо случайного обусловливания, которое впоследствии будет вам мешать. Более всего следите, чтобы не образовывались случайные временные связи. Как животное, так и люди очень хорошо чувствуют временные интервалы. Многие потомственные дрессировщики находятся просто в плену суеверного способа мышления и поведения. Некоторые считают, что дельфины предпочитают людей, одетых в белое, что мулов необходимо бить, что медведи не любят женщин и т.д. Это относится и к тем, кто работает с людьми и считает, например, что на пятиклассников необходимо кричать и что наказание необходимо, чтобы добиться уважения. Такие воспитатели находятся во власти традиции, они вынуждены всегда работать одними и теми же способами, так как не могут разделить действенных методов от того, что является просто суеверием. Эта слабость, или смешение, обнаруживается у представителей многих профессий - в образовании, технике, военном деле, но в большей мере, пожалуй, в медицине. Ужас сколько всего назначается пациенту не потому, что это обладает целебными свойствами, а просто потому, что так всегда делали или все сейчас делают. Каждый, кто хоть раз лежал в больнице, может вспомнить с полдюжины примеров ненужных действий, которые представляют собой не более как суеверное поведение. Интересно, что суеверное поведение не исчезает, если вы просто указываете на его неэффективность; будучи очень сильно заученным, оно соответственно сильно оберегается. Попробуйте поговорить с врачом о его привычке использовать неэффективное или даже вредное лечение, и вы полу чите отпор в соответствующих выражениях; Единственный способ избавиться от суеверного поведения - это убедиться, что оно не связано с подкреплением. Допустим, человек очень любит фехтование. Два-три раза в неделю он ходит на тренировку, а по выходным часто ездит на соревнования. Однажды во время поединка с сильным партнером он почувствовал себя подавленным, потому что оставил дома свою любимую шпагу. Он проиграл матч. Потом он понял, что ощущение подавленности, очевидно, гораздо больше влияет на его действия, чем та шпага, которой он пользуется, а следовательно, иметь "любимую" шпагу - суеверие. Этот человек выявлял и боролся с любым суеверным поведением, которое могло бы связаться с фехтованием. Он обнаружил у себя много таких пунктиков, начиная с привязанности к некоторым предметам одежды до внутреннего убеждения, что на его бой может повлиять приснившийся сон, спор или даже отсутствие фруктового сока на соревнованиях. Систематически анализируя каждое из этих обстоятельств, он разорвал одну за другой свою зависимость от них, так как понял, что это суеверия. И в результате теперь он выходит на каждый бой спокойным и уверенным, если даже перед этим ему снился кошмар про опоздание на поезд, потерю снаряжения, баталии с таксистами, если даже он фехтует одолженной шпагой в тренировочном костюме и в разных носках.
Организованное подкрепление
Чего можно добиться с помощью положительного подкрепления:
Вот несколько примеров того, чего можно добиться с помощью положительного подкрепления: Преподаватель на неделю задавал домашнюю работу, выполнением которой многие из учеников себя не утруждали. Преподаватель каждый раз по десяти, а то и более минут разглагольствовал о слабом выполнении домашних заданий. Устав от того, что их без конца бранили, одна из учениц предложила преподавателю подкреплять тех. Кто принес домашние работы, вместо того чтобы вправлять мозги тем, кто не сделал их. Так он и поступил, подкрепляя своих учеников публичной похвалой за каждое выполненное задание. К третьей неделе в классе не только улучшилось настроение, но и возросло число выполнивших домашнее задание с одной трети до трех четвертей класса. Молодая женщина вышла замуж за человека, который очень любил распоряжаться и командовать. Хуже того, и его отец, который жил с ними, тоже взялся помыкать невесткой. Эту историю рассказывала мать девушки. Она была в ужасе, когда впервые увидела, что приходится терпеть ее дочери. "Не беспокойся, мама, - сказала дочь, - поживем - увидим". Дочь взяла за правило как можно меньше реагировать на команды и резкие реплики, и одновременно подкреплять послушанием и живостью реакции любое проявление вежливости и внимания со стороны мужчин. За год она превратила их в очень славных людей. Теперь, когда она приходит домой, они встречают ее улыбками, и оба с радостью соглашаются помочь с покупками. Одна восьмиклассница, жившая в городе, любила по выходным брать свою собаку на загородные прогулки, но собака часто убегала очень далеко и не возвращалась на зов, особенно когда наступала пора ехать домой. Однажды во время прогулки, когда, бегая туда - сюда, собака сама подходила к девочке, та начала очень живо на это реагировать - хвалить, гладить, болтать, обнимать, возиться с собакой. Когда пришло время ехать домой, девочка позвала собаку, и та с радостью подошла к ней. Громадное радушие в качестве положительного подкрепления, очевидно, перевесило обычное продление собакой своей свободы. Больше на прогулках неприятностей с ней не было. Новый администратор одного грозного босса прикинул, что из его работы может являться подкреплением для босса - например принесение бумаг на подпись, - и старался как можно чаще приурочить это дело ко времени, когда босс не был в ярости. Босс стал спокойнее и, подписывая бумаги, стал даже отпускать шутки. Некоторые люди создают особые типы подкреплений, чтобы заслужить их, другие готовы многим пожертвовать.

Организованное подкрепление

Собрания участвующих в распродаже, клубы организации рекламы, курсы Д.Карнеги, общество контроля за собственным весом, да и большинство организаций, в которых происходит групповое обучение самоусовершенствованию используют в основном влияние подкрепления индивидуума группой. Похвала, медали, церемонии награждения и другие формы группового признания являются мощными подкреплениями, используемыми иногда с большим воображением. Директор фирмы, занимающейся распродажей, желая вознаградить свою "команду" за удачный год, арендовал футбольный стадион, устроил большой праздник для служащих старших администраторов и членов их семей; он сделал так, что комиссионеры выбегали на поле через туннель для игроков, а на табло под аплодисменты всех присутствующих вспыхивали их имена.

Самоподкрепление


Одним из наиболее полезных практических применений подкрепления является самоподкрепление. Мы им часто пренебрегаем, отчасти потому, что это не приходит нам в голову, отчасти, потому что склонны требовать от себя гораздо больше, чем от других. Как сказал один министр: "Немногие имеют столь низкие критерии, что по ним легко жить". В результате мы часто по нескольку дней не расслабляемся, переходя от одной задачи к другой, от нее к третьей, не замеченные и неотблагодаренные даже самими собой. Не говоря уже о подкреплении себя за изменение какой-либо привычки или приобретение нового навыка, какое-либо подкрепление необходимо и просто для будничной жизни; лишение себя подкреплений, - один из факторов повышения нервозности и депрессий.
Вы можете подкрепить себя здоровыми способами - часом досуга, прогулкой, разговором с друзьями или хорошей книгой; или нездоровыми - сигаретами, виски, пищей, от которой толстеют, наркотиками, сидением допоздна и т.д.

 Вводная часть Формирование высших форм поведения без принуждения и боли