ОПЕРАНТНОЕ ПОВЕДЕНИЕ
操作行为
Рефлексы, как условные, так и всякие другие, главным образом связаны с внутренними физиологическими: процессами в организме. Однако чаще всего нас интересует такое поведение, которое имеет определенное воздействие на окружающий мир. Оно возникает в результате столкновения человека с необходимостью решать задачи, выдвигаемые жизнью. Кроме того, его специфические характеристики также представляют интерес для теории. Последствия поведения могут играть роль обратной связи для организма. В этом случае они изменяют вероятность осуществления поведения, породившего их. В английском языке много слов, имеющих отношение к данному эффекту, например «поощрение» и «наказание», но ясное представление о нем мы можем получить только в результате проведения эксперимента.
条件反射和所有其他反射主要与身体的内部生理过程相关。然而,大多数时候我们感兴趣的是对我们周围的世界有一定影响的行为。它的出现是由于一个人与解决生活提出的问题的需要发生冲突。此外,它的具体特征也引起了理论的兴趣。行为的后果可以作为对有机体的反馈。在这种情况下,它们改变了导致它们发生的行为的概率。英语中有很多词指代这种效应,例如“reward”和“punishment”,但我们只能通过实验才能清楚地了解它。
КРИВЫЕ НАУЧЕНИЯ
学习曲线
В 1898 г. Э. Л. Торндайком была предпринята одна из первых серьезных попыток изучить изменения, обусловливаемые последствиями поведения. Его эксперимента возникли на основе дискуссии, которая впоследствии. заинтересовала многих ученых. Ч. Дарвин, настаивавший на преемственности видов, подверг сомнению уникальность человека и его способность думать. В печати распространилось большое количество анекдотов, в которых говорилось о проявлении животными «силы разума». Но распространение особенностей, ранее характеризующих только поведение человека, на поведение животных, привело к постановке новых вопросов. Указывали ли наблюдаемые факты на психические процессы или эти очевидные проявления мышления могут быть объяснены иначе? В конце концов отпала необходимость в представлении о внутренних мыслительных процессах. Должно было пройти много лет, прежде чем тот самый вопрос о специфичности поведения человека, не возник вновь, но эксперименты Торндайка и его объяснение мышления (reasoning) животных явились важным шагом в этом направлении.
1898 年,E. L. Thorndike 首次认真尝试研究行为后果引起的变化。他的实验源于随后的讨论。许多科学家感兴趣。坚持物种连续性的查尔斯·达尔文质疑人类的独特性及其思考能力。报刊上流传着大量关于动物“理性力量”表现的轶事。但以前仅表征人类行为的特征扩展到动物行为,引发了新的问题。观察到的事实是否表明了心理过程,或者这些明显的思维表现是否可以得到不同的解释?最终不再需要想象内部思维过程。许多年后,关于人类行为特殊性的同样问题再次出现,但桑代克的实验和他对动物推理的解释是朝这个方向迈出的重要一步。
Если кошка помещается в ящик, из которого она может выбраться, открыв задвижку, она может проявить много видов поведения, некоторые из которых могут оказаться эффективными. Торндайк установил, что при многоразовом помещении кошки в ящик успешное поведение наступало все быстрее и быстрее, в это продолжалось до тех пор, пока оно не стало предельно простым и быстрым. Кошка решала свою задачу, как разумное человеческое существо, хотя, возможно, и не так быстро. Однако Торндайк не видел за этим «мыслительных процессов» и утверждал, что они не нужны для объяснения. Он описал свои результаты, указав на то, что поведение кошки было «запечатлено» (stamped in), поскольку оно сопровождалось открытием двери.
如果一只猫被放在一个盒子里,通过打开门闩它就可以逃脱,它会表现出许多行为,其中一些可能是有效的。桑代克发现,当一只猫被反复放入盒子中时,成功的行为发生得越来越快,直到变得极其简单和快速。猫像聪明人一样解决了它的问题,尽管可能没那么快。然而,桑代克没有看到这背后的“心理过程”,并认为不需要解释。他在描述他的结果时表示,猫的行为被“印记”了,因为它伴随着门的打开。
Тот факт, что поведение запечатлевается или сопровождается определенными последствиями, Торндайк назвал «законом эффекта». В своих экспериментах он установил, что в рамках одной и той же ситуации определенное поведение протекает все более и более стабильно в отличие от других поведенческих проявлений. Фиксируя промежутки времени, которые требовались кошке для того, чтобы выбраться из ящика, он построил «кривую научения». Эта ранняя попытка описать поведенческий процесс количественно, аналогично описанию физических и биологических процессов, рассматривалась как важный шаг вперед. Он раскрыл процесс, который развертывался в течение длительного времени и который был доступен для наблюдения. Итак, Торндайк сделал открытие. С тех пор было получено много кривых, которые легли в основу многих психологических работ, посвященных научению.
行为会留下印记或伴随一定的后果,这一事实被桑代克称为“效果法则”。在他的实验中,他发现在相同的情况下,与其他行为表现相比,某些行为会越来越稳定地进行。通过记录猫离开盒子所需的时间,他构建了一条“学习曲线”。这种定量描述行为过程的早期尝试,类似于物理和生物过程的描述,被视为向前迈出的重要一步。他揭示了一个在很长一段时间内展开并且可以观察到的过程。于是桑代克有了一个发现。从那时起,人们获得了许多曲线,这些曲线构成了许多有关学习的心理学著作的基础。
Однако кривые научения не описывают сущность запечатления. Критерий Торндайка — время, необходимое животному для того, чтобы выбраться из клетки, — был связан с устранением других видов поведения, и его кривая зависела от ряда различных действий, которые могла выполнять кошка в определенном ящике. Форма кривой также зависела от поведения, которое было «успешным», и от того, был ли это редкий или обычный способ поведения в данном ящике. Можно сказать, что кривая научения, построенная таким образом, отражает свойства ящика с задвижкой, а не поведение кошки. Это положение распространяется на многие другие устройства, разработанные для изучения научения. Различные лабиринты, через которые белые крысы и другие животные учатся проходить, «ящики выбора», в которых животные научаются различать свойства, или паттерны стимулов, аппараты, посредством которых представляется последовательность стимулов, подлежащих усвоению при изучении памяти человека, — все они порождают различные кривые научения.
然而,学习曲线并不能描述印记的本质。桑代克的标准——动物离开笼子所需的时间——与消除其他行为有关,其曲线取决于猫在特定盒子中可能执行的许多不同动作。曲线的形状还取决于“成功”的行为以及它在给定框中是罕见的还是常见的行为。可以说,以这种方式构建的学习曲线反映了闩锁盒的属性,而不是猫的行为。这适用于许多其他旨在研究学习的设备。白老鼠和其他动物学习导航的各种迷宫,动物学习区分刺激的属性或模式的“选择框”,在人类记忆研究中呈现一系列刺激以供学习的装置——它们都会产生不同的学习曲线。
Усредняя многие показатели индивидов, мы можем сгладить эти кривые настолько, насколько хотим. Более того, кривые, полученные в различных условиях, могут иметь определенные общие свойства. Например, при измерении данным способом научение обычно «имеет негативную характеристику убыстрения» — улучшение выполнения наступает все более и более медленно до тех пор, пока оно вовсе не прекращается. Однако из этого не следует, что негативная акселерация характеризует сущность процесса. Предположим по аналогии, что мы наполнили стеклянный сосуд песком и так его перемешали, что песчинки одного и того же размера равномерно распределились внутри него. Если мы слегка встряхнем сосуд, то песчинки перераспределяются. Большие песчинки окажутся наверху, маленькие — внизу. Этот процесс также характеризуется негативной акселерацией. Сначала смесь перераспределяется быстро, но по мере приближения к его завершению процессы в распределении наступают реже и реже. Такая кривая может оказаться совершенно ровной и воспроизводимой, но один лишь этот факт не имеет большого значения. Кривая зависит от определенных процессов взаимодействия песчинок различного размера, от силы сотрясения сосуда и т. д., но в то же самое время она прямо не отражает сами эти процессы.
通过对许多个体进行平均,我们可以根据需要平滑这些曲线。此外,在不同条件下获得的曲线可能具有某些共同的特性。例如,当以这种方式衡量时,学习通常“具有负加速特性”——表现的提高变得越来越慢,直到完全停止。然而,这并不意味着负加速度是该过程的本质特征。以此类推,假设我们在一个玻璃容器中装满沙子,然后将其混合,使相同大小的沙粒均匀地分布在里面。如果我们轻轻摇动容器,沙粒就会重新分布。大沙粒在顶部,小沙粒在底部。这个过程还具有负加速度的特点。起初,混合物会很快重新分配,但随着它接近完成,分配过程发生的频率越来越低。这样的曲线可能是完全平坦且可重复的,但仅这一事实并不重要。该曲线取决于不同大小的沙粒之间相互作用的某些过程、容器的晃动力等,但同时它并不直接反映这些过程本身。
Кривые научения показывают, как различные виды поведения, порождаемые в сложных ситуациях, отбираются закрепляются и реорганизуются. Базисный процесс запечатления отдельного акта осуществляет это изменение, но в самом изменении он прямо не отражен.
学习曲线显示了如何选择、强化和重组在具有挑战性的情况下产生的不同行为。个人行为印记的基本过程带来了这种变化,但并不直接反映在变化本身。
ОПЕРАНТНОЕ ОБУСЛОВЛИВАНИЕ
操作条件
Для понимания сущности закона эффекта Торндайка, нам необходимо дать четкое определение понятия «вероятность реакции». Это очень важное понятие, но, к сожалению, очень трудное. При обсуждении поведения человека мы часто апеллируем к тенденциям «расположенности» вести себя определенным образом. Почти в каждой теории поведения используются такие термины, как «потенциал возбуждения», «сила привычки» или «детерминирующая тенденция». Но как мы наблюдаем тенденцию? И как можно ее замерить?
要理解桑代克效应定律的本质,我们需要对“反应概率”的概念给出明确的定义。这是一个非常重要的概念,但不幸的是,非常困难。在讨论人类行为时,我们经常诉诸以某种方式行事的倾向“倾向”。几乎每种行为理论都使用“唤醒潜力”、“习惯力量”或“决定倾向”等术语。但我们如何观察趋势呢?你如何衡量它?
Если бы определенное поведение существовало в двух ипостасях — в одном случае оно всегда бы имело место, а в другом — никогда, то мы оказались бы почти в беспомощном состоянии при введении программы функционального анализа. Феномен, имеющий характеристики «все и ничего», имеет только простые формы описания. Гораздо более продуктивным является предположение, что вероятность осуществления реакции последовательно распределяется между этими двумя полюсами «все — ничего». Тогда мы можем рассмотреть переменные, которые в отличие от стимулов порождения (eliciting stimulus), «не являясь причиной данного поведения», делают его наступление более вероятным. Далее мы можем, например, рассмотреть последствия действия нескольких таких переменных.
如果某种行为以两种形式存在——在一种情况下它总是发生,而在另一种情况下——从不发生,那么当我们引入泛函分析程序时,我们会发现自己处于一种几乎无助的状态。具有“一切又无”特征的现象只有简单的描述形式。一个更有成效的假设是,反应发生的概率始终分布在这两个全无极点之间。然后,我们可以考虑与引发刺激不同的变量, “虽然不是行为的原因”,但使其发生的可能性更大。例如,接下来我们可以考虑几个此类变量的后果。
Распространенные выражения, отражающие вероятностную природу явления, — «тенденция» или «предрасположенность» — характеризуют частоту наступления определенных видов поведения. Мы никогда не наблюдаем вероятность. Мы говорим, что кто-то «обожает бридж», потому что замечаем, что он часто играет в бридж и часто говорит о нем. «Глубоко интересоваться» музыкой означает много играть, часто слушать музыку и много говорить о музыке. «Неисправимый игрок» много играет в карты. Любитель киносъемок делает снимки, проявляет их и любуется своими собственными снимками и снимками других людей и т. д.
反映现象的概率性质的常见表达方式—— “倾向”或“倾向”——描述了某些类型行为发生的频率。我们从不观察概率。我们说某人“喜欢桥牌”,因为我们注意到他经常打桥牌并且经常谈论桥牌。对音乐“深感兴趣”意味着经常演奏、经常听音乐、经常谈论音乐。 “不可救药的赌徒”经常打牌。电影爱好者拍摄照片、冲洗照片并欣赏自己的照片和其他人的照片等。
Характеризуя поведение человека с точки зрения его частоты, мы принимаем определенные стандартные условия: он должен быть способен выполнить и повторить определенное действие, при этом другие виды поведения не должны мешать. Например, мы не можем знать, насколько сильна тяга человека к музыке, если ему приходится также заниматься другими вещами. Подойдя к проблеме уточнения научного определения вероятности, мы обнаруживаем, что исходными моментами являются частота и условия, при которых наблюдается то или иное поведение. Мы устраняем или по крайней мере сохраняем в неизменном виде любое условие, которое способствует проявлению конкурирующего с изучаемым нами видом поведения. Животное помещается в отдельный (quiet) ящик, и за его поведением наблюдают с помощью одноканального экрана, или оно регистрируется посредством специальных технических устройств. Эти условия нельзя рассматривать как вакуумную среду, так как животное будет реагировать на свойства ящика многими способами, однако его поведение постепенно достигнет достаточно устойчивого уровня, на котором можно исследовать частоту заданной реакции.
当用频率来描述一个人的行为时,我们接受某些标准条件:他必须能够执行并重复某个动作,而其他类型的行为不得干扰。例如,如果一个人还要做其他事情,我们就无法知道他对音乐的渴望有多强烈。在解决澄清概率的科学定义的问题时,我们发现出发点是观察到这种或那种行为的频率和条件。我们消除或至少保持不变,任何促进与我们正在研究的行为类型竞争的行为表现的条件。将动物放置在一个单独的(安静的)盒子中,并使用单通道屏幕观察其行为,或者使用特殊的技术设备进行记录。这些条件不能被视为真空环境,因为动物将以多种方式对盒子的特性做出反应,但其行为将逐渐达到足够稳定的水平,在该水平上可以检查给定反应的频率。
Для изучения процесса, который Торндайк назвал запечатлением, мы должны иметь его «последствие». Это может быть, например, предъявление еды голодному животному. Мы можем предъявлять нашему испытуемому еду в удобном для него месте, на большом подносе, с помощью специального устройства. При первом предъявлении подноса животное, вероятно, будет реагировать на него различными поведенческими реакциями, которые мешают проявлению изучаемого нами поведения. Постепенно после нескольких кормлений оно без промедления принимает пищу и мы получаем возможность рассматривать это последствие как зависящее от поведения и наблюдать его результат.
要研究桑代克所说的印记过程,我们必须了解它的“后果”。例如,这可能是向饥饿的动物提供食物。我们可以使用特殊的设备,在一个大托盘上,在一个对测试对象方便的地方向他提供食物。当托盘第一次出现时,动物可能会做出各种干扰我们正在研究的行为的行为。渐渐地,经过几次喂食后,它会立即接受食物,我们可以将这种结果视为取决于行为并观察其结果。
Мы выбираем относительно простой вид поведения, который свободно и многократно воспроизводим и который легко поддается наблюдению и регистрации. Например, если испытуемым является голубь, то поднятие им головы выше определенного уровня является удобным поведением для изучения. Оно может быть зафиксировано взглядом экспериментатора на шкале, прикрепленной к задней стенке ящика, на фоне которой находится голубь. Сначала мы изучаем естественную высоту поднятия головы голубем и выбираем на шкале отметку, которая достигается им только в отдельных случаях. Фиксируя свой взгляд на шкале, экспериментатор начинает очень быстро открывать поднос, как только голова поднимается выше этой линии. Если эксперимент проводится в соответствии со спецификациями, то получается один и тот же результат: мы наблюдаем быстрое изменение частоты пересечения головой голубя заданной линии. Мы также видим, что голова голубя поднимается на более высокий уровень, и этот факт имеет большое теоретическое значение. Мы можем очень быстро заставить голубя высоко поднимать голову, установив время предъявления пищи. Через одну-две минуты поза голубя изменяется таким образом, что его голова редко опускается ниже линии, которую мы выбрали вначале.
我们选择一种相对简单的行为类型,可以自由地、重复地再现,并且易于观察和记录。例如,如果研究对象是一只鸽子,那么将其头部抬起到一定高度以上是一种方便研究的行为。实验者的目光可以将其固定在盒子后壁上的一个秤上,秤上有一只鸽子。首先,我们研究鸽子抬头的自然高度,并在仅在个别情况下达到的标度上选择一个标记。实验者将目光固定在秤上,当他的头升到这条线上方时,他就开始快速打开托盘。如果按照规范进行实验,那么会得到相同的结果:我们观察到鸽子的头部越过给定线的频率发生快速变化。我们还看到鸽子的头部上升到了更高的高度,这一事实具有重要的理论意义。通过定时提供食物,我们可以很快让鸽子抬起头。一两分钟后,鸽子的姿势发生了变化,它的头很少低于我们一开始的线。
Когда мы демонстрируем процесс запечатления в такой относительно простой форме, мы видим, что некоторые обычные интерпретации эксперимента Торндайка избыточны. Выражение «научение путем проб и ошибок», которое часто связывается с законом эффекта, здесь явно неуместно. Мы вкладываем особый смысл в наши наблюдения, когда называем любое поднятие головы «пробой», и нет оснований считать «ошибочным» любое движение, которое не приводит к установленному нами результату. Даже употребление термина «научение» вводит в заблуждение. Утверждение, что «птица научается, получать пищу посредством вытягивания шеи», является неадекватным выражением того, что происходит. Говорить, что она приобрела «навык» вытягивать шею — значит просто обращаться к объяснительным вымыслам, поскольку единственным доказательством наличия навыка является приобретенная тендения выполнять действие. Простейшим возможным описанием данного процесса является следующее: мы делаем данный контингент следствий зависимым от определенных физических свойств поведения (поднятия головы), далее фиксируем, что частота появления этого поведения возрастает. Принято рассматривать любое движение живого существа как реакцию. Это слово заимствовано из исследований, посвященных изучению рефлексов. Оно означает действие, которое наступает в ответ на предшествующее событие — стимул. Но мы можем сделать событие зависимым от поведения без определения предшествующего стимула. Мы не изменяем среду обитания голубя для того, чтобы вызвать поднятие головы. Вероятно, нельзя показать, что любой простой стимул неизменно предшествует этому движению. Такое поведение может оказаться под контролем стимулов, но при этом отсутствуют отношения по типу «одно порождает другое». Поэтому термин «реакция» не вполне адекватен, но он настолько укоренился, что далее мы будем его использовать.
当我们以这种相对简单的形式演示印记过程时,我们发现对桑代克实验的一些常见解释是多余的。 “通过反复试验来学习”这句话经常与效果定律联系在一起,但在这里显然是不合适的。当我们将任何抬起头称为“崩溃”时,我们对我们的观察赋予了特殊的意义,并且没有理由将任何不能导致我们所确定的结果的动作视为“错误”。甚至“学习”这个词的使用也会产生误导。 “鸟学会通过伸展脖子来获取食物”这一说法并不足以表达正在发生的事情。说她获得了伸展脖子的“技能”,这只不过是诉诸解释性虚构,因为这种技能的唯一证据就是后天执行该动作的倾向。这个过程最简单的描述如下:我们使这种后果的发生取决于行为的某些物理属性(抬起头),然后我们记录这种行为发生的频率增加。人们习惯上将生物的任何运动视为反应。这个词是从反射研究中借用的。它意味着响应先前事件(刺激)而发生的动作。但我们可以使事件依赖于行为,而不需要指定先行刺激。我们不会改变鸽子的环境来引起抬头。可能无法证明任何简单的刺激总是先于这一运动。 这种行为可能受到激励的控制,但不存在“一生一死”的关系。因此,“反应”这个词并不完全足够,但它是如此根深蒂固,以至于我们将继续使用它。
Конечно, нельзя предсказать и проконтролировать реакцию, которая уже произошла. Можно только предсказать, что похожие реакции будут наблюдаться в будущем. Поэтому единицей науки о прогнозировании является не реакция, а класс реакций. Для его описания будет использоваться слово «оперантный». Данный термин показывает, что поведение «воздействует» (operates) на среду, генерируя последствия. Следствия определяют свойства, по которым устанавливается сходство реакций. Он будет использоваться и как прилагательное (оперантное поведение), и как существительное, обозначающее поведение, определенное данным следствием.
当然,不可能预测和控制已经发生的反应。我们只能预测将来也会观察到类似的反应。因此,预测科学的单位不是一个反应,而是一类反应。将使用“操作性”一词来描述它。该术语表明行为对环境“起作用”(作用) ,产生后果。结果决定了建立反应相似性的性质。它将既用作形容词(操作行为),又用作表示由该结果定义的行为的名词。
Поднятие голубем головы один раз в определенный момент является реакцией. Это прошлое и его можно рассматривать со всех точек зрения, которые представляют для нас интерес. Поведение, называемое «поднятием головы», которое происходит независимо от определенных обстоятельств (instances), является оперантным. Его можно описать не как завершенное действие, а как состав действий, определяющийся свойствами высоты, на которую нужно поднять голову. В этом смысле оперант можно определить посредством следствия, характеризуемого с помощью физических терминов. «Поднятие головы» («cutoff») на определенную высоту является частью (property) поведения.
鸽子在某个时刻抬起头一次是一种反应。这已经是过去的事了,可以从我们感兴趣的所有角度来看待。无论具体情况(实例)如何,这种被称为“抬起头”的行为都是可操作的。它不能被描述为一个完整的动作,而是一个动作的组合,由您需要抬起头的高度的属性决定。从这个意义上说,操作物可以通过以物理术语表征的效果来定义。 “抬起头”(“截止”)到一定高度是行为的一部分。
Традиционное употребление термина «научение» может быть сохранено для описания перераспределения реакций на классы в сложной ситуации. Терминология, необходимая для описания процесса запечатления, может быть заимствована из теории условных рефлексов И. П. Павлова. Сам Павлов называет все события, которые усиливают поведение «подкреплением» и все возникающие, в связи с ним изменения, «обусловливанием». Однако в экспериментах Павлова подкрепление сочетается со стимулом, а при оперантном поведении оно зависит от реакции. Поэтому оперантное подкрепление является специальным процессом и нуждается в специальном анализе. В обоих случаях усиление поведения, происходящее в результате подкрепления, называется «обусловливанием». При оперантном обусловливании мы усиливаем оперант, чтобы увеличить вероятность или частоту появления реакции. В условиях павловского, или «респондентного», обусловливания мы просто повышаем величину реакции, вызванную условным стимулом, и сокращаем время между стимулом и реакцией. Мы уже отмечали, что этими двумя случаями исчерпываются возможности: 1) организм обусловливается когда подкрепление сопровождает другой стимул или 2) следует за поведением организма. Любое событие, которое не приводит к одному из этих случаев, не влияет на изменение вероятности реакции. Тогда в эксперименте с голубем еда является тем, что подкрепляет, а ее предъявление, когда реакция «выделяется», является подкреплением. Оперант определяется свойствами, от которых зависит подкрепление — высотой, на которую должна подниматься голова голубя. Изменение частоты поднятия головы на эту высоту есть процесс - оперантного обусловливания.
可以保留术语“学习”的传统用法来描述复杂情况下跨类别的响应重新分配。描述印记过程所需的术语可以借用 I. P. 巴甫洛夫的条件反射理论。巴甫洛夫本人将所有强化行为的事件称为“强化”,并将与之相关的所有变化称为“条件作用”。然而,在巴甫洛夫的实验中,强化与刺激相结合,而在操作行为中,强化是依赖于反应的。因此,操作性强化是一个特殊的过程,需要特殊的分析。在这两种情况下,由于强化而导致的行为增加被称为“条件作用”。在操作条件反射中,我们强化操作以增加反应发生的可能性或频率。在巴甫洛夫条件反射或反应性条件反射中,我们只是增加条件刺激引起的反应幅度,并减少刺激和反应之间的时间。我们已经注意到,这两种情况耗尽了可能性:1)当强化伴随着另一个刺激时,有机体受到调节,或者2)遵循有机体的行为。任何不导致这些情况之一的事件都不会影响反应概率的变化。然后,在鸽子实验中,食物是强化物,而当反应“突出”时食物的呈现就是强化物。操作由强化所依赖的属性决定——鸽子的头部必须上升到的高度。 改变将头抬起到这个高度的频率是一个操作性条件反射的过程。
Находясь в состоянии бодрствования, мы постоянно воздействуем на среду, и многие последствия нашего поведения имеют силу подкрепления. Посредством оперантного обусловливания среда конструирует базисный репертуар поведения, благодаря которому мы сохраняем равновесие, ходим, играем в спортивные игры, пользуемся инструментами, говорим, пишем, гребем, управляем автомобилем и самолетом. Мы можем оказаться не готовыми к изменению в среде, например появлению нового автомобиля, нового друга, новых интересов, к смене работы и местожительства, но мы обычно быстро приспосабливаемся к новой обстановке, приобретая новые реакции и утрачивая старые. <...> Оперантное подкрепление не только структурирует репертуар поведения. Оно улучшает продуктивность поведения и еще долгое время сохраняет его после того, как его усвоение или продуктивность теряют свою значимость.
当我们醒着的时候,我们不断地影响着我们的环境,而我们行为的许多后果都具有强化的力量。通过操作性条件反射,环境构建了一系列基本行为,使我们能够保持平衡、行走、运动、使用工具、说话、写字、划船以及驾驶汽车和飞机。我们可能还没有准备好迎接环境的改变,例如一辆新车、一个新朋友、新的兴趣、换工作或居住地,但我们通常会很快适应新环境,获得新的反应并失去旧的。 <...> 操作性强化不仅构建行为体系。它提高了行为的生产力,并在学习或生产力失去意义后仍能长期保持这种生产力。
КОЛИЧЕСТВЕННЫЕ СВОЙСТВА
定量特性
Совсем не просто получить кривую научения. Мы не можем полностью изолировать оперант и устранить все случайные помехи. Можно было бы построить кривую и показать, как частота поднятия головы на определенную высоту изменяется в зависимости от времени или количества подкреплений, но дело в том, что общий эффект больше. Происходит смещение в более крупной схеме поведения, и для того чтобы его полностью описать, необходимо проследить все движения головой. Даже в этом случае мы не исчерпаем всей проблемы. Высота поднятия головы была выбрана произвольно, и эффект подкрепления зависит от нее. Если подкрепить высоту, которая достигается редко, изменение в схеме будет гораздо больше, чем в случае, когда выбирается высота, на которую голубь обычно поднимает голову. Для адекватного объяснения необходимо получить набор кривых, описывающих все случаи. Если заставить голубя поднимать голову все выше и выше, появляется еще один произвольный элемент, так как можно использовать различные графики подкрепления. Каждый график дает свою кривую, и картину можно считать исчерпывающей, только если будут использованы все графики подкрепления.
获得学习曲线并不容易。我们无法完全隔离操作者并消除所有随机干扰。可以绘制一条曲线并显示将头抬起到一定高度的频率如何随时间或强化数量而变化,但事实是总体效果更大。更大的行为模式发生了转变,为了充分描述它,有必要追踪头部的所有运动。即使在这种情况下,我们也不会穷尽整个问题。头部标高的高度是任意选择的,加固效果取决于它。如果对很少达到的高度进行强化,则模式的变化将比选择鸽子通常抬起头的高度大得多。为了得到充分的解释,有必要获得一组描述所有情况的曲线。如果你强迫鸽子把头抬得越来越高,就会出现另一个随机元素,因为可以使用不同的强化时间表。每个时间表都给出了自己的曲线,只有使用了所有的强化时间表,图片才算全面。
Мы не можем обойти эти проблемы, выбрав реакцию, которая более строго определяется свойствами среды, например открытие двери. Определенный механический индикатор поведения, разумеется, предпочтительнее, поскольку, например, он позволяет организовать постоянное представление подкрепления. Можно регистрировать высоту поднятия голубем головы с помощью фотоэлемента, но легче выбрать такую реакцию, которая производит изменение в среде и которую легче регистрировать. Если птица научается нажимать на небольшой рычаг, находящийся на стене экспериментального ящика, можно сконструировать рычаг таким образом, чтобы он замыкал электрическую цепь, что позволит предъявлять поднос с пищей и регистрировать реакции. Думается, что такая реакция отличается от реакции поднятия головы тем, что она имеет характеристику «все или ничего». Но ниже будет видно, что «реакция», которая не так произвольна, как реакция поднятия головы, не определяется механическими свойствами движения «нажатия на рычаг».
我们无法通过选择更严格地由环境特性决定的响应来解决这些问题,例如打开门。当然,某种机械的行为指标是更可取的,因为,例如,它允许组织持续的强化呈现。可以使用光电管记录鸽子抬头的高度,但更容易选择产生环境变化的反应,并且更容易记录。如果鸟学会按下实验箱壁上的一个小杠杆,则可以设计该杠杆来完成电路,从而可以呈现食物托盘并记录反应。看来这种反应与抬头反应不同,它具有“全有或全无”的特征。但下面会看到,“反应”并不像抬起头的反应那样自愿,也不是由“按下杠杆”的运动的机械特性决定的。
Нет необходимости иметь совершенное экспериментальное устройство для того, чтобы получить важные количественные данные об оперантном обусловливании. Мы уже можем оценивать много факторов. Важность обратной, связи ясна. Организм можно стимулировать последствием его поведения, если имеет место обусловливание. Например, при обучении шевелить ушами необходимо знать, когда уши двигаются, если мы хотим подкреплять двигательные реакции. При переучивании больного пользоваться частично парализованной конечностью можно с помощью специальных приспособлений или другого человека усиливать обратную связь при слабых движениях. Глухонемой научается говорить, только если он получает обратную связь о своем поведении, что можно сравнить со стимуляцией, которую он получает от других говорящих людей. Одной из функций педагога является обеспечение произвольных (иногда ложных) последствий с целью получения обратной связи. Обусловливание также зависит от вида, количества и момента предъявления подкрепления, а также от многих других факторов.
获得操作性条件反射的重要定量数据并不需要有完美的实验设计。我们已经可以评估许多因素。反馈的重要性是显而易见的。如果条件作用发生,有机体就会受到其行为后果的刺激。例如,当学习移动耳朵时,如果我们想强化运动反应,就必须知道耳朵何时移动。当重新训练患者使用部分瘫痪的肢体时,您可以使用特殊设备或另一个人来增强微弱运动期间的反馈。聋哑人只有收到有关其行为的反馈才能学会说话,这可以与他从其他说话的人那里收到的刺激进行比较。教师的职能之一是提供任意(有时是错误的)结果以获得反馈。调节还取决于强化的类型、数量和时间,以及许多其他因素。
Отдельное подкрепление может иметь значительный эффект.
个体强化可以产生显着的效果。
При благоприятных условиях один какой-нибудь резкий шаг может привести к увеличению частоты появления реакции в дальнейшем. В обычных случаях такое значительное увеличение наблюдается уже после одного подкрепления, и дальнейший дополнительный прирост величины продолжается по мере предъявления последующих подкреплений. Это наблюдение ни в коей мере нельзя объяснить мгновенным изменением в сторону максимальной вероятности, поскольку не выделен оперант в чистом виде. Увеличение частоты можно интерпретировать с точки зрения других поведенческих характеристик ситуации. Тот факт, что обусловливание организма может быть быстрым у животных такого «низкого уровня развития», как крысы и голуби, приводит к интересным выводам. Различия в том, что обычно называют интеллектом, до некоторой степени объясняются различиями в скорости научения. Но не может существовать более быстрого научения, чем мгновенное увеличение вероятности реакции. Следовательно, специфичность человеческого поведения определяется какими-то другими факторами.
在有利的条件下,突然的一步可能会导致未来反应发生的频率增加。在一般情况下,仅在一次强化后即可观察到如此显着的增加,并且随着随后的强化的出现,幅度会继续进一步增加。这种观察无论如何都不能用向最大概率的瞬时变化来解释,因为纯形式的操作并未被隔离。频率的增加可以用该情况的其他行为特征来解释。事实上,像老鼠和鸽子这样“发育程度较低”的动物的条件反射可能很快,这一事实得出了有趣的结论。通常所说的智力的差异在某种程度上可以用学习速度的差异来解释。但没有什么比反应概率的瞬时增加更快的学习了。因此,人类行为的特殊性是由其他一些因素决定的。
УПРАВЛЕНИЕ (CONTROL) ОПЕРАНТНЫМ ПОВЕДЕНИЕМ
操作行为的控制
Экспериментальная процедура оперантного обусловливания не сложна. Создается контингент подкрепления и предъявляется организму в течение определенного периода времени. Затем на основе этого объясняется частота возникновения реакции. Что было сделано в направлении предсказания и управления поведением в будущем? Какие переменные заставляют нас предсказывать, будет или не будет реагировать организм? Какими переменными нужно управлять, чтобы заставить организм реагировать? Мы экспериментируем с голодным голубем. Это означает, что голубь лишался пищи в течение определенного периода времени или до тех пор, пока он немного не терял в весе. В противоположность тому, что можно было бы ожидать, экспериментальные исследования показали, что сила эффекта, пищевого подкрепления может не зависеть от количества пищи. Но наблюдается, что частота реакций, которая является результатом подкрепления, зависит от степени депривации. Даже если мы научили голубя вытягивать шею, он не будет этого делать, если он не голоден. Таким образом, имеется еще один способ контроля за его поведением: для того чтобы заставить голубя вытягивать шею, необходимо лишить его пищи. Выбранный оперант прибавляется ко всему тому, что будет делать голодный голубь. Контроль за реакцией объединился с контролем за лишением животного пищи. Оперант может также контролироваться с помощью внешнего стимула, являющегося еще одной переменной величиной, которую можно использовать для предсказания поведения и контроля за ним. Тем не менее следует отметить, что обе эти переменные можно вывести из самого оперантного подкрепления.
操作性条件反射的实验过程并不复杂。一支强化队伍被创建并在一段时间内呈现给身体。然后基于此解释反应发生的频率。已采取哪些措施来预测和控制未来的行为?哪些变量使我们能够预测有机体是否会做出反应?需要操纵哪些变量才能使有机体做出反应?我们正在用一只饥饿的鸽子做实验。这意味着鸽子在一段时间内被剥夺食物或直到体重减轻。与预期相反,实验研究表明,食物强化效果的强度可能并不取决于食物的量。但据观察,强化产生的反应频率取决于剥夺的程度。即使我们教鸽子伸脖子,如果它不饿也不会这样做。因此,还有另一种方法可以控制它的行为:为了迫使鸽子伸长脖子,就必须剥夺它的食物。选定的操作将添加到饥饿的鸽子将要做的所有事情中。反应的控制与剥夺动物食物的控制相结合。操作也可以通过外部刺激来控制,这是另一个可用于预测和控制行为的变量。 然而,应该注意的是,这两个变量都可以从操作子附件本身导出。
ОПЕРАНТНОЕ УГАШЕНИЕ
操作性灭绝
Когда подкрепление больше не поступает, реакция становится все менее и менее частой; этот процесс получил название «оперантного угашения». Если задержать подачу пищи, голубь перестанет поднимать голову. В общем, когда мы выполняем поведение, которое больше «не приносит нам никакой выгоды», мы утрачиваем тенденцию повторять его. Если мы потеряли авторучку, мы все реже и реже направляем руку в карман, в котором она хранилась. Если нам не отвечают на телефонные звонки, то в конце концов мы перестаем звонить. Если пианино расстраивается, то мы все реже и реже на нем играем. Если звук нашего радиоприемника стал слишком громким или передачи стали хуже, мы перестаем его слушать.
当强化不再出现时,反应就会变得越来越不频繁;这个过程称为“操作性灭绝”。如果你延迟喂食,鸽子就会停止抬起头。一般来说,当我们做出的行为不再“对我们有利”时,我们就会失去重复这种行为的倾向。如果我们丢了一支钢笔,我们就越来越不可能把手伸进放钢笔的口袋里。如果我们的电话无人接听,我们最终就会停止打电话。如果钢琴走调,我们就会越来越少地弹它。如果收音机的声音变得太大或者广播变得更糟,我们就会停止收听。
Поскольку оперантное угашение протекает гораздо медленнее, чем оперантное обусловливание, постольку наблюдать за ним гораздо проще. При благоприятных условиях получаются плавные кривые, показывающие, что скорость реакций медленно уменьшается, возможно, в течение нескольких часов. Кривые раскрывают свойства, которые нельзя получить из наблюдения. У нас «может сложиться впечатление», что организм реагирует реже и реже, но за характером изменения можно проследить только при регистрации поведения. Кривые показывают, что угашение есть довольно однородный процесс, который определяет силу поведения.
由于操作性消退比操作性条件反射发生得慢得多,因此更容易观察到。在有利的条件下,获得平滑的曲线,表明反应速率缓慢下降,可能需要几个小时。曲线揭示了无法通过观察获得的特性。我们“可能得到这样的印象”:身体的反应越来越不频繁,但变化的本质只能通过记录行为来监测。这些曲线表明,灭绝是一个相当均匀的过程,决定了行为的强度。
При определенных условиях на кривую оказывают влияние эмоциональные реакции. Отсутствие подкрепления приводит не только, к угашению операнта. Оно вызывает также реакцию фрустрации, или ярости. Голубь, который не получил подкрепления, отворачивается от рычага, воркует, хлопает крыльями и демонстрирует другие виды эмоционального поведения. Человек также демонстрирует подобные реакции. Ребенок, у которого велосипед не двигается с места, когда он нажимает на педали, перестает их крутить. Взрослый, который находит ящик письменного стола запертым, скоро перестает дергать ручку, но он может колотить по столу и браниться или может проявлять другие признаки гнева. Точно так же как ребенок вновь вернется к велосипеду, а взрослый — к ящику стола, птица вновь повернется к рычагу, когда эмоциональная реакция угаснет. Могут наблюдаться и другие явления эмоционального характера. В таких условиях кривая угашения характеризуется циклическими колебаниями, поскольку эмоциональные реакции появляются, исчезают и вновь появляются. Если каким-либо способом удается устранить эмоцию, кривая принимает более простую форму.
在某些条件下,曲线会受到情绪反应的影响。缺乏强化不仅会导致操作项的消失。它还会引起沮丧或愤怒的反应。没有得到强化的鸽子会转身离开杠杆、咕咕叫、拍打翅膀,并表现出其他情绪行为。此人也表现出类似的反应。如果孩子踩下踏板后自行车不动,他就会停止转动自行车。一个成年人如果发现自己的书桌抽屉被锁了,很快就会停止拉笔,但他可能会敲打桌子、咒骂或者表现出其他愤怒的迹象。就像孩子会回到自行车或成人回到书桌抽屉一样,当情绪反应消退时,小鸟也会回到控制杆。还可以观察到其他情感性质的现象。在这种情况下,随着情绪反应的出现、消失和重新出现,消退曲线呈现出周期性波动。如果可以通过某种方式消除这种情绪,曲线就会呈现出更简单的形状。
Поведение, которое наблюдается во время угашения, является результатом обусловливания, которое ему предшествовало, и в свете этого кривая угашения дает еще одну меру эффекта подкрепления. Если было подкреплено всего лишь несколько реакций, угашение происходит быстро. Большое количество подкреплений приводит к длительному сохранению реакции. Силу сопротивления угашению нельзя предсказать по вероятности реакции, наблюдаемой в каждый отдельный момент. Необходимо знать историю подкрепления. Например, если мы получили подкрепление в виде великолепно приготовленной пищи в новом ресторане, невкусно приготовленная пища может «свести на нет» хорошее впечатление от этого ресторана; но если мы питались в ресторане качественной пищей в течение многих лет, то тогда, при прочих равных условиях, нам надо будет несколько раз принять невкусную пищу, прежде чем мы утратим склонность постоянно питаться в нем.
在消退过程中观察到的行为是之前条件作用的结果,鉴于此,消退曲线提供了增强效果的另一种衡量标准。如果只有少数反应得到强化,灭绝很快就会发生。大量的强化物会导致反应的长期保留。抵抗灭绝的强度无法根据在任何给定时刻观察到的反应的概率来预测。有必要了解加固的历史。例如,如果我们在一家新餐厅获得了精心准备的食物,那么准备得不好的食物可能会“否定”该餐厅的好印象;但是,如果我们多年来一直在一家餐馆吃优质的食物,那么,在其他条件相同的情况下,我们需要吃几次劣质的食物,然后才会失去继续在那里吃饭的兴趣。
Между количеством подкрепленных реакций и количеством реакций, возникающих при угашении, нет простых связей. Сила сопротивления угашению в режиме прерывистого подкрепления может быть гораздо больше силы сопротивления угашению в случае, когда то же количество подкреплений дается за каждую реакцию, таким образом, если мы только один раз случайно подкрепим ребенка за хорошее поведение, то оно при отсутствии подкрепления будет, сохраняться дольше, чем в том случае, когда мы подкрепляем каждое правильное выполнение.
强化反应的数量和消退期间发生的反应的数量之间不存在简单的联系。在间歇性强化的情况下,抵抗消退的强度可能比每次反应给予相同数量的强化时的抵抗消退的强度大得多,所以如果我们不小心只为孩子的良好行为强化了一次,那么如果我们强化每一次正确的执行,那么强化的持续时间就会更长。
Этот вывод имеет практическую значимость в тех случаях, когда ценные виды подкреплений ограничены. Подобного рода проблемы возникают в области образования, промышленности, экономики и пр. В условиях некоторых режимов прерывистого подкрепления голубь может произвести 10 000 поведенческих реакций, прежде чем водностью завершится процесс угашения.
这一结论在有价值的强化物类型有限的情况下具有实际意义。类似的问题也出现在教育、工业、经济等领域。在某些间歇性强化机制下,一只鸽子在灭绝过程完成之前可以产生一万种行为反应。
Угашение является эффективным способом устранения операнта из организма. Его не следует путать с другими процедурами, созданными для получения того же эффекта. В настоящее время предпочтение отдается наказанию, которое включает в себя различные процессы и эффективность которого вызывает сомнения. С угашением часто путают забывание. При забывании эффект обусловливания утрачивается просто по мере прохождения определенного времени, в то время как угашение требует, чтобы реакция возобновлялась без подкрепления. Обычно забывание наступает не быстро; большие кривые угашения были получены через шесть лет после того, как реакции голубей были подкреплены последний раз. Шесть лет составляют больше половины жизни голубей. В этот период времени голуби жили в таких условиях, в которых реакция не могла быть подкреплена. В поведении человека реакции научения, порожденные относительно определенными условиями, часто сохраняются без использования на протяжении половины жизни человека. Утверждение, что ранний опыт определяет личность зрелого организма, предполагает, что эффект оперантного обусловливания долгосрочен. Таким образом, если из-за раннего опыта, полученного в детстве, мужчина женится на женщине, которая напоминает его мать, то это говорит о том, что эффект определенных подкреплений должен сохраняться долгое время. Большинство случаев забывания включают в себя оперантное поведение при контроле определенных стимулов, и их нельзя подвергнуть адекватному анализу до обсуждения проблемы контроля.
灭绝是从体内消除操作物的有效方法。不应将其与旨在实现相同效果的其他程序相混淆。目前,主要以惩罚为主,其过程多种多样,其有效性值得怀疑。遗忘常常与灭绝相混淆。在遗忘中,调节作用会随着时间的流逝而消失,而消退则需要在没有强化的情况下恢复反应。遗忘通常不会很快发生;在鸽子的反应最后一次强化六年后,获得了大的消光曲线。六年占了鸽子一生一半以上的时间。这段时间,鸽子生活在反应无法强化的条件下。在人类行为中,相对特定条件产生的学习反应往往会在人的半生中被储存而不使用。早期经历决定成熟有机体的个性这一论断假定操作性条件反射的影响是持久的。因此,如果一个男人由于童年的早期经历而娶了一个与他母亲相似的女人,那么这表明某些强化物的作用应该会持续很长一段时间。大多数遗忘案例涉及某些刺激控制下的操作行为,在讨论控制问题之前无法对其进行充分分析。
Эффект угашения. Условия процесса протекания угашения более или менее известны, однако сущность его часто понимают неправильно. Экстремальное угашение иногда называют «abulia». Определение этого феномена как «отсутствие воли», мало что дает, поскольку отсутствие или наличие воли выводится из наличия или отсутствия поведения. Однако термин представляется полезным, поскольку он предполагает, что поведение отсутствует по определенной причине, и мы можем провести то же самое различение другим способом. Поведение является сильным или слабым из-за действия многих различных переменных, и задача науки о поведении заключается в том, чтобы их выявлять и классифицировать. Каждый случай мы определяем в терминах переменных величин. Условия, которые возникают. В результате длительного угашения. По лежащим на поверхности признакам напоминают инактивность, возникающую в результате действия других причин. Различия этих случаев надо искать в истории организма. Целеустремленный писатель, отправляющий издателям одну рукопись за другой, когда все они были отвергнуты, может в конце концов заявить, что «он не может больше написать ни одного слова». Частично он парализован тем, что его «зажимают», но все-таки он продолжает настаивать на том, что он «хочет писать», и мы можем согласиться с ним и квалифицируем это так: чрезвычайно низкая вероятность реакции определяется угашением. Однако другие переменные все еще сохраняют свое действие и если бы угашение не произошло, они бы дали высокую вероятность достижения.
消光效应。灭绝过程的条件或多或少为人所知,但其本质却常常被误解。极端灭绝有时被称为“ abulia ”。将这种现象定义为“缺乏意志”并没有多大帮助,因为意志的缺乏或存在是从行为的存在或不存在推断出来的。然而,这个术语似乎很有用,因为它表明该行为的缺失是有原因的,并且我们可以用不同的方式做出相同的区分。行为的强弱取决于许多不同变量的作用,行为科学的任务就是对它们进行识别和分类。我们根据变量数量来定义每种情况。出现的条件。由于长期灭绝。根据表面的迹象,它们类似于由于其他原因的作用而发生的不活动。这些情况之间的差异必须在生物体的历史中寻找。一位有抱负的作家在被拒绝后将一份又一份的手稿发送给出版商,最终可能会宣称“他不能再写一个字了”。他因“受限”而部分瘫痪,但他仍然坚持他“想写作”,我们可以同意他的观点,并这样限定:极低的反应概率是由灭绝决定的。然而,其他变量仍然有效,如果灭绝没有发生,它们实现这一目标的可能性很高。
Необходимо обратиться к условиям, при которых небольшая сила операнта является результатом угашения. Некоторые формы психотерапии являются системами подкрепления, созданными для восстановления поведения, которое было утрачено в процессе угашения. Терапевт может сам давать подкрепление или он организует такие условия жизни, которые будут подкреплять поведение. В терапии профессионального продвижения, например, терапевты способствуют тому, чтобы пациент начал осуществлять простые формы поведения, мгновенно и сравнительно постоянно подкрепляемые. Объяснения, что такая терапия помогает пациенту потому, что дает ему чувство «достижения» или «укрепляет его нравственную сферу», «формирует его интересы» или предотвращает его от «разочарования», не дают никаких преимуществ. Такая терминология просто, увеличивает объем объяснительных фикций. Человек, который действительно вовлечен в данный вид активности, проявляет не интерес, а демонстрирует эффект подкрепления. Мы не даем человеку «чувство достижения», а подкрепляем определенное его действие. Разочароваться — просто означает утратить возможность реагировать из-за отсутствия подкрепления. Наша проблема состоит лишь в том, чтобы объяснить вероятность реакции в терминах процесса подкрепления и угашения.
有必要解决因灭绝而导致操作强度较小的情况。某些形式的心理治疗是强化系统,旨在恢复因灭绝而丧失的行为。治疗师可以自己提供强化,也可以组织生活条件来强化行为。例如,在职业进步治疗中,治疗师鼓励患者从事简单的行为,这些行为会立即且相对持续地得到强化。解释说这种治疗对患者有帮助,因为它给了他一种“成就感”或“加强了他的道德领域”,“塑造了他的兴趣”或防止他“失望”,但并没有提供任何好处。这些术语只会增加解释性虚构的数量。真正参与此类活动的人并不是表现出兴趣,而是表现出强化效应。我们不是给人一种“成就感”,而是强化某种行动。变得沮丧仅仅意味着由于缺乏强化而失去了反应能力。我们的问题只是用强化和消退过程来解释响应概率。
КАКИЕ СОБЫТИЯ ЯВЛЯЮТСЯ ПОДКРЕПЛЯЮЩИМИ?
什么是支持活动?
Имея дело с людьми в жизни, клинике и лаборатории, мы должны знать, каков подкрепляющий эффект какого-либо специфического события. Мы часто замечаем, насколько наше собственное поведение подкрепляется одним и тем же событием. Нередко подобного рода практика уводит нас в сторону; тем не менее существует общепринятое мнение, что подкрепления можно определять в отрыве от рассмотрения их воздействий на определенный организм. Однако в соответствии с нашим использованием этого термина единственной определяющей характеристикой подкрепляющего стимула является то, что он подкрепляет.
在生活中、诊所和实验室中与人打交道时,我们必须知道任何特定事件的强化作用是什么。我们经常注意到同一事件会在多大程度上强化我们自己的行为。这种做法常常会让我们误入歧途。然而,人们普遍认为,强化物的定义可以脱离对特定生物体的影响的考虑。然而,根据我们对该术语的使用,强化物的唯一定义特征是它能够强化。
Для того чтобы сказать, подкрепляет ли определенное событие определенный организм в определенных условиях, необходимо провести прямое испытание. Мы наблюдаем за частотой выбранной реакции, затем делаем событие зависимым от нее и следим за изменениями, происходящими в его частоте. Если изменения имеют место, то тогда мы рассматриваем данное событие как подкрепляющее организм в данных условиях. В классифицировании событий на основе их эффектов нет ничего тавтологичного; используемый критерий является как эмпирическим, так и объективным. Однако, он стал бы тавтологичным, если затем мы стали бы утверждать, что данное событие усиливает оперант, потому что оно подкрепляет. Мы достигаем определенных успехов, когда нам удается угадать подкрепляющее событие только в результате «грубого» наблюдения. Так как мы испытали подкрепляющий эффект стимула на себе, мы допускаем, что он будет оказывать то же воздействие и на других. Мы достигаем успеха только тогда, когда рассматриваем себя как организм, подвергаемый изучению, и корректно наблюдаем за собственным поведением.
为了判断某种事件在某种条件下是否被某种生物体强化,必须进行直接测试。我们观察所选反应的频率,然后使事件依赖于它并监视其频率发生的变化。如果发生变化,那么我们认为该事件在这些条件下增强了有机体。根据事件的影响对事件进行分类并不是同义反复。所使用的标准既是经验性的又是客观的。然而,如果我们随后论证某个给定事件强化了操作项,因为它正在强化,那么它就会变成同义反复。当我们仅通过“粗略”观察来猜测强化事件时,我们就取得了一定的成功。因为我们经历过刺激对自己的强化效应,所以我们假设它也会对其他人产生同样的效果。只有当我们将自己视为一个需要研究的有机体并正确观察自己的行为时,我们才能取得成功。
Можно выделить два типа событий, обладающих эффектом подкрепления. Некоторые подкрепления представляют собой предъявление стимулов или добавление чего-то, например воды, еды или возможности сексуального контакта в ситуацию. Они называются положительными подкреплениями. Другой тип подкрепляемых событий состоит в устранении чего-либо, например сильного шума. Яркого света, холода, жары или электрического шока из ситуации. Эго — отрицательное подкрепление. В обоих случаях сохраняется один и тот же эффект подкрепления — вероятность реакции повышается. Мы не можем обойтись без этого различения, просто указав на то, что в негативной ситуации подкрепляет отсутствие яркого света, сильного шума и т. Д., поскольку воздействие оказывает именно отсутствие чего-либо после его презентации, и это еще один способ. Выражения того, что стимул устранен. Различия между двумя случаями станут яснее, когда мы рассмотрим случаи с презентацией негативного подкрепления, или случаи с устранением позитивного подкрепления. Их последствия мы называем наказанием.
有两种类型的事件具有强化效果。一些强化物涉及在某种情况下提供刺激或添加一些东西,例如水、食物或性接触的可能性。这些称为正强化。另一种类型的强化事件是消除某些事物,例如大声的噪音。强光、冷、热或电击的情况。自我是负强化。在这两种情况下,都保持了相同的强化效果——做出反应的概率增加。我们不能简单地指出,在消极的情况下,没有强光、大声的噪音等来强化这种区别,就可以忽略这种区别,因为正是在呈现后缺少某种东西才产生效果,而这就是另一种方式。表示刺激已被移除。当我们考虑呈现负强化的案例或移除正强化的案例时,这两种情况之间的差异会变得更加明显。我们称其后果为惩罚。
В условиях практического применения оперантного обусловливания часто бывает необходимо наблюдать за событиями, оказывающими подкрепляющее воздействие на данного индивида. В любой области, важной характеристикой которой является поведение, — образовании, управлении, семье, здравоохранении, промышленности, искусстве, литературе и т. д. — мы постоянно изменяем вероятности реакции с помощью их подкрепления. Промышленник, который хочет, чтобы его рабочие работали постоянно и без прогулов, должен заботиться о соответствующем подкреплении их поведения, и не только с помощью заработной платы, но также и с помощью подходящих условий работы. Девушка, которая хочет еще раз встретиться с молодым человеком, должна быть уверена, что поведение ее друга, связанное с назначением свидания и желанием сдержать свое слово, получило адекватное подкрепление. Для того чтобы обучить ребенка читать или петь, или играть на музыкальном инструменте, необходимо разработать программу педагогических подкреплений, в соответствии с которой правильные реакции должны постоянно «оцениваться». Если пациенту необходимо еще раз обратиться к врачу за консультацией, то последний должен быть уверен в том, что данное поведение пациента получило соответствующее. Подкрепление.
在操作性条件反射的实际应用中,通常需要观察对特定个体有强化作用的事件。在任何以行为为重要特征的领域——教育、政府、家庭、健康、工业、艺术、文学等——我们不断地通过强化来改变反应的概率。希望工人持续工作、不旷工的制造商必须注意充分强化他们的行为,不仅通过工资,而且还提供适当的工作条件。想要再次见到年轻人的女孩必须确保她的朋友与约会有关的行为以及信守诺言的愿望得到了充分的强化。为了教孩子读书、唱歌或演奏乐器,有必要制定一个教学强化计划,根据该计划,必须不断“评估”正确的反应。如果患者需要再次咨询医生,医生必须确保患者的行为是适当的。加强。
Мы оцениваем силу подкрепляющих событий, когда пытаемся установить, что «человек выбирает в жизни». Какие следствия определяют репертуар его поведения .и относительную частоту реакций, входящих в него? Кое-что об этом говорят нам реакции на различные темы, обсуждаемые в разговоре, но его обычное поведение является еще лучшим ориентиром. Мы делаем вывод о значимых видах подкрепления на основании проявления им интересов к какому-то писателю, освещающему определенные проблемы, к магазинам или музеям, в которых представлены определенные предметы, к друзьям, проявляющим определенные виды поведения, к ресторанам, в которых подают определенную пищу и т. д. «Интерес» соответствует вероятности, являющейся результатом, по крайней мере частично, последствий поведения «проявления интереса». Мы можем быть почти уверены в значимости подкрепления, если наблюдаем за тем, как начинается и протекает поведение по мере чередующегося предъявления и удержания подкрепления, так как тогда изменение вероятности, очевидно, будет в меньшей степени определяться случайным изменением какого-то другого вида. Поведение, которое ассоциируется с дружбой с каким-либо человеком, изменяется, поскольку этот человек изменяет поставляемые им подкрепления.
当我们试图确定“一个人在生活中选择什么”时,我们会评估强化事件的强度。哪些后果决定了他的行为方式以及其中包含的反应的相对频率?他对谈话中讨论的各种话题的反应告诉我们一些事情,但他平时的行为是一个更好的指导。我们根据他对解决某些问题的作家、展示某些物品的商店或博物馆、从事某些行为的朋友、提供某些食物的餐馆等表达的兴趣,推断出重要的强化类型。“兴趣”对应至少部分是由“表现出兴趣”行为的后果产生的概率。如果我们观察当强化物交替出现和保留时行为如何开始和进行,我们几乎可以确定强化物的重要性,因为那时概率的变化显然将较少由某种其他类型的随机变化决定。与一个人的友谊相关的行为会发生变化,因为这个人改变了他或她提供的强化物。
Если мы пронаблюдаем за подобными изменениями, то сможем составить вполне определенное мнение о том, «что означает эта дружба» или «что наш испытуемый видит в своем друге».
如果我们观察这些变化,我们就可以对“这种友谊意味着什么”或“我们的主题在他的朋友身上看到什么”形成非常明确的看法。
Данная процедура наблюдения может быть усовершенствована с целью ее применения в клинических и лабораторных исследованиях. Можно составить набор картинок, предоставив испытуемому возможность просмотреть их и при этом записав время разглядывания каждой из них. Поведение «разглядывания картинки» подкрепляется тем, что видится в ней. Рассматривание одной картинки может иметь больший эффект подкрепления, чем рассматривание другой картинки и, время, затрачиваемое на рассматривание картинок, также будет варьировать. Эта информация может быть применена в тех случаях, когда возникает необходимость по какой-либо причине подкрепить или устранить поведенческие реакции нашего испытуемого.
该观察程序可以改进以用于临床和实验室研究。您可以创建一组图片,让拍摄对象有机会查看它们,同时记录他查看每张图片的时间。 “看图片”的行为会因图片中所看到的内容而得到强化。看一张图片可能比看另一张图片具有更大的强化效果,并且看图片所花费的时间也会有所不同。该信息可以应用于出于任何原因需要加强或消除我们的受试者的行为反应的情况。
Литературу, живопись и эстраду можно рассматривать как хорошо продуманные подкрепления. Так или иначе приобретение книг, билетов на представления и выставки произведений искусства зависит от того, являются ли эти книги пьесы, концерты или картины подкреплениями. Часто художник ограничивает себя поисками того, что является подкреплением для него самого. Когда он действует таким образом, в его работе «отражается его собственная индивидуальность», и тогда только случайно (как мера универсальности) его книга или пьеса или музыка, или картина оказывают подкрепляющее воздействие на других. Поскольку коммерческий успех имеет большое значение, постольку с его помощью можно непосредственно изучать поведение других людей.
文学、绘画和舞台可以说是经过深思熟虑的强化。无论如何,购买书籍、表演和艺术展览的门票取决于这些书籍、戏剧、音乐会或绘画是否是强化物。艺术家常常将自己限制在寻找对自己有强化作用的东西上。当他以这种方式行事时,他的作品“反映了他自己的个性”,然后他的书、戏剧、音乐或图片对他人产生强化作用只是偶然的(作为普遍性的衡量标准) 。因为商业成功很重要,所以它可以用来直接研究其他人的行为。
Для выяснения того, что является подкреплением для данного человека, мы не можем ограничиться простым вопросом к нему о том, что его подкрепляет. Его ответ может представлять определенную ценность, но его ни в коем случае нельзя считать надежным. Подкрепляющие связи не всегда очевидны для человека. Часто только в ретроспективе тенденции человека вести себя определенным образом рассматриваются как результат определенных последствий, и отношения могут совсем не репрезентироваться субъекту, даже если они очевидны для других людей.
为了找出对某个人来说什么是强化,我们不能局限于简单地问他什么可以强化他。他的回答也许有一定的价值,但绝不可靠。加强联系对于一个人来说并不总是显而易见的。通常只有在回顾时,一个人的某些行为方式的倾向才会被视为某些后果的结果,而态度可能根本无法代表主体,即使它们对其他人来说是显而易见的。
Конечно, существуют большие различия между индивидами в отношении событий, которые имеют силу подкрепления. Различия между видами настолько велики, что едва ли они могут представлять интерес; очевидно, что-то, что подкрепляет лошадь, необязательно подкрепляет собаку или человека. Среди представителей вида большие различия могут объясняться не столько наследственностью, но и историей жизни индивида, обстоятельства которой могут быть прослежены. Тот факт, что организм наследует способность получать подкрепления в виде определенных событий, не может использоваться для предсказания неиспытанного стимула. Также и отношения между подкрепляющим событием и депривацией или любым другим условием организма не наделяют подкрепляющее событие никакими определенными физическими качествами. Особенно невероятно, чтобы событие, которое приобрело силу подкрепления, выделилось бы каким-то определенным образом. Тем не менее такие события являются важными видами подкрепления.
当然,对于具有执着力的事件,个体之间存在很大差异。物种之间的差异是如此之大,以至于很难引起人们的兴趣。显然,强化马的东西不一定强化狗或人。在一个物种的代表中,巨大的差异不仅可以用遗传来解释,还可以用个体的生活史来解释,个体的生活史是可以追踪的。有机体继承了以某些事件的形式接受强化的能力,这一事实不能用来预测未经历过的刺激。同样,强化事件与剥夺或任何其他身体状况之间的关系并不赋予强化事件任何特定的身体素质。尤其不可能以任何特定方式分享已获得强化力量的事件。然而,此类事件是重要的紧固类型。
УСЛОВНЫЕ ПОДКРЕПЛЕНИЯ
有条件的增援
Презентируемый при оперантном подкреплении стимул может быть соединен с другим стимулом, представленным. В респондентном обусловливании. В гл. 4 мы рассмотрели условия приобретения способности вызывать реакцию; здесь остановимся на феномене подкрепления. Хотя подкрепление имеет другую стимульную функцию, процесс, возникающий при сочетании стимулов, представляется таким же. Если голодному животному часто предъявлять пищу на подносе, то пустой поднос вызывает выделение слюны. В определенной степени пустой поднос также будет подкреплять оперант.
操作性强化期间呈现的刺激可以与呈现的另一个刺激配对。在受访者调节中。英寸。 4 我们研究了获得引起反应的能力的条件;这里我们重点关注强化现象。尽管强化具有不同的刺激功能,但刺激组合时发生的过程似乎是相同的。如果经常向饥饿的动物提供托盘上的食物,空托盘会导致流口水。在一定程度上,空托盘也会强化操作性。
Можно еще проще продемонстрировать условное подкрепление на примере стимулов, которые легче контролировать, если каждый раз, давая пищу голодному голубю, мы будем включать свет, то свет постепенно станет условным подкреплением. Он может использоваться для обусловливания операнта так же, как используется пища. Нам уже кое-что известно о том, как свет приобретает это свойство: чем чаще свет сочетается с пищей, тем большую силу как подкрепление он приобретает;
我们可以使用更容易控制的刺激来更简单地展示条件强化:如果每次给饥饿的鸽子喂食时都打开灯,那么灯将逐渐成为条件强化。它可以像使用食物一样用于操作性调节。我们已经知道光如何获得这种特性:光与食物结合的次数越多,它作为强化物的强度就越大;
Нельзя предъявлять пищу вслед за светом через боль
光亮后不要因疼痛而提供食物шие промежутки времени; сила подкрепления быстро утрачивается, когда пища не предъявляется. Все это вы
较长的时间;当不提供食物时,强化的强度很快就会消失。都是你текает из наших знаний о стимульном обусловливании. Условные подкрепления часто являются продуктом естественных контингентов. Обычно пища или вода получаются только после того, как организм выполнил «предшествующее» поведение — после того, как он воз
来自我们对刺激调节的了解。条件强化物往往是自然偶然事件的产物。通常,只有在生物体执行了“前面的”行为之后才能获得食物或水 - 在它执行完之后действовал на среду, чтобы создать возможность для того, чтобы поесть и попить. Поэтому стимулы, порожденные этим «предшествующим» поведением, становятся подкреплениями. Таким образом, прежде чем мы смо
对环境采取行动,创造饮食机会。因此,这种“先前”行为产生的刺激就成为强化物。所以在我们可以之前жем успешно перенести пищу с тарелки к себе в рот, необходимо приблизиться к тарелке, и любое поведение, которое приближает нас к тарелке автоматически подкрепляется. Следовательно, поддерживается сила «пред
为了成功地将食物从盘子转移到嘴里,我们必须靠近盘子,任何让我们靠近盘子的行为都会自动得到强化。因此,力“pre”得以维持шествующего» поведения. Это имеет большое значение» поскольку только незначительная часть поведения сразу подкрепляется пищей, водой, сексуальным контактом или другими событиями биологической важности. Хотя характерной особенностью человеческого поведения яв
行进”的行为。这很重要,因为只有一小部分行为会被食物、水、性接触或其他生物事件立即强化。尽管人类行为的一个典型特征是ляется то, что важные подкрепления могут быть эффек
事实证明,重要的强化物可以有效тивными при отсрочке на большие промежутки времени, это объясняется, по-видимому, тем, что промежуточные события становятся условными подкреплениями. Когда человек в октябре укрепляет на окнах своего дома вто
当长时间延迟时,中间事件会成为条件强化物,这显然可以解释这一点。当一个人十月份在自家窗户上安装水时рые рамы, потому что в результате аналогичного пове
ry 框架,因为由于类似的行为дения в октябре прошлого года в январе в доме было тепло, нам необходимо определить, как заполняется промежуток между поведением в октябре и его эффек
由于去年 10 月房子在一月份很温暖,我们需要确定如何填补 10 月份的行为及其影响之间的差距том в январе. Среди условных подкреплений, ответст
一月汤姆.在条件强化物中,责任венных за силу этого поведения, есть определенные вербальные последствия, исходящие от самого человека или его соседей. Иногда бывает важно оставить ряд со
造成这种行为强度的原因是该人本人或他的邻居会产生一定的言语后果。有时,留下一行很重要бытий между действием и конечным важным подкрепле
行动与最终重要强化之间的存在нием для того, чтобы осуществлять контроль за поведением в практических целях. В сфере образования, про
化,以便出于实际目的控制行为。在教育领域,关于мышленности, психотерапии и др. Мы сталкиваемся с различными методиками, разработанными для создания соответствующих условных- подкреплений. Обеспечение непосредственных эффективных последствий тогда» когда конечные последствия отсрочены, должно «улуч
思考、心理治疗等。我们面临着各种旨在创造适当的条件强化物的技术。当最终结果被延迟时提供立即有效的结果应该得到改善шать мораль», «усиливать интерес», «предотвращать по
破坏道德”、“增加兴趣”、“防止явление чувства неуверенности» или корректировать условия низкой оперантной силы, которые мы называем «
不确定感的现象”或纠正低操作强度的情况,我们称之为“abulia
阿布里亚», и т. Д. Конкретизируя это положение, можно сказать, что оно побуждает студентов учиться, лиц, на
”等。明确这一规定,我们可以说它鼓励学生学习、个人、нятых на работу, приходить в учреждения, больных принимать посильное участие в общественной жизни и т. Д.
受雇工作的人、来到机构的人、病人尽可能参与公共生活等。
Обобщенные (generalized) подкрепления. Условное подкрепление обобщается (is generalized), когда оно сочетается более чем с одним первичным подкреплением. Генерализованное подкрепление оказывается полезным потому, что состояние организма в данный момент необязательно является значимым. Оперантная сила, гене-рализованная посредством только одного подкрепления,. Наблюдается при создании соответствующего условия депривации: когда мы подкрепляем пищей, мы получаем возможность управлять голодным животным. Но если условное подкрепление сочетается с подкреплениями, соответствующими многим условиям, тогда по крайней мере одно из них, соответствующее состоянию депривации, должно будет оказать влияние на последующую ситуацию. Поэтому реакция должна будет произойти. Например, когда мы подкрепляем деньгами, организуемое нами управление относительно независимо от кратковременных депривации. Создается один вид обобщенного подкрепления, потому что многие первичные подкрепления получаются только после предъявленных преобразований физической среды.
广义的援军。当条件钢筋与多个主要钢筋组合时,它是通用的。广义强化是有用的,因为有机体在给定时刻的状态不一定是重要的。操作强度仅通过强化来概括。在创造适当的剥夺条件时可以观察到:当我们用食物强化时,我们就有机会控制饥饿的动物。但如果一个条件强化物与对应于多种条件的强化物组合在一起,那么至少其中一个对应于剥夺条件的强化物将不得不影响随后的情况。因此反应必须发生。例如,当我们用金钱作为后盾时,我们组织的控制相对独立于短期剥夺。创建了一种广义强化,因为许多主要强化只有在物理环境发生转变后才能获得。
В различных ситуациях одна форма «предшествующего» поведения может вести за собой различные виды подкреплений. Непосредственная стимуляция на основе такого поведения становится обобщенным подкреплением. Мы автоматически получаем подкрепление, независимо от любой определенной депривации, когда мы успешно осуществляем контроль за физическим миром. Этим объясняется наша тенденция увлекаться профессиональным мастерством, художественным творчеством и такими видами спорта, как игра в кегли, бильярд и теннис.
在不同的情况下,一种形式的“先行”行为可能会导致不同类型的强化。基于这种行为的直接刺激变成了广义强化。当我们成功地控制了物质世界时,无论有什么具体的剥夺,我们都会自动获得强化。这解释了我们倾向于对专业技能、艺术创造力以及保龄球、台球和网球等运动感兴趣。
Однако возможны ситуации, при которых некоторые эффекты подкрепления «сенсорной обратной связи» не обусловливаются. Оказывается, что ребенок подкрепляется стимуляцией, идущей из среды, за которой не следует первичное подкрепление, например действие детской погремушки. Способность получать подкрепление таким образом могла возникнуть в эволюционном процессе, и она, возможно, аналогична подкреплению, которое мы получаем, просто «организуя мир соответствующим образом». Любой организм, который подкрепляется успешным взаимодействием со средой, несмотря на последствия в каждый момент, окажется r более благоприятных условиях, когда последуют значимые последствия.
然而,在某些情况下,“感觉反馈”的某些强化效果可能不受条件限制。事实证明,孩子受到来自环境的刺激的强化,而没有进行初级强化,例如婴儿摇铃的动作。以这种方式获得强化的能力可能是在进化过程中出现的,也许类似于我们通过“相应地组织世界”而获得的强化。任何通过与环境的成功相互作用而得到强化的有机体,无论每时每刻都会产生后果,当重大后果随之而来时,都会发现自己处于更有利的条件下。
Когда поведение подкрепляется другими людьми, появляется несколько важных генерализованных подкреплений, например внимание. Всем известны случаи, когда ребенок плохо ведет себя «только для того, чтобы привлечь к себе внимание». Внимание людей подкрепляет, потому что оно является необходимым условием других подкреплений, исходящих от них вообще, только те люди, которые внимательны к нам, подкрепляют наше поведение. Внимание со стороны людей, которые прежде всего обычно являются источниками подкрепления — родителей, учителя или любимого человека, — служит особенно хорошим обобщенным подкреплением и формирует особенно сильное поведение «получения внимания». Специфичность многих вербальных реакций состоит в том, что они привлекают внимание, например «смотри», «пойми», а также произнесение имени человека. Другими характерными формами поведения, которые можно назвать сильными, потому что они требуют внимания, являются симуляция болезни, раздраженность и броскость (самореклама).
当行为被其他人强化时,就会出现一些重要的广义强化物,例如注意力。每个人都知道孩子“只是为了引起注意”而做出不良行为的情况。人们的注意力会强化,因为它是来自他们的其他强化的必要条件;只有那些关注我们的人才会强化我们的行为。来自通常是强化的主要来源的人——父母、老师或亲人——的关注是一种特别好的广义强化物,并产生特别强烈的“寻求关注”行为。许多言语反应的特殊性在于它们引起注意,例如“看”、“理解”以及发音一个人的名字。其他因需要关注而被称为强大的特征行为包括假装生病、易怒和浮夸(自我推销)。
Часто внимания бывает недостаточно. Другой человек может подкрепить только ту часть поведения данного человека, которое он одобряет, и, следовательно, любой признак его одобрения по праву становится подкрепляющим. Поведение, которое вызывает улыбку, или вербальную реакцию «правильно», «хорошо», или любую другую похвалу, подкрепляет. Мы пользуемся этим обобщенным подкреплением для формирования поведения других людей, особенно в сфере образования. Например, мы обучаем детей и взрослых говорить правильно, произнося «правильно», когда они дают правильную поведенческую реакцию.
往往注意力不够。另一个人只能强化他所认可的那部分行为,因此他认可的任何迹象都理所当然地成为强化。引起微笑的行为,或者“对的”、“很好”或任何其他形式的赞美的口头回应都是强化的。我们利用这种普遍强化来塑造他人的行为,尤其是在教育领域。例如,当儿童和成人做出正确的行为反应时,我们会说“正确”,从而教他们正确说话。
Еще более сильным генерализованным подкреплением является аффектация. Она может быть прежде всего связана с сексуальным контактом как первичным подкреплением, но когда тот, кто вызывает аффектацию, также вводит другие виды подкрепления, эффект генерализуется.
更强大的广义强化是矫揉造作。它可能主要与作为主要强化物的性接触有关,但是当引起影响的人也引入其他类型的强化物时,这种效果就会普遍化。
Трудно дать определение внимания, одобрения и аффекта и также трудно наблюдать за ними и измерять их. Они являются не вещами, а аспектами поведения других. Их неуловимые физические параметры предоставляют трудность не только для ученого, который должен изучать их, но также и для индивида, которого. Они подкрепляют. Если мы не можем легко обнаруживать, что человек обращает внимание на нас, одобряет наше поведение или что мы привлекательны для него, тогда наше поведение не будет последовательно подкрепляться. Поэтому оно может оказаться слабым, может иметь тенденцию протекать в несоответствующее время и т. Д. Мы не знаем, что делать для того, чтобы «привлечь к себе внимание», «вызвать любовь», или «когда это делать». Ребенок, борясь за внимание, влюбленный — за проявления любви, художник — за одобрение его произведений, демонстрируют стойкое поведение, которое является только результатом прерывистого подкрепления.
注意力、认可和影响很难定义,也同样难以观察和衡量。它们不是事物,而是他人行为的各个方面。它们难以捉摸的物理参数不仅对必须研究它们的科学家提出了挑战,而且对研究它们的个人也提出了挑战。他们加强。如果我们不能轻易地察觉到一个人在关注我们、认可我们的行为或者我们对他有吸引力,那么我们的行为就不会得到持续的强化。因此,它可能很弱,可能倾向于在不适当的时间发生,等等。我们不知道该怎么做才能“获得关注”、“获得爱”或“何时做”。一个孩子为了获得关注而奋斗,一个情人为了表达爱,一个艺术家为了获得自己的作品的认可,所表现出的持久行为只是间歇性强化的结果。
Другим генерализованным подкреплением является подчиненность других людей. Когда человек бывает вынужден давать различные подкрепления, то любое указание на его подчиненность становится подкреплением задиристого человека всегда подкрепляют признаки трусости, а представителей правящего класса — признаки уважения, престиж и уважение являются генерализованными подкреплениями только постольку, поскольку они гарантируют, что другие люди будут действовать определенным образом. То, что наличие своего собственного образа действия подкрепляет, можно показать на примере поведения тех людей, которые управляют ради того, чтобы управлять. Физические признаки покорности обычно не бывают столь неуловимыми, как свойства внимания, одобрения и любви. Задиристый человек может настаивать на проявлении четких признаков признания его доминирования, а ритуальные обычаи могут подчеркивать уважение.
另一个普遍的强化是其他人的服从。当一个人被迫给予各种强化物时,任何表明其从属地位的迹象都会成为强化物;欺凌者总是会因怯懦而得到强化,而统治阶级的代表则总是会因威望和尊重而得到强化;强化物仅在保证其他人会以某种方式行事的情况下才有效。那些为了管理而管理的人的行为例子可以证明,拥有自己的行为方式可以强化这一事实。顺从的身体迹象通常不像关注、认可和爱的品质那么微妙。欺凌者可能会坚持明显的统治迹象,而仪式习俗可能会强调尊重。
Источники обобщенных подкреплений легко забываются, и они рассматриваются как подкрепления, имеющие якобы самостоятельную силу. Мы говорим о потребности во внимании, одобрении или аффекте, о «потребности в доминировании» и «любви к деньгам», как будто бы они являются первичными условиями депривации. Но способность к подкреплению с помощью подобных средств едва ли может развиться за короткий промежуток времени, в течение которого преобладают необходимые условия. Внимание, аффект, одобрение и подчинение, по-видимому, существовали в человеческом обществе только короткий промежуток времени в процессе эволюции. Более того, они не представляют собой фиксированные формы стимуляции, поскольку зависят от особенностей склада определенных групп. Поскольку аффектация главным образом связана с сексуальной сферой, постольку она может быть связана с условием первичной депривации, которая в определенной мере независима от истории жизни человека, но признаки «удовольствия», которые приобретают силу подкрепления благодаря их связи с сексуальным контактом или с другими подкреплениями, едва ли могут обладать эффектом подкрепления по генетическим причинам. Символы появились еще позднее, и редко высказывается мнение, что потребность в них врождена. Обычно мы можем наблюдать за процессом, в котором ребенок начинает получать подкрепление в форме денег. Однако часто «любовь к деньгам» кажется независимой от «потребности в одобрении», но если мы более детально рассмотрим эффективность этих генерализованных подкреплений, у нас окажется столько же оснований для признания врожденной потребности к деньгам, как и» для признания врожденной потребности во внимании, удовольствии или доминировании.
广义强化物的来源很容易被遗忘,它们被认为是具有独立力量的强化物。我们谈论对关注、认可或情感的需求,“对支配地位的需求”和“对金钱的热爱”,仿佛这些是剥夺的主要条件。但这种方式的加固能力很难在具备必要条件的短时间内发挥出来。在人类社会的进化过程中,关注、情感、认可和服从似乎只存在了很短的一段时间。此外,它们并不代表固定的刺激形式,因为它们取决于某些群体的特征。由于情感主要与性领域有关,因此它可能与初级剥夺状况有关,这在某种程度上独立于人的生活史,但“快乐”的迹象由于与性有关而获得强化的力量。由于遗传原因,性接触或与其他强化物不太可能产生强化效果。符号的出现甚至更晚,而且很少有人认为符号的需要是与生俱来的。通常我们可以观察孩子开始接受金钱形式强化的过程。 然而,“对金钱的热爱”似乎常常与“认可的需要”无关,但如果我们更详细地考虑这些普遍强化的有效性,我们就有充分的理由认识到对金钱的天生需求,就像认识到天生的金钱需求一样。需要关注、快乐或支配。
Обычно генерализованные подкрепления оказываются эффективными, даже если первичные подкрепления, на которых они основываются, больше их не сопровождают. Мы играем в игры, требующие определенных навыков ради них самих. Аффекты не всегда вызываются сексуальным подкреплением. Подчиненность других людей подкрепляет, даже если мы не используем ее. Эффект подкрепления деньгами жадного человека может оказаться настолько сильным, что он может обречь себя на голод, чтобы не лишиться их. Эти факты, поддающиеся наблюдению, должны занять надлежащее место при построении теорий и изучении практики. Они не означают, что обобщенные подкрепления представляют собой нечто большее, чем физические свойства стимулов, наблюдаемые в каждом случае, или что существуют какие-то нефизические данности, которые необходимо принимать во внимание.
通常,即使广义强化物所基于的主要强化物不再伴随它们,广义强化物仍然有效。我们玩游戏本身就需要技巧。影响并不总是由性强化引起的。其他人的提交是强化的,即使我们不使用它。用金钱来增强一个贪婪的人的效果可能会如此强烈,以至于他注定要挨饿以免失去金钱。这些可观察到的事实必须在理论构建和实践研究中占有适当的位置。它们并不意味着广义强化物只不过是在每种情况下观察到的刺激的物理属性,或者需要考虑一些非物理给定。
ПОЧЕМУ ПОДКРЕПЛЕНИЕ ПОДКРЕПЛЯЕТ?
为什么强化会强化?
Закон эффекта не является теорией. Это просто правило, объясняющее усиление поведения. Когда мы подкрепляем реакцию и наблюдаем за изменениями ее частоты. Можно легко описать то, что произошло, в объективных терминах. Но при объяснении того, почему это произошло, необходимо обратиться к теории. Почему подкрепление подкрепляет? Одна из теорий утверждает, что организм повторяет реакцию, потому что он находит, что его следствия «приятны» или «приносят удовлетворение». Но в каком смысле это является объяснением для естественной науки? Такие характеристики, как «приятный» или «приносящий удовлетворение», вероятно, не относятся к физическим свойствам того, что подкрепляет, поскольку физическая наука не использует ни эти термины, ни какие-либо другие их - эквиваленты. Термины должны характеризовать определенное воздействие на организм, но можно ли его определить таким образом, чтобы оно было пригодным для объяснения подкрепления?
效果定律不是理论。这只是解释行为强化的一条规则。当我们强化某种反应并观察其频率的变化时。客观地描述所发生的事情是很容易的。但在解释为什么会发生这种情况时,有必要转向理论。强化为什么会强化?一种理论认为,身体重复某种反应是因为它发现其后果“令人愉快”或“令人满意”。但这在什么意义上是对自然科学的解释呢?诸如“令人愉快的”或“令人满意的”之类的特征可能不是指增强事物的物理特性,因为物理科学不使用这些术语或任何其他等效术语。这些术语必须表征对有机体的某种影响,但它能否以适合解释强化的方式来定义?
Иногда полагают, что вещь является приятной, если индивид стремится к ней или сохраняет ее, и она считается неприятной, если индивид избегает или отвергает ее. Сделано много попыток найти объективное определение, но все они уязвимы для критики: определяемое поведение может быть просто еще одним продуктом эффекта подкрепления. Утверждение, что стимул приятен, потому что организм стремится приблизиться к нему или удержать его, может быть еще одним способом выражения того, что стимул подкрепил поведение «приближения» или «удержания». Вместо того чтобы определять эффект подкрепления с точки зрения его воздействия на поведение в общем, мы просто определили известный нам вид поведения, который почти с неизбежностью подкреплялся и, следовательно, в общем является пригодным в качестве индикатора силы подкрепления. Если продолжать утверждать, что стимул подкрепляет потому, что он приятен, тогда то, что выдвигается как объяснение, включающее два эффекта, в действительности является излишним описанием одного из них.
有时人们认为,如果个人努力争取或维持某件事,那么它就是令人愉快的;如果个人避免或拒绝它,则认为它是不愉快的。人们已经做出了许多尝试来寻找客观的定义,但所有这些都容易受到批评:所定义的行为可能只是强化效应的另一种产物。刺激是令人愉快的,因为有机体倾向于接近或抓住它,这可能是表达刺激强化了接近或抓住行为的另一种方式。我们不是根据强化对一般行为的影响来定义强化的效果,而是简单地定义了一种我们已知的行为类型,这种行为几乎不可避免地会被强化,因此通常可用作强化强度的指标。如果我们继续认为刺激是增强的,因为它令人愉快,那么所提出的涉及两种效应的解释实际上是对其中一种效应的多余描述。
Альтернативный подход к. Описанию характеристик «приятный» и «неприятный» (или «приносящий удовлетворение» и «раздражающий») заключается в том, что испытуемого спрашивают, что он ощущает, когда имеет дело с определенными событиями. Это предполагает, что подкрепление имеет два эффекта: усиливает поведение и порождает «чувства» и что одно является функцией другого. Но функциональные отношения можно рассмотреть и в другой плоскости. Когда человек сообщает, что событие приятно, он может просто иметь в виду, что это такое событие, которое подкрепляет его» или по отношению к которому он обнаруживает в себе тенденцию стремиться, двигаться, так как оно подкрепляет такое движение. Далее мы увидим, что человек мог бы и не приобретать вербальные реакции, »указывающие на его ощущение удовольствия, если бы подобный феномен не имел бы места. В любом случае сам испытуемый не получает преимуществ, фиксируя таким образом свои наблюдения. Субъективные суждения об удовольствии или удовлетворении, порождаемые стимулами, как правило, ненадежны и неустойчивы. Как подчеркивается в теории бессознательного, мы не можем давать самоотчет о всех событиях, которые проявляют себя как подкрепляющие нас, или мы можем сообщить о том, что вступает в прямое противоречие с объективными наблюдениями; также мы можем назвать неприятным событие, которое в действительности подкрепляет. Примеры такой аномалии варьируют от мазохизма до мученичества.
描述“愉快”和“不愉快”(或“满意”和“恼人”)特征的另一种方法是询问受试者在处理某些事件时的感受。这表明强化有两种作用:它强化行为并创造“感觉”,其中一种是另一种的作用。但功能关系可以从不同的角度来考虑。当一个人报告某件事是令人愉快的时,他可能只是表示该事件增强了他的力量,或者他发现了一种为之奋斗、前进的倾向,因为它强化了这种运动。我们稍后会看到,如果这种现象不发生,一个人可能不会获得表明他感到快乐的言语反应。无论如何,受试者本人通过这种方式记录他的观察结果不会获得任何好处。对刺激产生的愉悦或满足的主观判断往往是不可靠和不稳定的。正如无意识理论所强调的那样,我们不能自我报告所有似乎对我们有强化作用的事件,或者我们可以报告与客观观察直接矛盾的事件;我们也可以将实际上增强我们力量的事件称为不愉快的事件。这种异常的例子包括从受虐到殉道。
Иногда утверждают, что подкрепление оказывается эффективным потому, что оно редуцирует состояние депривации. В данном случае имеет место по крайней мере побочный эффект, который не следует путать с самим подкреплением. Очевидно, что депривация имеет большое значение для оперантного обусловливания. В наших экспериментах мы имеем дело с голодным голубем и по-другому не можем продемонстрировать оперантное обусловливание. Чем голоднее птица, тем чаще она реагирует в результате подкрепления. Но, несмотря на эту связь, неправильно было бы считать, что подкрепление всегда редуцирует депривацию. Обусловливание может наступать прежде любого значительного изменения в депривации, измеряемой другими способами.
有时有人认为强化是有效的,因为它减少了剥夺状态。在这种情况下,至少存在不应与强化物本身相混淆的副作用。显然,剥夺对于操作性条件反射很重要。在我们的实验中,我们面对的是一只饥饿的鸽子,无法以任何其他方式展示操作性条件反射。鸟越饥饿,它就越容易做出强化反应。但是,尽管存在这种联系,但认为强化总是能减少剥夺的假设是错误的。调节可能发生在通过其他方式测量的剥夺发生任何重大变化之前。
Связь между насыщением и подкреплением следует искать в процессе эволюции. Едва ли можно оставить без внимания тот факт, что первичные подкрепления играют огромную биологическую роль. Пища, вода, сексуальный контакт и избегание боли явно связаны с благополучием организма. Индивид, который подкрепляется такими событиями, приобретает в высшей степени эффективное поведение. Также биологически значимым является то обстоятельство, согласно которому поведение, порождаемое определенным подкреплением, с большей вероятностью появляется в состоянии депривации. Таким образом, важным является не только то, что любое поведение, которое приводит к приему пищи, должно стать важной частью поведенческого репертуара, но и то, что это поведение оказывается особенно сильным, когда организм голоден. Эти две особенности организма, по-видимому, определяют то, что организм может подкрепляться специфическими способами и что результат будет наблюдаться в релевантных условиях депривации.
应在进化过程中寻求满足感与强化之间的联系。人们很难忽视这样一个事实:初级强化物发挥着巨大的生物学作用。食物、水、性和避免疼痛显然与身体的健康有关。受到此类事件强化的个人会获得高效的行为。同样具有生物学意义的事实是,特定强化物产生的行为更有可能发生在剥夺状态下。因此,重要的是,不仅任何导致食物摄入的行为都应该成为行为库的重要组成部分,而且这种行为在身体饥饿时尤其强烈。有机体的这两个特征似乎决定了有机体可以通过特定的方式得到强化,并且结果将在相关的剥夺条件下观察到。
Некоторые формы стимуляции получают положительное подкрепление, хотя они не вызывают поведения, имеющего биологическое значение. Ребенок подкрепляется не только пищей, но и звоном колокольчика или блеском яркого предмета. Поведение, которое постоянно следует за этими стимулами, характеризуется увеличением вероятности. Трудно, а может быть и невозможно проследить эти эффекты подкрепления в истории обусловливания. Позднее мы можем обнаружить, что того же самого индивида подкрепляют звучание оркестра или красочный спектакль. В данном случае еще труднее убедиться в том, что эффект подкрепления не обусловлен. Однако можно утверждать, что способность получить подкрепление из среды с помощью любой обратной связи была бы биологическим достижением, поскольку она готовила бы организм к успешному управлению средой, прежде чем сформируется данное состояние депривации. Когда организм порождает тактильную обратную связь, например, ощущение текстуры материала или поверхности скульптуры, обусловливание обычно рассматривается как результат сексуального подкрепления даже тогда, когда стимулируемая область по функции не является первично-сексуальной. В этой связи хотелось бы предположить, что другие формы стимуляции, продуцированные поведением, точно так же, связаны с биологически значимыми событиями.
某些形式的刺激即使不会产生具有生物学意义的行为,也会得到积极的强化。孩子不仅可以通过食物得到强化,还可以通过铃声或明亮物体的闪光来强化。持续遵循这些刺激的行为的特点是概率增加。通过条件作用的历史来追踪这些强化效应,即使不是不可能,也是很困难的。后来我们可能会发现管弦乐队的声音或丰富多彩的表演强化了同一个人。在这种情况下,验证强化效果是否不受条件限制就更困难了。然而,可以说,利用任何反馈从环境中获得强化的能力将是一项生物学成就,因为它将使有机体在形成特定的剥夺状态之前为成功控制环境做好准备。当有机体产生触觉反馈时,例如材料纹理或雕塑表面的感觉,调节通常被认为是性强化的结果,即使受刺激的区域主要不是性功能。在这方面,我们想假设行为产生的其他形式的刺激也与具有生物学意义的事件类似地相关。
Когда среда изменяется, тогда способность получать подкрепление данным событием с биологической точки зрения может рассматриваться как недостаток. Сахар является очень обильным подкреплением для большинства представителей человеческого рода, о чем свидетельствует огромное количество прилавков для продажи сладостей. В этом отношении его эффект гораздо превосходит биологическую потребность в нем в наши дни.
当环境发生变化时,从生物学角度来看,通过给定事件增强的能力可能被认为是一种劣势。对于大多数人类来说,糖是一种非常丰富的食物,大量出售糖果的摊位就证明了这一点。从这方面来说,它的作用远远超过了当今的生物学需要。
Этого не было до того, как сахар стал выращиваться я производиться в большом количестве. Несколько сот-лет тому назад сильный подкрепляющий эффект сахара, вероятно, был оправдан. Среда изменилась, но генетические возможности организма остались на прежнем уровне. Секс является еще одним примером. В настоящее время сильный эффект сексуального контакта не является преимуществом организма, но нам нет необходимости возвращаться на много лет назад, для того чтобы обнаружить условия голода и эпидемий, при которых сила сексуального подкрепления была оправдана. Объяснение силы подкрепления биологией организма можно продолжать до тех пор, пока мы будем говорить о том, почему то или иное событие подкрепляет. Для функционального анализа такое объяснение, вероятно, ничего не даст, так как оно не дает никаких способов идентификации подкрепляющих стимулов, »прежде чем. Мы не испытаем его подкрепляющего воздействия на организм. Следовательно, мы должны довольствоваться объяснением с точки зрения воздействий стимулов на поведение.
在糖被种植和大量生产之前,情况并非如此。几百年前,糖的强大强化作用可能是合理的。环境发生了变化,但生物体的遗传能力仍保持在同一水平。性是另一个例子。目前,性交的强烈作用对有机体来说并不是一种优势,但我们不需要回到很多年前就可以发现饥荒和瘟疫的情况,在这种情况下性强化的力量是合理的。只要我们谈论为什么这个或那个事件是强化的,就可以继续通过生物体的生物学来解释强化的力量。对于功能分析来说,这样的解释可能没有用,因为它之前没有提供任何识别强化刺激的方法。我们不会体验到它对身体的强化作用。因此,我们必须满足于刺激对行为的影响的解释。
НЕПРЕДВИДЕННЫЕ ОБСТОЯТЕЛЬСТВА И «СУЕВЕРНОЕ» ПОВЕДЕНИЕ
意外情况和“迷信”行为
Утверждалось, что эксперименты Торндайка нетипичны для процесса научения, поскольку кошка не может «видеть связей» между движением задвижки и «выходом из ящика». Но в оперантном обусловливании фиксирование связей не является существенным моментом. Как во время, так и после обусловливания человек част» рассказывает о связи своего поведения с окружающей его средой. Его отчет может оказаться пригодным для научного объяснения, и его реакция на его собственное поведение может даже оказаться важным связующим звеном в определенных сложных процессах. Но в простых процессах оперантного обусловливания такие отчеты или реакции не требуются. Это объясняется тем, что человек может оказаться неспособным описать контингента подкрепления, которые имели явно выраженный эффект.
有人认为,桑代克的实验是非典型的学习过程,因为猫无法“看到门闩的运动和“盒子的出口”之间的联系。但在操作性条件反射中,连接的固定并不是要点。在调节期间和之后,一个人经常谈论他的行为与环境之间的联系。他的报告可能对科学解释有用,他对自己行为的反应甚至可能被证明是某些复杂过程中的重要环节。但在简单的操作条件反射过程中,不需要这样的报告或响应。这是因为一个人可能无法描述具有明显效果的强化物的连续体。
Также отсутствует необходимость в каких-либо перманентных связях между реакцией и ее подкреплением. Мы делаем прием пищи зависимым от реакции голубя, организуя механические и электрические связи. За пределами лаборатории ситуации, в которых возникают связи между поведением и его следствием, определяются различными физическими системами. Но это никак не влияет на организм, и в этом никакой необходимости нет. Что касается самого организма, то единственно важное свойство контингента подкрепления — в его временном характере. Подкрепление следует за реакцией. Каким образом это происходит, значения не имеет.
响应与其强化之间也不需要任何永久的联系。我们通过组织机械和电气连接,使食物摄入量取决于鸽子的反应。在实验室之外,行为及其后果之间出现联系的情况是由各种物理系统决定的。但这对身体没有任何影响,也没有必要。对于有机体本身来说,强化部队唯一重要的属性就是它的临时性。响应之后进行强化。这如何发生并不重要。
Мы должны допустить, что презентация подкрепления всегда что-то подкрепляет, поскольку она неизбежно совпадает с каким-либо поведением. Мы знаем, что уже одно подкрепление может иметь значительный эффект. Если устанавливается только случайная связь между реакцией и появлением стимула, поведение называется «суеверным». Мы можем показать это на примере с голубем, аккумулируя эффект нескольких случайных обстоятельств. Предположим, что мы будем давать голубю небольшое количество еды каждые пятнадцать секунд, независимо от того, что он делает. Когда пища предъявляется первый раз, он выполняет какие-то поведенческие реакции — если только он не будет стоять спокойно — и произойдет обусловливание. Тогда более вероятно, что при предъявлении пищи снова будет наблюдаться то же самое поведение. Если это произойдет, то оперант будет еще более усилен. Если этого не произойдет, то будет усилено какое-то другое поведение. Обычно данное поведение достигает частоты, с которой оно подкрепляется. В дальнейшем оно становится постоянной частью репертуара птицы, даже если пища предъявлялась в такое время, которое не связано с поведением птицы. Видимые реакции, которые были установлены таким образом, включают резкие наклоны головы, переступание с ноги на ногу, наклоны и шарканье ногами, повороты вокруг своей оси, неестественную походку и наклоны головы. В дальнейшем топография поведения может сместиться на другие подкрепления, поскольку легкие изменения в форме реакции могут совпадать с приемом пищи.
我们必须假设强化的呈现总是强化某些东西,因为它不可避免地与某些行为相一致。我们知道,仅强化即可产生显着效果。如果反应与刺激的出现之间仅建立了偶然的联系,则这种行为被称为“迷信”。我们可以用鸽子的例子来展示这一点,累积几种随机情况的影响。假设我们每十五秒给鸽子少量的食物,无论它做什么。当食物第一次出现时,他会做出一些行为反应——除非他站着不动——并且条件作用就会发生。当提供食物时,更有可能再次观察到相同的行为。如果出现这种情况,操作性将会进一步加强。如果这种情况没有发生,那么其他一些行为就会得到强化。通常,给定的行为会达到其被强化的频率。随后,它就成为鸟儿的永久保留的一部分,即使食物是在与鸟儿的行为无关的时间呈现的。通过这种方式识别出的可见反应包括突然头部倾斜、拖曳、弯腰拖曳、转身、不自然的步态和头部倾斜。随后,行为的拓扑可能会转向其他强化,因为反应形式的轻微变化可能与食物摄入同时发生。
При продуцировании «суеверного» поведения важное значение имеют интервалы, через которые подается пища. За шестьдесят секунд эффект подкрепления утрачивается в значительной мере, прежде чем появляется другой, и вероятность появления другого поведения больше. Следовательно, вероятность появления «суеверного» поведения меньше, хотя оно может иметь место», если эксперимент выполняется на протяжении длительного времени. Через пятнадцать секунд обычно эффект бывает почти мгновенным. Когда «суеверная» реакция устанавливается, она будет сохраняться, даже если она будет подкрепляться изредка.
当产生“迷信”行为时,提供食物的时间间隔很重要。六十秒后,在另一种强化物出现之前,强化物的效果已经在很大程度上消失,另一种行为发生的可能性就更大。因此,如果实验长期进行, “迷信”行为虽然可能发生,但不太可能发生。十五秒后,效果通常几乎是立竿见影的。 “迷信”反应一旦形成,即使偶尔得到强化,它也会持续存在。
Голубь не является исключением. Поведение людей также во многом «суеверно». Только небольшая часть поведения, усиливаемая непредвиденными обстоятельствами, становится ритуалом, который мы называем «суеверием», однако сам принцип сохраняется в силе. Предположим, что, прогуливаясь по парку, вы находите десять долларов (и предположим, что это событие имеет для вас значительный подкрепляющий эффект). То, что мы делали в момент, когда мы нашли деньги, подкрепляется. Конечно, трудно привести строгие доказательствва, но весьма вероятно, что мы вновь пойдем на прогулку именно в тот же парк или в парк, похожий на этот, и более вероятно, что мы будем смотреть именно на то место, где были найдены деньги, и т. Д. Это поведение будет варьироваться в зависимости от состояния депривации, которому релевантны деньги. Его не следует называть «суеверным», но оно порождается ситуацией, которая редко оказывается «функциональной».
多夫也不例外。人类的行为很大程度上也是“迷信”的。只有一小部分行为在不可预见的情况下强化,成为一种仪式,我们称之为“迷信”,但原则本身仍然有效。假设你在公园散步时发现了十美元(并假设这个事件对你有显着的强化作用)。我们现在所做的事情我们发现金钱得到了加强。当然,很难提供严格的证据,但很有可能我们会再次去同一个公园或与这个公园类似的公园散步,而且更有可能的是我们会去看确切的地方这种行为会根据与金钱相关的剥夺状态而有所不同。它不应该被称为“迷信”,但它是由一种很少被证明是“功能性”的情况产生的。
Некоторые ситуации, которые продуцируют «суеверное» поведение, не являются абсолютно случайными. Иногда за реакцией следует следствие, которое тем не менее ее не «продуцирует», то можно лучше всего показать на примерах с таким типом стимула, который подкрепляет после его устранения. Прекращение кратковременной стимуляции такого вида может подкреплять поведение, порождаемое его началом. Когда появляется неприятный стимул, организм приходит в состояние активности; стимул прекращает свое действие, и это подкрепляет определенную часть поведения. Определенные заболевания, хромота, аллергия таковы, что любые меры, предпринятые для того, чтобы вылечить их, вероятно, будут подкреплять, когда состояние улучшится. Необязательно, чтобы данная мера была актуально связана с лечением. Ритуалы, используемые в ненаучной, народной медицине, вероятно, можно объяснить с точки зрения этой-характеристики многих форм заболеваний.
一些产生“迷信”行为的情况并不是完全随机的。有时,一种反应之后会产生一种结果,但这种结果并不会“产生”它,最好用一类刺激在消除后会增强的例子来说明这一点。此类短期刺激的停止可能会强化其开始时产生的行为。当不愉快的刺激出现时,身体进入活动状态;刺激停止了其作用,这强化了行为的某一部分。某些疾病、跛行、过敏等,当病情好转时,任何治疗这些疾病的措施都可能会得到加强。该措施不一定与治疗直接相关。非科学的本土医学中使用的仪式或许可以用许多疾病的这一特征来解释。
В «суеверном» оперантном поведении, как и в условных «суеверных» рефлексах, процесс обусловливания терпит неудачу. Обусловливание дает организму большие преимущества, вооружая его средствами поведения, которое позволяет ему действовать в новых условиях, однако не существует способов предотвращения усвоения неэффективных приемов случайного поведения. Любопытно, что эта трудность, вероятно, возрастала по мере развития обусловливания в процессе эволюции. Если, например, для изменения вероятности реакции всегда требовалось три подкрепления, «суеверное» поведение было бы невероятным. Только потому что организм достиг такого уровня, на котором уже один контингент приносит значительные изменения поведения, они могут совпадать.
在“迷信”操作行为中,就像条件反射一样,条件反射过程会失败。条件作用通过为有机体配备使其能够在新条件下发挥作用的行为手段,为有机体带来了巨大的优势,但没有办法阻止学习无效的随机行为技术。有趣的是,随着进化过程中条件反射的发展,这种难度可能会增加。例如,如果总是需要三个强化物来改变反应的概率,那么“迷信”行为就不可能发生。只有当有机体达到一定水平,其中一支队伍已经带来行为上的重大变化时,它们才能一致。
В человеческом обществе «суеверные» ритуалы включают в себя вербальные формулы и передаются как часть культуры. В этом смысле они отличаются от простого эффекта оперантного подкрепления. Но, вероятно, их источником является один и тот же процесс, и их, должно быть, поддерживают случайные, условия, которые имеют такой же паттерн.
在人类社会中,“迷信”仪式涉及言语公式,并作为文化的一部分传承下来。从这个意义上说,它们不同于操作性强化的简单效果。但它们可能起源于同一过程,并且必须得到具有相同模式的偶然条件的支持。
ЦЕЛИ, НАМЕРЕНИЯ И ДРУГИЕ КОНЕЧНЫЕ ПРИЧИНЫ ПОВЕДЕНИЯ
目标、意图和其他行为的最终原因
Неправильно говорить, что оперантное подкрепление «усиливает» реакцию, которая предшествует ему. Реакция уже произошла и не может измениться. Изменению подвергается будущая вероятность реакции одного и того же класса. Именно оперант как класс поведения, а не реакция как определенный случай подвергается обусловливанию. Следовательно, отсутствуют нарушения фундаментальных принципов науки, которые исключают «конечные причины». Но этот принцип нарушается, когда начинают утверждать, что поведение находится под контролем «мотивов», или «целей», которых организм еще не достиг, или «намерений», которых он еще не выполнил утверждения, в которых используются такие слова, как «мотив», или «цель», обычно сводятся к утверждениям об оперантном обусловливании, и необходимо внести лишь небольшое изменение, для того чтобы ввести их в русло естественной науки. Вместо того чтобы говорить, что человек ведет себя соответствующим образом потому, что есть следствия, которые должны следовать за его поведением, мы просто говорим, что он ведет себя так потому, что имеются следствия, которые следовали за похожим поведением в прошлом. Это, конечно, закон эффекта, или оперантное обусловливание.
说操作性强化“强化”了之前的反应是不正确的。反应已经发生,无法改变。同一类别的未来反应概率可能会发生变化。受条件限制的是作为一类行为的操作,而不是作为特定实例的响应。因此,不存在违反排除“最终原因”的科学基本原则的情况。但是,当断言行为是由有机体尚未实现的“动机”或“目标”或尚未实现的“意图”控制时,即使用“动机”或“动机”等词语的陈述时,就违反了这一原则。目标”,通常被简化为关于操作性条件反射的陈述,只需稍作修改即可将它们纳入自然科学的主流。我们不是说一个人以某种方式行事是因为他的行为会产生后果,而是说他这样做是因为过去类似的行为会产生后果。当然,这就是效果法则或操作性条件反射法则。
Иногда утверждают, что данную реакцию нельзя полностью описать до тех пор, пока не будут рассмотрены ее цели как ее «текущее» свойство. Но что имеется в виду под словом «описать»? Если мы пронаблюдаем за человеком, идущим по улице, мы сможем описать это событие на языке физической науки. Если затем мы добавим, что его цель состояла в том, чтобы опустить письмо, дополнит ли это то, что было выражено в первом высказывании? Вероятно, ответ будет положительным, так как человек может идти по улице «по многим причинам» и в каждом случае физический способ передвижения останется одним и тем же. Однако различительную грань необходимо проводить не по линии поведения, а по линии переменных величин, от которых поведение зависит функционально. Цель является свойством не самого поведения, а является способом обращения к контролирующим переменным. Если мы составляем наше описание после того, как мы увидели, что человек опустил свое письмо в почтовый ящик и повернул обратно, мы приписываем ему цель события, которое заставило его идти по улице. Это событие придает «смысл» его выполнению не посредством расширения описания как такового, а посредством указания на независимую переменную, функцией которого оно могло бы быть. Мы не можем увидеть его цель, не увидев, что он опустил письмо, если только прежде мы не наблюдали подобного поведения и подобных следствий. В тех случаях, когда мы это делаем, мы пользуемся данным термином просто для предсказания того, что в данной ситуации им будет опущено письмо.
有时有人认为,除非将其目标视为其“当前”属性,否则无法完全描述给定的反应。但“描述”是什么意思呢?如果我们观察一个人走在街上,我们可以用物理科学的语言来描述这一事件。如果我们接着补充说他的目的是省略这封信,这是否会增加第一个陈述中表达的内容?答案可能是肯定的,因为一个人可以出于“多种原因”走在街上,并且在每种情况下,物理运动模式都将保持不变。然而,区分线必须不是沿着行为线绘制,而是沿着行为在功能上依赖的变量线绘制。目标不是行为本身的属性,而是解决控制变量的一种方法。如果我们在看到一个人将信放入邮箱并将其退回后进行描述,我们就会将促使他走在街上的事件的目的归因于他。该事件赋予其性能“意义”,不是通过扩展描述本身,而是通过指向它可能是其函数的自变量。如果不看到他丢下这封信,我们就无法了解他的目的,除非我们之前观察到类似的行为和类似的后果。当我们这样做时,我们使用该术语只是为了预测在给定情况下该字母将被省略。
Также и наш испытуемый не может видеть - свою цель, не соотнесясь с похожими событиями. Если мы спросим его, почему он идет по улице или какова его цель, и он ответит: «я иду, чтобы опустить письмо», то мы не узнаем ничего нового о его поведении, кроме нескольких возможных причин. Конечно, сам испытуемый может находиться в преимущественном положении, описывая эти переменные, поскольку он находится в постоянном контакте со своим поведением на протяжении многих лет. Следовательно, его утверждение относится к тому же классу, что и утверждения других людей, которые несколько раз наблюдали за его поведением. Он просто делает возможное предсказание с точки зрения своего опыта с самим с собой. Более того, он может ошибаться. Он может сообщить о том, что собирается отправить письмо, и, действительно, он может нести в руке неотправленное письмо и опустить его в конце улицы, но мы все-таки можем показать, что его поведение определяется тем фактом, что в прошлом он находился в таких ситуациях, когда он имел дело с человеком, значимость которого для него связана с такой прогулкой. Он может не осознавать эту цель в том смысле, что он не способен сказать, что его поведение определяется именно этой причиной. Тот факт, что оперантное поведение «направлено на будущее», вводит в заблуждение. Например, рассмотрим случай, когда «что-либо ищется». В каком смысле это «что-либо», которое еще не было найдено, релевантно поведению? Предположим, что мы научаем голубя клевать пятно на стенке ящика и после формирования операнта устраняем пятно. Птица подойдет к привычному для нее месту около стены. Она поднимет голову, направит взгляд в привычном направлении и даже возможно, что она произведет слабое клевательное движение. До тех пор пока процесс угашения не продвинется очень далеко, она будет возвращаться на то же самое место и демонстрировать те же поведенческие реакции. Можно ли говорить, что голубь ищет пятно? Должны ли мы при объяснении поведения принимать во внимание поиск пятна?
同样,如果不将其与类似事件联系起来,我们的主题就无法看到他的目标。如果我们问他为什么走在街上或者他的目的是什么,他回答:“我要寄一封信”,那么除了一些可能的原因之外,我们不会了解到他的行为的任何新信息。当然,受试者本人在描述这些变量时可能处于有利地位,因为他多年来一直在不断接触自己的行为。因此,他的陈述与多次观察过他的行为的其他人的陈述属于同一类。他只是根据自己的经历做出了一个可能的预测。而且,他可能是错的。他可能会宣布他要寄一封信,事实上,他可能手里拿着一封未寄出的信,然后把它扔在街道的尽头,但我们仍然可以证明,他的行为是由以下事实决定的:过去,当他与一个对他来说意义与这样的散步有关的人打交道时,他发现自己处于这样的境地。他可能没有意识到这个目标,因为他不能说他的行为是由这个原因决定的。操作行为“面向未来”这一事实具有误导性。例如,考虑“搜索某些内容”的情况。这个尚未被发现的“东西”在什么意义上与行为相关?假设我们教一只鸽子啄盒子壁上的一个点,在操作形成后,我们将这个点移走。这只鸟会靠近墙壁附近的通常位置。 她会抬起头,将目光投向平常的方向,甚至可能会做出轻微的啄食动作。直到灭绝过程进行得很远,她才会回到同一个地方并表现出相同的行为反应。我们能说鸽子在寻找落脚点吗?在解释行为时我们是否应该考虑寻找地点?
Интерпретация этого поведения с позиций оперантного обусловливания не представляет большого труда. Поскольку визуальная стимуляция, исходящая от пятна, обычно предшествовала приему пищи, пятно стало условным подкреплением. Оно усиливает поведение поиска в данном направлении с различных положений. Хотя мы пытались обусловливать только реакцию клевания, в действительности мы усиливали много различных видов «предшествующего» поведения, которые заставляли птицу принять положение, из которого она ищет пятно и клюет его. Эти реакции продолжают появляться даже тогда, когда мы убираем пятно вплоть до наступления затухания. Пятно, которое ищется, является таким пятном, которое в прошлом было неотсроченным подкреплением поискового поведения. В общем, поиск чего-либо включает в себя порождение реакций, которые в прошлом произвели «нечто» как следствие.
从操作性条件反射的角度解释这种行为并不困难。由于这些斑点的视觉刺激通常发生在进食之前,因此该斑点成为了条件强化物。它从不同的位置强化了在给定方向上的主张行为。虽然我们试图只调节啄食反应,但我们实际上是在强化许多不同的“先前”行为,这些行为会导致鸟儿采取一个位置,从中寻找一个点并啄食它。即使我们去除污渍,这些反应也会继续出现,直到褪色。所寻找的地点在过去是搜索行为的非延迟强化物。一般来说,寻找某物涉及产生反应,而这些反应在过去会产生“某物”。
Аналогичная интерпретация применима к поведению человека. Когда мы видим, что человек передвигается по комнате, открывает ящик письменного стола, смотрит на что-то, находящееся под журналами и т. д., можно совершенно объективно описать его поведение: «сейчас он находится в определенной части комнаты; большим и указательным пальцами правой руки он держит книгу; он поднимает книгу и наклоняет свою голову, так, чтобы можно было видеть любой объект, находящийся под книгой». Можно также проинтерпретировать его поведение или «придать ему смысл»: он ищет что-то, или, если быть более, конкретным, он ищет очки. То, что мы добавляем, является не дальнейшим описанием его поведения, а суждением о некоторых переменных, определяющих его. Здесь нет ни текущей цели, ни мотива, ни намерения, которые должны быть приняты во внимание. То же самое будет иметь место, даже если мы спросим его о том, что он делает, и он ответит: «я ищу свои очки». Это не дальнейшее описание его поведения, а это описание переменных, функцией которых является его поведение оно эквивалентно высказываниям: «я потерял очки», «я прекращу делать то, что я делаю, когда найду мои очки», или «когда я это делал в прошлом, я находил мои очки?» эти выражения могут показаться не вполне конкретными, однако это происходит потому, что высказывания, включающие цели и намерения, являются аббревиатурами.
类似的解释也适用于人类行为。当我们看到一个人在房间里走来走去、打开书桌抽屉、看杂志下面的东西等等时,我们可以完全客观地描述他的行为:“现在他在房间的某个部分;现在他在房间的某个部分;现在他在房间的某个地方;”他用右手的拇指和食指拿着一本书;他拿起书并倾斜头部,这样他就可以看到书下面的任何物体。”你也可以解释他的行为或“赋予其意义”:他正在寻找某种东西,或者更具体地说,他正在寻找眼镜。我们添加的并不是对其行为的进一步描述,而是对决定它的一些变量的判断。目前没有目标、没有动机、没有意图被考虑。即使我们问他在做什么,他回答:“我在找我的眼镜”,情况也是如此。这不是对他的行为的进一步描述,而是对他的行为作为函数的变量的描述,相当于这样的陈述:“我失去了我的眼镜”,“当我发现时,我将停止做我正在做的事情;”我的眼镜”或者“当我过去这样做时,我找到我的眼镜了吗?”这些表达可能看起来不是很具体,但这是因为包含目标和意图的陈述都是缩写词。
Очень часто приписывание цели поведению используется как еще один способ описания биологической адаптации. Это положение уже обсуждалось, однако можно добавить следующее. Как в оперантном обусловливании, так и в эволюционном отборе поведенческих характеристик следствия изменяют будущую вероятность. Рефлексы и другие врожденные паттерны поведения развиваются, потому что они увеличивают вероятность выживания вида. Операнты укрепляются, потому что за ними следуют важные, следствия в жизни индивидов. По той же самой причине оба процесса порождают вопрос о цели, и в обоих случаях обращение к конечной причине, может быть аналогичным образом отвергнуто. Паук не владеет тщательно отработанным репертуаром поведения, с помощью которого он плетет паутину, потому что она дает ему возможность ловить пищу, благодаря которой он выживает. Он владеет схожим поведением, потому что в прошлом такое же поведение пауков давало им возможность ловить пищу, которая необходима для выживания. В эволюции поведению «плетения-паутины» соответствовала серия событий. Мы не правы, когда говорим, что видим «цель» плести паутину, наблюдая похожие события в жизни индивида.
很多时候,将目标归因于行为被用作描述生物适应的另一种方式。这一点已经讨论过,但可以补充以下内容。在操作性条件反射和行为特征的进化选择中,后果会改变未来的概率。反射和其他先天行为模式的进化是因为它们增加了物种生存的可能性。操作被强化是因为它们对个人的生活产生了重要的影响。出于同样的原因,这两个程序都提出了目的问题,并且在这两种情况下,对最终原因的上诉同样可能被驳回。蜘蛛没有经过精心训练的结网行为,因为它赋予了它捕捉赖以生存的食物的能力。他有类似的行为,因为在过去,蜘蛛的同样行为让它们有机会捕捉食物,这是生存所必需的。在进化过程中, “织网”行为对应着一系列事件。当我们说我们通过观察个人生活中的类似事件来看到编织网络的“目的”时,我们错了。