Инструментальное научение — психология

Инструментальное научение

Инструментальное научениеИнструментальное научение - психология

В то время как исследование классических условных рефлексов было начато в России, принципы инструментальных условных рефлексов были открыты и разработаны в США. Впрочем, первый шaг в этом направлении, по-видимому, был сделан в трудах Моргана (Morgan, 1852-1936).

Морган относился критически ко многим современным ему исследованиям по психологии животных из-за их слабой методологии и неубедительных толкований.

В книге «Introduction to Comparative Psychology» («Введение в сравнительную психологию») (1894) он провозгласил свое знаменитое правило: «Ни в коем случае нельзя считать какое-либо действие результатом упражнения более высокой психической способности, если его можно объяснить на основе способности, стоящей ниже по психологической шкале». Позднее (1900) он пояснил: «Можно добавить, — чтобы пределы применения этого принципа не были поняты неверно, — что такое правило никак не исключает взгляда на определенное действие как на результат высших мыслительных процессов, если мы уже располагаем независимым доказательством их присутствия в действующем агенте».

Морган оказал значительное влияние на развитие бихевиоризма, в особенности на Уотсона и Торндайка (Thorndike). В 1896 г. он проводил Лоуэлловские чтения в Гарвардском университете, чем побудил Торндайка начать изучение рассудочной деятельности животных.

Однажды Морган рассказал Торндайку, как его собака Тоби научилась открывать задвижку на садовой калитке, просовывая голову между рейками штакетника, и тот начал свои исследования вскоре после посещения Моргана, разработав способы повторения этого наблюдения в контролируемых лабораторных условиях.

Торндайк стал очень заметной фигурой в американской психологии, и полстолетия его теории господствовали как в психологии животных, так и в психологии воспитания.

Один видный его современник писал: «Психология научения животных, не говоря уже о научении ребенка, — была и все еще остается прежде всего вопросом согласия или несогласия с Торндайком или попытками слегка усовершенствовать его представления.

Все мы, американские гештальт-психологи, по-видимому, открыто или скрыто отталкиваемся от концепций Торндайка». (Tolman, 1938.)

Торндайк провел ряд опытов, в которых кошки должны были нажимать на задвижку или тянуть за пружину, чтобы, открыв дверцу, выйти из ящика и получить снаружи пищу. Ящики были сделаны с вертикальными щелями так, что пища была заметна (рис. 17.7).

Голодная кошка, впервые посаженная в ящик, производит множество действий, в том числе тянется к пище через щели и скребет предметы, находящиеся внутри ящика. Наконец она случайно ударяет по запирающему механизму и выскакивает наружу.

При последующих пробах действия кошки постепенно концентрируются вблизи этого механизма, и прочая активность со временем прекращается. Нако-

Рис. 17.7. Кошка в одном из торндайковских проблемных ящиков.

нец кошка становится способной правильно вести себя, как только ее поместят в ящик.

Торндайк (1898) назвал научение такого типа «методом проб, ошибок и случайного успеха».

Теперь оно называется инструментальным научением, поскольку правильная реакция, ведущая к вознаграждению, требует использования «инструментов».

Цирковые дрессировщики знали о научении такого типа в течение столетий, но Торндайк первый исследовал его систематически и создал на основе своих наблюдений стройную теорию.

Для объяснения изменений, происходящих в поведении животного в этих опытах, Торндайк (1913) предложил свой «закон эффекта». Он гласит, что для реакции, за которой следует вознаграждение или состояние удовлетворения, вероятность повторения возрастает, а для реакции, вызывающей вредное или неприятное последствие, вероятность повторения снижается.

Таким образом, успех инструментального научения приписывается тому факту, что выработанное поведение может быть непосредственно изменено его последствиями. Торндайк (1911) считал, что подкрепление повышает вероятность реакции, с которой оно сочетается, потому что усиливает установленную связь между ней и присутствующей стимульной ситуацией.

Этот взгляд стал известен как «теория научения по принципу стимул-реакция», и варианты этой теории господствовали в течение многих лет. Признавая значение закона эффекта как эмпирического факта, современные психологи в то же время сомневаются в том, что поведение непосредственно модифицируется своими последствиями, как предполагали Торндайк и его школа.

Чтобы понять это, сначала надо рассмотреть природу подкрепления.

Подкрепление

Между способом проведения опыта по выработке классического условного рефлекса и постановкой эксперимента по инструментальному научению существует коренное различие. В первом случае связь устанавливается между УС (например, звонком) и БС (например, пищей). Подкрепление предъявляется независимо от поведения животного.

При инструментальном научении подкрепление (например, пища) связано с определенным поведением животного (например, с нажимом на рычаг). Таким образом, при классических условных рефлексах связь устанавливается между стимулом и результатом, а при инструментальном научении она возникает между реакцией и результатом.

Такие различия необязательно означают, что в этих двух типах опытов происходят разные виды научения, но они говорят о разных процессах подкрепления.

Как мы видели, согласно взгляду Павлова, наличие подкрепляющего стимула в определенных условиях приведет к тому, что реакции, вызываемые им, будут возникать еще до подкрепления. Ясно, однако, что не всегда подкрепление необходимо для проявления выработанных связей между стимулами.

Это яснее всего видно при рассмотрении феномена, называемого сенсорным предобусловливанием. При нем два условных стимула (УC1 и УС2) применяются вместе много раз до того, как в опыт вводится БС. За совместным предъявлением УC1 и УС2 следует сочетание УC1 с БС.

В заключительной части опыта измеряется сила УР в ответ на УС2.

Первая четкая демонстрация сенсорного предобусловливания принадлежит Брогдену (Brogden, 1939), который предъявлял собакам 200 одновременных сочетаний света и зуммера. Затем один из этих стимулов сочетался с электрическим ударом лапы для выработки ее условнорефлекторного сгибания.

Применения второго УС вызывали в среднем 9,4 УР по сравнению со всего лишь 0,5 УР в контрольных опытах без предварительного сочетания зуммера и света.

Более поздние опыты показывают, что лучшие результаты получаются при меньшем числе предварительных сочетаний и когда два УС предъявляются не одновременно, а с промежутком в несколько секунд (Mackintosh, 1974).

Результаты опытов с сенсорным предобусловливанием ясно показывают, что

сочетания двух нейтральных стимулов достаточно, чтобы установить некоторую связь между ними. По-видимому, при слишком частом применении этих стимулов наступает известное привыкание, и научение не улучшается.

Совершенно независимо от того, что эти результаты нельзя удовлетворительно объяснить теорией стимул-реакция, ясно, что для образования связи между двумя нейтральными стимулами нет необходимости в подкреплении.

Поэтому павловское подкрепление не является обязательным условием образования связей, но оно облегчает их образование и делает их устойчивыми к привыканию.

Как мы увидим дальше, животные вполне способны научиться тому, что некоторые стимулы несущественны для их текущих мотивационных потребностей, и поэтому неудивительно, что связи, образованные между двумя нейтральными стимулами, должны быть временными.

Обратимся теперь к вопросу об инсmpументальном подкреплении. Закон эффекта Торндайка лег в основу бихевиористского подхода к научению животных. Крайнюю позицию занял Гарвардский бихевиорист Скиннер (Skinner), который определил подкрепление, исходя из закона эффекта. По Скиннеру.

подкреплением является любое событие, которое, сочетаясь с каким-нибудь видом поведения, будет делать ею более частым. Скиннер (1938) считал также, что любое подкрепление может усилить любую реакцию в присутствии любого стимула при условии, что этот стимул ощущается животным, а реакция лежит в пределах его возможностей.

Таким образом, предполагалось, что реакция и подкрепление по существу произвольны. Это стало широко распространенной точкой зрения среди теоретиков научения до конца 50-х годов.

Подкрепление, побуждающее животное приближаться к стимулам, которые оно связывает с этим подкреплением, обычно называется «положительным». Если же подкрепление заставляет животное в дальнейшем избегать данной ситуации, оно считается «отрицательным».

Животные могут научиться бояться некоторых ситуаций, испытав в них боль или стресс. В дальнейшем они могут избегать таких ситуаций при столкновении с ними.

Сходным образом ситуации, в которых на животное действуют естественные вызывающие страх стимулы, могут по ассоциации вызывать страх, даже когда животное не испытывает боли.

Но многократное применение таких стимулов может привести к привыканию, и животное перестанет их избегать.

Как мы видели, неприятные стимулы применимы в опытах по классическим условным рефлексам. Одно из первых таких исследований принадлежит В.М.

Бехтереву (1913), который раздражал переднюю лапу собаки слабым электрическим током (БС) вслед за звуковым стимулом — тоном (УС).

Сначала собака сгибала лапу в ответ на ток (БР), а после ряда сочетаний УС и БС — в ответ на тон (УР) в отсутствие тока. Классическая оборонительная условная реакция многие годы оставалась парадигмой научения избеганию.

По Торндайку (Thorndike, 1913) наказание вызывает такую же силу реакции, что и вознаграждение. Согласно положительному закону эффекта, если за реакциями следует состояние удовлетворения, вероятность их возникновения возрастает.

Отрицательный закон предполагает, что вероятность возникновения реакций, приводящих к неприятным последствиям, снижается. Однако в конечном счете Торндайк (1932) на основании некоторых опытов пришел к заключению, что закон эффекта неприменим к наказанию.

В этом отношении с ним соглашались Скиннер (Scinner, 1938, 1953) и Эстес (Estes, 1944). Общее мнение, по-видимому, сводилось к тому, что наказание не ослабляет связи стимул-реакция, хотя иногда оно временно подавляет наказуемое поведение.

Более поздние данные говорят о том, что наказание может быть эффективным с точки зрения модификации поведения, когда его сочетают с определенной реакцией (Church, 1963, 1969).

Дата добавления: 2016-06-18; просмотров: 863;

Источник: http://poznayka.org/s18613t1.html

Инструментальное научение

Инструментальное научениеИнструментальное научение - психология

Инструментальное научение, operant conditioning, метод проб и ошибок — простейшая форма оперантного обусловливания.

В оперантном поведении подкрепляется спонтанное поведение, а спонтанность бывает как творческая, так и случайная.

В инструментальном научении подкрепляется именно случайное поведение, не ища в нем какого-либо творческого разума и поиска. Достаточно, что это поведение нужное нам или находящееся на пути к нужному нам.

Кошка сидит в ящике, что делать не знает, дергается туда или сюда. Когда (чаще всего случайно) она тянула за шнур, ее награждали. Рано или поздно она научалась тянуть за шнур…

Читайте также:  Разум и рассудок - психология

Подкрепление производится в простейшей форме, методом наград и наказаний, и научение происходит за счет примитивных форм нервной деятельности, без включения разума.

Другой вариант оперантного обусловливания, его высшая форма — творческое научение, где подкрепляется в первую очередь включение разума, поисковой творческой активности в нужном направлении, для чего используются сложные и творческие методы подкрепления, существенно отличающиеся от простого метода наград и наказаний. См.→

Торндайк

Впервые инструментальное научение как метод проб и ошибок был систематически изучен американским ученым Э.Торндайком (1874-1949), одним из основателей психологии образования. Торндайк помещал кошку в ящик, из которого она могла выйти, только потянув за шнур, свешивавшийся с крышки.

После ряда случайных движений кошка рано или поздно тянула за шнур, обычно совершенно случайно. Однако, когда ее снова помещали в ящик, она уже тратила меньше времени на то, чтобы снова потянуть за шнур, и при повторении ситуации освобождалась из ящика мгновенно.

Научение измерялось в секундах, которые требовались кошке для того, чтобы совершить правильное действие.

Скиннер

Другой пример инструментального обучения — метод, предложенный американским психологом Б.Скиннером (1904-1990). «Ящик Скиннера» представляет собой тесную клетку с рычагом в одной из стенок; цель эксперимента — научить животное, обычно крысу или голубя, нажимать на этот рычаг.

Животное до начала обучения лишают пищи, а рычаг соединяют с механизмом подачи еды в клетку. Хотя сначала животное не обращает внимания на рычаг, рано или поздно оно нажимает на него и получает пищу.

Со временем интервал между нажатиями на рычаг уменьшается: животное научается использовать зависимость между желательной реакцией и кормлением.

Метод подследовательных приближений

Иногда научение определенному поведению оказывается таким долгим или сложным, что животное никогда не смогло бы прийти к нему случайно. Тогда применяется метод «последовательных приближений».

Не ожидая выполнения всей требуемой последовательности действий, дрессировщик выдает поощрение за что-то похожее на желательный поведенческий акт. Например, если собаку нужно научить перекатываться, ей сначала дают лакомство просто за то, что она ложится по команде.

После того, как первая часть освоена, собака получает поощрение лишь при случайном выполнении нужного движения: например, после того, как ляжет, она перекатится на бок. Шаг за шагом дрессировщик добивается все более близкого соответствия желаемому поведению, по принципу детской игры «холодно — теплее — горячо».

В целом, инструментальное научение очень похоже на эту игру, но роль спрятанного предмета выполняет определенный вид поведения, а роль слова «горячо» — поощрение.

Последовательные приближения к желаемому поведению применяются и при лечении тяжелых форм шизофрении, когда единственная цель — побудить пациента двигаться и разговаривать вместо того, чтобы уйти в себя и хранить молчание.

Как всегда при инструментальном научении, для успешности метода необходимо найти что-то, чего пациент хочет (например, сладости, жевательную резинку или интересные фотографии).

После того как обнаружена хоть какая-то реакция, следует определить, какие аспекты поведения наиболее желательны, и сделать их условием получения вознаграждения.

Инструментальное научение и наказание

Наказание в инструментальном научении используется реже. Наказание, в принципе, тоже формирует зависимость между нежелательным поведением и неприятным воздействием, тоже учит, но:

  • наказание учит менее понятно: показывает «что не надо», но оставляет без подкрепления, не показывает «что и как надо»,
  • наказание уменьшает контакт между тем кто учит и обучаемым. И животные, и люди из такой ситуации стараются побыстрее убежать.

Источник: https://knigarazuma.ru/article/instrumentalnoe_nauchenie

Интегративная психотерапия

Интегративная психотерапия

Современная поведенческая психотерапия не ограничивается приложением принципов и процедур классического и оперантного обусловливания к лечению клинических проблем. Различные подходы в поведенческой терапии отличаются степенью использования когнитивных концепций и процедур.

На одном конце континуума процедур поведенческой терапии находится функциональный анализ поведения, который сосредоточивается исключительно на наблюдаемом поведении и отвергает все промежуточные когнитивные процессы; на другом конце – теория социального научения и когнитивная модификация поведения, которые опираются на когнитивные теории.

Поведенческая терапия (называемая также «модификация поведения») – это лечение, которое использует принципы научения для изменения поведения и мышления.

Рассмотрим различные виды научения в их значении для терапии.

Виды научения

Классическое обусловливание

Основы классического обусловливания были созданы в начале XX века И. П. Павловым. В опытах Павлова условный стимул (звонок) сочетается с безусловным стимулом (кормление собаки), между ними устанавливается связь таким образом, что прежде нейтральный условный стимул (звонок) теперь вызывает условную реакцию (выделение слюны).

Прекрасным примером классического обусловливания является эксперимент Джона Б. Уотсона (J. B. Watson). В 1918 г. Уотсон начал лабораторные эксперименты с детьми, показывая, что опыт научения в детстве имеет длительный эффект.

В одном опыте он сначала показал, что девятимесячный мальчик Альберт не боялся белой крысы, кролика и других белых объектов. Затем Уотсон ударял по стальному бруску рядом с головой Альберта каждый раз, когда появлялась белая крыса.

После нескольких ударов Альберт при виде крысы начал вздрагивать, плакать и пытаться отползти. Подобным же образом он реагировал, когда Уотсон показывал ему другие белые объекты.

В этом опыте он использовал классическое обусловливание: сочетая громкий звук (безусловный стимул) с предъявлением крысы (условный стимул), он вызывал новую реакцию – условную реакцию страха – на прежде нейтральное животное.

Этот опыт также демонстрирует феномен, открытый Павловым и называемый «генерализацией стимулов». Суть его состоит в том, что если развилась условная реакция, то ее будут вызывать также стимулы, похожие на условный.

Уотсон продемонстрировал: ребенка можно приучить бояться того, что прежде представлялось безобидным, и этот страх будет распространяться на похожие объекты. Маленький Альберт стал испытывать страх ко всем меховым игрушкам.

Из своих опытов Уотсон сделал вывод, что дети научаются всему, в том числе фобиям.

Другое понятие, пришедшее из лаборатории Павлова и имеющее отношение к поведенческой терапии, – это различение стимулов (или стимульная дискриминация). Благодаря этому процессу люди научаются различать похожие стимулы.

Плач ребенка становится условным стимулом для матери: ее условная реакция может выражаться в том, что она просыпается от глубокого сна при малейшем волнении ребенка, но та же мать может глубоко спать, когда плачет чужой ребенок.

И еще один феномен, открытый Павловым и используемый в поведенческих процедурах. Условный стимул продолжает вызывать условную реакцию только в том случае, если хотя бы периодически появляется безусловный стимул.

Если же условный стимул не подкрепляется безусловным, то сила условной реакции начинает уменьшаться.

Постепенное исчезновение условной реакции в результате устранения связи между условным и безусловным стимулами называется «угасание».

Инструментальное, или оперантное, обусловливание

Не все виды научения можно объяснить классическим обусловливанием. При классическом обусловливании условный и безусловный стимулы предшествуют условной реакции. Но условные связи могут также возникать между реакциями и стимулами, которые следуют за ними, другими словами, между поведением и его последствиями.

Например, собака научается «служить», чтобы получить угощение; ребенок научается говорить «пожалуйста», чтобы получить конфетку. Эти реакции являются инструментами для получения какой-то награды.

Инструментальное обусловливание – это процедура научения, при которой реакции приводят к награждению или желаемому эффекту.

Принципы инструментального научения открыл американский психолог Эдвард Торндайк (Edward Thorndike) примерно в то время, когда Павлов проводил эксперименты в России.

Животное – обычно голодная кошка, помещалась в специальную клетку, названную «загадкой», и должна была научиться какой-то реакции; например, наступить на маленький рычаг для того, чтобы открыть дверь и выйти наружу.

Когда кошке это удавалось, она награждалась пищей и вновь возвращалась в ящик. После нескольких проб кошка спокойно подходила к рычагу, нажимала на него лапой, выходила через открытую дверь и ела.

Формирование реакции происходило путем проб и ошибок, как результат выбора нужного эталона поведения и последующего его закрепления.

Научение, согласно Торндайку, управляется законом эффекта: поведение контролируется его результатами и последствиями; поведение, которое приводит к достижению положительного результата, удовлетворению, закрепляется, и наоборот – не приводящее к положительному результату стирается или ослабляется.

Спустя несколько десятилетий после опубликования работ Торндайка другой американский психолог, Б. Скиннер (B. Skinner), развил идеи своего предшественника. Скиннер подчеркивал, что при инструментальном обусловливании животное оперирует со средой, производит какое-нибудь движение, воздействует на среду. Поэтому процесс научения этим реакциям он назвал оперантным обусловливанием.

Для изучения оперантного обусловливания Б. Скиннер изобрел экспериментальную камеру, получившую название скиннеровского ящика. Камера звуко– и светонепроницаема, в ней поддерживается постоянная температура, и она полностью контролируется.

Камера снабжена приспособлением, которым животное может оперировать для получения вознаграждения. Например, крыса, нажимая на рычаг, получает пищу из тонкой трубочки.

Скиннеровский ящик позволил изучать отношения между реакцией и ее последствиями и анализировать, как эти последствия влияют на поведение.

Оперантное обусловливание подчеркивает, что поведение есть функция его последствий. Поведение усиливается позитивным или негативным подкреплением; оно ослабляется наказанием.

Позитивное подкрепление – это предъявление стимулов, которые усиливают реакцию. Иными словами, это награждение. Примером может служить учитель, который хвалит ребенка за прилежную учебу.

Негативное подкрепление – процесс усиления поведения путем изъятия, удаления негативных стимулов, таких как боль, скука, избыток тепла или холода и т. п. Примером может служить прием таблетки анальгина при головной боли. Другой пример: пациент, испытывающий страх в метро, может избежать этого переживания, оставшись дома.

Наказание. И позитивное и негативное подкрепления усиливают частоту реакции. Наказание уменьшает частоту реакции. Часто путают наказание и негативное подкрепление, но они совершенно различны. Подкрепление усиливает поведение, а наказание ослабляет его.

Если ток выключается, когда крыса нажимает на рычаг, – это негативное подкрепление; оно увеличивает вероятность того, что крыса нажмет на педаль, когда ток снова включат.

Но если ток включается, когда крыса нажимает на рычаг, то это наказание; менее вероятно, что крыса снова нажмет на рычаг.

Дискриминационное научение имеет место тогда, когда реакция награждается (или наказывается) в одной ситуации, но не награждается (не наказывается) – в другой. В таком случае говорят, что реакция (поведение) находится под контролем стимула.

Читайте также:  Психологическая грамотность и эффективность - психология

Этот процесс особенно важен в объяснении гибкости поведения в различных социальных ситуациях. Дискриминация (различение) стимулов позволяет научиться тому, что является подходящим (подкрепляемым) и неподходящим (неподкрепляемым) в данной ситуации.

Например, ворчливая жена вряд ли будет бранить мужа в присутствии гостей.

Генерализация состоит в том, что поведение обнаруживается в иных ситуациях, а не только тех, в которых оно было приобретено. Например, терапевт может помочь пациенту стать более уверенным и экспрессивным во время терапии. Но цель терапии в том, чтобы пациент стал более уверенным в реальных жизненных ситуациях, другими словами, очень важно, чтобы произошла генерализация.

При сравнении классических и оперантных условных рефлексов видно, что, во-первых, классическое обусловливание требует повторного парного предъявления нейтрального стимула (звонок) и стимула, вызывающего врожденную, безусловную реакцию (пища).

Обеспечение такого предъявления достигается участием экспериментатора. В экспериментах же с оперантным обусловливанием животное само осуществляет перебор стереотипов поведения и выбор стереотипа, приводящего к достижению результата, протекает активнее.

Во-вторых, оперантные рефлексы контролируются их результатом; в экспериментах же с классическим обусловливанием появление условной реакции контролируется предъявлением предшествующего стимула.

В реальной жизни большая часть обучения осуществляется по законам формирования оперантных условных рефлексов.

Социальное научение

Как правило, научение у людей имеет место тогда, когда они находятся с другими людьми. И в большинстве случаев научение следует принципам инструментального и классического обусловливания.

Согласно традиционным взглядам на обусловливание, для того чтобы произошло научение, организм должен иметь непосредственный, личный опыт с сочетаниями стимулов или с последствиями реакций (поведения).

Теоретики же социального научения утверждают, что люди также учатся на опыте других, посредством процессов, известных как викарное обусловливание и викарное научение (или моделирование).

Викарное обусловливание может быть классическим и инструментальным. Посредством викарного классического обусловливания, например, на основе поведения какого-либо человека у нас может возникнуть и закрепиться эмоциональная реакция на определенный стимул.

Скажем, ваш друг восхищается каким-то писателем; его эмоция может действовать как безусловный стимул, который вызывает подобную же реакцию у вас (безусловную реакцию).

Поскольку имя писателя сочетается с безусловным стимулом, то оно может стать для вас условным стимулом; и, хотя вы сами не читали книг этого писателя, его имя вызывает у вас положительную эмоциональную реакцию (условную реакцию).

Викарное инструментальное обусловливание демонстрируют опыты Альберта Бандура (Albert Bandura). Маленьким детям был показан короткий фильм с участием мужчины и большой надувной куклы. Мужчина бил куклу кулаком по лицу, молотком по голове, пинал ее, бросал в нее различные предметы.

Но финалы в этом фильме были различными.

Одни дети смотрели фильм с окончанием, в котором агрессивного героя другой мужчина назвал «чемпионом» и угощал сладостями и напитками; другие дети смотрели, как героя фильма ругали и называли «плохим человеком», и, наконец, третьи дети смотрели фильм, в котором не было ни награждения, ни наказания героя.

После фильма каждому ребенку было позволено одному поиграть с куклой. Было обнаружено, что имитация агрессивной модели поведения была наибольшей у детей, которые наблюдали награждение. Таким образом, подкрепление, которое дети видели в фильме, но непосредственно не переживали, влияло на их поведение.

Психология bookap

Опыты с куклой показали, что научение может осуществляться не только посредством прямого обусловливания, но также и посредством викарного (замещающего) обусловливания. Викарное научение – это способность обучаться новому поведению, наблюдая поведение других.

Бандура также показал, что дети научаются и имитируют поведение взрослых, даже если оно не сопровождается награждением. В одном эксперименте детям показывали фильмы, в которых мужчина или сидел спокойно рядом с куклой, или с неистовством набрасывался на нее.

Потом детей оставляли одних в комнате с куклой. Те дети, которые наблюдали агрессивное поведение, были более агрессивны. Мало того, они в точности повторяли те формы агрессивного поведения, которые видели, то есть научение возможно без подкрепления.

(Следовательно, закон эффекта Торндайка не является универсальным.)

Источник: http://bookap.info/psyanaliz/aleksandrov_integrativnaya_psihoterapiya/gl48.shtm

Научение, его формы и физиологическая сущность. Классификация форм научения

Научение, его формы и физиологическая сущность. Классификация форм научения

Научение – это  выработка в процессе онтогенеза  приспособительных форм поведения. Научение обеспечивает постоянное пополнение и изменение наших знаний, а также приобретение новых навыков и умений. Для научения необходима память, т.к.

она представляет механизм, с помощью которого накапливается прошлый опыт, который может стать источником адаптивного поведения.

Научение требует определённого времени и реализуется с помощью нейрофизиологических механизмов разного уровня: межклеточного, внутриклеточного, молекулярного.

Существует несколько классификаций научения. Все виды научения делят на две группы: неассоциативное и ассоциативное, кроме того, выделяют простое и сложное научение.  По критерию активности животного или человека в ходе научения выделяют 4 группы научения:

I.Пассивное (реактивное) научение  имеет место во всех случаях, когда организм, не прилагая целенаправленных усилий реагирует на какие-то внешние факторы и когда в нервной системе формируются новые следы памяти. Формами пассивного научения являются: привыкание, сенситизация, импринтинг и  классические условные рефлексы.

А) Привыкание (габитуация)  — выражается в ослаблении поведенческой реакции при повторных предъявлениях стимула. Примером поведенческого привыкания является угасание ориентировочного рефлекса в случае многократно повторяющегося раздражителя, не имеющего значения для организма.

Благодаря привыканию  мы можем игнорировать раздражители, не несущие никакой новизны и не имеющие для нас значения, сосредоточивая внимание на более важных явлениях. Привыкание  — это особый приспособительный нервный процесс, его не следует путать с утомлением и адаптацией анализаторов, т.к.

его можно вызвать изменением стимула.

Б) Сенситизация – усиление реакции организма на повторяющийся стимул, если он вызывает каждый раз неприятные ощущения (например,  жужжание мухи, писк комара).

В данном случае научение носит негативный характер.

В основе механизма этого вида научения лежит механизм синаптического облегчения (посттетанической потенциации), которое улучшает проведение в синапсах после короткого раздражения афферентных путей.

В) Импринтинг – запечатление в памяти новорождённого окружающей действительности. Это особая форма научения, основанная на врождённой предрасположенности к определённым сочетаниям раздражителей и возникающих ответных реакциях в ранний период развития организма.

В отличие от ассоциативного или инструментального обучения импринтинг может реализоваться только в определённый период онтогенеза, так называемый сенситивный (чувствительный)  период. Первые данные о наличии чувствительных периодов в раннем онтогенезе, при которых происходит запечатление, были получены Конрадом Лоренцом на выводковых птицах.

Учёный назвал такой тип обучения  импринтингом. Различают несколько форм проявления импринтинга:

  1. 1.        Запечатление образов и объектов: родителей, братьев, сестёр, вида пищи т.д.
  2. 2.        Усвоение поведенческих актов (дети повторяют действия родителей). Это так называемое имитационное поведение, разновидностью этого импринтинга является половой импринтинг – половое поведение особей внутри своего вида.
  3. 3.        Реакция следования –  автоматическое следование новорождённого за родителями. Реакция следования происходит не только  за запечатлённым объектом, но и за близкими ему по форме. При этом запечатляться может любой предмет.

Считают, что двигательным эквивалентом реакции следования животных у ребёнка является улыбка, смена мимики, реакция оживления уже на втором месяце жизни.

Импринтинг имеет сходство как с безусловными, так и условными  рефлексами:

  • также как и безусловные рефлексы эти реакции сохраняются, как правило,  в течение всей жизни.
  • являются врождёнными, однако для их проявления требуются определённые условия. Например, реакция следования является врождённой, но в процессе жизни превращается в приобретённую (если изолировать детёныша от родителей сразу после рождения на определённый промежуток времени, то реакция следования не формируется, т.е. конкретная реакция  по наследству не передаётся, имеется только готовность к её выполнению у новорождённого).

Импринтинг отличается  и от  безусловных, и от условных  рефлексов:

  • он проявляется в определённые критические  (сенситивные) периоды.
  • запечатление происходит очень быстро, иногда с первого раза.

Открытие сенситивных периодов в развитии головного мозга и поведения птиц явилось стимулом для проведения исследований на млекопитающих.

Наблюдение за развитием детей свидетельствует о том, что важную роль в нервно-психическом развитии ребёнка имеет импринтинг, влияющий на будущее поведение, предопределяя  его на долгие годы, По-видимому, в развитии  детей имеются критические периоды, но они сдвинуты на более поздние сроки, чем у животных. В частности, существует мнение, что возраст от 6 недель до  6 месяцев является критическим для формирования отношений ребёнка с матерью.

  1. Классические условные рефлексы по И.П.Павлову – положительные и отрицательные.

II. Оперантное научение (от лат. оperatio –действие) – это научение, в ходе которого организм добивается полезного результата с помощью активного поведения. Имеется три вида оперантного научения –  метод проб и ошибок, инструментальный условный рефлекс и самораздражение.

А) Метод проб и ошибокАмер. Уч. Э.Торндайк (один из основоположников бихевиоризма, от англ.

behavior – поведение) помещал кошек в проблемные клетки, которые открывались в том случае, если кошка предпринимала какие-либо действия. Когда кошка выходила из клетки, она получала пищу.

По мере повторения этой процедуры (увеличения числа проб и ошибок) скорость выполнения задачи возрастала.

Б) Инструментальный условный рефлекс – научение действию с помощью  вознаграждения (подкрепления).

Этот вид оперантного научения происходит по сигналу в отличие от  научения методом проб и ошибок, который осуществляется без сигнала.

Например, животное по световому сигналу нажимает на рычаг и выключает электрический ток, чтобы избежать раздражения, т.е. использует какой-то инструмент, отсюда и название этого вида научения.

В) Самораздражение структур мозга для получения удовольствия, положительных эмоций.

  Если крысе вживить раздражающий электрод в латеральную область гипоталамуса, поместить её в камеру Скиннера и предоставить ей возможность осуществлять самораздражение, нажимая на рычаг, крыса будет осуществлять самораздражение настолько интенсивно, что возникает опасность её гибели от истощения.

Читайте также:  Секс (подросток) - психология

III. Когнитивное научение (рассудочное)основано на формировании функциональной структуры среды, т.е.

на извлечении законов связей между её отдельными компонентами. К когнитивному научению относится: научение путём наблюдения, рассудочная деятельность, психонервная деятельность.

Некоторые исследователи к этой форме научения относят вероятностное прогнозирование.

А) Научение путём наблюдения, в результате которого выполняются действия путём непосредственного наблюдения за действием других. Различают два вида этого научения: простое подражание и викарное научение.

  1. 1.       Простое подражание. Например, обезьяна в общении с исследователями научилась мыть банан перед едой, не понимая, зачем она это делает.
  2. 2.       Викарное научение. Осуществляется также  с помощью наблюдения, но при этом результат действия оценивается. Такое научение свойственно только человеку. Особенно часто используют научение путём наблюдения дети, причем в раннем детстве оно является преимущественно подражательным. С возрастом начинает преобладать викарное научение.

Б) Рассудочная деятельность. Представление о рассудочной деятельности животных ввёл в научный оборот в 1960 г. Л.В.Крушинский.

Наиболее характерное свойство элементарной рассудочной деятельности животных заключается в их способности улавливать простейшие эмпирические законы, связывающие предметы и явления окружающей среды, и возможность оперировать этими законами при построении программ поведения в новых ситуациях.

Рассудочная деятельность отличается от любых форм обучения тем, что она осуществляется при первой же встрече организма с необычной ситуацией, создавшейся в среде его обитания.         Наблюдения за поведением животных привели Л.В.

Крушинского к заключению о том, что их способность к экстраполяции направления движения раздражителя можно рассматривать как одно из элементарных проявлений рассудочной деятельности. Под экстраполяцией  понималась  способность животных определять направление дальнейшего перемещения значимого для него раздражителя.

Для исследования способности животных к экстраполяции (экстраполяционным рефлексам) в лаборатории Л.В.Крушинского проводился эксперимент, сущность которого  заключалась в следующем: перед животным помещалась ширма с щелью.

За ширмой располагали две кормушки, одна из которых пустая, а другая с пищей. После того, как животное  в течение нескольких секунд подкармливалось через щель, кормушки раздвигались в разные стороны.

Животное должно было определить направление движения кормушки с кормом и, обежав ширму, достичь её.

При исследовании способности к экстраполяции разных представителей животного мира, оказалось, что  первое место среди млекопитающих занимали волки и красные лисицы. У птиц самая высокая способность к экстраполяции наблюдается в семействе врановых птиц. Рептилии, в частности, ящерицы и крокодилы, решали задачу уже при первых её предъявлениях, тогда как рыбы и амфибии с ней не справлялись.

В лаборатории Л.В.Крушинского исследовался также вопрос о соотношении обучаемости и элементарной рассудочной деятельности.

Результаты показали, что доля правильных решений задачи при многократном её  предъявлении  уменьшается у тех видов животных, для которых был характерен высокий показатель при первом предъявлении, и наоборот – постепенное увеличение доли правильных решений у плохо экстраполирующих животных.

Таким образом был установлен парадоксальный результат: у животных с высоким уровнем рассудочной деятельности многократное предъявление экстраполяционной задачи ухудшает её решение.  По мнению Л.В.

Крушинского, это объясняется тем, что правильное решение вызывает резкое возбуждение головного мозга, что приводит при следующих предъявлениях к ухудшению решения задачи.

А у животных с невысоким уровнем рассудочной деятельности нарушений деятельности мозга не происходит, в результате обучению правильному решению задачи проходит успешно. Следовательно, степень развития рассудочной деятельности обусловливает тот исходный фон, с которого начинается формирование поведения при участии индивидуального опыта. Чем выше уровень элементарной рассудочной деятельности, тем пластичнее и адаптивнее поведение.

Таким образом сложное приспособительное поведение животных, с точки зрения Л.В.

Крушинского, строится из трёх основных компонентов ВНД: инстинктов, условных рефлексов и рассудочной деятельности, благодаря которой организм сразу вырабатывает программу адаптивного поведения в новых условиях, внезапно сложившихся ситуациях и способен выбрать наиболее адекватную тактику поведения в новой обстановке, прогнозируя развитие событий.

В) Психонервная деятельность (или образное поведение, или образная память). Психонервная деятельностьисследовалась И.С. Бериташвили в 1926 г.  Суть психонервной деятельности состоит в том, что у высших позвоночных животных при первом же восприятии конкретных явлений окружающей действительности (пищи, врага и т.д.) возникает определённый образ.

Этот образ сохраняется, и, каждый раз, когда он воспроизводится при восприятии данной среды или какого-либо его компонента, животное ведёт себя точно так же, как  и при непосредственном восприятии.  И.С. Бериташвили считал, что нервным субстратом психонервной деятельности является неокортекс.

 В отличие от условнорефлекторной деятельности психонервный образ

  • не требует повторяемости, а формируется сразу;
  • быстро перестаёт вызывать определённое поведение, если не сопровождается удовлетворением биологической потребности;
  • требует обязательного участия коры головного мозга, прежде всего её лобных отделов;
  • психонервная деятельность определяет включение и выключение условных и безусловных рефлексов, а также последовательность их протекания.

Индивидуальное поведение, первично направляемое психонервным образом, при повторной тренировке автоматизируется и осуществляется по всем закономерностям условнорефлекторной деятельности.

Г) Вероятностное прогнозирование, под которым понимается предвосхищение будущего, основанное на вероятностной структуре прошлого опыта и информации о наличной ситуации. Оба эти фактора являются основой для создания гипотез о предстоящем будущем.

В соответствии с таким прогнозом осуществляется подготовка к действиям в предстоящей ситуации, приводящим к наибольшей вероятности достижения цели. Высшие позвоночные и человек в своей деятельности постоянно опираются на вероятностное прогнозирование.

Например, когда человек переходит улицу, он прогнозирует ситуацию на проезжей части и интервал времени для безопасного пересечения дороги.

IV. Научение путём инсайта (озарения)– это внезапное нестандартное правильное решение задачи. Этот вид научения является следствием объединения опыта, накопленного в памяти, с той информацией, которой располагает индивид при решении проблемы.

В заключение необходимо отметить, что в конкретных ситуациях для достижения приспособительного результата индивид чаще всего использует не один, а несколько видов научения.

Источник: http://www.BrainTools.ru/article/9503

Инструментальное научение и подкрепление

Изменение поведения в результате социального научения

Теоретики научения, в том числе покойный Б. Ф. Скиннер, долгое время отстаивали идею о том, что ситуационные стимулы — окружающие нас события — напрямую влияют на наше поведение одним из двух способов.

Будучи внешними следствиями нашего поведения, они действуют как закрепляющие стимулы, повышая частоту проявления любого предшествовавшего поведения.

Эффект закрепления наблюдается в тех случаях, когда следствие оказывается закономерно связанным с поведением: поведение X позволяет ожидать, что за ним последует определенный Y.

Кроме того, ситуационные стимулы управляют нашим поведением за счет своей сигнальной функции: с ее помощью мы узнаем, когда либо где наше поведение может вызвать закрепляющие последствия.

Если стимулы выступают в роли дискримина-тивных стимулов, они информируют нас о том, что если мы начнем делать X прямо здесь и сейчас, то за этим последует искомое следствие Y. Однако если они подают другой сигнал, то же самое поведение может оказаться неуместным и даже навлечь на нас неприятности. Подробнее о дискриминативных (различительных) функциях ситуационных стимулов мы поговорим позднее в этой же главе.

Будучи радикальным бихевиористом, Скиннер утверждал, что наши установки, намерения, представления — это нечто большее, чем побочные продукты нашего внешнего поведения.

Изменению установки или представления далеко не всегда предшествует или сопутствует изменение поведения; под действием закрепления изменяется лишь внешнее поведение. Названные выше элементы внутреннего мира занимают центральное место в теории социального научения.

В особенности это характерно для изложения данной теории, сделанного Альбертом Бандурой (Bandura, 1977, 1986) из Стэнфордского университета.

В дальнейшем мы увидим, что предметом исследования в рамках этого подхода является то, как люди учатся образцам поведения — благодаря непосредственному подкреплению или через наблюдение за теми последствиями, к которым приводят действия других людей. Кроме того, теория социального научения описывает пути взаимодействия с целью взаимного изменения между самим человеком, его поведением и его окружением.

Когда наше поведение является инструментом изменения элементов внешнего окружения, мы обнаруживаем взаимосвязь между специфической реакцией и ее последствиями. В процессе инструментального (иначе оперантного) научения именно действия субъекта так или иначе изменяют окружающую среду.

В тех случаях, когда последствия оказываются позитивными, желательными или приятными, вызвавшие их действия повторяются снова и снова и в конце концов становятся привычкой.

Если действие, которое получает позитивное подкрепление, является сложным и трудно дается человеку, оно должно быть постепенно «сформировано»

(shape). Шейпинг — это такой процесс научения, при котором мы начинаем с заниженных требований к действию и постепенно поднимаем планку, положительно закрепляя любые результаты, которые хотя бы отдаленно напоминают желаемый конечный продукт. Затем мы последовательно ужесточаем критерии поощрения, следующего за реакцией, которая становится все ближе и ближе к желаемой.

На последнем этапе награды удостаиваются только правильные действия. Некоторые преподаватели используют эту процедуру инструментального формирования для того, чтобы научить студентов давать более продуманные ответы на вопросы.

Для начала они «закрепляют» вербальной похвалой простое поднятие руки и готовность дать какой бы то ни было ответ, а впоследствии избирательно поощряют лишь лучшие ответы.

Инструментальное научение является прямым следствием следующего принципа: все поведенческие проявления, влекущие за собой приятные последствия — т. е. являющиеся инструментами достижения каких-либо житейских наград — имеют тенденцию к повторению. Приятные последствия — житейские награды — выступают в роли позитивных подкреплений.

Таким образом, подкрепление можно определить как любой стимул, наличие которого повышает вероятность повтора предшествовавшего ему действия. Мы учимся делать то, что оправдывает наши усилия и прекращать делать то, что не приносит никакой отдачи либо влечет за собой нежелательные последствия.

Безусловно, эти принципы чрезвычайно просты — однако играют немалую роль в нашей повседневной жизни.

Источник: https://studlib.info/psikhologiya/3919761-instrumentalnoe-nauchenie-i-podkreplenie/

Ссылка на основную публикацию