Внешняя валидность — психология

Клуб Здорового Сознания

Внешняя валидность - психология

Внешняя валидность (англ. external validity) — вид валидности, определяющий то, насколько результаты конкретного исследования можно распространить на весь класс подобных ситуаций/явлений/объектов. Данное понятие можно рассматривать как междисциплинарное: оно широко применяется в экспериментальной психологии, а также в других сферах науки.

Общие сведения

Внешняя валидность определяет то, в какой мере результаты, полученные в эксперименте, могут соответствовать тому типу жизненной ситуации, которая была исследована, и то, насколько возможно обобщить эти результаты на все подобные жизненные ситуации. Например, критику психологов-экспериментаторов в том, что о студентах-второкурсниках и белых крысах они знают очень много, а обо всём остальном — очень мало, можно рассматривать как критику внешней валидности.

Как и в отношении любой другой валидности, о внешней валидности в исследовании, вероятно, невозможно сказать, что она абсолютно соблюдена, можно указать только на её нарушение.

Абсолютным соблюдение внешней валидности считалось бы тогда, когда результаты исследования можно обобщить на любые популяции при любых условиях и в любое время, поэтому учёные говорят не о соблюдении либо несоблюдении внешней валидности, а о степени её соблюдения.

Критерии внешней валидности

Чтобы исследование обладало наивысшей степенью валидности, должна существовать возможность генерализации его результатов на

другие популяции,
другие условия,
другое время.

Пример нарушения внешней валидности

Исследование Лоренса Колберга, посвящённое изучению нравственного развития детей, было подвергнуто критике за низкую степень внешней валидности. В 1963 году Колберг предложил мальчикам-подросткам разрешить различные коротко сформулированные дилеммы. На основании полученных ответов он разработал теорию о шести стадиях морального развития.

Критика внешней валидности этого исследования в частности состояла в том, что учёный не учитывал половых различий в особенностях мышления способах принятия моральных решений и, следовательно, неправомерно генерализовал свою модель на представителей обоих полов.

Колберг также исходил из предпосылки о том, что существуют некие «универсальные принципы справедливости и соблюдения прав личности», однако он не учёл межкультурных различий, следовательно, выводы, которые он сделал, не могут восприниматься как универсальные.

Соблюдение внешней валидности

Чтобы увеличить степень внешней валидности, в исследованиях могут не ограничиваться лишь экспериментальным методом, но также использовать и другие — например, наблюдение, межкультурные исследования и т. д.

При современном научном подходе в психологии соблюдение внешней валидности в исследованиях играет ведущую роль, так как наиболее ценным считается создание общих теорий, моделей и алгоритмов, применимых к психике в целом, независимо от контекста, — то есть моделей, обладающих крайне широкими предсказательными возможностями; поэтому исследования, результаты, которых можно применить только к какой-то определённой ограниченной ситуации, обладают нисходящей ценностью.

Источник: https://psy-space.ru/?page=vneshnyaya-validnost

Внешняя валидность

*определяет, в какой мере результаты, полученные в эксперименте, будут соответствовать жизненной ситуации, послужившей ʼʼпервообразомʼʼ для эксперимента.

*Вместе с тем, внешняя валидность характеризует возможность обобщения, переноса результатов, полученных в эксперименте, на весь класс жизненных ситуаций, к которым принадлежит ʼʼпервообразнаяʼʼ, и на любые Другие.

Надо сказать, что внешняя валидность имеет особое значение на эмпирической стадии развития науки. В принципе возможны такие эксперименты, которые не соответствуют никаким реальным жизненным ситуациям, а служат лишь для проверки гипотез, источником которых является развитая теория.

В развитых науках исследователи стремятся избегать ʼʼпрямого замыканияʼʼ. Экспериментальный результат — реальность, так как понятно, что эксперимент строится исходя из требований проверяемой теории, а не из требований соответствия реальности.

Моделирование некоторых условий, к примеру в экспериментах по сенсорной депривации или выработке классических условных рефлексов, не соответствует никакой жизненной реальности. При условии, в случае если под реальностью понимать то, что было, а не то, что потенциально должна быть.

По этой причине многостраничные рассуждения такого солидного автора, как Готтсданкер, по поводу ʼʼэкспериментов полного соответствияʼʼ или ʼʼэкспериментов, улучшающих реальностьʼʼ, кажутся надуманными и архаичными.

Но нельзя отрицать значение ʼʼвнешней валидностиʼʼ для эксперимента͵ если учитывать общее состояние психологической науки, а не ʼʼпередовойʼʼ край психологической теории.

Внешняя валидность иногда трактуется как характеристика эксперимента͵ определяющая возможность переноса (обобщения) полученных результатов на различные времена, места͵ условия и группы людей (или животных).

При этом возможность переноса является следствием двух причин:

1) соответствия условий эксперимента его ʼʼпервообразнойʼʼ жизненной ситуации (ʼʼрепрезентативностьʼʼ эксперимента);

2) типичности самой ʼʼпервообразнойʼʼ ситуации для реальности (ʼʼрепрезентативностьʼʼ ситуации).

Выбранная для моделирования в эксперименте ситуация должна быть совершенно нерепрезентативной с точки зрения жизни той группы испытуемых, которая участвует в эксперименте, или являться редкой и нетипичной.

Для достижения высокой внешней валидности нужно, чтобы уровни дополнительных переменных в эксперименте соответствовали их уровням в реальности. Эксперимент, который не имеет внешней валидности, считается неверным.

Добавим, что он неверен, в случае если источником гипотезы является реальность, обыденное знание, а не теория. Эксперимент, не соответствующий реальности, может обладать совершенной внутренней и операциональной валидностью.

Другое дело, что прямой перенос его результатов в реальность невозможен без учета влияния на зависимую переменную помимо независимой и дополнительных переменных.

Очевидно, что достижение полной внешней валидности невозможно в принципе, в связи с этим любое ʼʼчистоеʼʼ аналитическое исследование является внешне невалидным.

Вместе с тем рекомендуется максимально учитывать влияние дополнительных переменных на экспериментальный эффект, так как неизвестно, когда будет построена теория для их объяснения, а данные, возможно, придется использовать на практике.

Заботу о внешней валидности эксперимента особо проявляют исследователи, работающие в прикладных областях:

*клинической психологии,

*педагогической и

*организационной психологии.

Это понятно, ибо для решения своих повсœедневных задач им чаще приходится прибегать к постановке экспериментов, имитирующих реальность. По сути, историческая дискуссия сторонников лабораторного эксперимента и ʼʼестественного экспериментаʼʼ была отражением разного методического подхода специалистов, занимавшихся фундаментальной или прикладной психологией.

В настоящее время факторами, влияющими на внешнюю валидность, считают неустранимые особенности эксперимента͵ отличающие его от реальной ситуации. Кэмпбелл ставит знак равенства между внешней валидностью, репрезентативностью эксперимента и возможностью генерализации его результатов.

Он относит к факторам, угрожающим внешней валидности, в первую очередь эффекты, связанные с особенностями объекта исследования:

*обучаемость,

*наличие памяти,

*способность эмоционально реагировать на ситуации.

Кэмпбелл называет главные причины нарушения внешней валидности:

1.Эффект тестирований — уменьшение или увеличение восприимчивости испытуемых к экспериментальному воздействию под влиянием тестирования.

Например, предварительный контроль знаний учеников может повысить их интерес к новому учебному материалу.

Поскольку генеральная совокупность предварительному тестированию не подвергается, то результаты для нее бывают нерепрезентативными.

2. Условия проведения исследования. Οʜᴎ вызывают реакцию испытуемого на эксперимент. Следовательно, его данные нельзя переносить на лиц, не принимавших участия в эксперименте, этими лицами является вся генеральная совокупность, кроме экспериментальной выборки.

3. Взаимодействие факторов отбора и содержания экспериментального воздействия. Их следствия — артефакты (в экспериментах с добровольцами или испытуемыми, участвующими по принуждению).

4. Интерференция экспериментальных воздействий. Испытуемые обладают памятью и обучаемостью. В случае если эксперимент состоит из нескольких серий, то первые воздействия не проходят для них бесследно и сказываются на появлении эффектов от последующих воздействий.

Большинство причин нарушения внешней валидности связано с особенностями психологического эксперимента͵ проводимого с участием человека, которые отливают психологическое исследование от эксперимента͵ осуществляемого специалистами других естественных наук.

На взаимодействие процедуры тестирования и содержания экспериментального воздействия первым обратил внимание в 1949 ᴦ. Р. Л. Соломон[Solomon R.

L, 1949] при проведении исследования школьников: предварительное тестирование снижало эффективность обучения.

Исследование социальных установок показало, что предварительное тестирование оказывало влияние на установки личности и ее подверженность убеждению, а в экспериментах Ховленда, напротив — ослабляло убеждающее воздействие фильмов.

Эффект тем больше, чем необычнее процедура тестирования и чем более сходно по содержанию экспериментальное воздействие с тестом. Для того чтобы избежать эффекта предварительного тестирования, Кэмпбелл рекомендует применять экспериментальные планы с предварительно не тестируемыми группами.

Как уже отмечалось, ʼʼвзаимодействие состава группы и воздействияʼʼ связано с неслучайным участием испытуемых в эксперименте. Реакция должна быть двух типов:

*готовность добровольцев ʼʼподвергнуться воздействиюʼʼ и

*отказ, негативная реакция тех, кто принудительно привлечен к участию в эксперименте.

В исследованиях по научению могут согласиться участвовать только интеллектуально одаренные люди. Выбывание испытуемых в ходе эксперимента может вызываться экспериментальным воздействием. К примеру, лица, потерпевшие неудачу при выполнении заданий на мотивацию достижения, могут отказаться от участия в последующих сериях.

Естественно, практически невозможно элиминировать лишь фактор ʼʼреакции на экспериментʼʼ. Еще раз отметим, что проблема внутренней валидности разрешима в принципе, так как можно подобрать соответствующие процедуры планирования эксперимента и математической обработки результатов, чтобы обеспечить заданный уровень их достоверности.

Согласно Кэмпбеллу, проблема внешней валидности как репрезентативности эксперимента по отношению к реальности неразрешима, так как индукция, т. е. обобщение, никогда не должна быть полностью объективна.

Проблема внешней валидности как адекватности ситуации эксперимента его ʼʼпервообразнойʼʼ жизненной ситуации также неразрешима логическими и математическими средствами: она требует привлечения всœей совокупности научных психологических знаний для описания ситуации в целом.

Источник: http://referatwork.ru/category/psikhologiya/view/370077_vneshnyaya_validnost

Виды валидности

Валидность по своей сути — это комплексная характеристика, включающая, с одной стороны, сведения о том, пригодна ли методика для измерения того, для чего она была создана, а с другой стороны, какова ее действенность, эффективность, практическая полезность.

Проверка валидности методики называется валидизацией.

Для проведения прагматической валидизации методики, т. е. для оценки ее эффективности, действенности, практической значимости, обычно используется независимый внешний критерий — показатель проявления изучаемого свойства в повседневной жизни.

Таким критерием может быть и успеваемость (для тестов способностей к обучению, тестов достижений, тестов интеллекта), и производственные достижения (для методик профессиональной направленности), и эффективность реальной деятельности — рисование, моделирование и т. д.

(для тестов специальных способностей), субъективные оценки (для тестов личности).

4 типа внешних критериев:

критерии исполнения (в их число могут входить такие, как количество выполненной работы, успеваемость, время, затраченное на обучение, темп роста квалификации и т. п.
);
субъективные критерии (они включают различные виды ответов, которые отражают отношение человека к чему-либо или к кому-либо, его мнение, взгляды, предпочтения; обычно субъективные критерии получают с помощью интервью, опросников, анкет);
физиологические критерии (они используются при изучении влияния окружающей среды и других ситуационных переменных на организм и психику человека; замеряется частота пульса, давление крови, электросопротивление кожи, симптомы утомления и т.д.);
критерии случайностей (применяются, когда цель исследования касается, например, проблемы отбора для работы таких лиц, которые менее подвержены несчастным случаям).

Эмпирическая валидность

Если в случае с содержательной валидностью оценка теста производится за счет экспертов (устанавливающих соответствие заданий теста содержанию предмета измерения), то эмпирическая валидность измеряется всегда с помощью статистического коррелирования: подсчитывается корреляция двух рядов значений — баллов по тесту и показателей по внешнему параметру, избранному в качестве критерия валидности.

Конструктная валидность

Конструктная валидность имеет отношение к теоретическому конструкту самому по себе и включает в себя поиск факторов, объясняющих поведение при выполнении теста.

Как особый тип конструктная валидность канонизирована в статье Кронбаха и Миля (1955).

Авторы оценивали с помощью этого типа валидности все тестовые исследования, которые не были прямо направлены на предсказание некоторых значимых критериев. Исследование содержало информацию о психологических конструктахл.

Валидность «по содержанию»

Содержательная валидность требует того, чтобы каждое задание, задача или вопрос, принадлежащие к определенной области, имели равные шансы стать заданиями теста.

Валидность по содержанию оценивает соответствие содержания теста (заданий, вопросов) измеряемой области поведения. Тесты, составленные двумя командами разработчиков, проводятся на выборке испытуемых.

Надежность тестов подсчитывается путем расщепления заданий на две части, в результате чего получают индекс содержательной валидности.

«Прогностическая» валидность

«Прогностическая» валидность определяется также по достаточно надежному внешнему критерию, но информация по нему собирается некоторое время спустя после испытания.

Внешним критерием обычно бывает выраженная в каких-нибудь оценках способность человека к тому виду деятельности, для которой он отбирался по результатам диагностических испытаний.

Хотя этот прием наиболее соответствует задаче диагностических методик — предсказанию будущей успешности, применять его очень трудно. Точность прогноза находится в обратной зависимости от времени, заданного для такого прогнозирования.

Чем больше проходит времени после измерения, тем большее количество факторов требуется учитывать при оценке прогностической значимости методики. Однако учесть все факторы, влияющие на предсказание, практически невозможно.

«Ретроспективная» валидность

Она определяется на основе критерия, отражающего события или состояние качества в прошлом. Может быть использована для быстрого получения сведений о предсказательных возможностях методики.

Так, для проверки того, в какой мере хорошие результаты теста способностей соответствуют быстрому обучению, можно сопоставить прошлые оценки успеваемости, прошлые экспертные заключения и т.д.

у лиц с высокими и низкими на данный момент диагностическими показателями.

Конвергентная и дискриминантная валидность

От того, как психолог определяет диагностический конструкт, зависит стратегия включения в тест определенных пунктов. Если Айзенк определяет свойство «нейротизм» как независимое от экстраверсии-интроверсии, то это означает, что в его опроснике примерно поровну должны быть представлены пункты, с которыми будут соглашаться невротичные интроверты и невротичные экстраверты.

Если же на практике окажется, что в тесте будут преобладать пункты из квадранта «Нейротизм-Интроверсия», то, с точки зрения теории Айзенка, это означает, что фактор «нейротизм» оказывается нагруженным иррелевантным фактором — «интроверсией».

(Точно такой же эффект возникает, если появится перекос в выборке — если в ней будет больше невротичных интровертов, чем невротичных экстравертов.)

Для того чтобы не сталкиваться с такими сложностями, психологи хотели бы иметь дело с такими эмпирическими показателями (пунктами), которые однозначно информируют только об одном факторе. Но это требование реально никогда не выполняется: всякий эмпирический показатель оказывается детерминированным не только тем фактором, который нам нужен, но и другими — иррелевантными задаче измерения.

Таким образом, по отношению к факторам, которые концептуально определяются как ортогональные к измеряемому (встречающиеся с ним во всех комбинациях), составитель теста должен при отборе пунктов применить стратегию искусственного балансирования.

Соответствие пунктов измеряемому фактору обеспечивает конвергентную валидность теста. Сбалансированность пунктов относительно иррелевантных факторов обеспечивает дискриминантную валидностъ. Эмпирически она выражается в отсутствии значимой корреляции с тестом, измеряющим концептуально независимое свойство.

Источник: http://www.psyworld.ru/for-students/cards/psychodiagnostics/735-2009-08-28-14-52-44.html

Open Library — открытая библиотека учебной информации

Open Library - открытая библиотека учебной информации

*определяет, в какой мере результаты, полученные в эксперименте, будут соответствовать жизненной ситуации, послужившей «первообразом» для эксперимента.

*Вместе с тем, внешняя валидность характеризует возможность обобщения, переноса результатов, полученных в эксперименте, на весь класс жизненных ситуаций, к которым принадлежит «первообразная», и на любые Другие.

В развитых науках исследователи стремятся избегать «прямого замыкания». Экспериментальный результат — реальность, так как понятно, что эксперимент строится исходя из требований проверяемой теории, а не из требований соответствия реальности.

Моделирование некоторых условий, к примеру в экспериментах по сенсорной депривации или выработке классических условных рефлексов, не соответствует никакой жизненной реальности. При условии, если под реальностью понимать то, что было, а не то, что потенциально может быть.

По этой причине многостраничные рассуждения такого солидного автора, как Готтсданкер, по поводу «экспериментов полного соответствия» или «экспериментов, улучшающих реальность», кажутся надуманными и архаичными.

Но нельзя отрицать значение «внешней валидности» для эксперимента͵ если учитывать общее состояние психологической науки, а не «передовой» край психологической теории.

При этом возможность переноса является следствием двух причин:

1) соответствия условий эксперимента его «первообразной» жизненной ситуации («репрезентативность» эксперимента);

2) типичности самой «первообразной» ситуации для реальности («репрезентативность» ситуации).

Выбранная для моделирования в эксперименте ситуация может быть совершенно нерепрезентативной с точки зрения жизни той группы испытуемых, которая принимает участие в эксперименте, или являться редкой и нетипичной.

Внешняя валидность, как определяет ее Готтсданкер, влияет, прежде всœего, на достоверность выводов, которую дают результаты реального эксперимента по сравнению с экспериментом полного соответствия. Для достижения высокой внешней валидности нужно, чтобы уровни дополнительных переменных в эксперименте соответствовали их уровням в реальности.

Эксперимент, который не имеет внешней валидности, считается неверным. Добавим, что он неверен, если источником гипотезы является реальность, обыденное знание, а не теория. Эксперимент, не соответствующий реальности, может обладать совершенной внутренней и операциональной валидностью.

Очевидно, что достижение полной внешней валидности невозможно в принципе, в связи с этим любое «чистое» аналитическое исследование является внешне невалидным.

Вместе с тем рекомендуется максимально учитывать влияние дополнительных переменных на экспериментальный эффект, так как неизвестно, когда будет построена теория для их объяснения, а данные, возможно, придется использовать на практике.

Заботу о внешней валидности эксперимента особо проявляют исследователи, работающие в прикладных областях:

*клинической психологии,

*педагогической и

*организационной психологии.

Это понятно, ибо для решения своих повсœедневных задач им чаще приходится прибегать к постановке экспериментов, имитирующих реальность. По сути, историческая дискуссия сторонников лабораторного эксперимента и «естественного эксперимента» была отражением разного методического подхода специалистов, занимавшихся фундаментальной или прикладной психологией.

В настоящее время факторами, влияющими на внешнюю валидность, считают неустранимые особенности эксперимента͵ отличающие его от реальной ситуации. Кэмпбелл ставит знак равенства между внешней валидностью, репрезентативностью эксперимента и возможностью генерализации его результатов.

Он относит к факторам, угрожающим внешней валидности, в первую очередь эффекты, связанные с особенностями объекта исследования:

*обучаемость,

*наличие памяти,

*способность эмоционально реагировать на ситуации.

Кэмпбелл называет главные причины нарушения внешней валидности:

Например, предварительный контроль знаний учеников может повысить их интерес к новому учебному материалу.

L, 1949] при проведении исследования школьников: предварительное тестирование снижало эффективность обучения.

Исследование социальных установок показало, что предварительное тестирование оказывало влияние на установки личности и ее подверженность убеждению, а в экспериментах Ховленда, наоборот, ослабляло убеждающее воздействие фильмов.

Как уже отмечалось, «взаимодействие состава группы и воздействия» связано с неслучайным участием испытуемых в эксперименте. Реакция может быть двух типов:

*готовность добровольцев «подвергнуться воздействию» и

*отказ, негативная реакция тех, кто принудительно привлечен к участию в эксперименте.

Естественно, практически невозможно элиминировать лишь фактор «реакции на эксперимент». Еще раз отметим, что проблема внутренней валидности разрешима в принципе, так как можно подобрать соответствующие процедуры планирования эксперимента и математической обработки результатов, чтобы обеспечить заданный уровень их достоверности.

Согласно Кэмпбеллу, проблема внешней валидности как репрезентативности эксперимента по отношению к реальности неразрешима, так как индукция, т. е. обобщение, никогда не может быть полностью объективна.

Проблема внешней валидности как адекватности ситуации эксперимента его «первообразной» жизненной ситуации также неразрешима логическими и математическими средствами: она требует привлечения всœей совокупности научных психологических знаний для описания ситуации в целом.