Валидность — психология

Валидность

Валидность - психология

Валидность – это один из базовых критериев в психодиагностике тестов, методик, определяющий их качество, близкое к понятию достоверности. Применяется, когда нужно узнать насколько хорошо методика измеряет именно то, на что она ориентирована, соответственно то, насколько лучше отображается исследуемое качество, тем большая валидность данной методики.

Вопрос о валидности возникает сперва в процессе разработки материала, потом после применения теста или методики, если необходимо узнать, соответствует ли степень выраженности определяемой характеристики личности и методом измерения этого свойства.

Понятие валидности выражается корреляцией результатов, которые получились в результате применения теста или методики с другими характеристиками, которые также исследуются, и ее можно также аргументировать комплексно, с помощью разных приемов и критериев.

Используются разные виды валидности: концептуальная, конструктивная, критериальная, содержательная валидности, со свойственными методами установления их степени достоверности.

Иногда критерий достоверности является обязательным требованием к проверке психодиагностических методов, если они вызывают сомнения.

Чтобы психологическое исследование имело реальную ценность, оно должно быть не только валидным, а еще и надежным одновременно. Надежность позволяет экспериментатору быть уверенным в том, что исследуемое значение очень близко к истинному показателю.

А валидный критерий важен тем, что он указывает, что изучается именно то, что экспериментатор предполагает. Важно обратить внимание на тот факт, что данный критерий может предположить надежность, но надежность предположить валидность не может.

Надежные значения могут быть не валидными, но валидные обязаны быть надежными, в этом вся суть успешного исследования, тестирования.

Валидность это в психологии

В психологии понятие валидности обозначает уверенность экспериментатора в том, что он измерял именно то, что хотел с помощью определенной методики, показывает меру соответствия результатов и самой методики относительно поставленных задач. Валидное измерение – это то значение, которое измеряет именно то, для чего было создано. Например, методика, направлена на определение темперамента, должна измерять именно темперамент, а не нечто другое.

Валидность в экспериментальной психологии очень важный аспект, является важным показателем, который обеспечивает достоверность результатов, и с ним иногда больше всего возникает проблем.

Совершенный эксперимент должен обладать безупречной валидностью, то есть он должен демонстрировать, что экспериментальный эффект вызван модификациями независимой переменной и полностью соответствовать действительности. Полученные результаты без ограничений можно обобщать.

Если речь идет о степени данного критерия, то предполагается, что результаты будут соответствовать поставленным задачам.

Проверка на валидность осуществляется тремя способами.

Оценивание содержательной валидности, проводится, чтобы узнать уровень соответствия использованной методики и реальной действительности, в которой выражается исследуемое свойство в методике.

Существует здесь также такой компонент, как очевидная, еще ее называют лицевая валидность, она характеризует степень соответствия теста к ожиданиям оцениваемых.

В большинстве методик считается очень важным, чтобы участник оценки видел очевидную связь содержания процедуры оценки и действительности того объекта оценки.

Оценивание конструктной валидности исполняется для получения степени обоснованности, что тест реально вычисляет те конструкты, которые заданные и научно обоснованные.

В конструктной валидности имеются два направления. Первый называется конвергентной валидизацией, с его помощью проверяется ожидаемая связь результатов методики с характеристиками из других методик, которые измеряют исходные свойства.

Если для измерения какой-то характеристики необходимо несколько методик, то рациональным решением было бы проведение экспериментов минимум двух методик, чтобы при сопоставлении результатов обнаружив высокую положительную корреляцию, можно было утверждать о валидном критерии.

Конвергентная валидизация определяет вероятность вариации оценки теста с ожиданиями. Второй подход, называется дискриминантная валидизация, в ней заключается, что методика не должна измерять никаких характеристик, с которой теоретически не должно быть корреляции.

Проверка на валидность, также бывает критериальной, она, руководствуясь статистическими методами, определяет степень соответствия результатов к заранее определенным внешним критериям.

Такими критериями могут быть: непосредственные меры, независимые от результатов методики или значение социально-организационных значимых показателей деятельности. В критериальной валидности также выделяют прогностическую, она применяется при потребности прогнозирования поведения.

И если получается, что этот прогноз осуществляется со временем, значит методика прогностически валидна.

Валидность теста это

Тест – это стандартизованное задание в результате применения, которого получаются данные о психофизиологическом состоянии человека и его личностные свойства, его знания, способности и навыки.

Валидность и надежность тестов – это два показателя, которые определяют их качество.

Валидность теста определяет степень соответствия исследуемого качества, характеристики, психологического свойства к тесту, с помощью которого они определяются.

Валидность теста является показателем его эффективности и применяемости к измерению необходимой характеристики. Самые качественные тесты имеют 80% валидности. При валидизации следует учитывать, что от контингента испытуемых и их характеристик, будет зависеть качество результатов. Получается, что один тест может быть как высоко достоверным, так и совсем невалидным.

Существует несколько подходов к определению валидности теста.

При измерении сложного психологического явления, которое имеет иерархическую структуру и его невозможно исследовать, применяя всего один тест, применяют конструктивную валидность. Она определяет точность исследования сложных, структурированных психологических явлений, качеств личности, измеряемых с помощью тестирования.

Валидность за критерием – это такой критерий теста, за которым определяется исследуемое психологическое явление в настоящий момент и прогнозирование особенностей этого явления в будущем.

Для этого результаты, полученные при тестировании соотносятся со степенью развития измеряемого качества на практике, оценка специфических способностей в определенной деятельности.

Если валидность теста имеет значение минимум 0,2 то применение такого теста является оправданным.

Содержательная валидность – это критерий теста, который применяется для определения соответствия области его измеряемых психологических конструктов, демонстрирует все полноту множества измеряемых показателей.

Прогностическая валидность – критерий, за которым можно предсказать характер развития исследуемого качества в будущем. Такой критерий качества теста очень ценный, если смотреть с практической стороны, но могут быть сложности, поскольку исключается неравномерность развития данного качества в разных людей.

Надежность теста – это критерий теста, который измеряет уровень стабильности результатов, полученных после тестирования, при повторном исследовании.

Определяется путем вторичного тестирования спустя определенное количество времени и расчета корреляционного коэффициента результатов, полученных после первого и после второго тестирования.

Также важно, учитывать особенности самой процедуры проведения тестов и социально-психологической структуры выборки. Один и тот же тест может иметь разную надежность, зависимо от пола, возраста, социального статуса исследуемых.

Поэтому надежность может иногда иметь неточности, ошибки, которые истекают из самого процесса исследования, поэтому ищутся пути, как уменьшить влияние определенных факторов на тестирование. Можно утверждать о надежности теста, если она составляет значение 0,8-0,9.

Валидность и надежность тестов очень важны, потому что определяют тест, как измерительный инструмент. Когда надежность и валидность неизвестны, тест считается неприменяемым для применения.

В измерении надежности и валидность имеет место также этический контекст. Это особенно важно, когда результаты тестирования имеют значимость в использовании их для принятия жизненно важных решений людей.

Одних людей принимают на работу, других отсеивают, одни студенты проходят в учебные заведения, а другие должны еще доучиться сначала, кому-то определяется психиатрический диагноз и лечение, а кто-то здоров – это все говорит о том, что подобные решения принимаются на основании изучения оценки поведения или специальных способностей.

Например, человек ищущий работу, должен пройти тестирование, и его оценки есть решающими показателями при приеме на работу, узнает, что тест был не в меру валидным и надежным, он очень разочаруется.

Валидность методики это

Валидность методики определяет соответствие того, что изучается данной методикой, тому для изучения чего именно она предназначена.

Например, если психологическая методика, которая основана на осведомленном самоотчете, назначена для исследования некого качества личности, такого качества, которое не может быть верно, оцененным самим человеком, то такая методика не будет валидной.

В большинстве случаев ответы, которые дает испытуемый на вопросы о наличии или отсутствии развитости в нем этого качества, может выражать то, как сам испытуемый воспринимает себя, или каким бы ему хотелось быть в глазах других людей.

Валидность также является основным требованием к психологической методике изучения психологических конструктов.

Существует масса разных видов данного критерия, и нет пока единственного мнения о том, как правильно назвать эти виды и неизвестно каким именно видам методика обязана соответствовать.

Если же методика оказывается невалидной внешне или внутренне, не рекомендуется ее использовать. Существуют два подхода к валидизации методики.

Теоретический подход выявляется в том, чтобы показать насколько действительно методика измеряет именно то качество, которое, как придумал исследователь, и обязана измерять.

Это доказывается через составление с родственными показателями и теми, где связей не могло бы быть.

Поэтому для подтверждения теоретического валидного критерия нужно определить степень связей с родственной методикой, имеется в виду конвергентный критерий и отсутствие такой связи с методиками, которые имеют иную теоретическую базу (дискриминантная валидность).

Оценивание валидности методики может быть количественной или качественной.

За прагматическим подходом оценивается эффективность и практическая значимость методики, и для ее проведения используется независимый критерий извне, как показатель встречаемости данного качества в повседневной жизни.

Таким критерием, например, может быть успеваемость (для методик на достижения, тестов на интеллект), субъективные оценки (для личностных методик), специфические способности, рисование, моделирование (для методик специальных особенностей).

Для доказательства валидности внешних критериев, выделяется четыре типа: критерии исполнения – это критерии такие, как количество выполненных заданий, время, потраченное на обучение; субъективные критерии получают вместе с опросниками, интервью или анкетами; физиологические – частота пульса, давление, физические симптомы; критерии случайности – используются, когда к цели имеет касательство или влияние определенного случая или обстоятельств.

Источник: http://psihomed.com/validnost/

Валидность в психологии – понятие. Виды валидности. Валидность теста и методики

Что такое валидность?

У рассматриваемого понятия существует много определений. Что такое валидность? Это пригодность и обоснованность применения какой-то методики или результата в конкретной ситуации. Прикладное значение данного слова – степень соответствия результатов и методик поставленным задачам.

Валидность – это измерение другого показателя, которое измеряет конкретные качества. Таким образом, методика направлена на измерение конкретного качества, например, интеллекта, а ее валидность должна показывать, насколько хорошо данная методика помогает в получении результатов.

https://www.youtube.com/watch?v=KVGuDLxnc_A

Другим словом валидность можно назвать достоверностью. Она измеряет те тесты и методики, которые занимаются измерениями определенных психологических качеств. Чем лучше они измеряют те качества, которые измеряют, тем выше их валидность.

Читайте также: Вкус жизни - психология

Валидность становится важной в двух случаях:

Когда некая методика разрабатывается.
Когда некая методика показывает результаты, и необходимо установить, насколько качественны данные результаты.

Таким образом, валидность – это характеристика, которая указывает пригодность конкретной методики для измерения какого-то качества и полезность, качественность, эффективность данной методики.

Обычно используется несколько видов валидности, чтобы провести проверку конкретного теста или методики. Здесь также происходит сравнение показателей, которые даются различными инструментами.

Существует множество способов измерения того или иного психологического качества или характеристики. Чаще психологами будет использоваться та методика, которая дает более достоверные результаты.

Это и будет показывать ее высокую валидность.

Вместе с валидностью часто рассматривается такое понятие, как надежность. Методики и тесты должны быть надежными, то есть они должны быть постоянными, достоверными. Экспериментатор должен быть уверен в том, что он рассматривает именно то качество, которое он желает рассмотреть. Вот почему надежность не всегда может быть валидной, однако валидность всегда должна быть надежной.

перейти наверх

Валидность в психологии

Валидность используется во многих сферах жизни, где происходят измерения различных показателей. В психологии валидность также становится нужной, особенно в экспериментальной психологии. Валидность в психологии – это:

уверенность экспериментатора в том, что он измеряет нужное ему качество;
достоверность показателей, которые измеряют данное качество.

Если читатель хоть раз проходил психологические тесты, то он знает о внутреннем желании получить конкретный ответ на поставленный вопрос. Валидность теста показывает экспериментатору конкретный результат, которого он достигает путем тестирования. Здесь стоит конкретная задача, ответ на которую он должен получить после совершения всех нужных действий.

Методики и тесты должны быть полезными и достоверными, что и измеряется путем их валидности.

Существует три способа проверки на валидность:

Оценивание содержательной валидности – соответствие результатам оценивания испытуемого реальным качествам, которые проявляются в действительности. Здесь используется такое понятие, как лицевая валидность – человек должен видеть реальную связь между содержанием самой методики и ее результатами и действительностью, в которой проявляется измеряемое качество.
Оценивание конструктной валидности – определение того, что методика вычисляет научно обоснованные и заданные конструкты. Конвергентная валидизация позволяет использовать несколько методик, которые рассматривает схожие характеристики и дают более точные результаты рассматриваемого качества. Дискриминантная валидизация исключает другие методики, которые рассматривают качества, не имеющие корреляции с нужным качеством.
Оценивание критериальной валидности – это соответствие результатам ожидаемым показателям, которые выявляются другими способами. Здесь используется прогностическая валидность, которая помогает спрогнозировать дальнейшее поведение.

перейти наверх

Виды валидности

Существует несколько видов валидности, которые рассмотрим ниже:

Внешняя валидность – обобщение вывода ситуации, популяции, независимых переменных. Она делится на:

Операциональную валидность.
Конструктную валидность – объяснение поведения человека в момент прохождения теста.

Внутренняя валидность – изменение в процессе эксперимента под влиянием неизменяемых факторов.
Дифференциальная валидность.
Инкрементная валидность.
Экологическая валидность – показатель того, что человек способен к совершению различных действий, которые в одной ситуации могут быть успешными, а в другой нет.

Данная классификация используется экспериментальной психологией. Организационной психологией и психодиагностикой используется другая классификация:

Конструктная валидность. Она делится на:

Конвергентную валидность.
Дивергентную валидность.

Критериальная (эмпирическая) валидность – подсчет корреляции по баллу по тесту внешнему параметру, который был выбран в качестве валидного показателя. Она делится на:

Текущую валидность – изучение параметра в настоящем времени.
Ретроспективную валидность – состояние или событие, которое было в прошлом.
Прогностическую валидность – прогноз поведения, качества.

Содержательная валидность – используется в экспериментах, где рассматривается некоторое взаимодействие, деятельность. Имеет подвид:

Другими видами валидности являются:

Априорная.
Конгруэнтная.
Сопутствующая.
Конструктивная.
Консенсусная.
Факториальная.
Теоретическая и пр.

перейти наверх

Что такое валидность теста?

Многие люди проходят тесты. Есть специальные психологические тесты, применяемые психологами, и другие, бульварные тесты. Что такое валидность теста, которая является важным ее критерием? Это показатель соответствия характеристики, качества, свойства к тесту, который их измеряет.

Тесты бывают разными. Они используются для измерения психофизиологических параметров человека. Самым высоким показателем валидности остается 80%. Полезность применения тестов становится в том случае, когда они позволяют получить точные данные по тем или иным конкретным характеристикам. Существует несколько подходов при изучении валидности теста:

Конструктивная валидность, которая позволяет более глубоко изучить качества человека в ситуации, деятельности, системе.
Валидность за критерием – изучение параметра в настоящем времени и прогнозирование его в будущем.
Содержательная валидность – соответствие психологических конструктов, их многообразие.
Прогностическая валидность – предсказывает развитие конкретного качества в будущем, что является затруднительным, поскольку оно может развиваться по-разному у разных людей.

Пока надежность и валидность теста не определены, его не применяют в психологической практике. Многое зависит от того, в каких областях применяются тесты. Есть учебные, профессиональные и прочие тесты, которые применяются в отдельных учреждениях для прогнозирования и выявления характеристик претендентов.

На сайте психологической помощи psymedcare.ru вы также можете пройти тесты, которые уже обладают высокой валидностью и показывают достоверные результаты.

перейти наверх

Что такое валидность методики?

Что такое валидность методики? Это показатель, который обозначает, занимается ли рассматриваемая методика изучением того качества, характеристики, для которой она предназначена.

При этом делается акцент на том, что испытуемый, который проходит тестирование, может иначе видеть и характеризовать самого себя.

Вот почему не всегда результаты учитывают мнение людей, которые могут не замечать за собой определенных характеристик.

Валидизацией называется проверка валидности методики. Чтобы определить действенность, эффективность, практичность используемой методики, применяется внешний независимый показатель – качество, которое наблюдается в повседневной жизни. Здесь выделяют 4 типа внешних показателей:

Критерий исполнения – затраченное время, количество работы, уровень успеваемости, рост профессиональных навыков и т. д.
Субъективные критерии – мнение, взгляды, предпочтение, отношение испытуемого к кому- или чему-либо. Здесь применяются анкеты, интервью, опросники.
Физиологические критерии – влияние внешнего мира на психику и организм человека. Здесь измеряются пульс, частота дыхания, симптомы утомления и пр.
Критерий случайности – возможен ли, к примеру, подбор лиц, которые не склонны к несчастным случаям? Изучение влияния определенного случая.

Теоретический поход в измерении валидности методов позволяет распознать, действительно ли технология изучает именно то качество, для которого она была предназначена.

Валидность также определяется встречаемостью изучаемого качества. Хорошо, если оно является распространенным, что и делает методику нужной и полезной. Также важными становятся этические и культурные изменения общества.

перейти наверх

Итог

В психологической практике часто используются тесты и методики, которые помогают в изучении личности человека. Здесь речь идет в частности о внутренних параметрах, которые не видны глазом.

Качества характера, манера поведения, возможный прогноз на будущее, каким человек будет и какова будет его жизнь, — все это изучается различными тестами и методиками, которые преследуют единый итог – изучение человека.

Итогом успешного определения валидности того или иного инструмента является успешное познание каждого человека, несмотря на то, как он смотрит сам на себя. Люди часто не замечают за собой определенных качеств, редко смотрят на себя трезвым взглядом. Тесты и методики позволяют раскрыть в себе отдельные параметры.

Источник: http://PsyMedCare.ru/validnost-psihologii

Что такое валидность психологического эксперимента?

Автор Evgeniy в 23/11/2012. Опубликовано Психологические эксперименты и исследования

Что такое валидность психологического эксперимента?

Валидность — одно из фундаментальных понятий экспериментальной психологии. Что это такое, как определяется и на какие виды подразделяется?

Валидность — это степень соответствия методов, задач и результатов эксперимента. Абсолютно необходимо для теста иметь действительные результаты, которые могут быть измерены и интерпретированы.

Валидность не определяется единственной статистической величиной. Но имеет значение объем исследования, который демонстрирует отношения между тестом и поведением в результате него, подлежащим измерению.

Существуют три типа валидности:

Содержательная валидность

Этот тип валидности основывается на содержании в тесте всего возможного диапазона пунктов, подлежащих покрытию тестом.

В некоторых случаях, когда исследуется трудно определяемая грань, опытный эксперт может оценить уместность каждого пункта. Поскольку каждый эксперт обычно базирует рейтинг на субъективном мнении, тест следует оценить двум независимым экспертам по отдельности. Пункты, оцененные обоими экспертами, как релевантные, включаются в финальное исследование.

Валидность критериев

Тест считается валидным по критериям в тех случаях, когда демонстрирует свою эффективность в предположении критериев или индикаторов конструкции исследования. Существует два типа такой валидности:

параллельная валидность, подтверждаемая получением мер критериев, аналогичных экзаменационным оценкам. Таким образом проясняется степень, насколько точно оценки отражают текущее состояние человека относительно критерия. Например, на проверке уровня депрессии, у теста будет параллельная валидность при измерении данным образом текущего уровня депрессии испытуемого.

прогностическая валидность, происходящая в случае, когда меры по критерию получены единожды после испытания. Примеры теста с прогнозирующей валидностью — карьерные, или испытания способностей, определяющие, кто преуспеет или потерпит неудачу в определенном занятии.

Валидность конструкции

У теста определяется валидность конструкции, если он демонстрирует ассоциацию экзаменационной оценки с теоретическим предположением. Проверка умственных способностей — один из примеров инструментальных измерений, у которых должна присутствовать валидность конструкции.

Источник: http://aboutyourself.ru/eksperimenty/chto-takoe-validnost-psi-eksperimenta.html

Виды валидности

Валидность по своей сути — это комплексная характеристика, включающая, с одной стороны, сведения о том, пригодна ли методика для измерения того, для чего она была создана, а с другой стороны, какова ее действенность, эффективность, практическая полезность.

Проверка валидности методики называется валидизацией.

Для проведения прагматической валидизации методики, т. е. для оценки ее эффективности, действенности, практической значимости, обычно используется независимый внешний критерий — показатель проявления изучаемого свойства в повседневной жизни.

Таким критерием может быть и успеваемость (для тестов способностей к обучению, тестов достижений, тестов интеллекта), и производственные достижения (для методик профессиональной направленности), и эффективность реальной деятельности — рисование, моделирование и т. д.

(для тестов специальных способностей), субъективные оценки (для тестов личности).

4 типа внешних критериев:

критерии исполнения (в их число могут входить такие, как количество выполненной работы, успеваемость, время, затраченное на обучение, темп роста квалификации и т. п.
);
субъективные критерии (они включают различные виды ответов, которые отражают отношение человека к чему-либо или к кому-либо, его мнение, взгляды, предпочтения; обычно субъективные критерии получают с помощью интервью, опросников, анкет);
физиологические критерии (они используются при изучении влияния окружающей среды и других ситуационных переменных на организм и психику человека; замеряется частота пульса, давление крови, электросопротивление кожи, симптомы утомления и т.д.);
критерии случайностей (применяются, когда цель исследования касается, например, проблемы отбора для работы таких лиц, которые менее подвержены несчастным случаям).

Эмпирическая валидность

Если в случае с содержательной валидностью оценка теста производится за счет экспертов (устанавливающих соответствие заданий теста содержанию предмета измерения), то эмпирическая валидность измеряется всегда с помощью статистического коррелирования: подсчитывается корреляция двух рядов значений — баллов по тесту и показателей по внешнему параметру, избранному в качестве критерия валидности.

Конструктная валидность

Конструктная валидность имеет отношение к теоретическому конструкту самому по себе и включает в себя поиск факторов, объясняющих поведение при выполнении теста.

Как особый тип конструктная валидность канонизирована в статье Кронбаха и Миля (1955).

Авторы оценивали с помощью этого типа валидности все тестовые исследования, которые не были прямо направлены на предсказание некоторых значимых критериев. Исследование содержало информацию о психологических конструктахл.

Валидность «по содержанию»

Содержательная валидность требует того, чтобы каждое задание, задача или вопрос, принадлежащие к определенной области, имели равные шансы стать заданиями теста.

Валидность по содержанию оценивает соответствие содержания теста (заданий, вопросов) измеряемой области поведения. Тесты, составленные двумя командами разработчиков, проводятся на выборке испытуемых.

Надежность тестов подсчитывается путем расщепления заданий на две части, в результате чего получают индекс содержательной валидности.

«Прогностическая» валидность

«Прогностическая» валидность определяется также по достаточно надежному внешнему критерию, но информация по нему собирается некоторое время спустя после испытания.

Внешним критерием обычно бывает выраженная в каких-нибудь оценках способность человека к тому виду деятельности, для которой он отбирался по результатам диагностических испытаний.

Хотя этот прием наиболее соответствует задаче диагностических методик — предсказанию будущей успешности, применять его очень трудно. Точность прогноза находится в обратной зависимости от времени, заданного для такого прогнозирования.

Чем больше проходит времени после измерения, тем большее количество факторов требуется учитывать при оценке прогностической значимости методики. Однако учесть все факторы, влияющие на предсказание, практически невозможно.

«Ретроспективная» валидность

Она определяется на основе критерия, отражающего события или состояние качества в прошлом. Может быть использована для быстрого получения сведений о предсказательных возможностях методики.

Так, для проверки того, в какой мере хорошие результаты теста способностей соответствуют быстрому обучению, можно сопоставить прошлые оценки успеваемости, прошлые экспертные заключения и т.д.

у лиц с высокими и низкими на данный момент диагностическими показателями.

Конвергентная и дискриминантная валидность

От того, как психолог определяет диагностический конструкт, зависит стратегия включения в тест определенных пунктов. Если Айзенк определяет свойство «нейротизм» как независимое от экстраверсии-интроверсии, то это означает, что в его опроснике примерно поровну должны быть представлены пункты, с которыми будут соглашаться невротичные интроверты и невротичные экстраверты.

Если же на практике окажется, что в тесте будут преобладать пункты из квадранта «Нейротизм-Интроверсия», то, с точки зрения теории Айзенка, это означает, что фактор «нейротизм» оказывается нагруженным иррелевантным фактором — «интроверсией».

(Точно такой же эффект возникает, если появится перекос в выборке — если в ней будет больше невротичных интровертов, чем невротичных экстравертов.)

Для того чтобы не сталкиваться с такими сложностями, психологи хотели бы иметь дело с такими эмпирическими показателями (пунктами), которые однозначно информируют только об одном факторе. Но это требование реально никогда не выполняется: всякий эмпирический показатель оказывается детерминированным не только тем фактором, который нам нужен, но и другими — иррелевантными задаче измерения.

Таким образом, по отношению к факторам, которые концептуально определяются как ортогональные к измеряемому (встречающиеся с ним во всех комбинациях), составитель теста должен при отборе пунктов применить стратегию искусственного балансирования.

Соответствие пунктов измеряемому фактору обеспечивает конвергентную валидность теста. Сбалансированность пунктов относительно иррелевантных факторов обеспечивает дискриминантную валидностъ. Эмпирически она выражается в отсутствии значимой корреляции с тестом, измеряющим концептуально независимое свойство.

Источник: http://www.psyworld.ru/for-students/cards/psychodiagnostics/735-2009-08-28-14-52-44.html

Виды валидности

Понятие «валидность» ввел в употребление Д. Кэмпбелл. Различают внутреннюю и внешнюю валидность эксперимента. Существуют также конструктная и операциональная валидности.

Внутренняя валидность характеризует меру влияния на изменение зависимой переменной тех условий (независимой переменной), которые варьирует экспериментатор.

Чем больше влияют на изменение зависимой переменной неконтролируемые исследователем условия, тем ниже внутренняя валидность эксперимента. Высокая внутренняя валидность — главный признак хорошего эксперимента.

Внутренняя валидность тем выше, чем больше вероятность того, что экспериментальный эффект (изменение зависимой переменной) вызван изменением независимой переменной.

Кэмпбелл выделил несколько основных факторов, нарушающих внутреннюю валидность эксперимента. 1. Селекция — неэквивалентность групп по составу, которая вызывает систематическую ошибку в результатах (например, исследуются группы младших школьников, но одни из обычных классов, а другие — из класса коррекции) 2.

Статистическая регрессия — частный случай ошибки селекции, когда группы отбирались на основе «крайних» показателей (допустим, исследовали очень глупых и очень умных детей, а считалось, что взяли «середнячков»). 3.

Экспериментальный отсев — неравномерное выбывание испытуемых из сравниваемых групп, приводящее к неэквивалентности групп по составу.

4. Естественное развитие — изменение испытуемых, являющееся следствием течения времени, без связи с конкретными событиями изменение состояния (голод, усталость, болезнь и др.), свойств индивида (возрастные перемены, накопление опыта и т.п.). Также на нарушение внутренней валидности влияет большое количество побочных переменных.

Внешняя валидность определяет, в какой мере результаты, полученные в эксперименте, будут соответствовать жизненной ситуации, послужившей «первообразом» для эксперимента.

Кроме того, внешняя валидность характеризует возможность обобщения, переноса результатов, полученных в эксперименте, на весь класс жизненных ситуаций, к которым принадлежит «первообразная», и на любые другие.

В принципе возможны такие эксперименты, которые не соответствуют никаким реальным жизненным ситуациям, а служат лишь для проверки гипотез, источником которых является развитая теория. Например, эксперименты по сенсорной депривации или выработке классических условных рефлексов у собак не соответствуют никакой жизненной реальности.

Внешняя валидность иногда трактуется как характеристика эксперимента, определяющая возможность переноса (обобщения) полученных результатов на различные времена, места, условия и группы людей (или животных).

Однако возможность переноса является следствием двух причин: — соответствия условий эксперимента его «первообразной» жизненной ситуации («репрезентативность» эксперимента) (например, исследование мотивации учащихся — репрезентативный эксперимент, т.к.

все учащиеся находятся в ситуации учебной деятельности и так или иначе мотивированы на учебу);

— типичности самой «первообразной» ситуации для реальности («репрезентативность» ситуации). Выбранная для моделирования в эксперименте ситуация может быть совершенно нерепрезентативной с точки зрения жизни той группы испытуемых, которая участвует в эксперименте, или являться редкой и нетипичной (например, исследование поведения в экстремальных ситуациях пенсионеров села Банниково).

Кэмпбелл называет главные причины нарушения внешней валидности: 1. Эффект тестирования — уменьшение или увеличение восприимчивости испытуемых к экспериментальному воздействию под влиянием тестирования. 2.

Условия проведения исследования. Они вызывают реакцию испытуемого на эксперимент.

Следовательно, его данные нельзя переносить на лица, не принимавшие участия в эксперименте, этими лицами является вся генеральная совокупность, кроме экспериментальной выборки.

3. Интерференция экспериментальных воздействий. Испытуемые обладают памятью и обучаемостью. Если эксперимент состоит из нескольких серий, то первые воздействия не проходят для них бесследно и сказываются на появлении эффектов от последующих воздействий.

В реальной практике редко возникает возможность провести «правильное» исследование по всем законам и с учетом всех условий и требований.

В действительности чаще оказывается невозможным подобрать репрезентативные выборки, исключить эффекты селекции, выбывания, да и возможность переноса результатов на всю популяцию зачастую оказывается нереальной.

Поэтому в психологии разработаны так называемые планы квазиэкспериментов.

Квазиэкспериментом является любое исследование, направленное на установление причинной зависимости между двумя переменными («если А, то В»), в котором отсутствует предварительная процедура уравнивания групп или «параллельный контроль» с участием контрольной группы заменен сравнением результатов неоднократного тестирования группы (или групп) до и после воздействия.

Выбираются две естественные группы, например два параллельных школьных класса. Обе группы тестируются. Затем одна группа подвергается воздействию (ставится в особые условия деятельности), а другая — нет. Через определенное время обе группы проходят тестирование повторно. В педагогической практике большинство исследований проведено по типу квазиэкспериментальных.

Кэмпбелл ввел еще одно важное понятие, а именно — конструктную валидность. Она характеризует правильность обозначения (интерпретации) причины и экспериментального эффекта с помощью абстрактных терминов из обыденного языка или формальной теории.

Кэмпбелл отмечает, что установление внутренней валидности требует отбраковывания альтернативных объяснений связи между зависимой и независимой переменными. Установление конструктивной валидности требует отказа от альтернативных интерпретаций соотношения причины и следствия с понятиями, взятыми из той или иной теории.

Таким образом, конструктная валидность определяется правильностью употребления терминов той или иной теории при интерпретации данных эксперимента.

На основе теории выдвигается гипотеза, которая в конечном счете и проверяется в эксперименте. Методики и план эксперимента должны соответствовать проверяемой гипотезе — степень этого соответствия и характеризует операциональную валидность.

Например, исследовать степень притязаний с помощью анализа степени привлекательности спутника (спутницы) испытуемого нельзя.

Источник: https://psyera.ru/vidy-validnosti_8114.htm

Валидность психологического эксперимента

1 Планирование как средство повышения валидности эксперимента 1.1 Валидность и использование мысленных образцов эксперимента 1.2 Виды валидности при оценке психологического эксперимента 1.3 Конструктная валидность и концептуальные репликации 1.4 Специфика оценки валидности лабораторного эксперимента 1.

5 Валидность эксперимента и валидность выводов 2 Компоненты содержательного и формального планирования 2.1 Подходы к определению термина «планирование эксперимента». Выбор из возможных экспериментальных планов 2.2 Содержательное планирование и выбор типа эксперимента 2.3 Зависимость обобщения от типа проводимого эксперимента 2.

4 Статистические решения и формальное планирование 2.5 Валидность как цель экспериментального контроля

Список использованных источников

1 Планирование как средство повышения валидности эксперимента

1.1 Валидность и использование мысленных образцов эксперимента

Оценка валидности реально проводимых экспериментов совершается путем использования неких «внутренних очков», сквозь призмы которых удается увидеть направления возможных или уже сделанных ошибок при планировании и проведении эксперимента. Р. Готтсданкер использовал удобный прием представления в качестве таких направлений мысленных образцов эксперимента.

Не следует путать понятия «мысленный эксперимент» (МЭ) и «мысленный образец» эксперимента. МЭ может быть понят, во-первых, как принятый норматив размышлений психолога на всех этапах следования логике экспериментальной проверки психологической гипотезы.

Во-вторых, МЭ может рассматриваться в контексте использования психологом мысленных образцов с целью оценивания контроля угроз выводу об эмпирической зависимости. В-третьих, МЭ может представлять такой эксперимент, который нереализуем из-за отсутствия средств операционализации переменных, принятия определенных этических нормативов или экономических соображений и т.д.

В первых двух случаях путь мысленного экспериментирования – это обсуждение экспериментальной модели, задающей интересующую исследователя связь между переменными, когда анализируется реально проведенный или планируемый для реального сбора данных эксперимент. В третьем случае МЭ может представлять схему заведомо ирреального, т.е. в принципе нереализуемого исследования.

В нем, однако, представлен путь возможной организации выводов, если бы исследователю были доступны предполагаемые формы экспериментального контроля. Как и реально проводимый эксперимент, мысленный эксперимент является средством проверки не любых психологических гипотез. Детерминистски сформулированные гипотезы, проверяемые в МЭ, могут быть каузальными и структурно-функциональными.

Последние не являются предметом экспериментирования в узком смысле этого термина, но могут направлять построение, например, формирующих экспериментов. Методы теоретического моделирования, более отвечающие проверке структурно-функциональных гипотез, не рассматриваются в данном учебнике, построенном как введение в эксперимент в качестве метода сбора эмпирических данных.

При планировании психологического эксперимента МЭ может быть понят и как осуществляемый во внутреннем, умственном плане ход экспериментальной деятельности, внешне реально развернутой в этапах проведения эксперимента.

Собственно, все этапы планирования – это варианты мысленного экспериментирования с целью определения наилучших форм экспериментального контроля, выбора лучшего из возможных экспериментальных планов. Наряду с планированием в функции мысленного эксперимента входит обоснование или оценка валидности реально проводимых экспериментов.

Мысленные образцы, по отношению к которым оцениваются свойства реально проводимого эксперимента, позволяют обсуждать основные аспекты «правильности» построения экспериментальной модели. Правильность означает в данном случае лишь степень приближения к наилучшему мысленному воплощению экспериментальных условий, соответствующих конкретной экспериментальной гипотезе.

Экспериментатор может правильно или неправильно выбрать и обосновать переменные, методики как средства операционализации этих переменных. Экспериментатор может ввести смешения НП с другими переменными или удачно избежать смешений.

Он может получить более или менее надежные данные, установив то или иное количество проб на каждое из условий НП; может обеспечить случайность разброса условий побочных переменных по уровням НП или не проконтролировать несистематическую изменчивость (НП, ЗП, побочных факторов). Именно такое прочтение функций мысленных образцов представлено в использованных Р. Готтсданкером понятиях идеального и бесконечного экспериментов, экспериментов полного соответствия и безупречного. Все эти четыре термина служат для уточнения критериев, в соответствии с которыми необходимо оценивать успешность планирования, организации и проведения эксперимента, осуществляемого реально.

В контексте рассматриваемых нормативов профессиональных рассуждений психолога термин «мысленный эксперимент» – один из таких нормативов (или «внутренних очков»), используя которые психолог может ответить на многие вопросы относительно достигнутого уровня эмпирической подкрепленности проверяемой каузальной гипотезы.

Однако нет рецепта, как пользоваться этими «очками» в каждом конкретном случае. Иногда от них нужно отказаться, если тип исследования не таков, чтобы применять к нему сложившиеся нормативы экспериментальной оценки гипотезы.

Однако такой отказ не следует путать с неумением правильно организовать и проводить психологический эксперимент.

1.2 Виды валидности при оценке психологического эксперимента

Виды валидности – это направления сравнений реально проводимых экспериментов с мысленными образцами. Оценка валидности связана как с оценкой реализации выбранных форм экспериментального контроля, так и с оценкой системы умозаключений при организации исследования с точки зрения следования нормативам экспериментального вывода.

Нормативы, связанные с возможными обобщениями из психологических экспериментов, предполагают разведение разных видов валидности. Внутренняя и внешняя валидность – обязательно обсуждаемые аспекты правильного эксперимента, будь то эксперимент в научных или практических целях.

Отличия в выводах из этих экспериментов будут касаться того, как строится обобщение: переносится ли оно на других людей, другие ситуации, виды деятельности или на теоретическую модель. Внутренняя валидность эксперимента обеспечивает вывод только об исследуемой зависимости, т.е.

об отношении между независимой и зависимой переменными, но ничего не сообщает о возможности ее распространения за пределы данной экспериментальной ситуации.

Если полученные данные характеризуются ненадежностью или наличием смешений (систематических, несистематических, сопутствующих), то нельзя считать обоснованным утверждение, формулируемое в экспериментальной гипотезе, даже если получен соответствующий ей экспериментальный эффект.

Если внутренняя валидность проведенного эксперимента оценивается высоко, то из этого также еще не следует, что установленная экспериментально зависимость соответствует чему-либо в реальности. Так, в лабораторных экспериментах экспериментальная модель может представлять модель научную, репрезентирующую определенные связи между операционализированными переменными.

Возможны случаи, когда для этих моделей потом не находятся те виды субъективной реальности, которые они были призваны репрезентировать в экспериментальной ситуации. Тем самым не находится той эмпирии, на которую можно было бы перенести обобщение установленной в эксперименте зависимости.

Внешняя солидность, предполагающая решение проблем соответствия (НП, ЗП, ДП), обеспечивает возможность обобщения на те виды ситуаций или виды деятельности, которым соответствуют экспериментально контролируемые переменные. Если речь идет о теоретических обобщениях, то оценка внешней валидности уступает место оценке конструктной валидности.

Решение вопросов о конструктной и внешней валидности приводит исследователя к выбору типа эксперимента: естественного («дублирующего реальный мир»), искусственного (улучшающего реальный мир) или лабораторного.

Необходимо различать системы теоретических положений, предполагающих, что они имеют отношение к миру реальности (для психологических теорий это мир субъективной, или психологической, реальности), и положений, не нацеленных на соотнесение мира теории и эмпирии (как онтологической реальности, если пользоваться терминологией П. Фресса и Ж. Пиаже).

Это различение может касаться авторской позиции: «если моей теории в мире реальности ничего не соответствует, то пусть ей – реальности – будет хуже». Оно может быть следствием того, что сформулированным психологическим конструктам не было найдено соответствия на уровне опытных данных.

При рассмотрении особенностей экспериментального метода речь идет несколько о другом – о возможности эмпирически оценивать теоретические каузальные объяснения. Экспериментальный метод предполагает построение исследования с целью отвержения неадекватных объяснений или «неверных» теорий как не соответствующих эмпирически установленным зависимостям.

Чаще неразличение продуктивного теоретизирования и псевдотеоретизирования связано с тем, что всегда необходим существенный «прорыв» в обобщении, чтобы соотнести хотя бы посредством гипотетических конструктов закономерности, устанавливаемые при построении экспериментальных ситуаций (экспериментальных моделей) и теоретических моделей.

Только содержательное обсуждение устанавливаемой в каузальной гипотезе связи между переменными, учитывающее объяснительные принципы, сложившиеся в рамках конкретных психологических школ, позволяет исследователю настаивать на реальности, т.е. «эмпирической загруженности», стоящих за переменными психологических понятий и исследуемых зависимостей.

Анализ эмпирической загруженности следующих из теории гипотез выполняет при этом существенную роль «ограничителя» для утверждения псевдозакономерностей.

Понятие конструктной валидности охватывает соответствующий аспект оценки правильности построения эксперимента: насколько обоснованным был переход от представленных в теоретической гипотезе понятий – психологических конструктов к эмпирическим их репрезентациям как НП, ЗП, ДП, а также насколько объяснение установленной зависимости действительно следует из представляемой автором теории.

Еще до выбора конкретных методик или уже при их обосновании экспериментатор осуществляет тот «прорыв» в обобщении (от теории к эмпирии), который связан с множественностью экспериментальных воплощений универсальных высказываний. Один и тот же конструкт (например, понятие агрессии или фрустрации) может предполагать разные модели возникновения и регуляции исследуемых феноменов, т.е.

всегда возникает вопрос, какая авторская позиция стоит за используемым психологическим понятием. Эта позиция во многом определит, как будут конкретизированы переменные на уровне экспериментальной и контргипотез.

Уже рассмотренная проблема возможной множественной интерпретации одной и той же экспериментальной зависимости фиксирует другой аспект конструктной валидности, а именно: насколько обоснованным выглядит авторское введение гипотетических конструктов в каузальную зависимость как объяснение связи между НП и ЗП.

Известно, что отсутствие сильных конкурирующих объяснений – это третье условие причинного вывода. В реальности конкурирующие объяснения остаются всегда, вопрос только в том, насколько более обоснованной выступает авторская интерпретация по сравнению с другими объяснениями той же установленной зависимости.

Понятно, что эта оценка – содержательная, а не только формально-логическая (что тоже должно учитываться – как проявление логической компетентности автора).

Само принятие той или иной позиции может характеризовать пристрастия экспериментатора, однако оценка конструктной валидности уже не может быть столь же пристрастной, поскольку она связана с отражением в гипотезе накопленных знаний об исследуемой реальности. Проблема не в различении старых и новых гипотез, которые в разной степени подкреплены эмпирическими доводами. В.

Налимов назвал эту проблему одним из парадоксов в понимании развития науки, по К. Попперу. Парадоксальным выглядит тот факт, что новая гипотеза, в пользу которой имеется меньше теоретических и эмпирических доводов, со временем вытесняет старую, обычно более хорошо подкрепленную проведенными исследованиями. Проблема в том, как автору добиться согласия предполагаемого профессионального читателя отчета об исследовании с тем, что автор эксперимента достоверно представил на уровне эмпирических реалий теоретически подразумеваемые конструкты, а не осуществил их вольную или невольную подмену другими. Итак, оценка обоснованности перехода от уровня теоретических положений к уровню экспериментальной и контргипотезы – вопросы конструктной валидности эксперимента. Решение проблем операционализации переменных в методических процедурах их измерения (и управления) – вопросы операциональной валидности. Если обобщение зависимости включает перенос ее на «жизненные», т.е. реальные, виды ситуаций и деятельности человека – это решение проблем соответствия переменных с точки зрения внешней, или, как ее теперь иногда называют, экологической валидности. Оценка операциональной валидности охватывает этап перехода от уже сформулированных экспериментальных и контргипотез к процедурам их методического воплощения. Одна и та же переменная может быть представлена показателями разных методик. Одна и та же мысленная модель эксперимента может быть реализована при достаточно разном «техническом» или операциональном воплощении управляемых и измеряемых переменных. Популяционные гипотезы, имеющие целью перенос обобщений на конкретные группы людей и целые популяции, могут оцениваться с помощью использования мысленных образцов, но не могут быть проверены в умственном плане. Те дополнительные переменные, которые должны быть учтены исследователем в целях обобщения, не обеспечивают обоснования условий необходимости или достаточности в контексте представленности в реальном поведении людей или в реальных ситуациях действия именно тех механизмов, которые рассматривались в МЭ.

Факторы, угрожающие внутренней валидности эксперимента, рассматриваются в связи с обсуждением формального планирования как условия принятия решений об экспериментальном факте. Разработка межгрупповых или интраиндивидуальных планов направлена в первую очередь на обеспечение контроля внутренней валидности.

Применительно к стратегиям отбора испытуемых в группы из популяций следует также обсуждать взаимосвязь внешней (популяционной) и внутренней валидности, поскольку этими стратегиями решаются одновременно две задачи: обеспечение репрезентативности выборки испытуемых, и эквивалентности сравниваемых групп.

Загрузить весь реферат >>>

Источник: http://neparsya.net/referat/psychology/psych8