Фактор фона в экспериментальной психологии. Шпаргалка: Экспериментальная психология

Валидность исследования – это характеристика достоверности его результатов. Выделяют внутреннюю и внешнюю валидность экспериментального исследования. Внутренняя валидность заключается в вопросе о том, насколько в установленном в эксперименте факте отра­жена подлинная связь “причина – следствие”. Д. Кемпбелл так определяет внутреннею валидность: действительно ли именно экспериментальное воздействие (независимая переменная) привело к изменениям в данном эксперименте (зависимая переменная).

Внешняя валидность касается того, насколько обобщаемым и экстраполируемым является установ­ленный в эксперименте факт для генеральной совокупности в целом: можно ли распространить полученные в эксперименте результа­ты на представителей генеральной совокупности, на других людей, не участвовавших в эксперименте.

Д. Кэмпбелл выделил факторы, нарушающие внутреннюю валидность психологического эксперимента. Первая группа факторов назевается факторами выборки :

1) cелекция – неэквивалентность групп по составу, вызывающая появление систематической ошибки в результатах;

2) cтатистическая регрессия частный случай селекции, связанный с отбором групп на ос­нове “крайних” показателей измеренных переменных, например, высоко- и низкоактивные участники;

3) отсев участников – неравномерное выбывание испытуе­мых из сравниваемых групп;

4) естественное развитие участников , являющееся следствием течения времени.

Вторая группа факторов, нарушающих внутреннюю валидность психологического эксперимента, называется побочными факторами :

1) фактор фона, или “истории” – конкретные события, которые могут произойти в период проведения эксперимента и повлиять наряду с экспериментальным воздействием на поведение участников;

2) фактор тестирования – влияние процедуры измерения на результаты повторного тестирования;

3) инструментальная погрешность , ненадежность измерительного инструмента;

Факторы, нарушающие внешнюю валидность эксперимента:

1) условия проведения эксперимента как фактор, вызываю­щий неадекватную реакцию испытуемых на участие в исследовании;

2) взаимное наложение экспериментальных воздействий - остаточные “следы” более ранних экспериментальных воздей­ствий - “научение”.

Таким образом, основными характеристиками эксперимента как базового метода исследования являются выделение зависимой, независимой, внешней переменных; формирование контрольной и экспериментальной групп; контроль валидности, в частности предварительным планированием эксперимента. Элементом планирования выступает выбор конкретного исследовательского плана.

Вопросы для самопроверки

1. В чем заключаются признаки причинно-следственных связей?

2. В чем состоит отличие независимой и внешней переменных?

3. Каковы фундаментальные признаки экспериментального исследования?

4. В чем заключается процедура контроля в психологическом эксперименте?

5. Какие существуют способы контроля внешних переменных?

6. С какой целью в эксперимент вводят контрольную группу?

7. В чем состоит суть критерия репрезентативности при формировании эксперименталь­ной выборки?

8. Чем отличается внутренняя валидность экспериментального исследования от внешней?

9. Что такое рандомизация?

10. В чем заключается процедура манипулирования независимой переменной?

Тема 4. планирование эксперимента

Исследовательский план – это порядок действий экспериментатора со специально отобранными группами участников исследования.

В современной психологии выделяют четыре базовых исследовательских плана (дизайна, стратегии, схемы) проведения эмпирических психологических исследований:

1) введение какого-либо воздействия в контролируемые условия и измерение эффекта его влияния на поведение уча­стников (истинное экспериментальное исследование );

2) выбор группы, обладающей определенными свойствами, напри­мер, группы подростков с асоциальным поведением, измерение психологи­че­ских ха­рактеристик этой группы и их сравнение с аналогичными харак­тери­стиками контрольной группы, например, группы подростков с просоциальным пове­дением (сравнительное исследование );

3) наблюдение поведения людей в естественных условиях и фиксирова­ние вербальных и невербальных показателей (исследование с применением метода наблюдения );

4) выявление характера связи между двумя изучаемыми характеристиками у одной и той же группы людей (корреляционное исследование ).

Рассмотрим первый и второй исследовательские планы.

Истинные экспериментальные планы

Ранее были обозначены фундаментальные признаки экспериментального исследования (тема 3).

1. Наличие процедуры непосредственного манипулирования уровнями независимой переменной.

2. Контроль сопутствующих внешних переменных. Рандомизации участников эксперимента как частный случай контроля внешних переменных, связанных с индивидуальными особенностями испытуемых.

3. Наблюдение и фиксирование изменений зависимой переменной в контрольной и экспериментальной группах.

Наличие данных признаков характерно для истинных экспериментальных исследований , которыепозволяютс высокой вероятностью установить причинно-следственные связи между явлениями.

Истинное экспериментальное исследование строится по 4-м планам, выделенным Д. Кэмпбеллом, которые различаются способом контроля валидности. При их описании используем следующие символы:

R – процедура рандомизации участников исследования.

X – процедура экспериментального воздействия в виде манипулирования уровнями независимой переменной.

X 1 , X 2 (X с нижним индексом в виде арабской цифры) – разные уровни независимой переменной.

О – наблюдение и фиксирование изменений зависимой переменной.

O 1 , O 2 (O с нижним индексом в виде арабской цифры) – количество наблюдений зависимой переменной.

О I , O II (О с верхним индексом в виде римской цифры) – моменты времени наблюдений зависимой переменной.

Контрольная и экспериментальная группы обозначаются соответственного КГ и ЭГ.

План 1. План для двух рандомизированных групп с тестированием после воздей­ствия . (План Р.А. Фишера).

Равенство экспериментальной и контрольной групп является необ­ходимым условием применения этого плана и достигается рандомизацией. Если рандомизация проведена качественно, то этот план позволяет контролировать боль­шинство факторов, нарушающих валидность эксперимента.

После проведения рандомизации как процедуры уравнивания групп осуще­ствляется экспериментальное воздействие (Х). Если необходимо использовать не один уровень воздействия, то применяются пла­ны с несколькими экспериментальными группами (по числу уровней воздействия) и одной контрольной.

Поскольку предварительное тестирование отсут­ствует, исключен эффект тестирования. Однако при проведении большинства психологических экспериментов необходимо жестко фиксировать исходный уровень зависимой переменной, например, интеллект, тревож­ность, знания, статус личности в группе и т.п. Данный контроль возможен с помощью процедуры рандомизации. Если возникает сомнение по поводу качества ее проведения, применяют план с предварительным тестированием.

План 2. План для двух рандомизированных групп с предварительным и итоговым тестированием (план “тест-воздействие-ретест”).

ЭГ R O 1 I X O 2 II

КГ R O 3 I O 4 II

Этот план контролирует фактор “фона”, или “истории”, так как в промежутке между пер­вым и вторым тестированием обе группы подвергаются одинаковым “фоновым” воздействиям. Естественное развитие и эффект тестирования контролируются за счет того, что они одинаково проявляются в экспериментальной и контрольной группах, а эффек­ты неэквивалентности групп – при помощи проце­дуры рандомизации.

Главный фактор, нарушающий внешнюю валидность этого плана, – взаимодействие тестирования с экспериментальным воздействием. Напри­мер, тестирование уровня знаний по определенному предмету перед проведением эксперимента по заучиванию материала может привести к актуализации исходных знаний и к общему повышению продуктивности запоминания. Достигается это за счет создания установки на запоми­нание.

Для контроля данного фактора, снижающего внешнюю валидность, используется план Р.Л. Соломона, предложенный им в 1949 г.

План 3. План Соломона включает исследование двух экспериментальных и двух контрольных групп.

ЭГ 1 R O 1 I X O 2 II

КГ 1 R O 3 I O 4 II

ЭГ 2 R X O 5 II

План Соломона представляет собой объединение двух ранее рассмотренных пла­нов: первого, когда не производится предварительное тестирование, и второго – “тест-воздействие-ретест”. С помощью “первой части” плана можно контроли­ровать эффект взаимодействия первого тестирования и экспериментального воздей­ствия.

Сравнение O 2 и O 4 позволяет выявить эффект экспериментально­го воздействия - влияние независимой переменной на зависимую. Сравнение O 1 и O 2 , а также O 3 и O 4 показывают эффект предварительного тестирования.

План 4. Лонгитюдный план.

ЭГ 1 R O 1 I X O 2 II

КГ 1 R O 3 I O 4 II

ЭГ 2 R O 5 I X O 6 III

КГ 2 R O 7 I O 8 III

В случае необходимости проверить сохранение во времени эф­фекта воздействия независимой переменной на зависимую, например, выяснить, приводит ли новый метод обучения к долгосрочному запоминанию материала, применяют лонгитюдныйплан.

Планы сравнительного исследования

Сравнительные исследования – это виды исследований, в которых отсутствуют или нарушаются обозначенные выше фундаментальные признаки истинного экспериментального исследования. Сравнительные исследования также называют квазиэкспериментальными. Квазиэксперимент (от лат. quasi – напоминающий, подобный) – план исследования, при котором экспериментатор отказывается от полного контроля за переменными ввиду его неосуществимости по объективным причинам.

По мнению В.Н. Дружинина, квазиэкспериментальные планыявляются попыткой учета объективной реальности жизни при проведении эмпирических исследований. Условия, в которые ставит жизнь, а также практические задачи исследователей не всегда позволяют реализовать планы “истинных экспериментов”, использовать схемы контроля внешних переменных. … Исследователь осознает те внешние перемен­ные, которые он не может контролировать. … Квазиэкспериментальный план используется тогда, когда применение истинного плана невозможно.

В качестве основных выделяют два типа квазиэкспериментальных планов: 1) планы экспериментов для неэквивалентных (неодинаковых по одному или нескольким признакам) групп; 2) планы ex-post-facto, когда исследуются участники уже происшедшего события.

План 1. План для неэквивалентных групп

В исследовании участвуют две естественные группы, например, два параллельных школьных класса. Обе группы тестируются. Затем одна группа подвергается воздействию, ста­вится в особые условия деятельности, а другая – нет. Через определенное время обе группы проходят тестирование повторно. Разница результатов первичного тестирования двух групп (О 1 и О 3) позволяет установить меру их эквивалентности в отношении измеряе­мой зависимой переменной. Результаты первого и второго тести­рования обеих групп сопоставляются. Для выявления эффекта действия независимой переменной сравнивают О 2 и О 4 . Значимость различий показателей будет свиде­тельствовать о влиянии независимой переменной на зависимую. Различие О 2 и О 4 свидетельствует о естественном развитии и фоновом воздействии.

План 2. План ex-post-facto .

В плане ex-post-factoэкспериментатор сам не воздействует на испытуемых. В качестве воздействия (независимой переменной) выступает некоторое реальное собы­тие из их жизни. Отбирается группа “испытуемых”, подвергшаяся воздействию, и группа, не испытавшая его. Отбор осуществляется на основании личных воспоминаний и автобиографий, сведений из архивов, анкетных данных, медицин­ских карт и т.д. Затем проводится тестирование зависимой переменной у предста­вителей “экспериментальной” и контрольной групп. Данные, полученные в резуль­тате тестирования групп, сопоставляются и делается вывод о влиянии “естествен­ного” воздействия на дальнейшее поведение испытуемых.

Вопросы для самопроверки

1. Каковы фундаментальные признаки истинного экспериментального исследования?

2. Какие факторы нарушения валидности позволяет контролировать план Р.А. Фишера?

3. Что такое квазиэксперимент?

4. Чем отличаются истинные эксперименты от квазиэкспериментов?

5. С какой целью в плане Соломона используют две контрольные и две экспериментальные группы?

6. Что подразумевают под лонгитюдным планом исследования?

7. Позволяют ли сравнительные исследования устанавливать причинно-следственные связи?

8. В чем состоит суть реализации плана ex-post-facto?

Дональд Кэмпбелл выделяет факторы, угрожающие внутренней валидности, к которым относятся следующие:

1) фактор фона;

2) естественного развития;

3) эффекта тестирования;

4) инструментальной погрешности (нестабильности измерительного инструмента);

5) статистической регрессии;

6) отбора испытуемых;

7) отсева в ходе эксперимента.

А также факторы, угрожающие внешней валидности:

1) реактивный эффект (эффект взаимодействия тестирования);

2) эффекты взаимодействия фактора отбора и экспериментального воздействия;

3) условия организации эксперимента, вызывающие реакцию испытуемых на эксперимент;

4) взаимная интерференция экспериментальных воздействий

В нашем исследовании на результаты могли повлиять следующие факторы внутренней валидности:

Фактор инструментальной погрешности. В нашем исследовании были использованы опросники, как инструменты измерения уровня нейротизма и оценки предпочитаемой музыки. Основные проблемы использования личностных опросников связаны с возможностью фальсификации ответов, а также со снижением достоверности полученных данных в силу влияния факторов, имеющих установочную природу, и различий в понимании вопросов испытуемых. Помимо этого на достоверность ответов существенно влияет интеллектуальная оценка вопросов испытуемых (особенности понимания вопросов). Анализируя проблемы, возникающие в связи с разработкой и применением личностных опросников необходимо подчеркнуть, что для измерения той или иной личностной переменной мы формулируем вопрос или утверждение, ответ на который, по нашему мнению, будет индикатором ее наличия (отсутствия). Однако нужно твердо помнить о том, что ответ на вопрос обусловлен действием весьма значительного числа факторов (например, отношение к обследованию, условия обследования, пол экспериментатора, понимание вопроса, уровень проникновения в свое "Я", жизненный опыт и т.д. и т.п.), лишь одним из которых является та переменная, которую мы стремимся измерить. Поэтому связь измеряемой личностной переменной с ответом будет выражаться статистически, а не детерминистически. Ответ испытуемого зависит от многих факторов, выступающих в различных связях и вариантах у разных лиц .

Фактор фона (истории) - конкретных событий, которые происходят между первым и вторым измерением наряду с экспериментальным воздействием. Данный фактор повлиял на наше исследование, ввиду того, что наше исследование производилось на 1 группе, которую в дальнейшем уже поделили на 2, по критерию эмоциональной устойчивости и неустойчивости. Введение контрольной группы в наше исследование, сняло бы влияние данного фактора. Также данный фактор мог повлиять потому, что исследование было продолжительным по времени и проведение исследования у всех испытуемых было не одинаковым. Ввиду этого могли повлиять различные события, происходящие с испытуемыми, которые мы могли бы не учесть, например: болезнь, усталость, плохое настроение, либо же кто-то из испытуемых начал слушать другую музыку и его представления о любимой музыке могли измениться .

Представленные выше факторы могли повлиять на результаты нашего исследования и поэтому исследование, имеет статус сравнительного исследования. Характерно неравномерность групп, проведение эксперимента неравномерно.

Анализ результатов оценок "Предпочитаемой музыки"

В ходе проведенного экспериментального исследования, где предполагалось, что представления о предпочитаемой музыке у учащихся с разным уровнем нейротизма отличаются, было получено следующее.

Результаты применения метода семантических универсалий для обработки семантического дифференциала показывают, что универсалиями для групп с высоким уровнем нейротизма являются: Любимый (-2,18), Свежий, (-2,56), Приятный (1,93), Сильный (1,81), Хороший (2,06). Для групп с низким уровнем нейротизма: Любимый (-1,81), Свежий (-1,93), Приятный (2,18), Умный (-1,81), Большой (-1,62), Дорогой (-1,68).

Общими универсалиями являются такие, как: любимый, свежий, приятный, что может отражать общие представления групп в независимости от уровня нейротизма (эмоциональной устойчивости или неустойчивости).

Для группы с высоким уровнем нейротизма были выделены такие характеристики как сильный и хороший, которые относятся к факторам силы и оценки. Лица с данным видом нейротизма характеризуются, как эмоционально неустойчивые, напористые, подвижные, часто имеют склонность слишком сильно эмоционально реагировать на возбуждение и с трудом возвращаются в нормальное состояние, также это результат неуравновешенности процессов возбуждения и торможения. Это проявляется как эмоциональная неустойчивость, несбалансированность нервно-психических процессов.

Для группы с низким уровнем нейротизма выделены следующие дескрипторы, относящиеся к факторам оценки: умный, большой, дорогой. Лица с низким уровнем нейротизма характеризуются как устойчивые, уравновешенные, спокойные.

В результате, можно сделать вывод о том, что представления о предпочитаемой музыке у учащихся ВУЗов с разным уровнем нейротизма имеют схожие значения так и различные. Отличия заключаются в том, что в представлениях респондентов с высоким уровнем нейротизма доминируют дескрипторы, относящиеся к факторам оценки и силы, а в группе учащихся с низким уровнем нейротизма в представлениях доминируют дескрипторы, принадлежащие только фактору оценки.

Таблица 1. Семантические универсалии представлений о предпочитаемой музыке у групп с высоким и низким уровнем нейротизма

Валидность соответствие конкретного исследования принятым стандартам / безупречному эксперименту / (Дружинин В.Н.); достоверность / или степень достоверности / вывода, которую обеспечивают результаты реального эксперимента по сравнению с результатами безупречного эксперимента. «Валидность» – центральное понятие словаря экспериментатора: оно объединяет основные цели исследования с идеальными эталонами их достижения и реальными процедурами проведения эксперимента.

Глобальной целью любого экспериментального исследования является обобщение полученных результатов и вывода об экспериментальной гипотезе. Однако полное достижение этой цели возможно лишь в мысленном, безупречном эксперименте, невыполнимом на практике. Реальный эксперимент в той или иной мере репрезентирует / представляет / безупречный, и чем лучше эта репрезентативность, тем выше валидность эксперимента. Таким образом, повышение валидности, т.е. планирование проведения эксперимента в соответствии с его безупречным образцом, является конкретной задачей исследователя, успешность решения которой зависит, во-первых, от характера реальных условий и, во-вторых, от адекватности выбора средств . Так, источники нарушения валидности (прежде всего, надежность и смешение) отдаляют реальный эксперимент от безупречного, а способы их контроля позволяют приблизиться к нему, т.е. обеспечить высокую валидность для обобщения экспериментальных результатов. Валидность полученных результатов можно оценить статистически: например, валидность теста (в корреляционном исследовании) определяется степенью корреляции результатов его выполнения с изучаемым видом деятельности испытуемых / Готтсданкер Р. /

Для конструирования и оценки экспериментальных процедур используются понятия: идеальный эксперимент, эксперимент полного соответствия и бесконечный эксперимент .

Идеальный эксперимент - это эксперимент, организованный таким образом, что экспериментатор изменяет лишь независимую переменную, зависимая переменная контролируется, а все остальные условия эксперимента остаются неизменными. Идеальный эксперимент предполагает эквивалентность всех испытуемых, неизменность их характеристик во времени, отсутствие самого времени. Он никогда не может быть осуществлен в реальности, так как в жизни изменяются не только интересующие исследователя параметры, но и ряд других условий.

Соответствие реального эксперимента идеальному выражается в такой его характеристике, как внутренняя валидность . Внутренняя валидность показывает достоверность результатов, которую обеспечивает реальный эксперимент по сравнению с идеальным. Чем больше влияют на изменение зависимых переменных не контролируемые исследователем условия, тем ниже внутренняя валидность эксперимента, следовательно, больше вероятность того, что факты, обнаруженные в эксперименте, являются артефактами. Высокая внутренняя валидность - главный признак хорошо проведенного эксперимента.



Д. Кэмпбелл выделяет следующие факторы, угрожающие внутренней валидности эксперимента : фактор фона, фактор естественного развития, фактор тестирования, погрешность измерения, статистическая регрессия, неслучайный отбор, отсеивание. Если они не контролируются, то приводят к появлению соответствующих эффектов.

Фактор фона (истории) включает события, которые происходят между предварительным и окончательным измерением и могут вызвать изменения в зависимой переменной наряду с влиянием независимой переменной.

Фактор естественного развития связан с тем, что изменения в уровне зависимой переменной могут возникнуть в связи с естественным развитием участников эксперимента (взросление, нарастание утомления и т. п.).

Фактор тестирования заключается во влиянии предварительных измерений на результаты последующих.

Фактор погрешности измерения связан с неточностью или изменениями в процедуре или методе измерения экспериментального эффекта.

Фактор статистической регрессии проявляется в том случае, если для участия в эксперименте были отобраны испытуемые с крайними показателями каких-либо оценок.

Фактор неслучайного отбора соответственно встречается в тех случаях, когда при формировании выборки отбор участников проводился неслучайным образом.

Фактор отсеивания проявляется в том случае, если испытуемые неравномерно выбывают из контрольной и экспериментальной групп.



Экспериментатор должен учитывать и по возможности ограничивать влияние факторов, угрожающих внутренней валидности эксперимента.

Эксперимент полного соответствия - это экспериментальное исследование, в котором все условия и их изменения отвечают реальности. Приближение реального эксперимента к эксперименту полного соответствия выражается во внешней валидности . От уровня внешней валидности зависит степень переносимости результатов эксперимента в реальность. Внешняя валидность, по определению Р. Готтсданкера, влияет на достоверность выводов, которую дают результаты реального эксперимента по сравнению с экспериментом полного соответствия. Для достижения высокой внешней валидности нужно, чтобы уровни дополнительных переменных в эксперименте соответствовали их уровням в реальности. Эксперимент, который не имеет внешней валидности, считается неверным.

К факторам, угрожающим внешней валидности, относят следующие:

- реактивный эффект (заключается в уменьшении или увеличении восприимчивости испытуемых к экспериментальному влиянию вследствие предыдущих измерений);

- эффект взаимодействия отбора и влияния (состоит в том, что экспериментальное влияние будет существенным только для участников данного эксперимента);

- фактор условий эксперимента (может привести к тому, что экспериментальный эффект может наблюдаться только в данных специально организованных условиях);

- фактор интерференции влияний (проявляется при предъявлении одной группе испытуемых последовательности взаимоисключающих влияний).

Заботу о внешней валидности экспериментов особо проявляют исследователи, работающие в прикладных областях психологии - клинической, педагогической, организационной, поскольку в случае невалидного исследования его результаты ничего не дадут при переносе их в реальные условия.

Так же выделяют следующие виды валидности:

Валидность экологическая – вид внешней валидности, характеризует соответствие процедуры и условий лабораторного исследования «естественной» реальности.

Валидность теоретическая /или прогностическая / - отношение идеального исследования к реальности.

Валидность операциональная – соответствие операций экспериментатора теоретическому описанию переменных, контролируемых в исследовании. Варьируемые экспериментатором условия должны соответствовать независимой переменной. Методики и план эксперимента должны соответствовать проверяемой гипотезе – степень этого соответствия и характеризует операциональную валидность.

Валидность конструктная – выражает адекватность метода интерпретации экспериментальных данных теории, т.е. структура экспериментального исследования выглядит следующим образом: теория – эксперимент – интерпретация – реальность./ Д.Кэмпбелл /. Конструктная валидность, по мнению Кэмпбелла, характеризует правильность интерпретации причины и экспериментального эффекта с помощью абстрактных терминов из обыденного языка или формальной теории. С точки зрения Кэмпбелла, хороший эксперимент должен:

1) выявлять временную последовательность предполагаемых причины и следствия;

2) показывать, что вероятные причины и эффект взаимосвязаны /ковариантны/;

3) исключать влияние побочных переменных, которым можно было бы объяснить экспериментальный эффект;

4) исключать альтернативные гипотезы о теоретических конструктах, объясняющих эту связь.

Валидность критериальная – отражает соответствие диагноза и прогноза, полученного на основе данных тестирования, деятельностным и жизненным показателям; включает в себя текущую и прогностическую валидность.

Валидность содержательная / очевидная / - соответствие целей и процедуры исследования обыденным представлениям испытуемого о природе изучаемого явления. Имеет мотивационное значение для испытуемых.

Бесконечный эксперимент предполагает неограниченное количество опытов, проб для получения все более точных результатов. Увеличение количества проб в эксперименте с одним испытуемым ведет к повышению надежности результатов эксперимента. В экспериментах с группой испытуемых повышение надежности происходит при увеличении числа испытуемых. Однако суть эксперимента состоит именно в том, чтобы на основе ограниченного числа проб или при помощи ограниченной группы испытуемых выявить причинно-следственные связи между явлениями. Поэтому бесконечный эксперимент не только невозможен, но и бессмыслен. Для достижения высокой надежности эксперимента количество проб или число испытуемых должно соответствовать изменчивости изучаемого явления.

Следует отметить, что при увеличении числа испытуемых повышается и внешняя валидность эксперимента , так как его результаты могут быть перенесены на более широкую популяцию. Для проведения экспериментов с группой испытуемых необходимо рассмотреть вопрос об экспериментальных выборках.


В.В. Никандров указывает, что достижение главной цели эксперимента – предельно возможной однозначности в понимании связей между явлениями внутренней психической жизни и их внешними проявлениями – достигается благодаря следующим основным характеристикам эксперимента:

1) инициатива экспериментатора в проявлении интересующих его психологических фактов;

2) возможность варьирования условий возникновения и развития психических явлений;

3) строгий контроль и фиксация условий и процесса их протекания;

4) изоляция одних и акцентирование других факторов, обусловливающих изучаемые феномены, которая дает возможность выявления закономерностей их существования;

5) возможность повторения условий эксперимента для многократной проверки получаемых научных данных и их накопления;

6) варьирование условий для количественных оценок выявляемых закономерностей.

Таким образом, психологический эксперимент можно определить как метод, при котором исследователь сам вызывает интересующие его явления и изменяет условия их протекания с целью установить причины возникновения этих явлений и закономерности их развития. Кроме того, получаемые научные факты могут неоднократно воспроизводиться благодаря управляемости и строгому контролю условий, что дает возможность их проверки, а также накопления количественных данных, на основе которых можно судить о типичности или случайности изучаемых явлений.

4.2. Виды психологического эксперимента

Эксперименты бывают нескольких видов. В зависимости от способа организации выделяют лабораторный, естественный и полевой эксперименты. Лабораторный эксперимент проводится в специальных условиях. Исследователь планово и целенаправленно воздействует на объект изучения, чтобы изменить его состояние. Достоинством лабораторного эксперимента можно считать строгий контроль за всеми условиями, а также применение специальной аппаратуры для измерения. Недостатком лабораторного эксперимента является трудность переноса полученных данных на реальные условия. Испытуемый в лабораторном эксперименте всегда осведомлен о своем участии в нем, что может стать причиной мотивационных искажений.

Естественный эксперимент проводится в реальных условиях. Его достоинство состоит в том, что изучение объекта осуществляется в контексте повседневной жизни, поэтому полученные данные легко переносятся в реальность. Испытуемые не всегда проинформированы о своем участии в эксперименте, поэтому не дают мотивационных искажений. Недостатки – невозможность контроля всех условий, непредвиденные помехи и искажения.

Полевой эксперимент проводится по схеме естественного. При этом возможно использование портативной аппаратуры, позволяющей более точно регистрировать получаемые данные. Испытуемые проинформированы об участии в эксперименте, однако привычная обстановка снижает уровень мотивационных искажений.

В зависимости от цели исследования различают поисковый, пилотажный и подтверждающий эксперименты. Поисковый эксперимент направлен на поиск причинно-следственной связи между явлениями. Он проводится на начальном этапе исследования, позволяет сформулировать гипотезу, выделить независимую, зависимую и побочные переменные (см. 4.4) и определить способы их контроля.

Пилотажный эксперимент – это пробный эксперимент, первый в серии. Он проводится на небольшой выборке, без строгого контроля переменных. Пилотажный эксперимент позволяет устранить грубые ошибки в формулировке гипотезы, конкретизировать цель, уточнить методику проведения эксперимента.

Подтверждающий эксперимент направлен на установление вида функциональной связи и уточнение количественных отношений между переменными. Проводится на заключительном этапе исследования.

В зависимости от характера влияния на испытуемого выделяют констатирующий, формирующий и контрольный эксперименты. Констатирующий эксперимент включает в себя измерение состояния объекта (испытуемого или группы испытуемых) до активного воздействия на него, диагностику исходного состояния, установление причинно-следственных связей между явлениями. Целью формирующего эксперимента является применение способов активного развития или формирования каких-либо свойств у испытуемых. Контрольный эксперимент – это повторное измерение состояния объекта (испытуемого или группы испытуемых) и сравнение с состоянием до начала формирующего эксперимента, а также с состоянием, в котором находится контрольная группа, не получавшая экспериментального воздействия.

По возможности влияния экспериментатора на независимую переменную выделяют спровоцированный эксперимент и эксперимент, на который ссылаются. Спровоцированный эксперимент – это опыт, в котором экспериментатор сам изменяет независимую переменную, при этом наблюдаемые экспериментатором результаты (виды реакций испытуемого) считаются спровоцированными. П. Фресс называет данный тип эксперимента «классическим». Эксперимент, на который ссылаются, – это опыт, в котором изменения независимой переменной осуществляются без вмешательства экспериментатора. К этому виду психологического эксперимента прибегают тогда, когда независимые переменные оказывают воздействие на испытуемого, значительно растянутое во времени (например, система воспитания и т. п.). Если воздействие на испытуемого может вызвать серьезное негативное физиологическое или психологическое нарушение, то такой эксперимент проводить нельзя. Однако бывают случаи, когда негативное воздействие (например, травма головного мозга) происходит в реальности. Впоследствии такие случаи могут быть обобщены и изучены.

4.3. Структура психологического эксперимента

Главными компонентами любого эксперимента являются:

1) испытуемый (исследуемый субъект или группа);

2) экспериментатор (исследователь);

3) стимуляция (выбранный экспериментатором способ воздействия на испытуемого);

4) ответ испытуемого на стимуляцию (его психическая реакция);

5) условия опыта (дополнительные к стимуляции воздействия, которые могут влиять на реакции испытуемого).

Ответ испытуемого является внешней реакцией, по которой можно судить о протекающих в его внутреннем, субъективном пространстве процессах. Сами эти процессы есть результат воздействия на него стимуляции и условий опыта.

Если ответ (реакцию) испытуемого обозначить символом R, а воздействия на него экспериментальной ситуации (как совокупности воздействий стимуляции и условий опыта) – символом S, то их соотношение можно выразить формулой R = =f (S). То есть реакция есть функция от ситуации. Но эта формула не учитывает активную роль психики, личности человека (P). В действительности реакция человека на ситуацию всегда опосредована психикой, личностью. Таким образом, соотношение между основными элементами эксперимента может быть зафиксировано следующей формулой: R = f (Р, S).

П. Фресс и Ж. Пиаже в зависимости от задач исследования выделяют три классических типа отношений между этими тремя компонентами эксперимента: 1) функциональные отношения; 2) структурные отношения; 3) дифференциальные отношения.

Функциональные отношения характеризуются вариативностью ответов (R) испытуемого (Р) при систематических качественных или количественных изменениях ситуации (S). Графически эти отношения можно представить следующей схемой (рис. 2).

Примеры функциональных отношений, выявленных в экспериментах: изменение ощущений (R) в зависимости от интенсивности воздействия на органы чувств (S); объем запоминания (R) от числа повторений (S); интенсивность эмоционального отклика (R) на действие различных эмоциогенных факторов (S); развитие адаптационных процессов (R) во времени (S) и т. п.

Структурные отношения раскрываются через систему ответов (R1, R2, Rn) на различные ситуации (Sv S2, Sn). Отношения между отдельными ответами структурируются в систему, отражающую структуру личности (Р). Схематически это выглядит так (рис. 3).


Примеры структурных отношений: система эмоциональных реакций (Rp R2, Rn) на действие стрессоров (Sv S2, Sn); эффективность решения (R1, R2, Rn) различных интеллектуальных задач (S1, S2, Sn) и т. п.

Дифференциальные отношения выявляются через анализ реакций (R1, R2, Rn) разных испытуемых (P1, P2, Pn) на одну и ту же ситуацию (S). Схема этих отношений такова (рис. 4).

Примеры дифференциальных отношений: разница скорости реакции у разных людей, национальные различия в экспрессивном проявлении эмоций и т. п.

4.4. Экспериментальные переменные и способы их контроля

Для уточнения соотношения всех факторов, входящих в эксперимент, введено понятие «переменная». Выделяют три вида переменных: независимые, зависимые и дополнительные.

Независимые переменные. Фактор, изменяемый самим экспериментатором, называется независимой переменной (НП).

В качестве НП в эксперименте могут выступать условия, в которых осуществляется деятельность испытуемого, характеристика заданий, выполнение которых требуется от испытуемого, характеристики самого испытуемого (возрастные, половые, иные различия испытуемых, эмоциональные состояния и другие свойства испытуемого или взаимодействующих с ним людей). Поэтому принято выделять следующие типы НП: ситуационные, инструктивные и персональные.

Ситуационные НП чаще всего не входят в структуру экспериментального задания, выполняемого испытуемым. Тем не менее они оказывают непосредственное воздействие на его деятельность и могут варьироваться экспериментатором. К ситуационным НП относятся различные физические параметры, например освещенность, температура, уровень шума, а также размер помещения, обстановка, размещение аппаратуры и т. п. К социально-психологическим параметрам ситуационных НП может быть отнесено выполнение экспериментального задания в изоляции, в присутствии экспериментатора, внешнего наблюдателя или группы людей. В.Н. Дружинин указывает на особенности общения и взаимодействия испытуемого и экспериментатора как на особую разновидность ситуационных НП. Этому аспекту уделяется большое внимание. В экспериментальной психологии существует отдельное направление, которое называется «психология психологического эксперимента».

Инструктивные НП связаны непосредственно с экспериментальным заданием, его качественными и количественными характеристиками, а также способами его выполнения. Инструктивной НП экспериментатор может манипулировать более или менее свободно. Он может варьировать материал задания (например, числовой, словесный или образный), тип ответа испытуемого (например, вербальный или невербальный), шкалу оценивания и т. п. Большие возможности заключаются в способе инструктирования испытуемых, информирования их о цели экспериментального задания. Экспериментатор может изменять средства, которые предлагаются испытуемому для выполнения задания, ставить перед ним препятствия, использовать систему поощрений и наказаний в ходе выполнения задания и т. д.

Персональные НП представляют собой управляемые особенности испытуемого. Обычно в качестве таких особенностей выступают состояния участника эксперимента, которые исследователь может менять, например различные эмоциональные состояния или состояния работоспособности-утомления.

Каждый испытуемый, участвующий в эксперименте, обладает множеством уникальных физических, биологических, психологических, социально-психологических и социальных признаков, которыми экспериментатор управлять не может. В некоторых случаях следует считать эти неуправляемые признаки дополнительными переменными и применять к ним способы контроля, о которых будет рассказано ниже. Однако в дифференциально-психологических исследованиях при применении факторных планов неуправляемые персональные переменные могут выступать в качестве одной из независимых переменных (подробно о факторных планах см. 4.7).

Исследователи различают также разные виды независимых переменных. В зависимости от шкалы представления можно выделить качественные и количественные НП. Качественным НП соответствуют различные градации шкал наименований. Например, эмоциональные состояния испытуемого могут быть представлены состояниями радости, гнева, страха, удивления и т. п. Способы выполнения заданий могут включать наличие или отсутствие подсказок испытуемому. Количественные НП соответствуют ранговым, пропорциональным или интервальным шкалам. Например, время, отведенное на выполнение задания, количество заданий, размер вознаграждения по результатам решения задач могут быть использованы как количественные НП.

В зависимости от количества уровней проявления независимых переменных различают двухуровневые и многоуровневые НП. Двухуровневые НП имеют два уровня проявления, многоуровневые – три или более уровней. В зависимости от количества уровней проявления НП строятся различные по сложности экспериментальные планы.

Зависимые переменные. Фактор, изменение которого является следствием изменения независимой переменной, называется зависимой переменной (ЗП). Зависимая переменная – это компонент в составе ответа испытуемого, который непосредственно интересует исследователя. В качестве ЗП могут выступать физиологические, эмоциональные, поведенческие реакции и другие психологические характеристики, которые можно зарегистрировать в ходе психологических экспериментов.

В зависимости от способа, с помощью которого можно зарегистрировать изменения, выделяют ЗП:

S наблюдаемые непосредственно;

S требующие физической аппаратуры для измерения;

S требующие психологического измерения.

К ЗП, наблюдаемым непосредственно, относятся вербальные и невербальные поведенческие проявления, которые четко и однозначно могут быть оценены внешним наблюдателем, например отказ от деятельности, плач, определенное высказывание испытуемого и т. п. К ЗП, требующим физической аппаратуры для регистрации, относятся физиологические (пульс, величина артериального давления и т. д.) и психофизиологические реакции (время реакции, латентное время, длительность, скорость выполнения действий и т. п.). К ЗП, требующим психологического измерения, относятся такие характеристики, как уровень притязаний, уровень развития или сформированности тех или иных качеств, форм поведения и т. п. Для психологического измерения показателей могут быть использованы стандартизированные процедуры – тесты, опросники и т. п. Некоторые поведенческие параметры могут быть измерены, т. е. однозначно распознаны и интерпретированы только специально обученными наблюдателями или экспертами.

В зависимости от количества параметров, входящих в зависимую переменную, различают одномерные, многомерные и фундаментальные ЗП. Одномерная ЗП представлена единственным параметром, изменения которого и изучаются в эксперименте. Примером одномерной ЗП может служить скорость сенсомоторной реакции. Многомерная ЗП представлена совокупностью параметров. Например, внимательность может оцениваться объемом просмотренного материала, количеством отвлечений, числом правильных и ошибочных ответов и т. д. Каждый параметр может фиксироваться независимо. Фундаментальная ЗП представляет собой переменную комплексного характера, параметры которой имеют некоторые известные отношения между собой. В этом случае одни параметры выступают как аргументы, а собственно зависимая переменная – как функция. Например, фундаментальное измерение уровня агрессии может рассматриваться как функция ее отдельных проявлений (мимических, вербальных, физических и др.).

Зависимая переменная должна обладать такой базовой характеристикой, как сензитивность. Сензитивность ЗП – это ее чувствительность к изменению уровня независимой переменной. Если при изменении независимой переменной зависимая переменная не изменяется, то последняя несензитивна и проводить эксперимент в таком случае не имеет смысла. Известны два варианта проявления несензитивности ЗП: «эффект потолка» и «эффект пола». «Эффект потолка» наблюдается, например, в том случае, когда предъявляемая задача настолько проста, что ее выполняют все испытуемые независимо от возраста. «Эффект пола», напротив, возникает в том случае, когда задание настолько сложно, что с ним не может справиться ни один из испытуемых.

Существуют два основных способа фиксации изменений ЗП в психологическом эксперименте: непосредственный и отсроченный. Непосредственный способ применяется, например, в экспериментах по кратковременному запоминанию. Экспериментатор непосредственно после повторения ряда стимулов фиксирует их количество, воспроизведенное испытуемым. Отсроченный способ используется в том случае, когда между воздействием и эффектом проходит определенный промежуток времени (например, при определении влияния количества заученных иностранных слов на успешность перевода текста).

Дополнительные переменные (ДП) – это сопутствующая стимуляция испытуемого, оказывающая влияние на его ответ. Совокупность ДП состоит, как правило, из двух групп: внешних условий опыта и внутренних факторов. Соответственно их принято называть внешними и внутренними ДП. К внешним ДП относят физическую обстановку опыта (освещенность, температурный режим, звуковой фон, пространственные характеристики помещения), параметры аппаратуры и оборудования (дизайн измерительных приборов, рабочий шум и т. п.), временные параметры эксперимента (время начала, продолжительность и др.), личность экспериментатора. К внутренним ДП относят настроение и мотивацию испытуемых, их отношение к экспериментатору и опытам, их психологические установки, склонности, знания, умения, навыки и опыт в данном виде деятельности, уровень утомления, самочувствие и т. п.

В идеале исследователь стремится все дополнительные переменные свести на нет или хотя бы к минимуму, чтобы выделить «в чистом виде» связь между независимой и зависимой переменными. Существует несколько основных способов контроля влияния внешних ДП: 1) элиминация внешних воздействий; 2) константность условий; 3) балансировка; 4) контрбалансировка.

Элиминация внешних воздействий представляет собой наиболее радикальный способ контроля. Он состоит в полном исключении из внешней среды каких бы то ни было внешних ДП. В лаборатории создаются условия, изолирующие испытуемого от звуков, света, вибрационных воздействий и т. п. Наиболее ярким примером может служить эксперимент по сенсорной депривации, проводимый на добровольцах в специальной камере, полностью исключающей поступление каких-либо раздражителей из внешней среды. Следует отметить, что элиминировать воздействия ДП практически невозможно, да и не всегда нужно, так как результаты, полученные в условиях элиминации внешних воздействий, вряд ли могут быть перенесены в реальность.

Следующий способ контроля – создание константных условий. Суть этого способа состоит в том, чтобы сделать воздействия ДП постоянными и одинаковыми для всех испытуемых на протяжении всего опыта. В частности, исследователь стремится сделать постоянными пространственно-временные условия эксперимента, технику его проведения, оборудование, предъявление инструкции и т. д. При тщательном применении этого способа контроля удается избежать больших погрешностей, однако проблема переноса результатов эксперимента в условия, сильно отличающиеся от экспериментальных, остается проблематичной.

В тех случаях, когда нет возможности создать и поддерживать постоянные условия на протяжении всего эксперимента, прибегают к способу балансировки. Этот способ применяется, например, в ситуации, когда внешняя ДП не поддается идентификации. В этом случае балансировка будет состоять в использовании контрольной группы. Исследование контрольной и экспериментальной групп проводится в одних и тех же условиях с той лишь разницей, что в контрольной группе отсутствует воздействие независимой переменной. Тем самым изменение зависимой переменной в контрольной группе обусловлено лишь внешними ДП, а в экспериментальной – совместным действием внешних дополнительных и независимой переменной.

Если внешняя ДП известна, то балансировка заключается в воздействии каждого ее значения в сочетании с каждым уровнем независимой переменной. В частности, такая внешняя ДП, как пол экспериментатора, в сочетании с независимой переменной (пол испытуемого) приведет к созданию четырех экспериментальных серий:

1) мужчина-экспериментатор – мужчины испытуемые;

2) мужчина-экспериментатор – женщины испытуемые;

3) женщина-экспериментатор – мужчины испытуемые;

4) женщина-экспериментатор – женщины испытуемые.

В более сложных экспериментах может применяться балансировка нескольких переменных одновременно.

Контрбалансировка как способ контроля внешних ДП практикуется чаще всего тогда, когда эксперимент включает в себя несколько серий. Испытуемый оказывается в разных условиях последовательно, однако предыдущие условия могут изменять эффект воздействия последующих. Для ликвидации возникающего в этом случае «эффекта последовательности» разным группам испытуемых экспериментальные условия предъявляются в различном порядке. Например, в первой серии эксперимента первой группе предъявляется решение интеллектуальных задач от более простых к более сложным, а второй – от более сложных к более простым. Во второй серии, напротив, первой группе предъявляется решение интеллектуальных задач от более сложных к более простым, а второй – от более простых к более сложным. Контрбалансировка применяется в тех случаях, когда есть возможность проведения нескольких серий эксперимента, однако следует учитывать, что большое число попыток вызывает утомление испытуемых.

Внутренние ДП, как указывалось выше, – это факторы, кроющиеся в личности испытуемого. Они оказывают весьма значительное влияние на результаты эксперимента, их воздействие достаточно трудно проконтролировать и учесть. Среди внутренних ДП можно выделить постоянные и непостоянные. Постоянные внутренние ДП в течение эксперимента существенно не изменяются. Если эксперимент проводится с одним испытуемым, то постоянными внутренними ДП будут его пол, возраст, национальность. К этой группе факторов также можно отнести темперамент, характер, способности, склонности испытуемого, его интересы, взгляды, убеждения и другие компоненты общей направленности личности. В случае проведения эксперимента с группой испытуемых эти факторы приобретают характер непостоянных внутренних ДП, и тогда для нивелировки их влияния прибегают к специальным способам формирования экспериментальных групп (см. 4.6).

К непостоянным внутренним ДП относятся психологические и физиологические характеристики испытуемого, которые могут либо значительно изменяться по ходу эксперимента, либо актуализироваться (или исчезать) в зависимости от целей, задач, вида, формы организации эксперимента. Первую группу таких факторов составляют физиологические и психические состояния, утомляемость, привыкание, приобретение опыта и навыков в процессе выполнения экспериментального задания. В другую группу входят установка на данный опыт и данное исследование, уровень мотивации к данной экспериментальной деятельности, отношение испытуемого к экспериментатору и своей роли подопытного и т. п.

Для уравнивания эффекта воздействия этих переменных на ответы в разных пробах существует ряд способов, успешно применяемых в экспериментальной практике.

Для устранения так называемого серийного эффекта, в основе которого лежит привыкание, используется особая очередность предъявления стимулов. Эта процедура получила название «уравновешенного чередного порядка», когда стимулы разных категорий предъявляются симметрично относительно центра стимульного ряда. Схема такой процедуры выглядит так: А В В А, где А и В – стимулы разных категорий.

Чтобы предупредить влияние на ответ испытуемого тревожности или неопытности, проводятся ознакомительные или предварительные эксперименты. Их итоги не учитываются при обработке данных.

Для предупреждения изменчивости ответов из-за накопления опыта и навыков в процессе эксперимента испытуемому предлагается так называемая «исчерпывающая практика». В результате такой практики у испытуемого до начала собственно эксперимента вырабатываются устойчивые навыки, и в дальнейших экспериментах показатели испытуемого от фактора накопления опыта и навыков уже напрямую не зависят.

В тех случаях, когда необходимо свести к минимуму влияние на ответ испытуемого утомления, прибегают к «методу вращения». Суть его состоит в том, что каждой подгруппе испытуемых предъявляется определенная комбинация стимулов. Совокупность таких комбинаций полностью исчерпывает все множество возможных вариантов. Например, при трех типах стимулов (А, Б, В) каждому из них представляется первое, второе и третье место в предъявлении испытуемым. Таким образом, первой подгруппе стимулы предъявляются в порядке АБВ, второй – АВБ, третьей – БАВ, четвертой – БВА, пятой – ВАБ, шестой – ВБА.

Приведенные способы процедурного уравнивания внутренних непостоянных ДП применимы как для индивидуальных, так и для групповых экспериментов.

Установка и мотивация испытуемых как внутренние непостоянные ДП должны поддерживаться на одном и том же уровне во время всего опыта. Установка как готовность воспринимать раздражитель и отвечать на него определенным образом создается через инструкцию, которую экспериментатор дает испытуемому. Чтобы установка была именно такой, какая требуется по задаче исследования, инструкция должна быть доступна испытуемым и адекватна задачам эксперимента. Однозначность и легкость понимания инструкции достигаются ее ясностью и простотой. Во избежание вариативности предъявления инструкцию рекомендуется зачитывать дословно или давать в письменном виде. Поддержание исходной установки контролируется экспериментатором путем постоянного наблюдения за испытуемым и корректируется путем напоминания при необходимости соответствующих указаний инструкции.

Мотивация испытуемого рассматривается главным образом как интерес к данному эксперименту. Если интерес отсутствует или слаб, то трудно рассчитывать на полноценность выполнения испытуемым предусмотренных в эксперименте заданий и на надежность его ответов. Слишком высокий интерес, «перемотивация», также чревата неадекватностью ответов испытуемого. Поэтому для получения исходно приемлемого уровня мотивации экспериментатор должен самым серьезным образом подойти к формированию контингента испытуемых и подбору стимулирующих их мотивацию факторов. В качестве таких факторов могут выступать состязательность, различные виды вознаграждения, интерес к своим показателям, профессиональный интерес и др.

Психофизиологические состояния испытуемых рекомендуется не только поддерживать на одном уровне, но и оптимизировать этот уровень, т. е. испытуемые должны находиться в «нормальном» состоянии. Следует убедиться, что до проведения опыта у испытуемого не было сверхзначимых для него переживаний, у него достаточно времени для участия в эксперименте, он не голоден и т. п. Во время проведения эксперимента не следует излишне возбуждать или подавлять испытуемого. Если же эти условия выполнить не удается, то проведение эксперимента лучше отложить.

Из рассмотренных характеристик переменных и способов их контроля становится понятой необходимость тщательной подготовки эксперимента при его планировании. В реальных условиях экспериментирования добиться 100 %-го контроля всех переменных невозможно, однако различные психологические эксперименты значительно отличаются друг от друга степенью контроля переменных. Рассмотрению вопроса оценки качества эксперимента посвящен следующий раздел.

4.5. Валидность и надежность эксперимента

Для конструирования и оценки экспериментальных процедур используются понятия: идеальный эксперимент, эксперимент полного соответствия и бесконечный эксперимент.

Идеальный эксперимент – это эксперимент, организованный таким образом, что экспериментатор изменяет лишь независимую переменную, зависимая переменная контролируется, а все остальные условия эксперимента остаются неизменными. Идеальный эксперимент предполагает эквивалентность всех испытуемых, неизменность их характеристик во времени, отсутствие самого времени. Он никогда не может быть осуществлен в реальности, так как в жизни изменяются не только интересующие исследователя параметры, но и ряд других условий.

Соответствие реального эксперимента идеальному выражается в такой его характеристике, как внутренняя валидность. Внутренняя валидность показывает достоверность результатов, которую обеспечивает реальный эксперимент по сравнению с идеальным. Чем больше влияют на изменение зависимых переменных не контролируемые исследователем условия, тем ниже внутренняя валидность эксперимента, следовательно, больше вероятность того, что факты, обнаруженные в эксперименте, являются артефактами. Высокая внутренняя валидность – главный признак хорошо проведенного эксперимента.

Д. Кэмпбелл выделяет следующие факторы, угрожающие внутренней валидности эксперимента: фактор фона, фактор естественного развития, фактор тестирования, погрешность измерения, статистическая регрессия, неслучайный отбор, отсеивание. Если они не контролируются, то приводят к появлению соответствующих эффектов.

Фактор фона (истории) включает события, которые происходят между предварительным и окончательным измерением и могут вызвать изменения в зависимой переменной наряду с влиянием независимой переменной. Фактор естественного развития связан с тем, что изменения в уровне зависимой переменной могут возникнуть в связи с естественным развитием участников эксперимента (взросление, нарастание утомления и т. п.). Фактор тестирования заключается во влиянии предварительных измерений на результаты последующих. Фактор погрешности измерения связан с неточностью или изменениями в процедуре или методе измерения экспериментального эффекта. Фактор статистической регрессии проявляется в том случае, если для участия в эксперименте были отобраны испытуемые с крайними показателями каких-либо оценок. Фактор неслучайного отбора соответственно встречается в тех случаях, когда при формировании выборки отбор участников проводился неслучайным образом. Фактор отсеивания проявляется в том случае, если испытуемые неравномерно выбывают из контрольной и экспериментальной групп.

Экспериментатор должен учитывать и по возможности ограничивать влияние факторов, угрожающих внутренней валидности эксперимента.

Эксперимент полного соответствия – это экспериментальное исследование, в котором все условия и их изменения отвечают реальности. Приближение реального эксперимента к эксперименту полного соответствия выражается во внешней валидности. От уровня внешней валидности зависит степень переносимости результатов эксперимента в реальность. Внешняя валидность, по определению Р. Готтсданкера, влияет на достоверность выводов, которую дают результаты реального эксперимента по сравнению с экспериментом полного соответствия. Для достижения высокой внешней валидности нужно, чтобы уровни дополнительных переменных в эксперименте соответствовали их уровням в реальности. Эксперимент, который не имеет внешней валидности, считается неверным.

К факторам, угрожающим внешней валидности, относят следующие:

Реактивный эффект (заключается в уменьшении или увеличении восприимчивости испытуемых к экспериментальному влиянию вследствие предыдущих измерений);

Эффект взаимодействия отбора и влияния (состоит в том, что экспериментальное влияние будет существенным только для участников данного эксперимента);

Фактор условий эксперимента (может привести к тому, что экспериментальный эффект может наблюдаться только в данных специально организованных условиях);

Фактор интерференции влияний (проявляется при предъявлении одной группе испытуемых последовательности взаимоисключающих влияний).

Заботу о внешней валидности экспериментов особо проявляют исследователи, работающие в прикладных областях психологии – клинической, педагогической, организационной, поскольку в случае невалидного исследования его результаты ничего не дадут при переносе их в реальные условия.

Бесконечный эксперимент предполагает неограниченное количество опытов, проб для получения все более точных результатов. Увеличение количества проб в эксперименте с одним испытуемым ведет к повышению надежности результатов эксперимента. В экспериментах с группой испытуемых повышение надежности происходит при увеличении числа испытуемых. Однако суть эксперимента состоит именно в том, чтобы на основе ограниченного числа проб или при помощи ограниченной группы испытуемых выявить причинно-следственные связи между явлениями. Поэтому бесконечный эксперимент не только невозможен, но и бессмыслен. Для достижения высокой надежности эксперимента количество проб или число испытуемых должно соответствовать изменчивости изучаемого явления.

Следует отметить, что при увеличении числа испытуемых повышается и внешняя валидность эксперимента, так как его результаты могут быть перенесены на более широкую популяцию. Для проведения экспериментов с группой испытуемых необходимо рассмотреть вопрос об экспериментальных выборках.

4.6. Экспериментальные выборки

Как указывалось выше, эксперимент может проводиться либо с одним испытуемым, либо с группой испытуемых. Эксперимент с одним испытуемым проводится лишь в некоторых специфических ситуациях. Во-первых, это ситуации, когда индивидуальными различиями испытуемых можно пренебречь, т. е. испытуемым может быть любой человек (если в эксперименте изучаются его особенности в отличие, например, от животного). В других ситуациях, напротив, испытуемый представляет собой уникальный объект (гениальный шахматист, музыкант, художник и др.). Возможны также ситуации, когда от испытуемого требуется особая компетентность как результат обучения или неординарного жизненного опыта (единственный выживший в авиационной катастрофе и т. п.). Одним испытуемым ограничиваются и в тех случаях, когда повторение данного эксперимента с участием других испытуемых невозможно. Для экспериментов с одним испытуемым разработаны особые экспериментальные планы (подробно о них см. 4.7).

Чаще эксперименты проводятся с группой испытуемых. В этих случаях выборка испытуемых должна представлять собой модель генеральной совокупности, на которую затем будут распространяться результаты исследования. Первоначально исследователь решает проблему численности экспериментальной выборки. В зависимости от цели исследования и возможности экспериментатора она может составлять от нескольких испытуемых до нескольких тысяч человек. Количество испытуемых в отдельной группе (экспериментальной или контрольной) варьируется от 1 до 100 человек. Для применения статистических методов обработки рекомендуется число испытуемых в сравниваемых группах не менее 30–35 человек. Кроме того, целесообразно увеличивать количество испытуемых по крайней мере на 5-10 % от требуемого, так как часть из них или их результатов будет «отбракована» в ходе эксперимента.

Для формирования выборки испытуемых необходимо учитывать несколько критериев.

1. Содержательный. Он заключается в том, что подбор группы испытуемых должен соответствовать предмету и гипотезе исследования. (Например, бессмысленно набирать в группу испытуемых детей двухлетнего возраста для выявления уровня произвольного запоминания.) Желательно создать идеальные представления об объекте экспериментального исследования и при формировании группы испытуемых минимально отклоняться от характеристик идеальной экспериментальной группы.

2. Критерий эквивалентности испытуемых. При формировании группы испытуемых следует учесть все значимые характеристики объекта исследования, различия в выраженности которых могут существенно повлиять на зависимую переменную.

3. Критерий репрезентативности. Группа лиц, участвующих в эксперименте, должна представлять всю часть генеральной совокупности, на которую будут распространяться результаты эксперимента. Величина экспериментальной выборки определяется видом статистических мер и выбранной точностью (достоверностью) принятия или отвержения экспериментальной гипотезы.

Рассмотрим стратегии отбора испытуемых из популяции.

Случайная стратегия заключается в том, что каждому члену генеральной совокупности предоставляется равный шанс попадания в экспериментальную выборку. Для этого каждому индивиду присваивается номер, а затем с помощью таблицы случайных чисел формируется экспериментальная выборка. Данная процедура трудноосуществима, поскольку каждый представитель интересующей исследователя популяции должен быть учтен. Кроме того, случайная стратегия дает хорошие результаты при формировании экспериментальной выборки большого объема.

Стратометрический отбор используется в том случае, если в экспериментальной выборке обязательно должны быть представлены испытуемые с определенным набором характеристик (пол, возраст, уровень образования и т. п.). Выборка составляется таким образом, чтобы в ней были равно представлены испытуемые каждой страты (слоя) с заданными характеристиками.

Стратометрический случайный отбор совмещает две предыдущие стратегии. Представителям каждой страты присваиваются номера и из них случайным образом формируется экспериментальная выборка. Данная стратегия эффективна при отборе экспериментальной выборки небольшого объема.

Репрезентативное моделирование применяется в том случае, когда исследователю удается создать модель идеального объекта экспериментального исследования. Характеристики реальной экспериментальной выборки должны минимально отклоняться от характеристик идеальной экспериментальной выборки. Если исследователю известны не все характеристики идеальной модели экспериментального исследования, то применяется стратегия приближенного моделирования. Чем точнее набор критериев, описывающих популяцию, на которую предполагается распространить выводы эксперимента, тем выше его внешняя валидность.

Иногда в качестве экспериментальной выборки используются реальные группы, при этом в эксперименте либо участвуют добровольцы, либо все испытуемые привлекаются принудительно. И в том и в другом случае нарушается внешняя и внутренняя валидность.

После формирования экспериментальной выборки экспериментатор составляет план исследования. Достаточно часто эксперимент проводится с несколькими группами, экспериментальными и контрольными, которые помещаются в разные условия. Экспериментальные и контрольные группы должны быть эквивалентными на момент начала экспериментального воздействия.

Процедура подбора эквивалентных групп и испытуемых называется рандомизацией. По мнению ряда авторов, эквивалентность групп может быть достигнута при попарном отборе. В этом случае экспериментальная и контрольная группы составляются из индивидов, эквивалентных по значимым для эксперимента побочным параметрам. Идеальный вариант для попарного отбора – привлечение близнецовых пар. Рандомизация с выделением страт заключается в подборе однородных подгрупп, в которых испытуемые уравнены по всем характеристикам, кроме интересующих исследователя дополнительных переменных. Иногда для выделения значимой дополнительной переменной все испытуемые тестируются и ранжируются по уровню ее выраженности. Экспериментальная и контрольная группы формируются так, чтобы испытуемые, обладающие одинаковыми или близкими значениями переменной, попали в разные группы. Распределение испытуемых на экспериментальную и контрольную группы может проводиться и случайным методом. Как уже указывалось выше, при большой численности экспериментальной выборки этот способ дает вполне удовлетворительные результаты.

4.7. Экспериментальные планы

Экспериментальный план – это тактика экспериментального исследования, воплощенная в конкретной системе операций планирования эксперимента. Основными критериями классификации планов являются:

Состав участников (индивид или группа);

Количество независимых переменных и их уровней;

Виды шкал представления независимых переменных;

Метод сбора экспериментальных данных;

Место и условия проведения эксперимента;

Особенности организации экспериментального воздействия и способа контроля.

Планы для групп испытуемых и для одного испытуемого. Все экспериментальные планы можно разделить по составу участников на планы для групп испытуемых и планы для одного испытуемого.

Эксперименты с группой испытуемых имеют следующие преимущества: возможность обобщения результатов эксперимента на популяцию; возможность использования схем межгрупповых сравнений; экономия времени; применение методов статистического анализа. К недостаткам данного типа экспериментальных планов можно отнести: влияние индивидуальных различий между людьми на результаты эксперимента; проблему репрезентативности экспериментальной выборки; проблему эквивалентности групп испытуемых.

Эксперименты с одним испытуемым – это частный случай «планов с маленьким N». Дж. Гудвин указывает на следующие причины использования таких планов: потребности в индивидуальной валидности, так как в экспериментах с большим N возникает проблема, когда обобщенные данные не характеризуют ни одного испытуемого. Эксперимент с одним испытуемым проводится также в уникальных случаях, когда в силу ряда причин невозможно привлечь много участников. В этих случаях целью эксперимента является анализ уникальных явлений и индивидуальных характеристик.

Эксперимент с маленьким N, по мнению Д. Мартина, имеет следующие преимущества: отсутствие сложных статистических подсчетов, легкость в интерпретации результатов, возможность изучения уникальных случаев, привлечение одного-двух участников, широкие возможности манипуляции независимыми переменными. Ему свойственны и некоторые недостатки, в частности сложность процедур контроля, затруднение при обобщении результатов; относительная неэкономичность по времени.

Рассмотрим планы для одного испытуемого.

Планирование временных серий. Основным показателем влияния независимой переменной на зависимую при реализации такого плана является изменение характера ответов испытуемого во времени. Простейшая стратегия: схема А – В. Испытуемый первоначально выполняет деятельность в условиях А, а затем в условиях В. Для контроля «эффекта плацебо» применяется схема: А – В – А. («Эффект плацебо» – это реакции испытуемых на «пустые» воздействия, соответствующие реакциям на реальные воздействия.) В данном случае испытуемый не должен заранее знать, какое из условий является «пустым», а какое реальным. Однако эти схемы не учитывают взаимодействия воздействий, поэтому при планировании временных серий, как правило, применяют схемы регулярного чередования (А – В – А – В), позиционного уравнивания (А – В – В – А) или случайного чередования. Применение более «длинных» временных серий увеличивает возможность обнаружения эффекта, но приводит к ряду негативных последствий – утомлению испытуемого, снижению контроля за другими дополнительными переменными и т. п.

План альтернативных воздействий является развитием плана временных серий. Его специфика заключается в том, что воздействия А и В рандомизированно распределяются во времени и предъявляются испытуемому раздельно. Затем сравниваются эффекты от каждого из воздействий.

Реверсивный план применяется для изучения двух альтернативных форм поведения. Первоначально регистрируется базовый уровень проявления обеих форм поведения. Затем предъявляется комплексное воздействие, состоящее из специфического компонента для первой формы поведения и дополнительного для второй. Через определенное время сочетание воздействий видоизменяют. Эффект двух комплексных воздействий оценивается.

План возрастания критериев часто используется в психологии обучения. Суть его состоит в том, что регистрируется изменение поведения испытуемого в ответ на прирост воздействия. При этом следующее воздействие предъявляется лишь после выхода испытуемого на заданный уровень критерия.

При проведении экспериментов с одним испытуемым следует учитывать, что основные артефакты практически неустранимы. Кроме того, в этом случае, как ни в каком другом, проявляется влияние установок экспериментатора и отношений, которые складываются между ним и испытуемым.

Р. Готтсданкер предлагает различать качественные и количественные экспериментальные планы . В качественных планах независимая переменная представлена в номинативной шкале, т. е. в эксперименте используются два или более качественно разных условия.

В количественных экспериментальных планах уровни независимой переменной представлены в интервальных, ранговых или пропорциональных шкалах, т. е. в эксперименте используются уровни выраженности того или иного условия.

Возможна ситуация, когда в факторном эксперименте одна переменная будет представлена в количественном, а другая – в качественном виде. В таком случае план будет комбинированным.

Внутригрупповые и межгрупповые экспериментальные планы. Т.В. Корнилова определяет два типа экспериментальных планов по критерию количества групп и условий проведения эксперимента: внутригрупповые и межгрупповые. К внутригрупповым относятся планы, в которых влияние вариантов независимой переменной и измерение экспериментального эффекта происходят в одной группе. В межгрупповых планах влияние вариантов независимой переменной осуществляется в разных экспериментальных группах.

Преимуществами внутригруппового плана являются: меньшее количество участников, устранение факторов индивидуальных отличий, уменьшение общего времени проведения эксперимента, возможность доказательства статистической значимости экспериментального эффекта. К недостаткам относятся неконстантность условий и проявление «эффекта последовательности».

Преимуществами межгруппового плана являются: отсутствие «эффекта последовательности», возможность получения большего количества данных, сокращение времени участия в эксперименте для каждого испытуемого, уменьшение эффекта выбывания участников эксперимента. Главным недостатком межгруппового плана является неэквивалентность групп.

Планы с одной независимой переменной и факторные планы. По критерию количества экспериментальных воздействий Д. Мартин предлагает различать планы с одной независимой переменной, факторные планы и планы с серией экспериментов. В планах с одной независимой переменной экспериментатор манипулирует одной независимой переменной, которая может иметь неограниченное количество вариантов проявления. В факторных планах (подробно о них см. с. 120) экспериментатор манипулирует двумя и более независимыми переменными, исследует все возможные варианты взаимодействия их разных уровней.

Планы с серией экспериментов проводятся для постепенного исключения конкурирующих гипотез. В конце серии экспериментатор приходит к верификации одной гипотезы.

Доэкспериментальные, квазиэкспериментальные планы и планы истинных экспериментов. Д. Кэмпбелл предложил разделить все экспериментальные планы для групп испытуемых на следующие группы: доэкспериментальные, квазиэкспериментальные и планы истинных экспериментов. В основе этого деления лежит близость реального эксперимента к идеальному. Чем меньше артефактов провоцирует тот или иной план и чем строже контроль дополнительных переменных, тем ближе эксперимент к идеальному. Доэкспериментальные планы менее всего учитывают требования, предъявляемые к идеальному эксперименту. В.Н. Дружинин указывает, что они могут служить лишь иллюстрацией, в практике научных исследований их следует по возможности избегать. Квазиэкспериментальные планы являются попыткой учета реалий жизни при проведении эмпирических исследований, они специально создаются с отступлением от схем истинных экспериментов. Исследователь должен осознавать источники артефактов – внешних дополнительных переменных, которые он не может контролировать. Квазиэкспериментальный план применяется тогда, когда применение лучшего плана невозможно.

Систематизированные признаки доэкспериментальных, квазиэкспериментальных планов и планов истинных экспериментов приводятся в нижеследующей таблице.


При описании экспериментальных планов будем пользоваться символизацией, предложенной Д. Кэмпбеллом: R – рандомизация; X – экспериментальное воздействие; O – тестирование.

К доэксперименталъным планам относятся: 1) исследование единичного случая; 2) план с предварительным и итоговым тестированием одной группы; 3) сравнение статистических групп.

При исследовании единичного случая однократно тестируется одна группа после экспериментального воздействия. Схематично этот план можно записать в виде:

Контроль внешних переменных и независимой переменной полностью отсутствует. В таком эксперименте нет никакого материала для сравнения. Результаты могут быть сопоставлены лишь с обыденными представлениями о реальности, научной информации они не несут.

План с предварительным и итоговым тестированием одной группы часто применяется в социологических, социально-психологических и педагогических исследованиях. Его можно записать в виде:

В этом плане отсутствует контрольная группа, поэтому нельзя утверждать, что изменения зависимой переменной (разница между O1 и O2), регистрируемые в ходе тестирования, вызваны именно изменением независимой переменной. Между начальным и итоговым тестированием могут произойти и другие «фоновые» события, воздействующие на испытуемых вместе с независимой переменной. Этот план не позволяет контролировать также эффект естественного развития и эффект тестирования.

Сравнение статистических групп будет точнее назвать планом для двух неэквивалентных групп с тестированием после воздействия. Он может быть записан в таком виде:

Этот план позволяет учитывать эффект тестирования, благодаря введению контрольной группы контролировать ряд внешних переменных. Однако с его помощью невозможно учесть эффект естественного развития, так как нет материала для сравнения состояния испытуемых на данный момент с их начальным состоянием (предварительное тестирование не проводилось). Для сравнения результатов контрольной и экспериментальной групп используют t-критерий Стьюдента. Однако следует учитывать, что различия в результатах тестирования могут быть обусловлены не экспериментальным воздействием, а различием в составе групп.

Квазиэкспериментальные планы являются своеобразным компромиссом между реальностью и строгими рамками истинных экспериментов. Существуют следующие типы квазиэкспериментальных планов в психологическом исследовании: 1) планы экспериментов для неэквивалентных групп; 2) планы с предварительным и итоговым тестированием различных рандомизированных групп; 3) планы дискретных временных серий.

План эксперимента для неэквивалентных групп направлен на установление причинно-следственной зависимости между переменными, однако в нем отсутствует процедура уравнивания групп (рандомизация). Этот план может быть представлен следующей схемой:

К проведению эксперимента в данном случае привлекаются две реальные группы. Обе группы тестируются. Затем одна группа подвергается экспериментальному воздействию, а другая – нет. Затем обе группы повторно тестируются. Результаты первого и второго тестирования обеих групп сопоставляют, для сравнения используют t-критерий Стьюдента и дисперсионный анализ. Различие O2 и O4 свидетельствует о естественном развитии и фоновом воздействии. Для выявления действия независимой переменной необходимо сравнивать 6(O1 O2) и 6(O3 O4), т. е. величины сдвигов показателей. Значимость различия приростов показателей будет свидетельствовать о влиянии независимой переменной на зависимую. Этот план аналогичен плану истинного эксперимента для двух групп с тестированием до и после воздействия (см. с. 118). Главным источником артефактов является различие в составе групп.

План с предварительным и итоговым тестированием различных рандомизированных групп отличается от плана истинного эксперимента тем, что предварительное тестирование проходит одна группа, а итоговое – эквивалентная группа, которая подверглась воздействию:

Главный недостаток этого квазиэкспериментального плана – невозможность контролировать эффект «фона» – влияние событий, происходящих наряду с экспериментальным воздействием в период между первым и вторым тестированием.

Планы дискретных временных серий подразделяются на несколько видов в зависимости от количества групп (одной или нескольких), а также в зависимости от количества экспериментальных воздействий (одиночного или серии воздействий).

План дискретных временных серий для одной группы испытуемых состоит в том, что первоначально определяется исходный уровень зависимой переменной на группе испытуемых с помощью серии последовательных замеров. Затем применяют экспериментальное воздействие и проводят серию аналогичных замеров. Сравнивают уровни зависимой переменной до и после воздействия. Схема этого плана:

Главный недостаток плана дискретных временных серий в том, что он не дает возможности отделить результат влияния независимой переменной от влияния фоновых событий, которые происходят в течение исследования.

Модификацией этого плана является квазиэксперимент по схеме временных серий, в котором воздействие перед замером чередуется с отсутствием воздействия перед замером. Его схема такова:

ХO1 – O2ХO3 – O4 ХO5

Чередование может быть регулярным или случайным. Этот вариант подходит лишь в том случае, когда эффект воздействия обратим. При обработке данных, полученных в эксперименте, серии разбивают на две последовательности и сравнивают результаты замеров, где было воздействие, с результатами замеров, где оно отсутствовало. Для сравнения данных используется t-критерий Стьюдента с числом степеней свободы n – 2, где n – число ситуаций одного типа.

Планы временных серий часто реализуются на практике. Однако при их применении нередко наблюдается так называемый «эффект Хотторна». Впервые его обнаружили американские ученые в 1939 г., когда проводили исследование на заводе Хотторна в Чикаго. Предполагалось, что изменение системы организации труда позволит повысить его производительность. Однако в ходе эксперимента любые изменения в организации труда приводили к повышению его производительности. В результате оказалось, что само по себе участие в эксперименте повысило мотивацию к труду. Испытуемые поняли, что ими лично интересуются, и стали работать продуктивнее. Чтобы контролировать этот эффект, должна использоваться контрольная группа.

Схема плана временных серий для двух неэквивалентных групп, из которых одна не получает воздействия, выглядит так:

O1O2O3O4O5O6O7O8O9O10

O1O2O3O4O5O6O7O8O9O10

Такой план позволяет контролировать эффект «фона». Обычно он используется исследователями при изучении реальных групп в образовательных учреждениях, клиниках, на производстве.

Еще один специфический план, который нередко используется в психологии, называют экспериментом ex-post-facto. Он часто применяется в социологии, педагогике, а также в нейропсихологии и клинической психологии. Стратегия применения этого плана состоит в следующем. Экспериментатор сам не воздействует на испытуемых. В качестве воздействия выступает некоторое реальное событие из их жизни. Экспериментальная группа состоит из «испытуемых», подвергшихся воздействию, а контрольная группа – из людей, не испытавших его. При этом группы по возможности уравниваются на момент своего состояния до воздействия. Затем проводится тестирование зависимой переменной у представителей экспериментальной и контрольной групп. Данные, полученные в результате тестирования, сопоставляются и делается вывод о влиянии воздействия на дальнейшее поведение испытуемых. Тем самым план ex-post-facto имитирует схему эксперимента для двух групп с их уравниванием и тестированием после воздействия. Его схема такова:

Если удается достичь эквивалентности групп, то этот план становится планом истинного эксперимента. Он реализуется во многих современных исследованиях. Например, при изучении посттравматического стресса, когда люди, перенесшие воздействия природной или техногенной катастрофы, или участники боевых действий тестируются на наличие посттравматического синдрома, их результаты сопоставляются с результатами контрольной группы, что позволяет выявить механизмы возникновения подобных реакций. В нейропсихологии травмы головного мозга, поражения определенных структур, рассматриваемые как «экспериментальное воздействие», предоставляют уникальную возможность для выявления локализации психических функций.

Планы истинных экспериментов для одной независимой переменной отличаются от других следующим:

1) использованием стратегий создания эквивалентных групп (рандомизация);

2) наличием как минимум одной экспериментальной и одной контрольной групп;

3) итоговым тестированием и сравнением результатов групп, получавших и не получавших воздействие.

Рассмотрим подробнее некоторые экспериментальные планы для одной независимой переменной.

План для двух рандомизированных групп с тестированием после воздействия. Его схема выглядит так:

Этот план применяют в том случае, если нет возможности или необходимости проводить предварительное тестирование. При равенстве экспериментальной и контрольной групп данный план является наилучшим, поскольку позволяет контролировать большинство источников артефактов. Отсутствие предварительного тестирования исключает как эффект взаимодействия процедуры тестирования и экспериментального задания, так и сам эффект тестирования. План позволяет контролировать влияние состава групп, стихийного выбывания, влияние фона и естественного развития, взаимодействие состава группы с другими факторами.

В рассмотренном примере использовался один уровень воздействия независимой переменной. Если же она имеет несколько уровней, то количество экспериментальных групп увеличивается до числа уровней независимой переменной.

План для двух рандомизированных групп с предварительным и итоговым тестированием. Схема плана выглядит следующим образом:

R O1 Х O2

Этот план применяется в том случае, если существуют сомнения в результатах рандомизации. Главный источник артефактов – взаимодействие тестирования и экспериментального воздействия. В реальности также приходится сталкиваться с эффектом неодновременности тестирования. Поэтому наилучшим считается проведение тестирования членов экспериментальной и контрольной групп в случайном порядке. Предъявление-непредъявление экспериментального воздействия также лучше проводить в случайном порядке. Д. Кэмпбелл отмечает необходимость контроля «внутригрупповых событий». Данный экспериментальный план хорошо контролирует эффект фона и эффект естественного развития.

При обработке данных обычно используются параметрические критерии t и F (для данных в интервальной шкале). Вычисляют три значения t: 1) между O1 и O2; 2) между O3 и O4; 3) между O2 и O4. Гипотезу о значимости влияния независимой переменной на зависимую можно принять в том случае, если выполняются два условия: 1) различия между O1 и O2 значимы, а между O3 и O4 незначимы и 2) различия между O2 и O4 значимы. Иногда удобнее сравнивать не абсолютные значения, а величины прироста показателей б(1 2) и б (3 4). Эти значения также сравниваются по t-критерию Стьюдента. В случае значимости различий принимается экспериментальная гипотеза о влиянии независимой переменной на зависимую.

План Соломона представляет собой объединение двух предыдущих планов. Для его реализации необходимы две экспериментальные (Э) и две контрольные (К) группы. Его схема выглядит так:

С помощью этого плана можно контролировать эффект взаимодействия предварительного тестирования и эффект экспериментального воздействия. Эффект экспериментального воздействия выявляется при сравнении показателей: O1 и O2; O2 и O4; O5 и O6; O5 и O3. Сравнение O6, O1 и O3 позволяет выявить влияние фактора естественного развития и фоновых воздействий на зависимую переменную.

Теперь рассмотрим план для одной независимой переменной и нескольких групп.

План для трех рандомизированных групп и трех уровней независимой переменной применяется в тех случаях, когда необходимо выявление количественных зависимостей между независимой и зависимой переменными. Его схема выглядит так:

При реализации этого плана каждой группе предъявляется лишь один уровень независимой переменной. При необходимости можно увеличить количество экспериментальных групп в соответствии с количеством уровней независимой переменной. Для обработки данных, полученных с помощью такого экспериментального плана, могут применяться все вышеперечисленные статистические методы.

Факторные экспериментальные планы применяются для проверки сложных гипотез о взаимосвязях между переменными. В факторном эксперименте проверяются, как правило, два типа гипотез: 1) гипотезы о раздельном влиянии каждой из независимых переменных; 2) гипотезы о взаимодействии переменных. Факторный план заключается в том, чтобы все уровни независимых переменных сочетались друг с другом. Число экспериментальных групп при этом равно числу сочетаний.

Факторный план для двух независимых переменных и двух уровней (2 х 2). Это наиболее простой из факторных планов. Его схема выглядит так.



Данный план выявляет эффект воздействия двух независимых переменных на одну зависимую. Экспериментатор сочетает возможные переменные и уровни. Иногда используются четыре независимые рандомизированные экспериментальные группы. Для обработки результатов применяется дисперсионный анализ по Фишеру.

Существуют более сложные версии факторного плана: 3 х 2 и 3 х 3 и т. д. Дополнение каждого уровня независимой переменной увеличивает число экспериментальных групп.

«Латинский квадрат». Является упрощением полного плана для трех независимых переменных, имеющих два и более уровней. Принцип латинского квадрата состоит в том, что два уровня разных переменных встречаются в экспериментальном плане только один раз. Тем самым значительно сокращаются количество групп и экспериментальная выборка в целом.

Например, для трех независимых переменных (L, M, N) с тремя уровнями у каждой (1, 2, 3 и N(A, В, С)) план по методу «латинского квадрата» будет выглядеть так.

В этом случае уровень третьей независимой переменной (А, В, С) встречается в каждой строке и в каждой колонке по одному разу. Комбинируя результаты по строкам, столбцам и уровням, можно выявить влияние каждой из независимых переменных на зависимую, а также степень попарного взаимодействия переменных. Применение латинских букв А, В, С для обозначения уровней третьей переменной традиционно, поэтому метод и получил название «латинский квадрат».

«Греко-латинский квадрат». Этот план применяется в случае, если необходимо исследовать влияние четырех независимых переменных. Он строится на основе латинского квадрата для трех переменных, при этом к каждой латинской группе плана присоединяется греческая буква, обозначающая уровни четвертой переменной. Схема для плана с четырьмя независимыми переменными, каждая из которых имеет три уровня, будет выглядеть так:

Для обработки данных, полученных в плане «греко-латинский квадрат», применяется метод дисперсионного анализа по Фишеру.

Главная проблема, которую позволяют решить факторные планы, – определение взаимодействия двух и более переменных. Эту задачу невозможно решить, применяя несколько обычных экспериментов с одной независимой переменной. В факторном плане вместо попыток «очистить» экспериментальную ситуацию от дополнительных переменных (с угрозой для внешней валидности) экспериментатор приближает ее к реальности, вводя некоторые дополнительные переменные в разряд независимых. При этом анализ связей между изучаемыми признаками позволяет выявить скрытые структурные факторы, от которых зависят параметры измеряемой переменной.

4.8. Корреляционные исследования

Теория корреляционного исследования разработана английским математиком К. Пирсоном. Стратегия проведения такого исследования заключается в том, что управляемое воздействие на объект отсутствует. План корреляционного исследования несложен. Исследователь выдвигает гипотезу о наличии статистической связи между несколькими психическими свойствами индивида. При этом предположение о причинной зависимости не обсуждается.

Корреляционным называется исследование, проводимое для подтверждения или опровержения гипотезы о статистической связи между несколькими (двумя или более) переменными. В психологии в качестве переменных могут выступать психические свойства, процессы, состояния и т. п.

Корреляционные связи. «Корреляция» в прямом переводе означает соотношение. Если изменение одной переменной сопровождается изменением другой, то говорят о корреляции этих переменных. Наличие корреляции двух переменных не является свидетельством наличия причинно-следственных зависимостей между ними, но дает возможность выдвинуть такую гипотезу. Отсутствие корреляции позволяет опровергнуть гипотезу о причинно-следственной связи переменных.

Различают несколько типов корреляционных связей:

Прямая корреляционная связь (уровень одной переменной непосредственно соответствует уровню другой переменной);

Корреляция, обусловленная третьей переменной (уровень одной переменной соответствует уровню другой переменной в силу того, что обе эти переменные обусловлены третьей, общей переменной);

Случайная корреляция (не обусловлена никакой переменной);

Корреляция, обусловленная неоднородностью выборки (если выборка состоит двух неоднородных групп, то может быть получена корреляционная связь, не существующая в генеральной совокупности).

Корреляционные связи бывают следующих видов:

– положительная корреляция (повышение уровня одной переменной сопровождается повышением уровня другой переменной);

– отрицательная корреляция (рост уровня одной переменной сопровождается снижением уровня другой);

– нулевая корреляция (свидетельствует об отсутствии связи переменных);

– нелинейная связь (в определенных пределах повышение уровня одной переменной сопровождается повышением уровня другой, а при других параметрах – наоборот. Большинство психологических переменных имеют именно нелинейную связь).

Планирование корреляционного исследования. План корреляционного исследования является разновидностью квазиэкспериментального плана при отсутствии воздействия независимой переменной на зависимые. Корреляционное исследование разбивается на серию независимых измерений в группе испытуемых. В случае простого корреляционного исследования группа однородна. В случае сравнительного корреляционного исследования мы имеем несколько подгрупп, различающихся по одному или нескольким критериям. Результаты таких измерений дают матрицу вида Р х О. Обрабатываются данные корреляционного исследования путем вычисления корреляций по строкам или по столбцам матрицы. Корреляция по строкам дает сравнение испытуемых. Корреляция столбцов дает информацию о связи измеряемых переменных. Часто выявляются временные корреляции, т. е. изменение структуры корреляций во времени.

Ниже рассмотрены основные типы корреляционного исследования.

Сравнение двух групп. Применяется для установления сходства или различия двух естественных или рандомизированных групп по выраженности того или иного параметра. Средние результаты у двух групп сравнивают с помощью t-критерия Стьюдента. При необходимости для сравнения дисперсий показателя в двух группах также может быть использован t-критерий Фишера (см. 7.3).

Одномерное исследование одной группы в разных условиях. План этого исследования близок к экспериментальному. Но в случае корреляционного исследования мы не управляем независимой переменной, а лишь констатируем изменение поведения индивида в разных условиях.

Корреляционное исследование попарно эквивалентных групп. Этот план используется при исследовании близнецов методом внутрипарных корреляций. Близнецовый метод основывается на следующих положениях: генотипы монозиготных близнецов сходны на 100 %, а дизиготных близнецов – на 50 %, среда развития как дизиготных, так и монозиготных пар одинакова. Дизиготные и монозиготные близнецы разбиваются на группы: в каждой – один близнец из пары. У близнецов обеих групп измеряется интересующий исследователя параметр. Затем вычисляются корреляции между параметрами -корреляция) и между близнецами -корреляция). Сравнивая внутрипарные корреляции монозиготных и дизиготных близнецов, можно выявить доли влияния среды и генотипа на развитие того или иного признака. Если корреляция монозиготных близнецов надежно выше корреляции дизиготных близнецов, то можно говорить о существующей генетической детерминации признака, в противном случае говорят о средовой детерминации.

Многомерное корреляционное исследование. Проводится для проверки гипотезы о связи нескольких переменных. Отбирается экспериментальная группа, которая тестируется по определенной программе, состоящей из нескольких тестов. Данные исследования заносятся в таблицу «сырых» данных. Затем эта таблица обрабатывается, подсчитываются коэффициенты линейных корреляций. Корреляции оцениваются на статистические различия.

Структурное корреляционное исследование. Исследователь выявляет различие в уровне корреляционных зависимостей между одними и теми же показателями, измеренными у представителей разных групп.

Лонгитюдное корреляционное исследование. Оно строится по плану временных серий с тестированием группы через заданные промежутки времени. В отличие от простого лонгитюда исследователя интересуют изменения не столько самих переменных, сколько связей между ними.

К факторам, ставящим под угрозу внешнюю валидность, или репрезентативность эксперимента, относятся:

реактивный эффект, или эффект взаимодействия тестирования,- возможное уменьшение или увеличение сензитивности, или восприимчивости, испытуемых к экспериментальному воздействию под влиянием предварительного тестирования. Результаты лиц, прошедших предварительное тестирование, будут нерепрезентативны по отношению к тем, кто не подвергался предварительному тестированию, то есть тем, из кого состоит генеральная совокупность, из которых были отобраны испытуемые;

эффекты взаимодействия фактора отбора и экспериментального воздействия;

условия организации эксперимента, вызывающие реакцию испытуемых на эксперимент, которая не позволяет распространить полученные данные о влиянии экспериментальной переменной на лиц, подвергающихся такому же воздействию в неэкспериментальных условиях;

взаимная интерференция экспериментальных воздействий, нередко возникающая, когда одни и те же испытуемые подвергаются нескольким воздействиям, поскольку влияние более ранних воздействий, как правило, не исчезает. Это относится особенно к планам экспериментов с одной группой

Рассмотрим в качестве примеров еще два плана. План с предварительным и итоговым тестированием различных рандомизированных выборок отличается от истинного эксперимента тем, что предварительное тестирование проходит одна группа, а итоговое (после воздействия) - эквивалентная (после рандомизации) группа, которая подверглась воздействию:

Этот план называют также "имитацией плана с начальным и конечным тестированием". Главный его недостаток - невозможность контролировать влияние фактора "истории" - фоновых событий, происходящих наряду с воздействием в период между первым и вторым тестированием.

Усложненным вариантом этого плана является схема с контрольными выборками для предварительного и итогового тестирования. В этом плане используется 4 рандомизированные группы, но воздействию подвергаются лишь 2 из них, причем тестируется после воздействия одна. План имеет следующий вид:

В том случае, если рандомизация проведена удачно, т.е. группы действительно эквивалентны, данный план по качеству не отличается от планов "истинного эксперимента". Он обладает наилучшей внешней валидностью, поскольку позволяет исключить влияние основных внешних переменных, ее нарушающих: взаимодействие предварительного тестирования и воздействия; взаимодействие состава групп и экспериментального воздействия; реакцию испытуемых на эксперимент. Не удается лишь исключить фактор взаимодействия состава групп с факторами естественного развития и фона, так как отсутствуют возможности сравнить влияния предварительного и последующего тестирования на экспериментальную и контрольную группы. Особенность плана состоит в том, что каждая из четырех групп тестируется всего лишь один раз: либо в начале, либо в конце исследования.

План этот применяется крайне редко. Кэмпбелл также утверждает, что этот план ни разу не был реализован.

3.1.2 Планы дискретных временных серий

Гораздо чаще, чем приведенные выше планы, применяются схемы квазиэкспериментов, которые имеют общее название "дискретные временные серии". Для классификации этих планов можно выделить два основания: исследование проводится 1) с участием одной группы или нескольких; 2) с одним воздействием либо серией. Следует заметить, что планы, в которых реализуется серия однородных или разнородных воздействий с тестированием после каждого воздействия, получили в советской и российской психологической науке по традиции название "формирующие эксперименты". По своей сути они, конечно, являются квазиэкспериментами со всеми присущими таким исследованиям нарушениями внешней и внутренней валидности.

Используя такие планы, мы с самого начала должны давать себе отчет в том, что в них отсутствуют средства контроля внешней валидности. Невозможно проконтролировать взаимодействие предварительного тестирования и экспериментального воздействия, ликвидировать эффект систематического смешения (взаимодействия состава групп и экспериментального воздействия), проконтролировать реакцию испытуемых на эксперимент и определить эффект взаимодействия между различными экспериментальными воздействиями.

Квазиэкспериментальные планы, построенные по схеме временных серий на одной группе, по структуре сходны с экспериментальными планами для одного испытуемого.

План дискретных временных серий чаще всего используется в психологии развития, педагогической, социальной и клинической психологии. Суть его состоит в том, что первоначально определяется исходный уровень зависимой переменной на группе испытуемых с помощью серии последовательных замеров. Затем исследователь воздействует на испытуемых экспериментальной группы, варьируя независимую переменную, и проводит серию аналогичных измерений. Сравниваются уровни, или тренды, зависимой переменной до и после воздействия. Схема плана выглядит так:

О 1 О 2 О 3 Х О 4 О 5 О 6

Главный недостаток плана дискретных временных серий в том, что он не дает возможности отделить результат влияния независимой переменной от влияния фоновых событий, которые происходят в течение исследования. Чтобы ликвидировать эффект "истории", рекомендуют использовать экспериментальную изоляцию испытуемых.

Модификацией этого плана является другой квазиэксперимент по схеме временных серий, в котором воздействие перед замером чередуется с отсутствием воздействия пере д замером:

Х 0 1 – О 2 Х 0 3 – О 4 Х О 5

Чередование может быть регулярным или случайным. Этот вариант подходит лишь в том случае, когда эффект воздействия обратим. При обработке серии разбивают на две последовательности и сравнивают результаты тех замеров, где было воздействие, с результатами замеров, где оно отсутствовало. Для сравнения данных используется t-критерий Стьюдента с числом степеней свободы п-2 (где n-число ситуаций одного типа).

Планы временных серий часто реализуются на практике.

Схема плана временных серий для двух неэквивалентных групп, из которых одна не получает воздействия, выглядит так:

О 1 О 2 О 3 Х О 4 О 5 Х О 6 О 7 О 8 О 9 О 10

О’ 1 О’ 2 О’ 3 О’ 4 О’ 5 О’ 6 О’ 7 О’ 8 О’ 9 О’ 10

Квазиэксперимент позволяет контролировать действие фактора фоновых воздействий (эффект "истории"). Обычно именно этот план рекомендуется исследователям, проводящим эксперименты с участием естественных групп в детских садах, школах, клиниках или на производстве. Его можно назвать планом формирующею эксперимента с контрольной выборкой. Реализовать этот план весьма трудно, но в том случае, если удается провести рандомизацию групп, он превращается в план "истинного формирующего эксперимента".

Возможна комбинация этого плана и предыдущего, в котором чередуются серии с воздействием и его отсутствием на одной выборке.

3.2Типы

3.2.1 Квазиэкспериментальные планы со специальной организацией воздействий

Для многих психологических экспериментов очевидны допустимые зоны обобщения и оправдана готовность исследователей осуществлять перенос полученных результатов на другие ситуации, виды деятельности, группы людей. Это позволяет проводить эксперименты, обладающие хорошей внешней валидностью. Иногда приближение к естественным, или «полевым», условиям ограничивает возможные обобщения.

Таковыми являются «полевые» эксперименты, которые проводятся в условиях реально функционирующих учебных групп. В них НП «метод обучения» задана в комплексе реалий учебной деятельности. Но при этом может отсутствовать теоретическое обоснование преимуществ нового метода. Именно опосредующее звено теории – теоретического понимания оснований установленной закономерности, а не высокая оценка внешней валидности – позволяет осуществлять перенос знаний об установленных эффектах влияния НП на другие виды обучения и учебную деятельность в других учреждениях сходного типа.

В педагогических исследованиях распространен план с неэквивалентной контрольной группой (один из квазиэкспериментальных планов со снижением контроля до организации воздействий). Если в эксперименте используются реально сложившиеся коллективы, то экспериментальное и контрольное условия нельзя считать уравненными, так как между группами возможны различия, которые могут «наложиться» на изучаемую закономерность и обусловить неверные интерпретации. Дж. Кэмпбелл приводит следующий пример.

В университете г. Аннаполис (США) изучали влияние преподавания психологии на личностное развитие студентов. Предполагалось позитивное влияние знакомства с этим курсом на личностный рост.

Экспериментальная группа состояла из всех обучающихся второкурсников, которым в соответствии с учебным планом читали курс психологии. После прохождения этого курса у студентов тестировали их личностные особенности. Контрольная группа состояла из третьекурсников, для которых жизненная ситуация является более стабильной, поскольку наиболее сложные процессы адаптации приходятся именно на первые два года обучения в вузе. Поэтому отношение к предполагавшимся более высоким показателям, ожидаемым после чтения курса в экспериментальной группе, могло быть разным.

Рассмотренная в примере квазиэкспериментальная схема включала измерение ЗП в обеих группах не только после, но и до периодов экспериментального воздействия. Сравнить можно было данные конечных показателей между группами и изменения в тестируемых показателях в пределах каждой группы. Оказалось, что при первоначальном тестировании превосходство третьекурсников над второкурсниками и направление изменений показателей в контрольной и экспериментальной группах были иного порядка, чем то, что предсказывала конкурирующая гипотеза, исходящая из ведущей роли фактора естественного развития.

Включение, пусть и неэквивалентной, контрольной группы позволяет в ряде случаев отвергнуть гипотезу о роли взаимодействия факторов состава групп и естественного развития. Валидность вывода о роли воздействия чтения курса психологии была существенно выше, чем, если бы контрольная группа отсутствовала.

Чаще всего недостижимый в практике исследований в ВШ истинный эксперимент, где экспериментальная и контрольная группы должны быть полностью эквивалентны, вполне апроксимируется планом с неэквивалентной группой, если нет оснований заподозрить, что изначально отбор в каждую из имеющихся «естественных» групп осуществлялся каким-то специальным образом. В частности, если одна из групп сформировалась по принципу «добровольцев», то в нее попали люди с желанием подвергнуться испытаниям; здесь выводу о роли экспериментального воздействия будет угрожать фактор «мотивационного неравенства» групп.

3.2.2 Планы с неэквивалентными группами

Один из способов образования квазиэкспериментальных схем - невыполнение условия рандомизации как стратегии отбора испытуемых в группы. При этом межгрупповая схема бывает схожей с планами истинных экспериментов. НП при этом может варьировать по стандартным схемам (сравнения экспериментального и контрольного условий).

Причины невыполнения условия рандомизации оказываются разными. Часто это желание экспериментировать в реальных условиях, а значит - с реально сложившимися группами. Например, ими выступают учебные группы, классы школы, в которых уже сложилась своя внутригрупповая история. Главное следствие работы психолога с реально сложившимися группами - их неэквивалентность и смешения состава групп с факторами фона и развития.

Следующее существенное снижение эквивалентности условий происходит из-за фактора мотивации. Так, введение новых методов обучения показало, что существует эффект «желательности» экспериментальных условий и люди «хотят быть подвергнутыми воздействию», а проще говоря – большинство хочет учиться по новым методам, предполагая их заведомо лучшими. Это ставит проблему «замаскированного эксперимента», т. е. лучше было бы, если бы никто не знал о проводимом исследовании, а дети проходили бы обучение, имея обычную мотивацию.

Из-за неэквивалентности состава групп психолог никогда не может приписать полученный экспериментальный эффект только изменению НП.

Вместе с тем неэквивалентные группы не следует путать с однородными. Последние подразумевают обычно наличие внешнего критерия, по которому экспериментальная и контрольная группы испытуемых различаются. Тогда данное различие выступает аналогом НП. По всем же другим факторам, или побочным переменным, группы однородны. Пример подобного плана (причем в качестве корреляционного исследования) дан в учебнике Р.Готтсданкера, когда подбирались группы детей, родившихся в семье первыми, вторыми, третьими, четвертыми, пятыми (1982). Этот план был необходим для проверки гипотезы о том, что порядок рождаемости ребенка в семье влияет на последующие показатели его интеллекта (в качестве ЗП измерялся IQ).

Существуют разные стратегии подбора испытуемых в однородные группы. Приведем пример попарной стратегии. В пару объединяют потенциальных испытуемых так, чтобы они были сходны во всем, кроме исследуемого фактора. Отобранные группы называют при этом однородными.

Часто используется стратегия подбора или отбора контрольной группы для экспериментальной, которая уже существует.