Текст книги "Психология развития: методы исследования"
Автор книги: Скотт Миллер
Жанр:
Психология
сообщить о нарушении
Текущая страница: 3 (всего у книги 48 страниц) [доступный отрывок для чтения: 18 страниц]
Отбор
При принятии решений, касающихся переменных, нужно отвечать на вопрос «какие»: какие независимые переменные я буду изменять и какие потенциальные следствия этих изменений я буду измерять? Но важен также ответ на вопрос «кто»: на ком я буду изучать связи между независимыми и зависимыми переменными?
Формирование группы участников эксперимента называется отбором. Отбор важен по причине ограниченности рамок исследования. За очень редкими исключениями психологи не имеют возможности обследовать всех людей, которые их интересуют. Изучающий период младенчества, к примеру, не будет обследовать всех младенцев в мире, даже всех, родившихся в США, или (вероятно) даже тех, кто родился в определенном регионе. Вместо этого он обследует выборку, на основе результатов которой он надеется сделать общие выводы об интересующей его популяции. Обобщение правомерно, если выборка репрезентативна в отношении популяции. Это, как явствует, вопрос внешней валидности.
Как исследователю убедиться в том, что выборка репрезентирует популяцию? Следуя логике, сначала нужно определить, что представляет из себя сама популяция. Она необязательно должна быть столь велика, как все младенцы мира, скорее всего это что-то вроде «всех доношенных 3-месячных младенцев США». Следующим Шагом после очерчивания границ популяции является случайный отбор. Как подразумевает сам термин, случайный отбор означает, что представители популяции имеют равные шансы попасть в выборку. При этом наиболее вероятно, что в результате процесса отбора характеристики выборки будут отражать
характеристики популяции. Заметьте, однако, что вероятность этого напрямую зависит от размера выборки. Случайная выборка, состоящая из 100 человек, будет значительно более репрезентативна, чем случайная выборка, состоящая из 10 человек. Этот принцип – лишь один из ряда доводов (мы столкнемся с некоторыми из них в главе 7) в пользу больших выборок.
Насколько репрезентативны выборки, на практике используемые в исследованиях? Некоторое представление об этом дает нам обзор журналов Child Development и Developmental Psychology. В первую очередь, какую информацию мы получаем об этих выборках? Во всех проанализированных статьях нам сообщают количество участников и их возраст; в 91 % случаев указывается соотношение количества представителей обоих полов. В 70 % случаев предоставляются некоторые сведения о социальном статусе испытуемых и в 72 % – об их расе. Сравнение с результатами контент-анализа в первом издании книги (которые основывались на анализе тех же журналов за 1983 год) говорит о том, что в последние годы исследования отчетов стали информативнее. Соответствующими показателями из обзора 1983 года были 75 % для пола, 52 % для социального статуса и 24 % для расы. Тем не менее, неопределенность при описании расового или социально-экономического состава выборки является скорее правилом, чем исключением. Например, типичны фразы «преимущественно белые», «преимущественно среднего класса»; реже можно встретить точные численные значения и способы подсчета. Опубликованные в недавнем номере Child Development критерии рас и социальных классов (Entwisle & Astone, 1994) могут со временем привести к конкретизации исследовательских отчетов.
Неопределенность характерна и для сведений о способе привлечения испытуемых. Как отмечалось в главе 1, испытуемые не появляются по волшебству, исследователь постоянно должен задаваться вопросом, к кому и как обратиться. Имеют значение три момента. Во-первых, каково было исходное количество кандидатов, к которым обращались с просьбой принять участие в эксперименте? Изучая период младенчества, к примеру, использовал ли исследователь объявления о рождении детей в местной газете, списки в роддомах или информацию, полученную у педиатров? Популяции, которые можно выделить, пользуясь этими источниками, могут существенно различаться. Второй вопрос касается процента тех, кто в итоге согласился на участие. Если исследователь обратился, к примеру, к 100 новоиспеченным матерям, сколько из них принесли своих малышей на обследование? И, наконец, каков процент испытуемых, прошедших все исследование, – или, иначе говоря, сколько испытуемых отказалось сотрудничать в ходе исследования? В некоторых видах исследования, практически во всех, где фигурируют младенцы, выбывание испытуемых может явиться довольно серьезной проблемой. И, тем не менее, информация об отборе испытуемых и количестве выбывших встречается в отчетах редко. Только в 34 % статей сообщаются более или менее точные сведения о способе отбора и о доле согласившихся из числа тех, к кому обратились с просьбой об участии. Только в 50% соответствующих случаев дается информация о том, сколько участников выбыло в ходе исследования.
Учитывая эти недостатки в отчетах, что можно сказать о выборках при изучении развития? Эти выборки, как правило, достаточных размеров, обычно включают лиц и мужского, и женского пола. Испытуемые преимущественно из среднего класса, жители городов, в которых располагаются университеты, а значит, и исследовательские лаборатории. Наконец, в выборки в большинстве своем входит белое население, за исключением тех случаев, когда исследование направлено на выявление возможных групповых различий между белыми и афро-американскими детьми. В этом отношении выводы из этого обзора повторяют выводы контент-анализа других психологических исследований, проведенных за последнее время (Graham, 1992; Hagen & Conley, 1994)[ 2 ]2
Я должен добавить, что в последние годы Child Development выпускает специальные номера: один посвящен детям из этнических меньшинств (McLoyd & Spencer, 1990), другой – детям из малообеспеченных семей (Huston, McLoyd, & Coll, 1994). Эти специальные выпуски призваны стимулировать изучение недостаточно исследованных тем.
[Закрыть].
О чем говорит этот обзор? Очевидно, что изучаемые психологами выборки зачастую по тем или иным признакам не соответствуют критерию репрезентативности. Однако насколько серьезны последствия этих несоответствий? Действительно ли они ставят под сомнение внешнюю валидность большей части данных, накопленных исследователями в области психологии развития? По многим причинам ответ, скорее всего, отрицательный. Поскольку параметры практически любой выборки так или иначе будут отклонятся от абсолютной репрезентативности, вопрос может быть сформулирован так: существует ли вообще вероятность того, что определенные отклонения отражаются на возможности обобщения результатов? Часто такая вероятность минимальна. Обобщение предполагает нечто большее, чем то, о чем с логической точки зрения свидетельствуют полученные данные, и во многих случаях гораздо разумнее обобщить, чем не обобщать. Тем не менее к репрезентативности не стоит относиться излишне легкомысленно. «Часто» не то же самое, что «всегда», а «вероятный» не то же самое, что «гарантированный». Характер выборки всегда является тем, что важно учитывать, планируете ли вы свой эксперимент или оцениваете чужой.
Контроль
В предыдущих разделах мы уже затрагивали понятие контроля. Вспомним, что независимая переменная определяется как переменная, которую контролирует исследователь. А обеспечение репрезентативности выборки является одним из видов контроля, который должен осуществлять исследователь. Целью этого раздела является рассмотрение остальных форм контроля, которые приобретают значение с момента получения выборки.
Как явствует из табл. 2.3, для осуществления исследования важны три формы контроля. В таблице перечисляются эти формы и приводятся примеры их использования в исследовании. Формы и примеры их использования довольно сложны; их суть прояснится по ходу изложения. Таблица предназначена для общей ориентации, благодаря которой можно увидеть вводимые разграничения.
Один из видов контроля имеет отношение именно к конкретной форме переменной. Если, к примеру, интерес представляет эффект определенного подкрепления, тогда исследователь должен иметь возможность применить именно такое подкрепление. Если имеют место какие-либо непредусмотренные отклонения – в форме, хронометраже, последовательности и т. д., – исследователь больше не сможет с уверенностью сказать, что представляет из себя независимая переменная. Или рассмотрим вновь параметр времени изучения в исследовании Дюфресна и Кобасигавы. Поскольку исследователей интересовал возможный эффект трудности запоминаемого материала, необходимым условием являлось предъявление всем детям одних и тех же пар, отличавшихся именно по трудности. Вывод, который отсюда можно сделать, незамысловат; он заключается в том, что, желая исследовать эффект чего-либо, следует прежде всего получить возможность сгенерировать это «что-либо». Однако заметьте, что сделать это не всегда так просто, как в приведенных примерах, в которых уровни независимой переменной определялись всего лишь различием стимульного материала. Если экспериментальные манипуляции сложнее, использование переменной в одном и том же виде со всеми испытуемыми может оказаться проблематичным.
Вторая форма контроля имеет отношение ко всем факторам экспериментальных условий, за исключением независимой переменной. Независимые переменные не находятся в вакууме; для них всегда существует контекст, и задачей исследователя является точное определение того, что это будет за контекст. Проверяя память, (как, например, в двух описанных выше исследованиях), исследователь должен решить не только то, какой использовать тест, но и то, какова будет обстановка тестирования. Простой выход в этом конкретном случае – сделать обстановку как можно более спокойной с тем, чтобы минимизировать отвлекающие моменты. Приняв это решение, экспериментатор берет на себя ответственность по обеспечению равно спокойной обстановки для каждого испытуемого.
Теперь введем еще несколько терминов. Вариации значения зависимой переменной называются дисперсией. Те вариации, которые можно объяснить действием независимой переменной, называются первичной дисперсией; те же, которые являются результатом действия других факторов, называются вторичной
дисперсией, или дисперсией ошибки. Контролируя уровень других потенциальных переменных, экспериментатор пытается максимизировать долю первичной дисперсии. Возможно даже большее значение имеет то, что он стремится свести к минимуму вероятность устойчивой связи между любой из независимых переменных и другими источниками дисперсии. Допустим, что Черри и Парк тестировали бы всех своих молодых испытуемых в тихой университетской лаборатории, а пожилых испытуемых – в шумной комнате клуба пенсионеров. Очевидно, что в этом случае были бы две независимые переменные – возраст и условия тестирования, – тогда как подразумевалось наличие только одной. Любые непредусмотренные связи между двумя потенциально значимыми переменными называются смешением. Одной из первоочередных целей качественного исследовательского плана является исключение возможности смешения.
Как явствует из табл. 2.3, контроль нежелательных переменных может принимать несколько форм. Нередко имеется возможность контролировать переменную, делая ее одинаковой для всех испытуемых. Этот случай иллюстрирует пример с памятью, в котором шум в экспериментальных условиях поддерживался на одном уровне для всех испытуемых. Однако иногда такое точное уравнивание нецелесообразно. За примером можно вновь обратиться к исследованию Дюфресна и Кобасигавы. На успешность выполнения теста школьниками могло влиять время суток, в которое проходило тестирование. Склонность к сотрудничеству и внимание в конце учебного дня не обязательно те же, что и перед уроками, непосредственно перед переменой – не те же, что сразу после нее, в пятницу – не те же, что в понедельник. Очевидно, что Дюфресн и Кобасигава внесли бы потенциально значимое смешение, если бы тестировали всех своих первоклассников утром, а всех 7-класс-ников днем. Один из способов избегания этой проблемы – тестирование всех детей в одно и то же время суток в один и тот же день недели, к примеру, в час дня в среду. Однако с таким подходом для завершения большинства исследований потребовались бы месяцы, и даже тогда постоянными для всех испытуемых оставались бы лишь время суток и день недели, а не время года (которое тоже может иметь значение). Разумным альтернативным ходом было бы допустить колебания времени тестирования, однако сделать так, чтобы эти колебания были бы одинаковы во всех сравниваемых группах – в данном случае 1-, 3-, 5– и 7-классников. В этой ситуации контроль переменной «время тестирования» состоял бы не в приравнивании, а в рандомизации – то есть в равномерном распределении ее вариаций по группам испытуемых.
Таблица 2.3 Формы экспериментального контроля
Тип контроля | Методы достижения | Примеры |
Независимой переменной | Сделать значимые элементы экспериментальных манипуляций одинаковыми для всех испытуемых | В эксперименте Дюфресна и Кобасигавы одним и тем же способом предлагать всем детям одни и тот же набор легких и трудных нар |
Потенциально значимых | Сохранять факторы постоянными для всех | В эксперименте Черри и Парк тестировать всех испытуемых в одной тихой комнате |
факторов экспериментальных условии | испытуемых | |
Равномерно распределить по группам вариации других факторов | В эксперименте Дюфресна и Кобасигавы случайным образом выбирать время тестирования во всех группах детей | |
Изначальных индивидуальных | Случайным образом причислять испытуемых к группам, обследуемым в разных экспериментальных условиях | В эксперименте, Черри и Парк случайным образом включить половину испытуемых обоих возрастов в группу наблюдающих модель и в группу наблюдающих схему |
различий между испытуемыми | ||
Подобрать испытуемых таким образом, чтобы они соответствовали друг другу по потенциально значимым качествам | В эксперименте Черри и Парк измерить IQ испытуемых и причислить испытуемых с равными IQ к разным группам (на практике этого сделано не было) | |
Провести обследование каждого испытуемого при всех экспериментальных условиях | В эксперименте Дюфресна и Кобасигавы протестировать каждого ребенка с использованием и трудного, и легкого экспериментального материала | |
Общие принципы, о которых говорилось выше, должны казаться знакомыми. То, о чем здесь говорится, это просто классический научный метод: выявить эффекты некоторого фактора, систематически изменять этот фактор (первая форма контроля), сохраняя постоянными другие потенциально значимые факторы (вторая форма контроля).
Существует и третья форма контроля, которая также играет важную роль. До сих пор «другие, потенциально значимые факторы», о которых шла речь, находились внутри экспериментальной ситуации, например уровень шума в комнате для тестирования. В любом эксперименте еще одним значимым источником дисперсии являются индивидуальные различия между испытуемыми. Испытуемые заведомо неодинаковы, и различия между ними обусловливают наличие дисперсии ошибки в конечных результатах. Поскольку этих различий нельзя избежать, метод контроля вновь должен заключаться не в уравнивании, а в распределении. Экспериментатор должен убедиться в том, что различия равномерно распределены по группам – или, говоря это же иными словами, что к моменту начала обследования группы эквивалентны. Для выполнения этого требования необходимо, чтобы экспериментатор контролировал не только экспериментальное воздействие, но и тех, на кого оно направлено.
Как экспериментатору распределить людей по группам таким образом, чтобы эти группы оказались изначально эквивалентными? Ответ состоит в том, что, хотя возможность стопроцентной гарантии эквивалентности отсутствует, есть определенные способы приблизиться к ней настолько, насколько разумно было бы ожидать. Наиболее распространенный метод – случайное причисление испытуемых к разным группам. Случайное причисление означает, что у всех испытуемых равные шансы попасть в каждую группу. При этом характеристики каждого испытуемого (IQ, пол, опыт выполнения подобного задания – все, что может отразиться на результатах) с одинаковой вероятностью могут попасть в любую из групп. Отсюда, результатом случайного причисления, скорее всего, будет равномерное распределение характеристик по группам, что, естественно, и является целью исследования. Ясно, что логика случайного причисления та же, что и логика случайного отбора, и успешность этого процесса также зависит от размера выборки. Нельзя произвольно разделить 8 испытуемых на две группы и считать с какой-либо долей уверенности, что в результате рандомизации были получены эквивалентные группы. С выборкой, состоящей из 80 человек, шансы на успех гораздо выше.
На практике исследователи в области психологии развития, формируя группы, редко используют абсолютно случайное причисление. Обычно исследователь стремится работать с уравненными экспериментальными группами. Независимо от размеров выборки случайное причисление не может гарантировать, что к концу исследования количество испытуемых не уменьшится. Однако можно поставить условие, согласно которому размеры группы к концу исследования должны быть равными, при этом сохраняя случайность причисления всех испытуемых, Аналогично, даже если исследователя не интересуют половые различия, имеет смысл обеспечить равное соотношение мальчиков и девочек во всех сравниваемых группах. Или, проводя обследование в школе, полезно удостовериться в равноценности обстановки в разных классных комнатах. Соответствие любому из этих требований можно гарантировать установлением определенных ограничений на случайное причисление.
При обсуждении необходимости ограничения влияния случайности встает закономерный вопрос: зачем вообще использовать случайное причисление? В конечном счете, цель исследователя – обеспечить изначальную эквивалентность групп, но в то же время мы видим, что случайность не гарантирует эквивалентность. Если мы можем уравнять соотношение полов испытуемых и обстановку классных комнат, почему не пойти дальше и не привести в соответствие все имеющие значение характеристики, таким образом обеспечивая эквивалентность групп? Общий ответ заключается в том, что привести в соответствие все параметры – труднее, чем может показаться на первый взгляд, и попытка сделать это иногда усложняет, а не упрощает дело. Более конкретный ответ дан в главе 3, где мы возвращаемся к вопросу об отборе и причислении испытуемых. Кроме того, в главе 3 рассматривается третий метод достижения эквивалентности: обследование каждого испытуемого во всех экспериментальных условиях.
Субъектные переменные
Переменные, поддающиеся и не поддающиеся манипуляциям
До сих пор при обсуждении вопроса экспериментального контроля мы говорили в основном об идеальной для исследователя ситуации: когда он имеет возможность систематически изменять независимые переменные, сохраняя постоянными другие факторы, и включать испытуемых в группы с разными экспериментальными условиями, либо случайным образом, либо произвольно, но в рамках определенных ограничений. При использовании многих переменных такой контроль не только желателен, но и вполне осуществим. Мы видим элементы подобного рода контроля в обоих описанных исследованиях: контраст «легкое—трудное» в эксперименте Дюфресна и Кобасигавы, а также контраст «модель—схема» в эксперименте Черри и Парк.
Однако жизнь психолога осложняется тем фактом, что не все переменные находятся во власти исследователя, чего требует хороший исследовательский план. И вновь оба описанные исследования иллюстрируют эту ситуацию, и в этом случае примером служит хронологический возраст. Ясно, что возраст – не является характеристикой, устанавливаемой исследователем; наоборот, это характеристика самого человека, влияющая на экспериментальные условия. Возраст – это лишь один пример того, что называется субъектными (или классификационными) переменными: неотъемлемыми качествами испытуемых, не поддающимися экспериментальным манипуляциям; качествами, которые должны учитываться в своем естественном виде. Другими характерными примерами являются расовая и половая (если не учитывать успехи хирургии последних лет) принадлежность. Как уже отмечалось, исследователь, который хочет работать с такими характеристиками в качестве независимых переменных, лишает себя возможности контролировать их через манипуляции. Единственный способ контроля в этих случаях – контроль через отбор испытуемых, уже обладающих нужными характеристиками.
Другие переменные хотя и не являются в буквальном смысле не поддающимися манипуляциям, в экспериментах с людьми фактически никогда не контролируются. С теоретической точки зрения, к примеру, было бы весьма интересно узнать, развиваются ли младенцы без матери так же, как и с матерью. За исключением эксперимента Фридриха II (см. сноску на с. 13), у нас нет исследований, посвященных этому вопросу, с использованием манипуляций. Тем не менее уже давно существует литература по «материнской депривации» и ее воздействии на ребенка. Работа исследователей заключалась в том, чтобы выявить ситуации, в которых младенцы остались без матери (обычно в приютах), а затем воспользоваться этими «естественными условиями» для изучения развития детей. Существует масса примеров, когда психологи «эксплуатировали» естественно сложившиеся обстоятельства – исследования недостаточного питания в младенчестве, отсутствия отца в детском возрасте, социальной изоляции в старости и т. д. Во всех случаях независимая переменная создается через отбор, а не посредством манипуляций.
Исследования с не поддающимися манипуляциям переменными не соответствуют критериям «подлинного эксперимента», поскольку исключают возможность контролируемых манипуляций, составляющих суть эксперимента. По этой причине Кемпбелл и Стэнли (Campbell & Stanley, 1966), рассматривая экспериментальный план, назвали такие исследования доэкспериментальными. Из-за недостатка контроля мы не можем говорить об установленных причинно-следственных связях с той же долей уверенности, что и в классическом эксперименте.
Каковы конкретные минусы исследования с переменными, не поддающимися манипуляциям? Проблемы можно разделить на две основные категории. Во-первых, испытуемых нельзя произвольно распределять по группам. Поскольку случайное причисление невозможно, нельзя быть уверенными и в том, что изучаемые группы эквивалентны не только по интересующей нас переменной (например, наличие или отсутствие матери), но и по другим параметрам, и поэтому нельзя быть уверенными в том, что причиной различий между группами является именно эта переменная. Данное обстоятельство фактически и являлось поводом для критики исследований ранней материнской депривации. Отбор из популяции только тех малышей, которые воспитываются в приютах, не соответствует критерию случайности, и в результате формируется группа детей, в которой, как правило, выше процент генетических и органических нарушений. Поэтому отличие детей из приюта от остальных нельзя с какой-либо долей уверенности отнести на счет эффекта воспитания без матери. В хорошо спланированном эксперименте такое смешение должно было бы исключаться процедурой случайного причисления. Это, очевидно, проблема с внутренней валидностью: мы не можем утверждать, что наша независимая переменная действительно является причинным фактором.
Другая трудность связана с тем, что воздействие большинства субъектных переменных носит множественный и длительный характер. Воспитание в приюте, отсутствие отца, социальная изоляция, черный (или белый) цвет кожи, принадлежность к мужскому (или женскому) полу – все это факторы, которые способны оказывать значимое влияние на развитие человека. Поэтому, даже обнаружив значимый эффект, связанный с определенной субъектной переменной, мы все еще не
будем знать, каковы конкретные причинные факторы. Это еще одна слабая сторона исследований материнской депривации. Хотя пагубные последствия определенных аспектов воспитания в приюте не вызывают сомнений, уже долгое время ведутся споры о том, являются они результатом нехватки материнского тепла (как, например, утверждал Боулби (Bowlby, 1952)), или более общей когнитивно-перцептивной депривации (как утверждал, например, Кэслер, (Casler, 1961, 1961)). Даже если бы мы могли сделать вывод о значимости матери самой по себе, мы все еще не знали бы, отсутствие какого из факторов, связанных с наличием матери, обусловливает обнаруженные негативные последствия. Вновь имеет место смешение факторов, которые разграничиваются в хорошо спланированном эксперименте. Исследователь, держащий переменные под контролем, вряд ли выберет в качестве независимой такую глобальную переменную, которая не позволит интерпретировать возможные эффекты ее воздействия. Это, очевидно, проблема с конструктной валидностью: мы не знаем, правильно ли интерпретируем результаты.
Это рассуждение не имело своей целью убедить в том, что демонстрирование наличия связи между материнской депривацией, половой принадлежностью или возрастом и развитием ребенка бессмысленно. Однако следует отдавать себе отчет в том, что оно является лишь начальным этапом исследовательской программы.