Текст книги "Социальное влияние"
Автор книги: Филип Зимбардо
Соавторы: Майкл Ляйппе
Жанр:
Психология
сообщить о нарушении
Текущая страница: 47 (всего у книги 51 страниц)
2. Взаимодействие между факторами отбора и экспериментальной переменной. Влияние экспериментальной переменной может сказываться только на испытуемых, относящихся к определенному типу. Например, если изучались только испытуемые с крайними установками, то возможно, что переменные, которые обычно влияют на установки более умеренных в своих взглядах испытуемых, не повлияют на людей с крайними убеждениями.
3. Воздействие условий эксперимента. Специфические различия между условиями, существующими в экспериментальной обстановке, и условиями, существующими вне стен лаборатории, могут играть решающую роль при решении вопроса о границах применимости результатов эксперимента. Например, возможно, что испытуемые в ходе эксперимента всегда имеют сильную мотивацию внимательно прислушиваться к коммуникации, а в естественной обстановке это условие не выполняется.
4. Интерференция экспериментальных воздействий. Иногда каждый испытуемый подвергается тестированию в присутствии и в отсутствие экспериментальной переменной. Поэтому не исключено, что возникнут эффекты, вызванные последовательным воздействием: первая манипуляция не проходит для испытуемого бесследно и сказывается на том, как вторая манипуляция повлияет на его поведение. В таком случае результаты можно переносить только на испытуемых, подвергавшихся воздействию более одного раза, а возможно, только в той же последовательности.
План эксперимента
Теперь, после того, как мы рассказали о некоторых наиболее распространенных причинах нарушения внутренней и внешней валидности эксперимента, давайте посмотрим, насколько успешно можно устранить эти источники ошибок путем использования различных планов эксперимента.
В табл. 1 в обобщенной форме представлен набор, состоящий из пяти чрезвычайно сложных планов эксперимента. Наблюдения или измерения обозначены в таблице буквой О, а буква X относится к экспериментальному воздействию независимой переменной, которое получают испытуемые из данной группы. В каждом из этих экспериментов участвуют, по крайней мере, две группы испытуемых. Некоторые испытуемые получают данное воздействие; другие не подвергаются такому воздействию. Распределение испытуемых по группам, подвергающимся и не подвергающимся экспериментальному воздействию, всегда производится случайным образом (с помощью рандомизации). На случайный характер распределения испытуемых по группам указывает буква R. Например, самый простой из представленных в таблице планов – это план для двух рандомизированных групп. Экспериментальное воздействие получают только испытуемые из первой группы, после чего проводятся наблюдения за обеими группами.
Группа 1 | R | X | |
Группа 2 | R |
В таблице также приводится перечень различных причин нарушения внешней валидности, которые были описаны выше. Если в столбце, соответствующем конкретной причине нарушения валидности, стоит «да», то это означает, что данный план эксперимента не позволяет устранить ошибки такого типа. «Нет» означает, что при данном плане эксперимента такая проблема не возникает. (Причины нарушения внутренней валидности в таблице не указаны. Ни одна из них не является источником проблем, если правильно спланирована и проведена экспериментальная процедура.)
«Лучшим» планом, позволяющим свести к минимуму количество источников нарушения валидности, является план для отдельной выборки с предварительным и итоговым тестированием. В этом случае экспериментатор случайным образом распределяет испытуемых по нескольким группам. Сначала экспериментатор тестирует реакции до экспериментального воздействия, но только у половины испытуемых. Оставшаяся половина испытуемых проходит тестирование через какое – то время. Однако те испытуемые, тестирование которых проводится позднее, также делятся пополам, так что одна группа получает экспериментальное воздействие, а другая не
Таблица 1
Некоторые планы эксперимента, минимизирующие источники нарушения валидности
* Здесь рандомизируется как распределение испытуемых по группам, так и выбор групп, получающих экспериментальное воздействие.
получает. Кроме того, читателю следует обратить внимание на одну важную отличительную особенность этого плана. Можно показать, что концептуальный статус независимой переменной не ограничивается единственным набором конкретных операций. При использовании двух различных наборов операций (Х1 и Х2), которые оба являются производными одной и той же концептуальной независимой переменной, появляется возможность делать из конкретных наблюдений общие выводы, относящиеся к абстрактным переменным.
Это описание показывает, что при любом плане эксперимента рандомизация играет очень важную роль. Важно также, чтобы наблюдения за испытуемыми не влияли на поведенческие результаты экспериментальных воздействий.
Приложение 2
ОЦЕНКА УСТАНОВОК И ИХ КОМПОНЕНТОВ
В ходе лабораторных и полевых исследований производится оценка реакций людей. В этой книге мы проанализировали много исследований и вкратце описали, как в них проводилось измерение зависимой переменной. В данном приложении мы дадим более подробное описание некоторых основных методов психологических измерений. Эти методы часто служат основой для разработки специфических оценок, удовлетворяющих потребностям конкретного исследования. Мы сосредоточим основное внимание на оценке установок, которые являются центральным понятием этой книги. Мы также коротко расскажем о том, как можно оценивать другие компоненты систем установок.
Если вы задумаетесь над этим вопросом, то поймете, что оценка установки – далеко не простая задача. Как измерить нечто, находящееся в человеческом сознании? Можно догадаться, что единственный способ решения этой проблемы – заставить человека сделать внутренние установки внешними, чтобы их можно было оценить. Иными словами, надо добиться, чтобы внутренние установки человека выразились в его внешнем поведении. Элементом этого поведения может быть прохождение письменного тестирования или заполнение анкеты.
Шкалы установок
Для оценки установок разработано несколько различных письменных тестов. Четыре теста после тщательной разработки достигли довольно высокого уровня совершенства. В число этих основных методов тестирования установок входят метод равных интервалов Терстоуна, метод суммируемых оценок Ликерта, шкалограмм – ный анализ Гуттмана и метод семантического дифференциала Осгуда. Надеемся, что, ознакомившись с краткими обзорами каждого из этих методов, вы получите ясное представление о том, как социальные психологи получают данные, на основе которых они потом делают столь красивые обобщения.
В основе каждого из обсуждаемых методов лежат различные предположения о характере пунктов теста и характере информации об установках человека, которую можно получить в результате тестирования. Тем не менее есть некоторые основные предположения, которые являются общими для всех этих методов. В первую очередь предполагается, что субъективные установки поддаются количественному измерению, т. е. мнение каждого человека можно охарактеризовать с помощью какого – либо числового показателя. Во – вторых, во всех этих методах предполагается, что каждый конкретный пункт теста имеет одинаковый смысл для всех респондентов, и поэтому данный ответ будет оцениваться одинаково, кто бы его ни дал. Эти предположения могут быть не всегда оправданными, но до сих пор еще не разработана такая методика измерений, чтобы можно было обойтись без этих предположений.
Метод равных интервалов Терстоуна. Первый из основных методов оценки установок был разработан в 1929 году Терстоуном в работе, посвященной исследованию установок по отношению к религии. Создав шкалу оценки установок, он впервые предложил методику точных измерений для области исследований, в которой они прежде никогда не использовались. Терстоун предположил, что можно отобрать высказывания, содержащие мнения по какому – нибудь конкретному вопросу, и ранжировать эти высказывания по показателю, отражающему благоприятное или неблагоприятное отношение к данному вопросу, выраженное в высказываниях. Кроме того, можно ранжировать эти высказывания таким образом, чтобы разность показателей соседних высказываний континуума оказалась одинаковой. Последнее предположение позволяет дать количественную оценку расхождений между установками разных людей. Терстоун также предположил, что между высказываниями нет корреляционной связи и что в каждом высказывании выражена точка зрения, которая не зависит от других высказываний. Это означает, что из принятия одного высказывания не следует, что надо обязательно принять еще и какое – либо другое.
Шкала Терстоуна состоит примерно из 20 независимых высказываний, содержащих мнения по определенному вопросу. Каждому высказыванию соответствует значение показателя на числовой шкале, которое определяется его положением в континууме, а это положение в свою очередь определяется в соответствии с усредненными судейскими оценками.
Чтобы оценить установки людей по данному вопросу, их просят отметить те высказывания, с которыми они согласны. Общая оценка установок каждого человека определяется как среднее значение показателей тех высказываний, которые он отметил. Ниже приводится в качестве примера сокращенный вариант такой шкалы (табл. 2).
Отличительной особенностью шкалы Терстоуна является то, что интервалы между показателями соседних высказываний примерно одинаковы. Такое свойство шкалы достигается за счет метода ее построения. Первый шаг – это сбор большого количества высказываний по какому – нибудь конкретному вопросу. Все неясные, туманные или двусмысленные высказывания, а также высказывания, которые могли бы одобрить индивидуумы с противоположными установками, сразу же исключа-
Таблица 2
ются из рассмотрения. Затем группа судей сортирует все оставшиеся высказывания, разбивая их на 11 категорий в соответствии с тем, насколько выраженное в высказывании мнение благоприятно или неблагоприятно по отношению к рассматриваемой проблеме, независимо от собственных установок судей. Таким образом, эти классы образуют шкалу с диапазоном от наиболее благоприятных до крайне неблагоприятных мнений по отношению к данной проблеме, включая нейтральные. Протабулировав оценки всех судей, можно рассчитать положение каждого высказывания на числовой шкале (его среднее значение на шкале) и то, насколько судьи единодушны в мнениях об этом положении (разброс оценок). Для включения в окончательную шкалу отбирают высказывания, по которым мнение судей было примерно одинаковым и которые попадают в примерно одинаковые интервалы на континууме. После этого можно оценить установки человека по отношению к данной проблеме по его ответам на набор пунктов окончательно сформированной шкалы.
Метод суммируемых оценок Ликерта. Один из практических недостатков шкалы Терстоуна состоит в том, что ее построение чрезвычайно трудоемко и занимает много времени. Чтобы решить эту проблему, Ликерт разработал другую методику, с помощью которой сравнительно просто можно получить столь же надежную шкалу установок. Шкала Ликерта состоит из ряда высказываний, выражающих мнения по определенной проблеме. Однако в отличие от шкалы Терстоуна для оценки установки человека его просят указать степень своего согласия или несогласия с каждым пунктом. Для этого человек оценивает каждый пункт по пятибалльной шкале реакций (полностью согласен, согласен, не могу решить, не согласен, решительно не согласен). Оценкой установки человека служит сумма выставленных им оценок по всем пунктам. Ниже приводится пример одного пункта такой шкалы.
А. «Смертный приговор – это правильное наказание за преднамеренное убийство».
Ликерт предполагает, что каждое высказывание, включенное в шкалу, является линейной функцией одного и того же параметра установки. На основе этого предположения для получения итоговой оценки установки производится операция суммирования оценок, выставленных человеком по отдельным пунктам шкалы. Отсюда следует, что должна существовать тесная корреляция между пунктами шкалы и некоторой общей характеристикой, а значит, в отличие от четко разграниченных и независимых пунктов шкалы Терстоуна пункты шкалы Ликерта коррелируют между собой. Важно отметить, что Ликерт ни в коем случае не предполагает, что интервалы между значениями шкалы равны. Например, вполне возможно, что разница между «согласен» и «полностью согласен» значительно больше, чем разница между «согласен» и «не могу решить». Это означает, что шкала Ликерта позволяет получить информацию о порядковом распределении установок людей на континууме, но с ее помощью нельзя точно указать, насколько близки или далеки друг от друга различные установки.
Построение шкалы Ликерта на начальном этапе аналогично построению шкалы Терстоуна: производится сбор и редактирование различных высказываний, выражающих определенные мнения по какой – нибудь проблеме. Затем испытуемые из выборки оценивают оставшиеся после отбора высказывания по пятибалльной шкале реакций, основываясь на своем собственном мнении об этих высказываниях. Этим процедура построения шкалы Ликерта отличается от процедуры построения шкалы Терстоуна, где оценки выставляют подготовленные судьи, которые основывают их не на личном мнении, а на некоторой относительно объективной оценке положения каждого высказывания на континууме. В шкалу Ликерта включают те пункты, по которым сильнее всего расходятся в оценках испытуемые с самыми низкими и самыми высокими итоговыми оценками из всей выборки.
Шкалограмма Гуттмана. Третий метод шкалирования основан на предположении, что степень выраженности единственного одномерного свойства можно измерить с помощью набора высказываний, которые упорядочены вдоль континуума «трудности принятия». Это означает, что высказывания находятся в диапазоне от тех, которые большинству людей легко принять, до тех, которые поддержали бы
Таблица 3
лишь немногие люди. Пункты такой шкалы кумулятивны, поскольку из принятия одного пункта следует, что человек принимает все пункты, соответствующие меньшим значениям шкалы (эти пункты принять легче). Таким образом, можно предсказать отношение человека к другим высказываниям, зная, с каким наиболее трудным для принятия пунктом согласен этот человек. Примером шкалы Гуттмана может послужить следующая шкала: табл. 3.
Чтобы построить шкалу, отражающую единственный показатель, Гуттман предлагает испытуемым из выборки начальный набор пунктов и регистрирует их реакции на пункты шкалы, в которых приведены готовые образцы ответов. Эти образцы, которые называются классами шкалы, выстроены в определенном ступенчатом порядке. Испытуемый может не принять ни одного из пунктов этого набора (оценка 0), может принять только пункт А (оценка 1), может принять только пункты А и Б (оценка 2), может принять А, БиВ (оценка 3) и так далее. Если ответы испытуемого не укладываются в схему шкалы (например, он принимает только пункт Вине принимает пункты с меньшими значениями по шкале), то предполагается, что он сделал не менее одной ошибки в ответах. Анализируя количество сделанных в ответах ошибок, можно определить, до какой степени первоначальный набор пунктов отражает одномерное свойство (т. е. насколько эти пункты поддаются шкалированию). Окончательная шкала получается путем исключения непригодных пунктов и повторного тестирования испытуемых из выборки, пока не будет разработан набор пунктов, пригодных для шкалирования.
Чтобы оценить установки человека, его просят отметить на шкале те высказывания, которые для него приемлемы. Варианты шкалы Гуттмана используются в исследованиях актуальности установок для определения сфер принятия и отвержения (см. главу 6). Итоговой оценкой является оценка соответствующего класса шкалы или (если ответы испытуемого не укладываются в схему шкалы) оценка класса шкалы, ближайшего к этим ответам. Из описания процедуры получения оценки следует, что почти невозможно разработать идеальную одномерную шкалу. Возможно, дело в том, что люди в действительности реагируют не на единственный гипотетический параметр, а на какой – то другой или сразу на несколько параметров.
Метод семантического дифференциала Осгуда. В трех вышеописанных методах предпринимается попытка оценивать установки, заставив людей указать степень своего согласия с различными высказываниями, выражающими мнения. В отличие от такого подхода Осгуд при изучении установок обращал основное внимание на смысл, который люди придают слову или понятию. В основе этой методики лежит главное предположение о существовании гипотетического семантического пространства, обладающего неопределенным количеством измерений, в котором смысл любого слова или понятия можно представить в виде конкретной точки. Следуя процедуре Осгуда, надо попросить людей оценить конкретное понятие с помощью набора семантических шкал. На концах этих шкал находятся слова противоположного значения, а в середине – точка нейтральности; обычно шкалы состоят из семи, отличных друг от друга шагов. Например, можно оценить, что понимает конкретный человек под понятием «атомная энергия», зная его оценки этого понятия по ряду семантических шкал, составляющих набор:
Хорошо_____ _____ _____ _____ _____ _____ _____ _____ _____ _____ Плохо
Сильно _____ _____ _____ _____ _____ _____ _____ _____ _____ _____ Слабо
Быстро _____ _____ _____ _____ _____ _____ _____ _____ _____ _____ Медленно
Активно_____ _____ _____ _____ _____ _____ _____ _____ _____ _____ Пассивно
и так далее.
Анализируя собранные таким образом оценки, можно выявить конкретные параметры, которыми люди пользуются для определения своих ощущений, классы понятий, которые рассматриваются как сходные или различные по смыслу, и интенсивность смысла, вкладываемого в конкретное понятие. Собственные исследования Осгуда показали, что существуют три доминантных, независимых параметра, которыми люди пользуются для оценки понятий (Osgood et al., 1957). Он называет эти параметры оценочным фактором (например, хороший – плохой), фактором мощности (например, сильный – слабый) и фактором активности (например, активный– пассивный). Хотя этот метод может дать массу информации о понятии, не вполне ясно, каким образом смысл понятия для данного человека связан с установками этого человека.
Использование шкал с одним и несколькими пунктами в экспериментах. В большинстве исследований установок или изменения установок, особенно в лабораторных экспериментах, используемая для оценки установки шкала состоит только из одного или нескольких пунктов. Как правило, используется формат шкалы Ликерта, а не систематично разработанный вопросник со многими пунктами. Например, при исследовании убеждения в первом пункте, предлагаемом сразу же после убеждающего сообщения, может быть снова сформулирован вывод из этого сообщения, и испытуемого попросят оценить степень своего согласия с ним по шкале Ликерта. В шкале может быть пять, десять или даже тридцать и более пунктов, а подгруппам пунктов могут быть присвоены описательные ярлыки. Например:
Следует ввести для студентов плату за парковку автомашин на территории университета в размере 50 долларов за семестр:
1 2 3 | 4 5 6 | 7 8 9 | 10 11 12 | 13 14 15 |
Резкие возражения | Умеренные возражения | Не могу решить | Умеренное согласие | Полное согласие |
Можно также применять шкалу семантических дифференциалов в модифицированной форме. Часто семантические шкалы выбирают для того, чтобы подчеркнуть параметр «хороший – плохой», который лучше всего соответствует определению установки как итогового оценочного мнения. Например, после того как испытуемые прослушали сообщение, в котором поддерживается идея введения платы за автостоянку, их можно попросить оценить концепцию введения для студентов платы за парковку по четырем параметрам: «хорошо – плохо», «умно – глупо», «благоприятно – неблагоприятно» и «полезно – вредно». В некоторых случаях оценки каждого испытуемого по всем параметрам можно просуммировать и принять эту сумму за общую оценку установки испытуемого.
Кроме этих распространенных подходов используются также специфические шкалы самоотчета. Например, можно попросить испытуемых оценить свое отношение к объекту установки по шкале «нравится – не нравится».
Оценка установок: каждый исследователь выбирает метод на свой вкус.
В действительности в исследованиях используются самые разные методы измерения установок. В связи с отсутствием единой измерительной методики при интерпретации и сравнении полученных оценок возникают проблемы. Фактически разные исследования отличаются между собой не только тем, какие в них используются измерительные шкалы или какие задачи ставятся перед испытуемыми при тестировании. Даже при использовании весьма сходных систем измерения в экспериментах могут применяться различные методики преобразования этих обычных реакций в количественно определенные независимые переменные. Последнюю из упомянутых проблем можно проиллюстрировать на примере: в одном исследовании испытуемых просят высказать свое мнение, отметив точку на шкале «за – против», а в другом используется шкала «нравится – не нравится». Изменение установок может быть описано с помощью любой из следующих оценок: 1) процентная доля испытуемых, у которых вообще наблюдаются какие – либо положительные изменения; 2) процентная доля испытуемых, у которых наблюдаются «большие», «умеренные» и «маленькие» изменения или они отсутствуют (классы определяются произвольно); 3) сальдо процентных изменений (положительные, минус, отрицательные изменения); 4) любая из приведенных выше оценок, рассчитанная для произвольно выбранного сочетания пунктов теста; 5) изменение абсолютного среднего положения установки на шкале; 6) изменение положения установки, отнесенное к величине возможного изменения.
Применение разнообразных методов измерения установок имеет и свою положительную сторону. Во – первых, если исследователи получают сходные результаты даже если они используют различные измерительные методики, то возрастает наша уверенность в том, что эти результаты достоверны, а основанные на них выводы можно переносить на других испытуемых, ситуации, условия и т. п. – т. е. можно утверждать, что рассматриваемые независимые переменные действительно влияют на установки таким способом, который наблюдался в исследованиях (Campbell and Fiske, 1959). Если зависимая переменная все время измерялась совершенно одинаковым способом, то не исключается возможность влияния процедуры измерения, которое могло внести свой вклад в появление наблюдавшихся эффектов. Во – вторых, между оценками, полученными при использовании тщательно выбранных и разработанных методов измерения установок (даже при использовании шкал с несколькими пунктами), обычно существует довольно сильная корреляционная связь, что говорит о том, что с их помощью измеряются чрезвычайно сходные аспекты установки. В – третьих, отметим, что разные исследователи могут исходить из неодинаковых определений установки. Например, в некоторых теоретических работах, посвященных проблемам прикладных исследований, установки рассматриваются как сумма убеждений и когниций, в то время как при использовании других подходов и при анализе других проблем исследователей может интересовать в основном аффективный компонент установок. В первом случае наиболее подходящим измерительным инструментом может оказаться шкала Терстоуна; во втором случае можно использовать оценки по шкалам «нравится – не нравится» и «хорошо – плохо». И в том и в другом случае речь идет об измерении установок, однако методы измерений не являются идентичными ни с концептуальной, ни с операционной точки зрения – да они и не должны быть идентичными.