![](/files/books/160/oblozhka-knigi-psihologiya-razvitiya-metody-issledovaniya-170362.jpg)
Текст книги "Психология развития: методы исследования"
Автор книги: Скотт Миллер
Жанр:
Психология
сообщить о нарушении
Текущая страница: 11 (всего у книги 48 страниц) [доступный отрывок для чтения: 18 страниц]
Как наблюдать
Предположим, исследователь с ручкой и папкой в руке и твердым намерением провести наблюдение определенного рода повеления дошкольников приходит в детский сад. Как ему регистрировать интересующие его данные?
Один из возможных вариантов: просто записывать в повествовательной форме видимое поведение в его естественном виде. Этот метод называется нарративной записью, его также называют записью специфических моделей (термин предложен Баркер и Райт (Barker & Wright, 1951), поток поведения. Конечно, даже для максимально подробного нарративного описания все же характерна некоторая избирательность. Обычно все внимание сосредотачивается на одном ребенке, а поведение других детей учитывается лишь в момент их взаимодействия с наблюдаемым ребенком. Наблюдая ребенка, необходимо постоянно принимать решения о том, какие действия стоят того, чтобы их зафиксировать, а какие (например, моргание, сглатывание) можно проигнорировать. Кроме того, нужно принимать решения об уровне описания поведения. Например, сомкнул Джонни пальцы, сжал кулак или угрожал другому ребенку? В определенном смысле, при использовании нарративной записи наблюдатель выполняет функции видеокамеры и магнитофона. Однако он – это видеокамера-магнитофон со встроенным мощным аппаратом-редактором.
Несмотря на упомянутые выше ограничения, главным достоинством нарративной записи является ее подробность. Она дает больше информации, чем любой другой метод наблюдения. Эта полнота изложения делает нарративную запись особенно ценной для специалистов, которым требуется исчерпывающая информация о ребенке. Поэтому нарративную запись обычно используют учителя и клиницисты. Кроме того, нарративная запись может послужить отправной точкой для разработки исследовательских программ, наводя на мысль о существовании неких феноменов, которые затем будут изучаться более узконаправленными систематическими методами. Наконец, нарративная запись это не всегда и необязательно всего лишь подготовительное мероприятие перед исследованием; если регистрация производится достаточно умело и последовательно, полученные данные могут стать базой для исследования. В этих случаях нарративная запись представляет из себя «сырые» данные, которые необходимо кодировать и проанализировать; в результате из потока действий вычленяются интересующие исследователя элементы и феномены.
Если говорить о недостатках, ведение нарративной записи может потребовать значительных расходов и времени. Особенно высок уровень требований к наблюдателю, как и вероятность разных форм субъективности и систематических ошибок. У исследователя может накопиться огромный объем информации, только малая часть которой представляет некоторый интерес. Или, исследователь еще до начала наблюдения сформулировал вполне четкие цели и гипотезы, тогда нарративная запись будет не самой экономичной формой сбора данных. В обоих случаях имеет смысл использовать более узконаправленные методы наблюдения.
Второй из основных способов наблюдения – метод временных срезов (иногда называемый также методом интервальных срезов). От нарративной записи его отличают две особенности. Во-первых, при использовании метода временных срезов в центре внимания находится ограниченное количество специфических действий, а не их поток. В своем практическом применении приведенные в качестве примеров микро– и макросистема (табл. 4.2 и 4.3) также предполагают использование временных срезов. Здесь заранее оговорен точный список действий, и регистрируются только эти действия. Поскольку уже имеются четкие определения, нет необходимости составлять нарративное описание поведения; используется некий контрольный перечень или система кодирования. Второй отличительной особенностью является разделение всего периода наблюдения на строго отмеренные, обычно непродолжительные временные интервалы. Наблюдатель может 15 секунд наблюдать, отвернуться и регистрировать увиденное в течение 15 секунд, наблюдать еще 15 секунд, еще 15 секунд регистрировать и т. д. Таким образом, «срезы» в методе временных срезов происходят в двух плоскостях: анализируется только часть поведения, а само наблюдение производится только в определенные интервалы времени.
Третий способ лучше объяснить на примере. В своем, как это часто называют «классическом», исследовании Доу (Dawe, 1934) изучала ссоры дошкольников. Хотя мнения воспитателей и расходились, оказалось, что ссоры – не очень частое явление, имеющее место в среднем 3,4 раза в час. Если принять во внимание низкую частоту подобных случаев, использование нарративной записи временных срезов было бы малоэффективным. Кроме того, метод временных срезов мог бы ввести в заблуждение; наблюдатель мог бы упустить момент ссоры, если бы она произошла в период регистрации, или увидеть лишь ее часть, если бы она происходила в промежуточный момент. Поэтому Доу использовала метод выборочного анализа поведенческих событий, при котором единицей изучения служит эпизод изучаемого поведения, а не интервал времени. Как и при использовании метода временных срезов, наблюдатель прежде всего должен определиться, какое поведение его интересует. Однако, используя метод выборочного анализа поведенческих событий, наблюдатель просто дожидается, пока это поведение будет иметь место, и только затем начинает записывать. Протокольные записи Могут быть разных видов, от нарративного описания до последовательности кодов. Доу использовала сочетание заранее сформулированных категорий с дополнительными замечаниями. К оценивавшимся категориям относились «пассивное поведение», «мстительное поведение» и «ненаправленная активность». Какова бы ни была форма регистрации, сосредоточение на определенном виде поведения как элементарной единице наблюдения позволяет получить информацию (например, среднею продолжительность эпизодов изучаемого поведения, предшествующие ему события и события, следующие за ним), которая могла бы быть упущена при использовании временных срезов.
В целом, факторы, влияющие на выбор той или иной системы регистрации, те же, что и факторы, влияющие на выбор микро– или макронаблюдения: цель и осуществимость. В одних обсервативных исследованиях (например, в отчетах о клинических случаях) необходимо нарративное описание, в других – уместен более узконаправленный подход с использованием таких методов, как временные срезы и выборка событий. Каковы бы ни были цели, исследователь должен применять систему, отвечающую требованиям данных конкретных условий, не превосходящую возможности наблюдателей и лимит времени, а также, предполагающую рациональное соотношение между полезной информацией и затратами времени и усилий. Более подробно о плюсах и минусах разных систем регистрации можно узнать из ряда специальных работ (Hartman & Wood, 1990, Mann, Have, Plunkett, & Meisels, 1991, Odom & Ogawa, 1992).
Определение точности результатов наблюдения
Этот раздел открывает рассмотрение двух специфических факторов, способных отразиться на точности результатов наблюдения. Его завершает анализ проблемы надежности.
Поведение, которое регистрируется в обсервативном исследовании, может являться функцией от множества предшествующих и сопутствующих обстоятельств. Один из факторов, влияние которого на поведение нежелательно, – это само присутствие наблюдателя. Тем не менее присутствие наблюдателя и, как следствие, осознание испытуемым того, что он является объектом наблюдения, может так или иначе изменить поведение. Подобные эффекты входят в категорию реактивности – эффекта непреднамеренного влияния экспериментальных мероприятий на поведение испытуемого. Когда речь идет об обсервативном исследовании, эффект реактивности, как правило, называют проблемой влияния наблюдателя.
Вопрос о том, насколько важен эффект реактивности, уже давно является предметом научных споров. Есть основания полагать (например, Brody, Stoneman, & Wheatley, 1984; Russell, Russell, & Midwinter, 1992), что и взрослые, и дети ведут себя несколько иначе, зная, что за ними наблюдают; есть также свидетельства того,
что при определенных обстоятельствах наблюдение абсолютно не влияет на поведение, Хартманн и Вуд (Hartman & Wood, 1990) тщательно анализируют факторы, от которых зависит эффект реактивности. По их мнению, есть несколько способов снижения вероятности влияния наблюдателя. Один из них – дать испытуемым привыкнуть к присутствию наблюдателя, то есть ввести наблюдателя в обстановку до начала наблюдения и производить регистрацию только после того, как испытуемые привыкли к наблюдателю и возвратились к своему естественному поведению. Этот метод иногда называют «методом невидимки». Вариант его, который хотя и не всегда, но можно использовать, – наблюдение, производимое тем, с кем испытуемые уже хорошо знакомы,.кто является естественным персонажем в данной обстановке, например родителем или учителем. Выполнение функций наблюдателя известным лицом называется «включенным» наблюдением.
Еще одна стратегия – сокрытие факта наблюдения. Можно, к примеру, использовать скрытую камеру или одностороннее зеркало. Конечно, такая возможность нередко отсутствует – эти методы применимы только в специальных условиях. Кроме того, скрытое наблюдение связано с этическими, а также материально-техническими ограничениями. Как мы увидим в главе 8, наблюдение за людьми без их на то согласия может рассматриваться как нарушение принципов этики.
Второй недостаток обсервативных исследований – вероятность необъективности наблюдателя, которая является лишь частным случаем более общей проблемы. Многочисленные исследования, начатые Робертом Розенталем (Robert Rosen-thai, 1976), свидетельствуют о том, что ожидания исследователей, которые они привносят в свое исследование, иногда ведут к искажению результатов в направлении ожидаемых или желательных. Более подробно об этом рассказано в главе 5. В обсервативном исследовании присутствует риск того, что наблюдатель будет видеть и заносить в протокол только то, что ожидает увидеть, а не то, что происходит на самом деле.
Одним из доказательств может служить исследование Кент, О'Лири, Дайамент и Дитц (Kent, O'Leary, Diament, & Dietz, 1974). Наблюдателям были продемонстрированы видеозаписи, как было сказано испытуемым, исходной фазы и фазы экспериментального воздействия некой программы, направленной на коррекцию агрессивного поведения в школе. Половине наблюдателей было сообщено, что прогнозируется снижение уровня агрессии; другой половине – что никаких изменений не предвидится. Фактически все наблюдатели смотрели одну и ту же видеозапись, в которой никаких изменений поведения не происходило. Оценивая затем эффективность программы, 9 из 10 наблюдателей, ожидавших снижения уровня агрессии, сообщали о том, что оно действительно произошло; а 7 из 10 наблюдателей, не ожидавших изменений, не отмечали никаких изменений. Интересно, что протоколы, которые вели участники обеих групп в процессе просмотра видеозаписи, были сходными, однако окончательные оценки свидетельствовали о влиянии ожидания.
Результаты этого исследования говорят о том, что для снижения вероятности необъективности наблюдателя необходимо сделать систему оценки максимально специфичной и объективной. Чем шире простор для интерпретации, тем больше у наблюдателя возможностей исказить результаты собственной предвзятостью. Еще один способ снижения вероятности необъективности – сделать так, чтобы наблюдатель не знал о выдвинутых гипотезах или о том, к какой группе принадлежат испытуемые. Сокрытие информации, которая может привести к необъективности, является условием так называемого наблюдения «вслепую». Мотив его использования очевиден: если нет никаких ожиданий, нет и опасности эффекта ожидания. К сожалению, проведение наблюдения «вслепую» затруднительно, а в некоторых случаях – невозможно. Кроме того, даже если проведение наблюдения «вслепую» возможно, к нему прибегают далеко не всегда.
Еще одного рода проблемы так или иначе связаны с понятием надежности. Как отмечалось ранее, надежность означает согласованность результатов измерения. При использовании методов наблюдения ключевым моментом является единодушие наблюдателей: могут ли двое или более наблюдателей прийти к единым выводам относительно некоторого поведения? Такое согласие является необходимым условием точности результатов наблюдения. Однако выполнения этого требования недостаточно, поскольку существует вероятность того, что оба исследователя пришли к единому, но ложному выводу. Это вновь частный случай общего принципа: надежность – это необходимое, но недостаточное условие валидности.
Существует множество способов расчета надежности. Для определенного вида данных подходит коэффициент корреляции. Чем выше коэффициент корреляции между результатами, полученными двумя независимыми наблюдателями, тем выше надежность. Еще один, часто используемый индекс – процент совпадений. Предположим, оценка определенного вида поведения происходит 20 раз. Совпадение мнений двух наблюдателей в 19 случаях из 20 соответствует 93 %, достаточно высокой надежности. Совпадение только в 13 случаях из 20 соответствует 65 %, что может рассматриваться как неудовлетворительная надежность. О других методах расчета надежности, а также сложностях, связанных с каждым из них см.: .Mitchell, 1979 и Hartmann, 1982.
Вопрос о том, как рассчитать надежность, встает сразу, как только исследователь осознал необходимость надежности своего исследования. При обзоре журнальных статей (см. табл. 1.3) учитывалось наличие или отсутствие рассчитанного коэффициента надежности там, где это было желательно. Результаты обзора свидетельствуют о достаточно высоком, но не полном осознании необходимости учета фактора надежности: данные о надежности были представлены в 91 % случаев из тех, где эти данные были вполне уместны. Одом и Огава (Odom & Ogawa, 1992) более подробно рассматривают расчет коэффициента надежности в обсервативных исследованиях, включая анализ типов статистических показателей и критерии их использования.
Приемы повышения надежности легко описать, но не всегда легко использовать. До начала процедуры сбора данных наблюдатели должны пройти тщательную подготовку. Система оценок должна быть максимально четкой и конкретной. Для подготовки наблюдателей и уточнений системы оценок может использоваться пилотажное исследование, в ходе которого категории редко встречающегося и трудно оцениваемого поведения либо исключаются, либо трансформируются в более удобные категории. Наконец, если есть возможность, для того чтобы иметь непрерывную и воспроизводимую запись, лучше снимать поведение видеокамерой.
Как следует из вышесказанного, при сборе данных нужно как можно раньше позаботиться о надежности. Желательно также контролировать ее на всем протяжении исследования. О целесообразности этого говорят исследования Рэйд (Reid, 1970; Taplin & Reid, 1973). В исследовании Тэплин и Рэйд наблюдатели прошли предварительную подготовку, в ходе которой достигли приемлемого уровня надежности. Затем одну группу наблюдателей проинформировали о том, что надежность оцениваться больше не будет; а участникам второй группы сообщили, что периодически, без предупреждения будет осуществляться проверка их надежности. В действительности записи всех наблюдателей продолжали сравни-вать с исходным уровнем. Результат был очевиден: наблюдатели, ожидавшие, что их оценки будут подвергаться проверкам, сохраняли более высокий уровень надежности. Данная тенденция к снижению надежности изначально надежных наблюдателей при отсутствии контроля называется дрейфом наблюдателя. Дрейф наблюдателя относится к категории искажающих валидность факторов, которую Кэмпбелл и Стэнли (Campbell & Stanley, 1966) называют инструментацией: непреднамеренным изменением измерительного инструмента в ходе исследования.
До этого момента о надежности говорилось так, будто есть некий единый индекс надежности, которому исследование либо соответствует, либо нет. В действительности, в типичном исследовании, как правило, существует множество видов надежности – для определенных форм поведения, определенных аспектов поведения, определенных периодов времени, определенных подгрупп испытуемых и т. д. Суть состоит в том, что надежность должна быть продемонстрирована на том уровне, на котором производится анализ данных. Если, к примеру, исследователь хочет оценить посттестовые различия, обусловленные неким воздействием, необходимо продемонстрировать надежность посттестовых данных; надежности, достигнутой на фазе претеста, будет недостаточно. Аналогично, если изучается частота агрессивных действий, надежности общих оценок уровня агрессии будет недостаточно, исследователь должен показать, что наблюдатели сходятся во мнении и относительно частоты случаев проявления агрессии.
Ярроу и Уакслер (Yarrow & Waxier, 1979) иллюстрируют это положение интересным и несколько менее очевидным примером. Эти авторы описывают ряд обсервативных исследований, в которых коэффициенты надежности недсчитывались отдельно для мальчиков и для девочек. В некоторых случаях оценка поведения представителей одного пола была более надежной, чем оценка поведения представителей противоположного пола. По крайней мере в этих исследованиях оценки агрессии мальчиков были надежнее оценок агрессии девочек. Кроме того, существенная связь индивидуальных различий в уровне агрессии с другими показателями наблюдалась только у мальчиков. Как отмечают Ярроу и Уакслер, этот результат может отражать действительно имеющие место различия между полами или всего лишь недостаточную надежность оценок агрессивного поведения девочек. В этом случае, как и в предыдущем, надежность необходима на уровне, на котором используются данные.
Ярроу и Уакслер (Yarrow & Waxier, 1979) также обсуждают плюсы и минусы возложения на наблюдателя функций измерительного инструмента. Их рассуждение может быть кратким выводом к этой главе:
«Даже будучи чрезвычайно опытным, наблюдатель по многим критериям – неточный научный инструмент: нестандартный, неоткалиброванный, зачастую нестабильный и ненадежный. Эти недостатки компенсируются такими присущими лишь человеку качествами, как чувствительность, гибкость и аккуратность. Задача состоит в том, чтобы решить, как провести строгое наблюдение, в полной мере используя свойственную человеку проницательность» (р. 37).
Резюме
Эта глава начинается с рассмотрения некоторых базовых принципов измерения. Переменные, с которыми мы работаем, определяются – операционально – способами их измерения. Измерение всегда заключается в переводе некоего глобального конструкта (например, агрессии) в более конкретную, объективную, поддающуюся количественной оценке форму. Этот перевод подразумевает выбор из множества возможных ограниченного числа способов измерения. Необходимо выбирать аспект поведения, который будет измеряться (например, частота, интенсивность), характер объекта измерения (явный или неявный), определить, являются результаты измерения признаками или специфическими моделями изучаемого конструкта, и решить, следует сосредоточивать внимание на временном состоянии или на устойчивом свойстве.
При оценке качества измерения имеет значение следующее. Измерение должно привести к результатам, находящимся на определенном уровне и в определенных рамках, при отсутствии эффектов как нижнего, так и верхнего пределов. Если в исследование включаются разнородные группы (например, дети разных возрастов), необходимо решить вопрос эквивалентности измерения. Во избежание монооперационального искажения следует применять разноплановые методы. Наконец, исследователь должен позаботиться о надежности (согласованности) и валидности (точности) измерительных операций.
В следующем разделе главы, посвященном стандартизованным тестам, вопросы надежности и валидности рассматриваются более подробно. В отношении теста валидность означает, что тест измеряет именно то, что призван измерять. Анализируются три формы валидности теста: содержательная валидность, критериальная валидность и конструктная валидность. Наиболее сложной из этих форм является конструктная валидность, для установления которой могут потребоваться экспериментальные и корреляционные данные, а также обеспечение конвергентной и дивергентной валидности корреляций между показателями.
Надежность определяется как согласованность результатов измерения. Рассматриваются следующие формы надежности: ретестовая надежность и надежность внутренней согласованности. Рассматривается также угроза для валидности, возникающая при отсутствии надежности, – регрессия к среднему. Регрессия – это тенденция, проявляющаяся в изменении при повторном тестировании изначально крайних показателей в направлении среднего. Вероятность регрессии особенно велика в исследованиях с использованием экспериментального вмешательства и в определенного рода планах уравненных групп.
За разделом, посвященным тестам, следует рассмотрение другой важнейшей формы измерения – методов наблюдения. Анализируются три вопроса. Первый касается уровня специфичности, на котором оценивается поведение. При использовании микросистемы наблюдения учитываются мельчайшие детали поведения; макросистема наблюдения содержит более глобальные, интерпретационные категории. Выбор исследователем той или иной системы, находящейся на континууме от микро– к макромоделям, определяется целями исследования. Еще одной детер-минантой является осуществимость-определенная система наблюдения применима только при возможности обеспечения точности результатов наблюдения. Для выбора метода регистрации также имеют значение цели и осуществимость. Наиболее подробное описание поведения дает нарративная запись. К более узконаправленным методам наблюдения относят временные срезы и выборочный анализ поведенческих событий. В обоих случаях категории, по которым ведется оценка, определяются заранее, наблюдение происходит в рамках либо временных блоков (временные срезы), либо определенного вида поведения (выборка событий).
Последний из рассмотренных в этой главе вопросов касается проблем, которые могут возникнуть в обсервативном исследовании. Влияние наблюдателя – это особая форма реактивности; она связана с тем, что люди нередко изменяют свое поведение, если знают, что являются объектом наблюдения. Обсуждается ряд методов, направленных на снижение вероятности этого искажения. Еще один из возможных источников искажения – ожидания наблюдателя, который в некоторых случаях фиксирует то, что ожидает увидеть. Наиболее эффективный способ борьбы с этим искажением – минимизация ожиданий. Наконец, надежность наблюдателей определяется совпадением их мнения при категоризации определенного поведения. Надежность следует контролировать на протяжении всего исследования, с тем чтобы предотвратить феномен дрейфа наблюдателя. Кроме того, она должна быть проиллюстрирована данными, соответствующими анализируемым данным.