355 500 произведений, 25 200 авторов.

Электронная библиотека книг » Скотт Миллер » Психология развития: методы исследования » Текст книги (страница 18)
Психология развития: методы исследования
  • Текст добавлен: 8 октября 2016, 12:44

Текст книги "Психология развития: методы исследования"


Автор книги: Скотт Миллер


Жанр:

   

Психология


сообщить о нарушении

Текущая страница: 18 (всего у книги 48 страниц) [доступный отрывок для чтения: 18 страниц]

Резюме

Первый раздел этой главы посвящен условиям, в которых проводятся исследования в области психологии развития. Он построен на разграничении структурированных лабораторных условий и естественных полевых условий. Независимые переменные можно подвергать манипуляциям, а зависимые переменные – измерять в любых из этих условий, что дает четыре варианта плана исследования.

В исследованиях типа «лаборатория—лаборатория» максимальны и контроль Независимой переменной, и точность измерения зависимой переменной. Поэтому, как правило, такие исследования обладают высокой внутренней валидностью. Кроме того, некоторые проблемы психологии развития (например, многие вопросы перцептивного развития) можно изучать исключительно в контролируемых условиях лаборатории. С другой стороны, проводимые в лаборатории манипуляции и измерения зачастую резко отличаются от интересующих исследователя ситуаций, возникающих в реальной жизни; и эта искусственность ставит под угр°3У внешнюю валидность. Кроме того, в лабораторных исследованиях особенно высок риск реактивности и искажения ответов.

Полевые исследования имеют сильные и слабые стороны, абсолютно противоположные сильным и слабым сторонам лабораторного исследования. Большим преимуществом исследования типа «полевые условия – полевые условия» является то, что и независимая, и зависимая переменная находятся здесь в естественной среде. Поэтому снижается проблема искусственности, следствие которой – неудовлетворительная внешняя валидность. Главное ограничение данного подхода касается осуществимости – контроль независимой переменной и измерение зависимой переменной в естественных условиях осуществить сложнее, чем в лабораторных, а с некоторыми переменными такой контроль и такие измерения вообще невозможны.

Плюсы и минусы комбинированных планов («лаборатория – полевые условия» и «полевые условия – лаборатория») можно вывести из характерных особенностей классических лабораторных и полевых исследований. Кроме того, их преимущество заключается во временном и пространственном разделении независимой и зависимой переменных, что иногда повышает валидность.

За обзором исследовательских планов идет их анализ и оценка. Обсуждаются сложности в классификации исследовательских подходов, затем рассматриваются показатели частоты использования разных вариантов исследования по данным обзора журнальных статей. Этот обзор свидетельствует об обоснованности критики исследователей в области психологии развития за их ориентированность на работу преимущественно в лабораторных условиях. В данном разделе подчеркивается значение конвергентных операций – изучения определенной проблемы максимальным количеством способов с целью компенсирования неизбежных ограничений каждого из подходов достоинствами других подходов.

В среднем разделе главы рассматривается контекст исследования, но уже с несколько иных позиций. В своей теории экологических систем Бронфенбреннер выделяет четыре взаимосвязанных слоя средового контекста, в котором происходит развитие. Микросистема – слой, ближайший к ребенку; он состоит из социальных агентов (например, родителей, сверстников) и условий, непосредственно влияющих на развитие ребенка. Под термином меэосистема подразумеваются отношения между микросистемами, к примеру влияние родителей на школьные успехи ребенка. Термином экзосистема Бронфенбреннер обозначает социальные системы, которые могут воздействовать на ребенка только опосредованно, например, попечительские школьные советы, местные власти, предприятия, где работают родители. Наконец, макросистема – это культура или субкультура, в которой развивается ребенок.

Общим выводом из теории Бронфенбреннера является необходимость изучения средовых контекстов, выходящих за пределы микросистемы, на которой сосредотачивается большинство исследователей. Особый интерес представляет взаимодействие между двумя и более экологическими системами – например, зависимость эффектов родительского воспитания от типа культуры или субкультуры. Рассматриваются два примера исследований, в которых было продемонстрировано такое взаимодействие. Анализируются также результаты обзора журналов, свидетельствующие о том, что уровень микросистемы остается наиболее типичным объектом изучения в психологии развития.

Заключительный раздел этой главы посвящен целям исследования. Особое внимание уделяется прикладному исследованию, то есть исследованию, цель которого в предупреждении и коррекции нарушений в развитии, а также в оптимизации процесса развития. Рассматриваются две формы прикладного исследования. Цель оценки – выявление значимых, чаще всего негативных, характеристик некой популяции, входящей в группу риска. В качестве примера оценочной методики приводится Оценочная шкала поведения новорожденного (ОШПН). Одним из свидетельств валидности этой шкалы является возможность с ее помощью обнаружить эффекты факторов риска пренатального и натального периодов; еще одним свидетельством валидности является возможность спрогнозировать статус ребенка. Однако прогностические возможности этой методики далеки от идеальных – что в той или иной степени справедливо по отношению ко всем психологическим оценочным методикам.

Оценка нередко является этапом, предваряющим вторую форму прикладного исследования – вмешательство с целью коррекции или предупреждения нарушений. В качестве примера, иллюстрирующего особенности программ вмешательства, описаны программы тренировки памяти для пожилых людей. Одной из особенностей программ вмешательства является необходимость выявления потенциальных участников, задача, для решения которой важна точность оценочной методики. Оценка имеет значение и по окончании программы для определения ее эффективности. Актуальным вопросом является также проблема переноса приобретенных навыков на ситуации, выходящие за пределы контекста вмешательства, а также стойкость достигнутых изменений. Наконец, цель многих проектов вмешательства – разработка программ, которые могли бы получить широкое распространение; поэтому важно, чтобы исследовательские проекты были осуществимы и их основные элементы достаточно понятны.

Упражнения

Большинству из нас рассуждать о влиянии на развитие микросистемных факторов (родителей, друзей, учителей и т. д.) значительно легче, чем о влиянии контекстов другого уровня, которые рассматривал Бронфенбреннер в своей теории экологических систем. Задумайтесь о роли мезосистемы, экзосистемы и макросистемы в своем собственном развитии. Как эти контекстуальные факторы более высокого уровня повлияли на то, кем вы стали? Как иначе могло бы происходить ваше развитие, если бы иным оказался экологический контекст?

Проект Head Start работает в более чем 2000 центрах во всех 50 штатах. Посетите по крайней мере один или, если есть возможность, несколько центров Head Stan в своем районе. Попытайтесь посетить их несколько раз, чтобы застать разные занятия. Ознакомившись с тем, как работает Head Stan, подумайте, как можно оценивать эффективность таких программ. Какие оценочные методики, по вашему мнению, было бы необходимо использовать? Найдите книги по этой теме, на которые делались ссылки в этой главе, и сравните собственные идеи с тем, что действительно использовалось и используется в исследованиях, посвященных Head Start,.


Глава 7

Статистика

Все психологические исследования включают статистическую обработку данных. Нельзя стать исследователем в области психологии, не обладая знаниями основ статистического анализа. Кроме того, не имея элементарных представлений о том, что лежит в основе разных статистических показателей, невозможно понять и оценить исследования других людей.

Сказанное выше хорошо известно всем студентам, достаточно далеко продвинувшимся в изучении психологической науки. Все они также знают, что овладение статистикой – долгий процесс, который требует прослушивания нескольких курсов и прочтения нескольких увесистых учебников. Я не буду пытаться ужать содержание нескольких книг до одной главы. Моя задача намного скромнее: изложить в качестве дополнения к материалам о тестах некоторые основы и принципы, стоящие за статистическими процедурами. Эта глава может быть введением или дополнением к курсу статистики, а также может служить материалом, помогающим освежить уже имеющиеся знания.

Изложение в этой главе идет в направлении от сравнительно простого к более сложному. Начнем с того, что вспомним цели использования статистических показателей, затем, в качестве примера статистического объяснения, приведем уже знакомый вам t-критерий. Остальная часть главы в значительной мере будет посвящена усложненным вариантам простого анализа с использованием t-крите-рия – разнообразным ситуациям, когда нужны другие статистические показатели, их типам, а также основаниям для выбора между этими показателями. Поскольку каждый случай рассматривается кратко и в общих чертах, для каждой из затронутых тем предлагается список литературы.

Использование статистических показателей

Используя статистические показатели, психологи преследуют две цели: описать данные и прийти к логическому заключению об их значении. Первая из этих целей проста и понятна, достижение второй цели связано с определенными трудностями.

Таблица 7.1 Количество агрессивных действий в выборке детей дошкольного возраста (гипотетические данные)


Трехлетние мальчикиТрехлетние девочкиЧетырехлетние мальчикиЧетырехлетние девочки
523
4273
*0103
1433410
531
1518384'
23
24
95194
515353
35
26211
13
1610181
36103


Дескриптивные статистические показатели

Вернемся к одному из предыдущих примеров: исследованию агрессии методом наблюдения в условиях детского сада. Допустим, исследователь собрал данные, представленные в табл. 7.1. Как можно заметить, имеют место значительные индивидуальные различия в частоте агрессивных действий; вполне вероятно, что есть также различия между полами и возрастными группами. Но как разобраться в этом хаосе цифр и определить истинное положение вещей?

Первый шаг – охарактеризовать данные при помощи ряда дескриптивных статистических показателей. Большинство дескриптивных статистических показателей используется для выявления центральной тенденции, или преобладающей формы ответов в выборке. Чаще всего в качестве меры центральной тенденции выступает среднее арифметическое, или просто среднее. Из табл. 7.2 явствует, что группы испытуемых из нашего гипотетического исследования действительно имеют разный средний уровень агрессии.

Чаще всего среднее – наиболее информативный дескриптивный статистический показатель. Однако он не единственный, в ряде случаев знание лишь среднего не дает полного представления о полученных результатах. Сравним группы 3– и 4-летних мальчиков. Как явствует из табл. 7.2, средний уровень агрессии у старших мальчиков выше. Однако сырые данные из табл. 7.1 свидетельствуют о том, что фактически большинство показателей агрессии обеих групп достаточно близки. Более высокое среднее у старших детей явилось следствием наличия нескольких очень высоких показателей. Или же сравним группы 3-летних мальчиков и девочек. Полагаясь на средние значения из табл. 7.2, мы могли бы заключить, что эти группы имеют одинако-

вый уровень агрессии. Однако сырые данные из табл. 7.1 свидетельствуют о том, что эти средние значения имеют разные основания.

Приведенные выше примеры демонстрируют необходимость иных дескриптивных статистических показателей помимо среднего арифметического. Есть еще две меры центральной тенденции. Одна из них – медиана. Медиана – это центр распределения, выше которого находится одна половина показателей, а ниже – другая. Сравним вновь результаты 3– и 4-летних детей. Из табл. 7.2 явствует, что данные результаты имеют общую медиану – 4. Это свидетельствует о фундаментальном сходстве двух распределений, сходстве, которое мешает заметить разница средних. В целом, медиана приобретает особце значение тогда, когда распределение асимметрично, то есть включает несколько необычно высоких или низких показателей. В таких случаях среднее может дать искаженную картину типичных ответов.

Таблица 7.2 Дескриптивные статистические показатели для данных из таблицы 7.1


СреднееМедианаМодаСтандартное отклонение
3-летние5,6455,38
мальчики
3-летние девочки5,035,88
4-летние13,44313,90
мальчики
4-летние девочки3,4333,29
Мальчики в9,54311,09
целом
Деоочки в4,23. 04,75
целом
3-летние в5,33,55,55
целом
4-летние в целом8,43311,15

Третья мера центральной тенденции – мода. Мода – показатель, наиболее часто встречающийся в определенной группе. Эта мера используется редко, однако в некоторых обстоятельствах ее значение довольно информативно. Рассмотрим, к примеру, данные 3-летних девочек из табл. 7.1. Ранее мы отметили, что средний уровень агрессивных действий в этой группе – 5,0 – практически такой же, как и у мальчиков. Однако, в отличие от мальчиков, для 3-летних девочек модальным было нулевое значение. Этот факт вполне заслуживает того, чтобы упомянуть о нем в отчете.

Наряду с центральной тенденцией, дескриптивные статистические показатели характеризуют изменчивость распределения. Нам необходимо знать не только, какова центральная тенденция, но и то, насколько приближаются показатели к центральному значению или отклоняются от него. Чаще всего мерой изменчивости служит дисперсия. При ее расчете сначала находят среднее для выборки. Затем определяется разница между этим средним арифметическим и показателем каждого из испытуемых. Эти значения разности, или «отклонения», возводятся в квадрат, суммируются, а полученная сумма делится на N – 1, результатом чего и является показатель дисперсии. Таким образом, дисперсия – это приблизительно среднее квадратичных отклонений; «приблизительно», поскольку делитель равен N – 1, а не N. Чем больше разница между индивидуальными показателями, тем больше дисперсия.

В научных статьях в качестве меры изменчивости обычно указывается не дисперсия, а стандартное отклонение. Стандартное отклонение – это просто квадратный корень из показателя дисперсии. В табл. 7.2 он подсчитан для каждой из групп нашего гипотетического исследования. Полученныезначеиия стандартного отклонения подтверждают наши интуитивные предположения о степени разброса индивидуальных показателей в группах. Обратите особое внимание на весьма значительное стандартное отклонение у 4-летних мальчиков, в группе, где было отмечено несколько крайне высоких показателей.

Статистические показатели, выводимые логическим путем

Предположим, мы получили значения среднего арифметического, представленные в табл. 7.2. Оказывается, что уровень агрессии изменяется как функция от возраста и пола. Но как выяснить наверняка, является ли обнаруженное различие истинным или это просто случайные колебания? На этот вопрос призваны ответить статистические показатели, выводимые логическим путем.

Для объяснения смысла статистических показателей, выводимых логическим путем, нужно вспомнить некоторые разграничения (имеющие частичное совпадение), введенные в предыдущих главах. Одно из них – разграничение между истинными показателями и погрешностями измерения. Любой показатель состоит из двух компонентов; действительного результата испытуемого, полученного при измерении, и любого рода погрешности измерения, возникающей при попытке выявить этот истинный показатель. Второе разграничение – между первичной дисперсией и вторичной дисперсией, или дисперсией ошибки. Первичная дисперсия связана с изучаемыми независимыми переменными; вторичная дисперсия, или дисперсия ошибки, обусловлена действием всех других факторов, то есть может иметь какой угодно источник, за исключением независимых переменных. Последнее разграничение – между популяцией и выборкой. Популяция – это весь тот контингент людей, который интересует исследователя; а выборка – это группа людей, фактически включенных в исследование.

При сравнении двух выборок (двух возрастов, двух полов, экспериментальных условий и т. д.) нас интересует вопрос, есть ли истинное различие между популяциями, из которых отобраны эти группы. Если бы нам удалось собрать данные по всей популяции, а не только по выборке, и исключить возможность погрешности измерения, у нас был бы ответ: полученные результаты и были бы результатами интересующей нас популяции. Однако, разумеется, сделать этого мы не можем; выборки – это всегда лишь часть популяции, измерение всегда неточно, и всегда существуют посторонние источники дисперсии. Именно поэтому нам необходимы методы оценки, или определения на основе логических заключений вероятности того, что выявленные различия между выборками отражают истинные различия между популяциями.

Поясним сказанное выше на примере гипотетического исследования агрессии и вопроса различий между полами в уровне агрессии. Мы уже знаем, что различия между полами действительно есть, в том смысле, что показатели мальчиков и девочек неодинаковы. Однако мы знаем и то, что это различие может объясняться погрешностями измерения и побочными источниками дисперсии. Кроме того, мы наблюдали лишь небольшую выборку из популяции, которая нас интересует – только 60 детей из миллионов 3– и 4-леток, посещающих детские сады США, и только несколько часов из жизни этих детей. Возможно, понаблюдав за теми же детьми вновь, мы получили бы несколько отличные результаты. Возможно, что, понаблюдав вторую выборку из 60 детей, мы опять-таки получили бы иные результаты. И возможно, что если бы нам удалось понаблюдать всю интересующую нас популяцию, мы получили бы еще какую-то совокупность данных. Именно для определения вероятности всех этих «возможно» необходимы статистические показатели, выводимые логическим путем.

В предыдущем абзаце цели использования статистических показателей, выводимых логическим путем, рассматриваются с двух позиций. Во-первых, с точки зрения воспроизводимости результатов или надежности. Получим ли мы одинаковые результаты, вновь и вновь производя один и тот же эксперимент? Во-вторых (что в действительности то же самое), с точки зрения перехода от выборки к популяции. Достаточно ли велико отличие, обнаруженное в выборке, чтобы доказать существование отличия в популяции? Как бы мы ни формулировали вопрос, нужно выбрать одно из двух: либо наши результаты действительно отражают положение вещей в популяции, либо они обусловлены действием случайных факторов, действующих в нашем конкретном исследовании. И как бы мы ни формулировали вопрос, использование статистических показателей, выводимых логическим путем, не дает однозначного ответа о том, что из сказанного верно; все, о чем мы можем судить по этим статистическим показателям – это о вероятности каждой из альтернатив. Это, фактически, главное, что нужно осознать в отношении статистических выводов: они вероятностны, а не абсолютны.

Теперь обратимся к конкретному примеру статистического анализа. Рассмотрим вновь различия между полами в уровне агрессии. Нам нужно определить, отражает ли обнаруженное в исследовании различие истинное различие в популяции или же оно – результат случайности. Как уже отмечалось, в качестве примера, за основу мы возьмем логику статистического анализа при использовании f-критерия.

Формула расчета f-критерия представлена ниже. Логика, положенная в основу этой аналитической проверки, довольно проста. Величина f-критерия, а следовательно, и вероятность того, что результаты неслучайны, зависит от трех факторов. Первый – разница между значениями средних. Чем больше различие, тем больше t. Второй – изменчивость внутри сравниваемых групп. Именно изменчивость представлена в довольно громоздком делителе. Чем она меньше, тем больше С. Наконец, третий фактор – объем выборки. Объем выборки влияет на конечный результат по двум направлениям. Во-первых, как можно заметить, проанализировав формулу, объем выборки влияет на изменчивость: чем больше п, тем меньше делитель. Во-вторых, даже подсчитав С, мы все еще должны определить,

какова вероятность того, что это значение t – результат случайности. Эта вероятность зависит как от величины С, так и от объема выборки. Чем больше п, тем ниже вероятность того, что полученное значение t – всего лишь результат случайных колебаний.

Применим теперь формулу t для оценки различий между мальчиками и девочками в нашем гипотетическом исследовании. Получаем t, равное 2,41. Обратившись теперь к таблице показателей Г-критерия (которая есть в любом учебнике по статистике), мы устанавливаем, что такое или большее значение С могло быть результатом случайности менее чем в 5 случаях из 100. Этот расчет вероятности случайности основан на том, что называется нуль-гипотезой – то есть предположении, что между группами в действительности нет различий. Результаты, вероятность случайного появления которых составляет менее 5 %, условно считаются статистически значимыми. Поэтому мы можем отвергнуть нуль-гипотезу об отсутствии различий между полами и заключить, что мальчики действительно агрессивнее девочек.

Мы еще вернемся к понятию статистической значимости. Однако сначала стоит повторить логику анализа с использованием t-критерия, поскольку она применима в отношении ряда других статистических критериев. Как отмечалось, эта логика действительно довольно очевидна и сводится к трем правилам, основанным на простом здравом смысле:

1. Случайность больших различий между группами менее вероятна, чем случайность небольших различий. Поэтому разница между большинством других значений среднего арифметического из табл. 7.2 (например, между 3-летними девочками и 3-летними мальчиками) слишком мала, чтобы дать существенный t-показатель, и поэтому, скорее всего, объясняется случайностью.

2. Чем меньше внутригрупповая изменчивость, тем меньше вероятность того, что различия являются результатом случайности. Небольшое число существенных отклонений от группового среднего в ту или иную сторону практически не отражается на значении среднего арифметического. Этот фактор играет роль при сравнении результатов 3– и 4-летних мальчиков. Несмотря на существенную разницу между средними показателями, сравнение с использование f-критерия

говорит об отсутствии значимых различий, в немалой степени из-за высокой изменчивости в группе 4-летних мальчиков.

3. Наконец, вероятность случайности различий, обнаруженных в больших выборках, меньше, чем вероятность случайности таких же различий в небольших выборках. Если количество испытуемых невелико, один или два крайне высоких или крайне низких показателя могут исказить среднее арифметическое; в больших выборках такие случайные колебания компенсируются. Этот фактор играет роль при сравнении результатов 3-летних и 4-летних мальчиков. Если бы объем выборки составлял 30, а не 15 человек на группу, то полученный показатель t был бы значим.

Из сказанного выше следует, что цель использования статистических процедур, основанных на логических построениях, – установление статистической значимости. Важно ясно представлять, что подразумевается, а также, что не подразумевается под выражением «статистическая значимость».

Вспомним для начала, что выводы, основанные на логических статистических показателях, носят вероятностный характер. Утверждение, что определенное различие средних статистически значимо, означает, что такое различие вероятнее всего не случайно, если исходить из нуль-гипотезы об отсутствии различий в популяции. Однако всегда есть вероятность ошибки. Первая состоит в ошибочном отвержении нуль-гипотезы, то есть в выводе о наличии некоего эффекта при его реальном отсутствии. Этот тип ошибки называют ошибкой первого рода. В нашем исследовании агрессии мы допустили бы ошибку первого рода, заключив, что мальчики и девочки различаются по уровню агрессии, в то время как в действительности на уровне популяции в целом такое различие отсутствует. Вероятность ошибки первого рода определяется уровнем вероятности, на котором мы отвергаем нуль-гипотезу. Если уровень вероятности 0,05, риск допустить ошибку первого рода составляет 5 из 100. Если уровень вероятпости ниже, скажем, 0,01 или 0,001, тогда, естественно, у нас гораздо меньше шансов ошибиться. -

Второй тип ошибки состоит в принятии нуль-гипотезы тогда, когда в действительности имеется истинный эффект. Этот тип ошибки называется ошибкой второго рода. В исследовании агрессии мы допустили бы ошибку второго рода, если бы группы 3-летних и 4-летних детей различались, но мы заключили бы, что между ними нет различий. Вероятность ошибки второго рода рассчитать труднее, чем вероятность ошибки первого рода, и здесь мы даже не будем пытаться объяснить этот расчет. Однако замечу, что вероятность одной ошибки находится в обратной зависимости от вероятности второй ошибки, то есть чем выше вероятность одной, тем ниже вероятность другой. Исследователь, к примеру, может снизить риск ошибки первого рода, установив уровень вероятности 0,01, однако в то же время он существенно повышает риск ошибки второго рода. Отметим также, что психологи предпочитают минимизировать вероятность ошибки первого рода. Эта осторожность в позитивных выводах отражена в общепринятой норме: «значимыми» признаются только результаты, вероятность случайности которых составляет менее 5 %'.

Розноу и Розенталь (Rosnow & Roscntal, 1989) критикуют позицию исследователей, целиком полагающихся на уровень вероятности 0,05: «Несомненно, Господь любит 0,06 ничуть не меньше, чем 0,05» (р. 1277).

Рассмотрение ошибок первого и второго рода возвращает нас к понятию валидности. В главе 2 рассказывалось о трех из четырех основных форм валидности. Четвертая форма – валидность статистического вывода: точность статистического вывода, сделанного при анализе данных. Верны ли наши заключения о наличии или отсутствии связи между переменными? Избежав ошибочного вывода о существовании связи при ее отсутствии (ошибка первого рода) и об отсутствии связи при ее наличии (ошибка второго рода), мы достигаем валидности статистического

вывода.

Установив статистическую значимость, мы можем сказать, что наши результаты, вероятнее всего, не случайны. Важно отдавать себе отчет, что критерий значимости имеет отношение только к возможности случайных результатов. Значимость не исключает возможности искажения валидности. По этому критерию можно судить о наличии различий между двумя группами, но не о причинах различий.

Рассмотрим различие между полами в нашем исследовании агрессии. Нас интересует вероятность того, чТо это различие в поведении истинно (однако, разумеется,, причин?.! его еще предстоит выявить). Но значимое различие вполне могло появиться и по другим причинам. Возможно, наши наблюдатели ожидали от мальчиков или от девочек большей агрессивности и поэтому в соответствующем направлении искажали результаты – отсюда различие, обусловленное необъективностью наблюдателей. Возможно, на девочках сильнее отражается присутствие наблюдателя, и поэтому они более склонны подавлять агрессию, когда за ними наблюдают, – отсюда различие, обусловленное дифференцированной реактивностью. Возможно, мы наблюдали девочек в начале года, а мальчиков позже, когда агрессия становится обычным явлением, – отсюда различие, обусловленное одновременным влиянием фактора принадлежности к определенной группе и фактора

времени измерения.

Суть в том, что любые из описанных в этой книге факторов, ставящих под сомнение валидность, могут все еще действовать, искажая наши результаты. Статистическая значимость не гарантирует общей валидности. Это лишь отправная точка, необходимое, но не достаточное условие для вывода о том, что мы обнаружили что-то существенное.

И последнее замечание – статистическая значимость не гарантирует того, что результаты имеют некоторую научную ценность. «Значимость» в том смысле, в котором этот термин употребляется здесь, имеет отношение только к статистической вероятности, а не к теоретической или практической важности. Различие между полами в уровне агрессии может быть истинным, в том смысле, что оно не случайно и не обусловлено неудовлетворительной валидностью. Достаточно ли велико это различие, чтобы что-то значить – в отношении, например, того, как воспитатели должны вести себя с мальчиками и девочками, – отдельный вопрос. Важно помнить, что статистическая значимость различия зависит не только от величины разницы, но и от объема выборки. В достаточно большой выборке даже незначительное различие достигает уровня значимости. Мы еще вернемся к этому вопросу, когда будем рассматривать величину эффекта.


    Ваша оценка произведения:

Популярные книги за неделю