Текст книги "Психология оценки и принятия решений"
Автор книги: Скотт Плаус
Жанр:
Психология
сообщить о нарушении
Текущая страница: 12 (всего у книги 19 страниц)
Другой тип групповой поляризации исследуется с использованием парадигмы, в которой сама проблема порождает поляризующиеся уклоны. Давид Майерз и Мартин Каплан в 1976 году обнаружили, например, что когда группе предлагается для обсуждения достаточно мягкий приговор, вынесенный судом, то после окончания дискуссии ее участники склонны его еще более смягчить. Если же предложенный для обсуждения приговор суров, то субъекты приходят к выводу, что неплохо бы сделать его еще более суровым. Итак, начальные знания, основанные на данных сведениях, поляризуются в ходе групповой
259
дискуссии (обзор групповой поляризации можно найти: Майерз, 1982; Майерз и Ламм, 1976).
О ЛОШАДЯХ
«Человек купил лошадь за 60 долл. и продал за 70 долл. Потом выкупил ее за 80 долл. и снова продал за 90 долл. Сколько он заработал?»
Эта проблема, приведенная в п. 20 Анкеты, послужила основой одного из исследований в классической работе Нормана Мэра и Аллена Соулема (1952). Мэр и Соулем обнаружили, что только 45% опрошенных студентов могли решить эту проблему в одиночку. Когда же они обсуждали ее впятером или вшестером, они прекрасно справлялись с решением. Студенты, работавшие в группах с «инертным» лидером (просто наблюдавшим за обсуждением), отвечали верно в 72% случаев, а те, кто работал с «активным» лидером (побуждавшим всех членов группы высказывать свое мнение), отвечали верно в 84% случаев.
Чтобы увидеть, насколько эффективно группа справляется с заданием, перенесемся назад во времени и посмотрим на воображаемую группу, занятую дискуссией в лаборатории Мэра и Соулема:
ВЕНДИ (лидер группы): Эта проблема вызывает у меня подозрения: она кажется слишком простой, и я не доверяю психологам. Пусть каждый поделится своими мыслями об ответе и скажет, почему это решение кажется ему верным.
БЕННЕТ: Я совершенно уверен, что ответ 10 долл. Я рассуждал так: купив лошадь за 60 долл. и продав за 70 долл. мы выигрываем 10 долл. Затем, если купить ее за 80 долл., то можно потерять 10 долл., потому что 80 долл. больше 70 долл. и мы переплачиваем. Продав лошадь за 90 долл. мы снова выигрываем те же 10 долл. Вот так.
ДЖИЛЛ: Я думаю, 20 долл., потому что человек выиграл 10 долл. в первый раз, продав лошадь, и 10 долл. – продав ее во второй раз. Но после рассуждений Бена я уже не так уверена.
ВЕНДИ: Не думай о том, права ты или нет, мы просто пытаемся проиграть все возможные варианты. Как ты думаешь, Стив?
СТИВ: Я думаю, правильный ответ – 30 долл.: человек начал с 60 долл. и получил 90 долл. Что же он мог получить, как не 30 долл.?
260
ЭМИ: Он бы получил 30 долл., если бы больше не тратил денег. Но продав лошадь за 70 долл. он выкупил ее за 80 долл. и вложил в нее еще 10 долл. Так что получается 20 долл. (30 долл. минус 10 долл.).
ВЕНДИ: Все согласны с Джилл?
ЭМИ: Да. По правде говоря, мне кажется, что единственная причина, по которой эта проблема вызывает смущение, состоит в том, что покупается и продается одна и та же лошадь. Если бы в условии речь шла о двух разных лошадях, ответ был бы очевиден.
БЕННЕТ: Что ТЫ Имеешь В ВИДУ?
ЭМИ: Ну, представь, что человек купил лошадь за 60 долл. и продал за 70 долл. Сколько он выручил?
БЕННЕТ: 10 долларов.
ЭМИ: Теперь представь, что человек купил вторую лошадь за 80 долл. и продал за 90 долл. Сколько он получил прибыли?
БЕННЕТ: Еще 10 долларов.
ЭМИ: Итак, всего 20 долларов. Его доходы не определяются тем, одну или разных лошадей он торгует – и так, и так он получит 20 долл. Ошибка думать, что, покупая лошадь за 80 долл., человек теряет 10 долл. Для того чтобы потерять деньги, он должен продать ее дешевле, чем купил.
А теперь остановите действие и представьте, что вы – член этой группы. Эми закончила свое объяснение, и теперь вы рассказываете, как и почему вы ответили на вопрос. После того как и вы закончили свою речь, группа еще несколько минут обсуждает проблему. Экспериментатор просит каждого написать ответ.
У вас есть выбор: написать тот ответ, который вы дали в п. 20 Анкеты, или изменить его.
Большинство людей в такой ситуации дают правильный ответ – 20 долл. Члены группы, давшие с самого начала правильный ответ, редко меняют его в ходе дискуссии, а остальные обычно исправляют ответ после обсуждения.
Тем не менее Мэр и Соулем обнаружили: независимо от того, был лидер «активен» или «инертен», все члены группы высказывали свои мнения, но точность ответов была выше, если лидер был активен и побуждал всех членов группы высказывать свое мнение.
261
Результаты активного, терпеливого руководства явно проявляются в группах, где сначала только один человек дал правильный ответ. В таких случаях в группах у активных лидеров 76% студентов отвечают верно, тогда как у инертных – лишь 36%. Это открытие соответствует двум пунктам из предыдущей главы: (1) лучший способ избежать группового мышления – выслушать все точки зрения (Джаниз, 1982); (2) в определенных условиях меньшинство может сильно влиять на точность оценки всей группы (Немет, 1986).
Мэр и Соулем в 1952 году показали, что открытая дискуссия может привести к заметному росту точности. Но, несмотря на советы, высказанные во время обсуждения, не все члены группы в эксперименте Мэра и Соулема правильно решили задачу. Несмотря на то что 63 из 67 групп имели по крайней мере одного человека, правильно ответившего на вопрос, примерно пятая часть субъектов дала неверный ответ даже после обсуждения. Эдуин Томас и Клинтон Финк в 1961 году обнаружили близкие результаты, используя ту же задачку о продаже лошади. В их эксперименте 29 из 44 групп включали в себя, по крайней мере, одного человека, знающего правильный ответ, но только у 15 групп была тенденция давать правильные ответы после обсуждения. Итак, групповые дискуссии приводят к заметному повышению точности, но не дают гарантии того, что всечлены группы ответят верно.
ОДНА ГОЛОВА ХОРОШО, А ДВЕ ЛУЧШЕ?
Групповые оценки в основном точнее индивидуальных, но это не всегда так. Групповая точность зависит от нескольких факторов, в том числе от природы и сложности задачи, от компетентности членов группы, способа общения и т.п. Рейд Хейсти в 1986 году опубликовал обзор, в котором рассматривались многие факторы, влияющие на групповую оценку, и сравнивались группы и индивидуумы по трем различным типам: (1) оценке количества и величины, например, количества бобов в стакане;
(2) оценке в ответе на головоломки, вроде задачки о лошади;
(3) оценке в ответах на вопросы из области общего знания, например, абсент – это ликер или минерал?
В отношении количественных суждений Хейсти заключил, что группы обычно несколько более точны, чем индивидуумы
262
(для читателей, знакомых со статистикой, Хейсти сообщает, что разница равнялась одной восьмой единицы стандартного отклонения). Более современные исследования Джанет Снайзек и Бекки Хенри (1989, 1990) показали, что в некоторых случаях эта разница может быть больше, чем оценивал ее Хейсти. Используя меру, известную как «стандартизированное отклонение», Снайзек и Хенри обнаружили, что группы из трех человек были на 23—32% точнее, чем индивидуумы, т.е. в 2—3 раза больше, чем установил Хейсти.
В том, что касалось головоломок и других вопросов, связанных с логикой, Хейсти обнаружил, что группы обычно превосходили индивидуумов общим развитием, но что самый умный представитель группы в одиночку работал лучше, чем вся группа в целом. Точно так же Хейсти обнаружил, что группы обычно превосходят среднего индивидуума в ответах на вопросы, связанные с общим знанием, но что лучший член группы не уступал или превосходил группу в целом.
Подобные результаты рассмотрела Гейл Хилл в 1982 году в своей статье «Group versus Individual Performance: Are N +1 Heads Better Than One?», представляющей собой обзор исследований индивидуальных и групповых показателей за 50 лет. Несмотря на то что она уделяла больше внимания поведению, а не оценке и принятию решений, одна из частей ее работы посвящена творчеству и решению проблем. Хилл обнаружила, что группы зачастую превосходили средних индивидуумов, но группы нередко уступали наилучшему индивидууму, находящемуся в статистическом коллективе (невзаимодействующей группе того же размера). В отношении простых вопросов увеличение группы означало всего лишь, что она вероятнее будет включать в себя хотя бы одного человека, способного решить задачу. Для решения сложных вопросов командная работа имеет неоспоримое преимущество: члены группы могут поделиться мнением и исправить ошибки друг друга.
Хилл также обратила внимание и на брэйнсторминг (мозговой штурм). В частности, она сравнивала количество идей, выработанных группой, с количеством идей, предложенных той же численностью людей, которые сначала «штурмовали» по– отдельности и позднее сложили свои идеи вместе. Хилл обнаружила, что брэйнсторминг был более успешным, когда идеи вырабатывались независимо, а потом комбинировались, нежели
263
когда они выдвигались при групповом обсуждении. Она сделала вывод, что превосходство группы проявляется из– за того, что больше людей занято решением проблемы, а не из– за самого взаимодействия. В практическом смысле это означает, что лучший способ выработать решение трудной проблемы состоит в следующем: несколько людей независимо работают над этим, а затем делятся своими идеями.
ДОСТОИНСТВА ДИКТАТУРЫ
Несмотря на то что группа выносит более верные оценки, чем индивидуум, точность зависит и от того, каким образом члены группы комбинируют свои ответы (Дейвис, 1973). Исследование, иллюстрирующее это замечание, было опубликовано Джанет Снайзек в 1989 году. Снайзек сопоставила пять типов методик принятия решений, применяемых группами: (1) «консенсус», когда в лобовом, открытом обсуждении выбирается оценка, принимаемая всеми членами группы; (2) «диалектическая» методика, в которой члены группы обсуждают факторы, которые могут повлиять на их оценку; (3) «диктатура», когда обсуждение заканчивается выбором субъекта, чья оценка и станет оценкой группы; (4) метод Дельфи, когда члены группы не встречаются лицом к лицу, а вместо этого представляют ответы анонимно в серии «раундов», пока не будет достигнут консенсус или принято среднее решение (приятное качество этой методики состоит в том, что члены группы застрахованы от того, что кто– то один может монополизировать дискуссию и незаметно влиять на остальных); (5) «коллективная» методика, предотвращающая все интриги среди членов группы, поскольку просто усредняет индивидуальные оценки для получения оценки коллективной (в исследовании Снайзек коллективная методика устанавливала базовую линию точности, поскольку не зависела от социальных факторов).
Каждая группа состояла из пяти студентов, и каждая использовала все пять методик. Группы начинали с использования коллективной методики, после чего использовали прочие в переменном порядке. Задачей студентов было оценить, насколько большую выручку получит принадлежащий колледжу магазин в следующем месяце за одежду, журналы, открытки, сувениры, косметику и лекарства. Снайзек определяла точность оценок
264
относительно реальной выручки в «абсолютном проценте отклонения».
Она обнаружила, что каждая из четырех первых методик (консенсус, диалектика, диктатура и дельфийская) достигала более точных результатов, чем простое усреднение (коллективная методика), но наибольшие успехи принесла диктатура, при которой процент ошибки был в среднем в три раза меньше. Интересно, однако, что в каждом случае применения «диктатуры» диктатор группы изменял свое конечное мнение в направлении коллективного среднего, тем самым увеличивая величину ошибки. Другими словами, группы были способны выбирать диктаторов, дававших точные ответы, но диктатор тут же становился демократом и, таким образом, снижал общую точность ответов.
Конечно, открытия, сделанные Снайзек, специфичны, относятся только к группам определенного размера (пять человек), определенной категории (студенты) и к определенной задаче (определение доходов магазина). Было бы глупо считать, что метод диктатуры работает лучше во всех ситуациях. Тем не менее эксперимент Снайзек показал, что точность решения, принятого группой, зависит и от того, каким образом оно выработано. Ее результаты продемонстрировали, что в некоторых случаях экспертное решение, принятое группой, оказывается лучше, чем статистическое усреднение оценок, предложенных не совещавшимися людьми. Итак, по крайней мере, в конкретной ситуации результат зависит не только от того, лучше ли две головы, чем одна, но и от того, как эти головы соединены.
Заключение
Поскольку результаты, продемонстрированные группами, определяются столькими факторами, трудно делать какие– то обобщения (Тиндейл, 1989). По этой же причине трудно объединить отдельные результаты исследований групп. Кроется ли расхождение в разнице тем? В размерах группы? В правилах принятия решений? В самой интерпретации результатов?
Это опять– таки результат того, что групповой оценке и решениям не уделялось столько внимания, сколько индивидуальным, несмотря на наличие комитетов, комиссий, судов, штабов и других групп, предназначенных для выработки решений. Более того, граница между исследованиями групп и
265
индивидуумов не проводилась, поскольку группы, видите ли, тоже состоят из индивидуумов. Например, исследование групповой ошибки атрибуции – это, фактически, исследование того, как индивидуумыоценивают группы. Точно так же сдвиги к выбору могут изучаться и путем сравнения групповых решений с индивидуальными, и как сравнение индивидуальных решений до и после групповой дискуссии. Только в первом случае это действительно групповоерешение.
Однако исследования групповой оценки и принятия решений позволяют сделать следующие заключения:
Многие личностные виды эвристики и смещений проявляются и в групповой оценке.
Групповая дискуссия часто усиливает первоначальные склонности (тенденции).
Группы обычно добиваются лучших результатов, чем индивидуумы, особенно если лидер добивается, чтобы своемнение высказали всечлены группы.
Лучший член группы в одиночку может добиться большего (что может иногда сыграть на пользу «диктатуры»).
Мозговой штурм эффективнее, если члены группы генерируют идеи независимо.
Каждое из этих заключений обосновано достаточным числом экспериментов, но поскольку на группы влияет слишком много факторов, их можно воспринимать как общие советы. Несмотря на то что люди часто объединяются для принятия решений, сотрудничество – не всегда гарантия успеха.
Раздел VI. Типичные ловушки
Этот раздел посвящен трем распространенным проблемам, окружающим принимающего решения человека. Глава 19 посвящена излишней самонадеянности, глава 20 – обсуждению предсказаний, которые сбываются сами собой, а глава 21 рассказывает о специфических затруднениях, известных как «поведенческие ловушки». Каждая глава содержит практические советы и подсказки, как избежать этих проблем.
Глава 19. Самоуверенность
Авария случается раз в 10 000 лет
Виталий Скиларов, министр энергетики Украины, за два месяца до Чернобыльской трагедии
Ни одна из проблем оценки и принятия решений не таит в себе такой угрозы, как излишняя самоуверенность. Как отмечал Ирвинг Джанис в 1982 году в работе, посвященной групповому мышлению, американская самоуверенность позволила японцам уничтожить Pearl Harbor во время второй мировой войны. Самоуверенность сыграла также роль в гибельном решении о запуске космического корабля Челленджер.До того как челнок выполнил свою двадцать пятую миссию, НАСА официально оценило риск как одна катастрофа на 100 000 запусков (Фейнман, 1988, февраль), что означало, что если запускать корабль каждый день в течение 300 лет, то взорвется он всего один раз.
Случай Джозефа Кидда
Действительно ли НАСА было слишком уверено в успехе или ему просто было необходимо продемонстрировать уверенность? Поскольку реальную уверенность в такой ситуации измерить трудно, наиболее точную оценку должен дать тщательно контролируемый эксперимент.
Одним из первых и наиболее известных исследований такого рода стал опыт, результаты которого были опубликованы Стюартом Оскампом в 1965 году. Оскамп попросил 8 клинических психологов, 18 аспирантов– психологов и 6 студентов последних курсов психологических факультетов прочитать исследование случая «Джозефа Кидда», 29– летнего человека, у которого были проблемы (комплексы неполноценности) в подростковом возрасте. Эксперимент был разбит на четыре стадии. Часть 1 представляла Кидда как прошедшего воинскую службу и работающего бизнес– ассистентом в студии садово– паркового дизайна. (270:)
Часть 2 была посвящена детству Кидда (до 12 лет). Часть 3 отражала его школьные и студенческие годы. Часть 4 – армейскую службу и последующую жизнь.
Респонденты четыре раза отвечали после прочтения каждой части на один и тот же набор вопросов. Эти вопросы были построены на основе фактического материала исследования, но требовали от респондентов формирования клинической оценки, основанной на общем впечатлении о личности Кидда. В вопросах всегда предлагалось выбрать одну из пяти альтернатив ответа, и после каждого ответа респонденты оценивали свою уверенность в его правильности в границах от 20% (нет особой уверенности) до 100% (абсолютная уверенность).
Несколько удивительно, что особой разницы в ответах профессиональных психологов, аспирантов и студентов не было, так что Оскамп подводил итоги по всем трем группам респондентов вместе. Он обнаружил, что уверенность росла вместе с количеством информации, полученной респондентами, но точность – нет.
Прочитав первую часть, респонденты ответили верно на 26% вопросов (несколько выше уровня случайного угадывания), а их уверенность составляла 33%. Эти результаты довольно близки. Когда же респонденты получили больше информации, разрыв между точностью и уверенностью вырос (см. рис. 19.1). Несмотря на то что с получением дополнительной информации точность ответов не увеличилась, чем больше респонденты читали, тем увереннее они становились. К тому времени, когда они заканчивали читать четвертую часть, более 90% субъектов Оскампа были более уверены в своих ответах.
За годы, прошедшие со времени описания этого эксперимента, в ряде опытов было обнаружено, что люди имеют тенденцию быть слишком уверенными в своих оценках, особенно когда точное решение принять трудно. Например, Сара Лихтенштейн и Барух Фишхофф в 1977 году провели серию экспериментов, в которых наблюдали, что люди были уверены в своей правоте на 65—70%, хотя на самом деле были правы примерно наполовину.
В первом опыте Лихтенштейн и Фишхофф просили людей оценить, какие из 12 детских рисунков присланы из Европы, а какие – из Азии, а также оценить вероятность того, что тот или иной ответ верен. Несмотря на то что только 53% ответов были верными (почти случайная вероятность: угадал—не угадал), средняя уверенность достигала 68%. (271:)
Предполагаемая точность
Рисунок 19.1
Стюарт Оскамп (1965) обнаружил, что когда испытуемые получают больше информации, разрыв между предполагаемой точностью их ответов (уверенностью в своей правоте) и реальной точностью растет.
В другом эксперименте Лихтенштейн и Фишхофф давали людям отчеты о продажах из 12 магазинов и просили оценить, доходы каких магазинов за определенный период вырастут, каких – упадут. И опять, несмотря на то что точность ответов была только 47% (даже меньше, чем у ответов наугад), уверенность достигала 65%.
Проведя еще несколько дополнительных опытов, Лихтенштейн и Фишхофф сделали следующие заключения о связи между точностью и уверенностью в двухальтернативных суждениях:
Самоуверенность является самой высокой, когда точность близка к уровню случайного угадывания.
Самоуверенность уменьшается, когда точность растет от 50 до 80%, а если точность превышает 80%, то люди (272:) становятся недостаточноуверенными. Другими словами, разница между точностью и уверенностью наименьшая, если точность около 80%, и она возрастает, когда точность отклоняется от этого значения.
Несоответствие между точностью и уверенностью не зависит от умственного развития респондента.
Несмотря на то что первые критики этой работы писали, что эти результаты во многом являются порождением вопросов, которые были неясными или бессмысленными, последующие исследования показали, что факты Лихтенштейн и Фишхоффа подтверждаются и при использовании более обыденных, знакомых респондентам тем. Например, в серии экспериментов, включавшей более 10000 отдельных оценок, Ли Росс и его коллеги обнаружили, что люди на 10– 15% переоценивали точность своих ответов, когда их просили предсказать свое поведение и поведение других людей (Даннинг, Гриффин, Милойкович и Росс, 1990; Валлон, Гриффин, Лин и Росс, 1990).
Нельзя сказать, что люди всегдаизлишне самоуверенны. Давид Роунис и Фрэнк Йетс в 1987 году обнаружили, например, что самоуверенность частично зависит от того, как оценивать уверенность и какой тип оценки был сделан (суждения из области общего знания обычно выносятся с относительно высокой уверенностью). Существуют также некоторые основания считать, что игроки в бридж, профессиональные оценщики, работники метеорологической службы – все, кто получает регулярную обратную связь на свои оценки, – не склонны к излишней самоуверенности (Керен, 1987; Лихтенштейн, Фишхофф и Филлипс, 1982; Мерфи и Браун, 1984; Мерфи и Уинклер, 1984). Однако большая часть исследований свидетельствует о том, что переоценка присутствует всегда.
Экстремальная самоуверенность
Если люди уверены в правильности ответа, насколько часто они имеют для этого основания? В 1977 году Барух Фишхофф, Поль Словик и Сара Лихтенштейн провели серию экспериментов, чтобы ответить на этот вопрос. В первом опыте респонденты отвечали на сотни вопросов из области общего знания и оценивали вероятность того, что их ответы верны. Например, ответив (273:) на вопрос, является ли абсент ликером или минералом, они оценивали свою уверенность по шкале от 50% до 100% (эта проблема приведена в п. 21 Анкеты). Фишхофф, Словик и Лихтенштейн проверяли правильность только тех ответов, в которых респонденты были абсолютно уверены.
Они обнаружили, что люди отвечали верно в 70—85% таких случаев. Насколько были уверены вы в вашем ответе на вопрос п. 21? Правильный ответ: абсент – это ликер, но многие люди путали его название с названием камня аметиста.
Чтобы быть уверенными в том, что их результаты не являются порождением неверных представлений о вероятности, Фишхофф, Словик и Лихтенштейн в 1977 году провели второй эксперимент, в котором самоуверенность оценивалась в форме пропорции, отношения. Испытуемым в этом эксперименте давалось более 100 пунктов, в каждом указывалось две причины смерти, например, лейкемия и вождение машины. Их просили определить, от чего в США умирают чаще, и назвать вероятность того, что они правы, в виде отношения (например, 2:1, 3:1 и т.д.). Таким образом, испытуемые могли не путаться с процентами вероятности и говорить вместо 75%, что они оценивают шансы того, что они правы, как 3:1.
Словик, Фишхофф и Лихтенштейн обнаружили, что точность и уверенность вполне соответствовали друг другу, пока уверенность не превышала 3:1, но если она вырастала до значения от 3:1 до 100:1, точность оказывалась значительно ниже. Когда люди говорили, что они правы и уверены в этом на 100 против 1, они были точны в ответах в среднем на 75%. Если же уверенность колебалась от 10000 против I до 1000000 против 1 – просто невероятных величин – точность ответов достигала 85– 90% (что примерно соответствует уверенности от 6:1 до 9:1)*.
И наконец, в качестве последнего штриха, необходимого для уверенности в том, что испытуемые понимают и воспринимают задачу серьезно, Фишхофф, Словик и Лихтенштейн провели три беседы. В одной из них отношения между случаем и вероятностью были тщательно разъяснены в двадцатиминутной лекции.
* Несмотря на то что эти результаты могут показаться противоречащими предыдущим открытиям, сделанным Лихтенштейн и Фишхоффом (где речь, в частности, шла о том, что переоценка минимальна, если точность превышает 85%), на самом деле противоречия нет. Тот факт, что субъекты были только на 70– 90% точны, будучи при этом уверенными в своей правоте, не означает, что они всегда были слишком уверены, будучи правы на 70– 90%. (274:)
Испытуемым давали таблицу, показывавшую взаимосвязь между оценкой в виде отношения и вероятностью, и рассказывали о тонкостях выражения неуверенности при помощи отношений (приводились специальные примеры использования отношений между 2:1 и 1:1 для выражения неуверенности). Даже после этих инструкций испытуемые выражали невероятную уверенность в своих ответах. Они давали отношение никак не меньше 50:1, когда оно должно было быть равно 4:1, и 100:1, если на самом деле оно было 5:1.
В другом опыте испытуемых спрашивали, согласны ли они держать денежное пари по поводу верности тех ответов, в которых они сами оценят ее как 50:1. Из 42 испытуемых 39 сказали, что приняли бы предложение – несмотря на то что их ложная самоуверенность должна была привести к потере почти 140 долларов. В последней беседе Фишхофф, Словик и Лихтенштейн действительно заключали с испытуемыми пари. В этом опыте 13 из 19 испытуемых согласились поставить деньги на точность своих ответов, даже если они были неправы в ответах на 12% вопросов, точность которых оценили как 50:1 и выше (проигрыш должен был составить от 1 до 11 долларов, и экспериментаторы намеревались отдавать деньги). Эти результаты показали, что: 1) люди самоуверенны, даже если их правота – кажущаяся; 2) самоуверенность – это не просто результат восприятия задачи как легкой или непонимание того, как составляются оценки точности. Кроме того, Джоан Сибер в 1974 году обнаружила, что самоуверенность возрастает вместе с желанием показать хорошие результаты.
Когда самоуверенность становится уголовным преступлением
Склонны ли люди к переоценке, если ставка превышает несколько долларов? Несмотря на то что соображения этического характера, очевидно, в ограниченных рамках можно исследовать в лабораторных условиях, есть по крайней мере одно свидетельство того, что переоценка может возникнуть, даже если на карту поставлена человеческая жизнь. Это свидетельство получено при исследованиях, связанных со смертной казнью.
В исчерпывающем обзоре несправедливых приговоров Хьюго Бедау и Майкл Раделет в 1987 году обсуждали 350 (275:) зафиксированных в США случаев, в которых ложно обвиненные в уголовных преступлениях, несмотря на то что обвинения «вызывали обоснованные сомнения», были осуждены. В пяти случаях ошибка была обнаружена до вынесения окончательного приговора. Другим обвиняемым повезло меньше: 67 были заключены в тюрьмы на срок до 25 лет, 139 – на срок более 25 лет и 139 были приговорены к смерти. На тот момент, когда Бедау и Раделет писали свой обзор, 23 человека из приговоренных уже были казнены.
Градуирование
«Градуирование» – это согласование уверенности и точности. Человек, принимающий решение, может считать свою градуировку совершенной, если во всех оценках уровня уверенности отношение точности равно вероятности правоты. Другими словами, 90% всех оценок верны – 90% уверенности в том, что ответы верны; 80% оценок верны – 80% уверенности в ответах и т.д.
Когда оценки индивидуальны, особого смысла говорить о градуировании нет. Насколько хорошо градуировано решение человека, ответившего 70% на вопрос п. 216 Анкеты? Градуировка важна, когда речь идет о сотнях оценок (Лихтенштейн, Фишхофф и Филлипс, 1982).
Поскольку существует множество способов измерения уверенности, существует ряд методик измерения градуировки. Одна из них – обычный подсчет разницы между средним уровнем уверенности и общей пропорцией правильных ответов. Скажем, человек имеет 80% уверенности в своих ответах на ряд вопросов из области общего знания, но правильно ответил только на 60%. Этот субъект переоценил свои силы на 20%.
Несмотря на то что такой способ градуирования очень удобен, он не всегда может быть применен. Представьте себе, например, человека, уверенность и точность оценок которого равны 80% каждая. Этот человек обладает совершенной градуировкой? Необязательно. Он мог быть на 60% уверен в половине ответов и на 100% – в другой половине (в среднем – 80% уверенности), а верно ответить на 80% вопросов и в первой, и во второй половине. Такой человек имеет заниженную самооценку, когда уверен в 60% ответов, и завышенную, когда уверен во всех. (276:)
Более совершенной методикой является оценка точности через ряд условий уверенности. Если точность подсчитывается для разных уровней уверенности, то появляется возможность создать «кривую градуирования», где горизонтальная ось будет обозначать уверенность, а вертикальная – точность. Рисунок 19.2 содержит две кривые градуирования: одна – для предсказания метеослужбами выпадения осадков, другая – для диагнозов пневмонии. Как вы можете видеть, предсказания погоды почти
Рисунок 19.2
Этот рисунок содержит кривые градуирования для прогнозов погоды (незакрашенные кружки) и диагнозов пневмонии (закрашенные кружки). В то время как прогнозы погоды почти безупречно проградуированы, врачи демонстрируют чрезмерную самоуверенность (при наличии или отсутствии у пациента пневмонии). Данные о прогнозах погоды взяты из отчета Аллана Мерфи и Роберта Уинклера (1984), а данные о врачах – из исследования Джей Кристенсен– Шалански и Джеймса Бушихеда (1981).
277
совершенно проградуированы, в среднем их прогнозы почти всегда совпадают с погодой (вопреки традиционным взглядам!). А вот диагнозы проградуированы очень плохо; большинство предсказаний этого характера лежат ниже линии, символизирующей совершенную градуировку.
Существует еще несколько способов оценивать градуировку, некоторые из них подразумевают хорошее знание математики. Например, одна из наиболее распространенных методик состоит в следующем: необходимо подсчитать так называемый «показатель Брайера» (названный по имени статистика Гленна Брайера). Показатель Брайера может быть разложен на три компоненты, одна из которых соотносится с градуировкой. Эта компонента числа Брайера представляет собой взвешенную среднюю величину между среднеквадратичными отклонениями пропорциональной точности во всех категориях и вероятности для каждой категории (более подробно см. Йетс, 1990).
Одна из наиболее интересных оценок градуировки известна как «индекс неожиданности». Индекс используется для оценок промежутков, точность которых известна. Например, представьте, что вы почувствовали 90%– ную уверенность в том, что правильный ответ на вопрос п. 12 Анкеты находится где– то между дюймом и милей (см. п. 126). Поскольку правильный ответ больше мили, этот ответ должен быть засчитан как неожиданность. Индекс неожиданности – это простое процентное выражение оценок, лежащих за границей уверенности.