Текст книги "Лягушка в кипятке и еще 300 популярных инструментов мышления, которые сделают вас умнее"
Автор книги: Лорен Макканн
Соавторы: Габриэль Вайнберг
Жанры:
Психология
,сообщить о нарушении
Текущая страница: 12 (всего у книги 22 страниц)
Можно сделать вывод, что есть два подхода к статистике и они оба верны, если все делать правильно. Некоторые люди являются убежденными идеологами, которые клянутся в верности одной философии или другой, тогда как прагматики (вроде нас) используют те методы, которые лучше всего подходят для ситуации. Помните, что нельзя допускать путаницы между условной вероятностью и ее обратным значением: P(A|B) не равно P(B|A). Теперь вы знаете, что эти вероятности связаны теоремой Байеса, которая учитывает соответствующие базовые проценты.
Правильно или нет?
Вы узнали, что не должны основывать свои решения на единичных случаях и что маленькие выборки не могут достоверно показать, что произойдет в большой группе населения. Может быть, вам стало интересно: сколько данных достаточно, чтобы быть уверенными в своих выводах? Установление размера выборки, общего числа собранных точек данных – это уравновешивающее действие. С одной стороны, чем больше информации вы соберете, тем точнее будут ваши подсчеты и тем увереннее вы будете в своих выводах. С другой стороны, на сбор большого количества информации уйдет больше времени и денег и, возможно, риску подвергнется больше участников. Итак, как установить правильный размер выборки?
Даже идеально спланированный эксперимент иногда будет давать случайный результат, который заставит сделать неправильные выводы.
Больший размер выборки придаст больше уверенности в том, что положительный результат возник не случайно, а также даст больше шансов получить этот положительный результат.
Рассмотрим типичную ситуацию с опросом общественной поддержки предстоящего референдума, например по легализации марихуаны. Предположим, что референдум в конечном итоге провалился, но социологи случайным образом выбрали в качестве респондентов людей, которые были благосклоннее к проекту, чем остальное население. Это приведет к ложноположительному результату – положительному результату, который на самом деле оказался ложным (как и ложный результат алкотестера). Или наоборот, референдум в конце концов оказался успешным, но социологи случайно выбрали людей, которые меньше его одобряли по сравнению со всем населением. Получился ложноотрицательный результат – отрицательный результат, который на самом деле был истинным. В качестве другого примера рассмотрим маммографию – медицинский тест для диагностики рака молочной железы. Кажется, что такой тест имеет два возможных результата: положительный и отрицательный. Но на самом деле у маммографии четыре возможных результата, которые отображены в следующей таблице. Два результата, о которых вы сразу подумали: истинно положительный или истинно отрицательный. Другие два результата выдаются при ошибке теста – ложноположительный и ложноотрицательный результат.
Эти ошибочные модели встречаются далеко за пределами статистики в любой системе, где принимаются решения. Отличный пример – ваш спам-фильтр в электронной почте. Недавно спам-фильтры удалили письмо с фотографиями нашей новорожденной племянницы (ложноположительный результат). А настоящий спам до сих пор иногда просачивается в основную почту (ложноотрицательный результат).
Возможные результаты теста

Поскольку каждый тип ошибок имеет свои последствия, системы нужно создавать с их учетом.
То есть решения придется принимать на компромиссе между различными типами ошибок, признавая, что некоторые из них неизбежны.
Например, правовая система США должна требовать доказательств по обвинительным приговорам, а не основываться на разумных сомнениях в виновности задержанного человека. Это осознанный компромисс в пользу ложноотрицательного (выпустить преступника на волю), а не ложноположительного результата (наказать невиновного человека).
В статистике ложноположительный результат известен как ошибка типа I, а ложноотрицательный результат называется ошибкой типа II. При разработке эксперимента ученые оценивают вероятность каждого типа ошибки, которую они готовы терпеть. Допустимый процент ложноположительных результатов обычно равен 5 % (этот показатель также обозначается греческой буквой α – альфа, которая равняется 100 минус уровень доверия. Вот почему обычно уровень доверия составляет 95 %). Это значит, что в среднем, если ваша гипотеза неверна, один из 20 экспериментов (5 %) даст ложноположительный результат.
Независимо от размера выборки в вашем эксперименте всегда можно задать процент ложноположительного результата. Он не обязательно должен быть равен 5 %. Можно выбрать 1 % или даже 0,1 %. Но, ставя такой низкий процент ложноположительного результата для своей выборки, вы увеличиваете частоту ложноположительных ошибок, и тогда вам, возможно, не удастся найти реальный результат. Тут-то речь и заходит о размере выборки.
Определив процент ложноположительных результатов, вы должны выяснить, какого размера вам потребуется выборка, чтобы с достаточно высокой вероятностью найти истинный результат. Эта величина называется мощностью эксперимента и обычно выбирается так, чтобы вероятность обнаружения составляла 80–90 %, а частота ложноположительной ошибки, соответственно, 10–20 % (этот процент также обозначается греческой буквой β – бета, которая равняется 100 минус мощность). Исследователи говорят, что их эксперимент обладает мощностью 80 %.
Статистическая проверка

Давайте рассмотрим один пример, чтобы проиллюстрировать, как все эти модели работают вместе. Предположим, компания хочет доказать, что их новое приложение для засыпания работает. Предварительное исследование показало, что в половине случаев человек засыпает в течение 10 минут. Разработчики думают, что можно улучшить этот показатель с помощью приложения, помогая большему количеству людей заснуть меньше чем за 10 минут.
Разработчики планируют исследование в лаборатории сна, чтобы проверить свою теорию. Тестовая группа будет использовать приложение, а контрольная будет засыпать без него (у настоящего исследования план будет посложнее, но мы объясняем статистические модели).
Статистическая база большинства экспериментов (включая и этот) начинается с гипотезы о том, что между группами нет разницы, – это называется нулевой гипотезой.
Если разработчики соберут достаточно доказательств для опровержения этой гипотезы, они сделают вывод, что их приложение действительно помогает людям уснуть быстрее.
То есть разработчики приложения наблюдают за обеими группами, а затем рассчитывают процент людей, засыпающих в течение 10 минут в каждой. Если они найдут достаточно большую разницу между этими двумя результатами, они сделают вывод, что результаты несовместимы с нулевой гипотезой, а значит, приложение, вероятно, действительно работает.
Разработчикам также нужно детально изложить альтернативную гипотезу, которая описывает наименьшие значимые показатели, которые, как им кажется, возникнут между двумя группами: например, на 15 % больше людей уснет в течение 10 минут. Это реальный результат, который они хотят подтвердить своим исследованием и имеют 80 % шанс обнаружить (что соответствует ложноотрицательному результату в 20 % случаев).
Эта альтернативная гипотеза необходима для определения размера выборки. Чем меньше разница в альтернативной гипотезе, тем больше людей потребуется для ее обнаружения. Для описанного плана эксперимента размер выборки составляет 268 участников.
Все эти модели наглядно представлены на рисунке.
Для начала посмотрим на кривые нормального распределения (по центральной предельной теореме можно предположить, что разницы будут приблизительно нормально распределены). Кривая слева показывает результаты меньше нулевой гипотезы: между двумя группами нет существенной разницы. Вот почему эта левая кривая центрирована на 0 %. Даже в этом случае разница время от времени будет случайно составлять больше или меньше нуля, но чем больше разница, тем менее она вероятна. То есть из-за базовой изменчивости, даже если приложение и не обладает реальным эффектом, разница все равно будет обнаружена между двумя группами, потому что люди засыпают за случайные периоды времени.
Статистическая значимость

Другая кривая нормального распределения (справа) представляет собой альтернативную гипотезу, на правдивость которой надеются разработчики: количество людей, которые засыпают в течение 10 минут при использовании приложения, увеличится на 15 % по сравнению с людьми, которые не пользуются им. Опять же, даже если эта гипотеза верна, из-за изменчивости разница иногда все равно будет меньше 15 %, а иногда больше 15 %. Вот почему правая кривая центрирована на 15 %.
Пунктирная линия представляет собой порог статистической значимости. Все значения, превышающие этот порог (справа), будут опровергать нулевую гипотезу, поскольку такая большая разница вряд ли возникнет, если нулевая гипотеза верна.
На самом деле вероятность ее возникновения была бы меньше 5 % – такой процент ложноположительного результата изначально установили разработчики.
Последняя мера, к которой часто прибегают, чтобы выявить статистическую значимость результата, называется p-значением, официальное определение которого – вероятность получения результата, равного или превышающего наблюдаемый, если предположить, что нулевая гипотеза верна. По сути своей, если p-значение меньше выбранного уровня ложноположительного результата (5 %), можно сказать, что результат обладает статистической значимостью. P-значения часто используются в отчетах об исследованиях, чтобы сообщить о такой значимости.
Например, p-значение, равное 0,01, значит, что разница, равная или превышающая наблюдаемую, будет иметь место только в 1 % случаев, если приложение окажется неэффективным. Это значение соответствует значению на крайнем хвосте левой кривой нормального распределения и ближе к центру правой кривой нормального распределения. Такое расположение означает, что результат больше соответствует альтернативной гипотезе: данное приложение имеет эффект 15 %.
Теперь обратите внимание, как две кривые накладываются друг на друга, показывая, что некоторая разница между двумя группами согласуется с обеими гипотезами (одновременно под обоими колоколами кривых). Эти серые области показывают, где могут возникнуть два типа ошибки. Светло-серая область – это ложноположительный, а темно-серая – ложноотрицательный результат.
Ложноположительный результат получится, если между двумя группами обнаружится большая разница (как там, где p-значение равно 0,01), но на самом деле приложение не действует. Это произойдет, если кто-то из группы без приложения случайно долго не мог уснуть, а кто-то из группы с приложением случайным образом легко уснул.
Статистическая значимость

И наоборот, ложноотрицательный результат получится, если приложение на самом деле помогает людям уснуть быстрее, но наблюдаемая разница слишком мала, чтобы обладать статистической значимостью. Если исследование имеет типичную мощность 80 %, этот ложноотрицательный сценарий будет происходить в 20 % случаев.
Предположим, что размер выборки остается фиксированным. Снижение вероятности ложноположительной ошибки эквивалентно переносу пунктирной линии вправо с сокращением светло-серой области. Но при этом шанс сделать ложноотрицательную ошибку возрастает (сравните верхний рисунок с оригиналом).
Если хотите уменьшить процент одной из ошибок, не увеличивая другую, придется увеличить размер выборки. При этом каждая из кривых нормального распределения станет у́же (сравните нижний рисунок также с оригиналом).
Статистическая значимость

Увеличение размера выборки и сужение кривых нормального распределения уменьшают наложение двух кривых, в процессе сокращая общую серую область. Конечно, это привлекательно, потому что уменьшается вероятность совершить ошибку. Но, как мы отметили в начале раздела, есть множество причин, по которым увеличение размера выборки может оказаться нецелесообразным (время, деньги, риск для участников и т. д.).
В таблице показано, как изменяется размер выборки для разных пределов уровня ошибки в исследовании приложения для сна. Вы увидите, что, если процент ошибок понизится, размер выборки придется увеличить.
Все значения размеров выборки в следующей таблице зависят от выбранной альтернативной гипотезы с разницей в 15 %. Размеры выборки увеличивались бы и дальше, если бы разработчики хотели обнаружить еще меньшую разницу, и уменьшились бы, если бы хотели найти только большую разницу.
Размер выборки изменяется с мощностью и значимостью

Исследователям часто приходится брать выборку поменьше, чтобы сэкономить время и деньги, из-за чего выбор большей разницы для альтернативной гипотезы становится привлекательным. Но такой выбор сопряжен с высоким риском. Например, разработчики могли бы сократить размер выборки всего до 62 человек (вместо 268), если бы заменили разницу в альтернативной гипотезе на 30 % между двумя группами (а не 15 %).
Но если в действительности приложение дает разницу всего 15 %, с этим меньшим размером выборки они смогут обнаружить такую меньшую разницу только в 32 % случаев! Это меньше, чем изначальные 80 %, и значит, что в 2/3 случаев будет получен ложноотрицательный результат, который не покажет разницу в 15 %. В идеале любой эксперимент нужно разрабатывать так, чтобы обнаруживать малейшую существенную разницу.
Последнее замечание о p-значениях и статистической значимости: большинство статистиков предостерегают, что нельзя чрезмерно полагаться на p-значения при интерпретации результатов исследования. Неспособность найти значимый результат (достаточно малое p-значение) – это не то же самое, что уверенность в отсутствии эффекта.
Отсутствие доказательств не является доказательством отсутствия.
Точно так же, даже несмотря на то, что исследование могло достичь лишь низкого p-значения, этот результат может быть неприменим, что мы рассмотрим в заключительном разделе.
Статистическую значимость не следует путать с научной, человеческой или экономической значимостью. Даже самый мизерный заметный эффект будет статистически значимым, если размер выборки достаточно велик. Например, если в исследовании сна примет участие достаточное количество людей, вы потенциально обнаружите разницу в 1 % между двумя группами, но будет ли это значимо для покупателей? Нет.
И наоборот, больше внимания стоит обратить на разницу, измеренную в исследовании, вместе с соответствующим доверительным интервалом. Потребители приложения хотят знать не только то, будут ли они лучше спать с ним, чем без него, но и насколько лучше. Возможно, разработчикам даже захочется увеличить размер выборки, чтобы гарантировать определенную погрешность в своих оценках.
Кроме того, Американская ассоциация статистики в одном из выпусков своего журнала за 2016 год подчеркнула, что «научные выводы и деловые или политические решения не должны опираться только на то, преодолевает ли p-значение определенный порог». Слишком большое внимание к p-значению поощряет черно-белое мышление и сокращает до одного числа весь объем информации, полученной из исследования. Такой исключительный фокус заставит вас упустить из виду возможные неоптимальные варианты в проекте исследования (например, размер выборки) или погрешности, которые могли закрасться в него (например, систематическую ошибку отбора).
Получится ли воспроизвести?
Вы уже знаете, что результаты некоторых экспериментов – просто счастливая случайность. Чтобы удостовериться в том, что результат исследования не случаен, его необходимо воспроизвести. Интересно, что в некоторых областях, таких как психология, для воспроизведения положительных результатов предпринимались согласованные усилия, но эти усилия показали, что более 50 % положительных результатов невозможно воспроизвести.
Это низкий показатель и такая проблема с исключительно положительными результатами называется кризисом воспроизводимости. В этом последнем разделе мы предлагаем кое-какие модели, которые объясняют, как это происходит и как все равно получить больше доверия в своей области исследований.
Попытки воспроизведения – это попытки отличить ложноположительные результаты от истинно положительных.
Подумайте, каковы шансы воспроизведения в каждой из этих двух групп. Предполагается, что ложноположительный результат повторится – то есть ожидается получение второго ложноположительного результата при повторном эксперименте – всего в 5 % случаев. С другой стороны, ожидается, что истинно положительный результат повторится в 80–90 % случаев, в зависимости от мощности повторного исследования. Предположим, что это 80 %, как в предыдущем разделе.
Кризис воспроизводимости

Таким образом, для 50 % воспроизведения требуется, чтобы около 60 % исследований были истинно положительными, а 40 % – ложноположительными. Чтобы было понятнее, представьте 100 экспериментов: если 60 дадут истинно положительный результат, 48 из них должно быть можно воспроизвести (80 % от 60). Из оставшихся 40 ложноположительных результатов будут воспроизведены 2 (5 % от 40), чтобы в общей сложности получилось 50. Тогда уровень воспроизводимости будет 50 на 100 экспериментов, или 50 %.
Получается, в этом сценарии около четверти неудачных воспроизведений (12 из 50) будут объясняться недостатком мощности усилий для воспроизведения. Это реальный результат, который, скорее всего, будет воспроизведен успешно при проведении дополнительного исследования, или получился бы, если бы у первоначального воспроизведения была более крупная выборка.
Остальные результаты, которые не получилось воспроизвести, изначально и не должны были быть положительными. Многие из этих первоначальных исследований, вероятно, недооценили частоту ошибки типа I и повысили шансы получить ложноположительный результат. Это связано с тем, что при планировании исследования с 5 % шансом ложноположительного результата этот шанс применяется только к одной статистической проверке, но крайне редко такая проверка проводится всего один раз.
Проведение дополнительных проверок для поиска статистически значимых результатов имеет много названий, включая прочесывание, выуживание данных или p-взлом (попытка взломать данные в поисках достаточно малых p-значений). Часто это делается из лучших побуждений, потому что наблюдение за данными эксперимента воодушевляет и побуждает исследователя формировать новые гипотезы. Соблазн проверить дополнительные гипотезы велик, так как необходимые для их анализа данные уже собраны. Однако проблема возникает, когда исследователь преувеличивает результаты этих дополнительных испытаний.
Комикс XKCD[67], приведенный ниже, показывает, чем может обернуться выуживание данных: не найдя никакой статистически значимой связи между карамельками и прыщами, ученые продолжили прочесывать двадцать одну подгруппу, пока не нашли одну с существенно низким p-значением, из-за чего появился заголовок: «Прыщи появляются от зеленых карамелек!»

Каждый раз, когда проводилась очередная статистическая проверка, шанс сделать ошибочный вывод продолжал расти выше 5 %. Чтобы было понятнее, предположим, что у вас есть кубик с 20 гранями. Шансы сделать ошибку при первой проверке будут такими же, как шансы выбросить единицу. Каждый дополнительно проведенный тест будет еще одним броском кубика, каждый с новым шансом 1 к 20 выбросить единицу. После 21 броска (в соответствии с 21 цветной карамелькой в комиксе) будет шанс примерно 2/3, что единица выпала как минимум однажды, то есть был как минимум один ошибочный результат.
Если выуживание данных такого типа проводится достаточно часто, становится понятно, почему так много исследований, подлежащих воспроизведению, изначально бывают ложноположительными. Другими словами, в этом наборе из ста исследований базовый процент ложноположительного результата, скорее всего, был намного больше 5 %, поэтому значительную часть кризиса воспроизводимости можно объяснить ошибкой базового процента.
К сожалению, исследования с большей вероятностью опубликуют, если в них будут статистически значимые результаты, что приводит к искажению публикации. Исследования, которые не смогли показать статистически значимые результаты, все еще имеют научную значимость, но как сами ученые, так и издания предвзято относятся к ним по ряду причин. Например, в журнале ограничено количество страниц, и, выбирая между двумя исследованиями, редактор всегда отдаст предпочтение значимым результатам. Успешные исследования чаще привлекают внимание СМИ и научного сообщества. Вероятнее, что они также сильнее повлияют на карьеру исследователей.
Все эти факторы являются сильным стимулом к получению значительных результатов экспериментов. В комиксе, несмотря на то что первоначальная гипотеза не показала значимого результата, эксперимент был «спасен» и в конечном итоге опубликован, потому что нашлась второстепенная гипотеза, показавшая значимый результат.
Публикация ложноположительных результатов вроде этого напрямую способствует кризису воспроизводимости и задерживает научный прогресс, направляя будущие исследования к этим ложным гипотезам.
Так же как и замалчивание отрицательных результатов. Это приводит к тому, что разные люди проверяют одну и ту же ложную гипотезу снова и снова, потому что никто не знает, что ее уже проверили другие.
Есть и иные причины, по которым исследование не удается воспроизвести, включая различные ошибки, которые мы обсуждали в предыдущих разделах (например, систематическая ошибка отбора, систематическая ошибка выжившего и т. д.), закрадывающиеся в результаты. Другая причина заключается в том, что по случайности оригинальное исследование могло продемонстрировать впечатляющий эффект, тогда как на самом деле он был куда скромнее (регрессия к норме). Если это так, то воспроизведенное исследование, скорее всего, будет иметь недостаточно большую выборку (недостаточно мощности), чтобы выявить небольшой эффект, и это приведет к неудачному воспроизведению исследования.
Всегда есть способы преодолеть эти проблемы. Например, можно:
• использовать более низкие p-значения, чтобы учесть ложноположительные ошибки в оригинальном исследовании во всех проведенных тестах;
• использовать выборку большего размера при воспроизведении исследования, чтобы иметь возможность обнаружить даже небольшой эффект;
• заранее сделать спецификацию статистических тестов, чтобы избежать p-взлома.
Тем не менее из-за кризиса воспроизводимости и его причин нужно скептически относиться к любым изолированным исследованиям, особенно если вы не знаете, как собирались и анализировались данные.
В более широком смысле, когда вы интерпретируете утверждение, важно критически оценивать любые данные, подтверждающие его: они поступили из изолированного исследования или за ним стоит целый блок исследований?
Если это так, то как были разработаны эти исследования? Все ли ошибки были учтены при планировании и анализе? И так далее.
Такое исследование – большой труд. Источники в медиа могут делать ложные выводы и редко предоставляют необходимую информацию, которая позволит вам понять весь замысел эксперимента и оценить его качество. Как правило, за подробной информацией вам придется обратиться к оригинальной научной публикации. Почти во всех научных журналах есть целый раздел, описывающий статистический план исследования, но, учитывая ограничение на количество слов в типичной статье, детали иногда опускают. Ищите полные версии или связанные презентации на сайте журнала – можете даже обратиться напрямую к ученым, обычно они охотно отвечают на вопросы о своей работе.
При идеальном раскладе вы найдете блок из большого числа исследований, которые сотрут все сомнения по поводу случайности результата эксперимента. Если повезет, кто-то уже написал систематический обзор вашего вопроса к исследованию. Систематические обзоры – это организованный способ оценки вопроса с использованием всего объема исследований по определенной теме. Они описывают подробный и всесторонний (систематический) план для обзора результатов исследований в определенной области, включая поиск соответствующих исследований, чтобы исключить систематические ошибки в процессе.
Некоторые, но не все систематические обзоры включают в себя метаанализ, где используются статистические методы для объединения данных из нескольких исследований. Хороший пример – сайт FiveThirtyEight, который специализируется на метаанализе данных из опросов, чтобы лучше прогнозировать развитие событий в политике.
Помимо преимуществ, таких как точность и достоверность оценок, у метаанализа есть и недостатки. Например, сложно комбинировать данные из исследований, где слишком сильно отличаются планы или популяция выборок. Они также не могут самостоятельно устранять искажения из оригинальных исследований. Кроме того, и систематические обзоры, и метаанализ подвержены искажению публикации, потому что включают в себя только общедоступные результаты исследований.
Всякий раз, рассматривая обоснованность утверждения, вначале мы проверяем, проводился ли всеобъемлющий систематический обзор, и, если это так, начинаем с него. В конце концов систематические обзоры и метаанализы часто используются при принятии решений, например при разработке медицинских инструкций.
Если в этой главе и есть одна основная мысль, то это то, что разработать хороший эксперимент сложно! Мы надеемся, что вы также почерпнули отсюда, что вероятность и статистика – это полезные инструменты для понимания проблем, связанных с неопределенностью. Но этот раздел также призван объяснить, что статистика – это не панацея от неопределенности.
Как предложил статистик Эндрю Гельман в статье для журнала The American Statistician, мы должны «стремиться смириться с неопределенностью и отклонениями».
В целом имейте в виду, что хотя статистика помогает получить уверенные прогнозы в различных обстоятельствах, она не может точно предсказать, что произойдет в отдельно взятом случае.
Например, вы знаете, что в среднем летом на вашем любимом пляже тепло и солнечно, но это не гарантирует, что, когда вы пойдете в отпуск, погода не станет дождливой и не по сезону прохладной.
Точно так же медицинские исследования утверждают, что риск заработать рак легких возрастает, если вы курите, и хотя вы можете вычислить доверительный интервал, что средний курильщик за свою жизнь столкнется с раком легких, вероятность и статистика не могут сказать, что произойдет с отдельно взятым курильщиком.
Хотя вероятность и статистика – это не магия, они все же помогают лучше описать уверенность в вероятности различных результатов. Конечно, есть много подводных камней, на которые нужно обратить внимание, но мы надеемся, что вы почерпнете отсюда тот факт, что исследования и данные намного полезнее для преодоления неопределенности, чем догадки и предположения.
Основные идеи
• Не поддавайтесь ошибке игрока или ошибке базового процента.
Единичные случаи и корреляции, которые вы видите в данных, – хорошие генераторы гипотез, но корреляция не подразумевает причинно-следственной связи – вам все равно нужно основывать надежные выводы на хорошо спланированных экспериментах.
• Ищите проверенные планы экспериментов, такие как рандомизированные контролируемые эксперименты или А/В-тестирование, которые демонстрируют статистическую значимость.
Нормальное распределение особенно важно в экспериментальном анализе из-за центральной предельной теоремы. Помните, что при нормальном распределении около 68 % значений попадет в одно стандартное отклонение и 95 % – в два.
• Любой изолированный эксперимент может привести к ложноположительным или ложноотрицательным результатам и обусловлен множеством факторов, чаще всего систематической ошибкой отбора, искажением ответа и систематической ошибкой выжившего.
• Воспроизведение повышает уверенность в результатах, так что начните с поиска систематического обзора и/или метаанализа при исследовании определенной сферы.
• Никогда не забывайте, что при работе с неопределенностью значения, которые вы видите в отчетах или рассчитываете самостоятельно, сами по себе неопределенны и что вы должны искать и указывать значения с «усами»!
Глава 6
Решения, решения…
Как легко было бы принимать решения, если бы мы знали, чем они для нас обернутся.
Но это трудно, потому что выбор приходится делать с несовершенной информацией.
Предположим, вы хотите построить карьеру. Вам нужно рассмотреть различные варианты.
• Поискать такую же работу, что и сейчас, только с лучшими условиями (соцпакет, месторасположение, миссия организации и т. д.).
• Попытаться продвинуться по служебной лестнице на нынешней работе.
• Перейти в аналогичную организацию на более высокую должность.
• Полностью сменить карьеру и учиться чему-то новому.
Конечно, вариантов еще больше. Когда вы перекопаете их все, выбор покажется бесконечным. И вы не сможете испробовать все, чтобы в конце концов остановиться на одном. Такова жизнь.
Как же извлечь из этого всего смысл? Чаще всего люди в такой ситуации составляют список «за» и «против», где перечисляют списком все положительные последствия принятого решения (за) и сравнивают их со всеми отрицательными последствиями (против).
Хоть иногда это и полезно, у базовой методики сравнения всех «за» и «против» есть существенные недостатки. Во-первых, список подразумевает, что есть только два варианта, хотя вы уже и сами видели, что обычно их намного больше. Во-вторых, все плюсы и минусы в нем кажутся равноценными. В-третьих, в списке все пункты стоят по отдельности, хотя они наверняка взаимосвязаны. В-четвертых, так как плюсы бывают намного очевиднее, чем минусы, вам может показаться, что хорошо там, где нас нет, – вы мысленно будете ставить акцент на плюсах и игнорировать минусы.
К примеру, в 2000 году Габриэль окончил учебу и начал строить карьеру предпринимателя. Поначалу он подумывал заняться венчурным капиталом и финансировать и поддерживать чужие компании, вместо того чтобы основать свою собственную. Когда он изначально составил список «за» и «против», это показалось ему отличной идеей. Он видел очень много плюсов (возможность работать с людьми, которые меняют мир, потенциально огромный заработок, работа с мощными стартапами без риска и стресса, неизбежных для основателя компании, и т. д.) и не замечал очевидных минусов.
Тем не менее некоторые минусы он просто не в полной мере оценил или еще не знал, что они есть (включая то, что нужно постоянно общаться – большой минус для настоящего интроверта, постоянно говорить людям «нет», тяжело трудиться, чтобы пробиться наверх, тратить бо́льшую часть времени на компании в кризисе и т. д.). Конечно, это прекрасная карьера для тех, у кого есть возможность ей заниматься, но венчурный капитал совсем не подходил Габриэлю, хоть он поначалу этого и не понимал. Когда у него стало больше времени и опыта, он увидел полную картину (в его случае хорошо было не там, где его нет) и больше не планирует менять профессию.








