Теория игр. Искусство стратегического мышления в бизнесе и жизни

Текст добавлен: 12 октября 2016, 05:58

Текст книги "Теория игр. Искусство стратегического мышления в бизнесе и жизни"

Автор книги: Авинаш Диксит

Соавторы: Барри Дж Нейлбафф

Жанр:

Управление, подбор персонала

сообщить о нарушении

Текущая страница: 8 (всего у книги 43 страниц) [доступный отрывок для чтения: 10 страниц]

Назад к карточке книги

Дилемма

Проанализируем ход рассуждений менеджера компании RE. «Если ВВ выберет 80 долларов, я могу получить 110 тысяч долларов вместо 72 тысяч, снизив цену до 70 долларов. Если ВВ выберет 70 долларов, мой выигрыш составит 70 тысяч, если я тоже назначу эту цену, и только 24 тысячи долларов, если я оставлю цену 80. Для меня более выгодный вариант (в действительности самый выгодный, поскольку у меня только одна альтернатива) остается неизменным, что бы ни решили в ВВ. Следовательно, мне вообще не нужно думать о том, что думают они; мне просто нужно первым назначить цену 70 долларов».

Если в игре с параллельными ходами есть такое свойство (а именно оптимальный выбор игрока не зависит от выбора других игроков), это существенно упрощает рассуждения игроков, а также анализ, который делают специалисты по теории игр в подобных случаях. Следовательно, наличие такого свойства существенно упрощает решение игры. Специалисты по теории игр обозначают его термином «доминирующая стратегия». Говорят, что у игрока есть доминирующая стратегия, если эта стратегия лучше всех остальных стратегий независимо от того, какую стратегию или сочетание стратегий выберет другой игрок или игроки. Существует простое правило участия в играх с параллельными ходами{47}47
В главе 2 мы предложили вашему вниманию общий принцип разработки оптимальных стратегий для игр с последовательными ходами. Это было наше правило № 1: смотрите вперед и рассуждайте в обратном порядке. В играх с параллельными ходами все не так просто. Тем не менее «рассуждения о рассуждениях», которые необходимы в играх с параллельными ходами, можно сформулировать в виде трех простых правил. Эти правила в свою очередь опираются на две простые концепции: доминирующие стратегии и равновесие. Правило № 2 представлено в данной главе; правила № 3 и 4 будут сформулированы в следующих главах.

[Закрыть]:

ПРАВИЛО № 2: если у вас есть доминирующая стратегия, примените ее.

Дилемма заключенных – еще более специфичная игра: в ней доминирующая стратегия есть не у одного, а у обоих игроков (или у всех игроков). Менеджер компании ВВ рассуждает точно так же, как менеджер RE; для того чтобы хорошо усвоить эту идею, вы должны самостоятельно проанализировать ход рассуждений менеджера ВВ. Сделав это, вы увидите, что цена 70 долларов – это доминирующая стратегия и для компании ВВ.

Результат применения такой стратегии отображен в правой нижней ячейке таблицы игры: обе компании назначают цену 70 долларов и получают прибыль по 70 тысяч долларов каждая. Необходимо обратить внимание на следующий аспект дилеммы заключенных, который делает ее настолько важной игрой. Когда каждый из игроков применяет свою доминирующую стратегию, оба получают худший результат по сравнению с тем, что они получили бы, если бы доверились друг другу и договорились о том, что каждый выберет другую, доминируемую стратегию. В нашем примере это означало бы, что каждая компания назначит на свой товар цену 80 долларов, для того чтобы получить результат, отображенный в верхней левой ячейке матрицы игры, а именно прибыль в размере 72 тысячи долларов{48}48
В действительности 80 долларов – это та сумма, которая обеспечивает обеим компаниям максимальную прибыль. Они могли бы назначить эту цену, если бы объединились и создали картель в своей отрасли. Строгое доказательство этого утверждения требует математических расчетов, поэтому просто поверьте нам на слово. Читатели, которые захотят ознакомиться с этими расчетами, могут получить доступ к ним на сайте книги.

[Закрыть].

Для этого было бы недостаточно, чтобы только одна компания назначила на свой товар цену 80 долларов: это повлекло бы за собой очень плохие последствия для этой компании. Так или иначе, обе компании должны назначить высокую цену, чего очень трудно добиться на практике, учитывая существующий у каждой из них соблазн назначить более низкую цену, чем у конкурента. Если обе компании будут преследовать свои эгоистические интересы, они не смогут получить наилучший результат для них обеих. Такой вывод противоречит тому, чему учат нас классические экономические теории, начиная с теории Адама Смита{49}49
Разумеется, такое снижение цен выгодно потребителям, которые не являются активными участниками этой игры. Следовательно, в интересах общества в целом целесообразно сделать так, чтобы две компании не смогли решить дилемму ценообразования. В США и в других странах эту функцию выполняет антимонопольная политика.

[Закрыть].

Это вызывает ряд вопросов, часть которых связана с более общими аспектами теории игр. Что произойдет, если доминирующая стратегия будет только у одного участника игры? Что если ни у одного игрока не окажется доминирующей стратегии? Если оптимальный выбор каждого игрока зависит от того, что в это же время выбирает другой игрок, могут ли они разгадать выбор друг друга и найти решение этой игры? Мы проанализируем ответы на эти вопросы в следующей главе, в которой рассматривается более общий подход к решению игр с параллельными ходами, а именно равновесие Нэша. В данной главе сосредоточимся на решении дилеммы заключенных.

В обобщенном описании дилеммы заключенных две стратегии, имеющиеся в распоряжении каждого игрока, обозначаются так: «сотрудничать» и «предать» (или в некоторых случаях – «обмануть»); мы будем придерживаться именно этих терминов. Предательство – это доминирующая стратегия для каждого игрока; если оба игрока выберут эту стратегию, их выигрыш будет меньше, чем в случае выбора стратегии сотрудничества.

Предварительные соображения по поводу решения дилеммы заключенных

У игроков, столкнувшихся с дилеммой заключенных, есть веские основания для достижения договоренности о совместных действиях, которые позволили бы уйти от ее решения. Например, в Новой Англии рыболовы могут согласиться на ограничение улова ради сохранения рыбных ресурсов на будущее. Проблема состоит только в том, как обеспечить выполнение таких договоренностей в условиях, когда каждая сторона испытывает соблазн обмануть другую (например, выловить рыбы больше, чем позволяет квота). Что говорит теория игр по этому поводу? И что происходит в таких случаях в реальной жизни?

С тех пор как дилемму заключенных сформулировали впервые, прошло более пятидесяти лет. За это время были усовершенствованы теоретические основы этой дилеммы, а также накоплен большой объем данных, полученных как в процессе наблюдений за тем, что происходит в реальной жизни, так и в ходе лабораторных экспериментов. Давайте проанализируем этот материал и посмотрим, какие уроки мы можем из него извлечь.

У стратегии сотрудничества есть обратная сторона: стремление избежать предательства. Игрока можно заинтересовать в том, чтобы он выбрал стратегию сотрудничества вместо доминирующей стратегии предательства, пообещав ему достаточное вознаграждение. Кроме того, его можно удержать от применения стратегии предательства с помощью адекватного наказания.

Метод вознаграждения проблематичен по нескольким причинам. Вознаграждение может носить внутренний характер: один игрок платит другому за выбор стратегии сотрудничества. В иных случаях вознаграждение может быть внешним: третья сторона, заинтересованная в сотрудничестве между двумя игроками, платит им за выбор этой стратегии. Как бы там ни было, вознаграждение нельзя предоставлять игроку, пока он не сделает свой выбор, в противном случае он просто положит его себе в карман, после чего откажется выполнять договоренность. С другой стороны, если вознаграждение просто обещают, игрок может не поверить этому обещанию: когда он выберет стратегию сотрудничества, не исключено, что тот, кто дал это обещание, нарушит его.

Однако, несмотря на все эти трудности, вознаграждение бывает действенным и полезным. Проявив максимум креативности и воображения, игроки могли бы одновременно дать друг другу обещания и сделать их заслуживающими доверия, поместив обещанное вознаграждение на счете условного депонирования, который контролирует третья сторона[31]31
На основании этой идеи Джеймс Андреони и Хэл Вэриан разработали экспериментальную игру под названием Zenda. См. Preplay Communication in the Prisoners’ Dilemma, Proceedings of the National Academy of Sciences 96, no. 19 (September 14, 1999): 10933–10938. Мы проводили эту игру на занятиях и пришли к выводу, что она обеспечивает сотрудничество между игроками. Однако в реальных условиях достичь этого гораздо труднее.

[Закрыть]. В реальной жизни чаще складывается иная ситуация: поскольку игроки взаимодействуют по нескольким направлениям, сотрудничество в одном из них вознаграждается ответной услугой в чем-то другом. Так, самки шимпанзе делятся едой или присматривают за чужими детенышами в обмен на помощь в уходе за шерстью. В некоторых случаях третья сторона может быть заинтересована в обеспечении сотрудничества в игре. Например, ради того чтобы положить конец конфликтам в разных странах мира, Соединенные Штаты Америки и Европейский союз иногда обещают участникам противостояния экономическую помощь в качестве вознаграждения за мирное решение конфликта. Именно таким способом Соединенные Штаты вознаградили Израиль и Египет за сотрудничество в рамках подписания Кэмп-Дэвидских мирных соглашений в 1978 году.

Более распространенный метод решения дилеммы заключенных – наказание. Он имеет прямое действие. В фильме «Секреты Лос-Анджелеса» сержант Эд Эксли обещает Лерою Фонтейну, одному из подозреваемых, что если он согласится стать государственным свидетелем, то получит более мягкий приговор, чем два других подозреваемых, Рэй Коутс и Тайрон Джонс. Но Лерой знает, что, когда он выйдет из тюрьмы, его могут ждать на свободе друзья этих двоих!

Наказание, которое в данном контексте выглядит более естественным, оказывается возможным в связи с тем, что большинство подобных игр представляют собой часть непрерывного взаимодействия. Обман может обеспечить одному игроку краткосрочное преимущество, но навредит его взаимоотношениям с другим игроком и в долгосрочной перспективе обойдется гораздо дороже. Если цена достаточно велика, именно это может удержать игрока от обмана{50}50
В 2005 году Роберт Ауман получил Нобелевскую премию по экономике за выдающийся вклад в разработку общей теории кооперации в повторяющихся играх.

[Закрыть].

Наглядный пример такой ситуации предоставляет бейсбол. В Американской бейсбольной лиге питчеры попадают мячом в бэттеров на 11–17 процентов чаще, чем в Национальной бейсбольной лиге. По мнению профессоров Университета Юга в Суони Дага Драйнена и Джона-Чарльза Брэдбери, это обусловлено правилом о назначенном хиттере[32]32
  Об этом идет речь в их рабочем докладе Identifying Moral Hazard: A Natural Experiment in Major League Baseball, доступ к которому можно получить здесь: http://ddrinen.sewanee.edu/Plunk/dhpaper.pdf.

[Закрыть]. В Американской бейсбольной лиге питчеры не бьющие игроки. Следовательно, питчер Американской лиги, который попадает мячом в бэттера, может не бояться ответных действий со стороны питчера команды-соперника. Вероятность того, что мяч попадет в питчера, совсем небольшая, но она повышается в четыре раза, если он попал в кого-то в предыдущей половине иннинга. В таком случае страх получить ответный удар очевиден. Первоклассный питчер Курт Шиллинг объяснил это так: «Вы на самом деле готовы бросить в кого-то мяч, если играете против Рэнди Джонсона?»{51}51
  Рэндалл Дэвид Рэнди Джонсон – американский профессиональный бейсболист. Скорость его подач часто превышала 160 км/ч. – Прим. ред.

[Закрыть][33]33
  В то время Шиллинг был питчером команды Arizona Diamondbacks Национальной бейсбольной лиги, а обладатель приза Сая Янга Рэнди Джонсон – его товарищем по команде. Источник: Ken Rosenthal, “Mets Get Shot with Mighty Clemens at the Bat,” Sporting News, June 13, 2002.

[Закрыть].

В ситуации, когда один игрок наказывает другого за обман, действует стратегия «око за око, зуб за зуб». Эта стратегия оказалась настоящим открытием, сделанным в ходе самого известного эксперимента с дилеммой заключенных. В следующем разделе вы узнаете об этом эксперименте и его уроках.

Стратегия равноценных ответных действий

В начале 1980-х годов политолог Мичиганского университета Роберт Аксельрод предложил специалистам по теории игр со всего мира разработать стратегии решения дилеммы заключенных в виде компьютерных программ. Они были распределены по парам, каждая из которых разыгрывала дилемму заключенных 150 раз. На основании набранных очков составили рейтинг программ, принимавших участие в турнире.

Победителем стал профессор математики университета в Торонто Анатолий Рапопорт. Его выигрышная стратегия оказалась одной из самых простых: «око за око, зуб за зуб». Для Роберта Аксельрода этот результат явился большой неожиданностью, поэтому он решил провести еще один турнир, увеличив число участников. Рапопорт и в этот раз подал программу, основанную на той же стратегии, – и снова победил.

Стратегия равноценных ответных действий – один из вариантов правила поведения «поступайте с другими так, как они поступают с вами»{52}52
В книге «Исход» (21:22–25) сказано: «Когда дерутся люди, и ударят беременную женщину, и она выкинет, но не будет [другого] вреда, то взять с [виновного] пеню, какую наложит на него муж той женщины, и он должен заплатить оную при посредниках; а если будет вред, то отдай душу за душу, глаз за глаз, зуб за зуб, руку за руку, ногу за ногу, обожжение за обожжение, рану за рану, ушиб за ушиб». Новый Завет проповедует поведение, основанное на принципах сотрудничества. В Евангелии от Матфея (5:38–39) сказано: «Вы слышали, что сказано: око за око и зуб за зуб. А Я говорю вам: не противься злому. Но кто ударит тебя в правую щеку твою, обрати к нему и другую». Таким образом, мы перешли от правила «Поступайте с другими так, как они поступают с вами» к золотому правилу: «И как хотите, чтобы с вами поступали люди, так и вы поступайте с ними» (Евангелие от Луки 6:31). Если бы люди всегда придерживались золотого правила, дилеммы заключенных просто не существовало бы. Если мыслить более широко, становится очевидным следующий вывод: хотя сотрудничество может снизить ваш выигрыш в той или иной игре, возможное вознаграждение в жизни после смерти может сделать эту стратегию целесообразной даже для эгоиста. Вы считаете, что загробной жизни нет? Пари Блеза Паскаля гласит: если действовать, опираясь на это предположение, последствия могут оказаться катастрофическими, поэтому лучше выбрать другой вариант.

[Закрыть]. Если говорить более точно, эта стратегия подразумевает сотрудничество на первом этапе, после чего повторяются действия, которые предпринял соперник на предыдущем этапе.

По мнению Роберта Аксельрода, стратегия равноценных ответных действий опирается на четыре принципа, которые должны присутствовать в любой эффективной стратегии для повторяющейся дилеммы заключенных: понятность, доброжелательность, возмездие и прощение. Стратегия равноценных ответных действий очень проста и понятна: сопернику нет необходимости долго размышлять над вашим следующим ходом или просчитывать его. В основе такой стратегии лежит доброжелательность: она никогда не инициирует обман. В этой стратегии есть элемент возмездия: она не оставляет обман безнаказанным. Кроме того, эта стратегия стимулирует прощение: участники игры не держат зла друг на друга слишком долго и готовы возобновить сотрудничество.

Одна из самых впечатляющих характеристик стратегии равноценных ответных действий состоит в том, что она показала лучшие результаты по итогам всего турнира, хотя и не победила (и не могла победить) ни одну из конкурирующих стратегий в прямом противостоянии с ними. В лучшем случае эта стратегия может только сравнять счет с соперником. Следовательно, если бы Аксельрод оценивал каждую игру по принципу «победитель получает все», стратегия равноценных ответных действий имела бы на своем счету только проигрыши и ничьи, а значит, не добилась бы победы по итогам всего турнира{53}53
Поскольку на каждого проигравшего приходится один победитель, это неизбежно приводит к тому, что у одного из участников соревнования окажется в итоге больше побед, чем поражений, а у других – больше поражений, чем побед. (Единственное исключение составляет ситуация, когда каждый поединок заканчивается вничью.)

[Закрыть].

Однако Аксельрод оценивал парные игры между компьютерными программами не по принципу «победитель получает все»: в его турнирах учитывался такой фактор, как готовность к сотрудничеству. Большое преимущество этой стратегии заключается в том, что она сближает соперников. В худшем случае эта стратегия может потерпеть поражение из-за одного предательства, но дальше – только ничья.

Стратегия равноценных ответных действий стала победителем этих соревнований именно потому, что стимулировала сотрудничество, не допуская при этом эксплуатации. Другие стратегии были либо слишком ориентированными на доверие и открытыми для эксплуатации, либо слишком агрессивными и побуждающими игроков выбивать друг друга из игры.

И все-таки мы считаем, что стратегия равноценных ответных действий – ошибочная. Малейший промах или неправильное толкование результатов приводят к полному провалу стратегии. Этот недостаток не был столь очевидным в искусственной среде соревнования между компьютерными программами, поскольку там просто исключались ошибки и неправильное толкование. Однако в случае применения этой стратегии в реальном мире ошибки и заблуждения неизбежны, а результат может оказаться катастрофическим.

Проблема стратегии равноценных ответных действий состоит в том, что обе стороны противостояния повторяют ошибки и заблуждения друг друга. Одна сторона наказывает другую за предательство, и это вызывает цепную реакцию. Соперник отвечает на наказание ответным ударом, который влечет за собой очередное наказание. В таком противостоянии может и не наступить момент, когда одна из сторон приняла бы наказание без ответного удара.

Предположим, Флад и Дрешер разыгрывают стратегию равноценных ответных действий. Поначалу ни один из них не идет на предательство, поэтому какое-то время все складывается хорошо. Затем, скажем, в 11-м раунде игры Флад по ошибке выбирает стратегию «предать» или останавливается на стратегии «сотрудничать», но Дрешер по ошибке считает, что Флад выбрал предательство. В любом случае Дрешер выберет в 12-м раунде ход «предать», но Флад выберет стратегию «сотрудничать», поскольку Дрешер выбрал сотрудничество в 11-м раунде. В 13-м раунде они поменяются ролями. Ситуация, когда один из игроков выберет сотрудничество, а другой – предательство, будет повторяться снова и снова до тех пор, пока очередная ошибка или заблуждение не восстановят сотрудничество между соперниками или не заставят каждого из них выбрать предательство.

Такие циклы или ответные удары часто наблюдаются во время реальных конфликтов между израильтянами и арабами на Ближнем Востоке, или между католиками и протестантами в Северной Ирландии, или между индусами и мусульманами в Индии. На границе между штатами Западная Вирджиния и Кентукки шла памятная вражда между Хэтфилдами и Маккоями. В художественной литературе тоже можно найти яркие примеры того, как такие действия могут привести к непрекращающемуся циклу ответных ударов, как в случае вражды между Грэнджерфордами и Шепердсонами в романе Марка Твена.

Да из-за чего же вышла ссора, Бак? Из-за земли?

– Я не знаю. Может быть.

– Ну а кто же первый стрелял? Грэнджерфорд или Шепердсон?

– Господи, ну почем я знаю! Ведь это так давно было.

– И никто не знает?

– Нет, папа, я думаю, знает, и еще кое-кто из стариков знает; они только не знают, из-за чего в самый первый раз началась ссора{54}54
Твен М. Приключения Тома Сойера и Гекльберри Финна / Пер. Нины Дарузес. – М.: НИГМА, 2013.

[Закрыть].

Стратегия равноценных ответных действий не предполагает возможности остановить этот порочный круг. Она слишком ориентирована на возмездие и недостаточно стимулирует прощение. В следующих версиях соревнований, которые устраивал Роберт Аксельрод, предусматривалась возможность ошибок и заблуждений; в итоге другие, более бескорыстные, стратегии показали свое превосходство над стратегией равноценных ответных действий{55}55
В 2004 году Грэм Кендалл из Ноттингемского университета организовал соревнование в честь двадцатилетия первого турнира, который провел Роберт Аксельрод. Победителем стала группа исследователей из Саутгемптонского университета. Группа из Саутгемптона предложила стратегию, состоящую из 60 элементов: 59 «воинов» и одной «королевы». Все эти программы начинались с одной и той же комбинации символов, для того чтобы программы могли узнавать друг друга. Стратегия была разработана таким образом, что программы-воины приносили себя в жертву, давая королеве возможность добиться успеха. Кроме того, программы-воины отказывались сотрудничать с программами-соперниками, чтобы сократить их счет. Иметь в своем распоряжении армию воинов, готовых пожертвовать собой, – это действительно один из способов увеличить свой выигрыш, однако этот способ ничего не говорит нам о том, как решить дилемму заключенных.

[Закрыть].

Здесь мы можем научиться чему-то даже у обезьян. В ходе одного эксперимента с хохлатыми тамаринами одной из обезьян давали возможность потянуть рычаг, чтобы другая могла достать пищу. Однако для того, чтобы потянуть рычаг, следовало приложить усилие. Теоретически каждой обезьяне было бы выгоднее ничего не делать, пока партнер тянет рычаг. Но тамарины научились сотрудничать, чтобы избежать возмездия. Их сотрудничество сохранялось до тех пор, пока одна из обезьян два раза подряд не совершила предательство. Эта стратегия представляет собой разновидность стратегии «зуб за зуб», а именно – «два зуба за зуб»[34]34
Результаты эксперимента описаны в статье: M. Keith Chen and Marc Hauser, “Modeling Reciprocation and Cooperation in Primates: Evidence for a Punishing Strategy,” Journal of Theoretical Biology 235, no. 1 (May 2005): 5–12. Видеозапись эксперимента можно посмотреть здесь: www.som.yale.edu/faculty/keith.chen/datafilm.htm.

[Закрыть].

Более поздние эксперименты

Дилемма заключенных стала объектом тысяч экспериментов с участием разного числа игроков, с повторениями и с другой трактовкой условий игры. Вот некоторые важные выводы, сделанные в ходе этих экспериментов[35]35
См. Camerer, Behavioral Game Theory, 46–48.

[Закрыть].

Первый и самый важный вывод состоит в том, что игроки выбирают стратегию сотрудничества достаточно часто, даже если два игрока попадают в одну пару только один раз. В среднем почти половина игроков отдают предпочтение сотрудничеству. Самое впечатляющее доказательство этого факта было получено в ходе проведения телевикторины Friend or Foe («Друг или враг») на канале Game Show Network. Командам из двух человек задавали достаточно простые вопросы. Деньги, полученные участниками за правильные ответы, уходили в «трастовый фонд»; за 105 эпизодов в таком фонде накапливалось от 200 до 16 400 долларов. Для того чтобы разделить эти деньги, двум участникам предстояло решить следующую дилемму.

Каждый игрок должен был написать на листе бумаги слово «друг» или «враг». Если оба написали «друг», деньги делились поровну. Если один игрок написал «враг», а другой – «друг», весь выигрыш получал тот, кто написал «враг». Но если оба игрока написали «враг», ни один из них не получал ничего. Что бы ни сделала другая сторона, каждый игрок мог получить минимум столько же, сколько его соперник (или даже больше), если бы он написал «враг», а не «друг». Тем не менее почти половина участников шоу писали слово «друг». Даже когда призовой фонд увеличивался, вероятность того, что игроки выберут сотрудничество, оставалась прежней. Люди были в равной степени готовы сотрудничать, когда на кону стояло три и пять тысяч долларов. К таким же выводам пришли в ходе исследований Феликс Оберхольцер-Джи, Джоэль Вальдфогель, Мэтью Уайт и Джон Лист[36]36
См. Felix Oberholzer-Gee, Joel Waldfogel, and Matthew W. White, “Social Learning and Coordination in High-Stakes Games: Evidence from Friend or Foe,” NBER Working Paper No. W9805, June 2003. Available at SSRN: http://ssrn.com/abstract=420319. См. также John A List, “Friend or Foe? A Natural Experiment of the Prisoner’s Dilemma,” Review of Economics and Statistics 88, no. 3 (2006): 463–471.

[Закрыть].

Если вы сомневаетесь, можно ли считать телевизионное шоу научным исследованием, обратите внимание на следующий факт: участникам телевикторины выплатили более 700 тысяч долларов. У этого эксперимента с дилеммой заключенных оказалось самое лучшее финансирование за всю историю экспериментов такого рода. Кроме того, по результатам викторины было сделано много важных выводов. Оказалось, что женщины в большей степени готовы идти на сотрудничество, чем мужчины: 53,7 процента (в первом сезоне – 47,5 процента). В первом сезоне участники шоу не имели возможности увидеть результаты других состязаний перед тем, как принимать решение. А вот во втором сезоне были оглашены результаты первых 40 эпизодов, что позволяло увидеть закономерность. Участники шоу учились на опыте своих предшественников. Если команда состояла из двух женщин, коэффициент сотрудничества повышался до 55 процентов, а когда в состав команды входили одна женщина и один мужчина, этот коэффициент падал до 34,2 процента. У мужчин в этом случае коэффициент сотрудничества тоже снижался до 42,3 процента. В целом готовность участников шоу сотрудничать уменьшалась на десять пунктов.

Когда группу участников эксперимента несколько раз разбивают по парам, каждый раз формируя новые пары, число людей, которые выбирают сотрудничество, со временем сокращается. Тем не менее это число не сводится до нуля; вместо этого формируется небольшая группа участников эксперимента, неизменно отдающих предпочтение сотрудничеству.

Если одна и та же пара играет в базовую игру с дилеммой заключенных много раз подряд, в большинстве случаев образуется весьма значительная последовательность взаимного сотрудничества; это продолжается до тех пор, пока один из игроков уже в самом конце серии игр не выберет стратегию предательства. Именно это произошло в ходе первого эксперимента с дилеммой заключенных. Как только Меррил Флад и Мелвин Дрешер придумали эту игру, они предложили двум своим коллегам сыграть в нее 100 раз[37]37
Подробное описание этого эксперимента можно найти здесь: Poundstone, Prisoner’s Dilemma, 8–9; and Sylvia Nasar, A Beautiful Mind, 118–119.

[Закрыть]. В 60 раундах игры оба участника выбрали стратегию сотрудничества. Длинный период взаимного сотрудничества продолжался с 83-го по 98-й раунд, пока в 99-м раунде один из игроков не выбрал стратегию предательства.

Если следовать строгой логике теории игр, то в действительности этого не должно было произойти. Если игра повторяется ровно 100 раз, она представляет собой серию игр с одновременными ходами, а значит, мы можем применить к ней логику обратных рассуждений. Определите, что произойдет в сотом раунде. Это последний раунд игры, поэтому предательство не может быть наказано в следующих раундах. В таком случае, согласно принципу доминирующей стратегии, оба игрока должны выбрать в последнем раунде стратегию предательства. Но как только принимается такое предположение, последним становится, по сути, 99-й раунд. Хотя игрокам предстоит еще один раунд, выбор стратегии предательства в 99-м раунде не может быть наказан в 100-м раунде, поскольку сделанный в этом раунде выбор предопределен. Следовательно, логика доминирующей стратегии применима и к 99-му раунду. Эти рассуждения можно продолжить до первого раунда. Однако в реальной игре, будь то в лаборатории или в реальном мире, игроки склонны игнорировать эту логику и пытаются извлечь выгоду из взаимного сотрудничества. Поведение, которое на первый взгляд может показаться иррациональным (отказ от доминирующей стратегии), оказывается правильным выбором при условии, что другие игроки ведут себя столь же иррационально.

Специалисты по теории игр предлагают следующее объяснение этого феномена. В этом мире есть люди, которые всегда поступают с другими так, как поступают с ними; такие люди готовы сотрудничать до тех пор, пока другие делают то же самое. Предположим, вы не принадлежите к числу этих достаточно милых людей. Если бы в игре с конечным числом повторений вы вели себя так, как того требует ваш тип личности, вы начали бы с обмана. Это раскрыло бы ваш характер другому игроку. Для того чтобы скрыть правду (хотя бы на какое-то время), вам придется вести себя достойно. Зачем вам делать это? Предположим, вы начнете игру, поступив порядочно. Если другой игрок не относится к тем, кто всегда платит той же монетой, он подумает, что вы, возможно, принадлежите к числу тех немногих людей, которых можно назвать порядочными. Временное сотрудничество может принести определенную выгоду, поэтому другой игрок, желая получить эту выгоду, попытается ответить на вашу порядочность тем же. Это пойдет на пользу и вам. Разумеется, при этом вы (так же, как и другой игрок) планируете перейти к стратегии предательства к концу игры. Тем не менее на начальном этапе игры вы оба можете поддерживать взаимовыгодное сотрудничество. Хотя каждый игрок ждет момента, когда удастся воспользоваться порядочностью другого, этот взаимный обман приносит пользу им обоим.

В ходе некоторых экспериментов вместо распределения испытуемых по парам и проведения серии игр с дилеммой заключенных организуется большая игра с участием всей группы. Мы хотим привести здесь особенно интересный и поучительный пример. Профессор Реймонд Батталио из Техасского сельскохозяйственно-машиностроительного университета организовал следующую игру с участием 27 студентов[38]38
Jerry E. Bishop, “All for One, One for All? Don’t Bet On It,” Wall Street Journal, December 4, 1986.

[Закрыть]. Все студенты, якобы владельцы гипотетических компаний, должны были решить (одновременно и независимо друг от друга, написав свое решение на листике бумаги), какой объем продукции будет выпускать их компании: 1, который поможет сохранить совокупное предложение на низком уровне, а цены – на высоком, или 2, который позволит получить дополнительный доход за счет других. В зависимости от числа студентов, которые выберут объем продукции 1, деньги будут выплачены им по следующей схеме:

На графике эта схема представлена в наглядном виде.

Игра построена таким образом, чтобы студенты, выбравшие 2 («предать»), всегда получали на 50 центов больше, чем студенты, выбравшие 1 («сотрудничать»), но чем больше студентов выбирают 2, тем меньше их совокупный выигрыш. Предположим, все 27 студентов начинают с выбора 1; в таком случае каждый из них получит по 1,08 доллара. А теперь представьте себе, что один из них переключается на вариант 2. В игре остается 26 студентов, выбравших 1; каждый из них получит по 1,04 доллара (на 4 цента меньше, чем по первоначальному плану), но студент, изменивший стратегию, получит 1,54 доллара (на 46 центов больше). Такое распределение выигрыша не зависит от первоначального числа студентов, намеревающихся выбрать 1, а не 2. В данном случае вариант 2 – это доминирующая стратегия. Каждый студент, который переключается со стратегии 1 на стратегию 2, увеличивает свой выигрыш на 46 центов, но в то же время сокращает выигрыш каждого из оставшихся 26 участников игры на 4 цента. Когда все участники игры начнут действовать эгоистично, пытаясь получить максимальный выигрыш, каждый из них получит по 50 центов. Если бы они могли успешно объединить свои усилия и выбрать такой образ действий, который свел бы их общий выигрыш к минимуму, каждый из них получил бы по 1,08 доллара. А как вы сыграли бы в эту игру?

Когда эта игра проводилась на практике (один раз без обсуждения в группе, другой раз с обсуждением, для того чтобы выработать согласованные действия), число студентов, которые были готовы сотрудничать и выбрали вариант 1, колебалось от 3 до 14. В последней игре, в которой студенты объединили свои усилия, их было 4. Совокупный выигрыш составил 15,82 доллара, что было на 13,34 доллара меньше, чем в том раунде игры, в котором студентам удалось договориться. «Я больше никогда в жизни не стану никому доверять!» – недовольно пробормотал студент, который больше всех выступал за согласованные действия. Но каким был его выбор? «Ну, я выбрал 2», – сказал он. Йоссариан понял бы его.

В современных экспериментах с играми в дилемму заключенных с несколькими участниками используется вариант, получивший название «игра со взносами в общий фонд». Каждому игроку предоставляется некая начальная сумма, скажем, 10 долларов. После этого он решает, какую часть этой суммы оставит себе и какую отдаст в общий фонд. Затем экспериментатор удваивает сумму, накопившуюся в общем фонде, и делит ее поровну между всеми участниками игры (как теми, которые сделали взнос в общий фонд, так и теми, которые оставили всю сумму себе).

Предположим, в группу входят четыре игрока: А, Б, В и Г. Независимо от действий других игроков, если А решит внести 1 доллар в общий фонд, после удваивания сумма в общем фонде увеличится на 2 доллара. Но 1,5 доллара достанется при этом игрокам Б, В и Г; сам игрок А получит всего 50 центов. Следовательно, игрок А потеряет еще больше денег, если увеличит взнос в общий фонд; напротив, он будет в выигрыше, если сократит размер этого взноса. И такая ситуация складывается независимо от того, какой взнос в общий фонд делают другие игроки (и делают ли они его вообще). Иными словами, для игрока А доминирующая стратегия состоит в том, чтобы не вносить в общий фонд ничего. То же самое верно и для игроков Б, В и Г. Согласно этой логике, каждый участник игры должен рассчитывать на то, что он сможет стать «безбилетником» – получить выгоду от действий других игроков, не делая никакого взноса в общий фонд. Если все четыре игрока будут придерживаться своей доминирующей стратегии, общий фонд останется пустым, а каждый участник игры просто сохранит свою первоначальную сумму 10 долларов. Если каждый попытается проехаться «зайцем», автобус так и не сдвинется с места. С другой стороны, если бы каждый игрок внес в общий фонд всю имеющуюся у него сумму – 10 долларов, после удваивания в фонде оказалось бы 80 долларов, а доля каждого игрока составила бы 20 долларов. Но у каждого из них свои мотивы в такой игре. В этом и состоит их дилемма.

Игра со взносами в общий фонд – это не только объект лабораторных экспериментов или теоретических изысканий; она разыгрывается в реальном мире в тех случаях социального взаимодействия, когда некое общее благо можно создать только благодаря добровольному вкладу членов группы, но доступ к нему нельзя запретить тем членам группы, которые не внесли свой вклад в общее дело. Такая ситуация складывается, например, в случаях борьбы с наводнениями или рационального использования природных ресурсов: дамбы или плотины невозможно построить так, чтобы паводковые воды затопляли поля только тех обитателей деревни, которые не принимали участия в строительстве противопаводковых сооружений. Что касается рационального использования газа и рыбных ресурсов, на практике просто невозможно в будущем не допускать к этим ресурсам тех, кто сверх меры потреблял их в прошлом. Именно это и создает дилемму в игре с участием нескольких игроков: каждый игрок испытывает соблазн уклониться от работы или не делать взнос в общий фонд, рассчитывая на получение выгоды от вклада других участников группы. Когда так рассуждают все игроки, результат совместных действий оказывается совсем небольшим или вообще отсутствует, что негативно сказывается на всей группе. Эта ситуация встречается настолько часто, что во всех областях социальной теории и социальной политики возникла потребность в глубоком понимании методов решения данной дилеммы.

Возможно, самый интересный вариант этой игры – когда игрокам предоставляется возможность наказывать тех, кто нарушает принятое по умолчанию социальное соглашение о сотрудничестве. Однако связанные с этим издержки должны взять на себя все участники. После того как игра со взносами в общий фонд завершена, информация о взносе каждого игрока доводится до сведения всех остальных. Затем проводится второй этап игры, в ходе которого каждый игрок может предпринять действия, направленные на сокращение выигрыша других игроков, но это обойдется ему в какую-то сумму (как правило, около 33 центов) на каждый доллар того сокращения, которое он выбрал. Иными словами, если игрок А решает сократить выигрыш игрока Б на три доллара, выигрыш игрока А сократится на один доллар. Деньги, высвободившиеся в результате такого сокращения, не передаются никому другому, а возвращаются в фонд экспериментатора.

Результаты этого эксперимента говорят о том, что его участники склонны наказывать нарушителей социальных договоренностей (так называемых социальных обманщиков), взыскивая с них значительную сумму денег. Перспектива наказания существенно увеличивает размер взносов в общий фонд на первом этапе игры. По всей вероятности, наказание – это эффективный способ достижения сотрудничества, который приносит пользу всей группе. Однако тот факт, что люди действительно прибегают к этому методу, кажется неожиданным только на первый взгляд. Наказание других за свой счет – это уже вклад в общее благо. Это доминируемая стратегия, но если она стимулирует обманщика вести себя лучше в будущем, это приносит пользу всей группе, а наказавший получает только малую долю от этой выгоды. Следовательно, наказание должно быть следствием чего-то большего, чем сугубо эгоистический расчет. И это действительно так. В ходе ряда экспериментов проводилась позитронно-эмиссионная томография мозга игроков[39]39
Об этом идет речь в статье Thomas Hayden, “Why We Need Nosy Parkers,” U.S. News and World Report, June 13, 2005. Более подробную информацию можно найти здесь: D. J. de Quervain, U. Fischbacher, V. Treyer, M. Schellhammer, U. Schnyder, and E. Fehr, “The Neural Basis of Altruistic Punishment,” Science 305, no. 5688 (August 27, 2004): 1254–1258.

[Закрыть]. Оказалось, что применение наказания активизирует дорсальный стриатум – участок головного мозга, который отвечает за удовольствие и удовлетворенность. Иными словами, люди действительно получают психологическую выгоду или удовольствие, наказывая нарушителей коллективных договоренностей. По всей вероятности, этот инстинкт имеет глубокие биологические корни и прошел процесс отбора потому, что обеспечивает эволюционное преимущество[40]40
В своей книге «Страсти в пределах разумного» (Passions Within Reason. New York: W. W. Norton, 1988) экономист Корнелльского университета Роберт Фрэнк утверждает, что эмоции, в частности чувство вины и любовь, тоже эволюционировали, а социальные ценности, такие как доверие и честность, были сформированы и закреплены в качестве противовеса преходящей склонности человека к обману себе подобных, а также для того, чтобы обеспечить долгосрочные преимущества сотрудничества. А Роберт Райт в книге «Игра с ненулевой суммой» (Nonzero. New York: Pantheon, 2000) развивает идею о том, что механизмы, обеспечивающие взаимовыгодные результаты в игре с ненулевой суммой, во многом объясняют культурную и социальную эволюцию человека.

[Закрыть].

Назад к карточке книги "Теория игр. Искусство стратегического мышления в бизнесе и жизни"