355 500 произведений, 25 200 авторов.

Электронная библиотека книг » Дэвид Самптер » Десять уравнений, которые правят миром. И как их можете использовать вы » Текст книги (страница 2)
Десять уравнений, которые правят миром. И как их можете использовать вы
  • Текст добавлен: 17 марта 2022, 09:31

Текст книги "Десять уравнений, которые правят миром. И как их можете использовать вы"


Автор книги: Дэвид Самптер



сообщить о нарушении

Текущая страница: 2 (всего у книги 3 страниц)

Поскольку результатом матча была победа Испании, прогноз на победу в 77 % лучше, чем прогноз букмекеров, который давал 73 %.

Но здесь есть проблема. Если я увеличу β, то повышу и прогнозируемую вероятность победы Англии над Уругваем – с 51 до 52 %. Но Англия в том матче 2014 года уругвайцам проиграла. Чтобы справиться с этой проблемой, я могу увеличить другой параметр, назначив α = 1,1 и оставив при этом β = 1,2. Теперь уравнение предсказывает, что Испания обыграет Австралию с вероятностью 75 %, а Англия обыграет Уругвай с вероятностью 49 %. Изменив исходные значения α = 1 и β = 1, мы улучшили прогноз на оба матча.

Я рассмотрел по одному изменению каждого из параметров α и β и сравнил результаты всего по двум матчам. Данные Яна включали 284 матча на всех чемпионатах мира и Европы с 2006 года. Потребовалось бы очень много времени, чтобы вручную менять значения параметров, подставлять их в уравнение и смотреть, улучшают они прогноз или нет. Однако мы можем использовать для вычислений компьютерный алгоритм; именно это и делает логистическая регрессия (см. рис. 1). Она меняет значения α и β так, чтобы дать прогнозы, которые максимально близки к реальным результатам матчей.


Рис. 1. Иллюстрация того, как логистическая регрессия дает оценки α = 1,16 и β = 1,25

Я написал программу на языке Python, которая выполняет все эти вычисления. Запустил ее и смотрел, как она справляется со всеми этими расчетами. Через несколько секунд у меня был результат: наилучшие прогнозы получались при α = 1,16 и β = 1,25.

Эти числа сразу привлекли мое внимание. Сам факт, что оба параметра α = 1,16 и β = 1,25 превосходят 1, показывал сложную связь между коэффициентами и исходами матчей. Проще всего понять эту связь путем добавления к нашей таблице еще одной колонки и сравнения нашей модели логистической регрессии с прогнозами букмекеров.


Здесь мы видим проявление известного опытным игрокам феномена с недооценкой записных фаворитов вроде Испании. Коэффициенты, которые букмекеры устанавливают для таких команд, как правило, занижены, поэтому на них стоит ставить. А более слабые фавориты, вроде Англии в 2014 году, бывают переоценены: их шансы на победу не так высоки, как предполагают коэффициенты. Хотя такие различия между прогнозами и моделью малы, мы с Яном и Мариусом знали, что их достаточно, чтобы получить прибыль.

Мы нашли небольшое преимущество для чемпионата мира. Еще не зная, будет ли это преимущество, замеченное на предыдущих чемпионатах, работать на новом турнире, мы были готовы рискнуть незначительной суммой. Чтобы реализовать систему ставок на основании моего уравнения, хватило времени до обеда. Мы нажали «Запуск» и привели систему в действие. В течение всего чемпионата мира наши ставки размещались автоматически.

После обеда вернулись ко мне домой. Мы с Мариусом уселись смотреть игру Уругвая с Египтом. Ян достал ноутбук и начал скачивать коэффициенты для тенниса.

* * *

Уравнение ставок – это не только один чемпионат мира и даже не только зарабатывание денег на букмекерах. Его настоящая сила в том, что оно заставляет нас смотреть в будущее с точки зрения вероятностей и исходов. Использование уравнения ставок означает следующее: надо отказаться от догадок и навсегда забыть идею, что результат футбольного матча, скачек, финансовой инвестиции, собеседования при приеме на работу или даже романтического свидания можно предсказать со стопроцентной уверенностью. Вы не можете знать наверняка, что произойдет.

Большинство из нас смутно осознают, что события в будущем во многом определяются случайностью. Когда прогноз погоды говорит, что завтрашний день будет солнечным с вероятностью 75 %, не следует слишком сильно удивляться, если по дороге на работу вы попадете под ливень. Однако нахождение небольших преимуществ, скрытых в вероятностях, требует более глубокого понимания.

Если для вас важен конкретный результат, то подумайте, с какой вероятностью он реализуется, а с какой нет. Недавно я разговаривал с CEO одного очень успешного стартапа, который вырос за счет четырех этапов многомиллионных долларовых инвестиций и в котором работает сотня сотрудников, и он радостно признавал, что шансы на долговременную прибыль для него самого и его инвесторов по-прежнему всего лишь 1 из 10. Он самоотверженно и долго работал, но сознавал, что все может внезапно развалиться.

При поиске работы мечты или любви всей жизни шансы на успех при каком-нибудь конкретном заявлении на работу или свидании могут быть весьма малы. Меня часто удивляет, что люди, не прошедшие собеседования, ругают себя за то, что поступили неверно, а не учитывают, что, возможно, в этот день кто-то из других четырех кандидатов сделал все верно. Помните, что до появления на собеседовании ваши шансы составляли 20 %. Пока вы не провалите примерно пять собеседований, нет особых причин беспокоиться о каком-то конкретном результате[11]11
  Даже после пяти неудачных попыток вам не следует слишком отчаиваться. Если вероятность успеха на одном собеседовании составляет 1/5, вероятность того, что вам придется пройти минимум 5 собеседований, чтобы получить какую-то работу, составляет 1 – (1–1/5)5 = 67 %.


[Закрыть]
.

Вводить числа в романтику труднее, но здесь применимы те же вероятностные принципы. Не ждите, что на вашем первом свидании в Tinder появится принц или принцесса, но если вы сидите в одиночестве после неудачного свидания номер 34, то полезно поразмыслить над своим подходом.

Определив соответствующие вероятности, подумайте, как они соотносятся с размером ваших инвестиций и потенциальных прибылей. Мой совет мыслить вероятностно не попытка призвать к кармическому спокойствию или внимательности. CEO с шансами на успех один из десяти располагал бизнес-идеей, которая потенциально могла дать результат, подобный Uber или Airbnb: создать компанию стоимостью 10 миллиардов долларов. Даже десятая часть от этой суммы – миллиард, и это огромная ожидаемая прибыль.

Вероятностное мышление поможет вам быть реалистом перед лицом шансов, которые часто обращаются против вас. В скачках и футболе наивные игроки нередко переоценивают маловероятные события, но в реальной жизни мы склонны их недооценивать. Мы по природе осторожны и избегаем рисков. Помните, что награда после того, как вы получите действительно желательную работу или любимого человека, будет колоссальной. Это означает, что нужно быть готовым пойти на большой риск ради достижения цели.

* * *

Математика требует работы и упорства. Пять минут назад я закончил читать одну из самых примечательных работ в истории прикладной математики – статью, которая буквально стоит миллиард долларов. Я знал, что математика здесь важна, но, добравшись до уравнений, решил, что читать стало гораздо труднее. В первый раз я пропустил их, сказав себе, что вернусь к деталям позже, и перешел к интересным фрагментам.

Речь о статье Уильяма Бентера «Компьютерные системы прогнозирования и размещения ставок на скачках: отчет»[12]12
  Benter W. Computer based horse race handicapping and wagering systems: a report // D. B. Hausch, V. S. Y. Lo, W. T. Ziemba, eds. Efficiency of Racetrack Betting Markets. Revised edn. Singapore: World Scientific Publishing Co. Pte Ltd, 2008. Pp. 183–198.


[Закрыть]
. Это своеобразный манифест, декларация о намерениях. И это работа человека, одержимого строгостью и верой в то, что он делает, который документировал свой план, прежде чем взялся его реализовывать, – чтобы показать всему миру, что он побеждает благодаря не удаче, а математической уверенности.

В конце 1980-х Уильям Бентер решил обыграть тотализатор скачек в Гонконге. До того как он начал свой проект, азартная игра с высокими ставками была уделом темных личностей, которые шлялись по ипподромам «Хэппи-Вэлли» и «Сатхинь» и по Гонконгскому жокей-клубу, пытаясь собрать инсайдерскую информацию у владельцев, персонала конюшен и тренеров. Они выясняли, завтракала лошадь или нет и была ли у нее дополнительная тайная тренировка. Они сходились с жокеями и расспрашивали их о стратегии в будущих скачках.

Будучи американцем, Бентер был в этом мире посторонним, однако он нашел другой способ получить инсайдерскую информацию – тот, который жучки упустили, хотя он прятался прямо здесь, в помещениях жокей-клуба. Бентер собрал копии справочников-ежегодников с результатами забегов и нанял двух женщин, чтобы вводить эти данные в компьютер. Затем было то, что журнал Bloomberg Businessweek назвал прорывом. Он взял коэффициенты ставок, также имевшиеся в жокей-клубе, и их оцифровал. Именно они позволили Бентеру применить метод, аналогичный тому, что я показывал Яну и Мариусу: использовать уравнение ставок. Это был ключ к нахождению неточностей в предсказаниях игроков и прогнозистов[13]13
  Модель работала и без этих старых коэффициентов (по сути, вычисляла коэффициенты с нуля) и даже давала небольшую прибыль. Однако главную выгоду принесло именно сочетание коэффициентов и корректирующего их алгоритма.


[Закрыть]
.

Бентер на этом не остановился. В основном уравнении, представленном выше, я ограничился выявлением ошибок в букмекерских коэффициентах для футбола. Теперь, при втором или третьем чтении его статьи, я начал понимать, как Бентер оказывался с прибылью за такой долгий промежуток времени. В своей модели я не рассматривал никаких дополнительных факторов, которые помогали бы мне прогнозировать результат матча. Но Бентер делал все возможное и невозможное. Его быстро разраставшиеся данные включали прошлые выступления, возраст лошади, вклад жокея, стартовый номер, местную погоду и множество других факторов. Каждый из них постепенно вносил свой вклад в уравнение ставок. По мере того как он включал все больше подробностей, точность его логистической регрессии и, соответственно, прогнозов увеличивалась. После пяти человеко-лет ввода данных модель была готова, и Бентер начал играть на скачках на ипподроме «Хэппи-Вэлли» с капиталом, заработанным в казино[14]14
  Бентер входил в состав команды, игроки которой отслеживали все вышедшие карты и за счет этого контролировали вероятность появления следующей карты. Команда получала крохотное преимущество, которого хватало, чтобы заработать. Однако в итоге Бентер с коллегами попали в черный список, и им было запрещено появляться в казино.


[Закрыть]
.

За первые два месяца игры Бентер получил 50 % прибыли от инвестиций, но еще через два месяца она исчезла. В течение двух следующих лет прибыли Бентера прыгали вверх и вниз – то взлетая до 100 %, то падая почти до нуля. Примерно через два с половиной года модель действительно начала окупаться[15]15
  Модель стала всерьез окупаться как раз тогда, когда Бентер учел коэффициенты ставок.


[Закрыть]
. Прибыли поднялись до 200, 300, 400 % и далее росли экспоненциально. Бентер сообщил Bloomberg Businessweek, что в сезоне 1990/91 выиграл 3 миллиона долларов[16]16
  Chellel K. The gambler who cracked the horse-racing code // Bloomberg Businessweek, 3 May 2018 // bloomberg.com/news/features/2018-05-03/the-gambler-who-cracked-the-horse-racing-code.


[Закрыть]
. То же издание оценивало, что за следующие два десятилетия Бентер и его немногочисленные конкуренты, использовавшие те же методы[17]17
  Крупным игроком на гонконгских ипподромах был бывший партнер Бентера по играм в казино Алан Вудс, с которым тот поссорился в первые годы работы над моделью. В итоге они использовали разные модели и ставили по отдельности (хотя часто привлекали одних и тех же людей в качестве помощников – такие ставки требовали участия множества людей).


[Закрыть]
, заработали на ипподромах Гонконга свыше миллиарда долларов[18]18
  Сам Бентер соглашается с суммой около миллиарда, но говорит, что существенная часть денег ушла его партнерам в Гонконге и США.


[Закрыть]
.

Самым примечательным в научной статье Бентера было не содержание, а то, что ее мало кто прочитал. За 25 лет после публикации в других научных журналах на нее сослались всего 92 раза. Для сравнения: когда я 15 лет назад написал статью, как муравьи рода Temnothorax выбирают новое жилье, на нее сослались 351 раз.

Игнорируется не только статья Бентера. Он ссылается на публикацию Рут Болтон и Рэндалла Чепмена 1986 года, называя ее «обязательным чтением» для его собственной работы[19]19
  Bolton R. N., Chapman R. G. Searching for positive returns at the track: a multinomial logit model for handicapping horse races // Management Science. 1986. August. Vol. 32. No. 8. Pp. 1040–1060.


[Закрыть]
. Однако прошло почти 35 лет, а эта вдохновенная статья, показывающая, как можно получать деньги на американских ипподромах с помощью уравнения ставок, также цитировалась менее 100 раз.

У Бентера не имелось образования в области высшей математики[20]20
  Он покинул колледж ради игры в казино.


[Закрыть]
, но он был готов делать то, что требовалось. Его описывали как гения, но я так не считаю. Я знаком со многими нематематиками и негениями, которые настойчиво изучали те же статистические методы, что использовал Бентер. Обычно это не игроки. Это биологи, экономисты и социологи, которые используют статистику для проверки гипотез. Но они нашли время, чтобы понять математику.

Я никогда не улавливаю математические рассуждения при первом чтении. И я видел очень мало профессиональных математиков, которые могли бы прочитать и усвоить уравнения, не возвращаясь потом к ним детально. А именно в деталях и кроются секреты.

* * *

Самая большая угроза для любого тайного общества – раскрытие. Современная версия заговора иллюминатов, которая рисует технически подкованных правителей мира, требует, чтобы абсолютно все участники общества молчали о его целях и методах. Если хотя бы один поделится кодом или разгласит планы общества, вся система окажется под угрозой.

Эта опасность раскрытия – главная причина, почему большинство ученых не верят в существование организаций, подобных иллюминатам. Контроль за всей человеческой деятельностью потребует большого общества и масштабной секретности. Риск того, что кто-нибудь расколется и все расскажет, крайне велик.

Однако когда мы погружаемся в уравнение ставок, то видим, что секрет «Десятки» скрыт у всех на виду. Только когда члены общества упорно учатся, он медленно открывается тем, кто его ищет. Этому коду учат во всех школах, а затем в университетах, но мы не понимаем, что мы изучаем. Члены общества лишь смутно осознают, что они участники этого обширного заговора. Они чувствуют, что им нечего раскрывать, нечего признавать и нечего прятать.

Когда молодой перспективный участник «Десятки» читает научную статью Бентера второй и третий раз, он заставляет себя понять ее правильно. Он начинает ощущать связь, простирающуюся на десятилетия и столетия. Бентер, несомненно, чувствовал ее, когда читал работу Рут Болтон и Рэндалла Чепмена. А те до него испытывали то же чувство, когда изучали статью Дэвида Кокса, который предложил в 1958 году логистическую регрессию, ставшую основой их работы. Связь, выкованная математикой, тянется в историческое прошлое, через Мориса Кендалла и Роналда Фишера, работавших между мировыми войнами, и до первых идей о вероятности, высказанных Абрахамом де Муавром и Томасом Байесом в Лондоне XVIII века.

По мере углубления в детали наш юный последователь видит, как перед ним шаг за шагом раскрываются все секреты. Бентер записал истоки своего успеха в коде уравнений. И теперь, спустя 25 лет, можно постепенно разобрать этот успех – один алгебраический символ за другим.

Именно математика, общий интерес к этому уравнению, объединяет нас в пропасти времени и пространства. Как и Бентер до него, наш юный ученый начинает исследовать красоту размещения ставки не с помощью ощущений, а на основании статистической взаимосвязи данных.

* * *

Можно объяснить идею, которая стоит за разработанной нами с Яном и Мариусом стратегией ставок, даже без уравнений, одной фразой: мы обнаружили, что коэффициенты открытия для чемпионата мира (те, которые букмекеры предлагают задолго до начала матча) можно использовать для более точного прогнозирования результатов, чем коэффициенты закрытия (те, которые букмекеры предлагают прямо перед матчем).

Это наблюдение противоречит интуиции. Когда букмекеры устанавливают свои коэффициенты, до начала игры может произойти много неопределенных событий. Травма ведущего игрока (это случилось с Мохаммедом Салахом из сборной Египта), плохая форма целой команды (за несколько недель до чемпионата мира Франция сыграла вничью с командой США), смена тренера в последний момент (как произошло со сборной Испании). Теоретически для отражения всех таких событий коэффициенты должны меняться: если Испания внезапно уволит своего тренера, ее шансы на победу над Португалией упадут.

Коэффициенты действительно меняются, но при этом они скорее не отражают новую реальность, а завышаются. По мере приближения матча на рынке появляются игроки-любители, которые пытаются спрогнозировать результаты матчей, и коэффициенты букмекерских компаний меняются, чтобы отразить их ставки. Например, коэффициенты на победу Франции над Перу увеличились с 2/5 до 1/2 до их матча на групповой стадии турнира. Возможно, некоторые игроки полагали, что если Франция не смогла обыграть США в товарищеском матче, то Перу заработает одно очко, а то и три. Другие любители, несомненно, читали в газетах критику в адрес звездного полузащитника Поля Погба и начали сомневаться в его способностях привести сборную своей страны к успеху. Какими бы ни оказались причины, это был именно тот сценарий, который – как установила наша модель – давал удачные ставки на предыдущих чемпионатах мира. Когда коэффициенты на записных фаворитов повышаются, выгодно их поддержать. Наша автоматизированная система обнаружила такое их изменение, активировала функцию ставки и поставила 50 фунтов на Францию. После матча мы получили 75 фунтов. Просто и эффективно.

Важный навык для специалистов по прикладной математике – объяснить логику в основе используемых моделей. Когда мы с Мариусом после запуска модели смотрели футбол, то обсуждали, почему по мере приближения к чемпионату мира коэффициенты становятся менее точными.

– Большинство наших стратегий основано на идее, что к матчу коэффициенты становятся гораздо точнее, – сказал он. – С чемпионатом мира должно быть что-то особенное.

– Большой объем ставок, – предположил я. – По телевизору сплошной футбол, интересно попробовать. Одни ставят деньги на свою страну из национальной гордости, другие – против какой-то страны.

Мариус согласился. Чемпионат мира дал футболу новую аудиторию, она не может устоять перед искушением поставить деньги на своих любимцев. По нашим прикидкам, верные английские фанаты считают, что было бы здорово заработать немного за счет французов. Мы подумали, как аргентинцы и немцы ставили на Швейцарию, игравшую свой первый матч с Бразилией. Когда на аутсайдеров хлынули деньги, букмекеры увеличили коэффициенты для фаворитов, и наша модель, пойдя против толпы, оказалась выгодной. Не каждый матч давал нам выигрыш (бразильцы неожиданно сыграли со швейцарцами вничью), но история показала, что ставка на серьезных фаворитов прямо перед началом игры, вероятнее всего, приносит прибыль.

Пристрастие любителей ставить на маловероятные события было только частью нашей модели. Уравнение давало более тонкие прогнозы: значения α = 1,16 и β = 1,25 говорили, что в случае не совсем явного фаворита нам нужно, наоборот, поддержать аутсайдера – как в 2014 году, когда Англия проиграла Уругваю. Хорошим примером такого прогноза был матч между Колумбией и Японией. За дни перед ним коэффициенты на победу Колумбии выросли с 7/10 до 8/9. Подставив эти числа в наше уравнение, можно прийти к выводу, что стоит поставить на Японию. Не потому, что у нее было больше шансов на победу в матче (фаворитом по-прежнему оставалась Колумбия), просто уравнение говорило, что теперь на Японию, коэффициенты для которой стали 26/5, ставить выгоднее. И мы оказались правы: Колумбия проиграла, а мы заработали 260 фунтов, поставив 50.

* * *

Сэру Дэвиду Коксу сейчас 95 лет, и он никогда не прекращал трудиться. За свою 80-летнюю карьеру Кокс написал 317 научных работ, и очень вероятно, что напишет еще. В своем офисе в Наффилд-колледже в Оксфорде он продолжает писать комментарии и обзоры современной статистики, а также вносить новый вклад в эту область.

Я спросил его, каждый ли день он появляется в офисе.

– Не каждый, – ответил Дэвид. – В субботу и воскресенье не появляюсь.

Затем сделал паузу и поправился:

– Точнее, вероятность того, что я приду на работу в субботу или в воскресенье, отлична от нуля. Такое может произойти.

Сэр Дэвид Кокс любит точность. Его ответы на мои вопросы были осторожными и обдуманными; математик всегда оговаривал уровень уверенности в своей способности дать ответ.

Именно Кокс открыл уравнение ставок. Сам он, правда, никогда бы так не выразился, и это в любом случае не совсем верно. Точнее было бы сказать, что он разработал теорию логистической регрессии, которую я использовал для нахождения α и β, а Бентер – для определения факторов, влияющих на исход скачек[21]21
  Cox D. R. The regression analysis of binary sequences // Journal of the Royal Statistical Society: Series B (Methodological). 1958. Vol. 20. No. 2. Pp. 215–232.


[Закрыть]
. Дэвид Кокс разработал статистический метод, благодаря которому уравнение ставок дает точные прогнозы.

Логистическая регрессия была продуктом послевоенной Британии. К финалу Второй мировой войны Дэвид закончил изучать математику в Кембридже, и его направили на работу в королевские ВВС. Затем он перешел в текстильную промышленность, поскольку в Великобритании начался процесс восстановления[22]22
  В обоих случаях – в исследовательские организации.


[Закрыть]
. Кокс рассказал мне, что изначально его интересовала чистая математика, которую он изучал, но такая работа привлекла его внимание к новым задачам. «Текстильная промышленность была полна увлекательных математических проблем», – сказал он.

Сэр Дэвид признавал, что смутно помнит детали, но лучился энтузиазмом, говоря о тех временах. Он рассказал, как можно использовать тесты для различных характеристик материалов, чтобы определить вероятность их разрушения, и о проблемах, связанных с созданием более прочного и более однородного конечного продукта из грубо пряденой шерсти. Кроме того, в ВВС он столкнулся с задачами, касавшимися частоты аварий и аэродинамики крыла. Это также дало ему много пищи для размышлений.

Именно из таких практических соображений у Дэвида Кокса зародился более общий, математический вопрос: каким образом лучше всего прогнозировать, как разные факторы (скорость ветра или напряжения в материале и другие) могут повлиять на что-то – например, на авиационную катастрофу или на то, порвется ли одеяло. Это вопрос того же типа, который Бентер задавал о лошадях: как зависит вероятность победы четвероногого от истории его прошлых выступлений и от погоды.

– Когда я создавал эту теорию [в середине 1950-х], самые серьезные разногласия в университетах касались анализа медицинских и психологических данных, предсказания того, как разные факторы связаны с медицинским результатом, – рассказывал Кокс. – Логистическая регрессия возникла в результате синтеза моего практического опыта и математического образования. Все известные мне проблемы медицины, психологии и промышленности можно было решить с помощью одного семейства математических функций.

Это семейство оказалось гораздо полезнее, чем предполагал даже сам ученый. Начиная с промышленности 1950-х, когда логистическая регрессия играла важную роль в интерпретации результатов медицинских исследований, она успешно применяется к бесчисленным математическим задачам. Именно этот подход использует Facebook, чтобы определить, какую рекламу нам показать, а Spotify – чтобы рекомендовать нам музыку. Он же стал частью системы идентификации пешеходов в автомобилях без водителей. И конечно, он используется в азартных играх…

Я спросил у сэра Дэвида, знает ли он об успехах Бентера в применении логистической регрессии к скачкам. Он не слышал. Тогда я поведал ему, как логистическая регрессия принесла миллиард долларов, а также об оксфордском студенте Мэттью Бенхэме и его успехе в предсказании результатов футбольных матчей.


    Ваша оценка произведения:

Популярные книги за неделю