Текст книги "Невероятно – не факт"
Автор книги: Александр Китайгородский
Жанр:
Математика
сообщить о нарушении
Текущая страница: 6 (всего у книги 17 страниц)
А теперь о погоде
Вряд ли есть радиопередача, пользующаяся большей популярностью, чем сообщение о погоде. Хорошая погода для человека – это залог хорошего настроения. Ведь план ближайшего дня иногда сильно зависит от погоды, не говоря уже о планах отпуска.
Прогноз погоды слушают внимательно: негодуют, когда он не выполняется, радуются удачам метеорологов.
Метеостанции, раскиданные по всем уголкам земного шара, ведут систематические наблюдения за погодой уже много десятков лет. Ими накоплен огромный материал о температуре воздуха и почвы, об облачности и ветре, о давлении и количестве осадков. Хотите узнать, какая температура воздуха была в 10 часов утра 12 июля 1927 года в городе Ефремове? Пожалуйста, порывшись в архивах, вы найдёте эти сведения. Все они обрабатываются по тем правилам, которые мы обсуждали.
Для каждого элемента погоды построены самые разные кривые распределения. Ведь не угадаешь наперёд, какие случайные величины заинтересуют специалиста, планирующего сельскохозяйственные работы, и курортника, интересующегося погодой в прогулочных целях. В метеорологических справочниках приведены средняя годовая температура, средняя месячная температура, средняя максимальная температура (для каждого дня всегда отмечается верхняя отметка, до которой добиралась ртуть термометра), средняя минимальная температура… Все эти величины подвержены беспорядочным (и систематическим) колебаниям. Поэтому интересны средние отклонения от средних значений для всех этих величин.
В этом году я собираюсь поехать встречать Новый год в Сухуми или Гагру. Перед принятием такого решения я выписал из библиотеки справочник по климату и с нудной дотошностью учёного деятеля стал анализировать данные о погоде этих мест.
Оказалось, что у меня есть шансы попасть в настоящую жару. В городе Сухуми в январе был однажды зафиксирован абсолютный максимум температуры в 24 градуса. Вспомнив, о чём писал на предыдущих страницах, я решил не полагаться на мизерную вероятность повторения такой температуры в эту зиму и в соответствующей таблице нашёл «средний из абсолютных максимумов». (Это вот что такое. Каждый год отмечается максимальная температура января, февраля и т.д. «Среднее», о котором говорится, было выведено чуть ли не за 100 лет.) «Средний абсолютный максимум» оказался равен 18 градусам. А на такую температуру, хотя бы в течение одного-двух дней, уже можно рассчитывать даже невезучему субъекту. Восемнадцать градусов в тени – этого совершенно достаточно, чтобы с полным наслаждением загорать; а загорать на солнце в январе – это совершенно превосходно. Значит, беру отпуск в январе.
Но, скажет внимательный читатель, знание одного лишь среднего значения абсолютных максимумов совершенно недостаточно, чтобы судить о вероятности события. Ведь нормальная кривая может быть очень плоской, колокол может быть невысоким, и тогда вероятность среднего будет невелика.
Правильно. Такие 18 градусов – сомнительный залог блаженства. Я продолжаю листать справочник и нахожу то, что требуется. Другая таблица даёт значение «среднего отклонения» «средней максимальной температуры» от «многолетнего среднего январского»: это 2 градуса. («Среднее отклонение» – это ещё одна характеристика ширины кривой нормального распределения. Полуширина кривой, с которой мы подробно знакомили читателя, немного больше «среднего отклонения».)
Как получены эти 2 градуса? Предположим, в 1900 году средняя январская температура равнялась 15 градусам, в 1901 году – 14, в 1902 – 18, в 1903 – 20, в 1904 – 17 и т.д. Поместив рядом, в следующей графе таблицы, абсолютные отклонения от среднего (то есть от 18 градусов), получим для 1900 года – 3, 1901 – 4, 1902 – 0, 1903 – 2, 1904 – 1 и т.д. Теперь остаётся сложить эти цифры за все годы наблюдений и разделить на число лет. Так были получены эти 2 градуса.
Добыв «среднее отклонение», я значительно прояснил условия проведения своего отпуска. То есть могу достаточно смело рассчитывать на то, что встречусь с такими днями, когда температура будет лежать в пределах 16—20 градусов. Ну а будут ли отклонения от 18 градусов больше 2? Возможно. Но если температура не поднимается выше 14 градусов (отклонение в два раза больше среднего), то я буду считать, что мне не повезло. Если же за месяц пребывания в Сухуми столбик термометра не пересечёт 12 градусов – это уже редкостное невезение, и старожилы скажут, что такого они не помнят.
На этом можно было бы закончить разговор о метеорологических исследованиях, но я засомневался в его исчерпывающей полноте. Наши рассуждения насчёт вероятности отклонений справедливы в том случае, если распределение температуры подчиняется нормальному гауссову закону. А подчиняется ли оно на самом деле? Данные о «среднем значении» и о «среднем отклонении» от среднего – это хорошо, а «полная кривая распределения» всё-таки лучше. Какова она?
Составители справочника предусмотрели и такой запрос и привели данные для построения многолетней средней кривой распределения максимальных температур января. Согласно этим данным ниже нуля температура в январе не наблюдалась ни разу. В среднем 2,2 дня в январе имеют температуру между 0 и 5 градусами (можно сказать и так: вероятность температуры между 0 и 5 градусами в январе в городе Сухуми равняется 2,2/31, то есть 0,07 (семь процентов шансов). Температура между 5 и 10 градусами наблюдалась в среднем в течение 11,3 дня января; между 10 и 15 градусами – 12,4 дня; между 15 и 20 – 4,7 и, наконец, между 20 и 25 градусами – 0,4 дня. Я построил кривую и увидел, что все в порядке – получилась нормальная колоколообразная кривая.
Дни с температурой выше 10 градусов (в Москве в это время мороз и заносы) я считаю превосходной погодой: можно загорать, купаться, ходить на водных лыжах, кататься на катере. А таких дней в среднем за месяц будет 17,5, то есть больше половины. Значит, вероятность хорошей погоды одна вторая: орёл или решка? Можно рискнуть – взять отпуск в январе и поехать загорать в Сухуми.
Итак, вы видите, что справочник по климату может великолепно служить руководством к действию: при его помощи можно делать определённые прогнозы. Некоторые предсказания оказываются почти категорическими: в январе в Сухуми температура ниже 0 не опускается, до плюс 12 в какие-то дни она повысится непременно и т.д. Менее решительные суждения могут быть сформулированы в виде предположений. И кой-какие прогнозы можно делать и без глубоких соображений. Разумеется, носят они вероятностный характер, но сохраняют этот характер и в том случае, когда их делают специалисты.
* * *
– Это ни на что не похоже, – сказала она тоскливо. – Пропал весь отпуск. Дождь и дождь не переставая. Сколько можно! А ещё говорят, что этот месяц обычно не очень дождливый.
– Старожилы говорят, что такого не помнят, – сказал он. – Аномалия. Не повезло. А что сказало бюро погоды?
– Обещают на завтра такую же погоду, как сегодня, – и после паузы: – Слушай, давай уедем, чёрт с ними, с путёвками.
– Не угадаешь. Уедешь, и как раз дожди кончатся. Хоть бы наука помогла. Вычислить вероятность продолжения дождей, что ли, а потом решить?
– Разве можно такие вещи вычислять? – с недоверием спросила она. – А потом… ну, допустим, вычислишь, получишь 30 процентов за дождь, а 70 против. Решим остаться и… проиграем. При 70 проиграть не так уж трудно.
Честно говоря, я не решился бы дать совет этой паре. Проиграть не так уж трудно и при шансах на выигрыш в 90 процентов. Но всё же, если следовать вероятности всегда, то, подводя итоги, придёшь к выводу, что расчёты помогли.
Что же касается возможности рассчитать, будет ли дождь идти завтра после того, как он уже льёт целую неделю, то она имеется. Существует довольно простая формула математика прошлого Томаса Бейеса, опубликованная впервые в 1763 году в его посмертной работе «Опыт решения одной проблемы теории вероятностей». В ней впервые был поставлен вопрос о том, как может быть использована теория вероятностей для составления того или иного суждения о явлении, располагая лишь ограниченным рядом наблюдений. Пусть перед нами урна с шарами. Шары могут быть только белыми, могут быть только чёрными, а могут быть и белые и чёрные, то есть состав шаров – смешанный. Мы скажем, что любой состав урны имеет равные априорные вероятности.
(Что такое априорные? Латынь, которая обильно украшала научные сочинения прошлого, вышла сейчас из моды, но некоторые слова оказались стойкими. К ним относятся a priori и a posteriori, что означает «до опыта» и «после опыта». Впрочем, даже и в этом случае мы предпочитаем вводить соответствующие русские прилагательные.)
Предположим, мы вытащили один шар: он оказался белым. Ситуация после этого сразу изменилась, поскольку уже ясно, что предположение, будто все шары чёрные, надо отбросить. А если мы вытащили 5 белых шаров подряд? Этот факт сильно повышает вероятность гипотезы, что в урне много белых шаров. Можно ли выяснить, какова вероятность, что белых шаров 100 процентов, или 90, или 80, после того, как произведён опыт? Или короче – какова априорная вероятность того, что в урне столько-то белых шаров после того, как мы вытащили из урны 5 белых шаров?
Вот такие и подобные проблемы решал Бейес в своей работе.
Одна из формул, выведенных Бейесом, отвечает на вопрос, который интересовал неудачливую пару, попавшую в полосу дождей. Если какое-то событие произошло несколько раз, то можно высчитать, какова вероятность его свершения и в следующий раз. Формула, как говорилось, очень простая, и её можно привести здесь, прибегнув – увы! – к алгебраическим символам, навевающим на некоторых все же страх или скуку: p=(q+1)/(q+2) (вероятность равна дроби, числитель которой равен числу происшедших событий плюс единица, а знаменатель равен этому же числу плюс два). Значит, если дождь идёт один день, то вероятность, что он будет идти завтра, равна 2/3, если дождь идёт два дня, то назавтра вы можете ждать такой же погоды с вероятностью 3/4, три дня – 4/5… восемь дней – 9/10. Просто, не правда ли?
Но если бездумно применять эту формулу, то можно прийти к абсурду. Например, я два раза набирал по телефону 01, вызывая пожарную команду, и она приезжала: значит, если я буду вызывать её третий раз, то она прибудет тушить пожар с вероятностью в 75 процентов. Глупо ведь? Конечно, глупо. Или в этом году с Эйфелевой башни бросились и разбились две девушки, обманутые женихами. Значит, следующая имеет шанс из четырех остаться в живых. Глупо? Конечно, глупо. Но при чём здесь наша простая формула? Прочитав внимательно работу этого превосходного математика, мы увидим, что формула введена в предположении, что о вероятности единичного события нам неизвестно ровно ничего, то есть что эта вероятность может быть любой – от 0 до 1.
Итак, формулу Бейеса следует применять в том случае, когда мы ровно ничего не знаем о единичном событии. Так ли обстоит дело с дождливой погодой?
На основании многолетних наблюдений в городе Брюсселе установлено, что если дождь идёт 1 день, то вероятность того, что он будет идти и завтра, равняется 0,63; если дождь идёт 2 дня – его вероятность на завтра равна 0,68, 3 дня – 0,70, 5 дней – 0,73. Согласно же формуле Бейеса мы должны были бы иметь 0,66; 0,75; 0,80 и 0,86. Хотя опыт и теория близки, полного совпадения нет: формула оказывается несколько более пессимистична, чем реальная действительность.
Лучше совпадают с выводами теоремы Бейеса данные, полученные при наблюдении смены температуры. По данным того же города Брюсселя, вероятность того, что завтра температура будет такой же, как и вчера, равна 0,75; если 2 дня температура была неизменной, то она останется такой же и завтра с вероятностью 0,76; если 3 дня неизменна, то сохранится и завтра с вероятностью 0,78; если 5 дней, то с вероятностью 0,83, и если температура не менялась 10 дней, то с вероятностью 0,85 она останется той же и в 11-й день.
Как видите, предсказание по принципу «сегодня как вчера» имеет обоснование в теории вероятности. Большинство прогнозов погоды носит именно такой характер, а чтобы судить о научной мощи предсказаний, надо было бы скидывать со счётов все прогнозы типа «погода остаётся без изменений». Кажется, так метеорологи и поступают, когда испытывают новые теории и схемы предсказания погоды. Предвидение потепления или похолодания – вот в чём должно проявиться понимание законов климата.
Но вернёмся к работе Бейеса. Мы проиллюстрировали примерами лишь одну из формул его теории, касающихся вероятности повторения событий. Но оправданы также попытки предсказания будущего и тогда, когда ряд событий неоднороден и состоит из чередующихся удач и неудач. В этом случае формула Бейеса меняется лишь незначительно: в её знаменателе будет стоять полное число событий плюс 2. Например, если проведённая на курорте неделя (7 дней) порадовала нас всего лишь одним хорошим днём, то вероятность дождя на восьмой день нашего отдыха будет вычисляться так: P=(6+1)/(7+2)=7/9.
Если в баскетбол играет сильная команда «Спартак» со слабой командой, скажем текстильного института, и если, придя с опозданием к началу состязания, мы узнаем, что счёт 1 : 10 в пользу института, то мы все же не поставим и гривенника против рубля за команду студентов. Для предсказания исхода состязания формула, о которой идёт речь, явно без пользы. Она «работает» лишь в том случае, если нам ничего не известно о вероятностях выигрыша и проигрыша команд – участниц состязания. Вот если бы я не знал, кто играет, и не видел бы техники игры, тогда, зная счёт 1 : 10, я действительно имел бы право сделать заключение: вероятность того, что следующее очко заработает ведущая команда, равна 11/13.
Интересно применение работы Бейеса в случаях, когда наши заключения об исходе события делаются на основании комбинации априорного (доопытного) знания и знания результата опыта. Из полной колоды карт потеряли одну. Какую – неизвестно. Некто просто «с потолка» высказывает гипотезу, что потеряна пика. Ясно, что при отсутствии какого-либо дополнительного знания вероятность этой гипотезы равняется 1/4. Вероятность противоположного утверждения, что потеряна не пика, равна 3/4. Поскольку автор первой гипотезы настаивает на проверке своего утверждения, то ставит опыт. Из колоды берутся две карты, которые оказываются пиками. Нетрудно видеть, что сторонники второй гипотезы после этого опыта укрепляются в своём мнении, а шансы авторов первой упали.
Формулы Бейеса позволяют произвести и количественные оценки. Можно рассчитать, насколько изменились вероятности гипотез после того, как получена дополнительная информация. Мы не будем приводить формулы и производить вычисления, а подчеркнём лишь идейную сторону дела.
Довольно редко дело обстоит так, что после проведённого единичного эксперимента ошибочные гипотезы смело могут быть отброшены, а единственно правильная поставлена на пьедестал почёта. Большей частью разовый опыт лишь изменяет вероятность достоверности высказанных гипотез. Если одна из них «взяла верх» над другими не слишком значительно, то потребуется и второй эксперимент, а может быть, и третий, и сотый. По мере накопления информации вероятность правильной гипотезы будет постепенно расти. Впрочем, рост может быть и не монотонным, а на каком-то разе так называемая правильная гипотеза может здорово проиграть и даже совсем рухнуть. Так в примере урны с шарами дело может обстоять следующим образом: вытянув десять чёрных шаров, мы уже почти уверимся в том, что в ней нет шаров иного цвета, ан нет – одиннадцатый раз вытащили белый, и вопрос вновь остаётся открытым. В конце концов истина восторжествует и наступит ясность, и тогда опытное исследование может быть прекращено, и результат обнародован.
Имеется ряд проблем, в которых вероятности гипотез могут быть достаточно хорошо вычислены на каждом этапе исследования в зависимости от полученного объёма информации. В подобных случаях планирование эксперимента может быть поручено ЭВМ. Машина будет оценивать вероятности всех гипотез после каждого шага и остановится тогда, когда вероятность одной из гипотез станет настолько значительной, что её можно считать истиной.
Работы Томаса Бейеса лежат в основе современного подхода к эксперименту. Подход этот используется в генетических исследованиях, в теории военной стратегии, в исследовании движения ядерных частиц и во многих других областях деятельности людей.
Миллион цифр
В заголовке мы написали «миллион цифр», а точнее надо бы было сказать – миллион случайных цифр. Такая книжка, не содержащая ничего, кроме миллиона цифр, вышла в свет и нашла своих читателей. Возьмём ряд случайных цифр: 0, 1, 9, 6, 7… Что, собственно говоря, означает, что они образуют случайную последовательность? И кого интересует такой ряд? Начнём с ответа на второй вопрос.
Представьте себе, что вы проводите обширный эксперимент по агротехнике. Поле разбито на 1000 небольших участков, каждый из которых должен быть ухожен определённым способом. Пускай способов таких (агротехнических систем) 10. Занумеруем их. Теперь нужно решить, на каком участке какую агротехническую систему применить. Для этого каждому участку припишем какую-либо цифру от 0 до 9, и притом сделаем так, чтобы приписка была совершенно случайной. Только при случайной нумерации наши выводы о целесообразности того или иного способа обработки почвы будут лишены сознательной или бессознательной ошибки, связанной с тем, что для какого-то «излюбленного» способа выбираются лучшие участки.
Поручить кому-либо называть цифры наобум нельзя, нельзя даже ребёнку, который не заинтересован в пропаганде ваших или ещё чьих-то агротехнических теорий, нельзя потому, что, оказывается, каждый человек питает симпатию к одним и нелюбовь к другим цифрам. Поэтому «наобум» не будет означать «случайно». Ряды же случайных цифр нужны самым разным экспериментаторам: медикам и социологам, администраторам и полководцам, экономистам и метеорологам и многим-многим другим.
Нужду в случайных цифрах испытывают также и математики, решающие свои задачи так называемым методом Монте-Карло, который становится все более распространённым по мере увеличения числа электронно-вычислительных машин. Чтобы дать хоть некоторое представление об этом методе, приведём несколько простых примеров.
Мы хотим вычислить площадь произвольной сложной фигуры, какую представляет, ну скажем, Московская область на карте. Площадь всей карты найти просто – надо помножить её ширину на длину. А как быть с фигурой причудливой формы?
Представьте себе, что на карту падают капли дождя и случайным образом усеивают карту. Подсчитаем общее число капелек и число капелек, попавших на интересующую нас Московскую область. Ясно, что отношение этих чисел должно равняться отношению площади всей карты к площади Московской области.
Разумеется, подставлять карту под дождь не надо. Каждую каплю можно представить двумя случайными числами (двумя координатами на плоскости), и тогда «заполнение площадей каплями» можно произвести мысленно. Но для этого также нужна книга случайных цифр, о которой у нас идёт речь.
Ещё пример. Во многих задачах требуется вычислить, через сколько времени достигнет заданного барьера некая точка, если известно, откуда она вышла, и сказано, что движется она случайными шагами одинаковой длины, но направленными как попало. Разбив это «как попало» на 10 направлений (скажем, под углами 36°, 72°, 108° и т.д.), мы можем перемещать точку при помощи книги случайных цифр.
Итак, случайные цифры нужны. Но что же такое ряд случайных цифр?
На первый взгляд безупречным выглядит следующее определение: нет правила, по которому можно было бы, закрыв пальцами любую из цифр книги, угадать, какая она, с вероятностью большей, чем 0,1 (потому что цифр 10).
Однако это определение не подходит, и вот почему. При помощи счётных машин с точностью до ста тысяч цифр после запятой вычислена величина «пи» – замечательное число, начинающееся цифрами 3,14… Если бы вы взглянули на эту последовательность, то она вам показалась бы идеально беспорядочной. Во всяком случае, вы будете действительно угадывать любую цифру лишь с вероятностью 0,1. Более того, исследуя число «пи» повнимательнее, вы найдёте, что у него нет склонности к какой-либо особенной цифре и все они встречаются в среднем одинаково часто. Вы не найдёте также никаких особенностей в расположении двух или трех ближайших цифровых соседей. И тем не менее тот, кто знает, что это число «пи», может предсказать каждую следующую цифру.
Но дело обстоит ещё хуже для составителей книги случайных цифр, когда исследуется ещё одно число. Структура числа «пи» в глаза не бросается, а вот у такого числа, как 12345678910111213141516171819…, закономерность в расположении цифр – так сказать, узор ряда – вполне ясна. В то же время оказывается, что этот ряд удовлетворяет всем требованиям беспорядочной серии: вероятность появления каждой цифры равна 0,1; двух определённых цифр рядом – 0,01; трех определённых цифр – 0,001 и т.д. То есть никакие комбинации не имеют преимуществ.
После размышлений математики пришли к такому выводу: нет ничего странного в том, что ограниченная последовательность цифр обладает некоторым узором. При этом чем длиннее серии случайных цифр, тем чаще на отдельных её отрезках будут встречаться самые странные узоры.
Все сказанное показывает, что было бы большой ошибкой ставить знак равенства между отсутствием узора в следовании цифр, штрихов или событий, с одной стороны, и случайностью этих событий – с другой. Вот вам пример: большего «беспорядка», чем расположение звёзд на небе, пожалуй, не придумаешь. Тем не менее оно полно созвездий, имеющих характерный рисунок.
В ряду случайных событий, таких, как появление «чёрного» и «красного» в рулетке, мы найдём и длинные ряды одинакового цвета, и ряды, в которых множество раз два «чёрных» чередуются с одним «красным». Будут такие случаи, когда «красного» будет больше в чётные дни месяца, а «чёрного» – в нечётные. Найдутся последовательности месяцев, когда число 13 упорно приходится на воскресенье. Любые такие события возможны, а чтобы увидеть их, надо просто подсчитать вероятность их появления и убедиться в том, что она больше одной миллионной.
Узоры случайностей – идея абстрактной живописи Джексона Поллока. Сообщалось, что этот «художник» выплёскивает как попало на длинное полотно краски с помощью разных леек, шланг, вёдер. Рассуждал Поллок вполне правильно. При совершенно случайном нанесении красок на полотно на нём будут образовываться различные узоры, и не исключено, что часть из них будет смотреться с интересом и удовольствием.
Случайно возникающие узоры в форме или цвете создают красоту природы. Но беспорядок без узоров не производит впечатления; в нём нет никаких зрительных образов, которые вызывали бы у зрителя ассоциации и воспоминания. Беспорядок эмоционально беден.
Одним из способов введения порядка в беспорядок является наложение симметрии на хаотически разбросанные цветовые пятна в бессюжетной декоративной живописи. Для этого художники зачастую прибегают к услугам калейдоскопа. Нехитрое это устройство, многократно отражающее в системе зеркал случайное расположение нескольких десятков цветных пятен, создаёт выразительные узоры. Многие из них потом оказываются рисунками на обоях.
Мастера декоративной живописи используют часто и другие приёмы введения порядка в хаос цвета и формы, например ритмическое повторение рисунка вдоль запутанного пути: спирали, зигзаги и т.д.
Декоративная живопись смело могла бы принять на вооружение таблицы случайных цифр и некоторые приёмы теории вероятностей, но художники, как правило, ещё сторонятся математики.
Эстетически невыразительной, по моему мнению, является и противоположная крайность в расположении цветов и форм – идеальный порядок. Справедливость этого утверждения видна из того, что даже в архитектуре идеальная симметрия и повторяемость вышли из моды.
Введением беспорядка в порядок заинтересовался один геометр, который стал известным живописцем. Пример творчества этого голландского художника Эшера читатель найдёт в книге А. Шубникова и В. Копцика «Симметрия».
Довольно легко и широко стали использоваться идеи и методы теории вероятностей в музыке. Так же, как декоративная живопись, музыка (мелодия) лежит «посередине» между гудком телефона (порядок) и беготнёй котёнка по клавишам рояля (беспорядок). Следование друг за другом нот подчиняется правилам композиции лишь отчасти. Поэтому вполне правомерно поставить вопрос о вероятности следующей ноты в рамках правил, предписанных музыке. Но об испытании «гармонии алгеброй» написано много научных работ и популярных книг. Не устоял против этой темы и я, посвятив ей несколько страниц в книге «Реникса». Там я рассказал, как, вводя различное число инструкций, накладывающих узы на хаотическое следование звуков, получают музыку различных стилей.
Такими приёмами можно при желании исследовать музыкальную структуру того или иного произведения, можно характеризовать различных композиторов степенью случайности в выборе соседних звуков. Насколько мне известно, энтузиасты такого рода исследований встречаются редко. Причины надо, видимо, искать в различном духовном складе человека искусства и человека точной науки.
Цель наших замечаний сводится к тому, чтобы показать, что закономерности случая могут проявить себя в фактуре произведений искусства, а также и в том, чтобы отметить некоторые возможности использования миллиона случайных цифр в анализе предметов живописи, музыки, а может быть, и поэзии.