Текст книги "Атмосфера должна быть чистой. Применение статистических методов при аттестации источников эмиссии и оценке качества атмосферного воздуха"
Автор книги: Виктор Назаркин
сообщить о нарушении
Текущая страница: 2 (всего у книги 2 страниц)
В частности, такие функции должны быть ограничены слева значением Х=0 во избежание появления бессмысленных с физической точки зрения оценок вида:
(2.10.)
где Ɛ – абсолютная ошибка измерения.
Чтобы учесть положительную асимметрию распределения частот вносились поправки к функции распределения (2.1.) [ 21 ], предлагалось использовать усеченные нормальные распределения в виде:
(2.11.)
Где А – определялось из условия нормировки
– функция распределения Гаусса.
Эта модель дает вероятность P>0 для значений признака Х=0, в то время как MX>0.
Предлагалось использовать гамма-распределение [36, 37], плотность которого задается выражением:
(2.12.)
где – гамма функция.
Моменты распределения:
Для аппроксимации функции распределения случайных величин Х, изменяющихся на конечном интервале предлагалось использовать их разложение по системе ортогональных полиномов Лежандра и Лагерра [ 37 ]. В первом случае, если для (Х) известны ,S и центральные моменты , то плотность распределения величины задается в виде:
Соответствующие коэффициенты разложения находятся из условий ортогональности полиномов Лежандра:.
С использованием представлений для , для Cn получается:
(2.13.)
Например,
As – асимметрия.
Аналогично, предлагалось использовать разложение по полиномам Лагерра. Если известны величины , то производя замену , получим плотность распределения в виде ряда:
(2.14.)
Так как , то для Cn можно получить:
, где
Данный подход универсален и позволяет получить достаточную точность уже при вычислении 4÷5 членов разложения. Известны и другие виды разложений по ортогональным полиномам, основанным на нормальном распределении. Это, так называемые, ряд Грамма-Шарлье и асимптотическое распределение Эдокворта [ 38 ].
К недостаткам этих представлений следует отнести относительную сложность расчетных процедур и необходимость вычисления лишних моментов и семиинвариантов, так как не учет моментов 5-го и 6-го порядка приводил к генерации отрицательных частот [5].
К недостаткам таких аппроксимаций можно отнести и существенное влияние ошибок в определении параметров реальных распределений.
В последнее время появился ряд убедительных свидетельств в пользу возможности использования логарифмически нормального распределения для выравнивания распределения частот данных о загрязнении воздуха [22, 23, 39, 51]. При этом нормально распределенными являются величины:
а (2.15.)
где S, m – параметры распределения, определяемые из экспериментальных данных.
Характерной особенностью логнормального распределения является зависимость дисперсии от математического ожидания, таким образом, что коэффициент вариации остается близким к единице (рис. 2.4.).
Рис. 2.4. Плотность логнормального распределения с параметрами (а) и (σ).
Правомерность использования распределения (2.15.) для аппроксимации распределения частот эмпирических данных о загрязнении воздуха и воды отмечалась во многих экспериментальных работах [ 22, 23, 29, 31,51], подобные выводы делались и из некоторых общих соображений [31], известны и попытки строгого математического доказательства этих факторов с использованием (распространением) центральной предельной теоремы на случай, когда отдельные измерения случайной величины (Х) не являются независимыми [ 5 ]. Аргументом в пользу применения логнормального нормального распределения является его простая функциональная связь с распределением Гаусса, что позволяет использовать в готовом виде классические решения теории оценок и критериев значимости.
Использование функций от случайных величин вместо самих случайных величин может оказаться весьма плодотворным и в оценках параметров порядковых статистик [13, 14, 15]. Изучение вопроса о значениях порядковых статистик, играет принципиальную роль в возможности оценки экстремальных значений временных рядов. Смысл необходимости достоверных оценок экстремумов заключается в том, что основной задачей управления качеством окружающей среды является поддержание максимальных значений концентрации ЗВ ниже установленных границ допуска.
Стандарты качества воздуха качества воздуха характеризуются значениями предельно допустимых концентраций ПДК.
Различают максимально разовую ПДК (ПДКм.раз.), определяемую по времени экспозиции (осреднения) τ1=20 мин. или 0,33 часа), среднесуточная ПДК (ПДКср. сут.), где τ2=24 часа. Для нормирования концентрации радиоактивных веществ используется среднегодовая предельно допустимая концентрация (ПДКср. год) [2, 41]. В других странах, например, США стандарты включают и другие интервалы осреднения – 1 час, 3 часа, 8 часов и некоторые другие. Из цитируемых работ можно заключить, что максимальная концентрация для каждого периода может быть превышена раз в году. Если воспользоваться определением ПДК (ГОСТ 17.2.3.01-77), что это максимальная концентрация ЗВ, отнесенная к определенному времени осреднения, которая при периодическом воздействии на протяжении всей жизни человека не оказывает на него вредного действия, включая отдаленные последствия и на окружающую среду в целом, то становится ясным, что благополучной санитарно-гигиенической обстановкой можно считать такую, когда частота появления значений концентраций за контрольный период (Т=1 год), осредненных за интервалы τ1=20 мин и τ2=24 часа близка к нулю или вероятность появления такого значения близка к нулю . Аналогичный вывод делается и для среднегодовой концентрации радионуклидов в воздухе.
Формально данный вопрос можно исследовать с позиции теории пересечения некоторым случайным процессом Х(t) фиксированного уровня – границы допуска.
Теория проблем, связанных с пересечениями рассмотрена, например, в книге Крамера Г. и Лидбеттера М. [ 5 ].
Можно определить как η(t) некоторую случайную величину, определяемую процессом Х(t):
(2.16.)
и
(2.17.)
Тогда Z0(t) – та часть времени 0 ≤ t ≤ T , которую процесс Х(t) проводит над уровнем ПДК. (см. рис. 1.1).
Из теоремы Фубини следует, что среднее значение величины Z0(T) задается соотношениями:
(2.18.)
Ясно, что при соотношении эта величина может быть близка к нулю.
Таким образом, следуя требованиям стандарта, значения функции Х(t) могут сколько угодно раз касаться уровня ПДК, но не должны пересекать его на всем интервале 0 ≤ t ≤ T. Однако, нужно иметь ввиду, что если приведенные на рис. 2.2. превышения , определенны за время , то эти превышения не правомерно рассматривать как нарушения стандарта качества воздуха.
Таким образом, четко определяется задача оценки санитарно-гигиенической обстановки. Это – оценка возможных экстремальных значений концентрации за отчетный период 0 ≤ t ≤ T, отнесенных к определенным временам осреднения и сопоставление их с соответствующими границами допуска, отнесенными к тем же самым временам осреднения.
Оценки экстремальных значений могут быть сделаны разными способами, в том числе и простым и естественным перебором всех (n) экспериментальных значений, что обычно и делается в производственной практике. На самом деле, это может привести к учету заведомо ошибочных данных, кроме того не дает возможности объективно оценить частоты и вероятности.
Кроме того, метод перебора не дает гарантии «хорошей» оценки экстремума концентрации, так как на практике приходится иметь дело с выборками ограниченного объема, то есть с ситуациями, когда действительное число измерений концентрации за контрольный период времени Т = 1 год, гораздо меньше соответствующего объема генеральной совокупности n N. Если же промежуток времени между отдельными измерениями ∆t = 0, то метод перебора оправдан, но не позволяет, все-таки, исключить ошибочные и «выскакивающие», то есть не принадлежащие данной статистической совокупности значения. Кроме того, в этом случае, возможно наличие корреляционной связи между членами временного ряда, что ведет к необходимости обработки лишней информации.
Таким образом, во всех случаях целесообразно находить экстремальные значения при помощи какого-либо алгоритма.
У одномерной выборки, состоящей из (n) значений, всегда имеются, по крайней мере, два конечных и однозначно определяемых экстремальных значения и также конечная широта, являющаяся разностью между этими значениями. На первый взгляд кажется, что нахождение экстремума совсем простая задача, достаточно лишь расположить (n) выборочных значений в порядке возрастания их величины и рассмотреть значения, стоящие на i – ом месте от начала или конца ( в дальнейшем нас будет интересовать i – е верхнее значение), тогда при i=n получаются экстремальные значения. На самом деле экстремальные значения, как и любая порядковая статистика, обладают выборочной неустойчивостью и определяются свойствами генеральной совокупности, поэтому правильнее их находить по выборке при помощи каких-либо специальных алгоритмов.
Как известно [40], порядковые статистики представляют собой зависимые случайные величины (даже если исходная совокупность независимая) и поэтому описывается некоторым совместным распределением. Если функция распределения случайной переменной в генеральной совокупности и функции плотности f(x) непрерывны, то в выборке объемом (n) функция плотности распределения i-й порядковой статистики выражаются формулой:
(2.19.)
Математическое ожидание i – й порядковой статистики дается выражением:
(2.20.)
Где – переменная интегрирования.
Дисперсия i – й порядковой статистики определяется из выражения:
Где
(2.21.)
Ковариация между i-й и j-й порядковыми статистиками (I < j) вычисляется по формуле:
(2.22.)
Где
Нормированный коэффициент корреляции:
(2.23.)
Очевидно, что эти формулы очень сложны и малопригодны для аналитического исследования. Что касается распределения наибольшего значения Хn , то событие
Xn ≤ X эквивалентно пересечению событий
Следовательно,
(2.24.)
Тогда, (2.25.)
(2.26.)
Последнее выражение позволяет оценить Xmax если есть информация о распределении генеральной совокупности. Для нормальной или логнормальной функции распределения, оценки математических ожиданий i – х порядковых статистик могут быть выполнены только численным интегрированием на ЭВМ.
Если известны распределение и плотность генеральной совокупности F(X) и f(X), то можно находить любой контрольный уровень (Xmax) с любой вероятностью его не превышения (превышения) из уравнения:
(2.27.)
Например, для стандартного нормального распределения :
(2.28.)
Из последнего выражения видно, что оценки вида Xmax=μ+3σ является хорошей оценкой экстремального значения по выборке. Аналогичные оценки можно получить и для логнормального распределения. Какую же величину вероятности следует задавать для оценки экстремального значения? Однозначных рекомендаций нет. Используют уровень 2σ, то есть 95% и 3σ, то есть 99,7%. Задают и более жесткие границы, например, для частоты экстремального значения в работе [35] рекомендуется уровень 0,01%.
Конечно, одни нормы более «мягкие», другие более «жесткие», но на практике можно было бы ограничиться любыми уровнями, обеспечивающими вероятность не превышения 95%, главным является понимание того, что любая граница допуска может быть задана с определенной вероятностью ее не превышения. В данной работе предполагается детально исследовать этот вопрос и выдать конкретные рекомендации для практического использования.
Существует еще один аспект проблемы оценки санитарно-гигиенической обстановки, который связан со стационарностью рассматриваемых случайных функций (случайных процессов).
Этот вопрос имеет принципиальное значение, прежде всего для возможности применения эргодической гипотезы (общей эргодической теоремы – предельной теоремы для среднего значения случайных функций) [42]. В общем случае математическое ожидание и дисперсия случайной функции сами являются функциями времени. Если эти функции представляют собой долгопериодные регулярные колебания (как в случае метеорологических рядов), то они могут быть выявлены методами гармонического анализа и использованы для прогноза. В случае же нерегулярных колебаний, как возможность диагностики, так и прогноза становится проблематичной.
Задача существенно упрощается для стационарных случайных процессов. Для таких процессов:
(2.29.)
для любых 0≤ ti ≤ T .
Среднее по времени для каждой реализации определяется как:
(2.30.)
Если для любого k MXk=const, то процесс X(t) называется эргодическим, при этом его корреляционная функция зависит только от времени. Именно свойство эргодичности стационарных случайных процессов позволяет выполнить все необходимые оценки на основании данных одной реализации [ 8 ].
Какие же характеристики случайной функции X(t) могут быть получены при измерении концентрации ЗВ в источнике выбросов (эмиссий) или на стационарном посту наблюдения в приземном слое атмосферы? Например, в течение каждого часа отбирается проба для оценки максимально разовой концентрации ЗВ в течение суток Т, то есть 0 ≤ tj
Конец ознакомительного фрагмента.
Текст предоставлен ООО «ЛитРес».
Прочитайте эту книгу целиком, купив полную легальную версию на ЛитРес.
Безопасно оплатить книгу можно банковской картой Visa, MasterCard, Maestro, со счета мобильного телефона, с платежного терминала, в салоне МТС или Связной, через PayPal, WebMoney, Яндекс.Деньги, QIWI Кошелек, бонусными картами или другим удобным Вам способом.