355 500 произведений, 25 200 авторов.

Электронная библиотека книг » Ричард Фейнман » Квантовая механика и интегралы по траекториям » Текст книги (страница 22)
Квантовая механика и интегралы по траекториям
  • Текст добавлен: 23 марта 2017, 23:30

Текст книги "Квантовая механика и интегралы по траекториям"


Автор книги: Ричард Фейнман


Жанр:

   

Физика


сообщить о нарушении

Текущая страница: 22 (всего у книги 25 страниц)

𝐏

=

𝐤

𝑘

𝑎

𝑘

𝑒

𝑖𝐤⋅𝐫

,

(11.51)

то плотность заряда ионов равна

𝛒

=

𝛁⋅𝐏

=

𝑘

𝑎

𝑘

𝑒

𝑖𝐤⋅𝐫

(11.52)

Если 𝑉 – потенциал, то

𝛁²𝑉

=

𝛒

.

(11.53)

Поэтому если 𝑞𝑘 – амплитуда 𝑘-й продольной бегущей волны, то поляризация 𝑎𝑘 пропорциональна 𝑞𝑘 и взаимодействие между волной поляризации и электроном пропорцинально сумме членов вида (𝑞𝑘/𝑘) exp(𝑖𝐤⋅𝐱)по всем 𝐤.

Так как энергия и импульс электрона связаны выражением 𝐸=𝑝²/2𝑚, то мы можем записать лагранжиан всей системы в виде

𝐿

=

1

2

|𝐫̇|²

+

 

𝐤

1

2

(𝑞

2

𝑘

𝑞

2

𝐤

)+

2√2πα

𝑉

⎫½

 

𝐤

1

𝑘

𝑞

𝑘

𝑒

𝑖𝐤⋅𝐫

(11.54)

Первый член этого выражения – энергия электрона с координатой 𝐫, помещённого в кристалл с жёсткой решёткой. Второй член представляет собой лагранжиан колебаний поляризации в предположении, что все волны поляризации имеют одинаковую частоту и амплитуда 𝑘-го собственного колебания равна 𝑞𝑘. Последний член является лагранжианом взаимодействия электрона с колебаниями решётки, где 𝑉 – объём кристалла, α – постоянная величина. Чтобы упростить все последующие формулы, мы записали это выражение в безразмерном виде, т.е. единицы энергии, длины и времени выбраны так, что не только ℏ, но и общая частота осцилляторов ω, а также масса электрона 𝑚 – все равны единице. Тогда постоянная связи а равна безразмерному отношению:

α

=

1

√2

1

ε

1

ε

𝑒²

,

(11.55)

где ε и ε —соответственно статическая и динамическая диэлектрические постоянные. В типичном случае, например в кристалле NaCl, значение α составляет около 5. Вычисляемые значения энергии будут выражены в единицах ℏω.

После того, как мы решили задачу о движении гармонического осциллятора, можно изучить и квантовомеханическое движение электрона. Например, амплитуда вероятности того, что электрон выходит из точки 𝐫1, когда все осцилляторы находятся в основном состоянии, и заканчивает движение точке 𝐫2 при условии, что все осцилляторы снова находятся в основном состоянии, равна

𝐺

00

(2,1)

=

𝑒

𝑖𝑆

𝒟𝐫(𝑡)

(11.56)

(при этом мы использовали результаты гл. 8) и

𝑆

=

1

2

𝑑𝐫

𝑑𝑡

⎪²

𝑑𝑡

+

√2πα

𝑘²

𝑒

𝑖𝐤⋅𝐫(𝑡)

𝑒

-𝑖𝐤⋅𝐫(𝑠)

𝑒

-𝑖|𝑡-𝑠|

𝑑𝑡

𝑑𝑠

𝑑³𝐤

(2π)³

.

(11.57)

Проинтегрировав по волновым числам 𝐤, получим

𝑆

=

1

2

|𝐫̇|²

𝑑𝑡

+

α𝑖

√8

𝑒-𝑖|𝑡-𝑠|

|𝐫(𝑡)-𝐫(𝑠)|

𝑑𝑡

𝑑𝑠

.

(11.58)

Величина 𝐺00(2,1) зависит от начального и конечного положений электрона 𝐫1 и 𝐫2 и от рассматриваемого интервала времени 𝑇. Так как эта функция представляет собой ядро, она является решением волнового уравнения Шрёдингера, рассматриваемого в зависимости от величины временного интервала 𝑇. Поэтому в её экспоненциальные множители войдут частоты, пропорциональные уровням энергии 𝐹𝑚. Найдём низший из этих энергетических уровней.

Как уже отмечалось, развивая наш вариационный принцип, мы не интересовались ядрами, в которых величина 𝑇 имела бы смысл реального интервала времени; напротив, мы рассматривали мнимые величины, подобные появляющимся в выражении (11.8) при больших значениях β. Прослеживая все этапы, приведшие к выражению (11.58), можно легко показать для мнимых значений временной переменной β, что окончательный вид ядра будет таким:

𝐾(2,1)

=

𝑒

𝑆

𝒟𝐫(𝑡)

,

(11.59)

где переменная 𝑡 изменяется от 0 до β и

𝑆

=

1

2

𝑑𝐫

𝑑𝑡

⎪²

𝑑𝑡

+

α

√8

exp(-|𝑡-𝑠|)

|𝐫(𝑡)-𝐫(𝑠)|

𝑑𝑡

𝑑𝑠

.

(11.60)

Этот результат совпадает с тем, что получится, если в выражении (11.58) переменную 𝑡 заменить мнимой величиной 𝑖𝑡. При больших значениях β это ядро асимптотически становится пропорциональным exp(-β𝐸0).

Мы имеем сравнительно сложный интеграл по траекториям, к которому и попытаемся применить наш вариационный принцип. Сначала выберем некоторое простое действие 𝑆' грубо аппроксимирующее истинное действие 𝑆, а потом найдём 𝐸' и δ.

Заметим, что в соответствии с выражением (11.60) на частицу в любой момент времени «воздействует» реакция от её положения в предыдущий момент времени, которая обратно пропорциональна расстоянию между этими положениями и экспоненциально затухает с увеличением интервала между соответствующими моментами 22). Причиной этому служит то, что вызванное электроном возмущение в кристаллической решётке потребует некоторого времени для процесса релаксации ионов, и в этот релаксационный период электрон все ещё будет «чувствовать» старое возмущение.

22) Хотя величина 𝑡 в выражении (11.60) не является настоящим временем, а всего лишь переменной интегрирования, полезно рассматривать её, как мы это делали в § 2 гл. 10, в качестве времени.

Попробуем ввести действие 𝑆', обладающее всеми этими свойствами, за исключением того, что в законе взаимодействия вместо обратной пропорциональности расстоянию реакция положения будет иметь вид параболической ямы. Такая аппроксимация была бы непригодной, если расстояние |𝐫(𝑡)-𝐫(𝑠)| очень часто становилось бы чрезмерно большим. Однако, поскольку интервалы времени ограничены экспоненциальным затуханием, силы взаимодействия, большие значения этой разности, не могут дать сколько-нибудь существенного вклада в интеграл. Поэтому запишем

𝑆'

=

1

2

|𝐫̇|²

𝑑𝑡

1

2

𝐶

|𝐫(𝑠)-𝐫(𝑡)|²

𝑒

-𝑤|𝑡-𝑠|

𝑑𝑡

𝑑𝑠

.

(11.61)

Постоянная 𝐶 определяет силу притяжения между электроном и ранее созданным им возмущением; будем рассматривать её в качестве подгоночного параметра. Кроме того, без особых трудностей можно допустить, что закон обрезания экспоненты содержит некоторую отличную от единицы постоянную 𝑤. С её помощью мы сможем частично компенсировать неточность, которая вносится при замене обратно пропорциональной зависимости от расстояния параболической ямой (в этой связи заметим также, что добавление ещё одной постоянной в параболический член не улучшает результата, так как такой член выпал бы при вычислении 𝐸'0). Параметры 𝐶 и 𝑤 подберём далее таким образом, чтобы получить минимум 𝐸'0.

Поскольку действие 𝑆' мы выбрали квадратичным, то все существенные интегралы по траекториям легко вычисляются методами, описанными в гл. 2.

Сравнивая выражения (11.60) и (11.61), видим, что

1

β

⟨𝑆-𝑆'⟩

=

α

√8

1

|𝐫(𝑡)-𝐫(𝑠)|

𝑒

-|𝑡-𝑠|

𝑑𝑠

+

+

1

2

𝐶

⟨|𝐫(𝑡)-𝐫(𝑠)|²⟩

𝑒

-𝑤|𝑡-𝑠|

𝑑𝑠

=

𝐴+𝐵

.

(11.62)

Сконцентрируем наше внимание на первом члене в правой части этого равенства 𝐴. Для выражения |𝐫(𝑡)-𝐫(𝑠)|-1 в нем можно выполнить преобразование Фурье. Дело в том, что этот множитель возникает в результате преобразования Фурье при переходе от выражения (11.57) к (11.58). Таким образом, мы имеем

|𝐫(𝑡)-𝐫(𝑠)|

-1

=

𝑑³𝐤

exp{𝑖𝐤⋅[𝐫(𝑡)-𝐫(𝑠)]}

(2π²𝑘)

-1

.

(11.63)

Теперь необходимо изучить выражение

⟨exp{𝑖𝐤⋅[𝐫(τ)-𝐫(σ)]}⟩

=

(

𝑒

𝑆'

exp{𝑖𝐤⋅[𝐫(τ)-𝐫(σ)]}

)

𝒟𝐫(𝑡)

∫ 𝑒𝑆' 𝒟𝐫(𝑡)

.

(11.64)

Интеграл в числителе имеет вид

𝐼

=

exp

1

2

𝑑𝐫

𝑑𝑡

⎪²

𝑑𝑡

1

2

𝐶

|𝐫(𝑡)-𝐫(𝑠)|²

𝑒

-𝑤|𝑡-𝑠|

𝑑𝑡

𝑑𝑠

+

+

𝐟(𝑡)

𝐫(𝑡)

𝑑𝑡

𝒟𝐫(𝑡)

(11.65)

где введено обозначение

𝐟(𝑡)

=

𝑖𝐤δ(𝑡-τ)

𝑖𝐤δ(𝑡-σ)

.

(11.66)

Поскольку выражение (11.65) зависит от 𝐟 или 𝐤, можно вычислить его, за исключением некоторого нормирующего множителя, который был опущен в (11.64). Между прочим, отметим, что в (11.65) три взаимно перпендикулярные компоненты разделяются и нам останется рассмотреть лишь скалярный случай. Метод интегрирования здесь совпадает с предложенным в гл. 3 для вычисления гауссовых интегралов по траекториям. Поэтому подставим 𝑋(𝑡)=𝑋'(𝑡)+𝑌(𝑡), где 𝑋'(𝑡)– функция, для которой показатель экспоненты минимален; переменной интегрирования теперь является 𝑌(𝑡). Поскольку показатель экспоненты квадратичен по 𝑋(𝑡), а 𝑋' определяет его экстремум, то 𝑌(𝑡) может войти в показатель только в квадрате, поэтому 𝑌 выделится как множитель, не содержащий 𝑓 и обращающийся после интегрирования в постоянную (зависящую только от 𝑇):

𝐼

=

exp

1

2

𝑋̇'²(𝑡)

𝑑𝑡

1

2

𝐶

[𝑋'(𝑡)-𝑋'(𝑠)]²

𝑒

-𝑤|𝑡-𝑠|

𝑑𝑡

𝑑𝑠

+

+

𝑓(𝑡)

𝑋'(𝑡)

𝑑𝑡

.

(11.67)

Если время изменяется от 𝑡=0 до 𝑡=𝑇, то удобно выбрать граничные условия 𝑋'(0)=𝑋'(𝑇)=0. Условие обращения в нуль вариации даёт интегральное уравнение

𝑑²𝑋'(𝑡)

𝑑𝑡²

=

2𝐶

[𝑋'(𝑡)-𝑋'(𝑠)]²

𝑒

-𝑤|𝑡-𝑠|

𝑑𝑠

𝑓(𝑡)

.

(11.68)

С помощью этого уравнения выражение (11.67) можно записать в более простом виде:

𝐼

=

exp

1

2

𝑓(𝑡)

𝑋'(𝑡)

𝑑𝑡

.

(11.69)

Теперь мы должны ещё решить уравнение (11.68) и подставить результат в (11.69). Чтобы сделать это, введём функцию

𝑍(𝑡)

=

𝑤

2

𝑒

-𝑤|𝑡-𝑠|

𝑋'(𝑠)

𝑑𝑠

(11.70)

так, чтобы

𝑑²𝑍(𝑡)

𝑑𝑡²

=

𝑤²

[𝑍(𝑡)-𝑋'(𝑡)]

.

(11.71)

Тогда уравнение (11.68) принимает вид

𝑑²𝑋'(𝑡)

𝑑𝑡²

=

4𝐶

𝑤

[𝑋'(𝑡)-𝑍(𝑡)]

𝑓(𝑡)

.

(11.72)

Как видно, уравнения разделяются и легко решаются. Подстановка в соотношение (11.69) решения уравнения (11.68) 𝑋'(𝑡) даёт

𝐼

=

exp{𝑖𝐤⋅[𝐗(τ)-𝐗(σ)]}

=

=

exp

2𝐶𝑘²

𝑣²𝑤

(1-𝑒

-𝑣|τ-σ|

)

𝑤²

2𝑣²

𝑘²

|τ-σ|

,

(11.73)

где мы положили

𝑣²

=

𝑤²

+

4𝐶

𝑤

.

(11.74)

Этот результат нормирован правильно, так как он справедлив в случае 𝐤=0. После подстановки выражения (11.73) в (11.63) получим интеграл по 𝐤 от простой гауссовой функции, так что для 𝐴 имеем

𝐴

=

π

α𝑣

𝑤

0

𝑤²τ

𝑣²-𝑤²

𝑣

(1-𝑒

-𝑣τ

)

⎤-½

𝑒

-𝑤τ

𝑑τ

.

(11.75)

Чтобы найти 𝐵, нам нужно определить величину ⟨|𝐫(𝑡)-𝐫(𝑠)|²⟩. Её можно получить, разложив обе части выражения (11.73) в ряд по 𝐤 с точностью до членов порядка 𝑘. Таким образом,

1

3

⟨|𝐫(τ)-𝐫(σ)|²⟩

=

4𝐶

𝑣³𝑤

(1-𝑒

-|τ-σ|

)

+

𝑤²

𝑣²

|τ-σ|

.

(11.76)

Интеграл 𝐴 теперь легко вычислить, и результат выражается в очень простом виде:

𝐵

=

3𝐶

𝑣𝑤

.

(11.77)

В итоге нам нужно получить энергию 𝐸', соответствующую действию 𝑆'. Эту величину проще всего найти дифференцированием обеих частей выражения (11.6) по 𝐶:

𝐶𝑑𝐸'0

𝑑𝐶

=

𝐵

,

(11.78)

так что с учётом выражений (11.77) и (11.74) получаем после интегрирования

𝐸'

0

=

3

2

(𝑣-𝑤)

,

(11.79)

где мы учли, что 𝐸'0=0 при 𝐶=0. Поскольку 𝐸'0-𝐵=(3/4𝑣)(𝑣-𝑤)², то окончательно получим для энергии выражение

𝐸

=

3

4𝑣

(𝑣-𝑤)²

𝐴

,

(11.80)

где 𝐴 задано соотношением (11.75). Величины 𝑣 и 𝑤 – два параметра, которые для получения минимума можно варьировать порознь.

К сожалению, интеграл 𝐴 нельзя вычислить в квадратурах, так что окончательное определение 𝐸 требует численного интегрирования. Однако существует возможность найти приближённые выражения в различных предельных случаях. Случай больших α соответствует большим 𝑣. Выбор 𝑤=0 приводит к интегралу

𝐴

=

π

α

𝑣

½

0

𝑒

𝑑τ

(1-𝑒

-𝑣τ

)

=

αΓ(1/𝑣)

𝑣½Γ(½+1/𝑣)

(11.81)

и 𝐸'0=3𝑣/4. Это эквивалентно тому, что в выражении (11.37) используется потенциал, который соответствует свободным гармоническим колебаниям. При больших 𝑣 членом 𝑒-𝑣τ можно пренебречь, так что 𝐴=(πω)α𝑣½. Для значений α, меньших чем 5,8, и при 𝑤=0 выражение (11.80) не имеет минимума, только если не выполнено условие 𝑣=0, так что случай 𝑤=0 не даст единого выражения для всех значений α. Несмотря на этот недостаток, результат (11.81) сравнительно прост и достаточно точен. При α>6 фактически существенны только большие значения 𝑣 и пригодна приближённая формула

𝐴

=

α

𝑣

π

⎫½

1+

2 ln2

𝑣

;

(11.82)

при 𝑣>4 эта формула выполняется с точностью до 1%. Однако, например, Фрёлих [9] рассматривает разрыв при α=6 как серьёзный недостаток – недостаток, которого можно избежать в нашей теории. Мы сделаем это, выбрав 𝑤 отличным от нуля.

Изучим выражение (11.80) при малых значениях α и 𝑤≠0. Минимум будет иметь место, когда 𝑣 близко к 𝑤. Поэтому положим 𝑣=(1+ε)𝑤, считая ε малым, и разложим радикал в выражении (11.81). Это даст

𝐴

=

α

𝑣

𝑤

1-ε

0

τ

-3/2

𝑒

(1-𝑒

-𝑤τ

)

𝑑τ

½

+…

,

(11.83)

интеграл равен

-1

[(1+𝑤)

½

–1]

=

𝑃

.

(11.84)

В этом приближении задача сводится к минимизированию выражения

𝐸

=

3

4

𝑤ε²

–α-αε(1-𝑃)

,

(11.85)

получающегося с помощью подстановок из выражения (11.80); отсюда следует

ε=

2α(1-𝑃)

3𝑤

.

(11.86)

Этот результат справедлив только при малых значениях α, так как мы предположили, что ε мало. Окончательно

𝐸

=

–α

α²(1-𝑃)²

3𝑤

.

(11.87)

Таким образом, наш метод даёт поправку даже для малых значений α. Поправка будет минимальна при 𝑤=3, и в этом случае

𝐸

=

–α

α²

81

=

–α

–1,23

α

10

⎫²

.

(11.88)

Последнее выражение слабо зависит от 𝑤; например при 𝑤=1 коэффициент 1,23 уменьшается только до 0,98. Метод Ли и Пайнса [10] даёт в этом приближении точно такой же результат, что и выражение (11.88). Разложение по теории возмущений до членов второго порядка было сделано Хага [11], который показал, что истинное значение коэффициента при члене (α/10)² должно быть 1,26, так что наш вариационный метод очень точен при малых α.

Противоположный предел при больших значениях α соответствует большим 𝑣 и, как мы увидим, значениям 𝑤 порядка единицы. Так как 𝑣≫𝑤, то в первом приближении интеграл в выражении (11.75) переходит в формулу (11.81), асимптотику которой можно использовать без вычислений. Следующее приближение по 𝑤 можно получить, разложив радикал в выражении (11.75), при условии 𝑤/𝑣≪1. Кроме того, пренебрежимо малым оказывается член 𝑒-𝑣τ. В этом случае

𝐸

=

3

4𝑣

(𝑣-𝑤)²

–α

𝑣

π

⎫½

1+

2 ln2

𝑣

𝑤²

2𝑣

.

(11.89)

В рассматриваемом приближении больших 𝑣 это выражение минимально при 𝑤=1 и 𝑣=(4α²/9π)-(41𝑛-1); тогда (см. [12])

𝐸

=

α

–3 ln2 -

3

4

=

–0,1061α²

–2,83

.

(11.90)

Эти приближения не определяют верхнего предела 𝐸, так как, к сожалению, последующие члены будут порядка 1/α² и, по-видимому, являются положительными.

Детальный численный расчёт, основанный на этом приближении, был выполнен Шульцем [13]. С помощью счётной машины Шульц вычислил значения 𝑣 и 𝑤, которые дают минимум 𝐸 для различных значений α; он вычислил также энергию 𝐸 и сравнил полученную величину со значениями, полученными в различных теориях. В частности, он вычислил собственное значение энергии в теориях Ли, Лоу и Пайнса [14] (𝐸𝑙𝑙𝑝), в теориях Ли и Пайнса [10] (𝐸𝑙𝑝), Гросса [15] (𝐸𝑔), Пекара [16], Боголюбова [17] и Тябликова [18] (𝐸𝑝𝑏𝑡).

В табл. 2, позаимствованной из работы Шульца [13], приведены результаты вычислений α, 𝑣 и 𝑤, а также значения энергий из теории Фейнмана (𝐸𝑒) и других теорий. В этой таблице предполагается, что ω и ℏ равны единице. Отметим, что для всех значений а величина энергии в теории Фейнмана меньше, чем во всех других теориях.

Таблица 2

α

3

5

7

9

11

𝑣

 3,44

 4,02

 5,81

  9,85

 15,5

𝑤

 2,55

 2,13

 1,60

  1,28

  1,15

𝐸

𝑒

–3,1333

–5,4401

–8,1127

–11,486

–15,710

𝐸

𝑙𝑝

–3,10

–5,30

–7,58

–9,95

–12,41

𝐸

𝑔

–3,09

–5,24

–7,43

–9,65

–11,88

𝐸

𝑝𝑏𝑡

-6,83

–10,31

–14,7

Глава 12

ДРУГИЕ ЗАДАЧИ ТЕОРИИ ВЕРОЯТНОСТЕЙ

В предыдущих главах мы видели, как применяются интегралы по траекториям для решения задач квантовой механики, которые по своей физической природе являются вероятностными задачами. Кроме того, мы пользовались этим методом для анализа некоторых проблем статистической механики, вероятностная природа которой делает метод интегралов по траекториям особенно эффективным. Можно расширить круг конкретных применений этого метода на широкий класс задач теории вероятностей.

Целью данной главы является рассмотрение нескольких таких задач. Эти задачи разбиваются на два типа. Во-первых, мы обсудим непосредственное приложение метода интегрирования по траекториям к классическим задачам теории вероятностей. Это отличает данную главу от предыдущих, где все применения относились к квантовой механике. Во-вторых, рассмотрим смешанные вероятностные и квантовомеханические задачи. Мы не можем в этой главе углубляться в детали и ограничимся только некоторыми примерами постановки отдельных задач, предоставляя читателю самостоятельно разобрать другие применения метода интегрирования по траекториям.

Основное достоинство метода интегрирования по траекториям состоит в том, что он непосредственно содержит представление о вероятности некоторой траектории или функции. Для пояснения этой мысли последовательно рассмотрим хорошо известные понятия теории вероятности в применении к дискретным и непрерывным переменным 23).

23 Предполагаем, что читатель знаком с основными понятиями обычной теории вероятностей (см. например, [19]).

§ 1. Случайные события

Для начала предположим, что перед нами стоит задача теории вероятности, в которой переменные принимают дискретные значения. Пусть в случайно выбранные моменты времени происходит ряд дискретных событий; это может быть, например, прохождение космических частиц через счётчик или падение дождевых капель на выделенную для наблюдений площадку. Хотя известно, что частицы появляются в случайные моменты времени, однако можно ожидать, что в течение любого достаточно длительного промежутка времени 𝑇 будут наблюдаться 𝑛=𝑇μ частиц. Таким образом, μ имеет смысл средней скорости счета.

Конечно, при любом реальном измерении точное число зарегистрированных частиц 𝑛, вообще говоря, не будет совпадать с их средним числом. Однако можно спросить, какова вероятность наблюдения некоторого числа 𝑛 частиц за время, в течение которого в среднем появляются 𝑛 частиц. Ответ даётся распределением Пуассона

𝑃

𝑛

=

𝑛𝑛

𝑛!𝑒𝑛

(12.1)

С другой стороны, можно интересоваться вероятностными вопросами иного типа. Например, какова вероятность того, что после появления предыдущей частицы следующая появится в момент 𝑡? На вопрос, сформулированный таким образом, не существует правильного ответа. Если же мы поинтересовались бы вероятностью того, что интервал между появлениями частиц будет равен или больше 𝑡, то ответ 𝑒-μ𝑡 мог бы быть получен. Это значит, что можно определить лишь, находится ли момент 𝑡 внутри некоторого временного интервала. Таким образом, если нас интересует конкретный момент 𝑡, то должны исходить из бесконечно малого интервала и формулировать вопрос следующим образом: какова (бесконечно малая) вероятность того, что промежуток времени между двумя событиями будет лежать внутри окрестности 𝑑𝑡, окружающей момент 𝑡? Ответ записывается в виде

𝑃(𝑡)

𝑑𝑡

=

μ𝑒

-μ𝑡

𝑑𝑡

.

(12.2)

Так приходим к понятию распределения вероятности для непрерывной переменной: 𝑃(𝑡) есть отнесённая к единице измерения 𝑡 вероятность того, что интервал между событиями равен 𝑡. Запишем распределение вероятности для 𝑥 как 𝑃(𝑥), если 𝑃(𝑥)𝑑𝑥 представляет вероятность того, что переменная находится в окрестности 𝑑𝑥 точки 𝑥. Можно легко распространить это определение на случай двух переменных и написать вероятность распределения 𝑥 и 𝑦 как 𝑃(𝑥,𝑦)𝑑𝑥𝑑𝑦. При этом мы подразумеваем, что вероятность найти переменные 𝑥 и 𝑦 в области 𝑅 плоскости 𝑥𝑦 даётся интегралом

 

𝑅

𝑃(𝑥,𝑦)𝑑𝑥𝑑𝑦

.

Хотелось бы расширить концепцию вероятности ещё дальше. Желательно рассматривать распределения не только отдельных переменных, но также и целых кривых, т.е. хотелось бы построить вероятностные функции, или, точнее, функционалы, которые позволят ответить на вопрос: какова вероятность какой-либо конкретной эволюции физического процесса, развивающегося во времени, например напряжения на вольтметре или цены на товар, или, в случае двух переменных, какова вероятность формы поверхности моря как функции широты и долготы? Все это приводит нас к необходимости рассмотреть вероятность некоторой функции.

Запишем это так. Вероятность наблюдения функции 𝑓(𝑡) есть функционал 𝑃[𝑓(𝑡)]. При этом следует помнить, что вопросы относительно такой вероятности имеют смысл, только если определить интервал, внутри которого мы ищем определённую функцию. Так же, как в приведённом выше примере, мы должны были спросить: какова вероятность найти конец временного промежутка внутри интервала 𝑑𝑡? Теперь аналогично следует спрашивать: какова вероятность найти функцию в пределах некоторого более или менее ограниченного класса функций (например, среди кривых, заключённых между точками 𝑎 и 𝑏) в течение всего времени интересующего нас хода событий? Если мы назовём такую совокупность функций классом 𝐴 и спросим, какова вероятность найти функцию 𝑓(𝑡) в классе 𝐴, то ответ записывается в виде интеграла по траекториям

𝑃[𝑓(𝑡)]

𝒟𝑓(𝑡)

,

𝐴

(12.3)

где интегрирование проведено по всем функциям класса 𝐴.

Это выражение можно осмыслить по аналогии с функцией вероятности для нескольких переменных. Вообразим, что точками 𝑡1,𝑡2,… время разбито на дискретные интервалы (как мы это делали в гл. 2, когда только что определили интегралы по траекториям). Тогда значения функции в избранных временных точках 𝑓(𝑡1),𝑓(𝑡2),… = 𝑓1,𝑓2,…, аналогичны аргументам функции распределения многих переменных. Вероятность обнаружения заданной кривой можно понимать теперь как вероятность получения заданной системы величин 𝑓1,𝑓2,… в интервале 𝑑𝑓1,𝑑𝑓2,…, т.е. 𝑃(𝑓1,𝑓2,…) 𝑑𝑓1,𝑑𝑓2,…. Если затем перейти к пределу, устремляя число дискретных интервалов времени к бесконечности, то получим вероятность обнаружения непрерывной кривой 𝑓(𝑡) в интервале 𝒟𝑓(𝑡), стоящую под знаком интеграла по траекториям в выражении (12.3). Определённый таким образом функционал вероятности и соответствующий вероятностный подход мы будем использовать далее в этой главе.

§ 2. Характеристические функции

Полезно и дальше использовать аналогию между функционалом вероятности траектории и более привычной функцией распределения. Оба эти подхода имеют некоторые общие понятия, например понятие среднего значения. В случае обычных функций распределения дискретных величин, когда вероятность обнаружения некоторого числа 𝑛 равна 𝑃𝑛, среднее значение определяется как

𝑛

=

𝑛=1

𝑛

𝑃

𝑛

.

(12.4)

Для непрерывно распределённых переменных

𝑥

=

-∞

𝑥

𝑃(𝑥)

𝑑𝑥

.

(12.5)

Аналогичным образом среднее значение функционала 𝑄[𝑓(𝑡)] определим как

⟨𝑄⟩

=

∫𝑄[𝑓(𝑡)]𝑃[𝑓(𝑡)]𝒟𝑓(𝑡)

∫𝑃[𝑓(𝑡)]𝒟𝑓(𝑡)

.

(12.6)

В последнем соотношении, как и в гл. 7, мы включили в знаменатель интеграл по траекториям, который напоминает нам, что мы всегда должны иметь дело с проблемой нормировки. В принципе можно было бы с самого начала вычислить интеграл по траекториям от функции распределения, приравнять его единице и определить нормировочную постоянную. Однако во многих практических случаях удобнее оставлять функцию ненормированной, просто сокращая числовые множители в числителе и знаменателе выражения, которые сами по себе могут оказаться крайне сложными для вычисления.

Средний квадрат функции в заданный момент времени, например при 𝑡=𝑎, так же как и среднее значение функции, можно выразить через интегралы по траекториям. В этом случае получается функционал

⟨[𝑓(𝑎)]²⟩

=

∫[𝑓(𝑎)]²𝑃[𝑓(𝑡)]𝒟𝑓(𝑡)

∫𝑃[𝑓(𝑡)]𝒟𝑓(𝑡)

.

(12.7)

Одним из наиболее важных случаев усреднения функций согласно (12.5) является вычисление среднего значения 𝑒𝑖𝑘𝑥. Это среднее значение называется характеристической функцией и равно

φ(𝑘)

=

⟨𝑒

𝑖𝑘𝑥

=

-∞

𝑒

𝑖𝑘𝑥

𝑃(𝑥)

𝑑𝑥

.

(12.8)

Иногда эту функцию называют также производящей функцией для моментов. Она представляет собой просто преобразования Фурье для 𝑃(𝑥) и очень полезна для оценки различных характеристик распределения, так как её наличие эквивалентно заданию самой функции распределения. Последнее вытекает из возможности выполнить обратное преобразование

𝑃(𝑥)

=

-∞

𝑒

-𝑖𝑘𝑥

φ(𝑘)

𝑑𝑘

.

(12.9)

Некоторые важные параметры этого распределения можно определить, вычисляя производные характеристической функции. Так, например, среднее значение 𝑥 равно

⟨𝑥⟩

=

–𝑖

𝑑φ(𝑘)

𝑑𝑘

⎪𝑘=0

,

(12.10)

что легко показать, дифференцируя обе части равенства (12.8) по 𝑘 и полагая затем 𝑘=0. В самом деле, существует последовательность соотношений

φ(0)=1

,

φ'(0)=𝑖⟨𝑥⟩

,

φ''(0)=⟨𝑥²⟩

,…

(12.11)

Следующий наш шаг состоит в обобщении понятия характеристической функции на случай функционального распределения. Математическое определение такой характеристической функции можно построить, снова возвращаясь к нашей картине дискретных интервалов времени; затем нужно выполнить преобразование Фурье для функции распределения большого числа переменных, используя ядро exp(𝑖𝑘1𝑓1) exp(𝑖𝑘2𝑓2) …. При переходе к пределу бесконечного разбиения временных интервалов ядро превращается просто в exp[𝑖∫𝑘(𝑡)𝑓(𝑡)𝑑𝑡]. Это и есть функционал, среднее значение которого мы хотим вычислить для построения характеристического функционала. Используя равенство (12.6), получаем

Φ[𝑘(𝑡)]

=

∫𝑒𝑖∫𝑘(𝑡)𝑓(𝑡)𝑑𝑡𝑃[𝑓(𝑡)]𝒟𝑓(𝑡)

∫𝑃[𝑓(𝑡)]𝒟𝑓(𝑡)

.

(12.12)

Этот характеристический функционал также обладает важными специальными свойствами. Например, Φ(0)=1, а среднее значение функции 𝑓(𝑡), вычисляемое в некоторый момент времени 𝑡=𝑎, равно

⟨𝑓(𝑎)⟩

=

–𝑖

δ

δ𝑘(𝑎)

Φ[𝑘(𝑡)]

⎪𝑘(𝑡)=0

,

(12.13)

где используется функциональная производная, определённая в § 2 гл. 7.

В принципе можно выполнить обратное интегральное преобразование Фурье по траекториям и записать вероятностный функционал в форме

𝑃[𝑓(𝑡)]

=

𝑒

-𝑖∫𝑘(𝑡)𝑓(𝑡)𝑑𝑡

Φ[𝑘(𝑡)]

𝒟𝑘(𝑡)

(12.14)

где интеграл по траекториям берётся в пространстве функций 𝑘.

Для дальнейшего использования заметим, что если функция 𝑓(𝑡) всюду совпадает с некоторой заданной функцией 𝐹(𝑡), т.е. 𝑃[𝑓(𝑡)] равен нулю для всех 𝑓(𝑡), кроме 𝐹(𝑡), то характеристическая функция имеет вид

Φ

=

𝑒

𝑖∫𝑘(𝑡)𝐹(𝑡)𝑑𝑡

.

(12.15)

§ 3. Шумы

Используем теперь развитые выше идеи для изучения конкретных примеров и в ходе этого выработаем несколько новых понятий. Пусть мы проводим эксперимент, в котором считаем сигналы некоторого типа, например импульсы, создаваемые космическими лучами в счётчике Гейгера, или импульсы теплового шума в вольтметре. В таких случаях импульсы проявляются не просто как резкие дискретные всплески энергии, а характеризуются нарастанием и спадом потенциала. Внимательное изучение реального изменения потенциала, вызванного такими импульсами, показало бы, что для сигнала, пришедшего в момент 𝑡, оно имело бы форму 𝑔(𝑡). Точно так же, если бы сигнал приходился на момент 𝑡=𝑡0, форма потенциальной кривой была бы 𝑔(𝑡-𝑡0).

Далее предположим, что мы проводим наши измерения в интервале времени 𝑇, в течение которого регистрируются импульсы с центрами в моменты 𝑡1,𝑡2,…,𝑡𝑛. Полное изменение потенциала в течение всего эксперимента было бы

𝑛

𝑗=1

𝑔(𝑡-𝑡

𝑗

)

.

Так как нам известно, когда произошли все события, то наша функция распределения просто должна выражать достоверность. Используя равенство (12.15), получаем соответствующую характеристическую функцию

Φ

= exp

𝑖

𝑛

𝑗=1

𝑘(𝑡)

𝑔(𝑡-𝑡

𝑗

)

𝑑𝑡

.

(12.16)

Предположим теперь, что до проведения эксперимента мы хотели бы определить вероятность наблюдения вполне определённого изменения потенциала с течением времени. Допустим при этом, что 𝑛 событий равновероятно распределены по всему интервалу 𝑇, т.е. что вероятность события в интервале времени 𝑑𝑡 равна 𝑑𝑡/𝑇. В этом случае характеристическая функция оказывается равной

Φ

=

𝑇

0

exp

𝑖

𝑛

𝑗=1

𝑘(𝑡)

𝑔(𝑡-𝑡

𝑗

)

𝑑𝑡

𝑑𝑡1

𝑇

𝑑𝑡2

𝑇

𝑑𝑡𝑛

𝑇

=

=

𝑇

0

exp

𝑖

𝑘(𝑡+𝑠)

𝑔(𝑡)

𝑑𝑡

𝑑𝑠

𝑇

⎫𝑛

.

(12.17)

Обозначим выражение в скобках через 𝐴 и запишем результат как 𝐴𝑛.

Если число событий в интервале времени распределяется так, что применимо распределение Пуассона, т.е. наступление любого события не зависит от момента наступления других событий и имеется постоянная скорость μ появления среднего числа событий за единицу времени, то среднее число событий, происходящих за время 𝑇, равно μ𝑇=𝑛 и характеристическая функция

Φ

=

 

𝑛

𝐴

𝑛

𝑛𝑛

𝑛!

𝑒

-𝑛

.

(12.18)

Сумма в правой части этого равенства представляет собой разложение экспоненты от (𝐴-1)𝑛, так что характеристическую функцию можно записать в виде

Φ

=

𝑒

-(𝐴-1)𝑛

=

exp

–μ𝑇

1-

𝑇

0

𝑒

𝑖∫𝑘(𝑡+𝑠)𝑔(𝑡)𝑑𝑡

𝑑𝑠

𝑇

=

=

exp

–μ

𝑇

0

(1-𝑒

𝑖∫𝑘(𝑡+𝑠)𝑔(𝑡)𝑑𝑡

)

𝑑𝑠

.

(12.19)

Таким образом, можно теперь вычислить характеристическую функцию для многих различных случаев. Перейдём к рассмотрению некоторых частных случаев, где можно использовать простые приближения.

Допустим, что сигналы очень слабые, а их среднее число за единицу времени велико. В этом случае 𝑔(𝑡) мало и, разлагая экспоненту exp[𝑖∫𝑘(𝑡+𝑠)𝑔(𝑡)𝑑𝑡] в степенной ряд, можно аппроксимировать характеристическую функцию выражением

exp

𝑖μ

𝑇

0

𝑇

0

𝑘(𝑡+𝑠)𝑔(𝑡)𝑑𝑡

𝑑𝑠

=

exp

𝑖μ𝐺

2𝑇

0

𝑘(𝑡)𝑑𝑡

,

(12.20)

где через 𝐺=∫𝑔(𝑡)𝑑𝑡 обозначена площадь сигнала. Это означает, что характеристическая функция Φ выражается в виде (12.15) с 𝐹(𝑡)=μ𝐺 (постоянной, не зависящей от 𝑡), а это эквивалентно достоверному утверждению, что 𝑓(𝑡) совпадает с или, другими словами, вероятность равна единице при наблюдении функции 𝑓(𝑡)=μ𝐺 и равна нулю при наблюдении других функций 𝑓(𝑡). Таким образом, совокупность большого числа малых слабых сигналов порождает почти постоянный потенциал, величина которого равна произведению числа сигналов за 1 сек на среднее значение потенциала сигнала.

Перейдём теперь к приближению более высокого порядка и изучим флуктуации около этого постоянного потенциала.

Равенство (12.20) даёт первое приближение экспоненты exp[𝑖∫𝑘(𝑡+𝑠)𝑔(𝑡)𝑑𝑡] в выражении для характеристического функционала (12.19). Допустим теперь, что мы переходим к следующему приближению и учитываем члены второго порядка в виде

-

μ

2

𝑘(𝑡)𝑔(𝑡-𝑠)𝑑𝑡

𝑘(𝑡')𝑔(𝑡'-𝑠)𝑑𝑡'

𝑑𝑠

.

(12.21)

Чтобы получить более простое выражение, введём функцию, определяющую степень перекрытия двух соседних сигналов,

λ(τ)

=

𝑔(𝑡)

𝑔(𝑡+τ)

𝑑𝑡

.

(12.22)

Эта подстановка приводит член второго порядка к виду

-

μ

2

𝑇

0

𝑇

0

𝑘(𝑡)

𝑘(𝑡')

λ(𝑡-𝑡')

𝑑𝑡

𝑑𝑡'

.

(12.23)

Характеристический функционал с учётом членов первого и второго порядков приобретает вид

Φ

= exp

𝑖μ𝐺

𝑘(𝑡)

𝑑𝑡

exp

μ

2

𝑘(𝑡)

𝑘(𝑡')

λ(𝑡-𝑡')

𝑑𝑡

𝑑𝑡'

.

(12.24)

Первый множитель в этом выражении соответствует постоянному среднему уровню шума, который, если иметь в виду импульсы напряжения, можно назвать уровнем постоянного тока. Мы можем при желании пренебречь этим уровнем и интересоваться только изменениями потенциала, сдвинув начало отсчёта 𝑓(𝑡). Это означает, что путём изменения начала отсчёта функции 𝑓(𝑡) всегда можно освободиться от множителя exp[𝑖∫𝑘(𝑡)𝐹(𝑡)𝑑𝑡] [т.е. записать 𝑓(𝑡)=𝐹(𝑡)+𝑓'(𝑡), изучить распределение вероятности и характеристический функционал для 𝑓(𝑡)]. Если мы сделаем такое изменение начала отсчёта, то будем изучать лишь флуктации напряжения относительно уровня постоянного тока.

Отметим одно приближение к функционалу (12.24), которое часто оказывается точным. В общем случае λ(τ) – узкая, пикообразная функция от τ. Нарастание и спад формы сигнала 𝑔(𝑡) характеризуется конечной шириной, так что если два сигнала разделены достаточно большим промежутком времени, то у них нет области перекрытия. Другими словами, λ(τ) быстро стремится к нулю при увеличении τ. Поэтому, если λ(τ) имеет достаточно узкий профиль, второй член в уравнении (12.24) может быть аппроксимирован выражением

𝑒

-(𝑞/2)∫[𝑘(𝑡)]²𝑑𝑡

,

(12.25)

где обозначено

𝑞

=

μ

-∞

λ

𝑑τ

.

Это эквивалентно распределению вероятности

𝑃[𝑓(𝑡)]

=

𝑒

-(𝑞/2)∫[𝑓(𝑡)]²𝑑𝑡

.

(12.26)

Флуктуации, подобные тем, что мы сейчас рассматриваем, часто называют гауссовым шумом.

Характеристики функционалов вероятности, описывающих шумовые функции, последнее время широко обсуждались в теории связи, причём многие характеристики шумового спектра были определены и вычислены. Аналогичное рассмотрение проведём здесь и в следующем параграфе, где рассматриваются гауссовы шумы.


    Ваша оценка произведения:

Популярные книги за неделю