Текст книги "Фейнмановские лекции по гравитации"
Автор книги: Ричард Фейнман
сообщить о нарушении
Текущая страница: 15 (всего у книги 22 страниц)
𝑅
σα;γ
–
𝑅
σγ;α
+
𝑅
μ
σγα;μ
=
0.
(9.4.2)
Свёртывая по индексам (σ,α), мы получаем
𝑅
;γ
–
𝑅
σ
γ;σ
–
𝑅
μ
γ;μ
=
0.
(9.4.3)
Таким образом, тензорная величина, которая имеет нулевую ковариантную производную, есть
⎛
⎜
⎝
𝑅
μ
γ
–
1
2
𝑔
μ
γ
𝑅
⎞
⎟
⎠;μ
=
0.
(9.4.4)
Гипотеза Эйнштейна состояла в том, что эта величина в точности есть тензор энергии-импульса. Для того, чтобы записать это в эйнштейновской форме, мы просто поднимаем один индекс для того, чтобы записать дважды ковариантный тензор
𝐺
μν
=
𝑅
μν
–
1
2
𝑔
μν
𝑅
=
λ²
𝑇
μν
,
𝐺
μν
;ν
=
0.
(9.4.5)
Первое уравнение (9.4.5) определяет полный закон гравитации Эйнштейна; т.е. это отправная точка всей нашей работы. 𝐺μν часто называется тензором Эйнштейна.
После того, как мы установили связь между тензором энергии-импульса и тензором кривизны, возникает интересный вопрос. Наша интуиция могла бы предполагать, что если повсюду в пространстве нет материи и давлений, геометрия должна бы быть плоской, описываемой метрикой Минковского специальной теории относительности. Тем не менее, оказалось возможным получить решения такие, что
𝑇
μν
=
0
всюду и, несмотря на это,
𝑅
σ
ρτν
≠
0.
(9.4.6)
Наиболее интересным из таких решений является решение А.Тауба. Это решение наиболее интересно, поскольку оно не зависит от времени. Тем не менее, могут быть другие решения такой задачи, так мы можем спросить, можем ли мы иметь гравитацию без того, чтобы имелись источники?
Ответ на этот вопрос вероятно будет аналогичным ответу, который даётся на аналогичный вопрос в электродинамике. Если разрешается зависимость от времени, то уравнения допускают существование полей без источников (т.е. движущиеся волны), до сих пор мы никогда не сталкивались с физическими трудностями, предполагая, что всё наблюдаемое излучение действительно приходит от заряженных источников, которые и испускают это излучение. Можно построить статические поля, например, имеющие потенциалы
φ
=
𝑥,
φ
=
𝑥²
+
𝑦²
–
2𝑧²
,
(9.4.7)
которые являются бездивергентными, а потому не имеют источников. Обычная интерпретация таких решений состоит в том, что такие поля вызываются зарядами, лежащими вне некоторого объёма, внутри которого соотношения (9.4.7) оказываются справедливыми, и для этого требуется всё большее и большее количество заряда, находящегося вне рассматриваемой области для того, чтобы сделать такого рода решения приемлемыми, когда мы пытаемся увеличить объём, в котором выполнены приведённые выше решения.
Не проверяя в деталях решения А. Тауба, я полагаю, что он столкнулся с аналогичной ситуацией. Для того, чтобы объяснить наличие кривизны в отсутствии материи, мы должны взять предельный случай решений, которые имеют ясную физическую интерпретацию на малых областях, и затем разрешить этим областям стать бесконечно большими. Цена, которая при этом должна быть заплачена, состоит в том, чтобы неограниченно отсрочить объяснение растущего количества "внешней” материи, которая нам требуется.
Лекция 10
10.1. Полевые уравнения гравитации
Мы нашли тензор, называемый тензором кривизны, который определяется исходя из того, что происходит, когда мы переносим векторы по некоторой замкнутой кривой в нашем пространстве. Поскольку эта величина является тензором, мы можем использовать её для того, чтобы образовать величины, которые должны быть использованы при написании ковариантных уравнений. Мы не получили никакой физики, просто записывая эти уравнения, тем не менее, мы должны точно определить связь этих уравнений с реальным материальным миром. То, что сделал Эйнштейн, состоит в том, что он попросту предположил, что такая связь есть. Не существует способа вывести эту связь из более фундаментальных принципов. Каждая возможная гипотеза имеет свои характерные свойства, поэтому возможно для более позднего исследователя предположить наличие некоторого критерия, который бы делал выбор единственным, но это по сути дела некий обман.
Некоторая подсказка, которая может помочь нам, состоит в том, что гравитация взаимодействует с плотностью энергии, так что поскольку плотность энергии в теории относительности есть компонент (44) тензора второго ранга, то в уравнениях нам необходимо иметь тензор второго ранга. Кривизна является тензором четвёртого ранга, так что мы сворачиваем его (по верхнему и нижнему индексу) один раз и используем тензор Риччи. Первая гипотеза Эйнштейна состояла в том, что тензор энергии-импульса попросту равен тензору Риччи λ²𝑇μν=𝑅μν. Тем не менее, возможен другой выбор; мы можем добавить к тензору Риччи метрический тензор, умноженный на скалярную кривизну (свёрнутый тензор Риччи). Таким образом, получаем то, что в конце концов выбрал Эйнштейн:
𝑅
μν
–
1
2
𝑔
μν
𝑅
=
λ²𝑇
μν
.
(10.1.1)
Существует хороший аргумент в пользу того, почему такой выбор лучше. Если мы вычислим ковариантную дивергенцию уравнения (10.1.1), то ответ состоит в том, что эта величина тождественно равна нулю. Это означает, что закон сохранения энергии есть попросту следствие вида уравнения (10.1.1). Если мы положим тензор энергии-импульса равным только вектору Риччи (а не тензору Эйнштейна), то закон сохранения энергии был бы тогда физическим постулатом, который принёс бы больше информации и привёл бы к меньшей свободе. В действительности выбор метрических тензоров не является однозначным; когда мы работаем с ними, у нас есть возможность свободы выбора четырёх функций, соответствующих четырём функциям, которые описывают общее преобразование, задающее новые координаты через старые. Так как закон сохранения энергии есть тождество, то выбор четырёх функций в метрике является полностью свободным.
Насколько хорошо выбор Эйнштейна соответствует Природе? Как мы получаем тензор 𝑇μν и каково значение этих уравнений и кривизны? Для того, чтобы ответить на эти вопросы, мы поработаем с этими уравнениями некоторое время. Прежде всего мы попытаемся понять связь этих уравнений с остальной физикой и с вариационными принципами.
Для того, чтобы записать принцип действия в релятивистском виде, нам необходим интеграл, который есть скалярный инвариант. Мы выбираем, что действие для гравитационного поля есть
𝑆
𝑔
=-
1
2λ²
∫
𝑑⁴𝑥
𝑅√
–𝑔
.
(10.1.2)
В тех выражениях, которые мы выписываем, мы обозначаем 𝑑⁴𝑥=𝑑𝑥𝑑𝑦𝑧𝑑𝑡. Действие 𝑆𝑔 есть скаляр, поскольку 𝑅 есть скаляр и √-𝑔𝑑⁴𝑥 есть скаляр. Мы можем показать последнее, исходя из рассмотрения того, что собственное время есть скалярный инвариант
(𝑑𝑠)²
=
𝑔
μν
𝑑𝑥
μ
𝑑𝑥
ν
.
(10.1.3)
Вследствие того, что 𝑔μν есть симметричный тензор, мы всегда можем ввести вращение таким образом, что тензор будет диагональным; в этом случае
(𝑑𝑠)²
=
𝐷(𝑑𝑡)²
–
𝐶(𝑑𝑧)²
–
𝐵(𝑑𝑦)²
–
𝐴(𝑑𝑥)²
.
(10.1.4)
Отсюда мы видим, что элемент объёма 𝑑⁴𝑥 не является инвариантом; должным образом выбранный инвариантный элемент объёма есть
√
𝐴𝐵𝐶𝐷
𝑑𝑥'
𝑑𝑦'
𝑑𝑧'
𝑑𝑡'
=
√
–𝑔
𝑑⁴𝑥'
,
(10.1.5)
где 𝑔'=Det 𝑔'μν. Если мы делаем ортогональные преобразования, то 𝑑⁴𝑥=𝑑⁴𝑥' и также определитель Det 𝑔μν равен Det 𝑔'μν. Таким образом, общее выражение для инвариантного элемента объёма есть
√
–𝑔
𝑑⁴𝑥
.
(10.1.6)
Величина √-𝑔 есть скалярная плотность. Это означает, что её изменение при координатном преобразовании получается умножением на якобиан преобразования
√
–𝑔'
=
⎪
⎪
⎪
∂𝑥μ
∂𝑥'ν
⎪
⎪
⎪
√
–𝑔
.
(10.1.7)
Тензор кривизны появляется тогда, когда мы вычисляем вариацию величины 𝑆𝑔 по отношению 𝑔μν
δ𝑆𝑔
δ𝑔μν
=
1
2λ²
√
–𝑔
⎛
⎜
⎝
𝑅
μν
–
1
2
𝑔
μν
𝑅
⎞
⎟
⎠
.
(10.1.8)
Это происходит из-за того, что мы можем использовать интеграл от 𝑅 как действие гравитационной части полной задачи.
Позвольте мне отметить, что поскольку этот тензор давления появляется при таком подходе из вариационного принципа, его ковариантная дивергенция с необходимостью равна нулю (это утверждение впервые, я считаю, было отмечено Эддингтоном). Мы увидели эту связь с другого направления, заключающегося в том, что мы могли бы вывести вариационный принцип при условии, что мы исходим из тензора с нулевой дивергенцией. Доказательства, которые мы предлагаем, не являются строгими; мы не беспокоимся о строгости, поскольку факты составляют существо дела, а не их доказательства. Физика может развиваться без доказательств, но мы не можем продолжать развивать теорию без фактов. Доказательства полезны в том смысле, что они являются хорошими упражнениями; если факты верны, тогда доказательства являются предметом игры с корректным использованием алгебры.
Мы хотим показать, что если функционал
𝑆
𝑔
=
∫
𝑑⁴𝑥
∑
[𝑔
μν
]
,
(10.1.8')
есть инвариант при координатных преобразованиях, тогда ковариантная дивергенция вариации 𝑆𝑔 по отношению 𝑔μν тождественно равна нулю. Делая инфинитезимальное преобразование и переходя к штрихованным координатам 𝑥μ→𝑥'μ,
𝑥
μ
=
𝑥'
μ
+
ℎ
μ
(𝑥')
,
(10.1.9)
изменение 𝑔μν задаётся соотношением
𝑔
μν
→
𝑔'
μν
(𝑥')
=
𝑔
μν
(𝑥')
+
ℎ
α
,ν
𝑔
μα
(𝑥')
+
ℎ
α
,μ
𝑔
να
(𝑥')
+
+
ℎ
α
𝑔
μν,α
(𝑥')
.
(10.1.10)
Выражая действие в новых координатах, опуская штрихи у переменных, по которым ведётся интегрирование, инвариантное действие выражается в виде
𝑆
𝑔
=
∫
𝑑⁴𝑥
∑
[𝑔'
μν
]
=
∫
𝑑⁴𝑥
∑
[𝑔
μν
]
+
+
∫
𝑑⁴𝑥
δ∑
δ𝑔μν
(
ℎ
α
,ν
𝑔
μα
+
ℎ
α
,μ
𝑔
να
+
ℎ
α
𝑔
μν,α
).
(10.1.11)
Когда мы производим интегрирование по частям второго слагаемого в правой части этого выражения, мы преобразуем его к выражению, которое включает в себя функциональные производные функции ∑. Мы кладём его равным нулю, так как мы знаем, что изменение в действии должно быть равно нулю при любом ℎα вследствие вида функции ∑
∂
∂𝑥μ
⎡
⎢
⎣
δ∑
δ𝑔μν
𝑔
να
⎤
⎥
⎦
–
1
2
δ∑
δ𝑔μν
∂𝑔μν
∂𝑥α
=
0.
(10.1.12)
Обозначим 𝒢μν вариацию величины 2λ²𝑆𝑔 по отношению к 𝑔μν:
𝒢
μν
=
2λ²
δ𝑆𝑔
δ𝑔μν
.
(10.1.13)
Величина 𝒢μν есть контравариантная тензорная плотность второго ранга. Используя это определение, уравнение (10.1.12) можно переписать в виде
⎛
⎝
𝑔
αμ
𝒢
μν
⎞
⎠,ν
–
1
2
𝑔
μν,α
𝒢
μν
=
0,
(10.1.14)
которое эквивалентно утверждению, что ковариантная дивергенция 𝒢μν равна нулю
𝒢
μν
;ν
=
0.
(10.1.15)
Для демонстрации эквивалентности некоторых соотношений, включающих в себя ковариантные производные, удобно использовать некоторые соотношения, которые мы приведём сейчас для того, чтобы в дальнейшем их использовать. Вначале вычислим свёрнутые символы Кристоффеля.
Используя определение, получим
Γ
μ
εμ
=
𝑔
μσ
[με,σ]
=
1
2
𝑔
μσ
[
𝑔
σμ,ε
+
𝑔
σε,μ
–
𝑔
με,σ
].
(10.1.16)
Второй и третий члены взаимно сокращаются, так как тензор 𝑔μν – симметричен. Оставшийся член содержит обратную матрицу 𝑔μν умноженную на градиент 𝑔μν. Из хорошо известной теоремы об определителях следует, что алгебраическое дополнение 𝑀μν матрицы 𝑔μν связывается с соответствующим элементом обратной матрицы соотношением
𝑔
μν
=
𝑀μν
𝑔
,
(10.1.17)
и таким образом
𝑔
,λ
=
𝑔
μν,λ
𝑀
μν
=
𝑔
μν,λ
𝑔
μν
𝑔
.
(10.1.18)
Следовательно,
𝑔
μν
𝑔
μν,λ
=
[log(-𝑔)]
,λ
,
(10.1.19)
и свёрнутый символ Кристоффеля равен следующему соотношению
Γ
μ
εμ
=
[log(-𝑔)]
,ε
=
1
√-1
(√
–1
)
,ε
.
(10.1.20)
Кроме того, имеются следующие полезные формулы для ковариантных производных. Для скалярных функций ковариантные градиенты оказываются равными обычным градиентам
φ
;ν
=
φ
,ν
.
(10.1.21)
Для контравариантного вектора ковариантная дивергенция есть
𝐴
ν
;ν
1
√-𝑔
⎛
⎝
√
–𝑔
𝐴
ν
⎞
⎠,ν
(10.1.22)
Ковариантный ротор оказывается равным обычному ротору
𝐴
μ;ν
–
𝐴
ν;μ
=
𝐴
μ,ν
–
𝐴
ν,μ
(10.1.23)
Для тензоров второго ранга ответы оказываются различными (в зависимости от симметрии), для антисимметричных тензоров
𝐹
μν
;ν
=
1
√-𝑔
⎛
⎝
√
–𝑔
𝐹
μ
⎞
⎠,ν
если
𝐹
μν
=-
𝐹
μν
.
(10.1.24а)
Для симметричных тензоров
𝑇
ν
μ;ν
=
1
√-𝑔
⎛
⎝
𝑇
μ
ν
√
–1
⎞
⎠,ν
–
1
2
𝑔
αβ,μ
𝑇
αβ
,
если
𝑇
μν
=
𝑇
νμ
.
(10.1.24б)
Используя эти соотношения, путём прямых вычислений можно получить, что соотношения (10.1.14) и (10.1.15) эквивалентны. Таким образом, мы видим, что инвариантность действия приводит к построению тензорной плотности, которая автоматически имеет нулевую ковариантную дивергенцию. Так как ковариантная производная метрического тензора 𝑔μν обращается в нуль, то ковариантная производная (√-𝑔);λ также обращается в нуль. (Заметим для точности, что обычная производная (√-𝑔),λ есть не то же самое, что ковариантная производная, поскольку √-𝑔 есть скалярная плотность, а не скаляр). Тензор, ассоциированный с тензорной плотностью 𝒢μν также является бездивергентным,
𝐺
μν
=
𝒢μν
√-𝑔
,
𝐺
μν
;ν
=
0.
(10.1.25)
В этой связи нам следует прояснить некоторое положение, которое достаточно кратко, но иногда оказывается довольно запутанным. В лекции 6 мы работали с функциональными уравнениями (например, соотношение (6.2.3) того же вида, что и соотношение (10.1.2)); решения этих уравнений являются в действительности тензорными плотностями, а не тензорами. Тензорная плотность 𝒯μν удовлетворяет уравнению
𝒯
μν
,ν
=-
Γ
μ
αβ
𝒯
αβ
,
(10.1.26)
где 𝒯μν=√-𝑔𝑇μν, но тензор энергии-импульса 𝑇μν удовлетворяет следующему соотношению
𝑇
μν
,ν
=-
Γ
μ
αβ
𝑇
αβ
–
1
2𝑔
𝑔
,α
𝑇
μα
.
(10.1.27)
10.2. Действие для классических частиц в гравитационном поле
Следующее, что мы обсудим, это то, как записать общий закон физики, который описывает не только гравитационные поля, но также и вещество. Мы предполагаем, что такой закон может быть выведен из принципа наименьшего действия; математическая формулировка которого состоит в том, что вариация действия равна нулю
δ𝑆
=
δ
∫
𝑑⁴𝑥
ℒ[
𝑔
μν
,
𝐴
μ
, …]
(10.2.1)
Плотность лагранжиана ℒ содержит различные виды полей, например, поле тензора гравитации 𝑔μν, электромагнитное поле 𝐴μ и, если вещество есть скаляр, поле вещества скаляра φ. Когда мы вариируем это действие по отношению к различным полям, мы получаем уравнения распространения для соответствующих полей. Мы написали одну часть этого действия; давайте обозначим ту часть действия, которая ранее была пропущена, через 𝑆𝑚 которая зависит от полей материи φ и электромагнитных полей 𝐴μ и всех других полей, какие мы только знаем. Когда мы вычисляем вариацию от действия
𝑆
=
𝑆
𝑔
+
𝑆
𝑚
=-
1
2λ²
∫
𝑑⁴𝑥
√
–𝑔
𝑅
+
𝑆
𝑚
,
(10.2.2)
по отношению к 𝑔μν, мы получаем следующее уравнение:
δ𝑆𝑔
δ𝑔μν
=
1
2λ²
√
–𝑔
⎡
⎢
⎣
𝑅
μμ
–
1
2
𝑔
μν
𝑅
⎤
⎥
⎦
=-
δ𝑆𝑚
δ𝑔μν
.
(10.2.3)
Тензорная плотность энергии-импульса вещества 𝒯μν должна быть вариационной производной 𝑆𝑚
𝒯
μν
=-
2
δ𝑆𝑚
δ𝑔μν
,
(10.2.4)
в том случае, если тензор 𝑇μν должна быть источником гравитационного поля. Теперь нам понадобится несколько примеров тензора 𝑇μν. Если мы не можем вычислить тензор 𝑇μν, исходя из некоторого физического принципа, тогда нет теории гравитации, так как мы не знаем, каким образом поля связываются с любым другим объектом.
Существуют некоторые требования непротиворечивости, подобные тем, которые мы находим в электродинамике. Для того, чтобы решить уравнения Максвелла, нам необходимо иметь токи. Это должны быть сохраняющиеся токи, а не просто произвольные токи. Сохраняющиеся токи источника, имеющие столь важное значение, получаются путём решения некоторых других задач физики, описываемых некоторым независимым законом, таким как Закон Ома, или Закон Гука, или уравнение Шрёдингера для таких и подобных систем. Если у нас не было таких других законов, то теория электромагнитных полей была бы бесполезной и не имела бы никакого значения.
Для гравитации ситуация более сложная. В тензоре 𝑇μν заключено и движение материи, отсюда следует, что у нас должен быть закон, которому следует материя, включая закон Ома и закон Гука; но также тензор 𝑇μν будет заключать в себе поля гравитации 𝑔μν, обстоятельство, которое запутывает подобные задачи существенно в большей степени, чем в электромагнетизме. Вообще говоря, невозможно написать каким-либо согласованным образом тензор 𝑇μν за исключением вакуума, если не решена уже полная запутанная задача. Беспокойство вызвано тем, что любое точно определённое выражение для тензора 𝑇μν не будет давать решение подобной задачи, за исключением специальных случаев метрического тензора 𝑔μν; полное релятивистское решение должно было бы выполняться вне зависимости от частного выбора координат и кривизны. Даже для очень простых задач у нас нет идей относительно того, каким путём надо следовать, чтобы записать правильным образом тензор 𝑇μν. Мы не знаем, как записать тензор 𝑇μν для того, чтобы описать вращающийся стержень, так что мы не можем вычислить в точности излучение им гравитационных волн. Мы не можем вычислить тензор 𝑇μν для системы, состоящей из Земли и Луны, поскольку приливные силы и силы упругости Земли существенно влияют на гравитационные поля. Если мы предположим, что Земля абсолютно твёрдая, то эти уравнения окажутся несогласованными. Если мы предположим, что Земля есть точка, то уравнения окажутся слишком сингулярными для того, чтобы иметь решения. И несмотря на это, материальный шар с заданной жёсткостью, такой как Земля, будет вращаться вокруг Луны другой массы и жёсткости вне зависимости от того, являются ли рассматриваемые уравнения точно определёнными.
В этом месте теория гравитации оказывается достаточно уязвимой, поскольку одна часть уравнения теории гравитации является замечательно красивой и геометрической, а другая часть нет, она содержит всю ”грязь” закона Гука и других законов, которые определяют поведение материи, которые не являются ни красивыми, ни геометрическими. Очень многие физики оказались настолько загипнотизированными красотой одной части этих уравнений, что они игнорируют другую часть. Тем самым, у них нет физики, которую необходимо было бы исследовать.
Мы должны провести некоторое изучение для того, чтобы понять возможные виды для действия, соответствующего вкладу материи 𝑆𝑚 В качестве исходной точки полезно рассмотреть классические пределы. Если мы правильно запишем классическое действие, то обычно не очень трудно увидеть, каким образом можно обобщить формулы, чтобы они стали инвариантными при произвольных координатных преобразованиях. Удобный способ породить такие обобщённые формулы состоит в том, чтобы возвратиться назад к локально падающей (свободно падающей) касательной координатной системе, разгадать, как добавить в качестве множителей 𝑔μν и 𝑅μν так, чтобы всё выражение оказалось инвариантом. Например, свободная частица, на которую не действуют силы, характеризуется действием
𝑆
𝑚
=-
𝑚₀
2
∫
𝑑𝑠
𝑑𝑧μ
𝑑𝑠
𝑑𝑧μ
𝑑𝑠
.
(10.2.5)
Этот пример иллюстрирует процедуру решения подобных задач; обнаруживается обычно, что такой подход оказывается весьма плодотворным. Мы записываем выражения такими, как они выглядят в плоских координатах, переходим к криволинейным координатам и видим, в какие места входят величины 𝑔μν Часто бывает очевидно, какая общая форма будет приводить к результатам в плоском пространстве. Если 𝑧μ(𝑠) – орбита частицы, которая свободно падает, то соответствующее слагаемое в действие есть
𝑆
𝑚
=-
𝑚₀
2
∫
𝑑⁴𝑥
𝑑𝑠
δ⁴(𝑥-𝑧(𝑠))
𝑔
μν
𝑑𝑧μ
𝑑𝑠
𝑑𝑧ν
𝑑𝑠
.
(10.2.6)
Тензорная плотность энергии-импульса 𝒯μν получается путём варьирования этого слагаемого действия по отношению 𝑔μν что даёт
𝒯
μν
=
𝑚₀
∫
𝑑𝑠
δ⁴(𝑥-𝑧(𝑠))
𝑑𝑧μ
𝑑𝑠
𝑑𝑧ν
𝑑𝑠
.
(10.2.7)
Аналогия с результатами в электродинамике является настолько сильной, что этот результат не выглядит неожиданным. У нас нет волнений, связанных с противоречивостью определения 𝒯μν. Поскольку мы исходили из инвариантных выражений, тензорная плотность 𝒯μν удовлетворяет соответствующему условию на ковариантную производную.
Интересно исследовать связь между уравнениями движения и бездивергентным тензором энергии-импульса с противоположной точки зрения. При записывании действия мы по существу утверждали, что частица движется вдоль геодезической. Таким образом, результирующая тензорная плотность энергии-импульса является бездивергентной. Теперь мы хотим показать обратное. Предположим, что тензор 𝒯μν – ненулевой только в нитеобразной области пространства-времени. Тогда мы можем показать, что эта нитеобразная область есть на самом деле геодезическая при условии, что мы предполагаем нечто эквивалентное сферической симметрии частицы, когда мы смотрим на неё с очень близкого расстояния. Идея состоит в том, чтобы начать с рассмотрения условия, которое связывает обычную дивергенцию 𝒯μν с самой тензорной плотностью 𝒯μν, и произвести интегрирование по частям для того, чтобы преобразовать интегрирование по объёму в интегрирование по пространству
∫
𝑑⁴𝑥
𝒯
μ
ν
,ν
=
1
2
∫
𝑑⁴𝑥
𝑔
αβ,μ
𝒯
αβ
.
(10.2.8)
Если тензорная плотность 𝒯μν равна нулю всюду, за исключением нитеобразной области, вклад в поверхностный интеграл равен нулю за исключением тех мест, где нить пересекает поверхность, и которые соответствуют импульсу частицы ”до” и ”после”, если эти поверхности берутся в постоянный момент времени. Преобразуя этот результат к дифференциальной форме, в конце концов получаем результат, заключающийся в том, что движение следует уравнению геодезических:
𝑑²𝑧μ
𝑑𝑠²
+
Γ
μ
αβ
𝑑𝑧α
𝑑𝑠
𝑑𝑧β
𝑑𝑠
=
0.
(10.2.9)
Возможность такого вывода приводит к утверждению, что уравнения Эйнштейна одновременно определяют движение материи и гравитационных полей. Это утверждение вводит в заблуждение и совершенно не выглядит так замечательно, как это может показаться с первого взгляда. Давайте вспомним, что если у нас есть свободная частица, движущаяся сама по себе вдали от каких-либо других тел, тогда законы сохранения энергии и количества движения определяют полностью её движение. В теории гравитации свободно падающая частица становится эквивалентной свободной частице, так что вновь наличие закона сохранения энергии оказывается достаточным для того, чтобы полностью определить движение. Но обычная физическая ситуация не является настолько простой, как описанная выше. Когда мы имеем нечто большее, чем только гравитация и частица, уравнения движения не следуют только из законов сохранения энергии и импульса. В электродинамике сохранение заряда должно содержаться в каждом решении уравнений Максвелла, так что можно сказать, что этот закон сохранения есть следствие уравнений Максвелла. Но это условие не даёт всего необходимого для того, чтобы построить уравнения движения для зарядов, полей, которые они задают, и сил, с которыми эти заряды действуют друг на друга. Подобно этому в теории гравитации имеет место сохранение энергии и количества движения, но этого не достаточно, чтобы определить движение планет и Луны для случая, когда эти объекты не являются точками, и законы физики, отличные от закона сохранения энергии, требуются для того, чтобы уяснить их поведение в гравитационном поле.
10.3. Действие для материальных полей в гравитационном поле
Следующее, что мы рассмотрим – подготовим переход к квантовой теории. Если скалярные частицы описываются скалярным полем φ, тогда соответствующий вклад в действие есть
𝑆
𝑚
=
1
2
∫
𝑑⁴𝑥
(
φ
,ν
φ
,ν
–
𝑚²φ²
).
(10.3.1)
Легко может быть сделано обобщение на случай криволинейных координат; мы предполагаем, что
𝑆
𝑚
=
1
2
∫
𝑑⁴𝑥
√
–𝑔
(
𝑔
μν
φ
,μ
φ
,ν
–
𝑚²φ²
).
(10.3.2)
Это выражение является очевидным образом инвариантным при произвольных координатных преобразованиях, это есть одно из налагаемых на него требований, и приводится к соответствующему выражению для плоского пространства. Тем не менее, мы можем выписать другие выражения, которые являются идеально правильными инвариантами, квадратичными по полям φ, и которые включают в себя тензор кривизны. Все эти выражения обращаются в нуль в том случае, когда пространство становится плоским. Возможно, что действие должно содержать пропорции α и β соответствующих членов, например,
-α
∫
𝑑⁴𝑥
√
–𝑔
𝑅φ²
+β
∫
𝑑⁴𝑥
√
–𝑔
(
𝑅
μν
φ
,μ
φ
,ν
).
(10.3.3)
Мы видим, что действие, которое мы записываем, не является единственным. Первое слагаемое, которое мы записали, должно здесь присутствовать, так как только оно и приводит к правильному результату для плоского пространства. И нет экспериментального свидетельства о приливных силах и т.д. и т.п., что могло бы быть причиной для включения или невключения других слагаемых, таких как в выражении (10.3.3). Единственная разумная вещь, которую мог бы сделать физик теперь, состоит в том, чтобы выбрать некоторые слагаемые, которые являются ”проще”, чем другие слагаемые, пренебречь более сложными членами в действии и посмотреть, какого рода теорию он получил в результате. В некотором смысле возможно производные есть более сложные объекты, чем просто поля, поэтому член с множителем β является более сложным, поскольку он содержит четыре производных, две в полях и две в тензоре 𝑅μν. Слагаемое с множителем α содержит только две производных, тем не менее обе производных по полю 𝑔μν. Однако трудно определить усложнение теории, которое было бы сделано недвусмысленным образом; всегда возможно провести интегрирование по частям, так что производные исчезают в одном месте и вновь появляются в другом – простота, которая очевидна в случае, если начать формулировать теорию с одной исходной точки, может не соответствовать простоте, которая получилась бы, если теорию формулировали бы, исходя из другой начальной точки. Если нами используется построение квантовой механики, исходя из уравнения Шрёдингера, то простейшее действие, по-видимому, должно быть таким, которое соответствует α=0. Но так как мы начали формулировать квантовую механику, задаваемую через интегралы по траекториям, то простейшее действие кажется должно быть таким, которое соответствует α=1/6. Каждая из возможностей выбора значения а кажется наипростейшей с соответствующей точки зрения. Я не знаю никакого удовлетворительного способа определить величину α и считаю, что определение действия для скалярного поля является неоднозначным.1
1 Современное рассмотрение этой проблемы, включающее в себя обсуждение проблемы спектра атома водорода см. в [Klei 89].
Значение члена, такого как член со множителем β в соотношении (10.3.3), состоит в том, что он характеризует то, должны ли мы иметь дело с частицей, которая может чувствовать гравитационное поле вне области, достаточно большой по сравнению с той, которая характеризуется локальной кривизной. Если частица имеет структуру, которая в некотором смысле инфинитезимально мала, тогда она не может чувствовать кривизну. Но если, что скорее всего, частица, двигаясь, совершает движение типа штопора в окрестности своего положения, то член, включающий в себя локальную кривизну, может быть очень хорошо представлен.
Мы приведём пример, рассматривая ситуацию в электродинамике, как иное исходное положение приводит к иному ответу достаточно безобидным путём. Здесь принцип минимального электромагнитного взаимодействия приводит к замене
∂
∂𝑥μ
→
⎛
⎜
⎝
∂
∂𝑥μ
–
𝑖𝑒
𝐴
μ
⎞
⎟
⎠
(10.3.4)
в лагранжиане. Предположим теперь, что перед тем, как мы сделали такую замену, мы записали интеграл от лагранжиана следующим образом:
𝑆
=
∫
𝑑𝑉
ψ
γ
μ
∂
∂𝑥μ
ψ
–
∫
𝑑𝑉
ψ
𝑚ψ
+
+
ε
∫
𝑑𝑉
ψ
(
γ
μ
γ
ν
–
γ
ν
γ
μ
)
∂
∂𝑥μ
∂
∂𝑥ν
ψ
.
(10.3.5)
Последнее слагаемое не записывается при обычном изложении теории, поскольку оно тождественно равно нулю, причём потому, что оно в точности равно нулю, не может быть никакого твёрдого и надёжного правила относительно того, как отбросить этот член. Тем не менее, когда мы делаем замену градиента в соответствии с соотношением (10.3.4) для того, чтобы включить электромагнетизм, результирующий лагранжиан оказывается не тем же, каким он был до преобразования; лагранжиан имеет дополнительное слагаемое,
ε
γ
μ
γ
ν
𝐹
μν
.
(10.3.6)
где 𝐹μν=𝐴μ,ν-𝐴μ,ν Этот член есть член аномального момента, открытого Паули. (Впервые это было сообщено мне Вентцелем.)
Электродинамика частиц спина 1 усложняется также аномальными квадрупольными моментами. Очевидно, не существует более простого выражения для лагранжиана, который можно записать, так что в теоретических работах должны представляться вычисления с альтернативными теориями, которые соответствуют различным аномальным моментам.
В нашей теории гравитации ситуация аналогична. Это как если бы частица обладала аномальным моментом инерции, добавляемым к обычному моменту инерции, обусловленному распределением массы.
В электромагнетизме подобные неоднозначности не появляются при описании частиц с нулевым спином – они впервые появляются при описании частиц со спином 1/2. С другой стороны, в гравитации трудности возникают даже при обсуждении простейшего случая скалярных частиц. Не существует решения для преодоления таких трудностей – мы должны признать, что множество альтернативных теорий (различных значений α) оказывается возможным.
Движение частицы в заданном гравитационном поле описывается уравнением, которое получается, когда мы вариируем действие по отношению к полю φ. В зависимости от того, как мы переходим к квантовой механике, различные варианты действия приводят к простейшим результатам. Таким образом, мы не можем доказать, что что-либо проще, если это не приводит к одновременной простоте при решении множества различных задач. Для различных задач необходимо выбрать различные значения а для того, чтобы упростить решение, или для того, чтобы отказаться от производных. Если положить α=0, то тогда мы приходим к ковариантной простоте только в том смысле, что требуется меньше алгебраических вычислений при таком исходном положении. При этом нет какой-либо подразумеваемой физической простоты, так как все значения α приводят к различным степеням сложности или в той, или в другой задаче.
Давайте приступим к получению уравнений движения поля материи φ. Исходя из соотношения (10.3.2), мы можем использовать следующие вариации обратной матрицы и квадратного корня от детерминанта:
δ𝑔
μν
=-
𝑔
μα
𝑔
νβ
δ𝑔
αβ
,
δ(√
–𝑔
)
=
1
2
√
–𝑔
𝑔
αβ
δ𝑔
αβ
,
(10.3.7)
для того, чтобы получить следующее выражение для 𝒯μν:
𝒯
μν
=
–2
δ𝑆𝑚
δ𝑔μν
=
√
–𝑔
φ
;μ
φ
;ν
–
1
2
√
–𝑔
𝑔
μν
(
φ
;α
φ
;α
–
𝑚²φ²
)-
-α
√
–𝑔
⎛
⎜
⎝
𝑅
μν
–
1
2
𝑔
μν
𝑅
⎞
⎟
⎠
φ²
–
4αφφ
;β
√
–𝑔
δ𝑅
δ𝑔μν,β
.
(10.3.8)
Далее мы вычисляем вариацию по отношению к полю φ и кладём вариацию равной нулю для того, чтобы получить нечто, что является аналогичным уравнению Клейна – Гордона
⎛
⎝
√
–𝑔
𝑔
μν
φ
,ν
⎞
⎠μ
+
√
–𝑔
𝑚²φ
+
2α𝑅
√
–𝑔
φ
=
0.
(10.3.9)
Получим уравнение, в котором тензоры появляются путём деления на скалярную плотность √-𝑔
1
√-𝑔
⎛
⎝
√
–𝑔
𝑔
μν
φ
,ν
⎞
⎠μ
+
𝑚²φ
+
2α𝑅
φ
=
0.
(10.3.10)
Используя соотношения (10.1.20) и (10.1.21), мы видим, что последнее уравнение может быть переписано в виде
φ
;μμ
+
(
𝑚²
+
2α𝑅
)
φ
=
0.
(10.3.11)
Связь с уравнением Клейна – Гордона может быть замечена при рассмотрении случая α=0; обычный даламбертиан просто заменён на его ковариантный аналог, ковариантный даламбертиан.
Предшествующие шаги дали нам вполне определённую теорию, поскольку мы точно определили, как движется материя и какой есть тензор источника. Легко проверить, что для тензора, который мы выписали, ковариантная дивергенция 𝒯μν;ν равна нулю, трюк здесь состоит в том, чтобы использовать каждый раз, когда это необходимо, сами полевые уравнения. Таким образом, ход рассуждений оказывается последовательным, все соответствующие тензоры являются бездивергентными, и это оказывается достаточно существенным, чтобы в рассуждениях исходить из этого. Для того, чтобы построить более полную теорию, мы добавляем дополнительные члены к действию так, чтобы представить другие известные поля. Мы записали сначала действие в плоском пространстве, так как мы знаем это; исходя из некоторого вида критерия, мы выберем наипростейшую форму для действия, которое есть инвариант. Требование, что действие должно быть инвариантом, приводит к ковариантным уравнениям для полей. Это не является ограничением на то, какие известные поля мы можем включить в рассмотрение, поскольку все известные законы физики могут быть ковариантным образом записаны. Дифференциальные законы обладают этим свойством. Любой закон, записанный как дифференциальное уравнение, может быть легко преобразован к ковариантной форме; мы предполагаем, что в касательном пространстве этот закон оказывается тем же самым, каким мы его знаем, затем мы вращаем и растягиваем координаты. Результирующие уравнения включают в себя производные полей вплоть до второй производной метрического тензора.