Текст книги "Фейнмановские лекции по гравитации"
Автор книги: Ричард Фейнман
сообщить о нарушении
Текущая страница: 14 (всего у книги 22 страниц)
∂𝑥α
∂𝑥'μ
=
δ
α
μ
+
𝑎
α
μν
𝑥'
ν
+
1
2
𝑏
α
μνσ
𝑥'
ν
𝑥'
σ
.
(8.5.3)
В этом частном касательном пространстве метрические тензоры могут быть записаны в достаточно общем виде как
𝑔'
αβ
=
η
αβ
+
1
2
𝑥'
σ
𝑥'
τ
𝑔
0
'
αβ,στ
,
𝑔
αβ
=
η
αβ
+
1
2
𝑥
σ
𝑥
τ
𝑔
0
αβ,στ
.
(8.5.4)
Верхний индекс ”0” означает то, что рассматриваемая величина берётся в точке касания 𝑥₀. Мы получаем соответствующие инвариантные комбинации, рассматривая то, что мы имеем две произвольные системы координат в касательном пространстве, и требуем, что одни и те же формулы должны выполняться в обоих случаях. Так как эти пространства – касательные, то производные координат могут отличаться только квадратичными членами, так что
𝑎
α
μν
=
0.
(8.5.5)
Тогда необходимо только подставить одно преобразование в другое. Подставляя закон преобразования используя соотношения (8.5.3) для производных, находим
𝑔'
αβ
=
𝑔
μν
∂𝑥μ
∂𝑥'α
∂𝑥ν
∂𝑥'β
=
=
η
αβ
+
1
2
(
𝑔
0
αβ,στ
+
η
αν
𝑏
ν
βστ
+
η
βν
𝑏
ν
αστ
)
𝑥'
σ
𝑥'
τ
.
(8.5.6)
Для вторых производных величин имеем следующие соотношения
𝑔'
0
αβ,στ
=
𝑔
0
αβ,στ
+
𝑏
αβστ
+
𝑏
βαστ
,
(8.5.7)
где
𝑏
αβστ
≡
η
αν
𝑏
ν
βστ
.
Теперь, когда мы имеем эти соотношения, мы хотим получить линейные комбинации вторых производных компонентов метрики, которые не имели бы величин 𝑏αβστ. Мы используем тот факт, что величины 𝑏αβστ полностью симметричны по их трём последним индексам, в то время как 𝑏αβ,στ симметричны только по индексам στ. Переставим индексы (β↔σ) и, вычитая соответствующие выражения, получим
𝑔'
0
αβ,στ
–
𝑔'
0
ασ,βτ
–
𝑔
0
αβ,στ
+
𝑔
0
ασ,βτ
=
𝑏
βαστ
–
𝑏
σαβτ
.
(8.5.8)
Индексы (ατ) входят абсолютно симметрично в правую часть этого соотношения, но это утверждение не обязательно для левой части. Следовательно, при антисимметрировании по индексам (α-τ) мы получаем следующее соотношение
𝑅
ατβσ
=
1
2
(
𝑔
0
αβ,στ
–
𝑔
0
ασ,βτ
–
𝑔
0
τβ,σα
+
𝑔
0
τσ,βα
),
(8.5.9)
величину, которая равна самой себе в штрихованной системе координат. Таким образом, имеется двадцать линейных комбинаций, которые мы искали. Эта величина не является тензором; она не является достаточно общей; она определяется только в месте, в котором обращаются в нуль результирующие поля. Эти линейные комбинации являются несократимыми частями гравитационного тензора, теми, которые не могут быть устранены преобразованием системы координат. Они представляют чисто приливные силы. Таким образом, теперь мы имеем определённый рецепт для нахождения кривизны. Сначала найти преобразование (к римановым нормальным координатам), которое связывает величины 𝑔μν с величинами ημν, причём первые производные компонент 𝑔μν равны нулю. Тогда выраженные через преобразованные компоненты 𝑔μν величины, определяющие кривизну, задаются соотношениями (8.5.9). Эти соотношения остаются теми же самыми в любой координатной системе. Оставшаяся задача состоит в том, чтобы выразить 𝑅ατβσ через исходные произвольные координаты и исходные компоненты 𝑔μν.
8.6. Кривизна как величина, относящаяся к произвольным координатам
Вывод выражений для кривизны через общие координаты происходит наиболее гладким образом при использовании способа, состоящего в последовательном восхождении по ступенькам к искомому результату. Далее, мы снимаем ограничение на первые производные (которые теперь могут быть не равными нулю), но оставляем координаты локально ортогональными; тогда выражения 𝑔μν и 𝑔'μν следующие
𝑔
αβ
=
η
αβ
+
𝑔
0
αβ,μ
𝑥
μ
+
1
2
𝑔
0
ασ,μν
𝑥
μ
𝑥
ν
,
𝑔'
αβ
=
η
αβ
+
1
2
𝑔'
0
αβ,στ
𝑥'
σ
𝑥'
τ
.
(8.6.1)
Величина 𝑔' есть та же самая, что и была ранее с нулевыми первыми производными. Так как мы уже выбрали вторые производные, нам необходимо только рассмотреть преобразование типа
𝑥
α
=
𝑥'
α
+
1
2
𝑎
α
μν
𝑥'
μ
𝑥'
ν
.
(8.6.2)
Кубические члены не будут влиять на правильность приводимого ниже результата. Выражение для первых производных
∂𝑥α
∂𝑥'μ
=
δ
α
μ
+
α
α
μν
𝑥'
ν
(8.6.3)
вставляем в уравнение, выражающее 𝑔' через 𝑔,
η
αβ
+
1
2
𝑔'
0
αβ,στ
𝑥'σ
𝑥'τ
=
η
αβ
+(
𝑔
0
αβ,σ
+
𝑎
βασ
+
𝑎
αβσ
)
𝑥'
σ
+
+
𝑥'
σ
𝑥'
τ
⎡
⎢
⎣
𝑎
ρ
ασ
𝑎
ρβτ
+
𝑎
ρ
ατ
𝑔
0
ρβ,σ
+
𝑎
ρ
βτ
𝑔
0
ρα,σ
+
+
1
2
𝑎
ρ
στ
𝑔
0
αβ,ρ
+
1
2
𝑔
αβ,στ
⎤
⎥
⎦
,
(8.6.4)
где 𝑎αβσ=ηαμ𝑎μβσ Члены, соответствующие первым производным, будут равными нулю при следующем выборе 𝑎αμν:
𝑎
βασ
+
𝑎
αβσ
=-
𝑔
0
αβ,σ
.
(8.6.5)
Нам необходимо решить это уравнение таким образом, чтобы 𝑎αμν было выражено через
𝑔
0
αβ,σ
исходной системы координат. Эта процедура делается с использованием обычных приёмов; вычитаем уравнение, полученное перестановкой (α,σ), затем собираем подобные члены и т.д., и получаем следующее соотношение:
𝑎
σαβ
=-
1
2
⎡
⎣
𝑔
0
σα,β
+
𝑔
0
σβ,α
–
𝑔
0
αβ,σ
⎤
⎦
=-
[αβ,σ]⁰
.
(8.6.6)
Из соотношения (8.6.4) видно, что
𝑔'
0
αβ,στ
есть (удвоенное) выражение в квадратных скобках в правой части соотношения (8.6.4) с заменой 𝑎σαβ в соответствии с соотношением (8.6.6). Эти величины
𝑔'
0
αβ,στ
теперь могут быть заменены на
𝑔
0
αβ,στ
в соотношении (8.5.9) для того, чтобы найти компоненты кривизны, выписанные через старые координаты (ограниченные только тем, что они должны быть локально ортогональными), следующим образом:
𝑅
ατβσ
=
1
2
(
𝑔
αβ,στ
–
𝑔
ασ,βτ
–
𝑔
τβ,αβ
+
𝑔
τσ,αβ
)+
+
[ρσ,α]
η
ρλ
[τβ,λ]
–
[ρβ,α]
η
ρλ
[τσ,λ]
.
(8.6.7)
Осталось только ортогонализировать первоначально произвольные координаты. Это может быть сделано линейным преобразованием:
𝑥
α
=
𝐿
α
μ
𝑥'
μ
.
(8.6.8)
Всё, что осталось нам сделать, состоит в том, чтобы выбрать
𝑔'
0
αβ
=
η
αβ
,
(8.6.9)
и переписать все соотношения ещё раз. Производные при выбранном преобразовании определяются матрицей 𝐿αμ, и мы имеем
𝑔'
μν
=
𝐿
α
μ
𝐿
β
ν
𝑔
αβ
=
η
μν
.
(8.6.10)
Среди соотношений, которые могут быть получены, имеется следующее соотношение:
η
αβ
𝐿
α
σ
𝐿
β
μ
=
𝑔
σμ
.
(8.6.11)
Что же происходит с различными членами? Поскольку
∂
∂𝑥'α
=
∂
∂𝑥μ
∂𝑥μ
∂𝑥'α
=
𝐿
μ
α
∂
∂𝑥μ
,
(8.6.12)
то, следовательно, (в последующих соотношениях латинские индексы соответствуют штрихованным координатам)
𝑔'
𝑚𝑛,𝑠𝑡
=
𝐿
σ
𝑠
𝐿
τ
𝑡
𝐿
μ
𝑚
𝐿
ν
𝑛
𝑔
μν,στ
,
(8.6.13)
𝑎'
𝑟𝑚𝑛
=
𝐿
ρ
𝑟
𝐿
μ
𝑚
𝐿
ν
𝑛
𝑎
ρμν
,
(8.6.14)
η
𝑟𝑞
𝑎'
𝑟𝑚𝑛
𝑎'
𝑞𝑠𝑡
=
η
𝑟𝑞
𝐿
ρ
𝑟
𝐿
λ
𝑞
𝐿
μ
𝑚
𝐿
ν
𝑛
𝐿
σ
𝑠
𝐿
τ
𝑡
𝑎
ρμν
𝑎
λστ
.
(8.6.15)
Когда мы вставляем эти соотношения в выражения для компонент 𝑅, мы получаем, что 𝑅 не является более инвариантом. Окончательное выражение для 𝑅 (при выводе которого используется соотношение (8.6.11)) имеет следующий вид:
𝑅
ατβσ
=
1
2
(
𝑔
αβ,στ
–
𝑔
ασ,βτ
–
𝑔
τβ,ασ
+
𝑔
τσ,αβ
)+
+
[ρσ,α]
𝑔
ρλ
[τβ,λ]
–
[ρβ,α]
𝑔
ρλ
[τσ,λ]
,
(8.6.16)
а закон преобразования имеет вид:
𝑅'
𝑚𝑛𝑠𝑡
=
𝐿
μ
𝑚
𝐿
ν
𝑛
𝐿
σ
𝑠
𝐿
τ
𝑡
𝑅
μνστ
.
(8.6.17)
8.7. Свойства Великого Тензора Кривизны
Хотя величины 𝑅μνστ не являются инвариантами, они образуют тензор, как можно было бы заключить из закона преобразования (8.6.17). Легко можно показать, что тензор определяется только двадцатью величинами, как мы ранее и утверждали. Выражения (8.5.9) были получены путём антисимметризации по индексам (α,τ) и впоследствии по (β,σ). Имеются следующие симметрии для компонент тензора:
𝑅
ατβσ
=-
𝑅
ταβσ
,
(а)
=-
𝑅
ατσβ
,
(б)
=+
𝑅
βσατ
.
(в)
(8.7.1)
Следующее алгебраическое соотношение содержится неявно в соотношении (8.5.9) (и, следовательно, в соотношении (8.6.16)):
𝑅
ατβσ
+
𝑅
αστβ
+
𝑅
αβστ
=
0.
(8.7.2)
Давайте посчитаем число независимых компонент тензора кривизны. Первый индекс может не быть равным второму, третий не может быть равным четвёртому. Только антисимметричные комбинации могут быть не равны нулю – мы напоминаем, что имеется шесть возможно ненулевых компонент для антисимметричного тензора второго ранга, так что за исключением симметрии, связанной с перестановкой первой пары и второй пары, здесь имелось бы 36 компонентов; последняя же симметрия (8.7.1в) уменьшает это число до (6 × 7)/2 = 21. Алгебраическое соотношение, определяемое (8.7.2), содержит только одно нетривиальное ограничение. Если два индекса являются одинаковыми, то соотношение (8.7.2) является тождеством, поскольку имеются симметрии в соотношениях (8.7.1). Например,
𝑅
1τ1σ
+
𝑅
1στ1
+
𝑅
11στ
=
𝑅
1τ1σ
–
𝑅
1τ1σ
+
0
=
0.
(8.7.3)
Так что все индексы должны быть различными для того, чтобы это алгебраическое соотношение имело смысл. Но когда все индексы различны (1,2,3,4), то имеется только одно дополнительное уравнение. Итак, в общем случае имеется только двадцать независимых компонент Великого Тензора Кривизны (Тензора Римана).
То, в чем мы нуждаемся для построения нашей теории, это не тензор, а полностью инвариантная величина, которая может быть подставлена в лагранжиан. (Вместо этого, Эйнштейн говорил, что Тензор Энергии-Импульса равен другому тензору, которые получается из тензора кривизны.) Принцип наименьшего действия должен включать в себя интеграл по всему пространству, который должен быть полностью инвариантным под действием преобразований. Подынтегральное выражение должно быть мировой скалярной величиной
∫
𝑑𝑥
𝑑𝑦
𝑑𝑧
𝑑𝑡
(Скаляр) = (Скалярный инвариант).
(8.7.4)
Мы получим такой скаляр, поднимая индексы тензора кривизны и свёртывая по парам верхних и нижних индексов. Мы можем, например, поднять первый индекс
𝑔
αλ
𝑅
ατβσ
=
𝑅
λ
τβσ
.
(8.7.5)
Но если в этом месте мы проведём свёртывание по первой паре индексов, то эта величина, к сожалению, обращается в нуль
𝑅
τ
τβσ
≡
0.
(8.7.6)
То, что необходимо сделать сначала, состоит в уменьшении ранга тензора и свёртывании по первому и последнему индексам
𝑔
ασ
𝑅
ατβσ
=
𝑅
τβ
.
(8.7.7)
(Заметим, что одну и ту же букву 𝑅 удобно использовать для всех тензоров, получаемых из тензора кривизны.) Этот тензор второго ранга (тензор Риччи) – симметричен. Затем мы вновь уменьшаем ранг тензора для того, чтобы получить нашу скалярную величину (”скалярную кривизну”) для подынтегрального выражения
𝑔
ασ
𝑔
τβ
𝑅
ατβσ
=
𝑔
τβ
𝑅
σ
τβσ
=
𝑅
σβ
βσ
=
𝑅.
(8.7.8)
Теперь интеграл по объёму от этого скаляра не является инвариантом, поскольку элемент объёма не является скаляром; величина 𝑑𝑥𝑑𝑦𝑑𝑧𝑑𝑡 меняется при изменении координат, причём это изменение определяется определителем матрицы 𝐿αμ. Таким образом, интеграл от инварианта есть
∫
𝑑𝑥
𝑑𝑦
𝑑𝑧
𝑑𝑡
𝑅
√
–𝑔
.
(8.7.9)
Это выражение определяет действие Эйнштейна—Гильберта для пустого пространства [Hilb 15].
Лекция 9
9.1. Модификация электродинамики, требуемая принципом эквивалентности
Принцип Эквивалентности постулирует, что ускорение будет неотличимым от гравитации в каком бы то ни было эксперименте. В частности, ускорение не может быть отличимо от гравитации по наблюдению электромагнитного излучения. В этом месте у нас возникает некоторое беспокойство, так как мы унаследовали предрассудок, что ускоренно движущийся заряд должен излучать, тогда как мы не ожидаем, что заряд, находящийся в гравитационном поле, излучает. Тем не менее, это обусловлено не ошибкой в нашем утверждении эквивалентности, а тем фактом, что закон, описывающий мощность излучения ускоренно движущегося заряда
𝑑𝑊
𝑑𝑡
=
2
3
𝑒²
𝑐³
𝑎²
,
(9.1.1)
вводит нас в заблуждение. Обычно этот закон выводится из вычисления потока из теоремы Пойнтинга вдали от заряда, и это справедливо только для круговых движений или, по крайней мере, движений, для которых характерен бесконечный рост во времени (как имеет место для постоянного ускорения). Этого закона оказывается недостаточно для того, чтобы сказать нам, ”когда” электромагнитная энергия излучается. Ответ на этот вопрос может определяться только путём нахождения силы радиационного трения, которая есть (2/3)⋅(𝑒²/𝑐³)𝒂̇. Работа против этой силы представляет собой потери энергии. Для постоянного ускорения эта сила равна нулю. Вообще говоря, работа, совершаемая против этой силы, может быть записана в виде
𝑑𝑊
𝑑𝑡
=-
2
3
𝑒²
𝑐³
𝒗⋅𝒂̇
=
2
3
𝑒²
𝑐³
𝒂⋅𝒂
–
2
3
𝑒²
𝑐³
𝑑
𝑑𝑡
(𝒗⋅𝒂),
(9.1.2)
дающая правильное выражение для 𝑑𝑊/𝑑𝑡 Для круговых или ограниченных движений средний вклад последнего члена по достаточно большому времени мал или равен нулю (через один цикл, так как величина 𝒗⋅𝒂 сохраняет своё значение, то его вклад равен нулю) и для вычисления мощности излучения достаточно более простого соотношения (9.1.1).
Конечно, в гравитационном поле законы электродинамики Максвелла должны быть модифицированы для того, чтобы удовлетворить принцип относительности. В конце концов законы Максвелла предсказывают, что фотон должен двигаться по прямой линии, и обнаружено, что фотон искривляется звездой ("падает на звезду”). Ясно, что некоторое взаимодействие между гравитацией и электродинамикой должно быть включено в более точную формулировку законов электричества для того, чтобы сделать их согласованными с принципом эквивалентности.
Мы не будем завершать построение нашей теории гравитации до тех пор, пока мы не обсудим такие модификации электродинамики, а также механизмы излучения, приёма и поглощения гравитационных волн.
9.2. Ковариантные производные тензоров
В предыдущей лекции мы видели, как понятие кривизны возникает при обсуждении геометрических измерений. Мы можем получить более интересное представление о том, как четырёхмерная кривизна будет влиять на наш взгляд на физику, рассматривая более удачное приближение, которое состоит в том, чтобы определить кривизну как величину, описывающую, что происходит с вектором при перемещении его в пространстве. Давайте представим вновь наш двумерный мир. Если мы используем плоские евклидовы координаты, то постоянное векторное поле, существующее в пространстве, описывается постоянными компонентами. Если мы используем некоторые другие координаты, в общем случае искривлённые, постоянное векторное поле описывается компонентами, которые меняются от точки к точки. Хорошо знакомый пример состоит во введении на плоскости полярных координат, в которых постоянный вектор описывается компонентами
(
𝐴 cosθ
+
𝐵 sinθ
)=
𝐹
𝑟
,
(
𝐵 cosθ
–
𝐴 sinθ
)=
𝐹
θ
.
(9.2.1)
Первое, что мы должны сделать состоит в том, чтобы получить соотношения, которые позволят нам сравнить физически значимое различие между тензором в данной точке и его значением в окружающих точках. По сути дела мы хотим описать изменение тензора, которое до известной степени исключало бы изменения компонентов, вызываемые произвольным выбором координат. Например, мы хотим сравнить вектор в точке 𝑥μ с другим вектором, находящимся в точке, характеризуемой инфинитезимальным смещением 𝑑𝑥μ от заданной точки, перенесением одного из векторов, остающегося постоянным (более точно, остающегося параллельным самому себе) в некоторую другую точку.
Для скалярной функции (тензора нулевого ранга) подобная проблема не составляет проблем. Обычное градиентное преобразование определяется соотношением
∂φ
∂𝑥'ν
=
∂𝑥σ
∂𝑥'ν
∂φ
∂𝑥σ
,
(9.2.2)
так что градиент скаляра есть очевидно ковариантный вектор. Тем не менее, обычные градиенты векторов или тензорных величин более высокого порядка не являются тензорами; в этом случае в законе преобразования имеются члены, зависящие от случайности при выборе координат. Мы выводим соответствующее выражение для производной путём рассмотрения, как такие объекты выглядят в касательном пространстве. Так как касательное пространство – плоское, производные компонентов не содержат членов, обусловленных искривлением координат, и градиенты векторов по отношению к плоским координатам являются тензорами. Мы получим соотношение для этих тензоров в любых координатах, делая обратное преобразование от плоского пространства к произвольным координатам. Как обычно, мы употребляем разложения для того, чтобы получить такие соотношения. (”Штрихованные” координаты соответствуют плоскому пространству.) Пусть
𝑥
ν
=
𝑥'
ν
+
1
2
𝑎
ν
στ
𝑥'
σ
𝑥'
τ
+
… ,
∂𝑥ν
∂𝑥'μ
=
δ
μ
ν
+
𝑎
ν
στ
𝑥'
σ
+
… .
(9.2.3)
Используя первые члены разложения, получим
𝐴
μ
(𝑥)
=
∂𝑥ν
∂𝑥'μ
𝐴'
ν
(𝑥')
.
Поскольку мы можем переписать выражение для производной, используя соотношение (9.2.3), то получим
𝐴
μ
(𝑥)
=
𝐴'
μ
(𝑥')
+
𝑎
ν
μλ
𝑥'
λ
𝐴'
ν
(𝑥')
+
… .
(9.2.4)
Теперь возьмём градиент этого выражения по отношению к произвольным координатам и вычислим эту величину в начале координат
⎛
⎜
⎝
∂𝐴μ
∂𝑥σ
⎞
⎟
⎠₀
=
∂
∂𝑥'τ
⎛
⎜
⎝
𝐴'
μ
(𝑥')
+
𝑎
ν
μλ
𝑥'
λ
𝐴'
ν
(𝑥')
⎞
⎟
⎠₀
⎛
⎜
⎝
∂𝑥'τ
∂𝑥σ
⎞
⎟
⎠₀
=
∂𝐴'μ(𝑥')
∂𝑥'σ
+
𝑎
ν
μσ
𝐴'
ν
(𝑥')
.
(9.2.5)
Именно поскольку эта величина берётся в начале координат, все члены, линейные по 𝑥', равны нулю. Таким образом, мы получаем производную ”для плоского пространства” на языке произвольных координат
⎡
⎢
⎣
∂𝐴μ
∂𝑥σ
–
𝑎
ν
μσ
𝐴
ν
⎤
⎥
⎦
=
∂𝐴'μ
∂𝑥'σ
.
(9.2.6)
Если теперь мы запишем 𝑎νμσ через метрические тензоры, то мы получаем соотношение для ”более правильной” производной. Эта величина является тензором и известна как ковариантная производная вектора 𝐴τ. Для того, чтобы отличить эту производную от градиентов, мы будем использовать точку с запятой для обозначения ковариантного дифференцирования
𝐴
μ;τ
≡
∂𝐴μ
∂𝑥τ
–
Γ
σ
μτ
𝐴
σ
.
(9.2.7)
Доказательство того, что эта величина есть тензор, достаточно утомительно, но очень просто; всё, что для этого требуется, состоит в том, чтобы преобразовать все координаты к координатам в плоском пространстве, непосредственно вычислить производную и затем проверить полученный закон преобразования. Правило для дифференцирования контравариантного вектора аналогично предыдущему
𝐴
μ
;σ
≡
∂𝐴μ
∂𝑥σ
–
Γ
σ
μτ
𝐴
τ
.
(9.2.8)
Последнее соотношение может быть доказано более просто, если мы исходим из соотношения (9.2.7) и используем метрический тензор для поднятия и опускания индексов; перестановка метрических тензоров приводит к тому, что величина Γ меняет знак. Для того, чтобы вычислять ковариантную производную тензора, имеющего много индексов, получаем следующее правило
𝑇
μν
ρ;σ
≡
∂𝑇μνρ
∂𝑥λ
+
Γ
μ
λσ
𝑇
σν
ρ
+
Γ
ν
λσ
𝑇
μσ
ρ
–
Γ
σ
λσ
𝑇
μν
σ
.
(9.2.9)
Другими словами, каждый индекс приводит к тому, что добавляется член, который включает в себя Γ и сам тензор. Вряд ли нужно какое-либо другое мнемоническое правило; ковариантная производная вычисляется одинаково для верхних и нижних индексов, причём вычисление производной для верхних индексов идентифицируется со знаком "+", а для нижних индексов со знаком "-", тем самым только это и надо запомнить.
Наиболее хорошо известный пример таких преобразований – это формула для ротора вектора в сферических координатах; эти формулы всегда включают в себя обычные производные, умноженные на величины компонентов этого вектора.
Полезно ещё одно соотношение для ковариантных производных. Так как ковариантные производные метрического тензора равны нулю, как легко может быть показано,
𝑔
μν
;σ
=
0,
(9.2.10)
то следующее правило применимо для произведения
(𝐴
μ
𝐵
ν
)
;σ
=
𝐴
μ
𝐵
ν
;σ
+
𝐴
μ
;σ
𝐵
ν
.
(9.2.11)
Для того, чтобы показать, что подобные соотношения действительно связывают тензорные величины, всегда допустимо так выбрать координаты, чтобы сделать доказательство проще; тензоры являются такими математическими величинами, что тензорные соотношения, доказанные в одной координатной системе, остаются справедливыми для всех других координат. Последнее соотношение легко может быть доказано при использовании перехода к плоскому касательному пространству; ковариантная производная равна обычной производной в таком пространстве.
Одно из действий кривизны состоит в том, что вторая ковариантная производная не коммутирует с первой. Мы можем явно вычислить такие величины путём повторяющегося использования соотношения (9.2.9). Сначала получаем, что
𝐴
μ
;σ;τ
=
[𝐴
μ
;σ
]
;τ
=
∂[𝐴μ;σ]
∂𝑥τ
+
Γ
μ
τλ
[𝐴
λ
;σ
]
–
Γ
λ
στ
[𝐴
μ
;λ
]
,
(9.2.12)
и повторное дифференцирование даёт нам
𝐴
μ
;σ;τ
=
∂²𝐴μ
∂𝑥τ∂𝑥σ
+
∂
∂𝑥τ
⎛
⎝
Γ
μ
σλ
𝐴
λ
⎞
⎠
+
+
Γ
μ
τλ
⎛
⎜
⎝
∂𝐴λ
∂𝑥σ
+
Γ
λ
σρ
𝐴
ρ
⎞
⎟
⎠
–
Γ
λ
στ
⎛
⎜
⎝
∂𝐴μ
∂𝑥λ
+
Γ
μ
λρ
𝐴
ρ
⎞
⎟
⎠
.
(9.2.13)
Некоммутативность порядка операций взятия ковариантных производных видна, когда мы вычисляем их разность
𝐴
μ
;στ
–
𝐴
μ
;τσ
=
⎡
⎣
Γ
μ
σρ,τ
–
Γ
μ
τρ,σ
+
Γ
μ
τλ
Γ
λ
ρσ
–
Γ
μ
σλ
Γ
λ
ρτ
⎤
⎦
𝐴
ρ
.
(9.2.14)
Множитель, на который умножается вектор 𝐴ρ, должен быть тензором, поскольку величина в левой части последнего соотношения является разностью тензоров. Этот множитель в точности является тензором кривизны, так что
𝐴
μ
;στ
–
𝐴
μ
;τσ
=
𝑅
μ
ρστ
𝐴
ρ
.
(9.2.15)
9.3. Параллельный перенос вектора
Тот факт, что тензор кривизны появляется в связи с вычислением второй ковариантной производной, служит нам той путеводной нитью, которая позволяет нам дать другую полезную геометрическую интерпретацию кривизны. Свойство некоммутативности вторых производных представляет собой предел разности векторов в том случае, если мы вначале перемещаем его вдоль оси σ, затем вдоль оси τ или сначала вдоль оси τ, затем вдоль оси σ. Если координаты плоские, то для постоянного вектора нет отличий. Если мы имеем искривлённое пространство и если мы делаем такие перемещения в различном порядке, то мы находим некоторый результирующий вектор. Значимость подобных рассмотрений для получения физических утверждений становится очевидной, когда мы осознаем, что мы не имеем физического способа определения ”подлинно постоянного” векторного поля, за исключением того, чтобы сказать, что это такое векторное поле, чьи компоненты имеют нулевые производные в касательном пространстве.
Рис. 9.1.
Как кривизна появляется при рассмотрении переноса вектора, остающегося параллельным самому себе при перемещении его по поверхности, хорошо иллюстрируется в сферической геометрии. Мы будем представлять себе, что мы переносим маленький вектор с северного полюса по меридиану до экватора, затем вдоль экватора на угол θ и возвращаем его назад на северный полюс, как показано на рис. 9.1, причём всегда переносим вектор таким образом, чтобы он оставался параллельным самому себе и был направлен на юг. Когда мы возвращаем вектор назад на северный полюс, мы видим, что наш вектор повернулся на угол θ. Кривизна 𝐾 поверхности определяется через угол, на который вектор поворачивается в том случае, если мы рассматриваем перенос этого вектора вдоль инфинитезимальной замкнутой траектории. Для поверхности
δθ
=
(Площадь внутри замкнутой кривой)
⋅
𝐾
.
(9.3.1)
Для случая треугольника на сферической поверхности этот угол в точности есть превышение (над величиной 180°) суммы углов треугольника. Для сферической поверхности эта кривизна просто равна 1/𝑅².
Обобщённое определение кривизны многомерной поверхности будет даваться через изменение вектора при его переносе вдоль замкнутой кривой, причём при таком переносе, который оставляет вектор параллельным самому себе. Так как ориентация траектории, лежащей на определённой плоскости, зависит от двух осей координат, то мы видим, что кривизна в общем случае является тензором четвёртого ранга. В трёхмерном пространстве мы могли бы разбить сферическую поверхность проведением ”радиально” внешней части от точки для заданного измеренного расстояния вдоль наикратчайших измеренных траекторий (геодезических). Компоненты кривизны вдоль различных направлений должны бы соответствовать незначительному отклонению от 2π длин больших кругов сферической поверхности.
Наглядное представление понятия кривизны на языке более простого пространства, погружённого в пространство с более высокой размерностью, требует введения одного дополнительного измерения для каждого независимого компонента метрического тензора. Для двумерных пространств имеется три компонента метрики, и отсюда следует, что достаточно трёх измерений. Для трёх измерений метрический тензор имеет шесть независимых компонентов и для четырёх измерений имеется десять независимых компонентов.
Определение компонентов кривизны на языке изменения вектора при переносе его вдоль траектории является более общим, чем определение через дефекты в окружностях, которое не воспроизводит все признаки кривизны.
Рис. 9.2.
Связь со второй ковариантной производной может быть легко вычислена, когда мы рассматриваем последовательные перемещения вектора, сохраняя его параллельным самому себе. Так как мы проходим вдоль траектории на рис. 9.2, разность в этом векторе, получающаяся при прохождении вдоль этой траектории, должна быть
δ²
𝐴
μ
=
𝑅
μ
νστ
𝐴
ν
Δ
₁
𝑥
σ
Δ
₂
𝑥
τ
.
(9.3.2)
Так как кривизна есть тензор, антисимметричный по индексам (σ,τ), билинейные произведения Δ₁𝑥σΔ₂𝑥τ могут быть заменены на величину ½(Δ₁𝑥σΔ₂𝑥τ – Δ₁𝑥τΔ₂𝑥σ), которые являются половиной компонентов площади параллелограмма. Индексы тензоров имеют значение, которое нетрудно описать словесно; если мы рассматриваем перемещение векторов вдоль небольшой петли в плоскости (στ), компонент μ вектора меняется на величину, пропорциональную сумме по другим компонентам 𝐴ν, 𝑅μντσ𝐴μ и площади петли.
Мы уже очень много говорили о перемещении вектора параллельно самому себе, не делая это понятие математически определённым. При использовании более интуитивных терминов, это просто означает, что мы переносим конец стрелки и основание стрелки на некоторое равное смещение так близко, как только мы можем вдоль прямой линии, которая есть геодезическая. Математическое определение может быть наилучшим образом понято путём рассмотрения уравнения геодезических
𝑑²𝑥μ
𝑑𝑠²
=-
Γ
μ
νσ
𝑑𝑥ν
𝑑𝑠
𝑑𝑥σ
𝑑𝑠
.
(9.3.3)
Ясно, что вектор (𝑑𝑥μ/𝑑𝑠) вдоль геодезической представляет тангенциальную скорость Δ𝑡μ вдоль геодезической, которая есть "физическая” прямая линия. Вторая производная (𝑑²𝑥μ/𝑑𝑠²) представляет собой изменение этой скорости за интервал времени Δ𝑠
Δ
𝑠
⎛
⎜
⎝
𝑑²𝑥μ
𝑑𝑠²
⎞
⎟
⎠
=
Δ
𝑡
μ
=-
Γ
μ
νσ
𝑡
ν
Δ
𝑥
σ
.
(9.3.4)
Это изменение пропорционально самому вектору 𝑡ν и перемещениям Δ𝑥σ. Определение параллельного переноса аналогично; мы говорим, что вектор 𝐴'μ есть результат переноса параллельно самому себе
𝐴'
μ
=
𝐴
μ
+
δ𝐴
μ
,
где
δ𝐴
μ
=-
Γ
μ
σν
𝐴
σ
Δ
𝑥
ν
.
(9.3.5)
Легко может быть показано, что когда мы перемещаем множество векторов вдоль замкнутой кривой, перемещал каждый из них параллельно самому себе, соотношения между векторами не меняется, так что целое пространство, определённое множеством векторов, поворачивается при движении вдоль петли, это задаёт полное изменение, вызванное перемещениями. Доказательство этого утверждения состоит в проверке того, что все инвариантные скаляры
𝐵
μ
𝐴
ν
𝑔
μν
,
(9.3.6)
остаются неизменными. Это означает, что длины векторов и углы между векторами сохраняются. Единственное преобразование, которое допускает это, выглядит как поворот целого пространства.
Рис. 9.3.
Возможно, что топологические свойства пространства не полностью определяются локальной кривизной. Например, мы получили, что длины векторов сохраняются и углы между векторами сохраняются, когда мы переносим пространство параллельно самому себе. Всё же нет гарантии, что для длинной замкнутой траектории отражение недопустимо, также как и вращение. Двумерный пример таких отражений (например, неориентируемая поверхность) имеет место в ленте Мёбиуса (рис. 9.3). Если мы возьмём два вектора, один из которых параллелен, другой перпендикулярен центральной линии ленты Мёбиуса, и обойдём один раз ленту, двигаясь налево от вертикальной пунктирной линии, показанной рис. 9.3, то пространство не переходит само в себя, а испытывает отражение, обусловленное ”скрученностью” поверхности, а не просто поворот.
Теперь, когда мы определили такое понятие, как перенос вектора параллельно самому себе, мы можем получить важную формулу для тензора кривизны при движении по траектории 𝐴𝐵𝐶𝐷 на рис. 9.2. Разности в векторах при каждом инфинитезимальном перемещении задаются символами Кристоффеля Γ. Но так как эти разности не являются в точности теми же самыми вдоль (𝐴𝐵) и (𝐶𝐷), и даже, если бы эти перемещения были бы противоположны одно другому, вектор не вернулся бы к своей исходной величине. Мы можем понять, каким образом символы Кристоффеля оказываются вовлечены в доказательство этого факта. Выполняя алгебраические преобразования, приходим к соотношению (9.2.14).
Можно показать, что тензор кривизны удовлетворяет тождеству Бианки
𝑅
μ
σαβ;γ
+
𝑅
μ
σβγ;α
+
𝑅
μ
σγα;β
=
0.
(9.3.7)
Сейчас без подготовки я не стал бы говорить о геометрическом значении тождества Бианки. Имеется обычное уравнение электродинамики, которое может быть записано в виде, идентичном виду тождества Бианки, за исключением числа измерений. Тензор поля задаётся через векторный потенциал следующим соотношением:
𝐹
μν
=
∂𝐴μ
∂𝑥ν
–
∂𝐴ν
∂𝑥μ
,
(9.3.8)
другими словами 𝐹μν – ротор некоторого вектора. Но свойства содержащиеся в утверждении, что 𝐹μν есть ротор, эквивалентным образом также хорошо описываются тождеством
𝐹
μν,σ
+
𝐹
νσ,μ
+
𝐹
σμ,ν
=
0.
(9.3.9)
которое имеет вид, похожий на тождество Бианки. Свойства ротора могут быть связаны с криволинейным интегралом, если мы используем теорему Стокса1
∮
Γ
𝑮
⋅
𝑑𝒓
=
∫
(rot 𝑮)
⋅
𝑑𝑺
,
(9.3.10)
где интеграл в правой части соотношения представляет собой поверхностный интеграл по любой поверхности, ограниченной замкнутой кривой Γ.
1 Мы используем более распространённое обозначение в отечественной литературе для ротора (”rot”), а не ”curl”, как в лекциях Фейнмана (Прим. перев.)
Для случая гравитации аналогия может быть следующая: криволинейный интеграл представляет изменение вектора, когда мы перемещаем его, оставляя параллельным самому себе, вдоль замкнутой кривой Γ. Такое общее изменение возможно связывается с интегралом по любой двумерной гиперповерхности, ограниченной кривой Γ. Доказательство такого утверждения может быть получено по аналогии с доказательством теоремы Стокса, в котором рассматривается разделение конечной поверхности инфинитезимальной сеткой, например, как показано на рис. 9.4; показывается, что сумма вкладов от любой инфинитезимальной сетки равна криволинейному интегралу. Когда рассматривается аналогия для этой ситуации в пространстве более высоких размерностей, то мы можем лучше понять значение тождества Бианки для описания сущности кривизны пространства.
Рис. 9.4.
9.4. Связь между кривизной и материей
Мы видели, как эффекты, связанные с действием гравитационных полей, могут быть описаны в рамках нашей геометрической интерпретации через тензор кривизны 𝑅μνστ. Осталась только одна задача, состоящая в том, чтобы связать тензор кривизны с источниками гравитации, материи и энергии. Первое, что мы делаем для этого, мы производим свёртку тензора кривизны по первому и последнему индексам и получаем тензор, который называется тензором Риччи
𝑅
νσ
=
𝑅
μ
νσμ
.
(9.4.1)
В этом соотношении указан единственный способ, каким можно свернуть один раз тензор кривизны. Следующий намёк приходит из рассмотрения обобщённого закона сохранения энергии и импульса, который гласит, что свёрнутая ковариантная производная или, иначе говоря, ковариантная дивергенция тензора энергии-импульса, должна быть равна нулю.
Мы ищем вид соотношения, включающего в себя тензор Риччи таким образом, что его свёрнутая ковариантная производная является тождественным нулём. Ответ получается из свёртывания дважды тождества Бианки (9.3.7). Свёртывание по индексам (μβ) приводит к выражению, включающему в себя тензоры Риччи