e Let Ro Magnetism o
e Let Ro Magnetism o
e Let Ro Magnetism o
Sobre o Autor
José Roberto Pinheiro Mahon, nascido em Bauru, no Estado de São Paulo, em 1955, é professor e pes-
quisador do Departamento de Física Nuclear e Altas Energias, no Instituto de Física Armando Dias Tavares
da Universidade do Estado do Rio de Janeiro (UERJ). Graduado em matemática e tecnologia mecânica
em Sorocaba (FAFI e FATEC-UNESP), fez seu mestrado em física na Universidade Estadual de Campi-
nas (UNICAMP) e obteve seu doutorado em física pela Universidade de São Paulo (USP). Com formação
científica na área de física de partículas, desenvolveu pesquisas em física experimental de altas energias e
trabalhou em colaborações internacionais tanto no Fermilab, Estados Unidos, como no CERN, na Europa.
Atualmente dedica-se a fenomenologia de partículas e fundamentos de física. Publicou mais de 135 traba-
lhos em periódicos científicos internacionais, além de apresentações em congressos internacionais. Orienta
alunos de graduação e de pós-graduação. É coautor do livro Estimativas e erros em experimentos de Física,
já na terceira edição (2013) publicado pela EdUERJ, autor do livro Mecânica Quântica - desenvolvimento
contemporâneo com aplicações (2011) publicado pela LTC Editora e coautor do livro Introdução à QCD
perturbativa (2013) também publicado pela LTC Editora.
vii
“Z_2” — 2017/9/5 — 8:19 — page viii — #8
“Z_2” — 2017/9/5 — 8:19 — page ix — #9
Prefácio
A teoria eletromagnética clássica e a relatividade, juntamente com as mecânicas clássica, quântica e estatís-
tica, compõem o núcleo da formação teórica atual para os físicos de graduação e pós-graduação. Uma base
sólida nesses assuntos é um requisito para uma formação mais avançada ou especializada.
Este texto é baseado em um curso de pós-graduação em eletromagnetismo que ministrei nos últimos
quinze anos no I NSTITUTO DE F ÍSICA DA U NIVERSIDADE DO E STADO DO R IO DE JANEIRO, é uma
exposição básica e com abordagem moderna da teoria clássica do campo eletromagnético e da relatividade
restrita e geral.
Um programa típico de graduação em eletromagnetismo envolve dois semestres com ênfase nas leis
fundamentais, equações de onda eletromagnética e radiação. As ferramentas matemáticas utilizadas in-
cluem cálculo vetorial, equações diferenciais ordinárias, equações diferenciais parciais e funções especiais.
No início da pós-graduação vemos mais profundamente o desenvolvimento relativístico e tópicos avança-
dos do eletromagnetismo clássico, como radiação e espalhamento, radiação por partícula em movimento e
supercondutividade.
O objetivo do texto é apresentar o eletromagnetismo e a relatividade no contexto da física moderna,
incluindo vários exemplos atuais e suas aplicações. Assim, o texto está dirigido aos estudantes avançados
de graduação e de pós-graduação em física, estudantes de ciências exatas e engenharia, que trazem uma base
sólida da graduação, que gostariam de aperfeiçoar seus conhecimentos, ou seja, espera-se que o estudante
tenha familiaridade com o material básico de um curso de eletromagnetismo (nível de graduação) e de
matemáticas para a física e engenharia.
Os tópicos introduzidos são tratados de forma compreensiva, procurando-se expor claramente as de-
duções dos principais resultados. Espero que o texto seja estimulante por ter uma apresentação diferente
e nitidamente mais madura e profunda que aquela apresentada em sua formação básica e início do ciclo
profissional.
Os temas tratados neste texto foram divididos em vinte e três capítulos assim distribuídos: Introdu-
ção aos Conceitos Fundamentais, O Princípio da Relatividade, Partícula em um Campo Eletromagnético,
Campos Eletromagnéticos e Simetrias, Eletrostática e Magnetostática, Problemas de Contorno, Multipolos
Elétricos Magnéticos e Materiais, Campos Eletromagnéticos Variáveis no Tempo e Calibre, Ondas Eletro-
magnéticas, Aproximação WKB, Ondas Eletromagnéticas Cilíndricas e Esféricas, Interferência e Difração,
Guias de Onda e Cavidades Ressonantes, Sistema de Radiação, Radiação de Cargas Aceleradas, Perda de
Energia por Radiação, Fundamentos da Relatividade Geral e Tensores, Curvatura do Espaço-Tempo e Equa-
ções de Einstein, Abordagem Variacional e a Solução de Schwarzschild, Cosmologia: Princípios Físicos e
Modelo Padrão, Cosmologia Inflacionária, Buracos Negros e finalmente Ondas Gravitacionais. Como o
texto está preparado para estudantes avançados de graduação (dois semestres) e para estudantes de pós-
graduação (dois semestres), podemos utilizá-lo da seguinte forma: Para a graduação em física, os capítulos
1, 5, 6, 7, 8, 9, 12, 13, 14 e 15; estudantes avançados de engenharia, além destes, acrescentam os capítulos
ix
“Z_2” — 2017/9/5 — 8:19 — page x — #10
x P REFÁCIO
10 e 11; para a pós-graduação em física (dois semestres) usamos o texto completo. Este texto ainda poderá
ser usado como um curso de relatividade (um semestre) para alunos avançados de graduação ou pós, usando
os capítulos 1, 2, 3, 4, 17, 18, 19, 20, 21, 22 e 23.
Agradecimentos Desejo agradecer aos estudantes que em todos esses anos proporcionaram a motivação
para escrever este texto. Em especial Daniel Grangeia, Márcio Capri e Rogério Menezes de Almeida (hoje
doutores e professores), além de Sílvia Nunes, Breno D. Chrispim, Juan M. Zárate Pretel, Katharine Ivette
Cuba Quispe, solucionando problemas propostos nas listas e propondo problemas avançados durante o curso
e Michael Aleixo dos Santos, fazendo um estudo de monopolos magnéticos e cargas elétricas.
Agradeço também aos colegas do Instituto que incentivaram na preparação deste trabalho. Em especial
aos profs. José Umberto Cinelli Lobo de Oliveira, pelas discussões dos aspectos fundamentais do eletromag-
netismo, relatividade restrita e valiosa ajuda na apresentação do texto; Cesar Augusto Linhares da Fonseca
Junior, pelo apoio e discussões a respeito dos multipolos toroidais e momento anapolo; Vitor Oguri, pelo
apoio, incentivo e sugestões dadas; e Márcio Capri por valiosas discussões e sugestões em teoria clássica de
campos, formalismo matemático e relatividade. Cabe lembrar que o prof. Márcio Capri utilizou parte desse
material no curso por ele oferecido aos estudantes de pós-graduação e o Prof. Rogério Menezes de Almeida
utilizou esse material em seu curso de pós-graduação oferecido na UFRJ. Minhas longas conversas com
esses amigos e colegas de trabalho foram um grande estimulo para realização deste texto.
Sumário
Prefácio ix
2 O Princípio da Relatividade 15
2.1 Hipótese histórica do éter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
Transformação de Galileu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.2 Postulados de Einstein . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.3 Experimentos de Fizeau, de Michelson-Morley e Modernos . . . . . . . . . . . . . . . . . 19
Experimento de Fizeau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
Experimento de Michelson-Morley . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
Experimentos Modernos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.4 Transformação de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
Quadrivetores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
Intervalo Invariante e Tempo Próprio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.5 Grupos de Lorentz e de Poincaré . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
Cone de Luz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
Grupos O(3, 1) e SO(3, 1) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
Grupo SL(2, C) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
Grupo de Poincaré . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.6 Campos Escalares e Tensores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.7 Matriz de Lorentz Generalizada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.8 Efeito Doppler e Aberração da Luz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.9 Dinâmica Relativística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
xi
“Z_2” — 2017/9/5 — 8:19 — page xii — #12
xii S UMÁRIO
Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
Leitura Recomendada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
5 Eletrostática e Magnetostática 92
5.1 Eletrostática Elementar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
Equações do Campo Eletrostática . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
5.2 Lei de Coulomb . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
5.3 Lei de Gauss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
5.4 Potencial Eletrostático . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
5.5 Equação de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
5.6 Teorema de Green . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
5.7 Condições de Contorno de Dirichlet e Neumann . . . . . . . . . . . . . . . . . . . . . . . 99
5.8 Solução Formal - Função de Green . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
5.9 Energia Potencial Eletrostática . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
“Z_2” — 2017/9/5 — 8:19 — page xiii — #13
S UMÁRIO xiii
xiv S UMÁRIO
S UMÁRIO xv
xvi S UMÁRIO
S UMÁRIO xvii
xviii S UMÁRIO
S UMÁRIO xix
Bibliografia 674
Índice 678
“Z_2” — 2017/9/5 — 8:19 — page xx — #20
xx S UMÁRIO
“Z_2” — 2017/9/5 — 8:19 — page 1 — #21
Capítulo 1
Introdução aos Conceitos Fundamentais
Na física contemporânea, quatro são as interações entre as partículas elementares encontradas na natureza:
gravitacional, eletromagnética, nuclear forte e nuclear fraca. As interações fortes e fracas têm um alcance
da ordem de 10−13 cm, e precisamos das considerações de fenômenos quânticos. As interações eletromag-
néticas e gravitacionais são de longo alcance, possibilitando um estudo clássico, i.e., não quântico, em uma
ampla variedade de processos e aplicações.
Nesta introdução, estamos interessados na interação eletromagnética entre os campos elétricos e mag-
néticos e distribuições contínuas de cargas elétricas, além dos conceitos fundamentais da teoria da relativi-
dade, restrita e geral.
Na natureza, são encontradas três tipos de cargas elétricas: a negativa como os elétrons, a positiva como
os prótons e as neutras como os neutrons, fótons e neutrinos. Uma das características mais marcantes da
carga elétrica é sua conservação. A mais precisa evidência experimental para esta propriedade esta baseada
na observação da estabilidade do elétron, conforme os acurados experimentos realizados a partir de 1975
confirmando cada vez mais conclusivamente a conservação da carga elétrica. 1
O objetivo deste capítulo é apresentar uma revisão das equações de Maxwell2 para o eletromagnetismo
clássico ou eletrodinâmica clássica, bem como a teoria da gravitação em termos da relatividade geral.
Adotaremos o sistema gaussiano de unidades para o eletromagnetismo, o sistema CGS de Gauss,3
em que são considerados como conceitos primitivos: espaço, tempo, massa e carga elétrica, conforme
Tabela 1.1; em contraste com os conceitos primitivos do sistema internacional SI: espaço (L); tempo (T);
SÍMBOLO UNIDADE
GRANDEZA
DIMENSIONAL GAUSSIANA
espaço L centímetro
massa M grama
tempo T segundo
carga elétrica Q statcoulomb
massa (M) e corrente elétrica (I). O sistema SI tem a virtude e conveniência total em práticas de fenômenos
em grande escala, em especial na área de engenharia. O sistema CGS de Gauss é mais adequado para
os problemas que envolvem a eletrodinâmica microscópicas de partículas carregadas individuais, etc. As
1
L. Davis et al., Phys. Rev. Lett. 35, 1402 (1975); E. Bellotti et al., Phys. Lett. B124, 435 (1983); S. Orito et al., Phys. Rev. Lett.
54, 2457 (1985); H. O. Back et al., Phys. Lett. B525, 29 (2002).
2
James Clark Maxwell (1831-1879), físico escocês.
3
Johann Carl Friedrich Gauss (Gauß) (1777-1855), físico, matemático e astrônomo alemão.
1
“Z_2” — 2017/9/5 — 8:19 — page 2 — #22
∇ ~ = 4πρ
~ ·D ~ =ρ
~ ·D
∇
~ ~
~ ×H
∇ ~ − 1 ∂ D = 4π ~J ~ ×H
∇ ~ − 1 ∂ D = ~J
c ∂t c c ∂t
~ ~
∇·B = 0 ~ ·~
∇ B=0
~ ~
~ × ~E + 1 ∂ B = 0
∇ ~ × ~E + ∂ B = 0
∇
c ∂t ∂t
~ = ~E + 4π~P , ~ =~ ~ ~ = ǫ0~E + ~P , ~ = ~
B ~
D H B − 4π M D H µ0
−M
~
~ = ǫ~E ,
D ~ =
H B ~ = ǫ~E , H
D ~ = ~B
µ µ
ǫ0 = 1 ǫ0 = 8,854 187 8 . . . × 1012 F m−1
µ0 = 1 µ0 = 4π × 10−7 N A−2
~ ~
~ − 1 ∂A
~E = −∇Φ ~ − ∂A
~E = −∇Φ
c ∂t ∂t
~
B=∇ ~ ×A
~ ~
B=∇ ~ ×A
~
ρ(~r ′ ) 3 ′ ρ(~r ′ ) 3 ′
X qi Z Z
1 X qi 1
Φ= = ′
d x Φ = = d x
cargas
ri |~r −~r | 4πǫ0 cargas ri 4πǫ0 |~r −~r ′ |
I d~ℓ I d~ℓ
I I ~ ′ I I ~ ′
~ = 1
A =
1 J(~r ) 3 ′ ~
d x A =
µ0
=
µ0 J(~r ) 3 ′
d x
c |~r −~r ′ | c |~r −~r ′ | 4π |~r −~r ′ | 4π |~r −~r ′ |
1
= c2 × 10−7 N A−2 = 8,987 55 . . . × 109 m F−1 ;
4πǫ0
µ0
q
2
= 10−7 N A−2 ; γ = 1/ 1 − vc2
4π
1
c= √ = 2,997 924 58 × 108 m s−1 .
µ0 ǫ0
A integral volumétrica em M da divergência do campo vetorial ~F pode ser obtida como o fluxo deste campo
vetorial através da superfície de M.
Assim, teremos I Z
~J · d~s = ∇~ · ~J dV ,
~ · ~J + ∂ρ = 0 ,
∇ (1.3)
∂t
que fisicamente exprime o princípio de conservação das cargas.
As leis fundamentais da eletrodinâmica são as bem conhecidas equações de Maxwell para o campo
eletromagnético (~E, ~
B) associado a (ρ, ~J), que escreveremos no sistema gaussiano de unidades:
~ · ~E = 4πρ
∇ Lei de Coulomb (1.4a)
~ ·~
∇ B=0 Ausência de monopolos magnéticos (1.4b)
~
~ × ~E + 1 ∂ B = 0
∇ Lei de Faraday (1.4c)
c ∂t
~ ×~ 1 ∂~E 4π
∇ B− = ~J Lei de Ampère-Maxwell , (1.4d)
c ∂t c
5
Mikhail Vassiliovich Ostrogradski (1749-1827), matemático ucraniano.
“Z_2” — 2017/9/5 — 8:19 — page 4 — #24
em que c é a velocidade de propagação das ondas eletromagnéticas no vácuo, i.e., velocidade da luz no
vácuo. 6
Integrando a Eq. (1.4a) sobre um certo volume e aplicando o teorema da divergência de Gauss
Z I
∇ · E dV = ~E · d~s ,
~ ~
teremos
I Z
~E · d~s = 4π ρ dV . (1.5)
Portanto, o fluxo do campo elétrico ~E através de uma superfície fechada é igual a carga total, multiplicado
por 4π (ângulo sólido total).
Integrando a Eq. (1.4b) neste volume e novamente usando o teorema da divergência
Z I
~ ·~
∇ B dV = ~ B · d~s ,
encontramos
I
~
B · d~s = 0 . (1.6)
Desta forma, teremos o fluxo de um campo magnético ~ B através de uma superfície fechada qualquer nulo.
Utilizando o teorema de Stokes,7 i.e., seja S ⊂ R3 uma superfície compacta e orientada com borda
∂S. Seja ~F : S → R3 um campo vetorial diferenciável em S. Então
I Z
~F · d~l = ~ × ~F · n̂ ds .
∇ (1.7)
∂S S
em que a integral do segundo membro se faz ao longo do contorno fechado que envolve a superfície do
primeiro membro. Assim, da Eq. (1.4c) temos,
I Z
~E · d~l = − 1 ∂ ~
B · d~s . (1.8)
c ∂t
A integral de um vetor ao longo de um contorno fechado chama-se circulação. A circulação do campo
elétrico é conhecida como a força eletromotriz em um dado contorno. Deste modo, a força eletromotriz em
um determinado contorno é igual a derivada em relação ao tempo, com sinal trocado, do fluxo do campo
magnético através da superfície limitada por esse contorno.
Integrando a Eq. (1.4d) sobre uma superfície não fechada qualquer e novamente aplicando o teorema de
Stokes Z I
~ ×~
∇ B · d~s = ~B · d~l
6
Charles Augustin Coulomb (1736-1806), físico francês.
Michael Faraday (1791-1867), físico e químico inglês.
André-Marie Ampère (1775-1836), físico francês.
Nota-se que as equações de Maxwell são leis que não possuem uma hierarquia, i.e., não há ordenamento, como aparece nas leis
de Newton, por exemplo.
Sir Isaac Newton (1642-1727), físico, matemático e filósofo inglês.
7
Sir George Gabriel Stokes (1819-1903), matemático e físico irlandês.
“Z_2” — 2017/9/5 — 8:19 — page 5 — #25
temos I Z Z
1 ∂ ~E · d~s + 4π
B · d~l =
~ ~J · d~s . (1.9)
c ∂t c
A grandeza
1 ∂~E
4π ∂t
é conhecida como corrente de deslocamento. Assim, a Eq. (1.9) será
I Z !
4π 1 ∂ ~E
B · d~l =
~ ~J + · d~s .
c 4π ∂t
~ · ~J + ∂ρ = 0 ,
∇
∂t
ou seja, a conhecida equação de continuidade.
mas o rotacional do gradiente de uma função escalar é nulo. Para termos consistência com a eletrostática,
definimos
~
~E = −∇Φ~ − 1 ∂A , (1.11)
c ∂t
~ é o potencial vetor e Φ o potencial escalar.
em que A
Assim, poderemos deduzir as equações que definem o potencial do campo criado por cargas em movi-
mento. Faremos a substituição,
~
~E = − 1 ∂ A − ∇Φ
~
c ∂t
e
~
B=∇ ~ ×A ~ ,
“Z_2” — 2017/9/5 — 8:19 — page 6 — #26
na equação
~ ×~ 4π ~ 1 ∂~E
∇ B= J+
c c ∂t
e obteremos
4π ~
~ ~ ~ 2~ ~ ~ ~ ~ 1 ∂2A ~ ∂Φ
∇ × ∇ × A = −∇ A + ∇ ∇ · A = J− 2 2 −∇ . (1.12)
c c ∂t ∂t
∇ ~ + 1 ∂Φ = 0 ,
~ ·A (1.13)
c ∂t
e os potenciais que a satisfazem se ajustam ao calibre de Lorenz ou de Lorenz-Lorentz.9 Então, da Eq. (1.12)
chegaremos a equação
2~
~ − 1 ∂ A = − 4π ~J .
∇2 A (1.14)
c ∂t2
2 c
Analogamente, podemos usar
~ · ~E = 4πρ
∇
1 ∂ ~ ~
− ∇ · A − ∇2 Φ = 4πρ
c ∂t
Vejamos, então, que a transformação no potencial Φ pode ser determinada por (1.11). Usando a transforma-
ção (1.18), e impondo que ~E′ = ~E encontraremos,
~′ ~
~ ′ + 1 ∂ A = ∇Φ
∇Φ ~ + 1 ∂A ,
c ∂t c ∂t
mas usando (1.18) obteremos,
~ ~
~ ′ + 1 ∂A − 1 ∇
∇Φ ~ ∂Ψ = ∇Φ
~ + 1 ∂A ,
c ∂t c ∂t c ∂t
o que nos fornece
1 ∂Ψ
Φ → Φ′ − . (1.20)
c ∂t
Assim, os potenciais A ~ ′ e Φ′ , obtidos de A
~ e Φ pelas transformações (1.18) e (1.20), correspondem
ao mesmo campo eletromagnético, i.e., as equações de Maxwell são invariantes. As transformações aqui
definidas (1.18) e (1.20) são conhecidas como transformações de calibre.10 Fica claro que, classicamente,
o campo eletromagnético é mensurável e não o potencial.
Como os campos ~E e ~ B são invariantes em relação às transformações de calibre, podemos considerar
~ ΦeA
A, ~ ′ , Φ′ dados em (1.18) e (1.20), como fisicamente equivalentes. Devemos impôr a A ~ ′ e Φ′ que
satisfaçam as Eqs. (1.13), (1.14) e (1.15), assim
1 ∂2Ψ
∇2 Ψ − = 0. (1.21)
c2 ∂t2
Vemos então que a Eq. (1.21) restringe a arbitrariedade da função Ψ das transformações de calibre (1.18)
e (1.19). Conforme mostraremos posteriormente, esta condição representa um vínculo invariante por trans-
formações gerais na teoria da relatividade. As transformações de calibre formam um grupo.
em que ψ, no caráter vetorial, poderá ser tanto o campo elétrico ~E como o magnético ~B, se propagam, no
vácuo, com velocidade c, que é uma constante universal. Porém não foi discutido uma questão básica, i.e.,
a que referencial se refere esta velocidade.
A mecânica newtoniana consiste de uma das mais sólidas estruturas conceituais até hoje desenvolvidas
no âmbito científico. Por outro lado, a primeira e mais bem sucedida teoria de campo da física foi o eletro-
magnetismo de Maxwell. Assim, apresentamos alguns postulados e leis da mecânica de Newton:
Postulados de Newton
1 - Tempo (absoluto) É uma noção exata e universal, e flui, uniformemente, sem relação com qualquer
ação externa.
2 - Espaço (absoluto) É uma noção exata e universal, e se estende, uniformemente, sem relação com qual-
quer ação externa.
3 - Referencial inercial Esse referencial é uma coleção coerente de instrumentos de medida capaz de de-
terminar diferenças de tempo absoluto e de espaço absoluto.
4 - Momentum linear Uma grandeza vetorial, para cada sistema físico, que determina sua capacidade po-
tencial de modificar sua vizinhança.
5 - Força Uma grandeza vetorial que determina a forma como os corpos sensíveis interagem mutuamente.
1 - Inércia Apresenta o momentum linear constante no tempo, todo e somente aquele sistema sobre o qual
seja nula a resultante vetorial das forças atuantes.
2 - Dinâmica A derivada temporal do momentum linear total de um sistema equivale à força resultante que
sobre ele atua.
3 - Ação e reação A cada força exercida por um sistema X sobre um sistema Y corresponde uma força de
mesma direção e grandeza, e de sentido contrário, exercida pelo sistema Y sobre o sistema X.
Estas são as famosas leis de Newton. Decorre dessas definições e leis que, do ponto de vista da mecânica
de Newton, todos os referencias inerciais são indistinguíveis entre si. Esse importante resultado constitui
a denominada relatividade de Galileu11 da mecânica newtoniana, garantindo a possibilidade de escolha do
referencial inercial a ser adotado conforme a necessidade ou conveniência de cálculos. Com boa aproxi-
mação, um referencial vinculado às estrelas fixas é inercial, e, claro, qualquer referencial em movimento
retilíneo uniforme em relação a um referencial inercial é também inercial.
Sejam dois referenciais S e S ′ , em que se adotam respectivamente os sistemas de coordenadas (t, x, y, z)
e (t , x′ , y ′ , z ′ ). Os observadores destes referenciais estão em movimento de translação uniforme com velo-
′
cidade relativa ~v, sem perda de generalidade consideraremos os eixos correspondentes paralelos com o eixo
x paralelo à velocidade relativa ~v, ver Fig. 1.1. Os vetores posição e as coordenadas espaciais e temporais
nos dois sistemas estão relacionados segundo a transformação de Galileu:
~r′ = ~r − ~v t (1.22a)
e ′
t = t, (1.22b)
11
Galileo Galilei (1564-1642), físico, astrônomo e filósofo italiano. Criador do método científico.
“Z_2” — 2017/9/5 — 8:19 — page 9 — #29
Pelo fato de que as leis de Newton são invariantes em relação às transformações de Galileu, o chamado de
princípio da relatividade de Galileu ou princípio da relatividade newtoniana, as equações de movimento
de Newton nos dois sistemas são:
~F = m~a e ~F′ = m~a′ , (1.23)
de maneira que a forma da lei de movimento é invariante para observadores inerciais, para os quais as forças
consideradas em (1.23) são forças devidas apenas a interações com outros sistemas físicos. O conjunto geral
de transformações que leva um referencial inercial à outro é conhecido como grupo de transformações de
Galileu.
Entretanto, decorre das leis da eletrodinâmica que a luz se propaga, no vácuo, com velocidade c. Admi-
tindo que isto vale num dado referencial inercial, e que valem as leis da mecânica newtoniana, o resultado
não poderia valer num outro referencial inercial em movimento retilíneo uniforme em relação ao primeiro
com velocidade ~v. Com efeito, pela lei de Galileu de composição de velocidades, seria
~c′ = ~c − ~v (1.24)
1. As equações de Maxwell não estariam corretas. A teoria do eletromagnetismo seria invariante sob
transformações de Galileu.
2. As transformações de Galileu aplicavam-se à mecânica clássica, mas para o eletromagnetismo haveria
um sistema de referência privilegiado, o éter.
3. Existiria um princípio de relatividade para a mecânica clássica e o eletromagnetismo em conjunto,
mas não seria a chamada relatividade de Galileu. Isto implicaria a necessidade de modificação das
leis da mecânica.
A única opção compatível com os fatos experimentais foi a terceira aqui apresentada.
“Z_2” — 2017/9/5 — 8:19 — page 10 — #30
Finalmente, a teoria da relatividade restrita tem por base o eletromagnetismo e o caráter tensorial das
leis e das grandezas físicas. Pode-se dizer que as equações de Maxwell, i.e., o eletromagnetismo motivou
essa teoria. Daí a razão de um texto conjunto sobre eletromagnetismo clássico e teoria da relatividade. A
teoria da relatividade restrita postula que as leis da física devem ser formuladas com relação a um referencial
inercial qualquer. Deste ponto de vista, todos os referenciais inerciais são equivalentes. Assim, não existem
velocidades absolutas, e sim velocidades com relação a um dado referencial.
mI ~¨r = −mG ~g .
em que ~FN G representa as forças não gravitacionais que atuam sobre a partícula teste. Seja um referencial
S ′ que se desloca em relação ao referencial S com movimento retilíneo uniformemente acelerado, com
~ como consequência da lei de Galileu de composição de velocidades,
aceleração A,
~¨r ′ = ~¨r − A
~ , (1.26)
~ = −~g
e, em particular, se A
m ~¨r ′ = ~FN G , (1.28)
19
Ernst Waldfried Josef Wenzel Mach (1838-1916), físico e filósofo austríaco.
“Z_2” — 2017/9/5 — 8:19 — page 12 — #32
ou seja, num referencial em queda livre no campo gravitacional desaparecem os efeitos do campo gravita-
~ = −~g, elevador de Einstein. A última relação mostra que o refe-
cional sobre a partícula teste, i.e., A
′
rencial S se comporta como se fosse um referencial inercial na ausência do campo gravitacional. Como
consequência, as leis da mecânica na presença de um campo gravitacional, −~g, uniforme são as mesma que
resultariam, na ausência do campo, em um referencial com movimento retilíneo uniformemente acelerado,
com aceleração −~g, i.e., não será possível distinguir entre as duas situações por experiências de mecânica,
o que generaliza o princípio da relatividade de Galileu. Portanto, Einstein estendeu essa conclusão a todas
as leis físicas, formulando o princípio de equivalência. 20
Princípio de equivalência Em um recinto suficientemente pequeno para que o campo gravitacional dentro
dele possa ser tomado como uniforme, em queda livre dentro desse campo, todas as leis físicas são
as mesmas que em um referencial inercial, na ausência do campo gravitacional.
Assim, o princípio de equivalência deve ser aplicado localmente, em pequenos recintos, que podemos
chamar de referenciais inerciais locais ou referenciais localmente inerciais. Tomando tal precaução, o prin-
cípio de equivalência tem uma série de importantes, e testáveis, consequências físicas:
2. A aceleração de uma partícula teste, i.e., um objeto cuja a massa é suficientemente pequena para que
ele não produza alterações mensuráveis no campo gravitacional do corpo de massa maior para o qual
é atraído, em um campo gravitacional é inteiramente independente da sua natureza, da massa e da
composição.
3. O caminho de um raio de luz sofrerá uma curva na presença do campo gravitacional de um corpo
maciço.
4. Um raio de luz emitida a partir da superfície de um corpo maciço estará deslocando para o vermelho,
i.e., desvio gravitacional para o vermelho, quando o seu comprimento de onda é medido por um
observador distante.
para dez grandezas gµν .” Mais adiante as equações serão generalizadas para o caso da presença de matéria.
No entanto, antes de Einstein ter chegado a essa conclusão, e, naturalmente, as famosas equações que levam
seu nome, foram necessários anos de tentativa, que a forma simples como as equações são apresentadas
esconde. É difícil e nada linear, porém espetacular e vários passos importantes foram necessários.
O primeiro foi a sua descoberta do princípio de equivalência e o ter compreendido que, se quisesse con-
siderar corpos em aceleração, teria que ir para uma teoria que fosse covariante sob a ação de transformações
gerais de coordenadas, i.e., as transformações de Lorentz, que estão na base da teoria da relatividade restrita
ou especial, teriam que ser, não abandonadas, mas substituídas por transformações mais gerais, passando
elas a serem apenas um caso particular. O segundo passo, foi a sua descoberta de que um tratamento da
20
A. Einstein, Jahrbuch der Radioaktivitat un Elektronik, 4, 443 (1908).
21
A. Einstein, Annalen der Physik (ser. 4), 49, 769-822 (1916); Idem, 51, 639-642 (1916); Idem, Preussische Akademie der
Wissenschaften, Sitzungsberichte, part 1, 688-696 (1916); Idem, part 2, 1111-1116 (1916).
“Z_2” — 2017/9/5 — 8:19 — page 13 — #33
gravitação que fosse relativísticamente correto exigiria a consideração de geometrias não euclidianas. Fi-
nalmente, descobriu que o quadro apropriado a este tratamento já tinha sido criado pelos matemáticos na
forma de geometria de Riemann,22 ou geometria riemanniana, e do cálculo tensorial.
O tensor de Einstein, para relatividade geral, portanto, é definido por
1 µν
Gµν ≡ Rµν − g R, (1.29)
2
que é um tensor simétrico, 23 cuja característica é ter divergência nula, i.e.,
∂ν Gµν = 0 . (1.30)
Assim, após alguma álgebra, as equações de Einstein, ou equações do campo gravitacional da relatividade
geral, são encontradas,
8πG
Gµν = 4 T µν . (1.31)
c
Estas equações usualmente tomam-se unidades em que G = 1 = c e relacionam a curvatura do espaço-
-tempo, representada pelo tensor de Einstein, com a distribuição de matéria/energia-momentum, represen-
tada pelo tensor energia-momentum. 24 O fato do tensor de Einstein obedecer a ∂ν Gµν = 0 implica que
∂ν T µν = 0, que é a expressão tensorial da conservação da energia e do momentum. A equação ∂ν Gµν = 0
implica também que, das dez equações de Einstein (1.31) apenas seis são independentes. Como a métrica
é um tensor simétrico 4 × 4, tem, portanto, dez componentes independentes que as equações de Einstein
determinam a menos de quatro funções arbitrárias que manifestam a nossa completa liberdade em escolher
o sistema de coordenadas.
Einstein rapidamente percebe a impossibilidade de construir um modelo estático do universo. Estas
equações sempre produzem soluções que correspondem a uma expansão ou contração do universo. Com
a introdução de uma constante cosmológica Λ, Einstein foi capaz de desenvolver modelos estáticos do
universo, mais tarde todas essas soluções acabariam sendo instáveis. A constante cosmológica parecia des-
necessária. É interessante lembrar que se Einstein tivesse colocado mais confiança em suas equações, ele
poderia ter previsto a expansão do universo. As equações de campo tornam-se então
1 8πG
Rµν − gµν R + Λ gµν = 4 Tµν , (1.32)
2 c
em que Λ é a conhecida constante cosmológica, 25 cujo valor é Λ = 8πc2G ρvacuum . A primeira solução
exata se deve a Schwarzschild,26 conhecida como solução de Schwarzschild das equações de Einstein.27 A
solução de Schwarzschild é obtida exigindo que a métrica seja solução das equações de Einstein no vazio.
Então, a métrica de Schwarzschild para o espaço-tempo vazio fora de um corpo esférico de massa M foi
encontrada como
2GM 2GM −1 2
ds2 = 1 − c2
dt 2
− 1 − dr − r 2
dθ 2
+ sen 2
θ dφ2
, (1.33)
r c2 r c2
que podem dar as várias interpretações que precisamos para os testes clássicos da relatividade geral.
A relatividade geral explica a gravidade como uma consequência da curvatura do espaço-tempo, en-
quanto por sua vez a curvatura do espaço-tempo é uma consequência da presença de matéria. A curvatura
22
Georg Friedrich Bernhard Riemann (1826-1866), matemático alemão.
23
A. Einstein, Sitzungsberichte der Preussischen Akademie der Wissenschaften zu Berlin, 844-847 (1915).
24
A. Einstein, Annalen der Physik, 354 (7), 769-822 (1916).
25
A. Einstein, Sitzungsberichte der Königlich Preussischen Akademie der Wissenschaften Berlin part 1, 142-152 (1917).
26
Karl Schwarzschild (1873-1916), físico e astrônomo alemão.
27
K. Schwarzschild, Sitzungsberichte der Königlich Preussischen Akademie der Wissenschaften, 7, 189-196 (1916).
“Z_2” — 2017/9/5 — 8:19 — page 14 — #34
Problemas
1.1 Obtenha as equações de Maxwell na forma integral. Sugestão: Consulte o livro do Prof. H. Moysés
Nussenzveig [61].
1.2 Escreva as equações de Maxwell e as equações para os potenciais em coordenadas cilíndricas, para qual
dl2 = dr 2 + r 2 dϕ2 + dz 2 . Sugestão: Consulte o livro do Prof. J. D. Jackson [42].
1.3 Escreva as equações de Maxwell e as equações para os potenciais em coordenadas esféricas. Sugestão:
Consulte o livro do Prof. J. D. Jackson [42].
1.4 Deduza as equações de Einstein para a relatividade geral. Sugestão: Consulte o livro dos Profs. M. P.
Hobson, G. P. Efstathiou and A. N. Lasenby [38].
Leitura Recomendada
Solicita-se ao leitor que estude, antes de prosseguir na leitura deste texto, o impecável livro do Prof. Feyn-
man et al., que contém uma excelente introdução ao eletromagnetismo e poderá ajudar o leitor nos conceitos
mais fundamentais.
No livro do Prof. Moysés Nussenzveig, vol. 4, encontraremos uma excelente introdução a teoria da relati-
vidade, tanto a restrita como o geral.
Recomenda-se fortemente, como requisito paralelo, a leitura dos seguintes livros:
– J. D. Jackson [42];
– M. P. Hobson, G. P. Efstathiou and A. N. Lasenby [38].
Nestes livros, o leitor encontrará deduções detalhadas e claras da eletrodinâmica clássica e seus aspectos
mais fundamentais, além das deduções das equações de Einstein e sua solução, bem como uma excelente
discussão dos quatro testes clássicos da relatividade geral e seus principais resultados. Esses livros, do Prof.
Jackson é um clássico da literatura acadêmica, escrito de forma elegante e plenamente compreensível e dos
Profs. Hobson, Efstathiou e Lasenby é um texto moderno e objetivo.
28
John Archibald Wheeler (1911-2008), físico alemão-americano.
29
Resumo sucinto de Wheeler da teoria da relatividade geral de Einstein, publicado em John Archibald Wheeler, Kenneth William
Ford, Geons, black holes, and quantum foam: A life in physics, W. W. Norton & Company, p. 153 (2000).
“Z_2” — 2017/9/5 — 8:19 — page 15 — #35
Capítulo 2
O Princípio da Relatividade
A teoria da relatividade restrita ou especial, desde a sua publicação em 1905 por Einstein, tornou-se fun-
damental em física, tomando destaque junto as leis de Newton para a mecânica clássica, as equações de
Maxwell para o eletromagnetismo e a mecânica quântica.
A teoria da relatividade restrita tem por base o eletromagnetismo e o caráter tensorial das leis e das
grandezas físicas. Pode-se dizer que as equações de Maxwell, unificando a eletricidade o magnetismo e a
óptica, ou seja, o eletromagnetismo motivou essa teoria.
A partir de 1890, Lorentz e Larmor1 estudaram o comportamento do campo eletromagnético observado
por diferentes referenciais.2 Poincaré3 desenvolveu (1897-1905) e praticamente completou a teoria para
uma relatividade em consonância com as leis do eletromagnetismo,4 porém, faltava-lhe apenas uma crucial
hipótese: a constância da velocidade da luz, independentemente de velocidade da fonte, sendo esta hipótese,
substanciada e interpretada de forma revolucionária e genial por Einstein em 1905.5
Em Física moderna, a teoria da relatividade restrita é de grande importância para a investigação de
fenômenos atômicos, nucleares e em processos que envolvem partículas elementares de altas energias, uma
vez que todos esses fenômenos são detectados por meios eletromagnéticos.
Nas últimas quatro décadas do século XIX o eletromagnetismo e a óptica eram explicados com sucesso
pela teoria ondulatória baseada nas equações de Maxwell. A propedêutica à época previa que a teoria on-
dulatória sempre associava um meio material para a propagação das ondas, pareceu natural para os físicos
assumirem que a luz necessitava de um meio físico pelo qual se propagasse. Tendo em vista todos os fatos
conhecidos sobre a luz, pareceu necessário considerar que esse meio, então chamado de éter,6 preencheria
todo o espaço, possuiria densidade desprezível, e interagiria de forma também desprezível com a matéria.
Seu papel somente forneceria um meio físico para a propagação da luz.
1
Sir Joseph Larmor (1857-1942), físico, matemático e político norte-irlandês.
2
H. A. Lorentz, Arch. néerl. Sci. 25, 363 (1892); Idem, Versl. gewone Vergad. Akad. Amst. 1, 74 (1892); J. Larmor, Aether and
Matter, pp. 167-177, (Cambridge 1900); H. A. Lorentz, Proc. Acad. Sci. 6, 809 (1904).
3
Henri Poincaré (1854-1912), matemático e físico francês.
4
H. Poincaré, C. R. Acad. Sci., 140, 1504 (Paris, 1905).
5
A. Einstein, Ann. Phys., Lpz., 17, 891 (1905).
6
Fluido imaterial hipotético que permearia todo o espaço e que se supunha necessário à propagação das ondas eletromagnéticas,
cf. Houaiss.
Fluido extremamente sutil e elástico, espalhado em todo o universo, cuja existência era admitida por muitos físicos do séc. XIX
para explicar os fenômenos da luz e do calor (pela hipótese das ondulações), cf. Caudas Aulete.
15
“Z_2” — 2017/9/5 — 8:19 — page 16 — #36
A hipótese do éter colocara o eletromagnetismo numa situação especial em relação ao restante da fí-
sica. Há longo tempo sabia-se que as leis da mecânica eram as mesmas em diferentes referenciais que se
deslocassem uniformemente uns em relação aos outros, sem rotação relativa. Esses conceitos, pressupondo
ser o tempo uma quantidade independente do sistema de referência, têm por consequência que as leis da
mecânica são invariantes em face das transformações de Galileu.
~r′ = ~r − ~v t (2.1a)
e ′
t = t, (2.1b)
x′ = x − v t ; y′ = y ; z′ = z ; t′ = t .
Do fato de que as leis de Newton são invariantes com respeito às transformações de Galileu, o chamado de
princípio da relatividade de Galileu ou princípio da relatividade newtoniana, nos leva que as equações de
movimento de Newton para os dois sistemas são:
2 2 ′
~F = m d ~r = m d ~r = ~F′ , (2.2)
dt2 dt′ 2
de maneira que a forma da lei de movimento é invariante para observadores inerciais,8 para os quais as forças
consideradas em (2.2) são forças devidas apenas a interações com outros sistemas físicos. O conjunto geral
de transformações que leva um referencial inercial à outro é conhecido como grupo de transformações de
Galileu.9
7
Nome dado por P. Frank em 1909.
Philipp Frank (1884-1966), físico austríaco.
8
Uma vez que, em vista das transformações de Galileu, observadores em velocidade de translação relativa constante e velocidade
angular relativa nula medirem as mesmas acelerações.
9
Ver o texto de V. I. Arnold, Mathematical methods of classical mechanics (1989).
“Z_2” — 2017/9/5 — 8:19 — page 17 — #37
Um problema histórico importante ao final do século XIX se dá quando a força ~F em (2.2) é a força de
interação eletromagnética sobre uma partícula teste carregada devida a dada distribuição de cargas (ρ, ~J),
por meio da força de Lorentz, 10
Por exemplo, considere a equação escalar de onda, consequência das equações de Maxwell, para um
observador no referencial S ′ (ver Seção 1.3). Temos
2
′2 1 ∂2 ∂ ∂2 ∂2 1 ∂2
∇ − 2 ′2 ψ = + + − ψ = 0. (2.3)
c ∂t ∂x′2 ∂y ′2 ∂z ′2 c2 ∂t′2
Equação que não corresponde a uma equação de onda eletromagnética no referencial inercial S, em dis-
crepância com (2.3), que descreve a física observada do referencial inercial S ′ . Assim, a eletrodinâmica
não é consistente com o princípio da relatividade de Galileu.11 Deve-se ressaltar que a transformação in-
versa, também é uma transformação de Galileu, leva (2.4) em (2.3); ou seja, leva uma equação de não onda,
numa equação de onda! Ou ainda, se para S ′ há luz, para S não há comunicação eletromagnética! Há algo
fundamental a ser repensado do contexto clássico, 12 uma vez que observadores em S e em S ′ se comu-
nicam eletromagneticamente. As equações de ondas eletromagnéticas são consequências das equações de
Maxwell; assim, não tendo as equações de onda, não teremos as leis de Maxwell para o eletromagnetismo.
Voigt13 (1887) e Larmor (1897)14 foram os primeiros a perceber que as equações de onda eletromag-
néticas que satisfazem as equações de Maxwell eram, por outro lado, invariantes a outro tipo mais geral
de transformação, que devido ao trabalho de Lorentz (1899, 1904) recebeu o nome de transformação de
Lorentz, mesmo sida primeiramente publicada por Larmor. Os trabalhos de Poincaré e de Einstein visavam
uma teoria em compatibilidade com as transformações de Lorentz.
Até o advento da unificação em teoria dos fenômenos elétricos e dos fenômenos magnéticos, sintetiza-
dos por meio das equações de Maxwell, pouca atenção se deu para a questão de transformações de leis em
mudanças de referenciais, mesmo entre referenciais inerciais.
O estudo de cordas vibrantes e do som por meio de equação de onda explicava a realidade observada em
laboratório e em salas de música, enquanto o efeito Doppler (conceito introduzido em 1842 por Doppler15
para estudar estrelas duplas, independentemente de equação de onda; o efeito Doppler foi verificado para o
som em 1848 por Russell;16 já era conhecida a equação de onda para o som em meio material) era analisado
por meio da transformação de Galileu para o comprimento de onda em termos da velocidade relativa da
fonte emissora, e não em termos da transformação da equação de onda.
Para ondas acústicas há perda da invariância sob transformações de Galileu, uma vez que se a equação de
onda (2.3) é válida para sistema S ′ , ela é transformada por (2.1) em (2.4), que não se trata de uma equação de
10
A primeira derivação da força de Lorentz é comumente atribuído a Oliver Heaviside em 1889, embora outros historiadores
sugerem uma origem anterior, um artigo de 1865 escrito James Clerk Maxwell. Ver P. J. Nahin, Oliver Heaviside - the life,
work, and times of an electrical genius of the Victorian age (2002); P. G. Huray, Maxwell’s equations (2010), e o excelente livro
do prof. J. D. Jackson, Classical electrodynamics (1998).
Oliver Heaviside (1850-1925), engenheiro, matemático e físico inglês.
11
Questão que foi levantada por Galileu, que tentou medir em 1600 a velocidade de propagação da luz, colocando assistentes com
lanternas em topo de montanhas distantes, não tendo percebido quebra de simultaneidade.
12
Possivelmente na parcela cinética da lagrangiana.
13
Woldemar Voigt (1850-1919), físico alemão.
14
Larmor, Proceedings of the Royal Society; Philosophical Transactions of the Royal Society. Série de 3 artigos a conter a teoria
física de Larmor do universo. O último contém as chamadas transformações de Lorentz, em 1897 190, págs. 205-300.
15
Johann Christian Andreas Doppler (1803-1853), matemático e físico australiano.
16
John Scott Russell (1808-1882), engenheiro naval escocês.
“Z_2” — 2017/9/5 — 8:19 — page 18 — #38
onda. Algo semelhante ocorreu com eletromagnetismo no período 1887-1905, envolvendo Voigt, Larmor,
Lorentz, Poincaré, Michelson, Einstein, dentre outros; havendo à época várias possibilidades:
1. As equações de Maxwell não estariam corretas. A teoria do eletromagnetismo seria invariante sob
transformações de Galileu.
2. As transformações de Galileu aplicavam-se à mecânica clássica, mas para o eletromagnetismo haveria
um sistema de referência privilegiado, o éter.
3. Existiria um princípio de relatividade para a mecânica clássica e o eletromagnetismo em conjunto,
mas não seria a chamada relatividade de Galileu. Tal fato implicaria a necessidade de modificação
das leis da mecânica.
Os experimentos de Fizeau (1851, 1853) 17 sobre a velocidade da luz em fluídos em movimento, e, poste-
riormente, experimentos de Michelson-Morley só seriam explicados se o éter fosse parcialmente “arrastado”
pelo fluído em movimento, onde a eficiência do arrasto estava relacionado com seu índice de refração.
À época, o sucesso recente da teoria de Maxwell, sob aspecto teórico e experimental, com respaldo dos
trabalhos de Hertz18 , Lorentz e outros, enfraquecera a primeira possibilidade. Em 1887, Hertz construíra
o primeiro aparato eficaz para transmitir e para detectar ondas eletromagnéticas nas faixas de onda UHF e
VHF. Tal sucesso experimental evidenciara a importância das equações de onda previstas pelas equações
de Maxwell, e, daí, das transformações de Lorentz, apontado para a resposta à singela questão: em quais
referencias são válidas as equações de Maxwell.
Paralelamente, esforços para observar efeitos do deslocamento de laboratórios terrestres em relação ao
referencial éter resultaram em confrontos negativos com a análise dos dados do experimento de Michelson-
-Morley, (1886, 1887),19 resultados experimentais bem justificados pela contração de Lorentz-FitzGerald20
(1892, 1889),21 pela a qual objetos em movimento com velocidade constante ~v em relação ao éter se
contraem na direção do movimento de acordo com a fórmula
r
v2
L(v) = L0 1 − 2 . (2.5)
c
Lorentz e Poincaré mostraram que as equações de Maxwell são invariantes sob as transformações especiais
conhecidas como transformações de Lorentz, e que a contração (2.5) se mantém também para densidades
de carga móveis na eletrodinâmica.
Em seguida a esse resultado, Lorentz ainda tentou salvar a hipótese do éter da contradição resultante do
experimento de Michelson-Morley 22 ., considerando que a matéria seria de natureza eletromagnética, seria
assim plausível assumir que a equação (2.5) válida para agregados macroscópicos de elétrons e átomos.
Resultados experimentais robustos levam ao abandono da hipótese do éter.
vidade que deviriam abranger a mecânica clássica, a eletrodinâmica e todos os fenômenos da natureza. A
teoria da relatividade especial de Einstein se baseia em dois postulados:
Estes sistemas de referência são os chamados sistemas de referência inerciais. O postulado de relativi-
dade, também chamado postulado de Poincaré ou primeiro postulado de Einstein, é consistente com toda
a nossa experiência na mecânica desde os tempos de Copérnico, está também em concordância com os
experimentos de Michelson-Morley e deixa sem sentido a hipótese do éter.
Este postulado leva a uma radical reformulação das nossas idéias em relação ao espaço e ao tempo. Em
nossa derivação apresentada na Seção 2.4, faremos de forma tradicional, baseada nos postulados 1 e 2, mas,
como Mermin24 tem enfatizado, 25 a estrutura geral da transformação de Lorentz pode ser deduzida a partir
do primeiro postulado somente, além de alguns pressupostos óbvios, sem referência a velocidade da luz,
exceto como o parâmetro empírico que distingue essa transformação da de Galileu.
Experimento de Fizeau A hipótese da existência do éter, levou à uma série de experimentos com o
objetivo de estudar as suas propriedades e características de sua interação com os corpos ordinários
Em 1851, Fizeau realizou o clássico experimento em que a propagação da luz ocorria num meio em
movimento (a luz passava em um recipiente contendo água corrente), ver Fig. 2.2. A água circulava com
velocidade u conforme indicado na figura. Chamamos v a velocidade da luz na água em repouso. A ve-
locidade v, do ponto de vista da teoria do éter, é a velocidade da luz no éter que se encontra na água em
repouso. Supondo que o éter é arrastado pela água em movimento, mas não totalmente e sim parcialmente,
então sua velocidade em relação ao arranjo experimental é igual a αu.
24
Nathaniel David Mermin (1935- ), físico americano.
25
N. D. Mermin, American Journal of Physics 52, 119-124 (1984).
“Z_2” — 2017/9/5 — 8:19 — page 20 — #40
Nestas condições a velocidade da luz na água, em relação ao arranjo experimental, para um feixe lumi-
noso que se propaga contra a corrente será igual a v−αu, e para um feixe luminoso que se propaga a favor
da corrente será igual a v+αu. Desta forma temos a diferença entre os tempos
2L 2L 4Lαu
∆t = − = 2
v − αu v + αu v − α2 u2
sendo L o braço de cada um dos tubos. Assim, Fizeau obteve as figuras de interferência correspondentes a
água em repouso e em movimento, e mediu o deslocamento experimentado pelas franjas de interferência.
Por meio destas medidas, Fizeau demonstrou que o valor de α é expresso pela fórmula
1
α=1−
n2
em que n é o índice de refração da água. Este fator α = 1−1/n2 tende a zero, quando n tende a unidade, é
chamado coeficiente de Fresnel,26 e se n = 1 não deverá arrastar o éter.
Experimento de Michelson-Morley O fato da velocidade da luz ser muito elevada em comparação com
as velocidades obtidas em laboratórios, tornava difícil verificar se a velocidade da luz era ou não diferente
para diferentes referenciais. No entanto, o referencial da Terra move-se com grande velocidade em relação
ao Sol: o raio médio da órbita da Terra é R = 1,5×1011 m e a velocidade angular ω = 2π/(365 dias) ≈
2×10−7 s−1 , o que corresponde a uma velocidade média de 3×104 m/s = 30 km/s, ou seja, cerca de cem
mil quilômetros por hora!
Michelson e Morley (1881) usando o fato da Terra constituir um referencial que se move com grande
velocidade em relação ao Sol, tentaram medir a dependência da velocidade da luz em relação a velocidade
do observador.
O interferômetro de Michelson-Morley era constituído de dois braços perpendiculares, conforme mos-
trado na Fig. 2.3, um que pode ser colocado na direção do espelho A e o outro na direção do espelho B, e
veio permitir verificar o efeito da velocidade do referencial do observador na medição da velocidade da luz.
26
Augustin-Jean Fresnel (1788-1827), físico e engenheiro francês.
“Z_2” — 2017/9/5 — 8:19 — page 21 — #41
Numa dada época do ano, num dado local sabe-se qual a direção e sentido do movimento de translação.
Assim, o interferômetro será orientado com o braço do espelho B na direção de translação. Os braços
dos espelho A e espelho B tem o mesmo comprimento d, i.e., consideramos OA o braço entre o espelho
semi reflexivo O até o espelho A e OB o braço entre o espelho semi reflexivo O até o espelho B, tal que
OA = OB = d.
Enquanto os raios vão e vêm ao longo do caminho do braço OB, os espelhos O e B movem-se para O′
′
e B . Na hipótese da existência de um referencial absoluto, o éter, em relação ao qual a velocidade da luz é
c e assumindo ′
√ a validade do cálculo clássico da soma das velocidades, a luz viaja, no percurso OAO com
2 2
velocidade c −v , levando nessa viagem o tempo
d d 2d 1 2d v2
T1 = √ +√ = p = 1+ 2 .
c2 − v 2 c2 − v 2 c 1 − (v/c)2 c 2c
Há uma diferença de tempo T2 − T1 ≈ (d/c)(v 2 /c2 ) que corresponde a uma diferença de percurso
óptico ∆ = d(v 2 /c2 ). Este cálculo é para o caso em que o braço OA seja perpendicular ao movimento
de translação e o braço OB paralelo. Mudando a orientação dos braços o resultado é outro. As figuras de
interferência obtidas deveriam então naturalmente variar com a orientação do interferômetro. Nesse ponto
é que a experiência deu um resultado negativo inesperado. As figuras de interferência eram independentes
da orientação do interferômetro. Tudo se passa como se a luz não se aplicasse a regra da soma vetorial
de velocidades, deslocando-se sempre com a mesma velocidade c. A luz fica indiferente ao movimento do
interferômetro, arrastado no movimento de translação da Terra.
ω1 − ω2 2ΩR
= 2 |(~v0 )⊥ | sen Ωt
ω0 c
27
Rudolf Ludwig Mössbauer (1929-2011), físico alemão.
O efeito Mössbauer é um fenômeno físico descoberto pelo físico alemão Rudolf Mössbauer em 1957. Envolve emissão resso-
nante, sem recuo e absorção de fótons de radiação gama por átomos ligados em uma forma sólida e forma a base da espectros-
copia Mössbauer.
28
D. C. Champeney, G. R. Isaak and A. M. Khan, Phys. Lett., 7, 241 (1963).
“Z_2” — 2017/9/5 — 8:19 — page 22 — #42
em que (~v0 )⊥ é a componente de ~v0 perpendicular ao eixo de rotação, produz uma frequência de diferença
igual a largura da linha Mössbauer para uma velocidade de arraste do éter ∼ 200 m/s. Os dados não
indicaram modificações temporais na transmissão, com uma exatidão de 1 ou 2 %. Os autores concluíram
que a componente de ~v0 perpendicular ao eixo de rotação, é |(~v 0 )⊥ | = 1, 6 ± 2, 8 m/s, i.e., resultado nulo
dentro do limite dado pelo erro experimental. Uma experiência melhorada, em 1970,29 as mesmas linhas
dão uma velocidade de arraste com limite de 5 cm/s. Claramente, a existência de um sistema de referência
preferencial e com isso a idéia do éter deve ser abandonado, o primeiro postulado da teoria da relatividade
especial foi confirmado.
O segundo postulado, sem comprovação experimental quando Einstein fez a proposta, de que a ve-
locidade da luz é independente do movimento da fonte, destrói o conceito de tempo como uma variável
universal, independente das coordenadas espaciais. Este postulado teve sua verificação realizada em um
maravilhoso experimento realizado no CERN30 (Genebra, Suíça) em 1964.31 O teste foi realizado com
raios gama, de 6 GeV, emitidos por píons neutros π 0 de altas energias. Tais mésons, produzidos por prótons
de 19, 2 GeV colidindo em alvo fixo de berílio, decaem espontaneamente em dois gamas γ, conforme a
Fig. 2.5:
π0 → γ γ
cada um dos quais tem velocidade c no sistema de repouso do píon. Nesta experiência, a velocidade dos π 0
era maior que 0,99975 c. Apesar disso, a medida direta das velocidades dos raios γ emitidos praticamente
na direção frontal deu o resultado de (0,99992±0,00013) c, no sistema de referência do laboratório. Dentro
dos erros experimentais, este valor é igual à velocidade da luz! Em comparação, a adição galileana de
velocidades iria prever que os raios gama deviam ter uma velocidade de 2c com respeito ao laboratório.
Outros experimentos, com partículas carregadas e neutrinos, independentemente confirmaram este re-
sultado e forneceu evidências para a constância da velocidade da luz sobre sua frequência,32 estabelecendo
conclusivamente a validade do segundo postulado da relatividade especial.
29
G. R. Isaak, Phys. Bull., 21, 255 (1970).
30
CERN - European Organization for Nuclear Research, Genebra, Suíça.
31
T. Alväger, F. J. M. Farley, J. Kjellman and I. Wallin, Phys. Lett., 12, 260 (1964); T. Alväger, J. M. Bailey, F. J. M. Farley, J.
Kjellman and I. Wallin, Arkiv Fysik, 31, 145 (1966).
32
G. R. Kalbfleisch, N. Baggett, E. C. Fowler and J. Alspector, Phys. Rev. Lett., 43, 1361 (1979); K. Hirata et al. (Kamiokande-II
Collaboration), Phys. Rev. Lett., 58, 1490-1493 (1987); M. J. Longo, Phys. Rev., D36, 3276 (1987).
“Z_2” — 2017/9/5 — 8:19 — page 23 — #43
2 2 2 2
c2 t′ − (x′ + y ′ + z ′ ) = 0 . (2.7)
Do primeiro postulado de Einstein podemos supor que o espaço-tempo é homogêneo e isotrópico, então a
relação entre os dois sistemas deve ser linear. As Eqs. (2.6) e (2.7) estão relacionadas por
2 2 2 2
c2 t′ − (x′ + y ′ + z ′ ) = λ2 c2 t2 − (x2 + y 2 + z 2 ) (2.8)
em que λ = λ(~v ) é uma possível mudança de escala entre os sistemas. Com a escolha feita sobre os eixos, e
considerando também a transformação inversa, é possível provar que λ(v) = 1,33 e o tempo e as coordenadas
espaciais em S ′ estão relacionadas com aquelas em S pela transformação de Lorentz
0
x′ = γ(x0 − βx1 )
1
x′ = γ(x1 − βx0 )
2 (2.9)
x′ = x2
3
x′ = x3 ,
33
Segue-se que λ = ±1. Mas, λ = −1 é descartado imediatamente, uma vez que os intervalos c2 dt2 − (dx2 + dy 2 + dz 2 ) e
2 2 2 2
c2 dt′ − (dx′ + dy ′ + dz ′ ) devem coincidir exactamente quando não existe movimento de S ′ em relação a S.
“Z_2” — 2017/9/5 — 8:19 — page 24 — #44
É importante observar que o limite não relativístico da transformação de Lorentz obtém-se fazendo c → ∞.
De fato, passando ao limite c → ∞, em (2.9), temos a transformação de Galileu, característica da mecânica
newtoniana.
As Eqs. (2.9) e (2.10) descrevem uma situação especial de uma transformação de Lorentz já que esco-
lhemos um sistema movendo-se em relação a outro com uma velocidade ~v paralela ao eixo x. Se os sistemas
S e S ′ permanecem paralelos, mas a velocidade ~v do sistema S ′ em relação ao sistema S está numa direção
arbitrária, a generalização de (2.9) será
Os coeficientes da transformação de Lorentz Λµν formam uma matriz Λ = (Λµν ) conhecida como matriz da
transformação de Lorentz. No caso de termos a transformação de Lorentz ao longo da direção x, a matriz
associada será
γ −βγ 0 0
−βγ γ 0 0
Λ = (Λµν ) =
0
. (2.14)
0 1 0
0 0 0 1
No caso da transformação de Lorentz (2.12), em que a direção de ~v = c~β é arbitrária e, naturalmente,
~β = (β , β , β ) ≡ (β , β , β ), os elementos da matriz Λ = (Λµν ) generalizada são
1 2 3 x y z
Λ00 = γ
Λ0i = Λi0 = −γβi
βi βj
Λij = δij + (γ − 1) ,
β2
como veremos mais adiante.
“Z_2” — 2017/9/5 — 8:19 — page 25 — #45
~ ′·~
A′0 B ′0 − A ~ ·~
B′ = A0 B 0 − A B. (2.17)
Este resultado pode ser verificado explicitamente usando (2.15) para construir o lado esquerdo da Eq. (2.17),
ou usando (2.16) para a soma dos dois quadrivetores. Nota-se que usando as transformações de Lorentz, o
produto escalar é análogo à invariância de A~ ·~
B sob rotações em três dimensões.
Intervalo Invariante e Tempo Próprio O intervalo ds entre dois eventos infinitesimalmente próximos,
com coordenadas (x, y, z, t) e (x+dx, y+dy, z+dz, t+dt), respectivamente, é definido por
Este resultado indica que o intervalo entre dois eventos é invariante sob transformações de Lorentz, i.e.,
temos o intervalo invariante. Podemos dizer que ds é um escalar de Lorentz. Naturalmente o mesmo resul-
tado vale para um intervalo ∆s. Nota-se que ds é análogo à distância entre dois pontos infinitesimalmente
próximos num espaço euclidiano tridimensional. O espaço-tempo quadridimensional com ds invariante
definido por (2.18) é conhecido como espaço de Minkowski. 34
34
Hermann Minkowski (1864-1909), matemático russo-alemão.
“Z_2” — 2017/9/5 — 8:19 — page 26 — #46
Outro conceito importante é o de tempo próprio. Consideremos um sistema, como sendo uma partícula,
que está movendo-se com uma velocidade instantânea ~u(t) relativa a um outro sistema inercial S. Num in-
tervalo de tempo dt sua posição sofre um deslocamento d~r = ~u dt. Pela Eq. (2.18) temos o quadrado do
infinitesimal ds
ds2 = c2 dt2 − |d~r|2 = c2 dt2 (1 − β 2 ) > 0 , (2.20)
em que β = uc . No sistema de coordenadas S ′ onde a partícula está em repouso instantâneo, os incrementos
espaço-temporais são dt′ ≡ dτ , e d~r ′ = 0. Assim temos o intervalo ds = c dτ . O incremento de tempo dτ no
sistema de referência onde o partícula está em repouso instantâneo é, desta forma, um invariante de Lorentz
e tem a forma
p 1
dτ = dt 1 − β 2 (t) = dt . (2.21)
γ (t)
O tempo τ recebe o nome de tempo próprio da partícula ou do sistema. É o tempo medido no sistema de
repouso da partícula. Da Eq. (2.21) se segue que um dado intervalo de tempo próprio τ2 −τ1 será observado
no sistema S como o intervalo temporal
Z τ2 Z τ2
dτ
t2 − t1 = p = γ (t) dτ . (2.22)
τ1 1 − β 2 (t) τ1
As Eqs. (2.21) ou (2.22) expressam o fenômeno conhecido como dilatação temporal. Um relógio que se
movimenta funciona mais lentamente que outro em repouso. Para intervalos de tempo iguais no sistema do
relógio em repouso, os intervalos observados no sistema S são maiores por um fator γ > 1.
xµ yµ = xµ y ν gµν , (2.23)
em que xµ = (x0 , ~x) e yµ = gµν y ν = (y 0 , −~y ), sendo gµν os elementos da matriz G definida por
1 0 0 0
0 −1 0 0
G = (gµν ) =
0 0 −1 0 . (2.24)
0 0 0 −1
A matriz G define uma métrica no espaço de Minkowski e seus elementos gµν são chamados de compo-
nentes do tensor métrico. A Eq. (2.23) algumas vezes é chamada de produto escalar de Minkowski de x
por y.
Indicaremos por gµν a inversa da matriz gµν . Assim y µ = gµν yν . Índices superiores e inferiores são
chamados de contravariantes e covariantes, respectivamente. As coordenadas contravariantes e covariantes
diferem somente na parte espacial, quando os índices variam de um a três.
Seja Λ uma das transformações do grupo de Lorentz. Sabemos que
x′µ = Λµν xν ,
ΛT G Λ G = I , (2.26)
ou seja, (det Λ)2 = 1 e portanto det Λ = ±1. Uma transformação de Lorentz com determinante igual a +1
é dita própria, e dita imprópria se o determinante for −1. Assim, a transformação de Lorentz (2.9) é do tipo
própria.
Tomando α = β = 0 em (2.25) se obtém
ou seja
(Λ00 )2 = 1 + (Λ10 )2 + (Λ20 )2 + (Λ30 )2 ≥ 1 ,
e, finalmente,
Λ00 ≥ ±1 . (2.28)
Se Λ00 ≥ +1, a transformação de Lorentz é dita ortócrona (preserva o sentido do tempo); se Λ00 ≤ −1, a
transformação de Lorentz é dita não ortócrona ou heterócrona (inverte o sentido do tempo). Qualquer trans-
formação de Lorentz pura, tal como (2.9), que conecta referenciais com eixos paralelos e em movimento
relativo com velocidade constante, é ortócrona. As transformações de Lorentz puras também são chamadas
de boosts. 35 As transformações próprias e ortócronas são chamadas de transformações de Lorentz restritas.
Este conjunto forma um subgrupo do grupo de Lorentz, chamado de grupo de Lorentz próprio ou grupo de
Lorentz restrito. O princípio da relatividade de Einstein afirma que as leis da física são invariantes em rela-
ção ao grupo de Lorentz próprio, i.e., restrito. Os resultados da combinação das transformações de Lorentz
com as translações espaço-tempo formam o grupo de Poincaré.
Cone de Luz Uma interpretação física das transformações próprias de Lorentz é obtida mediante a noção
de cone de luz de um ponto, ver Fig. 2.6.
s2 = xµ xµ = c2 t2 −x2 −y 2 −z 2 .
35
Lorentz boots é simplesmente uma transformação de Lorentz, que não envolve a rotação.
“Z_2” — 2017/9/5 — 8:19 — page 28 — #48
O lugar geométrico dos pontos para os quais s2 = 0 é o cone de luz da origem, e é obviamente invariante de
Lorentz. O cone divide o espaço-tempo em quatro regiões: a região I, dentro do cone (contendo o eixo dos
tempos) para a qual
s2 > 0 , t > 0
é o semi-cone do futuro absoluto de O; a região II, dentro do cone, tal que
s2 > 0 , t<0
é o semi-cone do passado absoluto de O; as regiões III e IV, fora do cone, para qual
s2 < 0 ,
são regiões em que é impossível haver conexão causal entre O e um evento nelas contidos.
Uma transformação de Lorentz geral deixa invariante todas as regiões. Mas pode, evidentemente, trans-
formar I em II ou vice-versa. Uma transformação de Lorentz própria transforma I em I e II em II, i.e.,
não muda o futuro no passado ou vice-versa.
A evolução temporal de um sistema físico estará representada por uma trajetória (ct, x(ct)) nesse plano
espaço-temporal, chamada linha de universo. Na Fig. 2.6, as retas A e B, inclinadas de 45◦ relativamente
ao eixo dos tempos, representam as linhas do universo. É fácil notar que as linhas do universo dos sinais
luminosos emitidos em t = 0 desde a origem são representadas pelas trajetórias 0 = c2 t2−x2 = (ct+x)(ct−x),
ou seja, as trajetórias x = −ct e x = ct. Claro que qualquer sistema material tem uma velocidade menor
que c e sua linha de universo estará contida na metade superior do cone de luz (região I). Em particular, o
movimento de um ponto material pode ser representado por uma trajetória passando pela origem, contida
dentro do cone e dirigida de II para I.
Um ponto da região III ou IV chama-se do tipo espaço, um ponto da região I ou II chama-se do tipo
tempo, e se temos s2 = 0 é dito do tipo luz. Partículas que caminham na região III e IV são os táquions,
ou seja, partículas com velocidade superior a velocidade da luz no vácuo.
Grupos O(3, 1) e SO(3, 1) Seja Λ um elemento de Mat(4, R)36 que representa uma mudança entre
sistemas de referência inerciais que preserva os intervalos de tipo luz. Então,
1
G ΛT G Λ = (ΛT G Λ)00 I = ±| det Λ| 2 I . (2.29)
G ΛT G Λ = I , (2.31)
assim, temos x′µ y ′ µ = xµ yµ , para todos x, y ∈ R4 . Este fato e a particular forma da matriz Λ mostram que
o conjunto de tais matrizes Λ coincide com o grupo O(3, 1).
Devido à sua importância na física relativística, o grupo O(3, 1) recebe denominação especial, a sa-
ber, denominado grupo de Lorentz. O grupo O(3, 1) é também denotado por L. Os elementos de L são
denominados transformações de Lorentz. Assim,
Deste conjunto que forma o grupo de Lorentz, somente L↑+ é o subgrupo conhecido por grupo de Lorentz
próprio.
Nota-se que os elementos de ambos os conjuntos L↑+ e L↓+ satisfazem det Λ = 1. Portanto, o grupo de
Lorentz próprio L+ := L↑+ ∪ L↓+ coincide com o grupo SO(3, 1). Em L↑ não ocorre reversão temporal.
Assim,
SO(3, 1) := {Λ ∈ Mat(4, R), Λ−1 = ΛT e det Λ = 1} . (2.34)
com as definições
v
1 c
cosh ζ ≡ γ = q , senh ζ ≡ βγ = q ,
v2 v2
1− c2 1− c2
de modo que tanh ζ = β = vc . O “ângulo de rotação” ζ é conhecido como parâmetro de boosts ou rapidez.37
A fórmula (2.35) é diferente do usual, da transformação para o caso de rotação dos eixos de coordenadas,
em que as funções trigonométricas são substituídas por funções hiperbólicas. Isto destaca a diferença entre
a geometria euclidiana e pseudoeuclidiana.
37
Do inglês rapidity.
“Z_2” — 2017/9/5 — 8:19 — page 30 — #50
em que A é uma matriz 2 × 2 que pertence a Mat(2, C) que é o conjunto de todas as matrizes complexas
2 × 2.
Para estabelecer um homomorfismo entre o grupo de Lorentz próprio e o grupo de matrizes unimodula-
res 2× 2, usualmente representado por SL(2, C) faremos a seguinte correspondência: para cada quadrivetor
xµ associamos uma matriz hermitiana σµ , i.e., matrizes hermitianas de Pauli,38
0 1 0 −i 1 0
σ1 = , σ2 = , σ3 = ,
1 0 i 0 0 −1
então
µ 0 1 2 3 x0 + x3 x1 − i x2
x = x σµ = x I + x σ1 + x σ2 + x σ3 = , (2.36)
x1 + i x2 x0 − x3
tal que
1
xµ =
tr(xσµ ) . (2.37)
2
Assim, para cada transformação α ∈ SL(2, C) que escrevemos
µ
x → x′ = αxα† = x′ σµ (2.38)
sendo
1
Λµν = tr ασν α† σµ . (2.40)
2
′
Como det(x) = det(x ), ou explicitamente
3
X 3
X
0 i
(x0 )2 − (xi )2 = (x′ )2 − (x′ )2 ,
i=1 i=1
temos que Λ é uma transformação de Lorentz, e é facilmente demonstrado que Λ pertence ao grupo de
Lorentz próprio L↑+ . Substituindo (2.39) em (2.38)
tr I = tr σ0 = 2, tr σi = 0, i = 1, 2, 3 ,
1 1 1
Λ00 = tr ασ0 α† σ0 = tr αα† = |a|2 + |b|2 + |c|2 + |d|2
2 2 2
1
= 2 + |a − d∗ |2 + |b + c∗ |2 ≥ 1 . (2.44)
2
1 0
Mas corresponde a Λ = I com detΛ = 1. Mas o determinante é uma função contínua dos
0 1
elementos da Λ e como o grupo unimodular bidimensional é conexo, não será possível passar para a região
com det Λ = −1. A correspondência estudada é um homomorfismo pois, dada a transformação de Lorentz
Λ, existem duas matrizes, α e −α, que satisfazem (2.40).
Para as transformações de Lorentz pura, no entanto, há uma descrição simples da matriz α adequada
para rotações espaciais. Uma verificação direta da Eq. (2.38) mostra que a matriz unimodular α será
ζ
!
e− 2 0
α= ζ , (2.45)
0 e2
A relação (2.46) vai ser reconhecida como uma transformação de Lorentz pura, ver a Eq. (2.35), para o
movimento relativo ao longo do eixo x3 = z, com as definições cosh ζ ≡ γ, senh ζ ≡ βγ de modo que
tanh ζ = β. A matriz (2.45) também poderá ser escrita na forma
ζ ζ
α = cosh − σ3 senh , (2.47)
2 2
para a rotação espacial em torno do eixo z.
Para finalizar, a matriz unimodular bidimensional associada com a rotação ζ em torno de uma direção
genérica n̂ é dada por
ζ ζ
α = I cosh − n̂ · ~σ senh , (2.48)
2 2
e no espaço de spinores de Dirac, o grupo SL(2, C) atua por meio das matrizes
α 0
,
0 (α† )−1
~σ × ~σ = 2 i ~σ ,
σi σj σk = σi δjk − σj δik + σk δij + i εijk ,
i
σµ σν = εµνβα σ β σ α = δµν , σ µ ≡ (I, −~σ ) σµ ≡ (I, ~σ ) .
2
As quantidades εijk e εµνβα são totalmente antissimétricas e
ou seja, nessa forma de escrever a transformação de Poincaré também se aplica a classificação das transfor-
mações de Lorentz.
Por certo tempo, muitos físicos pensavam que o princípio da relatividade envolvesse o grupo de Poincaré
geral. Com a descoberta da violação da paridade nas interações fracas, ficou evidente que o princípio da
relatividade só é válido para o grupo de Poincaré cuja transformação é ortócrona e própria.
Dadas duas transformações de Poincaré
Se multiplicarmos Λβµ gβα Λαν = gµν por gλµ e sabendo que gλµ gµν = δνλ , então,
gλµ Λβµ gβα Λαν = δνλ . (2.50)
tal que
Λλα Λαν = δνλ . (2.51)
Isto mostra que Λλα são os coeficientes da transformação inversa daquela cujos coeficientes são dados
por Λαν .
Em virtude das condições impostas pelas Eqs. (2.50) e (2.51), o grupo de Lorentz próprio ortócronas
é um grupo contínuo de seis parâmetros, pois seus elementos são funções contínuas desses parâmetros e a
variação contínua desses a partir de δνµ pode gerar o grupo L↑+ . Já o grupo de Poincaré próprio ortócrono é
um grupo contínuo de dez parâmetros.
40
Eugene Paul Wigner (Wigner Jenö Pál) (1902-1995), matemático e físico húngaro-americano.
“Z_2” — 2017/9/5 — 8:19 — page 33 — #53
φ′ (x′ ) = φ(x) .
ou
∂µ′ φ′ = Λνµ ∂ν φ
com φ′ = φ, concluímos que, como operador,
∂µ′ = Λνµ ∂ν .
Analogamente
µ µν ∂ ∂ ∂ ∂ ∂ 1 ∂ ~
∂ = g ∂ν = = , , , = , −∇ (2.53)
∂xµ ∂x0 ∂x1 ∂x2 ∂x3 c ∂t
gera um vetor contravariante.
Tomando o produto escalar destes vetores (2.52) e (2.53), obtemos a versão quadridimensional do ope-
rador laplaciano, conhecido como operador d’alembertiano (de d’Alembert) 41
1 ∂2
= ∂µ ∂ µ = − ∇2 (2.54)
c2 ∂t2
Como este operador é um escalar, é uma quantidade invariante por transformações de Lorentz. Portanto, a
equação de onda (2.3) que pode ser escrita como
ψ = 0, (2.55)
Agora, vamos impor uma forma para Λik . Sabemos que essa deve reduzir-se à identidade no caso de velo-
cidade nula e deve depender apenas das velocidades. A forma mais simples com que esse fato acontece é
tomando
Λik = δki + b v i vk
vi (δki + b v i vk ) = γ vk + b v 2 vk = (1 + bv 2 )vk
γ−1
b= (2.62)
v2
v i vk
Λik = δki + (γ − 1) 2
v
~
Agora, considere uma solução da equação de onda φ(x) = Aei(ωt−k · ~x) = Aeiξ , que será invariante so-
mente
se sua
fase o for. Note que esta pode ser escrita como um produto escalar entre os quadrivetores
ω ~
k = c , k e x = (ct,~x), que devem se transformar da forma usual sob transformações de Lorentz.
Considere uma transformação tal que S ′ se mova em relação à S paralelo ao eixo x
γ −βγ 0 0
−βγ γ 0 0
Λ = (Λµν ) =
0
, (2.64)
0 1 0
0 0 0 1
com β = vc , então
ω′ ω
=γ − βkx
c c
′ ω
kx = γ kx − β (2.65)
c
′
ky = ky
kz′ = kz .
“Z_2” — 2017/9/5 — 8:19 — page 36 — #56
ω2
Além disso, sabemos que φ satisfaz a equação de onda dada anteriormente, então temos k2 = c2
−|~k|2 = 0.
ω′ ω ω
=γ − β|~k| cos α = γ(1 − β cos α)
c c c
′ (1 − β cos α)
ω =ω p (2.66)
1 − β2
ω ω′ ω′
kx = cos α = γ kx′ + β = γ (cos α′ + β)
c c c
αv 2
L∼
= −αc + .
2c
42
Ver o livro: J. D. Jackson, Classical electrodynamics, 3rd ed. (1999).
“Z_2” — 2017/9/5 — 8:19 — page 37 — #57
Lembrando que o termo constante é irrelevante para lagrangiana, pois não traz consequência para as
equações de movimento, o limite não relativístico fica representado apenas pelo segundo termo. Usando a
expressão clássica para lagrangiana L = mv 2 /2, α pode ser identificado com mc, tal que a ação será
Z b
S = −mc ds (2.69)
a
e a lagrangiana será r
2 v2
L = −mc 1− , (2.70)
c2
naturalmente no limite não relativístico
mv 2
L∼
= −mc2 + .
2
O momentum, ou impulso, de uma partícula é dado por
∂L mvi
pi = =q
∂vi 2
1 − vc2
m~v
~p = q (2.71)
v2
1− c2
Esta relação mostra que em mecânica relativística a energia de uma partícula livre não se anula quando
v = 0, pois ainda temos
E = mc2
que recebe o nome de energia de repouso da partícula.
No limite não relativístico, expandindo (2.72) em séries de potências v/c, temos
mv 2
E∼
= mc2 +
2
ou seja, o primeiro termo é a energia de repouso e o segundo termo a energia cinética da partícula.
As Eqs. (2.71) e (2.72) nos dão o momentum e a energia de uma partícula, porém não solucionamos
o problema da transformação da energia e momentum quando passamos de um sistema de referência para
outro. Para resolvermos este problema devemos fazer uso das características quadridimensionais destas
grandezas físicas.
Vamos introduzir a definição quadrivelocidade como
dxµ
uµ = . (2.73)
ds
Sabemos que ds = c dτ e utilizando a relação (2.21), podemos escrever
1 dxµ
uµ = q ,
1− v2 c dt
c2
“Z_2” — 2017/9/5 — 8:19 — page 38 — #58
uµ uµ = 1 . (2.75)
Como conhecemos, pelo princípio da ação mínima, (δxµ )a = (δxµ )b = 0. Usando a Eq. (2.76) e a
condição δS = 0 obtemos
duµ d(muµ )
mc = =0
ds dτ
que é equação de movimento para uma partícula livre.
Para determinar a variação da ação como função das coordenadas, vamos fixar o ponto a tal que
(δxµ )a = 0. O segundo ponto iremos considerar como uma variável tal que
δS = −mc uµ δxµ .
Logo,
E2
pµ pµ = m2 c2 = − p2
c2 (2.77)
E2
= p2 + m2 c2 ,
c2
“Z_2” — 2017/9/5 — 8:19 — page 39 — #59
E ′ + vp′x
E= q
2
1 − vc2
p′x + v2 E ′
px = q c (2.79)
2
1 − vc2
′
py = py
pz = p′z ,
Problemas
2.1 Descreva o experimento de Michelson-Morley, seus objetivos, suas medidas e suas consequências.
2.2 Mostre que uma transformação de Lorentz relacionando os sistemas inerciais S e S ′ pode ser expressa
como:
x′ = x , y′ = y , z ′ = z cosh α − ct senh α ,
z
t′ = t cosh α − senh α ,
c
v
em que tanh α = c . Verifique que essa transformação corresponde a uma rotação por um ângulo α i
no espaço quadridimensional.
2.4 Os píons se movem com velocidade v = 0, 99c. Em quantas vezes aumenta a meia vida dos píons que
é medido no sistema de laboratório? Qual a distância que eles percorrem durante esse tempo?
Dado: τπ = 1, 8 × 10−8 s. Sugestão: Consulte o livro do Prof. Jackson [41].
2.5 Discuta o processo de choque elástico de duas partículas, usando os quadrivetores. Sugestão: Consulte
o livro dos Profs. Landau e Lifshitz [49].
2.6 A energia cinética de uma partícula é igual a sua energia de repouso, qual é a velocidade da partícula?
2.7 No acelerador TEVATRON, no Fermilab (EUA),43 os prótons são acelerados até chegarem a uma ener-
gia de 900 vezes sua energia de repouso. Qual é a velocidades dos prótons?
Dado: A massa de repouso do próton é de aproximadamente 1 GeV.
43
Fermilab - Fermi National Accelerator Laboratory.
“Z_2” — 2017/9/5 — 8:19 — page 40 — #60
2.10 Em um meio transparente com índice de refração n, a velocidade da luz nesse meio é nc . Use a fórmula
da transformação da velocidade para mostrar que, se o meio tem uma velocidade v em relação ao
laboratório, então a velocidade da luz em relação ao laboratório é dada aproximadamente por
c 1
cl = ± 1 − 2 v ,
n n
em que o sinal (+) se aplica quando ~c é paralela a ~v, e o sinal (−) é para ~c antiparalela a ~v. Este
resultado foi observado na experiência de Fizeau (1859) sobre a velocidade da luz em fluidos em mo-
vimento.
2.11 Considere o decaimento do pion π 0 em dois fótons, i.e., π 0 → γ + γ. Usando a lei de conservação da
energia-momentum, e sendo θ o ângulo entre as direções de propagação dos fótons, mostre que
mπ c2
sen θ2 = √
2 E1 E2
em que E1 e E2 são as energias dos dois fótons no sistema de referência de repouso do píon.
2.12 Considere a questão da possibilidade de aniquilação de um par elétron-pósitron num único fóton.
Mostre que esse processo é incompatível com a conservação simultânea da energia e do momentum.
2.13 Determine o movimento uniformemente acelerado, i.e., o movimento retilíneo para o qual a aceleração
w no sistema de referência próprio permanece constante.
Leitura Recomendada
Recomenda-se ao leitor que estude, paralelamente à este texto, os seguintes livros
Nestes livros, que são clássicos da literatura, o leitor encontrará deduções detalhadas da relatividade restrita
e seus aspectos fundamentais e em especial no texto do prof. Pauli encontraremos um excelente trabalho
tanto do ponto de vista técnico como do ponto de vista histórico. O texto do Prof. Landau é muito elegante,
sendo o segundo livro da série monumental chamada Course of theoretical physics.
“Z_2” — 2017/9/5 — 8:19 — page 41 — #61
Capítulo 3
Partícula em um Campo Eletromagnético
O princípio de ação mínima para partículas carregadas que interagem com campos eletromagnéticos é de
grande importância para uma discussão sistemática das equações de movimento. Podemos deduzir a força
de Lorentz direto da formulação lagrangiana, bem como a equação de movimento na forma covariante.
em que Aµ se toma nos pontos da linha do universo da partícula. O fator 1c foi introduzido aqui por razões
de comodidade.
A ação para uma partícula em um campo eletromagnético externo tem a forma
Z b
e
S= −mc ds − Aµ dxµ . (3.1)
a c
~ o já conhecido potencial
As componentes espaciais do quadrivetor Aµ formam o vetor tridimensional A,
vetor. A componente temporal recebe o nome já conhecido de potencial escalar e é dado por A0 = Φ.
~ podemos reescrever a ação na forma
Assim, como temos Aµ = (Φ, A)
Z b
e~
S= −mc ds + A · d~r − eΦ dt ,
a c
41
“Z_2” — 2017/9/5 — 8:19 — page 42 — #62
d~r
ou introduzindo ~v = dt , faremos a integral com respeito ao tempo
Z r !
b
v2 e ~
S= −mc2 1 − 2 + A ·~v − eΦ dt , (3.2)
a c c
~P = q m~v + e A
~ = ~p + e A
~ , (3.4)
v2
1 − c2 c c
∂L
H = ~v · − L.
∂~v
Assim,
mc2
H=q + eΦ . (3.5)
v2
1− c2
Mas a hamiltoniana deve se expressar não em função da velocidade, mas sim em função do momentum
generalizado da partícula. Como a hamiltoniana é a energia total do sistema e difere da energia da partícula
livre pela adição da energia potencial eΦ, usando (3.4) podemos escrever o quadrimomentum como
µ E 1 ~ e~
p = , ~p = (H − eΦ), P − A ,
c c c
mas
pµ pµ = m2 c2 ,
então 2
H − eΦ e ~ 2
− ~P − A = m2 c2 . (3.6)
c c
Para velocidades pequenas, i.e., no limite não relativística, temos a lagrangiana
mv 2 e ~
L= + A ·~v − eΦ , (3.7)
2 c
nesta aproximação
e~
~p = m~v = ~P − A
c
e a hamiltoniana será
1 ~ e ~ 2
H= P− A + eΦ . (3.8)
2m c
“Z_2” — 2017/9/5 — 8:19 — page 43 — #63
e recordando que a derivada com respeito a~r se faz considerando ~v constante, temos
∂L e ~ A~ + e~v × (∇ ~ − e∇Φ
~ × A) ~ .
= (~v · ∇)
∂~r c c
Mas, sabemos que
∂L ~ e~
= P = ~p + A .
∂~v c
Como consequência, as equações de Euler-Lagrange serão da forma
d e~ e ~ + e ~v × (∇
~ A ~ − e∇Φ
~ × A) ~ .
~p + A = (~v · ∇)
dt c c c
Porém, como A ~ depende das coordenadas espaciais e do tempo, o diferencial total consta de duas partes,
d ∂ ~ obtemos então
= ∂t + ~v · ∇,
dt
d~p ~
e ∂A
=− ~ + e ~v × ∇
− e∇Φ ~ ×A
~ . (3.10)
dt c ∂t c
Esta é a equação de movimento de uma partícula em um campo eletromagnético.
A primeira parte da expressão anterior (primeiro e segundo termo) é independente da velocidade da
partícula. A força deste termo por unidade de carga poderá ser identificada com o nome de intensidade do
campo elétrico ~E, assim
~
~E = − 1 ∂ A − ∇Φ ~ , (3.11)
c ∂t
a segunda parte da expressão (terceiro termo) é dependente da velocidade da partícula, sendo proporcional e
perpendicular a mesma. O fator ~vc nesse tipo de força por unidade de carga identificamos como a intensidade
do campo magnético ~ B, assim
~
B=∇ ~ ×A ~ . (3.12)
Desta forma podemos reescrever a equação (3.10) como
d~p e
= e~E + ~v × ~
B, (3.13)
dt c
1
Leonhard Paul Euler (1707-1783), matemático e físico suíço.
Joseph-Louis Lagrange ou Giuseppe Lodovico (Luigi) Lagrangia (1736-1813), matemático e astrônomo ítalo-francês.
“Z_2” — 2017/9/5 — 8:19 — page 44 — #64
e
dK e
= ~v · e~E + ~v × ~
B ,
dt c
como ~v × ~
B ·~v = 0, temos
dK
= e~v · ~E . (3.14)
dt
A expressão a direita dessa equação é o trabalho realizado pelo campo eletromagnético sobre a partícula por
unidade de tempo. Este trabalho é realizado somente pelo campo elétrico. O campo magnético não realiza
nenhum trabalho, pois sua força efetiva é perpendicular a velocidade da partícula.
∂Aµ ν ∂Aµ
δAµ = δx e dAµ = dxν ,
∂xν ∂xν
encontramos Z b
e ∂Aµ µ ν e ∂Aµ
µ
mc duµ δx + δx dx − dxµ δxν = 0. (3.17)
a c ∂xν c ∂xν
du
Introduzindo a expressão duµ = dsµ ds no primeiro termo, e dxµ = uµ ds nos segundo e terceiro termos,
encontramos Z b
duµ e ∂Aν ∂Aµ
mc − µ
− ν
uν δxµ ds = 0 . (3.18)
a ds c ∂x ∂x
“Z_2” — 2017/9/5 — 8:19 — page 45 — #65
e introduzindo o tensor antissimétrico e de segunda ordem, conhecido como tensor do campo eletromagné-
tico ou tensor eletromagnético Fµν ,
∂Aν ∂Aµ
Fµν = − , (3.19)
∂xµ ∂xν
a equação de movimento covariante será
duµ e
mc = F µν uν . (3.20)
ds c
~ × A)
mas temos que ǫklm∂ l Am = −(∇ ~ k = −B k , de forma que F ij = −ǫijk B k . Analogamente, temos
!i
~
F i0 i 0
= ∂ A −∂ A = 0 i ~ − 1 ∂A
−∇Φ = Ei .
c ∂t
ou em componentes
X 1 X X kij ij
F i0 = E i e F ij = − ǫijk B k ⇔ Bk = − ǫ F . (3.22)
2
k i j
Os elementos de Fµν são obtidos a partir de F µν fazendo ~E → −~E. Uma outra quantidade de muita
utilidade é o tensor dual do campo eletromagnético F µν . Definindo o tensor totalmente antissimétrico de
quarta ordem, ou tensor de Levi-Civita 2 de quatro dimensões ǫµνγδ na forma
0 se dois ou mais índices quaisquer são iguais;
ǫµνγδ = +1 para permutações pares dos índices; (3.24)
−1 para permutações ímpares dos índices,
2
Tullio Levi-Civita (1873-1941), matemático e físico italiano.
“Z_2” — 2017/9/5 — 8:19 — page 46 — #66
∂x′µ ∂x′ν γδ
F ′µν = F . (3.27)
∂xγ ∂xδ
Usando a notação matricial para uma transformação de Lorentz própria, em que det Λ = +1, podemos
escrever essa equação na forma
F ′ = ΛF ΛT , (3.28)
em que
GΛT G = Λ−1 , (3.29)
sendo G a matriz dada em (2.24). Para uma transformação de Lorentz correspondente a um boost com
velocidade cβ segundo o eixo x̂, que vai desde o sistema S até o sistema S ′
γ −βγ 0 0
−βγ γ 0 0
Λ= 0
. (3.30)
0 1 0
0 0 0 1
Ex′ = Ex Bx′ = Bx
Ey′ = γ(Ey − βBz ) By′ = γ(By + βEz ) (3.31)
Ez′ = γ(Ez + βBy ) Bz′ = γ(Bz − βEy ) .
Para uma transformação de Lorentz geral de S até S ′ que se desloca com uma velocidade ~v relativa a S,
podemos escrever a transformação dos campos na forma
~E′ = γ(~E + ~β × ~ γ2 ~ ~ ~
B) − β(β · E)
γ+1
(3.32)
γ2 ~ ~ ~
~
B′ = γ(~ B − ~β × ~E) − β(β · B) .
γ+1
Estas transformações mostram que ~E e ~B não existem de forma independente. Um campo puramente elé-
trico ou magnético em um sistema de coordenas aparecerá como uma mistura de campos elétrico e magné-
tico em um outro sistema de coordenadas. Se estamos no limite não relativístico
~E′ = ~E + ~v × ~
B
c (3.33)
~B′ = ~ ~v
B − × ~E .
c
Como exemplo do uso da transformação dos campos eletromagnéticos temos: consideremos os campos
vistos por um observador num sistema S quando uma carga pontual q está em movimento em uma linha
reta com velocidade ~v. A carga está em repouso no sistema S ′ , e a transformação dos campos está dada
pela transformação inversa das Eqs. (3.32) ou (3.33). Suponhamos que a carga se desloca na direção de
x positivo e que a mínima distância de aproximação do observador é b (parâmetro de impacto), ver Fig.
3.1. Seja P o ponto de observação. Em t = t′ = 0 as origens dos dois sistemas coincidem e a carga
está na mínima distância de aproximação do observador. No sistema Sp ′ o ponto de observação P , tem
Figura 3.1 Partícula de carga q movendo-se com velocidade constante v, com observador em P e
parâmetro de impacto b.
~ q ~v ×~r
B≈ , (3.37)
c r3
que é justamente a expressão de Ampère-Biot-Savart4 para o campo magnético produzido por uma carga em
movimento. Quando temos velocidades relativística, quando γ ≫ 1, vemos que o campo elétrico transversal
Ey (t = 0) fica igual a γ vezes seu valor não relativístico.
Consideremos agora a variação espacial dos campos relativo à posição atual instantânea no laboratório.
Da Eq. (3.36), vemos que E vt
Ey = − b . Assim, o campo elétrico resultante está orientado ao longo da reta
x
com direção n̂ que une o observador com a posição da carga, como no caso coulombiano. Escrevendo o
denominador de (3.36) em termos da distância radial entre a posição da carga e o observador, e levando
em consideração o ângulo ψ = cos−1 (n̂ ·~v), definido na Fig. 3.1, obtemos o campo elétrico em termos da
presente posição da carga
~E = q~r
(3.38)
r γ (1 − β 2 sen2 ψ)3/2
3 2
O campo é radial, mas as linhas de força estão distribuídas isotropicamente somente para β = 0. Ao longo
da direção do movimento (ψ = 0, π), a intensidade do campo será reduzida num fator γ −2 relativo à
isotropia, enquanto na direção transversal (ψ = π/2) será aumentada num fator γ. A compressão das linhas
de força na direção transversal pode ser vista como uma consequência da contração de Lorentz-FitzGerald.
4
Jean-Baptiste Biot (1774-1862), físico, astrônomo e matemático francês.
Félix Savart (1791-1841), físico francês.
“Z_2” — 2017/9/5 — 8:19 — page 49 — #69
Fij F ij = 2B k B k .
Finalmente,
Fµν F µν = −2(E i E i − B i B i ) = −2(E 2 − B 2 ) , (3.39)
que é um primeiro invariante.
O segundo invariante pode ser obtido através do uso do tensor dual F µν definido em (3.25), tal que:
1
F µν = ǫµνγδ Fγδ
2
1 0ijk 1
F 0i = ǫ Fjk = − ǫijk ǫjkl B l = −B i ,
2 2
mas
1
F ij = ǫijµν Fµν = ǫijk E k .
2
Finalmente, temos
ou seja,
1
F µν Fµν = ǫµνγδ Fγδ Fµν = −4~E · ~
B, (3.40)
2
que é o segundo invariante.
Segundo as definições (3.11) e (3.12), o campo elétrico ~E é um vetor polar e o campo magnético ~ Bé
~ ~ 2 2
um vetor axial (produto de dois vetores polares ∇ e A). Então temos claramente que E − B é um escalar
verdadeiro, enquanto a grandeza ~E · ~
B é um pseudoescalar, nesse caso o escalar verdadeiro seria o quadrado
~ ~ 2
(E · B) . Este fato será muito importante para escrever a ação do campo eletromagnético, pois a ação deve
ser um escalar e por outro lado deverá ser a integral de um escalar verdadeiro. Este escalar será o produto
Fµν F µν .
dpx dpy
= eE , =0
dt dt
em que, integrando as equações anteriores, obtemos
px = eEt , py = p0 , (3.41)
dx c2 eEt
=p 2 ,
dt K0 + (ceEt)2
dy py c2 p0 c2
= =p 2 ,
dt K K0 + (ceEt)2
na qual encontraremos
p0 c ceEt
y= senh−1 . (3.44)
eE K0
Usando as Eqs. (3.43) e (3.44) para eliminarmos t, temos
K0 eEy
x= cosh . (3.45)
eE p0 c
Esta equação descreve o movimento de uma partícula carregada em um campo elétrico uniforme constante
seguindo uma catenária.
Para o caso não relativístico, v ≪ c, temos p0 = mv0 , K0 = mc2 ; e desenvolvendo a Eq. (3.45) em
série de potência 1c , e desprezando os termos de ordem superior.
eE 2
x= y + constante
2mv02
Movimento em Campo Magnético Uniforme Examinaremos agora o movimento de uma partícula car-
regada e em um campo magnético uniforme constante ~B. O campo magnético está orientado no eixo ẑ.
Podemos escrever a equação de movimento como
d~p e
= (~v × ~
B) ,
dt c
por uma outra relação, onde substituímos o momentum pela expressão
E~v
~p = ,
c2
em que E é a energia da partícula, que é uma constante de movimento em um campo magnético. Assim, a
equação de movimento será descrita por
E d~v e
= (~v × ~
B) . (3.46)
c2 dt c
Desenvolvendo a expressão vetorial acima em três componentes, temos
dvx dvy dvz
= ωvy , = −ωvx , = 0, (3.47)
dt dt dt
em que definimos ω = ecB
E como a frequência angular do movimento.
Fazendo uma manipulação algébrica, encontramos
d
(vx + i vy ) = − i ω(vx + i vy )
dt
e
vx + i vy = a e− i ωt ,
em que a é uma constante complexa. Em nosso estudo, podemos escrever a = vot e− i α , com vot e α reais.
Então,
vx + i vy = vot e− i(ωt+α)
e separando as partes real e imaginária, temos
com
vot vot E cpt
r= = = , (3.50)
ω ecB eB
em que pt é a projeção do momentum no plano xy. Da terceira equação dada em (3.47), deduzimos que
vz = voz e
z = zo + voz t . (3.51)
eB
Temos ainda que E = mc2 e a frequência angular ω = mc . Assim, as Eqs. (3.49) e (3.51) mostram que
a partícula carregada descreve, na presença de um campo magnético uniforme constante, o movimento de
uma hélice com frequência ω ao longo do eixo ẑ e raio r dado pela Eq. (3.50).
“Z_2” — 2017/9/5 — 8:19 — page 52 — #72
d2 x e d2 y e d2 z
m 2
= ẏB , m 2
= eEy − ẋB , m = eEz . (3.52)
dt c dt c dt2
Da terceira equação, podemos deduzir que o movimento da carga ocorre ao longo do eixo z e é uniforme-
mente acelerado:
eEz 2
z= t + voz t . (3.53)
2m
Multiplicando por i a segunda das equações em (3.52) e somando com a primeira, teremos:
d e
(ẋ + i ẏ) + i ω(ẋ + i ẏ) = i Ey ,
dt m
eB
com ω = mc . A integral dessa equação é igual a soma da integral da mesma equação sem o segundo
membro e da integral parcial da equação com o segundo membro. A primeira dessas integrais é a e− i ωt e a
eE cE
segunda é mωy = By . Portanto,
cEy
ẋ + i ẏ = ae− i ωt + .
B
A constante a, em geral, é complexa. Escrevendo a = b ei α , em que b e α são reais, vemos que, a se
multiplica por e− i ωt , tomando convenientemente o instante que se começa a contar o tempo, podemos dar
a fase α qualquer valor. Para nosso caso, vamos considerar neste instante que a seja real. Então, separando
em ẋ + i ẏ a parte imaginária da real, temos:
Ey
ẋ = a cos ωt + c , ẏ = −a sen ωt . (3.54)
B
Nota-se neste caso, que quando temos t = 0 a velocidade tem a direção do eixo x.
Integrando as Eqs. (3.54) e considerando as constantes de integração de forma tal que quando t = 0
tenhamos x = y = 0 obtemos,
a Ey a
x= sen ωt + c t , y= (cos ωt − 1) . (3.55)
ω B ω
Estas equações, consideradas como paramétricas de uma curva, definem uma trocóide.5
cE
Se tomarmos a = − By , as Eqs. (3.55) se transformam em
cEy cEy
x= (ωt − sen ωt) , y= (1 − cos ωt) , (3.56)
ωB ωB
ou seja, a projeção da trajetória no plano xy é uma ciclóide.
5
Trocóide: curva plana descrita por um ponto do plano de uma circunferência quando esta rola sem deslizar sobre uma reta fixa
apoiada por um circulo concêntrico de raio diferente; quando os raios forem iguais, tem-se uma ciclóide.
“Z_2” — 2017/9/5 — 8:19 — page 53 — #73
E = n~ω ,
h
em que n é o número quântico, um número inteiro, ~ = 2π é a constante de Planck e a frequência angular
das oscilações é dada por r
g
ω= ,
ℓ
sendo g a aceleração da gravidade.
Agora suponhamos que o fio do pêndulo seja lentamente encurtado, de modo que a frequência aumente
de forma muito lenta. Logo, como a energia do pêndulo estará mudando, o número quântico também deveria
mudar. No entanto, Lorentz argumentou que isso levaria a um paradoxo, pois a frequência não será alta o
suficiente para induzir uma transição entre estados com números quânticos diferentes.
Einstein, participando da conferência, respondeu que, embora o fio do pêndulo encurtando lentamente
tanto a energia E como a frequência ω do pêndulo sofressem mudanças, a razão entre eles, E ω deveria ser
E
constante, i.e., ω será um invariante adiabático, pois permanece aproximadamente constante durante um
tempo T muito maior do que o período do sistema, T ≫ 2π ω . Se T fosse infinito, a razão seria uma constante
do movimento, e não simplesmente um invariante adiabático.
Para o pêndulo, o invariante adiabático á a chamada integral de ação:
I
1 E
J= pθ dθ = ,
2π ω
em que pθ é o momentum canonicamente conjugado à coordenada angular θ, e a integral estende-se sobre um
ciclo completo de oscilação. Este raciocínio foi estendido por Sommerfeld7 como uma regra de quantização
para um sistema mecânico periódico: a integral da ação deverá ter valores múltiplos da constante de Planck:
J = n~, em que n = 1, 2, · · · é o respectivo número quântico.
De modo geral, em um sistema periódico em que a frequência varia muito lentamente em relação a uma
escala de tempo típica do sistema, a integral da ação será
I
1
J= ~p · d~q
2π
e é um invariante adiabático, em que ~q será uma coordenada generalizada, e ~p o momentum canonicamente
conjugado a essa coordenada. Esta definição será utilizada a seguir, no estudo dos espelhos magnéticos.
Espelhos Magnéticos Consideremos uma partícula com carga e movendo-se na presença de um campo
magnético uniforme ~B = B ẑ. Lembre-se da física básica: velocidade na direção paralela ao campo vz é
conservada, enquanto que no plano perpendicular à ~
B a partícula executa órbitas circulares de cíclotron,
satisfazendo
mv⊥ 2
e mcv⊥
= v⊥ B ⇒ ρ= ,
ρ c eB
6
Max Karl Ernst Ludwig Planck (1858-1947), físico alemão.
7
Arnold Johannes Wilhelm Sommerfeld (1868-1951), físico alemão.
“Z_2” — 2017/9/5 — 8:19 — page 54 — #74
em que ρ é o raio, i.e., é a coordenada radial no plano perpendicular à ~ B. O período das órbitas será então
T = 2πρv⊥ = 2πmc eB , daí a sua frequência é a frequência de cíclotron ωc = mceB
. Assumiremos que o
~
campo magnético tem uma dependência espacial, tal que campo B variando espacialmente não pode ser
unidirecional, i.e.,
~ · ~B = ∇~ ⊥·~ ∂Bz
∇ B⊥ + = 0.
∂z
A natureza não colinear de ~ B resulta na deriva 8 das órbitas de cíclotron. No entanto, se o campo ~
B sentido
pela partícula varia lentamente na escala de tempo T = 2πωc , então o sistema possui um invariante adiabático,
I I
1 ~ 1 e~ ~
J= ~p · dℓ = m~v + A · dℓ
2π C 2π C c
I I
m e
= ~v · d~ℓ + ~
B · n̂ dΣ .
2π C 2πc int(C)
eBz ρ2 e m2 v⊥
2c
=− =− ΦB (C) = − ,
2c 2πc 2eBz
em que ΦB (C) é o fluxo magnético incluso em C.
A energia será
1 2 1
E = mv⊥ + mvz2 ,
2 2
portanto, temos r
2
vz = (E − M B) ,
m
em que
e e2
M =− J= ΦB (C)
mc 2π mc2
E
é o momento magnético. Nota-se que vz será nula quando B = Bmáx = M . Quando esse limite for atingido,
a partícula dará voltas em círculos. Este é um espelho magnético. Um par de espelhos magnéticos podem ser
utilizados para confinar as partículas carregadas numa garrafa magnético, como representado na Fig. 3.2.
Consideremos vk,0 , v⊥,0 e Bk,0 como as componentes da velocidade longitudinal e transversal e a com-
ponente longitudinal do campo magnético, respectivamente, no ponto de injeção. As duas leis de conserva-
ção, J e E, garante
vk2 (z) + v⊥2 2
(z) = vk,0 2
+ v⊥,0
2 (z) 2
v⊥,0
v⊥
= .
Bk (z) Bk,0
Isto leva a reflexão na coordenada longitudinal z ∗ , em que
v
u 2
u vk,0
Bk (z ) = Bk,0 t1 + 2 ,
∗
v⊥,0
8
Deriva vem do inglês drift.
“Z_2” — 2017/9/5 — 8:19 — page 55 — #75
ou seja, esse é o princípio de confinamento das partículas carregadas em uma garrafa magnética, através
dos espelhos magnéticos. Outra área de aplicação desses princípios são os campos magnéticos terrestre e
estelar, em que o movimento de partículas carregadas nos campos dipolos magnéticos do Sol ou da Terra
estão em termos dos invariantes adiabáticos.
Problemas
3.1 Seja S ′ um sistema inercial que se move com velocidade ~v em relação ao sistema inercial S. Considere
uma partícula cuja velocidade no sistema S é ~u e no sistema S ′ é ~u′ . Deduza as equações cinemáticas
que relacionam as forças nos sistemas S e S ′ , i.e.,
′
d~p d~p γ (v) d~p′
= + 2 ~u × ~v × ′
dt k dt′ k c dt k
′
d~p d~p γ (v) d~p′
= γ (v) + 2 ~u × ~v × ′ .
dt ⊥ dt′ ⊥ c dt ⊥
3.2 Mostre que a aceleração de uma partícula com massa m e carga q na presença de um campo eletromag-
nético é dada por, " #
d~u q ~ ~u · ~E ~u ~
~a = = E − 2 ~u + × B .
dt γm c c
3.4 Expresse a aceleração de uma partícula carregada em termos de sua velocidades e das intensidades dos
campos elétrico e magnético. Sugestão: Consulte o livro dos Profs. Landau e Lifshitz [49].
3.5 Encontre o princípio variacional para a trajetória de uma partícula carregada em um campo eletromag-
nético constante em condições relativística. Sugestão: Consulte o livro dos Profs. Landau e Lifshitz
[49].
“Z_2” — 2017/9/5 — 8:19 — page 56 — #76
3.7 a) Determine o movimento relativo de uma partícula carregada em campos magnético e elétrico unifor-
mes e paralelos. b) Determine o movimento relativo de uma partícula carregada em campos magnético
e elétrico que são mutuamente perpendiculares e iguais em magnitude. Sugestão: Consulte o livro dos
Profs. Landau e Lifshitz [49].
3.8 Um campo elétrico e um campo magnético são observados em um sistema S. Indique o sistema S ′ no
qual esses campos são paralelos. a) Se os campos forem perpendiculares em S, indique o sistema S ′
em que E = 0 e a condição para que isso seja possível. b) Faça o mesmo para B = 0.
3.9 Considere um capacitor de placas paralelas, contendo entre as placas um campo elétrico ~E0 na direção
z. Calcule as componentes do tensor energia-momentum.
3.10 Numa dada região do espaço, existem campos elétrico e magnético cruzados, tais que ~E = E0 x̂ e
~
B = E0 ŷ. Encontre todas as componentes do tensor energia-momentum.
3.11 Considere um campo elétrico uniforme ~E = E0 ẑ. Determine os campos elétrico e magnético ~E′ e ~B′
observados em um sistema de referência x′ , y ′ , z ′ que se move com velocidade ~v na direção z. Encontre
todas as componentes do tensor energia-momentum nesse sistema de referência.
3.12 Um neutron com momento magnético ~µ se move com velocidade ~v em um campo coulombiano cau-
sado pelo núcleo em repouso, cuja carga é Q. Considerando a velocidade do neutron pequena quando
2
comparada com a velocidade da luz (desprezando termos de ordem vc2 ≪ 1), encontre a força ~F apli-
cada ao neutron em cada ponto da trajetória.
Leitura Recomendada
Recomenda-se ao leitor que estude os seguintes textos
Nestes livros, que são clássicos da literatura, o leitor encontrará deduções detalhadas da descrição de uma
partícula carregada sob a ação do campo eletromagnético e aplicações e em especial os textos do prof. Lan-
dau e do prof. Jackson são excelentes trabalhos do ponto de vista técnico, usando conceito de relatividade.
“Z_2” — 2017/9/5 — 8:19 — page 57 — #77
Capítulo 4
Campos Eletromagnéticos e Simetrias
O princípio variacional para partículas carregadas que interagem com campos eletromagnéticos é de grande
importância para a discussão sistemática das equações de movimento. A formulação lagrangiana mostra
uma conexão fundamental entre as simetrias do espaço-tempo e as leis de conservação do campo eletro-
magnético. Além disso, através da formulação canônica dos campos, este método permite uma transição
entre a eletrodinâmica clássica e a eletrodinâmica quântica.
A quantidade Sint é a parte da ação que depende da interação entre as partículas e o campo. Assim, para um
sistema de partículas
XeZ
Sint = − Aµ dxµ . (4.3)
c
57
“Z_2” — 2017/9/5 — 8:19 — page 58 — #78
4.2 Quadricorrente
Considerando uma distribuição contínua de cargas, cuja densidade de carga seja ρ conforme definido no
Capítulo 1, ρ dV será a carga total que se encontra no volume dV . Mas devemos lembrar que as cargas são
pontuais, tal que a densidade ρ é nula em todas as partes menos naqueles pontos em que as cargas estão
localizadas. Então, ρ deve ser representado na forma de uma função delta ou função delta de Dirac
X
ρ= ea δ(~r −~ra ) . (4.4)
a
Função Delta de Dirac Neste momento apresentamos algumas propriedades da função delta de Dirac, que
será de grande utilidade neste texto. Em uma dimensão, a função delta, escrita como δ(x − a), é uma
função matematicamente imprópria com as seguintes propriedades:
1. δ(x − a) = 0 para x 6= a.
R 1 se x = a
2. δ(x − a) dx =
0 se x =
6 a.
3. Se A ⊂ R então Z
f (a) se a ∈ A
δ(x − a) f (x) dx =
A 0 se a ∈
6 A.
4. Se A ⊂ R então Z
′ −f ′ (a) se a ∈ A
δ (x − a) f (x) dx =
A 0 se a ∈
6 A,
em que a linha (′ ) representa a derivada em relação ao argumento.
5. Seja f (x) uma função que tem raízes simples em x = xi , com i = 1, · · · , N , então
N
X 1
δ(f (x)) = δ(x − xi ) .
|f ′ (x i )|
i=1
7. Se A ⊂ R3 então Z
3 f (~a) se ~a ∈ A
δ(~x −~a) f (~x) d x =
A 0 se ~a 6∈ A .
Utilizando a função delta de Dirac, a densidade de carga associada a uma distribuição discreta de n
cargas qi localizadas em~ri pode ser escrita como
n
X
ρ(~r) = qi δ(~r −~ri ) .
i=1
3a2
∇2 fa (~r) = − .
(r 2 + a2 )5/2
“Z_2” — 2017/9/5 — 8:19 — page 59 — #79
4.2 Q UADRICORRENTE 59
A função ga (~r) = 3a2 /(r 2 + a2 )5/2 é bem comportada em todo R e a sua integral vale
Z
ga (~r) d3 r = 4π ,
R
independente do valor de a. Parece natural então definir o mesmo valor da integral no limite a → 0.
A função resultante nesse caso, g(~r) = lima→0 ga (~r), satisfaz
Z
g(~r) d3 r = 4π
R
e
g(~r) = 0 ∀ ~r 6= ~0 .
Vemos então que é natural fazer a seguinte identificação:
g(~r) = 4πδ(~r) ,
Mas ,
1
lim ∇2 fa (~r) = ∇2 lim fa (~r) = ∇2 .
a→0 a→0 |~r|
Assim,
1
∇2 = −4πδ(~r) . (4.5)
|~r|
que é um resultado muito importante para nosso desenvolvimento futuro.
A carga da partícula, por sua própria definição, é invariante, i.e., não depende do sistema de referência.
A densidade ρ, por outro lado, não é invariante, somente o produto ρ dV é invariante. Multiplicando a
igualdade de = ρ dV em ambos os lados por dxµ , temos
dxµ
de dxµ = ρ dV dxµ = ρ dV dt .
dt
O primeiro membro dessa igualdade é um quadrivetor, no segundo membro dV dt é um escalar e portanto
µ
ρ dx
dt é um quadrivetor. Este quadrivetor chamamos de quadricorrente j
µ
dxµ
jµ = ρ . (4.6)
dt
dxµ
jµ = ρ = (cρ, ~J) . (4.7)
dt
No Capítulo 1, mostramos o princípio de conservação de cargas através da Eq. (1.3), i.e.,
∂ρ
∇ · ~J + = 0.
∂t
“Z_2” — 2017/9/5 — 8:19 — page 60 — #80
Vamos introduzir a quadricorrente (4.7) na expressão (4.3) da ação. Substituindo as cargas pontuais por
uma distribuição contínua de densidade ρ, podemos escrever a ação na forma
Z
1
− ρ Aµ dxµ dV ,
c
mas Z Z
1 dxµ 1
− ρ A dV dt = − 2 Aµ j µ d4 x .
c dt µ c
E finalmente a ação total será
XZ 1
Z
1
Z
S=− mc ds − Aµ j µ d4 x − F µν Fµν d4 x . (4.9)
c2 16πc
Invertendo, sem perda de informações, a ordem de δ e ∂µ no último termo da expressão anterior e integrando
por partes, temos
Z Z
1 4 ∂L ∂L A1 ∂L
δS = d x − ∂µ δφ + dσµ δφA = 0 ,
c ∂φA ∂(∂µ φA ) c Σ ∂(∂µ φA )
R
em que Σ é a integral na fronteira, esse último termo da expressão vem do teorema de Gauss generalizado,
em que dσµ é hipersuperfície da região que contém o quadrivolume d4 x. As condições de fronteira fixa nos
leva a δφA Σ = 0, então essa integral de superfície será nula, mas δφA é completamente arbitrária em outros
lugares. Assim, de acordo com o princípio da ação mínima, obteremos as equações de Euler-Lagrange para
o campo,
∂L ∂L
− ∂µ = 0. (4.11)
∂φA ∂(∂µ φA )
“Z_2” — 2017/9/5 — 8:19 — page 61 — #81
sendo
∂L 1
µ
= − jµ
∂A c
∂L 1 ∂F αβ
ν µ
= − Fαβ
∂(∂ A ) 8π ∂(∂ ν Aµ )
1 ∂(∂ β Aα − ∂ α Aβ )
= Fαβ
8π ∂(∂ ν Aµ )
1
= Fµν ,
4π
em que usamos F αβ = F µν , F αβ = −F βα e o fato de
∂(∂ β Aα − ∂ α Aβ )
= 2.
∂(∂ ν Aµ )
Logo, encontramos
4π
∂ ν Fµν = −
jµ , (4.14)
c
que são as equações de Maxwell inomogêneas na forma covariante, note que essa equação tensorial equivale
a quatro equações em componentes na forma tridimensional.
As três primeiras equações por componentes (para µ = i) são:
4π i
∂ν F iν = ∂0 F i0 + ∂j F ij = − j ,
c
assim,
1 ∂E i 4π
− ǫjik ∂j B k = − j i ,
c ∂t c
então,
~ ×~ 1 ∂~E 4π ~
∇ B= + J. (4.15)
c ∂t c
“Z_2” — 2017/9/5 — 8:19 — page 62 — #82
e
j 0 = cρ ,
logo,
~ · ~E = 4πρ .
∇ (4.16)
Assim, as Eqs. (4.15) e (4.16) são as equações de Maxwell inomogêneas.
De forma similar, podemos escrever as duas equações de Maxwell homogêneas. As equações homo-
gêneas estão relatadas para o fato de que o tensor F µν expressa seis campos em termos de um simples
quadrivetor. Note que isto é equivalente a dizer que:
∂ ν F µρ + ∂ µ F ρν + ∂ ρ F νµ = 0 , (4.17)
em que ν, µ e ρ são quaisquer inteiros 0, 1, 2, 3. Podemos escrever a Eq. (4.17) em termos do tensor dual
F µν , de fato temos que
1
∂µ F µν = ǫµνγδ ∂µ Fγδ = ǫµνγδ ∂µ ∂γ Aδ
2
e
∂µ F µν = ǫµνγδ ∂µ ∂γ Aδ = −ǫγνµδ ∂µ ∂γ Aδ = −ǫµνγδ ∂µ ∂γ Aδ = −∂µ F µν ,
assim,
∂µ F µν = 0 , (4.18)
que são as equações de Maxwell homogêneas na forma covariante. Podemos ainda verificar que
∂µ F µ0 = ∂i F i0 ,
∂µ j µ = 0 ,
ou seja,
∂ρ ~ ~
+ ∇·J = 0, (4.21)
∂t
como vimos no primeiro capítulo.
“Z_2” — 2017/9/5 — 8:19 — page 63 — #83
Teorema de Noether e Tensor Canônico Vamos discutir explicitamente o teorema de Noether no con-
texto dos campos eletromagnéticos. Enunciando-o como segue: A todo grupo de transformações contínuas
de φA que mudam L, no máximo por uma divergência, existe associada uma corrente conservada.
Considere uma transformação infinitesimal
xµ → x′µ = xµ + aµ ,
1
Amalie “Emmy” Noether (1882-1935), matemática alemã.
2
E. Noether, Nachr. D. König. Gesellsch. D. Wiss. Zu Göttingen, Math-phys. Klasse 1918, 235-257 (1918).
“Z_2” — 2017/9/5 — 8:19 — page 64 — #84
Supondo campos localizados, o último termo irá se anular pela lei de Gauss, de forma que obtemos quatro
constantes de movimento Z
1 dP ν
Pν = T 0ν d3 x → = 0. (4.26)
c dt
Para a lagrangiana do campo eletromagnético livre,
1
L=− Fµν F µν ,
16π
o tensor canônico é
∂L
T µν = ∂ µ Aλ − gµν L ,
∂(∂ν Aλ )
em que o somatório sobre λ está implícito no índice repetido. Com a ajuda de
∂L 1
µ λ
= − Fµλ ,
∂(∂ A ) 4π
encontramos
1 µδ
T µν = − g Fδλ ∂ µ Aλ − gµν L . (4.27)
4π
Para elucidar o significado do tensor T µν , temos explicitamente os termos T 00 , T 0i e T i0 , respectivamente
1 ~2 ~2 1 ~
T 00 = (E + B ) + ∇ · (Φ~E)
8π 4π
1 ~ 1 ~
T 0i = (E × ~B)i + ∇ · (Ai~E) (4.28)
4π 4π
1 ~ ~ 1 ~ ~ ∂
T i0 = (E × B)i + (∇ × ΦB)i − (ΦEi ) .
4π 4π ∂x0
Admitindo que os campos sejam livres de fontes e estejam localizados numa região finita do espaço, as
integrais sobre todo o espaço tridimensional, num referencial inercial e num instante fixo, das componentes
T 00 e T 0i , podem ser interpretadas como a energia total e o produto de c pelo momentum total dos campos
eletromagnéticos neste referencial:
Z Z
1
00 3
T d x= (~E2 + ~B2 ) d3 x = Ecampo
8π
Z Z (4.29)
0i 3 1 ~ ~ 3 i
T d x= (E × B)i d x = cPcampo .
4π
Tensor Canônico Simétrico Até o momento, o tensor canônico T µν foi conveniente, porém necessita de
algum melhoramento (“embelezamento”), pois T µν não é simétrico e não é um invariante de calibre.
É fácil notar que um tensor energia-momentum deveria ser um invariante de calibre, mas porque ser
simétrico? A questão de simetria aparece quando consideramos o momentum angular do campo
Z
~Lcampo = 1 ~x × (~E × ~
B) d3 x
4πc
A densidade do momentum angular tem uma generalização covariante, i.e.,
M µρσ = T µρ xσ − T µσ xρ , (4.30)
∂µ M µρσ = 0 . (4.31)
“Z_2” — 2017/9/5 — 8:19 — page 65 — #85
Assim, temos
∂µ (T µρ xσ ) − ∂µ (T µσ xρ ) = 0
T µρ δµσ − T µσ δµρ = T σρ − T ρσ = 0 ,
logo
T σρ = T ρσ ,
ou seja, se quisermos que o momentum angular se conserve, o tensor energia-momentum deve ser simétrico.
Esta condição é mais forte do que aparenta, já que conservação do momentum angular pode ser encontrada
da invariância da ação sob boosts de Lorentz.
Ainda temos mais duas considerações a fazer sobre o tensor T µν , dado em (4.27): a primeira é a de que
envolve explicitamente os potenciais, e por isso não é a invariante nas transformações de calibre; a segunda
é que o traço de Tµµ não é nulo, conforme exigência de massa nula para os fótons.
Então, vamos construir um tensor simétrico Θµν , de traço nulo e invariante nas transformações de
calibre, a partir do tensor canônico T µν .3 Como a definição de T µν não é única, definimos um outro tensor
na forma Θµν = T µν + ∂ρ f µνρ , com f µνρ = −f ρνµ , que se conserva
∂µ Θµν = ∂µ T µν + ∂µ ∂ρ f µνρ = ∂µ T µν = 0 .
em que o último termo se anula devido a aplicação da lei de Gauss. Dessa forma temos que
Z
ν 1
P = Θ0ν d3 x (4.32)
c
e este novo tensor energia-momentum é perfeitamente equivalente ao definido anteriormente.
Assim, vamos calcular o novo tensor Θµν do campo eletromagnético (campo livre). A lagrangiana é
dada por
1
L=− Fµν F µν
16π
e
∂L 1
= − Fρµ ,
∂(∂µ Aρ ) 4π
assim, o tensor
∂L 1 µ ν ρ 1 µν
T µν = ∂ ν Aρ − gµν L = F ∂ A + g Fαβ F αβ ,
∂(∂µ Aρ ) 4π ρ 16π
logo, encontramos
1 µ νρ 1 µν 1 µ ρ ν
T µν =
Fρ F + g Fαβ F αβ + F ∂ A .
4π 16π 4π ρ
Podemos ainda reescrever o último termo como
1 µ ρ ν 1 ρµ 1
F ∂ A = F ∂ρ Aν = ∂ρ (F ρµ Aν ) ,
4π ρ 4π 4π
3
A construção geral da simetria, invariância de calibre do tensor simétrico Θµν a partir do tensor T µν é descrito em L. D.
Landau and E. M. Lifshitz, The classical theory of fields (1993) e A. O. Barut, Electrodynamics and classical theory of fields
and particles (1980).
“Z_2” — 2017/9/5 — 8:19 — page 66 — #86
em que se utilizou, para campo livre, ∂ρ F ρµ = 0. Nota-se ainda que o resultado acima é do tipo ∂ρ f ρνµ ,
antissimétrico em ρ e µ. Assim podemos subtraí-lo de T µν para obtermos
µν 1 µ νρ 1 µν αβ
Θ = Fρ F + g Fαβ F , (4.33)
4π 4
em que obtemos diretamente a relação simétrica Θµν = Θνµ . O cálculo explícito de Θµν , i.e.,
00 1 0 0ρ 1 00 αβ
Θ = Fρ F + g Fαβ F
4π 4
1 0i 0i 1~2 1~2
= F F + B − E
4π 2 2
1 ~2 1~2 1~2
= E + B − E
4π 2 2
1 ~2 ~2
= E +B .
8π
1 0 iρ 1 0 ij
Θ0i = Fρ F = F F
4π 4π j
1
= Ej ǫijk Bk = Si
4π
1 ~
= E × ~B .
4π i
1 1 ij
ij
Θ = i jρ
Fρ F + g (−2) E − B ~ 2 ~ 2
4π 4
1 1
= F F + F F + δij ~E − ~
i0 j0 ik jk 2
B 2
4π 2
1 i j ikl jkm l m 1 ~ 2 ~ 2
= −E E + ǫ ǫ B B + δij E − B
4π 2
1 1
= −E E + δij ~
i j
B − B B + δij ~E − ~B
2 i j 2 2
4π 2
1 i j i j 1 ~ 2 ~ 2
= −E E − B B + δij E + B .
4π 2
nos leva as seguintes componentes
1
Θ00 = ~E2 + ~
B2
8π
1
Θ0i = ~E × ~
B (4.34)
4π i
1 1 ij k k
Θij = i j i j
E E +B B − δ E E +B B k k
.
4π 2
Pela lei diferencial da conservação:
∂µ Θµν = 0 .
Essa equação inclui o teorema de Poynting4 e a conservação do momentum para campos livres. Por exemplo,
para ν = 0 temos
µ0 1 ∂u ~ ~
0 = ∂µ Θ = + ∇·S , (4.35)
c ∂t
4
John Henry Poynting (1852-1914), físico inglês.
J. H. Poynting, Philosophical Transactions of the Royal Society of London, 175, 343-361 (1884).
“Z_2” — 2017/9/5 — 8:19 — page 67 — #87
~S = c (~E × ~
B) (4.36)
4π
e u a densidade de energia definido por
1 ~2 ~2
u= (E + B ) , (4.37)
8π
com a energia total dos campos dentro do volume V dado por
Z Z
1
Ecampos = 3
ud x = (~E2 + ~B2 ) d3 x . (4.38)
V 8π V
Analogamente, para ν = i
3
µi 1 ∂Si X ∂
0 = ∂µ Θ = 2 − TM, (4.39)
c ∂t ∂xj ij
j=1
1
sendo TijM = Θij = 4π [E i E j + B i B j − 12 δij (E k E k + B k B k )] o tensor stress de Maxwell. O resultado
da Eq. (4.39) é equivalente a
d ~ XZ ∂
Pcampo = TijM d3 x , (4.40)
dt V ∂x j
j
Nota-se que esse momentum é proporcional ao vetor de Poynting ~S. Podemos completar a identificação da
integral de volume por
1 ~
~g = (E × ~
B) , (4.42)
4πc
em que ~g é o momentum eletromagnético.
Leis de Conservação para Campos Eletromagnéticos Interagindo com Partículas No caso de inte-
ração (campos com fontes), mantemos o tensor energia-momentum dado pela Eq. (4.33), mas obviamente
vamos achar uma relação não homogênea para a sua divergência
µν 1 µ νρ 1 ν αβ
∂µ Θ = ∂ (Fρµ F ) + ∂ (Fαβ F ) .
4π 4
4π
Lembrando que, nesse caso ∂ µ Fµρ = c jρ , temos:
1 ρν Fµρ µ ρν
∂µ Θµν = F jρ + (∂ F + ∂ µ F ρν + ∂ ν F µρ ) ,
c 8π
mas
∂ ν F µρ + ∂ µ F ρν + ∂ ρ F νµ = 0
e
∂ ν F µρ + ∂ µ F ρν = −∂ ρ F νµ .
“Z_2” — 2017/9/5 — 8:19 — page 68 — #88
Então, temos
1 ρν Fµρ µ ρν
∂µ Θµν = F jρ + (∂ F − ∂ ρ F νµ ) .
c 8π
Mas,
Fµρ ∂ µ F ρν = Fρµ ∂ ρ F µν = Fµρ ∂ ρ F νµ ,
ou seja,
1 ρν 1
∂µ Θµν = F jρ = − F νρ jρ . (4.43)
c c
Podemos agora encontrar as leis de conservação para o campo eletromagnético na forma usual. A com-
ponente temporal dessa equação é
1
∂µ Θµ0 = − F 0ρ jρ ,
c
logo
1 ∂ ~2 ~2 1 ~ ~
∂0 Θ00 + ∂i Θi0 = (E + B ) + ∇ · (E × ~
B) .
8πc ∂t 4π
Mas,
1 1 1
− F 0i ji = − F i0 j i = − ~J · ~E ,
c c c
ou seja,
∂ucampo ~ ~
+ ∇ · S = −~J · ~E , (4.44)
∂t
em que ~S é o vetor de Poynting, ucampo já definido em (4.37) e umec é a densidade de energia mecânica
dada por
∂umec ~ ~
= J·E (4.45)
∂t
e a energia mecânica total das partículas carregadas dentro do volume V será dada por
Z
dEmec
= ~J · ~E d3 x . (4.46)
dt V
∂ ~ · ~S = 0 ,
(ucampo + umec ) + ∇ (4.47)
∂t
que é a forma diferencial da lei de conservação de energia.
Temos ainda as componentes espaciais, que nos leva
1
∂µ Θµi = − F iρ jρ
c
e
1
F iρ jρ = F i0 j0 + F ik jk = c ρE i + (~J × ~
B)i .
c
Então
3
1 ∂Si X ∂ 1~ ~
∂0 Θ0i + ∂j Θji = − T M
= − ρEi + (J × B)i , (4.48)
c2 ∂t ∂xj ij c
j=1
~Lcampo = ~r × ~g = 1 ~r × (~E × ~
B) (4.54)
4πc
e o fluxo de momentum angular está descrito pelo tensor
f = Te ×~r .
M (4.55)
1 h~ ~E)
i
~g = E × (~
v × (4.56)
4πc2
“Z_2” — 2017/9/5 — 8:19 — page 70 — #90
Figura 4.1 Modelo simples de elétron, carga distribuída na superfície da esfera de raio a.
2 e2
me = . (4.60)
3 ac2
Esta massa não é exatamente igual à massa de repouso da partícula. A razão é que não consideramos
as forças adicionais, como, por exemplo, aquela que mantém estável a distribuição da carga na partícula.
Existem também fatores de correção quântica que deveriam ser introduzidos.
e2
A massa eletromagnética me = 43 2ac 4
2 = 3 mrepouso . Como a energia eletrostática para o modelo em
questão é
e2
West = , (4.61)
2a
a massa eletromagnética se relaciona com a energia eletrostática por
4 West
me = . (4.62)
3 c2
Esta relação entre massa e energia, cujo fator 4/3 aparece, irá incomodar somente com o surgimento da
teoria da relatividade especial, que prevê a relação m = E/c2 .
5
Ver dedução em R. P. Feynman et al., The Feynman Lectures on Physics, v. 2 (1963).
“Z_2” — 2017/9/5 — 8:19 — page 71 — #91
É importante enfatizar que existe evidência experimental para a massa eletromagnética. Por exemplo,
os mésons π ± , carregados, têm massa de 139,6 MeV/c2 , mas o méson π 0 neutro a massa é de 135 MeV/c2 .
Esta diferença de massa tem uma explicação nas origens eletromagnéticas.6
A massa eletromagnética foi inicialmente um conceito da mecânica clássica, denotando a respeito de
quanto o campo eletromagnético, ou a autoenergia, está contribuindo para a massa de partículas carregadas.
Este conceito foi derivado por J J Thomson7 em 1881 8 e foi durante algum tempo também considerada como
uma explicação dinâmica de massa inercial, por si só. Hoje, a relação de massa, força, velocidade e todas
as formas de energia, incluindo energia eletromagnética, é interpretada com base na relatividade especial
de Albert Einstein e a equivalência massa-energia. Como causa para a geração de massa de partículas
elementares, utilizamos atualmente o mecanismo de Higgs9 no âmbito do modelo relativista padrão. 10 Além
disso, alguns problemas relativos à massa electromagnética e autoenergia de partículas carregadas são ainda
estudado.
Massa Eletromagnética Revisada Vamos reexaminar a teoria clássica da massa eletromagnética. Sim-
plesmente porque ainda temos questionamentos para fazer. Primeiro, lembre-se que há dois significados
convencionais para a massa eletromagnética. A energia eletrostática de uma distribuição de carga em re-
pouso, dividido por c2 , nos dá uma massa, m(1) . O momentum eletromagnético da distribuição de carga em
movimento define outra massa, m(2) . Estas estão relacionadas por
4 (1)
m(2) = m . (4.63)
3
A aparente violação da invariância relativista é colocada no fracasso da definição usual de momentum eletro-
magnético, uma definição que se refere apenas aos campos eletromagnéticos, e não ao estado de movimento
de suas fontes. 11
Então, lembremos que a distribuição de carga é considerada instável, em consequência da repulsão de
Coulomb em suas partes. Alternativamente, um aponta para a integral não nula das tensões na estrutura
do sistema em repouso. Nessa fase, as tensões não eletromagnéticas de Poincaré são geralmente introdu-
zidos para produzir estabilidade. Poincaré propôs que tais forças, descrita por um tensor de tensões não
eletromagnética P αβ , deveria ser adicionada a Θαβ para dar o tensor total de autotensões S αβ ,
S αβ = Θαβ + P αβ .
6
G. C. Wick and B. Zumino, Physics Letters 25B, 479-481 (1967).
C. Manuel and N. Rius, The Electromagnetic Mass Difference of Pions at Low Temperature (1998), site:
http://cdsweb.cern.ch/record/357459/files/9806385.pdf, visitado em 12 de dezembro de 2012.
7
Sir Joseph John “J. J.” Thomson (1856-1940), físico inglês.
8
J. J. Thomson, Philosophical Magazine, 5 11 68, 229-249 (1881).
9
Peter Ware Higgs (1929- ), físico britânico.
10
F. Englert and R. Brout, Physical Review Letters 13 (9), 321-323 (1964); P. Higgs, Physical Review Letters 13 (16), 508-509
(1964); G. Guralnik, C. R. Hagen and T. W. B. Kibble, Physical Review Letters 13 (20), 585-587 (1964). Para recente revisão
do modelo de Higgs, ver C. Patrignani et al. (Particle Data Group), Chinese Physics C40, 100001 (2016).
No início de julho de 2012, os experimentos ATLAS e CMS no LHC/CERN apresentaram evidências da existência da partí-
cula Higgs com massa em torno de 125 GeV, ver: G. Aad et al. (ATLAS Collaboration), Physics Letters B716, 1-29 (2012);
S. Chatrchyan et al. (CMS Collaboration), Physics Letters B716, 30-61 (2012).
11
F. Rohrlich, Classical charged particles (1965).
“Z_2” — 2017/9/5 — 8:19 — page 72 — #92
em que a integral é sobre todo espaço tridimensional num instante fixo. O lado direito da equação anterior
transforma como um quadrivetor fornecido por
∂α S αβ = 0 ,
com i, j = 1, 2, 3, e o índice superior (0) indica o referencial de repouso (~P = 0). Esta condição é a de
que a autotensão total (no sentido tridimensional) seja nula, o que é exatamente a condição de estabilidade
mecânica. 12
Como enfatizado por Rohrlich, 13 é possível dar definições covariantes para a energia eletromagnética e
o momentum de um sistema de campos. As expressões,
Z
′ 1 ~E′2 + ~
Ee = B′2 d3 x′
8π
(4.64)
Z
~P′ = 1 ~E′ × ~B ′ d 3 x′ ,
e
4πc
são a energia e o momentum num referencial inercial S ′ , respectivamente. Claro que os integrandos acima
são elementos do tensor Θαβ . Evidentemente, devemos contrair um dos índices do tensor por um quadrive-
tor. Este deve ser tal que reduz a d3 x′ no referencial S ′ . Definimos um quadrivetor tipo tempo por
dσ β = nβ d3 σ ,
nβ = (γ, γ~β) .
(4.66)
Z
cPei = γ cgi + TijM β j d3 σ ,
12
H. Poincaré, Comptes Rendue, 140, 1504 (1905), Idem, Rend. del Circ. Mat. di Palermo, 21, t. 29-175 (1906). Usando notação
moderna ver H. M. Schwartz, American Journal of Physics, 39, 1287 (1971); Idem, 40, 862, 1282 (1972).
13
Fritz Rohrlich (1921- ), físico austríaco-americano.
F. Rohrlich, Classical charged particles (1965).
“Z_2” — 2017/9/5 — 8:19 — page 73 — #93
B = ~β × ~E .
~
invariantes, assim, associados com a mesma distribuição de campos-corrente estão relacionados por (4.63).
E, preconceitos à parte, estes sistemas mecânicos são estáveis. Esta descrição foi dada por Schwinger15 em
um modelo para uma partícula carregada clássica estável. 16
No sistema de repouso da partícula, o potencial quadrivetor é definido por17
Φ′ = ef (r 2 ) , ~ ′ = 0,
A
Aα = ev α f (z) , ξ α = xα − (v β xβ )v α , (4.70)
em que
v · ξ = v β ξβ = 0 ,
logo, perpendiculares. Ainda definimos z = −ξ 2 = −ξ · ξ = −x · x+(v · x)2 e usamos a relação v α vα = 1.
Podemos notar que
∂ µ z = ∂ µ (−ξ 2 ) = −2ξ µ .
Então, temos
∂ α Aβ = −2eξ α v β f ′ ,
df (z)
em que, f ′ = dz . Consequentemente, encontramos ∂α Aα = 0 e
F αβ = −2e(ξ α v β − ξ β v α )f ′ . (4.71)
e2 ′ 2 h α β z i
Θαβ = (f ) −ξ ξ + zv α v β − gαβ (4.73)
π 2
e seu divergente é
1 e2
∂α Θαβ = −F βλ jλ = − ξ β f ′ (3f ′ + 2zf ′′ ) . (4.74)
c π
A densidade de força de Lorentz (negativa do lado direito da relação anterior) deve ser equilibrada pelas
tensões de Poincaré para a estabilidade. Schwinger, observando a relação de derivada ∂ α G(z) = −2ξ α G′ ,
define uma função t(z) cuja derivada é
dt(z) e2 ′ 2
t′ (z) = =− 3(f ) + 2zf ′ f ′′ . (4.75)
dz 2π
Assim, é possível definir as tensões não eletromagnéticas ou tensor stress de Poincaré como,
com h constante. Foram discutidos dois casos no trabalho de Schwinger, h = 0 e h = −1. As componentes
de S αβ , explicitamente, são dadas por
S 00 = Θ00 + (1 + hγ 2 )t
S i0 = Θi0 + hγ 2 β i t ,
mostrando que quando h = 0, S 00 = Θ00 + t e S i0 = Θi0 em todos os sistemas de referência. Quando
h = −1, S 00 = Θ00 no sistema de repouso da partícula. A escolha original de Schwinger para o tensor
stress de Poincaré, (4.76), é, em certo sentido, a escolha mínima e natural, ligada diretamente à configuração
do campo eletromagnético.
Da equação diferencial de primeira ordem (4.75) e da condição física de que t(z) → 0 no infinito,
temos, fazendo uma integração por partes,
Z
e2 ∞ ′ 2 ′ e2
t(z) = (f ) dz − z(t′ )2 . (4.77)
π z 2π
Para formas específicas da função potencial f (z), é apenas uma questão simples de integração encontrar
t(z). Exemplos, para uma casca esférica carregada de raio a e uma distribuição de carga em um volume
esférico uniforme também de raio a, temos
η(a2 − z) para casca esférica,
e2
t(z) =
8πa4
3η(a2 − z)(1 − z/a2 ) para distribuição uniforme.
Aqui, η(a2 − z) e a função degrau ou função degrau de Heaviside. O modelo de casca esférica nos dá a
mais drástica ilustração de efeito de estabilização das tensões de Poincaré. Eles existem apenas dentro da
esfera. Como não existem campos dentro da esfera, o stress eletromagnético somente existe do lado de fora
e2
da esfera e dá uma força desestabilizadora, para fora da esfera, por unidade de área em r = a+ igual a 8πa 4
no sistema de repouso. Em r = a− , tensões de Poincaré proporciona a força de estabilização, para dentro
da esfera. Assim, a camada de superfície de carga sente força resultante nula.
A contribuição eletromagnética para a massa da partícula pode ser encontrada a partir de
Z Z
1 ~ 2 ~ 2 3 1 ~E(0)2 d3 x(0)
me = E −B d σ =
8πc2 8πc2
ou diretamente a partir de qualquer outra estrutura integrante de Θ00 . Usando a primeira forma, precisamos
E (0)2 = 4e2 · z(t′ )2 . Então, encontramos
Z ∞
3
2 2
me c = e z 2 (f ′ )2 dz . (4.78)
0
“Z_2” — 2017/9/5 — 8:19 — page 76 — #96
Substituindo t(z) dado em (4.77) na equação anterior, uma integração por partes nos leva ao resultado
1
mP c2 = (1 + h)me c2 . (4.79)
3
Entretanto, a massa total será
1
M = me + mP = (4 + h)me . (4.80)
3
Nota-se que quando h = 0, a massa é 34 me , temos o resultado dinâmico, enquanto que, se h = −1,
M = me , temos o resultado electrostático. Por outro lado, se h ≫ 1, a maior parte da massa é de origem não
eletromagnética. Nem o fator 4/3 nem a unidade prova nada sobre a covariância da energia e do momentum
da partícula. Esta propriedade será demonstrada a seguir.
Iniciamos com Θ00 ,
00 e2 1
Θ =− −(ξ ) + γ z − z (f ′ )2 .
0 2 2
π 2
Uma vez que integramos Θ00 em um espaço tridimensional com tempo fixo x0 em S, necessitamos da
avaliação de (ξ 0 )2 e z explicitamente em S. Se tomamos o eixo-3 paralelo à ~β, da definição (4.70) com
v · ξ = 0, encontramos
ξ 0 = βξ 3
ξ 3 = γ 2 (x3 − βx0 ) .
z = ρ2 + γ 2 (x3 − βx0 )2 .
d3 x′
Se definirmos x′3 = γ(x3 − βx0 ), na qual é a coordenada-3 em S ′ , o elemento de volume será d3 x = γ .
Colocando tudos juntos, temos a parte eletromagnética da energia como,
Z
e2 2
Ee = d3 x′ [f ′ (r ′2 )]2 [(γβρ)2 + 21 r ′ ] .
γπ
Uma média por todos os ângulos introduz um fator de [( 23 )γ 2 β 2 + 12 ]r ′ 2 . Com a definição de me dada em
(4.78), temos
4 1
Ee = γ− me c2 .
3 3γ
Para Θ30 , temos o momentum eletromagnético,
Z
4
cPe = Θ30 d3 x = γβme c2 .
3
Claramente, as contribuições eletromagnéticas por si só não se transformam corretamente.
As contribuições não eletromagnéticas para a energia e para o momentum são,
Z Z
00 3 2 d 3 x′ 1 1
EP = Π d x = (1 + h γ ) t(z) = + γh me c2
γ 3 γ
Z Z
30 3 2 d 3 x′ 1
cPP = Π d x = h γ β t(z) = hγβme c2 .
γ 3
“Z_2” — 2017/9/5 — 8:19 — page 77 — #97
Como temos invariantes de Lorentz, podemos desenvolver as integrais no referencial de repouso. Da Eq.
(4.78) e a seguir, vemos que
1
cPeα = (me c2 )v α e cPPα =
(1 + h)(me c2 )v α
3
são separadamente quadrivetores por construção, com uma soma igual a (4.81). A simplicidade e elegância
do uso da manifestada covariância da Eq. (4.65) é aparente. Os resultados são, é claro, o mesmo encontrados
na outra forma.
O modelo de Poincaré-Schwinger de uma partícula estável aborda a questão das propriedades de trans-
formação de Lorentz para energia e momentum da partícula, mas não entra na questão da reação de radia-
ção. 18
A equação acima, é uma expressão para a energia total do campo eletromagnético. É fácil verificar que a
hamiltoniana também poderia ser escrita na forma,
Z Z
1 ~E2 + ~
H= Θ00 d3 x = B2 d3 x .
8π
Vamos agora confinar o campo em uma caixa de dimensão L, e tomemos as condições de contorno tal
que os campos sejam periódicos. Este método nos leva a uma representação dos campos que é facilmente
quantizada.
Devido a periodicidade dos campos, podemos expandir ~E e A
~ em séries de Fourier 19 como:
1 ~
~f k,λ (~x) = ε̂k,λ ei k · ~x ,
L3/2
Vamos aplicar essas relações a um campo de radiação, que é puramente transversal. Escolhendo um calibre
onde Φ = 0, podemos tomar ∇ ~ = 0, ∇
~ ·A ~ · ~E = 0. Nesse caso ~k · ε̂k,λ = 0, e portanto a soma sobre as pos-
síveis polarizações incluirá apenas duas componentes ε̂k,1 e ε̂k,2 , para cada ~k, em que ε̂k,λ é perpendicular
a ~k. Consequentemente
∇~ × ~f k,1 = i k~f k,2 . (4.86)
(2π)3 X X
= ε̂k,λ · ε̂k′ ,λ′ pk,λ p∗k′ ,λ′ δ(~k − ~k′ ) , (4.87)
L3 ′
k,λ k ′ ,λ
19
Jean Baptiste Joseph Fourier (1768-1830), físico e matemático francês.
“Z_2” — 2017/9/5 — 8:19 — page 79 — #99
1 P 1
R
mas sabemos que L3 k = (2π)3
d3 k e usando a ortogonalidade dos vetores de polarização, obtemos:
Z Z Z
1 L3 X
~E2 d3 x = d k d3 k′ ε̂k,λ · ε̂k′ ,λ′ pk,λ p∗k′ ,λ′ δ(~k − ~k′ )
3
4π (2π)3 ′
λ,λ
3 X Z
L
= d3 k ε̂k,λ · ε̂k,λ′ pk,λ p∗k,λ′
(2π)3 ′
λ,λ
Z 2
L3 X 3 ∗
XX
= d k p k,λ p k,λ = |pk,λ |2 . (4.88)
(2π)3
λ k λ=1
Cada termo na Eq. (4.90) é o mesmo que na hamiltoniana para um oscilador harmônico. Assim, o campo
de radiação pode ser equivalente a um conjunto de osciladores harmônicos.
A Eq. (4.90) nos permite uma transição apropriada para a eletrodinâmica quântica, em que as variáveis
canônicas p e q são quantizadas, tornando-se operadores de absorção e criação de fótons. Para fazermos
estas transformações, introduzimos os operadores de absorção e criação de fótons, de acordo com as rela-
ções: r
L3
qk,λ = (ak + a∗k )
4πc2
e r
L3
pk,λ = − i k (ak − a∗k ) = q̇k,λ ,
4πc2
em que L3 é o volume da caixa, sendo ak e a∗k os operadores de absorção e criação dos fótons, respectiva-
mente. O princípio de incerteza, ou princípio de incerteza de Heisenberg,20 permite a criação momentânea
de um fóton virtual γ e a sua subsequente absorção pelo elétron, conforme mostra a Fig. 4.2.
Este processo radiativo modifica a estrutura eletromagnética do elétron, de modo que o seu fator de
Landé,21 g, terá correções em relação ao valor 2 previsto pela equação de Dirac. O fator de Landé será visto
20
Werner Karl Heisenberg (1901-1976), físico alemão.
21
Alfred Landé (1888-1976), físico alemão-americano.
“Z_2” — 2017/9/5 — 8:19 — page 80 — #100
nas seções finais do Capítulo 7. Cada vértice de interação da Fig. 4.2 é proporcional à carga do elétron, de
2
maneira que a correção correspondente será da ordem de α = e~c = 137,04 1
, em que α é a constante de
estrutura fina. As correções radiativas na eletrodinâmica quântica, associadas aos processos que envolvem
fótons virtuais, levam à seguinte previsão teórica: 22
g α
α 2
3 4
2 − 1 = 2π − 0, 32847844400290(60) π + 1, 181234016827(19) απ − 1, 9144(35) απ + · · ·
= (115.965, 218278 ± 0, 000772 ± 0, 000011 ± 0, 000026) × 10−8 para o rubídio (Rb) ,
−8
= (115.965, 218278 ± 0, 000933 ± 0, 000011 ± 0, 000026) × 10 para o césio (Cs) .
em que os erros 0, 000772 e 0, 000933 vêm das incertezas dos valores, de entrada nos cálculos, da cons-
tante de estrutura fina determinadas pelo experimentos com átomo de rubídio e átomo de césio, respecti-
vamente. 23 Esta correção radiativa permite a determinação experimental do fator (g/2 − 1) com grande
precisão. Este fator é denominado momento magnético anômalo do elétron, cujo resultado está de acordo
com os resultados experimentais, como veremos no Capítulo 7.
( −m2 )η = 0 , (4.92)
em que m2 é uma constante, i.e., um escalar invariante. Desde que é um operador diferencial esca-
lar quadridimensional, sua invariância é inalterada se adicionar outro escalar a ele. A solução da equação
anterior será
~ e−m|~x|
η = ei(k · ~x−ωt) , (4.93)
|~x|
na qual descreve o campo de méson de Yukawa24 para um méson escalar de massa m. Usando
1 ∂η
Π= , (4.94)
c2 ∂t
a densidade hamiltoniana será
1 2 2 ~ 2 2 2
H= c Π + ∇η + m η , (4.95)
2
na qual é definida positiva.
Vamos ver o que acontece quando (4.92), dada para a força nuclear, não está mudando com o tempo.
Queremos uma solução esfericamente simétrica de
∇ 2 Φ − m2 Φ = 0
22
Combinação das diversas contribuições: J. Schwinger, Physical Review, 73, 416L (1948); C. M. Sommerfield, Physical Review,
107, 328 (1957); A. Petermann, Helv. Phys. Acta, 30, 407 (1957); C. M. Sommerfield, Ann. Phys. (New York), 5, 26 (1958);
S. Laporta and E. Remiddi, Physics Letters, B379, 283 (1996); T. Aoyama, M. Hayakawa, T. Kinoshita, and M. Nio, Physical
Review Letters, 99, 110406 (2007).
23
Para o Rb: P. Cladé et al., Physical Review, A74, 052109 (2006); para o Cs: A. Wicht et al., Phys. Scr., T102, 82 (2002);
V. Gerginov et al., Physical Review, A73, 032504 (2006).
24
Hideki Yukawa (1907-1981), físico japonês.
“Z_2” — 2017/9/5 — 8:19 — page 81 — #101
em torno de alguma ponto de fonte localizado na origem. Se Φ depende apenas de r, sabemos que
1 ∂2
∇2 Φ = (rΦ) .
r ∂r 2
Assim, temos a equação
1 ∂2 ∂2
(rΦ) − m2 Φ = 0 ⇒ (rΦ) = m2 (rΦ) .
r ∂r 2 ∂r 2
Pensando (rΦ) como nossas variáveis dependentes. A sua solução será
e−mr
rΦ = K e±mr ⇒ Φ=K ,
r
pois fica claro que Φ não poderá se tornar infinito quando temos grande valores de r. A função Φ é conhecida
como potencial de Yukawa.
Campo de Fóton Massivo de Proca Outro campo de interesse é o campo de fóton massivo de Proca,25
cuja densidade de lagrangiana é dado por:
1 µν m2 µ 1
L=− F Fµν + A Aµ − j µ Aµ , (4.96)
16π 8π c
mγ c
em que m = ~ e mγ denota a massa do fóton. Logo a equação dinâmica será
4π ν
∂µ F µν + m2 Aν = j . (4.97)
c
Esta equação descreve um campo eletromagnético com massa, em outras palavras, fótons massivos. Se estes
existem, campos magnéticos de grande escala modificariam sensivelmente as medidas dos campos terrestre
e galácticos de sua forma usual. Se de fato existirem haverá um impacto tanto na eletrodinâmica bem como
na cosmologia e astrofísica.
No calibre de Lorenz, que agora se exige pela conservação da corrente, a Eq. (4.97) pode ser escrita na
forma
4π
Aν + m2 Aν = j ν
c
e solucionando no limite estático, temos
4π ν
∇2 Aν − m2 Aν = − j .
c
Quando a fonte é uma carga puntiforme q em repouso na origem, só não é nula a componente temporal
A0 = Φ. Ela assume a forma de Yukawa, esferossimétrica,
e−mr
Φ(x) = q ,
r
ou seja, o potencial de Yukawa morre mais rapidamente do que 1r pelo fator exponencial. O potencial vai
a zero muito mais rapidamente do que 1r para distância além de m
1
. Isto mostra a feição característica da
massa do fóton.
25
Alexandru Proca (1897-1955), físico romeno-francês.
A. Proca, J. Phys. Radium, 7, 237 (1936).
“Z_2” — 2017/9/5 — 8:19 — page 82 — #102
As medidas do campo magnético da Terra, seja na superfície, seja por satélites, possibilitam fixar os
melhores limites da medida da massa do fóton mγ . As observação geofísicas, e também as de laborató-
rios, foram discutidas por Kobzarev e Okun e por Goldhaber e Nieto.26 Medidas geomagnético da Terra,
realizadas na superfície, dão os seguintes valores 27
mγ < 4 × 10−48 g .
Em uma experiência de laboratório de alta frequência, para realizar um teste da lei de Coulomb, tinha a
sensibilidade dada em termos de uma massa de repouso finita para o fóton usando as equações de Proca, o
resultado encontrado foi 28
mγ < 1, 6 × 10−47 g ,
ou seja, um limite que difere do limite geomagnético por apenas um fator 4 (pior).
Além desses resultados, em artigo recente de revisão, Goldhaber e Nieto apresenta valores limites para
fótons massivos com diferentes experimentos, conforme Tabela 4.1: 29
Tabela 4.1 Lista dos limites de massa mais significativos para o fóton.
DESCRIÇÃO
DO MÉTODO
mγ ≤ (eV) mγ ≤ (g)
LIMITES SEGUROS
Dispersão na ionosfera 3 × 10−13 10−46
Lei de Coulomb 10−14 1, 6 × 10−47
Campo magnético de Jupiter 4 × 10−16 7 × 10−49
Campo magnético do vento solar 10−18 2 × 10−41
LIMITES ESPECULATIVOS
Método Lakes estendido 7 × 10−7 ⇔ 7 × 10−20 10−49 ⇔ 10−52
Método de Higgs – –
Campo magnético cósmico 6 × 10−27 10−59
A resolução de (4.98) pode ser conseguida encontrando-se uma função de Green 30 D(x, x′ ) para a equação
x D(x, x′) = δ(4) (x − x′ ) , (4.99)
em que δ(4) (x − x′ ) é uma função delta quadridimensional. Na ausência de superfícies de fronteiras, a
função de Green só pode depender da diferença quadrivetorial z µ = xµ − x′µ . Então,
D (x, x′ ) = D(x − x′ ) = D (z)
e a Eq. (4.99) será
z D(z) = δ(4) (z) .
Função de Green A função de Green é uma excelente técnica para resolver equações diferenciais do
tipo: 31
L̂ψ (x) = f (x) , (4.100)
em que L̂ é um operador diferencial de segunda ordem. A ideia é que, em vez de resolver a Eq.
(4.100), resolveremos a equação:
L̂G(x, x′ ) = δ(x − x′ ) . (4.101)
Se for possível encontrar a função de Green G(x, x′ ) que satisfaz a equação acima, então a solução
da Eq. (4.100) será: Z
ψ (x) = dx′ G(x, x′ ) f (x′ ) . (4.102)
Nota-se que existem infinitas funções de Green que satisfazem a Eq. (4.101), já que sempre é possível
adicionar uma função ψh (x) a G(x, x′ ), em que L̂ψh = 0, e G(x, x′ )+ψh (x) também será uma função
de Green que satisfaz a Eq. (4.101). Isso faz com que possamos escolher a função de Green apropriada
de acordo com a situação do problema, de forma que a solução obedeça a qualquer condição de
contorno.
Função de Green em eletrostática No Eletromagnetismo, a primeira função de Green que devemos
encontrar aparece na eletrostática, que veremos em detalhes no próximo capítulo. Na verdade,
o potencial no ponto ~x devido a uma carga pontual num ponto ~x′ é:
q
Φq (~x) = .
|~x − ~x′ |
Como o potencial acima é a solução da equação de Poisson:32
∇2 Φ = −4πρ = −4πqδ(~x − ~x′ ) ,
isto significa que:
1
2
∇ = −4π δ(~x − ~x′ ) .
|~x − ~x′ |
Ou seja, a função de Green para a equação de Poisson é
1
G(~x,~x′ ) = .
|~x − ~x′ |
Na verdade, esta é a função de Green que faz com que o potencial vá a zero quando r → ∞. A
rigor, esta expressão é válida a menos de uma constante de integração. Porém, fisicamente esta
constante é irrelevante, pois sabemos que o potencial eletrostático é sempre definido a menos
de uma constante.
30
George Green (1793-1841), físico matemático inglês.
31
G. Green, An essay on the application of mathematical analysis to the theories of electricity and magnetism (1828).
32
Siméon-Denis Poisson (1781-1840), matemático e físico francês.
“Z_2” — 2017/9/5 — 8:19 — page 84 — #104
Agora, basta fazer a transformada inversa de Fourier para obter ψ (t,~x) em termos de f (t′ ,~x′ ).
Portanto,
Z
1 ~ −1
ψ (t,~x) = 4
dω d3 k ei ωt ei k · ~x ˜ ~
2 f (ω, k)
(2π) ~k − ωc2
2
Z Z
1 i ωt i ~k · ~x −1 ~
dt′ d3 x′ e− i ωt e− i k · ~x f (t′ ,~x′ )
3 ′ ′
= 4
dω d k e e 2
(2π) ~k2 − 2 ω
Z Z c
1 ~ −1
dω d3 k ei ω(t−t ) ei k · (~x−~x )
′ ′
= dt′ d3 x′ f (t′ ,~x′ ) × 4
.
(2π) ~k2 − ω22
c
Comparando esta última expressão com a Eq. (4.105), notamos que a função de Green é dada
pelos termos à direita do sinal ×, i.e.,
Z
1 ~ −1
dω d3 k ei ω(t−t ) ei k · (~x−~x )
′ ′
G(t,~x; t′ ,~x′ ) = .
(2π)4 ~k2 − ω22
c
Para computar esta integral, será útil definir os intervalos de tempo e de espaço, ∆t = t − t′ e
∆~x = ~x − ~x′ . Assim, podemos escrever
Z Z ~
−1 ei k · ∆~x
G(t,~x; t′ ,~x′ ) = dω ei ω∆t d3 k .
(2π)4 ~k2 − ω22
c
“Z_2” — 2017/9/5 — 8:19 — page 85 — #105
dem ser feitas além dessas duas mostradas na figura: poderíamos escolher incluir o polo da
direita mas não o da esquerda; ou poderíamos escolher incluir o da esquerda e não o da di-
reita; mas também poderíamos até escolher uma combinação linear dessas duas escolhas! Esta
liberdade na escolha do contorno, e quais resíduos portanto vão determinar a integral, é uma
consequência da liberdade que temos para escolher qual função de Green queremos. Lembra-
-se que existem infinitas funções de Green, e a nossa escolha deve-se pautar nas condições de
contorno ou em outros argumentos de natureza física. A escolha apropriada para problemas que
envolvem radiação de ondas eletromagnéticas será a do lado esquerdo da Fig. 4.3. 33 Esta esco-
lha nos leva à função de Green retardada, que discutiremos mais adiante. Nota-se que, para que
33
Para maiores detalhes ver P. M. Morse and H. Feshbach, Methods of theoretical physics (1953).
“Z_2” — 2017/9/5 — 8:19 — page 86 — #106
a integral possa ser fechada por cima será necessário que, na Eq. (4.106), i ω∆t → −∞ quando
ℑ[ω] → +∞. Em outras palavras, para a nossa escolha de incluir ambos os polos, é preciso
que ∆t > 0. Se ∆t < 0 então o contorno deve ser fechado por baixo, nenhum dos polos estará
contido no contorno e a integral será zero, i.e.,
Z ∞ X
c2 1 ei ω∆t
G(∆t, ∆x) = 3 dk k sen (k∆x) × η (∆t) 2π i (ω − ωj ) 2 ,
4π ∆x 0 res ω
ω − k2 c2
j
o resultado será
c η (∆t) 1
G(∆t, ∆x) = [δ(∆x + c∆t) − δ(∆x − c∆t)] .
4π ∆x
Devido à função degrau η (∆t), apenas a segunda função δ pode ser diferente de zero, o que nos
dará o resultado final
η (∆t) 1 ′ ∆x
G(∆t, ∆x) = − δ t − t− .
4π ∆x c
O argumento da função δ pode ser escrito em termos do tempo retardado ou tempo de retardo
tR = t − ∆x ∆x
c . O termo c é o tempo que um sinal que caminha à velocidade da luz leva para
ir do ponto ~x′ até o ponto ~x. Um observador no ponto ~x, no instante t, verá portanto um sinal
que foi emitido no ponto ~x′ no instante tR , i.e., um sinal emitido no instante t′ , no ponto ~x′ ,
chega no ponto ~x no tempo t = t′ + ∆x c . Assim, a função de Green retardada nos dará a noção
de causalidade, de uma ordem na natureza que determina que as causas têm que vir antes dos
efeitos. Esta propriedade causal do eletromagnetismo foi depois estendida para toda a física, e
levou à teoria da relatividade especial de Einstein, em 1905.
Finalmente, vamos escrever a solução final para as ondas no nosso campo ψ em termos da fonte
e da função de Green retardada. Da Eq (4.105) temos
Z
−1 1
ψ (t,~x) = dt′ d3 x′ δ(t′ − tR ) × f (t′,~x′ )
4π ∆x
Z
1 f (tR ,~x′ )
=− d 3 x′ ,
4π ∆x
em que foi suprimido a função degrau η nas últimas relações, já que é redundante, i.e., a condi-
ção de que ∆t > 0 é sempre satisfeita no caso que estamos considerando.
Voltando ao nosso problema, vamos usar as integrais de Fourier para passar do espaço de coordenadas para
o espaço de números de onda. A transformada de Fourier D (k) da função de Green é definida por
Z
1
D (z) = d4 k D (k) e− i k · z , (4.107)
(2π)4
“Z_2” — 2017/9/5 — 8:19 — page 87 — #107
1
D (k) = − . (4.109)
k·k
Assim, temos
Z
1 e− i k · z
D (z) = − d4 k . (4.110)
(2π)4 k·k
Em virtude do integrando em (4.110) ser singular quando k · k = 0, a expressão conforme está escrita é
ambígua, e só adquire um significado definido quando se manipulam as suas singularidades. Assim,
Z Z
1 3 i ~k ·~z
∞
e− i k0 · z0
D (z) = − d ke dk0 , (4.111)
(2π)4 −∞ k02 − κ2
em que introduzimos a notação κ = |~k|. A integral em k0 adquire sentido quando se considera k0 uma
variável complexa, e se trata a integral como uma integral de contorno no plano k0 . Assim, usaremos o
teorema dos resíduos para resolver nossa integral. O integrando tem dois polos simples, em k0 = ±κ,
conforme a Fig. 4.4. Dois contornos possíveis estão denominados como r e a, veja as definições na Fig. 4.4.
Para z0 > 0, a exponencial, exp (− i k0 z0 ), aumenta sem limites no semiplano superior. Para usar o teorema
dos resíduos devemos, portanto, fechar o contorno no semiplano inferior. O oposto vale para z0 < 0.
Consideremos o contorno r. Para z0 < 0, a integral resultante se anula, pois o contorno é fechado no
semiplano superior e não inclui singularidades. Para z0 > 0, a integral sobre k0 é
I
e− i k0 · z0 e− i k0 · z0
dk0 2 = −2π i Res
r k0 − κ2 k02 − κ2
− i κz0
e ei κz0
= −2π i +
2κ −2κ
2π
= − sen (κz0 ) . (4.112)
κ
“Z_2” — 2017/9/5 — 8:19 — page 88 — #108
Fazendo a integração sobre os ângulos de ~k, a função de Green (4.111) será então,
Z
η(z0 ) ~ sen (κz0 )
Dr (z) = 3
d3 k ei k ·~z
(2π) κ
Z ∞ Z 1 Z 2π
η(z0 ) 2 sen (κz0 )
= 3
κ dκ d(cos(θ)) dφ ei κR cos(θ)
(2π) 0 −1 0 κ
Z ∞ Z i κR i κR cos(θ)
η(z0 ) e sen (κz0 )
= 2
κ2 dκ d(i κR cos(θ))
(2π) 0 − i κR i κR κ
Z
η(z0 ) ∞
= dκ sen (κR) sen (κz0 ) , (4.113)
2π 2 R 0
em que R = |~z| = |~x − ~x′ | é a distância espacial entre xµ e x′µ e η(z0 ) é a função degrau. Com um pouco
de trigonometria, a Eq. (4.113) será
Z h i
η(z0 ) ∞
Dr (z) = 2 dκ ei(z0 −R)κ − ei(z0 +R)κ .
8π R −∞
As integrais remanescentes são exatamente funções delta de Dirac. Uma vez que z0 > 0 e R > 0, a segunda
integral é sempre nula. a função de Green para o contorno r é portanto,
η(x0 − x′0 )
Dr (x − x′ ) = δ(x0 − x′0 − R) . (4.114)
4πR
Esta função de Green é denominada a função de Green retardada ou causal, também é conhecida como a
função de Green para as ondas emergentes.
Com a escolha do contorno a na figura 4.4, um cálculo análogo leva à função de Green avançada,
η[−(x0 − x′0 )]
Da (x − x′ ) = δ(x0 − x′0 + R) . (4.115)
4πR
Estas funções de Green podem ser escritas na forma covariante pelo uso da seguinte identidade
1
δ[(x − x′ )2 ] = δ(x0 − x′0 − R) + δ(x0 − x′0 + R) .
2R
Então as funções de Green serão
1
Dr (x − x′ ) = η(x0 − x′0 ) δ[(x − x)2 ]
2π (4.116)
1
Da (x − x′ ) = η(x′0 − x0 ) δ[(x − x)2 ] .
2π
A solução para o potencial pode então ser escrita na forma
Z
µ µ 4π
A (x) = Ain,out (x) + d4 x′ D r,a (x − x′ ) j µ (x′ ) , (4.117)
c
em que Aµin,out (x), in – potenciais incidentes, out – potenciais emergentes, são soluções da equação homo-
gênea, quando escolhemos os dados sobre as superfícies em x0 = −∞ ou x0 = +∞, respectivamente. As
duas soluções estão relacionadas por uma terceira solução de equação homogênea,
Z
µ µ 4π
Aout (x) = Ain (x) + d4 x′ D(x − x′ ) j µ (x′ ) . (4.118)
c
Os campos de radiação estão definidos como a diferença entre os campos emergentes e os campos inciden-
tes. Assim, Z
4π
Aµrad (x) = Aµout (x) − Aµin (x) = d4 x′ D(x − x′ ) j µ (x′ ) , (4.119)
c
em que D(x − x′ ) = D r (x − x′ ) − D a (x − x′ ). A escolha da função de Green depende obviamente das
condições de contorno do problema.
“Z_2” — 2017/9/5 — 8:19 — page 89 — #109
Problemas
4.1 Mostre que a lagrangiana relativística para uma partícula carregada
r
2 v2 q ~
L = −mc 1 − 2 + A ·~v − qΦ
c c
conduz, através das equações de Euler-Lagrange, à equação da força de Lorentz,
d~p ~ ~v ~
=q E+ ×B .
dt c
4.2 Mostre que, para uma partícula em movimento em um campo eletromagnético, a velocidade ~v pode ser
expressa em termos do momentum canônico ~P, através da relação
c~P − q A
~
~v = 1 .
2 2
~P − A
q ~ + m2 c2
c
L = −(∂µ η ∂µ η + m2 η 2 ) .
( −m2 )η = 0 .
~ e−m|~r|
η = ei(k ·~r−ωt) .
|~r|
∂µ F µν = j ν ,
4.6 Usando as equações de Maxwell para o campo eletromagnético livre, deduza as seguintes relações para
as componentes Fνµ ∂ν Aρ :
~ · (Φ~E)
Fν0 ∂ν A0 = ∇
~ · (Aj ~E)
Fν0 ∂ν Aj = ∇
~ ~ 1 ∂
Fνj ∂ν A0 = (∇ × ΦB)j − (ΦEj ) .
c ∂t
∂ ~
Lmec + ~Lcampo + ∇
~ ·M
f=0
∂t
e Z I
d ~Lmec + ~Lcampo d3 r + f da = 0 ,
n̂ · M
dt V S
em que a densidade do momentum angular do campo é
~Lcampo = ~r × ~g = µǫ ~r × (~E × ~
B)
4πc
f = Te ×~r, em que Te é o tensor das tensões de
e o fluxo do momentum angular é descrito pelo tensor M
Maxwell. Usamos nas fórmulas anteriores a notação diática para Mij e Tij .
4.8 Considere campos eletromagnéticos livres de fontes e confinados numa região localizada no espaço.
a) Mostre que o tensor Mρµν = xµ Tρν − xν Tρµ , satisfaz a equação de continuidade, ∂ρ Mρµν = 0.
b) Mostre que, quando µ e ν são índices espaciais, temos a conservação do momentum angular do
campo eletromagnético
∂ ~ · (Te ×~r) = 0
(~r × ~g) + ∇
∂t
em que ~g é a densidade do momentum do campo e Te é o tensor de stress de Maxwell.
4.9 Discuta o tensor energia-momentum de corpos macroscópicos. Sugestão: Consulte o livro dos Profs.
Landau e Lifshitz [49].
4.10 Considere o campo de fóton massivo de Proca, cuja densidade de lagrangiana é dada por
1 µν m2 µ 1
L=− F Fµν + A Aµ − j ν Aν ,
16π 8π c
m c
em que m está relacionado com a massa do fóton por m = ~γ . a) Mostre que a equação dinâmica
será
4π ν
∂µ F µν + m2 Aν = j .
c
b) Mostre que no calibre de Lorenz e no limite estático, quando a fonte é uma carga puntiforme q em
repouso na origem, só não é nula a componente temporal A0 = Φ, ela assume a forma de Yukawa,
esferossimétrica,
e−mr
Φ(x) = q .
r
c) Quais são as consequências e implicações do campo de Proca?
“Z_2” — 2017/9/5 — 8:19 — page 91 — #111
4.11 Partiremos do campo de fóton massivo de Proca, cuja densidade de lagrangiana é dada no problema
anterior. a) Mostre que o tensor stress simétrico de energia-momentum para o campo de Proca é
µν 1 µγ λν 1 µν λα 2 µ ν 1 µν λ
Θ = g Fγλ F + g Fλα F + m A A − g Aλ A .
4π 4 2
b) Para estes campos em interação com uma fonte externa j ν , como mostrado na densidade de lagran-
giana do problema anterior, mostre que a lei diferencial de conservação é dada por ∂µΘµν = 1c j λ F λν .
c) Mostre explicitamente que:
1 h i
Θ00 = ~ · A)
E 2 + B 2 + m2 (A0 A0 + A ~
8π
1 h i
Θi0 = (~E × ~
B)i + m2 Ai A0 .
4π
4.12 Verifique que o quadrivetor f ν definido na (4.49) tem as componentes dadas de acordo com aquela
relação. Mostre que F ν uν = 0 e interprete este resultado.
Leitura Recomendada
Recomenda-se ao leitor os seguintes livros, muito úteis para a compreensão do desenvolvimento deste ca-
pítulo,
– A. O. Barut [6];
– L. D. Landau and E. M. Lifshitz [49];
– J. D. Jackson [42];
– F. Rohrlich [67];
– R. P. Feynman, R. B. Leighton, and M. Sands [29].
Nestes livros, o leitor encontrará deduções detalhadas da descrição do campo eletromagnético, simetrias e
aplicações. Estes livros são clássicos da literatura.
Os textos do prof. Feynman, do prof. Rohrlich e do prof. Jackson trazem excelentes trabalhos sobre
a massa eletromagnética, de forma muito clara e elegante. No texto do prof. Jackson encontramos uma
excelente discussão sobre os limites da massa do fóton através das equações de Proca.
“Z_2” — 2017/9/5 — 8:19 — page 92 — #112
Capítulo 5
Eletrostática e Magnetostática
Neste capítulo iremos tratar dos aspectos dos campos eletromagnéticos constantes, i.e., da eletrostática e da
magnetostática. Na eletrostática estudaremos os fenômenos que envolvem distribuições de carga e campos
que não dependem do tempo. Porém, devemos lembrar que a eletrostática desenvolveu-se como uma ciência
de fenômenos macroscópicos. As idealização de carga pontual e de campo elétrico num ponto devem ser
vista como construção matemática que permitem a descrição dos fenômenos a nível macroscópico, mais que
podem não ter sentido a nível microscópico. Na magnetostática, sob o ponto de vista histórico, os fenômenos
magnéticos são conhecidos e estudados pelo menos há tanto tempo quanto os fenômenos elétricos. As
pedras-ímãs naturais são conhecidas desde tempos remotos, a bússola é uma invenção muito antiga. Porém
ao contrário da eletrostática, as leis básicas dos campos magnéticos não foram consequência direta dos
primeiros contatos do homem com materiais magnéticos. As razões para esta diferença são várias, mas todas
radicam-se numa diferença básica entre a magnetostática e a eletrostática: não existem cargas magnéticas
livres. Isto quer dizer que os fenômenos magnéticos são muito diferentes dos fenômenos elétricos e que
durante muito tempo não se estabeleceu uma conexão entre eles.
~ →A
A ~′=A
~ − ∇Ψ
~ (~r) = 0 .
Soluções estáticas ~E = ~E(~r) são relevantes na física quando um processo dinâmico está no limite tendendo
ao equilíbrio.
Equações do Campo Eletrostática Para o campo elétrico constante (eletrostático) as equações de Max-
well tem a forma
~ · ~E = 4πρ
∇ (5.1)
e
~ × ~E = 0 .
∇ (5.2)
92
“Z_2” — 2017/9/5 — 8:19 — page 93 — #113
5.2 L EI DE C OULOMB 93
Esta equação implica que o campo elétrico é conservativo, i.e., podemos escrevê-lo como um gradiente de
um potencial escalar Φ = Φ(~r):
~ × ~E = 0
∇ ⇔ ~E = −∇Φ
~ . (5.3)
Com A0 = Φ, isto é consistente com E i = F i0 = ∂ i A0 − ∂ 0 Ai porque escolhemos o calibre apropriado
∂Φ
Ai = 0 e ∂ i A0 = −∂i Φ = − ∂x i . O campo elétrico é nulo quando ~ r → ∞, então o potencial poderá ser
escrito na forma Z C~r
Φ(~r) = − d~l · ~E(~l) , (5.4)
∞
~ × ~E = 0, a integral (5.4) não
em que C~r indica o caminho da integração de ∞ até~r. Devido ao fato que ∇
depende da escolha de C~r .
DESCRIÇÃO
DATA ( ANO )
DO MÉTODO
|ε| ≤
1970 Cinco esferas concêntricas 1, 3 × 10−13
1971 Cinco icosaedros concêntricos (2, 7 ± 3, 1) × 10−16
1986 Cinco icosaedros concêntricos - melhorado (1, 0 ± 1, 2) × 10−16
1983 Três icosaedros concêntricos 6 × 10−17
Portanto, podemos realmente afirmar que a força entre duas cargas puntiformes em repouso é inversa-
mente proporcional ao quadrado da distância entre as mesmas:
em que ~F é a força sobre uma carga pontual q1 , localizada em~r1 , devida a outra carga pontual q2 , localizada
em~r2 . Nota-se que tanto q1 quanto q2 são quantidades algébricas as quais podem ser positivas ou negativas.
A constante de proporcionalidade k depende do sistema de unidades que está sendo usado.
Como a eletrostática trata com campo magnético ~ B nulo, componente de espaço da densidade de força
de Lorentz, (4.49),
ν 1 νρ 1~ ~ ~ 1~ ~
f = F jρ = J · E, ρE + J × B
c c c
é simplesmente, ~F = q~E. Logo, o campo elétrico é definido através da força que atua sobre a carga teste
q ′ , que deve ser suficientemente pequena de modo a não alterar a distribuição das outras cargas que criam o
campo:
~
~E = F .
q′
Então, o campo elétrico no ponto~r devido à carga pontual q1 situada no ponto~r1 pode ser obtido diretamente
a partir da expressão
~E(~r) = k q1 ~r −~r1 , (5.7)
|~r −~r1 |3
segundo se mostra na Fig. 5.1. A constante k é determinada pela unidade de carga escolhida. Em unidades
eletrostáticas (esu), a unidade carga é aquela que exerce uma força de uma dina sobre uma outra carga igual
afastada um centímetro de distância. Assim, em unidades CGS, k = 1 e a unidade de carga é chamada de
statcoulomb. No sistema internacional SI, k = (4πε0 )−1 , em que ε0 =8,85419×10−12 farad/metro (F/m)
é chamada de permissividade do vácuo. Utilizaremos esu.
“Z_2” — 2017/9/5 — 8:19 — page 95 — #115
5.3 L EI DE G AUSS 95
Se as cargas são muito pequenas e numerosas de forma que elas podem ser descritas por uma densidade
volumétrica de carga ρ(~r), i.e., qi = ρ(~ri ) d3 r, podemos substituir a soma por uma integral:
Z
~E(~r) = ~r −~r′ 3 ′
ρ(~r′ ) d r . (5.9)
V |~r −~r′ |3
= 4πρ(~r) , (5.10)
uma vez que o operador ∇ ~ atua somente sobre a coordenada~r e aonde utilizou-se o resultado (4.5). Vemos
então que a divergência do campo elétrico será:
~ · ~E(~r) = 4πρ(~r) ,
∇ (5.11)
que é a conhecida forma diferencial da lei de Gauss.
Agora estamos em condições de aplicar o teorema da divergência ao campo elétrico ~E. Seja uma distri-
buição contínua de carga ρ(~r) e seja S uma superfície fechada qualquer. Definimos o elemento de superfície
orientado na forma d~s ≡ n̂ ds, sendo que n̂ é a normal exterior à superfície. Então
I Z
~E(~r) · d~s = 4π ρ(~r) d3 r , (5.12)
S V
em que V é o volume interior à superfície S. A equação (5.12) é conhecida como a forma integral da lei de
Gauss. No caso de uma densidade volumétrica de cargas discretas temos
N
X
ρ(~r) = qi δ(~r −~ri ) , (5.13)
i=1
mas ~E = −∇Φ
~ (~r), assim
Z B Z B
W =q ~ · d~l = q
∇Φ dΦ = q(ΦB − ΦA ) , (5.19)
A A
logo
Z B
~E · d~l = −(ΦB − ΦA ) . (5.20)
A
Porém se o caminho da integral é fechado, então a integral de linha é nula. Assim,
I
~E · d~l = 0 . (5.21)
c
Agora, usando o teorema de Stokes (1.7), temos
Z I
∇ × E · d~s = ~E · d~l .
~ ~
s c
Portanto
~ × ~E = 0 ,
∇
como demonstramos anteriormente.
“Z_2” — 2017/9/5 — 8:19 — page 97 — #117
e
~ × ~E = 0 ,
∇ (5.23)
sendo a última equação equivalente a dizer que o campo elétrico é o gradiente de uma função escalar, i.e., o
potencial escalar Φ:
~E = −∇Φ
~ . (5.24)
As Eqs. (5.22) e (5.24) podem ser combinadas para fornecer uma única equação para a função Φ(~r):
∇2 Φ = −4πρ , (5.25)
na qual é conhecida como equação de Poisson. Nas regiões do espaço onde não existe densidade de carga,
o potencial escalar satisfaz a equação de Laplace:6
∇2 Φ = 0 . (5.26)
Já conhecemos uma solução da equação de Poisson. Operando com o laplaciano ambos os lados da Eq.
(5.18), Z
1
Φ(~r) = ρ(~r′ ) ′|
d3 r ′ ,
V ~
|r −~r
e, usando (4.5), obtemos,
Z
2 1
∇ Φ(~r) = ρ(~r′ ) ∇2 d3 r ′
|~r −~r′ |
Z
= −4π ρ(~r′ ) δ(~r −~r′ ) d3 r ′
= −4πρ(~r) . (5.27)
Assim, a expressão
Z
1
Φ(~r) = ρ(~r′ ) d3 r ′ (5.28)
|~r −~r′ |
é uma solução da equação de Poisson.
Nota-se agora que se Φ1 (~r) é uma solução da equação de Poisson (5.25), então Φ2 (~r)=Φ1 (~r) + Λ(~r), em
que Λ(~r) é uma solução da equação de Laplace (5.26), também é solução da Eq. (5.25). Assim, a solução
mais geral da equação de Poisson é da forma
em que Φ1 (~r) é uma solução particular da equação de Poisson e Λ(~r) é uma solução da equação de Laplace
e que em geral carrega todas as condições de contorno.
6
Pierre-Simon de Laplace, marquês de Laplace (1749-1827), matemático, astrônomo, físico e político francês.
“Z_2” — 2017/9/5 — 8:19 — page 98 — #118
e
∇ψ ~ ψ = ∂ψ ,
~ · n̂ = n̂ · ∇ (5.32)
∂n
em que ∂/∂n é a derivada na direção normal exterior na superfície S. Quando (5.31) e (5.32) são substituí-
das no teorema da divergência (5.30), obtemos a primeira identidade de Green, i.e.,
Z I
2 ~ ~ 3 ∂ψ
(φ∇ ψ + ∇φ · ∇ψ) d r = φ ds . (5.33)
V S ∂n
Quando se escreve (5.33) com φ e ψ trocados e se subtrai o resultado da identidade primitiva, os termos
~ · ∇ψ
em ∇φ ~ se cancelam e se tem a segunda identidade de Green, ou o teorema de Green, i.e.,
Z I
2 2 3 ∂ψ ∂φ
(φ∇ ψ − ψ∇ φ) d r = φ −ψ ds . (5.34)
V S ∂n ∂n
Escolhamos agora ψ e φ da seguinte forma
1 1
ψ (~r′ ) = ′
≡ (5.35)
|~r −~r | R
φ(~r′ ) = Φ(~r′ ) , (5.36)
em que ∇′ 2 Φ(~r′ ) = −4πρ(~r′ ) é o potencial escalar,~r é o ponto de observação e~r′ é a variável de integração.
Lembrando que ∇2 (1/R) = −4πδ(~r −~r′ ), da Eq. (5.36) o teorema de Green ficará
Z I
′ 4π 3 ′ ∂ 1 1 ∂Φ
′
−4πΦ(~r )δ(~r −~r ) + ′
ρ(~r ) d r = Φ ′ − ′
ds′ (5.37)
V R S ∂n R R ∂n
=⇒
Z I
ρ(~r′ ) 1
3 ′ 1 ∂Φ ∂ 1
Φ(~r) = d r + −Φ ′ ds′ , (5.38)
V R 4π S R ∂n′ ∂n R
em que o ponto ~r fica dentro do volume V. Se o ponto ~r fica fora da superfície S, o primeiro membro da
equação (5.38) é nulo.
Duas observações são importantes em relação à equação (5.38):
7
G. Green, An essay on the application of mathematical analysis to the theories of electricity and magnetism (1828).
“Z_2” — 2017/9/5 — 8:19 — page 99 — #119
1. Se a superfície S se situa no infinito e o campo elétrico nela (E = ∂Φ/∂n) cai a zero mais rapida-
mente que 1/R, então a integral de superfície é nula e (5.38) adota a forma familiar (5.28).
2. Se o volume V não contém cargas (ρ(~r) = 0), então os valores do potencial (solução da equação de
Laplace neste caso) dentro do volume estão determinados pelos valores que toma o potencial sobre a
superfície S.
U = Φ1 − Φ2 .
Então ∇2 U = 0 no interior de V, e U = 0 ou ∂U
∂n = 0 sobre S para as condições de contorno de Dirichlet
ou de Neumann, respectivamente. Da primeira identidade de Green (5.33), com φ = ψ = U , encontramos
Z I
2 ~ ~ 3 ∂U
U ∇ U + ∇U · ∇U d r = U ds .
V S ∂n
A função 1/|~r − ~r′ | é uma das que pertencem à classe de funções que dependem das variáveis ~r e ~r′ ,
chamadas funções de Green, e que satisfazem a equação
2
∇′ G(~r,~r′ ) = −4πδ(~r −~r′ ) , (5.40)
Com o conceito geral de função de Green e seu grau de liberdade adicional, via a função F (~r,~r′ ), é possível,
usando o teorema de Green com ψ = G(~r,~r′ ) e escolhendo F (~r,~r′ ) para anular uma das duas integrais de
superfície, obter uma solução do problema do potencial que envolva somente condições de contorno de
Dirichlet ou de Neumann.
Com o teorema de Green (5.34), φ = Φ, ψ = G(~r,~r′ ) e (5.40), é possível obter uma generalização de
(5.38): Z I
1 ′
3 ′ ′ ∂Φ ′ ∂G(~r,~r )
Φ(~r) = ′ ′
ρ(~r ) G(~r,~r ) d r + G(~r,~r ) ′ − Φ(~r ) ′
ds′ . (5.43)
V 4π S ∂n ∂n
A liberdade disponível na definição de G, Eq. (5.41), significa que podemos fazer com que a integral de
superfície dependa somente de um tipo de condição de contorno. Para a condição de contorno de Dirichlet
fixamos:
GD (~r,~r′ ) = 0 , ~r′ ∈ S , (5.44)
assim o primeiro termo na integral de superfície (5.43) se anula e a solução fica
Z I
′ ′ 3 ′ 1 ∂GD ′
Φ(~r) = ρ(~r ) GD (~r,~r ) d r − Φ(~r′ ) ds . (5.45)
V 4π S ∂n′
A condição de contorno de Neumann requer mais atenção, já que a escolha aparentemente simples,
∂GN (~r,~r′ )
=0, ~r′ ∈ S , (5.46)
∂n′
é incompatível com o teorema da divergência aplicado à (5.40)
I
∂G ′
′
ds = −4π . (5.47)
S ∂n
A energia potencial total de todas as cargas devida a todas as forças que atuam entre elas é então dada por:
N X
X qi qj
W = . (5.54)
|~ri −~rj |
i=1 j<i
Uma forma mais simétrica para W se obtém somando sobre i e j sem restrição, omitindo os termos com
i = j (termos de “auto energia” infinita):
1 X X qi qj
W = . (5.55)
2 |~ri −~rj |
i j
Uma outra expressão, equivalente a (5.56), pode ser obtida observando que uma das integrais em (5.56) é
justamente o potencial Φ(~r). Então Z
1
W = ρ(~r) Φ(~r) d3 r . (5.57)
2
As Eqs. (5.55), (5.56) e (5.57) expressam a energia potencial eletrostática em termos das posições das cargas
e por isso realçam as interações entre cargas via a força de Coulomb.
Observações:
1. Se estivermos tratando com um sistema de condutores, nos quais a carga elétrica se distribui nas
superfícies dos mesmos e é caracterizada pela densidade superficial σ (~r), a energia potencial eletros-
tática desse sistema será obtida pela Eq. (5.57), na qual substituímos ρ(~r) por σ (~r), i.e.,
I
1
W = σ (~r) Φ(~r) ds . (5.58)
2
“Z_2” — 2017/9/5 — 8:19 — page 102 — #122
2. Nas Eqs. (5.57) e (5.58), Φ(~r) representa o potencial criado pela fonte ρ(~r). Contudo, quando o
potencial é externo, Φext (~r) é a energia de interação entre a densidade de carga elétrica (volumétrica
ou superficial) e este potencial é dado, respectivamente, por:
Z I
1 3 1
Wext = ρ(~r) Φext (~r) d r , Wext = σ (~r) Φext (~r) ds . (5.59)
2 2
Uma outra descrição pode ser obtida realçando o campo elétrico e interpretando a energia como sendo
armazenada pelo campo envolta das cargas. Para obter esta última forma, usamos a equação de Poisson para
eliminar a densidade de carga de (5.57):
Z
1
W =− Φ∇2 Φ d3 r . (5.60)
8π
Isto significa que existe uma força por unidade de área sobre a superfície condutora igual a
~F = − 1 δW n̂ = 2πσ 2 n̂ = w n̂ . (5.66)
δa δx
Vemos que a força está dirigida para fora da superfície e independe do sinal da densidade de carga, resultado
que era de se esperar tendo a distribuição de carga o mesmo sinal e sendo a força de Coulomb repulsiva
entre os diferentes elementos de carga.
10
Lembremos aqui que as linhas do campo eletrostático são perpendiculares à superfície de um condutor perfeito, já que esta é a
única forma de garantir, na situação estática, que não existam deslocamentos das cargas livres no condutor. A superfície de um
condutor perfeito constitui assim uma superfície equipotencial para o potencial escalar.
“Z_2” — 2017/9/5 — 8:19 — page 103 — #123
Para um sistema de N condutores no espaço vazio, cada um com um potencial Vi , e carga total Qi , com
i = 1, · · · , N , a energia potencial eletrostática pode ser expressa só em termos dos potenciais e de certas
quantidades geométricas chamadas coeficientes de capacitância. Para uma dada configuração de condutores,
a dependência linear do potencial com a densidade de carga implica que o potencial do i-ésimo condutor
pode ser escrito como
XN
Vi = pij Qj , (i = 1, · · · , N ) , (5.67)
j=1
em que os pij dependem da geometria dos condutores. Estas N equações podem ser invertidas para fornecer
a carga do i-ésimo condutor em termos de todos os potenciais
N
X
Qi = Cij Vj , (i = 1, · · · , N ) . (5.68)
j=1
A expressão da energia em termos dos potenciais Vi e dos Cij , ou em termos das cargas Qi e dos coeficientes
pij , permite a aplicação de métodos variacionais para obter valores aproximados das capacitâncias.
~ ~ × A.
B=∇ ~
Usando a lei de Ampère (5.72) e a equação potencial (5.73), podemos combiná-las para obter uma sim-
~ quando usamos o calibre de Coulomb, ∇
ples fórmula para o potencial vetor A ~ = 0. As transformações
~ ·A
~
de calibre (1.18) sempre permitem essa escolha. Seja A um potencial de calibre arbitrário, que não pode
~ ·A
satisfazer ∇ ~ = 0. A condição
0=∇ ~ ·A
~′=∇ ~ ·A~ + ∇2 Ψ
implica na equação de Poisson para uma função escalar desconhecida Ψ e existem soluções, como já fize-
~ ·A
mos para eletrostática. Um potencial vetor que satisfaz ∇ ~ = 0 permite ainda a fixação de um calibre
adicional. A relação ∇~ ·A
~ = 0 é conhecida como calibre de Coulomb, porque a divergência do campo
elétrico torna-se
3
X
~ · ~E =
∇ ~ ·A
∂j F j0 = −∇2 A0 − ∂ 0 ∇ ~ = −∇2 A0 = −∇2 Φ ,
j=1
4π ~ ~ ×~ ~ × (∇
~ × A)
~ = ∇(
~ ∇~ · A)
~ − ∇2 A
~ = −∇2 A
~ ,
J=∇ B=∇
c
ou seja,
~ =− 4π ~
∇2 A J. (5.74)
c
Existe uma relação entre as componentes do potencial vetor e as componentes da corrente, similar a relação
entre o potencial eletrostático e a densidade de carga elétrica (5.18), dada por
Z ~J(~r′ )
~ (~r) = 1
A d3 r ′ (5.75)
c |~r −~r′ |
~ atua em~r, i.e., não atua em ~J(~r′ ). O resultado final para o campo magnético será
em que ∇
Z ′
~
B(~r) =
1 ~J(~r′ ) × ~r −~r d3 r ′ . (5.77)
c |~r −~r′ |3
“Z_2” — 2017/9/5 — 8:19 — page 105 — #125
O segundo termos envolve uma diferencial perfeita na integral sobre d~l1 . Consequentemente este termo não
nos dá nenhuma contribuição para a integral (5.80), desde que os caminhos estão fechados ou estendidos ao
infinito. Então, a relação de Ampère para à força entre duas espiras que carregam corrente será dada por,
I I
~F12 = − I1 I2 ~r12
2
(d~l1 · d~l2 ) 3 ,
c C1 C2 r12
11
Hans Christian Ørsted (Oersted) (1777-1851), físico e químico dinamarquês.
12
H. C. Ørsted, Experimenta circa effectum conflictus electrici in acum magnetican, Hafniae, Schultz (1820).
13
J. B. Biot and F. Savart, Annales de Chemie et Physique, 15, 222-223 (1820); Idem, Journal de Physique, de Chemie, d’Histoire
Naturelle et des Arts, 91, 151 (1820).
14
A.-M. Ampère, Mémoires de la Classe des Sciences Mathématiques et Physiques de l’Institut de France, 6, 175-387 (1827).
“Z_2” — 2017/9/5 — 8:19 — page 106 — #126
dF 2I1 I2
= 2 . (5.81)
dl c d
A força é atrativa se as correntes têm a mesma direção, e é repulsiva se as correntes têm a direção oposta.
Se uma densidade de corrente, de volume dV = d3 r, caracterizada pelo vetor ~J(~r) está num campo
magnético externo ~ B(~r), a lei (5.79) implica que a força total sobre a distribuição de corrente é:
Z
~F = 1 ~J(~r) × ~ B(~r) d3 r . (5.82)
c
Para a mesma distribuição considerada acima, de forma análoga à mecânica, o torque total vale
Z
~ ~ 1
N = ~r × F = ~r × (~J(~r) × ~
B(~r)) d3 r . (5.83)
c
Da mesma maneira que esse resultado para ~E não é tão conveniente, em certas circunstâncias, quanto as
equações diferenciais, a Eq. (5.84) não é a forma mais útil para a magnetostática, mesmo que inclua, em
princípio, a descrição de todos os fenômenos.
Analisando a Eq. (5.84), vamos considerar uma carga q movendo-se ao longo do caminho ~r = ~r0 (t).
Neste caso, a densidade de corrente será dada por,
Supondo que em t = t0 , a partícula está na origem, i.e., ~r0 (t0 ) = 0, escrevemos sua velocidade como
~v = d~rdt
0 (t)
, portanto, temos a seguinte relação para o campo magnético,
~ q ~v ×~r
B= .
cr 3
“Z_2” — 2017/9/5 — 8:19 — page 107 — #127
Este resultado assume que a velocidade ~v é pequena comparada a velocidade da luz c, tal que os efeitos
relativísticos são desprezados.
Para obter a equação diferencial equivalente a (5.84) observa-se que poderemos colocá-la na forma
Z
~B(~r) = 1 ∇
~ × ~J(~r′ ) 1 d3 r ′ . (5.86)
c |~r −~r′ |
Da Eq. (5.86) vemos imediatamente que a divergência de ~ B se anula, pois temos que ∇~ · (∇
~ × A)
~ = 0.
Assim,
∇~ ·~
B=0. (5.87)
~ × ~E = 0 na eletrostática. Por analogia com
Esta é a primeira equação da magnetostática, e corresponde à ∇
~
eletrostática calcularemos agora o rotacional de B, i.e.,
Z
~ × ~B(~r) = 1 ∇
∇ ~ ×∇ ~ × ~J(~r′ ) 1 d3 r ′ . (5.88)
c |~r −~r′ |
Usando a identidade vetorial ∇~ × (∇~ × A)=
~ ~ ∇
∇( ~ · A)−∇
~ ~ válida para um campo vetorial arbitrário A,
2A ~
a expressão (5.88) pode ser transformada em
Z Z
~ ~ 1~ ~ ′ ~ 1 3 ′ 1 ~ ′ 2 1
∇ × B(~r) = ∇ J(~r ) · ∇ d r − J(~r )∇ d3 r ′ . (5.89)
c |~r −~r′ | c |~r −~r′ |
Usando as igualdades
~ 1 ~ ′ 1
∇ = −∇
|~r −~r′ | |~r −~r′ |
e
2 1
∇ = −4πδ(~r −~r′ ) ,
|~r −~r′ |
as integrais em (5.89) podem ser escritas na forma
Z Z
~ ~ 1~ ~ ′ ~′ 1 3 ′ 4π ~ ′
∇ × B = − ∇ J(~r ) · ∇ d r + J(~r ) δ(~r −~r′ ) d3 r ′ .
c |~r −~r′ | c
Integrando por partes a primeira integral e usando as propriedades da função delta na segunda integral,
temos Z ~′ ~ ′
~ ~ 4π ~ 1~ ∇ · J(~r ) 3 ′
∇×B= J(~r) + ∇ d r . (5.90)
c c |~r −~r′ |
Da equação de continuidade,
∂ρ ~ ~
+ ∇·J = 0 ,
∂t
vemos que para uma situação estacionária (∂ρ/∂t = 0), temos ∇ ~ · ~J = 0. Então o segundo termo de (5.90)
se anula e
~ ×~ 4π ~
∇ B= J. (5.91)
c
Esta é a segunda equação da magnetostática, e corresponde a ∇ ~ · ~E = 4πρ na eletrostática.
~ ~
Na eletrostática ∇ · E = 4πρ é a conhecida lei de Gauss na forma diferencial. A Eq. (5.91) é a chamada
lei de Ampère,15 também apresentada na forma diferencial. A forma integral dessa lei se obtém aplicando o
teorema de Stokes à (5.91), Z Z
~ ~ 4π ~
∇ × B · n̂ ds = J · n̂ ds (5.92)
S c S
15
A.-M. Ampère, Sur la theórie mathématique des phénomènes électrodynamiques uniquement déduite de l’expérience, Mém.
Acad. R. Sci. Inst. France,ser. 2, 6, 175-388 (1827) (memoirs presented from 1820 to 1825).
“Z_2” — 2017/9/5 — 8:19 — page 108 — #128
transformando-a em I Z
~ ~ 4π ~
B · dl = J · n̂ ds . (5.93)
C c S
Uma vez que a integral de superfície da densidade de corrente é a corrente total I que passa através da curva
fechada C, a lei de Ampère pode ser escrita na forma
I
~ 4π
B · d~l = I. (5.94)
C c
Nota-se que, assim como a lei de Gauss pode ser usada para calcular o campo elétrico em situações de alta
simetria, a lei de Ampère também pode ser usada em circunstâncias análogas para os campos magnéticos.
O gradiente adicional de uma função escalar arbitrária Ψ mostra que, para uma dada indução magnética ~
B,
o potencial vetor pode ser transformado livremente na forma
~ −→ A
A ~ + ∇Ψ
~ , (5.98)
que é a transformação de calibre. Esta transformação sobre A ~ é possível em virtude da equação (5.96)
~
especificar somente o rotacional de A. A liberdade da transformação de calibre nos permite fazer com que
~ ·A
∇ ~ tenha a forma funcional que julgarmos mais conveniente.
Se (5.96) é substituído na segunda equação em (5.95), encontramos
~ × (∇
∇ ~ = 4π ~J
~ × A)
c (5.99)
~ ∇ ~ − ∇2 A
~ · A) ~ = 4π ~J .
∇(
c
“Z_2” — 2017/9/5 — 8:19 — page 109 — #129
~ ·A
Se agora aproveitamos o grau de liberdade do calibre (5.98), podemos fazer a escolha do calibre ∇ ~ = 0,
i.e., calibre de Coulomb. Assim, cada componente cartesiana de A~ satisfaz à equação de Poisson
~ =− 4π ~
∇2 A J. (5.100)
c
Da nossa discussão em eletrostática, sabemos que a solução para A ~ no espaço ilimitado é dado por (5.97)
com Ψ = cte. Assim,
Z ~ ′
~ 1 J(~r ) 3 ′
A(~r) = d r . (5.101)
c |~r −~r′ |
A condição Ψ = cte pode ser entendida da seguinte forma. Nossa escolha do calibre ∇ ~ ·A
~ = 0 se reduz
2
a ∇ Ψ = 0, pois a primeira parcela do segundo membro de (5.97) tem a divergência nula, uma vez que
~ ′ · ~J = 0. Se ∇2 Ψ = 0 vale para todo o espaço, então Ψ deve ser pelo menos uma constante já que não
∇
temos correntes no infinito.
Observações:
~ o potencial vetor
1. Para o caso de uma distribuição superficial de corrente caracterizada pelo vetor K,
é definido por:
Z ~
~ (~r2 ) = 1
A
K(~r1 )
ds1 . (5.102)
c |~r2 −~r1 |
2. Para o caso de um circuito linear fechado percorrido por uma corrente elétrica I, o potencial vetor é
definido por (lembrar que d~l1 = d~r1 ):
I
~ 1 I
A(~r2 ) = d~r1 . (5.103)
c C |~r2 −~r1 |
3. Em 1845 Franz Neumann16 introduziu pela primeira vez o conceito de potencial vetor magnético
~ quando analisou o processo de indução magnética em um circuito devido ao movimento relativo
A,
de magnetos ou circuitos próximos. Muito embora Neumann não tenha definido o potencial vetor
diretamente da expressão que calculou para representar a força entre dois circuitos, infere-se que, na
linguagem atual, o potencial vetor de Neumann é o mesmo do da forma de Maxwell.17 Em 1873,
Maxwell escreve o potencial vetor A~ ′ na forma do de Neumann. Para Maxwell, o potencial vetor
foi introduzido apenas como um artifício matemático. Ele, então, escreve o que hoje é chamado de
~ =A
equação de transformação calibre, A ~ ′ − ∇Ψ,
~ e observa que: A quantidade Ψ desaparece a partir
~ ~ ~
das equações B = ∇ × A e não está relacionada a qualquer fenômeno físico.18
Espira Circular de Corrente Como ilustração para o cálculo do potencial vetor A ~ e dos campos magné-
ticos, vamos considerar uma espiral circular de raio R, no plano xy, centrada na origem, com a corrente I.
A densidade da corrente, ~J, será
′
~J = Iδ(cos θ ′ ) δ(R − r ) φ̂ = Jφ φ̂ , (5.104)
R
16
Franz Ernst Neumann (1798-1895), mineralogista, físico e matemático alemão.
17
F. E. Neumann, Abhandlungen der Königlichen Akademie der Wissenschaften zu Berlin, aus dem Jahre, 1845, 1-87 (1847);
Idem, 1847, 1-85 (1849).
18
J. C. Maxwell, Treatise on electricity and magnetism (1873). Ver o desenvolvimento histórico científico feito por J. D. Jackson
and L. B. Okun, Review of Modern Physics, 73, 663-680 (2001).
“Z_2” — 2017/9/5 — 8:19 — page 110 — #130
o que significa que o fluxo de corrente flui na direção φ̂. Podemos mostrar isso fazendo uma integração ao
redor do eixo z,
Z π Z ∞ Z π Z ∞
′ ′ ′~ ′ δ(θ ′ ) δ(R − r ′ )
dθ r dr J = I φ̂ dθ r ′ dr ′ = I φ̂ .
0 0 0 sen (π/2) 0 R
~ será
e o potencial vetor A
Z
~ =1 Jφ (−x̂ sen φ′ + ŷ cos φ′ ) 3 ′
A d r .
c |~r −~r′ |
Uma vez que há simetria axial, para fins de cálculo podemos escolher o ponto de observação no plano xy
(φ = 0), i.e.,
φ̂ = ŷ cos φ′ .
Então, Z
~ (φ = 0) = 1 Jφ ŷ cos φ′
A q d3 r ′ .
c ′2
r 2 + r − 2rr ′ (cos θ cos θ ′ + sen θ sen θ ′ cos φ′ )
A Eq. (5.104) define a densidade de corrente, e a integração, levando em consideração as funções delta,
nos dará Z 2π
~ (φ = 0) = IR ŷ cos φ′ dφ′
A p .
c 0 R2 + r 2 − 2Rr sen θ cos φ′
~ = Aφ φ̂, e teremos
Para um φ arbitrário, A
Z 2π
IR cos φ′ dφ′
Aφ (r, θ) = p . (5.106)
c 0 R2 + r 2 − 2Rr sen θ cos φ′
Esta integral pode ser expressa em termos das integrais elípticas completas K e E,
4IR (2 − k2 )K (k) − 2E (k)
Aφ (r, θ) = √ (5.107)
c R2 + r 2 + 2Rr sen θ k2
em que
4Rr sen θ
k2 =
R2 + r 2 + 2Rr sen θ
e Z π Z π
2 dα 2 p
K (k) = √ , E (k) = 1 − k2 sen2 α dα ,
0 1 − k2 sen2 α 0
são as integrais elípticas completas do primeiro tipo e do segundo tipo, respectivamente. Para r ≫ R, e
fazendo a expansão do integrando em série de Taylor,19 temos
Z 2π
IR2 sen θ πIR2 sen θ
Aφ (r, θ) = (cos φ′ )2 dφ′ = . (5.108)
cr 2 0 cr 2
19
Brook Taylor (1685-1731), matemático inglês.
“Z_2” — 2017/9/5 — 8:19 — page 111 — #131
1 ∂ 2πIR2 cos θ
Br = (sen θ Aφ ) =
r sen θ ∂θ cr 3
1 ∂ 2
πIR sen θ
Bθ = − (rAφ ) = (5.109)
r ∂r cr 3
Bφ = 0
que também podem ser expressas em termos de integrais elípticas. As equações anteriores são as componen-
tes do campo magnético dipolo, com a orientação do dipolo ao longo do eixo z, como veremos futuramente.
d2 d
x(1 − x) 2
y (x) + [c − (a + b + 1)x] y (x) − ab y (x) = 0 ,
dx dx
em que a, b e c são constantes. Tal equação é invariante a permutação a ↔ b e tem singularidades
regulares em x = 0, 1 e ∞. Esta equação é denominada equação hipergeométrica, ou equação de
Gauss. A razão do interesse nessa equação reside em três fatos. Primeiro, a equação hipergeométrica
é a única equação linear homogênea de segunda ordem com apenas três pontos singulares regulares.
Segundo, existe diversas equações diferenciais de interesse que podem ser transformadas em equa-
ções hipergeométricas e, com isso, pode-se estudar certas propriedades de diversas funções especiais,
tais como seu comportamento assintótico, a partir das propriedades correspondentes de funções hi-
pergeométricas. Terceiro, suas soluções possuem muitas simetrias. Uma solução é
y (x) = 2 F1 (a, b, c; x)
a·b x a(a + 1)b(b + 1) x2
=1+ + + ··· , c 6= 0, −1, −2, −3, · · · ,
c 1! c(c + 1) 2!
que é conhecida como função hipergeométrica. O intervalo de convergência para c > a + b é |x| < 1
e x = 1, e para c > a + b − 1 é x = −1. Em termos do símbolo de Pochhammer, 20 usado com
frequência,
(a + n − 1)!
(a)n = a(a + 1)(a + 2) · · · (a + n − 1) = ,
(a − 1)!
(a)0 = 1 ,
em que Γ(n) é a função Gamma. A explicação para a notação 2 F1 é a seguinte: o “2” à esquerda de
F indica a presença de dois símbolos de Pochhammer no numerador dos termos da série hipergeo-
métrica; o “1” à direita de F indica a presença de um símbolo de Pochhammer no denominador. Há
generalizações da série anterior que definem as chamadas funções hipergeométricas generalizadas,
denotadas por k Fl , e que contêm k símbolos de Pochhammer no numerador e l no denominador.
20
Leo August Pochhammer (1841-1920), matemático prussiano.
“Z_2” — 2017/9/5 — 8:19 — page 112 — #132
Em termos da função hipergeométrica de Gauss, a integral elíptica completa de primeiro tipo e de segundo
tipo podem ser expressas como
π 1 1 2
π 1 1 2
K (k) = 2 F1 2 , 2 ; 1; k e E (k) = 2 F1 2 , − 2 ; 1; k ,
2 2
respectivamente. Assim, o potencial vetor, (5.107), será dado em termos de funções hipergeométricas por,
4IR (2 − k2 )K (k) − 2E (k)
Aφ (r, θ) = √
c R2 + r 2 + 2Rr sen θ k2
√
π I R2 + r 2 + 2Rr sen θ
= (2 − k2 ) 2 F1 1 1
2 , 2 ; 1; k
2
− 2 2 F1 1 1
2 , − 2 ; 1; k
2
.
2 c r sen θ
Agora, faremos ao estudo da espira circular de corrente através do seguinte método. O vetor campo
magnético ~B(r) em um determinado ponto no espaço ~r, está relacionada com a distribuição de corrente
~J(~r′ ), através da lei de Biot e Savart (5.77), i.e.,
Z
~ 1 ~ ′ ~r −~r′ 3 ′
B(~r) = J(~r ) × d r .
c |~r −~r′ |3
Esta lei pode ser expressa em termos do rotacional do potencial vetor A ~ (r) como
Z
~ 1~ 1
B(~r) = ∇ × ~J(~r′ ) ~ ×A
d3 r ′ = ∇ ~ (r) ,
c |~r −~r′ |
podemos escrever
Z Z i ~k · (~r−~r′ )
~ 1 ~ ~J(~r′ ) e
B(~r) = ∇× d3 k d3 r ′ .
2πc k2
Considerando a transformada de Fourier de ~J(~r′ )
Z
~J(~k) = ~J(~r′ ) e− i ~k ·~r′ d3 r ′ ,
Se a distribuição da corrente está no plano (x, y, 0), a transformada de Fourier da distribuição pode ser
escrita como
~J(~k) = Jx (kx , ky )ı̂ + Jy (kx , ky )̂ (5.111)
e a equação de continuidade, expressa em termos de componentes de Fourier, é dado por (5.111)
Z
Bz (~r) = − kx2 + ky2 f (~k,~r) d3 k , (5.114)
em que
~
i Jx (kx , ky ) ei k ·~r
f (~k,~r) = .
2πc ky k2
Portanto, ao integrar sobre kz , finalmente temos
Z ∞ Z ∞ i(kx x+Ky y) √ 2 2
i ∂ e
Bβ (~r) = Jx (kx , ky ) e−|z| kx +ky dkx dky , β = x, y, z , (5.115)
2πc ∂β −∞ −∞ ky
que são as expressões analíticas para as componentes do campo magnético produzido por uma distribuição
de corrente planar.
Como ilustração dessa técnica, vamos considerar nossa espiral circular de raio R, no plano xy, centrada
na origem, com a corrente I. Neste caso, a transformada de Fourier para densidade de corrente complexa
poderá ser escrita como em (5.111)
em que a integral angular poderá ser escrita como uma série convergente
Z 2π ∞
X
i q(x cos φ−y sen φ) (qr)2k
e dφ = 2π (−1)k k 2 , r 2 = x2 + y 2 .
0 (2 k!)
k=0
Devido à simetria axial desse problema, vamos utilizar as coordenadas cilíndricas do vetor campo magné-
tico. A componente radial Br2 (~r) = Bx2 (~r) + By2 (~r) e a componente axial Bz (~r) do campo magnético pode
ser obtido a partir da Eq. (5.118), sendo escrita como
∞ Z ∞
2π I R ∂ X k+1 r 2k
Bγ (~r) = (−1) q 2k e−|z|q J1 (Rq) dq , γ = r, z . (5.119)
c ∂γ (2k k!)2 0
k=0
em que definimos,
∞
X ∞
(a)n (b)n xn Γ(c) X Γ(a + n)Γ(b + n) xn
2 F1 (a, b, c; x) = = ,
n=0
(c)n n! Γ(a)Γ(b) n=0 Γ(c + n) n!
e Γ(n) é a função Gamma. Finalmente, as componentes do campo magnético podem ser escritas como séries
das funções hipergeométricas,
∞
π I R2 X k+1 k r
2k−1
−2(k+1) 3 R2
Br (~r) = (−1) |z| Γ[2(k + 1)] 2 F1 k + 1, k + , 2; − 2 (5.121)
c (2k k!)2 2 z
k=0
∞
π I R2 X k (k + 1) r
2k
−(2k+3) 3 R2
Bz (~r) = (−1) |z| Γ[2(k + 1)] 2 F1 k + , k + 2, 2; − 2 . (5.122)
c (2k k!)2 2 z
k=0
Mas, se pacote de ondas segue a outra trajetória~r2 (t), a mudança de fase será
Z
q tb
S2 = Φ(~r2 (t), t) dt . (5.124)
~ ta
Assim, a diferença de fase será I
q
∆S = S1 − S2 = Φ dt , (5.125)
~ C
22
Yakir Aharonov (1932- ), físico israelense.
23
David Joseph Bohm (1917-1992), físico anglo-americano.
24
Y. Aharonov and D. Bohm, Physical Review, 115, 485-491 (1959). Para um precursor significativo, ver W. Ehrenberg and
R. E. Siday, Proceedings of the Physical Society London, B62, 8 (1949).
“Z_2” — 2017/9/5 — 8:19 — page 115 — #135
que nos dá uma interferência construtiva ou destrutiva entre as duas trajetórias. De fato, a diferença de fase
pode ser escrita como uma integral circular em uma curva C no espaço-tempo, formada quando a partícula
carregada sai de (cta ,~a) para (ctb , ~b) associada a trajetória~r1 (t) e retornando a (cta ,~a) associada a~r2 (t).
Agora, se a diferença de fase tem uma consequência física, ∆S é um invariante de Lorentz. Então
podemos generalizar a Eq. (5.125) usando o quadrivetor potencial Aµ = (Φ/c, A) ~ e o quadrivetor espaço-
µ
-tempo dx = (cdt, d~r). Então, a diferença de fase, invariante de Lorentz, será
I I
q ~ · d~r .
∆S = Φ dt − A (5.126)
~ C C
Esta fórmula demonstra o efeito Aharonov-Bohm, ou seja, a diferença de fase ∆S encontrada depende
diretamente do potencial vetor ao longo das trajetórias. Este potencial vetor, e não o campo magnético, é
que estabelece uma quantidade física, invariante de Lorentz, observada.
Se escrevermos o resultado da Eq. (5.127) em termos do campo magnético, encontraremos
I
q ~ · d~r
∆S = − A
~ C
Z
q ~
= − B · d~S
~
q
= − F, (5.128)
~
em que aplicamos o teorema de Stokes e escrevemos a integral circuital de A ~ em termos do fluxo F que
~
passa através da superfície dS limitada pelos caminhos~r1 e~r2 . A diferença de fase não depende do campo
magnético mas sim do fluxo magnético total limitado pelos trajetórias.
O efeito Aharonov-Bohm que mostra um efeito físico direto do potencial eletromagnético sobre elé-
trons quânticos (contrariamente aos elétrons clássicos) pode ser testado experimentalmente. Um arranjo
experimental para medir este efeito é apresentado na Fig. 5.6, onde elétrons são emitidos de uma fonte para
chegar ao detector. Um obstáculo é colocado de tal forma que o feixe de elétrons tomará o caminho C1
ou C2 . Após, esse obstáculo um solenoide é colocado entre o caminho da fonte de elétrons e o detector.
“Z_2” — 2017/9/5 — 8:19 — page 116 — #136
Existem certos cristais de ferro que podem ser feitos crescer sob a forma de filamentos muito alongados,
microscopicamente finos, chamados fios de cabelo (ou bigode de gato), em inglês whiskers, que, quando
magnetizados, produzem campo magnético estático concentrado no interior do cristal, mas praticamente
nulo fora do cristal. 25 Embora nesses pontos exteriores tenhamos ~ B = 0, existe neles um potencial de
~ 6= 0.26 Sua confirmação experimental definitiva só veio no ano de 1986! 27
calibre A
O efeito Aharonov-Bohm forma a base de operação dos “SQUID”,28 na qual usa a interferência (su-
percondutora) de pares de elétrons passando através de uma estrutura “tipo anel” para detectar campos
magnéticos extremamente pequenos.
O fluxo magnético dentro de um supercondutor toroidal é quantizada da seguinte forma
2π~c π~c
Fn = n= n; q = 2e , n ∈ Z.
q e
Observe o fator crucial 2 entre a carga do par de Cooper 29 (q = 2e), responsável pelo mecanismo de super-
condutores, e a carga do elétron. 30
SQUID – O dispositivo “SQUID” é formado por duas junções Josephson 31 em paralelo. A corrente I que
entra no dispositivo é dividida em duas componentes, que atravessam as duas junções Josephson na
forma de correntes de pares de elétrons. Nesse caso, pode-se mostrar que a dependência de cada
corrente nas fases das funções de onda nos dois lados resulta numa corrente que varia com o fluxo
magnético F que atravessa o contorno do circuito (efeito Aharonov-Bohm), na forma
F
I = I0 cos π
F0
h
em que F0 é o fluxo quântico dado por F0 = 2e . Este resultado mostra que, quando o “SQUID” é
submetido a um campo magnético, a corrente varia periodicamente, passando por máximos conse-
cutivos à medida que o fluxo passa por múltiplos de F0 . Então, por meio de um circuito contador
25
A. Tonomura et al., Physical Review Letters, 48, 1443 (1982).
26
Calibre vem do inglês gauge.
27
A. Tonomura et al., Physical Review Letters, 56, 792 (1986); A. Tonomura, Int. J. Mod. Physics, A15, 3427 (2000).
28
SQUID - Superconducting QUantum Interference Device, desenvolvido em 1964 por Arnold Silver, Robert Jaklevic, John
Lambe e James Mercereau da Ford Research Labs.
29
Leon Neil Cooper (1930- ), físico americano.
30
L. N. Cooper, Physical Review, 104 N.4, 1189 (1956).
31
Brian David Josephson (1940- ), físico galês.
O efeito Josephson é um efeito físico que se manifesta pela aparição de uma corrente elétrica que flui através de dois supercon-
dutores fracamente interligados, separados apenas por uma barreira isolante muito fina. Esta disposição é conhecida como uma
junção Josephson, e a corrente que atravessa a barreira é chamada de corrente Josephson.
“Z_2” — 2017/9/5 — 8:19 — page 117 — #137
digital, pode-se contar o número de máximos que a corrente atravessa e assim determinar o fluxo
final. Este aparelho é usado para medir campos magnéticos com grande sensibilidade e precisão. Os
magnetômetros de “SQUID” são utilizados rotineiramente em equipamentos científicos, médicos e
industriais.
que a corrente é formada por um fluxo de portadores de carga q (único tipo de portador de carga), portanto,
temos
~J = nqh~vi , (5.129)
c−1 q h~vi × ~
B = c−1 qvB x̂ × ẑ = −c−1 qvB ŷ
dirigido de cima para baixo, compense exatamente o efeito do campo magnético sobre cada portador de
carga, i.e.,
q|~E| = q|~v × ~
B| .
Se d é a largura da barra, a força eletromotriz transversal à corrente assim gerada é
J
E = VH = |~E|d = |~v||~
B|d = Bd . (5.130)
nq
A força eletromotriz também é chamada de voltagem Hall. Nota-se que a parte de cima da barra, na confi-
guração mostrada na figura, estará a potencial mais alto que a de baixo se os portadores têm carga negativa,
como elétrons, mas estará a potencial mais baixo se tiverem carga positiva. Logo, o efeito Hall pode ser
usado para determinar o sinal dos portadores de carga. Este fenômeno também pode ser usado para deter-
1
minar o coeficiente Hall RH = nq .
Apesar de ter sido descoberto há mais de um século, o efeito Hall constitui ainda hoje uma técnica
importante de investigação das propriedades de condução dos materiais. Foi com esta técnica que K. von
Klitzing,34 em 1980, descobriu que quando o movimento de elétrons num semicondutor (em condições não
comuns, como temperaturas e sob campos magnéticos muito intensos) é confinado a duas dimensões, a
voltagem Hall varia com o campo magnético em degraus. 35 A tensão de Hall é assim quantizada e temos:
JRK
VH = , (5.131)
f
em que f = 1, 2, 3, ... e
h
RK = = 25812, 807557(18) Ω
qe2
é a constante de Klitzing. 36 A constante h que aparece na relação anterior é a famosa constante de Planck.
Fica claro que esse é um efeito resultante da quantização dos níveis de energia de elétrons no campo mag-
nético. Este resultado é conhecido como efeito Hall quântico.
Posteriormente, Laughlin, Störmer e Tsui,37 perceberem que sob certas condições especiais a resistência
de Hall é dada pela equação anterior e que existem inteiros n que quando substituídos por uma série de
equações fracionárias resultaria em algo semelhante à Fig. 5.5. Este fenômeno é denominado efeito Hall
quântico fracionário. 38
Problemas
5.1 Suponha que o potencial de uma carga pontual q situada na origem do sistema e tenha a seguinte forma
e−Kr
Φ=q .
r
34
Klaus von Klitzing (1943- ), físico alemão.
35
K. von Klitzing, G. Dorda and M. Pepper, Physical Review Letters 45 (6), 494-497 (1980).
36
A. Tzalenchuk, S. Lara-Avila, A. Kalaboukhov, S. Paolillo, M. Syväjärvi, R. Yakimova, O. Kazakova, T. J. B. M. Janssen, V.
Fal’ko and S. Kubatkin, Nature Nanotechnology 5, 186-189 (2010).
O valor da constante de Klitzing recomendado pela CODATA é RK = qh2 = 25812, 807572(95) Ω, ver P. J. Mohr, B. N. Taylor
e
and D. B. Newell, CODATA recommended values of the fundamental physical constants: 2006. Review of Modern Physics 80,
633-730 (2008).
37
Robert Betts Laughlin (1950- ), físico americano.
Horst Ludwig Störmer (1949- ), físico alemão.
Daniel Chee Tsui (1939- ), físico americano, nascido na China.
38
D. C. Tsui, H. L. Stormer and A. C. Gossard, Physical Review Letters 48 (22), 1559 (1982); R. B. Laughlin, Physical Review
Letters 50 (18), 1395 (1983); H. L. Stormer, Review of Modern Physics 71 (4), 875 (1999).
“Z_2” — 2017/9/5 — 8:19 — page 119 — #139
a) Determine o campo elétrico ~E = −∇Φ. ~ b) Verifique se a lei de Gauss é válida para esse campo
~ ~
elétrico. c) Calcule ∇ · E. d) Mostre que para r 6= 0, o potencial satisfaz a relação ∇2 Φ − K 2 Φ = 0,
em que este potencial é o potencial de Yukawa.
5.2 Use a lei de Gauss para calcular o campo elétrico ~E e o potencial Φ devidos a um cilindro condutor
infinito de raio a, cuja carga por unidade de comprimento é dada por λ. Como poderíamos definir nesse
caso o zero do potencial?
5.3 Considere um capacitor formado por duas placas paralelas de área S, que estão separadas por uma
S
distância d. Mostre que a capacitância no vácuo é dada por C = 4πd . Se o alinhamento das placas for
perturbado de modo que sobre uma borda a separação seja d + δ e sobre a borda oposta seja d − δ, em
que δ ≪ d, mostre que a capacitância será,
S δ2
C= 1+ 2 .
4πd 3d
5.4 Use o teorema de Gauss para provar as seguintes afirmações: a) Qualquer excesso de carga colocado
em um condutor deve ficar inteiramente em sua superfície. b) Um condutor oco fechado protege seu
interior a partir de campos devido a cargas exteriores, mas não protege seu exterior a partir dos campos
devido a cargas colocadas no seu interior. c) O campo elétrico na superfície de um condutor é normal à
superfície e tem uma magnitude 4πσ, em que σ é a densidade de carga por unidade de área da superfície.
5.5 Usando funções delta de Dirac nas coordenadas apropriadas, expresse as seguintes distribuições de
carga como densidades de carga tridimensional ρ(~r): a) Em coordenadas esféricas, uma carga Q dis-
tribuída por uma casca esférica de raio R. b) Em coordenadas cilíndricas, uma carga por unidade de
comprimento λ uniformemente distribuída sobre uma superfície cilíndrica de raio b. c) Em coordena-
das cilíndricas, uma carga Q distribuída uniformemente sobre um disco circular plano de espessura
desprezível e raio R. d) O mesmo da parte c), usando coordenadas esféricas.
“Z_2” — 2017/9/5 — 8:19 — page 120 — #140
em que q é a grandeza da carga elétrica, α−1 = a20 e a0 é o raio de Bohr.39 Encontrar a distribuição de
carga (tanto a contínua como a discreta) que dará esse potencial e interpretá-la fisicamente. Sugestão:
Consulte o livro do Prof. Greiner [34].
5.7 Provar o teorema do valor médio: Para o espaço de carga livre o valor do potencial electrostático em
qualquer ponto é igual à média do potencial sobre a superfície de qualquer esfera centrada sobre esse
ponto.
5.8 Uma distribuição de carga com simetria esférica tem uma densidade de carga ρ(r) = kr −n , em que k
e n são constantes positivas e 0 ≤ r ≤ R. Calcule a energia eletrostática dessa distribuição de carga.
Para que valores de n a energia é finita?
5.9 Use teorema de Gauss para provar que na superfície de um condutor curvo carregado, a derivada normal
do campo elétrico é dada pela relação
1 ∂E 1 1
=− + ,
E ∂n R1 R2
5.10 Calcule a força necessária para manter dois hemisférios de raio R, cada um com carga Q/2, juntos.
5.11 Prove o teorema da reciprocidade de Green: Se Φ é o potencial devido a uma densidade volumétrica
de carga ρ dentro de um volume V e uma densidade superficial de carga σ na superfície condutora S
que limita o volume V , enquanto Φ′ é o potencial devido a uma outra distribuição de carga ρ′ e σ ′ ,
então Z Z Z Z
′ ′
ρΦ dV + σΦ dA = ρ Φ dV + σ ′ Φ dA .
′
V S V S
5.12 Dois condutores circulares, coaxiais e paralelos, de raio R são portadores da corrente I. Em que
distância a, entre si, os condutores devem ser colocadas de modo que, na ligação em série do campo
magnético entre si, esse campo magnético torna-se tão uniforme quanto possível? Sugestão: Consulte
o livro do Prof. Greiner [34].
5.13 Calcule o campo magnético B (z) sobre o eixo de uma espira circular percorrida por uma corrente I.
Mostre então que, Z ∞
4πI
B (z) dz = .
−∞ c
H
Explique por que esse resultado está de acordo com a lei circuital de Ampère, Γ ~ B · d~l, embora a
integral de linha não seja sobre um caminho fechado.
I d~l ×~r
d~
B=
c r3
39
Niels Henrik David Bohr (1885-1962), físico dinamarquês.
“Z_2” — 2017/9/5 — 8:19 — page 121 — #141
para a indução magnética produzida por um aumento da corrente Id~l, mostra claramente que para um
circuito fechado com uma corrente I, a indução magnética em um ponto de observação P é
~B = − I ∇Ω
~ ,
c
em que Ω é o ângulo sólido subtendido por o laço no ponto P . Esta é uma forma alternativa de lei de
Ampère para circuitos de corrente.
5.15 a) Um solenoide circular de comprimento L e raio a tem N espiras por unidade de comprimento
na qual transporta uma corrente I, mostrar que a densidade do fluxo magnético no eixo principal do
cilindro é dada aproximadamente por Bz = 2πN I
c (cos θ1 + cos θ2 ), em que os ângulos são definidos na
Fig. 5.6.
b) Para um solenoide longo do comprimento L e raio a, mostrar que perto do eixo e próximo do centro
do solenóide a indução magnética é principalmente paralela ao eixo, mas tem uma pequena componente
radial
96πN I a2 zρ
Bρ ≃ ,
c L4
corrigir a ordem de a2 /L2 e para z ≪ L, ρ ≪ a. A coordenada z é medida a partir do ponto central do
eixo.
c) Mostram que no final de um solenoide longo da indução magnética perto do eixo tem componentes
2πN I πN I ρ
Bz ≃ e Bρ ≃ .
c c a
5.16 Um fio longo e reto de raio a carrega uma corrente I distribuída uniformemente através de sua seção
reta. a) Usando o teorema de Stokes, provar a relação entre o campo magnético ~B e o potencial vetor
~
A, Z I
~
B · d~a = ~ · d~l ,
A
S Γ
em que S é a superfície delimitada pela curva fechada Γ. b) Usando a lei de Ampère e a relação acima,
determine ~
BeA ~ em todos os pontos do espaço.
IπR2 r sen θ
Aφ (r, θ) = .
c (R2 + r 2 + 2Rr sen θ) 32
5.18 Dado o potencial vetor de uma espira circular (5.107), encontre as componentes do campo magnético
~B em termos das integrais elípticas K (k) e E (k).
“Z_2” — 2017/9/5 — 8:19 — page 122 — #142
5.19 Uma esfera de raio R com uma carga q, uniformemente distribuída sobre sua superfície, está rodando
em torno de seu diâmetro, a uma velocidade angular constante ~ω . Calcule o potencial vetor e a indução
magnética dentro e fora da esfera. Sugestão: Consulte o livro do Prof. Greiner [34].
5.20 Calcule o potencial vetor de dois fios condutores infinitamente longos, que transportam correntes
estáveis antiparalelas I. Considere também o caso de correntes paralelas. Como poderá uma expressão
convergente bem definido ser alcançada? Sugestão: Consulte o livro do Prof. Greiner [34].
5.21 Usando as equações da magnetostática, mostre explicitamente que a divergência do tensor de Max-
well,
1 1~ ~
Tij = Bi Bj − B · B δij ,
4π 2
é igual à i-ésima componente da densidade de força magnética,
X ∂ 1 ~ ~
(Tij ) = J×B .
∂xj c i
j
Leitura Recomendada
Recomenda-se ao leitor a consulta e leitura dos seguintes livros, muito úteis para a compreensão do desen-
volvimento deste capítulo,
– J. D. Jackson [42];
– M. A. Heald and J. B. Marion [36];
– R. P. Feynman, R. B. Leighton, and M. Sands [29];
– J. Frenkel [30];
– L. D. Landau and E. M. Lifshitz [49].
Nestes textos, o leitor encontrará deduções detalhadas da descrição da eletrostática e magnetostática. Estes
textos são magníficos, e, em especial, os livros do prof. Feynman, do prof. Marion e do prof. Jackson trazem
uma excelente sequência de trabalhos, do fundamental ao avançado, de forma muito clara e elegante.
“Z_2” — 2017/9/5 — 8:19 — page 123 — #143
Capítulo 6
Problemas de Contorno
Muitos problemas em eletrostática envolvem superfícies sobre as quais o potencial ou a densidade de carga
estão especificados. A solução formal destes problemas será apresentada usando o método das funções de
Green. Em situações normais, a determinação da correta função de Green pode ou não ser uma tarefa sim-
ples. Consequentemente uma série de métodos para a resolução de problemas de contorno em eletrostática
e magnetostática serão desenvolvidos, tais como as funções especiais, em coordenadas cilíndrica e esférica,
para solução das equações diferenciais.
Figura 6.1 Carga pontual na presença de um plano condutor infinito conectado à terra.
123
“Z_2” — 2017/9/5 — 8:19 — page 124 — #144
Carga na Esfera Condutora Conectada à Terra Como ilustração do método das imagens, consideremos
o problema, mostrado na Fig. 6.2, de uma carga pontual q localizada em ~y relativo a origem no qual é
Figura 6.2 Carga pontual na presença de uma esfera condutora conectada à terra.
1 ∂Φ
σ=−
4π ∂r r=a
q r − y cos γ ry 2 /a2 − y cos γ
=− − p 3 + p 3
4π
r 2 + y 2 − 2ry cos γ a2 + r 2 y 2 /a2 − 2yr cos γ
r=a
a2
q 1 − y2
=− 3/2 , (6.7)
4πay 2
1 + ay2 − 2a
y cos γ
em que cos γ = r̂ · ŷ. Essa distribuição de carga é máxima quando r̂ · ŷ = 1, ou seja, na direção da carga q.
Podemos observar que a carga induzida na superfície da esfera, que é calculada como a integral de superfície
da densidade de carga σ, é igual à carga imagem q ′ , conforme a lei de Gauss.
A força atuando sobre a carga q pode ser calculada
usando a força de Coulomb entre a carga q e a sua
′ ′ a2
imagem q . A distância entre elas é y − y = y 1 − y2 . Assim a força atrativa fica:
a
q q′ q2 y
F = =− 2 . (6.8)
|~y − ~y′ |2 a2
y2 1 − y2
Para grandes separações a força varia com o inverso da lei cúbica, mas perto da esfera ela é proporcional ao
quadrado da distância à superfície da esfera.
Toda a discussão anterior se baseia no fato de que a carga q está situada no exterior da esfera. Os
resultados se aplicam também para a carga q dentro da esfera. A única mudança necessária é na densidade
superficial de carga σ, Eq. (6.7), aonde agora a derivada normal a superfície condutora tem a direção −ŷ,
o que implica numa mudança de sinal. Lembrar também que agora temos y ≤ a. A distribuição angular de
carga é similar à obtida no caso anterior (carga q fora da esfera), só que agora a carga total induzida vale −q.
Esfera Condutora, Carregada e Isolada Agora, se considerarmos o problema de uma esfera condutora
isolada e carregada com uma carga total Q na presença de uma carga puntiforme q, podemos construir a
solução do potencial por superposição linear. Podemos começar com uma esfera condutora conectada à
terra (com uma carga q ′ distribuída sobre a sua superfície). Então desligamos o fio terra e adicionamos à
esfera uma quantidade de carga Q − q ′ . Isso nos leva a carga total na esfera ao valor de Q. Notemos que
a carga adicionada Q − q ′ se distribuirá uniformemente sobre a superfície da esfera, uma vez que a força
eletrostática devida à carga q já está compensada pela carga q ′ . Assim, o potencial devido à carga adicionada
Q − q ′ será o mesmo daquele devido à uma carga pontual da mesma grandeza localizada na origem, pelo
menos para os pontos fora da esfera.
O potencial é a superposição de (6.1) e do potencial de uma carga pontual Q − q ′ na origem
q aq Q + ay q
Φ(~r) = − + . (6.9)
|~r − ~y| y ~r − a2 ~y r
y 2
“Z_2” — 2017/9/5 — 8:19 — page 126 — #146
A força atuando sobre a carga q pode ser escrita diretamente a partir da lei de Coulomb. Ela está dirigida
segundo a direção radial apontando para q e tem o valor
~F = q ~E = −q ∇Φ ~
~r=~y
aq a2 aq
y ~r − y2 ~y Q+ y
= q − 3 + ~r
2 r3
(~r − ay2 ~y
~r=~y
3 2 2
q qa (2y − a )
= 2 Q− ŷ . (6.10)
y y(y 2 − a2 )2
No limite y ≫ a, a força se reduz à lei de Coulomb usual entre duas cargas pequenas. Mas na vizinhanças
da esfera, a força é modificada devido à distribuição de cargas induzidas na superfície.
Esfera Condutora em Potencial Fixo Um outro problema que pode ser discutido facilmente é aquele de
uma carga pontual perto de uma esfera condutora mantida a um potencial fixo V . O potencial é o mesmo
que para uma esfera carregada, só que agora a carga Q − q ′ do centro é substituída por uma carga V a. Isto
pode ser visto da Eq. (6.9), uma vez que em r = a os dois primeiros termos cancelam-se e o último termo
será igual a V , em concordância com as condições de contorno. Assim o potencial será
q aq Va
Φ(~r) = − + . (6.11)
|~r − ~y| y ~r − a ~y
2 r
y 2
Esfera Condutora em um Campo Elétrico Uniforme Como último exemplo, vamos considerar uma
esfera condutora em um campo elétrico uniforme, conforme mostra a Fig. 6.3.
Este caso será reduzido para o nosso primeiro exemplo, assumindo que o campo elétrico é gerado por
duas cargas iguais e opostas q e −q localizadas a distâncias iguais em lados opostos da esfera. Estas duas
“Z_2” — 2017/9/5 — 8:19 — page 127 — #147
6.2 F UNÇÃO DE G REEN PARA A E SFERA , S OLUÇÃO G ERAL PARA O P OTENCIAL 127
cargas geram um campo de magnitude R2q2 na origem. Para obter um campo uniforme, assumimos que q e
R tendem ao infinito de tal modo que a magnitude do campo E0 = R2q2 é sempre conservada.
O potencial total é a superposição dos potenciais das duas cargas geradoras do campo e as suas cargas
de imagem. A magnitude e a posição das cargas de imagem podem ser tomadas a partir de nosso primeiro
exemplo, e, assim, obtém-se
q q q ay q ay
Φ(~r) = − + + − . (6.13)
|~r − ~y| |~r + ~y| |~r − ~y′ | |~r + ~y′ |
a2 a2
Quando y = R, temos ~y′ = y ŷ = R ŷ e o potencial será
q q
Φ=− p +p
R2 + r 2 − 2rR cos γ R2 + r 2 + 2rR cos γ
qa qa
+ q − q
a4 a2 4 2
R r 2 + R2 − 2r R cos γ a
R r 2 + R2 + 2r aR cos γ
q q
=− q + q
r 2 r 2
R 1+ R − 2 Rr cos γ R 1+ R + 2 Rr cos γ
qa qa
+ q − q . (6.14)
a4 a2 a4 a2
Rr 1+ r 2 R2
− 2 rR cos γ Rr 1+ r 2 R2
+ 2 rR cos γ
r r
Se R ≪ 1 a raiz quadrada pode ser expandida, e tendo em conta o termo linear em R obtemos
2q 2q a3 a3
Φ=− r cos γ + cos γ + · · · = −E0 r − cos γ . (6.15)
R2 R2 r 2 r2
3
A expressão −~E ·~r = −E0 r cos γ é o potencial no campo uniforme, enquanto E0 ar2 cos γ, obviamente,
vem das cargas de imagem.
Finalmente, como em nosso primeiro exemplo, a densidade superficial de carga induzida pode ser cal-
culada,
1 ∂Φ 3
σ=− = E0 cos γ . (6.16)
4π ∂r r=a 4π
1 a
GD (~r,~r′ ) = ′
− . (6.17)
|~r −~r | r ′ ~r − a2 ~r′
2
r′
“Z_2” — 2017/9/5 — 8:19 — page 128 — #148
1 1
GD (~r,~r′ ) = − 1/2 , (6.18)
(r 2 + r′2 − 2rr ′ cos γ)1/2 r2 r′ 2
a2
+ a2 − 2rr ′ cos γ
em que cos γ = r̂ · ŷ. A simetria nas variáveis ~r e ~r′ é óbvia na forma (6.18), assim como também a
condição de que G = 0 se~r ou~r′ está sobre a superfície da esfera.
∂G
Para a solução (5.49) da equação de Poisson necessitamos, além de G, a quantidade ∂n ′ . Lembrando
′
que n̂ é o versor normal externo ao volume de interesse, i.e., direcionado em sentido contrário à~r′ , então
obteremos
∂G (r 2 − a2 )
= − . (6.19)
∂n′ r′ =a a(r 2 + a2 − 2ra cos γ)3/2
Observe que isto é essencialmente a densidade de carga induzida (6.7). Assim a solução da equação de
Laplace fora da esfera com o potencial especificado na sua superfície é, segundo (5.45),
I
1 a(r 2 − a2 )
Φ(~r) = Φ(a, θ ′ , φ′ ) dΩ′ , (6.20)
4π S (r 2 + a2 − 2ar cos γ)3/2
em que Ω′ é o elemento de ângulo sólido no ponto (a, θ ′ , φ′ ) e cos γ = cos θ cos θ ′ +sen θ sen θ ′ cos(φ−φ′ ).
∂G
Para o problema interior, a derivada normal está dirigida radialmente para fora, por isso o sinal de ∂n ′ é
oposto ao do sinal de (6.19). Para um problema com uma distribuição de carga, devemos somar em (6.20) o
primeiro termo de (5.45), com a função de Green (6.18).
Z
1 2
Φ(~r) = ρ(~r′ ) 2 ′ 2 ′ cos γ)1/2
r ′ dr ′ dΩ′
V (r + r − 2rr
Z
1 ′2 ′ ′
− ρ(~r′ ) 1/2 r dr dΩ
2 ′ 2
V r r 2 ′
a2 + a − 2rr cos γ
I
1 a(r 2 − a2 )
+ Φ(a, θ ′ , φ′ ) 2 dΩ′ .
4π S (r + a2 − 2ar cos γ)3/2
“Z_2” — 2017/9/5 — 8:19 — page 129 — #149
Neste estágio α e β são completamente arbitrários. Consequentemente a Eq. (6.25) representa, via superpo-
sição linear, uma classe muito grande de soluções da equação de Laplace.
Para determinar α e β é necessário impor condições de contorno específicas sobre o potencial. Como
exemplo, consideremos uma caixa retangular, como mostra a Fig. 6.5, com dimensões (a, b, c) nas direções
(x, y, z). Todos os lados da caixa são mantidos no potencial zero, à exceção do lado z = c, o qual é mantido
no potencial V (x, y). Deseja-se encontrar o potencial em qualquer ponto no interior da caixa. Partindo da
condição em que Φ = 0 para x = y = z = 0, é possível ver que as funções devem ser
X = sen αx
Y = sen βy (6.26)
p
Z = senh( α2 + β 2 z) .
Figura 6.5 Caixa oca, com cinco paredes mantidas no potencial zero, enquanto a sexta parede (z = c)
tem o potencial Φ = V (x, y).
podemos escrever um potencial Φnm , que satisfaz todas as condições de contorno, menos uma, ou seja
Assim, o potencial pode ser expandido em termos desses Φnm com coeficientes inicialmente arbitrários,
i.e.,
X∞
Φ(x, y, z) = Anm sen(αn x) sen(βm y) senh(γnm z) . (6.29)
n,m=1
Isto é justamente uma série dupla de Fourier para a função V (x, y). Consequentemente, os coeficientes
Anm estão dados por:
Z a Z b
4
Anm = dx dy V (x, y) sen(αn x) sen(βm y) . (6.31)
ab senh(γnm c) 0 0
Se a caixa retangular tiver potenciais diferentes de zero em todos os lados, a solução para o potencial dentro
da caixa pode ser obtida por superposição linear de seis soluções, uma para cada lado, equivalentes às
(6.29) e (6.31). O problema da solução da equação de Poisson, i.e., do problema dentro da caixa com uma
distribuição de carga no seu interior e com condições de contorno sobre sua superfície, requer da construção
da função de Green apropriada, em concordância com (5.44) e (5.45).
Empregando a técnica de separação das variáveis, i.e., substituindo a relação (6.33) na Eq. (6.32) e dividindo
por RQZ, encontraremos três equações diferenciais ordinárias escritas nas formas
d2 Z
− k2 Z = 0 (6.34)
dz 2
d2 Q
+ ν 2Q = 0 (6.35)
dφ2
1 d2 R 1 dR 2 ν2
+ + k − 2 = 0. (6.36)
R dρ2 Rρ dρ ρ
As soluções das duas primeiras equações são elementares
em que ν deve ser um inteiro. Entretanto, algumas condições de contorno são necessárias para que na
direção z o parâmetro k seja arbitrário. No momento vamos assumir que k é real e positivo.
Na equação radial podemos fazer uma troca de variável, tal que x = kρ. Logo, dρ = dxk e teremos
d2 R 1 dR ν2
+ + 1 − R = 0. (6.39)
dx2 x dx x2
Esta é a conhecida equação de Bessel, cuja soluções são dadas pelas funções de Bessel de ordem ν. Se uma
solução em série de potências na forma
∞
X
R(x) = xα aj xj (6.40)
j=0
e
1
a2j = − a2j−2 (6.42)
4j(j + α)
para j = 1, 2, 3, · · · . Todas as potências ímpares de xj possuem coeficientes nulos. A relação de recorrência
pode ser iterada para obter
(−1)j Γ(α + 1)
a2j = 2j a0 . (6.43)
2 j! Γ(j + α + 1)
Normalmente escolhemos a constante a0 = [2α Γ(α + 1)]−1 . Logo, as duas soluções serão:
x ν X
∞
(−1)j x 2j
Jν (x) = (6.44)
2 j! Γ(j + ν + 1) 2
j=0
x −ν X
∞
(−1)j x 2j
J−ν (x) = . (6.45)
2 j! Γ(j − ν + 1) 2
j=0
Estas soluções são conhecidas como funções de Bessel do primeiro tipo e de ordem ±ν. As séries convergem
para todos os valores de x. Se ν não for um inteiro, essas duas soluções formam um par de soluções
linearmente independentes da equação de Bessel de segunda ordem. Entretanto, se ν for um inteiro, elas
são as bem conhecidas soluções linearmente dependentes. Para ν = m inteiro, podemos representar as
séries como
J−m (x) = (−1)m Jm (x) . (6.46)
Consequentemente será necessário encontrar uma outra solução linearmente independente quando m for
inteiro. É de costume, mesmo quando ν não for inteiro, trocar o par J±ν (x) por Jν (x) e Nν (x), a função de
Neumann (ou função de Bessel do segundo tipo):
2ν
Ων−1 (x) + Ων+1 (x) = Ων (x) (6.49)
x
dΩν (x)
Ων−1 (x) − Ων+1 (x) = 2 , (6.50)
dx
em que Ων (x) representa qualquer uma das funções cilíndricas de ordem ν.
1
Hermann Hankel (1839-1873), matemático alemão.
2 (1) (2)
Função de Hankel de primeira espécie, Hν (x), e de segunda espécie, Hν (x), respectivamente.
“Z_2” — 2017/9/5 — 8:19 — page 133 — #153
Nestas fórmulas, ν assume a condição de ser real e não negativo. Agora, para x ≫ 1
r
2 νπ π
Jν (x) → cos x − −
rπx
2 4 . (6.53)
2 νπ π
Nν (x) → sen x − −
πx 2 4
A transição de pequenos valores de x para os grandes valores de x possui um comportamento assintótico e
ocorre na região de x ∼ ν.
Da forma assintótica (6.53) fica claro que cada função de Bessel possui um número infinito de raízes.
Estaremos, principalmente, interessado com as raízes de Jν (x):
Jν (xνn ) = 0 , n = 1, 2, 3, · · · (6.54)
em que xνn é a n-ésima raiz de Jν (x). Para os primeiros valores inteiros de ν, as três primeiras raízes são:
Integrando por partes, e lembrando que (ρJν Jν′ ) anula-se em ρ = 0 (para ν ≥ 0) e ρ = a, escrevemos o
resultado como
Z a Z a 2
dJν xνn′ aρ dJν xνn aρ xνn ν 2 ρ ρ
− ρ dρ + − ρ Jν x νn ′ Jν x νn dρ = 0 .
0 dρ dρ 0 a2 ρ2 a a
Se escrevemos a mesma equação, trocando n por n′ e subtrairmos da expressão anterior, vamos encontrar a
condição de ortogonalidade
Z a
2 2 ρ ρ
(xνn − xνn′ ) ρ Jν xνn′ Jν xνn dρ = 0 . (6.56)
0 a a
Com as relações de recorrência (6.49) e (6.50) e a equação diferencial, a integral normalizada pode ser
escrita como Z a ρ ρ a2
ρ Jν xνn ′ Jν xνn dρ = [Jν+1 (xνn )]2 δn′ ,n . (6.57)
0 a a 2
Assumindo que os cálculos das funções de Bessel estão completos, podemos expandir um função arbitrária
de ρ no intervalo 0 ≤ ρ ≤ a em séries de Fourier-Bessel
X∞ ρ
f (ρ) = Aνn Jν xνn , (6.58)
a
n=1
em que Z
2 a ρ
Aνn = 2 (x ) ρ f (ρ) Jν xνn dρ . (6.59)
a2 Jν+1 νn 0 a
A dedução de relação (6.58) envolve a restrição ν ≥ 0. Na verdade, pode ser provado a validade para todos
ν ≥ −1.
Antes de trabalharmos com as propriedades das funções de Bessel, devemos notar que, na separação de
variáveis da equação de Laplace, a constante de separação k2 em (6.34) foi feita como −k2 , então Z (z) foi
escrita como função de sen kz ou cos kz e a equação para R(ρ) como
d2 R 1 dR 2 ν2
+ − k + 2 R = 0.
dρ2 ρ dρ ρ
Com kρ = x, temos
d2 R 1 dR ν2
+ − 1 + 2 R = 0.
dx2 x dx x
As soluções para esta equação são chamadas de funções de Bessel modificadas. É evidente que estas são
funções de Bessel de um argumento que é imaginário puro. A escolha usual de soluções linearmente inde-
pendentes são indicadas por Iν (x) e Kν (x), que são definidas por
Iν (x) = i−ν Jν (i x) (6.60)
π ν+1 (1)
Kν (x) = i Hν (i x) , (6.61)
2
que são funções reais para x e ν reais. Assumindo ν ≥ 0, suas formas limites, para x pequenos e grandes,
são: Para x ≪ 1
1 x ν
Iν (x) → (6.62)
Γ(ν + 1) 2
e
x
− ln 2 + 0, 5772 · · · , ν=0
Kν (x) → (6.63)
Γ(ν) 2 ν
2 x , ν =
6 0
“Z_2” — 2017/9/5 — 8:19 — page 135 — #155
e para x ≫ 1
1 x 1
Iν (x) → √ e 1+O
2πx x
r . (6.64)
π −x 1
Kν (x) → e 1+O
2x x
Assim temos as soluções da equação de Laplace em coordenadas cilíndricas.
Substituindo na Eq. (6.65) temos a equação para a função de Green radial gm (k, ρ, ρ′ ),
1 d dgm m2 4π
ρ − k + 2 gm = − δ(ρ − ρ′ ) .
2
(6.68)
ρ dρ dρ ρ ρ
Para ρ 6= ρ′ o termos após a igualdade se anula e temos a já conhecida equação das funções de Bessel
modificadas, Im (kρ) e Km (kρ). Supondo que ψ1 (kρ) é uma combinação linear de Im (kρ) e Km (kρ) a
qual satisfaz a condição de contorno para ρ < ρ′ , e que ψ2 (kρ) é uma combinação linear independente da
primeira que satisfaz a condição de contorno para ρ > ρ′ . Então, a simetria da função de Green em ρ e ρ′
requer que
gm (k, ρ, ρ′ ) = ψ1 (kρ< ) ψ2 (kρ> ) . (6.69)
A normalização desse produto é calculada pela descontinuidade da função delta na Eq. (6.68)
dgm dgm 4π
− =− , (6.70)
dρ + dρ − ρ′
“Z_2” — 2017/9/5 — 8:19 — page 136 — #156
que é uma equação do tipo Sturm-Liouville,5 e, é conhecido que o wronskiano de duas soluções linearmente
1
independentes, desta equação, é proporcional a p(x) . Então a possibilidade de satisfazer a Eq. (6.70) para
todos os valores de ρ′ é assumido. De (6.71) vemos que o wronskiano (com a normalização do produto
ψ1 ψ2 ) tem o valor
4π
W [ψ1 (x), ψ2 (x)] = − . (6.73)
x
Se não houver condições de superfície, o requerimento é de que gm (k, ρ, ρ′) seja finito em ρ = 0 e
anula-se para ρ → ∞. Consequentemente ψ1 (kρ) = A Im (kρ) e ψ2 (kρ) = Km (kρ). A constante A pode
ser determinada pela condição do wronskiano (6.73). Usando os limites, ou para x pequeno ou para x
grande, temos
1
W [Im (x), Km (x)] = − , (6.74)
x
1
de modo que A = 4π. A expansão de |~r−~r′ | fica, portanto
∞ Z ∞
1 2 X ′
′
= dk ei m(φ−φ ) cos [k(z − z ′ )] Im (kρ< ) Km (kρ> ) . (6.75)
|~r −~r | π m=−∞ 0
O Wronskiano é o resultado do determinante desta matriz quadrada, formada pelas funções na primeira linha, primeira derivada
das funções na segunda linha, e assim por diante, até a (n − 1)-ésima derivada das funções na n-ésima linha.
Josef Maria Hoëné-Wronski (1776-1859), filósofo e matemático franco-polonês.
5
Jacques Charles François Sturm (1803-1855), matemático franco-suíço.
Joseph Liouville (1809-1882), matemático francês.
“Z_2” — 2017/9/5 — 8:19 — page 137 — #157
Substituindo ρ2 na equação acima por R2 = ρ2 + ρ′ 2 − 2ρρ′ cos (φ − φ′ ), então temos do lado esquerdo da
1 ′
r′ | com z = 0. Sendo assim, temos
expressão o inverso da distância |~r−~
∞
X
K0 (kR) = I0 (kρ< ) K0 (kρ> ) + 2 cos [m(φ − φ′ )] Im (kρ< ) Km (kρ> ) . (6.78)
m=1
Neste último resultado podemos tomar o limite de k → 0 e obter a expansão para a função de Green em
coordenadas polares bidimensional
∞
1 1 X 1 ρ< m
ln = 2 ln +2 cos [m(φ − φ′ )] . (6.79)
R ρ> m=1
m ρ >
Esta representação pode ser verificada por uma construção sistemática da função de Green bidimensional
para a equação de Poisson.
1 ∂2 1 ∂ ∂Φ 1 ∂2Φ
2
(rΦ) + 2 sen θ + =0. (6.80)
r ∂r r sen θ ∂θ ∂θ r 2 sen2 θ ∂φ2
Se propormos um produto para o potencial na forma
U (r)
Φ(r, θ, φ) = P (θ) Q(φ) , (6.81)
r
então, ao substituir na Eq. (6.80), obtemos a equação:
∂2U UQ ∂ ∂P UP ∂2Q
PQ 2 + 2 sen θ + 2 =0. (6.82)
∂r r sen θ ∂θ ∂θ r sen2 θ ∂φ2
Se agora multiplicarmos por r 2 sen2 θ/U P Q, obtém-se:
2 2 1 ∂2U 1 ∂ ∂P 1 ∂2Q
r sen θ + sen θ + =0. (6.83)
U ∂r 2 P r 2 sen θ ∂θ ∂θ Q ∂φ2
“Z_2” — 2017/9/5 — 8:19 — page 138 — #158
A dependência em φ da equação foi isolada no último termo. Consequentemente este termo deve ser igual
a uma constante, que chamaremos de −m2 , logo
1 ∂2Q
= −m2 , (6.84)
Q ∂φ2
cuja soluções são dadas por,
Q = e± i mφ . (6.85)
Para que Q seja unívoca, m deve ser um inteiro (se permitimos 0 ≤ φ < 2π, domínio do ângulo azimutal).
Fazendo considerações similares, podemos encontrar equações separadas para P (θ) e U (r):
1 ∂ ∂P m2
sen θ + l(l + 1) − P = 0 (6.86)
sen θ ∂θ ∂θ sen2 θ
∂2U l(l + 1)
2
− U = 0, (6.87)
∂r r2
em que l(l + 1) é uma outra constante real.
A forma da equação radial sugere uma solução tal que U ∼ r ν . Substituindo na Eq. (6.87) obtemos a
seguinte relação para ν:
ν(ν − 1) − l(l + 1) = 0 , (6.88)
de onde por inspeção direta vemos que ν = l + 1 e ν = −l são as soluções. Assim, a função radial fica:
U = Ar l+1 + Br −l , (6.89)
6
Adrien-Marie Legendre (1752-1833), matemático francês.
7
Ferdinand Georg Frobenius (1849-1917), matemático alemão.
“Z_2” — 2017/9/5 — 8:19 — page 139 — #159
em que os coeficientes Al e Bl podem ser determinados a partir das condições de contorno do problema.
Como exemplo, vamos supor que o potencial seja especificado como V (θ) na superfície de uma esfera
de raio a, e queremos determinar o potencial no interior da esfera. Não havendo cargas na origem, o po-
tencial deve ser finito nesse ponto. Assim, Bl = 0 para todos os l. Em r = a, i.e., na superfície da esfera,
temos
∞
X
V (θ) = Al al Pl (cos θ)
l=0
de modo que os coeficientes Al são
Z π
2l + 1
Al = V (θ) Pl (cos θ) sen θ dθ . (6.101)
2al 0
Se tomamos, como segundo exemplo, uma esfera com dois hemisférios em potenciais iguais mas opostos,
tal que: V (θ) = +V se 0 ≤ θ < π/2; e V (θ) = −V se π/2 < θ ≤ π. Então, o potencial no interior da
esfera será
3r 7 r 3 11 r 5
Φ(r, θ) = V P1 (cos θ) − P3 (cos θ) + P5 (cos θ) − · · · . (6.102)
2a 8 a 16 a
Para encontrar o potencial fora da esfera, basta substituir (r/a)l por (a/r)l+1 .
Uma propriedade muito útil dos polinômios de Legendre é aquela que permite escrever o potencial no
ponto~r provocado por uma carga pontual unitária em~r′ na forma
X rl ∞
1 <
= P (cos γ) ,
l+1 l
(6.103)
|~r −~r′ | r> l=0
em que r< (r> ) é o mínimo (máximo) entre r e r ′ , e γ é o ângulo entre ~r e ~r′ (cos γ = r̂ · r̂ ′ ), como se
mostra a Fig. 6.8.
Figura 6.8 Potencial no ponto ~r provocado por uma carga pontual unitária em ~r′.
Como exemplo de aplicação, consideremos o potencial provocado por uma carga Q distribuída unifor-
memente num anel circular de radio a, como mostra a Fig. 6.9, com o eixo do anel localizado no eixo z
e seu centro em z = b. O problema tem então simetria azimutal. O potencial no ponto P sobre o eixo de
simetria com z = r é Q dividido pela distância AP :
Q
Φ(z = r) = , (6.104)
(r 2 + c2 − 2cr cos α)1/2
“Z_2” — 2017/9/5 — 8:19 — page 141 — #161
Figura 6.9 Anel de carga, com raio a e carga total q, localizado no eixo z, com centro em z = b.
~ | = |P~ − C|)
em que c2 = a2 + b2 e α = tan−1 (a/b). O inverso da distância AP (AP = |AP ~ pode ser
expandido usando a relação (6.103). Assim, para r > c temos,
∞
X cl
Φ(z = r) = Q Pl (cos α) . (6.105)
r l+1
l=0
O potencial em qualquer ponto do espaço se obtém multiplicando cada termo dessa série por Pl (cos θ):
X∞ l
r<
Φ(r, θ) = Q Pl (cos α) Pl (cos θ); (6.107)
r l+1
l=0 >
1−x
Relação entre os Polinômios de Legendre e a Função Hipergeométrica Faça a troca y = 2 , portanto
x = −2y + 1, na equação diferencial de Legendre (6.91). Após uma pequena álgebra
d2 d
y(1 − y) 2
Pl (y) + (1 − 2y) Pl (y) + l(l + 1)Pl (y) = 0 .
dy dy
Uma rápida comparação com a equação
d2 d
z(1 − z) y (z) + [c − (a + b + 1)z] y (z) − ab y (z) = 0 ,
dz 2 dz
em que a, b e c são constantes, mostra que a equação acima é uma equação hipergeométrica com os parâme-
tros a = −l (como deve ser para a hipergeométrica ser um polinômio), b = l + 1 e c = 1. Já que c = 1 ∈ Z,
9
Sobre o eixo z temos θ = 0, cos θ = 1 e Pl (1) = 1 para todo l. A unicidade da expansão em termos dos polinômios de
Legendre garante que (6.107) é a solução em todo o espaço, já que coincide com (6.105) e (6.106) sobre o eixo z.
“Z_2” — 2017/9/5 — 8:19 — page 142 — #162
Função Associada de Legendre e Harmônicos Esféricos O problema geral do potencial pode ter va-
riações azimutais, de modo que m6=0 em (6.85) e (6.90). Para que a equação (6.90) tenha soluções finitas
no intervalo (−1, 1) o parâmetro l deve ser zero ou um inteiro positivo e o parâmetro inteiro m só pode
assumir os valores −l, −(l − 1), · · · , 0, · · · , (l − 1), l. As soluções que têm estas propriedades se chamam
funções associadas de Legendre Plm (x). Elas podem ser obtidas através de uma generalização da fórmula
de Rodrigues:
dm Pl (x)
Plm (x) = (−1)m (1 − x2 )m/2
dxm
(−1)m dl+m
= l (1 − x2 )m/2 l+m (x2 − 1)l . (6.108)
2 l! dx
As funções Pl−m (x) e Plm (x) são proporcionais, uma vez que a equação (6.90) depende somente de m2 , e,
m é um inteiro. Pode-se mostrar que
(l − m)! m
Pl−m (x) = (−1)m P (x) . (6.109)
(l + m)! l
Para m constante, as funções Plm (x) formam um conjunto ortogonal no índice l, no intervalo (−1, 1). As
relações de ortogonalidade são
Z +1
2 (l + m)!
Plm m
′ (x)Pl (x) dx = δl′ l . (6.110)
−1 2l + 1 (l − m)!
A solução da equação de Laplace foi decomposta num produto de fatores para as três variáveis r, θ e φ.
É conveniente combinar os fatores angulares para construir funções ortogonais sobre a esfera. Estas funções
angulares se chamam harmônicos esféricos e são definidas através da forma
s
2l + 1 (l − m)! m
Ylm (θ, φ) = P (cos θ) ei mφ . (6.111)
4π (l + m)! l
A forma explícita de Ylm (θ, φ), para alguns valores de l e para m ≥ 0,11
r
1
l = 0 Y00 =
4π
r
3
l = 1 Y11 = − sen θ ei φ
8π
r
3
Y10 = cos θ
4π
r
1 15
l = 2 Y22 = sen2 θ ei 2φ
4 2π
r
15
Y21 = − sen θ cos θ ei φ
8π
r (6.115)
5 3 2 1
Y20 = cos θ −
4π 2 2
r
1 35
l = 3 Y33 = − sen3 θ ei 3φ
4 4π
r
1 105
Y32 = sen2 θ cos θ ei 2φ
4 2π
r
1 21
Y31 = − sen θ 5 cos2 θ − 1 ei 2φ
4 4π
r
1 7
Y30 = sen θ 5 cos3 θ − 3 cos θ .
2 4π
Nota-se que, para m = 0, r
2l + 1
Yl0 (θ, φ) = Pl (cos θ) . (6.116)
4π
Uma função arbitrária g(θ, φ) pode ser expandida em harmônicos esféricos na forma
∞ X
X l
g(θ, φ) = Alm Ylm (θ, φ) , (6.117)
l=0 m=−l
A solução geral para o problema de condições de contorno em coordenadas esféricas pode ser escrita então
em termos dos harmônicos esféricos e de potências de r, numa generalização de (6.100):
∞ X
X l h i
Φ(r, θ, φ) = Al r l + Bl r −(l+1) Ylm (θ, φ) . (6.119)
l=0 m=−l
Se o potencial está especificado sobre uma superfície esférica, os coeficientes podem ser determinados pela
estimativa de (6.119) sobre a superfície e usando (6.118).
Um resultado de considerável interesse é o chamado teorema da adição para os harmônicos esféricos.
Dois vetores de posição ~r e ~r′, com coordenadas esféricas (r, θ, φ) e (r, θ′, φ′) respetivamente, definem um
ângulo γ entre eles, segundo mostra a Fig. 6.10. O teorema de adição exprime um polinômio de Legendre
11
Como referência destas funções especiais, ver o excelente texto: P. M. Morse and H. Feshbach, Methods of theoretical physics
(1953).
“Z_2” — 2017/9/5 — 8:19 — page 144 — #164
Se o ângulo γ vai para zero, daí resulta uma “regra da soma” para os quadrados dos Ylm ,
l
X 2l + 1
|Ylm (θ, φ)|2 = . (6.122)
4π
m=−l
O teorema da adição pode ser usado para expandir (6.103), i.e., expandir o potencial em ~r de uma carga
unitária em~r′ , na sua forma mais geral. Finalmente, substituindo (6.120) em (6.103) obtemos
X∞ X l l
1 1 r<
= 4π Y ∗ (θ ′, φ′ ) Ylm (θ, φ) .
l+1 lm
(6.123)
|~r −~r′ | 2l + 1 r>
l=0 m=−l
A Eq. (6.123) fornece o potencial numa forma completamente fatorada nas coordenadas~r e~r′ . Isto é muito
útil em qualquer integração sobre densidades de carga, em que uma variável é a variável de integração e a
outra é a coordenada do ponto de observação.
Da definição das funções associadas de Legendre,
dm Pl (x)
Plm (x) = (1 − x2 )m/2 , −l ≤ m ≤ l ,
dxm
podemos obter uma relação entre as funções associadas de Legendre com as funções hipergeométricas.
Usando o fato de que
dm dm 1−x
Pl (x) = 2 F1 −l, l + 1; 1;
dxm dxm 2
“Z_2” — 2017/9/5 — 8:19 — page 145 — #165
e sabendo que12
dm Γ(m + a) Γ(m + b) Γ(c)
m 2 F1 (a, b; c; z) = 2 F1 (a + m, b + m; c + m; z) ,
dz Γ(a) Γ(b) Γ(m + c)
temos
dm Γ(−l + m) (l + m)! 1 (−1)m 1−x
Pl (x) = 2 F1 −l + m, l + 1 + m; 1 + m; .
dxm Γ(−l) l! m! 2m 2
X∞ X l l
1 1 r<
G(~r,~r′ ) = = 4π Y ∗ (θ ′, φ′ ) Ylm (θ, φ) .
l+1 lm
(6.124)
|~r −~r′ | 2l + 1 r>
l=0 m=−l
Procuremos agora uma expansão similar para a função de Green ao problema exterior, com uma fronteira
em r = a. O resultado se obtém a partir da função de Green (6.17). Usando a expansão (6.123) para os dois
termos da Eq.(6.17) obtemos,
∞ X l
" l+1 #
X 1 r<l 1 a2
′ ∗
G(~r,~r ) = 4π l+1
− Ylm (θ ′ , φ′ ) Ylm (θ, φ) . (6.125)
2l + 1 r> a rr ′
l=0 m=−l
Figura 6.11 Domínio V entre as esferas de raios a e b, onde a função de Green é obtida.
álgebra, temos
l
∞ X
! !
X ∗ (θ ′ , φ′ ) Y (θ, φ)
Ylm lm a2l+1 1 l
r>
l
G(~r,~r′ ) = 4π a 2l+1 r< − l+1 l+1
− . (6.127)
r< r> b2l+1
l=0 m=−l (2l + 1) 1 −
b
Esta é a função de Green para o volume V entre duas superfícies esféricas concêntricas de raios a e b, aqui
temos a < b, e condições de contorno de Dirichlet.
Para os casos especiais em que a → 0 e b → ∞, temos
" #
1 r> r< l
X∞ X l l
′ 1 r< ∗
a → 0 ⇒ G(~r,~r ) = 4π l+1
− Ylm (θ ′ , φ′ ) Ylm (θ, φ)
2l + 1 r> b b2
l=0 m=−l
∞ X l
" 2 l+1 #
X 1 r l
1 a
< ∗
b → ∞ ⇒ G(~r,~r′ ) = 4π l+1
− Ylm (θ ′ , φ′ ) Ylm (θ, φ) ,
2l + 1 r> a r> r<
l=0 m=−l
Solução Geral com a Função de Green Esférica A solução geral da equação de Poisson com valores do
potencial especificados sobre a superfície de fronteira (problema de Dirichlet) é dada por
Z I
′ ′ 3 ′ 1 ∂G
Φ(~r) = ρ(~r ) G(~r,~r ) d r − Φ(~r′ ) ′ ds . (6.128)
V 4π S ∂n
Para ilustrar o problema consideremos o potencial dentro de uma esfera de radio b. Fazendo a = 0 em
(6.127), a derivada normal, desenvolvida em r ′ = b, ficará
∂G ∂G 4π X r l ∗ ′ ′
′
= =− Ylm (θ , φ ) Ylm (θ, φ) . (6.129)
∂n ∂r ′ r ′ =b b2 b
l,m
Então, a solução da equação de Laplace no interior da esfera de r = b com Φ = V (θ, φ) sobre a superfície
é, segundo (6.128), dada por
X I
r l
′ ′ ∗ ′ ′ ′
Φ(~r) = V (θ , φ ) Ylm (θ , φ ) dΩ Ylm (θ, φ) . (6.130)
S b
l,m
Consideremos agora a solução do problema com uma distribuição de cargas dentro da esfera, de forma que
o primeiro termo da Eq. (6.128) não será zero. Para tal, vamos considerar problemas nos quais o potencial
sobre a superfície de fronteira se anula. Por superposição linear de uma solução da equação de Laplace, pode
“Z_2” — 2017/9/5 — 8:19 — page 147 — #167
Figura 6.12 Anel de raio a e carga Q no centro de uma esfera de raio b, aterrada com V = 0.
ser obtida a solução geral do problema. Consideremos uma esfera oca, ligada à terra, de radio b, com um
anel concêntrico carregado de radio a e carga total Q. O anel está localizado no plano xy, segundo mostra
a Fig. 6.12. A densidade de carga do anel pode ser escrita com a ajuda da função delta em coordenadas
esféricas na forma:
Q
ρ(~r′ ) = δ(r ′ − a) δ(cosθ ′ ) . (6.131)
2πa2
Na integral de volume sobre a função de Green somente os termos em (6.127) com m = 0 sobrevivem
devido à simetria azimutal. Então, usando (6.116) e lembrando que a → 0 em (6.127), encontraremos
Z
Φ(~r) = ρ(~r′ ) G(~r,~r′ ) d3 r ′
∞
!
X 1 r l
l >
= Q Pl (0) r< l+1
− 2l+1 Pl (cos θ) , (6.132)
r> b
l=0
em que agora r< (r> ) é o menor (maior) entre r e a. Usando o fato de que
(−1)n (2n − 1)!!
P2n+1 = 0 e P2n (0) = ,
2n n!
em que usamos a notação (2n + 1)!! ≡ (2n + 1)(2n − 1)(2n − 3) · · · (5)(3)(1), a Eq. (6.132) pode ser
escrita na forma
X∞ 2n
(−1)n (2n − 1)!! 2n 1 r>
Φ(~r) = Q r< 2n+1 − b4n+1 P2n (cos θ) . (6.133)
n=0
2n n! r>
No limite b → ∞, verifica-se que (6.133) se reduz à (6.107) para uma anel carregado no espaço livre
(nota-se que ali devemos fazer α = π/2). Na região r > a temos
X∞
(−1)n (2n − 1)!! 2n 1 r 2n
Φ(~r) = Q n n!
, a 2n+1
− 4n+1
P2n (cos θ) . (6.134)
n=0
2 r b
A densidade superficial de carga da esfera ligada à terra se obtém derivando (aqui n̂ ≡ −r̂):
1 ∂Φ
σ=
4π ∂r r=b
X∞
(−1)n (2n − 1)! 2n 4n + 1
= −Q a P2n (cos θ) . (6.135)
n=0
2n n! b2(n+1)
“Z_2” — 2017/9/5 — 8:19 — page 148 — #168
Para obter a carga total induzida sobre a esfera devemos integrar a densidade σ sobre a superfície,
I
Qind = σ dΩ . (6.136)
S
Problemas
6.1 Dado duas cargas pontuais qi colocadas nas posições (ri , θi , φi ), encontre o potencial Φ(r, θ, φ) na
posição (r, θ, φ). Em seguida, é reivindicado que o potencial proveniente das cargas qi′ invertidas em
relação à uma esfera com um raio a e estando nas posições (a2 /ri , θi , φi ) seja dado por
6.2 Seja uma carga pontual q que se encontra a uma distância a em frente a uma parede condutora infinita-
mente estendida. Que densidade de carga será induzida na parede? Qual é a grandeza da carga total do
plano? Tratar o problema através da introdução de uma carga imagem. Ver Fig. 8.5. Sugestão: Consulte
o livro do Prof. Greiner [34].
6.3 Seja dois hemisférios condutores com potenciais distintos. Determine o potencial entre os dois he-
misférios separados por um disco isolante perpendicular ao eixo z e claro os hemisférios possuindo
potenciais de ±V . Sugestão: Consulte o livro do Prof. Greiner [34].
6.4 Calcular a função de Green para a equação de Poisson nas dimensões d = 1, 2, 3. Use as coordenadas
esféricas. Sugestão: Consulte o livro do Prof. Greiner [34].
6.5 Prove que a função de Green do problema de Dirichlet é simétrica, i.e., GD (~x,~x′ ) = GD (~x′ ,~x). Suges-
tão: Consulte o livro do Prof. Greiner [34].
“Z_2” — 2017/9/5 — 8:19 — page 149 — #169
para o problema do potencial bidimensional com o potencial especificado sobre a superfície de um ci-
lindro de raio b. Avalie os coeficientes formalmente, substitua-os em série, e some para obter o potencial
no interior do cilindro sob a forma de integral de Poisson:
Z 2π
1 b2 − ρ2
Φ(ρ, φ) = Φ(b, φ′ ) 2 dφ′ .
2π 0 b + ρ2 − 2bρ cos (φ′ − φ)
Qual modificação é necessária para que o potencial desejado esteja na região do espaço delimitado pelo
cilindro e o infinito?
6.7 Um cilindro circular reto e oco de raio b tem o seu eixo coincidente com o eixo z, e as suas extremidades
em z = 0 e z = L. O potencial sobre as faces das extremidades é zero, enquanto o potencial sobre a
superfície cilíndrica é dada como V (φ, z). Usando a separação adequada das variáveis em coordenadas
cilíndricas, encontre uma solução em série para o potencial em qualquer lugar no interior do cilindro.
6.8 Para o cilindro do Problema anterior, a superfície cilíndrica é constituída por duas metades iguais do
cilindro, um no potencial V e o outro no potencial −V , de modo que
V para −π/2 < φ < π/2
V (φ, z) =
−V para π/2 < φ < 3π/2 .
a) Encontre o potencial dentro do cilindro.
b) Assumindo L ≫ b, encontre o potencial em z = L/2 como função de ρ e φ. Discuta o resultado.
6.9 Uma folha plana, fina e infinita, de material condutor tem um furo circular de raio a cortado sobre ela.
Um disco plano, fino, do mesmo material e um raio ligeiramente menor encontra-se na folha plana,
preenchendo o furo acima citado, mas separado da folha por um anel isolante muito estreito. O disco é
mantido a um potencial fixo V , enquanto a folha infinita é mantida a um potencial nulo.
a) Usando as coordenadas cilíndricas apropriadas, encontre uma expressão integral envolvendo as fun-
ções de Bessel para o potencial em qualquer ponto acima do plano.
b) Mostra que o potencial a uma distância perpendicular z acima do centro do disco é
z
Φ0 (z) = V 1 − √ .
a2 + z 2
em que k = 2a/(z 2 + 4a2 )1/2 , sendo K (k) a integral elíptica completa de primeiro tipo.
6.10 Escreva o potencial vetor, dado em (5.107), usando expansão harmônica esférica para |~r − ~r′ |−1 .
Encontre as componentes do campo Br e Bθ . Sugestão: Consulte o livro do Prof. Jackson [42].
6.11 Seja dois hemisférios condutores com potenciais distintos. Os dois hemisférios estão separados por
um anel isolante perpendicular ao eixo z e claro os hemisférios possuindo potenciais de ±V . Calcule
o potencial em todos os pontos do espaço. Use as expressões de Pn (cos θ) e calcule os três primeiros
termos da expressão.
“Z_2” — 2017/9/5 — 8:19 — page 150 — #170
6.12 Duas esferas concêntricas têm raios a, b (b > a), e cada uma é dividida em dois hemisférios pelo
mesmo plano horizontal. O hemisfério superior da esfera interna e o hemisfério inferior da esfera ex-
terna são mantidos no potencial V . Os outros hemisférios estão no potencial nulo. Determine o potencial
na região a ≤ r ≤ b como uma série em polinômios de Legendre. Inclua termos, pelo menos, até l = 4.
Verifique a sua solução em relação aos resultados conhecidos nos casos limites b → ∞ e a → 0.
6.13 Resolva o problema anterior, usando a função de Green apropriada obtida no texto. Verifique que a
resposta obtida desse modo concorda com a solução direta vinda da equação diferencial.
6.14 Uma esfera condutora de raio a, possuindo carga total Q, está situada num campo elétrico inicialmente
uniforme, E0 . Determine, o potencial em todos os pontos exteriores da esfera.
6.15 Uma esfera de raio R está carregada com uma densidade espacial ρ = ρ0 cos θ, sendo θ o ângulo polar
do sistema de coordenadas esféricas. Aplicando o desenvolvimento da função |~r − ~r′ |−1 em funções
esféricas, calcular o potencial Φ dentro e fora da esfera.
6.16 Uma linha carregada de comprimento 2d com uma carga total de Q tem uma densidade linear de
carga variando conforme (d2 − z 2 ), em que z representa a distância do ponto médio. Uma casca esfera
aterrada de raio interno b > d é centrado no ponto médio da linha carregada.
a) Encontre o potencial em todos os lugares dentro da esférica como uma expansão em polinômios de
Legendre.
b) Calcular a densidade superficial de carga induzida na casca esférica.
c) Discuta as suas respostas, relativas aos itens anteriores, no limite d ≪ b.
Leitura Recomendada
Recomenda-se ao leitor os seguintes livros, muito úteis para a compreensão e desenvolvimento deste capí-
tulo,
– J. D. Jackson [42];
– J. Frenkel [30];
– M. A. Heald and J. B. Marion [36];
– W. Greiner [34];
– G. Arfken and H. J. Weber [4];
– P. M. Morse and H. Feshbach [60].
Nestes livros, o leitor encontrará excelentes discussões e deduções detalhadas dos métodos para a resolução
de problemas de contorno, em especial no livro do Profs. Arfken e Weber e no monumental texto dos Profs.
Morse e Feshbach. Já os textos do prof. Marion e do prof. Jackson trazem uma excelente sequência de
trabalhos em eletromagnetismo e suas aplicações.
“Z_2” — 2017/9/5 — 8:19 — page 151 — #171
Capítulo 7
Multipolos Elétricos, Magnéticos e Materiais
Neste capítulo estudaremos a expansão dos potenciais escalar e vetorial em momentos multipolares, tendo
em vista a sua importância para os fenômenos de radiação. Além disso, faremos um estudo em meios
materiais, como os efeitos de meios dielétricos e meios magnéticos nos campos elétrico e magnético.
Vemos então que o potencial fora da distribuição de carga pode ser escrito como uma expansão em harmô-
nicos esféricos da forma
X∞ X l
4π Ylm (θ, φ)
Φ(~r) = qlm , (7.3)
2l + 1 r l+1
l=0 m=−l
ou Z
∗ l
qlm = Ylm (θ ′ , φ′ ) r ′ ρ(~r′ ) d3 r ′ . (7.5)
Para uma densidade de carga real os momentos com m < 0 podem ser obtidos a partir dos momentos com
m ≥ 0 na forma:
ql,−m = (−1)m qlm
∗
, (7.6)
pois
∗
Yl,m (θ ′ , φ′ ) = (−1)m Yl,−m (θ ′ , φ′ ) .
1
A distribuição ρ(~r′ ) = 0 fora de alguma esfera centrada na distribuição de carga
151
“Z_2” — 2017/9/5 — 8:19 — page 152 — #172
Z r Z
′ ∗ ′ ′ 3
q11 = ′
ρ(~r ) r Y11 (θ , φ ) d3 r ′
=− ρ(~r′ ) r ′ sen θ ′ cos φ′ − i sen θ ′ sen φ′ d3 r ′
8π
r Z r
3 3
=− ρ(~r′ ) x′ − i y ′ d3 r ′ = − (Px − i Py )
8π 8π
Z r Z
′ ∗ ′ ′ 3 ′ 3
q10 ′
= ρ(~r ) r Y10 (θ , φ ) d r = ρ(~r′ ) r ′ cos θ ′ d3 r ′
4π
r Z r
3 ′ ′ 3 ′ 3
= ρ(~r ) z d r = Pz
4π 4π
Z r Z
′2 ∗ ′ ′ 1 15 2 3 ′
q22 = ρ(~r′ ) r Y22 (θ , φ ) d3 r ′
= ρ(~r′ ) r ′ sen θ ′ cos φ′ − i sen φ′ d r
4 2π (7.7)
r Z
1 15 2
= ρ(~r′ ) x′ − i y ′ d3 r ′
4 2π
2 1 h ′ 2 2
2 2
i
mas x′ − i y ′ = 3x − r ′ − 6 i x′ y ′ 3y ′ − r ′
r 3
1 15
= (Q11 − 2 i Q12 − Q22 )
Z12 2π
2
q21 = ρ(~r′ ) r ′ Y21 (θ , φ ) d3 r ′
∗ ′ ′
analogamente
r Z r
15 ′ ′ ′ ′
3 ′ 1 15
=− ρ(~r ) z x − i y d r = − (Q13 − i Q23 )
8π 6 2π
Z r Z
′2 ∗ ′ ′ 3 ′ 1 5 2 2
q20 ′
= ρ(~r ) r Y20 (θ , φ ) d r = ρ(~r′ ) 3z ′ − r ′ d3 r ′
4 π
r
1 5
= Q33 .
4 π
Naturalmente, as equações, dadas em (7.7), estão escritas em função da carga elétrica total
Z
q = ρ(~r′ ) d3 r ′ , (7.8)
Vemos então que o l-ésimo momento multipolar esférico é uma combinação linear das componentes do
mesmo multipolo expressos em coordenadas cartesianas. A expansão do potencial Φ em coordenadas car-
“Z_2” — 2017/9/5 — 8:19 — page 153 — #173
tesianas será:
q ~P ·~r 1 X ri rj
Φ(~r) = + 3 + Qij 5 + · · · (7.11)
r r 2 r
ij
1
r′ | .
que poderá ser obtida via a expansão da série de Taylor de |~r−~
As componentes do campo elétrico para um dado multipolo podem ser expressas mais facilmente em
termos das coordenadas esféricas. Como ~E = −∇Φ, ~ o gradiente negativo de um termo em (7.3) com l e m
definidos tem as componentes esféricas dadas por:
Pela operação direta do gradiente sobre o termo de dipolo em (7.11), obtemos o campo elétrico no ponto~r
produzido por um dipolo ~P no ponto~r0 :
~ ~
~E(~r) = 3n̂(P · n̂) − P , (7.14)
|~r −~r0 |3
Estes momentos são independentes da localização da origem, dependendo somente da posição relativa das
duas cargas, mas todos os momentos de ordem superior dependem da origem. Esses exemplos simples
são casos especiais de um teorema geral. Os valores de qlm para o menor momento multipolar não nulo
de qualquer distribuição de carga são independentes da escolha da origem de coordenadas, mas todos os
momentos multipolares de ordem superior em geral dependem da localização da origem.
Se o potencial Φ varia lentamente na região em que a distribuição de cargas ρ(~r) é não nula, então podemos
fazer a expensão em série de Taylor com uma origem na própria distribuição:
XX ∂2Φ
~ (0) + 1
Φ(~r) = Φ(0) +~r · ∇Φ ri rj (0) + · · · . (7.18)
2 ∂ri ∂rj
i j
Utilizando a definição de campo elétrico ~E = −∇Φ,~ os dois últimos termos de (7.18) podem ser reescritos
na forma:
1 XX ∂Ej
Φ(~r) = Φ(0) −~r · ~E(0) − ri rj (0) + · · · . (7.19)
2 ∂ri
i j
Devido ao fato de que para o campo externo temos ∇ ~ · ~E = 0 (sua fonte está fora da região da expansão),
1 2 ~ ~
podemos subtrair a quantidade 6 r ∇ · E do último termo para obter, finalmente, a expansão:
1 XX ∂Ej
Φ(~r) = Φ(0) −~r · ~E(0) − 3 ri rj − r 2 δij (0) + · · · . (7.20)
6 ∂ri
i j
Substituindo (7.20) em (7.17), mas lembrando das definições da carga total q (7.8), do momento dipolo ~P
(7.9) e do momento quadrupolo Qij (7.10), a energia potencial da distribuição de carga assume a forma:
1 XX ∂Ej
W = q Φ(0) − ~P · ~E(0) − Qij (0) + · · · . (7.21)
6 ∂ri
i j
Esta expressão mostra a forma característica na qual cada um dos multipolos interage com um campo
externo: a carga com o potencial, o dipolo com o campo elétrico, o quadrupolo com o gradiente do campo,
e assim por diante.
Na física nuclear, a interação de quadrupolo é de especial interesse. Os núcleos atômicos podem ter
momentos de quadrupolo elétrico e seus módulos e sinais refletem a natureza das forças entre neutrons e
prótons assim como as formas dos próprios núcleos. A cada estado nuclear está associada uma densidade
de carga ρ(~r) que é cilindricamente simétrica em torno do eixo z. Portanto, o tensor de quadrupolo de um
estado nuclear é determinado pelo momento de quadrupolo Q0 definido por:
Z
Q0 = Q33 = 3 z 2 − r 2 ρ(~r) d3 r , (7.22)
isto nos permite definir o momento quadrupolo elétrico de uma distribuição com simetria azimutal como:
Z
1 1
Q = Q33 = 3 z 2 − r 2 ρ(~r) d3 r , (7.23)
e e
“Z_2” — 2017/9/5 — 8:19 — page 155 — #175
em que e denota o módulo da carga do elétron. O fator 1e é introduzido na Eq. (7.23) para que o momento
de quadrupolo elétrico Q tenha dimensão de área.
A distribuição da carga nuclear pode ser aproximada por uma densidade de carga constante através
do volume esferoidal do núcleo,2 com semieixo maior a e semieixo menor b. Para calcular o momento
quadrupolo de um tal núcleo com carga total Ze, consideremos a densidade constante dada por,
Ze
ρ(~r) = .
(4π/3) ab2
Devido à simetria do problema, é mais conveniente o uso de coordenadas cilíndricas para o cálculo da Eq.
(7.23). Assim,
Z a Z b √a2 −z 2 Z 2π
3Z a
2 2
Q= dz 2z − l l dl dφ
4πab2 −a 0 0
2
= Z a2 − b2 , (7.24)
5
em que integramos a equação acima usando l, z e φ como coordenadas cilíndricas.
Podemos agora definir um parâmetro de deformação nuclear η,
∆R
, η=
R
em que R é o raio de uma esfera de volume igual ao do elipsóide e ∆R = a − R. Em termos do parâmetro
de deformação nuclear, os semieixos do elipsóide podem ser escritos como
a = R(1 + η)
R
b= √ .
1+η
Usando estas relações na Eq. (7.24) e considerando apenas termos de primeira ordem em η, temos:
6
Q= ZR2 η . (7.25)
5
Com efeito, se Q > 0, então n > 0 e, pela relação η = ∆R R , a > R. Neste caso, o elipsóide tem forma
prolato, i.e., o núcleo é deformado ao longo do eixo z, tipo charuto. Se Q < 0, analogamente, encontramos
a < R, e o elipsóide tem a forma oblato, i.e., o núcleo é achatado em relação ao eixo z, tipo disco. Em
geral, os núcleos estão sujeitos a campos elétricos que têm gradientes em suas vizinhanças. Por isso, de
acordo com (7.21), a energia dos núcleos terá uma contribuição da interação de quadrupolo. A detecção
destas pequenas energias, medidas com técnicas de radiofrequência, leva à determinação do momento de
quadrupolo dos núcleos.
A energia de interação entre dois dipolos ~P1 e ~P2 pode ser obtida a partir de (7.21) usando o campo de
dipolo (7.14). Assim, a energia potencial da interação mútua é
~P1 · ~P2 − 3(n̂ · ~P1 )(n̂ · ~P2 )
W12 = , (7.26)
|~r1 −~r2 |3
em que n̂ é o vetor unitário na direção~r1 −~r2 , e onde assumimos que~r1 6= ~r2 . A interação dipolo-dipolo
é atrativa ou repulsiva, dependendo da orientação relativa dos dipolos. Se os momentos estão aproximada-
mente paralelos, a atração (repulsão) ocorre quando os momentos estão orientados mais ou mesmos para-
lelamente (perpendicularmente) à linha que une seus centros. Se os momentos dipolos foram antiparalelos
então acontece a situação contrária. Os valores extremos da energia potencial são iguais em módulo para
ambas situações.
2
Por exemplo, o núcleo será um elipsóide de resolução, com o eixo de simetria coincidindo com o eixo dos z.
“Z_2” — 2017/9/5 — 8:19 — page 156 — #176
O fato de ~J ser uma distribuição de corrente localizada, e de divergência nula, permite uma simplificação da
expansão (7.28). Sejam f (~r′ ) e g(~r′ ) duas funções bem comportadas de~r′ , as quais serão escolhidas depois.
Então, se ~J(~r′ ) está localizada e têm divergência zero, temos
~ ′ · (f g~J) = f ~J · ∇
∇ ~ ′ g + g ~J · ∇
~ ′f . (7.29)
Integrando em todo o espaço, e levando a integral de ∇ ~ · (f g~J) a uma integral de fluxo de f g~J sobre uma
~
superfície no infinito, que é nula pois J é localizada, obtemos o resultado
Z
f~J · ∇
~ ′ g + g~J · ∇
~ ′ f d3 r ′ = 0 . (7.30)
O primeiro termo em (7.28), que corresponde ao termo do monopolo da eletrostática, é nulo. Escolhendo
agora f = ri′ e g = rj′ obteremos em (7.30)
Z
ri′ Jj + rj′ Ji d3 r ′ = 0 . (7.32)
~:
e a sua integral como o momento magnético m
Z
1
~ =
m ~r′ × ~J(~r′ ) d3 r ′ . (7.35)
2c
~ ×~r
~ (~r) = m
A . (7.36)
r3
~ para uma distribuição localizada e estacionária de corrente.
Este é o menor termo não nulo na expansão de A
~
O campo magnético B fora da distribuição pode ser calculado diretamente pela avaliação do rotacional de
(7.36):
~ ~ )−m
3n̂(n̂ · m ~
B(~r) = 3
. (7.37)
r
em que n̂ é o vetor unitário na direção de~r. Longe de qualquer distribuição localizada de correntes, o campo
magnético é o de um dipolo magnético de momento de dipolo dado por (7.35).
~ ~ M (~r) .
B(~r) = −∇Φ (7.38)
∇2 Φ M = 0
em qualquer lugar que ~J(~r) = 0. A expressão na Eq. (7.38) pode ser integrada para produzir uma expressão
para este potencial escalar como
Z ~r
ΦM (~r) = − ~
B(~r) · d~r , (7.39)
Pref
em que Pref é um ponto de referência fixo. É importante que o caminho de integração tomado na equação
anterior não passe por qualquer região em que ~J(~r) 6= 0.
Este potencial escalar é então idealmente adequado para obter a expansão multipolar de uma distribuição
de corrente localizada, com o ponto de referência Pref escolhido no infinito e a origem O escolhida perto
da distribuição de corrente localizada. Como antes, ~J se anula fora de uma esfera de raio rmin centrada em
O. Usando a Eq. (5.77), Z ′
~ (~r) = 1 ~J(~r′ ) × ~r −~r d3 r ′ ,
B
c |~r −~r′ |3
o potencial escalar magnético será dado por
Z Z ~r ~J(~r′ ) × (~r −~r′ )
1 3 ′
ΦM (~r) = − d r d~r · .
c V′ ∞ |~r −~r′ |3
“Z_2” — 2017/9/5 — 8:19 — page 158 — #178
Devido r̂ · ~J × (~r −~r′ ) = r̂ · ~r′ × ~J , o resultado anterior fica
Z Z ~r
1 dr
ΦM (~r) = − d3 r ′ r̂ · ~r′ × ~J(~r′ )
c V ′ ∞ ~
|r −~r′ |3
Z~r Z
1 dr 1
=− d3 r ′ ~r′ × ~J(~r′ ) · ∇~′ ,
c ∞ r V′ |~r −~r′ |
na qual pode ser integrada por partes sobre as variáveis usando linhas, (′ ), para produzir
Z Z ~r
1 ~ ′ · ~r′ × ~J(~r′ ) dr
ΦM (~r) = d3 r ′ ∇ ′
. (7.40)
c V′ ∞ r|~r −~r |
1
Podemos novamente utilizar a expansão em harmônicos esféricos, Eq. (6.123), para |~r−~ r′ | . Pelo fato de
′
estarmos interessados no potencial em que r< = r e r> = r,
∞ l Z Z ~r
1 X X 4π ′l ∗ ′ ′ ~′ ′ ~
ΦM (~r) = Ylm (θ, φ) ′
r Ylm (θ , φ ) ∇ · ~r × J(~r ) r −(l+2) dr d3 r ′ ,
c 2l + 1 V′ ∞
l=0 m=−l
R −(l+1)
a integral sobre r avaliada termo a termo terá como resultado r −(l+2) dr = − r l+1 . Portanto, a expansão
multipolar do potencial escalar magnético em harmônicos esféricos é
∞ X
X l
4π Ylm (θ, φ)
ΦM (~r) = Mlm , (7.41)
2l + 1 r l+1
l=0 m=−l
em que as quantidades Mlm são os momentos multipolares magnéticos para o campo, dado por
Z
1 l ∗ ~ ′ · ~r′ × ~J(~r′ ) d3 r ′ .
Mlm = − r ′ Ylm (θ ′ , φ′ ) ∇ (7.42)
(l + 1)c V ′
Observe que o termo l = 0 resulta em uma contribuição não física de monopolo magnético.
Existem várias formas equivalentes para os momentos
R multipolares magnéticos
R esféricos definidos por
(7.42). Por exemplo, devido ao fato de Alm = − f (r ′ ) ∇~ · ~S(r ′ ) dV ′ = ∇f ~ (r ′) · ~S(r ′ ) dV ′ , 3 temos
Z
1 l ~′ ∗
Mlm = r′ ∇ Ylm (θ ′ , φ′ ) · ~r′ × ~J(~r′ ) d3 r ′ (7.43)
(l + 1)c V ′
ou ainda, após pequena álgebra,
Z
1 l
Mlm = − r ′ ~J(~r′ ) · ~r′ × ∇
~ ′ Y ∗ (θ ′ , φ′ ) d3 r ′ .
lm (7.44)
(l + 1)c V′
Um segundo exemplo para obtermos formas alternativas de Mlm será relacionando o potencial vetor
com as correntes,
~ ×B
∇ ~ =∇ ~ × (∇~ × A)~ = 4π ~J .
c
Assim, temos 4
~ ×∇
∇ ~ × Alm Φlm = 4π Jlm Φlm
c
3
J. P. Wikswo and K. R. Swinney, Journal of Applied Physics, 57, 4301-4308 (1985).
4
Aqui estamos usando a notação de vetores esféricos, em que
~ lm
Φlm ≡ r̂ × Ψlm = ~r × ∇Y e ~ lm
Ψlm = r ∇Y
que são vetores esféricos harmônicos, ver P. M. Morse and H. Feshbach, Methods of theoretical physics (1953), Volumes I and
II.
“Z_2” — 2017/9/5 — 8:19 — page 159 — #179
l
r<
4π
Alm = l+1
(r ′ )2 .
(2l + 1)c r>
Para um ponto do campo fora da fonte, i.e., r ≫ r ′ , a solução da equação diferencial acima será
Z
4π αlm
Alm = (r ′ )l+2 Jlm (r ′ ) dr ′ = .
(2l + 1)cr l+1 r l+1
~
B=∇ ~ ×A~ = αlm ∇ ~ × Φlm
r l+1
r̂ 1
= αlm − l+2 l(l + 1) Ylm + l+2 Ψlm
r r
= lαlm ∇~ Ylm .
r l+1
em que a última relação apresenta uma forma alternativa para as Eqs. (7.42)-(7.44).
Como ilustração, vamos considerar uma espiral circular de raio R, no plano xy, centrada na origem,
com uma corrente I. A densidade da corrente, ~J, será
1
d3 r ≡ r 2 sen θ dr dθ dφ e δ(cos θ) = δ(θ − π2 ) ,
sen θ
“Z_2” — 2017/9/5 — 8:19 — page 160 — #180
encontramos
Z
1 δ(r − R) ~ ∗ r 2 sen θ dr dθ dφ
Mlm =− rl I δ(cos θ)φ̂ · r̂ × r ∇Y lm
(l + 1)c R
Z Z
I l+2 δ(r − R) ∂ ∗ 1 ∂ ∗
=− r dr φ̂ · φ̂ Ylm − θ̂ Y δ(cos θ) sen θ dθ dφ
(l + 1)c R ∂θ sen θ ∂φ lm
Z Z
I l+2 δ(r − R) ∂ ∗
=− r dr Y sen θ δ(cos θ) dθ dφ
(l + 1)c R ∂θ lm
Z Z
I δ(r − R) ∂ ∗
=− r l+2 dr Y δ(θ − π2 ) dθ dφ
(l + 1)c R ∂θ lm
Z Z 2π
I l+2 δ(r − R) ∂ ∗
=− r dr Y | π dφ .
(l + 1)c R 0 ∂θ lm θ= 2
∗ (θ, φ) em φ é e− i mφ e a integral
A dependência de Ylm
Z 2π
e− i mφ dφ = 0
0
~ ~ )−m
~ (~r) = 3n̂(n̂ · m ~
B(~r) = −∇Φ 3
. (7.50)
r
em que n̂ é o vetor unitário na direção de~r. Sendo este resultado o mesmo encontrado anteriormente, como
era esperado.
Consideremos um segundo exemplo como um caminho de corrente constituído por dois anéis em forma
de D, cada um de raio a, como mostrado na Fig. 7.1. É intuitivamente óbvio que não haverá momento
“Z_2” — 2017/9/5 — 8:19 — page 161 — #181
dipolar líquido, i.e., o momento dipolar dos dois D se cancelam. Então o campo de indução magnética
distante será no máximo um campo quadrupolar (l = 2). Nesta configuração, a distribuição de corrente é:
I
δ(cos θ)δ(r − a)φ̂ se 0 < φ < π
a
~J = − aI δ(cos θ)δ(r − a)φ̂ se π < φ < 2π (7.51)
2Iδ(z)δy x̂ no eixo x, |x| < a .
Para encontrar Mlm , ou melhor M2m pois l = 2(quadrupolo), usaremos o procedimento análogo ao reali-
~ ∗ = 0, o terceira componente da densidade de corrente não
zado anteriormente. Desde que r̂ · r̂ × r ∇Y lm
∗ em
irá contribuir para M2m . Portanto, consideremos as outras contribuições. Como a dependência de Y2m
φ é e− i mφ , e levando em consideração as duas primeiras contribuições da corrente,
Z π Z 2π
− i mφ 4i
e dφ − e− i mφ dφ = − .
0 π m
Faremos precisamente os mesmos passos que fizemos para chegar em (7.48). Concluímos que m deverá ser
ímpar para não anularmos M2m . Assim, para l = 2 e m ímpar, temos
M2,±2 = 0 M2,0 = 0
r
4 i a3 I 15 (7.52)
M2,±1 =− .
3c 8π
O principal campo de indução magnética, a grandes distâncias, poderá ser encontrado a partir do potencial
∞ X
X l
4π Ylm
ΦM = Mlm l+1
2l + 1 r
l=0 m=−l
4π
= (M2,1 Y2,1 + M2,−1 Y2,−1 ) (7.53)
5r 3
⇒
4a3 I
ΦM = − sen θ cos θ sen φ .
cr 3
“Z_2” — 2017/9/5 — 8:19 — page 162 — #182
É possível descrever este campo com um tensor quadrupolar simétrico Qij , a partir das relações (ver o
desenvolvimento, para obter o momento quadrupolo elétrico, das Eqs. (7.7)),
r
1 15
M22 = (Qxx − 2 i Qxy − Qyy ) = 0
12 2π
r r
4 i a3 I 15 1 15
M21 = − =− (Qxz − i Qyz ) (7.54)
3c 8π 3 8π
r
1 5
M20 = Qzz = 0 .
2 4π
Então, para este campo, o único componente de quadrupolo não nulo será
4a3 I
Qyz = − . (7.55)
c
Finalmente, sendo o potencial escalar magnético dado por
∞ X
X l
4π Ylm (θ, φ)
ΦM (~r) = Mlm , (7.56)
2l + 1 r l+1
l=0 m=−l
as componentes do campo de indução magnético para um dado multipolo magnético são expressas em
termos das coordenadas esféricas através da relação ~ ~ M , que tem as componentes esféricas dadas
B = −∇Φ
por:
4π(l + 1) Ylm (θ, φ)
Br = Mlm
2l + 1 r l+2
4π 1 ∂
Bθ = − Mlm l+2 Ylm (θ, φ) (7.57)
2l + 1 r ∂θ
4π 1 im
Bφ = − Mlm l+2 Ylm (θ, φ) .
2l + 1 r sen θ
em que l = 1 temos um momento dipolo, l = 2 um momento quadrupolo, l = 3 um momento octupolo e
assim por diante.
1 ′ 1
x′i Jk = (xi Jk + x′k Ji ) + (x′i Jk − x′k Ji ) .
2 2
Assim, escrevemos
X h i
Bk (x′k Ji − x′i Jk ) = ~r′ × ~J × ~
B .
i
k
Portanto, a partir de (7.35) e (7.58), o torque exercido sobre o dipolo magnético será
~ =m
N ~ ×~
B. (7.61)
Esta relação é análoga à expressão para o momentum angular ~L de um sistema caracterizado por uma
distribuição de massa ρm
Z
~L = ρm (~r′ × ~v) d3 r ′ . (7.63)
A razão |~m|/|~L| é conhecida como a razão giromagnética Γ do sistema. Se esse for composto de
partículas clássicas de massa M e carga q, então Γ = q/2M c. Por outro lado, se a distribuição tiver uma
estrutura mais complexa, temos:
q ~
m~ = Γ ~L ≡ g L, (7.64)
2M c
em que o fator de Landé g descreve a estrutura magnética. Do ponto de vista clássico, um fator g 6= 1
indicam que a carga e a massa não estão igualmente distribuídas no interior do corpo girante. Por exemplo,
se g > 1 temos a carga mais próxima da superfície do corpo. É interessante notar que o momento magnético
intrínseco do elétron tem um fator g = −2, 00231930436182(52).5 O afastamento desse fator em relação
ao valor clássico deve-se a efeitos relativísticos e quânticos descritos pela equação de Dirac.
Substituindo (7.64) em (7.61), podemos escrever que:
~
~ = dL = Γ ~L × ~B .
N (7.65)
dt
Esta equação mostra que o torque magnético provoca uma mudança do momentum angular que é sempre
perpendicular a ~L. Portanto, a grandeza do momentum angular se conserva e ~L precessa em torno de ~
B. O
efeito sobre uma distribuição de carga está indicado na Fig. 7.2.
A velocidade angular de precessão:
~ω L = Γ ~
B (7.66)
prevista por Larmor em 1897, é conhecida como frequência de Larmor.6 Este resultado para a frequência
de precessão é confirmado por cálculo mais complexo baseado na mecânica quântica.
5
NIST - 2014 CODATA recommended values
6
J. Larmor, Philosophical Transactions of the Royal Society, 190, 205-300 (1897).
“Z_2” — 2017/9/5 — 8:19 — page 164 — #184
uµ sµ = 0 . (7.69)
Vemos então, que a componente temporal no sistema S é dependente da sua componente espacial, sendo
dada por
~u
s0 = · ~S . (7.70)
c
7
Valentine Bargmann (1908-1989), matemático e físico americano, nascido na Alemanha.
Louis Michel (1923-1999), matemático e físico francês.
Valentine Louis Telegdi (1922-2006), físico húngaro americano.
V. Bargmann, L. Michel, and V. L. Telegdi, Physical Review Letters, 2, 435-436 (1959).
8
O quadrivetor spin sµ é o dual do tensor sµν no sentido de que sµ = (1/2c)ǫµνγδ uν sγδ , em que uµ é a quadrivelocidade da
partícula.
“Z_2” — 2017/9/5 — 8:19 — page 165 — #185
Das relações (2.12) e (2.15), temos a relação explícita entre sµ e o spin~s no referencial de repouso,
γ ~u ~ ~u
~s = ~S − ·S (7.71)
γ+1 c c
e as expressões inversas
2
~S = ~s + γ ~u ~u
·~s
γ+1 c c
~u
s0 = γ ·~s . (7.72)
c
Vemos assim que o spin~s no referencial de repouso da partícula determina completamente as componentes
do quadrivetor spin sµ em qualquer referencial inercial.
Voltamos a Eq. (7.67), a generalização de seu lado esquerdo é dsµ /dτ , em que τ é o tempo próprio
da partícula. Para obter uma expressão covariante para o lado direito, é conveniente lembrar a equação
covariante que descreve o movimento de uma partícula num campo eletromagnético (3.20). Lembrando que
µ q µν
pµ = mcuµ , e ds = cdτ podemos escrever a relação mc du ds = c F uν como
duµ q
= F µν uν . (7.73)
dτ mc
A equação covariante que descreve o movimento do spin tem uma forma análoga a expressão (7.73). Assim,
dsµ gq
= F µν sν . (7.74)
dτ 2mc
Usando o tensor eletromagnético F µν dado em (3.21), é fácil verificar que a parte espacial desta expressão
se reduz, no referencial de repouso da partícula, a Eq. (7.67).
A Eq. (7.74) não pode ser a generalização completa da relação (7.67), pois a equação de vínculo (7.69)
deve ser válida em todos os instantes. Portanto,
d duµ dsµ
(uµ sµ ) = sµ + uµ = 0. (7.75)
dτ dτ dτ
Então, usando a Eq. (7.73), resulta que
dsµ q µ q
uµ =− s Fµν uν = uµ F µν sν . (7.76)
dτ mc mc
Mas de acordo com (7.74) temos
dsµ gq
uµ = uµ F µν sν . (7.77)
dτ 2mc
Portanto, a forma simples (7.74) é completa apenas para g = 2. Nota-se que este valor corresponde a uma
partícula com spin ~2 , descrita pela equação de Dirac.
Se g 6= 2, a Eq. (7.74) deverá continuar sendo válida no sistema próprio de referência, mas alguns termos
devem ser adicionados de modo que as consequências de (7.68) e (7.73) sejam compatíveis. Evidentemente,
a componente espacial desses termos deve se anular no sistema de repouso da partícula. Para termos (7.77)
numa forma consistente com (7.76) que é sempre válida, devemos modificar (7.74) de modo que:
dsµ q
uµ = uµ F µν sν
dτ mc
gq q
= uµ F µν sν − (g − 2) uµ F µν sν . (7.78)
2mc 2mc
“Z_2” — 2017/9/5 — 8:19 — page 166 — #186
µ
Assim, usando a mudança de variável de uµ uµ = 1, em que uµ = dx µ 2
ds , para u uµ = −c , tendo
dx µ
uµ = dτ , generalizamos (7.74), segundo a correção de V. Bargmann, L. Michel e V. L. Telegdi (1959),9
como
dsµ q g µν 1 g
µ λδ
= F sν + 2 − 1 u (sλ F uδ ) . (7.79)
dτ mc 2 c 2
No sistema de repouso da partícula, as componentes espaciais da equação acima coincidem com a Eq.
(7.67). A equação covariante (7.79) contém a informação da precessão de Thomas. 10 Ela aparece no termo
final da Eq. (7.79), termo devido à exigência de vínculo de ser o quadrivetor spin ortogonal à quadriveloci-
dade. Para encontrarmos a precessão de Thomas, vamos considerar a equação do movimento para o spin~s
no referencial de repouso. Usando o resultado
duµ d~u
sµ = −γ ~S · (7.80)
dτ dτ
e a Eq. (7.71) de~s em termos de ~S, verificam que as duas equações (com ~β = ~uc )
!
d~S ~ d~β
= F + γ 2 ~β ~S · (7.81)
dτ dτ
e !
ds0 d~β
= F0 + γ 2 ~S · (7.82)
dτ dτ
podem ser combinadas para dar, depois de simplificadas,
" !#
d~s ~ γ ~β γ2 d~β
=F− F0 + ~s × ~β × . (7.83)
dτ γ+1 γ+1 dτ
Uma vez que (F0 , ~F) constitui um quadrivetor, com F0 = ~β · ~F, os primeiros dois termos em (7.83) podem
ser reconhecidos como o torque ~F′ avaliado no sistema de repouso. Dividindo os dois membros por γ e
usando a definição
∆~Ω γ 2 ~a × ~u
~ω T = − lim = ,
δt→0 δt γ + 1 c2
em que −∆~ Ω é um desvio angular em relação aos eixos transformados no laboratório e ~a é a aceleração no
referencial do laboratório, para a frequência de precessão de Thomas, encontraremos da Eq. (7.83),
d~s 1
= ~F′ + ~ω T ×~s . (7.84)
dt γ
Como ~F′ é dado pelo segundo membro da Eq. (7.67), essa expressão é exatamente
!
d~s gq ~
B′
= ~s × − ~ω T .
dt não rot 2mc
d~β q h~ ~ ~ ~ ~ ~ i
= E + β × B− β β·E . (7.85)
dt γmc
9
V. Bargmann, L. Michel, and V. L. Telegdi, Physical Review Letters, 2, 435-436 (1959).
10
Llewellyn Hilleth Thomas (1903-1992), matemático e físico inglês.
L. H. Thomas, Nature, 117, 514 (1926); Idem, Phil. Mag., 3, 1 (1927).
“Z_2” — 2017/9/5 — 8:19 — page 167 — #187
Definimos
~ = ε(t,~r)~E ,
D (7.89)
em que ε(t,~r) é a constante dielétrica, e
~ = 1 ~
H B, (7.90)
µ(t,~r)
em que µ(t,~r) é a permeabilidade magnética do material.
Meios Dielétricos e a Polarizabilidade Molecular Os materiais chamados dielétricos podem ser polari-
zados por campo elétrico aplicado externamente. A polarização pode resultar do alinhamento de moléculas
que têm uma assimetria natural na sua distribuição de carga. Suponhamos que uma dada molécula neutra é
colocada na presença do campo elétrico ~E, esta forma pequeno momento dipolo ~p na direção do campo. O
momento dipolo da molécula é definido por ~p = q~r, em que −q é a carga total dos elétrons que constituem
a molécula e −~r é o distância deslocada destes elétrons em relação ao centro da carga que constituem seu
núcleo atômico.
Se temos N moléculas por unidade de volume, o estado elétrico médio de um dielétrico será especificado
pelo momento dipolo ~P por unidade de volume, conhecido como polarização do meio ou ainda polarização
elétrica. Ainda podemos definir < ~pi > como o momento dipolo médio da i-ésima molécula confinada
neste volume, na vizinhança do ponto~r, e Ni como o número médio por unidade de volume do i-ésima tipo
desta molécula. Então o momento dipolo será
X
~P(~r) = Ni < ~pi > .
i
Esta polarização produzirá uma densidade efetiva de carga volumétrica dada por:
~ · ~P .
ρ′ = −∇ (7.91)
Sendo que a carga total de polarização do meio é nula, na fronteira do material dielétrico teremos também
uma densidade superficial de carga, ρ′S . Logo, usando a condição de ser a carga total de polarização nula:
Z I
ρ′ dv ′ + ρ′S da = 0 ,
V S
ρ′S = ~P · n̂ . (7.93)
Estas relações têm uma importante aplicação na determinação do campo elétrico efetivo que atua sobre cada
molécula. O campo elétrico efetivo ~Eef será dado pelo campo elétrico ~E somado ao campo elétrico interno
~Ei , devido à polarização das moléculas. O campo molecular local será dado por ~E + ~Ei .
“Z_2” — 2017/9/5 — 8:19 — page 169 — #189
Num meio dielétrico é conveniente distinguir cargas livres ρ e cargas polarizadas ρ′ . Assim podemos
escrever a lei de Gauss como:
~ · ~E = 4πρt ,
∇
em que ρt = ρ + ρ′ é a densidade total de cargas. Então,
~ · ~E = 4π ρ + ρ′
∇
~ · ~E = 4πρ − 4π ∇
∇ ~ · ~P
~ · ~E + 4π~P = 4πρ .
∇ (7.94)
∇ ~ = 4πρ ,
~ ·D (7.95)
em que ε é a constante dielétrica ou permissividade relativa do meio. Logo, das Eqs. (7.95) e (7.98), temos
~
∇ ~ ·D = 1∇
~ · ~E = ∇ ~ = 4πρ .
~ ·D (7.99)
ε ε ε
Assim, os campos elétricos produzidos por cargas livres num meio dielétrico são análogos aos produzidos
pela mesma carga no vácuo, exceto que estes campos são reduzidos por um fator ε.
Devemos observar que as Eqs. (7.97)-(7.99) são uma aproximação assumindo os casos particularmente
simples, para materiais dielétricos isotrópicos. Para meios dielétricos anisotrópicos, como por exemplo, os
cristais a Eq. (7.98) generaliza a
~ = ~ε · ~E ,
D (7.100)
em que~ε é um tensor de segunda ordem conhecido como tensor dielétrico.
Densidade de Energia num Meio Dielétrico Dada uma distribuição de cargas descrita pela densidade
volumétrica de carga ρ, a energia associada a tal configuração é dada por
Z Z
1 3 1 ~E · ~E d3 r .
W = ρ(~r)Φ(~r) d r ⇒ W =
2 8π
A demonstração deste resultado é bastante geral e vale, em princípio, na presença de meios dielétricos,
porém desde que ρ descreva todas as cargas presentes no sistema, i.e., a energia acima corresponde ao gasto
energético para se construir todo o sistema, incluindo o material dielétrico, trazendo partícula por partícula
do dielétrico do infinito para suas posições finais, e finalmente fazendo o mesmo com as cargas livres.
15
Em casos particularmente simples, para dielétricos isotrópicos.
“Z_2” — 2017/9/5 — 8:19 — page 170 — #190
Porém, já sabemos que, ao lidar com meios dielétricos, é preciso fazer a distinção entre densidade de
cargas livres ρ e densidade de cargas polarizadas ρ′ , que são tratadas de forma diferenciada. Desta forma,
uma situação mais razoável é partir do dielétrico já presente, em sua condição inicial, e então estudar a
energia gasta para trazer cada carga livre para suas posições finais. Em situações mais realistas, essa é a
energia que queremos falar: os materiais dielétricos já existem e estão posicionados onde devem estar, e
estamos interessados apenas na variação de energia devida ao campo externo que podemos manipular, i.e.,
aquele gerado pela densidade de cargas livres ρ.
Consideremos, então, uma variação infinitesimal na densidade de carga livre ρ → ρ + δρ, num sistema
que pode incluir em um ou em vários materiais dielétricos. Nota-se que δρ é uma função de ~r, i.e., não
consideramos cargas pontuais individualmente mas sim pequenos incrementos na densidade volumétrica
de carga δρ. Tal construção é matematicamente mais simples, e o caso de cargas pontuais pode ser obtido
como um caso particular.
Então, a variação de energia gasta será
Z
δW = δρ(~r)Φ(~r) d3 r ,
~ · (δD)
∇ ~ = 4π δρ .
Portanto, Z
1 ~ · (δD)
~ d3 r .
δW = Φ∇
4π
~ · (δD)
Como Φ ∇ ~ =∇
~ · (δD
~ Φ) − ∇Φ
~ · δD,
~ obtemos
Z Z
1 ~ Φ) d3 r − 1
~ · (δD ~ · δD
~ d3 r .
δW = ∇ ∇Φ
4π 4π
Utilizando o teorema da divergência de Gauss na primeira integral, resulta igual a uma integral do campo
~ Φ sobre uma superfície que tende ao infinito. Como usual, podemos considerar que os campos
vetorial δD
tendem a zero suficientemente rápido no infinito para que tal integral se anule. Assim,
Z
1 ~ · δD ~ d3 r .
δW = − ∇Φ
4π
Como ~E = −∇Φ,
~ encontraremos
Z
1 ~E · δD
~ d3 r .
δW =
4π
Agora faremos a suposição de que todos os dielétricos presentes no sistema sejam lineares. Esta é uma
restrição, porém útil: a expressão que obteremos é válida somente para esta classe de materiais. Além disso,
por mera simplicidade de notação, vamos supor que D ~ = ε~E, i.e., o tensor de permissividade reduz-se a
um múltiplo da identidade. Esta simplificação não é fundamental: o resultado que obteremos vale também
para um tensor permissividade geral. Para dielétricos lineares, vale
e, portanto,
Z
1
δW = δ(~E · D)
~ d3 r
8π
Z
1 ~ ~ 3
=δ E·Dd r .
8π
É elementar somar todas as variações δρ que levam de ρ = 0 (a configuração inicial) até uma dada configu-
ração final ρ, e obtemos a energia total
Z
1 ~E · D
~ d3 r .
W = (7.101)
8π
W 1 ~ ~
w= = E·D. (7.102)
V 8π
Densidade de Força num Meio Dielétrico A Eq. (7.101) foi obtida considerando um processo virtual no
qual cargas verdadeiras são adicionadas a um sistema de cargas e dielétricos os quais são mantidos fixos,
de modo que nenhum trabalho mecânico seja feito contra os deslocamentos físicos. Vamos considerar uma
diferença de processos virtuais na qual as coordenadas físicas das cargas e dielétricos dão um deslocamento
virtual δ~r à cada ponto do espaço, mas nenhuma carga livre é adicionada ao sistema. Uma vez que estamos
lidando com um sistema conservativo, a energia (7.101) pode ainda ser usada, apesar do fato de ter sido
obtida em termos de um outro processo virtual. A variação na energia total δW quando o sistema sofre um
deslocamento virtual δ~r está relacionado com a densidade de força eletrostática ~f atuando dentro de um
meio dielétrico, Z
δW = − ~f · δ~r d3 r .
Agora, vamos considerar a variação da energia causada por dois fatores: a variação da distribuição de
carga livre δρ(~r) e a variação da constante dielétrica δε(~r), causadas pelo deslocamento virtual. Pela Eq.
(7.101) temos,
Z " ~2 ~
#
1 D D ~ d3 r
δW = − 2 δε + 2 · δD
8π ε ε
ou
Z Z
1 ~E2 δε d3 r + 1 ~E · δD
~ d3 r .
δW = − (7.103)
8π 4π
~
Aqui, usamos o fato de D
ε = ~E. O segundo termos da Eq. (7.103) pode ser escrito como,
Z Z Z Z
1 ~ d3 r = − 1
~E · δD ~ d3 r = 1
~ · δD ~ · δD
~ d3 r =
∇Φ Φ∇ Φδρ d3 r ,
4π 4π 4π
“Z_2” — 2017/9/5 — 8:19 — page 172 — #192
~ · δD
pois usamos −∇Φ ~ = −∇ ~ · (ΦδD)
~ + Φ∇ ~ · δD
~ e sabemos que ∇ ~ · δD
~ = 4π δρ além de que a integral
em todo o espaço do primeiro termos do lado direito dessa relação será nula. Então, de (7.103), temos
Z Z
1 ~E2 δε d3 r + Φδρ d3 r
δW = −
8π
e
Z Z
dW ∂ρ 3 1 ~E2 ∂ε d3 r .
= Φ d r− (7.104)
dt ∂t 8π ∂t
A fim de obter a expressão para densidade de força ~f precisamos expressar as derivadas no tempo ∂ρ∂t e
∂ε
∂t em função do campo de velocidade de ~
u . Para isso iremos adotar a dependência da constante dielétrica
ε com a densidade de massa ρm . Se assumimos que ε(ρm ) é uma função conhecida, segue:
Dε dε Dρm
= ,
Dt dρm Dt
em que
D ∂ ~
≡ + ~u · ∇
Dt ∂t
é a derivada total no tempo. A equação hidrodinâmica de continuidade do dielétrico é
∂ρm ~
+ ∇ · (ρm~u) = 0,
∂t
que implica em
Dρm ~ ·~u .
= −ρm ∇
Dt
Daqui resulta que,
∂ε dε ~ ·~u − ~u · ∇ε
~ .
=− ρm ∇
∂t dρm
A equação de continuidade para carga livre é
∂ρ ~
+ ∇ · (ρ~u) = 0 .
∂t
Assim, a Eq. (7.104) terá a forma
Z Z Z
dW 1 ~ 2 dε 1
~
= − Φ ∇ · (ρ~u) d r +3
E ~ 3
ρm ∇ ·~u d r + (~E2 ∇ε)
~ ·~u d3 r . (7.105)
dt 8π dρm 8π
Integrando o primeiro termo por partes e desprezando quaisquer contribuições de superfície, obtemos
Z Z
~ 3
− Φ ∇ · (ρ~u) d r = ρ ∇Φ ~ ·~u d3 r .
A Relação de Clausius-Mossotti Intuitivamente esperamos uma relação entre a capacidade dos átomos
constituintes de um cristal de se polarizar com a capacidade do cristal como inteiro se polarizar. Assim,
consequentemente deverá haver uma correspondência entre a polarizabilidade e a constante dielétrica do
material.
Seja ~p o momento dipolo que a presença de um campo elétrico externo ~E cria num átomo. Denomina-se
polarizabilidade do átomo a quantidade α definida através da relação
~p = α ~E .
~P = 1 (ε − 1) ~E .
4π
O campo que age sobre um átomo é a soma do campo externo aplicado sobre o dielétrico e dos campos dos
demais átomos, polarizados, que produzem na posição do átomo considerado. Assim, este campo é dado
por
~ = ~E + 4π ~P
E (7.107)
3
como mostraremos a seguir.
Prova. Se o campo externo que age sobre o dielétrico é ~E, o campo sobre um átomo desse dielétrico será
~
E = ~E + ~Eat ,
em que ~Eat é o campo dos outros átomos na posição do átomo considerado. Ao redor do átomo, conside-
remos uma cavidade esférica. Dentro dessa cavidade, o vazio, e o átomo está no centro dessa cavidade. O
16
eletrostrição - deformação elástica produzida num dielétrico sólido quando sobre esse age um campo elétrico, o termo vem do
inglês electrostriction ’id.’, de electro + striction, como em constriction. Ver Houaiss.
“Z_2” — 2017/9/5 — 8:19 — page 174 — #194
campo que agirá sobre o átomo, devido aos outros átomos, é o campo no centro da cavidade. Seja ~P = P k̂
a polarização. Colocando a origem das coordenadas no centro da cavidade esférica, temos que n̂ = ~rr e
~P · n̂ = P k̂ · n̂ = P cos θ ,
em que θ é o ângulo entre k̂ e n̂. A densidade superficial de cargas de polarização é dada por σ = ~P · n̂.
Logo,
σ = P cos θ .
O campo desta distribuição de cargas no centro da cavidade é dado por ~Eat = Eat k̂, com
Z
1
Eat = 2 σ n̂ · k̂ dS
b
Z
2π b2
= 2 σ n̂ · k̂ sen θ dθ
b
Z π
= 2π P cos2 θ sen θ dθ ,
0
Como ~
E é o campo que age sobre um átomo, temos
~p = α ~
E.
Se temos o número total de átomos por unidade de volume dado por N . Então,
~P = N~p = N α ~
E.
Logo,
~P = N α ~E + 4π ~P
3
e
~P 1 − 4πN α = N α ~E .
3
Finalmente, usando ~P = 1
4π (ε − 1) ~E,
1 ~ 4πN α 4πN α
(ε − 1) E 1 − = N α ~E ⇒ ε−1 = ,
4π 3 1 − 4πN
3
α
A relação de Clausius-Mossotti recebe esse nome após Mossotti, em 1850,18 analisar a relação entre as
constantes dielétricas de dois meios diferentes, e Clausius, que deu a fórmula explicitamente em 1879 no
contexto não de constantes dielétricas mas de índices de refração.19 A mesma fórmula também surge no
contexto de condutividade, em que ela é conhecida como fórmula de Maxwell. Origina-se uma vez mais, no
contexto de refratividade, em que ela é conhecida como a equação de Lorentz-Lorenz.20
~ ×~ 4π
∇ B = ~Jt ,
c
mostra que os efeitos magnéticos observados na natureza são consequências das correntes associadas ao
movimento das cargas. Assim, numa visão elementar, podemos considerar o movimento orbital dos elétrons
em átomos e moléculas como fontes que produzem o magnetismo. Cada átomo ou molécula seria então
equivalentes a um pequeno dipolo magnético. Vamos agora, representar cada dipolo magnético devido a
um pequeno circuito de corrente I e d~a o elemento de área direcionado normalmente ao plano do circuito.
Assim, o dipolo magnético é dado pelo desenvolvimento da Eq. (7.35), i.e.,
Z
1
~ =
m ~r′ × ~J(~r′ ) d3 r ′
2c
Z
1
= ~r′ × Id~l′ .
2c
Desde que 12 |~r′ × d~l′ | = d~a nos fornece o elemento de área. Então,
Z
I I
m~ = d~a = ~S , (7.108)
c S c
em que ~S é a área direcionada do circuito planar. Esta definição é consistente com a definição usual de
dipolo elétrico, no sentido de que torques exercidos sobre dipolos em campos externos uniformes são dados
por expressões análogas. O torque elétrico definido como,
~ e = ~p × ~E
N
n2 − 1 4πN α
= ,
n2 + 2 3
√
em que n = ε é o índice de refração, N é o número de moléculas por unidade de volume e α é a polarizabilidade do meio.
Esta equação só é válida para certas estruturas cristalinas. Ver C. Kittel, Introduction to solid state physics, (2005).
“Z_2” — 2017/9/5 — 8:19 — page 176 — #196
~ dado por:
Este alinhamento produz um momento dipolo por unidade de volume, ou magnetização, M,
X
~ (~r) =
M Ni < m~ i >, (7.109)
i
em que o índice i representa a i-ésima molécula. Resolvendo em analogia com a polarização elétrica ~P,
teremos que o potencial magnético é a soma das contribuições da corrente controlada explicitamente mais
a densidade de dipolo magnético induzido
Z " ~ ′ ~ (~r′ ) × (~r −~r′ )
# Z
~ 1 J (~
r ) c M 3 ′ 1 ~J(~r′ ) + c ∇~′×M ~ (~r′ )
A(~r) = + d r = d3 r ′ ,
c |~r −~r′ | |~r −~r′ |3 c |~r −~r′ |
Novamente devemos distinguir num material magnético entre correntes livres e correntes de magnetização,
~J e ~J′ , respectivamente, tal que considerando a corrente total, ~J + ~J′ , a lei de Ampère será
~ ×~ 4π ~
∇ B= Jt
c
4π ~ ~ ′
= (J + J )
c
4π ~ ~ ×M
~
= J + 4π ∇
c
e finalmente,
~ × (~
∇ ~ = 4π ~J ,
B − 4π M) (7.111)
c
~ como sendo:
definindo a intensidade magnética, H,
~ =~
H ~ .
B − 4π M (7.112)
∇ ~ = 4π ~J ,
~ ×H (7.113)
c
em analogia com as leis eletrostáticas para a matéria.
~ é proporcional ao
Em materiais paramagnético e diamagnético, encontra-se experimentalmente que M
~ tal como,
campo H
~ = χm H
M ~ ,
como indicado na Fig. 7.3, em que B0 é o valor inicial do campo magnético e o valor do campo aplicado
H está crescendo ou decrescendo lentamente. Para algumas substâncias |µ± (H)| pode ser tão grande até
próximo de 106 .22
Potencial Escalar Magnético e Potencial Vetor Vamos assumir que a densidade de corrente se anula em
alguma região finita do espaço, i.e., ~J = 0. Assim, da Eq. (7.113) temos ∇
~ ×H
~ = 0. Isso implica que
~ = −∇Φ
H ~ M,
Como
~′ 1 ~ 1
∇ = −∇ ,
|~r −~r′ | |~r −~r′ |
temos
Z ~ (~r′ )
~ · M
ΦM (~r) = −∇ d3 r ′ . (7.119)
|~r −~r′ |
De passagem observamos que, longe da região de magnetização não nula, o potencial pode ser aproxi-
mado por
Z
~ 1 ~ ·~r
~ (~r′ ) d3 r ′ = m
ΦM (~r) ≃ −∇ · M ,
r r3
R
em que m ~ = M ~ d3 r é o momento magnético total da distribuição. Esta relação é do potencial escalar
magnético de um dipolo.
Muitas vezes, é uma boa aproximação tratar o campo de magnetização M ~ (~r) como a quantidade des-
~
contínua. Em outras palavras, M(~r) é especificado ao longo dos ferromagnéticos permanentes em questão,
e cai subitamente para zero no limite da superfícies desses materiais. Integrando a densidade volumétrica de
carga magnética ρM = −∇ ~ ·M~ em todo o volume e aplicando o teorema da divergência de Gauss temos a
densidade superficial de carga magnética efetiva,
~ · n̂ ,
σM = M (7.120)
Considerando um meio magnético caracterizado por uma magnetização M ~ (~r′ ). A partir da Eq. (7.36) e
usando o princípio de superposição, temos que o potencial vetor devido a esta distribuição é dado por,
Z ′ Z
~ (~r) =
A ~ (~r′ ) × (~r −~r ) d3 r ′ =
M ~ (~r′ ) × ∇
M ~′ 1
d3 r ′ .
|~r −~r′ |3 |~r −~r′ |
em que ~F é um vetor campo arbitrário, o resultado do potencial acima pode ser escrito na forma,
Z ~′×M ~ (~r′ ) I ~ (~r′ ) × n̂′
~ (~r) = 1
A
c∇
d 3 ′
r +
1 cM
da′ . (7.122)
c V |~r −~r′ | c S |~r −~r′ |
~′×M
Esta expressão mostra que c ∇ ~ (~r′ ) pode ser interpretado como a densidade volumétrica de corrente
~ (~r′ ) × n̂′ representa a densidade de magnetização superficial.
de magnetização, ao passo que c M
“Z_2” — 2017/9/5 — 8:19 — page 179 — #199
∇~ ·D
~ = 4π ρ (7.123a)
~
∇ ~ − 1 ∂ D = 4π ~J
~ ×H (7.123b)
c ∂t c
~
~ × ~E + 1 ∂ B = 0
∇ (7.123c)
c ∂t
∇~ ·~
B = 0, (7.123d)
Condições de Contorno Vimos que os campos elétricos e magnéticos são influenciados pelos efeitos de
polarização e magnetização. Quando existem dois meios diferentes justapostos, podemos esperar que estes
campos vetoriais sofram mudanças na superfície entre os dois meios diferentes. Assim, devemos considerar
~ e de ~E nas interfaces dos meios. Estas condições são deduzidas
a questão das condições de contorno de D
do conjunto completo das equações de Maxwell em meios macroscópicos.
Primeiramente, vamos considerar a condição no campo de deslocamento D ~ na interface T entre os dois
meios, conforme está na Fig. 7.4, em que temos as pequenas áreas δA1 e δA2 em cada lado de T e δh é a
23
Georg Simon Ohm (1789-1854), físico e matemático alemão.
“Z_2” — 2017/9/5 — 8:19 — page 180 — #200
~ na forma integral
altura do cilindro gaussiano. Aplicando a lei de Gauss, para o campo D,
I Z
~ · n̂12 da = 4π
D ρ dV = 4π q
V
~ 2−D
(D ~ 1 ) · n̂12 = 4π σ (7.127)
em que n̂12 é o vetor unitário normal à interface, dirigido da região 1 para a região 2, e σ é a densidade
superficial de carga macroscópica sobre a interface (não incluindo a carga de polarização). A relação acima
relata a troca na componente normal de D~ através da superfície, tendo somente a densidade superficial de
carga sobre a interface.
Agora, vamos considerar a condição no campo elétrico ~E na interface T entre os dois meios, conforme
está na Fig. 7.5, em que b̂ é o vetor unitário perpendicular ao plano do retângulo de Stokes, tangente à
as primeira e terceira integrais são realizadas através da área do retângulo, a segunda é realizada ao longo
de sua fronteira. Se temos P1 Q1 = δs1 e P2 Q2 = δs2 pequenos, o campo ~E será substituído por campos
“Z_2” — 2017/9/5 — 8:19 — page 181 — #201
∂~
constantes ~E1 e ~E2 ao longo desses segmentos. Similarmente B
∂t será substituído por um valor constante.
Assim,
~
~E1 · t̂1 δs1 + ~E2 · t̂2 δs2 + contribuições do final do retângulo = − 1 ∂ B · b̂ δsδh ,
c ∂t
em que δs é o elemento de linha na qual o retângulo intercepta a superfície. Façamos com que o retângulo
diminua gradualmente, tal que as contribuições do final do retângulo tendem à zero, e δs1 = δs2 → δs.
~
Assumindo que ∂∂tB permaneça finito, no limite em que δh → 0 temos
~E1 · t̂1 + ~E2 · t̂2 δs = 0 .
Pela Fig. 7.5 encontramos, t̂1 = −t̂ = −b̂ × n̂12 e t̂2 = t̂ = b̂ × n̂12 . Assim,
h i
~E2 − ~E1 · b̂ × n̂12 = − ~E2 − ~E1 × n̂12 · b̂ = 0 .
Desde que a orientação do retângulo e consequentemente que o versor b̂ seja arbitrário, segue-se que
~E2 − ~E1 × n̂12 = 0 , (7.128)
(~
B2 − ~
B1 ) · n̂12 = 0 , (7.129)
que expressa a continuidade da componente normal de ~ B na interface. Por outro lado, tendo em vista a
~ não será, em geral, contínua. Em lugar de (7.128), obtemos:
equação (7.113), a componente tangencial de H
(H ~ 1 ) × n̂12 = − 4π K
~ 2−H ~ , (7.130)
c
Problemas
7.1 Demonstre explicitamente as relações dadas em (7.7). Sugestão: Consulte o livro do Prof. Greiner [34].
7.2 Demonstre as condições de contorno na região separada por dois dielétricos diferentes, i.e., mostre que
(~
B2 − ~
B1 ) · n̂ = 0 , ~ 1 ) × n̂ = − 4π ~i ,
~ 2−H
(H
c
em que n̂ é o vetor unitário normal à superfície e~i é a densidade de corrente livre na interface.
“Z_2” — 2017/9/5 — 8:19 — page 182 — #202
7.3 Considere o campo elétrico que atravessa a superfície entre dois meios dielétricos com constantes
dielétricas ε1 e ε2 . No primeiro meio, a linha do campo faz um ângulo θ1 com a normal da interface,
enquanto no segundo meio, faz um ângulo θ2 . Mostre que
1 1
tan θ1 = tan θ2 .
ε1 ε2
A propriedade acima é similar à lei de Snell,24 que descreve o comportamento das ondas eletromagné-
ticas.
7.4 Uma barra dielétrica com a forma de um cilindro circular reto de comprimento L e raio R se polariza
na direção de seu comprimento, i.e., ~P = P k̂. Se a polarização for uniforme e de módulo P , calcule o
campo elétrico resultante desta polarização num ponto sobre o eixo da barra.
7.5 Qual o potencial e o campo elétrico de uma esfera eletricamente neutra, consistindo de um meio com
a permissividade dieléctrica ε, colocada dentro de um campo elétrico uniforme ~E0 ? Considere a per-
missividade fora da esfera igual a 1, i.e., a esfera está em vácuo. Sugestão: Consulte o livro do Prof.
Greiner [34].
7.6 Uma esfera homogênea de raio a e com permissividade ε2 está colocada em uma região com permissi-
vidade ε1 . Na ausência da esfera, um campo uniforme ~E = E0 ẑ está nessa região de ε1 . O potencial e a
forma das linhas de campo na presença do campo são necessárias. Para uma cavidade esférica, ε1 = ε e
ε2 = 1, calcular a densidade da carga de polarização na superfície esférica bem como o campo elétrico
produzido por cargas superficiais. Sugestão: Consulte o livro do Prof. Greiner [34].
7.7 Na prática, os eletrodos são frequentemente mantidos em potencial constante usando baterias. Mudando
os eletrodos entre os dielétricos, as correntes estarão fluindo de tal forma que os potenciais são conser-
vados. Por conseguinte, a energia é fornecido ou retirado para fora do campo. Discuta a ação de uma
força para que os potenciais sejam mantidos constantes. Sugestão: Consulte o livro do Prof. Greiner
[34].
7.8 Calcular o potencial Φ de uma carga pontual q em um meio uniforme√ anisotrópico com o tensor dielé-
~ = ~ε · ~E). Determinar a carga pontual modificada q ′ = q/ det~ε para o tensor dielétrico
trico εik (D
√
29 3 −3√ 2
1
εik = 3√ 29
√ 3 2,
4
−3 2 3 2 26
a transformação do eixo principal bem como a excentricidade das superfícies equipotenciais. Sugestão:
Consulte o livro do Prof. Greiner [34].
7.9 Um longo e oco cilindro circular reto de raios interno e externo, a e b, respectivamente, e de permeabi-
lidade relativa µ, é colocado em uma região de densidade de fluxo magnético inicialmente uniforme ~ B0
perpendicularmente ao campo. Encontrar a densidade de fluxo em todos os pontos no espaço, e esboçar
o logaritmo da razão das grandezas de ~B sobre o eixo do cilindro para ~ B0 como uma função do log10 µ
2 2
para a /b = 0, 5, 0, 1. Negligência os efeitos finais.
7.10 Um espira circular, de arame, com um raio a e transportando uma corrente I está localizado no vácuo,
com o seu centro a uma distância d a partir de uma placa semi-infinita de permeabilidade µ. Encontre
a força que age sobre o circuito quando:
24
Willebrord Snellius - nascido Willebrord Snel van Royen (1580-1626), astrônomo e matemático holandês.
“Z_2” — 2017/9/5 — 8:19 — page 183 — #203
7.11 Um cilindro circular reto de comprimento L e raio a tem uma magnetização uniforme e longitudinal-
mente M .
a) Mostre que, quando ele é colocado com a sua extremidade plana de encontro a uma superfície plana
infinitamente permeável, adere com força
2 K (k) − E (k) K (k1 ) − E (k1 )
F = 8πaLM − ,
k k1
em que
2a a
k=√ , k1 = √ .
4a2 + L2 a + L2
2
7.12 Seja um campo magnetostático decorrente, inteiramente, de uma distribuição localizada de magneti-
zação uniforme.
a) Demonstre que: Z
~
B·H ~ d3 r = 0 .
7.13 Um elipsóide com eixos principais 2a, 2a e 2b está magnetizado uniformemente na direção paralela a
~ 0 . Calcular a densidade do polo magnético para essa geometria.
2b. A magnetização do elipsóide é M
7.14 Uma esfera de material magnético de raio R é colocada na origem de um sistema de coordenadas. A
magnetização é dada por M ~ = (ax2 + b)ı̂, em que a e b são constantes. Determine todas as densidades
de polo e as correntes de magnetização.
7.15 Considere um meio magnético caracterizado por uma magnetização M ~ (~r′ ). A partir da Eq. (7.36)
mostre, usando o princípio de superposição, que o potencial vetor devido a essa distribuição é dado por,
Z Z
~ ~ (~r −~r′ ) 3 ′ ~ ~ ′ 1
A(~r) = M(~r ) × ′ ′
d r = M(~r ) × ∇ d3 r ′ .
|~r −~r′ |3 |~r −~r′ |
Tendo em vista o teorema integral, dado no texto, em que ~F é um vetor arbitrário, mostre usando o
resultado anterior que o potencial vetor pode ser escrito na forma,
Z ~′×M ~ (~r′ ) I ~ (~r′ ) × n̂′
~ (~r) = 1
A
c∇
d3 r ′ +
1 cM
da′ .
c ′
|~r −~r | c |~r −~r′ |
V S
“Z_2” — 2017/9/5 — 8:19 — page 184 — #204
Leitura Recomendada
Recomenda-se ao leitor os seguintes livros, em paralelo ao desenvolvimento deste capítulo,
– J. D. Jackson [42];
– W. Greiner [34];
– M. A. Heald and J. B. Marion [36].
Nestes textos, o leitor encontrará excelentes discussões e deduções detalhadas da expansão dos potenciais
escalar e vetorial em momentos multipolares.
Os livros do prof. Greiner e do prof. Jackson trazem uma excelente sequência de trabalhos em meios
materiais, como os efeitos de meios dielétricos e meios magnéticos nos campos elétrico e magnético. Estes
textos são fortemente recomendado.
“Z_2” — 2017/9/5 — 8:19 — page 185 — #205
Capítulo 8
Campos Eletromagnéticos Variáveis no Tempo
e Calibre
Nos capítulos anteriores deduzimos o eletromagnetismo completamente, claro que usando o formalismo
da eletrodinâmica relativística, porém não fizemos nenhum comentário relevante e/ou especial sobre a lei
de Faraday, que será assunto deste capítulo. Ainda dentro deste contexto, faremos uma discussão sobre as
correntes de deslocamento, os potenciais vetor e escalar, transformações de calibre e desenvolveremos as
equações de onda, agora em espaço tridimensional, através da função de Green, obtendo os potenciais de
retardo. Também usaremos os fenômenos de polarização e magnetização, mostrando que podemos escrever
os potenciais em termos destes parâmetros. Ainda faremos um estudo do vetor de Hertz, bem como um
estudo dos monopolos magnéticos e a sua interpretação quântica, desenvolvida por Dirac.
1
M. Faraday, Experimental Researches in Electricity, (Taylor, London), Vol. 1, pp. 1-41 (from Philos. Trans. R. Soc. London,
November 24, 1831) (1839).
2
G. Ohm, Die Galvanische Kette, mathematisch bearbeitet, Berlin (1827). Este texto continha uma dedução teórica da lei de
Ohm, e se tornou muito mais conhecido do que seu artigo de 1826, dando a dedução experimental.
185
“Z_2” — 2017/9/5 — 8:19 — page 186 — #206
em que ~E′ é o campo elétrico induzido e d~l é o elemento de linha do circuito C. A observação de Faraday é
resumida na forma da seguinte lei matemática
dF
E = −k . (8.3)
dt
A força eletromotriz induzida no circuito é proporcional à taxa de variação temporal do fluxo magnético
acoplado ao circuito. O sinal é especificado pela lei de Lenz,3 a qual estabelece que a corrente induzida (e
o fluxo magnético que ela gera) tem uma direção tal que se opõe à mudança de fluxo no circuito. O sinal
negativo já havia aparecido na demostração de (1.8), em que a circulação do campo elétrico é conhecida
como a força eletromotriz em um dado contorno.
Consideremos agora a lei de Faraday para um circuito em movimento uniforme, e vejamos as con-
sequências da invariância de Galileu. Se expressamos (8.3) em termos das integrais sobre ~E′ e ~B temos
I Z
~E′ · d~l = −k d ~
B · n̂ da . (8.4)
C dt S
A força eletromotriz induzida é proporcional à derivada total do fluxo, e o fluxo poderá mudar pela modifi-
cação do campo magnético ou mudando a orientação do circuito. Na forma (8.4), temos uma generalização
da lei de Faraday. O circuito C poderá ser imaginado como sendo um caminho fechado no espaço, não
necessariamente coincidente com um circuito elétrico. Então a Eq. (8.4) se torna uma relação entre os pró-
prios campos. É importante notar que o campo elétrico ~E′ é o campo em d~l no sistema de coordenadas ou
no meio na qual d~l está em repouso, uma vez que é esse campo quem produz um fluxo de corrente se um
circuito estiver presente.
Se o circuito C está se deslocando com uma velocidade ~v numa certa direção, a derivada total em (8.4)
deve levar em conta esse movimento. Para isso escreveremos a derivada total como sendo uma derivada
convectiva na forma
d ∂ ~ .
= + ~v · ∇
dt ∂t
Assim,
d~
B ∂~
B ~ ~
= + (~v · ∇)B
dt ∂t
∂~
B ~
= + ∇ × (~ ~ ·~
B × ~v) + ~v(∇ B) , (8.5)
∂t
~ ·~
em que ~v é considerado constante na derivada. Desta forma, e usando ∇ B = 0, podemos escrever
I Z !
~E′ · d~l = −k ∂~B ~
+ ∇ × (~B × ~v) · n̂ da , (8.6)
C S ∂t
em que usamos o fato do circuito se deslocar rigidamente, na qual nem n̂ e nem da mudam com o tempo.
Aplicando o teorema de Stokes no último termo de (8.6) obtemos
I Z ~ I
~E′ · d~l = −k ∂B
· n̂ da − k (~ B × ~v) · d~l . (8.7)
C S ∂t C
Este resultado é o equivalente à lei de Faraday aplicada ao circuito em movimento C. Mas podemos escolher
uma interpretação diferente. Podemos pensar no circuito C e na superfície S como estando instantaneamente
numa dada posição do espaço no laboratório. Aplicando a lei de Faraday (8.4) a esse circuito fixo, obtemos
I Z
~E · d~l = −k d ~
B · n̂ da , (8.9)
C dt S
em que ~E é agora o campo elétrico no laboratório. A invariância de Galileu obriga que os membros esquer-
dos das Eqs. (8.8) e (8.9) devem ser iguais. Isto implica que o campo elétrico no sistema de coordenadas
em movimento vale
~E′ = ~E + k(~v × ~
B) . (8.10)
Para determinar o valor da constante k, notemos que uma carga q, em repouso num circuito em movimento,
sofre uma força ~F′ = q~E′ = k(~v × ~ B), no caso em que ~E = 0 no laboratório. Quando a carga é vista do
laboratório, esta representa uma corrente ~J = q~v δ(~r −~r0 ). Para que a força ~F′ seja igual à força obtida a
partir da lei de Biot e Savart (5.79) no laboratório (como a invariância de Galileu requer), devemos escolher
k = 1c , i.e., usamos sistema gaussiano de unidades – CGS.4
Vemos então que a lei de Faraday assume a forma
I Z
~E′ · d~l = − 1 d ~
B · n̂ da , (8.11)
C c dt S
em que ~E′ é o campo elétrico em d~l no sistema de coordenadas para qual esse campo está em repouso. A
derivada temporal na direita, é uma derivada total. Obtivemos também como o campo elétrico ~E′ , medido
no laboratório, se transforma quando passamos a um sistema de coordenadas que se desloca com velocidade
constante ~v:
~E′ = ~E + 1 (~v × B)
~ . (8.12)
c
Devido ao fato de que consideramos as transformações de Galileu, o resultado apresentado em (8.12) é
uma aproximação que vale só quando a velocidade v é pequena em comparação com a velocidade da luz
c. A lei de Faraday não é uma aproximação. A transformação de Galileo foi utilizada só para calcular a
constante k. 5
A lei de Faraday (8.11) pode ser representada na forma diferencial utilizando o teorema de Stokes, uma
vez que o circuito C é mantido fixo no sistema de coordenadas escolhido, desta forma todos os campos ~E e
~
B estarão definidos no mesmo sistema. A transformação da integral da força eletromotriz numa integral de
superfície nos leva ao resultado
Z !
~
~ × ~E + 1 ∂ B
∇ · n̂ da = 0 . (8.13)
S c ∂t
4
No sistema internacional de unidades – SI, a constante k será igual a unidade.
5
Como sabemos da Seção 3.4, para uma transformação de Lorentz geral de S até S ′ que se desloca com uma velocidade ~v
relativa a S, podemos escrever a transformação (8.12) na forma
~E′ = γ(~E + ~β × ~ γ2 ~ ~ ~
B) − β(β · E) ,
γ+1
que no limite não relativístico será
~E′ = ~E + ~v × ~
B,
c
como vimos na Eq. (8.12).
“Z_2” — 2017/9/5 — 8:19 — page 188 — #208
Uma vez que o circuito C e a superfície limitante são arbitrários, a integral deve ser nula em todo ponto do
espaço. Assim a forma diferencial da lei de Faraday é
~
~ × ~E + 1 ∂ B = 0 .
∇ (8.14)
c ∂t
~ × ~E = 0 da eletrostática.
Nota-se que esta equação é a generalização, dependente do tempo, da lei ∇
Observações:
1. De acordo com a lei de Ohm, o fluxo de corrente transiente em um circuito considerado C provoca o
aparecimento de uma força eletromotriz E, definida por:
1 dF
E =− ,
c dt
com: I Z
E= ~E(~r, t) · d~l e F = ~
B(~r, t) · n̂ da .
C S
O sinal menos (−) da primeira expressão, como vimos, traduz a lei de Lenz e estabelece que a corrente
induzida no circuito C é sempre num sentido tal que se opõe à modificação do vetor indução ~ B(~r, t).
2. Consideremos uma espira que pode estar ligada a uma bateria. Não há campo magnético externo. No
instante em que a chave for fechada vai surgir corrente no circuito. Esta corrente vai produzir um
campo magnético, enfim, um fluxo magnético, que varia. De acordo com a lei de Faraday, a variação
de fluxo vai provocar uma força eletromotriz induzida, que vai se opor à força eletromotriz da bateria
(de acordo com a lei de Lenz). Este fenômeno é conhecido como autoindutância. Devido à autoin-
dutância, a espira oferece alguma inércia à variação da corrente. A força eletromotriz autoinduzida é
proporcional à taxa temporal de variação de corrente:
1 dF dI
E =− = −L ,
c dt dt
em que L é uma constante de proporcionalidade, conhecida como indutância.
Se considerarmos n circuitos lineares. Sendo Ik e Fk a corrente e o fluxo magnético, respectivamente,
do k-ésimo circuito. O fluxo será Z
Fk = ~
B · n̂ da ,
ak
X n Z
~ (r) = µ
A Ii
d~ri
.
c |~r −~ri |
i=1
“Z_2” — 2017/9/5 — 8:19 — page 189 — #209
Assim,
n Z Z
1 µ X d~ri · d~rk X
Fk = 2 Ii = Lki Ii ,
c c i k |~ri −~rk |
i=1 i
na qual o coeficiente de indução será
Z Z
µ d~ri · d~rk
Lki = 2 .
c i k |~ri −~rk |
Obviamente, em geral vale a relação de simetria Lki = Lik . Então, Fk = c Lki Ii . Em particular, se
Fk = c Lkk Ik , temos o coeficiente de autoindução, ou indutância, Lkk do k-ésimo condutor,
Z Z
µ d~rk · d~r′k
L = Lkk = 2 .
c k |~rk −~r′k |
3. Dois circuitos com correntes variáveis induzem correntes mutuamente, além da autoindução. A força
eletromotriz induzida pelo circuito 1 sobre o circuito 2 é diretamente proporcional à variação da
corrente 1, e vice-versa. As forças eletromotrizes totais induzidas em cada circuito, são:
dI2 dI1
E1 = −M12 − L1
dt dt
dI1 dI2
E2 = −M21 − L2 .
dt dt
No caso de circuitos rígidos, é fácil verificar que M12 = M21 . Este parâmetro é chamado de indutân-
cia mútua e é dado por: Z Z
µ d~r1 · d~r2
M21 = 2 ,
c 2 1 |~r2 −~r1 |
na qual temos a conhecida fórmula de Neumann para a indutância mútua.6 O fenômeno de indutância
mútua está na base de funcionamento do transformador.
Lei de Lenz De acordo com a lei de Faraday, a força eletromotriz induzida no circuito é dada pela equação
I
1 dF
E = ~E′ · d~l = − ,
C c dt
em que ~E′ é o campo elétrico induzido, d~l é o elemento de linha do circuito C e F é o fluxo magnético
dado em (8.1). O sinal negativo que aparece na equação anterior vem da lei de Lenz. Segundo a lei de Lenz,
qualquer corrente induzida tem um sentido tal que o campo magnético que ela gera se opõe à variação do
fluxo magnético que a produziu. Para entender o conteúdo da lei de Lenz pode-se considerá-la no contexto
lei de Faraday.
A lei de Lenz é uma consequência da conservação de energia. Para ver isto, considere uma espira circular
e um ímã com seus eixos alinhados, com o polo norte do ímã voltado para a espira, como na Fig. 8.1. Se o
ímã se aproxima da espira, é induzida uma corrente anti-horária na espira (vista a partir do ímã). Assim, a
espira passa a atuar como um eletroímã, com o polo norte voltado para o ímã, e eles se repelem. Caso o ímã
esteja se afastando, a corrente seria no sentido horário, o polo sul estaria voltado para o ímã, e a força seria
de atração. Em qualquer um dos casos, a força é contrária ao movimento. Se não fosse assim, um pequeno
movimento em qualquer sentido geraria uma força no mesmo sentido, e a velocidade (e a energia cinética)
iria aumentar indefinidamente, o que não é compatível com a conservação de energia.
Devido às contribuições de Neumann e Lenz, a lei da indução pode ser chamada de lei de Faraday, lei
de Faraday-Lenz ou lei de Faraday-Neumann-Lenz. Um exemplo muito interessante da aplicação da lei de
Lenz, é quando usamos o circuito RLC, que será visto abaixo.
6
F. E. Neumann, Abhandlungen der Königlichen Akademie der Wissenschaften zu Berlin, aus dem Jahre, 1845, 1-87 (1847).
“Z_2” — 2017/9/5 — 8:19 — page 190 — #210
Figura 8.1 Lei de Lenz aplicada a um ímã em movimento próximo a uma espira. (a) ímã se aproxima
da espira, e é repelido. (b) ímã se afasta da espira, e é atraído.
Circuito RLC
IR = IL = IC = I , (8.15)
em que IR , IL e IC são as correntes do resistor, do indutor e do capacitor, respectivamente. As voltagens
relacionadas as correntes são:
Q dQ
VR = RI , VC = com =I , (8.16)
C dt
sendo Q(t) a carga do capacitor. Podemos considerar o indutor como um solenoide ideal. A força eletromo-
triz induzida (voltagem no indutor), está relacionado com o fluxo eletromagnético
dF dI
Eind = VL = =L , (8.17)
dt dt
em que a constante L > 0 é a conhecida autoindutância, estudada acima. De acordo com a lei de Lenz, a
força eletromotriz induzida Eind realizará um trabalho contrário ao trabalho realizado pela força eletromo-
triz E que dirige o circuito. Usando cálculo complexo e as quantidades físicas dadas pelas partes reais, a
“Z_2” — 2017/9/5 — 8:19 — page 191 — #211
d2 Q dQ Q
L 2
+R + = Emáx e− i ωt . (8.19)
dt dt C
A solução geral desta equação é obtida pela superposição de uma solução especial da equação inomogênea
e a solução geral da equação homogênea. A solução especial da equação inomogênea é
Qi = Q0 e− i ωt , (8.20)
com
Emáx
Q0 = 1 . (8.21)
−ω 2 L − i ωR + C
A solução geral para a equação homogênea tem a forma Qh = Ae± i αt , na qual nos leva a equação algébrica
1
−α2 L ± i αR + = 0.
C
Descartando as soluções que crescem exponencialmente, soluções sem significado físico, a solução é
com r
1 R2
ωh = − .
LC 4L2
Nota-se que a exponencial, da solução homogênea, cai para unidade quando t é muito grande, Q = Qi .
A solução homogênea pode ser usada para nos dar as condições iniciais, como ligar ou desligar o circuito.
Trabalhando com mais detalhes, iremos separar o máximo da amplitude Q0 de sua fase. Assim,
Q0 = Qmáx e− i δ , (8.23)
sendo
1
Qmáx = |Q0 | = q 2 .
1
C − ω2L + ω 2 R2
Pela convenção padrão, escreveremos a expressão para Qmáx na seguinte forma
em que
1
XC = é a reatância capacitiva
ωC
XL = ωL é a reatância indutiva
XC − XL é a reatância total
q
Z= (XC − XL )2 + R2 é a impedância .
“Z_2” — 2017/9/5 — 8:19 — page 192 — #212
Emáx (XC − XL + i R)
Q0 = . (8.25)
Z2
sen δ ℑ[Q0 ] XL − XC
tan δ = = = . (8.26)
cos δ ℜ[Q0 ] R
Qmáx − i δ − i ωt
VC = e e (8.27)
C
e a fase da corrente I está deslocada em π/2 com relação a VC .
dQ
I= = − i ωQmáx e− i δ e− i ωt = ωQmáx e− i δ−iπ/2 e− i ωt
dt
= Imáx e− i δ−i π/2 e− i ωt . (8.28)
Nota-se também que Imáx = ωQmáx , com a Eq. (8.24) teremos Imáx = Emáx /Z. A voltagem do resistor está
em fase com a corrente, como podemos ver
dI
VL = L = ωLImáx ei δ−i π ei ωt . (8.30)
dt
Definindo, da Eq. (8.24), a frequência de ressonância é
1
ω0 = √ , (8.31)
LC
tal que Qmáx (ω0 ) = Emáx /ω0 R. Nota-se que, para R 6= 0, o máximo valor de Qmáx estará deslocado em
uma ordem de (R/L)2 de ω0 . Encontramos o máximo de Qmáx pela derivada em relação a ω 2 ,
r
1 2 2 1 R2
− 2L − ωmáx L + R = 0 =⇒ ωmáx = − . (8.32)
C LC 2L2
Nota-se que o valor ωmáx é ainda menor do que a frequência ωh da solução homogênea amortecida (8.22).
~
~ × ~E + 1 ∂ B = 0
∇
c ∂t
representa a forma diferencial da lei de Faraday. Uma aplicação importante desta lei está relacionada com
o efeito Zeeman.7
7
Pieter Zeeman (1865-1943), físico holandês.
“Z_2” — 2017/9/5 — 8:19 — page 193 — #213
Em 1896 Zeeman observou uma radiação eletromagnética quando átomos de sódio, mercúrio, etc., eram
colocados num campo magnético externo. 8 Consideremos o efeito Zeeman na presença de campos magné-
ticos intensos, na qual a descrição clássica é adequada. A teoria clássica do efeito Zeeman foi desenvolvida
por Lorentz, baseando-se na hipótese de que a luz emitida por um átomo tem sua origem no movimento
vibratório dos elétrons no interior dos átomos. Em poucas palavras, o efeito Zeeman tem a ver com o fato de
que a frequência da luz emitida pelos átomos em uma descarga em gases é alterada quando o gás encontra-se
submetido a um campo magnético externo.
A equação de movimento de um elétron ligado a um átomo por um força de vínculo~f (r) e com o sistema
imerso em um campo magnético estático ~ B, é
d2~r ~ e
m = f (r) − ~v × ~
B, (8.33)
dt2 c
em que m, −e,~r e ~v são a massa, a carga, a posição e a velocidade do elétron, respectivamente.
Simplificando, vamos considerar que o elétron no átomo se movimenta com velocidade angular ω0
numa órbita circular de raio r cujo plano é normal à direção do campo magnético estático ~ B. Na ausência
deste campo, o elétron sofre a força coulombiana do núcleo, i.e., a força de vínculo, de modo que a equação
de movimento tem a forma:
mv 2 Ze2
f (r) = = mω02 r = 2 , (8.34)
r r
em que ω0 = v/r.
Quando o campo magnético é ligado, o fluxo magnético através da órbita experimentará nesse processo
uma variação temporal. Esta mudança irá gerar um campo elétrico induzido tangencial à órbita. O campo
adicional modificará então a velocidade do elétron na órbita. No mesmo tempo, sendo que o elétron se move
no campo ~B, ele será afetado pela força de Lorentz cuja direção é ao longo do raio:
~FB = − e ~v × ~B . (8.35)
c
A grandeza e a direção de ~FB é tal que o raio da órbita permanecerá constante. Portanto, o processo
de ligação do campo magnético resultará somente no aumento ou na diminuição da velocidade angular do
elétron, dependendo da direção de seu movimento em relação à direção do campo magnético.
Se o novo valor da velocidade angular do elétron for ω, então de acordo com (8.35), a força radial de
Lorentz devida ao campo magnético é:
e
FB = ± Bωr . (8.36)
c
Os sinais são determinados pela lei de Lenz, sendo que o movimento adicional do elétron devido à
variação do campo magnético externo é tal que cria um campo magnético oposto à variação do primeiro.
Neste caso, no lugar da Eq. (8.34), temos a seguinte equação de movimento:
e
mω 2 r = mω02 r ± Bωr . (8.37)
c
Desta equação, podemos encontrar a frequência ω. Sendo que no átomo ω0 ≃ 1016 s−1 e tendo
eB/mc ≃ 1012 s−1 , podemos escrever aproximadamente:
eB
ω± = ω0 ± , (8.38)
2mc
mesmo para campos magnéticos intensos da ordem de 105 Gauss.
8
P. Zeeman, Philosophical Magazine 43, 226-239 (1897); Idem, 44, 55-66 e 255-259 (1897); Idem, Nature 55, 347 (1897);
Idem, Comptes Rendus de l’Académie de Sciences Française 124, 1444-1445 (1897).
“Z_2” — 2017/9/5 — 8:19 — page 194 — #214
eB
A quantidade 2mc é a frequência de Larmor,9 associada com o momentum angular orbital do elétron,
conforme vimos na Eq. (7.66). No caso mais geral, quando o campo magnético não é normal ao plano
da órbita, o torque magnético produz uma precessão da órbita do elétron em torno da direção de ~ B, com
velocidade angular ωL . É claro que, se a órbita estiver num plano paralelo a ~B, os elétrons não sofrerão
qualquer influência do campo magnético. Devido a natureza aleatória das orientações das órbitas eletrônicas,
esperaríamos então que as velocidades angulares dos elétrons tivessem valores típicos caracterizados pelas
frequências ω− , ω0 e ω+ .
Uma descrição avançada do efeito Zeeman, requer os conhecimentos da mecânica quântica. Para isso
consideramos o movimento de um elétron, de massa me , no campo central do núcleo. Na presença de um
campo magnético externo B, a sua hamiltoniana é:
1 ~ e ~ 2
H= P+ A − eΦ , (8.39)
2me c
~2 ~ 2 ~e ~ ~
H =− ∇ + (A · ∇) − eΦ . (8.40)
2me i me c
Escolhendo a direção do campo magnético na direção ẑ, com as componentes do potencial vetor:
1 1
Ax = − By , Ay = Bx e Az = 0 ,
2 2
~ · ∇Ψ
e, lembrando que em coordenadas polares, A ~ = 1 H dΨ , a equação de Schrödinger, 10 HΨ = EΨ, que
2 dϕ
descreve o movimento de um elétron atômico sob as forças combinadas do campo coulombiano e campo
magnético, é
~ 2 2me 2 i e 1 dΨ 2me ze2
∇ Ψ+ Em + B + Ψ = 0. (8.41)
~ ~c 2 dϕ ~2 r
Esta equação tem como solução geral,
destes loops eventualmente cancelam-se, de maneira que apenas a corrente I que flui em torno da fronteira
permanece. Vamos, então, calcular o trabalho que precisa ser feito para trazer um destes loops a partir do
infinito.
Considera-se, em primeiro lugar, uma partícula pontual ordinária mantido a um potencial (mecânico) U .
A taxa na qual esse potencial varia se a partícula muda a sua posição é
dU dU (~r(t)) ~ · d~r = −~F ·~v ,
= = ∇U
dt dt dt
em que ~F é a força atuando na partícula. Especificamente, para partículas carregadas movendo-se em nosso
sistema de loops, ~F = q~E, em que ~E é o campo elétrico induzido pela variação do fluxo magnético através
do loop que se aproxima do infinito.
Consideremos, agora, um elemento infinitesimal de volume d3 r dentro do loop. Assumindo que a carga
se move com velocidade ~v, a carga do elemento de volume é dada por q = ρd3 r a sua taxa de variação do
potencial dada por
dU
= −ρd3 r~v · ~E = d3 r ~J · ~E .
dt
“Z_2” — 2017/9/5 — 8:19 — page 196 — #216
Podemos agora usar a lei de indução e expressar o campo elétrico em termos de quantidades magnéticas:
I Z Z I ~
~E · d~l = − 1 d~
B 1 d(∇ ~
~ × A) 1 dA ~
· n̂ da = − · n̂ da = − · dl .
c δS dt c δS dt c dt
~
~E = − 1 dA ,
c dt
~
em que ddtA representa a alteração no potencial vetor devido ao movimento do loop. Assim, a taxa na qual o
potencial de um elemento de volume muda é dada por
dU 1 ~
dA
= d3 r ~J · .
dt c dt
Integrando ao longo do tempo e do espaço, descobrimos que a energia potencial total do circuito, devido à
presença de um potencial vetor, é dada por
Z
1
W = d3 r ~J · A
~ . (8.44)
c
Embora derivada para o caso específico de um loop de corrente, a Eq. (8.44) vale para distribuições gerais
de correntes sujeitas a um campo magnético.12
Agora, podemos assumir que deslocamos o circuito com uma corrente fixa em relação ao campo mag-
nético. A alteração na energia potencial que corresponde a um pequeno deslocamento é dada pela relação
Z
1
δW = d3 r ~J · δA
~ ,
c
~ × δA
em que ∇ ~ = δ~
B indica a alteração da intensidade do campo. Usando
~ = 4π ~J ,
~ ×H
∇
c
temos
Z Z
1 ~ × H)
~ · δA ~ = 1
δW = d3 r (∇ d3 r ǫijk (∂j Hk )δAi
4π 4π
Z Z
1 1 ~ · δ~
= d3 r Hk ǫijk ∂j δAi = d3 r H B.
4π 4π
Na sua forma atual, a relação anterior é aplicável a todos os meios magnéticos, incluindo substâncias ferro-
magnéticas. Assumindo que o meio é paramagnético ouRdiamagnético, tal que exista a relação linear entre
~ e~
H ~ · δ~
B, então H B = 12 δ(H ~ ·~
B), i.e., δW = 8π 1
δ d3 r H~ ·~
B. Finalmente, somando sobre todas as
mudanças necessárias para trazer o loop de corrente do infinito, obtemos
Z
1 ~ ·~
W = d3 r H B, (8.45)
8π
para a energia do campo magnético.
12
Por exemplo, para a densidade de corrente carregada por uma partícula pontual em ~r(t), ~J = qδ(~r − ~r(t))~v(t), obtemos
~ (~r(t)), i.e., a familiar contribuição da força de Lorentz para a lagrangiana de uma partícula carregada.
W = q~v(t) · A
“Z_2” — 2017/9/5 — 8:19 — page 197 — #217
A indução magnética ~ ~ × A.
B pode ser substituída por ∇ ~ Então
~ ·~
H B=H~ ·∇~ ×A~ =A~ ·∇
~ ×H ~ +∇~ ·A
~ ×H
~
~ · (∇
=A ~ × H)
~ +∇~ · (A
~ × H)
~ .
Substituindo em (8.45),
Z Z
1 ~ · (∇
~ × H)
~ + 1 ~ · (A
~ × H)
~ .
W = d3 r A d3 r ∇
8π 8π
~ ×H
A segunda integral da relação acima se anula de acordo com o teorema de Gauss e usando ∇ ~ = 4π ~J
c
na primeira integral, temos Z
1 ~ · ~J d3 r .
W = A (8.46)
2c
Considerando um condutor linear, então ~Jd3 r = Id~r e
n Z
1 X ~ · d~rk .
W = Ik A
2c
k=1
Logo,
n
1 X
W = Ik Fk .
2c
k=1
1 P
Finalmente, usando c Fk = i Lki Ii e relação de simetria Lki = Lik , temos
n n n
1X XX
W = Lk Ik2 + Mki Ik Ii , (8.47)
2
k=1 k=1 i=1
em que Lk é a autoindutância do k-ésimo circuito e Mki = Lki é a indutância mútua entre o k-ésimo e o
i-ésimo circuitos. Assim, temos uma relação entre a energia e as indutâncias.
De fato as Eqs. (8.48) são inconsistentes conforme estão escritas. Maxwell notou, em 1865, a inconsistência
e as transformou num conjunto coerente que implicava novos fenômenos físicos.13 O conjunto modificado
é conhecido como as equações de Maxwell.
~ · ~J = 0. Esta con-
A falha está na lei de Ampère. Ela foi derivada para uma corrente estacionária, com ∇
~
dição sobre a divergência de J está contida profundamente na lei de Ampère, como podemos ver tomando
a divergência em ambos os lados:
4π ~ ~ ~ · (∇
~ × H)
~ ≡0.
∇·J = ∇ (8.49)
c
Enquanto ∇~ · ~J = 0 vale para problemas estacionários, a relação completa está dada pela equação da
continuidade para a carga e a corrente
∇~ · ~J + ∂ρ = 0 . (8.50)
∂t
Maxwell notou que a equação da continuidade pode ser convertida numa divergência nula usando a lei de
Coulomb (8.48a). Assim,
!
∂ρ 1 ∂ ~
D
~ · ~J +
∇ =∇~ · ~J + =0. (8.51)
∂t 4π ∂t
~
~J −→ ~J + 1 ∂ D , (8.52)
4π ∂t
para campos dependentes do tempo. Assim, a lei de Ampère será dada por
~
∇ ~ = 4π ~J + 1 ∂ D ,
~ ×H (8.53)
c c ∂t
sendo a mesma para fenômenos estacionários, mas agora consistente com a equação da continuidade no
caso de campos dependentes do tempo. Maxwell chamou o termo adicional em (8.52) de corrente de des-
locamento. A corrente de deslocamento já havia aparecido no desenvolvimento da Eq. (1.9).
Logo, o conjunto das quatro equações,
~ ·D
∇ ~ = 4πρ (8.54a)
~ ·~
∇ B=0 (8.54b)
~
~ × ~E = − 1 ∂ B
∇ (8.54c)
c ∂t
~
~ ×H
∇ ~ = 4π ~J + 1 ∂ D , (8.54d)
c c ∂t
conhecidas como as equações de Maxwell, formam a base completa de todos os fenômenos do eletromag-
netismo clássico. Quando combinadas com a equação da força de Lorentz e a segunda lei de Newton, essas
equações fornecem uma descrição completa da dinâmica clássica da interação de cargas e dos campos ele-
tromagnéticos.
13
J. C. Maxwell, Philosophical Transactions of the Royal Society of London, 155, 459-512 (1865).
“Z_2” — 2017/9/5 — 8:19 — page 199 — #219
~ ~ ×A
B=∇ ~ (8.55)
1 ∂ ~ ~
∇2 Φ + (∇ · A) = −4πρ (8.57)
c ∂t
~
2~ 1 ∂2A ~ ∇ ~ ·A
~ + 1 ∂Φ 4π
∇ A− 2 2
−∇ = − ~J . (8.58)
c ∂t c ∂t c
Reduziremos o conjunto de quatro equações de Maxwell a um conjunto de duas equações. Mas ainda elas
~ i.e.,
estão acopladas. Podemos desacoplá-las explorando a arbitrariedade na definição do potencial vetor A,
fazendo a transformação
~ −→ A
A ~′=A ~ + ∇Ψ~ . (8.59)
Para que o campo elétrico (8.56) fique também invariante, o potencial escalar deve ser transformado simul-
taneamente na forma
1 ∂Ψ
Φ −→ Φ′ = Φ − . (8.60)
c ∂t
O termo Ψ é uma função escalar. O grau de liberdade envolvido em (8.59) e (8.60) significa que podemos
~ de tal forma que satisfaça a condição de Lorenz,14
escolher um par de potenciais (Φ, A)
∇ ~ + 1 ∂Φ = 0 .
~ ·A (8.61)
c ∂t
Isto desacopla as equações (8.56) e (8.58) obtendo então duas equações de onda inomogêneas, uma para Φ
~
e outra para A:
1 ∂2Φ
∇2 Φ − = −4πρ (8.62)
c2 ∂t2
2~
~ − 1 ∂ A
∇2 A = −
4π ~
J. (8.63)
c2 ∂t2 c
As três últimas equações formam um conjunto equivalente as equações de Maxwell no vácuo, como obser-
vado por Lorenz e outros.
Como sabemos, as transformações (8.59) e (8.60) são denominadas transformações de calibre, do inglês
gauge, e a invariância dos campos sob estas transformações se chama invariância de gauge, ou de calibre.
Para ver que sempre podemos escolher os potenciais que satisfaçam à condição de Lorenz, suponhamos
14
L. V. Lorenz, Phil. Mag. Ser. 3, 34, 287 (1867).
“Z_2” — 2017/9/5 — 8:19 — page 200 — #220
~ que satisfazem (8.57) e (8.58) mas não à equação (8.61). Façamos então uma
que os potenciais Φ e A,
~ ′ e Φ′ satisfazendo à condição de Lorenz:
transformação de calibre para os potenciais A
′ 2
∇ ~ ′ + 1 ∂Φ = 0 = ∇
~ ·A ~ + 1 ∂Φ + ∇2 Ψ − 1 ∂ Ψ .
~ ·A (8.64)
c ∂t c ∂t c2 ∂t2
Assim, dada uma função de calibre Ψ satisfazendo
1 ∂2Ψ ~ + 1 ∂Φ ,
~ ·A
∇2 Ψ − = − ∇ (8.65)
c2 ∂t2 c ∂t
~ ′ e Φ′ satisfarão a condição de Lorenz e as equações de onda (8.62) e (8.63).
os novos potenciais A
Ainda para os potenciais que satisfazem à condição de Lorenz (8.61) existe uma arbitrariedade. Podemos
ver que a transformação de calibre restrita
~ −→ A
A ~′=A ~ + ∇Ψ
~
1 ∂Ψ
Φ −→ Φ′ = Φ − , (8.66)
c ∂t
em que
1 ∂2Ψ
∇2 Ψ − =0 (8.67)
c2 ∂t2
preserva a condição de Lorenz se A ~ e Φ a satisfaçam inicialmente. Os potenciais nessa classe restrita
pertencem ao chamado calibre de Lorenz. O calibre de Lorenz é utilizado: primeiro, porque permite a
~ em pé de igualdade
obtenção das equações de onda (8.62) e (8.63), as quais tratam aos potenciais Φ e A
e segundo, porque ele é um conceito que é invariante sob as transformações de Lorentz, as quais são as
transformações de coordenadas da relatividade especial, como já vimos em capítulos anteriores.
Um outro calibre útil é o chamado calibre de Coulomb, de radiação ou transversal. Este é o calibre em
que
~ ·A
∇ ~ =0. (8.68)
Da Eq. (8.57), vemos que o potencial escalar satisfaz a equação de Poisson
∇2 Φ = −4πρ , (8.69)
com a solução Z
ρ(~r′ , t) 3 ′
Φ(~r, t) = d r . (8.70)
|~r −~r′ |
O potencial escalar é justamente o potencial coulombiano instantâneo, devido à densidade de carga ρ(~r, t).
Esta é a origem do nome calibre de Coulomb.15
O potencial vetor satisfaz a equação de onda inomogênea
~
1 ∂2A 4π 1 ~ ∂Φ
~ −
∇2 A = − ~J + ∇ . (8.71)
2
c ∂t 2 c c ∂t
15
“Um fato relevante a respeito do calibre de Coulomb é que, quando estamos considerando este calibre, o potencial elétrico
(8.70) em um ponto P (~r) do espaço e em um instante de tempo t é determinado pela distribuição de cargas ρ(~r, t) no instante
de tempo t, independentemente de quão afastadas estiverem as cargas do ponto de observação P . Isto significa que o potencial
elétrico no calibre de Coulomb propaga-se de forma instantânea pelo espaço, violando, em princípio, a teoria da relatividade. A
questão é que a relatividade diz que nenhuma informação pode viajar mais rápido do que a luz, mas nada impede algo que não
transporte informação de se mover mais rápido que a luz. O potencial elétrico (8.70) sozinho não é uma grandeza mensurável,
lembre-se que ele não é o potencial elétrico usual da eletrostática, mas sim o campo elétrico derivado a partir de (8.56), o qual
depende também de A. ~ O potencial vetor magnético compensa o potencial elétrico no calibre de Coulomb, de forma que os
campos eletromagnéticos não violam a relatividade.” Ver K. D. Machado, Teoria do eletromagnetismo (2007).
“Z_2” — 2017/9/5 — 8:19 — page 201 — #221
O termo de “corrente” envolvendo o potencial escalar pode, em princípio, ser calculado a partir de (8.70).
Devido ao fato de que envolve o operador gradiente, ele é um termo irrotacional, i.e., o rotacional será nulo.
Isto sugere que ele pode cancelar o correspondente termo na densidade de corrente. A densidade de corrente
(ou qualquer campo vetorial) pode ser escrita como soma de dois termos,
~ × ~Jl = 0 ,
∇
~ · ~Jt = 0 .
∇
~ × (∇
∇ ~ × ~J) = ∇(
~ ∇~ · ~J) − ∇2 ~J , (8.73)
juntamente com
∇2 (1/|~r −~r′ |) = −4π δ(~r −~r′ )
pode-se mostrar que ~Jl e ~Jt serão construídos explicitamente na forma16
Z
~ ′ · ~J
~Jl = − 1 ∇
~ ∇
d3 r ′ (8.74)
4π |~r −~r′ |
Z ~J
~Jt = 1 ~ ~
∇×∇× d3 r ′ . (8.75)
4π |~r −~r′ |
~ ∂Φ = 4π~Jl .
∇ (8.76)
∂t
Assim, a fonte da equação de onda para A ~ será expressa inteiramente em termos da corrente transversal
(8.75):
2~
∇2 A ~ − 1 ∂ A = − 4π ~Jt . (8.77)
c2 ∂t2 c
Esta é a origem do nome calibre transversal. A denominação calibre de radiação está associada com a
emissão de radiação por cargas. O calibre de Coulomb é útil também na eletrodinâmica quântica, sendo
necessário quantizar apenas o potencial vetor magnético para estabelecer uma descrição quântica dos fótons.
O calibre de Coulomb é utilizado frequentemente quando não temos fontes presentes. Então Φ = 0 e A ~
satisfaz a equação de onda homogênea. Os campos são dados por
~
~E = − 1 ∂ A
c ∂t
(8.78)
~B = ∇
~ ×A
~ .
16
Outra observação é que a corrente transversal (8.75) estende-se por todo o espaço, mesmo se ~J for localizada. Ver O. L. Brill
and B. Goodman, American Journal of Physics, 35, 832 (1967).
“Z_2” — 2017/9/5 — 8:19 — page 202 — #222
Prova. Introduzimos coordenadas polares centradas em torno de~r′ e atuamos com a representação esférica
± i kr
do operador de Laplace em G± (r) = e r . Nota-se que a parte radial do operador de Laplace, ∇2r , é dado
∂2
por r12 ∂r
∂ ∂
r 2 ∂r = ∂r 2 ∂ 2 1 = −4πδ(~r). Assim, obtemos
2 + r ∂r e ∇r r
± i kr
2 2
~ ω) = ± ∂2 2 ∂ 2 e
(∇ + k )G (R, + +k
∂r 2 r ∂r r
2
± i kr ∂ 2 ∂ 1 ∓ i kr ∂ 1 ∂(e± i kr )
=e + + 2e
∂r 2 r ∂r r ∂r r ∂r
∓ i kr
2
e ∂ 2 ∂ 2 ± i kr
+ + + k e
r ∂r 2 r ∂r
Significado Físico das Funções de Green Para entendermos o significado físico da função de Green
retardada, substituímos G± da Eq. (8.88) em (8.81) e obtemos
Z r′ |
f ~r′ , t − |~r−~
c
Ψ(~r, t) = d3 r ′ ′
. (8.89)
|~r −~r |
Para qualquer instância fixa de espaço e de tempo, (~r, t), a solução de Ψ(~r, t) é afetada pela fonte de f (~r′ , t′ )
r′ |
em todos os pontos no espaço e tempos anteriores fixos t′ = t − |~r−~ c . Dito de outro modo, um tempo
r′ |
t − t′ = |~r−~ c tem de passar antes que a amplitude da fonte de f (~r′ , t′ ) possa provocar um efeito no ponto
de observação ~r no tempo t, o sinal recebido em (~r, t) é sujeito a um mecanismo de retardo. Quando o
sinal é recebido, é então submetido a uma intensidade de força f (~r′ , t′ )/|~r −~r′ |,19 similar ao potencial de
Coulomb na eletrostática. Na verdade, para uma fonte independente do tempo f (~r′ , t′ ) = f (~r′ ), podemos
ter um ansatz independente do tempo na equação de onda Ψ(~r), em que se reduz à equação de Poisson.
Resumindo, as fontes atuam como cargas de Coulomb instantânea nas quais são de intensidade de força
r′ |
f (~r′ , t′ ) e sentida em tempos t = t′ + |~r−~ c .
Exemplo – Considere uma fonte pontual na origem, sendo que a ocorrência das transmissões de sinais para
um curto instante de tempo ocorra ao redor de t′ ≃ 0, assim, f (~r′ , t′ ) = δ(~r′ )F (t′ ), em que a função
F é acentuadamente um pico em torno de t′ = 0 e descreve o perfil temporal da fonte. O sinal será
19
Intensidade de força vem do inglês strength.
“Z_2” — 2017/9/5 — 8:19 — page 204 — #224
Figura 8.4 Propagação de uma frente de onda de um pulso criado por uma fonte pontual na origem
esquematicamente representada em função do espaço bidimensional e do tempo. A largura da
frente de onda é definida por δx = cδt, em que δt é a duração do pulso de tempo. A sua intensidade
decai como ∼ x−1 .
b) Embora a função de Green avançada não carrega significado físico imanente, não é um objeto sem
sentido completamente. No entanto, a utilidade deste objeto se revela apenas em teorias quânticas.
Calibre do Campo Eletromagnético e Funções de Green Até agora, resolvemos a equação de onda de
uma fonte escalar arbitrária. Vamos agora trabalhar com as equações de onda
4π
∂ν ∂ ν Aµ = jµ , ∂µ Aµ = 0 (calibre de Lorenz)
c
para as componentes do potencial electromagnético Aµ . Para uma primeira aproximação, estas são quatro
equações de onda escalares independentes para os quatro fontes jµ . Podemos, portanto, apenas copiar a
20
Para uma possível interpretação física para a solução avançada ver: J. A. Wheeler and R. P. Feynman, Reviews of Modern
Physics, 17, 157-181 (1945); J. L. Anderson, American Journal of Physics, 60, 465-476 (1992).
“Z_2” — 2017/9/5 — 8:19 — page 205 — #225
1 ∂Φ ~ ~
∂µ Aµ = 0 ⇔ + ∇·A = 0,
c ∂t
temos que verificar se esta condição foi cumprida pelas soluções (8.91). De um modo semelhante, temos
que ter em mente que as fontes não são muito independentes, eles obedecem a equação de continuidade
∂ρ ~ ~
∂µ j µ = 0 ⇔ + ∇·J = 0.
∂t
Aqui será mais conveniente investigar o comportamento de calibre do potencial vetor numa linguagem
de Fourier totalmente desenvolvida. Além disso, vamos usar a notação de quadrivetor. Nesta notação, a
transformada de Fourier assume a forma
Z
µ
˜
f (k) = d4 x f (x) ei xµ k , (8.92)
em que um fator de 1c foi absorvido na medida de integração e kµ = (k0 , ~k) com k0 = cω2 . A transformada
de Fourier de uma equação de onda escalar (8.79) torna-se kµ kµ Ψ(k) = −4πf (k). Especificamente, a
função de Green obedece à equação kµ kµ G(k) = −1, cuja solução é G(k) = − kµ1kµ . 21 A solução geral da
equação de onda escalar (8.81) obtém-se pela convolução da função de Green e da fonte,
Z
f (x) = 4π (G ∗ g) (x) = 4π d4 x G(x − x′ )g(x′ ) .
Potenciais em Meios Materiais Utilizando as relações (7.96) e (7.112), podemos escrever os potencias
escalar e vetor em termos da polarização e magnetização. Os termos ~P de polarização e M
~ de magnetização
se anulam no vácuo, tal que essas quantidades representam a influência de um meio material no campo
eletromagnético.
Assumindo um material não condutor (σ = 0) e considerando o campo na região onde as densidades de
carga e corrente são nulas (ρ = ~J = 0), podemos escrever as equações de Maxwell na forma:
~ · ~E = 4πρℓ
∇ (8.94a)
~ ×~ 1 ∂~E 4π
∇ B− = ~Jℓ (8.94b)
c ∂t c
~
~ × ~E + 1 ∂ B = 0
∇ (8.94c)
c ∂t
~ · ~B = 0 ,
∇ (8.94d)
em que ρℓ e ~Jℓ são as densidades de carga livre e de corrente livre, respectivamente, definidas por
~ · ~P
ρℓ = −∇ (8.95)
e
~
~Jℓ = ∂ P + c ∇~ ×M ~ . (8.96)
∂t
Assim, segue-se por analogia ao feito anteriormente, as equações de onda para os potenciais escalar e vetor
serão,
1 ∂2Φ
∇2 Φ − = −4πρℓ (8.97)
c2 ∂t2
2~
~ − 1 ∂ A
∇2 A = −
4π ~
Jℓ . (8.98)
c2 ∂t2 c
Em termos de polarização e magnetização, as soluções das Eqs. (8.97) e (8.98) são expressas na forma
Z
1 h~ ′ ~ i
Φ=− ∇ · P dV ′ (8.99)
R
e " #
Z
~ = 1 ~′ ~ 1 ∂ ~P
A ∇ ×M+ dV ′ , (8.100)
R c ∂t
em que R ≡ |R| ~ = |~r −~r′ |. Aqui os diferenciais divergente e rotacional são com respeito as coordenadas
(x , y , z ) do ponto de integração~r′ situado no elemento de volume dV ′ , e os colchetes denotam valores de
′ ′ ′
retardo, i.e., o argumento t é substituído por t′ = t − |~r −~r′ |/c dentro de cada colchete.
As soluções das Eqs. (8.102) e (8.103) podem ser obtidas com o auxílio da função de Green retardada, que
satisfaz a equação diferencial inomogênea 24
1 ∂2
∇ − 2 2 G+ (~r, t;~r′ , t′ ) = δ(~r −~r′ ) δ(t − t′ ) .
2
c ∂t
em que R ≡ |R|~ = |~r −~r′ |. Com o auxilio da equação anterior, escrevemos a equação do campo elétrico
(8.102) como,
Z 3 ′Z !
d r R 1 ∂~J(~r′ , t′ )
~E(~r, t) = − dt′ δ t′ − t − ~ ′ ρ(~r′ , t′ ) +
∇
R c c2 ∂t′
Z Z " #
~′ ∂~J
3 ′ [∇ ρ] 1
=− d r − d3 r ′ 2 , (8.104)
R c R ∂t
em que a notação [· · · ] denotam valores de retardo, i.e., é uma função de~r′ e evoluem no tempo de retardo
t′ = t − |~r −~r′ |/c dentro colchete.
Neste ponto, devemos tomar muito cuidado, porque ∇ ~ ′ [ρ] 6= [∇
~ ′ ρ]. O significado de ∇ ~ ′ sob o colchete
retardado é um gradiente espacial em x′ , com t′ fixo; o significado do lado de fora do colchete retardado
é um gradiente espacial em relação a ~r′ , com ~r e t fixos. Desde que [f (~r′ , t′ )] = f (~r′ , t − R/c), é neces-
sário corrigir a dependência de ~r′ introduzido através R quando o operador gradiente é levado para fora.
Explicitamente, temos
~ ρ] = ∇
′ ~ [ρ] −
′ ∂ρ ~ (t − R/c) = ∇
′ ~ [ρ] −
′ n̂ ∂ρ
[∇ ∇ ,
∂t c ∂t
24
T. G. Vold, American Journal of Physics, 61 N.6, 505-513 (1993).
“Z_2” — 2017/9/5 — 8:19 — page 208 — #228
~
R
em que n̂ = R. Assim, usando essa relação, correta, encontramos
Z Z " #
∇~ ′ [ρ] Z n̂ ∂ρ 1 ∂~J
~E(~r, t) = − d3 r ′ + d3 r ′ − d3 r ′ 2
R cR ∂t c R ∂t
Z Z Z " #
n̂ n̂ ∂ρ 1 ∂~J
= d3 r ′ 2 [ρ] + d3 r ′ − d3 r ′ 2 . (8.105)
R cR ∂t c R ∂t
R ~′
No último passo, a integral d3 r ′ ∇R[ρ] foi realizada por partes e descartamos termos de superfície, porque
a distribuição de carga está localizada. A Eq. (8.105) é uma das equações de Jefimenko.25 Observe o ca-
ráter retardado do campo elétrico. O primeiro termo do lado direito da Eq. (8.105) é o termo de Coulomb
retardado.
Para obter a expressão desejada do campo magnético , usaremos a função de Green retardada e reescre-
vemos a Eq. (8.103) como
Z 3 ′Z
~B(~r, t) = 1 d r ′ ′
dt δ t − t −
R ~ ′ × ~J(~r′ , t′ )
∇
c R c
Z 3 ′
1 d r ~′ ~
= [∇ × J] . (8.106)
c R
Se usarmos
" #
∂~J
~ ′ × ~J] = ∇
[∇ ~ ′ × [~J] + ~ ′ (t − R/c)
×∇
∂t
" #
~ ′ × [~J] + 1 ∂~J
=∇ × n̂ ,
c ∂t
O primeiro termo do lado direito da relação anterior se anula devido o fato da distribuição de corrente ser
~ ′ (1/R) = −n̂/R2 , temos
localizada no espaço. Usando a relação ∇
Z " # !
n̂ ∂~J n̂
~
B(~r, t) = d r [~J] ×
3 ′
+ × 2 . (8.108)
cR2 ∂t c R
O primeiro termo do lado direito desta equação é o termo de Biot-Savart retardado e o segundo termo
contêm o campo de radiação transversal. A Eq. (8.108) é a segunda equação de Jefimenko.26 Há expressões
~ eH
semelhantes para D ~ para as equações de Jefimenko, na qual se discute as soluções das equações de
Maxwell para campos elétrico e magnético em meios arbitrários.27
25
O. D. Jefimenko, Electricity and magnetism: an introduction to the theory of electric and magnetic fields (1989), Sec. 15.7.
26
Mesma referência anterior.
27
O. D. Jefimenko, American Journal of Physics, 60 N.10, 899-902 (1992).
“Z_2” — 2017/9/5 — 8:19 — page 209 — #229
~β = − 1 d (Rn̂) ,
c dt′
a Eq. (8.111) será expressa como
~E(~r, t) = q n̂ 1 ∂R 1 ∂ n̂ 1 ∂R 1 ∂
1− + 1− + (Rn̂)
R2 c ∂t c ∂t R c ∂t Rc ∂t
n̂ R ∂ n̂ 1 ∂ 2 n̂
=q + + 2 . (8.112)
R2 c ∂t R2 c ∂t2
28
Richard Philips Feynman (1918-1988), físico americano.
29
Alfred-Marie Liénard (1869-1958), físico e engenheiro francês.
Emil Johann Wiechert (1861-1928), físico e geofísico alemão.
“Z_2” — 2017/9/5 — 8:19 — page 210 — #230
Esta é a fórmula originalmente desenvolvida, em 1902, por Heaviside,30 e, redescoberta mais tarde por
Feynman, na qual comumente chamamos de fórmula de Feynman.31 Sendo assim, chamaremos esta expres-
são de fórmula de Heaviside-Feynman.
Para calcular o campo ~B, usaremos ~ B=∇ ~ × A.
~ Assim,
" !#
~β × n̂ 1 ∂ ~β × n̂
~B(~r, t) = q + . (8.113)
KR2 c ∂t KR
M ~ =− 1 H
~ = χm H ~ .
4π
30
O. Heaviside, Electromagnetic Theory (1971), volume III, p.437.
31
R. P. Feynman, R. B. Leighton, and M. Sands, The Feynman lectures on physics (1963), Vol. 1, Chapter 28 e Vol. 2, Chapter 21.
32
O. Heaviside, Electromagnetic Theory (1971), volume III, p.436.
33
R. P. Feynman, R. B. Leighton, and M. Sands, The Feynman lectures on physics (1963), Vol. 1, Chapter 28 e Vol. 2, Chapter 21.
34
Heike Kamerlingh Onnes (1853-1926), físico holandês.
35
H. K. Onnes, Comm. Phys. Lab, Univ. Leyden, Nos. 119, 120, 122 (1911).
36
Fritz Walther (Meißner) Meissner (1882-1974), físico alemão.
37
Robert Ochsenfeld (1901-1993), físico alemão.
38
W. Meissner and R. Ochsenfeld, Naturwissenschaften, 21, 787-788 (1933).
“Z_2” — 2017/9/5 — 8:19 — page 211 — #231
A supercondutividade dos materiais tornou-se um dos fenômenos físicos mais intrigantes e desafiadores
do século XX. Em 1934 Heinz e Fritz London 39 anunciaram uma teoria fenomenológica para explicar o
efeito Meissner. A teoria de London-London é baseada nas equações do eletromagnetismo e na propriedade
básica de um supercondutor, i.e., resistência nula. 40 Em 1950, Ginzburg 41 e Landau 42 criaram uma teoria
que descreve a transição entre a fase supercondutora e a fase normal. 43 Pode-se notar que, quando essa
teoria apareceu, a teoria Ginzburg-Landau parecia bastante fenomenológica e não foi muito apreciada na
literatura científica ocidental. Porém, foram necessários mais sete anos de trabalho até a formulação de
uma teoria microscópica convincente, elaborada por Bardeen, 44 Cooper e Schrieffer 45 em 1957. 46 Esta
teoria, conhecida como teoria BCS, explicava os fenômenos até então observados, e foi baseada no teorema
fundamental, que afirma que, para um sistema de muitos elétrons com temperatura crítica Tc pequena,
qualquer atração fraca, não importa quão pequena ela é, pode ligar dois elétrons, formando o chamado par
de Cooper. 47 Posteriormente, em 1959, Gor’kov 48 percebeu que a teoria Ginzburg-Landau era equivalente
à teoria BCS em torno do ponto crítico Tc , 49 e esse resultado vindica a teoria Ginzburg-Landau como uma
obra-prima da física. Além disso, Gor’kov provou que as quantidades fundamentais das duas teorias, i.e..,
o gap de energia, para formação do par de Cooper, da teoria BCS e o parâmetro de ordem ϕ(~r) da teoria
Ginzburg-Landau, foram relacionados por uma constante de proporcionalidade e o parâmetro de ordem
ϕ(~r) pode ser pensado como a função de onda do par de Cooper no sistema de centro de massa. Entretanto,
em 1986, Müller 50 e Bednorz 51 descobriram a supercondutividade com alto valor para a temperatura crítica
Tc . 52 Verificou-se que a teoria BCS não explicava a supercondutividade desses materiais, que até o momento
não têm uma teoria microscópica (quântica) completa.
39
Heinz London (1907-1970), físico alemão.
Fritz Wolfgang London (1900-1954), físico alemão.
40
H. London and F. London, Proceedings of Royal Society of London, A149, 71 (1935); Idem, Physica, 2, 341 (1935).
41
Vitaly Lazarevich Ginzburg (1916-2009), físico e astrofísico russo-soviético.
42
Lev Davidovich Landau (1908-1968), físico russo-soviético.
43
V. L. Ginzburg and L. D. Landau, Zh. Eksp. Teor. Fiz., 20, 1064 (1950).
44
John Bardeen (1908-1991), físico americano.
45
John Robert Schrieffer (1931- ), físico americano.
46
J. Bardeen, L. N. Cooper, and J. R. Schrieffer, Physical Review, 106, 162-164 (1957); Idem, 108, 1175 (1957).
47
L. N. Cooper, Physical Review, 104 N.4, 1189 (1956).
48
Lev Petrovich Gor’kov (1929-2016), físico russo-soviético-americano.
49
L. P. Gor’kov, Soviet Physics JETP, 36, 1364 (1959).
50
Karl Alexander Müller (1927- ), físico suíço.
51
Johannes Georg Bednorz (1950- ), físico alemão.
52
J. G. Bednorz and K. A. Müller, Zeitschrift für Physik, B62 N. 2, 189-193 (1986).
“Z_2” — 2017/9/5 — 8:19 — page 212 — #232
d~J ns e2 ~
= E. (8.116)
dt µ
Substituindo esta expressão para o campo elétrico
~
~E = − 1 ∂ A ,
c ∂t
obtemos,
∂ ~ ns e2 ~
J+ A = 0.
∂t µc
Assim, podemos concluir que
2
~J = − ns e A
~ . (8.117)
µc
Esta é a equação de London, que relaciona a corrente com o campo magnético num supercondutor.
Para obter a equação do campo A,~ usamos a relação do campo magnético ∇ ~ × ~B = 4π~J. Porém,
c
sabemos que ~B = ∇ ~ Logo,
~ × A.
~ ×∇
∇ ~ ×A ~ = 4π ~J .
c
Utilizando as conhecidas relações entre operadores ∇,~ e a relação ∇
~ ·A
~ = 0, obtemos a equação que
~
descreve a variação do campo A num supercondutor,
2
∇ ~ = − 4π ~J = 4πns e A
~ 2A ~ . (8.118)
c µc2
Vamos utilizar a Eq. (8.118) para calcular o campo magnético num supercondutor semi-infinito, com su-
perfície plana. Supondo que o campo é uniforme na parte externa, x < 0, sendo paralelo a superfície,
~ = A0 ẑ. Como Az só varia na direção x, a Eq. (8.118) em x > 0 reduz-se a,
A
d2 Az (x) 1
= 2 Az (x) , (8.119)
dx2 λL
1/2
µc2
em que λL = 4πns e2
é o comprimento de London. A solução desta equação é
Como o campo deve ser finito em x → ∞, é preciso que C2 = 0. Devido à continuidade na superfície
x = 0, C1 = A0 . Portanto,
Az (x) = A0 e−x/λL . (8.121)
“Z_2” — 2017/9/5 — 8:19 — page 213 — #233
Assim, o campo externo aplicado ao supercondutor penetra apenas numa camada de espessura λL na su-
perfície, e decai exponencialmente tendendo a zero no seu interior. Como λL está na faixa de 500-5000 Å,
a camada é muito fina, de modo que o campo praticamente não penetra no interior do supercondutor. Este
resultado explica o efeito Meissner.
Outra contribuição da equação de London vem por conta de tomarmos a corrente elétrica através da
mecânica quântica, na qual é −e vezes a probabilidade da corrente ~J, conforme Feynman:53
h i
~J = − ~e ϕ∗ ∇ϕ
~ − (∇ϕ)~ ∗ϕ .
i 2µ
~ o operador momentum será ~p + e A,
Em um campo magnético, A, ~ tal que a corrente é dada por
c
∗
~J = − e ϕ∗ ~ ∇ ~ + eA~ ϕ+ ~~ e~
∇+ A ϕ ϕ
2µ i c i c
h i 2
=−
~e
ϕ∗ ∇ϕ ~ ∗ ϕ − e Aϕ
~ − (∇ϕ) ~ ∗ϕ . (8.122)
i 2µ µc
~ = 0, temos
Com A h i
~J = − ~e ϕ∗0 ∇ϕ
~ 0 − (∇ϕ
~ 0 )∗ ϕ0 = 0 .
i 2µ
~ 6= 0, ϕ0 transforma-se em ϕ. Se ϕ ≈ ϕ0 , então a Eq. (8.122) nos dá
Quando A
2 2
~J = − e Aϕ
~ ∗ ϕ = − ns e A
~ , (8.123)
µc µc
em que ns = ϕ∗ ϕ. Vemos então que, se a função de onda é “rígida”, i.e., se ela não muda quando é
introduzido um campo A, ~ então a Eq. (8.123) implica na Eq. (8.117). O que poderia causar essa rigidez?
Pela teoria de perturbação, 54 temos
X hϕn |Hpert |ϕ0 i
|ϕi ∼
= |ϕ0 i + |ϕn i ,
(En − E0 )
n6=0
53
A discussão segue a do magnífico texto de R. P. Feynman, R. B. Leighton, and M. Sands, The Feynman lectures on physics
(1963), ou R. P. Feynman, Statistical mechanics - A set of Lectures (1972).
54
Para o estudo da teoria de perturbação em mecânica quântica, ver J. R. P. Mahon, Mecânica Quântica - desenvolvimento
contemporâneo com aplicações (2011).
55
A discussão segue a do texto de R. P. Feynman, Statistical mechanics - A set of Lectures (1972).
56
Para uma revisão do princípio variacional em mecânica clássica, ver Goldstein, Classical mechanics (1980), ou o livro de
Landau e Lifshitz, Mechanics (1993).
“Z_2” — 2017/9/5 — 8:19 — page 214 — #234
Usando Eq. (8.127) com Eq. (8.126), temos a equação de Schrödinger e sua complexa conjugada.
√
Se escrevermos ϕ = ρ ei θ , podemos considerar L como uma função de ρ e θ e de suas derivadas.
Então
δL δL ∂ϕ δL ∂ϕ∗ δL δL ∂ϕ δL ∂ϕ∗
= + ∗ =0 e = + ∗ = 0. (8.128)
δρ δϕ ∂ρ δϕ ∂ρ δθ δϕ ∂θ δϕ ∂θ
Em termos de ρ e θ,
ρ ~ q ~ 2 ~2 ~ √ ~ √ ~
L= ~∇θ − A + ∇ ρ · ∇ ρ + qΦρ + ~ρθ̇ + ρ̇ .
2µ c 2µ 2i
Segue-se que
1 2 ~ · ρ~v + ρ̇ = 0 ,
µv + qΦ + U = −~θ̇ e ∇ (8.129)
2
em que
1 ~ q~ ~2 1 ~ 2 √
~v = ~∇θ − A e U =− √ ∇ ρ. (8.130)
µ c 2µ ρ
A propósito ∗
~J = 1 ∗
ϕ
~~ q~
∇− A ϕ+
~~ q~
∇ − A ϕ ϕ = ρ~v
2µ i c i c
é a corrente de probabilidade, e não a corrente elétrica.
Agora, como tudo isso se aplica para a supercondutividade? Nos supercondutores, os elétrons no estado
fundamental vêm em pares com spins opostos. A combinação linear de tais pares com a menor energia pode
ser considerado uma partícula. Desde que o spin é zero, a “partícula” obedece a estatística de Bose, 57 e o
estado fundamental de um supercondutor tem um grande número de “partículas” no mesmo estado. Se ρ é
tal que ϕ é normalizada, a Eq. (8.129) descreve o movimento de uma única “partícula”, mas pelo fato das
“partículas” serem bósons, qualquer número pode estar no mesmo estado e ρ será a densidade de número.
A equação de Maxwell e a densidade macroscópica, para um supercondutor, são dadas pelas equações 58
~ ×~ 4π
∇ B = ~J , ~
B=∇ ~ ×A~ ,
c
∗
~J = q ∗ ~ q
~ − A~ ϕ+ ~ q
~ − A~ ϕ ϕ .
ϕ ∇ ∇ (8.131)
4µ i c i c
57
Satyendra Nash Bose (1894-1974), físico hindu.
Para um estudo da estatística de Bose ou estatística de Bose-Einstein, ver J. R. P. Mahon, Mecânica Quântica - desenvolvimento
contemporâneo com aplicações (2011).
58
O sistema é descrito pela distribuição do número de ocupação, ou sua transformada de Fourier, ϕ(~r). Assim, |ϕ(~r)|2 representará
a densidade real das partículas, e não mais a densidade de probabilidade.
“Z_2” — 2017/9/5 — 8:19 — page 215 — #235
Nota-se que q = −2|e| é a carga do par de Cooper e µ = duas vezes a massa efetiva do elétron, i.e.,
2µ é a massa do par de Cooper. Observa-se também que se ρ é o densidade de número, somos obrigados a
modificar L, de tal forma que ρ não se afaste muito de algum valor característico do material. Logo, o estado
supercondutor será caracterizado por uma densidade constante não nula, ρ = ns = ϕ∗ ϕ = constante 6= 0.
Claro que tal estado é chamado de condensação dos pares de Cooper.
Análogo ao resultado de (8.130), a corrente terá a forma
~J = qρ ~∇θ ~ − qA ~ .
2µ c
~ · ~J = 0, i.e.,
Como ρ é constante, da equação de continuidade temos que ∇
~ 2θ = 0 ,
∇ (8.132)
em que usamos ∇ ~ ·A~ = 0. Dentro do volume de um supercondutor, a Eq. (8.132) implica que a fase θ é
constante. Assim,
2
~J = − q ns A
~ ,
2µc
que é a equação de London.
Algo muito interessante acontece quando o material supercondutor tem a forma toroidal. Considere a
corrente supercondutora que flui em um toróide. Ao circular no toróide, um par de Cooper deve manter a
coerência de fase da função de onda. Mas, por outro lado, ao dar uma volta completa no toróide, a função
de onda deve recuperar seu valor inicial, devido a unicidade do estado quântico. Consequentemente, a
mudança de fase deve ser um múltiplo inteiro de 2π. Assim, ao fazer um deslocamento d~l, a mudança de
fase da função de onda de um par de Cooper, levando em conta a unicidade do estado quântico, exige que
I
~ · d~l = 2πn ,
∇θ (8.133)
~
~ = 1 ∂ Πe + ∇
A ~ ×Π
~m (8.136)
c ∂t
Φ = −∇ ~e,
~ ·Π (8.137)
na qual, estas equações tem a mesma relação matemática das Eqs. (8.95) e (8.96).
~ eeΠ
Aplicando a condição de Lorenz, de forma análoga as anteriores, temos que os potenciais Π ~ m são
soluções das equações de onda inomogêneas,
1 ∂2Π~e
~ e−
∇2 Π = −4π~P (8.138a)
c ∂t2
2
2~
~ m − 1 ∂ Πm = −4π M
∇2 Π ~ . (8.138b)
c2 ∂t2
As soluções destas equações são expressas na forma de potenciais de retardo, ou potenciais retardados,
Z ~
~e= [P]ret
Π dV ′ (8.139a)
R
Z ~
~m= [M]ret
Π dV ′ , (8.139b)
R
~ será
De acordo com a Eq. (8.138a), o campo deslocamento elétrico D
!
1 ∂ ~m
Π
D~ =∇~ × − +∇ ~ ×Π ~e . (8.142)
c ∂t
59
Estas são generalizações de certas funções potenciais introduzidas para o campo eletromagnético de um dipolo oscilante feitas
por H. Hertz, Ann. d. Physik., 36, 1 (1889). O vetor característico do potencial de Hertz foi observado por A. Righi, Nouvo
Cimento, 2, 104 (1901), que introduziu o correspondente potencial magnético.
“Z_2” — 2017/9/5 — 8:19 — page 217 — #237
~ será
Finalmente, utilizando as Eqs. (8.140) e (8.138b), o campo magnético H
! !
1 ∂ ~e
Π 1 ∂ ~m
2Π
~ = ∇
H ~ × +∇~ ×Π ~m + ∇ Π 2 ~ m−
c ∂t c2 ∂t2
!
1 ∂ 1 ∂Π ~m
= +∇ ~ ×Π ~ e +∇ ~ ∇ ~ ·Π~m . (8.143)
c ∂t c ∂t
Ilustrações do uso dos potenciais de polarização, que discutem a radiação de multipolo em termos do
vetor de Hertz, estão em excelentes textos de eletromagnetismo.60 Mais a frente, Capítulo 11, faremos uma
discussão detalhada sobre ondas eletromagnéticas cilíndrica e esférica.
Esta substituição é chamada transformação de dualidade. Apesar dessa generalização das equações de
Maxwell parecer perfeitamente plausível, ela contém certas dificuldades que aparecem ao expressarmos o
campo magnético como o rotacional do potencial vetor:
~B = ∇
~ ×A
~ . (8.146)
Para ver porque esta equação pode conduzir a dificuldades, vamos integrar a equação
~ ·~
∇ B = 4πρm
sobre o volume de uma esfera que contém um monopolo magnético g. Usando o teorema de Gauss, temos:
Z
~
B · d~S = 4πg ,
ou seja, Z
~ ×A
∇ ~ · d~S = 4πg . (8.147)
Agora vamos considerar o lado esquerdo da Eq. (8.147). Podemos calcular a integral de ∇ ~ ×A ~ sobre
uma superfície esférica fechada, considerando primeiramente um pequeno círculo de raio δ que forma uma
abertura sobre essa superfície esférica.
Agora faremos o limite quando δ → 0. Usando o teorema de Stokes, a integral de ∇ ~ ×A ~ sobre uma
~ em torno desse pequeno círculo.
superfície esférica “aberta” é igual a integral de A
Z Z
∇~ ×A ~ · d~S = ~ · d~l .
A (8.148)
δ→0
Se A~ for livre de singularidades, então este potencial se aproxima de uma constante quando δ → 0. Logo,
o lado direito da Eq. (8.148) se reduz a I
A · d~l = 0 ,
~
ou seja, temos Z
~ ×A
∇ ~ · d~S = 0 , (8.149)
o que contradiz a Eq. (8.147). Para resolver este problema Dirac considerou a existência de singularidades
~ (~r), qualquer superfície fechada em torno de um monopolo magnético deve ter pelo menos um ponto
em A
em que A~ é singular de tal forma que a integral de linha de A
~ em torno da singularidade nos dá 4πg quando
δ → 0. Assim, temos um potencial vetor, que deve ser singular, porque
~ ·~
∇ B 6= 0 ⇒ ~ ~ ×A
B 6= ∇ ~ . (8.150)
~B(~r) = g ~r .
r3
Este potencial vetor, Eq. (8.151), tem uma linha de singularidades ao longo do semieixo positivo z, em que
θ = 0. Esta linha de singularidades é chamada de linha de Dirac do monopolo.
“Z_2” — 2017/9/5 — 8:19 — page 219 — #239
em que
~ ·~f (~r) = 4π δ(~r) ,
∇ (8.153)
tal que ~f tem suporte apenas ao longo da linha n̂ passando pela origem. A linha de singularidades é a
chamada linha de Dirac, e ~f é chamada de função de linha.
Talvez a consequência mais importante da teoria dos monopolos magnéticos seja a condição de quan-
tização para a carga elétrica. Considere um monopolo magnético g tal que ~
B(~r) = g r~r3 , o movimento de
uma partícula com massa m e carga elétrica q no campo magnético é dado por
q
m~a = ~v × ~
B, (8.154)
c
d2~r d~r
em que ~a = dt2
e ~v = dt . Podemos calcular a taxa de variação de seu momentum angular orbital,
d gq d gq
(~r × m~v) = ~r × m~a = 3 ~r × (~v ×~r) = r̂ .
dt r c dt c
Este resultado, primeiramente realizado por Poincaré, em 1896, nos leva a definição do momentum angular
total, 66
~J = ~r × m~v − gq r̂ , (8.155)
c
que é uma quantidade conservada. O segundo termo da Eq. (8.155) pode ser interpretado como o momentum
angular devido ao campo eletromagnético, pois usando sua definição, temos
Z !
~E × ~B
~L = ~r × dv
4πc
Z
g ~ · ~E)r̂ dv = gq r̂ .
= (∇ (8.156)
4πc c
Por simetria, as componentes Lx e Ly se anulam e temos somente a componente
gq
Lz = .
c
Nota-se que este resultado é independente da separação entre monopolo magnético e carga elétrica! De
acordo com a mecânica quântica, sabemos que
1
Lz = n~ ,
2
em que n = 0, ±1, ±2, · · · . Isto nos leva a seguinte relação:
gq 1
= n~ , (8.157)
c 2
que é justamente a condição de quantização de Dirac. Este resultado leva à notável conclusão de que a carga
elétrica é quantizada: para um dado g, q é proporcional ao inteiro n.
Se substituirmos q = e e n = 1 na Eq. (8.157), encontraremos a unidade fundamental da carga magné-
tica:
c~ 137
g= = e. (8.158)
2e 2
66
H. Poincaré, Compt. Rendus Acad. Sci. Paris, 123, 530 (1896).
“Z_2” — 2017/9/5 — 8:19 — page 220 — #240
Apesar da falta de evidência experimental conclusiva, 67 existem fortes razões teóricas para a existência dos
monopolos magnéticos. Elas decorrem de ideias gerais sobre a unificação das interações fundamentais.
Durante as últimas décadas, houve grandes avanços na compreensão das forças fracas e fortes entre as
partículas elementares.
G. t’ Hooft 68 e A. M. Polyakov 69 mostraram que as teorias unificadas contêm necessariamente partí-
culas estáveis que possuem carga magnética, i.e., monopolos magnéticos. 70 Estas aparecem como soluções
independentes do tempo com energia finita das equações não lineares dos campos. Portanto, a existên-
cia dos monopolos magnéticos é uma consequência muito geral da unificação das interações fundamen-
tais. Ainda nestes trabalhos, t’ Hooft e Polyakov fazem uma estimativa puramente teórica para a massa
de um monopolo magnético de 137 × mW , em que mW = 80 GeV/c2 é a massa dos W ± ; assim,
137 × 80 GeV/c2 = 104 GeV/c2 .
Um verdadeiro monopolo magnético seria uma nova partícula elementar que violaria a lei ∇ ~ · ~B = 0.
Um monopolo desse tipo, que ajudaria a explicar a lei da quantização da carga, como formulado por Dirac
em 1931, 71 nunca foi observado em experimentos.72 Porém, desde 2003, vários grupos de física de matéria
condensada usaram o termo “monopolo magnético” para descrever um fenômeno diferente e em grande
parte não relacionado àqueles preditos pelo trabalho de Dirac sobre eletrodinâmica quântica e, portanto, sua
descoberta dificilmente ajudará os físicos a desenvolver grandes teorias unificadas de física de partículas
ou teorias de cordas. Mas, como os monopolos ocorrem em materiais magnéticos, a compreensão de suas
propriedades pode ajudar no desenvolvimento de memórias magnéticas e outros dispositivos espirais. 73
Assim, alguns sistemas de matéria condensada contêm, não-isoladas, quase-partículas efetivas de mo-
nopolos magnéticos, i.e., vários grupos observaram o que pode ser considerado como correntes magnéticas
num material chamado gelo de spin ou spin ice. Quando se adiciona um pouco de energia a esse sistema
de spins congelados, introduzem-se excitações que quebram as linhas fechadas entre os polos norte e sul
magnéticos, criando-se um novo polo magnético sul e outro polo magnético norte, que se podem mover
livre e dissociadamente. Neste sentido, experimentos de espalhamento de neutrons no gelo de spin revelou
que, embora essas excitações se comportem como monopolos magnéticos, sua criação ocorre sempre em
pares. 74
Outros estudos contem fenômenos que são matematicamente análogos à monopolos magnéticos. Nos
superfluidos, existe um campo ~ B∗ , relacionado à vorticidade superfluida, que é matematicamente análogo
ao campo magnético ~ B. Por causa da similaridade, o campo ~B∗ é chamado de campo magnético sintético.
Experimentalmente foram observados monopolos magnéticos de Dirac em um campo eletromagnético sin-
tético que surge no contexto de um spin ferromagnético em um 87 Rb condensado de Bose-Einstein. 75 Isso
constitui o primeiro exemplo de um monopolo quase-magnético observado dentro de um sistema governado
67
Experimentos realizados em 1975 e 1982 produziram resultados inicialmente interpretados como evidências da existência de
monopolos, mas hoje vistos como inconclusivos, ver P. B. Price, E. K. Shirk, W. Z. Osborne and L. S. Pinsky, Physical Review
Letters, 35, 487 (1975); Blas Cabrera, Physical Review Letters, 48, 1378 (1982).
68
Gerardus t’ Hooft (1946- ), físico holandês.
69
Alexander Markovič Polyakov (1945- ), físico russo.
70
G. t’ Hooft, Nuclear Physics, B79, 276 (1974); Idem, Physical Review Letters, 37, 8 (1976); A. M. Polyakov, JETP Letters, 20,
194 (1974).
71
P. A. M. Dirac, Proceedings of the Royal Society of London, A133, 60 (1931); Idem, Physical Review, 74, 817 (1948).
72
C. Patrignani et al. (Particle Data Group), Review of Particle Physics, Chinese Physics C40, 100001 (2016); A. Rajantie,
Physics Today 69 (10), 40 (2016).
73
H. Johnston, physicsworld.com, IOP Physics World, Sep 3, (2009); E. Gibney, Nature, doi:10.1038/nature.2014.14612 (2014).
74
C. Castelnovo, R. Moessner and S. L. Sondhi, Nature, 451, 42-45 (2008); M. J. P. Gingras, Science, 326 (5951), 375-376 (2009);
D. J. P. Morris and et al., Science, 326, 411-414 (2009); S. T. Bramwell, S. R. Giblin, S. Calder, R. Aldus, D. Prabhakaran and
T. Fennell, Nature, 461, 956-959 (2009); S. R. Giblin, S. T. Bramwell, P. C. W. Holdsworth, D. Prabhakaran and I. Terry, Nature
Physics, 7 (3), 252-258 (2011).
75
M. W. Ray, E. Ruokokoski, S. Kandel, M. Möttönen and D. S. Hall, Nature, 505 (7485), 657-660 (2014).
“Z_2” — 2017/9/5 — 8:19 — page 221 — #241
Problemas
8.1 A partir das equações de Maxwell, (8.54), mostre: a) a lei de conservação da energia: vetor de Poynting,
b) a lei de conservação do momentum linear: tensor stress de Maxwell. Sugestão: Consulte o livro do
Prof. Greiner [34].
8.2 Uma barra metálica de comprimento ℓ gira em torno de seu eixo por uma das extremidades, com uma
velocidade angular ω. O plano de rotação da barra é perpendicular à um campo magnético ~
B. Qual a
força eletromotriz entre as extremidades da barra?
8.3 Seja um campo magnético dado por ~ B(t) = B0 tẑ. Supondo Φ = 0 e usando a simetria em torno do
eixo z, a) calcular o potencial vetor A~ e b) determinar o campo elétrico induzido. Através de uma
integração direta, mostre que a lei de Faraday é satisfeita.
8.4 Um disco condutor de raio R e condutividade σ é colocado num campo magnético paralelo ao seu eixo
de simetria. Sendo ~
B(t) = ~
B0 sen ωt, encontre a densidade de corrente induzida em todos os pontos
do disco.
8.5 Uma casca esférica condutora de raio R gira com velocidade angular ~ω = ω ẑ na presença de um
campo magnético dado por ~ B = B0 ẑ. Calcular a força eletromotriz gerada entre o polo e um ponto
situado no círculo do equador.
8.6 Do problema anterior, sabemos que a força eletromotriz produz sobre a casca esférica girante um po-
tencial eletrostático Φ(θ). Considere o zero do potencial no infinito. Assim, mostre que a densidade de
carga superficial induzida é
5ωRB0
ρS (θ) = − P2 (cos θ) .
12πc
Verificar que a carga total será zero.
8.7 Calcular: a) o coeficiente de autoindução de uma bobina e b) o coeficiente de autoindução de um
condutor circular. Sugestão: Consulte o livro do Prof. Greiner [34].
8.8 Discuta a corrente em dois circuitos que não contêm capacitância, i.e., circuitos RL. No primeiro
circuito, uma voltagem V0 ei ωt está presente, enquanto no segundo circuito, nenhuma fonte externa
está presente. Sugestão: Consulte o livro do Prof. Greiner [34].
8.9 Discuta o princípio de funcionamento de um transformador. Sugestão: Consulte o livro do Prof. Greiner
[34].
8.10 Uma bobina toroidal, com N espiras, é enrolada sobre uma fôrma não magnética. Se o raio médio
b e√
da bobina for o raio da seção reta for a, demonstre que a autoindutância da bobina será dada por
4π 2
L = c N b − b2 − a2 .
8.11 Dados dois circuitos coaxiais de raios a e b, respectivamente, separados a uma distância d e colocados
em um meio homogêneo de permeabilidade µ. Através da fórmula de fórmula de Neumann para a
indutância, mostre que a indutância mútua dos circuitos é dada por
4πµ √ 2 2
M12 = 2 ab − k K (k) − E (k)
c k k
76
E. Gibney, Nature, doi:10.1038/nature.2014.14612 (2014).
“Z_2” — 2017/9/5 — 8:19 — page 222 — #242
4ab
em que k2 = (a+b) 2 +d2 , sendo K (k) e E (k) as integrais elípticas completas. Encontre o valor limite
quando d ≪ a, b sendo a ≃ b.
8.12 Mostre que no espaço livre, ρ = 0 e ~J = 0, as equações de Maxwell são corretamente obtidas poe
~ que satisfaz
uma simples função vetor A
2~
~ ·A
∇ ~ = 0, ~ − 1 ∂ A = 0.
~ 2A
∇
c2 ∂t2
8.13 É dado um meio no qual ρ = 0, ~J = 0, µ 6= 0, mas que a polarização ~P é uma função dada da posição
e do tempo, i.e., ~P = ~P(x, y, z, t). Demonstre que as equações de Maxwell são obtidas corretamente a
partir de uma única função vetor ~Z (vetor de Hertz), em que ~Z satisfaz a equação,
1 ∂ 2~Z
∇2 ~Z − = −4π~P
c2 ∂t2
e
~E = ∇
~ ×∇
~ × ~Z − 4π~P , ~ 1 ~ ∂~Z
B= 2∇ × .
c ∂t
8.14 É dado um meio no qual ρ = 0, ~J = 0, ǫ 6= 0, mas que a magnetização M ~ é uma função dada da
~ =M
posição e do tempo, i.e., M ~ (x, y, z, t). Mostre que as equações de Maxwell serão obtidas a partir
~
de uma única função vetor Y (vetor de Hertz modificado), em que Y ~ satisfaz a equação,
1 ∂2Y~
~ −
∇2 Y ~
= −4π M
c2 ∂t2
e
~
~ ~ ×∇
B=∇ ~ ×Y
~ , ~ × ∂Y .
~E = −∇
∂t
8.15 Partindo das generalizações de Jefimenko para as leis de de Coulomb e de Biot-Savart, e usando as
expressões para as densidades de carga e de corrente para uma carga pontual obtenha as expressões de
Heaviside-Feynman para os campos elétrico e magnético de uma carga pontual.
~ = −g 1 + cos θ φ̂
A
r sen θ
determina o campo magnético para o monopolo magnético. Verifique que com essa escolha, a linha de
Dirac estará ao longo do eixo z positivo.
8.17 Verifique que as equações de Maxwell-Dirac são invariantes sob a transformação de dualidade,
E → E cos θ + M sen θ
M → M cos θ − E sen θ ,
em que E denota qualquer quantidade elétrica, tais como ~E, ρ ou ~J, e M denota qualquer quantidade
magnética, tais como ~
B, ρm ou ~Jm .
8.18 A partir das equações de Maxwell-Dirac, mostre a lei de conservação das cargas magnéticas,
∂ρm ~ ~
+ ∇ · Jm .
∂t
“Z_2” — 2017/9/5 — 8:19 — page 223 — #243
Leitura Recomendada
Recomenda-se ao leitor os seguintes textos,
– J. D. Jackson [42];
– J. A. Stratton [77];
– M. A. Heald and J. B. Marion [36];
– W. Greiner [34];
– J. Frenkel [30].
Nestes livros, o leitor encontrará excelentes discussões e deduções detalhadas no estudo dos campos eletro-
magnéticos variáveis no tempo, condições de calibre e suas aplicações.
Os textos do prof. Jackson e do prof. Stratton trazem uma excelente sequência e lucidez em suas ex-
posições. Enquanto o estudo de monopolos magnéticos serão encontrados nos textos do prof. Jackson e do
prof. Frenkel.
“Z_2” — 2017/9/5 — 8:19 — page 224 — #244
Capítulo 9
Ondas Eletromagnéticas
Neste capítulo, discutiremos, em detalhes, a propagação das ondas de radiação eletromagnética, bem como
suas propriedades, tais como polarização, reflexão, refração, energia, momentum linear e momentum angular.
Também iremos tratar da propagação das ondas eletromagnéticas em meios não condutores e também em
meios condutores, incluindo as relações de dispersão de Kramers-Kronig.1
~ · ~E = 0
∇ (9.1a)
~ ·~
∇ B=0 (9.1b)
~ × ~E = − 1 ∂~B
∇ (9.1c)
c ∂t
~ ×~ µε ∂~E
∇ B= , (9.1d)
c ∂t
2~
∇ ~ × ~E − 1 ∂ ∇
~ ×∇ ~ ×~ ~ ∇
B = ∇( ~ · ~E) − ∇2 ~E + µε ∂ E = 0
c ∂t c2 ∂t2
1
Ralph Kronig (1904-1995), físico teuto-americano.
Hendrik Anthony “Hans” Kramers (1894-1952), físico holandês.
224
“Z_2” — 2017/9/5 — 8:19 — page 225 — #245
e analogamente para ~
B. Obtemos as equações de onda para ~E e ~
B, respectivamente, como
µε ∂ 2~E
∇2 ~E − =0 (9.2a)
c2 ∂t2
µε ∂2~B
∇2 ~
B− 2 =0, (9.2b)
c ∂t2
1 ∂2u
∇2 u − =0, (9.2c)
v 2 ∂t2
em que
c
v=√ (9.3)
µε
é a velocidade de propagação no meio material.
Nota - A equação da onda e sua solução Para simplificar, escreveremos a equação diferencial (9.2c) em
uma dimensão. Assim, a equação diferencial que descreve uma onda viajando em uma dimensão, tem
a forma
∂2u 1 ∂2u
− = 0,
∂x2 v 2 ∂t2
em que a função u(x, t) descreve o deslocamento de um elemento da sua posição de equilíbrio e v é
a velocidade de propagação da onda no meio. Podemos mostrar que a função
u(x, t) = f (x − vt)
é uma solução da equação diferencial, não importa a forma de f , mas é impositivo a forma que as
variáveis se relacionam. Podemos mostrar esta relação diretamente, através da equação diferencial,
consideremos uma outra variável, s = x − vt. Com efeito:
∂u ∂f df ∂s df
= = =
∂x ∂x ds ∂x ds
2 2
2
∂ u ∂ f d f ∂s d2 f
= = =
∂x2 ∂x2 ds2 ∂x ds2
e de modo equivalente
∂u ∂f df ∂s df
= = = −v
∂t ∂t ds ∂t ds
2 2
2 2
∂ u ∂ f d f ∂s 2 d f
= = −v = v
∂t2 ∂t2 ds2 ∂t ds2
também é uma solução da equação diferencial. Assim, é possível mostrar que a solução geral da
equação diferencial da onda tem a forma:
em que o primeiro termo da direita representa uma onda viajando no sentido positivo do eixo x, i.e.,
na direção de x > 0 e é denominada de onda progressiva; enquanto o segundo termo da direita
representa uma onda viajando no sentido negativo do eixo x, i.e., na direção de x < 0 e é conhecida
como onda regressiva.
Voltando ao nosso estudo, a equação de onda (9.2c) tem como soluções particulares as conhecidas solu-
ções de ondas planas que se propagam na direção do vetor ~k, conforme pode ser verificado por substituição
direta,
~
up (~r, t) = ei k ·~r±i ω t , (9.4)
em que a frequência ω e o módulo do vetor ~k desta solução particular estão relacionados por
ω √ ω
k= = µε . (9.5)
v c
Se considerarmos ondas se propagando em apenas uma direção (digamos na direção de k̂), sendo (9.2)
homogêneas por se tratar de situação no vácuo, i.e., em região extensa (suficientemente distante de mudança
de condições de contorno) desprovida de carga elétrica livre, ou seja, em que ρ(~r, t) ≡ 0, a solução geral é
uma combinação linear de soluções particulares da forma (9.4)
~ ~
u(~r, t) = A ei k ·~r−i ω t + B e− i k ·~r−i ω t . (9.6)
Usando (9.5), podemos escrever (9.4) na forma unificada para dado ~k:
~ ~
uk (~r, t) = A(~k) ei k · (~r−~v t) + B (~k) e− i k · (~r+~v t) , (9.7)
em que A(~k) e B (~k) são funções arbitrárias de ~k e ~v = v ~k/|~k|, sendo ~k = k k̂ na qual k̂ é um versor
constante e k ∈ R é qualquer, o que é o suficiente para que uk (~r, t) seja uma solução particular de (9.2c)
também. Da arbitrariedade de k ∈ R, a combinação linear das soluções particulares será a integral, i.e.,
a integral de Fourier, que expressa a solução geral de (9.2c): (a adoção do fator (2π)−3 é questão de
conveniência de racionalização das relações)
Z +∞
1 ~
u(~r, t) = A(~k) ei k · (~r−~v t) d3 k
(2π)3 −∞
Z +∞ (9.8)
1 ~
+ B (~k) e− i k · (~r+~v t) d3 k .
(2π)3 −∞
As ondas planas básicas (9.4) e (9.5) satisfazem a equação de onda escalar (9.2c). Mas ainda temos que
considerar a natureza vetorial do campo eletromagnético e as exigências das equações de Maxwell. Com a
convenção de que os campos físicos elétrico e magnético são obtidos tomando as partes reais das quantida-
des complexas, os campos de onda plana serão da forma
~ B
em que os vetores E, ~ e k̂ são constantes no tempo e no espaço. Cada componente de ~E e ~
B satisfaz a
equação de onda de Helmholtz
ω2
∇2 u + µ ε 2 u = 0 (9.10)
c
desde que
ω2
k2 k̂ · k̂ = µ ε 2 . (9.11)
c
Para recuperar a Eq. (9.5), é necessário assumir que k̂ é um vetor que satisfaz a k̂ · k̂ = 1. Com a equação
de onda satisfeita, somente resta fixar as propriedades vetoriais para que (9.1) sejam válidas. As condições
~ · ~E = 0 = ∇
de divergência em (9.1), i.e., ∇ ~ ·~
B, obrigam que
k̂ · E~ = 0 (9.12a)
k̂ · B~ = 0. (9.12b)
B~ = √µε k̂ × E~ (9.13a)
1
E~ = − √ k̂ × B ~. (9.13b)
µε
A combinação das Eqs. (9.12) e (9.13) indica que k̂, E~ e B ~ formam um conjunto ortonormal. Se k̂ é real,
(9.13) significa que E~ e B ~ têm a mesma fase. É então conveniente introduzir um conjunto ortogonal de
vetores {ǫ̂1 , ǫ̂2 , k̂}, como se mostra na Fig. 9.1. Em termos destes versores, as intensidades do campo E~ e
z
k = k k̂
~
ǫ̂1
~E HYH
H
ǫ̂2
~B
B~ são
E~ = ǫ̂1 E0 (9.14a)
B~ = ǫ̂2 √µε E0 (9.14b)
ou
em que E0 e E0′ são constantes, possivelmente complexas. A onda descrita por (9.9) e (9.14) ou (9.15) é
uma onda transversal, propagando-se na direção k̂. Em outras palavras, a forma mais geral de escrever os
vetores dos campos elétrico e magnético é
~E = E0 ǫ̂1 + E ′ ǫ̂2 ei kk̂ ·~r−i ωt (9.16a)
0
√ i kk̂ ·~r−i ωt
~
B = ′
µ ε E ǫ̂ + E ǫ̂ e
0 2 . (9.16b)
0 1
A média temporal do fluxo de energia da onda eletromagnética será dada pela parte real do vetor de Poynting
complexo:
h i
~S = 1 c ~E × H ~ ∗ = 1 c ~Eℜ × H ~ ℜ + ~Eℑ × H~ ℑ + i ~Eℑ × H ~ ℜ − ~Eℜ × H ~ℑ . (9.17)
2 4π 2 4π
Prova. Para fazermos esta demostração, vamos considerar os campos complexos e trabalharemos com suas
partes reais e seu valor médio. Assim, vamos considerar
~k ·~r − ωt = ϕ ,
tendo os campos
~E = ~E0 ei ϕ = ~Eℜ + i ~Eℑ ei ϕ , ~B = ~ ~ ℜ + i~
B0 ei ϕ = B Bℑ ei ϕ ,
em que ~Eℜ,ℑ (~
Bℜ,ℑ ) são grandezas reais. Lembrando que ei ϕ = cos ϕ + i sen ϕ temos,
h i h i
ℜ ~E = ℜ ~Eℜ + i ~Eℑ (cos ϕ + i sen ϕ) = ~Eℜ cos ϕ − ~Eℑ sen ϕ
h i h i
ℜ ~ B =ℜ ~ Bℜ + i ~Bℑ (cos ϕ + i sen ϕ) = ~ Bℜ cos ϕ − ~ Bℑ sen ϕ .
1 c h i 1 c h i
h~Si = ℜ ~E × ~
B∗ = ℜ ~E × H
~∗ ,
2 4πµ 2 4π
Assim, voltando ao nosso problema, o fluxo de energia, i.e., energia por unidade de área e por unidade
de tempo, é r
~S = c ε
|E0 |2 k̂ . (9.18)
8π µ
O valor médio temporal u da densidade de energia é
1 ~ ~ ∗ 1~ ~∗ ε
u= εE·E + B·B = |E0 |2 . (9.19)
16π µ 8π
Na discussão anterior assumimos que k̂ é um vetor real unitário. Isto não leva a solução mais geral pos-
sível para uma onda plana. Suponhamos que k̂ seja complexo, e que se escreve k̂ = k̂ℜ + ik̂ℑ . Então, a
exponencial em (9.9) fica
exp (i kk̂ ·~r − i ωt) = exp (−kk̂ℑ ·~r) exp (i kk̂ℜ ·~r − i ωt) . (9.20)
A onda possui um crescimento, ou decaimento, em algumas direções. É então chamada de onda plana
inomogênea. As superfícies de amplitude constante e as de fase constante são planas, mas elas não são
mais paralelas. As relações (9.12) e (9.13) se mantém. A condição k̂ · k̂ = 1 tem uma parte real e uma
imaginária2
2 2
kℜ − kℑ =1
(9.21)
k̂ℜ · k̂ℑ = 0 .
A segunda dessas condições mostra que k̂ℜ e k̂ℑ são ortogonais. O sistema de coordenadas pode ser esco-
lhido de forma que k̂ℜ esteja segundo a direção x̂, e k̂ℑ segundo a direção ŷ. A primeira equação em (9.21)
pode ser satisfeita, em geral, escrevendo
em que A e A′ são constante complexas. Para θ 6= 0, E~ em geral tem componentes na direção de k̂. Para
θ = 0, são recuperadas as soluções (9.14) e (9.15).
(9.15) está linearmente polarizada, com vetor de polarização ǫ̂2 , e é linearmente independente da primeira.
Assim, as duas ondas
podem ser combinadas para dar a onda plana homogênea mais geral, que se propaga na direção ~k = kk̂,
o que implica em h i
~E(~r, t) = ǫ̂1 |E1 | + ǫ̂2 |E2 | ei(φ2 −φ1 ) ei ~k ·~r−i ωt+i φ1 ,
pois as amplitudes E1 = |E1 |ei φ1 e E2 = |E2 |ei φ2 são complexas, para permitir a possibilidade de uma
diferença de fase entre ondas de diferente polarização.
Se E1 e E2 têm a mesma fase, a Eq. (9.25) representa uma onda linearmente polarizada,
p com seu vetor
−1
de polarização fazendo um ângulo θ = tan (E2 /E1 ) com ǫ̂1 e um módulo E = E12 + E22 , como
se mostra na Fig. 9.2. Se E1 e E2 têm diferentes fases, a onda (9.25) está elipticamente polarizada. Para
E2 6
3~E
ǫ̂2 6
θ- -
ǫ̂1 E1
entender melhor o conceito, consideremos o caso mais simples, uma onda circularmente polarizada. Neste
caso E1 e E2 têm o mesmo módulo, mas diferem em fase por π/2 radianos. A onda (9.25) ficará então
sendo E0 uma amplitude real. Podemos imaginar eixos nos quais a onda está se propagando segundo a
direção de z positivo, enquanto ǫ̂1 e ǫ̂2 estão nas direções x̂ e ŷ, respectivamente. Então, as componentes
do campo elétrico, obtidas tomando a parte real de (9.26), são
Num ponto fixo do espaço, os campo dados pela Eq. (9.27) são tais que o seu campo elétrico é constante em
módulo, mas descreve um círculo com frequência ω, de acordo com a Fig. 9.3. Para a combinação ǫ̂1 + i ǫ̂2 ,
a rotação é anti-horária vista por um observador para o qual a onda se aproxima. É chamada, em óptica,
circularmente polarizada para a esquerda, i.e., levogira. Na terminologia de física moderna, essa onda
tem helicidade positiva. Esta última descrição é mais adequada, uma vez que esta onda tem uma projeção
positiva do momentum angular segundo o eixo z (direção de propagação). A outra combinação ǫ̂1 − i ǫ̂2 ,
“Z_2” — 2017/9/5 — 8:19 — page 231 — #251
y
'$~ E
?
x
&%
a rotação de ~E é horária vista por um observador que observa a onda aproximando; esta é circularmente
polarizada para a direita, i.e., destrógira ou em terminologia moderna tem helicidade negativa.
As duas ondas circularmente polarizadas (9.27) formam um conjunto igualmente aceitável de campos
básicos para a descrição de um estado geral de polarização. Se introduzirmos os vetores complexos unitários
ortogonais
1
ǫ̂± = √ (ǫ̂1 ± i ǫ̂2 ) (9.28)
2
com as propriedades
ǫ̂∗± · ǫ̂∓ = 0
ǫ̂± · ǫ̂3 = ǫ̂∗± · ǫ̂3 = 0 (9.29)
ǫ̂∗± · ǫ̂± = 1,
em que E+ e E− são amplitudes complexas. Se E+ e E− têm módulos diferentes, mas a mesma fase, a
Eq. (9.30) representa uma onda elipticamente polarizada, com os eixos principais da elipse nas direções de
ǫ̂1 e ǫ̂2 . A razão entre o semieixo maior e o semieixo menor é |(1 + r)/(1 − r)|, em que r = E− /E+ .
Se as amplitudes têm uma diferença de fase entre elas, E− /E+ = reiα , então, é fácil mostrar que a elipse
descrita pelo vetor ~E tem seus eixos deslocados de um ângulo (α/2). Para r = ±1, recaímos no caso da
onda linearmente polarizada.
1
E± = √ (E1 ∓ i E2 ) .
2
com E1 = E2 , temos as propriedades do vetor de onda circular (9.29) e uma fase de π/2 radianos. Mas se
temos E1 6= E2 e uma fase de φ2 = φ ± π/2 então
~E(~r, t) = (E1 ǫ̂1 ± E2 ǫ̂2 ) ei φ+i ~k ·~r−i ωt , (9.31)
pegamos a parte real dada por
~Eℜ (~r, t) = E1 ǫ̂1 cos (ωt − φ − ~k ·~r) ± E2 ǫ̂2 sen (ωt − φ − ~k ·~r) .
Esta equação descreve uma elipse no plano ǫ̂1 − ǫ̂2 , para E1 > E2 quando o semieixo maior for E1 e o
semieixo menor for E2 , e vice-versa para E2 > E1 . Vamos tomar o caso E1 > E2 e φ2 − φ1 = π/2.
Usando exp (i φ2 ) = exp (i φ1 ) exp (i π/2) = i exp (i φ1 ) encontramos
1
E+ = √ E1 ei φ + E2 ei φ = E+ ei φ ,
2
com E+ = √1 (E1 + E2 ), e
2
1
E− = √ E1 ei φ − E2 ei φ = E− ei φ ,
2
com E− = √1 (E1 − E2 ). Seguindo que a razão do semieixo maior com o semieixo menor, E1 /E2 , é dado
2
por
1+r
,
1−r
com r = E− /E+ , podemos mostrar que
E1 −E2
1+r 1+ E1 +E2 E1 + E2 + E1 − E2 E1
= E1 −E2
= = .
1−r 1− E1 +E2
E1 + E2 − E1 + E2 E2
Voltando ao caso geral, em que fases arbitrárias são assumidas para E+ e E− , então:
E−
= r ei α (9.32)
E+
e esta equação representa exatamente a situação de uma rotação para uma elipse, descrita em coordenadas
circular pelos coeficientes E± por um ângulo γ = α/2. Então, vamos considerar ǫ̂′1 e ǫ̂′2 as novas bases de
um sistema de coordenadas girando na direção horária por um ângulo γ. Logo,
ǫ̂′1 = cos γ ǫ̂1 + sen γ ǫ̂2
ǫ̂′2 = − sen γ ǫ̂1 + cos γ ǫ̂2 ,
para vetores de ondas circulares, esta relação será
ǫ̂′± = e∓ i γ ǫ̂± .
Nota-se que,
1 1
ǫ̂′+ = e− i γ ǫ̂+ = √ (cos γ ǫ̂1 + sen γ ǫ̂2 + i cos γ ǫ̂2 − i sen γ ǫ̂1 ) = √ (ǫ̂′1 + i ǫ̂′2 )
2 2
e similarmente ǫ̂′− = √1
2
(ǫ̂′1 − i ǫ̂′2 ). Consequentemente,
′
E± = e± i γ E± (9.33)
e a diferença de fase será removida por uma rotação do eixo igual a γ = α/2.
Na Fig. 9.4, mostramos o caso geral de polarização elíptica e as elipses traçadas para os campos elétrico
~E e de indução magnética ~ B em um dado ponto no espaço. Enquanto na Fig. 9.5, mostramos os três casos
de polarização: linear, circular e elíptica, respectivamente.
“Z_2” — 2017/9/5 — 8:19 — page 233 — #253
Figura 9.4 Campo elétrico e indução magnética pra uma onda polarizada elipticamente.
Propriedades dinâmicas :
a partir do meio µ, ε. As ondas refratada e refletida têm vetores ~k′ e ~k′′ , respectivamente, e n̂ é um vetor
unitário normal, dirigido do meio µ, ε até o meio µ′ , ε′ .
3 ~k
′
n̂ 6
r
µ′ ε′
x
µε Q
Q
Q
i r′ Q
Q
Q
Qs ~k′′
Q
~k
Figura 9.6 Uma onda incidente ~k atinge a interface plana entre dois meios diferentes, dando lugar a
uma onda refletida ~k′′ e uma onda refratada ~k′ .
Incidente
~E = ~E0 ei ~k ·~r−i ωt
√ ~k × ~E (9.34)
~
B = µε ,
k
Refratada
Refletida
independentemente da natureza das condições de contorno. As Eqs. (9.38) contêm os aspectos cinemáticos
da reflexão e refração. Vemos que os três vetores de onda devem estar no mesmo plano. Na notação da
Fig. 9.6
k sen i = k′ sen r = k′′ sen r ′ . (9.39)
Devido ao fato de que k′′ = k, encontramos que i = r ′ , i.e., o ângulo de incidência é igual ao ângulo de
reflexão, expressão essa que traduz a lei de reflexão. Assim, a lei de Snell fica
s
sen i k′ µ′ ε′ n′
= = = . (9.40)
sen r k µε n
As propriedades dinâmicas estão contidas nas condições de contorno, i.e., as componentes normais de
~
D=ε ~E e ~
B são contínuas; enquanto as componentes tangenciais de ~E e H ~ = [c/(ωµ)]~k × ~E são con-
tínuas. Em termos dos campos (9.34) e (9.36), estas condições de contorno em z = 0 são
h i
ε ~E0 + ~E′′0 − ε′~E′0 · n̂ = 0
h i
~k × ~E0 + ~k′′ × ~E′′ − ~k′ × ~E′ · n̂ = 0
0 0
(9.41)
~E0 + ~E′′0 − ~E′0 × n̂ = 0
1 ~ ~ ~ ′′ ~ ′′ 1 ~ ′ ~ ′
k × E0 + k × E0 − ′ k × E0 × n̂ = 0 .
µ µ
Ao aplicar estas condições, é conveniente considerar duas situações diferentes, uma na qual a onda
incidente está linearmente polarizada, com seu vetor de polarização perpendicular ao plano de incidência
(plano este definido pelos vetores ~k e n̂), e a outra na qual o vetor de polarização é paralelo ao plano de
incidência. O caso geral de uma polarização elíptica arbitrária pode ser obtido por uma combinação linear
apropriada desses dois resultados, seguindo os métodos da seção anterior.
Consideremos primeiramente o campo elétrico perpendicular ao plano de incidência, como está mos-
trado na Fig. 9.7. Todos os campos elétricos apontam para o plano do papel. A orientação dos vetores ~B
são escolhidas para dar um fluxo de energia positivo na direção do vetores de onda. Uma vez que os cam-
pos elétricos são todos paralelos à superfície, a primeira condição de contorno em (9.41) não nos oferece
qualquer informação. A terceira e a quarta condições em (9.41) nos dão
E0 + E0′′ − E0′ = 0
(9.42)
r s
ε ε′ ′
E0 − E0′′ cos i − E cos r = 0 ,
µ µ′ 0
enquanto a segunda, usando a lei de Snell, só duplica a terceira. As amplitudes relativas das ondas refratada
e refletida podem ser encontradas a partir da Eq. (9.42). São elas
“Z_2” — 2017/9/5 — 8:19 — page 236 — #256
~
B′ 3 ~k
′
n̂ 6 ]J
r J⊗
~ E′
µ′ ε′
x
µε @
@
~B i i @ ~ B′′
I
@
@⊗~
E ~E′′@
⊗
@ ~k′′
~k R
@
E0′ 2n cos i
= p
E0 n cos i + µ
n′ 2 − n2 sen2 i
µ′
(9.43)
p
µ
E0′′ n cos i − µ′ n′ 2 − n2 sen2 i
= p .
E0 n cos i + µ
n′ 2 − n2 sen2 i
µ′
p
A raiz quadrada nestas expressões é n′ cos r, i.e., n′ 2 − n2 sen2 i = n′ cos r, mas a lei de Snell foi usada
para expressá-las em termos do ângulo de incidência. Para frequências ópticas é permitido fazer µ/µ′ = 1.
Então, as Eqs. (9.43) poderão ser escritas na forma
As Eqs. (9.43) e (9.45) e (9.46) mais embaixo, são comumente utilizadas em contextos ópticos, em que n e
n′ são reais, mas valem também para constantes dielétricas complexas.
Se o campo elétrico é paralelo ao plano de incidência, conforme está na Fig. 9.8, as condições de
contorno envolvidas são as seguintes: a componente normal de D, ~ as componentes tangenciais de ~E e H
~ (a
primeira, a terceira e a quarta das equações em (9.41). As continuidade das componentes tangenciais de ~E
eH~ exige que
cos i E0 − E0′′ − cos r E0′ = 0
(9.45)
r s
ε ε′ ′
E0 + E0′′ − E = 0.
µ µ′ 0
“Z_2” — 2017/9/5 — 8:19 — page 237 — #257
~E′
3 ~k
′
n̂ 6 ]J
r J⊙
~ B′
µ′ ε′
x
µε @
@
~E i i @ ~E′′
I
@ @⊙~
B ~B′′@
⊙
@ ~k′′
~k R
@
Como, para frequências ópticas µ/µ′ = 1, as Eqs. (9.46) poderão ser escritas na forma
′
E0′ 2 nnεε′ 2 sen r cos i
= ε tan i
=
E0 1+ ε′ tan r
sen(i + r) cos(i − r) µ=µ′
(9.47)
ε tan i
E0′′ 1− ε′ tan r tan(i − r)
= ε tan i
= .
E0 1+ ε′ tan r
tan(i + r) µ=µ′
As equações (9.43) e (9.46) são conhecidas como equações de Fresnel.3 Elas governam a troca da polariza-
ção da luz através da reflexão e refração.
Incidência normal i = 0. Para incidências normais, as duas Eqs. (9.43) e (9.46), se reduzem a
E0′ 2 2n
=q ′ −→ ′
E0 µε
+1 n +n
µ′ ε
(9.48)
q
µε′
E0′′ −1 n − n′
µ′ ε
=q ′ −→ ,
E0 µε
+ 1 n + n′
µ′ ε
3
Equações derivadas em 1823 por Fresnel com base na sua teoria dinâmica da luz.
“Z_2” — 2017/9/5 — 8:19 — page 238 — #258
em que os resultados da direita valem para µ = µ′ . Para a onda refletida, a convenção de sinal é
aquela para a polarização paralela ao plano de incidência. Isto significa que, se n′ > n, existe uma
inversão de fase para a onda refletida.
Para uma razão típica de n′ /n = 1, 5, temos iB ≈ 56◦ .6 Se uma onda plana de polarização mista incide
sobre uma interface plana com o ângulo de Brewster, a radiação refletida está completamente linearmente
polarizada (plano-polarizada), com o vetor de polarização perpendicular ao plano de incidência.
Prova. Podemos provar rigorosamente a relação (9.49) à partir da segunda equação dada em (9.46). Note
bem a expressão para a amplitude da onda refletida para a polarização no plano:
p
µ ′2
µ′ n cos i − n n′ 2 − n2 sen2 i
E0′′ = E0 p .
µ ′2 ′ 2 − n2 sen2 i
µ′ n cos i + n n
Esta amplitude será zero para certos ângulos, nomeadamente aquelas que tais:
µ ′2 p
n cos i = n n′ 2 − n2 sen2 i .
µ′
Enquadrando ambos os lados e restaurando o termo cosseno à sua forma original:
2
µ 2
n′ cos2 i = n2 cos2 r .
µ′
µn′ cos r
′
= .
µn cos i
Para frequências ópticas, µ = µ′ , então, n′ cos i = n cos r. Com a lei de Snell, temos:
n n′
tan i = tan r .
n′ n
Esta equação transcendental pode ser resolvida pela observação da sua simetria. É verdade se e somente se:
n′
tan i = = cot r .
n
O ângulo de incidência será
n′
iB = tan−1 ,
n
“Z_2” — 2017/9/5 — 8:19 — page 239 — #259
para ambos os casos, ~E paralelo e perpendicular ao plano (x, z) em função do ângulo de incidência i,
adotando n = 1 e n′ = 3. O ângulo de Brewster iB é de aproximadamente 71, 56◦ .
O segundo fenômeno é chamado de reflexão interna total. A palavra interna implica que as ondas
incidente e refletida estão num meio de índice de refração maior que o meio da onda refratada (n > n′ ).
A lei de Snell (9.40) mostra que, se n > n′ , então r > i. Consequentemente, r = π/2, quando i = i0 ,
sendo ′
−1 n
i0 = sen . (9.50)
n
Para ondas incidentes com i = i0 , a onda refratada se propaga paralela à superfície. Não existe fluxo de
energia através dela. Neste ângulo de incidência, temos reflexão total. Se i > i0 , notemos que sen r > 1.
Isto significa que r é um ângulo complexo com um cosseno puramente imaginário
s
sen i 2
cos r = i − 1. (9.51)
sen i0
4
Sir David Brewster (1781-1868), astrônomo, matemático e físico escocês.
5
D. Brewster, Philosophical Transactions of the Royal Society of London 105, 125-159 (1815).
6
Por exemplo, o primeiro meio é o vidro, n′ ≈ 1, 5, e o segundo meio é o ar, n ≈ 1, 0. Outra interface muito usada é água/ar,
n′ ≈ 1, 33 e iB ≈ 53◦ .
“Z_2” — 2017/9/5 — 8:19 — page 240 — #260
O significado dessas quantidades complexas fica claro quando consideramos o fator de propagação para a
onda refratada
~′
ei k ·~r = ei k (x sen r+z cos r) = e−k [(sen i/ sen i0 ) −1] z ei k (sen i/ sen i0 )x .
′ ′ 2 1/2 ′
(9.52)
Isto mostra que, para i > i0 , a onda refratada se propaga apenas paralelamente à superfície, e está atenuada
exponencialmente além da interface.
Embora existam campos do outro lado da superfície, não existe fluxo de energia através da superfície.
Assim, a reflexão interna total acontece para i ≥ i0 . A perda de fluxo de energia pode verificar-se calculando
o valor médio temporal da componente normal do vetor de Poynting, nas vizinhanças internas da superfície
h i
~S · n̂ = c ℜ n̂ · ~E′ × H ~ ′∗ . (9.53)
8π
Com H ~ ′ = c′ ~k′ × ~E′ , vemos que
µω
~S · n̂ = c2 ~ ′ ~ ′
2
ℜ n̂ · k E0 . (9.54)
8πωµ′
Numa onda plana infinita, ~E e ~B são perpendiculares ao vetor da onda. Assim, neste caso o único mo-
mentum angular presente será o momentum angular orbital, que é associado com o movimento translacional
da onda. Entretanto, numa onda finita, os campos ~E e ~ B terão perto das bordas componentes paralelas ao
vetor de onda, visto serem as linhas do campo curvas fechadas. Assim, a energia fluirá também em direções
perpendiculares ao vetor de onda.
Numa onda circularmente polarizada que se propaga na direção z, temos um fluxo de energia transver-
sal. Esta circulação de energia implica na existência de um momentum angular não orbital, cuja direção é
paralela (ou antiparalela) à direção de propagação. Este momentum angular adicional é chamado de spin
da onda. Para obter a expressão para o spin de uma onda de extensão finita, vamos escrever as densida-
des de momentum e de momentum angular em termos do potencial vetor, considerando por simplicidade a
propagação da onda no vácuo.
Usando a convenção do somatório sobre os índices repetidos e a identidade
~E × ~
B = ~E × (∇
~ × A)
~ = [E i ∇A
~ i − (~E · ∇)
~ A]
~ , (9.55)
“Z_2” — 2017/9/5 — 8:19 — page 241 — #261
~r × (~E · ∇)
~ A~ = ∇i (E i ~r × A)
~ − ~E × A
~ .
Modelo Simples para ε(ω) Consideremos um modelos simples de cargas harmonicamente ligadas (elé-
trons e íons). A equação de movimento de um elétron de carga −e ligado por uma força harmônica e sobre
o qual atua um campo elétrico ~E(~r, t) é
d2~r d~r
m + γ + ω 2
0~r = −e~E(~r, t) , (9.64)
dt2 dt
e ~E0
~r0 = − ,
m(ω02 − ω 2 − i γω)
de modo que
e ~E0 e− i ωt
~r(t) = −
m(ω02 − ω 2 − i γω)
ou
e ~E(t)
~r(t) = − .
m(ω02 − ω 2 − i γω)
O momento dipolo associado ao j-ésimo elétron, ~p = −e~r, será então
e2 2
~pj (t) = −e~rj (t) = (ω − ω 2 − i γj ω)−1~E(t) ≡ χe (ω) ~E(t) , (9.65)
m 0j
em que χe (ω) é a susceptibilidade elétrica do material.
Admitindo que temos N moléculas por unidade de volume, com Z elétrons por molécula, e que, no
lugar de uma frequência própria de ligação para todos os elétrons, existem fj elétrons por molécula, com
frequência de ligação ωj e constante de atenuação γj , então a soma dos momentos dipolos, por unidade de
volume, será
N e2 X
~p = fj (ωj2 − ω 2 − iγj ω)−1 ~E ,
m
j
“Z_2” — 2017/9/5 — 8:19 — page 243 — #263
em que identificamos
N e2 X
χe = fj (ωj2 − ω 2 − iγj ω)−1 .
m
j
4πN e2 X
ε(ω) = 1 + fj (ωj2 − ω 2 − iγj ω)−1 , (9.66)
m
j
Com uma adequada definição quântica de fj , γj e ωj , a Eq. (9.66) fornece uma precisa descrição da contri-
buição atômica à constante dielétrica.8
Um diagrama esquemático do comportamento típico da parte real e imaginária da função da constante
dielétrica, Eq. (9.66), é mostrado na Fig. 9.10. Algumas observações sobre o perfil dessas funções:
Figura 9.10 Perfil esquemático da função ε(ω). Cada frequência de ressonância ωi é o centro de um
pico na parte imaginária de ε e de uma oscilação ressonante é um pico na parte real. A largura
dessas estruturas é determinada pela taxa de amortecimento γi .
4πN e2 X fj
ε=1+ 2 , (9.71)
m ω j
j
Se alguma fração f0 de elétrons por molécula é livre, no sentido de que têm ω0 = 0, a constante
dielétrica é singular em ω = 0. Se a contribuição dos elétrons livres for expressa separadamente, usando
(9.66) temos
4πN e2 f0
ε(ω) = ε0 + i , (9.72)
mω(γ0 − iω)
em que ε0 é a contribuição de todos os outros dipolos. O comportamento singular pode ser entendido se
examinarmos a equação de Maxwell-Ampère
~
∇ ~ = 4π ~J + 1 ∂ D
~ ×H (9.73)
c c ∂t
e assumirmos que o meio obedece a lei de Ohm, ~J = σ~E, e que tem uma constante dielétrica normal ε0 .
Com uma dependência temporal harmônica, a equação fica
∇ ~ = −i ω
~ ×H ε0 + i
4πσ ~E . (9.74)
c ω
Se, por outro lado, não inserimos explicitamente a lei de Ohm, mas atribuímos todas as propriedades do meio
à constante dielétrica, identificaremos a grandeza entre parênteses em (9.74) como sendo ε(ω). Comparando
com (9.72) obtemos uma expressão para a condutividade
f0 N e2
σ(ω) = . (9.75)
m(γ0 − i ω)
Este é, essencialmente, o modelo de Drude,9 de 1900, para a condutividade elétrica, 10 sendo f0 N o número
de elétrons livres por unidade de volume no meio. A constante de atenuação γ0 /f0 pode ser determinada
empiricamente a partir de dados experimentais sobre a condutividade. Para o cobre, N ≃ 8, 47 × 1022 /cm3
e, em temperaturas normais, a condutividade em baixas frequências é σ ≃ 5, 9 × 105 (Ω.cm)−1 . Isto nos
dá γ0 /f0 ≃ 4 × 1013 s−1 . Assumindo que f0 ≈ 1, isto mostra que até frequências bem além da região de
micro-ondas (ω ≤ 1011 s−1 ) as condutividades dos metais são essencialmente reais (em fase com o campo)
e independentes da frequência. Em frequências maiores (infravermelho e além) a condutividade é complexa
e varia com a frequência numa forma descrita qualitativamente segundo a equação (9.75).11
Estas considerações mostram que as distinção entre dielétricos e condutores é de certo modo artificial,
pelo menos nas faixas distintas de ω = 0. Se o meio possui elétrons livres, ele é um condutor em frequências
baixas; de outro modo, é um isolante.
9
Paul Karl Ludwig Drude (1863-1906), físico alemão.
10
P. Drude, Annalen der Physik 306 (3), 566 (1900); Idem, 308 (11), 369 (1900).
11
Ver valores experimentais em C. Kittel, Introduction to solid state physics (2005); N. W. Ashcroft e N. D. Mermin, Física do
estado sólido (2011).
“Z_2” — 2017/9/5 — 8:19 — page 246 — #266
Limite de Altas Frequências Em frequências muito maiores que a maior frequência ressonante, a cons-
tante dielétrica (9.66) assume a forma simples
ωp2
ε(ω) ≈ 1 − , (9.76)
ω2
em que
4πN Ze2
ωp2 = . (9.77)
m
A frequência ωp , a qual depende somente do número total N Z de elétrons por unidade de volume, é cha-
mada frequência de plasma do meio. O número de onda é dado, nesse limite, por
q
ck = ω 2 − ωp2 . (9.78)
As vezes, a Eq. (9.78) é expressa como ω 2 = ωp2 + c2 k2 e é chamada de relação de dispersão. Em meios
dielétricos, a Eq. (9.76) aplica-se somente para ω 2 ≫ ωp2 . A constante dielétrica é então próxima da unidade,
embora um pouco menor, e cresce com a frequência.
Em algumas situações, tais como na ionosfera ou em plasmas rarefeitos de laboratório, os elétrons estão
livres e a atenuação é desprezível. Então a expressão (9.76) vale para um amplo intervalo de frequências,
incluindo ω < ωp . Para frequências menores que a frequência de plasma, o número de onda (9.78) é
puramente imaginário. Estas ondas, quando incidem num plasma são refletidas, e os campos dentro caem
exponencialmente com a distância a partir da superfície. Em ω = 0, a constante de atenuação é
2ωp
αplasma ≈ . (9.79)
c
Na escala de laboratório, as densidades de plasma são da ordem de 1012 –1016 elétrons/cm3 . Isto significa
que ωp ≈ 6 × 1010 –6 × 1012 s−1 , assim os intervalos de atenuação típicos (α−1 ) são da ordem de 2 × 10−1 -
-2 × 10−3 cm para campos estáticos ou de baixa frequência. A expulsão dos campos de dentro de um
plasma é um fenômeno bem conhecido utilizado para controlar processos termonucleares, e é explorado
nas tentativas de confinamento de plasmas quentes.
A refletividade dos metais em frequências ópticas e altas é causada, essencialmente, pelo mesmo com-
portamento que no caso de um plasma rarefeito. A constante dielétrica de um metal é dada por (9.72). Em
altas frequências (ω ≫ γ0 ) toma a forma aproximada
ωp2
ε(ω) ≈ ε(ω0 ) − 2 , (9.80)
ω
em que ωp2 = 4πne2 /m∗ é a frequência de plasma dos elétrons de condução, aos quais se dá uma massa
efetiva m∗ para levar em conta os efeitos da ligação. Para ω ≪ ωp , o comportamento da luz incidente
sobre o metal é aproximadamente o mesmo que para um plasma descrito por (9.76). A luz penetra somente
uma distância muito pequena dentro do metal, e é quase inteiramente refletida. Mas, quando a frequência
entra no domínio em que ε(ω) > 0, o metal subitamente pode transmitir luz e a sua refletividade muda
drasticamente. Isso acontece, tipicamente, no ultravioleta e dá lugar ao termo transparência dos metais ao
ultravioleta. A determinação da frequência crítica fornece informações sobre a densidade ou a massa efetiva
dos elétrons condutores no metal.
É usual separar formalmente a constante dielétrica de um meio condutor em duas partes, uma constante
dielétrica real ε, e uma condutividade real σ, tal que de acordo com a lei de Ohm temos ~J = σ~E. Dessa
forma, as equações de Maxwell ficam
~ · ~E = 0
∇ (9.81a)
~ · ~B = 0
∇ (9.81b)
~ × ~E + 1 ∂~
B
∇ =0 (9.81c)
c ∂t
~ ×B~ − µε ∂~E 4π σ µ ~
∇ = E, (9.81d)
c ∂t c
em que usamos as relações
~ = ε ~E
D ~ = 1~
H B.
e
µ
Para determinar as equações de onda que mostram o comportamento dos campos elétrico e magnético,
vamos manipular a álgebra vetorial, tal que teremos
4π σ µ ∂~E µ ε ∂ 2~E
∇2~E − − 2 =0 (9.82)
c2 ∂t c ∂t2
B µ ε ∂2~
4π σ µ ∂ ~ B
∇2 ~
B− − 2 = 0. (9.83)
c2 ∂t c ∂t2
Estas mostram que os campos elétrico e magnético satisfazem equações de onda idênticas, contendo os
termos de amortecimento proporcionais à condutividade do meio condutor. Estas equações são conhecidas
como equação do telégrafo, pois constituem a base teórica da telegrafia sem fio, desenvolvida por Marconi
e Popov.12
Se os campos no condutor variam no espaço e no tempo na forma
~E = ~E0 ei ~k ·~r−i ωt
~
~
B=~ B ei k ·~r−i ωt ,
0
podemos ver que ~E0 e ~B0 são amplitudes transversais ao vetor de onda ~k. Substituindo as expressões
anteriores nas Eqs. (9.82) e (9.83), temos
2 4π σ µ ω µ ε ω 2 ~ i ~k ·~r−i ωt
k −i − E0 e =0
c2 c2
e uma equação similar para ~
B0 . Logo, sendo este resultado válido para valores arbitrários de ~E0 , temos
2 ω2 4πσ
k = µε 2 1 + i . (9.84)
c ωε
O primeiro termo corresponde à corrente de deslocamento e o segundo à corrente de condução. Ao tomar
a raiz quadrada, impomos que k tenha os resultados familiares quando σ = 0. Então encontramos, supondo
que σ, µ e ε sejam reais,
α
k =β+i , (9.85)
2
12
Guglielmo Marconi, primeiro marquês de Marconi (1874-1937), engenheiro, físico e inventor italiano.
Alexander Stepanovich Popov “Popoff” (1859-1906), físico russo.
G. Marconi, The Nobel Prize in Physics (1909), nobelprize.org; A. S. Popov, Zh. Russ. Fiz.-Khim. Obshchestva (Physics,
pt 1) 27, 259-260 (1895); Idem, 28, 1-14 (1896); Idem, An application of the coherer, The Electrician (1897).
“Z_2” — 2017/9/5 — 8:19 — page 248 — #268
em que
q 12
4πσ 2
β √ ω 1 + ωε ± 1
α = µε . (9.86)
2 c 2
4πσ
Para um mau condutor ωε ≪ 1 encontramos, aproximadamente,
r
α √ ω 2π µ
k = β + i ≈ µε + i σ, (9.87)
2 c c ε
expressão correta até a primeira ordem em σ/ωε. Neste limite, temos ℜ[k] ≫ ℑ[k], e a atenuação de
onda (ℑ[k]) não depende explicitamente da frequência. Para um bom condutor 4πσ α
ωε ≫ 1 , 2 e β são
aproximadamente iguais:
√
2πωµσ
k ≈ (1 + i) , (9.88)
c
em que temos os termos de primeira ordem em ωε/σ.
~
As ondas que se propagam como ei k ·~r−i ωt são ondas transversais amortecidas. Os campos podem ser
escritos como
em que k̂ é o versor na direção de ~k. A equação da divergência para ~E mostra que ~E0 · k̂ = 0, enquanto a
lei de Faraday nos dá
~ 0 = c β + i α k̂ × ~E0 .
H (9.90)
µω 2
~ e ~E estão fora de fase num condutor. Com o módulo e a fase de k definidos como
Isto mostra que H
r " 2 #1/4
α2 √ ω 4πσ
|k| = + β 2 = µε 1+
4 c ωε
(9.91)
α 1 4πσ
φ = tan−1 = tan−1 ,
2β 2 ωε
r " 2 #1/4
~0= ε 4πσ
H 1+ ei φ k̂ × ~E0 . (9.92)
µ ωε
r " #1/4
~ 0|
|H ε 4πσ 2
= 1+ . (9.93)
|~E0 | µ ωε
“Z_2” — 2017/9/5 — 8:19 — page 249 — #269
Em condutores muito bons, podemos ver que a grandeza do campo magnético é muito grande comparada
com a do campo elétrico e está atrasado no tempo por um ângulo de fase em quase 45◦ . A natureza da
energia do campo eletromagnético é quase toda magnética, i.e., temos
~ 0| r r r
|H ε 4πσ 4πσ
→ = ≫1
~
|E0 | µ ωε ωµ
ou r
|~
B0 | 4πσµ
→ ≫ 1.
|~E0 | ω
As ondas dadas por (9.89) mostram uma atenuação exponencial com a distância de penetração. Isto
mostra, que uma onda eletromagnética que entra num condutor tem sua amplitude reduzida num fator 1/e
depois de percorrer uma distância
2 c
δ= ≈√ , (9.94)
α 2πµωσ
em que a última aproximação vale para bons condutores. A distância δ é chamada de skin depth ou distância
de penetração.
Efeito Skin Em um bom condutor, como notamos, a corrente de condução é muito maior do que a corrente
de deslocamento, tal que podemos desprezá-la. Assim, da Eq. (9.82) temos,
4πσµ ∂~E
∇2~E − =0
c2 ∂t
4πσµ ∂~J
∇2~J − = 0.
c2 ∂t
Estas equações são familiares, pois são justamente as equações de difusão. Se escrevermos
~J(t) = ~J0 e− i ωt ,
então
∇2~J0 + τ 2 ~J0 = 0 ,
em que
4πσµω
τ2 = i .
c2
√ 1+i
Agora, i= √ ,
2
tal que
√
2πσµω 1+i
τ = (1 + i) =
c δ
em que δ é skin depth ou distância de penetração,
c
δ=√ ,
2πσµω
ondas planas normal a superfície, e polarizadas na direção z, tal que a amplitude ~J0 (~r) se reduz a Jz (x).
Então a solução da equação ∇2~J0 + τ 2 ~J0 = 0 será simplesmente
(i −1)x
Jz (x) = Jz (0) ei τ x = Jz (0) e δ ,
em que Jz (0) é a amplitude da densidade de corrente na superfície. Descartando a fase da onda de amorte-
cimento penetrando no condutor, obtemos a grandeza relativa da densidade de corrente em uma profundi-
dade x,
Jz (z) x
= e− δ .
Jz (0)
A densidade de corrente diminui exponencialmente dentro do condutor. As medidas da distância de pene-
tração δ, para um determinado material e uma dada frequência, mostra a profundidade no material em que
a densidade da corrente foi reduzido para 1/e do valor na superfície, e-folding.13 Para um condutor, como
o cobre,
δ ≈ 0, 85 cm para frequências de 60 Hz ,
−3
δ ≈ 0, 71 × 10 cm para frequências de 100 MHz .
Por outro lado, para frequências de 15 kHz, a distância de penetração para águas do mar é aproximadamente
de 200 cm. Voltando para materiais condutores, essa rápida atenuação significa que, em circuitos de altas
frequências, a corrente circula somente pela superfície dos condutores. Uma consequência deste resultado
é que a indutância de uma circuito em baixas frequências é maior que para altas frequências, devido à
expulsão do fluxo magnético do interior dos condutores. Este é o chamado efeito skin ou skin effect.
Reflexão e Refração em uma Superfície Metálica Neste momento, trataremos da reflexão e da reflação
de uma onda eletromagnética em uma interface entre um dielétrico e um meio condutor. É interessante
observar que as equações de Fresnel continuam válidas, mas devemos tomar cuidado com o índice de
refração dos metais, pois estes serão complexos.
Para um meio condutor, vamos considerar a Eq. (9.81d),
~ ×~ µ ε ∂~E 4π σ µ ~
∇ B− = E,
c ∂t c
usando a variação temporal periódica, i.e., e− i ωt , encontramos
~ ~ 4π σ µ
∇×B− ε+i (− i ω) ~E = 0 .
ω c
Então, facilmente podemos definir a constante dielétrica complexa como
4π σ
b
ǫ = ε+i . (9.95)
ω
Mas ainda temos que a Eq. (9.84) lembra a Eq. (9.5), na qual temos a adição complexa na constante dielé-
trica. Assim,
ω2 4πσ p
k2 = µε 2 1 + i → b= ω b
k ǫµ , (9.96)
c ωε c
13
Na ciência, e-folding é o intervalo de tempo no qual uma quantidade exponencialmente crescente aumenta por um fator e; que
é a base e análogo ao tempo de duplicação. Este termo é frequentemente usado em muitas áreas da ciência, como na química
atmosférica, medicina e física teórica, especialmente quando a inflação cósmica é investigada. Físicos e químicos, muitas vezes
falam sobre a escala de tempo e-folding que é determinado pelo tempo próprio em que o comprimento de um fragmento do
espaço ou do espaço-tempo aumenta pelo fator e mencionado.
“Z_2” — 2017/9/5 — 8:19 — page 251 — #271
No estudo da reflexão e da transmissão em uma superfície metálica, por simplicidade, vamos considerar
o caso especial em que temos a onda de incidência normal, a onda incidente vem de um meio não condutor
(por exemplo, ar) pare um meio feito de bom condutor (por exemplo, metal), nenhum dos meios são mag-
néticos. As amplitudes das ondas transmitida e refletida tem a forma das relações dadas em (9.48) com a
substituição n → nb
2n1
E0′ = E0
n1 + n
b2
(9.98)
n1 − n
b2
E0′′ = E0 ,
n1 + n
b2
nas quais, para nosso caso, são complexas. No limite de um bom condutor, 4πσ2 ≫ ε2 ω. Da Eq. (9.97),
temos r r
4π σ2 4π σ2 c
n
b2 = ε2 + i → i = (1 + i)
ω ω ωδ
c
em que usamos distância de penetração δ = √2πσω definida na Eq. (9.94). Por conveniência, vamos intro-
duzir comprimento de onda reduzido λ, para a onda de frequência ω no espaço livre,
λ c
λ= = .
2π ω
Então, com ω = 2πν, temos
r r
δ ωδ ω ν
= = = .
λ c 2π σ σ
Com estas substituições, a razão da amplitude refletida com a amplitude incidente será
E0′′ n1 − (1 + i) λδ
= .
E0 n1 + (1 + i) λδ
2
E ′′ 2 n1 − (1 + i) λδ
R= 0 =
E0 n1 + (1 + i) λδ
n1 − λδ (1 + i) n1 − λδ (1 − i)
=
n1 + λδ (1 + i) n1 + λδ (1 − i)
2 2 2
n1 − λδ + λδ δ
λ n1 − 1 +1
= 2 2 = 2
n1 + λδ + λδ δ
λ n1 + 1 +1
2
1 − λδ n1 + 1
= 2 (9.99)
1 + λδ n1 + 1
“Z_2” — 2017/9/5 — 8:19 — page 252 — #272
Como para bons condutores, a razão λδ é menor do que a unidade, podemos desenvolver o coeficiente de
reflexão em uma expansão de primeira ordem, tal que
r
δ ν
R ∼ 1 − 2 n1 = 1 − 2n1 .
λ σ2
Naturalmente, nesta condição, o coeficiente de transição será
r
δ ν
T = 1 − R ∼ 2 n1 = 2n1 .
λ σ2
Isto representa a fração da energia incidente média na superfície, que é transmitida para, e absorvida pelo,
o meio de condução.
Agora, examinaremos a refração de uma onda eletromagnética que incide com o ângulo i em um meio
condutor, conforme indica a Fig. 9.11. Os meios situados abaixo e acima do plano z = 0 têm índices de
refração dados por n1 e n b2 , respectivamente. Uma onda plana incidente com vetor de onda ~k incide na
interface a partir do meio n1 . As ondas refratada e refletida têm vetores ~k′ e ~k′′ , respectivamente, e n̂ é um
vetor unitário normal, dirigido do meio n1 até o meio n b2 . Aqui definiremos o índice de refração complexo
3 ~k
′
n̂ 6
r
n
b2
x
n1 QQ
Q
i i Q
Q
Q
Qs ~k′′
Q
~k
Figura 9.11 Uma onda ~k incide em um meio condutor, dando lugar a uma onda refletida ~k′′ e uma
onda refratada ~k′ .
como
n
b2 = n (1 + i κ) , (9.101)
em que n e κ são reais, sendo κ o índice de atenuação ou índice de extinção. As quantidades n e κ são
facilmente expressas em termos das constantes do material ε, µ e σ. Assim, enquadrando (9.101) e usando
as Eqs. (9.95)-(9.97), temos
b22 = n2 1 + 2 i κ − κ2
n
“Z_2” — 2017/9/5 — 8:19 — page 253 — #273
e
4π σ
b22
n = µb
ǫ=µ ε+i .
ω
Aqui, tanto σ quanto ε não são constantes verdadeiras do meio, elas dependem da frequência. Assumindo
que ε também seja real, para nosso caso, igualamos as partes real e imaginária das relações anteriores e
encontraremos,
n2 1 − κ2 = µε
2π µσ µσ
n2 κ = = .
ω ν
a partir dessas relações, conclui-se que
"r #
1 4µ 2 σ2
2
n = µ2 ε2 + + µε
2 ν2
"r #
1 4µ 2 σ2
2 2
n κ = µ2 ε2 + − µε .
2 ν2
O sinal positivo da raízes quadradas nas equações anteriores é tomado aqui, desde que n e nκ são reais,
e consequentemente n2 e n2 κ2 também serão positivos. Tendo em mãos essas considerações, voltamos ao
problema em que a onda refratada será dada por
sen i = n
b2 sen r .
Esta relação requer um cuidado. Embora seja análoga à lei de Snell, não podemos afirmar que r seja um
b2 é uma grandeza complexa. Deste modo, vejamos a representação complexa de r,
ângulo de refração, pois n
sen i sen i
sen r = =
n
b2 n (1 + i κ)
1 − iκ
= sen i = γ (1 − i κ) sen i , (9.102)
n (1 + κ2 )
p q
cos r = 1− sen2 r = 1 − [γ (1 − i κ) sen i]2
p
= 1 − γ 2 (1 − κ2 ) sen2 i + i 2κγ 2 sen2 i , (9.103)
em que
1
γ= .
n (1 + κ2 )
“Z_2” — 2017/9/5 — 8:19 — page 254 — #274
dω
De (9.113), vemos que a integral em (9.115) é justamente u(x′ , 0), em que x′ = x − dk 0 t:
dω
u(x, t) ≈ u x − t, 0 ei[k0 (dω/dk)|0 −ω0 ]t . (9.116)
dk 0
Isto mostra que, além de um fator de fase global, o pacote se desloca sem deformação na sua forma, e com
uma velocidade, denominada velocidade de grupo
dω
vg ≡ . (9.117)
dk k0
Se uma densidade de energia está associada com a onda, é claro que nesta aproximação, o transporte de
energia acontece com a velocidade de grupo, uma vez que esta é a velocidade na qual o pulso viaja (avança).
Para ondas de luz, a relação entre ω e k é dada por
ck
ω (k) = , (9.118)
n(k)
em que c é a velocidade da luz no vácuo, e n(k) é o índice de refração expresso como função de k. A
velocidade de fase é
ω (k) c
vf = = , (9.119)
k n(k)
“Z_2” — 2017/9/5 — 8:19 — page 256 — #276
sendo menor ou maior que c, dependendo de n(k) ser maior ou menor do que a unidade.18 Para a maioria
das frequências ópticas, n(k) é maior que a unidade em quase todas as substâncias. Assim, a velocidade de
grupo (9.117) é
c
vg = dn
. (9.120)
n(ω) + ω dω
Nesta equação, é conveniente pensar em n como função de ω, no lugar de k. Para dispersão normal
(dn/dω) > 0, e também n > 1; a velocidade de propagação da energia é menor que a velocidade de
fase, e também menor que c, em acordo com nossa intuição.
Considerando um meio que possui somente uma frequência natural de oscilação ω0 e uma constante de
amortecimento γ, sua constante dielétrica dada por Eq. (9.66) fica,
ωp
ε(ω) = 1 + ,
ω02 − ω 2 − i γω
em que ωp é a frequência de plasma do meio, já definido. Para simplificar, será assumido que a permeabili-
dade magnética do meio é igual à do vácuo. Assim, a relação de dispersão será
2 ω2 ωp
k = 2 1+ 2 ,
c ω0 − ω 2 − i γω
sendo mais conveniente escrever a expressão para o índice de refração do meio, n = kc/ω, o qual pode ser
diretamente comparado com o índice de refração do vácuo. Então,
ωp
n2 (ω) = 1 − .
ω2 − ω02 + i γω
Observa-se que o índice de refração deste meio é uma quantidade complexa que possui polos em
q
ω = ± ω02 − i γω .
A Fig. 9.12 mostra o comportamento de n2 (ω) = ℜ[n2 ] + i ℑ[n2 ] para um conjunto particular de
valores para γ e ωp . Os comportamentos tanto da parte real quanto da parte imaginária nas vizinhanças de
ω = ω0 são característicos de um meio dispersivo. A parte real de n2 está associada com as características de
propagação da onda no meio. Em um meio não dispersivo, uma onda plana com qualquer frequência sempre
irá se propagar com a mesma velocidade, denominada velocidade de fase, vf = c/n, portanto, vf < c. Um
meio dispersivo, por outro lado, possui um índice de refração que depende da frequência da onda, como
ilustrado na Fig. 9.12. Nesta, percebem-se duas regiões distintas: uma região denominada subluminal e uma
outra região denominada superluminal. Na primeira região, temos ℜ[n2 ] > 1 e, portanto, vf < c, como
no caso de um meio não dispersivo. Contudo, na região superluminal, vf > c, o que contradiz o princípio
da relatividade restrita. Por si só, essa já é uma indicação que a velocidade de fase não é a quantidade que
calcula adequadamente a velocidade de propagação de um pulso eletromagnético em um meio dispersivo.
Além disso, em ambas as regiões a dependência de n2 em ω implica que diferentes componentes de Fourier
do pulso se propagarão com diferentes velocidades de fase. Este fenômeno provoca a dispersão do pulso e
torna a velocidade de fase definitivamente inútil para determinar a taxa de transporte da energia pela onda
eletromagnética.
Usualmente, a velocidade de grupo, vg , é a velocidade de propagação de um pulso em num meio disper-
sivo. Tanto na região subluminal quanto na região superluminal, constata-se que vg ≤ c, obedecendo assim
18
A velocidade de fase pode ser maior que c, mas isso não causa problemas em relação à relatividade porque a informação é
transmitida pela onda completa, que se propaga com a velocidade de grupo, que é geralmente menor ou igual a c. Mas mesmo
a velocidade de grupo poderá ser maior do que c. Veja, P. C. Peters, American Journal of Physics, 56, 129 (1988).
“Z_2” — 2017/9/5 — 8:19 — page 257 — #277
Figura 9.12 Gráfico de n2 (ω) para γ = ω0 /3 e ωp = ω0 /2. A curva acima é ℜ[n2 ] e a curva abaixo
é ℑ[n2 ]. Em destaque observam-se as regiões onde as ondas são subluminais, superluminais ou
onde ocorre dispersão anômala.
a relatividade restrita. Contudo, existe uma região na Fig. 9.12 denominada de dispersão anômala, na qual a
velocidade de grupo também não é a medida correta da velocidade do pulso. Nesta região, identificada pelo
intervalo de valores de frequência em que ∂ℜ[n2 ]/∂ω < 0, a velocidade de grupo muda de sinal, o que é
uma indicação de que esta é uma região proibida, ou seja, onde não é possível a existência de ondas eletro-
magnéticas. Em certos tipos de meios dispersivos, pode ocorrer até que |vg | > c ou mesmo que vg < 0, i.e.,
aparente violação da relatividade. Associado a este fato, observa-se também na Fig. 9.12 que a parte ℑ[n2 ]
é positiva e cresce significativamente na região de dispersão anômala. Valores de ℑ[n2 ] > 0 mostram que
as ondas são substancialmente absorvidas nessa região, o que também indica ser esta uma região proibida
para as mesmas.
Escrevendo-se agora a equação de dispersão em termos de ω = ω (k), obtém-se,
ω 4 + i γω 3 − ω02 + ωp2 + k2 c2 ω 2 − i γk2 c2 ω + ω02 k2 c2 = 0 .
Propagação de um Pulso Unidimensional em um Meio Dispersivo Para ilustrar uma aplicação prática
dos resultados obtidos anteriormente, considera-se um modelo físico para um meio contínuo específico,
representado pela sua relação de dispersão, a ser utilizado no cálculo, sem aproximações, da propagação de
um pulso policromático de ondas eletromagnéticas.
Assim, para realizar tal cálculo, é necessário especificar as condições iniciais do pulso e tratar o pro-
blema para todos os instantes posteriores. Como a equação da onda é de segunda ordem, considera-se como
condições iniciais a forma do pulso eletromagnético em t = 0 e sua primeira derivada. Assim, a solução de
XZ
~E(~r, t) = 1 ~
d3 k ~Eσ (~k) ei(k ·~r−ωk t)
σ
(2π)3 σ
Como, Z
~′ ~
d3 r ei(k −k) ·~r = (2π)3 δ(~k′ − ~k)
temos
Z X
~
d3 r e− i k ·~r ~E(~r, 0) = ~Eσ (~k) (9.121a)
σ
Z X
~ ∂~
d3 r e− i k ·~r E(~r, 0) = − i ~Eσ (~k) ω σ ,
k (9.121b)
∂t σ
o qual consiste em um sistema de equações que irá determinar as amplitudes espectrais ~Eσ (~k), caso seja
possível.
Reduzindo o problema para uma dimensão (coordenada x) e representando a componente do campo
elétrico nessa situação por u(x, t), temos
Z
1 X ∞ σ
u(x, t) = dk Eσ (k) ei(kx−ωk t) .
2π σ −∞
A relação de dispersão a ser empregada nesta aplicação prática será obtida para um meio com permea-
bilidade magnética constante e idêntica ao vacuo e com a permeabilidade elétrica valida no limite de alta
frequência. Assim, a equação de dispersão fica
!
2 ω 2
ω p
k2 − 2 1 − 2 = 0 ⇒ k2 c2 − ω 2 + ωp2 = 0
c ω
em que σ = ±1 e ωk ≡ ωk+ .
Consideramos agora o caso de um pulso monocromático de extensão finita lançado a partir da origem
em t = 0 para ambos os sentidos ao longo do eixo x. Este tipo de pulso é modelado por
2 /2L2 ∂u(x, 0)
u(x, 0) = e−x cos k0 x , = 0,
∂t
em que L é a largura espacial do pulso e k0 = 2π/λ está relacionado ao comprimento de onda λ. Para este
tipo de pulso, as amplitudes espectrais, obtidas a partir da Eq. (9.123), ficam
Z
1 ∞ 2 2
Eσ (k) = dx e− i kx e−x /2L cos k0 x
2 −∞
r
π h −(L2 /2)(k−k0 )2 2 2
i
= L e + e−(L /2)(k+k0 ) ,
8
com σ = ±1.
Com este resultado, a solução da equação da onda u(x, t) é obtida a partir de
Z
1 X ∞ σ
u(x, t) = dk Eσ (k) ei(kx−ωk t)
2π σ −∞
“Z_2” — 2017/9/5 — 8:19 — page 260 — #280
e da relação de dispersão ωkσ = σ ωp 1 + 12 a2 k2 . Logo,
Z ∞ Z ∞
1
u(x, t) = dk E+ (k) ei(kx−ωk t) + dk E+∗
(k) e− i(kx−ωk t)
2π 0 0
Z ∞ Z ∞
i(kx+ωk t) ∗ − i(kx+ωk t)
+ dk E− (k) e + dk E− (k) e ,
0 0
ℜ[ωkσ ] = −ℜ[ω−k
σ
]
ℑ[ωkσ ] = ℑ[ω−k
σ
],
mostrando que o resultado é real. Uma vez empregadas as propriedades matemáticas de Eσ (k) e ωk , pode-
-se fazer uso do fato de que ambas são funções pares em k. Além disso, para este caso, Eσ (k) é real e
independente de σ. Assim, podemos escrever a expressão anterior da seguinte forma,
Z ∞ h ih i
L −(L2 /2)(k−k0 )2 −(L2 /2)(k+k0 )2 i(kx−ωk t) i(kx+ωk t)
u(x, t) = √ ℜ dk e +e e +e .
32π −∞
Em t = 0 esta expressão se reduz às condições iniciais. Para t > 0, escrevemos a expressão anterior na
forma compacta,
" #
L XZ ∞ 1 2 2
−(L2 /2)(k−s1 k0 )2
u(x, t) = √ ℜ dk e exp i kx + s2 ωp 1 + a k t ,
32π s1 ,s2 −∞
2
A solução acima é real, pois é fácil mostrar que u∗ (x, t) = u(x, t). Além disso,
" #
1 X − x2
− i s k x
u(x, 0) = ℜ e 2L2 e 1 0
,
2 s 1
Assim, os efeitos dispersivos em um dado pulso são mais intensos durante um dado intervalo de tempo ∆t
quanto mais estreito for o pulso inicial, i.e., quanto menor for L. O critério para um efeito dispersivo menos
intenso é dado por L ≫ a. Obviamente, para tempo longos o pulso sempre irá variar linearmente com o
tempo
L(t) a
−→ ωp t ,
a L
mas o tempo necessário para se chegar a essa forma limite depende da razão a/L. A Fig. 9.13 mostra uma
comparação entre dois pulsos lançados inicialmente com diferentes larguras. O pulso mais largo (k0 L ≫ 1)
consiste em um pacote de ondas composto por um número grande de comprimentos de onda e é pouco
distorcido durante sua propagação pelo meio dispersivo. Já o pulso mais estreito (k0 L . 1) é deformado
em um tempo relativamente curto.
Figura 9.13 Alteração na forma de um pacote de ondas durante a propagação em um meio dispersivo.
O pulso mais largo contém um número maior de comprimentos de onda (k0 L ≫ 1) e é comparati-
vamente menos distorcido que o pulso mais estreito (k0 L . 1), na qual é rapidamente disperso.
a dependência em relação ao tempo pode ser construída pela superposição de Fourier. As integrais de Fourier
no tempo e na frequência podem ser escritas como
Z ∞
~ 1 ~ (~r, t) ei ωt
D(~r, ω) = dt D
2π −∞
(9.126)
Z ∞
~E(~r, ω) = 1 dt ~E(~r, t) ei ωt .
2π −∞
19
R. de L. Kronig, J. Opt. Soc. Am., 12, 547-557 (1926), H. A. Kramers, Atti Cong. Intern. Fisici, (Transactions of Volta Centenary
Congress) Como, 2, 545-557 (1927).
“Z_2” — 2017/9/5 — 8:19 — page 262 — #282
As Eqs. (9.126) definem D ~ (~r, ω) e ~E(~r, ω) para frequências positiva e negativa. Usando a transformada
~ (~r, ω) e a relação (9.125) temos:
inversa de Fourier para D
Z ∞ Z ∞
~
D(~r, t) = ~
dω D(~r, ω) e − i ωt
= dω ε(ω) ~E(~r, ω) e− i ωt
−∞ −∞
Definindo Z ∞
′ 1
τ =t−t , G(τ ) = dω [ε(ω) − 1] e− i ωτ ,
2π −∞
Nota-se que a Eq. (9.128) é não local no tempo, mas não no espaço. Essa aproximação é válida desde que a
variação espacial dos campos aplicados tenha uma escala que seja grande em comparação com as dimensões
envolvidas na criação da polarização atômica ou molecular.
Para um índice de refração dado por (9.66), com uma só ressonância:
ωp2
ε(ω) − 1 = , (9.129)
ω02 − ω 2 − i γω
A integral acima pode ser calculada mediante uma integração de contorno, i.e., devemos usar o plano com-
plexo e os teoremas de integrais de Cauchy.20 O integrando tem polos na metade inferior do plano ω,
r
2 2 γ γ2
ω0 − ω − i γω = 0 ⇒ ω± = − i ∓ ω02 − .
2 4
Como os dois polos estão na parte inferior do plano complexo, devemos nos preocupar com a integração
feita nesta região. Para τ < 0, o contorno pode ser fechado na metade superior do plano sem afetar o valor
da integral. Uma vez que o integrando é regular no intervalo do contorno fechado, a integral é nula, i.e.,
Z ∞ I
e− i ωτ e− i ωτ
dω = dω = 0 .
−∞ ω02 − ω 2 − i γω S ω02 − ω 2 − i γω
20
Barão Augustin-Louis Cauchy (1789-1857), matemático francês.
“Z_2” — 2017/9/5 — 8:19 — page 263 — #283
Para τ > 0, o contorno é fechado na metade inferior do plano ω, e a integral será diferente de zero, i.e.,
Z ∞ I
e− i ωτ e− i ωτ γτ sen ω1 τ
dω = dω = 2π e− 2 ,
−∞ ω02 − ω 2 − i γω S
2 2
ω0 − ω − i γω ω1
em que −2ω1 = ω+ − ω− . Esta ilustração mostra que o aspecto mais óbvio e fundamental do núcleo é o de
que ele é nulo para τ < 0.
Mais rigorosamente, a causalidade implica que o futuro do campo elétrico, ~E(~r, t′ ) para t > t′ , não
~ (~r, t) e
podem contribuir para determinar o campo deslocamento, D
implica em
ε(−ω) = ε∗ (ω ∗ ) . (9.133)
Pela relação (9.131) temos que G(τ ) = 0 para τ < 0, mas não assumimos que G(τ ) seja contínuo em
τ = 0, porém G(τ ) 6= 0. É um fato físico mensurável que ε(ω) existe para ω real, e este fato implica numa
redefinição da Eq. (9.132) de ε(ω), desta forma podemos resolver o problema de G(τ ) 6= 0, normalmente
usando o limite vindo da parte do plano complexo superior,
Z ∞
ε(ωℜ ) − 1 = lim dτ ei ωℜ τ −ωℑ τ G(τ ) . (9.134)
ωℑ →0+ 0
Para τ → ∞ temos G(τ ) → 0, que nos leva à uma série assintótica. Veja que ε(ω) não depende de eventos
ocorridos em um passado distante (passado infinito). Definindo g(τ ) por
G(0) = 4π σ c , (9.137)
em que σ c é a condutividade.
Deixamos com Z ∞
ε0 (ωℜ ) − 1 = dτ ei ωτ g(τ ) , g(0) = 0 (9.138)
0
“Z_2” — 2017/9/5 — 8:19 — page 264 — #284
e, pelo fato de e−ωℑ τ ir para zero quando τ > 0, a integral (9.138) mostra que ε0 (ω) também é uma função
analítica de ω no semiplano complexo superior. Se g(τ ) para τ > 0 está definido por uma expansão de
Taylor
X∞
τ n (n)
g(τ ) = g (0) , (9.139)
n!
n=1
Em particular, no limite ωℑ → 0, a série assintótica mostra que temos as partes real e imaginária de ε(ω)
como
1 1
ℜ[ε0 (ωℜ ) − 1] = O 2
, ℑ[ε0 (ωℜ ) − 1] = O .
ω ω3
A analiticidade de ε(ω) no semiplano complexo superior possibilita o uso do teorema de Cauchy para
relacionar a parte real e a imaginária de ε(ω) sobre o eixo real. Assim, com o uso do teorema de Cauchy,
i.e., seja f (z) analítica no interior de um contorno fechado C. Para qualquer ponto z dentro de uma curva
fechada C no semiplano superior ω, temos
I
1 f (ω ′ ) − 1 ′
f (z) = 1 + dω , (9.141)
2π i C ω ′ − z
encontramos, I
1 ε(ω ′ ) − 1 ′
ε(z) = 1 + dω . (9.142)
2π i C ω′ − z
Escolhe-se agora a curva C constituindo pelo eixo real de ω e uma grande semicircunferência no infinito, no
semiplano superior. Com a expansão assintótica que acabamos de discutir, vemos que ε(ω) − 1 se anula com
grande rapidez no infinito, de modo que a semicircunferência em nada contribui para a integral. Portanto a
integral de Cauchy será escrita na forma
Z ∞
1 ε(ω ′ ) − 1 ′
ε(z) = 1 + dω , (9.143)
2π i −∞ ω ′ − z
em que z é agora qualquer ponto no semiplano superior e a integral se efetua sobre o eixo real. Tomando o
limite quando a frequência complexa se aproxima do real, vinda de cima, escreveremos z = ω + i η. Desta
forma Z ∞
1 ε(ω ′ ) − 1
ε(ω) = 1 + dω ′ . (9.144)
2π i −∞ ω ′ − ω − i η
Com ω real, a presença de i η no denominador é uma observação para distorcer o contorno ao longo do
eixo real, dando-lhe um pequeno desvio semicircular para baixo no ponto ω ′ = ω. O denominador pode ser
escrito formalmente como
1 1
=P + π i δ(ω ′ − ω) , (9.145)
ω′ − ω − i η ω′ − ω
“Z_2” — 2017/9/5 — 8:19 — page 265 — #285
Estas relações, ou as que serão escritas imediatamente, são conhecidas como as relações de Kramers-Kronig
ou relações de dispersão. As integrais (9.147) podem ser transformadas para cobrir somente as frequências
positivas:
Z ∞ ′
2 ω ℑ[ε(ω ′ )] ′
ℜ[ε(ω)] = 1 + P dω
π 0 ω′2 − ω2
(9.148)
Z ∞
2ω ℜ[ε(ω ′ ) − 1
ℑ[ε(ω)] = − P ′2 − ω2
dω ′ .
π 0 ω
Ao escrever (9.147) ou (9.148), admitimos implicitamente que ε(ω) era regular em ω = 0. Para condutores,
o polo simples em ω = 0 pode ser tratado separadamente, e tem uma forma um pouco mais complicada.21
com k = ω/c. A Eq. (9.149) pode ser interpretada como a superposição da onda incidente com a onda
refletida.
A amplitude u(k) desta onda é dada pela transformação de Fourier, quando x = 0, também assumimos
as condições de contorno, x = 0 no tempo t = 0 tal que
ud (x, t) = 0 . (9.157)
Esta equação, em conjunto com u0 (0, t) = 0, estabelece que nenhum sinal se propaga com velocidade maior
do que c, qualquer que seja o meio, como era de se esperar.
Problemas
9.1 Dada a equação de onda, (1.21),
1 ∂2Ψ
∇2 Ψ − = 0,
c2 ∂t2
em que Ψ é um campo escalar, mostre que: a) A equação de onda não é invariante sob as transformações
de Galileu. b) A equação de onda é invariante sob as transformações de Lorentz.
“Z_2” — 2017/9/5 — 8:19 — page 267 — #287
~ ei ~k ·~r , em que A
9.2 Demonstre que, se ~F(r) = A ~ é constante, temos
~ · ~F = i ~k · ~F
∇ e ~ × ~F = i ~k × ~F .
∇
9.3 Duas ondas planas possuem os mesmos ω, ~k e amplitude E, mas polarizações circulares opostas, i.e.,
esquerda e direita. Demonstre que a superposição das duas ondas é linearmente polarizada, com ampli-
tude 2E.
9.4 Considere duas ondas planas no vácuo que possuem os mesmos ω, ~k e sentido de polarização ~p, porém
com amplitudes e fases diferentes, (E1 , 0) e (E2 , φ). Calcule o vetor de Poynting temporal médio, ~S,
da superposição das duas ondas. Observe o efeito de interferência devido à diferença de fase φ, que não
poderia ocorrer se as duas ondas tivessem direções de polarização perpendiculares.
9.5 Para uma onda plana em um meio condutor
~ n̂
B = û × ~E ,
c
em que n̂ = n + i k é o índice de refração complexo. Suponha que ~E é elipticamente polarizado, com
~E = Ep ei φ p̂ + Es ŝ .
9.10 a) Uma onda plana circularmente polarizada move-se na direção z, tendo extensão finita nas direções
x e y. Supondo que seja um pacote de ondas, mostre que
~E(~r, t) ≃ E0 (x, y) (ê1 ± i ê2 ) + i ∂E0 ± i ∂E0 ê3 ei(kz−ωt)
k ∂x ∂y
e
~ √
B ≃ ∓ i µε ~E .
Lembre-se que ê1 , ê2 e ê3 são os versores nas direções x, y e z.
b) Mostre ainda que a componente z média do momentum angular obedece a relação
U = ωLz ,
em que U é a densidade média de energia. Sugestão: Consulte o livro do Prof. Marion [36].
~ ·A
9.11 a) Considere o calibre de Coulomb para os potenciais: ∇ ~ = 0. Mostre que para distâncias sufici-
~ nesse caso.
entemente longas em relação às fontes, podemos tomar A0 = 0. Encontre a equação para A
b) Mostre que o momentum angular é
Z X3
~L = 1 ~ +
d3 x ~E × A ~ Aj ,
Ej ~r × ∇
4πc
j=1
em que
XZ d3 k h ~ i
~ (~r, t) =
A ǫ̂ λ (k) aλ (~k) ei(~k ·~r−ωt) + c.c.
(2π)3
λ
em que a e b são constante reais. Determine a razão entre os valores médios do spin e da energia da
onda.
9.13 Use as relações de Kramers-Kronig, (9.148), para calcular a parte real de ε(ω), dando a parte imagi-
nária de ε(ω) para ω positivo como
a) ℑ[ε] = λ [η(ω − ω1 ) − η(ω − ω2 )], para ω2 > ω1 > 0, em que η é a função degrau.
b) ℑ[ε] = (ω2 −ωλγω
2 )2 +γ 2 ω 2 .
0
9.14 Discuta a extensão das relações de Kramers-Kronig, (9.148), para um meio com uma condutividade
elétrica estática σ. Mostre que a primeira equação de (9.148) não será alterada, porém a segunda equa-
ção será Z ∞
4πσ 2ω [ℜ[ε(ω ′ )] − 1]
ℑ[ε(ω)] = − P ′2 − ω2
dω ′ .
ω π 0 ω
“Z_2” — 2017/9/5 — 8:19 — page 269 — #289
Leitura Recomendada
Recomenda-se fortemente a leitura dos seguintes livros,
– J. D. Jackson [42];
– J. A. Stratton [77];
– M. A. Heald and J. B. Marion [36];
– W. Greiner [34];
– M. Born and E. Wolf [12];
– J. Schwinger, L. L. DeRaad Jr., K. A. Milton and W.-Y. Tsai [72].
Nestes livros, clássicos da literatura, o leitor encontrará excelentes discussões e deduções detalhadas para o
estudo de ondas eletromagnéticas.
O texto do prof. Jackson traz uma excelente sequência de trabalhos, abordando ondas em meios não
condutores, polarização, dispersão, propagação de onda em meio dispersivo e relações de Kramers-Kronig.
O magnífico texto dos profs. Born e Wolf traz o mais completo trabalho em óptica física, com a teoria de
propagação eletromagnética, interferência e difração da luz.
“Z_2” — 2017/9/5 — 8:19 — page 270 — #290
Capítulo 10
Aproximação WKB
ωp2
n2 = 1 − , (10.1)
ω(ω + i ν)
em que ν é uma constante real positiva que parametriza o amortecimento do movimento do elétron, em fato,
ν é a frequência de colisão do elétron livre com outras partículas da ionosfera, e
r
4π N e2
ωp = (10.2)
m
é a frequência de plasma do meio. Na equação anterior, N é a densidade dos elétrons livres na ionosfera e m
é a massa do elétron. Vamos supor que a ionosfera é horizontalmente estratificada, tal que N =N (z), em que
a coordenada z mede a altura acima da superfície da Terra, onde a curvatura da Terra será negligenciada em
nossa análise. A ionosfera consiste basicamente de três camadas; a camada D, a camada E e a camada F .1
1
Do solo para cima, a ionosfera se divide em camadas de ionização. Estas variam conforme a hora do dia, estações do ano e
condições solares. Suas camadas iônicas são: D, E, F 1 e F 2. A camada D é a mais próxima ao solo, fica entre 50 e 80 km,
é a que absorve a maior quantidade de energia eletromagnética, seu comportamento é diurno, aparece no momento em que as
moléculas começam a adquirir energia solar. Esta camada permanece por alguns instantes no início da noite. Ionicamente é a
menos energética. É a responsável pela absorção das ondas de rádio durante o dia. A camada E se situa acima da camada D e
embaixo das camadas F 1 e F 2, sua altitude média é entre 80 e 100-140 km. Semelhante à camada D, durante o dia se forma
e se mantém, durante a noite se dissipa. Em algumas ocasiões, dependendo das condições de vento solar e energia absorvida
durante o dia, a camada E pode permanecer esporadicamente à noite, quando isto ocorre é chamada de camada E-esporádica.
Esta camada tem a particularidade de ficar mais ativa quanto mais perpendiculares são os raios solares que incidem sobre si. A
camada F 1 está acima da camada E e fica entre ∼ 100-140 até ∼ 200 km. Existe durante os horários diurnos, acompanhando o
comportamento da camada E, podendo esporadicamente estar presente à noite. Serve de refletora em determinadas frequências,
esta reflexão varia conforme a espessura que adquire ao receber energia solar. Normalmente a radiofrequência incidente que
270
“Z_2” — 2017/9/5 — 8:19 — page 271 — #291
Para a ionosfera uma típica densidade de elétrons livres máxima é de N ≃ 104 -106 elétrons/cm3 , corres-
pondendo a frequência de plasma na ordem de ωp ≃ 6 × 106 -6 × 107 seg−1 . Vamos investigar com mais
detalhes exatamente como esse processo ocorre. Nota-se, aliás, que, para ondas de rádio com frequência em
MHz, ν ≪ ω, segue-se a partir da Eq. (10.1) que n2 será predominantemente real. Neste trabalho, vamos
utilizar a aproximação WKB.
A segunda aproximação para a solução é obtida pela substituição da Eq. (10.11) no lado direito da
Eq. (10.9)
1
dφ 2 2 dn 2
≃ ± k n ± ik . (10.12)
dz dz
Usando a expansão binomial, temos
1
dφ i dn 2 i dn
≃ ±kn 1 ± 2 ≃ ±kn + . (10.13)
dz kn dz 2n dz
Integrando esta equação obteremos
Z z
φ ∼ ±k n dz + i ln n1/2 . (10.14)
Este deve ser pequeno em comparação com qualquer um dos termos no lado esquerdo da Eq. (10.6). Assim,
a condição para a expressão (10.15) ser uma boa solução da Eq. (10.6) se torna
2
1 3 1 dn 1 d2 n
− ≪ 1. (10.17)
k2 4 n2 dz 2n3 dz 2
As soluções,
Rz
Ey ≃ A n−1/2 e± i k n dz
(10.18a)
Rz
Bx ≃ ∓A n1/2 e± i k n dz
, (10.18b)
para as equações de onda em meio não uniforme (10.4) são conhecidas como soluções WKB.
Recordando que, quando uma onda propagando está incidindo normalmente sobre uma interface, em
que o índice de refração muda repentinamente (por exemplo, quando uma onda de luz propaga-se no ar está
incidindo normalmente sobre uma placa de vidro), há geralmente uma reflexão significativa da onda. No
entanto, de acordo com as soluções WKB, dadas em (10.18), quando uma onda propagando está incidindo
normalmente em um meio na qual o índice de refração varia lentamente ao longo da propagação da onda,
então a onda não se reflete em tudo. Isto é verdade mesmo que o índice de refração varia substancialmente ao
longo do caminho de propagação da onda, desde que varia lentamente. A solução WKB implica que a onda
ao se propagar através do meio mudará gradualmente seu comprimento de onda. De fato, o comprimento de
“Z_2” — 2017/9/5 — 8:19 — page 274 — #294
onda na posição z é aproximadamente λ(z) = k 2π n(z) . As Eqs. (10.18) também implicam que a amplitude da
onda irá mudar gradualmente com sua propagação. De fato, a amplitude da componente do campo elétrico
é inversamente proporcional à n1/2 , considerando que a amplitude da componente do campo magnético é
diretamente proporcional à n1/2 . Nota-se, q
entretanto, que o fluxo de energia na direção z, dado pelo vetor
c ~ ~
de Poynting, Sz = 8π ℜ[E × B ]z = − 8π µε |E0 |2 , porém desmagnetizado µ = 1, permanece constante,
∗ c
Para uma onda na n-ésima camada, qualquer quantidade de campo, ~E ou ~ B, depende em z e x por meio de
fatores
A ei knn (±z cos θn +x sen θn ) , (10.26)
em que A é uma constante. O sinal ± denota se as ondas estão subindo ou descendo, respectivamente.
∂
Quando o operador ∂x atua sobre a expressão acima, é equivalente a uma multiplicação por
∂
≡ ikS (10.27a)
∂x
∂
≡ 0, (10.27b)
∂y
em que usamos a notação S = sen θI . Este resultado é verdadeiro, não importa o quão finas são as camadas,
por isso também deve se manter para a ionosfera real. Nota-se que, de acordo com a lei de Snell, se a
onda começa normal, para fora, no plano xz, então ela permanecerá nesse plano propagando-se através da
ionosfera.
“Z_2” — 2017/9/5 — 8:19 — page 276 — #296
Como antes, as equações de Maxwell podem ser divididas em dois grupos independentes, correspondendo
a duas polarizações independentes de ondas de rádio que se propagam através da ionosfera. Para o primeiro
conjunto de equações, o campo elétrico é sempre paralelo ao eixo y. As ondas correspondentes são, por essa
razão, ditas de polarização horizontal. Para o segundo conjunto de equações, o campo elétrico se encontra
sempre no plano xz. As ondas correspondentes são, portanto, ditas de polarização vertical, note que o
termo polarização vertical ou polarizado verticalmente não implica necessariamente que o campo elétrico é
paralelo ao eixo vertical. Podemos observar que as equações que regem as ondas de polarização horizontal
não são isomórficas às aquelas que regulam as ondas de polarização vertical, de modo que ambos os tipos
de ondas devem ser tratados separadamente.
Para o caso de polarização horizontal, as Eqs. (10.28b) e (10.28c) nos dará
∂Bx
= − i k q 2 Ey , (10.30)
∂z
em que q 2 = n2 − S 2 . Da Eq. (10.30) combinada com a Eq. (10.28a) temos
∂ 2 Ey
+ k2 q 2 Ey = 0 . (10.31)
∂z 2
As Eqs. (10.30) e (10.31) têm a mesma forma das Eqs. (10.4b) e (10.6), exceto que n2 foi substituído por
q 2 . Então, podemos usar as soluções WKB, na qual tomam a forma,
Rz
Ey = A q −1/2 e± i k q dz
(10.32a)
Rz
Bx = ∓A q 1/2 e± i k q dz
, (10.32b)
em que A é uma constante. Claro que, ambas expressões devem conter o fator multiplicativo ei(kSx−ωt) ,
mas este é geralmente omitido por uma questão de clareza. Por analogia com a Eq. (10.17), as soluções
WKB são válidas para a seguinte condição
1 3 1 dq 2 1 d2 q
− ≪ 1. (10.33)
k2 4 q 2 dz 2q 3 dz 2
Esta desigualdade falha claramente na vizinhança de q = 0, não importa quão lentamente q varia com z.
Assim, em q = 0, ou n2 = S 2 , especificará a altura em que a reflexão irá ocorrer. Logo, o coeficiente de
reflexão, por analogia com a relação (10.23), ao nível do solo, i.e., z = 0 é dado por
R z0
R = − i e2 i k 0 q dz
, (10.34)
“Z_2” — 2017/9/5 — 8:19 — page 277 — #297
∂Ex q2
= i k 2 By . (10.35)
∂z n
Combinando a relação anterior com a Eq. (10.29b) temos
∂ 2 By 1 d(n2 ) ∂By
− + k 2 q 2 By = 0 . (10.36)
∂z 2 n2 dz ∂z
Claramente, a equação diferencial que regula a propagação de ondas com polarização vertical é considera-
velmente mais complicada do que a equação correspondente para ondas com polarização horizontal.
As solução WKB para ondas com polarização vertical será obtida pela substituição de uma função tipo
By = A ei φ(z) ,
em que A é uma constante e φ(z) é a fase generalizada, na Eq. (10.36). Assim, obtemos a equação diferencial
para a fase,
2
d2 φ dφ i d(n2 ) dφ
i 2 − − 2 + k2 q2 = 0 . (10.37)
dz dz n dz dz
Desde que o meio varie lentamente, o primeiro e o terceiro termos na equação anterior são pequenos de tal
forma que em primeira aproximação,
dφ
= ±k q (10.38a)
dz
d2 φ dq
2
= ±k . (10.38b)
dz dz
Inserindo estas expressões nos primeiro e segundo termos da Eq. (10.37) encontramos a segunda aproxima-
ção,
1
dφ 2 2 dq 2q dn 2
= ± k q ±ik − . (10.39)
dz dz n dz
Os dois termos finais no lado direito da equação anterior são pequenos, então expandindo o lado direito e
usando e usando o teorema binomial encontramos,
dφ i dq i dn
= ±k q + − . (10.40)
dz 2q dz n dz
Esta equação pode ser integrada e seu resultado inserido em By = A ei φ(z) para termos a solução WKB,
Rz
By = A n q −1/2 e± i k q dz
. (10.41)
e Rz
Ex = ±A n−1 q 1/2 e± i k q dz
. (10.42)
Aqui, todos os termos envolvendo derivadas em n e q foram negligenciados.
Substituindo a relação (10.41), do campo magnético, na equação diferencial (10.36) e exigindo que o
resultado seja pequeno em comparação com os termos originais da equação diferencial, obtemos a seguinte
condição de validade das soluções WKB acima:
" #
1 3 1 dq 2 1 d2 q 1 1 d2 n 1 dn 2
− 3 + −2 ≪ 1. (10.43)
k2 4 q 2 dz 2q dz 2 q 2 n dz 2 n dz
“Z_2” — 2017/9/5 — 8:19 — page 278 — #298
Este critério falha claramente na vizinhança de q = 0, não importa quão lentamente n e q varia com z.
Assim, q = 0 dará a altura em que a reflexão ocorre. A condição falha também perto de n = 0, o que
não corresponde ao nível de reflexão. Se, como é normalmente o caso, a densidade de elétrons na ionosfera
aumenta monotonicamente com a altura, então o nível em que n = 0 encontra-se acima do nível de reflexão,
em que q = 0. Se os dois níveis são bem separados, então o processo de reflexão não é afetado pelo falha da
desigualdade acima no nível n = 0, e o coeficiente de reflexão é determinado pela Eq. (10.34), exatamente
como para no caso de polarização horizontal. Se, no entanto, o nível em que n = 0 encontra-se próximo
do nível em que q = 0, então o coeficiente de reflexão podem ser afetado, e um tratamento mais preciso da
equação diferencial (10.36) será necessária de modo a obter o valor real do coeficiente de reflexão.
e
φ(ω) = k(ω)x − ωt .
É claro que F (ω) é uma função variando lentamente em ω, exceto na proximidade imediata dos
pontos singulares ω = ±2π/τ , enquanto que a fase φ(ω) é geralmente grande e varia rapidamente.
“Z_2” — 2017/9/5 — 8:19 — page 279 — #299
Está subentendido que o ponto estacionário encontra-se no eixo real no espaço ω, de modo que
localmente a integral ao longo do contorno C é uma integral ao longo do eixo real no sentido de
diminuir ω. Assim, a expressão anterior pode ser escrita na forma
s Z 2 2
i φs 4π ∞ πt πt
fs ≃ −F (ωs ) e ′′
cos + i sen dt ,
φs 0 2 2
2
em que πt2 = 1
2 φ′′s (ω − ωs )2 . As integrais da expressão anterior são as integrais de Fresnel e seus
valores são Z ∞ 2 Z ∞ 2
πt πt 1
cos dt = sen dt = .
0 2 0 2 2
Logo, s
2π i
fs ≃ − F (ωs ) ei φs .
φ′′s
É fácil verificar que o comprimento de arco, no espaço ω, do contorno da integração faz uma con-
tribuição importante para fs na ordem de ∆ωωs ∼
√ 1 . Assim, o comprimento do arco é rela-
k (ωs ) x
tivamente curto, desde que o comprimento de onda do sinal seja muito menor do que a distância
propagada através do meio dispersivo. Se houver mais do que um ponto de fase estacionária no inter-
valo de integração, então a integral é aproximada como uma soma de termos como o feito acima.
Integrais da forma Z
f (x, t) = ei φ(ω) F (ω) dω ,
C
podem ser calculadas exatamente através do método da descida mais íngreme.8 A aproximação da
fase estacionária s
2π i
fs ≃ − F (ωs ) ei φs
φ′′s
concorda com o termo principal do método da descida mais íngreme (que é muito mais difícil de
implementar do que o método da fase estacionária), desde que φ(ω) seja real, i.e., desde que o ponto
8
Ver o texto L. Brillouin, Wave propagation and group velocity (1960).
“Z_2” — 2017/9/5 — 8:19 — page 280 — #300
estacionário encontra-se no eixo real. Se φ é complexo, o método da fase estacionária pode produzir
resultados errados. Isto sugere que o método da fase estacionária está propenso a colapsar quando
o ponto extremo ω = ωs aproxima-se de quaisquer polos ou cortes de ramificação no plano ω, ver
Fig. 10.1. O caminho de integração B é convenientemente dividido nas partes B1 até B5 , conforme
R
Figura 10.1 Esboço dos contornos de integração utilizados para avaliar f (x, t) = C ei φ(ω) F (ω) dω.
I
1 i(kx−ωt) dω
B5 = ℜ e ,
2π B5 ω − 2π/τ
“Z_2” — 2017/9/5 — 8:19 — page 281 — #301
onde os caminhos dos ramos das integrações circulares tem cortes apropriados, conforme mostrado
na Fig. 10.1.
Assim, voltando ao nosso caso, as oscilações rápidas de ei φ durante a maior parte do caminho de in-
tegração asseguram que as médias aproximam-se de zero. No entanto, este argumento de cancelamento
não se aplica a estes pontos no caminho da integração, onde a fase é estacionária, i.e., os pontos em que
∂φ
∂ω = 0. Logo, para resolver a Eq. (10.45), usaremos o método da fase estacionária, desenvolvida anterior-
mente. O lócus destes valores especiais para z e t podem, evidentemente, ser considerado como a equação
de movimento do pulso, uma vez que se propaga através da ionosfera. Assim, a equação de movimento será
especificado por
∂φ
= 0, (10.46)
∂ω ω=ω0
na qual fornece Z
z
1 ∂(ω n)
t= dz . (10.47)
c 0 ∂ω ω=ω0
Suponhamos que a velocidade em z de um pulso com frequência central ω0 a uma altura z é dada por
uz (ω0 , z). A equação diferencial de movimento do pulso será então
Z z
dz dz
dt = ⇒ t= , (10.48)
uz 0 uz
Esta velocidade é a conhecida velocidade de grupo. É fácil mostrar que a expressão anterior para a veloci-
dade de grupo é consistente com a expressão obtida na Seção 9.8, ver Eq. (9.117).
Das Eqs. (10.3) resulta que
!1
ωp2 (z) 2
n(ω, z) = 1 − , (10.50)
ω2
no limite em que as colisões de elétrons são desprezíveis. A velocidade de fase das ondas de radio propa-
gando-se verticalmente através da ionosfera é dada por
!− 1
c ωp2 (z) 2
vz (ω, z) = =c 1− . (10.51)
n(ω, z) ω2
uz (ω, z) = c 1 − . (10.52)
ω2
viajasse com a velocidade c. Como sabemos que um pulso de frequência dominante ω propaga-se na altura
z com velocidade uz (ω, z), isto é verdade tanto para pulsos subindo como para pulsos descendo, e também
que o pulso irá refletir na altura z0 (ω), em que ω = ωp (z0 ), segue-se que
Z z0 (ω) Z z0 (ω)
dz c
τ =2 e h(ω) = dz . (10.53)
0 uz (ω, z) 0 uz (ω, z)
Nota-se que a altura equivalente de reflexão h(ω) é maior que a atual altura de reflexão z0 (ω) desde que a
velocidade de grupo uz seja menor que a velocidade da luz. A equação acima combinada com a Eq. (10.52)
nos dará
Z z0 (ω) !− 1
ωp2 (z) 2
h(ω) = 1− dz . (10.54)
0 ω2
Pode-se observar que o integrando diverge quando o ponto de reflexão é abordado, mas a integral permanece
finita.
em que ωp2 (z0 ) = ω 2 , necessariamente implica num conhecimento da função ωp2 (z)? Naturalmente, da Eq.
(10.2), temos ωp2 (z) ∝ N (z).
Fazendo ω 2 = v e ωp2 (z) = u(z), a Eq. (10.55) se torna
Z z0 (v1/2 )
−1/2 1/2 dz
v h(v )= , (10.56)
0 [v − u(z)]1/2
em que, u(z0 ) = v e u(z) < v para 0 < z < z0 . Agora, se multiplicarmos ambos os lados desta equação
−1/2
por (w−v)
π e integrando v de 0 até w, temos
Z Z w "Z z0 (v1/2 ) #
1 w −1/2 1 dz
v (w − v)−1/2 h(v 1/2 ) dv = dv . (10.57)
π 0 π 0 0 (w − v)1/2 (v − u)1/2
Considere a integral dupla do lado direito da equação anterior. A região do espaço vz sobre o qual esta inte-
gral é realizada está esboçado na Fig. 10.2. Podemos observar que z0 (v 1/2 ) é uma função monotonicamente
crescente de z e podemos trocar a ordem de integração para dar
Z 1/2 Z w
1 z0 (w ) dv
1/2 (v − u)1/2
dz . (10.58)
π 0 u(z) (w − v)
Aqui, usamos o fato de que a curva z = z0 (v 1/2 ) será idêntica com a curva v = u(z). Podemos observar
que se z0 (v 1/2 ) não é uma função monotonicamente crescente de v, então, ainda podemos trocar a ordem de
“Z_2” — 2017/9/5 — 8:19 — page 283 — #303
integração, mas os limites de integração são, em geral, muito mais complicado do que os indicados acima.
A integral sobre v na expressão anterior pode ser calculada usando métodos padrão, fazendo a substituição
v = w cos2 θ + u sen2 θ: o resultado é simplesmente π. Então, a expressão (10.58) será z0 (w1/2 ). Logo, de
(10.57) temos
Z
1 w −1/2
1/2
z0 (w ) = v (w − v)−1/2 h(v 1/2 ) dv . (10.59)
π 0
Z π
2 2
z (ωp ) = h(ωp sen α) dα . (10.61)
π 0
Assim, obtemos z como função de ωp e, por conseguinte, ωp como uma função de z, simplesmentep tomando
a integral apropriada da função h(ω), determinada experimentalmente. Desde que ωp (z) ∝ N (z), isto
significa que podemos determinar o perfil de densidade de elétrons na ionosfera, desde que sabemos a
variação da altura equivalente da ionosfera em relação a frequência de pulso. O vínculo z0 (ω) será uma
função monotonicamente crescente de ω que por sua vez N (z) será uma função monotonicamente crescente
de z. Nota-se ainda que podemos determinar N (z) direto de h(ω) para o caso em que a função precedente é
não monotônica, é apenas um procedimento muito mais complicado do que o descrito acima. Esta técnica
em que invertemos a Eq. (10.54), na qual especificamos h(ω) como integral sobre ωp (z), para dar ωp (z)
como integral sobre h(ω) é conhecida como inversão de Abel.9
9
Niels Henrik Abel (1802-1829), matemático norueguês.
“Z_2” — 2017/9/5 — 8:19 — page 284 — #304
em que k = ωc . Aqui, o termo da dependência temporal do sinal, i.e., e− i ωt , é negligenciado por uma questão
de clareza. Suponhamos que o sinal emitido pela antena está em sua maioria concentrado na direção que
faz um ângulo θI com a vertical. Assim, F (S) possui um pico máximo e estreito ao redor de S = S0 , em
que S0 = sen θI .
Como a Eq. (10.62) representa o sinal emitido em z = 0, então o sinal à uma altura z na ionosfera será
obtida através das soluções WKB para ondas polarizadas horizontalmente, já discutida nas Seções 10.4 e
10.5. Logo, obtemos, Z 1
F (S)
Ey (x, z) = 1/2
ei φ(x,z,S) dS , (10.63)
0 q (z, S)
em que Z z
φ(x, z, S) = k q (z, S) dz + k S x .
0
F
A Eq. (10.63) é basicamente uma integral de linha no espaço S. A quantidade q1/2 é uma função de S
variando lentamente, enquanto a fase φ é uma função de S, grande e variando rapidamente. Como sabemos,
as oscilações rápidas de ei φ sobre a maior parte do caminho de integração assegura que as médias do
integrando são quase zero. De fato, somente aqueles pontos no caminho de integração em que a fase é
∂φ
estacionária, i.e., ∂S = 0, terão contribuição significante para a integral. Segue-se que o lado esquerdo da
Eq. (10.63), as médias tente para um valor muito pequeno, excepto para os valores especiais de x e z em
que um dos pontos de fase estacionária no espaço S coincide com o pico de F (S). O lócus destes valores
especiais para x e z pode, claramente, ser considerado como a trajetória do sinal de rádio emitido pela
antena à medida que passa através da ionosfera. Assim, a trajetória do sinal é especificado por
∂φ
= 0,
∂S S=S0
que nos dará Z
z
∂q
x=− dz . (10.64)
0 ∂S S=S0
Podemos pensar nessa equação como sendo o caminho traçado da frequência de radiação do raio, emitido
por uma antena com um ângulo θI com a vertical, propagando-se através da ionosfera.
Mas, se q 2 = n2 − S 2 , então o caminho traçado pelo raio será
Z z
dz
x=S p , (10.65)
0 n2 (z) − S 2
em que S = sen θI , i.e., o ângulo inicial (na antena). Naturalmente, a Eq. (10.65) é para descrever os raios
que estão subindo. Para os raios que estão descendo uma variante simples das soluções WKB nos dará
Z z0 (S) Z z0 (S)
dz dz
x=S p +S p , (10.66)
2
n (z) − S 2 n (z) − S 2
2
0 z
“Z_2” — 2017/9/5 — 8:19 — page 285 — #305
em que n(z0 ) = S. Assim, o raio sobe para a ionosfera depois de ser lançado a partir da antena, atinge a
altura máxima z0 acima da superfície da Terra, e então começa a descer. O raio finalmente cruza a superfície
da Terra novamente à uma distância horizontal de
Z z0 (S)
dz
x0 = 2S p (10.67)
0 n2 (z) − S 2
Séries Assintóticas Muitas vezes é conveniente expandir uma função de variável complexa f (z) em po-
tências inversas de z:
A1 A2
f (z) = φ(z) A0 + + 2 + ··· , (10.69)
z z
em que φ(z) é uma função cujo comportamento para grandes valores de z é conhecido. Se φf (z) (z)
for singular
quando |z| → ∞, então a série anterior diverge. No entanto, sob determinadas circunstâncias, a série ainda
será útil.
Estas circunstâncias são possíveis quando a diferença entre fφ(z) (z)
e os primeiros n + 1 termos da série for
1
na ordem de z n+1 , tal que para valores suficientemente grande de z, essa diferença torna-se muito pequena.
Mais precisamente, a série representa fφ(z)
(z)
assintoticamente, i.e.,
∞
X Ap
f (z) ≃ φ(z) , (10.70)
zp
p=0
desde que
f (z)
n
X Ap
lim zn − → 0. (10.71)
|z|→∞ φ(z) zp
p=0
Em outras palavras, para um dado valor de n, os primeiros n + 1 termos da série podem ser escritos tão
próximos como se desejar para a que razão φf (z)
(z)
faz com que z seja suficientemente grande. Para cada valor
1
de z e n existe um erro na ordem de z n+1 . Uma vez que a série realmente diverge, existe um número ótimo
de termos na série usada para representar φf (z)
(z)
para um dado valor de z. Associado com isto existe um erro
inevitável. Como z aumenta, o número ideal de termos aumenta e o erro então diminuirá.
Considere o exemplo. A integral exponencial está definida como
Z ∞ −t
e
E1 (x) = dt .
x t
“Z_2” — 2017/9/5 — 8:19 — page 286 — #306
A série assintótica desta função pode ser obtida via uma série de integrações parciais,
Z ∞ −t
e−x e
E1 (x) = − dt .
x x t2
Continuando com esse procedimento,
Z ∞ −t
e−x 1 2! 3! (−1)n n! n+1 e
E1 (x) = 1 − + 2 − 3 + ··· + n
+ (−1) (n + 1)! dt .
x x x x x x tn+2
A série infinita obtida tomando o limite n → ∞ diverge, uma vez que os ensaios da convergência de Cauchy
nos dá
un+1 n
lim = lim = ∞.
n→∞ un n→∞ x
Nota-se que dois termos sucessivos na série tornam-se iguais em magnitude para n = x, o que indica que
o número ótimo de termos para um determinado x é aproximadamente o número inteiro mais próximo x.
Para provar que a série é assintótica, precisamos mostrar que
Z ∞ −t
n+1 x n+1 e
lim x e (−1) (n + 1)! dt = 0 .
x→0 x tn+2
Isto é verdade, desde que Z Z
∞ ∞
e−t 1 e−x
n+2
dt < n+2 e−t dt = .
x t x x xn+2
−x
Assim, o erro envolvido usando os primeiros n termos é inferior a (n+1)! xen+2 , que é exatamente o próximo
termo na série. Podemos ver que quando n aumenta, esta estimativa do erro, primeiro diminui e depois
aumenta sem limite. Para visualizar este fenômeno mais exatamente, consideremos f (x) = x ex E (x) e
n
X (−1)p p!
fn (x) =
xp
p=0
sendo a representação da série assintótica desta função na qual contem n + 1 termos. A Fig. 10.3 mostra o
n = 10 voltando a crescer novamente. Obviamente, o número ótimo de termos usado nesse série assintótica
será f (10) ao redor de 10.
Séries assintóticas são fundamentalmente diferentes para expansões da lei de potência convencional,
como
z3 z5 z7
sen z = z − + − + ··· .
3! 5! 7!
Esta representação de série para sen z converge absolutamente para todos os valores finitos de z. Assim, em
qualquer z o erro associado com a série pode ser feito tão pequeno quanto se desejar, incluindo um número
suficientemente grande de termos. Em outras palavras, ao contrário de uma série assintótica, não há um
erro intrínseco, ou inevitável, associado a uma série convergente. Logo, podemos dizer que a representação
convergente das séries para lei de potência de uma função é única dentro do domínio de convergência da
série. Por outro lado, uma representação de séries assintóticas de uma função não é única. É perfeitamente
possível termos duas representações de séries assintóticas para uma mesma função, desde que a diferença
entre as duas séries seja menor do que o erro intrínseco associado com cada uma das séries. Além disso, é
frequente o caso em que diferentes séries assintóticas são usados para representar a mesmo valor da função
analítica em diferentes regiões do plano complexo.
Vamos considerar um importante exemplo, a expansão assintótica da função hipergeométrica confluente
F
1 1 (a, c, z). Essa função é solução da equação diferencial conhecida equação hipergeométrica confluente,
ou equação de Kummer, 10 dada por
d2 1 F1 d1 F1
z 2
+ (c − z) − a1 F1 = 0 , (10.72)
dz dz
em que a e c são constantes e na qual é analítica em z = 0, de fato, 1 F1 (a, c, 0) = 1. A expansão assintótica
de 1 F1 (a, c, z) terão as formas:
Γ(a)Γ(c − a) a−c z 1
1 F1 (a, c, z) ≃ Γ(c − a) z e 1+O
Γ(c) z
1
+ Γ(a) z −a e− i πa 1 + O para − π < arg (z) < 0 (10.73a)
z
Γ(a)Γ(c − a) a−c z 1
1 F1 (a, c, z) ≃ Γ(c − a) z e 1+O
Γ(c) z
1
+ Γ(a) z −a ei πa 1 + O para 0 < arg (z) < π (10.73b)
z
Γ(a)Γ(c − a) a−c − i 2π(a−c) z 1
1 F1 (a, c, z) ≃ Γ(c − a) z e e 1+O
Γ(c) z
1
+ Γ(a) z −a ei πa 1 + O para π < arg (z) < 2π , etc . (10.73c)
z
Podemos ver que a expansão consiste de uma combinação linear de duas séries assintóticas, apenas o pri-
meiro termo em cada série é mostrada. Para |z| ≫ 1, a primeira série é exponencialmente maior do que o
segundo sempre que ℜ[z] > 0. Assim, dizemos que a primeira série é dominante nesta região, enquanto que
a segunda série é subdominante. Outrossim, a primeira série é exponencialmente menor do que o segundo
sempre que ℜ[z] < 0. Assim, dizemos que a primeira série é subdominante nesta região, enquanto que a
segunda série é a dominante.
10
Ernest Eduard Kummer (1810-1893), matemático alemão.
“Z_2” — 2017/9/5 — 8:19 — page 288 — #308
Considere uma região na qual uma ou outra das séries é a dominante. Estritamente falando, não é
matematicamente consistente incluir a série subdominante na expansão assintótica porque a sua contribuição
é realmente menor que o erro intrínseco associado com a série dominante, i.e., este erro é O(1/z) vezes
a série dominante, desde que sejam incluídos somente o primeiro termo desta série. Assim, em geral, um
ponto no plano complexo, a expansão assintótica consiste simplesmente da série dominante. No entanto,
este não é o caso na vizinhança imediata das linhas de ℜ[z] = 0: estes são chamados de linhas anti-Stokes.
Quando uma linha anti-Stokes é atravessada, uma série dominante torna-se subdominante e vice-versa. Nas
imediações de uma linha anti-Stokes nenhuma série é dominante, por isso é matematicamente consistente
incluir ambas as séries na expansão assintótica.
A função hipergeométrica confluente 1 F1 (a, c, z) é uma função analítica, de uma única variável, per-
feitamente bem comportada no plano complexo. No entanto, nossas duas séries assintóticas são, em geral,
funções multivariáveis no plano complexo, ver Eq. (10.73a). Uma função de uma única variável pode ser
representada assintoticamente por uma função de multivariáveis? A resposta curta é não. Temos que empre-
gar diferentes combinações das duas séries em diferentes regiões do plano complexo, a fim de assegurar que
1 F1 (a, c, z) permanece uma função de uma única variável. As Eqs. (10.73) mostram como isto é possível.
Basicamente, o coeficiente na frente da série subdominante muda de forma descontinua em certos valores
do arg (z). Isto é perfeitamente consistente com 1 F1 (a, c, z) pelo fato de ser uma função analítica, porque
a série subdominante é invisível, i.e., a contribuição da série subdominante à solução assintótica cai abaixo
do erro intrínseco associado com a série dominante, de modo que não interessa se o coeficiente na frente da
série anterior muda de forma descontínua. Imagine traçar um grande circulo, centrado na origem, no plano
complexo. Perto de uma linha anti-Stokes, nenhuma série é dominante, por isso temos de incluir ambas as
séries na expansão assintótica. À medida que se afastam da linha anti-Stokes, uma série se torna dominante,
o que significa que as outras séries se torna subdominante e, portanto, caem fora de nossa expansão assintó-
tica. Eventualmente, nos aproximamos de uma segunda linha anti-Stokes, e a série subdominante reaparece
em nossa expansão assintótica. No entanto, o coeficiente ne frente da série subdominante quando reaparece
é diferente daquele que tinha quando desapareceu. Este novo coeficiente é transportado através da segunda
linha anti-Stokes para a região onde a série subdominante torna-se dominante. Nesta nova região, a série
dominante se torna subdominante desaparece da nossa expansão assintótica. Eventualmente, aproximamos
de uma terceira linha de anti-Stokes e as séries reaparecem, mas, novamente, com um coeficiente diferente
na frente. Os saltos nos coeficientes da série subdominante são escolhidos de tal maneira que, se realizar
um circuito completo no plano complexo, então, o valor da expansão assintótica será o mesmo nos pontos
de início e nos pontos finais. Em outras palavras, a expansão assintótica é de uma única variável, apesar do
fato de que é construído a partir de duas séries assintóticas que não são de uma única variável. Os saltos
no coeficiente da série subdominante, que são necessários para manter a expansão assintótica de uma única
variável, são chamados fenômenos Stokes.11
Onde exatamente o salto no coeficiente da série subdominante ocorrerá? Tudo o que podemos realmente
dizer é que estará em algum lugar na região entre duas linhas anti-Stokes, onde a série em questão é subdo-
minante. O problema é que somente retemos o primeiro termo de cada série assintótica. Consequentemente,
o erro intrínseco na série dominante é relativamente grande e perdemos a noção da série subdominante
muito rapidamente depois de se afastar da linha anti-Stokes. No entanto, poderíamos incluir mais termos
em cada série assintótica. Isto nos permitiria reduzir o erro intrínseco na série dominante e, assim, expan-
dir a região do plano complexo nas proximidades das linhas anti-Stokes aonde podemos ver tanto a série
dominante como a série subdominante. Se tivéssemos de continuar a acrescentar termos na nossa série as-
sintótica, de modo a minimizar o erro na solução dominante, acabaríamos sendo forçado a concluir que um
salto no coeficiente da série subdominante só poderia ocorrer naquelas linhas no complexo plano em que
ℑ[z] = 0: estas são as chamadas linhas de Stokes.12 Numa linha de Stokes a magnitude da série dominante
11
G. G. Stokes, Transactions of the Cambridge Philosophical Society 9(1), 166-189 (1847).
12
Idem, 10(1), 105-128 (1858).
“Z_2” — 2017/9/5 — 8:19 — page 289 — #309
atinge o seu valor máximo no que diz respeito à da série subdominante. Uma vez que sabemos que um
salto no coeficiente da série subdominante só pode ocorrer em uma linha de Stokes, podemos manter a
série subdominante em nossa expansão assintótica em todas as regiões do plano complexo. O que estamos
basicamente dizendo é que, apesar de, na prática, não podermos realmente ver a série subdominante muito
afastada da linha anti-Stokes porque estamos mantendo somente o primeiro termo de cada série assintótica,
poderíamos, em princípio, ver o série subdominante a todos os valores de arg (z), desde que mantido um
número suficiente de termos na nossa série assintótica.
A Fig. 10.4 mostra a localização no plano complexo das linhas de Stokes e anti-Stokes para expansão
Figura 10.4 Linhas de Stokes (tracejada), anti-Stokes (sólida) e a linha de corte (ondulada).
d2 Ey
+ k2 n2 (z) Ey = 0 (10.75)
dz 2
2π
no limite em que o comprimento de onda típico, nk , é muito menor do que a variação típica da escala
de comprimento do índice de refração. Mas, que tipo de aproximação estará envolvida ao escrever essa
solução?
É conveniente definir uma variável de escala por ẑ = Lz , em que L é a variação típica da escala de
comprimento do índice de refração n(z). Então, reescrevemos a Eq. (10.75) como
w′′ + h2 q w = 0 , (10.76)
“Z_2” — 2017/9/5 — 8:19 — page 290 — #310
em que
d
w(ẑ, h) ≡ Ey (Lẑ) , q (ẑ) ≡ n2 (Lẑ) , ′
≡e h = kL .
dz
Nota-se que, em geral, q (ẑ), q ′ (ẑ), q ′′ (ẑ), etc. são quantidades O(1). A constante não dimensional h é da
ordem da razão da variação típica da escala de comprimento do índice de refração pelo comprimento de
onda. Assim, vamos procurar soluções para (10.76) no limite h ≫ 1.
Escrevendo w(ẑ, h) = ei hφ(ẑ,h) e substituindo em (10.76), temos
i ′′
φ − (φ′ )2 + q = 0 . (10.77)
h
Expandindo em potências de h1 , obtemos
′ i q′
1 1
φ = ±q + 2 +O , (10.78)
2h q h2
na qual chegaremos em
− 41 ±ih
R ẑ
q dẑ 1
w(ẑ, h) = q e 1+O . (10.79)
h
Naturalmente, reconhecemos imediatamente esta expressão como uma solução WKB.
Suponhamos que na Eq. (10.78) continuamos expandindo em potências de h1 . A generalização apropria-
da da Eq. (10.79) é uma solução em séries da forma
∞
X
1
R ẑ Ap (ẑ)
w(ẑ, h) = q − 4 e± i h q dẑ 1 + . (10.80)
hp
p=1
Esta relação é, de fato, uma série assintótica em h. Agora, podemos apreciar que uma solução WKB é
apenas uma série assintótica altamente truncada em h, em que apenas o primeiro termo da série é mantida.
Mas por que é tão importante que reconheçamos que as soluções WKB são séries assintóticas truncadas?
O ponto é que o método WKB inicialmente foi bastante controverso, isso logo depois que foi popularizado
na década de 1920. Muitos pesquisadores pensaram que o método era completamente errado. Vamos tentar
entender qual era o problema. Suponhamos que nunca ouvimos falar de uma série assintótica. Olhando para
Eq. (10.80), poderíamos imaginar que a expressão entre colchetes é uma expansão da lei de potência h1 .
A aproximação WKB envolve negligenciando todos os termos desta expansão, exceto o primeiro. Isto soa
bem, desde que h seja muito maior do que a unidade. Mas, com certeza, sendo matematicamente rigoroso,
temos que verificar que a soma de todos os termos da expansão que estamos negligenciando é pequena
em comparação com o primeiro termo? No entanto, se tentar isso, descobriremos, para nossa consternação,
que a expansão é divergente. Em outras palavras, a soma de todos os termos negligenciadas é infinito!
Assim, se interpretarmos a Eq. (10.80) como uma expansão da lei de potência convencional h1 , o método
WKB é claramente absurdo: a solução WKB é a primeira aproximação ao infinito. No entanto, uma vez
apreciamos que a Eq. (10.80) é, na verdade, uma série assintótica em h, o fato de que a série diverge torna-
-se irrelevante. Se retemos os primeiros n termos da série, esta se aproxima da solução exata da Eq. (10.80)
com um erro intrínseco, fracionário, que é da ordem de h1n , i.e., o primeiro termo negligenciado na série. O
erro é minimizado a um valor particular de h. À medida que o número de termos na série vai aumentado, o
erro intrínseco diminui, e o valor de h em que o erro será minimizado aumenta. Em particular, podemos ver
que há um erro intrínseco associado à uma solução WKB que é da ordem de h1 vezes a solução.
É interessante observar que se a Eq. (10.80) não for uma série divergente, então seria impossível a obten-
ção de reflexão total das soluções WKB no ponto q = 0. Como iremos verificar, a reflexão está diretamente
associada ao fato de que a expansão (10.80) exibe um fenômeno Stokes. É, naturalmente, impossível para
uma expansão em série de potência convergente exibir um fenómeno Stokes.
“Z_2” — 2017/9/5 — 8:19 — page 291 — #311
− 41 −ih
R ẑ √
q dẑ 1
(ẑ, a) = q e a 1+O . (10.82b)
h
Aqui, adotamos um nível de referência arbitrária de fase ẑ = a. A notação (a, ẑ) é bastante autoexplicativa:
a e ẑ referem-se aos limites inferior e superior de integração, respectivamente, dentro da exponencial. Daqui
resulta que a outra solução WKB pode ser escrita como (ẑ, a), podemos inverter os limites de integração
dentro da exponencial para obter menos a integral em ẑ de ẑ = a a ẑ = ẑ.
Até agora temos o pensamento de ver ẑ como uma variável real que representa a escala de altura na
ionosfera. Vamos agora generalizar nossa análise um pouco e pensar em ẑ como uma variável complexa.
Não há nada em nossa derivação das soluções WKB que depende crucialmente ẑ como sendo uma variável
real, então esperamos que estas soluções permaneçam válidas quando ẑ é reinterpretado como uma variável
complexa. Aliás, agora temos que interpretar q (ẑ) como uma função bem comportada de variável complexa.
Uma solução geral aproximada da equação diferencial (10.81) no plano complexo ẑ pode ser escrito como
como uma superposição das duas soluções WKB (10.82).
Assumimos o parâmetro h muito maior do que a unidade. É evidente que a partir das Eqs. (10.82), em
algumas regiões do plano complexo, uma das soluções WKB será exponencialmente maior do que a outra.
Em tais regiões, não é matematicamente consistente manter a solução WKB menor na expressão para a
solução geral, uma vez que a contribuição da solução WKB menor será menos do que o erro intrínseco
associado ao da solução maior. Assim, a solução WKB maior é dita dominante, e a solução WKB menor é
dita subdominante. Vamos denotar a solução WKB (10.82a) como (a, ẑ)d nas regiões do plano complexo
em que é dominante, e como (a, ẑ)s nas regiões em que é subdominante. Uma notação análoga é adotada
para a segunda solução WKB (10.82b).
Suponhamos que q (ẑ) possua um zero no ponto ẑ = ẑ0 , escolhido como origem por questão de conve-
niência. Conclui-se que na vizinhança imediata da origem, podemos escrever
q = a1 ẑ + a2 ẑ 2 + · · · , (10.83)
em que a1 6= 0. É conveniente adotar a origem em a = 0, tal que as duas soluções WKB serão (0, ẑ) e
(ẑ, 0). Podemos definir as linhas anti-Stokes no plano complexo ẑ, tal que satisfaçam
Z ẑ
√
ℜ i q dẑ = 0 , (10.84)
0
na qual quando cruzamos uma linha anti-Stokes a solução dominante WKB torna-se subdominante e vice-
versa. Então (0, ẑ)d ↔ (0, ẑ)s e (ẑ, 0)d ↔ (ẑ, 0)s . Nas imediações de uma linha anti-Stokes as duas
soluções WKB têm aproximadamente a mesma ordem de grandeza, de modo que é matematicamente con-
sistente incluir as contribuições de ambas soluções na expressão para a solução geral. Em tal região, pode-
mos simplesmente escrever as soluções WKB como (0, ẑ) e (ẑ, 0), já que elas não serão nem dominante
nem subdominante.
É evidente que a partir das Eqs. (10.82) as soluções WKB não são funções de um simples valor de ẑ,
uma vez que dependem de q 1/2 (ẑ), que é uma função de duplo valor. Assim, se quisermos escrever uma
“Z_2” — 2017/9/5 — 8:19 — page 292 — #312
solução analítica aproximada para a equação diferencial (10.81), não podemos expressar esta solução como
a mesma combinação linear das soluções WKB para todas as regiões do plano complexo ẑ. Isto implica
que deve haver certas linhas no plano complexo x̂ através do qual a mistura das soluções WKB em nossa
expressão para a solução geral muda de forma descontínua. Estas são as linhas de Stokes, já estudadas, e
satisfazem Z ẑ
√
ℑ i q dẑ = 0 . (10.85)
0
Como cruzamos a linha de Stokes, o coeficiente da solução WKB dominante em nossa expressão para a
solução geral deve permanecer inalterado, mas o coeficiente da solução WKB subdominante é permitido
mudar de modo descontínuo. Aliás, isto é perfeitamente consistente com o fato de que a solução geral seja
analítica: o salto em nossa expressão para a solução geral é devido ao salto no coeficiente da solução WKB
subdominante e será menor do que o erro intrínseco nesta expressão devido ao erro intrínseco na solução
WKB dominante. Assim que perceber que o coeficiente da solução subdominante só pode mudar em uma
linha de Stokes, podemos manter ambas as soluções WKB em nossa expressão para a solução geral em
todo o plano complexo ẑ. Na prática, só podemos ver a solução subdominante nas imediações de uma linha
anti-Stokes, mas se fôssemos avaliar as soluções WKB para a maior precisão que pudéssemos obter, i.e.,
reter mais termos na série assintótica em Eqs (10.82), em princípio, seguiríamos uma solução subdominante
em todo o caminho até uma linha de Stokes vizinha.
Nas imediações da origem,
Z ẑ √
√ 2 a1 3
q dẑ ≃ ẑ 2 . (10.86)
0 3
Logo, resulta de Eqs. (10.84) e (10.85) que três linhas de Stokes e três linhas anti-Stokes irradiam de um
zero de q (ẑ). O esboço geral das linhas de Stokes e das linhas anti-Stokes nas proximidades do ponto q = 0
está apresentado na Fig. 10.5. Nota-se que uma linha de corte também irradia a partir do ponto q = 0, a
Figura 10.5 Linhas de Stokes (tracejada), anti-Stokes (sólida) e a linha de corte (ondulada). Todas as
linhas irradiam de um zero de q(ẑ), ou seja, de um ponto q = 0.
fim de especificar unicamente a função q 1/2 (ẑ). Assim, em geral, sete linhas irradiam de um zero de q (ẑ),
dividindo o plano complexo ẑ em sete domínios, numerados de 1 a 7.
Vamos escrever nossa solução geral como
na linha anti-Stokes entre os domínios 1 e 7, em que A e B são constantes arbitrárias. Suponha-se que a
“Z_2” — 2017/9/5 — 8:19 — page 293 — #313
solução WKB (0, ẑ) é dominante no domínio 7. Assim, no domínio 7 a solução geral toma a forma
Movendo para o domínio 1, cruzamos uma linha anti-Stokes, a solução dominante torna-se subdominante e
vice-versa. Então, no domínio 1 a solução geral toma a forma
Passemos agora para o domínio 2. Ao fazê-lo, cruzamos uma linha de Stokes, tal que o coeficiente da solução
dominante, B, deve manter-se constante, mas o coeficiente da solução subdominante, A, poderá mudar.
Suponhamos que o coeficiente da solução subdominante salta t vezes o coeficiente da solução dominante,
em que t é uma constante determinada. Logo, no domínio 2 a solução geral toma a forma
Passando agora para o domínio 3, novamente cruzaremos uma linha anti-Stokes, que já sabemos o que
acontece. Assim, no domínio 3 a solução geral tomará a forma
Indo para o domínio 4, novamente atravessamos uma linha de Stokes e o coeficiente da solução dominante
permanece constante enquanto o coeficiente da solução subdominante poderá sofrer alterações. Vamos su-
por que o coeficiente da solução subdominante salte u vezes o coeficiente da solução dominante. Portanto,
no domínio 4 a solução geral tomará a forma
Movendo-se para o domínio 5, cruzaremos novamente uma linha anti-Stokes e a solução geral terá a forma
Indo para o domínio 6, cruzaremos a linha de corte na direção anti-horária. Então, o argumento de ẑ diminui
em 2π. Da Eq. (10.83) resulta que q 1/2 → −q 1/2 e q 1/4 → − i q 1/4 . As seguintes regras para rastrear as
soluções WKB através da linha de corte, no sentido anti-horário, garante que a solução geral será contínua
sempre que atravessar esta linha, ver Eqs. (10.80):
Nota-se que as propriedades de soluções dominante e subdominante são preservadas quando cruzamos a
linha de corte. Logo, no domínio 6 a solução geral toma a forma
w(6) = − i(A + tB) (ẑ, 0)s − i(B + u[A + tB]) (0, ẑ)d . (10.95)
Finalmente, voltamos ao domínio 7 cruzando uma linha de Stokes, tais que o coeficiente da solução domi-
nante permanece constante, mas o coeficiente da solução subdominante será permitido mudar. Suponha-se
que o coeficiente da solução subdominante salta v vezes o coeficiente da solução dominante, em que v é
uma constante indeterminada. Então, no domínio 7 a solução geral toma a forma
w(7) = − i(A + tB + v{B + u[A + tB]}) (ẑ, 0)s − i(B + u[A + tB]) (0, ẑ)d . (10.96)
Agora, esperamos que nossa solução geral seja uma função analítica, então segue-se que as soluções
(10.88) e (10.96) devem ser idênticas. Assim, podemos comparar os coeficientes das duas soluções WKB,
“Z_2” — 2017/9/5 — 8:19 — page 294 — #314
(ẑ, 0)s e (0, ẑ)d . Uma vez que A e B são arbitrárias, também podemos comparar os coeficientes de A e B.
Assim, comparando os coeficientes de A(0, ẑ)d , encontramos
1 = −i u.
0 = 1 + ut.
0 = 1 + vu.
1 = − i(t + v + vut) .
t=u=v=i. (10.97)
Em outras palavras, se adotarmos a regra simples de que cada vez que cruzamos uma linha de Stokes
no sentido anti-horário, o coeficiente da solução subdominante salta em i vezes o coeficiente da solução
dominante, então isto garante que a nossa expressão para a solução geral (10.87) se comporta como uma
função analítica. Aqui, a constante i é geralmente chamado de constante de Stokes. Nota-se que se cruzamos
uma linha de Stokes numa direção horária, então o coeficiente de solução subdominante tem que saltar − i
vezes o coeficiente da solução dominante, a fim de assegurar que a solução geral comporta-se como uma
função analítica.
1
Rx√
(0, x) = q − 4 (x) ei h 0 q (x) dx
(10.99a)
1
Rx√
(x, 0) = q − 4 (x) e− i h 0
q (x) dx
, (10.99b)
em que podemos interpretar (0, x) como uma onda se propagando para a direita ao longo do eixo x, en-
quanto (x, 0) como uma onda se propagando para a esquerda. Em OA, as soluções WKB tomam a forma
1
Rx√
(0, x)d = ei π/4 |q (x)|− 4 e+h 0
|q (x)| dx
(10.100a)
1
Rx√
(x, 0)s = ei π/4 |q (x)|− 4 e−h 0 |q (x)| dx
. (10.100b)
“Z_2” — 2017/9/5 — 8:19 — page 295 — #315
Figura 10.6 Linhas de Stokes (tracejada), anti-Stokes (sólida) e a linha de corte (ondulada) no plano
complexo ẑ.
Claramente, (x, 0)s representa uma onda evanescente que decresce à direita ao longo do eixo x, enquanto
que (0, x)d representa uma onda evanescente que decresce à esquerda. Se adotarmos a condição de contorno
em que não há onda incidente na região x → ∞, a solução assintótica mais geral em OA para a Eq. (10.98)
será
w(x, h) = A (x, 0)s , (10.101)
em que A é uma constante arbitrária.
Vamos assumir que podemos encontrar uma solução analítica w(ẑ, h) para a equação diferencial
w′′ + h2 q (ẑ) w = 0 ,
na qual satisfaz w(ẑ, h) = w(x, h) ao longo do eixo real, em que w(x, h) é a solução física. Do ponto de
vista matemático, isso parece bastante razoável. Nos domínios 1 e 2 a solução (10.101) será
e
w(2) = A (ẑ, 0)s . (10.103)
Nota-se que a solução é contínua ao cruzar a linha de Stokes OA, uma vez que o coeficiente da solução
dominante (0, ẑ) é igual a zero: assim, o salto no coeficiente da solução subdominante é zero vezes a
constante de Stokes, i, i.e., zero. Vamos passar para domínio 3. Ao fazer isso, cruzamos uma linha anti-
Stokes, tal que a solução se torna
w(3) = A (ẑ, 0)d . (10.104)
Agora, iremos para o domínio 4. Aqui cruzaremos uma linha de Stokes, aplicando a regra geral conhecida,
temos
w(4) = A (ẑ, 0)d + i A (0, ẑ)s . (10.105)
Finalmente, em OB as soluções serão
Suponhamos que existe um ponto a no eixo x negativo em que q (x) = 1. Seguindo as Eqs. (10.101) e
(10.106) podemos escrever a solução assintótica para Eq. (10.98) como
R∞√ R0√ R √
q dx −1/4 − i h a∞ q dx
w(x, h) = q −1/4 ei h a q dx
− i e2 i h a q e (10.107)
“Z_2” — 2017/9/5 — 8:19 — page 296 — #316
na região x < 0 e
R0√ Rx√
w(x, h) = ei h a q dx − i π/4
e |q|−1/4 e−h 0 |q| dx
(10.108)
Se interpretarmos x como uma altura normalizada na ionosfera, q (x) como o quadrado do índice de refração
nesta ionosfera, o ponto a sendo o nível do chão, e w como a intensidade do campo elétrico de uma onda
de rádio propagando-se verticalmente e para a ionosfera, então a Eq. (10.107) nos diz que uma onda de
amplitude unitária foi lançada verticalmente para cima a partir do chão em direção à ionosfera e é refletida
no nível em que o índice de refração é zero. O primeiro termo na Eq. (10.107) é a onda incidente e o segundo
termo é a onda refletida. O coeficiente de reflexão, i.e., a razão entre a onda refletida e a onda incidente ao
nível do solo, é dada pela relação
R0√
R = − i e2 i h a q dx
. (10.109)
Nota-se que |R| = 1, portanto a amplitude da onda refletida é igual a da onda incidente. Em outras palavras,
não há nenhuma absorção da onda no nível aonde ocorre a reflexão. A mudança de fase da onda refletida ao
nível do chão, em relação à da onda incidente, é aquela associada com a propagação da onda a partir do nível
do chão para o nível aonde ocorre a reflexão e de volta, novamente, ao nível do chão, mais um deslocamento
na fase −π/2 na reflexão. De acordo com a Eq. (10.108), a onda atenua de forma bastante rápida, no espaço
de poucos comprimentos de onda, acima do nível de reflexão. Naturalmente, a Eq. (10.109) é completamente
equivalente a Eq. (10.23).
Observa-se ainda que a reflexão da onda incidente no ponto em que o índice de refração é zero, é
directamente relacionado com o fenômeno Stokes. Sem o salto no coeficiente da solução subdominante,
vamos do domínio 3 ao domínio 4, em que não há nenhuma onda refletida sobre o eixo OB. Nota-se,
também, que as soluções WKB (10.107) e (10.108) quebram-se nas imediações de q = 0, i.e., o ponto de
reflexão. Assim, é possível demonstrar que a onda incidente é refletida totalmente no ponto q = 0, com um
desvio de fase −π/2, sem a necessidade de resolver a estrutura de onda na proximidade imediata do ponto
de reflexão. Isto demonstra que a reflexão da onda incidente em q = 0 é uma propriedade intrínseca das
soluções WKB, e não depende do comportamento detalhado da onda na região em que as soluções WKB
se quebram.
Fórmula de Conexão de Jeffreys No item anterior assumimos que o índice de refração q (x) ≡ n2 (x)
é uma função real. Como resulta da Eq. (10.1), este é apenas o caso na ionosfera em que as colisões dos
elétrons são desprezíveis. Vamos generalizar a nossa análise para levar em consideração as colisões dos
elétrons. Na verdade, o efeito principal da colisões de elétrons é mover o valor zero de q (ẑ) à uma curta
distância do eixo real, a distância é relativamente curta desde que se adotem a ordem física ν ≪ ω. O arranjo
das linha de Stokes e anti-Stokes em torno do novo ponto zero, localizada em ẑ = ẑ0 , está esboçado na Fig.
10.7. Nota-se que as colisões de elétrons modifica significativamente a forma de q (ẑ) nas proximidades
imediata do ponto zero. Então, se estamos suficientemente longe ẑ = ẑ0 no plano complexo ẑ, as soluções
WKB e as localizações das linhas de Stokes e anti-Stokes são exatamente as mesmas, como no item anterior.
As soluções WKB (10.99) e (10.100) são válidas em todo o caminho ao longo do eixo real, exceto
por uma pequena região próxima à origem, onde as colisões dos elétrons modificam significativamente a
forma de q (ẑ). Assim, ainda podemos adotar a solução fisicamente razoável para o decaimento (10.101)
no eixo real positivo. Vamos traçar esta solução no plano complexo ẑ até chegar ao eixo real negativo.
Podemos alcançar isto movendo-se em um semicírculo no semiplano superior do plano complexo. Uma vez
que nunca movemos para fora da região em que as soluções WKB (10.99) e (10.100) são válidas, podemos
concluir, por analogia com o item anterior, que a solução sobre o eixo real negativo é dada pela Eq. (10.106).
“Z_2” — 2017/9/5 — 8:19 — page 297 — #317
Figura 10.7 Linhas de Stokes (tracejada), anti-Stokes (sólida) e a linha de corte (ondulada) no plano
complexo ẑ.
É claro que, em todas as soluções WKB o ponto ẑ = 0 deve ser substituído pelo novo ponto zero ẑ = ẑ0 . A
nova fórmula para o coeficiente de reflexão, que é apenas uma generalização simples da Eq. (10.109), será
R ẑ √
0
R = − i e2 i h a q dẑ
. (10.110)
Esta é a conhecida fórmula de conexão de Jeffreys.13 A expressão geral para o coeficiente de reflexão é
incrivelmente simples. Simplesmente integramos a solução WKB no plano complexo ẑ do nível de fase
usada como referência ẑ = a para o ponto zero, eleva ao quadrado o resultado e multiplique por − i.
Observe que o caminho de integração entre ẑ = a e ẑ = ẑ0 não importa, por causa do teorema de Cauchy.
√
Nota-se também, que desde que q é, em geral, complexo ao longo do caminho de integração, não temos
mais |R| = 1. Na verdade, é facilmente demonstrado que |R| ≤ 1. Então, quando colisões de elétrons são
incluídos na análise não mais obtemos reflexão perfeita das ondas de rádio a partir da ionosfera. Em vez
disso, pequenas frações da energia destas ondas de rádio serão absorvida em cada evento de reflexão. Esta
energia é finalmente transferida para as partículas na ionosfera com que os elétrons colidiram.
Problemas
10.1 A ionosfera pode ser aproximada por planos horizontais estratificados nos quais a densidade de elé-
trons N aumenta com a altitude z até chegar a um valor máximo de Nmáx ≃ 106 cm−3 , e então
decresce. A lei de Snell aplicada aos planos adjacentes mostra que as ondas de rádio têm um caminho
tal que n(z) sen θ (z) será conservado, sendo n o índice de refração e θ o ângulo do feixe com o plano
vertical. Desprezando o efeito do campo magnético terrestre, mostre que uma onda de rádio é refletida
na altitude ou abaixo da onda, a frequência do plasma é igual à frequência da onda. Devido a cur-
vatura da Terra, um feixe enviado horizontalmente incide na região da ionosfera (aproximadamente
uma altitude de 300 km) em um ângulo de ∼ 75◦ . Mostre que a frequência máxima utilizada para
comunicação de longas distâncias será quatro vezes maior do que a frequência do plasma para Nmáx .
10.2 Um modelo simplificado para a ionosfera é um meio descrito pela constante dielétrica (9.76). Sendo
a ionosfera da Terra composta com tal meio começando subitamente a uma altura h e estendendo-
13
H. Jeffreys, Proceedings of the London Mathematical Society 23, 428-436 (1923).
“Z_2” — 2017/9/5 — 8:19 — page 298 — #318
-se ao infinito. As ondas que se propagam na ionosfera tem polarização tanto perpendicular ao plano
de incidência a partir de uma antena horizontal como ao plano de incidência a partir de uma antena
vertical. a) Mostrar a partir de equações de Fresnel para reflexão e refração que para ω > ωp há uma
variedade de ângulos de incidência de tal forma que a reflexão não é total, mas para ângulos maiores,
existe uma reflexão total que faz as ondas voltarem para a Terra. b) Um rádio amador operando sinais
com comprimento de onda de 21 m no início da noite descobre que eles podem ser recebidos em
estações distantes, situados a mais de 1000 km de distância, mas nenhuma estação mais próxima.
Assumindo que os sinais são inicialmente refletidos a partir da camada F da ionosfera a uma altura
efetiva de 300 km, calcule a densidade de elétrons. Compare com a densidades máxima e mínima para
a camada F , i.e., Nmáx ∼ 2 × 106 cm−3 durante o dia e Nmín ∼ (2 − 4) × 105 cm−3 durante a noite.
10.3 Considere a propagação de ondas de rádio na ionosfera da Terra, com meio não uniforme ε = ε(z)
para z > 0. Considere as equações de Maxwell para estes casos e os campos podendo ser escritos
como funções de z vezes ei(kx−ωt) . a) Mostre que a equação de onda propagando-se para z > 0 é
dada
d2 F ω2
2
+ q 2 (z) F = 0 , em que q 2 (z) = 2 ε(z) − k2
dz c
e F = E para polarização horizontal, e
2
2 ω2 1 d2 ε 3 dε
q (z) = 2 ε(z) + 2
− 2 − k2
c 2ε dz 4ε dz
√
com F = ε E para polarização vertical. b) Use a aproximação WKB para tratar a propagação de
ondas diretamente verticais indo para a ionosfera k = 0, assumindo que a constante dielétrica é dada
por (9.76). c) Use os resultados WKB do item anterior e os conceitos de propagação dados na Seção
9.8, define uma altura efetiva para a ionosfera h′ (ω) calculando o tempo T para o pulso de frequência
dominante ω para subir e ser refletido de volta, h′ = cT 2 .
10.4 Seja a equação de onda de rádio que se propaga na ionosfera para z > 0 dada
d2 E ω2
− αzE = 0, em que q 2 (z) = −α z ou q 2 (z) = ε(z) − k2 .
dz 2 c2
a) Mostre que sua solução é dada por
Z ∞
A 1
E= Φ(α1/3 z) , em que Φ(ξ) = √ cos( 13 u3 + u ξ) du
α1/6 π 0
Leitura Recomendada
Recomenda-se ao leitor os dois livros de
– K. G. Budden [16] e [17].
Nestes livros, os mais completos que conheço, o leitor encontrará excelentes discussões e deduções deta-
lhadas dos aspectos físico e matemático para o estudo da propagação de ondas na ionosfera.
14
Sir George Biddell Airy (1801-1892), matemático e astrônomo inglês.
“Z_2” — 2017/9/5 — 8:19 — page 299 — #319
Capítulo 11
Ondas Eletromagnéticas Cilíndricas e
Esféricas
Neste capítulo, iremos estudar as ondas eletromagnéticas cilíndricas e esféricas. Porém, antes de desenvol-
vermos estes tópicos, primeiramente iremos desenvolver o vetor de Hertz em meios materiais. Esta técnica
tem muita importância tanto para o cálculo de propagação de ondas em guias de onda assim como para
a teoria de radiação eletromagnética, principalmente quando aplicados à campos e ondas em engenharia
elétrica. Faremos também um breve estudo sobre ondas elípticas.
µε ~ ~e
∂Π
~
B= ∇× (11.3)
c ∂t
2~
~E = ∇(
~ ∇ ~ e ) − µε ∂ Πe ,
~ ·Π
c ∂t2
2
299
“Z_2” — 2017/9/5 — 8:19 — page 300 — #320
em que
~e
µε ∂ 2 Π 4π
~ e−
∇2 Π = − ~P , (11.4)
2
c ∂t 2 ε
~
sendo P o vetor de polarização associado às fontes e definido por,
~
~J = ∂ P e ρ = −∇ ~ · ~P .
∂t
~ m que satisfaz às equações do campo eletromagnético em meio
Ainda existe uma solução alternativa Π
linear, homogêneo e isotrópico e sem correntes de condução ou cargas. Assim,
~ ·Π
Φm = −∇ ~m
~
~F = µε ∂ Πm
c ∂t
(11.5)
~
~ = − µε ∇
D ~ × ∂ Πm
c ∂t
2~
~ ~ ∇
B = ∇( ~ m ) − µε ∂ Πm .
~ ·Π
c2 ∂t2
Portanto, o campo eletromagnético pode ser decomposto em duas parcelas, uma relacionada ao vetor Π ~ee
~
outra relacionada ao vetor Πm .
Para a formulação apresentada aqui, a origem dos campos é externa à região considerada. Para inter-
~ eeΠ
pretar a diferença entre Π ~ m é conveniente considerar os domínios do espaço sem a referida restrição,
o que aproveita a separação entre as duas soluções e associa Π ~e eΠ ~ m às fontes, ou origem, do campo
eletromagnético. Por exemplo, considerando meios em que temos uma polarização elétrica residual ~P0 e
uma polarização magnética residual M~ 0 , ambas função de x, y e z e independentes dos campos ~E e H,
~ mas
em que não haja correntes de condução nem cargas e sendo constantes no domínio de tempo considerado,
os campos D ~ eH~ podem ser escritas como
~ = ε ~E + 4π ~P0
D e ~ = 1~
H ~ 0.
B − 4π M
µ
Utilizando convenientemente os graus de liberdade das soluções de potencial obtemos,
2~ ~
~E = ∇(
~ ∇ ~ e ) − µε ∂ Πe − µ ∇
~ ·Π ~ × ∂ Πm
2
c ∂t 2 c ∂t
(11.6)
~ 2~
~ = ε∇
H ~ × ∂ Πe + ∇(
~ ∇ ~ m ) − µε ∂ Πm ,
~ ·Π
c ∂t c2 ∂t2
~ eeΠ
em que Π ~ m são soluções de
~e
µε ∂ 2 Π 4π
~ e−
∇2 Π = − ~P0
2
c ∂t 2 ε
~m
µε ∂ 2 Π
~ m−
∇2 Π ~ 0.
= −4π M
c2 ∂t2
“Z_2” — 2017/9/5 — 8:19 — page 301 — #321
Nestas condições consideramos como fonte do vetor Π ~ e a polarização residual elétrica ~P0 e a fonte do
~ m é a polarização residual magnética M
vetor Π ~ 0 . Na hipótese de termos um determinado domínio espacial
em que não contém polarização residual elétrica ou magnética, mas se este meio for caracterizado pelas
constantes dielétrica ε, magnética µ e pela condutividade σ, obtemos soluções do tipo
~
~E = ∇
~ ×∇ ~ e−µ∇
~ ×Π ~ × ∂ Πm
c ∂t
(11.7)
!
~ e 4πσ
ε ∂Π
~ =∇
H ~ × + ~e
Π ~ ×∇
+∇ ~ ×Π
~ m.
c ∂t c
Como nosso interesse é estudar o comportamento dos campos harmônicos, em que as funções envolvi-
~ ×∇
das possuam uma variação temporal do tipo e− i ωt é mais útil relacionar diretamente os termos ∇ ~ ×Π
~e
~ ~ ~
e ∇ × ∇ × Πm através das relações,
2~ ~
~ ×∇
∇ ~ ×Π
~ e − ∇(
~ ∇ ~ e ) + µε ∂ Πe + 4πσµ ∂ Πe = 0
~ ·Π
2
c ∂t 2 c2 ∂t
(11.8)
2~ ~
~ ×∇
∇ ~ ×Π ~ ∇
~ m − ∇( ~ m ) + µε ∂ Πm + 4πσµ ∂ Πm = 0 ,
~ ·Π
c2 ∂t2 c2 ∂t
que nos leva,
~ e 4πσµ ∂ Π
µε ∂ 2 Π ~e
~ e−
∇2 Π − =0
c2 ∂t2 c2 ∂t
(11.9)
µε ~
∂2Π m
~m
4πσµ ∂ Π
~ m−
∇2 Π − 2 = 0,
c2 ∂t 2 c ∂t
que são equações de onda em meios condutores homogêneos.
~ =Π
Π ~ e+Π
~ m,
em que
~ e = Πe ẑ
Π e ~ m = Πm ẑ .
Π
De acordo com as Eqs. (11.7), os campos elétrico e magnético podem ser dados, considerando um meio
homogêneo, linear e isotrópico, por
~E = ∇
~ ×∇ ~ e−µ ∂ ∇
~ ×Π ~m
~ ×Π
c ∂t
(11.10)
~ = ε ∂ 4πσ ~ ×Π
~ e+∇
~ ×∇
~ ×Π
~ m,
H + ∇
c ∂t c
2~ ~
~ ×∇
∇ ~ m − ∇(
~ ×Π ~ ∇ ~ m ) + µε ∂ Πm + 4πσµ ∂ Πm = 0 .
~ ·Π
c2 ∂t2 c2 ∂t
Campo de modos transversais magnéticas (T M ) – Para este modo temos as componentes dos campos
como,
∂ 2 Πez
Er =
∂r∂z
1 ∂ 2 Πez
Eφ =
r ∂φ∂z
1 ∂ ∂Πez ∂ 1 ∂Πez
Ez = − r +
r ∂r ∂r ∂φ r ∂φ
(11.11)
ε ∂ 4πσ 1 ∂Πez
Hr = +
c ∂t c r ∂φ
ε ∂ 4πσ ∂Πez
Hφ = − +
c ∂t c ∂r
Hz = 0 .
1
Veja com detalhes o magnífico texto do Prof. J. A. Stratton, Electromagnetic theory (1941).
“Z_2” — 2017/9/5 — 8:19 — page 303 — #323
Campo de modos transversais elétricas (T E) – Para este modo temos as componentes dos campos como,
µ 1 ∂ 2 Πmz
Er = −
c r ∂t∂φ
µ ∂ 2 Πmz
Eφ =
c ∂t∂r
Ez = 0
(11.12)
∂ 2 Πmz
Hr =
∂r∂z
1 ∂ 2 Πmz
Hφ =
r ∂φ∂z
1 ∂ ∂Πmz ∂ 1 ∂Πmz
Hz = − r + .
r ∂r ∂r ∂φ r ∂φ
Seguindo mesma lógica, podemos escrever os potenciais escalar e vetor. Assim, em coordenadas cilín-
dricas, temos:
∂ 2 Πez 1 ∂ 2 Πez
Er = , Eφ = ,
∂r∂z r ∂φ∂z
1 ∂Az ∂Az
Br = , Bφ = − , Bz = 0 .
r ∂φ ∂r
∂Πmz µε ∂Πmz
Φm = − , Fz = , Fr = Fφ = 0 . (11.16)
∂z c ∂t
“Z_2” — 2017/9/5 — 8:19 — page 304 — #324
~ = −∇
~ × ~F e H
~ = −∇Φ
~ m− 1 ∂~F 4πσ ~F serão
Então, as componentes de D c ∂t − c
1 ∂Fz ∂Fz
Dr = − , Dφ = , Dz = 0 ,
r ∂φ ∂r
∂ 2 Πmz 1 ∂ 2 Πmz
Hr = , Hφ = ,
∂r∂z r ∂φ∂z
∂ 2 Πmz µε ∂ 2 Πmz 4πσµ ∂Πmz
Hz = 2
− 2 2
− 2 .
∂z c ∂t c ∂t
Funções de Onda Cilíndrica Circular O campo eletromagnético obtido pela superposição de Π ~ eeΠ~m
é de caráter geral, podendo representar qualquer condição de fronteira onde não estejam envolvidas as
fontes. No caso de existirem as fontes, estas podem ser representadas através da inclusão de vetores de
Hertz adicionais. Uma vez que o vetor de Hertz possui apenas uma componente, é possível associá-lo a um
escalar ψ, em outras palavras, seja Πz a intensidade de qualquer um dos vetores de Hertz, logo
Πz = ψ .
O escalar ψ, conhecido como função de onda, deve satisfazer a equação de uma onda escalar, uma vez que
o vetor de Hertz a satisfaz, como vimos anteriormente. Para um sistema de coordenadas cilíndricas (r, φ, z)
temos
1 ∂ ∂ψ 1 ∂ 2 ψ ∂ 2 ψ µε ∂ 2 ψ 4πσµ ∂ψ
r + 2 + − 2 − 2 = 0. (11.17)
r ∂r ∂r r ∂φ2 ∂z 2 c ∂t2 c ∂t
Como estamos interessado no estudo do comportamento dos campos harmônicos, as funções envolvi-
das possuam uma variação temporal do tipo e− i ωt e lembrando
que a equação de onda, ou equação de
2 2
Helmholtz, é dada no domínio da frequência por ∇ + k ψ, admitindo-se um meio homogêneo, linear,
infinito e isotrópico de permeabilidade magnética µ, condutividade σ e constante dielétrica ε, com um fator
de propagação k, em que
ω2 ω
k2 = µε 2 + i 4πσµ 2 .
c c
A solução da Eq. (11.17) é obtida através do método de separação de variáveis. Considere, a principio que
a função de onda ψ, possa ser decomposta em três funções, de tal modo que,
1 d2 f3
= −h2 , (11.19)
f3 dz 2
1 d2 f2
= −n2 , (11.21)
f2 dφ2
sendo n uma constante, podendo ser complexa. É possível então obter a seguinte equação
r d df1
r − n2 + (k2 − h2 )r 2 = 0 , (11.22)
f1 dr dr
que é uma equação diferencial ordinária em r. Agora é possível escrever um conjunto de três equações
diferencias ordinárias
d df1
r r + (k2 − h2 )r 2 − n2 f1 = 0 (11.23)
dr dr
d2 f2
+ n2 f2 = 0 (11.24)
dφ2
d2 f3
+ h2 f3 = 0 . (11.25)
dz 2
As Eqs. (11.24) e (11.25) são equações harmônicas que possuem como solução funções exponenciais, usual-
mente estas exponenciais são diretamente proporcionais às coordenadas, i.e.,
f2 (φ) = e± i nφ e f3 (z) = e± i hz ,
As séries convergem para todos os valores de ρ. Se p não for um inteiro, estas duas soluções formam um
par de soluções linearmente independentes da equação de Bessel de segunda ordem. Entretanto, se p for um
“Z_2” — 2017/9/5 — 8:19 — page 306 — #326
inteiro, elas são as bem conhecidas soluções linearmente dependentes. Para p = n inteiro, Jp (ρ) torna-se
uma função de valor único de posição. A função Γ(n + m + 1) é substituída pelo fatorial (n + m)!, tal que
(−1)m ρ n+2m
∞
X
Jn (ρ) = , (11.30)
m! (n + m)! 2
m=0
Caso a constante de propagação h for complexa, o campo não é necessariamente periódico ao longo do
eixo z. Uma expressão explícita para h em função da frequência e da constante de propagação do meio k
somente pode ser obtida através dos valores de ψ para um dado cilindro de raio constante ou no plano z
igual a uma constante conhecida. Em outras palavras, os valores das constantes de separação dependem
sempre das condições de contorno ou fronteira. A direção de propagação é positiva ou negativa de acordo
com o sinal de h.
“Z_2” — 2017/9/5 — 8:19 — page 307 — #327
A primeira equação em (11.34) deve ser empregada a domínios finitos incluindo o eixo r = 0. Quando
analisamos o comportamento a grandes distâncias das fontes a segunda equação em (11.34) deverá ser
empregada, pois a função de Hankel para grandes valores do argumento pode ser representada por sua
expansão assintótica
q nπ
− π4
ei(r− )
(1) 2
Hn (r) ∼ πr
2 para − π < arg r < 2π
q (11.35)
r− nπ − π4
e− i( )
(2) 2
Hn (r) ∼ πr
2 para − 2π < arg r < π .
∂ψnhk i h ∂ψnhk
Er = ± i h , Eφ = ± , Ez = (k2 − h2 ) ψnhk ,
∂r r ∂φ
4πσ
c + i ωε
c ∂ψnhk 4πσ ωε ∂ψnhk
Hr = − , Hφ = +i , Hz = 0 ,
r ∂φ c c ∂r
enquanto para o caso de modos T E teremos,
µω ∂ψnhk µω ∂ψnhk
Er = i , Eφ = − i , Ez = 0 ,
rc ∂φ c ∂r
∂ψnhk i h ∂ψnhk
Hr = ± i h , Hφ = ± , Hz = (k2 − h2 ) ψnhk .
∂r r ∂φ
Cada função de onda elementar é identificada univocamente pelos valores de n, h e k. Quando n = 0,
o campo é simétrico em relação ao eixo z. Quando as condições iniciais são definidas para um determinado
plano ou superfície cilíndrica, a solução é construída pela superposição de funções de onda elementares.
Para um determinado valor de k e h obtemos os seguintes campos, no caso de uma solução geral
∞
X ∞
∂ψn µω X
Er = i h an − nbn ψn
n=−∞
∂r rc n=−∞
X∞ ∞
h µω X ∂ψn
Eφ = − nan ψn − i bn (11.36)
r n=−∞ c n=−∞ ∂r
∞
X
2 2
Ez = (k − h ) an ψn
n=−∞
“Z_2” — 2017/9/5 — 8:19 — page 308 — #328
∞ ∞
4πσ
+ i ωε X X ∂ψn
c c
Hr = nan ψn + i h bn
r n=−∞ n=−∞
∂r
X∞ X∞
4πσ ωε ∂ψn h
Hφ = i +i an − nbn ψn (11.37)
c c n=−∞
∂r r n=−∞
∞
X
Hz = (k2 − h2 ) bn ψn ,
n=−∞
em que an e bn são os coeficientes a serem determinados a partir das condições iniciais. A direção de
propagação é positiva ou negativa de acordo com o sinal de h.
No caso do coordenada elíptica, o parâmetro a tem o valor de − 12 e a Eq. (11.38) representa a equação
de Mathieu2 na forma algébrica, já no caso esferoidal, a é um número inteiro positivo. Esta equação é
caracterizada por uma singularidade irregular no infinito e singularidades regulares em z = ±1.3
Como estamos interessado em coordenadas elípticas, temos
d2 f1
2
+ c2 λ2 cosh2 u − b f1 = 0 (11.39)
du
d2 f2
2
+ b − c2 λ2 cos2 v f2 = 0 , (11.40)
dv
√
em que b é uma constante arbitrária de separação, e, como na seção anterior λ = k2 − h2 . A transição
para o caso circular ocorre quando c → 0 e u → ∞. Então c cosh u → c senh u → r e v é claramente o
2
Émile Léonard Mathieu (1835-1890), mathemático francês.
E. Mathieu, Journal de Mathématiques Pures et Appliquées, 137-203 (1868).
3
J. A. Stratton, Proceedings of the National Academy of Sciences, 1, 51-56 (1935); P. M. Morse, Proceedings of the National
Academy of Sciences, 1, 56-62 (1935).
“Z_2” — 2017/9/5 — 8:19 — page 309 — #329
ângulo feito pelo raio r com o eixo x. Por essa razão f1 (u) é conhecida como função radial e f2 (v) como
função angular.
As expressões (11.39) e (11.40) são as equações de Mathieu.4 Primeiramente, vamos considerar as
funções angulares f2 (v). Existe, obviamente, as soluções de (11.40) seja qual for o valor da constante de
separação b. Mas, campo electromagnético é uma função de um só valor de posição e, consequentemente,
as propriedades do meio são homogêneas no que diz respeito à variável v, é necessário que a função f2 (v)
seja uma função periódica do ângulo v. Assim, a Eq. (11.40) admite soluções periódicas somente para cer-
tos valores característico de b, i.e., para certo conjunto de valores {b1 , b2 , · · · , bm , · · · }. De acordo com os
valores de b, a Eq. (11.40) admite soluções periódicas pares e ímpar. Designamos os valores característicos
(e)
para soluções pares como bm e as funções características associadas representadas por séries de cosseno
(o)
Se mλ (v). Se temos soluções ímpares, os valores característicos são designados por bm e as funções ca-
racterísticas associadas representadas por séries de seno So mλ (v). As definições das funções de Mathieu,
Se mλ (v) e So mλ (v), são dadas do seguinte modo:5
∞ ′
X
Se mλ (v) = Dnm (λ) cos nv (11.41)
n=0
X∞ ′
So mλ (v) = Fnm (λ) sen nv , (11.42)
n=0
P∞
em que o sinal (′ ) no somatório, n=0 ′ , indica que a soma é para todos os valores pares de n se m é par,
e para todos os valores ímpares de n se m é ímpar. As relações de recorrência dos coeficientes Dnm (λ) e
Fnm (λ) são encontradas pela substituição das expressões anteriores em (11.40). Todos os coeficientes das
séries estão referidos para uma condição inicial na qual é arbitrária. A vantagem da escolha do coeficiente
inicial e de tal forma que a própria função tem valor unitário quando v = 0, correspondendo à cos v = 1.
Assim, para Dnm (λ) temos
∞ ′
X
Dnm (λ) = 1 ⇒ Se mλ (0) = 1 ,
n=0
4
Fixando adequadamente as constantes, as Eqs. (11.38)-(11.40) são de mesma estrutura algébrica.
5
The Computational Laboratory of the National Applied Mathematics Laboratory, National Bureau of Standards, Tables relating
to Mathieu functions, Columbia Univ. Press, New York (1951).
“Z_2” — 2017/9/5 — 8:19 — page 310 — #330
em que
∞ ′
X ∞ ′
X
Ie mλ = π [(1 + δ) Dnm (λ)]2 e Io mλ = π [Fnm (λ)]2 ,
n=0 n=0
π
em que im−n = ei(m−n) 2 . Desde que as equações de Bessel satisfaçam as relações de recorrência, a função
radial par de segundo tipo em termos das funções de Bessel do segundo tipo será dado por
r ∞ ′
(2) π X m−n m
Re mλ (u) = i Dn (λ) Nn (cλ cosh u) . (11.44)
2
n=0
1 2m+1
(3) i cλ cosh u− 4 π
Re mλ (u) ∼ √ e
cλ cosh u
1 2m+1
(4) − i cλ cosh u− 4 π
Re mλ (u) ∼√ e ,
cλ cosh u
(1)
para cλ cosh u → ∞. A função Re mλ (u) satisfaz a mesma equação como função do ângulo Se mλ (v);
nem tem outras singularidades do que aquela do infinito. Assim, as duas funções devem, portanto, ser
proporcional uma a outra,
√ (1)
Se mλ (v) = 2π ℓem Re mλ (u) ,
em que
P∞ ′ n−m Dnm (λ)
1
π n=0 i D0m (λ) para m par
(e)
ℓm =
2 P∞ ′ Dnm (λ)
cλπ n=0 n in−m D1m (λ) para m ímpar .
6
J. A. Stratton, Proceedings of the National Academy of Sciences, 1, 51-56 (1935); P. M. Morse, Proceedings of the Natio-
nal Academy of Sciences, 1, 56-62 (1935); The Computational Laboratory of the National Applied Mathematics Laboratory,
National Bureau of Standards, Tables relating to Mathieu functions, Columbia Univ. Press, New York (1951).
“Z_2” — 2017/9/5 — 8:19 — page 311 — #331
Mas temos também o conjunto de funções radiais ímpares, definidas em termos das funções de Bessel de
primeiro tipo e de segundo tipo:
r ∞ ′
(1) π X m−n
Ro mλ (u) = tanh u i nFnm (λ) Jn (cλ cosh u) (11.47)
2
n=0
r ∞ ′
(2) π X
Ro mλ (u) = tanh u im−n nFnm (λ) Nn (cλ cosh u) . (11.48)
2
n=0
As expansões assintóticas das funções ímpares são idênticas com as correspondentes assintóticas das fun-
ções pares. Finalmente,
√ (1)
i So mλ (v) = 2π ℓom Ro mλ (u) ,
em que P∞ m
4
πc2 λ2 n=0
′
n FFnm (λ)
(λ)
in−m para m par
2
ℓ(o)
m =
2 P∞ ′ Fnm (λ) n−m
πcλ n=0 F1m (λ) i para m ímpar .
Consequentemente, quando u = 0, temos
(1) d (1) 1 1
Ro mλ (0) =0 ⇒ R (u) =√ .
du o mλ u=0
(o)
2π ℓm
Tendo todas estas funções de Mathieu, pares e ímpares, podemos escrever as funções de onda cilíndrica
elíptica. Quando estas funções são finitas em todos os lugares e, em particular, ao longo do eixo que une os
focos, as equações de onda são construídas direto das funções radiais do primeiro tipo,
√
(1) k 2 −λ2 z−i ωt
ψe(1)
m = Se mλ (v) Re mλ (u) e
±i
(11.51)
√
(1) k 2 −λ2 z−i ωt
ψo(1)
m = So mλ (v) Ro mλ (u) e± i . (11.52)
Porém, quando a grande distância do eixo do cilindro os campos estão se propagando radialmente para
longe, as equações de onda são construídas direto das funções radiais do terceiro tipo, pois estas têm apro-
ximações assintóticas,
√
(3) k 2 −λ2 z−i ωt
ψe(3)
m = Se mλ (v) Re mλ (u) e
±i
(11.53)
√
(3) k 2 −λ2 z−i ωt
ψo(3)
m = So mλ (v) Ro mλ (u) e
±i
. (11.54)
“Z_2” — 2017/9/5 — 8:19 — page 312 — #332
As componentes dos campos elétrico e magnético são calculados de acordo com o conjunto de regras
apresentados. Em um meio condutor, homogêneo e isotrópico, temos
ω2 ω
k2 = µε 2
+ i 4πσµ 2 .
c c
Em coordenadas elípticas definimos,
ξ ≡ cosh u e η ≡ cos v
e s s
ξ2 − η2 ξ 2 − η2
h1 = c0 e h2 = c0 ,
ξ2 − 1 1 − η2
em que usamos c0 (distância semifocal) para não confundir com a velocidade da luz c. Para as componentes
no modo T M , os potenciais escalar e vetor são
µεω 4πµσ
Φ = ∓ihψ e A = −i +i ψ
c c
e os campos são
i h ∂ψ i h ∂ψ
Eξ = ± , Eη = ± , Ez = (k2 − h2 ) ψ
h1 ∂ξ h2 ∂η
e
i k2 1 ∂ψ i k2 1 ∂ψ
Hξ = − , Hη = , Hz = 0 .
µω/c h2 ∂η µω/c h1 ∂ξ
Já, para as componentes no modo T E, os potenciais escalar e vetor são
µεω
Φm = ∓ i h ψ e F = −i ψ
c
e os campos são
µω 1 ∂ψ µω 1 ∂ψ
Eξ = i , Eη = − i , Ez = 0
c h2 ∂η c h1 ∂ξ
e
i h ∂ψ i h ∂ψ
Hξ = ± , Hη = ± , Hz = (k2 − h2 ) ψ .
h1 ∂ξ h2 ∂η
(1) (1) (3) (3)
Naturalmente, estas relações são válidas para todas as ψ, i.e., para o conjunto {ψe m , ψo m , ψe m , ψo m }.
Ondas Esféricas Elementares Suponhamos que a função de onda possui variação harmônica com o
tempo na forma e− i ωt e um meio com parâmetros σ, ε e µ e lembrando que não há imposições com relação
ao comportamento destes parâmetros em função da frequência, a função de onda ψ e a equação de onda
pode ser escrita para um sistema de coordenadas esféricas (r, θ, φ) como:
ψ = f (r, θ, φ) e− i ωt
e
∂2f 2 ∂f 1 ∂ ∂f 1 ∂2f
+ + 2 sen θ + + k2 f = 0 . (11.55)
∂r 2 r ∂r r sen θ ∂θ ∂θ r 2 sen2 θ ∂φ2
Usando a função f = f1 (r) f2 (θ) f3 (φ) e fazendo a devida separação de variáveis, temos
d2 f3
+ m2 f 3 = 0 (11.56)
dφ2
1 d df2 m2
sen θ + n(n + 1) − f2 = 0 (11.57)
sen θ dθ dθ sen2 θ
2
d2 f1 2 df1 k
+ + 2 − n(n + 1) f1 = 0 . (11.58)
dr 2 r dr r
A primeira equação é satisfeita por f3 (φ) = e± i mφ , para que f3 seja unívoca, m deve ser um inteiro
(se permitimos 0 ≤ φ < 2π, domínio do ângulo azimutal). A segunda equação é satisfeita pelas funções
associadas de Legendre de primeiro tipo Pnm (cos θ) e de segundo tipo Qm
n (cos θ). A terceira equação, poderá
ser escrita na forma de Bessel,
" #
d2 w 1 dw k2 1 2
+ + 2 − n+ w = 0, (11.59)
dr 2 r dr r 2
1
em que w = r 2 f1 e é satisfeita pelas funções de Bessel e pelas funções de Neumann, i.e., Jn+1/2 (kr) e
Nn+1/2 (kr).7
É usual definir as funções esféricas de Bessel, Neumann e Hankel por:
π 1/2
jn (x) = Jn+1/2 (x)
2x
π 1/2
nn (x) = Nn+1/2 (x) . (11.60)
π 1/22x
h(1,2)
n (x) = Jn+1/2 (x) ± i Nn+1/2 (x)
2x
Nas ondas esféricas, x = kr, devemos ter o controle quando r → 0 e r → ∞, na qual associamos às
propriedades assintóticas destas funções. Assim, as funções esféricas de Hankel serão
± i kr
n+1 e 1
h(1,2)
n (kr) = ±(∓ i) + O , (11.61)
kr r2
na qual está apropriada para descrever a forma assintótica, r → ∞ das ondas esféricas. É interessante notar
que as funções de Bessel esféricas são mais simples que suas contrapartes cilíndricas. Consideremos, por
exemplos as funções esféricas de ordem zero
sen kr cos kr
j0 (kr) = , n0 (kr) = − ,
kr kr
7
Como referência destas funções especiais, ver: P. M. Morse and H. Feshbach, Methods of theoretical physics (1953); H. Bate-
man, The mathematical analysis of electrical and optical wave-motion on the basis of Maxwell’s equations (1915).
“Z_2” — 2017/9/5 — 8:19 — page 314 — #334
(1) ei kr (2) e− i kr
h0 (kr) = , h0 (kr) = − .
i kr i kr
Um detalhe interessante é que das funções de Bessel esféricas somente as famílias dadas por jn (kr) são
finitas para r = 0.
A equação em θ, i.e., Eq. (11.57), como já afirmamos, relaciona-se com a equação de Legendre e possui
como solução as funções associadas de Legendre de primeiro tipo Pnm (cos θ) ou de segundo tipo Qm n (cos θ),
representadas genericamente por Lm n (cos θ), em que L m (cos θ) = 0 para m > n. Quando estamos interes-
n
sados no caso em que a variável cos θ tem θ um ângulo real, tal que 0 < θ < π, a melhor definição para
as funções de Legendre generalizadas para valores irrestritos de m e n estão dadas em termos das funções
gama Γ e funções hipergeométrica 2 F1 ,8
m 1 m θ 2 θ
Pn (cos θ) = cot 2 F1 −n, n + 1, 1 − m; sen (11.62)
Γ(1 − m) 2 2
π 1
Qmn (cos θ) =
2 sen (n + m)π Γ(1 − m)
m θ 2 θ
× cos (n + m)π cot 2 F1 −n, n + 1, 1 − m; sen
2 2
θ θ
− tanm 2 F1 −n, n + 1, 1 − m; cos2 (11.63)
2 2
Z θ
−m cosecm θ cos n + 12 φ
Pn (cos θ) = m dφ . (11.64)
2 Γ 21 Γ m + 12
1
0 (2 cos φ − 2 cos θ) 2 −m
A última relação dada anteriormente, também pode ser escrita, como uma combinação de Pnm (cos θ) e
Qm
n (cos θ), na forma
−m Γ(n − m) m 2 m
Pn (cos θ) = cos mπ Pn (cos θ) − sen mπ Qn (cos θ) .
Γ(n + m) π
As soluções regulares são
m dm
Pnm (x) = (1 − x2 ) 2 Pn (x)
dxm
m dm
Qm 2 2
n (x) = (1 − x ) Qn (x)
dxm
e finalmente, vale a relação de ortogonalidade,
Z π
2 n+m
Pnm′ (cos θ) Pnm (cos θ) sen θ dθ = δn′ ,n .
0 2n + 1 n − m
Excelentes textos trazem as propriedades das funções de Legendre com muita clareza.9
Portanto, a solução geral da equação diferencial (11.55) será
X h
∞ m=n
X i
f (r, θ, φ) = A(1)
nm nh(1)
(kr) + A(2) (2)
h
nm n (kr) Lm
n (cos θ) e
± i mφ
, (11.65)
n=0 m=−n
8
E. W. Hobson, Philosophical Transactions of the Royal Society of London, A187, 443-531 (1896); E. W. Barnes, Philosophical
Transactions of the Royal Society of London, A, 249-297 (1906).
9
Como referência das funções especiais de Legendre, ver os magníficos textos: P. M. Morse and H. Feshbach, Methods of
theoretical physics (1953); G. Arfken and H. J. Weber, Mathematical methods for physicist (1995); E. Butkov, Mathematical
physics (1968) e R. Courant and D. Hilbert, Methods of mathematical physics (1962).
“Z_2” — 2017/9/5 — 8:19 — page 315 — #335
(1) (2)
em que os coeficientes Anm e Anm serão determinados pelas condições de contorno do problema.
No caso de f (r, θ, φ) ser finito na origem e incluindo a variação temporal do tipo e− i ωt , temos
∞ m=n
X X
ψ= Cnm jn (kr) Lm
n (cos θ) e
± i mφ − i ωt
e ,
n=0 m=−n
em que Cnm é um coeficiente a ser determinado e usamos jn (kr) pois estas são as funções de Bessel
esféricas finitas para r = 0. Enquanto um campo cujas superfícies de fase constante viajam para o exterior
é expresso por
X∞ m=n
X
ψ= A(1) (1) m
nm hn (kr) Ln (cos θ) e
± i mφ − i ωt
e ,
n=0 m=−n
(1)
pois hn (kr) tem solução assintótica.
Equação de Onda Vetorial Vamos considerar um meio homogêneo e isotrópico e os vetores do campo
eletromagnético {~E, ~ ~ H},
B, D, ~ potencial vetor e vetores de Hertz satisfazendo a mesma equação diferen-
~
cial. Denotando C sendo qualquer um destes vetores, então
µε ∂ 2 ~ ~
C 4πσµ ∂ C
∇2 ~
C− 2 2
− 2 = 0.
c ∂t c ∂t
O vetor ~
C tem uma fator temporal ei ωt , e, usando a propriedade vetorial
∇2 ~ ~∇
C=∇ ~ ·C
~ −∇
~ ×∇
~ ×~
C,
∇2 ψ + k 2 ψ = 0 (11.67)
e ~a um vetor constante de comprimento unitário. Podemos construir três soluções vetoriais independentes
de (11.66),10
~L = ∇ψ
~ , ~ =∇
M ~ ×~aψ , ~ = 1∇
N ~ ×M ~ . (11.68)
k
Se C~ for colocado igual a ~L, M
~ ou N,
~ irá verificar que a Eq. (11.66) é de fato identicamente satisfeita por
~ poderá ser escrito como
(11.68) quando sujeito a Eq. (11.67). Desde que ~a seja um vetor constante, M
~ = ~L ×~a = 1 ∇
M ~ .
~ ×N (11.69)
k
~ é perpendicular ao vetor ~L, i.e.,
Para uma mesma função geradora ψ, o vetor M
~L · M
~ = 0.
~ eN
enquanto M ~ são solenoidais
~ ·M
∇ ~ = 0, ~ ·N
∇ ~ = 0.
~ eN
Com as devidas particularidades descritas, os vetores M ~ são obviamente apropriados pelas repre-
sentações dos campos ~E e H.
~ Se o fator temporal é dado por e ωt e se a densidade de carga livre é zero em
i
~E = i µ ω ∇~ ×H
~ , ~ =
H
1 ~ ~
∇ × E. (11.70)
k2 c i µ ωc
Suponhamos que o potencial vetor pode ser representado como uma expansão das funções vetoriais carac-
terística na forma
X
~ = i
A ~ n + bn N
an M ~ n + cn ~Ln , (11.71)
ω/c n
em que os coeficientes an , bn e cn são determinados a partir a partir da distribuição de corrente. Através das
~ × ~L = 0, ∇
relações ∇ ~ · ~L = ∇2 ψ = −k2 ψ, da Eq. (11.70) e de µ H ~ =∇ ~ × A,~ encontramos,
X X
~E = − ~ n + bn N
an M ~n , ~ =− k
H ~ n + bn M
an N ~ n . (11.72)
ω
n
iµc n
O potencial escalar não participa deste cálculo, mas pode ser encontrado diretamente de Eq. (11.71). Para
nosso caso, usando a relação,
~ ·A
∇ ~ + µ ε ∂Φ + 4π σ µ Φ = 0 ,
c ∂t c
temos
~ = i k2 Φ ,
~ ·A
∇
ω/c
então, X
Φ=− cn ψn . (11.73)
n
Portanto,
X ~
~ =−
∇Φ cn ~Ln ⇒ ~ − 1 ∂A ,
~E = −∇Φ
n
c ∂t
levando novamente à Eq. (11.72). Finalmente, considerado nosso caso em que temos uma variação harmô-
nica do tipo e− i ωt , o campo elétrico e magnético podem ser definidos a partir do par de vetores de Hertz
~ eeΠ
Π ~ m,
~E = ∇
~ ×∇ ~ e + i µω ∇
~ ×Π ~ ×Π
~m
c
(11.74)
~ = k2 ~ ×Π
~ e+∇
~ ×∇
~ ×Π
~ m,
H ∇
i µ ωc
é imediato que
X X
~ e = −1
Π bn ψn ~a , e ~m=− 1
Π an ψn ~a , (11.75)
ω
k n
iµc n
Funções de Ondas Vetoriais Esféricas Usando a notação precedente, colocamos ψeo mn = feo mn e− i ωt ,
em que a solução característica feo mn é dada por
feo mn = cos m α
sen mφ Pn (cos θ) zn (kr) , (11.76)
em que a notação (eo ) denota a forma par ou ímpar da função e o valor de α corresponde à uma das funções
radiais esféricas, i.e.,
zn1 (kr) = jn (kr) , zn2 (kr) = nn (kr) , zn3 (kr) = h(1)
n (kr) , zn4 (kr) = h(2)
n (kr) ,
em que znα (kr) vai ser utilizado para denotar uma dependência radial arbitrária.
Para obter as funções de ondas vetoriais, devemos escolher um vetor piloto. Em coordenadas esféricas,
este vetor será ~r = rı̂1 . Como acabamos de ver, para f e o vetor piloto, podemos definir três vetores: o
vetor ~L em que temos ~L = ∇f ~ e∇ ~ × ~L = 0; o vetor M
~ na qual temos M~ =∇ ~ × (rı̂1 f ); e o vetor N em
~ ~ ~ ~ ~
que temos kN = ∇ × M. Se C for colocado igual a qualquer dos vetores L, M ou N, ~ ~ valerá a Eq. (11.66),
i.e., verificará de fato que é identicamente satisfeita pelas relações acima relacionadas.
Os três campos de vetores, ~L, M ~ eN ~ preenchem o espaço de todas as configurações possíveis dos
~
campos eletromagnéticos. O vetor L tem divergência diferente de zero e não é frequentemente usado em
problemas de espalhamento. Os demais vetores, M ~ eN ~ mapeiam os campos elétrico e magnético das
configurações de campo de interesse. Separando o fator tempo dos três vetores, escrevendo ~L = ~ℓ e− i ωt ,
M~ =m ~ = ~n e− i ωt , após uma pequena álgebra, encontramos
~ e− i ωt e N
m α ∂ m
~ eo mn = ∓
m z (kr) Pnm (cos θ) sen α
cos mφ ı̂2 − zn (kr) P (cos θ) cos
sen mφ ı̂3 (11.78)
sen θ n ∂θ n
n(n + 1) α 1 ∂ ∂
~neo mn = zn (kr) Pnm (cos θ) cos
sen mφı̂1 + [r znα (kr)] Pnm (cos θ) cos sen mφı̂2
kr kr ∂r ∂θ
m ∂
∓ [r znα (kr)] Pnm (cos θ) sen
cos mφ ı̂3 . (11.79)
kr sen θ ∂r
As equações anteriores não estão normalizadas.11 Nas relações m
~ eo mn e ~neo mn é fácil mostrar que a derivada
radial poderá ser expressa como,
∂
[r znα (kr)] = znα (kr) + kr znα ′ (kr) ,
∂r
em que o símbolo (′ ) indica a derivada com relação a kr. A derivada da função associada de Legendre pode
ser escrita como,
∂ m 1
Pn = − (n − m + 1)(n + m)Pnm−1 − Pnm+1 ,
∂θ 2
para m 6= 0, e, para m = 0
∂ 0
P = Pn1 .
∂θ n
De posse dos resultados apresentados acima e usando a Eq. (11.72), com uma pequena álgebra, fica fácil
calcular os campos elétrico ~E e magnético H,
~ bem como os potenciais escalar Φ e vetor A. ~
11
Aqui seguimos o procedimento usado em J. A. Stratton, Electromagnetic theory (1941), cujas funções estão definidas como
pares e ímpares e não são normalizadas. No texto W. C. Chew, Waves and fields in inhomogeneous media (1990), as funções
incluem o fator tempo e− i ωt e são normalizadas.
“Z_2” — 2017/9/5 — 8:19 — page 318 — #338
Oscilações de uma Esfera Consideremos uma esfera de raio a caracterizada pela constante k1 imersa
em um meio homogêneo infinito caracterizado pela constante k2 . Os campos elétrico e magnético são
representados em termos das funções de onda vetoriais esféricas, i.e.,
X X k
~E = − ~ n + bn N
an M ~n , ~ =−
H an
~
N n + bn
~
M n ,
n n
i µ ωc
em que o índice subscrito n significa todos os índices, no qual no presente caso temos três. As funções
poderão ser pares ou ímpares e os índices m e n determinam o números de nós com respeito aos ângulos
esféricos φ e θ. Recordemos que a componente radial de cada função m~ eo mn é zero. Assim, se os coeficientes
an são todos zero, apenas bn será excitado, o campo tem um componente radial de ~E, mas o vetor magnético
será sempre perpendicular ao raio vetor. Haverá, por conseguinte, uma distribuição da carga elétrica sobre
a superfície da esfera. As oscilações cujas amplitudes são representadas pelos coeficientes bn são do tipo
elétrico. Por outro lado, se apenas an são excitados, o campo que produzimos pelas oscilações das cargas
magnéticas na superfície da esfera são do tipo magnético.
Primeiramente, vamos considerar as oscilações do tipo magnética.
~E = − (ae mn m
~ e mn + ao mn m
~ o mn ) , ~ = − k (ae mn ~ne mn + ao mn ~no mn ) .
H (11.80)
i µ ωc
Logo, usando as relações (11.78) e (11.79), quando temos r < a, as componentes dos campos internos são,
Eri = 0
1 ∂Ymn i
Eθi = − jn (k1 r) e− i ωt (11.81)
sen θ ∂φ
i
∂Ymn
Eφi = jn (k1 r) e− i ωt
∂θ
e
n(n + 1) i 1
Hri = − Ymn jn (k1 r) e− i ωt
i µ1 ωc r
i
1 ∂Ymn 1
Hθi = − ω [k1 r jn (k1 r)]′ e− i ωt (11.82)
i µ1 c ∂θ r
1 i
1 ∂Ymn 1
Hφi = − ω [k1 r jn (k1 r)]′ e− i ωt ,
i µ1 c sen θ ∂φ r
i estão dados por,
em que os harmônicos esféricos Ymn
i
Ymn = aie mn cos mφ + aio mn sen mφ Pnm (cos θ)
e o símbolo (′ ) indica a derivada com relação a k1 r.
As componentes dos campos externos, i.e., quando temos r > a, são encontradas usando
e
Ymn = (aee mn cos mφ + aeo mn sen mφ) Pnm (cos θ)
(1)
i , k e µ no lugar de k e µ , e, finalmente h (k r) no lugar de j (k r). Logo,
no lugar de Ymn 2 2 1 1 n 2 n 1
Ere = 0
1 ∂Ymn e
Eθe = − h(1) (k2 r) e− i ωt (11.83)
sen θ ∂φ n
e
∂Ymn
Eφe = h(1)
n (k2 r) e
− i ωt
∂θ
“Z_2” — 2017/9/5 — 8:19 — page 319 — #339
e
n(n + 1) e 1 (1)
Hre = − Ymn hn (k2 r) e− i ωt
i µ2 ωc r
1 ∂Y e 1h i′
mn
Hθe = − k2 r h(1)
n (k2 r) e− i ωt (11.84)
i µ2 ωc ∂θ r
1 e 1h
1 ∂Ymn i′
Hφe = − k2 r h (1)
n (k2 r) e− i ωt ,
i µ2 ωc sen θ ∂φ r
com um idêntico para de relações para os coeficientes ímpares aio mn e aeo mn . Vamos agora definir as se-
guintes variáveis
ρ = k2 a , k1 = N k2 , k1 a = N ρ . (11.86)
As condições de contorno dada em (11.85) são satisfeita somente por um discreto conjunto formado por
valores característicos ρns no qual são as raízes da equação transcendental
h i′
(1)
[N ρ jn (N ρ)]′ ρ hn (ρ)
= (1)
. (11.87)
µ1 jn (N ρ) µ2 hn (ρ)
Desde que os valores permitidos de ρ pertençam a um conjunto discreto, segue que, existe com conjunto
correspondente de frequências naturais ou modos de oscilações. Conforme a Eq. (11.86),
2 µ2 ε2 4πµ2 σ2 2
ρ2ns = ωns + i ωns a . (11.88)
c c
P
em que Yni = ∞ i
m=0 Ymn , depende então da maneira desejada em θ e φ quando t = 0. Mas existe um
número infinito de tais séries, uma para cada raiz s da Eq. (11.87). Cada uma destas séries poderá ser
multiplicada por outro coeficiente ais e somada sobre todas as raízes s. Logo,
∞ X
X ∞
n(n + 1) i jn (k1 r) − i ωns t
Hri =− ais Y e , (11.91)
s=0 n=1
i ωns µc1 n r
na qual ais são determinados de modo que (11.91) corresponde a f2 (r) em t = 0. Finalmente, notamos
que antes da soma podemos multiplicar as soluções particulares por k1 r e então diferenciar em relação a
mesma variável. Para Hθi ou Hφi , nenhuma alteração será necessária nos coeficientes aieo mn , mas o somatório
sobre todos os s será modificado para ajustar as condições impostas. O fator temporal e− i ωns t corrige o
comportamento em todos os momentos posteriores, e, devido as condições de unicidade, as componentes
externas dos campos também serão determinadas.
As oscilações do tipo elétrico são bem independentes das do modo magnético, mas os campos e as
frequências naturais serão determinadas exatamente da mesma maneira. Assim, para o caso tipo elétrico, a
Eq. (11.80) ficará
As componentes dos campos elétrico e magnético para qualquer ponto interno r < a serão,
jn (k1 r) − i ωt
Eri = −n(n + 1) Ymn
i
e
k1 r
i
∂Ymn 1
Eθi = − [k1 r jn (k1 r)]′ e− i ωt (11.93)
∂θ k1 r
1 ∂Ymni 1
Eφi = − [k1 r jn (k1 r)]′ e− i ωt
sen θ ∂φ k1 r
Hri = 0
k1 i
1 ∂Ymn
Hθi = − ω jn (k1 r) e− i ωt (11.94)
i µ1 c sen θ ∂φ
i
k1 ∂Ymn
Hφi = ω jn (k1 r) e− i ωt .
i µ1 c ∂θ
Similar ao já realizado, as componentes dos campos elétrico e magnético para qualquer ponto externo da
esfera, r > a, serão
(1)
e hn (k2 r) − i ωt
Ere = −n(n + 1) Ymn e
k2 r
∂Y e 1 h i′
Eθe = − mn k2 r h(1)
n (k2 r) e− i ωt (11.95)
∂θ k2 r
1 ∂Ymne 1 h i′
Eφe = − k2 r h(1)
n (k2 r) e− i ωt
sen θ ∂φ k2 r
“Z_2” — 2017/9/5 — 8:19 — page 321 — #341
Hre = 0
k2 1 ∂Ymn e
Hθe = − h(1) (k2 r) e− i ωt (11.96)
i µ2 c sen θ ∂φ n
ω
k2 ∂Ymn e
Hφe = h(1)
n (k2 r) e
− i ωt
.
i µ2 ωc ∂θ
As amplitudes dos campos interno e externo estão relacionados pelas condições de contorno, logo
k1 i k2 e
be jn (k1 a) = be h(1) (k2 a)
µ1 o mn µ2 o mn n
(11.97)
1 i 1 e h i′
beo mn [k1 a jn (k1 a)]′ = be k2 a h(1)
n (k2 a) ,
k1 k2 o mn
na qual chegaremos a equação transcendental
h i′
(1)
[N ρ jn (N ρ)]′
µ2 ρ hn (ρ)
= , (11.98)
N 2 jn (N ρ) µ1 (1)
hn (ρ)
para os valores característicos ρns . As frequências naturais ωns são obtidas através da Eq. (11.89).
Oscilações de uma esfera condutora Como exemplo, suponhamos uma esfera condutora, mas o meio em
que está incorporado é um dielétrico perfeito. Consideremos primeiramente o caso limite em que
σ1 → ∞. Agora, as duas equações transcendentais (11.87) e (11.98) se reduz a
h i′
h(1)
n (ρ) = 0 , ρ h(1)
n (ρ) = 0, (11.99)
cujas raízes são os valores característicos dos modos magnético e elétrico, respectivamente. No en-
(1)
tanto, cada uma das funções hn podem ser representadas como uma exponencial vezes um polinô-
mio. Por exemplo, tomemos o modo elétrico para n = 1. Logo,
h i′
(1) 1 iρ i (1) i
h1 (ρ) = − e 1+ , ρ h1 (ρ) = − 2 ei ρ ρ2 + i ρ − 1 , (11.100)
ρ ρ ρ
A amplitude é reduzida para a e-ésima parte do seu valor inicial, no tempo necessário em que uma
onda percorre uma distância igual ao diâmetro da esfera. O comprimento de onda no meio externo é
2π
λ = 0,86 a = 7, 3 a. Desde que a condutividade seja infinita, o amortecimento é atribuído inteiramente
a perda de energia por radiação. Esta perda é muito rápida, mesmo para a mais baixa ordem, e no caso
citado a amplitude será reduzida à 0,27 parte de um período completo.
“Z_2” — 2017/9/5 — 8:19 — page 322 — #342
Quando temos uma esfera de metal, a condutividade é finita, mas, não obstante, N é muito grande.
Entretanto, esperamos encontrar as raízes de (11.87) e de (11.98) nas vizinhanças daquelas encontra-
das em (11.99). Se |N ρ| ≫ 1, a representação assintótica de (11.87) será
h i′
ρ h
(1)
(ρ)
n+1 µ1 n
N ρ tan N ρ − π ≃− . (11.103)
2 µ2 h(1)n (ρ)
(1)
Seja ∆ρns o desvio de qualquer uma das raízes ρns da equação hn (ρ) = 0. Expandindo o lado
direito da equação anterior em séries de Taylor ao redor de ρ = ρns e ficando apenas com o termo
linear, obtemos
µ1 1
∆ρns ≃ − ,
µ2 N tan N ρns − n+1 2 π
na qual determina as correções que serão aplicadas nas frequências naturais dos modos magnéticos.
Entretanto, para os modos elétricos, substituímos (11.98) por
h i′
ρ h
(1)
n (ρ)
ρ n+1 µ2
tan N ρ − π ≃− (1)
. (11.104)
N 2 µ2 hn (ρ)
Aqui,
h ∆ρins será o desvio, devido a condutividade finita, de qualquer uma das raízes ρns da equação
(1) ′
ρhn (ρ) = 0. Então,
h i′ h i′′
ρh(1) (1)
n (ρ) = ρhn (ρ) ∆ρns + · · ·
ρ=ρns
encontramos,
µ1 ρ2ns n+1
∆ρns ≃ tan N ρns − π .
µ2 N ρ2ns − n(n + 1) 2
Assim, no caso do modo elétrico fundamental, obtemos
2 µ1
− i ρ1 ≃ −0, 50 ± i 0, 86 1 − ,
3 µ2 N
desde que a tangente de um número complexo muito grande seja + i. No caso de um metal
µ1 1 − i ωǫ2
≃ √ .
µ2 N 2 cσ1
Se a condutividade da esfera é finita, o amortecimento das oscilações é extremamente rápido. Por
outro lado, se a esfera é um perfeito dielétrico, os valores característicos são reais, logo não há amor-
tecimento, daí parece que estes modos não irradia.
Problemas
11.1 Considere o condutor vertical enterrado no solo, com trechos isolados e trechos em contato com o solo.
O solo possui três camadas horizontais de parâmetros distintos, conforme mostrado na Fig. 11.1. Na
última camada não há condutor, sendo que em cada camada, o solo pode ser considerado, homogêneo,
linear e isotrópico. Calcule o campo magnético e elétrico nas três regiões.
“Z_2” — 2017/9/5 — 8:19 — page 323 — #343
em que h21 + h22 + h23 = k, satisfaz a equação de onda e sendo Πz = ψ, calcule as componentes dos
campos elétrico e magnético e as impedâncias em coordenadas cartesianas. Suponha primeiro que só
há modos T M . Repita o procedimento para os modos T E. Faço todo o procedimento em coordenadas
cilíndricas. Sugestão: Consulte o livro do Prof. Stratton [77].
11.5 Mostre que um caso especial da solução obtido no problema anterior reduz-se a função de onda bidi-
mensional e simétrica, Z ∞
1 r
ψ= F t − cosh α dα ,
2π 0 c
“Z_2” — 2017/9/5 — 8:19 — page 324 — #344
na qual representa a função expandida ao redor de uma fonte de linha uniforme de tensão F (t) ao
longo do eixo z. Sugestão: Consulte o livro do Prof. Bateman [8].
11.6 Seja um cilindro circular de raio a e comprimento infinito que está envolvido em um meio homogêneo
infinito. A constante de propagação no cilindro é k1 e no meio externo é k2 . a) Encontre as compo-
nentes dos campos elétrico e magnético em pontos no interior do cilindro r < a e em todos os pontos
no exterior do cilindro r > a. b) Encontre os modos naturais. Sugestão: Consulte o livro do Prof.
Stratton [77].
11.7 Calcule explicitamente as Eqs. (11.77), (11.78) e (11.79). Sugestão: Consulte o livro do Prof. Stratton
[77].
11.9 Considere um dipolo oscilante, conforme apresentado na Fig. 11.2, usando a técnica desenvolvida
11.10 Supondo um meio linear, homogêneo, isotrópico e sem perdas aonde se insere o dipolo da Fig. 11.2
e a projeção do mesmo no plano xz conforme mostra a Fig. 11.3, em que P é um ponto genérico no
espaço. Calcular o potencial escalar e o potencial vetor para este dipolo quando orientado ao longo do
eixo z. Encontre as componentes dos campos elétrico e magnético.
11.11 Ainda para o mesmo dipolo, determine o valor médio, no tempo, do vetor de Poynting para um ponto
de coordenadas esféricas (r, θ, φ), sendo R ≫ ℓ, em que ℓ é a distância entre as cargas. Determine o
valor médio, no tempo do fluxo do vetor de Poynting através de uma esfera de raio R, com centro no
centro do dipolo. Considerando agora ℓ = 1, determine em função da frequência f a potência radiada
pelo dipolo, e o valor eficaz da corrente i(t), no segmento que une as cargas do dipolo.
11.12 Estude o espalhamento de ondas eletromagnéticas por uma esfera, i.e., seja uma esfera de raio a
caracterizada por (ε1 , µ1 ) mergulhada em um meio homogêneo infinito caracterizado por (ε, µ). A
esfera está na origem do sistema de coordenadas polares esféricas sendo irradiada por um onda plana.
~ e N.
a) Valendo-se da simetria esférica do centro espalhador, encontre os vetores esféricos vetoriais M ~
“Z_2” — 2017/9/5 — 8:19 — page 325 — #345
Leitura Recomendada
Recomenda-se ao leitor um estudo paralelo dos excelentes livros,
– J. A. Stratton [77];
– H. Bateman [8];
– W. K. H. Panofsky and M. Phillips [64];
– P. M. Morse and H. Feshbach [60].
Nestes livros, o leitor encontrará o mais completo trabalho e deduções detalhadas dos aspectos físico e
matemático de ondas eletromagnéticas em coordenadas cilíndricas e esféricas. O magnífico livro do Prof.
Stratton é o mais completo que conheço, mas também podemos destacar os excelentes textos do prof.
Bateman e dos Profs. Panofsky e Phillips. Funções matemáticas especiais e aplicações encontramos no
fantástico texto dos Profs. Morse e Feshbach.
“Z_2” — 2017/9/5 — 8:19 — page 326 — #346
Capítulo 12
Interferência e difração
Neste capítulo iremos fazer um estudo qualitativo e quantitativo dos fenômenos de interferência, assim
como os de difração, aos quais estão estreitamente ligados e são característicos de uma teoria ondulatória.
Para analisar estes efeitos precisamos de uma representação do sinal luminoso. Portanto, como a luz é uma
onda eletromagnética, faremos a descrição destes fenômenos através dos campos elétrico ~E e magnético ~ B.
12.1 Interferência
A interferência é o fenômeno que superpomos ondas numa mesma região do espaço. Como resultado desta
superposição de campos, ocorrem variações espaciais na intensidade resultante. Estas variações de inten-
sidade são chamadas de franjas de interferência. Embora a interferência seja um fenômeno inerente ao
caráter ondulatório da luz, no dia a dia não é muito comum a observação de interferência. Por exemplo
quando iluminamos uma sala com diversas lâmpadas não observamos franjas de interferência. Isto acontece
porque as fontes de iluminação que utilizamos rotineiramente são incoerentes.
Fendas de Young As fendas de Young é um experimento clássico, feito pela primeira vez em 1801 por
Thomas Young,1 que demonstrou o caráter ondulatório da luz. Um efeito característico ondulatório, encon-
trado quando ondas se superpõem, é o efeito de interferência. Foi Young quem primeiro chamou a atenção
para este efeito dando o exemplo de dois conjuntos de ondas na água que chegam juntos a um canal estreito,
observando: “se entrarem no canal de tal forma que as elevações de um coincidem com as do outro, produ-
zirão como resultado elevações maiores: mas se as elevações de um coincidem com as depressões do outro,
preencherão exatamente estas depressões, e a superfície da água permanecerá em repouso. Afirmo agora
que resultados semelhantes ocorrem quando duas porções de luz se juntam, e é o que chamo a lei geral de
interferência da luz”.2
Para demonstrar este efeito, Young usou uma fonte puntiforme de luz para iluminar um anteparo opaco
onde havia dois pequenos orifícios muito próximos entre si, e observou o resultado em um outro anteparo,
obtendo a superposição feita por dois caminhos diferentes. Em lugar do resultado ser a soma das iluminações
dos dois orifícios, apareciam franjas brilhantes e escuras, i.e., as franjas de interferência.
Para analisar efeitos como este, precisamos de uma representação do sinal luminoso. Como a luz é uma
onda eletromagnética, descrita através dos campos elétrico ~E e magnético ~ B, e como no experimento de
1
Thomas Young (1773-1829), cientista britânico, formado em medicina, deu contribuições fundamentais à teoria da elasticidade
(módulo de Young), à anatomia (mecanismo da acomodação no olho) e à egiptologia (ajudou a decifrar a pedra de Roseta), além
de suas conhecidas contribuições em ótica.
2
Em 1801, Young apresentou um documento famoso para a Royal Society intitulado Sobre a teoria da luz e cores, em que
descreveu vários fenômenos de interferência, e em 1803 ele realizou seu famoso experimento da dupla fenda. Ver T. Young,
Philosophical Transactions of the Royal Society of London 92, 12-48 (1802); Idem, 94, 1-16 (1804).
326
“Z_2” — 2017/9/5 — 8:19 — page 327 — #347
Young temos dois caminhos diferentes, usaremos o princípio da superposição de duas ondas harmônicas,
descrita a seguir.
Superposição de Duas Ondas Harmônicas Quando duas ondas eletromagnéticas se superpõem em uma
mesma região do espaço, os campos elétrico e magnético resultantes são a soma vetorial dos campos in-
dividuais devido a cada uma das ondas isoladamente (devido ao princípio da superposição), da mesma
forma que os campos devido a presença de cargas elétricas se somam. Assim, a superposição de duas ondas
monocromáticas dadas por,
~E1 = ǫ̂1 E10 ei(k1 z−ω1 t+φ1 )
~E2 = ǫ̂2 E 0 ei(k2 z−ω2 t+φ2 ) ,
2
em que cada uma das ondas viajam na direção de z e estão linearmente polarizadas em ǫ̂1 e ǫ̂2 , tem frequên-
cias ω1 e ω2 e as fases são φ1 e φ2 respectivamente, será o campo elétrico total
~E = ~E1 + ~E2 . (12.1)
A irradiância da onda resultante é (vetor de Poynting médio)
c c ~ ~∗
I = hℜ[~E · ~E∗ ]i = E·E
4π n 8π o
c
= |~E1 |2 + |~E2 |2 + ~E1 · ~E∗2 + ~E∗1 · ~E2 . (12.2)
8π
Definimos as componentes das intensidades irradiadas tais que
I = I1 + I2 + I12 ,
em que
c
I1 = |~E1 |2
8π
c
I2 = |~E2 |2 (12.3)
8π
c
I12 = (~E1 · ~E∗2 + ~E∗1 · ~E2 ) ,
8π
com I12 sendo o termo de interferência.
• Se ω1 = ω2 , as ondas têm a mesma frequência, então k1 = k2 e
~E1 · ~E∗ = E 0 E 0 ei(k1 z−k2z+φ1 −φ2 )
2 1 2
~E∗ · ~E2 = E 0 E 0 ei(k2 z−k1z+φ2 −φ1 ) .
1 1 2
• Finalmente, se ~E01 ⊥ ~E02 , i.e., quando temos polarizações ortogonais, hIi = I1 + I2 , implica que o termo
de interferência → 0.
Podemos interpretar (12.5) como uma variação periódica de intensidade em função da diferença de fase
entre as ondas (franjas de interferência). O termo oscilatório que carrega esta dependência com a fase é
chamado de termo de interferência e varia de −1 (interferência destrutiva) a 1 (interferência construtiva).
Assim, temos a interferência destrutiva quando δ = (2n + 1)π, cos δ = −1, e a interferência construtiva
quando δ = 2nπ, cos δ = 1, com n = 0, ±1, ±2, · · · .
Podemos ainda, definir a visibilidade das franjas de interferência como:
em que I0 é a intensidade que resultaria se uma única fenda estivesse aberta, no caso do experimento de
Young.
Na prática para que tenhamos ondas coerentes (sincronismo) e de mesmo comprimento de onda preci-
samos utilizar luz da mesma fonte por isso geralmente é utilizado um interferômetro para dividir a frente de
onda e produzir franjas de interferência.
Lâminas Delgadas - Múltipla Interferência Suponhamos uma onda incidindo numa lâmina de faces
paralelas, de índice de refração n e espessura d, conforme mostrado na Fig. 12.1. Devido às múltiplas
reflexões, ao invés de duas ondas interferindo temos uma série infinita de ondas que mantêm entre si sempre
“Z_2” — 2017/9/5 — 8:19 — page 329 — #349
4π
∆= nd cos θ2 = 2mπ , (12.8)
λ
em que λ é o comprimento de onda incidente e m = 0, 1, 2, · · · . Assim, se a luz incidente contém dois
comprimentos de ondas diferentes superpostos, as posições dos máximos de interferência correspondentes
na luz transmitida serão diferentes.
Se as franjas brilhantes forem suficientemente estreitas, isto permite separar comprimentos de onda,
mesmo que sejam muito próximos. Os interferômetros, que são usados em espectroscopia para analisar a
estrutura fina ou hiperfina das linhas espectrais, afim de comparar comprimentos de onda entre si ou com o
padrão (medida absoluta de λ), se baseiam nesse princípio.
Usando notação complexa, concluímos que a contribuição de um raios transmitido difere da de outro
raio transmitido, consecutivo, por um fator r e(i ∆) . Logo, a soma das amplitudes complexas dessa série
infinita de ondas será:
1
1 + r e(i ∆) + (r e(i ∆) )2 + ... = , (12.9)
1 − r e(i ∆)
em que r é a reflectividade das interfaces, que é a porcentagem de reflexão, i.e., a fração da intensidade
incidente que se reflete. Para r próximo da unidade, as franjas de interferência na luz transmitida adquirem
o aspecto de riscas brilhantes e muito estreitas (máximos de transmissão) num fundo escuro.
A largura, em termos da diferença de fase ∆, das franjas de interferência é da ordem de t = 1 − r, a
transmissividade de uma das interfaces. Com efeito, em cada reflexão interna, uma fração r de intensidade
é refletida e uma fração t é transmitida. Assim, a intensidade da irradiância será:
|~E|2 |t|2
I∝ (12.10)
|1 − r e(i ∆) |2
e terá uma máxima intensidade toda vez que a diferença de fase for
4π
∆= nd cos θ2 = 2mπ , m = 0, ±1, ±2, · · · .
λ
Para incidência normal, temos θ2 = 0 ⇒ 2d = mλ. Portanto variando-se a espessura da lamina
delgada ou o ângulo de incidência teremos máximos e mínimos de interferência, assim como se variarmos
o comprimento de onda incidente. Este comportamento de máximos e mínimos pode ser utilizado para se
medir a espessura e o índice de refração de filmes finos.
Interferômetro Na prática, para que tenhamos ondas coerentes (sincronismo) e de mesmo comprimento
de onda precisamos utilizar luz da mesma fonte, por isso geralmente é utilizado um interferômetro para
dividir a frente de onda e produzir franjas de interferência. Se as franjas brilhantes forem suficientemente
estreitas, isto permite separar comprimentos de onda, mesmo que sejam muito próximos. É neste princípio
que se baseiam os interferômetros.
A principal qualidade de um interferômetro para análise é o seu poder separador, PS, definido como o
inverso da menor variação fracionária δλ/λ que ele permite determinar, i.e.,
λ
PS = , (12.11)
δλ
em que λ é o comprimento de onda. Discutiremos abaixo, dois dos mais importantes interferômetros co-
nhecidos:
“Z_2” — 2017/9/5 — 8:19 — page 330 — #350
Para observar as franjas, coletam-se os feixes transmitidos paralelos por meio de uma lente de fo-
cagem, que os focaliza num ponto P do anteparo de observação, i.e., alvo. A fonte luminosa é uma
fonte extensa, os S, que envia raios incidentes em diferentes direções.
Pela simetria do dispositivo em torno do eixo da lente, são observadas franjas de interferência de igual
inclinação de forma circular.
A lamina de faces paralelas neste caso é a lamina de ar de espessura d, separação entre as placas, de
forma que n = 1, e a condição que dá o máximo de interferência de ordem m é dado pela (12.8), i.e.,
4π
d cos θm = 2mπ (12.12)
λ
que dá o ângulo de abertura θm do cone correspondente a cada ordem m.
O poder separador do interferômetro de Fabry-Perot é dado por
λ mπ
PS = = (12.13)
δλ t
e atinge valores extremamente elevados, permitindo detectar a estrutura hiperfina de raias espectrais,
separando comprimentos de onda muito próximos.
M2 onde são refletidos de volta para M onde eles são respectivamente transmitidos e refletidos indo
interferir no ponto de observação O. Sejam
Y1 = a1 sen (ωt − α1 ) e Y2 = a2 sen (ωt − α2 )
as duas ondas que interferem em O e produzem como resultado uma onda que pode ser descrita como
Y = A sen (ωt − ∆) ,
em que
A = a1 + a2 + 2a1 a2 cos ∆
e
∆ = α1 + α2 .
Na pratica para se obter uma fonte extensa uma lente é inserida entre a fonte de luz e o espelho semi-
prateado. Sendo os espelhos perpendiculares entre si, o sistema é equivalente a uma luz proveniente
de uma fonte extensa incidindo sobre uma camada de ar, de espessura d = d1 − d2 , entre o espelho
M1 e a imagem virtual do espelho M2′ .
Os dois feixes interferem no plano de observação O, onde são focalizados pela lente L colocada
antes do observador. Se M2′ é a imagem especular de M2 na lâmina semiprateada, as condições de
interferência construtiva ou destrutiva são as mesmas que para a lâmina de faces paralelas formadas
por M1 e M2′ .
Como o raio que vai para M1 sofre reflexão interna na camada espelhada, e o raio que vai para
M2 é refletido externamente, existe portanto uma defasagem adicional de π. Para n = 1, temos
2d cos θm = mλ (m = 0, 1, 2, ...) para interferência destrutiva, em que d = |d2 − d1 | é a diferença
de caminho (anéis escuros).
O interferômetro de Michelson permite detectar diferenças extremamente pequenas de caminho ótico
entre dois braços perpendiculares do percurso dos raios. Uma diferença de caminho λ (∆m) re-
presenta um deslocamento de ∆m franjas. É possível estimar visualmente deslocamentos até de
1
∆m ∼ 20 de franja.
“Z_2” — 2017/9/5 — 8:19 — page 332 — #352
12.2 Difração
Vamos considerar um pequeno orifício circular em um anteparo opaco, e tendo um feixe paralelo de luz
monocromática incidente perpendicularmente ao anteparo. Segundo a lei de propagação retilínea da ótica
geométrica, o feixe transmitido através do orifício seria um cilindro circular, e formaria uma imagem bri-
lhante idêntica ao orifício num segundo anteparo de observação: fora desta região, teríamos a escuridão
completa, i.e., sombra geométrica.
Este fenômeno já havia sido observado por Grimaldi,6 num livro publicado postumamente em 1665,7
que, quando o orifício é muito pequeno e a distância R ao anteparo de observação é suficientemente grande,
verifica-se que a luz penetra na região de sombra geométrica, com o aparecimento de franjas claras e escuras
na vizinhança do limite da sombra.8
Estes desvios da propagação retilínea da luz foram chamados de difração,9 nome ligado à deflexão dos
raios luminosos. Nesta seção iremos descrever o fenômeno de difração, introduzindo as teorias escalar e
vetorial de difração, assim como os limites de Fraunhofer10 e Fresnel para a difração. A teoria de difração
inclui também o estudo do espalhamento, sendo que eles são basicamente o mesmo fenômeno com dois
nomes diferentes, dependendo da composição entre o comprimento de onda da radiação e o tamanho carac-
terístico do obstáculo. Quando o obstáculo é muito menor que o comprimento de onda da radiação, temos
o fenômeno do espalhamento, ao passo que, se o obstáculo for da mesma ordem de tamanho ou maior que
o comprimento de onda da radiação, temos a difração.
Os primeiros trabalhos, seguindo uma metodologia, relacionados a difração estão associados a nomes
como Huygens,11 Young, Fraunhofer e Fresnel. Mas, a primeira atenção sistemática para derivar a teoria de
Fresnel foi realizada por Kirchhoff em 1882.12
Como se vê, as frentes de onda inicialmente planas, ao passarem pelo orifício, perdem o caráter plano e
começam a se curvar, alterando a direção de propagação e atingindo regiões proibidas pela ótica geométrica.
Nota-se, que se o comprimento de onda da frente de onda incidente for da mesma ordem ou maior que o
orifício, então os efeitos de difração tornam-se perceptíveis, conforme já descrito por Grimaldi em 1665.
Teoria de Kirchhoff para Difração Para estabelecer uma teoria sobre difração, podemos iniciar fazendo
considerações simples e gerais a respeito do fenômeno. A primeira iniciativa a ser tomada é definir alguns
termos relevantes, ver Fig. 12.4. Na região 1 estão as fontes de radiação, que interagem com a superfície S1 ,
Figura 12.4 Geometrias para difração. A região 1 contém as fontes de radiação, enquanto a região 2
é a região aonde ocorre a difração, em que os campos satisfazem as condições de radiação.
que pode ser uma fenda de difração numa tela, e o resultado desta interação são campos de radiação que se
propagam na região 2. Em geral, a superfície S2 não participa do problema, podendo ser considerada muito
distante da superfície S1 . Assim, a idéia é relacionar os campos na região 2 com a superfície S1 ou com os
campos na região 1.
O método de Kirchhoff usa o teorema de Green para expressar um campo escalar (uma componente
de E ou ~
~ B) dentro do volume fechado V em termos de seus valores e sua derivada normal na condição
de fronteira S. Vamos considerar qualquer componente escalar dos campos ψ (~x, t) com uma dependência
temporal harmônica, e− i ωt . O campo escalar satisfaz a equação de onda de Helmholtz
dentro do volume V . Para resolver e equação de onde de Helmholtz introduzimos a função de Green,
G(~x,~x′ ) tal que
(∇2 + k2 )G(~x,~x′ ) = −δ(~x − ~x′ ) , (12.15)
em que ~x′ indica posições no volume da região 2. Para tratar as condições de contorno é necessário de-
senvolver algumas técnicas matemáticas novas, i.e., as identidades ou teoremas devidos à George Green
(1824). Estas identidades são obtidas a partir do teorema da divergência,
Z I
~ ~
∇·Ad r = 3 ~ · n̂ ds ,
A (12.16)
V S
~ · (Φ∇Ψ)
∇ ~ ~ · ∇Ψ
= ∇Φ ~ + Φ∇2 Ψ (12.17)
“Z_2” — 2017/9/5 — 8:19 — page 334 — #354
e
~ · n̂ = (n̂ · ∇)Ψ
~ ∂Ψ
∇Ψ = , (12.18)
∂n
em que ∂/∂n é a derivada na direção normal exterior na superfície S. Quando (12.17) e (12.18) são substi-
tuídas no teorema da divergência (12.16), obtemos a primeira identidade de Green,
Z I
~ · ∇Ψ
~ ∂Ψ
Φ∇2 Ψ + ∇Φ dV = Φ dS . (12.19)
V S ∂n
Quando se escreve (12.19) com Φ e Ψ trocados e se subtrai o resultado da identidade primitiva, os
~ · ∇Ψ
termos em ∇Φ ~ se cancelam e se tem a segunda identidade de Green, ou o teorema de Green,
Z I
∂Ψ ∂Φ
Φ∇2 Ψ − Ψ∇2 Φ dV = Φ −Ψ dS . (12.20)
V S ∂n ∂n
em que n̂′ = −n̂ aponta para dentro do volume V . A Eq. (12.22) é realizada se ~x está dentro do volume V ,
caso contrário o lado esquerdo da equation se anula.
A equação integral da difração de Kirchhoff é obtida de (12.22) utilizando a função de Green que
descreve uma onda saindo,
ei kR
G(~x,~x′ ) = , (12.23)
4πR
em que R = |~x − ~x′ | e utilizando
i kR i kR
~ ′ e e 1
∇ = ik 1− x̂ .
4πR 4πR i kR
Assim, "
I ~ #
1 ei kR ′ ~ ′ i R
ψ (~x) = − n̂ · ∇ ψ + i k 1 + ψ dS ′ . (12.24)
4π S R kR R
Agora devemos efetuar considerações a respeito da superfície S, que é formada pelas superfícies S1 e S2 .
Inicialmente, vamos subdividir a superfície S1 em duas outras regiões, S1,o e S1,t . Na superfície S1,o ficam
os orifícios por onde a radiação pode passar, e a superfície S1,t fica atrás da tela que contém os orifícios,
do lado da região 2, dentro do volume. Temos assim três superfícies, S1,o , S1,t e S2 . Para estas superfícies
fazemos as seguintes hipóteses, conhecidas como hipóteses de Kirchhoff:
1. Na superfície S1,o tudo se passa como se não houvesse o obstáculo, i.e., a presença da tela não altera
significativamente os campos produzidos na região 1 e que estão propagando na direção da região 2.
Assim, os valores de ψ e ∇~ ′ ψ · n̂′ em S1,o são os mesmos, com ou sem tela. Se o tamanho do orifício
for bem maior que o comprimento de onda da radiação, esta hipótese se justifica, ver descrição de
Huygens para a difração. Porém, se o orifício for da mesma ordem ou maior que o comprimento de
onda, ela perde a validade. Em qualquer caso, na região entre S1,o e S1,t esta hipótese também falha.
“Z_2” — 2017/9/5 — 8:19 — page 335 — #355
3. Para a superfície S2 , supõe-se que ela seja escolhida de forma que não contribua para a integral. Note
que, em princípio, não precisa ser assim. É importante lembrar que os campos na região 2 são campos
de radiação, os quais são descritos por
ei kR
ψ (~x) → f (θ, φ) . (12.25)
R
Assim,
1 ∂ψ ei kR 1 1
→ f (θ, φ) i k 1− = ik − . (12.26)
ψ ∂R R i kR R
Portanto, considerando as expressões (12.25) e (12.26), vemos que a dependência em R para os
termos da Eq. (12.24) é da ordem de 1/R2 . Como a área dS cresce com R2 , em princípio a superfície
S2 contribuiria para a integral. Porém, precisamos lembrar que a radiação tem uma velocidade finita
de propagação e considerando que a superfície S2 está tão afastada da fronteira (vai para o infinito),
a contribuição dos campos se anulam.
Estas são as condições de contorno das hipóteses de Kirchhoff. Porém, é importante fazer alguns comen-
tários das condições anteriores. Primeiro, elas são aproximações que são feitas com o objetivo de facilitar
o desenvolvimento e que têm a vantagem de fornecer resultados razoáveis. Entretanto, conforme vimos,
são condições que têm pontos frágeis. Note, a hipótese 2 se fosse totalmente válida, não haveria difração!
Quando se especificam, ao mesmo tempo, ψ e ∇ ~ ′ ψ · n̂′ numa dada superfície para a equação de Helmholtz,
isto torna o problema super determinado. Se, além disso, os valores de ψ e ∇ ~ ′ ψ · n̂′ forem nulos, o único
resultado possível é que ψ = 0 em toda a região 2, o que é internamente inconsistente. Em geral a Eq.
(12.24) não fornecerá estes valores em S1,t para ψ e ∇ ~ ′ ψ · n̂′ . Para resolver estas inconsistências matemá-
ticas presentes nas hipóteses de Kirchhoff temos que considerar as condições de contorno de Dirichlet e
de Neumann para a função de Green (12.22). No primeiro caso, temos uma função de Green que satisfaz
uma condição de Dirichlet, i.e., será nula nos pontos pertencentes a S1,t , mas sua derivada normal não será
necessariamente nula, de modo que GD (~x,~x′ ) = 0 na superfície S1,t . No segundo caso, com condições de
Neumann, a derivada normal de G é nula em S1,t , i.e., ∂G ∂n′ (~
N
x,~x′ ) = 0. O ponto mais importante é que,
mesmo com estas correções, os resultados obtidos são muito similares aos resultados conseguidos usando
apenas as condições de Kirchhoff. Além disso, qualquer um dos casos acima implica em que o ponto em
que queremos determinar os campos difratados esteja separado da região em que há os orifícios por uma
distância maior que alguns comprimentos de onda da radiação.
Finalmente, com o uso das hipóteses de Kirchhoff, a equação integral da difração de Kirchhoff será
Z " ~ #
1 ei kR ′ ~ ′ i R
ψ (~x) = − n̂ · ∇ ψ + i k 1 + ψ dS ′ , (12.27)
4π S1 R kR R
com a integração somente sobre a superfície S1 , da região 1 para 2 produzindo difração, conforme descrição
de Huygens.
Agora, se a onda emitida pelas fontes na região 1 se propagar como uma onda esférica, podemos escrever
para uma dada posição ~x′′ ,
′
′′ ei kR
ψ (~x ) = A , (12.28)
R′
“Z_2” — 2017/9/5 — 8:19 — page 336 — #356
Z " ′
! ~ ′
#
1 ei kR ′ ~ ′ ei kR i R ei kR
ψ (~x) = − n̂ · ∇ A +ik 1+ A dS ′ (12.29)
4π S1 R R′ kR R R′
e lembrando que
′
! ′
~ ′ ei kR ei kR 1
∇ A = i kA 1− x̂
R′ 4πR′ i kR′
Z ′
!
Ak ei kR ei kR ′ ~
R ~′
R
ψ (~x) = n̂ · + ′ dS ′ . (12.30)
4π i S1 R R′ R R
Assim, a onda é produzida na forma de uma onda esférica em ~x′ , propagando desta forma até um ponto ~x′′
que tem seu vetor origem fixado à superfície S1,o em que estão os orifícios da tela de difração, e, a partir
daí, a função de Green
ei kR
G(~x,~x′′ ) =
4πR
é responsável pela propagação, também em ondas esféricas, até o ponto de observação ~x. A expressão
(12.30) é conhecida como integral de difração de Fresnel-Kirchhoff. Ela pode ser reescrita como
Z ′
Ak ei kR ei kR
ψ (~x) = O(θ, θ ′) dS ′ . (12.31)
2π i S1 R R′
O fator
1
O(θ, θ ′) = (cos θ + cos θ ′ ) (12.32)
2
é chamado de fator de obliquidade, ou fator de inclinação, introduzido por Stokes em 1849, 13 em que θ é
~ e θ ′ é o ângulo entre n̂′ e R
o ângulo entre n̂′ e R ~ ′ . Note que quando θ = π + θ ′ temos uma onda que é
difratada no sentido oposto ao da onda incidente. Neste caso, o fator de obliquidade fornece O(θ, θ ′ ) = 0.
Assim, a amplitude da onda retrodifratada se anula. Se a onda incidente é uma onda plana, então a Eq.
(12.30) será
Z !
Ak ei kR ′ ~
R ~′
R
ψ (~x) = n̂ · + ′ dS ′ (12.33)
4π i S1 R R R
e, no caso particular de ser uma onda plana incidente com incidência normal, temos θ ′ = 0, assim
Z
Ak ei kR
ψ (~x) = (1 + cos θ) dS ′ . (12.34)
4π i S1 R
A integral de Fresnel-Kirchhoff dada na forma especial (12.34), ou na forma mais geral da Eq. (12.33),
servirá de base para o resto de nossa discussão sobre difração. A formulação de Fresnel-Kirchhoff incorpora
princípio Huygens através da integração ao longo da área do orifício.
13
G. G. Stokes, Trans. Camb. Phil. Soc., 9, 1 (1849).
“Z_2” — 2017/9/5 — 8:19 — page 337 — #357
Difração de Fraunhofer e Fresnel Para um problema geral de difração, a resolução das Eqs. (12.30)-
-(12.34) pode ser extremamente complicada matematicamente. Mas, podemos simplificar o tratamento atra-
vés de aproximações, como as aproximações de Fraunhofer e Fresnel.
Vamos considerar primeiro o caso limite conhecido como difração de Fraunhofer.14 Vamos considerar
uma fenda ou orifício plano, de seção reta qualquer, perpendicular a um dado eixo, escolhido aqui como o
eixo z. Queremos determinar a figura de difração que se forma num segundo plano também perpendicular
a esse eixo e situado a uma certa distância do plano que contêm a fenda.
O plano da fenda situa-se em z = 0, o plano de difração está em z = Z, e o ponto de observação P
tem coordenadas (x, y). O versor normal ao plano da fenda vale n̂′ = k̂. Vamos designar o tamanho da
fenda D, o comprimento de onda λ e ~x a distância da fenda ao ponto de observação P , ver Fig. 12.5. Para
|~x| = r ≫ D , kr ≫ 1 , D 2 /λ ≪ r .
Deve haver um compromisso entre o tamanho da fenda D, o comprimento da onda λ e a distância da fenda
ao plano da imagem da difração r. Neste caso r ≈ R, com R = |~x − ~x′ | e
ei kR ei kr − i ~k · ~x′
≃ e .
R r
Assumindo a observação próxima da direção ~k, Z/R ≈ 1 e i k ≫ 1/R. Então a aproximação de Fraunhofer
será Z
Ak ei kr ~
e− i k · ~x dS ′ ,
′
ψ (~x) = (12.35)
2π i Z fenda
em que A é a amplitude, como já havíamos definido. Devemos lembrar que o importante é a intensidade de
radiação no ponto de observação, I (P ), que é proporcional a |ψ|2 .
Como exemplo, podemos considerar a difração de Fraunhofer para uma fenda circular de raio a. Vamos
tomar ~k no plano (y, z), fazendo um ângulo θ com o eixo z,
~k = k(ŷ sen θ + ẑ cos θ)
14
J. Fraunhofer, Denkschriften der Königlichen Akademie der Wissenschaften zu München (Memoirs of the Royal Academy of
Science in Munich), 8, 3-76 (1821), Idem, Annalen der Physik, 74(8), 337-378 (1823).
“Z_2” — 2017/9/5 — 8:19 — page 338 — #358
e usamos
~x′ = r ′ (x̂ cos φ + ŷ sen φ) .
Então, a intensidade I (P ) = I (θ) será
Z a Z 2π 2
′ sen θ sen φ
I (θ) ∝ |ψ|2 = C r ′ dr ′ e− i kr dφ , (12.36)
0 0
Logo, a fórmula da intensidade para a difração de Fraunhofer para uma fenda circular será
2
2 2 J1 (ka sen θ)
I (θ) = C (2πa ) .
ka sen θ
Esta relação para a difração de campo distante de uma onda plana incidente em uma abertura circular é
muitas vezes referida como disco de Airy.15
Vamos considerar agora um segundo caso limite, conhecido como difração de Fresnel.16 Aqui na di-
fração de Fresnel, o que ocorre é que a condição de Fraunhofer não é seguida, isto porque o tamanho da
fenda não é tão pequeno quando comparado com o comprimento de onda da radiação (pode ser da mesma
ordem ou até mesmo maior) ou porque a distância entre fenda e plano de difração não é tão grande quando
comparada com o comprimento de onda. Assim, tem-se que D 2 /λr pode ser da mesma ordem ou maior
que 1. Então, vamos apresentar a difração de Fresnel considerando o caso simples de uma fenda de difração
com uma dimensão bem definida (x′ , y ′ ) a uma distância Z ≫ D. Logo,
(x − x′ )2 (y − y ′ )2
R = ((x − x′ )2 + (y − y ′ )2 + Z 2 )1/2 ≈ Z + + + ··· ,
2Z 2Z
esta equação é a aproximação de Fresnel. Assim, a onda difratada se expressa por
Z
(x−x′ )2 (y−y ′ )2
1 i k Z+ 2Z + 2Z
ψ (~r) ≈ e dx′ dy ′
i λZ S
Z
ei kZ ik
e 2Z [(x−x ) +(y−y ) ] dx′ dy ′
′ 2 ′ 2
≈
i λZ S
Z Z
ei kZ ′ i k (x−x′ )2 ′ ′ i k (y−y′ )2 ′
≈ e 2Z dx e 2Z dy .
i λZ x y
Para simplificação, vamos considerar somente o plano xz. Assim a equação anterior, unidimensional,
será, Z d2
ik ′ 2
ψ (x) = A e 2Z (x−x ) dx′ ,
d1
em que d1 e d2 são os limites para o tamanho da fenda e A é o fator complexo em que todas as constantes
foram incluídas. Fazendo a definição de uma nova variável ϕ, tal que
r
k ′ 2 π 2 2
(x − x ) = ϕ ou ϕ=+ (x′ − x) ,
2Z 2 λZ
15
G. B. Airy, Trans. Camb. Phil. Soc., 5, 283 (1835).
16
A. Fresnel (1819), Memoir on the Diffraction of Light. The Wave Theory of Light - Memoirs by Huygens, Young and Fresnel.
American Book Company. pp. 79-145 (1900).
“Z_2” — 2017/9/5 — 8:19 — page 339 — #359
temos r
′ λZ
dx = dϕ .
2
Nessa nova variável, os limites para a fenda estão em
r r
2 2
ϕ1 = (d1 − x) e ϕ2 = (d2 − x) .
λZ λZ
As integrais que aparecem acima estão relacionadas com as integrais de Fresnel, C (ϕ0 ) e S (ϕ), que são duas
funções transcendentais, definidas como
Z ϕ0 π Z ϕ0 π
2
C (ϕ0 ) = cos ϕ dϕ , S (ϕ0 ) = sen ϕ2 dϕ . (12.39)
0 2 0 2
A simultânea equação paramétrica de S (ϕ) e C (ϕ) é conhecida como a espiral de Cornu,17 também conhe-
cida como clotóide ou como espiral de Euler. A espiral de Cornu é a curva gerada pela equação paramétrica
de S (ϕ) por oposição a C (ϕ), ver Fig. 12.6. A espiral de Cornu foi criada como um nomograma para com-
Figura 12.6 Gráfico de S(ϕ) em função de C(ϕ) conhecido como espiral de Cornu ou clotóide.
Princípio de Babinet Vamos considerar novamente as Eqs. (12.30)-(12.34) quando aplicadas a um pro-
blema qualquer. Suponha que um dado ponto da região de difração, região 2, tenha uma certa intensidade
ψ1 (P ) quando uma certa disposição de obstáculos e orifícios é utilizada. Considere, neste momento, que
aonde havia orifícios agora temos obstáculos, e vice-versa, uma espécie de negativo do problema. Neste
caso, a intensidade em P vale ψ2 (P ). É claro que, se somarmos as duas intensidades, teremos a intensidade
total ψt (P ) que significa o valor total da intensidade em P quando não há obstáculos. Este é o princípio de
Babinet19 para orifícios ou fendas complementares. Algumas implicações interessantes são:
1. Considere um ponto P tal que ψ1 (P ) = 0, i.e., a intensidade é nula para um dado arranjo de obstáculos
e fendas. Se trocarmos obstáculos e fendas, a intensidade em P agora será ψ2 (P ) = ψt (P ), que é a
intensidade total. Assim, as áreas claras da figura de difração tornam-se escuras e vice-versa.
2. Outro caso interessante é o que ocorre quando a intensidade em algum ponto qualquer é nula quando
não há obstáculos, i.e., temos ψt (P ) = 0. Assim, quando algum obstáculo for colocado, a intensidade
no ponto passará a ser ψ1 (P ) por causa da difração. Se trocarmos os papéis obstáculos-fendas, a nova
intensidade será ψ2 (P ) e, devido ao princípio de Babinet , devemos ter ψ1 (P ) + ψ2 (P ) = ψt (P ) = 0,
i.e., ψ1 (P ) = −ψ2 (P ). Como a grandeza relevante é |ψ|2 , vemos que as intensidades nos dois casos
são iguais, para as duas configurações. O sinal negativo surge apenas para representar uma inversão
de fase difratada num caso em relação ao outro.
Aspecto Vetorial da Integral de Kirchhoff Podemos tentar uma aproximação semelhante para integral
de Kirchhoff visando considerar os campos vetoriais, na forma de uma equação vetorial, e não escalar. Neste
sentido, o equivalente à Eq. (12.22) para o campo elétrico ~E(~x) é
I h i
~E(~x) = ~E n̂′ · ∇
~ ′ G − G n̂′ · ∇~ ′ ~E dS ′ (12.40)
S
no ponto ~x dentro do volume V fechado na superfície S. Aqui, o versor normal n̂′ também está direcionado
para dentro do volume V . Devido a escolha de certos teoremas do cálculo vetorial que aplicamos a funções
bem conhecidas, a função G é singular em ~x′ = ~x. Vamos agora imaginar que a superfície S consiste de
uma superfície externa S ′ e uma superfície infinitamente pequena interna S ′′ em torno do ponto singular
~x′ = ~x. Então, pelo teorema de Green, o lado esquerdo da Eq. (12.40) se anula. Naturalmente, resolvendo
a integral proxima da superfície interna S ′′ , no limite quando cai a zero ao redor do ponto singular ~x′ = ~x,
nos dá −~E(~x). Então (12.40) é restaurada em prática, mas a exclusão do ponto ~x′ = ~x do volume V
necessitamos assegurar um bom comportamento matemático. Assim, com um bom entendimento a respeito
da superfície S, podemos reescrever (12.40) na forma,
I h i
0= 2~E n̂′ · ∇ ~ ′ G~E dS ′ .
~ ′ G − n̂′ · ∇ (12.41)
S
O teorema de divergência será usado para converter o segundo termo em uma integral de volume. Então,
I Z
~ ′ ~′ 2
0= 2E n̂ · ∇ G dS − ′
∇′ G~E dV ′ . (12.42)
S V
~
Usando a propriedade vetorial, válida para qualquer vetor A,
~ = ∇(
∇2 A ~ ∇~ · A)
~ −∇
~ × (∇
~ × A)
~
19
Jacques Babinet (1794-1872), físico, matemático e astrônomo francês.
“Z_2” — 2017/9/5 — 8:19 — page 341 — #361
em que φ e A~ são funções escalar e vetorial bem comportadas, e n̂ é a normal saindo do volume V pela
superfície S, podemos expressar a integral de volume novamente como uma integral de superfície. Então,
I h i
0= ~ ′ G − n̂′ ∇
2~E n̂′ · ∇ ~ ′ · G~E + n̂′ × ∇ ~ ′ × G~E dS ′ .
S
acharemos
I h i
0= i k n̂′ × ~
B G + 2~E n̂′ · ∇
~ ′ G − n̂′ ~E · ∇
~ ′ G + n̂′ × ∇~ ′ G × ~E dS ′ .
S
Expandindo o produto vetorial triplo e reagrupando os termos dos campos, o resultado final será
I h i
~E(~x) = i k n̂′ × ~B G + n̂′ × ~E × ∇ ~ ′ G + n̂′ · ~E ∇~ ′ G dS ′ , (12.43)
S
em que agora o volume V dentro pela superfície de contorno S contêm o ponto singular ~x′ = ~x. Uma
expressão análoga para ~B pode ser obtida diretamente de (12.43) através das substituições, ~E → ~Be
~
B → −~E, dando
I h i
~
B(~x) = − i k n̂′ × ~E G + n̂′ × ~ B ×∇ ~ ′ G + n̂′ · ~B ∇~ ′ G dS ′ . (12.44)
S
Estas expressões correspondem às integrais de difração vetoriais de Kirchhoff, e elas podem ser usadas da
mesma forma que a expressão escalar obtida anteriormente. É interessante notar que os resultados obtidos
pela teoria vetorial não são substancialmente melhores que os extraídos por meio da teoria escalar, sendo
que esta última é mais simples matematicamente.
A integral (12.43) pode ser escrita como a soma de duas integrais, uma sobre S1 e a outra sobre S2 . Na
superfície S2 a função de Green, para valores suficientemente grandes de r0 , é dada por
′
ei kr i kn̂′ · ~x
G→ e
4πr ′
e seu gradiente dado por
~ ′ G → − i kn̂′ G .
∇
Então, a contribuição de S2 à integral em (12.43) é
I I h i
= ik n̂′ × ~
B − (n̂′ × ~E) × n̂′ − n̂′ (n̂′ · ~E) G dS ′
S2 S2
ou I I h i
= ik (n̂′ × ~
B) − ~E G dS ′ .
S2 S2
“Z_2” — 2017/9/5 — 8:19 — page 342 — #362
Os campos na região 2 são campos difratados ou espalhados, e assim obedecem às condições de ondas
em expansão nas vizinhanças de S2 . Em especial, os campos ~E e ~
B são mutuamente perpendiculares e
transversais ao raio vetor. Portanto, sobre S2 ,
~E = n̂′ × ~ 1
B+O .
r02
Mostrando que, I
1
→O
S2 r0
e que a contribuição para a integral sobre S2 se anula quando r0 → ∞. Portanto, a integral (12.43) será
I h i
~E(~x) = i k n̂′ × ~
B G + n̂′ × ~E × ∇ ~ ′ G + n̂′ · ~E ∇~ ′ G dS ′ , (12.45)
S1
1 ei kr − i ~k · ~x′
G(~x,~x′ ) → e
4π r
i kr
~Ee (~x) → e ~F(~k, ~k0 ) ,
r
em que ~k é o vetor de onda na direção do ponto de observação P , ~k0 é o vetor de onda incidente e ~F(~k, ~k0 )
á a amplitude vetorial dos campos espalhados, não normalizada. Neste limite, ∇ ~ ′ G = − i ~kG. Então, a Eq.
(12.45) poderá ser escrita na forma dos campos espalhados ~F(~k, ~k0 ):
I h i
~F(~k, ~k0 ) = i ~
e− i k · ~x k(n̂′ × ~
′
Be ) + ~k × (n̂′ × ~Ee ) − ~k(n̂′ · ~Ee ) dS ′ . (12.46)
4π S1
Nota-se que ~F(~k, ~k0 ) depende explicitamente da direção de ~k, e a dependência em ~k0 está implícita nos
campos espalhados ~Ee e ~Be . Desde que ~k · ~F = 0, é verdadeiro que em (12.46) a componente paralela a
~k da primeira integral cancela a terceira integral. Assim, é conveniente desmembrar o integrando da Eq.
(12.46) em componentes paralela e perpendicular a ~k, e o caráter transversal de ~F será:
I " #
1 ~ ~k × (n̂′ × ~
B )
~F(~k, ~k0 ) = ~k × e− i k · ~
x ′ e
− n̂ × ~Ee dS ′ .
′
(12.47)
4π i S1 k
Ainda podemos obter a amplitude da radiação espalhada em função do vetor de onda ~k e da polarização ǫ̂
como
I h i
i ~
e− i k · ~x kǫ̂∗ · (n̂′ × ~
′
∗ ~ ~ ~
ǫ̂ · F(k, k0 ) = Be ) + ǫ̂∗ · (~k × (n̂′ × ~Ee )) dS ′ . (12.48)
4π S1
“Z_2” — 2017/9/5 — 8:19 — page 343 — #363
A relação (12.48) pode ser usada para obter uma expressão bastante relevante no eletromagnetismo, assim
como na mecânica quântica, conhecida como teorema óptico. Para isso vamos lembrar que os campos totais
em qualquer ponto do espaço são dados pela soma dos campos incidentes com os campos espalhados, i.e.,
~E = ~Ei + ~Ee , ~
B=~
Bi + ~
Be .
Relembrando que o fluxo da energia transportado pela radiação por unidade de área e tempo numa dada
direção, o que equivale ao fluxo de potência por unidade de área, é dado pelo vetor de Poynting multiplicado
pelo versor daquela direção. Assim, a potência espalhada é calculada normalmente considerando-se a forma
assintótica do vetor de Poynting para os campos espalhados, e fazendo a integração do vetor de Poynting
sobre uma superfície grande o suficiente para que os campos sejam campos de radiação. Assim,
I
c
Pesp = ℜ[~Ee × ~B∗e ] · n̂′ dS ′ . (12.49)
8π S1
Em geral, o objeto espalhador pode absorver parte da energia que recebe da onda incidente, devolvendo
na forma de radiação espalhada uma fração desta energia e não toda. Por exemplo, a radiação incidente pode
gerar correntes elétricas que farão com que parte da energia seja dissipada na forma de calor. A potência
total que atravessa a superfície S1 é obtida por
I h i
c
P = ℜ ~Ee × ~
B∗i + ~E∗i × ~Be · n̂′ dS ′ . (12.50)
8π S1
~ i = 1 ~k0 × ~Ei ,
B
k
a potência total assume a forma
( I " # )
c ~k × (n̂′ × ~Ee )
− i ~k0 · ~x′
P = ℜ E0 ∗
e ǫ̂0 · (n̂ × ~
∗ ′ ∗
Be ) + ǫ̂0 · ′
dS .
8π S1 k
A comparação entre esta última relação e a expressão dada em (12.48) para a amplitude espalhada mostra
que a potência total está relacionada à amplitude dos campos espalhados para a frente (~k = ~k0 , ǫ̂ = ǫ̂0 )
segundo a expressão
c h ∗ ∗ ~ ~ ~ i
P = ℑ E0 ǫ̂0 · F(k = k0 ) . (12.51)
2k
Este é o resultado básico do teorema óptico, e a seção total de espalhamento σt , em óptica é denominada
seção de absorção, é definida como a razão entre a potência total e a potência incidente por unidade de área,
c|E0 |2 /8π. Agora, definimos a amplitude normalizada por intermédio de
~ ~ ~
~f (~k, ~k0 ) = F(k, k0 ) . (12.52)
E0
Assim, em termos de σt e da amplitude normalizada ~f , temos o teorema óptico como segue, a seção total
de espalhamento da radiação está correlacionada à parte imaginária da amplitude da radiação difundida
para frente, i.e.,
4π
σt = ℑ[ǫ̂∗0 ·~f (~k = ~k0 )] . (12.53)
k
“Z_2” — 2017/9/5 — 8:19 — page 344 — #364
Este teorema é consequência de considerações muito gerais sobre a conservação de energia e do fluxo de
potência, e tem a sua contrapartida no espalhamento quântico de partículas, mediante a conservação de
probabilidades.
A notação em (12.53) corresponde às convenções padrões da mecânica quântica. Para as partículas
que têm spin, a amplitude relevante no espalhamento para frente é aquela em que nenhuma das partículas
modifica seu estado de spin. No caso da radiação eletromagnética, fótons, isto está indicado pela presença
da amplitude ǫ̂∗0 ·~f para a radiação espalhada, o que confere a esta, a mesma polarização que tinha a radiação
inicial.
Problemas
12.1 Demonstre explicitamente a relação (12.9) e (12.10), para interferência em lâminas delgadas.
12.2 Determine a distribuição da intensidade da luz na vizinhança de um ponto em que o raio é tangente à
cáustica.20 Sugestão: Consulte o livro dos Profs. Landau e Lifshitz [49].
12.4 Discuta difração de Fraunhofer por uma fenda. Sugestão: Consulte o livro do Prof. Kleber Machado
[54].
12.5 Discuta difração de Fraunhofer por fenda dupla e por múltiplas fendas. Sugestão: Consulte o livro do
Prof. Kleber Machado [54].
12.6 Desenvolva a difração de Fraunhofer para fenda retangular e para a fenda circular. Sugestão: Consulte
o livro do Prof. Kleber Machado [54].
12.7 Na difração de Fresnel, como a intensidade é proporcional ao quadrado da amplitude, mostre que a
intensidade normalizada poderá ser escrita da seguinte forma:
I0 n o
I (x) = [C (ϕ2 ) − C (ϕ1 )]2 + [S (ϕ2 ) − S (ϕ1 )]2 .
2
Sugestão: Consulte o livro dos Profs. Kleber Machado [54] e Marion [36].
12.8 Estude o espalhamento de Fresnel para um anteparo dielétrico opaco. Sugestão: Consulte o livro do
Prof. Bassalo [7].
12.10 Uma onda plana não polarizado de frequência ω = ck é espalhada com perdas ligeiramente uniforme
por uma esfera dielétrica isotrópica (constante dielétrica ε e condutividade σ) de raio R muito menor
do que um comprimento de onda. Considere a distância de penetração δ muito maior que o raio da
esfera R.
20
Cáustica - superfície dos raios de luz refletidos ou refratados por uma superfície curva ao objeto, ou a projeção desta superfície
de raios em outra superfície.
“Z_2” — 2017/9/5 — 8:19 — page 345 — #365
(Rσ/c)
σabs = 48π 2 R2 .
(ε + 2)2 + (4πσ/ω)2
c) Do item (a) escreva a amplitude de espalhamento e use o teorema óptico para calcular a seção de
choque total. Compare este resultado com a soma da seção de choque de espalhamento e de absorção
dos itens (a) e (b). Comente este resultado. Sugestão: Consulte e compare com o livro dos Profs.
Landau e Lifshitz [51].
Leitura Recomendada
Recomenda-se a leitura detalhada contidas nos seguintes livros,
– J. D. Jackson [42];
– M. A. Heald and J. B. Marion [36];
– M. Born and E. Wolf [12].
Nestes livros, o leitor encontrará excelentes discussões e deduções detalhadas para o estudo de interferência
e difração.
O valioso texto dos Profs. Born e Wolf traz uma excelente sequência de trabalhos, abordando em todos
os aspectos os fenômenos de interferência, os modelos de interferômetros e as difrações de Fraunhofer e
Fresnel. Este é o texto mais completo de óptica que conheço. Porém, para os assuntos tratados neste capítulo,
recomendo também o texto dos Profs. Heald e Marion.
Para a teoria escalar e vetorial de difração, além do estudo de espalhamento, recomendo fortemente o
clássico texto de eletrodinâmica do Prof. Jackson.
“Z_2” — 2017/9/5 — 8:19 — page 346 — #366
Capítulo 13
Guias de Onda e Cavidades Ressonantes
adequada para nos fornecer campo elétrico zero dentro do condutor perfeito. De forma similar, para campos
magnéticos que variam no tempo, as cargas superficiais se deslocam em reposta à componente tangencial
do campo magnético de forma que produz uma densidade superficial de corrente K: ~
~ 4π ~
n̂ × H = K (13.2)
c
e garante que o campo magnético seja zero dentro do condutor perfeito. As outras duas condições de con-
torno são: sobre as componentes normal de ~
B e tangencial de ~E:
n̂ · ~
B−~ Bc = 0
(13.3)
n̂ × ~E − ~Ec = 0 ,
em que o subíndice (c ) refere-se ao condutor. Devido ao fato de que dentro do condutor os campos são
1
As expressões incluindo os fatores dentro dos colchetes, estão em unidades gaussianas, i.e., sistema gaussiano de unidades para
o eletromagnetismo (o sistema CGS de Gauss), omitindo o colchete temos as unidades MKSA, ou sistema internacional SI.
346
“Z_2” — 2017/9/5 — 8:19 — page 347 — #367
n̂ · ~B = 0
(13.4)
n̂ × ~E = 0 ,
~ ≈ −n̂ ∂
∇ (13.7)
∂ξ
desprezando as outras derivadas quando operamos sobre os campos dentro do condutor. Nesta aproximação
a Eq. (13.6) fica
~
~Ec ≈ − c n̂ × ∂ Hc
4πσ ∂ξ
(13.8)
~
~ c ≈ i c n̂ × ∂ Ec .
H
µc ω ∂ξ
“Z_2” — 2017/9/5 — 8:19 — page 348 — #368
H ~ k e− ξδ e iδξ ,
~ c=H (13.11)
em que H ~ k é o campo magnético paralelo fora da superfície. Da Eq. (13.8), vemos que o campo elétrico é,
aproximadamente, r
~Ec ≈ µc ω (1 − i) n̂ × H ~ k e− δξ e iδξ . (13.12)
8πσ
Estas formas para H~ e ~E no interior do condutor mostram as propriedades discutidas na seção anterior: (a)
um rápido decaimento exponencial, (b) uma diferença de fase, (c) um campo magnético muito maior que o
campo elétrico. Elas mostram que, para um bom condutor, os campos no condutor são paralelos à superfície
e se propagam normalmente a ela, com módulos que dependem somente da componente tangencial H ~ k do
campo magnético que existe nas vizinhanças externas da superfície. 2
Das condições de contorno sobre a parte tangencial de ~E, ver Eq. (13.3), encontramos que nas vizi-
nhanças externas da superfície, existe uma pequena componente tangencial de campo elétrico dada pela Eq.
(13.12), avaliada em ξ = 0: r
~Ec ≈ µc ω (1 − i) n̂ × H ~k . (13.13)
8πσ
Nesta aproximação, existe também uma pequena componente normal de ~ B no exterior imediato da superfí-
cie. Ela pode ser obtida a partir da lei de Faraday e dá um ~B⊥ da mesma ordem de grandeza de ~Ek .
A existência de uma pequena componente tangencial de ~E no exterior da superfície, além das compo-
nentes normal ~E e tangencial H,
~ significa que existe um fluxo de potência para dentro do condutor. O valor
médio temporal da potência absorvida por unidade de área é
dPperdida c h i 1 µ ωδ 2
~ ~ ∗ c ~k .
= − ℜ n̂ · (E × H ) = H (13.14)
da 8π 4π 4
Este resultado pode ser interpretado como uma perda ôhmica no interior do condutor. Em concordância com
a lei de Ohm, existe uma densidade de corrente ~J perto da superfície do condutor
r ξ(1−i)
~J = σ~Ec = µc ωσ (1 − i) n̂ × H ~ k e− δ . (13.15)
8π
O valor médio temporal da energia dissipada por unidade de tempo e unidade de volume, em perdas ôhmi-
cas, é
1~ ~ ∗ 1 ~ 2
J·E = |J| ,
2 2σ
2
Em situações em que a aproximação de mais baixa ordem é essencialmente eletrostática, o tratamento aqui apresentado não é
aplicado. Assim, diferentes aproximações devem ser usadas. Para isso, ver T. H. Boyer, Physical Review A9, 68 (1974).
“Z_2” — 2017/9/5 — 8:19 — page 349 — #369
então a energia total dissipada por unidade de tempo, dentro do volume sob um elemento de área ∆A na
superfície é
Z ∞ Z
1 ~ ~ ∗ µc ω ~ 2 ∞ − 2ξ µc ωδ ~ 2
∆A dξ J · J = ∆A Hk e δ dξ = ∆A Hk . (13.16)
2σ 0 8π 0 16π
Esta é a mesma taxa de perda de energia que é dada pelo vetor de Poynting na Eq. (13.14).
A densidade de corrente ~J está confinada numa camada tão fina sob a superfície do condutor, que aquela
~ ef
é equivalente a uma densidade superficial efetiva K
Z ∞ h i
~ ef =
K ~Jdξ = c n̂ × H ~k. (13.17)
0 4π
Uma comparação com (13.2) mostra que um bom condutor se comporta efetivamente como um condutor
perfeito, com a corrente superficial ideal substituída por uma corrente superficial equivalente, a qual está
distribuída numa camada muito fina, mas finita, sob a superfície. A potência perdida pode ser escrita em
termos da densidade de corrente superficial equivalente
dPperdida 1 ~ 2
= Kef . (13.18)
da 2σδ
Isto mostra que σδ1
tem o papel de uma resistência superficial do condutor. A Eq. (13.18), com K ~ ef dada
por (13.17), ou (13.14), nos permite calcular aproximadamente as perdas resistivas nas cavidades, linhas de
transmissão e guias de onda, uma vez que resolvemos os campos no problema idealizado de condutividade
infinita.
Combinações lineares apropriadas podem ser feitas para obter ondas viajantes ou ondas estacionárias na
direção z. O vetor número de onda k é, até o presente momento, um parâmetro desconhecido, que pode ser
real ou complexo. Com a dependência segundo z assumida para os campos, a equação de onda (13.20) se
reduz à forma bidimensional
( )
ω 2 ~
E
∇2t + µε 2 − k2 ~ =0, (13.22)
c B
∂2
∇2t = ∇2 − . (13.23)
∂z 2
em que
~Ez = ~E · ẑ = ẑEz
~Et = ẑ × ~E × ẑ .
Definições similares se tem para o campo magnético ~B. As equações de Maxwell (13.19a)-(13.19b) podem
ser escritas em termos das componentes paralela e transversal dos campos na forma
∂~Et ω
+ i ẑ × ~ Bt = ∇~ t Ez
∂z c
~ t × ~Et ω
ẑ · ∇ = i Bz (13.25)
c
∂~
Bt ω
− i µε ẑ × ~Et = ∇ ~ t Bz
∂z c
~t×~ ω
ẑ · ∇ Bt = − i µε Ez (13.26)
c
~ t · ~Et = − ∂E z
∇
∂z
~ t·B ∂B
~t = − z .
∇ (13.27)
∂z
É evidente, das primeiras equações em (13.25) e (13.26), que se as componentes Ez e Bz são conhecidas,
então as componentes transversais de ~E e ~B estão determinadas, assumindo que a dependência em z é dada
pela Eq. (13.21).
Consideremos agora uma solução especial, chamada de onda eletromagnética transversal (EM T ). Esta
solução tem unicamente componentes transversais à direção de propagação. Das segundas equações em
(13.25) e (13.26) vemos que se Ez = Bz = 0, então a componente ~EEM T ≡ ~Et satisfaz
~ t × ~EEM T = 0 ,
∇ ~ t · ~EEM T = 0 .
∇ (13.28)
Isto significa que ~EEM T é solução de um problema eletrostático em duas dimensões. Assim, temos três
consequências importantes:
“Z_2” — 2017/9/5 — 8:19 — page 351 — #371
1. O número de onda axial está dado pelo valor correspondente a um meio infinito
1 √
k = k0 = ω µε (13.29)
c
3. O modo EM T não pode existir dentro de um único condutor cilíndrico, oco, de condutividade infi-
nita. A superfície é uma equipotencial; o campo elétrico, então, anula-se no seu interior. É necessário
ter duas ou mais superfícies para dar suporte ao modo EM T . O cabo coaxial é uma estrutura para a
qual esse modo de propagação é o dominante.
Em cilindros ocos (ou em linhas de transmissão de alta frequência), existem dois tipos de configura-
ções de campos. A sua existência pode ser observada, considerando a equação de onda (13.22) satisfeita
pelas componentes longitudinais, Ez e Bz , e as condições de contorno que devem ser obedecidas. Para um
condutor perfeito, estas condições são
n̂ × ~E = 0 , n̂ · ~
B=0, (13.31)
Ez |S = 0 . (13.32)
Da componente paralela a n̂ na primeira equação em (13.26), pode ser inferido que a correspondente con-
dição de contorno sobre Bz é
∂Bz
=0, (13.33)
∂n S
em que ∂/∂n é a derivada normal num ponto da superfície. A equação bidimensional (13.22) para Ez e
Bz , juntamente com as condições de contorno (13.32) e (13.33), definem um problema de autovalores.
Para uma dada frequência ω, somente alguns valores do vetor número de onda k podem existir, situação
típica num guia de onda, ou, para um dado k, somente alguns valores de ω podem existir, situação típica
numa cavidade ressonante. Devido ao fato de que as condições de contorno sobre Ez e Bz são diferentes,
os autovalores serão, em geral, diferentes. Assim, os campos se dividem naturalmente em duas categorias
distintas:
Ondas transversais elétricas (T E) – Definidas por Ez = 0 em todos os pontos, com a condição de con-
∂Bz
torno = 0.
∂n S
As ondas T M e T E, junto com as EM T – se existirem – constituem um conjunto completo de campos
para descrever uma perturbação eletromagnética qualquer dentro de um guia de ondas ou uma cavidade
ressonante.
“Z_2” — 2017/9/5 — 8:19 — page 352 — #372
~ t = ± 1 ẑ × ~Et ,
H (13.34)
Z
sendo Z conhecida como impedância de onda, e é dada por
r
ck k µ
= (TM )
εω k0 ε
Z= r (13.35)
µω k0 µ
= (TE ) ,
ck k ε
em que k0 está dado por (13.29). O sinal positivo ou negativo, na equação (13.34), vem de ei kz ou e− i kz .
Os campos transversais são determinados pelos campos longitudinais, segundo
~Et = ± i k ∇
~ tψ (TM )
γ2
(13.36)
~ t = ±i k ∇
H ~ tψ (TE ) ,
γ2
em que ψ e± i kz é Ez (Hz ) para o modo T M (T E), e γ 2 está definido mais abaixo. A função escalar ψ
satisfaz a equação de onda bidimensional (13.22),
∇2t + γ 2 ψ = 0 , (13.37)
na qual
ω2
γ 2 = µε − k2 (13.38)
c2
com as condições de contorno
ψ|S = 0 (TM )
(13.39)
∂ψ
= 0 (TE ) .
∂n S
A primeira equação de (13.39) usa a condição de Dirichlet, enquanto a segunda equação usa a condição de
Neumann.
A Eq. (13.37), juntamente com as condições de contorno (13.39), definem um problema de autovalores.
Devido ao fato da função ψ ter um comportamento oscilante, para satisfazer a condição de contorno (13.39)
sobre as paredes opostas de um guia de onda, a constante γ 2 deve ser positiva. Haverá um espectro de
autovalores {γλ2 } e as soluções correspondentes ψλ , λ = 1, 2, 3, · · · , que formam um conjunto ortogonal.
Estas soluções diferentes são chamadas de modos do guia de onda. Para uma frequência dada ω, o número
de onda é determinado para cada valor de λ na forma
ω2
kλ2 = µε − γλ2 . (13.40)
c2
“Z_2” — 2017/9/5 — 8:19 — page 353 — #373
Nota-se que, para ω > ωλ , o vetor de onda kλ é real; as ondas do modo λ podem propagar-se pelo guia.
Para frequências menores que a frequência de corte, kλ é imaginário; estes modos não podem propagar-se e
são chamados modos cortados ou modos evanescentes. Dada uma frequência, somente um número finito de
modos pode propagar-se. É conveniente desenhar os guias de tal forma que, para a frequência operacional,
somente o modo de frequência menor pode ser propagado.
Devido ao fato que o número de onda kλ ser sempre menor que o valor correspondente ao espaço livre,
√ ω
µε c , o comprimento de onda no guia será sempre maior que o comprimento de onda no vácuo. Por outro
lado, a velocidade de fase vf será maior que o valor correspondente ao espaço livre (infinito)
ω c 1 c
vf = =√ q >√ . (13.43)
kλ µε ωλ 2 µε
1− ω
Isto corresponde à metade de um comprimento de onda no vácuo, na direção transversal do guia. A forma
explícita dos campos para esse modo, simbolizado por TE 1,0 , é:
πx
Hz = H0 cos ei kz−i ωt
a
i ka πx
Hx = − H0 sen ei kz−i ωt (13.49)
π a
i ωaµ πx
Ey = H0 sen ei kz−i ωt ,
πc a
em que k = k1,0 é dado pela Eq. (13.42), com ωλ = ω1,0 . O fator i em Hx (e Ey ) significa que existe uma
desfasagem espacial (ou temporal) de 90◦ entre Hx (e Ey ) e Hz na direção de propagação. O modo TE 1,0
é o modo que tem a frequência de corte mais baixa, tanto para o T E quanto para o T M , e por isso é o mais
usado na maioria das aplicações práticas.
Se as superfícies das tampas estão em z = 0 e z = d, as condições de contorno podem ser satisfeitas sobre
cada superfície somente se
π
k=p , p = 0, 1, 2, · · · . (13.51)
d
Para os campos T M , o anulamento de ~Et em z = 0 e z = d requer
pπz
Ez = ψ (x, y) cos , p = 0, 1, 2, · · · . (13.52)
d
Similarmente, para as ondas T E, o anulamento de Hz em z = 0 e z = d requer
pπz
Hz = ψ (x, y) sen , p = 1, 2, 3, · · · . (13.53)
d
Então, de (13.34) e (13.35), encontramos os campos transversais:
Campos T M
~Et = − pπ sen pπz ∇~ tψ e ~ t = i εω cos pπz ẑ × ∇
H ~ tψ . (13.54)
dγ 2 d cγ 2 d
Campos T E
~Et = − i ωµ sen pπz ẑ × ∇
~ tψ e ~ t = pπ cos pπz ∇
H ~ tψ . (13.55)
cγ 2 d dγ 2 d
“Z_2” — 2017/9/5 — 8:19 — page 355 — #375
As condições de contorno nas tampas da cavidade são, agora, explicitamente satisfeitas. Resta ainda o
problema dos autovalores, (13.37)-(13.39), como antes. Mas agora, a constante γ 2 é:
ω 2 pπ 2
γ 2 = µε − . (13.56)
c2 d
Para cada valor de p, o autovalor γλ2 determina uma autofrequência ωλp :
pπ 2
2 [c2 ] 2
ωλp = γλ + (13.57)
µε d
e os campos correspondentes a esse modo ressonante.
Cavidade Retangular Uma cavidade ressonante do ponto de vista didático é o cubo com paredes perfei-
tas. Esta cavidade oscilante tem paredes condutoras perfeitas na forma de um cubo de lado a. Em um certo
modo o campo elétrico é dado por
~E = x̂E0 sen πy sen πz e− i ωt , (13.58)
a a
para calcular o campo magnético, faremos
~ = ck ẑ × ~E
H
εω
e temos as equações de Maxwell associadas a suas condições de contorno, conforme descrito similarmente
em guia de onda retangular.
Cavidade Cilíndrica Uma cavidade ressonante de importância prática é o cilindro circular reto, que pode
ter um pistão móvel que permite a sintonia variando a sua altura. Sejam R e d o raio interno e a altura
do cilindro, respectivamente. Para um modo T M , a equação de onda transversal para ψ = Ez , sujeita à
condição de contorno Ez = 0 em r = R, tem a solução
s
[c] x′ 2mn p2 π 2
ωmnp = √ + 2 , (13.61)
µε R2 d
aonde usamos a Eq. (13.55). Para d > 2, 03R, a frequência de ressonância ω111 é menor que a do modo T M .
Assim, o modo T E111 é o modo de oscilação fundamental da cavidade. Devido ao fato que a frequência
depende de d/R, é possível conseguir uma sintonia fazendo um ajuste das tampas da cavidade.
Cavidade Esférica A superfície da Terra, como uma superfície de contorno, e a ionosfera como a outra
superfície formam um exemplo particular da cavidade ressonante esférica. Aqui consideramos o modelo
físico constituído por duas esferas concêntricas, perfeitamente condutora, com os raios R1 e R2 = R1 + h.
No nosso exemplo, R1 é o raio da Terra e h é a altura da ionosfera acima da superfície terrestre.
Usando a separação de variáveis em coordenadas esféricas e os harmônicos esféricos, temos uma equa-
ção diferencial para Ylm (θ, φ) fl (r), que nos dá a solução de uma onda esférica, na qual podemos resolve-la
com os métodos aplicados no Capítulo 11 e que iremos usar no próximo capítulo.
Aqui vamos considerar apenas os modos T M e admitir que os campos são independentes do ângulo azi-
mutal φ, pois sabe-se dos harmônicos esféricos que a grandeza relevante é o l, e não o m. Se a componente
radial de ~
B se anula e as outras componentes não dependem de φ, então apenas Bφ 6= 0 se os campos forem
finitos em θ = 0. Da lei de Faraday temos que Eφ = 0. Assim, das equações homogêneas de Maxwell para
modos T M temos somente as componentes Er , Eθ e Bφ .
Admitindo-se uma função do tempo e− i ωt , as equações de Maxwell podem ser combinadas em
ω2 ~ ~ ×∇
~ × ~B = 0 ,
B−∇ (13.64)
c2
em que usamos µ = 1. A componente φ da equação (13.64) é
ω2 ∂2 1 ∂ 1 ∂
(rBφ ) + 2 (rBφ ) + 2 (sen θ rBφ ) = 0 . (13.65)
c2 ∂r r ∂θ sen θ ∂θ
que nos dá os polinômios associados de Legendre, Pl m (cos θ), com m = ±1. Logo, podemos escrever uma
solução do tipo
ul (r) 1
Bφ (r, θ) = Pl (cos θ) . (13.66)
r
“Z_2” — 2017/9/5 — 8:19 — page 357 — #377
ic ∂ ic ul (r) 1
Er = (sen θ Bφ ) = − l(l + 1) Pl (cos θ)
ωr sen θ ∂θ ωr r
e
ic ∂ i c ∂ul (r) 1
Eθ = − (rBφ ) = − Pl (cos θ) .
ωr ∂r ωr ∂r
Como em r = R1 e em r = R2 , temos Eθ = 0, a condição de contorno para ul (r) será
dul (r)
= 0, para r = R1 e r = R2 . (13.68)
dr
A solução detalhada de (13.67) será feita no próximo capítulo. Para nosso objetivo, abordaremos um caso
limite. A altura h da ionosfera é muito pequena quando comparada ao raio da Terra R1 , logo, h/R1 ≪ 1.
Os termos em l(l + 1)/r 2 na equação (13.67) podem ser aproximados pelo seu valor em r = R1 . Deste
2
modo as soluções de (13.67) são na forma de cos κr e sen κr, em que κ2 = ωc2 − l(l+1) R21
, i.e., no ponto
r = R1 . Usando as condições (13.68), encontraremos a solução
em que κh = nπ, com n = 0, 1, 2, · · · para o modo T M usado até o momento. Para n = 1, 2, · · · temos
o modo T E. Somente para n = 0 temos modo de frequência muito baixa. Em κ = 0 temos as conhecidas
ressonâncias de Schumann 3
c p
ωl ≈ l(l + 1) , l = 0, 1, 2, · · · . (13.69)
R1
Com o raio da Terra R1 = 6.400 km, as primeiras cinco frequências ressonantes são:
ωl
= 10, 6 ; 18, 3 ; 25, 8 ; 33, 4 ; 40, 9 Hz .
2π
3
Winfried Otto Schumann (1888-1974), físico alemão.
4
Foi Schumann quem primeiro estudou os aspectos teóricos das ressonâncias globais do sistema de guia de onda Terra-ionosfera,
conhecida hoje como as ressonâncias de Schumann, ver W. O. Schumann, Zeitschrift und Naturfirschung, 7A, 149-154 (1952);
Ibidem, 250-252 (1952); Idem, Il Nuovo Cimento, 9 (12), 1116-1138 (1952). No entanto, somente a partir das medições feitas
entre 1960 e 1963, que as técnicas de análise adequadas passaram a ser disponíveis para extrair as informações de ressonância
de ruído de fundo, ver M. Balser and C. Wagner, J. Res. NBS, 64D, 415-418 (1960); Idem, Nature, 188 (4751), 638-641 (1960);
Idem, Journal of Geophysical Research, 67 (2), 619-625 (1962); Idem, 67 (10), 4081-4083 (1962); Idem, 68, 4115-4118 (1963).
“Z_2” — 2017/9/5 — 8:19 — page 358 — #378
Energia armazenada
Q = ω0 . (13.70)
Potência dissipada
Aqui, ω0 é a frequência de ressonância, assumindo que não tem perdas. Pela conservação da energia, a
potência dissipada em perdas ôhmicas é o negativo da taxa de variação temporal da energia armazenada U ,
na cavidade. Assim, de (13.70), podemos escrever uma equação para U como função do tempo
dU ω0
=− U , (13.71)
dt Q
A integral em (13.75), fornece uma distribuição nas frequências para a energia na cavidade da forma
1
|E (ω)|2 ∝ . (13.76)
(ω − ω0 − ∆ω)2 + (ω0 /2Q)2
O perfil da ressonância (13.76), tem uma largura total Γ (erradamente chamada de meia largura) à meia
altura do máximo, igual a
ω0
Γ= . (13.77)
Q
“Z_2” — 2017/9/5 — 8:19 — page 359 — #379
Para uma voltagem de entrada constante, a energia da oscilação na cavidade, em função da frequência,
seguirá a curva de ressonância nas vizinhanças de uma dada frequência de ressonância. Assim, o intervalo
de frequência δω entre os pontos a meia potência determina a largura Γ, e o Q da cavidade será dado por
ω0 ω0
Q= = . (13.78)
δω Γ
São comuns, nas cavidades a micro-ondas, valores de Q da ordem de várias centenas ou milhares.
às de um guia de onda metálico oco, quando a constante dielétrica é suficientemente elevada. Mas existem
diferenças características, que aparecem nas condições de contorno em virtude da superfície do cilindro.
Aqui o componente transversal dos campos é governado por duas equações, uma para o interior do cilindro
e outra para o exterior do mesmo.
Interior ( )
ω2 ~E
∇2t + µ1 ε1 2 − k2 ~ =0. (13.79)
c B
Exterior ( )
ω2 ~E
∇2t + µ0 ε0 2 − k2 ~ =0. (13.80)
c B
Tanto o meio dielétrico (µ1 , ε1 ) como o meio circundante (µ0 , ε0 ) são considerados uniformes e isotrópicos.
A constante k de propagação é a mesma no interior e no exterior do cilindro.
Dentro do cilindro dielétrico o laplaciano transversal deve ser negativo, deste modo a constante
ω2
γ 2 = µ1 ε1
− k2 (13.81)
c2
é positiva. Fora do cilindro, os campos diminuem exponencialmente, Não existe modo T EM para estes
guias. Logo, a constante equivalente a γ 2 deve ser negativa. Assim, definimos uma outra grandeza
ω2
β 2 = k2 − µ0 ε0 (13.82)
c2
“Z_2” — 2017/9/5 — 8:19 — page 360 — #380
No interior
i k ∂Bz i ε1 ω ∂Ez
Bρ = , Bφ =
γ 2 ∂ρ γ 2 c ∂ρ . (13.85)
ω ck
Eφ = − Bρ , Eρ = Bφ
ck ε1 ω
No exterior Com expressões análogas para ρ > a.
Pelo fato de termos duas duplas agrupadas, com (Bρ , Eφ ) dependentes de Bz e com (Bφ , Eρ ) dependen-
tes de Ez , iremos procurar soluções do tipo T E ou T M . Para os modos T E, as componentes dos campos
são:
Bz = J0 (γρ)
ik
Bρ = − J1 (γρ) ρ≤a (13.86)
γ
iω
Eφ = J1 (γρ)
cγ
e
Bz = A K0 (βρ)
i kA
Bρ = K1 (βρ)
β ρ>a. (13.87)
i ωA
Eφ = − K1 (βρ)
cβ
Em ρ = a, as componentes dos campos nos leva à duas condições
A K0 (βa) = J0 (γa)
A J1 (γa) . (13.88)
− K1 (βa) =
β γ
“Z_2” — 2017/9/5 — 8:19 — page 361 — #381
J1 (γa) K1 (βa)
+ =0 (13.89)
γJ0 (γa) βK0 (βa)
J1 (γa) ε0 K1 (βa)
+ = 0. (13.91)
γJ0 (γa) ε1 βK0 (βa)
Para evitar sujeira na superfície e consequentemente perda da energia, as fibras ópticas são feitas com duas
regiões, o núcleo central com diâmetro R e índice de refração n, e uma casca com diâmetro R′ e índice
5
Em 1977, AT&T e GTE iniciaram suas primeiras comunicações telefônicas usando fibras ópticas. No Brasil, o desenvolvimento
em fibras ópticas ocorreram no final dos anos 1970 e início dos anos 1980, na UNICAMP em Campinas e no Laboratório da
Telebras, também em Campinas.
“Z_2” — 2017/9/5 — 8:19 — page 362 — #382
de refração n′ < n. Dessa forma, a reflexão interna total ocorre entre o núcleo e a casca, não havendo
interferências externas e a consequente perda da energia. Assim, uma fibra óptica é constituída do núcleo,
da casca e de um revestimento plástico para sua proteção. Para um exemplo realista, tomamos o núcleo com
índice de refração n = 1, 5 e a casca com índice de refração n′ = 1, 485. Com estes valores, usando a lei
de Snell (9.39), temos o ângulo interno total de reflexão θc = sen−1 (1, 485/1, 5) ≈ 82◦ . Isto nos dá um
ângulo de aceitação de ±8◦ . As fibras ópticas podem ser do tipo multímodo ou do tipo monomodo. Numa
fibra multímodo, o diâmetro do núcleo é muito maior que o comprimento de onda óptico que é transmitido,
assim podem ser transmitidos milhares de modos. As fibras que permitem propagar apenas um modo são
chamadas monomodo.
Uma característica fundamental das fibras ópticas é a variação da atenuação da energia luminosa com
o comprimento de onda da luz. A atenuação é expressa em dB/km. O valor em decibel de uma atenuação
A é dado por A(dB) = 10 log 10 A. Assim, uma atenuação por um fator 10 corresponde a 10 dB, 100
corresponde a 20 dB, 1000 a 30 dB, etc.. Uma atenuação típica é de 0,25 dB/km com luz de 1550 nm de
comprimento de onda, isto significa uma redução de potência em 0,1 para cada 40 km de onda transmitida.
A propagação da onda guiada pela fibra óptica é descrita matematicamente pelas soluções das equações
de Maxwell na geometria cilíndrica da fibra. Se temos uma fibra com diâmetro R então, com a dependência
convencional z e t, as soluções serão:
Ez AE
= Jm (γρ) ei mφ (13.92)
Hz AH
com γ ′ 2 = n′ 2 ω 2 − kz2 quando ρ > R. Aqui, Jm são as funções de Bessel e Km são as funções de Hankel
modificadas definidas por
π
Km (x) = im+1 Hm (1)
(i x) .
2
Temos soluções T E e T M e soluções com ambas componentes Ez e Hz não nulas, conhecidas como modos
híbridos HE. Os modos T E e T M têm frequências de corte não nulas para γρ = 2, 405, o primeiro zero
de J0 (x). Em contraste, o menor modo HE não tem frequência de corte e para 0 < γρ < 2, 405 existe
somente um modo que se propaga na fibra.
Problemas
13.1 Estude a propagação de ondas entre planos condutores, considerando os modos T E e T M . Sugestão:
Consulte os livros do Prof. Kleber Machado [54] e dos Profs. Heald e Marion [36].
13.2 Estude a propagação de ondas em condutores ocos. Sugestão: Consulte o livro dos Profs. Heald e
Marion [36].
13.3 Obtenha os campos dos modos T E para uma cavidade ressonante de seção reta retangular de lados a
e b e altura L.
13.4 Considere uma cavidade ressonante cilíndrica de raio R e altura L, obtenha os campos dos modos T E
e T M.
13.5 Determine o fator de qualidade Q para uma cavidade ressonante sujeita a modos T M .
“Z_2” — 2017/9/5 — 8:19 — page 363 — #383
13.6 Uma linha de transmissão constituída por dois cilindros concêntricos de metal com condutividade σ
e a distância de penetração δ, como demonstrado no texto, é preenchido com um material dielétrico
sem perdas uniforme (µ, ε). Um modo T EM é propagado ao longo dessa linha.
a) Mostre que o fluxo de potência média de tempo ao longo da linha é
h c i rµ
b
2 2
P = πa |H0 | ln ,
4π ε a
P (z) = P0 e−2γz ,
em que
h c i 1 r ε 1 + 1
a b
γ= .
4π 2σδ µ ln ab
c) A impedância característica Z0 da linha é definida como o razão da voltagem entre os cilindros e
a corrente axial carregada em um deles na posição z. Mostre que para esta linha de transmissão, a
impedância característica será r
4π 1 µ b
Z0 = ln .
c 2π ε a
d) Mostre que a resistência e a indutância em série por unidade de comprimento da linha de transmis-
são são:
1 1 1
R= +
2πσδ a b
4π µ b µc δ 1 1
L= 2 ln + + ,
c 2π a 4π a b
13.7 Ondas Transversais elétricas e magnéticas estão propagando ao longo de um cilindro de latão circular
reto e oco, com raio interno R. a) Encontre as frequências de corte dos diferentes modos T E e T M .
Determinar numericamente a frequência mais baixa de corte (o modo dominante) em termos do raio
do tubo cilíndrico e a razão das frequências de corte dos próximos quatro modos superiores à do modo
dominante. Para esta parte assumir que a condutividade do latão é infinita. b) Calcular a constante de
atenuação do guia de onda como função da frequência para os dois modos mais baixas e fazer um
gráfico como uma função da frequência.
13.8 Um guia de √ onda é construído de tal forma que a seção reta do guia forma um triângulo reto com os
lados a, a e 2 a. O meio no interior do guia de onda tem µ = ε = 1. a) Assumindo condutividade
infinita nas paredes, determinar os modos possíveis de propagação e suas frequências de corte. b) Para
os modos mais baixos, de cada tipo, calcular a constante de atenuação, assumindo que as paredes têm
condutividade finita, porém muito elevada. Compare o resultado com com guias quadrados de lado a
feitos de mesmo material.
13.9 Uma cavidade ressonante de cobre composta por um cilindro circular oco e reto de raio interno R e
comprimento L, com as extremidades com faces planas.
√
a) Determinar as frequências ressonantes da cavidade para todos os tipos de ondas. Com c/ µε R
“Z_2” — 2017/9/5 — 8:19 — page 364 — #384
como unidade de frequência, fazer um gráfico das quatros frequências ressonantes mais baixas de
cada tipo de onda como função de R/L para 0 < R/L < 2. É possível que o mesmo modo tenha a
menor frequência para todos R/L?
b) Se R = 2 cm, L = 3 cm e a cavidade é feita de puro cobre, qual o valor numérico para Q quando
temos o modo ressonante mais baixo?
Leitura Recomendada
Recomenda-se a leitura detalhada contidas nos seguintes clássicos,
– J. D. Jackson [42];
– M. A. Heald and J. B. Marion [36].
Nestes livros, o leitor encontrará excelentes discussões e deduções detalhadas para o estudo de cavidades
ressonantes e guias de onda e aplicações.
“Z_2” — 2017/9/5 — 8:19 — page 365 — #385
Capítulo 14
Sistemas de Radiação
Neste capítulo iremos dedicar nosso estudo a respeito da geração de ondas eletromagnéticas, e vamos dis-
cutir a emissão de radiação por sistemas de cargas e de correntes, oscilantes e localizadas. Inicialmente
faremos um estudo das ondas eletromagnéticas em coordenadas esféricas e então aplicá-las em nosso es-
tudo. Estas ondas esféricas vetoriais são convenientes para tratar de problemas de contorno eletromagnéticos
que possuem propriedades de simetria esférica e para discutir a radiação de multipolo de uma distribuição
de fontes localizadas. Ainda faremos um estudo da expansão multipolar incluindo os momentos toroidais e
sua contribuição para a radiação.
1 ∂2ψ
∇2 ψ − = 0, (14.1)
c2 ∂t2
em que, usando análise de Fourier,
Z ∞
ψ (~r, t) = dω ψ (~r, ω)e− i ωt (14.2)
−∞
com k2 = ω 2 /c2 . As soluções da equação acima são dadas pela expansão em harmônicos esféricos,
∞ m=l
X X
ψ (~r, ω) = fl (k, r) Ylm (θ, φ) . (14.4)
l=0 m=−l
Para tal, usamos coordenadas esféricas e a notação do momentum angular ~L, como veremos mais tarde, em
que os autovalores serão L2 Ylm = l(l + 1)Ylm . Então,
2 m 1 ∂ 2 (rfl ) fl
∇ (fl Yl ) = 2
Ylm − 2 L2 Ylm
r ∂r r
2
1 ∂ (rfl ) l(l + 1)
= 2
Ylm − fl Ylm .
r ∂r r2
365
“Z_2” — 2017/9/5 — 8:19 — page 366 — #386
Funções Esféricas de Bessel, Neumann e Hankel É usual definir as funções esféricas de Bessel, Neu-
mann e Hankel por:
π 1/2
jl (x) = Jl+1/2 (x)
2x
π 1/2
nl (x) = Nl+1/2 (x) , (14.9)
π 1/22x
Jl+1/2 (x) ± i Nl+1/2 (x)
(1,2)
hl (x) =
2x
na qual associadas com as expansões em série (6.44) e (6.45) são
l 1 d l sen x
jl (x) = (−x)
x dx x
l . (14.10)
l 1 d cos x
nl (x) = −(−x)
x dx x
Nas ondas esféricas, x = kr, devemos ter o controle quando r → 0 e r → ∞, na qual associamos às
propriedades assintóticas das funções de Bessel e de Neumann. Para valores do argumento x ≪ max[1, l] a
função esférica de Bessel se torna finita2
xl x2 4
jl (x) = 1− + O(x ) , (14.11)
(2l + 1)!! 2(2l + 3)
na qual é apropriada para descrever a forma assintótica, r → ∞ das ondas esféricas. Então, usando as
funções esféricas de Hankel, a solução da equação diferencial (14.3) será
X X h
∞ m=l
(1) (1) (2) (2)
i
ψ (~r) = Alm hl (kr) + Alm hl (kr) Ylm (θ, φ) , (14.16)
l=0 m=−l
(1) (2)
em que os coeficientes Alm e Alm serão determinados pelas condições de contorno do problema.
Função de Green, Ondas Esféricas Para fins de referência, apresentamos a expansão em ondas esféricas
para a função de Green que satisfaz a equação
∇2 + k2 G(~r,~r′ ) = −δ(~r −~r′ ) . (14.17)
2
Usa-se a notação: (2l + 1)!! ≡ (2l + 1)(2l − 1)(2l − 3) · · · (5)(3)(1).
“Z_2” — 2017/9/5 — 8:19 — page 368 — #388
1 ∂2 l(l + 1)
∇2 [gl Ylm ∗ Ylm ] = 2
(r gl )Ylm ∗ Ylm − gl Ylm ∗ Ylm , (14.21)
r ∂r r2
substituindo esse resultado e a definição de Gk (14.19) na Eq. (14.20) temos
X X d2
∞ m=l
2 d l(l + 1)
+ 2
+k − gl (r, r ′ ) Ylm ∗ Yl m
dr 2 r dr r2 (14.22)
l=0 m=−l
1
= − 2 δ(r − r ′ ) δ(cos θ − cos θ ′ ) δ(φ − φ′ ) .
r
Lembrando da relação de completeza para os harmônicos esféricos
∞ m=l
X X
Ylm ∗ (θ ′ , φ′ )Ylm (θ, φ) = δ(cos θ − cos θ ′ ) δ(φ − φ′ ) ,
l=0 m=−l
e a condição
lim gl (r, r ′ ) = finito
r→0
implica em
gl (r, r ′ ) = A a1l (kr> ) jl (kr< ) ,
em que A é uma constante que não depende de r ′ , r< (r> ) é o mínimo (máximo) entre r e r ′ como já
definimos no Capítulo 7.
e a condição
ei kr
lim gl (r, r ′ ) ∼
r→∞ r
implica em
(1)
gl (r, r ′ ) = A a2l (kr< ) hl (kr> ) ,
em que a constante A é a mesma da condição anterior. Isto não é uma restrição, pois ainda temos as
funções dos parâmetros r ′ , a1l e a2l .
“Z_2” — 2017/9/5 — 8:19 — page 369 — #389
A forma explícita da função de Green (14.18) implica que as funções gl (r, r ′ ) sejam simétricas em seus
argumentos, como se segue (~r −~r′ )2 = r 2 − 2~r ·~r′ + r ′ 2 e~r ·~r′ = rr ′ n̂ · n̂′ , em que n̂ e n̂′ são os vetores
unitários nas direções de~r e~r′ , respectivamente. Assim,
(1)
gl (r, r ′ ) = gl (r ′ , r) → A a1l (kr> ) jl (kr< ) = A a2l (kr< ) hl (kr> ) . (14.24)
Finalmente, temos que resolver o problema da singularidade da função δ na Eq. (14.23). Isto implica em
uma função degrau para a primeira derivada de gl (r, r ′ ) em r = r ′ :
(1)
A equação entre parêntesis é o wronskiano do determinante de jl e de hl , determinado da seguinte forma,
(1)
dh (x) djl (x) (1)
(1)
W = W jl , hl = jl (x) l − hl (x) (14.27)
dx dx
e
dW (1) ′′ (1) 2 (1) ′ 2 (1) 2
= W ′ = jl hl − jl′′ hl = − jl hl + jl′ hl = − W , (14.28)
dx x x x
que será facilmente resolvida por
Z Z
dW dx b
= −2 → ln W = a − 2 ln x → W = 2 com b = ea (14.29)
W x x
e a constante de integração b é determinada para os limites de x pequenos nas Eqs. (14.11) e (14.12), logo
b = − i. Assim,
(1) i
W = W jl , hl =− 2, (14.30)
x
lembrando da Eq. (14.26), temos A = − i k. Então, a expressão final para a função de Green das ondas
esféricas será
′ ∞ m=l
X X
ei k|~r−~r | (1)
Gk (~r,~r′ ) = = i k jl (kr< ) hl (kr> ) Ylm ∗ (θ ′, φ′ ) Ylm (θ, φ) . (14.31)
4π|~r −~r′ |
l=0 m=−l
Até o momento, realçamos as funções radiais. Iremos agora reexaminar as funções angulares.
“Z_2” — 2017/9/5 — 8:19 — page 370 — #390
Momentum Angular
As funções angulares básicas são os harmônicos esféricos Ylm (θ, φ) e podemos associá-las ao operador
momentum angular ~L da mecânica quântica e seus autovalores.3
O operador momentum angular é definido por
~L = − i~r × ∇
~ (14.32)
e é igual a ~−1 vezes o operador momentum angular orbital da mecânica quântica.
Em coordenadas cartesianas temos
3
X 3
X 3 X
X 3
~L = ~L2 ≡ L2 = ∂
êi Li , L2i , com Li = − i ǫijk xj .
∂xk
i=1 i=1 j=1 k=1
Explicitamente,
∂ ∂ ∂ ∂ ∂ ∂
Lx = − i y −z , Ly = − i z −x , Lz = − i x −y .
∂z ∂y ∂x ∂z ∂y ∂x
Ainda podemos definir operadores de levantamento L+ e de abaixamento L− que serão de grande utilidade
para a construção dos harmônicos esféricos,
L± = Lx ± i Ly . (14.33)
As relações de comutação são:
X X
[Li , Lj ] = i ǫijk Lk ou ǫijk Li Lj = i Lk (14.34)
k ij
em que l = 0, 1, 2, · · · .
Fazendo outra separação de variáveis Ylm (θ, φ) = P (θ) Q(φ)
1 d2 Q
= −m2 → Q = Qm = ei mφ . (14.42)
Q dφ2
Usando Lz em coordenadas esféricas, podemos ver que
Lz Qm = m Qm (14.43)
e similarmente
em que cm m m
l+ e cl− são as constantes que estão associadas à normalização de Yl em coordenadas esféricas
R ′
dΩ Ylm ∗ Ylm′ . Assim,
Z Z Z
m+1 2
m 2
|cl+ | = dΩ Yl = dΩ Yl L− L+ Yl = [l(l + 1) − m(m + 1)] dΩ |Ylm |2
m∗ m
e Z Z Z
2
|cm 2
l− | = dΩ Ylm−1 = dΩ Ylm ∗ L+ L− Ylm = [l(l + 1) − m(m − 1)] dΩ |Ylm |2 .
“Z_2” — 2017/9/5 — 8:19 — page 372 — #392
0 ≤ |cm 2
l+ | = (l − m)(l + m + 1) , 0 ≤ |cm 2
l− | = (l + m)(l − m + 1) .
Portanto,
−l ≤ m ≤ l
e p )
L+ Ylm = p(l − m)(l + m + 1) Ylm+1
. (14.45)
L− Ylm = (l + m)(l − m + 1) Ylm−1
Finalmente, observamos que as seguintes equações entre operadores dão as propriedades de comutação de
~L, de L2 e de ∇2 :
L2 ~L = ~L L2
~L × ~L = i ~L , (14.46)
Lj ∇ 2 = ∇ 2 Lj
em que
1 ∂ L2
∇2 = (r) − . (14.47)
r ∂r 2 r2
1
Z Z ~ ′ ′ |~r −~r′ |
~ 3 ′ ′ J(~r , t ) ′
A(~r, t) = d r dt δ t + −t , (14.50)
c |~r −~r′ | c
em que a solução homogênea é zero, por que assumimos a condição de contorno de um campo nulo quando
r → ∞. A função delta de Dirac assegura o comportamento causal dos campos. Pelo fato de termos a
dependência temporal e− i ωt na corrente, a integração dt′ dará (para o número de onda k = ω/c)
Z
′ − i ωt′ ′ |~r −~r′ | ′
dt e δ t + − t = ei k|~r−~r | e− i ωt
c
e o potencial vetor fica
~ (~r, t) = A
A ~ (~r) e− i ωt (14.51)
com Z i k|~r−~r′ |
~ (~r) = 1
A ~J(~r′ ) e d3 r ′ . (14.52)
c |~r −~r′ |
4
Existem algumas sutilezas que podem aparecer, como fatores de 2 na correspondência entre as grandezas clássica e quântica. Por
exemplo, num átomo com um só elétron, o nosso momento de dipolo clássico ~p é substituído por 2ehf |~r|ii para uma transição
do estado inicial i para o estado final f .
“Z_2” — 2017/9/5 — 8:19 — page 373 — #393
Note que a função de Green relevante para ondas esféricas, como já vimos, é
′
′ 1 ei k|~r−~r |
G(~r,~r ) = − (14.53)
4π |~r −~r′ |
com
∇2 + k2 G(~r,~r′ ) = −δ(~r −~r′ ) . (14.54)
A indução magnética é dada por
~ ~ ,
~ ×A
B=∇ (14.55)
enquanto que, no exterior da fonte, o campo elétrico é dado por
~E = i ∇
~ ×~
B. (14.56)
k
Agora, desejamos apenas estabelecer algumas propriedades simples dos campos no caso limite em que a
fonte de corrente está confinada numa região pequena, na realidade muito pequena se comparada com o
comprimento de onda. Vamos assumir que as dimensões da fonte seja caracterizada pelo comprimento d.
Se o comprimento de onda for λ = 2πc/ω e se d ≪ λ podemos classificar o problema da radiação por:
Isto mostra que os campos ligados são quase-estacionários e oscilam harmonicamente com e− i ωt ,
mas têm o caráter estático.
3. A zona afastada, do campo de radiação (radiativa): d ≪ λ ≪ r. Aqui kr ≫ 1, por está razão temos
que a exponencial de k|~r −~r′ | ≫ 1 oscila rapidamente e determina o comportamento do potencial
vetor. Como r ≫ r ′ , eles são governados pela expansão
s ′ 2
q
′ 2 ′ ′ ′ 2 r′ ′ r
|~r −~r | = r − 2rr (n̂ · n̂ ) + r = r 1 − 2 (n̂ · n̂ ) +
r r
1 r′2
≈ r − r ′ (n̂ · n̂′ ) + + · · · ≈ r − n̂ ·~r′ . (14.59)
2 r
“Z_2” — 2017/9/5 — 8:19 — page 374 — #394
Antes de entrarmos na radiação do dipolo elétrico e outros tipos de radiação, vamos examinar a ques-
tão dos campos do monopolo elétrico quando as fontes variam com o tempo. Então, o potencial escalar
retardado é Z Z
3 ′
′ ′
′ ρ(~r , t ) ′ |~r −~r′ |
Φ(~r, t) = d r dt δ t + −t .
|~r −~r′ | c
A contribuição da integral do monopolo elétrico é obtida pela substituição de |~r −~r′ | por |~r| = r. Assim,
q (t′ = t − r/c)
Φmonopolo (~r, t) = ,
r
em que q (t) é a carga total da fonte. Uma vez que a carga se conserva e que a fonte localizada é uma
fonte que não tem cargas afluentes ou efluentes, a carga total q é independente do tempo. Assim, a parte
do monopolo elétrico no potencial de uma fonte localizada tem a natureza estática. Campos com uma
dependência temporal e− i ωt , com ω 6= 0, não têm termos de monopolo elétrico.
A integral pode ser revolvida com o auxílio da equação de continuidade (14.49), através de
~ r · ~J) = ~J +~r(∇
∇(~ ~ · ~J) = ~J + i ωρ~r ,
e Z Z
~J(~r′ ) d3 r ′ = − i ω ~r′ ρ(~r′ ) d3 r ′ . (14.63)
∂ ~
A ei kr 1
~B = ∇~ ×A ~ = n̂ × 2
= k (n̂ × ~p) 1− (14.65)
∂r r i kr
e considerando na zona de radiação, kr ≫ 1
e i kr
~
B ≈ k2 (n̂ × ~p) . (14.66)
r
~ da Eq. (14.64) não depende de θ ou de φ.
Nota-se que A
O campo elétrico do dipolo elétrico é dado pela Eq. (14.56)
~E = i ∇ ~ ×~ B=∇ ~ × (n̂ × ~p) ei kr i k − 1 , (14.67)
k r2 r3
usando a identidade vetorial
~ × (~r × ~p) = −2~p +~r(~p∇)
∇ ~ − ~p(~r∇)
~ ,
~ r = ~p, ∇~
em que (~p∇)~ ~ p = (~r∇)~
~ p = 0, aqui ~p não depende de~r, e, ∇~ ~ r = 3. Como o operador nabla está
atuando somente como função de r, teremos
~E = ∂ ∂ ik 1
−2~p + n̂ (n̂ ·~p) r − ~pr ei kr −
∂r ∂r r2 r3
ei kr
= −k2 n̂ (n̂ · p~) + k2~p
r
ei kr
+ 2 (+2~p i k − i kn̂ (n̂ ·~p) − 2 i kn̂ (n̂ ·~p) + i k~p − 2 i k~p)
r
ei kr
+ 3 (+2~p + 3n̂ (n̂ ·~p) − 3~p) . (14.68)
r
Finalmente, somando todas as contribuições
~E = i ∇ ~ ×~ 2 ei kr 1 ik
B = k (~p − n̂(n̂ ·~p)) + (3n̂(n̂ ·~p) − ~p) 3 − 2 ei kr . (14.69)
k r r r
Agora, considerando a zona de radiação, r → ∞
~E = i ∇ ~ ×~ ei kr
B = −n̂ × ~
B = k2 (~p − n̂(n̂ ·~p)) . (14.70)
k r
Continuando com esta aproximação, (14.70), tomamos a liberdade de escolher a direção do dipolo elétrico
em ẑ, ~p = pẑ. Então temos n̂ × ~p = −p sen θ φ̂ e
~B = Bφ φ̂ ei kr
com Bφ = −k2 p sen θ e ~E = −Bφ (n̂ × φ̂) = Bφ θ̂ .
r
“Z_2” — 2017/9/5 — 8:19 — page 376 — #396
O vetor de Poynting pode ser agora calculado e promediado. Isto requer o cálculo das partes reais de ~E e ~
B
respectivamente,
~Smédio = c ℜ[~E × ~B∗ ] =
c
|Bφ |2 (θ̂ × φ̂) =
c
|Bφ |2 n̂ . (14.71)
8π 8π 8π
A potência média, P , irradiada por unidade de ângulo sólido será então dada por
dP c 4 2
= r 2 n̂ · ~Smédio = k p sen2 θ , (14.72)
dΩ 8π
a radiação correspondente encontra-se na Fig. 14.1, também conhecida como radiação E1. A potência total
Figura 14.1 Radiação de dipolo e quadrupolo. A figura está feita em z = r cos θ versus ρ = r sen θ com
r = sen2 θ para o dipolo e r = 2 sen2 θ cos2 θ para o quadrupolo.
irradiada será Z Z π
dP c 4 2 1 4 2
P = dΩ = k p 2π dθ sen3 θ = ck p , (14.73)
dΩ 8π 0 3
em que a integral foi resolvida usando sen2 θ = 1 − cos2 θ e d cos θ = − sen θ dθ.
Átomo como um sistema radiante Um exemplo interessante de um sistema radiante de cargas é consti-
tuído pelo átomo. Aqui o tamanho do sistema é da ordem: d ≈ 1 Å, sendo o comprimento da onda
emitida tipicamente da ordem: λ ≈ 5 × 103 Å. Portanto a condição d ≪ λ é bem satisfeita neste
caso. Definimos a vida média τ por
~ω 1 4 2 1 ω 4 p2
τ= , P = ck p = ,
P 3 3 c3
que representa o tempo necessário para o átomo emitir um fóton de energia ~ω. Embora P seja
calculado pela mecânica quântica, podemos estimar que a grandeza do dipolo é dada pelo produto do
raio atômico e da carga eletrônica, tal que
3~c3
τp ≈
ω 3 e2 d2
Para a frequências ópticas, τp = 10−7 s.
Antena linear como dipolo elétrico radiante Um bom exemplo de dipolo elétrico radiante é a antena li-
near, com alimentação no centro, e comprimento d pequeno em comparação com o comprimento de
onda. Para a descrição geométrica da antena, ver Fig. 14.2. As grandezas das correntes são as mesmas
para cada metade da antena. O valor I0 no corte, cai quase linearmente até o zero nas extremidades:
− i ωt 2|z| − i ωt
I (z) e = I0 1 − e . (14.74)
d
“Z_2” — 2017/9/5 — 8:19 — page 377 — #397
Colocando este resultado nas Eqs. (14.72) e (14.73) e eliminando ω através de ω 2 = c2 k2 , acharemos
a potência irradiada para esta antena
e
Yl,−m (θ, φ) = (−1)m Ylm
∗
(θ, φ) ,
ainda temos
Y1−1 = −Y11
r
3
Y11 = − sen θ ei φ (14.80)
8π
r
0 3
Y1 = cos θ
4π
e escolhendo n̂ = ẑ, i.e., em θ = 0, acharemos
Z
~ = 4π i k h(1) (kr) Y10 (0)
A
∗
d3 r ′ ~J(~r′ ) j1 (kr ′ ) Y10 (θ ′, φ′ ) (14.81)
1
c
com r
3
Y10 (0)
. =
4π
Usando a expansão de pequena distância kd ≪ 1 para a função esférica de Bessel
1 ′ ∗
j1 (kr ′ ) = kr , r ′ cos θ ′ = n̂ ·~r′ para eliminar Y10 (θ ′ , φ′ ) . (14.82)
3
Na frente da integral temos a função esférica de Hankel
(1)
h1 = j1 + i n1
com
d sen x cos x sen x
j1 (x) = − =− +
dx x x x2
e
d cos x sen x cos x
n1 (x) = + =− + ,
dx x x x2
somando as contribuições
(1) ei x
h1 = − i (1 − i x) . (14.83)
x2
Finalmente, inserindo as Eqs. (14.80), (14.82) e (14.83) na aproximação (14.79), encontramos
i kr 1 Z
~ (~r) = e
A − ik ~J(~r′ ) (n̂ ·~r′ ) d3 r ′ . (14.84)
cr r
Esta expressão pode ser escrita como a soma de duas partes. A parte antissimétrica produz uma indução
magnética transversal e a parte simétrica produz um campo de quadruplo elétrico. Vamos definir a função
1~
f (~J,~r′ ) = J(n̂ ·~r′ ) . (14.85)
c
A contribuição simétrica é
~ ′ 1 ~ ′ ′ ~
fs (J,~r ) = J(n̂ ·~r ) +~r (n̂ · J) (14.86)
2c
e a contribuição antissimétrica é
1 ~ 1 ′ ~
fa (~J,~r′ ) = J(n̂ ·~r′ ) −~r′ (n̂ · ~J) = (~r × J) × n̂ (14.87)
2c 2c
“Z_2” — 2017/9/5 — 8:19 — page 379 — #399
e, naturalmente, f = fs + fa .
Como, no momento, o nosso interesse é o campo de dipolo magnético, iremos usar a parte antissimé-
trica. Inserindo a parte antissimétrica fa na integral da Eq. (14.84) teremos o momento de dipolo magnético
Z
~ = M
m ~ (~r′ ) d3 r ′ com M~ (~r′ ) = 1 ~r′ × ~J(~r′ ) (14.88)
2c
e a parte antissimétrica do potencial vetor
i kr
~ (~r) = i k(n̂ × m e 1
A ~) 1− . (14.89)
r i kr
dP c 4 2
= k m sen2 θ , (14.92)
dΩ 8π
~ e~r. A potência média total é
sendo θ o ângulo entre m
ck4 m2 ω4
P = = 3 m2 , (14.93)
3 3c
em que m = |~ m|.
Um exemplo de um dipolo magnético oscilante é o de uma espira percorrida por uma corrente alter-
nada, situada no plano xy da Fig. 14.3. Radiação do tipo dipolo magnético e também conhecida como
radiação M 1.
“Z_2” — 2017/9/5 — 8:19 — page 380 — #400
3~ c3
τm = ,
ω 3 m2
em que m deve ser calculado de acordo com a mecânica quântica. Para uma estimativa, é suficiente lembrar
que o momento magnético devido ao movimento orbital é relacionado com o momentum angular por
e ~
~ =−
m L,
2M c
em que M é a massa da partícula em movimento. Tipicamente, o momentum angular é da ordem ~, de modo
que:
3~c3 2M c 2
τm ≈ 3 .
ω e~
Esta vida média é maior do que a vida média devida a uma transição de dipolo elétrico por um fator de
2
τm M cd
≈ ∼ 105 ,
τp ~
em que d é da ordem do raio orbital do sistema atômico, e M representa a massa do elétron. Consequente-
mente, a transição de dipolo magnético é usualmente muito menos provável do que a transição elétrica. É
claro que, se esta última for proibida por alguma regra de seleção, então a contribuição magnética poderá
ser relevante.
Para sistemas nucleares, a razão apresentada na expressão acima é bem menor. Isto é devido em parte ao
fato de que o momento magnético devido ao spin do próton é maior do que aquele estimado pela equação
e ~ gp 5
~ = − 2M
m c L, por um fator giromagnético 2 = 2, 792847356(23). Esses detalhes poderão ser elucidados
através da mecânica quântica. 6
Z "X3 # Z h i
∂ ′ i ′ ′ ~ ′ ~ 3 ′ ′ ~ ~J)~r′ d3 r ′ .
~
r J (n̂ r
·~ ) +~
r [∇(n̂ r
·~ )]J d r = (n̂ r
·~ )J + (n̂ ·
i=1
∂x′ i
Assim, o potencial vetor será
2 i kr
Z
~ (~r) = − k e
A 1−
1
~r′ (n̂ ·~r′ )ρ(~r′ ) d3 r ′ . (14.95)
2 r i kr
Para proceder, tomaremos o rotacional de A ~ e determinaremos o campo magnético para a zona de radiação
kr ≫ 1
Z
~ ~ ~ k2 ∂ i kr 1 ′ ′ ′ 3 ′ 1
B = ∇×A = − n̂ e ~r (n̂ ·~r )ρ(~r ) d r 1−O
2 ∂r r r
3 i kr Z
ik e
= − n̂ × ~r′ (n̂ ·~r′ )ρ(~r′ ) d3 r ′ (14.96)
2 r
= i kn̂ × A ~ .
Similarmente
~E = i ∇
~ × ~B = i k(n̂ × A)
~ × n̂ . (14.97)
k
Vamos agora adicionar à expressão no lado direito da Eq. (14.96), segunda linha, um termo que é nulo, mas
que será útil para escrever o campo magnético numa forma mais transparente. Assim, temos
Z h i
~ i k3 ei kr 2
B=− n̂ × 3~r′ (n̂ ·~r′ ) − n̂r ′ ρ(~r′ ) d3 r ′ , (14.98)
6 r
em que incluímos o termo r ′ 2 n̂ρ(~r′ ) com r ′ = |~r′ |, na qual sua contribuição é nula, isto devido n̂ × n̂ = 0,
portanto, não alterando a relação original da Eq. (14.96). Usando a definição (7.10) do tensor momento de
quadrupolo Z
2
Qij = (3ri′ rj′ − r ′ δij ) ρ(~r′ ) d3 r ′ , (14.99)
Notemos que o vetor Q(n̂) depende não só da magnitude do quadrupolo, como também da direção do ponto
de observação. Desta forma, a indução magnética será:
~ i k3 ei kr
B=− n̂ × Q(n̂) (14.102)
6 r
que produz uma potência média por unidade de ângulo sólido dada por
dP c
= k6 |[n̂ × Q(n̂)] × n̂|2 . (14.103)
dΩ 228π
A distribuição angular geral normalmente é complicada. Mas a potência total irradiada pode ser calculada
de uma forma simples. Podemos escrever a dependência angular como
Como Qab é um tensor cujos elementos da diagonal principal nos fornece um traço igual a zero, portanto, a
potência total irradiada por uma fonte quadrupolo será,
c 6X
P = k |Qab |2 . (14.107)
360
a,b
Observe que a potência irradiada varia conforme a sexta potência da frequência para momentos de quadru-
polos fixos, em comparação com a quarta potência para a radiação de dipolo.
Um exemplo simples de uma fonte de quadrupolo é uma distribuição esferoidal de carga oscilante. Neste
caso, os elementos fora da diagonal de Qij se anulam, sendo os elementos diagonais dados por
1
Q33 = Q , Q11 = Q22 = − Q . (14.108)
2
Usando a relação (14.101) teremos neste exemplo com simetria axial
1 1
Q(n̂) = − Q nx x̂ − Q ny ŷ + Q nz ẑ
2 2
e
9 2 2 9
|[n̂ × Q(n̂)] × n̂|2 = Q nx + n2y n2z = Q2 sen2 θ cos2 θ ,
4 4
“Z_2” — 2017/9/5 — 8:19 — page 383 — #403
em que θ é o ângulo polar medido em relação ao eixo de simetria. Portanto, a distribuição angular da
potência irradiada será dada pela expressão
dP ck6 2
= Q sen2 θ cos2 θ . (14.109)
dΩ 128π
Nota-se que, em virtude da simetria azimutal, esta expressão é independente do ângulo φ. A radiação cor-
respondente encontra-se na Fig. 14.1, também conhecida como radiação E2. A potência total será
Z
dP ck6 2
P = dΩ = Q
dΩ 240
ω6
= Q2 . (14.110)
240 c5
Para o átomo, a radiação de quadrupolo elétrica é muito pequena. Mas, nos sistemas nucleares, as
transições de dipolo magnético e do quadrupolo elétrico são comparáveis em magnitude, sendo muito mais
prováveis do que nos sistemas atômicos.
Exemplo: Pulsar de spin-down Como aplicação da radiação dipolo magnética consideraremos o modelo
oblíquo-rotador de um pulsar, i.e., uma estrela de neutrons rotativa que emite pulsos de radiação eletromag-
nética a intervalos regulares. Os pulsares (por exemplo, na nebulosa do Caranguejo) são observados a girar
com spin-down e se associamos a frequência de spin com a frequência de pulso, então podemos interpretá-la
em termos de um pulsar perdendo energia rotacional
1
E= I Ω2 ,
2
em que I é o momento de inércia da estrela e Ω sua velocidade angular. Se P denota o período de pulsos,
então Ω = 2π 2 2
P . Considerando a estrela de neutrons como uma esfera solida, então I = 5 M R . A perda de
energia de rotação traduz-se numa diminuição de
Ṗ
Ėrot = I Ω Ω̇ = −(2π)2 I .
P3
~ 1
B(t) = 3 [3(~ ~ ].
m · n̂)n̂ − m
R
“Z_2” — 2017/9/5 — 8:19 — page 384 — #404
~,
O campo é máximo no polo magnético, em que n̂ está alinhado com m
2m0
Bmáx = .
R3
O momento magnético variando no tempo produz uma radiação de dipolo magnético que leva energia para
longe da estrela a uma taxa dada pela Eq. (14.93)
1 ¨ 2
Ėrad = ~m .
3c3
Assim,
1 1
Ėrad = 3
(m0 Ω2 sen α)2 = · · · = (Bmáx Ω2 R3 sen α)2
3c 12c3
e se estabelecermos que Ėrad = Ėrot , temos
que é grande, mas não sem razão. A principal razão vem da sequência da estrela, que normalmente suporta
um campo magnético de 103 Gauss, se o campo está congelado na estrela durante o colapso, o fluxo
magnético 4πR2 B será conservado. Assim, por causa da redução de R por um fator 105 , o campo B
aumentará por um fator de 1010 .
ω
k= c, a densidade de corrente é
~J(~r) = I sen kd
− k|z| δ(x) δ(y) ẑ , (14.111)
2
em que |z| < d2 . As funções delta asseguram que a corrente flui somente ao longo do eixo z.
Usando a densidade de corrente dada acima, o potencial vetor terá a direção de z. Assim, na região de
radiação tomará a forma
Z
~ Iei kr +d/2 kd ′
A(~r) = ẑ sen − k|z | e− i kz cos θ dz ′ .
′
(14.112)
cr −d/2 2
“Z_2” — 2017/9/5 — 8:19 — page 385 — #405
Sendo que o campo magnético na região de radiação é ~ ~ a potência média irradiada por
B = i k n̂ × A,
unidade de ângulo sólido será
kd 2
dP I 2 cos kd2 cos θ − cos 2
= . (14.114)
dΩ 2πc sen θ
Esta distribuição angular depende do valor kd. No limite de comprimentos de onda longos, kd ≪ 1, é
fácil mostrar que o resultado se reduz à forma (14.72) para um dipolo elétrico. É instrutivo verificar isto
explicitamente. Com esta finalidade nota-se que, sendo kd ≪ 1, podemos expandir as funções cosseno
obtendo
dP I 2 d4 k4
= sen2 θ . (14.115)
dΩ 128πc
Mas, usando a equação de continuidade ∇ ~ · ~J = i ωρ, podemos escrever a densidade de carga como
1 ~ ~ 1 ∂J
ρ= ∇·J = .
iω i kc ∂z
Assim, o momento do dipolo elétrico que é paralelo ao eixo z, terá o módulo
Z Z
1
p= z ′ ρ d3 r ′ = J d3 r ′ ,
kc
em que integramos por partes e usamos o fato de que a corrente se anula nas extremidades. Usando a
expressão (14.111), obteremos no limite kd ≪ 1 o resultado
Id2
p= .
4c
Substituindo então a corrente I em termos de p na Eq. (14.115), obteremos precisamente a expressão (14.72)
para o dipolo elétrico.
Para os valores especiais kd = π (ou 2π), correspondendo a uma metade (ou duas metades) do compri-
mento de onda da oscilação da corrente ao longo da antena, a distribuição angular (14.114) será
cos2 π cos θ
(2 )
, kd = π
dP I
2 sen2 θ
= (14.116)
dΩ 2πc
2 cos4 ( π2 cos θ)
sen2 θ
, kd = 2π .
A distribuição de meia-onda é bastante semelhante à de um dipolo elétrico simples, a distribuição de onda
inteira é consideravelmente mais aguda.
Voltamos a discutir a antena de meia-onda para calcular a potência total irradiada. Usando a Eq. (14.114)
com kd = π, temos
dP I 2 cos2 π2 cos θ
= . (14.117)
dΩ 2πc sen2 θ
Mas, sabemos que dΩ = 2π sen θ dθ, e integrando a equação acima em θ teremos a potência total irradiada
da antena. Assim, Z Z
dP I 2 π cos2 π2 cos θ
P = dΩ = dθ . (14.118)
dΩ c 0 sen θ
“Z_2” — 2017/9/5 — 8:19 — page 386 — #406
Para resolver a integral desta equação vamos fazer a substituição da variável cos θ → u e usar o fato de
π 1 + cos (πu)
cos2 u = ,
2 2
novamente, fazendo outra substituição de variável 1 + u → πv . Então, temos
Z π Z +1 Z
cos2 π2 cos θ cos2 π2 u 1 +1 1 + cos (πu)
dθ = du = du
0 sen θ −1 1 − u2 2 −1 (1 + u)(1 − u)
Z Z
1 +1 1 + cos (πu) 1 +1 1 + cos (πu)
= du + du
4 −1 (1 + u) 4 −1 (1 − u)
Z Z
1 +1 1 + cos (πu) 1 2π 1 − cos v
= du = dv
2 −1 (1 + u) 2 0 v
1
= [γ + ln 2π − Ci(2π)]
2
≈ 1, 22 , (14.119)
~ ′ ′
em que n̂ = RR (R = |~r − ~r |) e a notação [· · · ] denotam valores de retardo, i.e., é uma função de ~r e
′ ′
evoluem no tempo de retardo t = t − |~r −~r |/c = t − R/c dentro do colchete. Nota-se que,
~ ′ ~ ′ ′ ′ ∂Ji (~r′ , t′ ) 1 ′
∇ · [J] = ∂i Ji (~r , t ) t′ =t−R/c + × − ∂i R
∂t′ t′ =t−R/c c
h i h i R h i n̂
~ ′ · ~J + J˙i i ˙
= ∇ = − [ρ̇] + ~J · , (14.122)
cR c
7
Lorenzo Mascheroni (1750-1800), matemático italiano.
Um estudo moderno da constante de Euler-Mascheroni poderá ser encontrado no artigo J. C. Lagarias, Bulletin of the American
Mathematical Society, 50, n. 4, 527-628 (2013).
8
M. Abramowitz and I. A. Stegun, Handbook of mathematical functions (1965).
9
W. K. H. Panofsky and M. Phillips, Classical electricity and magnetism (1962); J. D. Jackson, Classical electrodynamics, 3rd ed.
(1999); K. T. MacDonald, American Journal of Physics, 65, n. 11, 1074-1076 (1997); R. de Melo e Souza, M. V. Cougo-Pinto,
C. Farina and M. Moriconi, American Journal of Physics, 77 N.1, 67-72 (2009).
“Z_2” — 2017/9/5 — 8:19 — page 387 — #407
em que Ri = ri − ri′ e também usamos a equação de continuidade para realizar a última passagem. Da Eq.
(14.122) temos
h i n̂
~ ′ · [~J] + ~J˙
[ρ̇] = −∇ · ,
c
na qual substituindo no segundo termo do lado direito da Eq. (14.121) encontraremos,
h i
Z Z ∇ ~ ′ · [~J] n̂ Z ~J˙ · n̂ n̂
1 [ρ̇] n̂ 3 ′ 1 3 ′ 1
d r =− d r + 2 d3 r ′ . (14.123)
c R c R c R
O primeiro termo do lado direito da Eq. (14.123) é proporcional a R12 , de modo que não contribui para o
campo de radiação. Observa-se que
Z ∇ ~ ′ · [~J] n̂ Z
1 3 ′ êk Rk 3 ′
− d r =− ∂i′ [Ji ] d r
c R c R2
Z Z
êk ′ Rk 3 ′ êk ′ Rk
=− ∂i [Ji ] 2 d r + [Ji ] ∂i d3 r ′ (14.124)
c R c R2
Z
êk 2 Ri δki
=0+ [Ji ] Rk 3 − 2 d3 r ′ ,
c R R R
pois o termo de superfície que aparece na primeiro termo do lado direito da Eq. (14.124) anula-se porque
as fontes são localizadas. Assim,
Z ∇ ~ ′ · [~J] n̂ Z 2 [~J] · n̂ n̂ − [~J]
1 1
− d3 r ′ = d3 r ′
c R c R2
Z [~J] · n̂ n̂ + [~J] × n̂ × n̂
1
= d3 r ′ , (14.125)
c R2
em que usamos a identidade vetorial (~a × ~b) ×~c = (~a ·~c)~b − (~b ·~c)~a. Substituindo a Eq. (14.125) na Eq.
(14.123) e inserindo seu resultado na Eq. (14.121), obtemos
Z Z [~J] · n̂ n̂ + [~J] × n̂ × n̂
~E(~r, t) = [ρ] n̂ 3 ′ 1
d r + d3 r ′
R2 c R2
Z [~J˙ ] · n̂ n̂ Z ~˙
1 1 [J] 3 ′
+ 2 d3 r ′ − 2 d r
c R c R
Z Z [~J] · n̂ n̂ + [~J] × n̂ × n̂ Z [~J˙ ] × n̂ × n̂
[ρ] n̂ 3 ′ 1 1
= 2
d r + 2
d3 r ′ + 2 d3 r ′ ,
R c R c R
(14.126)
que é a equação procurada para nossos propósitos. Se considerarmos fontes arbitrárias variáveis no tempo
em repouso e usar as Eqs. (8.108) e (14.126), os campos elétricos e magnéticos de radiação (transversal) é
dado por,
Z ~˙
~ 1 [ J ] × n̂ 3 ′
Brad (~r, t) = 2 d r
c R
(14.127)
Z [~J ˙
] × n̂ × n̂
~Erad (~r, t) = 1 d3 r ′ .
c2 R
“Z_2” — 2017/9/5 — 8:19 — page 388 — #408
Pode-se mostrar que, para fontes variáveis no tempo em movimento, a Eq. (14.127) nos dá os campos de
radiação mais termos adicionais não radiativos da ordem O(1/R2 ). Podemos tomar como exemplo um
dipolo de Hertz acelerado, assim a integração da Eq. (14.127) produzirá campos de radiação além dos
termos não radiativos da ordem O(1/R2 ) que serão induzidos pelo movimento do dipolo.10
Na zona de radiação, podemos escrever
1 1
n̂ ≃ r̂ , ≃ e R ≃ r − r̂ ·~r′ ,
R r
em que r = |~r|. Substituindo essas aproximações em (14.127), temos
Z
~ 1 ˙
~J r̂ ·~r′
Brad (~r, t) ≃ 2 ~r′ , t0 + × n̂ d3 r ′
c r c
Z
~Erad (~r, t) ≃ 1 ˙
~J ′ r̂ ·~r′
~r , t0 + × n̂ × n̂ d3 r ′
c2 r c
⇒
~Erad (~r, t) = ~
Brad (~r, t) × n̂ , (14.128)
em que t0 = t − r/c. Assim, estamos com as ferramentas para os cálculos das primeiras contribuições para
os campos de radiação.
Contribuição do Dipolo Elétrico A contribuição, de ordem mais baixa, para os campos de radiação vem
do termo do dipolo elétrico. Para simplicidade, calcula-se a contribuição, de menor ordem, para o campo
(1)
magnético de radiação, denotado ~Brad ,
Z
~ (1) 1 3 ′ ~˙ ′
Brad = 2 d r J (~r , t0 ) × r̂ . (14.129)
c r
~ ′ x′ e para um vetor qualquer ~v = êi vi = êi (~v · êi ), com i = 1, 2, 3. Da equação anterior
Usando êi = ∇ i
temos,
Z Z Z
˙ ˙ ˙
d3 r ′ ~J (~r′ , t0 ) = êi d3 r ′ ~J (~r′ , t0 ) · êi = êi d3 r ′ ~J (~r′ , t0 ) · ∇
~ ′ x′
i
Z Z
~ ′ · x′i ~J ˙ ′ ˙ ′
~ ′ · ~J
= êi d3 r ′ ∇ (~r , t0 ) − êi d3 r ′ x′i ∇ (~r , t0 ) , (14.130)
em que na última passagem integramos por partes. Como consideramos fontes localizadas, a primeira inte-
gral do lado direito da Eq. (14.130) se anula. A segunda integral pode ser convertida em uma forma mais
r′ ,t0 ) (~r′ ,t0 )
conveniente, se usarmos a equação de continuidade e a relação ∂ρ(~∂t = ∂ρ∂t 0
,
2 ′
~ ′ · ~J˙ (~r′ , t0 ) = ∂ ρ(~r , t0 ) .
∇ (14.131)
∂t 2
Contribuição do Dipolo Magnético Para calcular o próximo termo, precisamos ter em consideração o
segundo termo da expansão,
˙
~J r̂ ·~r′ ˙ r̂ ·~r′ ~¨ ′
′
~r , t0 + ≈ ~J (~r′ , t0 ) + J (~r , t0 ) .
c c
Substituindo na primeira relação dada nas Eqs. (14.128) e identificando a próxima ordem de contribuição
(2)
com o campo magnético de radiação, ~ Brad , temos
Z
(2) 1 3 ′ ~¨
~
Brad = 3 ′
d r J (~r , t0 ) r̂ ·~r ′
× r̂ . (14.134)
c r
Por razões que se tornarão claras, vamos dividir a integral da Eq. (14.134) em contribuições antissimétrica
e simétrica sob a troca de ~J e~r′ . Este rearranjo irá dar origem aos termos de dipolo magnético e quadrupolo
elétrico originários da expansão multipolar para os campos de radiação.
¨ ¨ ¨
Nota-se que, fazendo ~J (~r′ , t0 ) (r̂ ·~r′ ) = 12 ~J (~r′ , t0 ) (r̂ ·~r′ ) + 12 ~J (~r′ , t0 ) (r̂ ·~r′ ) e somando e subtraindo
h i
1 ~¨ ′ ′
2 J (~r , t0 ) · r̂ ~r na integral (14.134), temos
Z h i
(2) 1 1 ¨ ¨
~
Brad = 2 d3 r ′ ~J (~r′ , t0 ) r̂ ·~r′ − ~J (~r′ , t0 ) · r̂ ~r′ × r̂
c r 2c
Z h i
1 1 3 ′ ~¨ ′
¨ ′
+ ′ ~
d r J (~r , t0 ) r̂ ·~r + J (~r , t0 ) · r̂ ~r′ × r̂ . (14.135)
c2 r 2c
em que
Z ¨
¨ (t0 ) = ~r′ × ~J (~r′ , t0 )
~m d3 r ′
2c
é a derivada segunda, no tempo, do momento dipolo magnético da distribuição de carga em um tempo
“Z_2” — 2017/9/5 — 8:19 — page 390 — #410
Contribuição do Quadrupolo Elétrico Agora, consideremos o termo simétrico da Eq. (14.135). Assim,
Z h i
(2s) 1 1 ¨ ¨
~
Brad = 2 d3 r ′ ~J (~r′ , t0 ) r̂ ·~r′ + ~J (~r′ , t0 ) · r̂ ~r′ × r̂ . (14.138)
c r 2c
Trabalhando com a primeira integral da equação anterior, como já fizemos antes, temos
Z Z Z
3 ′ ~¨ ′
′ ~¨ ′
¨
d r J (~r , t0 ) r̂ ·~r = êi d r r̂ ·~r J (~r , t0 ) · êi = êi d3 r ′ r̂ ·~r′ ~J (~r′ , t0 ) · ∇
′ 3 ′ ~ ′ x′i .
O lado esquerda da Eq. (14.140) é a integral na Eq. (14.138). Escrevemos o fator 12 da Eq. (14.138) como 63
e obtemos,
3 Z
(2s) 1 ∂ ′
~
Brad = 3 3 ′ ′ ′
d r 3r̂ ·~r ~r ρ(~r , t0 ) × r̂
6c r ∂t3
3 Z h i
1 ∂ 3 ′ ′
′ ′2 ′
= 3 d r 3r̂ ·~r ~r + r r̂ ρ(~r , t0 ) × r̂ , (14.141)
6c r ∂t3
em que incluímos, na última passagem, o termo r ′ 2 r̂ρ(~r′ , t0 ), com r ′ = |~r′ |, na qual esta contribuição se
anula devido r̂ × r̂ = 0, não alterando assim, a relação original. Definindo a transformação Q, i.e., o
momento quadrupolo, como
Z h i
2
Q(~ξ, t) = d3 r ′ 3~ξ ·~r′ ~r′ + r ′ ~ξ ρ(~r′ , t) . (14.142)
“Z_2” — 2017/9/5 — 8:19 — page 391 — #411
~ (2s)1 ...
Brad = Q(r̂, t0 ) × r̂ , (14.143)
6c3 r
que é a contribuição simétrica para o campo magnético. Já, a correspondente contribuição simétrica para o
campo elétrico será,
h ... i
~E(2s) = 1 Q(r̂, t0 ) × r̂ × r̂ . (14.144)
rad 6c3 r
Observação - Os campos de radiação elétrica quadrupolar dados em (14.143) e (14.144), junto com os
campos de radiação magnética dipolar dados por (14.137), são as primeiras correções para os termos
de ordem principal dados pelas Eqs. (14.132) e (14.133). Neste sentido, podemos escrever as primei-
ras contribuições multipolares para a expansão multipolar para os campos de radiação de uma fonte
completamente arbitrária, mas localizada, variável no tempo mas em repouso no vácuo como
h i
~ 1 ¨ ¨ 1 ...
Brad (~r, t) = 2 ~p (t0 ) × r̂ + m ~ (t0 ) × r̂ × r̂ + Q(r̂, t0 ) × r̂ + · · ·
c r 3c
~Erad (~r, t) = ~
Brad (~r, t) × r̂ .
Com estes campos de radiação, pode-se calcular o vetor de Poynting correspondente e a potência
irradiada pela fonte.
da velha União Soviética como sendo uma parte importante da expansão multipolar até a década de 1990
e permaneceu negligenciado por grande parte da comunidade de pesquisa, mesmo nos anos 1990 e início
dos anos 2000.18 Porém, na literatura didática temos um artigo que apresenta a expansão eletromagnética
multipolar completa em duas considerações: (i) a validade para todos os pontos no espaço, e (ii) reconhece
a existência de momentos toroidais.19 Em 2012, o livro de Zangwill20 apresenta uma breve discussão da
violação da paridade e do momento anapolo.21 Assim, já em tempo, vamos incorporar esses tópicos em um
texto avançado de eletrodinâmica clássica.
Figura 14.5 (A) dipolo elétrico, (B) dipolo magnético e (C) dipolo toroidal.
toroidal.
A causa formal dos momentos toroidais é a representação do campo de vórtice (neste caso, da compo-
nente da densidade de corrente transversal ~J⊥ (~r, t), i.e., de uma função para a qual ∇
~ · ~J⊥ ≡ 0), sob a forma
da soma
~J(~r, t) = ∇
~ × [~rψ (~r, t)] + ∇ ~ ×∇~ × [~rχ(~r, t)] ,
em que ψ (~r, t) e χ(~r, t) são respectivamente funções pseudoescalar e escalar. A expansão de ψ (~r, t) em
harmônicos esféricos radiais gera uma família de funções multipolares magnéticas, dentre as quais um dos
geradores é o momento dipolar magnético m ~ , desde que podemos usar para construir todos os momentos
superiores desta família: Mik = ri Mk + rk Mi , etc. Uma expansão semelhante para χ(~r, t) gera uma família
de momentos multipolares toroidais.22 O momento gerador na família toroidal é o momento dipolar toroidal
T , i.e., o termo toroidal de ordem mais baixa. Sua grandeza ao longo da direção i é dada por
Z h i
1
Ti = ri ~r · ~J − 2r 2 Ji d3 r .
10c
18
M. Ya Agre, Physics - Uspekhi, 54 (2), 167-180 (2012).
19
A. Góngora-T and E. Ley-Koo, Revista Mexicana de Física, 52 (2), 188-197 (2006).
20
Andrew Zangwill (1954- ), físico americano.
21
A. Zangwill, Modern electrodynamics (2012).
22
V. M. Dubovik and A. A. Cheskov, Soviet Journal of Particles and Nuclei, 5, 318-337 (1974); V. M. Dubovik, L. A. Tosunyan and
V. V. Tugushev, Soviet Physics - Journal of Experimental and Theoretical Physics (JETP), 63 (2), 344-351 (1986); V. M. Dubovik
and V. V. Tugushev, Physics Reports, 187 No. 4, 145-202 (1990).
“Z_2” — 2017/9/5 — 8:19 — page 393 — #413
Uma vez que este termo surge apenas numa expansão da densidade de corrente para a segunda ordem, ele
geralmente desaparece numa aproximação de comprimento de onda longo. Importante, o dipolo toroidal
não caracteriza nenhum dos polos da carga (desde que é puramente uma excitação de corrente), nem dos
polos magnéticos onde as linhas de campo magnético parecem divergir ou convergir. Além disso, o dipolo
~
toroidal interage diretamente somente com condução externa, ~Jext , e correntes de deslocamento, ∂∂tD , ou, de
forma equivalente, com um vórtice de campo magnético, ∇ ~ ×~ B, como segue da expressão para a energia
de sua interação com campos eletromagnéticos 23
!
4π ~ ~
∂D
WT = −T · Jext + .
c ∂t
Na prática, o momento dipolo toroidal poderia ser medido com base no binário de uma pequena bobina
toroidal colocada entre as placas de um condensador. Podemos também mencionar que este sistema é um
motor eletromagnético de um terceiro tipo, os dois primeiros significam um dipolo magnético girando em
um campo magnético e um dipolo elétrico girando em um campo elétrico. Um quarto tipo de motor poderia
ser concebido com base no momento toroidal axial. Outros não são dados em R3 . Enfim, estas construções
podem ser úteis em considerações de sistemas moleculares e microbiológicos.
Na matéria condensada, a ordem toroidal magnética pode ser induzida por diferentes mecanismos: 24
• Ordem de spins localizados quebram a inversão espacial e a inversão de tempo. O momento toroidal
resultante é descrito por uma soma dos produtos vetoriais ~Si dos íons magnéticos e suas
P dos spins
posições~ri dentro da unidade de célula magnética, T = i ~ri × ~Si . 25
• Correntes em loops orbitais foram propostos em supercondutores de óxidos de cobre 27 que podem ser
importantes para entender a supercondutividade a alta temperatura. A verificação experimental da
quebra de simetria por tais correntes orbitais foi reivindicada em cupratos, i.e., compostos de óxido
de cobre, através do espalhamento de nêutrons polarizados. 28
Expansão das Densidades de Corrente Além da densidade de carga, um sistema não estático também é
descrito por uma densidade de corrente ~J(~r, t). Assim como podemos expandir a densidade de carga ρ(~r, t),
podemos fazer uma expansão multipolar das componentes espaciais da corrente. Como resultado, aparecem
três famílias de momentos adicionais e seus raios. No entanto, no âmbito da eletrodinâmica, devemos levar
em consideração a lei de conservação,
~ · ~J = −ρ̇ .
∇ (14.145)
É conveniente realizar este vínculo em termos da expansão multipolar usando o teorema de Helmholtz.
Este teorema, mostra que o conhecimento da divergência e do rotacional de um campo vetorial é condição
23
V. M. Dubovik and A. A. Cheskov, Soviet Journal of Particles and Nuclei, 5, 318-337 (1974).
24
N. A. Spaldin, M. Fiebig and M. Mostovoy, Journal of Physics: Condensed Matter, 20 (43), 434203 (2008).
25
C. Ederer and N. A. Spaldin, Physical Review, B76, 214404 (2007).
26
Classe de material multifuncional, dentre a classe de materiais multifuncionais encontram-se aqueles que possuem duas ou
mais ordens ferróicas, ou seja, os multiferróicos. As ordens ferróicas que um material multiferróico pode possuir são: a fer-
roeletricidade, o ferro/antiferromagnetismo e/ou a ferroelasticidade. Ver V. Scagnoli, U. Staub, Y. Bodenthin, R. A. de Souza,
M. Garcia-Fernandez, M. Garganourakis, A. T. Boothroyd, D. Prabhakaran and S. W. Lovesey, Science, 332 (6030), 696-698
(2011).
27
C. M. Varma, Physical Review, B73 (15), 155113 (2006).
28
B. Fauqué, Y. Sidis, V. Hinkov, S. Pailhès, C. T. Lin, X. Chaud and P. Bourges, Physical Review Letters, 96 (19), 197001 (2007).
“Z_2” — 2017/9/5 — 8:19 — page 394 — #414
suficiente para atender o campo vetorial em todo o espaço. Além disso, o campo pode ser decomposto
em uma parte irrotacional e uma parte solenoidal, i.e., longitudinal e transversal, respectivamente. Logo,
usando este teorema, podemos representar ~J na forma
em que ~Jk = ∇ϕ
~ (portanto ∇ ~ × ~f , em que a função vetorial ~f satisfaz a condição de
~ × ~Jk = 0) e ~J⊥ = ∇
calibre
~ ·~f = 0 .
∇ (14.147)
~ · ~Jk = −ρ̇ .
∇ (14.148)
Assim, segue-se que a expansão da parte longitudinal da corrente ~Jk , i.e., os parâmetros de expansão da
função escalar ϕ introduzida acima, é determinada pelas derivadas temporais dos momentos multipolares
e seus raios, caracterizando a densidade de carga ρ(~r, t); em segundo lugar, em vista da relação (14.148),
permanecem duas componentes independentes do vetor ~f ; seus parâmetros de expansão definem ~J⊥ . Uma
vez que não há mais vínculos do tipo (14.145) e (14.147), concluímos que a componente transversal da
corrente ~J⊥ está caracterizada por duas famílias de momentos que são independentes dos momentos de
carga. Nota-se que estes vínculos são diferenciais; eles são transformados em relações algébricas, indo ao
espaço dos vetores de onda ~k, em que ~Jk (~k) é realmente colinear com ~k e ~J⊥ (~k) é ortogonal a ele. No
espaço de coordenadas, tem a relação não local
Z
~J⊥ = ~J − ~Jk = ~J − ∇~ ρ̇(~r′ , t) 3 ′
d r .
|~r −~r′ |
De fato, existe uma formulação da eletrodinâmica em que os momentos de carga estão, em geral, ausentes
devido a ρ ≡ 0 ou ρ̇ ≡ 0, o que não diminui o número de componentes do vetor ~J⊥ . No entanto, as
condições ρ ≡ 0, ∇ ~ · ~J = 0 não são compatíveis para as quadricorrentes na eletrodinâmica de Maxwell-
-Lorentz. Eles são válidos apenas em formulações fenomenológicas, como na eletrodinâmica de Ampère.
Obviamente, neste ponto, será conveniente fazer uma nova decomposição, por meio de certos critérios,
do campo solenoidal ~J⊥ em uma soma de dois campos, cada um deles especificado pela ação de operadores
diferenciais em campos escalares. Isto indica o fato de que em R3 , qualquer campo solenoidal pode ser
representado como uma soma de dois campos vetoriais,
~J⊥ = Mψ
~ (r, θ, φ) + ∇
~ × Mχ
~ (r, θ, φ) , (14.149)
em que M ~ =: −~r × ∇ ~ ≡ i ~L. A primeira parte, do lado direito da equação anterior, descreve as correntes
toroidais, i.e., fluindo ao longo dos paralelos em uma esfera, e a segunda parte descreve as correntes poloi-
dais, i.e., fluindo em um toro ao longo dos meridianos. Nota-se que as funções ψ e χ para uma propriedade
fixa de ~J⊥ sob reflexões espaciais são um escalar e um pseudoscalar, respectivamente.
Uma decomposição semelhante foi desenvolvida por Neumann em problemas de física matemática, e
mais tarde por Debye.29 Assim, escrevemos o teorema de Helmholtz da seguinte forma: 30
~J = ∇ϕ
~ +∇
~ × (~rψ) + ∇
~ ×∇
~ × (~rχ) . (14.150)
29
Petrus Josephus Wilhelmus (Peter Joseph William) Debye (1884-1966), químico e físico holandês-americano.
30
Para o trabalho de F. Neumann ver P. M. Morse and H. Feshbach, Methods of theoretical physics, Vol. II (1953); Para os
potenciais de Debye, ver P. Debye, Annalen der Physik (Series 4), 30, 57-136 (1909).
“Z_2” — 2017/9/5 — 8:19 — page 395 — #415
Usando estes operadores diferenciais, as operações de projeção e comutação são válidas, i.e.,
~ ·M
∇ ~ = ~r · M
~ =∇ ~ ·N
~ =M ~ ·N~ = 0, ~ = −M
~r · N ~ 2, ~
M△ = △M ~ ,
~
N△ ~ ,
= △N ~M
∇ ~ 2−M
~ 2∇
~ = 2N
~ + 2∇
~ , etc.
Assim, encontramos
M~ ·~f ⊥ = M
~ 2ψ , ~r ·~f ⊥ = −M
~ 2f .
Se ~f = ~f k + ~f ⊥ , as operações de projeção dão ~f k ≡ ∇ϕ
~
~ ·~f = ∇2 ϕ ,
∇ ~ ·~f = M
M ~ 2ψ , ~r ·~f = −M
~ 2 ψ + ~r · ∇
~ ϕ.
Como o operador ∇ ~ anula qualquer constante e o operador momentum angular i M ~ anula qualquer
~
função esférica simétrica, vemos que sem alterar f podemos mudar o usual potencial escalar elétrico
ϕ e os chamados potenciais de Debye ψ e χ da seguinte forma,
ψ (r, θ, φ) → ψ (.) + η (r) , χ(r, θ, φ) → χ(.) + ν (r) , ϕ(r, θ, φ) → ϕ(.) + C .
Então, quando conhecemos os potenciais ψ, χ e ϕ, a distribuição f (r) é construída com uma precisão
de duas funções escalares dependente somente da variável radial, η (r) e ν (r) e uma constante. Em
outras palavras, as partes isotrópicas de ψ e χ não são fixas, mas a representação de Neumann-Debye
tem consideravelmente menos liberdade do que a representação de Helmholtz geralmente aplicada
através dos potenciais A~ e ϕ. Nota-se também que, sob as condições
Z Z
dΩ ψ = dΩ χ = 0
S⊂⊙ S⊂⊙
a escolha dos potenciais transversais será única. As expansões nas funções esféricas satisfazem estas
condições automaticamente, i.e., em toda superfície esférica concêntrica com a origem (S ⊂ ⊙).
Para campos axiais ψ = ψ (r, θ) e χ = χ(r, θ), é fácil mostrar que, com os operadores M~ eN ~ atuando
sobre estas funções, obteremos as distribuições de correntes toroidal e poloidal, respectivamente. De
fato, nesse caso, em coordenadas esféricas, a distribuição ~Lψ (r, θ) será
~ (r, θ) ×~r = − ∂ψ φ̂ .
~f = ∇ψ
∂θ
Portanto, as linhas de correntes da distribuição representam círculos, r = constante, θ = constante,
centrados no eixo de simetria.
Desde que N~ =: ∇ ~ × ~L, em coordenadas esféricas, a distribuição Nψ
~ (r, θ) será
~f = −∇~ × ∂χ φ̂ = 1 cot θ + ∂ ∂χ r̂ − 1 + ∂ ∂χ θ̂ .
∂θ r ∂θ ∂θ r ∂r ∂θ
Na Fig. 14.6, temos as linhas de correntes poloidais em uma seção da esfera ao longo de φ = constante
(planos meridionais) para o dipolo toroidal (Fig. 14.6-a) e para o quadrupolo toroidal (Fig. 14.6-b), e,
da seção da esfera ao longo de θ = constante para o dipolo magnético (Fig. 14.6-c).
“Z_2” — 2017/9/5 — 8:19 — page 396 — #416
Figura 14.6 Linhas de correntes poloidais em uma esfera ao longo de φ = constante, (a) dipolo toroidal
e (b) quadrupolo toroidal; e ao longo de θ = constante (c), dipolo magnético.
Derivação da Expansão Multipolar numa Base Canônica Assim, para obtermos a radiação da expansão
multipolar vamos expandir as fontes, ρ(~r, t) e ~J(~r, t), em relação aos momentos multipolares e seus raios,
i.e., vamos fazer a expansão de três funções escalares ϕ, ψ e χ. Um sistema adequado para isto é fornecido
pelas soluções da equação de onda escalar de Helmholtz, 31
p il
fl (z) = (2π)3 √ Il+ 1 (z) , sendo z = kr .
z 2
R
Substituindo na densidade de carga ρ(~r, t) = ρ(~r′ , t)δ(~r′ −~r) d3 r ′ , temos a forma
r
1 X (− i k)l 4π
ρ(~r, t) = Flmk (~r)Qlm (k2 , t) . (14.153)
(2π)3 (2l − 1)!! 2l + 1
l,m,k
A expansão da distribuição multipolar de carga, i.e., os fatores de forma Qlm (k2 , t), em uma série de Taylor
(2n)
em k2 nos dá o 2l -momento de carga total Qlm (0, t) e seu raio na potência 2n, i.e., Qlm (0, t). A partir da
expansão da função ψ (~r, t) em Flmk (~r), Eq. (14.150), temos as definições dos fatores de forma magnético,
i.e., distribuição multipolar magnética Mlm (k2 , t), como
r Z
2 (2l − 1)!! 2l + 1 ~ F ∗ (~r) · ~J(~r, t) d3 r ,
Mlm (k , t) = − ~r × ∇ lmk (14.155)
(− i k)l (l + 1) 4π
e, os fatores de forma elétrico transversal, ou distribuição multipolar elétrica transversal Elm (k2 , t), vem
da expansão da função χ(~r, t).
A parte não trivial do problema de expansão multipolar é o estudo do fator de forma de Elm (k2 , t). 32
O resultado principal desse estudo é que os fatores de forma elétrico transversal são somas de dois termos
independentes,
1
Elm (k2 , t) = Q̇lm (0, t) + k2 Tlm (k2 , t) , (14.156)
c
em que Q̇lm (0, t) são associadas com a expansão de ρ̇(~J⊥ ), i.e., a parte escalar longitudinal da corrente,
dadas por Z
√
Q̇lm (0, t) = 4πl r l−1 Y ∗l l−1 m (r̂) ~J(~r, t) d3 r . (14.157)
Nota 1 A expansão multipolar de um vetor corrente é obtida por meio de vetores harmônicos, que são
ortonormais e completas, analogamente as Eqs. (14.152). A base da expansão de ~J(~r, t) é introduzida
da seguinte forma:
(−) i ~
F lmk (~r) = − ∇F lmk (~r)
k
(0)
~L
F lmk (~r) = p Flmk (~r)
l(l + 1)
(+) 1 ∇ ~ × ~L
F lmk (~r) = − p Flmk (~r)
k l(l + 1)
e
Ylm (~r) = r l Ylm (r̂) .
Ainda podemos estabelecer que o vetor r l−1 Y l l−1 m (r̂), dado na Eq. (14.157), tem propriedades
notáveis, ou seja, é simultaneamente longitudinal e transversal,
satisfazendo a equação de Laplace. Este vetor também é poloidal, i.e., pode ser representado na forma
√
~ × ~Lr l Ylm (r̂) .
i(l + 1) 2l + 1 r l−1 Y l l−1 m (r̂) = ∇
É pela razão apresentada no final desta nota, que tanto Q̇lm (k2 , t) e Elm (k2 , t) contêm nas suas definições
r l−1 Y l l−1 m (r̂) como os harmônicos mais baixos; os momentos Q̇lm (0, t) são distinguidos no limite de
comprimento de onda longo kr ≪ 1.
32
Este fator foi primeiramente desenvolvido de forma correta por V. M. Dubovik and A. A. Cheshkov, Fiz. Elem. Chastits At.
Yadra, 5, 792 (1974) [Sov. J. Particles and Nuclei, 5, 318 (1975)].
“Z_2” — 2017/9/5 — 8:19 — page 398 — #418
O termo Tlm (k2 , t) que aparece na Eq. (14.156) define os fatores de forma toroidal, i.e., distribuição
multipolar toroidal, 33
r r
2 (2l − 1)!! l 2l + 1
Tlm (k , t) = −
c(− i k)l+1 l + 1 4π
Z r !
∗ (+) 4π(− i kr)l−1 l+1 ∗
× F lmk (~r) − Y (r̂) · ~J(~r, t) d3 r (14.158)
(2l − 1)!! 2l + 1 l l−1 m
Pela Eq. (14.158), nota-se que ~J(~r, t) é, de fato, aqui vinculado com um vetor poloidal, enquanto a expressão
para T1m (0, t) transformada na base ortogonal é idêntica à definição de T na forma,
Z h i
1
T = ~r ~r · ~J − 2r 2~J d3 r .
10c
Os momentos toroidais Tlm (0, t) contribuem para a radiação El, como Q̇lm (0, t), mas duas ordens de gran-
deza superiores em relação a kr.
Nota 2 Em todos os textos clássicos conhecidos,34 a aproximação de comprimento de onda longo da ex-
pansão multipolar leva a perda de informação sobre os momentos toroidais. Podemos demostrar isto
analisando as operações da parte elétrica transversal,35
Z Z
~ ∗ ~ ~ 1 ∗ ~ ~
3
fl Tlm ∇ × J d r = p fl Ylm L · ∇ × ~J d3 r
l(l + 1)
Z 1 ∂
i ∗ 2 ~ 2~ ~
=p fl Ylm ∇ ~r · J − r ∇ · J d3 r ,
l(l + 1) r ∂r
pois usamos o fato de que ~L · ∇~ × ~J = i ∇2 ~r · ~J − ~ · ~J . (a) Para resolvermos a
r2∇ i ∂
r ∂r
primeira integral, usaremos o teorema de Green (5.34) e escolhamos ψ = fl Y ∗ e φ = ~r · ~J lm
Z h i I h i
∗
fl Ylm ∇2 (~r · ~J) − (~r · ~J)∇2 (fl Ylm
∗
) dV = ∗
fl Ylm ∇(~r · ~J) − (~r · ~J)∇(fl Ylm
∗
) · n̂dS
V S
O volume de integração deve ser suficientemente grande para envolver as fontes, de modo que ~J = 0
na superfície que define o volume. Então
Z Z
∗
fl Ylm ∇2 ~r · ~J d3 r = ~r · ~J ∇2 (fl Ylm
∗
) d3 r .
33
V. M. Dubovik and A. A. Cheshkov, Fiz. Elem. Chastits At. Yadra, 5, 792 (1974) [Sov. J. Particles and Nuclei, 5, 318 (1975)];
V. M. Dubovik and V. V. Tugushev, Physics Reports, 187 No. 4, 145-202 (1990).
34
Como os excelentes textos já citados na nota de rodapé 11 deste capítulo.
35
Aqui usaremos o vetor esférico
~Tlm = p 1 ~LYlm ,
l(l + 1)
como ~L é hermitiano ~L† = ~L, teremos ~LYlm = Ylm
∗ ~
L.
“Z_2” — 2017/9/5 — 8:19 — page 399 — #419
O limite de comprimento de onda longo é tomado da seguinte forma, o termo contendo o produto
escalar ~r · ~J é omitido, pois é de ordem superior em kr e o primeiro termo é considerado no limite
kr ≪ 1. Para isso, usaremos
l−1 ′ ′
fl = fl−1 − fl−1 ⇒ rfl = (l − 1)fl−1 − rfl−1
r
usando l = l + 1 ⇒ rfl+1 = l fl − rfl′ ⇒ rfl′ = l fl − rfl+1 ,
tal que
Z
1 ∗
−p Ylm [(l + 1) fl − krfl+1 ] i ckρ d3 r
l(l + 1)
r Z Z
l+1 ∗ k
= fl Ylm ρ̇ d3 r − p ∗
rfl+1 Ylm ρ̇ d3 r .
l l(l + 1)
No lado direito, o primeiro termo define a parte escalar longitudinal, que é proporcional a Q̇lm (k2 , t).
O segundo termo tem um fator adicional kr, normalmente nos textos didáticos este termo é rejeitado
e Elm (k2 , t) é definido de forma igual como Q̇lm (k2 , t)
“Z_2” — 2017/9/5 — 8:19 — page 400 — #420
Esta conclusão é obviamente errada, pois, desta forma, ocorre que a parte elétrica transversal da
corrente é expressa pela expansão multipolar da parte longitudinal. Na realidade, de validade restrita
é apenas uma afirmação de que
Elm (k2 , t) k 2 →0
→ Q̇lm (0, t) .
Na verdade, Q̇lm (0, t) é determinado pela projeção da corrente no vetor fl−1 Y l l−1,m , que é longi-
tudinal e transversal. Se quisermos usar a diferença Elm (k2 , t) − Q̇lm (0, t) e somar todos os outros
termos no lado direito da relação
Z Z
~ × ~J d3 r = p i
fl ~T∗lm ∇ ∗
Ylm r
∂fl
+ fl i ckρ − k2 fl ~r · ~J d3 r ,
l(l + 1) ∂r
podemos nos convencer depois de cálculos bastante laboriosos que eles definem Tlm (k2 , t). 36
Nota 3 Nesta nota, vamos desenvolver um cálculo mais detalhado da relação Tlm (k2 , t) Para isso, faremos
uma cuidadosa análise da parte elétrica transversal 37
Z
i ∗ ∂fl ~
p Ylm r + fl i ckρ − k fl ~r · J d3 r
2
⇒
l(l + 1) ∂r
Z
ck 3 ∗ ∂ ik ~
= −p d r Ylm ρ (rfl ) + ~r · J fl . (14.160)
l(l + 1) ∂r c
Expressão similar é obtida na amplitude de multipolo da radiação elétrica aE (l, m) que encontramos
no excelente clássico do Prof. Jackson, em que tomamos a magnetização M ~ = 0, pois estamos
trabalhando no vácuo, ao contrário do texto do Jackson. O tratamento apresentado por Jackson, em
que o “campo de radiação” é considerado e estudado em relação às fontes, os momentos toroidais e
raios, lá escondidos, são, após cálculos, perdidos na aproximação de comprimento de onda longo.38
Usando nossa fonte harmônica ρ = ρ0 e− i ωt , temos ρ = cki ρ̇. Logo, a relação anterior será,
Z
i 3 ∗ ∂ 2 ~
=− p d r Ylm ρ̇ (rfl ) + k ~r · J fl . (14.161)
l(l + 1) ∂r
Usando √
∗ 1 3z sen kr cos kr
Y10 = √ , f1 = −
2 πr k2 r2 kr
∂
e calculando ∂r (rf1 ),
r Z sen kr cos kr
3 3 z cos kr sen kr 2 ~
= −i d r ρ̇ − 2 2 + sen kr + k ~r · J − .
8π r kr k r k2 r2 kr
(14.163)
36
V. M. Dubovik and A. A. Cheshkov, Fiz. Elem. Chastits At. Yadra, 5, 792 (1974) [Sov. J. Particles and Nuclei, 5, 318 (1975)].
37
E. E. Radescu and G. Vaman, Physical Review, E65, 046609 (2002).
38
J. D. Jackson, Classical electrodynamics, 3rd ed. (1999).
“Z_2” — 2017/9/5 — 8:19 — page 401 — #421
Uma vez que as duas integrais seguintes, contendo ρ̇, não podem ser relacionadas à momentos multi-
~ · ~J. Integrando por partes,
polares elétrico, devemos usar a relação de continuidade, ρ̇ = −∇
Z Z Z h i
3 2 3 ~ ~ 2 3
~
d r ρ̇r z = − d r ∇ · J r z = d r 2z r · J + r Jz ~ 2
Z Z Z h i
3 4 3 ~ ~
d r ρ̇r z = − d r ∇ · J r z = d3 r r 2 4z ~r · ~J + r 2 Jz .
4
De fato, na Eq. (14.167), as contribuições toroidais anteriormente ocultas fizeram sua aparição e todos
os raios quadráticos médios elétricos não-radiante provenientes do primeiro termo (ρ) e do segundo
termo (~r · ~J) na Eq. (14.160) se cancelam, como deveria: a primeira integral da Eq. (14.167) é a
componente z do momento dipolo toroidal,
Z h i
1
T = d3 r ~r ~r · ~J − 2r 2~J ,
10c
enquanto a segunda integral expressa apenas o (irradiando) primeiro raio quadrático médio da distri-
buição do dipolo toroidal na base cartesiana,
Z h i
1
R2 = d3 r 3r 2~J − 2~r ~r · ~J .
28c
em que Tz = T10 , R2 z = −(R2 )l=1,m=0 e a conexão entre as derivadas do fator de forma e o raio
quadrático médio, 39
d
2 (t) = 10
R10 T10 (k2 , t) k 2 =0
.
d(k2 )
ou seja, a parte não trivial do problema da expansão multipolar dos fatores de forma elétrico trans-
versal será dada pela soma de dois termos independentes,
1
Elm (k2 , t) ∼ Q̇lm (0, t) + k2 Tlm (k2 , t) , (14.171)
c
como esperado. 40
39
E. E. Radescu and G. Vaman, Physical Review, E65, 046609 (2002).
40
V. M. Dubovik and A. A. Cheshkov, Fiz. Elem. Chastits At. Yadra, 5, 792 (1974) [Sov. J. Particles and Nuclei, 5, 318 (1975)].
“Z_2” — 2017/9/5 — 8:19 — page 403 — #423
Assim, voltando para nosso problema, vamos expressar a expansão ρ(~r, t) como já fizemos antes, i.e.,
r
1 X (− i k)l 4π
ρ(~r, t) = 3
Flmk (~r)Qlm (k2 , t) . (14.172)
(2π) (2l − 1)!! 2l + 1
l,m,k
As condições para a expansão espectral de ρ(~r, t) e ~J(~r, t) estão satisfeitas, o caso mais simples é o de fontes
harmônicas, a última definição se reduz à fórmula (14.174) e em qualquer caso, a expressão (14.181) é de-
pendente de Qlm (k2 , t) devido à conservação da quadricorrente. Porém, a questão de termos dos momentos
longitudinais Q̇lm (0, t) aparecendo na expansão da parte da corrente transversal, ver Eq. (14.176), é mais
complicado. Porém, nesta abordagem, as fórmulas obtidas fornecem a correta parametrização multipolar
para os graus de liberdade transversais da energia de interação de um sistema não relativístico com campo
de radiação. Partindo das propriedades das funções vetoriais esféricas Flmk , é fácil verificar que as distri-
buições Mlm produzem campos tipo El, em particular, emitem multipolos El; enquanto as distribuições de
carga Qlm e toroidal Tlm são responsáveis pela produção dos campos tipo M l, em particular, Q̇lm (0, t) e
Tlm (0, t) são responsáveis pela emissão de multipolos M l.
Intensidade de Radiação de uma Fonte Arbitraria em Termos de Multipolos Nas subseções anteriores
mostramos que a relação de continuidade carga-corrente pode ser completamente parametrizada em termos
de três famílias de fatores de forma multipolar, i.e., elétrico, magnético e toroidal. Assim,
p
1 X l 4π(2l + 1)
ρ(~r, t) = 3
(− i k) Qlm (k2 , t) Flmk (~r) , (14.182)
(2π) (2l + 1)!!
l,m,k
p
~J(~r, t) = c X l−1 4π(2l + 1)(l + 1)/l
3
(− i k)
(2π) (2l + 1)!!
l,m,k
2 (0) 1 2 2 (+)
× k Mlm (k , t) F lmk (~r) + Q̇lm (0, t) + k Tlm (k , t) F lmk (~r)
c
1p 2 (−)
+ l/(l + 1) Q̇lm (k , t) F lmk (~r) , (14.183)
c
em que
i ~ 1 h√ √ i
(−)
F lmk (~r) = − ∇F lmk (~r) = √ lfl−1 Y l l−1 m (r̂) − l + 1fl+1 Y l l+1 m (r̂)
k 2l + 1
(0)
~
L
F lmk (~r) = p Flmk (~r) = fl Y l l m (r̂)
l(l + 1)
1 ∇ ~ × ~L 1 h√ √ i
(+)
F lmk (~r) = − p Flmk (~r) = √ lfl+1 Y l l+1 m (r̂) + l + 1fl−1 Y l l−1 m (r̂)
k l(l + 1) 2l + 1
e X
[Y l l m (r̂)]µ = hl′ m′ 1µ|lmiYl′ m′ (r̂)
m′
“Z_2” — 2017/9/5 — 8:19 — page 405 — #425
Z
i(2l + 1)!!
2
Mlm (k , t) = − p fl∗ (kr)Y ∗llm (r̂) · ~J(~r, t) d3 r (14.186)
c(− i k)l 4π(2l + 1)(l + 1)/l
s Z
i 4πl
Mlm (0, t) = − r l Y ∗llm (r̂) · ~J(~r, t) d3 r (14.187)
c (2l + 1)(l + 1)
√ Z n√
(2l − 1)!! l ∗
2
Tlm (k , t) = − p lfl+1 (kr)Y ∗l l+1 m (r̂)
c(− i k)l+1 4π(l + 1)
√ 4π(− i kr)l−1
∗
+ l + 1 fl−1 (kr) − Y l l−1 m (r̂) · ~J(~r, t) d3 r
∗
(14.188)
(2l − 1)!!
√ Z p !
πl 2 l/(l + 1)
Tlm (0, t) = − r l+1 Y ∗l l−1 m (r̂) + Y ∗l l+1 m (r̂) · ~J(~r, t) d3 r . (14.189)
c(2l + 1) (2l + 3)
Para encontrar os campos criados por uma distribuição mais geral de cargas e correntes descritas pela
densidade de carga e pela densidade de corrente que satisfazem a relação de continuidade, temos que come-
çar, como de costume, pelos potenciais retardados escalar e vetor, i.e.,
Z r′ | Z ~J ~r′ , t − |~r−~r′ |
ρ ~r′ , t − |~r−~
Φ(~r, t) = d3 r ′
c
, ~ (~r, t) = 1 d3 r ′
A
c
|~r −~r′ | c |~r −~r′ |
e portanto,
~
~E = − 1 ∂ A − ∇Φ
~ , ~
B=∇ ~ ×A ~ .
c ∂t
Uma vez que queremos obter os campos em termos dos fatores de forma elétrico, magnético e toroidal,
vamos introduzir as transformações de Fourier em relação ao tempo para a densidades de carga e de corrente
e seus correspondentes fatores de forma Qlm , Mlm e Tlm . 44 Assim, para a densidade de carga,
p
1 X l 4π(2l + 1)
ρ(~r, ω) = (− i k) Qlm (k2 , ω) Flmk (~r) (14.190)
(2π)3 (2l + 1)!!
l,m,k
sendo
ω2 ω2
Q̇lm (0, ω) = ωQlm (0, ω) , Q̇lm ,ω = ω Qlm ,ω .
c2 c2
Com estas transformações de Fourier, é preciso avaliar ainda mais o potencial escalar
Z Z ω
(1) 2 ∞ −~r′ |
3 ′ ′
cos c |~r
Φ (~r, t) =dω sen(ωt) d r ρ(~r , ω)
0 π |~r −~r′ |
Z ∞ Z
(2) 2 3 ′ ′
sen ωc |~r −~r′ |
Φ (~r, t) = − dω cos(ωt) d r ρ(~r , ω) ,
π 0 |~r −~r′ |
e, o potencial vetor
~ (~r, t) = A
A ~ (1) (~r, t) + A
~ (2) (~r, t) , (14.193)
Z ∞ Z ′|
ω
~ (1) 2 −~ r
3 ′~ ′
sen c |~r
A (~r, t) =
dω sen(ωt) d r J(~r , ω)
0 πc |~r −~r′ |
Z ∞ Z ω ′|
~ (~r, t) = 2 cos ~
|r −~ r
A (2)
dω cos(ωt) d r ~J(~r , ω)
3 ′ ′ c
.
πc 0 |~r −~r′ |
Para o que pretendemos, i.e., o calculo dos campos, será necessário ter as funções do Green. Para o caso
de potencial escalar, 45
′
ei(ω/c)|~r−~r | ω X ∗
= Flm(ω/c) (~r′ ) Hlm(ω/c) (~r) , r > r′ , (14.194)
|~r −~r′ | 4πc
l,m
45
E. E. Radescu and G. Vaman, Physical Review, E65, 046609 (2002); V. M. Dubovik and A. A. Cheshkov, Fiz. Elem. Chastits
At. Yadra, 5, 792 (1974) [Sov. J. Particles and Nuclei, 5, 318 (1975)]; P. M. Morse and H. Feshbach, Methods of theoretical
physics (1953).
“Z_2” — 2017/9/5 — 8:19 — page 407 — #427
em que Flm(ω/c) (~r) = fl ((ω/c)r) Ylm (r̂), enquanto Hlm(ω/c) (~r) e Nlm(ω/c) (~r) estão relacionados a função
esférica de Hankel e a função esférica de Bessel de segunda espécie,
(+)
Hlm(ω/c) (~r) = hl ((ω/c)r) Ylm (r̂)
Nlm(ω/c) (~r) = nl ((ω/c)r) Ylm (r̂) ,
seguindo as mesmas condições de normalização e completeza. também segue as relações,
~ × N (−) (~r) = 0 ,
∇ ~ × H (−) (~r) = 0
∇
lmk lmk
~ · N (−) (~r) = i kNlmk (~r) ,
∇ ~ · H (−) (~r) = i kNlmk (~r)
∇
lmk lmk
~ · N (+) (~r) = ∇
∇ ~ · N (0) (~r) = 0 , ~ · H (+) (~r) = ∇
∇ ~ · H (0) (~r) = 0 .
lmk lmk lmk lmk
Para o potencial vetor, será útil usarmos as funções do Green em termos das funções vetoriais da equação
do Helmholtz,
′
ei(ω/c)|~r−~r | ω X (λ) ∗ (λ) ∗
′
= F lm(ω/c) (~r′ ) · H lm(ω/c) (~r) , r > r′ , (14.195)
|~r −~r | 4πc
l,m,λ
cos ω
−~r′ |
c |~r ω X h (+) ∗ (+) ∗ (−) ∗ (−) ∗ (0) ∗ (0) ∗
i
= − F lm(ω/c) · N lm(ω/c) + F lm(ω/c) · N lm(ω/c) + F lm(ω/c) · N lm(ω/c)
|~r −~r′ | 4πc
l,m
sen ωc |~r −~r′ | ω X h (+) ∗ (+) ∗ (−) ∗ (−) ∗ (0) ∗ (0) ∗
i
= F lm(ω/c) · F lm(ω/c) + F lm(ω/c) · F lm(ω/c) + F lm(ω/c) · F lm(ω/c) ,
|~r −~r′ | 4πc
l,m
com
! !
(0) (+)
H lmk (~r) i ~ × ~rHlmk (~r) = hl (kr)
(0) =p ∇ Y llm (r̂)
N lmk (~r) l(l + 1) ~rNlmk (~r) nl (kr)
!
(+)
H lmk (~r) 1 i~ ~ ~rHlmk (~r)
(+) = −p ∇×∇×
N lmk (~r) l(l + 1) k ~rNlmk (~r)
!
(−)
H lmk (~r) i ~ Hlmk (~r)
(−) =− ∇ .
N lmk (~r) k Nlmk (~r)
Usando os resultados obtidos acima para as funções do Green, o potencial escalar na será dado por
Φ(~r, t) = Φ(1) (~r, t) + Φ(2) (~r, t) , (14.196)
√
1
Z ∞ X − i ω l 2l + 1
ω2
(1)
Φ (~r, t) = − dω ω sen(ωt) Qlm , ω Nlm(ω/c) (~r)
π 3/2 c 0 c (2l + 1)!! c2
l,m
√
1
Z ∞ X − i ω l 2l + 1
ω2
(2)
Φ (~r, t) = − dω ω cos(ωt) Qlm , ω Flm(ω/c) (~r) ,
π 3/2 c 0 c (2l + 1)!! c2
l,m
“Z_2” — 2017/9/5 — 8:19 — page 408 — #428
p
1
Z ∞ X − i ω l−1 4π(2l + 1)(l + 1)/l
~ (2) (~r, t) = −
A dω ω sen(ωt)
2π 2 c2 0 c (2l + 1)!!
l,m
2 2
ω (0) ω2 ω (+)
× ωMlm 2
, ω F lm(ω/c) (~r) + ωQlm (0, ω) + 2 Tlm , ω F lm(ω/c) (~r)
c c c2
2
p ω (−)
+ l/(l + 1) ωQlm , ω F lm(ω/c) (~r) .
c2
Com as Eqs. (14.196)-(14.197) e usando
~ lm(ω/c) (~r) = i ω F (−)
∇F (~r) , ~ lm(ω/c) (~r) = i ω N (−)
∇N (~r) ,
c lm(ω/c) c lm(ω/c)
encontraremos o campo elétrico ~E(~r, t)
Z ∞ X l+2 √2l + 1 h i 2
~E = 1 dω (− i)l−1 ω
sen(ωt)N
(−)
+ cos(ωt)F
(−)
Q lm
ω
,ω
π 3/2 0 c (2l + 1)!! lm(ω/c) lm(ω/c) c2
l,m
1
Z ∞ X l+1 p4π(2l + 1)(l + 1) nh i
l−1 ω (−) (−)
− 2 dω (− i) √ sen(ωt)N lm(ω/c) + cos(ωt)F lm(ω/c)
2π c 0 c l(2l + 1)!!
l,m
p 2 h i 2
(0) (0)
× l/(l + 1)ωQlm ωc2 , ω + ω sen(ωt)N lm(ω/c) + cos(ωt)F lm(ω/c) Mlm ωc2 , ω
h ih 2 io
(+) (+) 2
+ sen(ωt)N lm(ω/c) + cos(ωt)F lm(ω/c) ωQlm (0, ω) + ωc Tlm ωc2 , ω . (14.198)
1
Z ∞ X ω l+2 p4π(2l + 1)(l + 1)
~
B= 2 dω (− i) l−1
√
2π 0 c l(2l + 1)!!
l,m
nh i 2
(+) (+)
× − sen(ωt)F lm(ω/c) + cos(ωt)N lm(ω/c) Mlm ωc2 , ω
h ih 2 io
(0) (0)
+ − sen(ωt)F lm(ω/c) + cos(ωt)N lm(ω/c) Qlm (0, ω) + ωc Tlm ωc2 , ω . (14.199)
“Z_2” — 2017/9/5 — 8:19 — page 409 — #429
As fórmulas exatas para o campo elétrico Eq. (14.198) e para o campo magnético Eq. (14.199) expressam
sem qualquer ambiguidade a maneira pela qual o conteúdo multipolar da fonte (especificado pelos fatores
de forma multipolares elétrico, magnético e toroidal) reflete-se nos campos criados. Os campos vêm dos
potenciais escalar e vetor retardados que satisfazem a condição de Lorenz e são invariantes de calibre.
Para calcular a intensidade da radiação, precisamos obter das expressões exatas dos campos elétrico
e magnético, Eqs. (14.198)-(14.199), fórmulas que expressam o comportamento destes campos a grandes
distâncias, i.e., r → ∞, na ordem de O(1/r). Para esse propósito, usaremos o comportamento assintótico
das funções esféricas de Bessel para r → ∞, ver (14.13)-(14.14), e considerar corretamente as funções
(λ) (λ)
vetoriais F lm(ω/c) (~r) e N lm(ω/c) (~r) em ordem de O(1/r). 46 Assim, encontramos ~E(~r, t) e ~B(~r, t) que
expressam o comportamento a grandes distâncias na ordem de O(1/r), em termos dos fatores de forma
multipolar
Z ∞ p
2 1 X ω l+1 4π(2l + 1)(l + 1) n 2
~E ∼ − dω √ − i M ω ω π
lm c2 , ω sen ωt − c r + l 2 Y llm (r̂)
πc r 0 cl
l,m
l(2l + 1)!!
h
ω
2 i
ω ω π
q l q
l+1
+ Qlm (0, ω) + c Tlm c2 , ω cos ωt − c r + l 2 2l+1 Y l l+1 m (r̂) + 2l+1 Y l l−1 m (r̂)
(14.200)
Z ∞ p
2 1 X ω l+1 4π(2l + 1)(l + 1)
~B ∼ − dω √
πr 0 cl+1 l(2l + 1)!!
l,m
2
ω ω π
q l q
l+1
× Mlm c2 , ω sen ωt − c r + l 2 2l+1 Y l l+1 m (r̂) + 2l+1 Y l l−1 m (r̂)
h 2 i o
+ i Qlm (0, ω) + ωc Tlm ωc2 , ω cos ωt − ωc r + l π2 Y llm (r̂) . (14.201)
Nota sobre índices sobrescrito duplo Em vez dos fatores usuais Qlm (k2 , t), Mlm (k2 , t) e Tlm (k2 , t), na
qual são funções de duas variáveis, a do momentum transferido k2 e a do tempo t, será útil expressar,
de forma equivalente, esta informação completa sobre a estrutura eletromagnética do sistema em
termos de raios quadrados médios de vários tipos, elétrico, magnético e toroidal, rlm 2n (t), ρ2n (t) e
lm
2n (t), respectivamente. Temos multipolaridade (l) e ordens (2n), e quando n = 0 temos apenas o
Rlm
momento multipolar correspondente. Todos estes raios ainda são funções do tempo e suas derivadas
de várias ordens em relação ao tempo ocorrerão nos cálculos. Uma vez que todo os fatores numéricos
destes raios são, eles próprios, derivadas dos fatores de forma Qlm (k2 , t), Mlm (k2 , t) e Tlm (k2 , t)
de várias ordens (n) em relação a (k2 ) quando k2 = 0, devemos trabalhar com as quantidades
sobrescritas duplas,
(n)(ν) dν dn 2
Qlm (0, t) = ν Qlm (k , t)
dt d(k2 )n k 2 =0
ν n
(n)(ν) d d 2
Mlm (0, t) = ν Mlm (k , t)
dt d(k2 )n k 2 =0
ν
n
(n)(ν) d d 2
Tlm (0, t) = ν Tlm (k , t) .
dt d(k2 )n k 2 =0
46
E. E. Radescu and G. Vaman, Physical Review, E65, 046609 (2002).
“Z_2” — 2017/9/5 — 8:19 — page 410 — #430
As quantidades acima nos fornecem informações completas sobre o conteúdo multipolar da fonte e
será em termos destas quantidades que devemos expressar nossos resultados para a intensidade da
radiação. Elas sem dúvidas representam resultados exatos na análise multipolar da configuração mais
geral de cargas e correntes. Elas permitem a particularização imediata das primeiras contribuições
multipolar para as quantidades físicas mencionadas acima. Neste ponto, nosso objetivo é livrarmos da
integral sobre ω, e podemos fazer isto introduzindo as quantidades de sobrescrito duplo das relações
anteriormente mencionadas, na qual são, até determinados números, derivadas em relação ao tempo
(segundo sobrescrito) dos raios quadráticos médios multipolar de qualquer tipo (elétrico, magnético
e toroidal) e sua ordem (marcado pelo primeiro sobrescrito).
Neste ponto, nosso objetivo é livrarmos da integral sobre ω, e podemos fazer isto introduzindo as quanti-
dades de sobrescrito duplo das relações anteriormente mencionadas, na qual são, até determinados números,
derivadas em relação ao tempo (segundo sobrescrito) dos raios quadráticos médios multipolar de qualquer
tipo (elétrico, magnético e toroidal) e sua ordem (marcado pelo primeiro sobrescrito).
Primeiramente consideremos o campo magnético dado pela Eq. (14.201) e trataremos separadamente
as contribuições dos termos com l pair e com l ímpar para a soma sobre todos os l. No caso de l par, l = 2k
(k = 1/2, k = inteiro) e usando as transformadas de Fourier,
2 Z ∞ 2
l+1 ω l/2+1 ′ (l+1) ω
ω Mlm , ω = (−1) dt Mlm , t′ sen(ωt′ )
c2 0 c2
Z ∞
(l+1)
ω l+1 Qlm (0, ω) = (−1)l/2 dt′ Qlm 0, t′ cos(ωt′ )
0
2 Z ∞ 2
l+2 ω l/2+1 ′ (l+2) ω
ω Tlm , ω = (−1) dt Tlm , t′ cos(ωt′ ) ,
c2 0 c2
em que o sobrescrito denota a ordem da derivação em relação ao segundo argumento dos fatores de forma,
i.e., o tempo. Usando
ωr π ωr
sen ωt − +l = (−1)l/2 sen ωt −
c 2 c
ωr π l/2
ωr
cos ωt − +l = (−1) cos ωt − ,
c 2 c
na Eq. (14.201), então, os fatores de forma acima recebem contribuições para o campo magnético vindo
destes termos, por exemplo,
Z ∞ 2
l+1 ω ωr
dω ω Mlm , ω sen ωt −
0 c2 c
Z ∞ Z ∞ 2
(−1) l/2+1
′ (l+1) ω ′ ′ ωr
= dω dt Mlm , t cos ωt − ωt + .
2 0 0 c2 c
Agora, desenvolvendo a derivada (l + 1), em relação ao tempo, do fator de forma magnético sob as integrais
em termos dos raios magnéticos, temos
2 n
2 X ∞ ω
(l+1) ω ′ c2 (n)(l+1)
Mlm , t = Mlm (0, t′ ) ,
c2 n=0
n!
Analogamente,
Z ∞ h
l+1 r i l/2 π (0)(l+1)
r
dω ω Qlm (0, ω) cos ω t − = (−1) Q 0, t −
0 c 2 lm c
Z ∞ 2 h i r
∞
X 1
ω r l/2+1 π (n)(l+2n+2)
dω ω l+2 Tlm , ω cos ω t − = (−1) T 0, t − ,
0 c2 c 2 n=0 n!c2n lm c
p
~ 1 X 1 4π(2l + 1)(l + 1) n (0)(l+1)
B∼ √ − i Qlm 0, t − rc Y llm (r̂)
r cl+1 l(2l + 1)!!
l,m
X∞
1 (n)(l+2n+1) r
q l q
l+1
+ Mlm 0, t − c 2l+1 Y l l+1 m (r̂) + 2l+1 Y l l−1 m (r̂)
n!c2n
n=0
i
∞
X 1 o
(n)(l+2n+2) r
+ T 0, t − Y llm (r̂) . (14.203)
c n=0 n!c2n lm c
Aqui, estamos prontos para calcularmos a intensidade de radiação, para uma distribuição geral de car-
gas e correntes, no caso da variação do tempo mais geral das fontes, em termos de quantidades do tipo
(n)(l+q)
Mlm (0, t − r/c) em que Mlm representa qualquer fator de forma multipolar Qlm (k 2 , t), Mlm (k 2 , t),
Tlm (k , t) e o primeiro índice sobrescrito denota a derivada em relação a (k2 ) em k2 = 0, enquanto o
2
~S = c (~E × ~
B)
4π
47
E. E. Radescu and G. Vaman, Physical Review, E65, 046609 (2002).
“Z_2” — 2017/9/5 — 8:19 — page 412 — #432
e expressamos a potência total irradiada (intensidade de radiação) como a integral de superfície do compo-
nente radial de ~S, Sr , sobre uma esfera de grande raio r,
Z Z
cr 2
P =r 2
dΩ Sr = dΩ ~E × ~ B .
4π r
Para resolver a expressão anterior, devemos tomar as Eqs. (14.202)-(14.203) para os campos elétrico e
magnético, respectivamente. Assim, o produto vetorial ~E × ~ B será,
p ( ∞
4π X 1 (2l + 1)(l + 1)(2l ′ + 1)(l′ + 1) X 1 (n)(l+2n+1)
~E × ~
B= 2 ′ √ − i Mlm Y llm (r̂)
r c l+l +2 ′ ′ n!c2n
l,m,l′ ,m′
ll (2l + 1)!!(2l + 1)!! n=0
q q
(0)(l+1) l l+1
− Qlm 2l+1 Y l l+1 m (r̂) + 2l+1 Y l l−1 m (r̂)
∞ q q )
1X 1 (n)(l+2n+2) l l+1
+ T 2l+1 Y l l+1 m (r̂) + 2l+1 Y l l−1 m (r̂)
c n=0 n!c2n lm
( ∞ q q
X 1 (n′ )(l′ +2n′ +1) l′ l′ +1
× M′ ′ 2l′ +1 Y l l +1 m (r̂) +
′ ′ ′
2l′ +1 Y l l −1 m (r̂)
′ ′ ′
n′ !c2n′ l m
n′ =0
∞
)
′
(0)(l +1) i X 1 ′ ′ ′
(n )(l +2n +2)
− i Ql′ m′ Y l′ l′ m′ (r̂) + T′ ′ Y l′ l′ m′ (r̂) . (14.204)
c ′ n′ !c2n′ l m
n =0
A integral de superfície de P deve ser realizada sobre o produto vetorial dos vetores harmônicos esféricos
Y llm (r̂). Assim, usando as fórmulas
r
l
(Y l′ l′ m′ × Y l l+1 m )r = − i Y l′ l′ m′ · Y llm
2l + 1
r
l′
(Y l′ l′ +1 m′ × Y l l−1 m )r = i Y l′ l′ m′ · Y l l−1 m
2l′ + 1
Z r
m l
dΩ (Y l l+1 m × Y l′ l′ m′ )r = − i(−1) δll′ δm,−m′
l+1
Z r
m l+1
dΩ (Y l l−1 m × Y l′ l′ m′ )r = − i(−1) δll′ δm,−m′ ,
2l + 1
obtém-se para a intensidade da radiação a seguinte fórmula geral em termos das derivadas dos fatores de
forma elétrico, magnético e toroidal (em relação aos dois argumentos k2 e t), em que as potências (1/c) em
frente a várias contribuições são explicitamente evidenciadas,
X 1
(l + 1) (0)(l+1) 2
P = 2l+1
Qlm 0, t − rc
c l(2l − 1)!!(2l + 1)!!
l,m
X 1 h (n)(l+2n+2) ∗
(0)(l+1)
− 2n+1
Qlm 0, t − rc Tlm 0, t − rc
n
n!c
(0)(l+1) ∗ (n)(l+2n+2) i
+ Qlm 0, t − rc Tlm 0, t − rc
X 1 h (n′ )(l+2n′ +1) ∗
(n)(l+2n+1)
+ ′ 2n+2n ′ Mlm 0, t − rc Mlm 0, t − rc
n!n !c
n,n′
1 (n)(l+2n+2) r
(n′ )(l+2n′ +2) ∗ r
+ 2 Tlm 0, t − c Tlm 0, t − c . (14.205)
c
“Z_2” — 2017/9/5 — 8:19 — page 413 — #433
Esta equação expressa a intensidade de radiação para um tipo de fonte mais geral, na qual é caracterizada
pelos fatores de forma multipolar elétrico, magnético e toroidal, tendo uma dependência temporal arbitrária
destes fatores de forma, em termos de suas derivadas em ambos os argumentos, na qual são derivadas
do tempo (até fatores numéricos conhecidos). Esta equação, também explora exatamente e totalmente o
conteúdo multipolar da fonte, para uma dependência de tempo arbitrária, no cálculo da intensidade de
radiação emitida por esta fonte.
Lembrando que o primeiro sobrescrito indica a ordem de derivação em relação ao primeiro argumento,
2
k , do fator de forma, enquanto o segundo sobrescrito indica a ordem de derivação em relação ao segundo
argumento, t. Todos os termos que aparecem na Eq. (14.205) são reais, sendo iguais aos seus complexo
conjugado. Assim, a intensidade de radiação P é obviamente positiva, na qual pode ser escrita:
X 1 (l + 1)
P =
c2l+1 l(2l − 1)!!(2l + 1)!!
l,m
2
(0)(l+1) 1X 1 (n)(l+2n+2)
× Qlm 0, t − r
c − T lm 0, t − r
c
c n n!c2n
2
X 1 (n)(l+2n+1)
+ Mlm 0, t − rc . (14.206)
n
n!c2n
2 ¨2 2 ¨ 2 2 ...2
Pe = ~p , Pm = m ,
~ Pt = T ,
3c3 3c3 3c5
em que,
Z Z h i Z h i
1 1
~p = 3
d r ρ(~r, t)~r , ~ =
m d r ~r × ~J(~r, t) ,
3
T = d3 r ~r ~r · ~J − 2r 2~J .
2c 10c
Assim, temos para as intensidades de campo de radiação de um sistema arbitrário, com precisão até os
termos de ordem (1/c7 ), incluindo a contribuição do dipolo toroidal, a seguinte relação
2 ¨ 1 ... 2 2 ¨ 2 1 ... 1 ... ... 1 ...
P = 3 ~p − T + 3 ~ m + Qik − T ik Qik − T ik
3c c 3c 20c5 c c
2 .... .... .... ....
+ 7
Q ijk Q ijk + M ijk M ijk + · · · , (14.207)
945c
em que, Qik , Mik e Tik são os momentos quadrupolos elétrico, magnético e toroidal, dados por
Z
1 1
Qik = ρ(~r, t) ri rk − δik~r d3 r
2
2 3
Z h i
1
Mik = ~r × ~J rk + ~r × ~J ri d3 r
3c i k
Z h i
1
Tik = 4ri rk ~r · ~J − 5r 2 (ri Jk + rk Ji ) + 2r 2 ~r · ~J δik d3 r ,
28c
“Z_2” — 2017/9/5 — 8:19 — page 414 — #434
enquanto, Qijk e Mijk são os momentos octupolos elétrico e magnético, dados por
Z
1 1 2
Qijk = ρ(~r, t) ri rj rk − r (ri δjk + rj δik + rk δij ) d3 r
6 5
Z
15
Mijk = ri rj ~r × ~J + ri rk ~r × ~J + rj rk ~r × ~J
2c k j i
δij δik δjk
+ ~
~r ×~r ×~r × J + ~
~r ×~r ×~r × J + ~
~r ×~r ×~r × J d3 r .
5 k 5 j 5 i
Expressões semelhantes à Eq. (14.207) foram obtidas com base na invariância dos momentos sob a trans-
formação de Galileu da origem.48 Observamos que ao trabalhar com os campos apenas, o magnífico texto
do Prof. Landau, não aparecem os seguintes termos: o momento toroidal e o quadrupolo toroidal, estes fo-
ram perdidos durante os cálculos.49 Diferente do texto do Prof. Jackson, o coeficiente elétrico transversal
contém duas peças independentes diferentes, i.e., o momento elétrico e o fator de forma toroidal também
radiante; ambas as peças são independentes do terceiro termo relacionado à magnetização M ~ que conduz a
50
estes os chamados “momentos elétricos induzidos”; este termo não influirá em nossos cálculos, pois são
independentes e estamos trabalhando no vácuo.
A radiação El proveniente do momento toroidal é duas ordens, em k, maior que a proveniente do
momento elétrico e deslocadas em fase com π/2. Para distinguir a radiação proveniente do fator de forma
toroidal daquele que vem do momento elétrico correspondente, será necessária uma análise espectral da
radiação. Assim, podemos ver que, quando uma fonte é construída de tal forma que não tenha momentos
dipolo elétrico e magnético, nem quadrupolo magnético, a radiação dominante da fonte será a radiação E1
gerada por seu momento dipolo toroidal. Um toro com uma corrente alternada possui esta propriedade.
Apenas recentemente a existência de ressonâncias eletromagnéticas de natureza toroidal foi demons-
trada experimentalmente, primeiro nos metamateriais51 e, em seguida, em frequências ópticas, onde podem
ser importantes na análise de espectroscopia.52
48
N. B. Baranova and Y. B. Zel’dovich, Sov. Phys. Usp., 22, 143 (1979).
49
L. D. Landau and E. M. Lifshitz, The classical theory of fields (1993).
50
J. D. Jackson, Classical electrodynamics (1999).
51
Metamaterial, são materiais artificiais modificados de tal modo que adquiram propriedades desejadas que não existem de forma
natural. Eles são conjuntos de vários elementos individuais formados a partir de materiais convencionais, tais como metais ou
plásticos, mas os materiais, geralmente construídos em padrões repetitivos, são muitas vezes, estruturas microscópicas. Meta-
materiais derivam suas propriedades, não a partir das propriedades da composição dos materiais que a formam, mas a partir
de suas estruturas pré desenhada. A sua forma exata, a geometria, tamanho, a orientação e disposição, pode afetar as ondas
de luz (radiação electromagnética) ou o som de uma maneira não observável em materiais naturais. Assim, um metamaterial é
um material produzido artificialmente, dotado de propriedades físicas que não são encontradas normalmente na natureza, em
sua definição regular. Portanto, a palavra metamaterial designaria materiais que possuiriam propriedades não naturais. Eviden-
temente, qualquer propriedade que um metamaterial apresente, por mais estranha que possa parecer, é fisicamente possível,
caso contrário não seria verificada. Entretanto, esse nome reflete a perplexidade da comunidade científica quando encontrou nos
materiais referidos propriedades físicas antes consideradas não possíveis e que normalmente não são encontradas na natureza.
Os metamateriais foram teorizados num ensaio de Victor Veselago, em 1968, mas durante muito tempo foram considerados
impossíveis por apresentarem propriedades ópticas estranhas, tais como índice de refração negativo e efeito Doppler invertido.
Somente em 2006 que pesquisadores liderados por John Pendry, provaram que é possível sintetizar materiais que apresentem
índices de refração negativos.
Victor Georgievich Veselago (1929- ), físico russo-ucraniano.
V. G. Veselago, Sov. Phys. Usp., 10 (4), 509-514 (1968); Russian text 1967.
Sir John Brian Pendry (1943- ), físico inglês.
J. B. Pendry et al., Science, 312, 1780-1782 (2006).
52
V. Savinov, V. A. Fedotov and N. I. Zheludev, Physical Review, B89, 205112 (2014); N. Papasimakis, V. A. Fedotov, V. Savinov,
T. A. Raybould and N. I. Zheludev, Nature - Materials, 15, NMAT4563 (2016); Chaojun Tang, Bo Yan, Qiugu Wang, Jing Chen,
Zhendong Yan, Fanxin Liu, Naibo Chen and Chenghua Sui, Scientific Reports, 7, 582 (2017).
“Z_2” — 2017/9/5 — 8:19 — page 415 — #435
em que k̂in é o vetor unitário que indica a direção incidente, ǫ̂in é a polarização da onda incidente e k = ωc .
Esta onda é espalhada por um pequeno objeto, uma molécula, de dimensão d ≪ λ tal que induzem a apro-
ximação dipolo no pequeno meio difusor. As contribuições vem dos dipolos elétricos e dipolos magnéticos.
Os campos espalhados serão:
i ke r
~Ee = k2 e [(n̂ × ~p) × n̂ − n̂ × m
~]
r
(14.209)
Be = n̂ × ~Ee ,
~
em que n̂ é um vetor unitário na direção do observador e r é a distância medida a partir do difusor. A seção
diferencial de espalhamento (ou de difusão) é definida por,53
dσ Potência irradiada por ângulo sólido na direção n̂ com polarização ǫ̂
(n̂, ǫ̂; k̂in , ǫ̂in ) =
dΩ Potência por unidade de área na direção k̂in com polarização ǫ̂in
2
r2 c
π ǫ̂∗ · ~Ee k4
= 2 = |ǫ̂∗ ·~p + (n̂ × ǫ̂∗ ) · m
~ |2 . (14.210)
|E0 |2
c
8π ǫ̂∗in · ~Ein
A dependência entre a seção de espalhamento com k̂in e ǫ̂in está implicitamente contida nos momentos
de dipolo ~p e m
~ . A variação da seção diferencial de espalhamento é caracterizada pela dependência com a
quarta potência, k4 , do número de onda,
4
4 2π
k = , (14.211)
λ
conhecida como a lei de Rayleigh.54 Somente no caso de os dois momentos de dipolo estáticos serem nulos,
o espalhamento deixa de seguir a lei de Rayleigh.
Um exemplo especial é quando temos o espalhamento por uma pequena esfera dielétrica. Vamos consi-
derar uma molécula como uma pequena esfera dielétrica de raio a = d/2 ≪ λ. Este resultado é interessante,
pois temos a situação do espalhamento da luz por pequenas esferas moleculares da atmosfera terrestre. Para
uma esfera dielétrica de raio a, os momentos dipolos são
ε−1
~p = a3 ~Ein , ~ = 0.
m (14.212)
ε+2
A dependência da Eq. (14.213) em relação à polarização é típica do espalhamento exclusivo por dipolo
elétrico. A radiação espalhada é linearmente polarizada no plano definido pela direção do momento de
dipolo (k̂in ) e pelo vetor unitário n̂. Aqui, usaremos a notação ǫ̂1 para a polarização perpendicular e ǫ̂2 para
a polarização paralela. Escolhemos o ângulo polar θ para ser o ângulo entre k̂in e n̂. Então,
em que φ é o ângulo azimutal na qual determina a orientação de k̂in no plano transverso. Fazendo a média
em φ em ambos casos como 1/2 temos,
2
dσ⊥ k4 a6 ε − 1
= para ǫ̂ = ǫ̂1 perpendicular (14.214)
dΩ 2 ε+2
e
2
dσk k4 a6 ε − 1
= cos2 θ para ǫ̂ = ǫ̂2 paralelo . (14.215)
dΩ 2 ε+2
A polarização Π(θ) da radiação espalhada é definida por
dσ⊥ dσk
dΩ − dΩ
Π(θ) = dσk
. (14.216)
dσ⊥
dΩ + dΩ
Das Eqs. (14.214) e (14.215), podemos calcular a polarização do espalhamento, de dipolo elétrico, por uma
pequena esfera dielétrica,
sen2 θ
Π(θ) = . (14.217)
1 + cos2 θ
A seção diferencial de espalhamento, somando sobre toda a polarização da radiação difundida, é
2
dσ k4 a6 ε − 1
= (1 + cos2 θ) (14.218)
dΩ 2 ε+2
e a seção de choque total de espalhamento é
Z 2
dσ 8π 4 6 ε − 1
σ= dΩ = k a . (14.219)
dΩ 3 ε+2
As características de polarização do céu azul constituem uma ilustração deste fenômeno e foram o motivo
que levou Rayleigh a investigar o problema.
Conjunto de difusores É importante observar que a expressão (14.210) não considera a possibilidade de
haver espalhamento múltiplo, ou conjunto de difusores, e admite, ainda, que o livre caminho médio
entre dois espalhamentos é grande em relação às dimensões do sistema de partículas. Entretanto,
quando há N partículas influenciando o espalhamento, cada uma delas contribui com um fator expo-
nencial e a Eq. (14.210) deverá ser substituída por
N 2
dσ k4 X ∗
= ~ i ] ei~q ·~ri
[ǫ̂ ·~pi + (n̂ × ǫ̂∗ ) · m , (14.220)
dΩ |E0 |2
i=1
em que ~q = k(n̂0 − n̂) mede o desvio do vetor de onda. Quando se trata de N partículas iguais,
localizadas em~ri posições diferentes, esta expressão poderá ser escrita da seguinte forma,
dσ k4
= ~ |2 F (q) ,
|ǫ̂∗ ·~p + (n̂ × ǫ̂∗ ) · m (14.221)
dΩ |E0 |2
“Z_2” — 2017/9/5 — 8:19 — page 417 — #437
Difusores oscilantes Considere algumas partículas ligadas em um simples potencial de oscilador harmô-
nico com um campo eletromagnético incidente sobre ele. Se pudermos determinar o momento dipolo
~p para essa partícula oscilante, podemos determinar o espalhamento dele também. O movimento pode
ser descrito como:
d2~r d~r e ~
2
+ Γ + ω02~r = Ein , (14.222)
dt dt m
em que Γ é uma constante de decaimento com dimensões de uma frequência. Se assumimos que
~Ein = ~E0 ei ωt , temos a equação de movimento dada por
e 1 ~E0 ei ωt .
~r(t) = 2 (14.223)
m ω0 − ω 2 − i Γω
Então,
e2 1 ~E0 ei ωt .
~p = 2 (14.224)
m ω0 − ω 2 − i Γω
Logo, a seção de choque diferencial será.
2
dσ k4 e4 1
= |ê∗ · k̂in |
dΩ m2 ω02 − ω 2 − i Γω
2 2
e ω4 1
= 2 (1 + cos2 θ) .
mc2 (ω0 − ω 2 )2 + Γ2 ω 2 2
Assim, a baixas frequências, a seção de choque aumenta com a quarta potencia da frequência. Esta
dependência da frequência é a chamada lei de Rayleigh, que já vimos anteriormente.
~ ·D
∇ ~ =0 (14.227a)
~
~ ×H
∇ ~ = 1 ∂D (14.227b)
c ∂t
~
~ × ~E = − 1 ∂ B
∇ (14.227c)
c ∂t
~ ~
∇·B = 0. (14.227d)
~ como
Assim, podemos combiná-las para construir uma equação de onda, D,
~ ∇
∇ ~ ·D
~ → ∇ ~ × ∇ ~ ×D
~ + ∇2 D ~ =0
1 ∂ ~ ~ 2~
∇×H ~ → ~ × 1 ∂H = 1 ∂ D .
∇
c ∂t c ∂t c2 ∂t2
Combinando estes resultados temos,
~
1 ∂2 ~ ~ × ∇~ ×D ~ × 1 ∂H .
~ −∇
∇2 − 2 2 D = −∇
c ∂t c ∂t
Então, podemos simplesmente escrever isto como fizemos anteriormente para campos com as fontes,
Z ′
~ in − 1
~ =D 3 ′~ ′ei k|~r−~r |
D d r Jdif (~r ) .
4π |~r −~r′ |
Quando a solução física é de espalhamento, temos a onda incidente e a função de Green para a onda
espalhada. No limite |~r −~r′ | ≫ 1, isso pode ser aproximado para
i kr
~ =D
D ~ee ,
~ in + A (14.229)
r
“Z_2” — 2017/9/5 — 8:19 — page 419 — #439
~ e é dada por,
em que a amplitude de espalhamento A
Z h i
1
d3 r ′ ~Jdif (~r′ ) e− i kn̂ ·~r + · · · .
′
~
Ae ≡ −
4π
Isto pode ser avaliado por meio de uma integração por partes. Os termos são semelhantes em estrutura,
por isso vamos trabalhar olhando apenas em um detalhe.
Z Z n h i o
3 ′ i k n̂ ·~r′ ~ ~ ′ ~
d r e ~ ~
∇× H − B = d3 r ′ ∇ ~ × ei kn̂×~r′ H~ −~ B + i ke− i k ·~r ∇ × ~ B−H ~ .
Os termos de fronteira podem ser descartados, uma vez que assumimos ~E = D ~ e~ ~ quando
B=H
estão a grandes distâncias do dispersor. Isto nos dá o resultado de:
Z nh i o
k2
d3 r ′ e− i kn̂ ·~r
′
~
Ae = n̂ × D~ − ~E × n̂ − n̂ × ~ ~
B−H . (14.230)
4π
Então, a seção de choque diferencial será
dσ ~ e · ǫ̂∗ |2
|A
= , (14.231)
dΩ ~ in |2
|D
Para estabelecer contato com os resultados que já obtivemos, suponhamos que a região de espalha-
mento seja uma esfera dielétrica uniforme de raio a. Assim, da equação anterior, temos
2
dσ ∼ sen qa − qa cos qa
= k4 |δε|2 |ǫ̂∗ · ǫ̂in |2 .
dΩ Born q3
a3
No limite q → 0, i.e., k ∼ k′ , o colchete aproxima-se de 3 . Logo,
2
dσ ∼ δε
lim = k4 a6 |ǫ̂∗ · ǫ̂in |2 . (14.233)
q→0 dΩ Born 3
55
Na verdade, no contexto do espalhamento eletromagnético, esta aproximação foi desenvolvida por Lord Rayleigh em 1881, ver
J. Strutt (Lord Rayleigh), Philosophical Magazine, series 5, 12, 81-101 (1881).
“Z_2” — 2017/9/5 — 8:19 — page 420 — #440
O céu azul, flutuações de densidade e opalescência crítica A cor azul do céu, em contraste com a cor
amarela do sol, é uma consequência da lei de Rayleigh (1871),56 lembrando que obedece à lei λ14 ,
4
pois k4 = 2π λ e nas Eqs. (14.218), (14.219) e (14.226) temos esta informação. A seção de choque
de espalhamento da luz para uma molécula de ar sem duvidas pode ser aproximada pela expressão
(14.219). Os raios de luz que observamos no céu são aqueles que sofreram um leve desvio em relação
àqueles que vêm diretamente do sol. Note que se sairmos da atmosfera terrestre, por exemplo em
um foguete, enxergaremos tudo negro em volta da imagem do sol, porque no vácuo não observamos
espalhamento da luz. É a atmosfera terrestre quem espalha lateralmente a luz solar. A maioria das
frequências de ressonância para as moléculas de N2 , O2 e H2 O estão na região ultravioleta. Assim,
a luz na extremidade azul do espectro visível e muito mais espalhada do que a luz na extremidade
vermelha do espectro, a razão entre estas seções de choque será da ordem de (7/4)4 ≈ 9. A luz azul
será então espalhada para fora de um feixe de luz solar, preenchendo todo o céu. O azul do céu, o
vermelho do crepúsculo, o calor do sol no inverno, a facilidade de bronzeamento no verão, são todos
consequências da lei de Rayleigh para o espalhamento na atmosfera.
Um tratamento mais rigoroso será adequado para um gás ideal diluído, na qual as moléculas estão
realmente distribuídas ao acaso, no espaço, umas em relação às outras e levando em conta, de validade
mais geral, as flutuações da densidade do gás.
Quando as moléculas individuais, localizadas em~rj , têm, por hipótese, os momentos dipolos
~ 3 ε−1
~pj = γmol E(~rj ) , em que γmol =
4πN ε + 2
número de moléculas multiplicado pela seção de choque de uma só molécula. Para um gás diluído, a
relação entre a polarizabilidade e a constante dielétrica é ε ≃ 1 + 4πN γmol , em que N é o número
de moléculas por unidade de volume. A seção de choque total por molécula do gás é,
k4 2k4
σ= 2
|ε − 1|2 = |n − 1|2 , (14.235)
6πN 3πN 2
em que n é o índice de refração, com a condição de |n − 1| ≪ 1. A Eq. (14.235) representa a potência
espalhada por molécula, por unidade de fluxo de energia incidente. Ao atravessar uma espessura dx
do gás, haverá uma diminuição relativa de N σdx. O feixe incidente tem portanto uma intensidade
I (x) = I0 e−αx , sendo α o coeficiente de absorção, da Eq. (9.68), dado por
2k4
α = Nσ = |n − 1|2 . (14.236)
3πN
Estes resultados descrevem o que se conhece como espalhamento Rayleigh, que é o espalhamento
incoerente pelas moléculas de um gás ou por outros dipolos difusores distribuídos ao acaso, em que
cada espalhamento obedece a lei de Rayleigh, ∼ λ14 .
Um tratamento mais geral é o de considerar as flutuações de densidade e portanto do índice de refra-
ção. Considere o volume V do fluido dividido em células pequenas em comparação com o compri-
mento de onda, porém suficientemente grandes para conter um número de moléculas muito grande.
Em cada célula temos um volume v, com um número médio de moléculas dado por Nv = vN . O
número de moléculas flutua em torne de Nv , tal que depende da natureza do gás. A largura em relação
ao número médio de moléculas na j-ésima célula é ∆Nj . Logo, a variação do índice de refração será
dado por
∂ε ∆Nj
δεj = .
∂N v
Usando a equação de Clausius-Mossotti podemos escrever a relação
Portanto,
(ε − 1)(ε + 2)
δεj = ∆Nj . (14.237)
3N v
Em um fluido em equilíbrio com um reservatório de pressão e de temperatura constante, a probabili-
− G(V )
dade que uma determinada parte do fluido ocupa um volume V é e kB T , em que G é a energia livre
de Gibbs,57 kB é a constante de Boltzmann58 e T é a temperatura. Em termos da compressibilidade
isotérmica βT do meio
−1
1 ∂V ∂2G
βT = − = V ,
V ∂p T ∂V 2
em que p é a pressão. O desvio médio quadrático de
h(∆V )2 i = kB T hV iβT
e
h(∆N )2 i = kB T hN 2 /V iβT .
57
Josiah Willard Gibbs (1839-1903), físico, químico e matemático americano.
58
Ludwig Eduard Boltzmann (1844-1906), físico austríaco.
“Z_2” — 2017/9/5 — 8:19 — page 422 — #442
V h(δN )2 i = N 2 kB T βT .
Então,
2
ω4 (ε − 1)(ε + 2)
α= 4
N kB T βT . (14.239)
6πN c 3
Esta expressão particular, obtida pela primeira vez por Einstein em 1910,59 é conhecida como fórmula
de Einstein-Smoluchowski.60 Para um gás diluído, com |ε − 1| ≪ 1 e N kB T βT = 1, a Eq. (14.239)
se reduz ao resultado de Rayleigh. A medida que o pondo crítico fica mais próximo, βT se torna
muito grande. Por isso, o espalhamento e a atenuação se tornam grandes nestas vizinhanças. Este
fenômeno é conhecido como opalescência crítica. A grande dispersão está diretamente relacionada
às grandes flutuações de densidade nas vizinhanças do ponto crítico, conforme trabalho original de
Smoluchowski.61
Problemas
14.1 Mostrar explicitamente que a solução da equação diferencial (14.3) é dada por
X X h
∞ m=l
(1) (1) (2) (2)
i
ψ (~r) = Alm hl (kr) + Alm hl (kr) Ylm (θ, φ) .
l=0 m=−l
14.2 Suponha que uma distribuição de carga esfericamente simétrica esteja oscilando simplesmente na
direção radial, de forma que permaneça esfericamente simétrica a cada instante. Prove que nenhuma
radiação é emitida.
14.3 Uma casca esférica uniformemente carregada oscila de maneira puramente radial. Mostre que neste
caso não existe campo magnético e portanto não poderá ocorrer radiação.
14.4 Um anel circular de arame carrega a corrente I = I0 cos ωt constituindo um dipolo magnético os-
cilante. Determine os campos ~E e ~B de radiação para este oscilador, a potência total irradiada e a
potência média.
59
A. Einstein, Annalen der Physik 33, 1275-1298 (1910).
60
Marian Ritter von Smolan Smoluchowski (1872-1917), físico polonês.
61
M. von Smoluchowski, Annalen der Physik 25, 205-226 (1908).
“Z_2” — 2017/9/5 — 8:19 — page 423 — #443
14.5 Uma espira circular, mostrada na Fig. 14.3, tem raio R e é percorrida por uma corrente I = I0 e− i ωt .
Determine o vetor de Poynting associado com a radiação do dipolo magnético, em função das coor-
denadas polares r, θ.
14.6 Considere uma antena linear cujo comprimento d é igual a 34 λ, em que λ é o comprimento de onda
irradiada. Esboce a distribuição da densidade de corrente na antena e a distribuição angular irradiada.
14.7 Considere uma antena linear cujo comprimento d é pequeno comparado ao comprimento de onda λ.
A antena está orientada ao longo do eixo z, indo de z = + d2 a z = − d2 , com uma pequena fenda no
centro para entrada e saída da corrente. A corrente é dada por
2|z| − i ωt
I (z) e− i ωt = I0 1 − e ,
d
em que I0 é o valor da corrente na fenda e esta cai linearmente a zero nas extremidades. A corrente
tem a mesma direção em cada metade da antena.
a) Usando a equação de continuidade, mostre que o momento dipolo é orientado ao longo de z, tendo
a magnitude,
I0 d
p= .
2ω
b) calcule a distribuição angular da potência irradiada e mostre que a potência total irradiada está dada
por,
I 2 (kd)2
P = 0 .
12c
14.8 Encontrar a radiação de um dipolo ~d = q~r que gira em um plano com velocidade angular constante
Ω. Sugestão: Consulte o livro dos Profs. Landau e Lifshitz [49].
14.9 Encontrar a radiação total produzida quando duas partículas se chocam frontalmente e se repelem.
Sugestão: Consulte o livro dos Profs. Landau e Lifshitz [49].
14.10 Encontrar a seção de choque eficaz para a dispersão de uma onda não polarizada, como a luz natural.
Sugestão: Consulte o livro dos Profs. Landau e Lifshitz [49].
14.11 Determinar a frequência (ω ′ ) da luz dispersada por uma carga em movimento. Sugestão: Consulte o
livro dos Profs. Landau e Lifshitz [49].
14.12 Determine a seção de choque eficaz da dispersão de uma onda, polarizada linearmente, por um osci-
lador espacial, i.e., por uma carga elétrica que realiza pequenas oscilações de frequência ω0 . Nota-se
a força de amortecimento de radiação. Sugestão: Consulte o livro dos Profs. Landau e Lifshitz [49].
14.13 A densidade de carga de transição, de uma transição radiativa do estado m = 0, 2p para o estado
fundamental 1s, no átomo de hidrogênio, i.e., |H; 2pi → |1si, é
2e
ρ(r, θ, φ, t) = √ a−4
0 ·re
−3r/2a0
Y00 Y10 ei ω0 t ,
6
~ 3e2
em que a0 = me 2 é o raio de Bohr e ω0 = 8~a é a diferença de frequência dos dois níveis.
0
a) Calcular todos os multipolos radiantes para esta densidade de carga, usando o limite para os grandes
comprimentos de onda.
b) Calcular, na aproximação de dipolo
4 elétrico, a média no tempo da potência total irradiada. Escrever
α c e2
a resposta em unidade de (~ω0 ) a0 , sendo α = ~c a constante de estrutura fina.
“Z_2” — 2017/9/5 — 8:19 — page 424 — #444
c) Ao interpretar a potência calculada classicamente como a energia do fóton (~ω0 ) vezes a probabi-
lidade de transição, calcular numericamente a probabilidade de transição em unidades de s−1 .
d) Se no lugar da densidade de carga dada anteriormente, o elétron no estado 2p for descrito por uma
órbita circular de Bohr de raio 2a0 , girando com a frequência de transição ω0 , que potência irradiada
teremos?
14.14 Uma antena linear delgada de comprimento d, está excitada de modo que a corrente senoidal efetua
uma onda completa de oscilação, veja a Fig. 14.7.
a) Encontre a potência irradiada por unidade de ângulo sólido e faça um gráfico da distribuição
angular de radiação.
b) Encontre a potência total irradiada e calcule um valor numérico para a resistência de radiação.
14.15 Tratar o problema anterior pelo método do desenvolvimento em multipolos, em comprimentos de
onda grandes. a) Calcular os momentos de multipolos. b) Comparar o resultado da distribuição do
multipolo não nulo de ordem mais baixa com a distribuição exata do problema anterior. c) Calcular a
potência total irradiada para o multipolo de ordem mais baixa e a resistência de radiação correspon-
dente. Compare com o problema anterior.
14.16 a) Mostre que para uma polarização inicial arbitrária, a seção de choque de uma esfera perfeitamente
condutora, de raio a, somados sobre as polarizações espalhadas, é dado no limite do comprimento de
onda longa por,
dσ 4 6 5 2 1 2
(ǫ̂in , n̂in , n̂) = k a − |ǫ̂in · n̂| − |n̂ · (n̂in × ǫ̂in )| − n̂in · n̂ ,
dΩ 4 4
em que n̂in e n̂ são as direções das radiações incidente e espalhada, respectivamente, sendo ǫ̂in o
vetor unitário de polarização da radiação incidente, ǫ̂∗in · ǫ̂in = 1 e n̂in · ǫ̂in = 0.
b) Se a radiação incidente for polarizada linearmente, podemos mostrar que a seção de choque será
dσ 4 6 5 2 3 2
(ǫ̂in , n̂in , n̂) = k a (1 + cos θ) − cos θ − sen θ cos 2φ ,
dΩ 8 8
em que n̂ · n̂in = cos θ e o ângulo azimutal φ foi medido da direção da polarização linear.
Leitura Recomendada
Recomenda-se a leitura paralela contidas nos seguintes livros,
– J. D. Jackson [42];
– L. D. Landau and E. M. Lifshitz [49];
– J. Schwinger, L. L. DeRaad Jr., K. A. Milton and W.-Y. Tsai [72];
– M. A. Heald and J. B. Marion [36].
Nestes livros, clássicos da literatura, o leitor encontrará excelentes discussões e deduções detalhadas para
o estudo de ondas esféricas, radiação eletromagnética e o espalhamento da luz. O texto do Prof. Landau é
muito claro e elegante.
“Z_2” — 2017/9/5 — 8:19 — page 425 — #445
Capítulo 15
Radiação por Cargas em Movimento e de
Cargas Aceleradas
Neste capítulo vamos discutir a emissão de radiação por cargas em movimento e de cargas aceleradas. Inici-
almente faremos um estudo dos potenciais de Liénard-Wiechert para cargas puntiformes, além do estudo da
fórmula de Larmor, da radiação de cargas aceleradas, do efeito Bremsstrahlung e das radiações de cíclotron
e síncrotron. Finalmente faremos uma introdução ao estudo da radiação no caso geral e dos fótons virtuais.
em que uµ (τ ) é a quadrivelocidade da carga e r (τ ) sua posição. Substituindo a função de Green e a Eq. (15.4)
na Eq. (15.3) e integrando em d4 x′ , temos
Z h i
Aµ (x) = 2e dτ uµ (τ ) η [x0 − r0 (τ )] δ (x − r (τ ))2 . (15.5)
425
“Z_2” — 2017/9/5 — 8:19 — page 426 — #446
A contribuição desta integral através do tempo próprio só ocorrerá quando τ = τ0 , em que τ0 é definido
pela condição do cone de luz
[x − r (τ0 )]2 = 0 (15.6)
e o retardo requer x0 > r0 (τ0 ). O significado destas condição está na Fig. 15.1. A função de Green é
diferente de zero somente no cone de luz oposto do ponto de observação. Note que a linha do universo da
partícula, r (τ ), cruza o cone de luz em dois pontos, um anterior e outro posterior a x0 . Para solução da Eq.
(15.5), usaremos a regra
X δ(x − xi )
δ[f (x)] = ,
i df
dx x=x
i
em que xi são as raízes de f (x), assumimos por hipótese ser linear. Precisamos que
d
[x − r (τ )]2 = −2[x − r (τ )]ν uν (τ ) (15.7)
dτ
avaliada a um ponto, τ = τ0 . Assim, temos o quadrivetor potencial
e uµ (τ )
Aµ (x) = (15.8)
u · [x − r (τ )] τ =τ0
que são conhecidos como potenciais de Liénard-Wiechert. A restrição do cone de luz, ver Eq. (15.6), implica
x0 − r0 (τ0 ) = |~x −~r(τ0 )| = R. Então,
u.[x − r (τ )] = u0 [x0 − r0 (τ0 )] − ~v · [~x −~r(τ0 )]
= γcR − γ~v · n̂R
= γcR(1 − ~β · n̂) , (15.9)
em que n̂ é o vetor unitário direcional de ~x −~r(τ ) e ~β = ~v(τ )
c . Então da Eq. (15.8) temos
" # " #
e e ~β
Φ(~r, t) = e ~ (~r, t) =
A . (15.10)
(1 − ~β · n̂)R ret
(1 − ~β · n̂)R ret
O termo [ ]ret indica que a grandeza deve ser estima no instante retardado, r0 (τ0 ) = x0 − R. Assim, para
melhor visualização
e ~ (~r, t) = e~v
Φ(~r, t) = ~
e A ~
. (15.11)
~v · R ~v · R
R− c c R− c
ret ret
“Z_2” — 2017/9/5 — 8:19 — page 427 — #447
Estas expressões, foram obtidas independentemente por Liénard em 1898 e por Wiechert em 1900.1 Quando
~vkR~ e v → c, os potenciais tornam-se singulares, i.e., nestas condições, os potenciais de Liénard-Wie-
chert tornam-se infinitos, como se pode observar nas fórmulas apresentadas em (15.11), considerando que
~
R − ~v ·cR desaparece naquelas condições. Esta propriedade da onda de choque de uma partícula carregada
movendo-se com velocidade mais rápida que a luz no vácuo foi observada por Sommerfeld que conside-
rou, antes mesmo da relatividade especial aparecer, a radiação de um elétron movendo-se no vácuo com
velocidades superluminal.2 Os potenciais de Liénard-Wiechert se reduzem no limite não relativístico às
relações
Φ(~r) =
e
e ~ (~r) = ~v e ,
A
R cR
respectivamente.
duµ ˙ ˙ ˙
= [cγ 4~β · ~β , cγ 2 ~β + cγ 4~β(~β · ~β )]
dτ
e
d duµ
[u · (x − r)] = −c2 + (x − r)µ ,
dτ dτ
˙ d~β
em que ~β = dt é a aceleração dividida por c. Assim, podemos escrever os campos (15.14) nas formas
" # " #
n̂ − ~β e n̂ × {(n̂ − ~β) × ~β˙ }
~E(~r, t) = e + (15.15)
γ 2 (1 − ~β · n̂)3 R2 ret c (1 − ~β · n̂)3 R ret
e
~
B(~r, t) = [n̂ × ~E]ret . (15.16)
A primeira parte dos campos, conhecida como campos de velocidade, tende ao campo ordinário de Coulomb
quando ~v → 0 e não contribuem para a radiação. A segunda parte dos campos, conhecida como campos
˙
de aceleração, dependem linearmente de ~β e contribuem para a radiação na zona afastada, por isso são
chamados de campos de radiação. A equação (15.15) ainda poderá ser escrita na forma
2
1 − vc2 ~v e ~v ˙
~E(~r, t) = e ~
R − R + ~
R × ~
R − R × ~
v (15.17)
~ · ~v 3
R c 2 ~ · ~v 3
R c
R− c c R− c
e naturalmente ~B = n̂ × ~E.
No caso especial em que a partícula está em movimento uniforme, não temos aceleração. Assim, a Eq.
(15.14) para o campo eletromagnético F µν é dada por
e c2
F µν = · [(x − r)µ uν − (x − r)ν uµ ] (15.18)
[u · (x − r)]3
quando uµ é constante. Analisando a Fig. 15.2, a carga está movendo-se de P ′ para P , enquanto o observa-
dor está em O. A distância P ′ Q é βR cos θ = ~β · n̂R e a distância OQ é (1− ~β · n̂)R. Dos triângulos OP Q
e P P ′ Q, temos [(1 − ~β · n̂)R]2 = r 2 − β 2 R2 sen2 θ. Finalmente do triângulo OM P ′ temos R sen θ = b,
então
1
[(1 − ~β · n̂)R]2 = b2 + v 2 t2 − β 2 b2 = 2 (b2 + γ 2 v 2 t2 ) . (15.19)
γ
“Z_2” — 2017/9/5 — 8:19 — page 429 — #449
sendo ~
Ba = n̂ × ~Ea . Mas,
~Ea × ~Ba = ~Ea × (n̂ × ~Ea ) = |~Ea |2 n̂ − (~Ea · n̂)~Ea .
Porém, devido o fato de que ~Ea ser perpendicular à n̂, o segundo termo da expressão anterior será nulo, e
temos
~Ea × ~Ba = |~Ea |2 n̂ .
ou
2 e2 ˙ 2
P = ~v . (15.25)
3 c3
“Z_2” — 2017/9/5 — 8:19 — page 430 — #450
Esta é a fórmula de Larmor, derivada em 1897, para a potência irradiada por uma carga acelerada não
relativística.3
Podemos generalizar este resultado para qualquer velocidade da partícula. Para isso, devemos estudar
as propriedades da potência total irradiada P = dE
dt , sob a transformação de Lorentz. Com esta finalidade,
notemos que, no sistema de repouso da partícula, a taxa de variação de seu momentum devido à emissão de
radiação é Z Z
d~p R2 ~
− = R2 c ~g dΩ = S dΩ = 0 , (15.26)
dt c
1 ~
em que usamos a relação (4.42), para a densidade do momentum do campo ~g = 4πc (E × ~B) e a expressão
(15.23) para o vetor de Poynting. Este resultado mostra que, em virtude do cancelamento dos momenta
emitidos em direções opostas, o momentum total irradiado no sistema próprio da partícula é zero. Assim,
usando então a primeira transformação de (2.79) para a energia, temos
E′
E=q .
v2
1− c2
dE dE ′ dE ′
P = = q = , (15.27)
dt dt 1 − v2 dt′
c2
em que pµ é o quadrimomentum da partícula e dτ = dt/γ é o seu elemento de tempo próprio. Para verificar
se a Eq. (15.29) tende para a Eq. (15.28) quando ~β → 0 faremos
2 2 2 2
dpµ dpµ d~p 1 dE d~p 2 dp
− = − 2 = −β . (15.30)
dτ dτ dτ c dτ dτ dτ
que se reduz a (15.25) quando ~β → 0. Uma área em que esta expressão relativística se aplica é a dos
aceleradores de partículas carregadas.
Acelerador linear Em aceleradores lineares, o movimento é unidimensional. Da Eq. (15.30) vemos que a
potência irradiada é dada por
2
2 e2 dp
P = . (15.32)
3 m2 c3 dt
A taxa de variação da quantidade de movimento, i.e., do momentum, é igual à taxa de variação da
energia da partícula por unidade de distância. Assim
2
2 e2 dE
P = .
3 m2 c3 dx
Vemos que esta potência irradiada não depende da energia real da partícula ou de seu momentum,
pois a última relação mostra que para o movimento linear, a potência irradiada depende apenas das
forças exteriores que determinam a taxa de variação da energia da partícula com a distância.
A relação entre a potência irradiada pela energia fornecida por fontes externas é
P 2 e2 1 dE 2 (e2 /mc2 ) dE
= → ,
(dE/dt) 3 m2 c3 v dx 3 mc2 dx
na qual, através desta relação podemos mostrar que a perda de radiação num acelerador linear de
elétrons será insignificante, a menos que o ganho de energia seja da ordem de mc2 = 0, 511 MeV na
distância de e2 /mc2 = 2, 82 × 10−13 cm, ou da ordem de 2 × 1014 MeV/m. Tipicamente, as perdas
por radiação são completamente insignificantes em aceleradores lineares desde que os ganhos sejam
menores do que 50 MeV/m.
Acelerador circular Nos aceleradores circulares, como num betatron ou num síncroton, o momentum ~p
varia rapidamente de direção à medida que a partícula descreve sua órbita, mas a variação de energia
por volta é pequena, isto implica que:
d~p 1 dE
= γω0 |~p| ≫ . (15.33)
dτ c dτ
2 e2 2 e2 c 4 4
P = 2 3
γ 2 ω02 |~p|2 = β γ , (15.34)
3m c 3 ρ2
4
A. M. Liénard, L’Eclairage Électrique, 16, pp. 5; 53; 106 (1898).
“Z_2” — 2017/9/5 — 8:19 — page 432 — #452
cβ
em que usamos ω0 = ρ , sendo ρ o raio da órbita. Este resultado foi obtido pela primeira vez por
Liénard, em 1898.
A perda de energia radiativa por rotação é:
2πρ 4π e2 3 4
δE = P = β γ .
cβ 3 ρ
Para elétrons de altas energias, β ≈ 1, esta relação recebe o valor numérico
[E (GeV)]4
δE (MeV) = 8, 85 × 10−2 .
ρ(metros)
No síncrotron de elétrons de Cornell de 10 GeV e com ρ = 100 m, a perda de energia por rotação é
de 8, 85 MeV.5 No acelerador LEP no CERN,6 com feixes de 60 GeV e ρ ∼ 4300 m as perdas de
energia por órbita está por volta de 300 MeV.
15.4 Bremsstrahlung
Um caso especial de radiação é quando a velocidade ~v e a aceleração ~v˙ são colineares, i.e., paralela ou
antiparalela, tal que ~v × ~v˙ = 0. Esta condição para uma grandeza arbitrária de ~v nos leva a,
h i
~Ea = e (~r −~r′ ) × (~r −~r′ ) × ~v˙ , ~v || ~v˙ (15.35)
c2 s3
e
e |~r −~r′ | h ˙ i
~ ~
Ba = n̂ × Ea = ′
~v × (~r −~r ) , ~v || ~v˙ (15.36)
c2 s3
em que
(~r −~r′ ) (~r −~r′ ) ·~v
n̂ = e s = |~r −~r′ | − .
|~r −~r′ | c
Consequentemente, a distribuição angular do fluxo de energia, i.e., vetor de Poynting, associado com a
radiação será
~Sa = e2 v̇ 2 sen2 θ
n̂ . (15.37)
4πc3 |~r −~r′ |2 (1 − β cos θ)6
O vetor de Poynting está relatado no tempo em que é medido, e para uma superfície fixa no espaço. A
potência irradiada por unidade de ângulo sólido é dada pela fórmula
dU (θ) e2 v̇ 2 sen2 θ
dP (θ) = dΩ = ~Sa · (~r −~r′ ) |~r −~r′ | dΩ = dΩ . (15.38)
dt 4πc3 (1 − β cos θ)6
Por outro lado, a potência irradiada vem da radiação que ocorre em uma partícula carregada em um tempo
retardado t′
dU dU ∂t
dΩ = dΩ , (15.39)
dt′ dt ∂t′
5
Acelerador síncroton da Universidade de Cornell - Cornell Synchrotron.
6
LEP - Large Electron Positron Collider, no CERN, até o momento, o LEP foi o mais poderoso acelerador de léptons já cons-
truído, parou de funcionar em 2001, em seu lugar hoje está em funcionamento o LHC - Large Hadron Collider, o mais poderoso
acelerador de hádrons já construído. No início de julho de 2012, os experimentos ATLAS e CMS no LHC apresentaram evi-
dências da existência da partícula Higgs com massa em torno de 125 GeV, ver os artigos originais: G. Aad et al. (ATLAS
Collaboration), Physics Letters B716, 1-29 (2012); S. Chatrchyan et al. (CMS Collaboration), Physics Letters B716, 30-61
(2012).
“Z_2” — 2017/9/5 — 8:19 — page 433 — #453
usando o fato de
|~r −~r′ | − (~r−~rc ) · ~v
′
∂t s
= = = 1 − n̂ · ~β ,
∂t′ |~r −~r′ | |~r −~r′ |
encontraremos,
dU dU s
dΩ = dΩ = ~S · (~r −~r′ ) s dΩ . (15.40)
dt′ dt |~r −~r′ |
Portanto, a distribuição angular da energia irradiada é
dU e2 v̇ 2 sen2 θ
dP = dΩ = dΩ . (15.41)
dt′ 4πc3 (1 − β cos θ)5
Podemos notar o efeito relativístico que provém da transformação do referencial de repouso da partícula
para o referencial do observador, manifestado pelo fator (1 − β cos θ)5 no denominador da Eq. (15.41). A
Fig. 15.4 mostra o diagrama polar da distribuição angular da perda de energia dada pela Eq. (15.41).
Uma aplicação interessante destes resultados é o cálculo da radiação emitida por um elétron desacele-
rado por um bloco de matéria, supondo que a direção de movimento permanece inalterada. Este fenômeno
de radiação é conhecido com o nome de Bremsstrahlung. A frequência emitida no espectro pode ser obtida
pela análise de Fourier do campo de radiação. Para simplicidade vamos supor que a mudança ∆v na velo-
cidade ocorre durante um curto intervalo de tempo δt′ e que v ≪ c. Admitindo t′ = t0 como uma função
delta, temos Z +∞
v̇ = ∆v δ(t′ − t0 ) , ∆v = v̇ dt′ .
−∞
O campo elétrico para este intervalo será
e sen θ
E= ∆v δ(t′ − t0 ) . (15.42)
c2 |~r
−~r′ |
Escrevendo Z +∞
E (t) = Eω e− i ωt dω ,
−∞
teremos então para a transformada de Fourier,
Z +∞
1 e sen θ
Eω = E (t) ei ωt dt = δv ei ωt0 . (15.43)
2π −∞ 2πc2 |~r −~r′ |
“Z_2” — 2017/9/5 — 8:19 — page 434 — #454
φ(t′ ) = ω0 t′
em que α é o ângulo entre~r−~r′ e a normal do plano da órbita da partícula. Assim, das expressões anteriores
obteremos,
(~r −~r′ ) ·~v = |~r −~r′ | v sen α cos φ (15.48)
e
(~r −~r′ ) ·~a = −|~r −~r′ | a sen α sen φ = |~r −~r′ | a cos θ , (15.49)
em que θ é o ângulo entre ~a e~r −~r′ .
O fluxo da potência irradiada é dado pelo vetor de Poynting e será escrito por,
c ~ 2 ~r −~r′
~S = c ~E × ~ B = |E| . (15.50)
4π 4π |~r −~r′ |
Logo,
dP dU (α, φ) c
= = |~r −~r′ | s |~E|2 , (15.51)
dΩ dt′ 4π
em que a distância retardada, s, já foi definida na seção anterior. Como o campo elétrico é
~Ea = e (~r −~r′ ) × (~r −~r′ ) ×~a
c2 s3
e usando a manipulação algébrica para (~r −~r′ ) × [(~r −~r′ ) ×~a] temos
2
dU (α, φ) e2 a2 (1 − β sen α cos φ) − 1 − β 2 sen2 α sen2 φ
= . (15.52)
dt′ 4πc3 (1 − β sen α cos φ)5
Os ângulos θ e φ variam no tempo durante a rotação. Parametrizando o ângulo sólido dΩ no ângulo φ e em
α, de tal forma que temos dΩ = sen α dα dφ, a integração da equação acima por este ângulo sólido nos
dará
2e2 a2 1
P = . (15.53)
3c (1 − β 2 )2
3
dU (α, φ) e2 a2
= (1 − sen2 α sen2 φ) . (15.54)
dt′ 4πc3
Mas, de acordo com a relação (15.49),
dU (α, φ) e2 a2 2 e2 a2
= (1 − cos θ) = sen2 θ . (15.55)
dt′ 4πc3 4πc3
Consequentemente, um observador fixo próximo do plano da órbita observará a radiação de cíclotron duas
vezes por resolução, na forma de dois picos de pulsos iguais de radiação com polarização alternada.
dU (π/2, 0) e2 a2 1
′
= . (15.56)
dt 4πc (1 − β)3
3
Logo, quando β → 1, a radiação tem um pico frontal pronunciado, e um lóbulo de menor intensidade na
direção oposta. Vemos que a expressão (15.56) aumenta rapidamente quando β → 1, de maneira que cargas
relativísticas confinadas numa órbita circular irão irradiar uma grande parte de suas energias. Estas são as
características da radiação de síncrotron.
No plano de órbita da partícula (α ≈ π/2), a Eq. (15.52) é dada por
2
dU (π/2, φ) e2 a2 (1 − β cos φ) − 1 − β 2 sen2 φ
= , (15.57)
dt′ 4πc3 (1 − β cos φ)5
Aqui φ0 é o momento em que começamos observar o movimento circular da carga, i.e., o ângulo φ0 é uma
medida da largura do lóbulo da radiação síncrotron ∆θ. Consideremos uma partícula ultra-relativística e
um deslocamento ∆θ. Assim,
1 p
γ=p ≫ 1, 1 − β2 ≪ 1 ,
1 − β2
∆θ
∆t′ = , (15.60)
ω0
dt ∆θ ∆θ
∆t = ′
∆t′ = (1 − β) = 2 , (15.61)
dt ω0 2γ ω0
∆θ
∆l = v ∆t′ = v ,
ω0
encontraremos,
∆l v ∆t′ ∆θ
∆t = ∆t′ − = ∆t′ − = (1 − β) ∆t′ = (1 − β)
c c ω0
(1 − β)(1 + β) ∆θ (1 − β 2 ) ∆θ ∆θ
= = = 2 . (15.62)
(1 + β) ω0 2 ω0 2γ ω0
1
∆t = . (15.63)
2γ 3 ω0
Devido ao caráter periódico do movimento da partícula carregada, este pulso será repetido com intervalos
T = 2π/ω0 . A dependência temporal da potência recebida está ilustrada qualitativamente na Fig. 15.6.
Análise espectral No último passo, realizado acima, fizemos uma descrição qualitativa da radiação de
síncroton, mas o argumento poderá ser quantificado pelo uso do teorema de Parseval da análise de
Fourier, que será discutido com mais detalhes na Seção 15.7. Assim,
dP (t) ~ (t)|2 ,
= |A (15.64)
dΩ
em que r
~ (t) = c h ~i
A RE . (15.65)
4π ret
O campo elétrico ~E é dado pela Eq. (15.15). A potência instantânea dada na Eq. (15.64) está expressa
no tempo do observador, ao contrário do que aparece em (15.41).
“Z_2” — 2017/9/5 — 8:19 — page 438 — #458
A energia total irradiada por unidade de ângulo sólido é a integral no tempo da Eq. (15.64). Logo,
Z ∞
dU ~ (t)|2 dt .
= |A (15.66)
dΩ −∞
A igualdade de Eqs. (15.68) e (15.66) é um caso especial do teorema de Parseval. É habitual integrar
somente sobre frequências positivas, uma vez que o sinal da frequência não tem significado físico.
Portanto, a energia irradiada por unidade de ângulo sólido por unidade de intervalo de frequência será
Z ∞ 2
dU d I (ω, n̂)
= dω ,
dΩ 0 dω dΩ
em que
d2 I ~ (ω)|2 + |A
~ (−ω)|2 .
= |A (15.69)
dω dΩ
~ (t) for real, então A
Mas, se A ~ (−ω) = A~ ∗ (ω). Assim,
d2 I ~ (ω)|2 ,
= 2 |A (15.70)
dω dΩ
na qual relaciona a energia irradiada como uma função contínua do tempo para o espectro de frequên-
cias da energia irradiada.
Reescrevendo (15.15), para uso futuro, temos
" #
n̂ − ~β n̂ × {(n̂ − ~β) × ~β˙ }
~E(~r, t) = e + , (15.71)
γ 2 (1 − ~β · n̂)3 R2 c(1 − ~β · n̂)3 R ret
usando esta equação, vamos tentar derivar uma expressão geral para a energia irradiada por unidade
de ângulo sólido por unidade de intervalo de frequência em termos de uma integral sobre a trajetória
da partícula.
Logo, a transformada de Fourier usando (15.71) será
r Z ∞ " #
e2 n̂ × {(n̂ − ~β) × ~β˙ }
~ (ω) =
A ei ωt dt , (15.72)
8π 2 c −∞ (1 − ~β · n̂)3 ret
“Z_2” — 2017/9/5 — 8:19 — page 439 — #459
R(t′ )
em que [ ]ret significa avaliada em t = t′ + c . Mudando a variável de integração de t para t′
chegaremos em
r Z ˙
~ (ω) = e2 ∞
′ R(t′ ) n̂ × {(n̂ − ~β) × ~β } ′
A ei ω[t + c
]
dt , (15.73)
8π 2 c −∞ (1 − ~β · n̂)2
uma vez que o ponto de observação assumimos estar longe da região em que ocorre a aceleração, o
dt
vetor unidade n̂ pode ser considerado constante no tempo. Também usamos o fato de dt ~
′ = 1 − β · n̂.
R(t′ ) ≈ x − n̂ ·~r(t′ ) ,
Na relação anterior excluímos um fator de fase global, sem perdas de generalidades, ainda omitimos
as linhas na variável do tempo apenas por simplicidade. Então, a energia irradiada por unidade de
ângulo sólido por unidade de intervalo de frequência (15.70) é
Z 2
˙
d2 I e2 ∞
i ω[t− n̂ ·cr(t) ]
~ n̂ × {(n̂ − ~β) × ~β }
= 2 e dt . (15.74)
dω dΩ 4π c −∞ (1 − ~β · n̂)2
˙
Para um movimento específico em que ~r(t) é conhecido, ~β (t) e ~β (t) podem ser calculados, e a
integral pode ser avaliada como uma função de ω na direção de n̂. Se estudarmos mais de uma
partícula carregada acelerada, uma soma coerente de amplitudes A~ j (ω) (uma para cada partícula)
deverá substituir a amplitude única na Eq. (15.74).
Nota-se que, o integrando na Eq. (15.74) é um diferencial perfeito, excluindo o exponencial,
˙ " #
n̂ × {(n̂ − ~β) × ~β } d n̂ × (n̂ × ~β)
= .
(1 − ~β · n̂)2 d 1 − ~β · n̂
Então, fazendo uma integração por partes, obtemos a seguinte relação para a distribuição de intensi-
dade Z ∞ 2
d2 I e2 ω 2 n̂ ·~r(t)
= 2 n̂ × (n̂ × ~β) ei ω[t− c ] dt . (15.75)
dω dΩ 4π c −∞
Para diversas cargas ei em movimento acelerado, o integrando em (15.75) torna-se
N
X
ω ω
e ~β e− i c n̂ ·~r(t) → ej ~β j e− i c n̂ ·~rj (t) .
j=1
No limite de uma distribuição contínua de carga em movimento, a soma sobre j torna-se uma integral
sobre a densidade de corrente ~J(~x, t),
Z
ω 1 ω
e ~β e− i c n̂ ·~r(t) → d3 r ~J(~x, t) e− i c n̂ · ~x .
c
“Z_2” — 2017/9/5 — 8:19 — page 440 — #460
βc βc
~r(t) = ρ sen t , ρ 1 − cos t , 0 .
ρ ρ
No limite de pequenos ângulos, computamos
βct βct
n̂ × n̂ × ~β = β −ǫ̂k sen + ǫ̂⊥ cos sen θ ,
ρ ρ
em que ǫ̂k = ǫ̂2 é o vetor unitário na direção y correspondendo à polarização no plano de órbita e
ǫ̂⊥ = n̂ × ǫ̂2 é a polarização ortogonal, correspondendo, aproximadamente, à polarização perpendi-
cular ao plano de órbita. O argumento da exponencial é
n̂ ·~r(t) ρ βct ω 1 2 c2 3
ω t− = ω t − sen cos θ ≃ + θ t + 2t ,
c c ρ 2 γ2 3ρ
já que estamos preocupados com pequenos ângulos θ e intervalos de tempo comparativamente
curtos
~
em torno de t = 0. Fazendo a mesma aproximação na relação de n̂ × n̂ × β e substituindo as duas
relações anteriores na integral da radiação, Eq. (15.75), temos
2
d2 I e2 ωρ 2 1 2 2 θ2 2
= 2 + θ K2/3 (ξ) + K (ξ) , (15.77)
dω dΩ 3π c c γ2 (1/γ 2 ) + θ 2 1/3
em que introduzimos o parâmetro
3
ρω 1 2
ξ= + θ2
3c γ2
“Z_2” — 2017/9/5 — 8:19 — page 441 — #461
O primeiro termo entre colchetes na Eq. (15.77) corresponde à radiação polarizada no plano de órbita
e o segundo termo entre colchetes à radiação polarizada perpendicularmente a este plano. No plano
de órbita θ = 0, a polarização é puramente horizontal. Integrando sobre todas as frequências, a
distribuição angular da energia irradiada será,
Z ∞ 2
dI d I 7 e2 1 5 θ2
= dω = 1+ . (15.78)
dΩ 0 dω dΩ 16 ρ (1/γ 2 + θ 2 )5/2 7 (1/γ)2 + θ 2
Integrando em todos os ângulos, verificamos que a energia irradiada com polarização paralela é sete
vezes maior do que a energia irradiada com polarização perpendicular. A radiação a partir de uma
carga com movimento relativístico é fortemente, mas não completamente, polarizada no plano de
movimento.
Da Eq. (15.77), observa-se que a intensidade da radiação é insignificante para ξ ≫ 1. A frequência
crítica ωc é definida como a frequência quando temos ξ = 12 e θ = 0. Então,
3c 3
ωc = γ
2ρ
e o ângulo crítico θc é definido como,
1/3 1/3
3c 1 2ωc
θc ≈ = .
ωρ γ ω
Para frequências muito maiores do que a frequência crítica e ângulos muito maiores do que o ângulo
crítico, a emissão de radiação síncrotron é insignificante. A Fig. 15.8 mostra qualitativamente a distri-
buição angular para frequências muito menores em comparação com ωc , para frequências na ordem
de ωc e para frequências muito maiores do que ωc . Usa-se a unidade natural de ângulo, γθ.
Uma integração da Eq. (15.77) sobre todos os ângulos nos leva à expressão,8
Z √ e2 ω Z ∞
dI d2 I
= dΩ = 3 γ K (x) dx . (15.79)
dω dω dΩ c ωc ω/ωc 5/3
Se definirmos √ Z ∞
9 3
S (y) ≡ y K5/3 (x) dx ,
8π y
ω
em que y = ωc . Então,
dI 8πe2
= γ S (y) . (15.80)
dω 9c
8
J. Schwinger, Physical Review, 75, No. 12, 1912-1925 (1949).
“Z_2” — 2017/9/5 — 8:19 — page 442 — #462
No limite em que ω é muito menor do que ωc , a Eq. (15.79), ou (15.80), se reduz à forma
dI e2 ωρ 13
∼
dω c c
e quando temos o limite em que ω é muito maior do que ωc , se reduz à forma
r 1
dI 3π e2 ω 2 − ωω
≈ γ e c.
dω 2 c ωc
ω
O comportamento de S (y) como função de y = ωc está dado na Fig. 15.9.
Finalmente, a fórmula para a distribuição espectral da radiação sincrotron, Eq. (15.79), pode ser
expressa em termos de uma integral rapidamente convergente sem o uso das funções especiais envol-
vidos por meio da relação.9 Assim, temos
Z ∞ Z ∞ " r #
1 9 + 36x2 + 16x4 4x2 x2
K5/3 (x) dx = √ q exp −ξ 1 + 1+ dx .
ξ 3 0 (3 + 4x2 ) 1 + x2 3 3
3
Quando muitas partículas carregadas, N , contribuem para a radiação, podemos ter três situações dife-
rentes, dependendo das fases relativas dos campos de radiação a partir das partículas individuais:
9
M. Kh. Khokonov, Journal of Experimental and Theoretical Physics, 99, No. 4, 690-707 (2004).
“Z_2” — 2017/9/5 — 8:19 — page 443 — #463
1. Todas as N partículas radiantes estão espacialmente muito próximos umas das outras, mais próximas
do que um comprimento de onda característico. Então, as diferenças de fase relativas dos campos
elétrico e magnético individuais irradiados são desprezíveis e os campos irradiados total de todas as
partículas individuais se somam para tornar-se N vezes a partir de uma partícula. Isto significa que a
energia irradiada a partir dos N partículas será N 2 maior do que a de uma única partícula carregada.
Isto é chamado de radiação coerente.
2. As partículas carregadas são perfeitamente bem distribuída na órbita. Neste caso, as fases dos campos
de radiação causam um cancelamento completo dos próprios campos. Nenhuma radiação escapa.
3. As partículas carregadas são, um pouco, desigualmente distribuídas na órbita. Isto acontece por uma
corrente de anel aberto, realizado inicialmente por partículas carregadas uniformemente distribuídas,
que está sujeita a flutuações térmicas. Da mecânica estatística, sabemos que isto acontece
√ em todos
os sistemas abertos e que as densidades
√ das partículas exibem flutuações da ordem de N . Isto sig-
nifica que, das N partículas, N irá apresentar desvio de aleatoriedades perfeita (e de cancelamento
de campo de radiação,
√ assim, perfeito) e dão origem a campos de radiação líquida, que são propor-
cionais ao fator N . Como resultado, a potência irradiada será proporcional a N , e naturalmente,
aqui estamos falando sobre a radiação incoerente. Exemplos disto podem ser encontrados tanto em
laboratórios terrestres como em condições cósmicas.
A radiação de síncrotron foi observada pela primeira vez em 1947 no acelerador síncrotron de elétrons
da General Electric.10 Aqui no Brasil, temos o Laboratório Nacional de Luz Síncrotron (LNLS),11 que em
muito vem contribuindo para a pesquisa científica e tecnológica do país.
A radiação de síncrotron é observada também na astrofísica, como a nebulosa do Caranguejo. As obser-
vações concluem que a radiação de síncrotron está sendo emitida por elétrons de aproximadamente 1013 eV,
que se movem em órbitas circulares ou helicoidais, numa indução magnética da ordem de 10−4 gauss. Por-
tanto, a frequência orbital dos elétrons será
eB
ω0 = = 9 × 10−4 /s ,
mcγ
mas a radiação de síncrotron correspondente terá frequências da ordem de até
ωc = γ 3 ω0 ≈ 7 × 1015 /s .
Assim, o espectro de radiação da nebulosa do Caranguejo estende-se sobre uma faixa de frequência que vai
das radiofrequências até o ultravioleta.12
Ainda dentro das classes de fontes astronômicas onde emissão síncrotron é importante estão as nebulo-
sas de vento de pulsar, também conhecida como plerion, este tipo é uma nebulosa que deve sua dinâmica ao
vento produzido por um pulsar. Nos estágios iniciais, durante os primeiros milhares de anos de sua existên-
cia, uma nebulosa de vento de pulsar encontra-se no interior de invólucros de remanescentes de supernova.
Entretanto, nebulosas de vento de pulsar também são encontradas em torno de pulsares mais velhos, em
10
General Electric, conhecida como GE, empresa americana.
Ver: F. R. Elder, A. M. Gurewitsch, R. V. Langmuir and H. C. Pollock, Physical Review, 71 (11), 829-830 (1947).
11
O Laboratório Nacional de Luz Síncrotron (LNLS) é uma instituição de pesquisa em física, em biologia estrutural e em nano-
tecnologia, desenvolvendo projetos nas áreas de física, química, engenharia, meio ambiente e ciências da vida. O laboratório foi
projetado em 1983 entrou em funcionamento em 1997 e está localizado na cidade de Campinas, São Paulo. O LNLS possui um
acelerador de partículas (um síncrotron) usado como fonte de luz que é o pioneiro desse gênero no hemisfério sul e foi projetado
e construído totalmente no Brasil. O novo laboratório de luz síncrotron 4G, será construído no mesmo local com inauguração
prevista para 2019. Nele ficará Sirius, o novo acelerador de partículas com 235 metros de diâmetro e com emitância de 0,27
nanômetros-radianos.
12
Para maiores detalhes ver J. D. Jackson, Classical electrodynamics, 3rd ed. (1999).
“Z_2” — 2017/9/5 — 8:19 — page 444 — #464
2 e2 a2 1 − β 2 sen2 ψ
P (θ, φ) = , (15.82)
3 c3 (1 − β 2 )3
Vamos fazer uma análise de Fourier das componentes do campo elétrico que são transversais à veloci-
dade ~v. Assim, podemos escrever que
γ −2 b
E⊥ (t) = q , (15.83)
[(vt)2 + γ −2 b2 ]3/2
Numa onda eletromagnética, metade da energia da onda é carregada pelo campo elétrico e a outra
metade é associada ao campo magnético. Portanto, a energia total será
Z Z Z +∞
1 2 v 2
U= E⊥ dV = 2π b db E⊥ dt . (15.88)
4π 4π −∞
~ (ω) a
Em termos das componentes de Fourier, usando o teorema de Parseval, que afirma que: Sendo A
~
transformada de Fourier de um campo real A(t)
Z +∞
~ (ω) = 1
A ~ (t) ei ωt dt
A (15.89)
2π −∞
temos a relação
Z +∞ Z ∞
~ 2 dt = 4π
|A| ~ (ω)|2 dω .
|A (15.90)
−∞ 0
mentais. Pelo fato de 2α/π = 0, 00464, o número de fótons equivalentes por elétrons é pequeno. Na teoria
quântica, incluindo as contribuições de ordem mais baixa, temos o espalhamento e− e− → γ → e− e− , em
que aparece fótons virtuais, este processo é conhecido como espalhamento Møller.18 Uma representação
esquemática da aproximação semiclássica deste processo é dada na Fig. 15.10.
18
Christian Møller (1904-1980), físico e químico dinamarquês.
C. Møller, Annalen der Physik, Lpz, 14, 531 (1932).
“Z_2” — 2017/9/5 — 8:19 — page 447 — #467
Problemas
15.1 Encontre os potenciais e os campos de uma partícula com carga e:
a) com a velocidade constante ~v;
b) com a aceleração constante ~a.
Sugestão: Consulte o livro dos Profs. Landau e Lifshitz [49] e do Prof. Jackson [42].
15.2 Usando o fato de que os potenciais de Liénard-Wiechert são soluções das equações de onda (1.14) e
(1.15), juntamente com a equação de continuidade, mostre que estes potenciais são consistentes com
a condição de Lorenz,
~ + 1 ∂Φ = 0 .
~ ·A
∇
c ∂t
15.3 Determine o vetor de Poynting associado com uma carga puntiforme em movimento uniforme, e
mostre que a potência total irradiada é igual a zero. Sugestão: Consulte o livro do Prof. Bassalo [7].
15.4 Determine os potenciais de Liénard-Wiechert para uma partícula carregada q em movimento retilí-
neo uniforme com velocidade ~v partindo da origem em t = 0. Sugestão: Consulte o livro do Prof.
Machado [54].
15.5 Determine os campos ~E e B ~ produzidos pela partícula carregada q do problema anterior. Sugestão:
Consulte o livro do Prof. Machado [54].
15.6 Mostre que o potencial escalar
q
Φ(~r, t) = q
(ct −~r · ~β)2 + (1 − β 2 )(r 2 − c2 t2 )
para uma partícula de carga q movendo-se com velocidade constante pode ser reescrito como
q
Φ(~r, t) = p ,
R(t) 1 − β 2 sen2 θ
em que R~ (t) = ~r − c~βt é calculado no tempo atual, não no tempo retardado e θ é o ângulo entre
~v = c~β e R
~ (t). Sugestão: Consulte o livro do Prof. Machado [54].
15.7 Uma partícula de carga q1 está em repouso na origem enquanto uma partícula de carga q2 move-se
ao longo do eixo z com velocidade constante ~vq2 = v k̂. Sua equação de movimento é dada por
~rq2 (t) = vtk̂.
a) Determine a força de Lorentz produzida por q1 sobre q2 , como função do tempo t.
b) Determine a força produzida por q2 sobre q1 , como função do tempo t.
Sugestão: Consulte o livro do Prof. Machado [54].
15.8 Uma partícula de carga q está em movimento circular uniforme em um círculo de raio a com veloci-
dade angular ω. A órbita está no plano xy e em t = 0 a partícula está na posição (a, 0). Determine os
potenciais e campos de Liénard-Wiechert no eixo z.
15.9 Determinar a intensidade da radiação de uma partícula ultra relativística que se move seguindo uma
trajetória circular em um campo magnético uniforme constante. Sugestão: Consulte o livro dos Profs.
Landau e Lifshitz [49].
15.10 Determine a lei de variação da energia ao longo do tempo para uma carga em movimento, em uma
órbita circular em um campo magnético uniforme e constante, e a perda de energia por radiação.
Sugestão: Consulte o livro dos Profs. Landau e Lifshitz [49].
“Z_2” — 2017/9/5 — 8:19 — page 448 — #468
15.11 Encontre a polarização para a radiação síncrotron. Sugestão: Consulte o livro dos Profs. Landau e
Lifshitz [49].
15.12 A expressão de Heaviside-Feynman para o campo elétrico de uma partícula de carga e em movimento
arbitrário, i.e., uma alternativa para a expressão de Liénard-Wiechert (15.15), é
~E = e n̂ R d n̂ d2
+e + e [n̂]ret ,
R2 ret c ret dt R2 ret c2 dt2
em que as derivadas temporais são em relação ao tempo no ponto de observação. O campo magnético
′
é dado por (15.16). Usando o fato de que o tempo retardado é t′ = t − R(tc ) e que
dt
= 1 − ~β (t′ ) · n̂(t′ ) ,
dt′
mostre que a forma acima produz (15.15), quando as diferenciações no tempo são realizadas.
15.13 Uma partícula não relativística, de carga ze, massa m e energia cinética K, efetua uma colisão frontal
com um campo de forças central, de alcance finito. A interação é repulsiva e descrita por um potencial
U (r) que se torna maior que K a curtas distâncias.
a) Determine a energia total irradiada.
2
b) Para o potencial de Coulomb Uc (r) = zZe r , determine a energia total irradiada.
15.14 Utilizando os campos de Liénard-Wiechert, discutir a potência média temporal irradiada por unidade
de ângulo sólido, num movimento não relativístico de uma partícula carregada e, que se move:
a) Ao longo do eixo z com posição instantânea z (t) = a cos ω0 t.
b) Em um círculo de raio R no plano xy, com frequência angular constante ω0 .
Interprete graficamente e compare cada caso.
15.15 Como o caso a) do problema anterior, uma carga e move-se com movimento harmônico simples ao
longo do eixo z, com a equação horária z (t′ ) = a cos ω0 t′ .
a) Mostre que a potência instantânea irradiada por unidade de ângulo sólido é
em que β = a ωc0 .
b) Através da realização de um tempo médio, mostrar que a potência média por unidade de ângulo
sólido é
dP e2 cβ 4 4 + β 2 cos2 θ
= sen2 θ .
dΩ 32πa2 (1 − β 2 cos2 θ)7/2
15.16 Use a idéia do fóton e os princípios de conservação de energia e do momentum para justificar a
conclusão de que uma carga em movimento uniforme não pode irradiar.
15.17 Usando a relação (15.86) e as formas assintóticas das funções de Bessel, mostre que
r
1 π −x
lim K1 (x) → e lim K1 (x) → e .
x→0 x x→∞ 2x
“Z_2” — 2017/9/5 — 8:19 — page 449 — #469
Leitura Recomendada
Recomenda-se ao estudante, a leitura paralela contidas nos seguintes livros,
– J. D. Jackson [42];
– L. D. Landau and E. M. Lifshitz [49];
– J. Schwinger, L. L. DeRaad Jr., K. A. Milton and W.-Y. Tsai [72];
– M. A. Heald and J. B. Marion [36].
Nestes livros, em especial o texto do Prof. Jackson, o leitor encontrará excelentes discussões e deduções
detalhadas para os potenciais de Liénard-Wiechert para cargas puntiformes, a fórmula de Larmor, o efeito
Bremsstrahlung, radiações de cíclotron e síncrotron.
Para um estudo dos fótons virtuais, podemos consultar o texto do Prof. Frenkel,
– J. Frenkel [30].
“Z_2” — 2017/9/5 — 8:19 — page 450 — #470
Capítulo 16
Perda de Energia por Radiação
Neste capítulo, começaremos pela consideração do simples problema da transferência de energia para um
elétron livre por uma partícula pesada e rápida. Os efeitos de uma força de ligação sobre um elétron li-
vre serão explorados, e obtém-se a fórmula clássica de Bohr para a perda de energia. Descrevem-se as
modificações quânticas e o efeito de polarização do meio. Discute-se ainda o fenômeno da radiação de
Čerenkov1 nos materiais transparentes, o fenômeno da radiação de transição e finalmente o método dos
quanta virtuais.
450
“Z_2” — 2017/9/5 — 8:19 — page 451 — #471
zeγvt
E1 = −
(b2 + γ 2 v 2 t2 )3/2
zeγb
E2 = (16.1)
(b + γ 2 v 2 t2 )3/2
2
E3 = 0.
Integrando no tempo, somente a componente transversal E2 não se anula. Assim, o impulso ∆p será
Z ∞
2ze2
∆p = e E2 (t) dt = . (16.2)
−∞ bv
Da Eq. (16.2) temos que a energia transferida para o elétron, ∆E, é dado por
(∆p)2 2z 2 e4 1
∆E (b) = = . (16.3)
2m mv 2 b2
Note que a energia transferida ∆E (b) depende somente da carga e da velocidade da partícula incidente, e
não de sua massa. Nota-se também que é inversamente proporcional ao quadrado do parâmetro de impacto
b. Naturalmente, há um limite superior na energia transferida, correspondente à uma colisão frontal. Assim,
podemos obter um limite mínimo de bmín válido para a máxima energia transferida permitida. Se o momen-
tum da partícula incidente é ~p = γm~v, no caso de transferência máxima ∆~p = 2γm~v, logo a energia
máxima é
(∆p)2 ∼
∆E (bmín ) = ∆Emáx = = 2mγ 2 v 2 , (16.4)
2m
então temos o limite inferior
ze2
bmín = . (16.5)
γmv 2
No outro extremo, i.e., em caso de colisões com parâmetro de impacto muito grande, bmáx , o resultado
para ∆Emáx dado em (16.3) recai em um erro, em virtude da ligação dos elétrons atômicos. Em primeira
aproximação consideramos os elétrons livres, na realidade eles estão blindados em uma órbita no átomo.
Se o tempo de colisão, ∆t ∼ = b/γv, é pequeno comparado ao período orbital do movimento do elétron,
esperamos em uma primeira aproximação que o elétron seja livre. Mas, por outro lado, se o tempo de
colisão for muito maior que o período orbital, o elétron fará muitos ciclos de seu movimento, enquanto a
partícula incidente passa lentamente, e será influenciado adiabaticamente por campos que não contribuem na
transferência de energia. Quando o tempo de colisão, ∆t ∼ = b/γv, e o período orbital são compatíveis, então
o parâmetro de impacto será máximo, bmáx . E se ω for a frequência atômica característica do movimento do
elétron, esta condição será
1 γv
∆t(bmáx ) ∼ ou bmáx = . (16.6)
ω ω
Como resultado temos que no intervalo bmín < b < bmáx a energia transferida é representada com conside-
rável aproximação pela Eq. (16.3).
Uma partícula rápida, passando através da matéria, vê um mar de elétrons que estão em diferentes
distância em relação a sua trajetória. Se temos N átomos por unidade de volume com Z elétrons cada, o
número de elétrons compreendidos em um parâmetro de impacto entre b e b + db em uma espessura dx de
matéria é
dn = N Z 2πb db dx . (16.7)
“Z_2” — 2017/9/5 — 8:19 — page 452 — #472
Assim, a perda de energia por unidade de comprimento para a partícula incidente será dada por dn∆E/dx.
Logo, Z
dE
= 2πN Z ∆E (b) b db . (16.8)
dx
Substituindo o valor de ∆E (b) dado em (16.3), e integrando de bmín a bmáx , teremos
Z bmáx
dE z 2 e4 1
= 4πN Z b db
dx mv 2 bmín b
2
z 2 e4 bmáx
= 4πN Z ln , (16.9)
mv 2 bmín
mas bmáx ∼
= γ 2 mv 3 /ze2 ω. Então, da Eq. (16.9) temos
bmín
dE z 2 e4 γ 2 mv 3
= 4πN Z ln . (16.10)
dx mv 2 ze2 ω
Este resultado para a perda de energia nos dá todas as características essenciais do resultado clássico obtido
por N. Bohr em 1915.2
se a energia transferida for pequena, tal que o movimento da partícula blindada não é relativístico e a
amplitude inicial e final de oscilação ao redor da origem O é pequena comparada com b. Então, somente
o campo elétrico da partícula incidente será necessário na equação de movimento. Este caso é conhecido
como aproximação dipolo, por analogia com o problema correspondente da absorção de radiação.
2
N. Bohr, Philosophical Magazine, 25, 10-31 (1913); Idem, 30, 581-612 (1915); Idem, Det Kongelige Danske Videnskabernes
Selskab - Matematisk-fysiske Meddelelser, 18 No. 8, 1-144 (1948).
“Z_2” — 2017/9/5 — 8:19 — page 453 — #473
¨ + Γ ~x˙ + ω0 ~x = − e ~E(t) ,
~x (16.11)
m
em que ~E(t) é o campo elétrico em O produzido por ze, suas componentes são dadas por (16.1), ω0 é a
frequência característica da ligação e Γ é a constante de amortecimento. Pela transformada de Fourier,
~E(t) e ~x(t) são,
Z +∞
1
~x(t) = √ ~x(ω) e− i ωt dω (16.12)
2π −∞
Z +∞
~E(t) = √1 ~E(ω) e− i ωt dω , (16.13)
2π −∞
em que ~x(t) e ~E(t) são reais, e as partes positiva e negativa da frequência estão relacionadas por
e Z +∞
∆E = −e dt ~v · ~E , (16.18)
−∞
em que ~v = ~x˙ e, na aproximação dipolo, ~E é o campo da partícula incidente ao redor da origem O. Usando
as transformadas de Fourier, bem como
Z +∞
1 ′
ei(k−k )x dx = δ(k − k′ ) ,
2π −∞
“Z_2” — 2017/9/5 — 8:19 — page 454 — #474
Para Γ pequeno, o integrando salta bruscamente em ω = ω0 como uma aproximação lorentziana, i.e., um
pico agudo de ressonância. Consequentemente ao redor de ω = ω0 o campo elétrico será ~E(ω0 ). Então, a
Eq. (16.20) pode ser escrita como,
Z ∞
2e2 ~ 2 ω2 Γ
∆E ≈ E(ω0 ) dω
m 0 (ω02 − ω 2 )2 + ω 2 Γ2
Z ∞
2e2 ~ 2 x2
= E(ω0 ) 2 2 dx , (16.21)
m 0 ω0 2 2
Γ2
− x + x
πe2 ~ 2
∆E = E(ω0 ) . (16.22)
m
Para uma partícula com carga ze passando a uma distância b da origem, O, com velocidade ~v, o campo
eletromagnético na origem é dado por (16.1). Para determinar ∆E precisamos calcular E1 (ω) e E2 (ω). A
transformada E1 (ω) será
Z
zeγv ∞ t ei ωt
E1 (ω) = − √ dt
2π −∞ (b2 + γ 2 v 2 t2 )3/2
Z ∞
i zeγv ∂ ei ωt
E1 (ω) = √ dt , (16.23)
2π ∂ω −∞ (b2 + γ 2 v 2 t2 )3/2
chamando x = γvt/b, a Eq. (16.23) fica
Z ∞
i ze ∂ ei ωbx/γv
E1 (ω) = √ dx (16.24)
2π b2 ∂ω −∞ (1 + x2 )3/2
Então, a energia transferida, dada por (16.22), para uma carga ligada harmonicamente, usando as relações
(16.28) e (16.31), será
2z 2 e4 1 2 2 1 2 2
∆E (b) = ξ K1 (ξ) + ξ K0 (ξ) , (16.32)
mv 2 b γ2
em que ξ = ω0 b/γv.
P
em que ∆Ei (b) é dado por (16.32) e i gi são os Z elétrons combinados em grupos de gi elétrons com a
mesma frequência harmônica ωi e com ξ = ωi b/γv. Nota-se que a Eq. (16.32) cai rapidamente a zero para
grandes valores de b. Pelo fato de que para uma integral da função de Bessel arbitrária termos,
Z
x2 n o
x [Zp (αx)]2 dx = [Zp (αx)]2 − Zp−1 (αx)Zp+1 (αx) .
2
ωi bmín
em que ξmín = γv . Em geral, ξmín ≪ 1. Assim, nestas condições temos, para ξmín ≪ 1,
ξ
− ln + 0, 5772... , quando v=0
2
Kv (ξ) → . (16.35)
Γ(v) 2 v
, quando v 6= 0
2 ξ
Então a expressão final será,
dE z 2 e4 1, 123 γv v2
= 4πN Z ln − . (16.36)
dx mv 2 hωibmín 2c2
ze 2
e bmín = γmv 2 . Este resultado é a perda de energia clássica obtida por Bohr em seu trabalho de 1915,
como já vimos anteriormente.3 Esta fórmula dá uma descrição razoável da perda de energia das partículas
alfa relativamente lentas e dos núcleos mais pesados. Para os elétrons, mésons, prótons e até partículas alfa
rápidas, são necessárias as correções quânticas.
ze2
O limite clássico para bmín é γmv 2 . Na mecânica quântica temos um outro limite mínimo, visto que o
elétron poderá ser localizado por uma partícula incidente pesada, com uma acurácia que satisfaz o princípio
de incerteza ∆x ≥ ~/p, i.e., ∆x ∼ bmín . Logo,
~ ~
bmín ≈ = . (16.38)
p γmv
O valor de bmáx é o mesmo dado em (16.6), então substituindo na Eq. (16.9) encontraremos
dE z 2 e4 γ 2 mv 2
= 4πN Z ln , (16.39)
dx mv 2 ~hωi
em que hωi é a frequência média do átomo. Um cálculo mais rigoroso foi realizado por H. Bethe4 em 1930,
incluindo os efeitos de colisões próximas, dando5
2 2
dE z 2 e4 2γ mv v2
= 4πN Z ln − 2 . (16.40)
dx mv 2 ~hωi c
2
Nota-se que, com exceção da correção vc2 e do fator 2 no logaritmo, a expressão (16.39) está de acordo
com o resultado exato dado pela Eq. (16.40). Esta equação mostra que dE/dx é independente da massa da
partícula, variando como 1/β 2 para velocidades não relativísticas. Após passar por um mínimo, βγ ∼ 3,
dE/dx aumenta com uma variação proporcional a ln(γ), com βγ = p/mc, como mostra Fig. 16.3. Nesta
figura, observamos diversos meios materiais e três diferentes partículas, múons, píons e prótons.
Assim, temos as relações clássica e quântica para a perda de energia por unidade de comprimento. Estas
relações são muito úteis no estudo de física nuclear e altas energias.6
3
N. Bohr, Philosophical Magazine, 30, 581-612 (1915).
4
Hans Albrecht Bethe (1906-2005), físico alemão-americano.
5
H. A. Bethe, Annalen der Physik, 5, 325-400 (1930).
6
Uma excelente revisão em aspectos teóricos e experimentais de perda de energia dE/dx poderá ser encontrada no artigo de
S. P. Ahlen, Reviews of Modern Physics, 52, 121-173 (1980).
“Z_2” — 2017/9/5 — 8:19 — page 457 — #477
dielétrico macroscópico isotrópico (condutividade zero, permeabilidade unitária e sem absorção da radia-
ção).
As equações de Maxwell, para este meio dielétrico, são:
~
~ ×H
∇ ~ = 4π ~J + 1 ∂ D (16.41a)
c c ∂t
~
~ × ~E = − 1 ∂ B
∇ (16.41b)
c ∂t
~ ·D
∇ ~ = 4πρ (16.41c)
~ ·~
∇ B=0. (16.41d)
Quando o dielétrico se encontra polarizado, devido a ação de um campo externo, a região estudada terá
dois campos, um devido à polarização ~P e o outro devido ao vácuo: D ~ 0 = ε0~E, em que ~E é o campo
medido macroscopicamente e ε0 é a constante dielétrica no vácuo. Dai segue:
~ =D
D ~ 0 + 4π ~P = ε0 ~E + 4π ~P , (16.42)
4π ~P = (n2 − 1) ~E . (16.46)
e naturalmente,
~
~E + 1 ∂ A = −∇Φ
~ , (16.50)
c ∂t
em que Φ é o conhecido potencial escalar.
Além disso, colocaremos A~ e Φ de maneira tal que satisfaçam a condição de Lorenz,
∇ ~ + ε ∂Φ = 0 .
~ ·A (16.51)
c ∂t
“Z_2” — 2017/9/5 — 8:19 — page 459 — #479
Substituindo as Eqs. (16.48) e (16.50) na Eq. (16.41a) e utilizando a condição de Lorenz e o fato de que
~ = ε ~E, temos
D !
ε ∂ 1 ∂ ~
A 4π ~
~ × (∇
∇ ~ =
~ × A) − ~
− ∇Φ + J. (16.52)
c ∂t c ∂t c
encontramos
2~
∇ ~ − ε ∂ A = − 4π ze~v δ(~r − ~vt)
~ 2A (16.54)
c2 ∂t2 c
e de modo análogo,
2
~ 2Φ − ε ∂ Φ
ε ∇ = −4π ze δ(~r − ~vt) . (16.55)
c2 ∂t2
~
~ (~k, ω) = 2ze ~v δ(ω − k ·~v)
A
c k2 − 22 ε(ω)
ω
c
. (16.60)
2ze δ(ω − ~k ·~v)
Φ(~k, ω) =
ε(ω) k2 − ω22 ε(ω)
c
“Z_2” — 2017/9/5 — 8:19 — page 460 — #480
Para ilustrar iremos calcular a componente E1 (ω), a componente de ~E paralela a ~v. Das Eqs. (16.60) e
(16.61), temos
Z ∞
2 i ze 1 3 i bk2 ωε(ω)v δ(ω − vk1 )
E1 (ω) = d k e − k1 2 , (16.63)
ε(ω) (2π)3/2 −∞ c2 k2 − ωc2 ε(ω)
sendo d3 k = dk1 dk2 dk3 . A integral anterior pode ser efetuada rapidamente, como segue
Z ∞
2 i ze 1 i bk2 ωε(ω)v δ(ω − vk1 )
E1 (ω) = 3/2
dk1 dk2 dk3 e 2
− k1 2 ,
ε(ω) (2π) −∞ c k1 + k22 + k32 − ωc2 ε(ω)
2
R∞
como −∞ f (x) δ(x − a) dx = f (a), temos
h i
Z ∞ 1 ωε(ω)v
− ω
2 i ze 1 v c 2 v
E1 (ω) = 3/2
dk2 dk3 ei bk2 ω2 ω 2 .
ε(ω) (2π) −∞
2 2
+ k2 + k3 − c2 ε(ω)
v2
ω2 ω2
Chamando λ2 = v2
− ε(ω), encontraremos
c2
Z ∞ Z ∞
2 i zeω 1 2 i bk2 dk3
E1 (ω) = − 3/2 2
−β dk2 e 2 2 2
, (16.64)
(2π) v ε(ω) −∞ −∞ k2 + k3 + λ
Nota-se que, se ε(ω) → 1 as Eqs. (16.66) e (16.67) se reduzem nas Eqs. (16.28) e (16.31).
Para calcular a energia transferida ao átomo à uma distância b, i.e., parâmetro de impacto, tomaremos
uma forma generalizada de (16.19)
X Z ∞
∆E (b) = 2e gi ℜ ~ ∗
i ω ~xi (ω) · E (ω) dω , (16.68)
i 0
em que ~xi (ω) é a amplitude do i-ésimo elétron no átomo em questão. No lugar de usar a relação (16.15)
para ~xi (ω), expressaremos a soma do momento dipolo em termos da polarização molecular e da constante
dielétrica X 1
−e gi ~xi (ω) = [ε(ω) − 1] ~E(ω) ,
4πN
i
em que N é o número de átomos por unidade de volume. Assim, escreveremos a energia transferida como,
Z ∞
1 ~ 2
∆E (b) = ℜ − i ω ε(ω) |E(ω)| dω . (16.69)
2πN 0
A perda de energia por unidade de comprimento, com parâmetro de impacto b ≥ a, tal que a é da ordem
das dimensões atômicas, e dada por
Z ∞
dE
= 2πN ∆E (b)b db . (16.70)
dx b>a a
Se as componentes dos campos (16.66) e (16.67) são introduzidos em (16.69) e substituídos em (16.70),
obteremos a expressão de Fermi
Z ∞
dE 2 (ze)2 ∗ ∗ 1 2
= ℜ i ω λ a K1 (λ a) K0 (λa) − β dω , (16.71)
dx b>a π v 2 0 ε(ω)
em que λ está dado pela definição acima, i.e.,
ω2 ω2 ω2
λ2 = − ε(ω) = 1 − β 2
ε(ω) .
v2 c2 v2
Da Eq. (16.71) podemos escrever uma fórmula usual padrão para a perda de energia por unidade de com-
primento, que será: Z ∞
dE ∗
= −ca ℜ B3 (ω) E1 (ω) dω . (16.72)
dx b>a 0
4πN Ze2
ωp2 = .
m
Nota-se que a expressão relativística correspondente, sem o efeito de densidade, da Eq. (16.36) será
dE (ze)2 ωp2 1, 123γc 1
= ln − . (16.75)
dx b>a c2 ahωi 2
Para o caso incluindo o efeito de densidade, a fórmula de Bethe, Eq. (16.40), será
dE (ze)2 ωp2 γωp 1
lim ∆ = ln − . (16.76)
β→1 dx c2 hωi 2
Assim, temos as relações para a perda de energia considerando os dois casos, sem o efeito de densidade e
com o efeito de densidade.
materiais bombardeados por partículas radiativas e raios-X.17 Devido às condições experimentais da época,
a luminescência era bem mais evidente que a radiação de Čerenkov, dificultando sobremaneira a distinção
entre os dois fenômenos.18 Em 1940, Ginsburg formulou a teoria quântica da radiação de Čerenkov.19
Descrição Qualitativa Seja um meio material com índice de refração n, atravessado por um elétron com
velocidade menor que a velocidade da luz neste meio. Durante sua passagem, o elétron provocará uma
polarização local dos átomos do material, os quais, voltando ao estado despolarizado, emitem ondas ele-
tromagnéticas. Estas ondas em nenhum ponto do material interferirão construtivamente e as emissões são
independentes.
Mas, se a partícula incidente têm velocidade superior à velocidade da luz no meio, veremos que as
frentes de onda emitidas interferirão construtivamente, formando assim uma nova frente de onda, ver Fig.
16.4. Assim, temos v ≥ nc , pela figura cos θC = vn
c
, e sendo β = vc , encontraremos a relação de Čerenkov,
1 1
cos θC = = p . (16.77)
βn β ε(ω)
Utilizando a relação de Čerenkov e β ≤ 1, encontraremos dois limites para a velocidade da partícula. Como
1
βn ≤ 1 a velocidade da partícula deve estar na região,
1
≤β≤1
n
de modo que
−1 1
0 ≤ θC ≤ cos . (16.78)
n
17
L. Mallet, Compte Rendu, 183, 274 (1926); Idem, 187, 222 (1928); Idem, 188, 445 (1929).
18
A emissão luminescente pode ser diferenciada da emissão Čerenkov, pelo atraso entre a excitação e a emissão que é grande
quando comparada ao período de radiação λ/c, em que λ é o comprimento de onda e c a velocidade da luz no vácuo.
19
V. L. Ginsburg, Zh. Exp. Theor. Phys., 10, 589 (1940); Ibidem, 608 (1940).
“Z_2” — 2017/9/5 — 8:19 — page 464 — #484
Da relação de Čerenkov (16.77) vemos que o ângulo de emissão aumenta com o aumento da velocidade da
partícula.
q
E2 (ω, b) → ze λ
e−λb (16.79)
vε(ω) b
A A
n2 (ω) = 1 + , n2 (0) = ε = 1 + ,
ω02 − ω 2 ω02
2
em que A = 4πN e
m , z = 1 e ω0 é a frequência molecular média do meio, e integrando de ω = 0 até ω = ω0 ,
obteremos a perda de energia por unidade de comprimento para um elétron rápido, i.e., β ∼ 1,
dE e2 ω02 ε
= (ε − 1) ln . (16.82)
dx 2c2 ε−1
dE
Se assumirmos ω0 ∼ 6 × 1015 s−1 , teremos dx na ordem de alguns KeV por centímetro.
“Z_2” — 2017/9/5 — 8:19 — page 465 — #485
Distribuição Espectral Assumiremos que o índice de refração n seja constante na parte visível do espec-
tro e z = 1, então Z
dE e2 1
= 2 1− 2 2 ω dω . (16.83)
dx c β n βn>1
Como a energia de um quantum individual é ~ω, se tivermos N fótons, podemos escrever dE = dN ~ω,
então a Eq. (16.83) será Z
dN e2 1
= 2 1− 2 2 dω , (16.84)
dx ~c β n βn>1
2πc
mas ω = λ , e a região do espectro entre λ1 e λ2 será
Z λ2
dN e2 1 dλ
= 2 1− 2 2 −2πc 2
dx ~c β n λ1 λ
e
dN e2 1 1 1
= 2π 2 1− − ,
dx ~c β n2
2 λ2 λ1
da relação de Čerenkov (16.77), temos o número de fótons por unidade de comprimento dado por
dN 1 1
= 2πα − sen2 θ , (16.85)
dx λ2 λ1
e2 1
em que α = ~c = 137 é a conhecida constante de estrutura fina, ainda podemos escrever
1 1 ∆ν
− =
λ2 λ1 c
de modo que a Eq. (16.85) será escrita na forma
dN 2πα
= ∆ν sen2 θ . (16.86)
dx c
O efeito Čerenkov tem importantes aplicações na física de partículas de altas energias. Os detectores Če-
renkov são excelentes identificadores de partículas, sendo possível calcular suas velocidades, e trabalham
com um meio cujo índice de refração é conhecido.20
Descrição Qualitativa É possível entender aspectos importantes desta radiação sem fazer cálculos com-
plexos. Consideremos uma partícula relativística, com carga ze e velocidade v = βc, incidindo normal-
mente ao longo do eixo z sobre uma fronteira entre o vácuo (z < 0) e um meio dielétrico (z > 0), com
índice de refração n(ω), ver Fig. 16.5. Os campos móveis da partícula carregada induzem no meio uma
20
Ver os textos: K. Kleinknecht, Detectors for particle radiation, 2nd Edition, Cambridge University Press, Cambridge, UK
(1998); C. Grupen and B. Shwartz, Particle detectors, 2nd Edition, Cambridge University Press, Cambridge, UK (2011).
21
V. L. Ginsburg and I. M. Frank, Soviet Physics JETP, 16, 15 (1946).
“Z_2” — 2017/9/5 — 8:19 — page 466 — #486
Figura 16.5 A radiação de Transição é observada sob o ângulo θ em relação à direção do movimento
da partícula, conforme o vetor de onda ~k.
polarização ~P(~r′ , t) dependente do tempo, que emite radiação. Os campos irradiados de diferentes pontos
do espaço combinam-se coerentemente e cobrem uma certa distância do meio, provocando a radiação de
transição, com uma distribuição angular e uma intensidade típica.
A distribuição angular e a comprimento de formação D são uma consequência imediata devido a coe-
rência para se ter uma intensidade de radiação apreciável. Os campos da partícula incidente são dados por,
zeγvt
Ex = Ex′ = −
(b2
+ γ 2 v 2 t2 )3/2
γzeb
Ey = γEy′ = 2 (16.87)
(b + γ 2 v 2 t2 )3/2
Bz = γβEy′ = βEy ,
′ ′ ′ ′
sendo
h as componentes i restante nulas. A dependência, num ponto~r = (ρ , φ , z ), das potências inversas de
2
φ′ + γ 2 (z ′ − vt)2 implica que uma componente de Fourier de frequência ω:
′
a) Moverá na direção z com velocidade ~v a amplitude ∼ e(i ωz /v) ;
Por outro lado, a polarização dependente do tempo em que gera uma onda na zona de radiação, escrita na
forma
ei kr − i k(z ′ cos θ+ρ′ sen θ cos φ′ )
A e ,
r
em que A é proporcional ao campo motriz da partícula incidente, k = n(ω)ω/c, a radiação é observada no
plano xz e no hemisfério frontal. Haverá apreciável superposição coerente da radiação de diferentes pontos
no meio, a menos que haja uma mudança significativa da fase dos campos na região. O fator relevante na
amplitude é
′ ′ ′ sen θ cos φ′
ei(ω/v)z e− i(ω/c)n(ω) cos θz e− i(ω/c)n(ω)ρ
′ ′ sen θ cos φ′
= ei(ω/c)(1/β−n(ω) cos θ)z e− i(ω/c)n(ω)ρ .
Na direção radial, a coerência será mantida se a fase que envolve ρ′ for ≤ 1 na região 0 < ρ′ ≤ ρ′máx . Assim,
ω γv
n(ω) sen θ ≤ 1 (16.88)
c ω
ou
n(ω) γθ ≤ 1 (16.89)
para γ ≫ 1. A distribuição angular está confinada em um cone dirigido para frente, i.e., γθ ≤ 1.
Para um fator dependente de z ′ na amplitude, o comprimento d(ω) sobre a qual se mantém a coerência
será,
ω 1 ∼ 1.
− n(ω) cos θ d(ω) =
c β
Considerando:
ω2
a) n(ω) ∼
= 1 − 2ωp2 para as frequências acima da região óptica, onde não ocorre a radiação de Čerenkov;
b) 1 ∼
=1+ 1
para partícula relativística;
β 2γ 2
c) cos θ ∼
= 1.
Teremos,
2cωγ 2
d(ω) = , (16.90)
ω 2 + γ 2 ωp2
2
em que ωp2 = 4πNm
e
é a frequência eletrônica de plasma. Definimos o comprimento de formação D como
o maior valor de d(ω), i.e., quando ω = γωp ,
γc
D= . (16.91)
ωp
2πc3 γ 4
V (ω) ∼ πρ2máx (ω) d(ω) = .
ω(ω 2 + γ 2 ωp2 )
Este volume diminui rapidamente de tamanho quando ω > γωp , e o espectro de radiação se estenderá até
ω∼= γωp , porém não muito mais.
“Z_2” — 2017/9/5 — 8:19 — page 468 — #488
Descrição Teórica O cálculo exato para a radiação de transição é muito complexo. Sendo assim, faremos
uma aproximação que é fisicamente correta e que serve para a maior parte das aplicações. Vamos nos basear
na observação de que os índices de refração para frequências acima da região da ressonância óptica não
serem muito diferentes da unidade. Nesta situação, os campos da partícula incidente não são significativa-
mente diferentes no meio e no vácuo. Logo, a componente de Fourier para a polarização induzida, ~P(~r′ , ω),
será
~P(~r′ , ω) = ε(ω) − 1 ~Ei (~r′ , ω) , (16.92)
4π
em que ~Ei é a transformada de Fourier do campo elétrico da partícula incidente no vácuo. A polarização
irradiará a onda eletromagnética que deve ser descrita corretamente, com o número de onda k = ωn(ω)/c
do meio.
O campo de radiação dipolo vindo da polarização ~P(~r′ , ω) d3 r ′ será, de acordo com a Eq. (14.70), dado
por
ei kR ~ ~ ~ 3 ′
d~Erad = k×P ×k d r ,
R
em que ~k é o vetor de onda na direção de observação e R = r − k̂ ·~r′ . Usando (16.92) e integrando sobre o
semiespaço z ′ > 0, temos
Z
ei kr ε(ω) − 1 2 ~ ′
~Erad = k k̂ × ~Ei × k̂ e− i k ·~r d3 r ′ .
r 4π z ′ >0
Mas sabemos que, a forma geral da potência irradiada por unidade de ângulo sólido é
dP (t) ~ (t)|2 ,
= |A (16.95)
dΩ
em que
c 1/2 h i
~ (t) =
A R~E . (16.96)
4π ret
~ (ω) de A
Vamos introduzir a transformada de Fourier A ~ (t),
Z ∞
~ 1 ~ (t) ei ωt dt
A(ω) = √ A (16.97)
2π −∞
e a sua inversa Z ∞
~ (t) = √1
A ~ (ω) e− i ωt dω .
A (16.98)
2π −∞
Então, após alguma manipulação algébrica, juntamente com conceitos de física, definimos uma grandeza
que é a energia irradiada por unidade de ângulo sólido por unidade de frequência,
d2 I ~ (ω)|2 + |A
~ (−ω)|2 .
= |A (16.99)
dωdΩ
“Z_2” — 2017/9/5 — 8:19 — page 469 — #489
d2 I ~ (ω)|2 .
= 2|A (16.100)
dωdΩ
Usando (16.96) e (16.100) conclui-se que a energia irradiada é dada por
Z
d2 I c ωp 4 h i
~Ei (~r, ω) × k̂ e− i ~k ·~r d3 r
2
= k̂ × , (16.101)
dωdΩ 32π 3 c z ′ >0
em que os campos motrizes ~Ei são definidos pela transformada de Fourier (16.97) e sua inversa (16.98). Na
notação da Fig. 16.5, os campos incidentes são
r
2 zeω i ωz/v ωρ
Eρ (~r, ω) = 2
e K1
π γv γv
(16.102)
r
2 zeω i ωz/v ωρ
Ez (~r, ω) = − i 2 2
e K0 . (16.103)
π γ v γv
A integral (16.101) pode ser calculada da seguinte forma. A dependência entre z e ~Ei ocorre mediante o
fator ei ωz/v , e definimos
Z h i
~
~
F = k̂ × ~Ei (~r, ω) × k̂ e− i k ·~r d3 r
′
Zz >0 Z h i Z ∞
= dx dy k̂ × ~Ei × k̂ e− i kx sen θ dz ei(ω/v−k cos θ)z
z=0 0
i Z Z h i
= 1−e i(ω/v−k cos θ)Z
dx dy k̂ × Ei ~ × k̂ e− i kx sen θ .
ω
v − k cos θ
z=0
O limite superior Z é um artifício formal para a integração em z. Quando temos placas de espessura grande
comparada com D, abandonamos a exponencial oscilante em Z na base da intuição física,22 e para uma
interface simples teremos
Z Z h i
~ = i ~Ei
F ω
dx dy k̂ × × k̂ e− i kx sen θ .
v − k cos θ z=0
em que ǫ̂a e ǫ̂b são os vetores de polarização e θ é o ângulo polar de k̂, eliminamos a linha do ângulo
azimutal de integração. A componente paralela a ǫ̂b dá uma integral igual a zero, pois é impar em y. Assim,
usando (16.102) para os campos, teremos
Z Z " #
~ = i ǫ̂a − i kx sen θ x
F ω
dx dy e cos θ p Eρ − sen θ Ez
v − k cos θ x2 + y 2 z=0
r Z Z
i ǫ̂a 2 zeω
= ω 2
dx dy e− i kx sen θ
v − k cos θ π γv
" p p #
x ω sen θ ω
× cos θ p K1 x2 + y 2 − i K0 x2 + y 2 .
x2 + y 2 γv γ γv
22
Um tratamento mais delicado da dependência com a espessura é indispensável quando se têm folhas que não são grossas o
suficiente em relação a D, ou quando se analisam pilhas de folhas
“Z_2” — 2017/9/5 — 8:19 — page 470 — #490
O primeiro termo pode ser transformado em uma integração por partes em x. Usando o resultado
p p
x ω 2 2
γv ∂ ω 2 2
p K1 x +y =− K0 x +y ,
x2 + y 2 γv ω ∂x γv
~ a forma
encontraremos para F
r Z Z p
~ 2 ze sen θ ω − i kx sen θ ω 2 2
F = ǫ̂a k cos θ − 2 dx dy e K0 x +y .
π v ωv − k cos θ γ v γv
~ será
E o resultado para F
√
2 2π ze sen θ k cos θ − γω2 v
~ = ǫ̂a
F 2 . (16.105)
v ωv − k cos θ γω2 v2 + k2 sen2 θ
Esta é a fórmula usual para a radiação de transição na região dos raio-X. A equação acima não leva em conta
a interferência entre as duas amplitudes. Assim, a distribuição de energia por unidade de ângulo sólido por
unidade de frequência será
2
d2 I (ze)2 θ 2 ωp2 /ω 2
= . (16.107)
dωdΩ π2 c 1 ωp2 1
γ2
+ ω2
+ θ2 γ2
+ θ 2
Descrição Prática Um caso importante é quando temos uma partícula relativística de carga ze movendo-
-se ao longo do eixo z com uma velocidade βc. Em z ≤ 0 temos um material dielétrico uniforme, com
frequência de plasma ω1 , em z ≥ 0 temos um meio semelhante, porém com frequência de plasma será ω2 .
Então a intensidade de radiação de transição por unidade de ângulo sólido por unidade de frequência será
2
d2 I (ze)2 θ 2 1 1
= ω12
− ω22
. (16.111)
dωdΩ π2c 1
+ + θ2 1
+ + θ2
γ2 ω2 γ2 ω2
Num segundo caso, vamos introduzir o fator de interferência. Consideremos a radiação de transição emitida
por uma partícula relativística que atravessa uma folha dielétrica de espessura a na direção perpendicular à
sua trajetória. Vamos também admitir que
n(ω) − 1
n(ω) + 1
seja muito pequeno, tal que poderemos ignorar as reflexões. Então, a intensidade de radiação por unidade de
ângulo sólido por unidade de frequência é dado pelo resultado (16.107) para uma só interface, multiplicado
pelo fator
FI = 4 sen2 Θ , (16.112)
em que !
γω 1 ωp2 a
Θ= + + θ2 . (16.113)
ωp γ 2 ω2 4D
Nesta equação, D é o comprimento de formação, já definido, enquanto Θ é conhecido como zona de forma-
ção. Se a ≫ D o fator FI oscila com muita rapidez em ângulo ou frequência, com a média < FI >= 2.
Um terceiro caso importante para construção de detectores de radiação de transição, conhecidos como
TRD, é quando uma partícula relativística atravessa normalmente uma pilha de N folhas de material dielé-
trico (usualmente Mylar), cada qual com espessura a, separadas por camadas de ar, cada qual com espessura
b. Ainda iremos admitir que se possam desprezar as reflexões múltiplas em toda a pilha. Para isso devemos
ter
n(ω) − 1 ∼ ωp2 1
= 2
≪ .
n(ω) + 1 4ω N
Então, para este caso, a intensidade de radiação de transição por unidade de ângulo sólido por unidade de
frequência será dado pelo resultado (16.107) para uma só interface, multiplicado pelo fator
sen2 [N (Θ + Ψ)]
FI = 4 sen2 Θ , (16.114)
sen2 [Θ + Ψ]
Este resultado obtido por Garibyan23 em 197024 é muito usado na construção dos detectores TRD para
identificação de partículas em física de altas energias.25
23
Grigor M. Garibyan (1924-1991), físico russo-soviético.
24
G. M. Garibyan, Zh. Eksp. Teor. Fiz., 33, 1403 (1957); Idem, 37, 527 (1959); Idem, 60, 39 (1970).
25
A teoria e prática dos detectores de radiação de transição são tratados com grande detalhes em G. B. Yodh, X. Artru and
R. Ramaty, The Astrophysical Journal, 181, 725 (1973); X. Artru, G. B. Yodh and G. Mennessier, Physical Review, D12, 1289
(1975).
“Z_2” — 2017/9/5 — 8:19 — page 472 — #492
a) achamos a transformada de Fourier de cada componente do campo eletromagnético criado pela par-
tícula incidente;
b) determinamos o espectro de frequência (energia por unidade de área, por intervalo de frequência) do
pulso equivalente;
Como é conveniente usar a linguagem dos parâmetros de impactos em lugar das transferências de mo-
mentum, a conexão entre estes dois tratamentos se faz mediante a relação do princípio de incerteza
~
b∼ .
Q
Como um momentum transferido máximo Qmáx = 2M v ocorre na radiação de frenamento, vemos que o
parâmetro de impacto mínimo efetivo na produção de radiação será
~ ~
bmín ∼ ≃ .
Qmáx 2M v
26
Carl Friedrich von Weizsäcker (1912-2007), físico e filósofo alemão.
Evan James Williams (1903-1945), físico galês.
27
E. J. Williams, Proceedings of the Royal Society, A139, 163 (1933); Idem, Physical Review, 45, 729 (1934); C. F. von Weizsäc-
ker, Zeitschrift für Physik, 88, 612 (1934); E. J. Williams, Kgl. Danske Videnskab. Selskab Mat.-Fys. Meddel., 13, No. 4 (1935).
28
E. Fermi, Zeitschrift für Physik, 29, 315 (1924).
“Z_2” — 2017/9/5 — 8:19 — page 473 — #493
O espectro de radiação equivalente para uma partícula incidente de carga q, velocidade v ≃ c, que passa
por um sistema alvo P , sob um parâmetro de impacto b, pode ser calculado através dos campos dados em
(3.36):
qγvt
E1 (t) = −
(b2
+ γ 2 v 2 t2 )3/2
γqb
E2 (t) = 2
(b + γ 2 v 2 t2 )3/2
B3 (t) = βE2 (t) .
Sabe-se que, no limite β ∼ 1, um observador em um ponto P do espaço não consegue distinguir o campo
criado pela partícula em movimento e o campo de um pulso de radiação plana polarizada que se propaga na
mesma direção da partícula, conforme Fig. 16.6. Assim, os campos E2 (t) e B3 (t) podem ser representados
Figura 16.6 Campos da partícula que passando pelo sistema alvo P e os pulsos equivalentes de
radiação.
por um pulso de radiação P1 que se desloca na direção x1 , ver Fig. 16.6(b). No entanto, um pulso P2 , que se
desloca segundo a direção x2 , não reproduz exatamente o campo criado por E1 (t), pois não existe nenhuma
componente magnética associada a E1 (t). Apesar disso, esta será uma boa aproximação na maioria dos
problemas de colisão, pois a importância relativa entre o campo magnético e o elétrico, num campo pertur-
bativo de origem eletromagnética é da ordem de (u/c)2 , em que u é a velocidade da partícula perturbadora,
que normalmente é pequena em comparação à c. Para que os pulsos P1 e P2 produzam efeitos equivalen-
tes àqueles produzidos pela partícula, a reação sobre a partícula em movimento deve ser pequena, deste
modo podemos considerá-la como centro de um campo coulombiano que descreve uma trajetória retilínea.
Tiramos daí que a velocidade da partícula perturbadora deve ser bem maior que a velocidade da partícula
perturbada; caso contrário, a perturbação não seria pequena. Mas só em colisões distantes a probabilidade
de transição do sistema perturbado é a mesma nos casos em que o agente perturbador é uma partícula ou
um campo de radiação. Se estas condições são satisfeitas, segue-se que os pulsos P1 e P2 representam bem
o campo criado pela carga q, em qualquer ponto do espaço e visto de qualquer outro sistema de referên-
cia inercial que se desloque em relação ao sistema no qual a partícula perturbadora está inicialmente em
repouso.
Para determinarmos o espectro de radiação equivalente, vamos calcular a distribuição de energia por
unidade de área e por unidade de intervalo de frequência, dI (ω, b)/dω, dos pulsos P1 e P2 , cujas expressões
para os campos são bem conhecidas,
dI (ω, b) c
= |E (ω)|2 ,
dω 2π
“Z_2” — 2017/9/5 — 8:19 — page 474 — #494
dI1 (ω, b) c
= |E2 (ω)|2 ,
dω 2π
em que Z +∞
1 γqb
E2 (ω) = √ ei ωt dt .
2π −∞ (b2 + γ 2 v 2 t2 )3/2
Definindo ξ = γvt/b, temos uma integral cujo resultado pode ser expresso em termos da função de Bessel
modificada de segunda ordem, K1 ,
Z +∞ i ωbξ
1 q e γv
E2 (ω) = √ dξ
2π vb −∞ (1 + ξ 2 )3/2
1
q 2 2 ωb ωb
= K1 .
bv π γv γv
Assim,
" #
dI1 (ω, b) 1 q 2 c 2 ωb 2 2 ωb
= 2 2 K1
dω π cb v γv γv
(16.116)
" #
dI2 (ω, b) 1 q 2 c 2 1 ωb 2 2 ωb
= 2 2 K0 .
dω π cb v γ 2 γv γv
Para obtermos o comportamento da distribuição espectral dos pulsos P1 e P2 que representam o campo
da partícula perturbadora numa colisão cujo parâmetro de impacto é b, devemos analisar a expressão,
Z 2
dI1,2 (ω, b) c
= E2,1 (t) ei ωt dt .
dω 2π
“Z_2” — 2017/9/5 — 8:19 — page 475 — #495
No caso de baixas frequências, i.e., frequências muito menores que a frequência de colisão, ω ≪ γv/b,
a exponencial na equação anterior varia muito pouco durante o intervalo de tempo para o qual os campos
E2,1 (t) são apreciáveis. Neste caso, a quantidade I seria independente de ω e a denotaremos por I0 :
Z 2
c
I0 = E2,1 (t) dt .
2π
em que, no caso de P2 , o campo E é uma função ímpar do tempo. Da Eq. (16.116), observamos que
a intensidade do pulso P2 envolve um fator γ −2 e, por essa razão, tem uma importância reduzida para
partículas ultra-relativísticas. Na Fig. 16.7, temos, em representação qualitativa, a forma dos espectros de
frequência, dIdω
(ω,b)
, dos dois pulsos equivalentes de radiação, P1 e P2 .
Podemos agora calcular a energia por intervalo de frequência presente no campo de radiação equiva-
lente. Para isso, será necessário integrar o espectro de frequência sobre todos os parâmetros de impacto
possíveis, Z ∞
dI (ω) dI1 (ω, b) dI2 (ω, b)
= 2π + b db , (16.118)
dω bmín dω dω
em que combinamos as contribuições dos pulsos P1 e P2 . As integrais que resultam de (16.118) podem
também ser expressas em termos de funções de Bessel modificadas, e o resultado será
dI (ω) 2 q 2 c 2 v2 2 2 2
= ζ K0 (ζ)K1 (ζ) − 2 ζ K1 (ζ) − K0 (ζ) , (16.119)
dω π c v 2c
em que ζ = ωbγvmín .
Para frequências baixas, ω ≪ γv/bmín , ou ζ ≪ 1, as funções de Bessel modificadas se comportam
como
ζ 1
K0 (ζ) ≃ − ln + 0, 5772 e K1 (ζ) ≃ .
2 ζ
“Z_2” — 2017/9/5 — 8:19 — page 476 — #496
Assim, como ζ ≪ 1, podemos desprezar os termos da ordem O(ζ 2 ), que nos levará à
dI (ω) 2 q 2 c 2 v2
≃ K0 (ζ) − 2
dω π c v 2c
2
2 q c 2 ζ v2
≃ − ln − 0, 5772 − 2
π c v 2 2c
2 2
2 q c 2 v
≃ − ln(0, 8905 ζ) − 2
π c v 2c
A Fig. 16.8 mostra o comportamento de I (ω), dado pela Eq. (16.119) no limite β ∼ 1, assim como
a aproximação para baixas frequências, i.e., a Eq. (16.120). Na Fig. 16.8, vemos que no limite β ∼ 1 o
Figura 16.8 Espectro de frequência dos quanta virtuais para uma partícula relativística, com energia
por intervalo unitário de frequência em unidades de q 2 /πc e a frequência em unidades de γv/bmín .
com alguns se extendendo até frequências da ordem de 2γv/bmín . Esta distribuição de energia corresponde
a um número de fótons virtuais, N (~ω), que pode ser obtido através da relação
dI (ω)
dω = ~ω N (~ω) d(~ω) . (16.122)
dω
Logo, o número de quanta virtuais por unidade de intervalo de energia, no limite de baixas frequências, será
2 q 2 c 2 1 1, 123 γv v2
N (~ω) ≃ ln − 2 , (16.123)
π ~c v ~ω ωbmín 2c
As duas últimas expressões representam, igualmente, o efeito do campo da partícula que se move com
um parâmetro de impacto maior que bmín em relação ao sistema perturbado. Então, a validade da aplicação
do método de Weizsäcker-Williams a problemas de colisão depende do fato de podermos ou não encontrar
um valor bmín de tal modo que o efeito do campo da partícula perturbadora seja bem pequeno, para distâncias
menores que bmín e que, ao mesmo tempo, o campo perturbador possa ser substituído por um campo de
radiação, respeitando as seguintes condições:30
b) u(1 − u2 /c2 )−1/2 ≪ v(1 − v 2 /c2 )−1/2 , em que as velocidades u e v são medidas em relação ao
sistema S ′ ;
c) decorrente do fato de que a probabilidade de transição do sistema perturbado depende somente das
componentes de Fourier da radiação incidente sobre o sistema, e da linearidade das equações de
movimento da mecânica quântica. Se existe uma frequência no espectro de Fourier alta o bastante
para produzir uma alteração apreciável no estado do sistema perturbado em uma dada colisão, isto irá
influir no efeito das demais frequências. Isto só não irá ocorrer se o campo da partícula perturbadora
for suficientemente fraco para que, em uma dada colisão, exista somente uma pequena probabilidade
P do sistema perturbado sofrer uma transição de seu estado inicial.
Analisando a Eq. (16.124) vemos que os principais fatores envolvidos na relação dos efeitos da partí-
cula carregada, com os da radiação, são a constante de estrutura fina α e o argumento do logaritmo, pois
este depende essencialmente da força coulombiana. O coeficiente γv/ω representa a distância máxima, em
relação à trajetória da partícula que se move com velocidade v, até aonde encontramos a frequência ω no
espectro do seu campo, veja Fig. 16.8.
O exemplo mais simples ao qual podemos aplicar o método de Weizsäcker-Williams é o de ionização
(ou de excitação) de um átomo, causado por uma partícula em movimento. Este efeito está relacionado com
30
F. Caruso, Sobre o método de Weizsäcker-Williams e suas primeiras aplicações, CBPF-MO-001 (2009).
“Z_2” — 2017/9/5 — 8:19 — page 478 — #498
o efeito fotoelétrico da radiação e pode ser calculado considerando a absorção fotoelétrica da radiação equi-
valente.31 Outros exemplos importantes de aplicações do método de Weizsäcker-Williams são encontrados
no texto do prof. Jackson.32
Do ponto de vista das aplicações do método, é sempre interessante ter a possibilidade de, dado um certo
processo A devido à interação eletromagnética de uma partícula com um alvo, podermos obter a seção de
choque σA para o processo, a partir da seção de choque de fotoprodução por fótons livres, σγγ , através
método de Weizsäcker-Williams. E o procedimento para realizar isto é muito simples: basta integrar a seção
de choque de fotoprodução sobre todo o espectro dos fótons equivalentes, i.e.,
Z ~ωmáx
σA = σγγ (~ω) N (~ω) d(~ω) , (16.126)
~ωlimiar
em que N (~ω) é o número de fótons virtuais por unidade de energia, que determinamos através das relações
dadas em (16.124)-(16.125).
Problemas
16.1 Uma partícula pesada carregada, de carga ze, massa M e velocidade não relativística v, colide com
um elétron livre de carga −e, massa m e em repouso. Mostre que a energia transferida ao elétron nesta
colisão coulombiana, em função do parâmetro de impacto b, será
2(ze2 )2 1
∆E (b) = 2 .
mv 2 ze2
b2 + mv2
16.2 a) Admitindo ~hωi = 12 eV, na perda de energia quantizada, encontre a taxa de perda de energia, em
MeV/cm, no ar em CNTP,33 no alumínio, no cobre e no chumbo para um próton e um múon, cada
qual com as energias cinéticas de 10, 100 e 1000 MeV. b) Converter os resultados da perda de energia
em MeV.cm2 /g, compare e discuta os resultados.
16.3 Considere um lucite34 com índice de refração igual à 1, 50 na região do visível, calcular o ângulo
de emissão da radiação de Čerenkov visível para elétrons e prótons em função das suas energias, em
MeV. Calcular o número de quanta de radiação, com comprimentos de onda entre 4000 e 6000 Å,
emitidos por centímetro de trajetória no lucite por um elétron de 1 MeV, um próton de 500 MeV e
também outro próton de 5 GeV.
16.4 Discuta a perda de energia por unidade de distancia, dada pela Eq. (16.40), para um monopolo mag-
nético, com a carga magnética g. Faça um gráfico da curva dE/dx equivalente ao apresentado na Fig.
16.3 e discuta as diferenças.
16.5 Encontre a energia irradiada como a radiação Čerenkov por unidade de distância ao longo da trajetória
de um monopolo magnético, com a carga magnética g. Compare e discuta a diferença existente com
o estudado no texto.
31
E. J. Williams, Proceedings of the Royal Society, A139, 163 (1933); Idem, Kgl. Danske Videnskab. Selskab Mat.-Fys. Meddel.,
13, No. 4 (1935).
32
J. D. Jackson, Classical electrodynamics (1999).
33
CNTP – Condições Normais de Temperatura e Pressão.
34
Lucite – Acrílico ou polimetil-metacrilato (PMMA) é um material termoplástico rígido e transparente; também pode ser consi-
derado um dos polímeros (plásticos) mais modernos e com maior qualidade do mercado, por sua facilidade de adquirir formas,
por sua leveza e alta resistência. É também chamado vidro acrílico.
“Z_2” — 2017/9/5 — 8:19 — page 479 — #499
16.6 Calcule a perda de energia em um plasma eletrônico. Sugestão: Consulte o livro do Prof. Jackson [41].
16.7 Faça um estudo do espalhamento elástico de partículas rápidas por átomos. Sugestão: Consulte o livro
do Prof. Jackson [41].
16.8 Uma partícula relativística de carga ze move-se ao longo do eixo z com uma velocidade βc. Em z ≤ 0
temos um material dielétrico isotrópico e uniforme, com frequência de plasma ω1 , em z ≥ 0 temos
um meio semelhante, porém com frequência de plasma será ω2 . Mostre que a intensidade de radiação
de transição por unidade de ângulo sólido por unidade de frequência é dada pela Eq. (16.111), i.e.,
2
d2 I (ze)2 θ 2 1 1
= ω12
− ω22
.
dωdΩ π2c 1
+ + θ2 1
+ + θ2
γ2 ω2 γ2 ω2
16.9 Considere a radiação de transição emitida por uma partícula relativística que atravessa uma folha
dielétrica de espessura a na direção perpendicular à sua trajetória. Admitindo que
n(ω) − 1
n(ω) + 1
seja muito pequeno, tal que podemos ignorar as reflexões. Mostre que a intensidade de radiação por
unidade de ângulo sólido por unidade de frequência é dado pelo resultado (16.107) para uma só inter-
face, multiplicado pelo fator
FI = 4 sen2 Θ ,
em que !
γω 1 ωp2 a
Θ= + + θ2 .
ωp γ 2 ω2 4D
16.10 Uma partícula relativística atravessa uma pilha de N folhas de material dielétrico, cada qual com
espessura a, separadas por camadas de ar (ou vácuo), cada qual com espessura b. Admitindo-se que
podemos desprezar as reflexões múltiplas em toda a pilha, ou seja, para isso devemos ter
n(ω) − 1 ∼ ωp2 1
= 2
≪ .
n(ω) + 1 4ω N
Mostre que, para esse caso
sen2 [N (Θ + Ψ)]
FI = 4 sen2 Θ ,
sen2 [Θ + Ψ]
em que Θ está definido no problema anterior e
γω 1 2 b
Ψ= +θ .
ωp γ 2 4D
16.11 Quando uma partícula carregada efetua uma colisão, ela sofre aceleração e emite radiação. Discuta a
radiação emitida durante as colisões. Sugestão: Consulte o livro do Prof. Jackson [41].
16.12 Faça um estudo da radiação de frenamento, ou Bremsstrahlung, nas colisões coulombianas. Suges-
tão: Consulte o livro do Prof. Frenkel [30] e do Prof. Jackson [41].
16.13 Discuta o efeito de blindagem a carga nuclear e encontre a perda relativística de energia radiativa.
Sugestão: Consulte o livro do Prof. Jackson [41].
“Z_2” — 2017/9/5 — 8:19 — page 480 — #500
16.14 Não podemos fazer um tratamento completo da ionização e da excitação de um átomo produzida por
uma partícula carregada usando o método de Weizsäcker-Williams, pois as condições de aplicabilidade
do mesmo não são satisfeitas em colisões para as quais o parâmetro de impacto é menor que as
dimensões atômicas, i.e., b < ℓ. O método de Weizsäcker-Williams pode ser aplicado quando b & ℓ,
discuta a excitação e a ionização de átomos neste caso.
16.15 Desenvolva o problema de excitação e desintegração de núcleos atômicos por elétrons através do
método de Weizsäcker-Williams.
16.16 Desenvolva o trabalho da radiação de frenamento, i.e., Bremsstrahlung, não relativístico e relativís-
tico, usando o método de Weizsäcker-Williams dos quanta virtuais.
16.17 Na produção de pares por fótons de alta energia no campo de um núcleo atômico, podemos usar o
método de Weizsäcker-Williams.
a) Mostre que o número de fótons por intervalo de energia d~ω é dado por
2 2 gγmc2 d~ω
N (~ω) d~ω = αZ ln .
π ~ω ~ω
16.18 No processo de produção de pares em colisões entre duas partículas com velocidade relativa próxima
à da luz, encontre a seção de choque do processo.
Leitura Recomendada
Recomenda-se ao estudante, a leitura paralela do excelente texto do Prof. Jackson,
– J. D. Jackson [41].
Neste livro, o leitor encontrará uma completa discussão e dedução detalhada dos tópicos aqui apresentados.
Ainda neste texto, o leitor poderá estudar as diversas aplicações dos métodos aqui desenvolvidos.
Para fótons virtuais bem como para o efeito Čerenkov, também podemos consultar o texto do Prof.
Frenkel,
– J. Frenkel [30].
Excelente, elegante e rigoroso trabalho, sobre o efeito Čerenkov e radiação de transição, encontramos
no magnifico texto do Prof. Landau,
Capítulo 17
Fundamentos da Relatividade Geral e Tensores
A teoria da relatividade geral, que é uma teoria clássica de campos, é a teoria de Albert Einstein da gravita-
ção, publicado em 1916, 1 onze anos após a publicação de sua teoria da relatividade especial. Todo mundo
já ouviu falar de E = mc2 , enquanto a relatividade especial, provavelmente, teve amplo impacto cultural, a
relatividade geral é, sem dúvida, reconhecida entre os físicos como verdadeira obra-prima de Einstein: uma
conquista realmente notável, maior do que todos os feitos de seu Annus Mirabilis em 1905. 2 Foi descrito
por Max Born como “o maior feito do pensamento humano sobre a natureza, a combinação mais surpre-
endente da penetração filosófica, da intuição física e da habilidade matemática”.3 Finalmente, Paul Dirac
chamou a relatividade geral “provavelmente a maior descoberta científica de todos os tempos”.4
A relatividade geral explica a gravidade como uma consequência da curvatura do espaço-tempo, en-
quanto por sua vez a curvatura do espaço-tempo é uma consequência da presença de matéria. A curvatura
do espaço-tempo afeta o movimento da matéria, que reciprocamente determina as propriedades geométricas
e a evolução do espaço-tempo. Podemos resumir isto parafraseando uma citação devido a John Wheeler,
como segue: “O espaço-tempo diz à matéria como se mover, e a matéria diz ao espaço-tempo como se
curvar”.5 Uma forma metafórica para a gravidade como curvatura do espaço-tempo está em visualizar uma
folha esticada de borracha, deformando-a pela presença de um corpo maciço, como mostra Fig. 17.1, Para
entendermos melhor como Einstein chegou a esta fantástica teoria, devemos primeiro considerar, breve-
mente, sua teoria da relatividade especial ou restrita.
481
“Z_2” — 2017/9/5 — 8:19 — page 482 — #502
Figura 17.1 Imagem familiar de espaço-tempo curvo, como uma folha esticada de borracha,
deformando-se pela presença de um corpo maciço. Uma partícula que se move no campo gra-
vitacional da massa central seguirá uma trajetória curva, em vez de uma linha reta, que se move
sobre a superfície da folha e se aproxima da massa central, corpo maciço.
da velocidade da luz que nos diz: A velocidade da luz no vácuo, c, é a mesma em todas as direções e em
todos os referenciais inerciais, e é independente do movimento da sua fonte emissora. Einstein mostrou que,
como consequência deste postulado, o conceito newtoniano de uma estrutura rígida de espaço e de tempo
em relação ao qual os fenômenos físicos foram estudados já não era mais defensável, medições de tempo e
de espaço não podem ser absolutas, mas dependem de movimento do observador e estão relacionados por
meio das transformações de Lorentz. O espaço e o tempo como entidades distintas deu lugar a um espaço-
-tempo unificado, e somente o intervalo de espaço-tempo entre os eventos é independente do referencial
do observador, referido como referencial de Lorentz. Para eventos vizinhos ocorrendo nas coordenadas do
espaço-tempo (t, x, y, z) e (t + dt, x + dx, y + dy, z + dz), o intervalo é definido por
Outro observador inercial usando um sistema de coordenadas diferente (t′ , x′ , y ′ , z ′ ), i.e., em um referencial
de Lorentz diferente, vai encontrar o mesmo valor para o intervalo de espaço-tempo entre os eventos, apesar
de medi-los e ter uma diferente separação espacial e temporal. Além disso:
• Os intervalos entre eventos vizinhos com ds2 < 0 são tipo tempo; existe um referencial de Lorentz (A),
em que os eventos ocorrem nas mesmas coordenadas espaciais, e no referencial A, a separação de
coordenadas temporais dos eventos é igual ao intervalo de tempo próprio entre elas. Além disso, os
dois eventos estão localizados sobre a linha do universo, i.e., a trajetória através do espaço-tempo, de
uma partícula material.
• Os intervalos entre eventos vizinhos com ds2 > 0 são tipo espaço; existe um referencial de Lorentz (B),
em que os eventos ocorrem nas mesmas coordenadas temporais, e no referencial B, a separação de
coordenadas espaciais dos eventos é igual à distância própria entre elas. Além disso, os dois eventos
não estão localizados sobre a linha do universo de uma partícula material, uma vez que no referencial
B a partícula parece estar em dois lugares ao mesmo tempo!
• Os intervalos entre eventos vizinhos com ds2 = 0 são nulos ou tipo luz; os dois eventos localizados na
linha do universo de um fóton.
A geometria descrita pela Eq. (17.1) difere substancialmente daquele do espaço euclidiano plano, e é co-
nhecido como o espaço de Minkowski. Podemos reescrever a Eq. (17.1), de forma mais geral, como
em que a soma sobre os índices µ e ν está implícita e ambos os índices variam através de 0, 1, 2, 3, corres-
pondente a t, x, y, z. Na Eq. (17.2), gµν são componentes da métrica (definimos na Seção 2.5), que descreve
como os intervalos são medidos em nosso espaço-tempo. Em geral, estas componentes podem ser funções
“Z_2” — 2017/9/5 — 8:19 — page 483 — #503
complicadas das coordenadas espaço-tempo, mas para o espaço-tempo de Minkowski, em coordenadas car-
tesianas e definindo c = 1, a métrica assume uma forma muito simples
Uma pergunta à ser respondida, como a gravidade newtoniana se encaixam neste cenário da relatividade
especial? Vemos imediatamente que a resposta é não muito bem. A gravidade newtoniano é inerentemente
não relativista, uma vez que descreve a força gravitacional entre as duas massas atuando instantaneamente e
que depende da distância que separa estas massas. Diferentes observadores inerciais não concordaria sobre
qualquer ponto de vista, e por isso não estaria de acordo com a força da gravidade entre as duas massas. E o
que dizer de observadores não inerciais? A elegante geometria do espaço-tempo de Minkowski é aplicada
apenas para os observadores em movimento relativo uniforme, não ao movimento acelerado. No entanto,
Einstein buscou uma teoria totalmente covariante, capaz de descrever as leis da física, incluindo a gravidade,
em qualquer sistema de coordenadas e para qualquer movimento relativo. O passo fundamental para alcan-
çar este feito, veio com a realização de Einstein, é de que a gravidade e a aceleração são fundamentalmente
equivalente, esta é uma idéia consagrada no princípio de equivalência.
Princípio de Equivalência Fraco Na física newtoniana a massa inercial de um corpo é uma medida de
sua resistência à aceleração, e é a quantidade que aparece no lado direito da equação que descreve a segunda
lei de Newton: ~F = m~a. A massa gravitacional de um corpo, por outro lado, é a quantidade que aparece
na lei da gravitação universal de Newton. Não há uma razão a priori, na física newtoniana, pela qual essas
duas massas devem ser iguais, mesmo ainda que experimentalmente elas são encontradas idênticas, com
precisão extremamente elevada.
O princípio de equivalência fraco assume a equivalência entre a massa inercial e a massa gravitacional
como axiomático, afirmando que a massa inercial, mI , e a massa gravitacional, mG , de um corpo são, de
fato, identicamente iguais.
Um resultado profundo segue imediatamente do princípio de equivalência fraco: um objeto maciço em
queda livre em um campo gravitacional uniforme (por exemplo, um elevador despencando em direção à
terra após o seu cabo ter partido, ou o interior de uma nave espacial em órbita da Terra) obedecerá as
primeira e segunda leis de Newton de movimento. Em outras palavras, o objeto em queda livre encontra-se
num referencial inercial em que todas as forças gravitacionais desapareceram. Chamamos o referencial
inercial em que o objeto em queda está localizado de referencial inercial local: o sistema de referência só é
inercial sobre a região do espaço-tempo para o qual o campo gravitacional é uniforme. O tamanho efetivo
do referencial inercial local, portanto, depende da rapidez com que o campo gravitacional varia em função
da posição, e o quão preciso podemos medir a distância e a velocidade dos corpos em queda livre.
O princípio de equivalência fraco tem uma série de importantes, e testáveis, consequências físicas:
2. A aceleração de uma massa teste, i.e., um objeto cuja a massa é suficientemente pequena para que
ele não produza alterações mensuráveis no campo gravitacional do corpo de massa maior para o qual
é atraído, em um campo gravitacional é inteiramente independente da sua natureza, da massa e da
composição.
“Z_2” — 2017/9/5 — 8:19 — page 484 — #504
3. O caminho de um raio de luz sofrerá uma curva na presença do campo gravitacional de um corpo
maciço.
4. Um raio de luz emitida a partir da superfície de um corpo maciço estará deslocando para o vermelho,
i.e., redshifted,6 quando o seu comprimento de onda é medido por um observador distante.
A verificação experimental do segundo item tem uma longa e fantástica história, a partir de Galileu até
a Apollo 15 e experimentos mais recentes.7 Em relação ao terceiro item, Einstein fez o cálculo para a
curvatura da luz quando essa passa muito próxima da superfície do sol e obteve que a luz sofreria uma
deflexão por um ângulo de 1,7 segundos do arco; durante o eclipse solar de 1919, um grupo de astrônomos
liderados por Arthur Eddington8 examinou as placas fotográficas de áreas próximas ao sol e comparou a
posição das estrelas com outra placa que examinaram com uma diferença de seis meses, foi detectado um
deslocamento θ ≃ 1, 75 ′′ , i.e., de acordo com o valor previsto pela teoria de Einstein.9 Medidas modernas
conseguiram um vínculo observacional mais apurado através de observações de mais de 20 anos usando 87
sítios de VLBI – interferômetro de linha de base muito longa – e 541 fontes de rádio produzindo mais de
1, 7 × 106 observações e, tendo obtido um vínculo em θ
θ = (0, 99992 ± 0, 00023) × 1, 75 ′′
na qual é 3 ordens de grandeza melhor do que as medidas de Eddington.10 Medidas experimentais do
desvio gravitacional para o vermelho foram realizadas a partir de várias fontes astrofísicas, bem como, por
6
Redshifted, o efeito é referido como o desvio gravitacional para o vermelho.
7
Um breve histórico das importantes medidas sobre massa. No século VI, Philoponus descreve corretamente o efeito da queda
livre de bolas de diferentes massas, mas Galileu foi o primeiro a testar a equivalência de massa inercial e massa gravitacional
em seu experimento com queda de diferentes massas. Entretanto, a famosa história sobre as duas massas (balas de canhão e de
fuzil) deixada cair do alto da Torre de Pisa (Itália) parece ser apócrifa. Mas, uma experiência deste tipo parece ter sido realizada
por Stevin, precursor de Galileu, que dela teria tido conhecimento. Newton também considerou o problema e mediu os períodos
de diversos pêndulos de comprimentos iguais, mas com massas de diferentes materiais. Nem Newton nem Galileu encontraram
qualquer diferença entre as massas (inerciais e gravitacionais), mas os métodos eram muitos brutos. No experimento de Newton
foi detectado uma diferença de somente uma parte em 103 . Eötvös, em 1890, derivou um método para testar a equivalência
das massas inercial e gravitacional. Usando dois objetos de materiais diferentes, ele comparou o efeito da força gravitacional
da Terra com o efeito da força inercial causada pela rotação da Terra. Como resultado, Eötvös e colaboradores obtiveram uma
diferença de 5 partes em 109 , feito fantástico para época. No século XX, experimentos usando essencialmente o mesmo método
(nomeadamente os experimentos de Dicke e colaboradores), melhoraram a precisão da medida e encontraram uma diferença
entre as massas inercial e gravitacional de tão somente umas poucas partes em 1014 . Isto é um ponto importante na física, no
que diz respeito ao chamado princípio de equivalência de Einstein, ponto de partida para a teoria da relatividade geral.
Joannes Philoponus (João Filopono de Alexandria) (490-570), filósofo neoplatônico cristão que rejeitou diversas das idéias
básicas defendidas por Aristóteles, uma exceção para os neoplatônicos da época.
Simon Stevin (1548/49-1620), matemático e engenheiro militar flamengo-holandês.
Barão Loránd Eötvös de Vásárosnamény (Roland von Eötvös) (1848-1919), físico húngaro.
Robert Henry Dicke (1916-1997), físico americano.
Segue uma lista dos experimentos desde Dicke, passando pelo da Apolo 15 e outros mais modernos: P. G. Roll, K. Krotkov and
R. H. Dicke, Ann. Phys., 26, 442 (1964); Braginsky and Panov, Zh. Eksp. Teor. Fiz., 61, 873 (1971); Shapiro et al., Physical
Review Letters, 36, 555 (1976); Niebauer et al., Physical Review Letters, 59, 609 (1987); Heckel et al., Physical Review Letters,
62, 609 (1989); Adelberger et al., Physical Review, D42, 3267 (1990); Baeßler et al., Physical Review Letters, 83, No. 18, 3585
(1999); Idem, Classical Quantum Gravity, 18, No. 13, 2393 (2001).
Para 2015 estava previsto um novo experimento cuja previsão para a diferença entre as massas inercial e gravitacional seria
somente umas poucas partes em 1017 , por enquanto nenhum resultado oficial, para maiores detalhes deste experimento ver R.
D. Reasenberg, B. R. Patla, J. D. Phillips and R. Thapa, Design and characteristics of a WEP test in a sounding-rocket payload,
Classical and Quantum Gravity, 29, 184013 (2012).
Como último comentário, com o primeiro sucesso na produção de antimatéria, em particular anti-hidrogênio, realizada no
CERN, foi proposta uma nova abordagem para testar o princípio de equivalência fraco. Assim, experiências para comparar o
comportamento gravitacional da matéria e antimatéria estão sendo desenvolvidas atualmente, ver M. Kimura et al., Testing the
weak equivalence principle with an antimatter beam at CERN, Journal of Physics: Conference Series, 631, 012047 (2015).
8
Sir Arthur Stanley Eddington (1882-1944), astrônomo, físico e matemático inglês.
9
F. W. Dyson, A. S. Eddington and C. Davidson, Philosophical Transactions of the Royal Society, A220, 291-333 (1920).
10
A. S. Shapiro, J. L. Davis, D. E. Lebach and J. S. Gregory, Physical Review Letters, 92 (12), 121101 (2004).
“Z_2” — 2017/9/5 — 8:19 — page 485 — #505
via terrestre, através do experimento de Pound-Rebka.11 O resultado deste experimento confirmou que as
predições da relatividade geral estavam ao nível de 10% e foi posteriormente aprimorado até o nível de
1%.12 Outro teste importante envolvendo um maser de hidrogênio espacial aumentou a precisão da medida
para cerca de 10−4 , i.e., 0.01%.13 Mais tarde discutiremos brevemente a deflexão da luz em um campo
gravitacional, no contexto da chamada solução de Schwarzschild das equações de Einstein.14
Princípio de Equivalência Forte O princípio de equivalência forte vai mais longe e afirma que local-
mente, i.e., em um referencial inercial local todas as leis da física têm a sua forma relativística especial de
costume, com exceção da gravidade, que simplesmente desaparece. Além disso, o princípio de equivalência
forte afirma que não há experiência que pode efetuar a distinção entre um referencial inercial local, na qual
está em queda livre num campo gravitacional uniforme e um referencial de inércia, o qual se situa numa
região do universo longe de qualquer massa gravitando, e, portanto, bem descrito pela geometria do es-
paço-tempo de Minkowski da relatividade especial. Por outro lado, se estamos dentro de uma nave espacial
em nossa região remota do cosmos, portanto livre da gravidade, podemos simular a gravidade, dando ao
foguete uma aceleração; esta aceleração será indistinguível de um campo gravitacional uniforme com igual
(mas oposta) aceleração da gravidade, gravidade e aceleração são equivalentes.
∂ ν F µρ + ∂ µ F ρν + ∂ ρ F νµ = 0
que são as equações de Maxwell homogêneas. A forma matricial do tensor do campo eletromagnético é
dada por
0 −Ex −Ey −Ez
Ex 0 −Bz By
F µν =
Ey Bz
.
0 −Bx
Ez −By Bx 0
Entretanto, ela não é satisfeita pela descrição newtoniana de outra interação fundamental existente na natu-
reza, que é a gravitação.
Com efeito, pela lei de Newton da gravitação, ela é descrita como uma interação instantânea à distân-
cia, i.e., se mudarmos a posição de uma massa, mudam instantaneamente as forças gravitacionais entre ela
e quaisquer outras massas, por mais distantes que estejam. Einstein propôs reformular a teoria da gravitação
11
Robert Vivian Pound (1919-2010), físico americano.
Glen Anderson Rebka, Jr. (1931-2015), físico americano.
12
R. V. Pound and G. A. Rebka Jr., Physical Review Letters, 4 (7), 337-341 (1960); R. V. Pound and J. L. Snider, Physical Review
Letters, 13 (18), 539-540 (1964).
13
R. F. C. Vessot, M. W. Levine, E. M. Mattison, E. L. Blomberg, T. E. Hoffman, G. U. Nystrom, B. F. Farrel, R. Decher, P. B.
Eby, C. R. Baugher, J. W. Watts, D. L. Teuber and F. D. Wills, Physical Review Letters, 45 (26), 2081-2084 (1980).
14
K. Schwarzschild, Sitzungsberichte der Königlich Preussischen Akademie der Wissenschaften, 7, 189-196 (1916).
“Z_2” — 2017/9/5 — 8:19 — page 486 — #506
de forma a torná-la compatível com as limitações impostas pela relatividade restrita. Um dos principais
passos seguidos para auxiliá-lo nesta tarefa foi um fato que já havia despertado a atenção de Newton, mas
que jamais havia encontrado uma resposta adequada, ou seja, a igualdade da massa inercial e da massa
gravitacional. Esta explicação veio com o princípio de equivalência.
Como sabemos, a teoria da relatividade especial poderia ser obtida supondo um tipo especial de for-
malismo do espaço-tempo, conhecido como o espaço de Minkowski ou geometria de Minkowski. Uma
diferença grande entre a teoria da relatividade especial e a gravitação é que temos forças que atuam nos
corpos que criam alguma orientação privilegiada em nosso sistema.
É interessante observar que os princípios de equivalência, fraco e forte, nos diz que: desde que o nosso
campo gravitacional seja uniforme (ou razoavelmente aproximado ao uniforme) podemos definir um refe-
rencial inercial local, i.e., um sistema de coordenadas em que a gravidade tem sido localmente transformado,
assim, as leis da física de acordo com a relatividade especial e a métrica do espaço-tempo pode ser reduzida
para a forma simples da equação de Minkowski (17.3). No entanto, este é apenas o primeiro passo no sen-
tido de uma teoria totalmente covariante da gravidade. Em geral campos gravitacionais decididamente não
são uniformes, os referenciais inerciais definidos por dois elevadores em queda livre em São Paulo e Tóquio
são muito diferentes, de modo que só podemos transformar seus efeitos localmente. A fim de ser uma teoria
efetiva da gravidade, a relatividade geral deve nos fornecer os meios para unir referenciais inerciais locais
em todas as regiões do espaço-tempo prolongado, contendo campos gravitacionais não uniformes. Este pro-
cesso de costura transforma a geometria localmente plana do espaço-tempo de Minkowski, em que podem
ser aplicados a cada referencial inercial local, na geometria curva que caracteriza o campo gravitacional das
regiões estendidas.
Cabe aqui uma observação importante. Para isso, apresentamos um referencial de Lorentz local. Pode-
mos conseguir isto fazendo o problema em queda livre no ponto P . O princípio de equivalência estabelece
que todos os efeitos da gravitação desaparecem e que localmente obtemos a métrica da teoria da relatividade
especial, i.e., a métrica de Minkowski. Assim, podemos escolher a cada ponto P da variedade um sistema
de coordenadas em que a métrica de Minkowski é válida. Enquanto na teoria da relatividade especial isto
pode ser um sistema de coordenadas global, na relatividade geral este é apenas localmente possível. Com
este procedimento podemos encontrar uma definição da distância de cada ponto P : com
Em essência, praticamos a teoria da relatividade especial em cada ponto P e temos a medida do compri-
mento das hastes e os tempos próprios dos relógios ideais. No referencial de Lorentz local, a métrica é dada
por ηµν = diag(1, −1, −1, −1).
Para descrever a curvatura do espaço-tempo rigorosamente será necessário usar ferramentas matemáti-
cas do campo da geometria diferencial: essencialmente estender a descrição familiar das quantidades físicas
em termos de escalares e vetores para tensores. Vamos discutir tensores e suas propriedades com moderação,
para não ficar muito atolado em matemática e por sua vez muito longe da física da relatividade geral, mas
alguma discussão sobre tensores será essencial se quisermos entender completamente a relatividade geral e
sua importância teórica para a estudo das ondas gravitacionais. No entanto, antes de introduzir os tensores
em nossa ferramenta de matemáticas, podemos primeiro adquirir algum conhecimento físico, a mais, sobre
a relação entre gravidade, aceleração e curvatura do espaço-tempo, considerando de forma simplificada as
trajetórias de partículas em queda livre, caminhos estes conhecidos na relatividade geral como geodésicas.
Podemos dizer que uma geodésica é a distância mais curta entre dois pontos. Ela será uma reta somente no
caso em que a superfície em questão for um plano. Para todos os tipos de superfície haverá um tipo de curva
específica que será a distância mais curta entre dois pontos selecionados.
“Z_2” — 2017/9/5 — 8:19 — page 487 — #507
Matematicamente, a curvatura do espaço-tempo pode ser revelada ao considerar o desvio das geodésicas
vizinhas. O comportamento do desvio da geodésica é representado qualitativamente na Fig. 17.2, que mos-
tra três superfícies bidimensionais de curvaturas diferentes intrínsecas na qual dois objetos se deslocam ao
longo de trajetórias vizinhas, inicialmente trajetórias paralelas. Na figura vemos: na superfície mais à es-
querda, uma peça plana de papel, com uma curvatura intrínseca zero, a separação dos objetos permanece
constante à medida que eles se movem ao longo de suas geodésicas vizinhas; na superfície do centro, que
lembra uma esfera, com curvatura intrínseca positiva, a separação dos objetos em movimento diminui com
o tempo, i.e., as geodésicas movem-se uma em direção à outra; na superfície mais à direita, que forma uma
superfície tipo sela, com curvatura intrínseca negativa, a separação dos objetos aumenta com o tempo, i.e.,
as geodésicas se separam uma da outra.
Especificamente, é a aceleração do desvio entre geodésicas vizinhas que é uma assinatura de curvatura
do espaço-tempo, ou equivalentemente (como descreveríamos usando a física newtoniana), temos a pre-
sença de um campo gravitacional não uniforme. Este último ponto é importante: desvio geodésico não pode
distinguir entre um campo gravitacional zero e um campo gravitacional uniforme; no último caso, a acele-
ração do desvio geodésico é também zero. Apenas para um campo gravitacional não uniforme ou campo
gravitacional de ondas é que temos o desvio geodésico acelerado. Veremos mais adiante que é precisamente
estas variações de onda que os detectores de ondas gravitacionais são sensíveis.
Antes de considerarmos uma completa descrição da relatividade geral para a relação entre o desvio ge-
odésico e a curvatura do espaço-tempo, é instrutivo considerar uma ilustração bastante simples: A descrição
15
Extremum, do latim até o fim, até o extremo.
“Z_2” — 2017/9/5 — 8:19 — page 488 — #508
newtoniana do comportamento das partículas vizinhas que estão em queda livre na presença de um campo
gravitacional não uniforme.
Desvio Geodésico na Gravidade Newtoniana A Fig. 17.3 é uma ilustração exagerada de duas partículas
Figura 17.3 Ilustração de como na física newtoniana a separação de partículas testes mudará com o
tempo, se elas estão em queda livre na presença de um campo gravitacional não uniforme.
testes que estão inicialmente suspensas na mesma altura acima da superfície da Terra, supostamente esférica,
e são liberadas a partir do repouso. De acordo com a física newtoniana, a separação destas partículas testes
irá reduzir à medida que caem livremente (queda livre) em direção à Terra, porque elas estarão caindo em
um campo gravitacional não uniforme. A força gravitacional sobre cada partícula é dirigida para o centro
da Terra, o que significa que os vetores de aceleração não são paralelos.
Suponhamos que a separação inicial das partículas testes seja de ξ0 e a suas distância a partir do centro
da Terra seja r0 , depois de algum tempo t aquela separação será ξ (t) e a distância a partir do centro da Terra
será de r (t). Através da semelhança de triângulos, podemos ver que
ξ (t) ξ0
= = k, (17.6)
r (t) r0
em que k é uma constante. Derivando duas vezes no tempo, encontramos
kGM
ξ̈ = kr̈ = − , (17.7)
r2
ξ
em que M é a massa da Terra. Substituindo por k = r temos
ξ GM GM ξ
ξ̈ = − =− 3 . (17.8)
r r2 r
Se as partículas testes se encontram muito próximo da superfície da Terra, então, r ≈ R, em que R é o raio
da Terra, então
GM ξ
ξ¨ = − .
R3
“Z_2” — 2017/9/5 — 8:19 — page 489 — #509
Figura 17.4 Ilustração da alteração na separação das geodésicas que se movem ao longo de grandes
círculos de longitude constante sobre a superfície de uma esfera.
ao equador, passando por P1 e P2 e separados por uma distância ξ0 no equador. A distância do arco ao longo
de cada geodésica é indicado por s e a separação dos geodésicas em s é ξ (s).
Evidentemente a separação geodésica não é constante quando mudamos s e avançamos para o polo norte
N . Assim, podemos escrever a equação diferencial que governa a mudança nesta separação das geodésicas.
Se a diferença (pequena) na longitude entre as duas geodésicas for dφ (em radianos), então ξ0 = a dφ.
Por outro lado, na latitude θ (mais uma vez, em radianos) correspondente ao comprimento do arco s a
separação da geodésica é s
ξ (s) = a cos θ dφ = ξ0 cos θ = ξ0 cos . (17.10)
a
Derivando ξ (s) duas vezes em relação à s encontramos,
d2 ξ 1
= − 2 ξ. (17.11)
ds2 a
Comparando as Eqs. (17.9) e (17.10), veremos que faz sentido a quantidade
1
G M −2
R= (17.12)
R3 c2
“Z_2” — 2017/9/5 — 8:19 — page 490 — #510
representando o raio de curvatura do espaço-tempo na superfície da Terra. Calculando este raio para a
Terra vemos que R = 2 × 1011 m. O fato deste valor ser muito maior do que o raio físico da Terra nos
diz que o espaço-tempo é quase plano na vizinhança da superfície da Terra, i.e., o campo gravitacional da
Terra é bastante fraco. Por outro lado, se calcularmos R, por exemplo, para uma anã branca ou estrela de
nêutrons,16 então veremos evidências de que seus campos gravitacionais são muito mais fortes.
Voltaremos, em breve, ao assunto da curvatura do espaço-tempo e consideraremos como ele se expressa
na relatividade geral. Porém, para lidar rigorosamente com as propriedades geométricas do espaço-tempo
curvos, precisamos introduzir uma série de conceitos e ferramentas matemáticas apropriadas. Começamos
com o conceito de uma variedade.17
Matemática: Nesta nota não precisamos nos preocupar com a matemática formal da definição de coorde-
nadas, mas o leitor interessado pode encontrar discussões úteis em qualquer livro introdutório sobre
geometria diferencial. Genericamente falando, isto envolve fazendo a cobertura dos pontos da varie-
dade através de uma coleção de conjuntos abertos, Ui , cada um dos quais mapeados em Rn por um
mapeamento de um-para-um, φi . O par (Ui , φi ) é chamado de carta,18 e a coleção de cartas chama-se
de atlas. Pode-se pensar de cada carta, como a definição de um sistema de coordenadas diferentes.
Assim, isto pode ser obtido do seguinte modo. Definimos primeiro uma carta sobre a variedade M,
i.e., um par (Ui , φi ), em que
1. U é um subconjunto aberto de M,
2. φ : U → Rn é um homeomorfismo de conjuntos abertos, i.e., uma aplicação bijetiva e bicontí-
nua.
Assim, a aplicação φ pode ser usada para estabelecer um sistema de coordenadas sobre U de uma
maneira óbvia: Sejam xk , em que k = 1, 2, · · · , n e tomemos n funções coordenadas sobre Rn , se
a = (a1 , · · · , an ) ∈ Rn então xk (a) = ak .
Na relatividade geral estamos preocupados com uma determinada classe de variedades diferenciáveis
conhecidas como variedade riemanniana, ou manifold riemanniano. A variedade riemanniana é uma vari-
edade diferenciável em que a distância, ou métrica, foi definida.
16
Em astronomia, anã branca é o objeto celeste resultante do processo evolutivo de estrelas de até 10 M⊙ , o que significa dizer
que cerca de 98% de todas as estrelas evoluirão até a fase de anã branca. Entretanto, somente 6% dos objetos nas vizinhanças do
Sol são anãs brancas. As estrelas de nêutrons são corpos celestes supermassivos, ultracompactos e com gravidade extremamente
alta. A partir de estudos teóricos e observações astronômicas, sabe-se que a densidade no centro destas estrelas é enorme, da
ordem de 1015 g/cm3 . Devido à alta gravidade superficial, os feixes de luz que passam próximos a algumas estrelas de nêutrons
são desviados, ocasionando distorções visuais, muitas vezes aberrações cromáticas ou o efeito chamado de lente gravitacional.
Estrelas de nêutrons são um dos possíveis estágios finais na vida de uma estrela. Elas são criadas quando estrelas com massa
maior a oito vezes a do Sol esgotam sua energia nuclear e passam por uma explosão de supernova.
17
Vem do inglês manifold, apesar de manifold ser mais conhecido na literatura, usaremos variedade daqui para frente. Variedade
ou manifold é a designação matemática precisa que substitui a palavra espaço.
18
Do inglês chart.
“Z_2” — 2017/9/5 — 8:19 — page 491 — #511
Podemos ver por que a matemática das variedades riemannianas são apropriadas para a relatividade
geral. De acordo com o princípio de equivalência fraco, o espaço-tempo é localmente plano e o intervalo
entre os eventos neste espaço-tempo é descrito por uma métrica, seguindo a Eq. (17.2). Além disso, qualquer
teoria dinâmica da gravidade envolve derivadas do espaço e do tempo; daí a nossa descrição de espaço-
-tempo ser diferenciável. Variedades riemannianas atendem todos os três critérios.
Funções Escalares em uma Variedade Podemos definir uma função, f , em uma variedade, M. Assim,
em qualquer ponto P da variedade a função recebe um valor real
f : M → R. (17.13)
µ ∂x′ µ
∆x′ = ∆xα . (17.15)
∂xα
Agora, considere dois vetores deslocamentos ∆~x e ∆~y, ver Fig. 17.5. Como podemos decidir se ∆~x e ∆~y
Figura 17.5 Vetores em uma variedade curva. Em geral, as componentes de ∆~x em X e de ∆~y em
Y serão diferente, porque eles são definidos em diferentes pontos da variedade em questão.
sejam iguais quando são definidos em diferentes pontos na nossa variedade? Por exemplo, para vetores em
um espaço plano com coordenadas cartesianas, podemos simplesmente transladar ∆~y para X e comparar
as componentes de ∆~y com as componentes de ∆~x. Esta regra não será válida para uma variedade curva
“Z_2” — 2017/9/5 — 8:19 — page 492 — #512
geral, devido ao fato de que os coeficientes da lei de transformação na Eq. (17.15) são em geral funções de
posição. Em outras palavras, a lei de transformação entre os sistemas de coordenadas com linha e sem linha
é, em geral, diferente para diferentes pontos da variedade. Assim, não é suficiente definir as componentes
de um vetor; também precisamos especificar o ponto da variedade com que o vetor e suas componentes
estão definidos.
O fato de que a lei de transformação dos coeficientes da Eq. (17.15) serem em geral funções de posição
também significa que não temos nenhum conjunto universal de vetores de base de coordenadas em uma
variedade curva, como é o caso quando estamos trabalhando no espaço euclidiano. Há, no entanto, um
meio de definir um conjunto natural de vetores de base para cada ponto da variedade, que nos permite
desenvolver uma visão mais geral do que se entende por um vetor e na qual é igualmente válido em um
espaço-tempo curvo.
Vetores Tangentes Suponhamos que temos uma função escalar φ definida em um ponto P de uma varie-
dade riemanniana, em que P tem coordenadas {x1 , x2 , · · · , xn } em algum sistema de coordenadas. Desde
que nossa variedade seja diferenciável, podemos calcular a derivada de φ em relação a cada xi , em que
temos i=1, 2, · · · , n. Em fato, sendo φ completamente arbitrário, podemos pensar as derivadas como um
conjunto de n operadores, denotados por
∂
.
∂xi
Estes operadores podem atuar em qualquer função escalar φ e produzir a taxa de alteração da função no que
diz respeito à xi .
Agora, podemos definir um vetor tangente no ponto P como um operador linear da forma
∂ ∂ ∂ ∂
aµ µ
≡ a1 1 + a2 2 + · · · + an n , (17.16)
∂x ∂x ∂x ∂x
em que é possível observar o uso da convenção no somatório. Este vetor tangente opera em qualquer função
φ e, essencialmente, proporciona a taxa de alteração da função, ou a derivada direcional numa direção, que
é definida pelos números (a1 , a2 , · · · , an ). Podemos definir a adição de dois vetores tangentes na forma.
∂ ∂ ∂
aµ + bµ µ = (aµ + bµ ) µ . (17.17)
∂xµ ∂x ∂x
Observação Matemática: Com esta definição simples da adição, um pouco de matemática formal facil-
mente mostra que o conjunto de todos os vetores tangentes formam um espaço vetorial.
Então, o operador
∂
aµ
∂xµ
comporta-se como um vetor, cujas componentes são (a1 , a2 , · · · , an ). Podemos, portanto, escrever
∂
~a = aµ . (17.18)
∂xµ
Os n operadores ∂x∂ µ pode ser pensado como a formação de um conjunto de vetores de base, {êµ }, abran-
gendo o espaço vetorial dos vetores tangentes em P .
O que exatamente estes vetores de base representam? Podemos encontrar um quadro geométrico simples
para os vetores êµ primeiro cristalizando a noção de uma curva C, definida em nossa variedade. A nossa
noção intuitiva de uma curva é simplesmente a de uma série de pontos em nossa variedade; na literatura
matemática, no entanto, chamamos isso de caminho, e o termo curva é, em vez disso, reservada para o caso
particular de um caminho que foi parametrizado.
“Z_2” — 2017/9/5 — 8:19 — page 493 — #513
Assim, a curva é uma função que mapeia um intervalo da reta real para a variedade. Pondo isto de forma
mais simples, uma curva é um caminho com um número real (por exemplo, s) associado a cada ponto do
caminho; assim, chamamos s de parâmetro da curva. Nota-se também que uma vez escolhido um sistema
de coordenadas, cada ponto na curva tem coordenadas {xµ }, que pode também ser expresso em função do
parâmetro s, i.e.,
xµ = xµ (s) µ = 1, · · · , n . (17.19)
Uma vez que especificamos nosso sistema de coordenadas, podemos considerar um determinado conjunto
de curvas na qual usam as próprias coordenadas como parâmetro. Por exemplo, o ponto P com coordenadas
{x1 , x2 , · · · , xn } encontra-se nas n curvas que obtemos, permitindo que apenas o valor de xi poderá variar
ao longo da i-ésima curva (i = 1, · · · , n) e fixando todos os outros valores de coordenadas para serem
iguais aos seus valores em P . Para visualizar um exemplo simples, pense em círculos de igual latitude e
∂
longitude na variedade 2-esfera. Os vetores de base êi ≡ ∂x i pode ser considerado simplesmente como
a tangente à i-ésima curva. Esta representação geométrica está ilustrada na Fig. 17.6, novamente para o
Figura 17.6 Ilustração das coordenadas dos vetores de base definidos em dois pontos X e Y sobre a
superfície de uma esfera.
exemplo simples da 2-esfera. Nota-se que os vetores de base êφ e êθ são diferentes nos pontos X e Y de
nossa variedade.
E o que dizer de uma curva mais geral na variedade? Aqui, simplesmente conectamos a noção, intro-
duzida acima, de um vetor tangente como uma derivada direcional para a nossa representação geométrica
simples de uma tangente a uma curva. A Fig. 17.7 mostra muito bem uma curva, com parâmetro s, e com
vetores tangentes desenhado em pontos com diferentes valores do parâmetro. Suponhamos que as coorde-
nadas dos pontos da curva são {xµ (s)}, para µ = 1, · · · , n. Então, as componentes T µ do vetor tangente
com com respeito a base {êµ } ≡ { ∂x∂ µ } são simplesmente dadas por
dxµ
Tµ = . (17.20)
ds
“Z_2” — 2017/9/5 — 8:19 — page 494 — #514
Figura 17.7 Representação esquemática de uma curva, parametrizada por s, e mostrando os vetores
tangente desenhados em s = 5 e s = 7.
Para resumir, podemos representar vetores como vetores tangentes das curvas em nossa variedade. Uma
vez que tiver especificado nosso sistema de coordenadas, podemos escrever as componentes de um vetor
definido em qualquer ponto da variedade no que diz respeito à base natural gerada pelos operadores { ∂x∂ µ }
naquele ponto. Um campo vetorial pode ser definido através da atribuição de um vetor tangente em cada
ponto da variedade.
Lei de Transformação para Vetores, Covetores e 1-Forma Neste ponto faremos um breve estudo mo-
derno de vetores, covetores e 1-forma e suas leis de transformação:
Vetores
Suponhamos a mudança de base para um novo sistema de coordenadas {x′ 1 , x′ 2 , · · · , x′ n }. Nossa base será
∂
ê′µ ≡ . (17.21)
∂x′ µ
Como as componentes, {a1 , a2 , · · · , an }, se transformam em nosso novo sistema de coordenadas? Para ver
como a lei surge no âmbito da nossa descrição para vetores tangentes, vamos considerar o vetor ~a operando
em uma função escalar arbitrário φ. Então,
∂φ
~a(φ) = aν . (17.22)
∂xν
Pela regra da cadeia para a diferenciação, podemos reescrever a relação anterior como
∂x′ µ ∂φ
~a(φ) = aν . (17.23)
∂xν ∂x′ µ
No entanto, se escrevermos ~a diretamente em termos de coordenadas base {ê′µ } ≡ { ∂x∂′ µ }, temos
µ ∂φ
~a(φ) = a′ . (17.24)
∂x′ µ
Comparando as Eqs. (17.23) e (17.24), vemos que
µ ∂x′ µ ν
a′ = a . (17.25)
∂xν
É fácil ver que a base muda como
∂ ∂xν ∂ ∂xν
ê′µ ≡ = = êν .
∂x′ µ ∂x′ µ ∂xν ∂x′ µ
“Z_2” — 2017/9/5 — 8:19 — page 495 — #515
Nota-se que a base se transforma contrariamente às componentes do vetor e por isso os vetores tangentes
são também chamados de vetores contravariantes.
Assim, as componentes do vetor tangente transformam-se de acordo com a Eq. (17.25). Chamamos
esta equação de lei de transformação para vetores ou lei de transformação para um vetor contravariante, e
dizemos que as componentes de~a transformam-se de forma contravariante. O termo contravariante é usado
para distinguir estes vetores de outro tipo de objetos geométricos, i.e., vetores covariantes ou covetores,
na qual iremos considerar na próxima subseção. Denotamos as componentes de um vetor contravariante
usando sobrescritos. A Eq. (17.25) é a lei de transformação protótipo para qualquer vetor contravariante.
Qualquer conjunto de n componentes, Aµ , que pode ser calculado em qualquer sistema de coordenadas, e
que se transformam de acordo com a lei de transformação dada em (17.25), é o que chamamos de um vetor
contravariante.
Covetores
Agora, nosso próximo passo. Qual será a relação entre os vetores de base ê′µ e êµ nos sistemas de coorde-
nadas com linha e sem linha? É fácil verificar, direto da Eq. (17.21) temos
∂xν
ê′µ = êν . (17.26)
∂x′ µ
Assim, vemos que os vetores de base não se transformam na mesma maneira como as componentes de um
vetor contravariante. Isto não deve ser muito surpreendente, uma vez que a transformação de uma base e a
transformação de componentes são coisas diferentes: a primeira é a expressão de novos vetores em termos
dos velhos vetores; já a segunda é a expressão do mesmo vetor em termos de uma nova base. Na verdade, a
forma de transformação que aparece na Eq. (17.26) é a mesma que a lei de transformação para um outro tipo
de objeto geométrico, o qual chamamos vetor covariante ou covetor. Qualquer conjunto de n componentes,
Aµ , que pode ser calculado em qualquer sistema de coordenadas, é dito ser um vetor covariante e se trans-
forma de acordo com a lei de transformação para vetores covariantes, i.e., as componentes se transformam
de acordo com a equação
∂xν
A′µ = Aν . (17.27)
∂x′ µ
Pode-se simplesmente considerar a Eq. (17.27) como a definição de um vetor covariante. Denotamos as
componentes de um vetor covariante usando subscritos.
1-forma
Muitos livros modernos sobre geometria diferencial, no entanto, começam definindo uma 1-forma como
um mapeamento linear que atua sobre um vetor para dar um número real.
O espaço vetorial de vetores tangentes à curva no ponto P definido anteriormente, denotado por TP ,
é chamado de espaço tangente e existe um espaço tangente diferente a cada ponto da variedade. Como
sabemos da álgebra linear, pode-se construir o espaço dual a TP , denotado TP∗ , através das aplicações
lineares p̃ que levam um vetor tangente pertencente a TP num número real, i.e., p̃(~a) é um número real.
Pode-se construir a chamada base dual de TP∗ , w̃µ , através da definição
Os elementos deste espaço p̃ = pµ w̃µ , são os chamados de 1-forma e é fácil ver que suas componentes pµ
∂xν
se transformam como a base ê′µ = ∂x ′ µ êν . A partir desta definição pode-se então chegar à Eq. (17.27).
19
19
S. Z. Sternberg, Lectures on differential geometry (1983); D. J. Struik, Lectures on classical differential geometry (1988).
“Z_2” — 2017/9/5 — 8:19 — page 496 — #516
Uma demostração rápida do dito anteriormente nos dá o seguinte: as componentes pµ (nota-se que o
índice é subscrito, ao contrário de um vetor, ou vetor contravariante) de uma 1-forma p̃ são os seus valores
quando se é dado aos vetores de base como argumentos,
Uma vez que conhecemos as componentes de uma 1-forma, podemos trabalhar com seu efeito sobre qual-
quer outro vetor, utilizando as condições de linearidade. Um vetor geral ~a pode ser escrito em termos de
seus vetores de base em um determinado período, como ~a = aµ êµ . Assim,
Observação
∂xj ∂x′ i
= = aij
∂x′ i ∂xj
de modo que não há nenhuma diferença entre transformações contravariantes e covariantes. Em outros
sistemas, a relação anterior em geral não se aplica, e a distinção entre contravariante e covariante é real e
deve ser observada. Isto é de extrema importância no espaço riemanniano20 curvo da relatividade geral. Em
1853, estes termos covariantes e contravariantes foram introduzidas, pela primeira vez, por Sylvester,21 a
fim de estudar a teoria algébrica invariante.22
Lei de Transformação para Tensores Tendo definido o que entendemos por vetores e 1-forma, em ter-
mos de como as suas componentes se transformam sob uma transformação de coordenadas geral, podemos
agora estender nossa definição para a classe mais geral de um objeto geométrico que chamamos de tensores.
Um tensor de tipo (l, m), definida em uma variedade n-dimensional, é um operador linear que mapeia l
1-forma e m vetores (contravariantes) para um número real, i.e., um escalar. Este tensor tem um total de
nl+m componentes.
A lei de transformação para um tensor geral (l, m) resulta da sua linearidade e a partir das leis de
transformação de um vetor e de um vetor covariante, de modo que a quantidade escalar obtida quando o
tensor opera sobre l 1-forma e m vetores é independente da escolha de um sistema de coordenadas. Podemos
escrever esta lei geral de transformação da seguinte forma
Um tensor (2, 0), i.e., T ij , é conhecido como um tensor contravariante de segunda ordem, se transforma
de acordo com a lei de transformação
ij ∂x′ i ∂x′ j kl
T′ = T . (17.29)
∂xk ∂xl
Um tensor (0, 2), i.e., Bij , é conhecido como um tensor covariante de segunda ordem, se transforma de
acordo com a lei de transformação
′ ∂xk ∂xl
Bij = Bkl . (17.30)
∂x′ i ∂x′ j
Um importante exemplo de tensor (0, 2) é o tensor métrico gµν . Este é um tensor simétrico, i.e.,
Podemos ver perfeitamente que a forma da Eq. (17.2) faz sentido: os pequenos deslocamentos dxµ e dxν
transformam-se como vetores contravariantes; o tensor métrico opera sobre estes vetores para fornecer um
escalar, o intervalo, o que é invariante.
Um tensor que tem índices superior e inferior, na qual significa que tem ambos os termos contravariante
e covariante no sua lei de transformação, é conhecido como um tensor misto. O exemplo mais simples, após
o caso trivial do tensor (0, 0), é um tensor (1, 1), como Dji . Sua lei de transformação é dada por
i ∂x′ i ∂xl k
D′ j = D . (17.32)
∂xk ∂x′ j l
Um importante exemplo de tensor (1, 1) é o delta de Kronecker δji , ou tensor de Kronecker23 definido por:
1, se i = j
δji = (17.33)
0, se i 6= j
j ∂x′ j ∂xi i
A′ B ′ j = A Bi = Ai Bi . (17.34)
∂xi ∂x′ j
Podemos generalizar a operação de contração para o caso de dois tensores quaisquer, e através de um número
arbitrário de índices, desde que um número igual de índices superiores e inferiores sejam selecionados. Em
geral, a contração sobre k índices irá produzir, a partir de um tensor do tipo (l, m), um novo tensor do tipo
(l − k, m − k). Por exemplo, a contração de dois tensores Gijk s
lm e Rtu sobre os índices i e t, j e u, e, l e s
ijk l
dará um tensor (1, 1) Glm Rij , em que novamente os índices k e m são livres.
Levantamento e abaixamento dos índices Dado um vetor contravariante Aµ , é possível por definição, via
tensor métrico, associar um vetor covariante ou 1-forma Aν através da relação
Aν = gµν Aµ . (17.35)
Similarmente, usando gµν podemos levantar o índice de um vetor covariante Bµ para obter o vetor
contravariante B ν , via
B ν = gµν Bµ . (17.36)
Sendo esta operação conhecida como levantamento de índice.
O processo de levantar ou abaixar os índices podem ser realizadas com tensores de qualquer ordem e
tipo. Por exemplo
ijk..
Dlm = glp gmq D ijkpq . (17.37)
Alguns cuidados devem ser tomados no posicionamento dos índices. Os pontos .. foram colocados ali
para indicar os índices sobre os quais a contração tenha ocorrido, embora, em geral, vamos omitir os
ijk ..ijk
pontos e apenas escrever Dlm . Note que Dlm definido por
..ijk
Dlm = glp gmq D pqijk (17.38)
ijk..
não é o mesmo que Dlm , a menos que D ijkpq possui alguma simetria.
A grandeza, ou magnitude, de um vetor com componentes Aµ é gµν Aµ Aν na qual é invariante, desde
que gµν seja um tensor (0, 2) e as componentes Aµ e Aν sejam tensores (1, 0). Nota-se que,
Manipulação dos índices Qualquer tensor de ordem dois Aij pode ser representado como a soma de um
tensor simétrico e de um tensor antissimétrico
1 1
Aij = (Aij + Aji ) + (Aij − Aji ) .
2 2
É facilmente verificado que o primeiro termo, denominado A(ij) , não sofre mudança quando índices
são trocados
1
A(ij) = (Aij + Aji ) = A(ji) .
2
Quanto ao segundo termo, A[ij] , recebe um sinal menos, i.e.,
1
A[ij] = (Aij − Aji ) = −A[ji] .
2
Para um tensor de terceira ordem, as partes simétrica e antissimétrica são:
1
A(ijk) = (Aijk + Aikj + Akij + Akji + Ajki + Ajik )
3!
1
A[ijk] = (Aijk − Aikj + Akij − Akji + Ajki − Ajik ) .
3!
Então para um tensor geral de n-ésima ordem, as partes simétrica e antissimétrica são dadas por:
n!−1
1 X
T(µ1 µ2 µ3 ···µn ) = (permutações de µ1 · · · µn )
n!
j=0
n!−1
X
1
T[µ1 µ2 µ3 ···µn ] = (−1)j (permutações de µ1 · · · µn ) .
n!
j=0
“Z_2” — 2017/9/5 — 8:19 — page 499 — #519
∂xl ∂ 2 x′ i
Ak ,
∂x′ j ∂xl ∂xk
é a razão do porque que Ai, j não se transforma como um tensor. A raiz do problema é que o cálculo da
derivada envolve vetores encontrados em dois pontos vizinhos, em que cada um deles a lei de transformação
será, em geral, diferente. Para superar este problema necessitamos transportar um dos vetores para o ponto
vizinho, de modo que eles sejam encontrados no mesmo ponto na variedade. Isto pode ser conseguido pelo
processo conhecido pelo nome de transporte paralelo, que transporta as componentes do vetor ao longo de
uma curva na variedade de tal forma que irá preservar o ângulo entre esses vetores.
Suponhamos que existe um ponto com coordenadas xi e que seu vizinho tenha coordenadas xi + dxi .
É mais fácil considerar, em primeiro lugar, o transporte paralelo das componentes de um vetor covariante,
ou uma 1-forma, a partir de xi + dxi até xi . Suponhamos que a mudança δBk nas componentes será uma
função linear das componentes originais Bj e do deslocamento dxi , então podemos escrever
em que o sinal (−) foi introduzido por convenção e Γjik são os conhecidos símbolos de Christoffel24 que de-
finem a conexão afim. Estes símbolos descrevem como os vetores de base em diferentes pontos na variedade
se movem através da variedade, i.e.,
∂ êα
≡ Γµαβ êµ . (17.43)
∂xβ
Uma variedade M com uma conexão afim, nela definida, é uma variedade afim. Segue-se então que a
derivada covariante de uma 1-forma pode ser escrita como
em que B, k −Γjik Bj transforma-se como um tensor (0, 2) e Bi; k ≡ ∇k Bi . Dado que as derivadas covariante
e parcial de um escalar são idênticas, então é fácil mostrar que a derivada covariante de um vetor tem a forma
são as componentes do vetor transportado paralelamente e claro que Γαλµ conecta vetores de espaços tan-
gentes diferentes através do chamando transporte paralelo.
Outra forma de definirmos Γβαµ é através da base: ∇α êµ = Γβαµ êβ , i.e., Γβαµ é a componente β na base
ê do vetor resultante da aplicação da componente α da derivada covariante no vetor de base êµ . Nota-se
que no espaço plano em coordenadas cartesianas, cujas bases são constantes, ∇α êµ = 0 ⇔ Γβαµ = 0, i.e.,
no espaço plano em coordenadas cartesianas o transporte paralelo não altera o vetor, como já sabemos.
Usando a regra de Leibniz25 e o fato de que o operador ∇α reproduz ∂α ao atuar em uma função,
β
podemos obter a Eq. (17.45), i.e., ∇α A = ∂α A + Γαν A de ∇α A ≡ ∇α A w̃β e A
β β ν β ~ ~ = Aµ êµ .
Como ∇α Aβ são componentes de um verdadeiro tensor (1, 1) e como ∂α Aβ não se transforma como um
tensor, então Γβαµ também não pode se transformar como um verdadeiro tensor para compensar esse fato.
Então, exigindo que ∇α Aβ seja um tensor, podemos mostrar que
isto mostra de fato que Γβαµ não é um tensor. Embora a conexão não seja um tensor, a diferença Γβαµ − Γβµα
é um tensor, conhecido como torção. Em nosso estudo iremos supor a torção nula, o que corresponde dizer
que a conexão é simétrica. Além da simplificação que isso traz, esta hipótese nos levará as equações de
Einstein. Existem, no entanto teorias da gravitação em que a hipótese pode não ser exigida.
Podemos estabelecer uma relação entre a conexão, i.e., os símbolos de Christoffel, e o tensor métrico
impondo que o ângulo entre dois vetores transportados pela conexão ao longo de uma curva se mantenha
constante ao longo do transporte. Isto implica que a derivada covariante do tensor métrico seja igual a zero,
para todos α, β, γ
gαβ ; γ ≡ ∇γ gαβ = 0 e gαβ ; γ ≡ ∇γ gαβ = 0 . (17.46)
Estes resultados são chamados de espaço riemanniano, ou espaço de Riemann. Podemos obter a conexão
simétrica de um espaço de Riemann completamente em função da geometria permutando os índices da
relação ∇γ gαβ = 0, i.e., obtemos uma expressão para os símbolos de Christoffel em termos da métrica e
suas derivadas parciais
1
Γijk = gil glj , k + glk , j − gjk , l . (17.47)
2
25
Gottfried Wilhelm von Leibniz (1646-1716), matemático e filósofo alemão.
“Z_2” — 2017/9/5 — 8:19 — page 501 — #521
Geodésica das Partículas com Massa A linha do universo de uma partícula com massa será escrita com
o tempo próprio τ como parâmetro afim ao longo desta linha. Se xµ (s) for a geodésica, o seu vetor tangente
µ
será dado por uµ = dx ds , i.e., a quadrivelocidade da partícula é o vetor tangente à linha do universo, tendo
como condição que este vetor tangente uµ seja paralelamente transportando. A definição de geodésica é
então traduzida pela equação
∇~u~u = ∇u uµ = 0 .
Observe que em um referencial local de Lorentz estas linhas são realmente retas. Para as componentes do
vetor temos,
uβ ∇β uµ = uβ ∂β uµ + Γµαβ uα uβ = 0
µ
Sendo s o parâmetro da curva, então uµ = dx β d
ds e u ∂β = ds . Logo,
d dxµ dxα dxβ
+ Γµαβ = 0.
ds ds ds ds
Se s é um parâmetro afim, tendo ds = cdτ , temos que τ também é um parâmetro afim e reescrevemos a
equação da geodésica como
d 2 xµ α
µ dx dx
β
+ Γ αβ dτ dτ = 0 . (17.48)
dτ 2
“Z_2” — 2017/9/5 — 8:19 — page 502 — #522
Geodésica dos Fótons Para os fótons, o tempo próprio τ não pode ser usado para parametrizar sua linha
do universo, uma vez que dτ para um fóton é zero. Precisamos encontrar alguma outra maneira de parame-
trizar a linha do universo do fóton, por exemplo, uma coordenada angular ao longo da trajetória, de modo
que, em relação a este novo parâmetro, digamos λ, a equação da geodésica estará satisfeita, i.e.,
d 2 xµ α
µ dx dx
β
+ Γ αβ dλ dλ = 0 . (17.49)
dλ2
Aqui, naturalmente λ é conhecido como o parâmetro afim.
Observação final do capítulo Descrevemos os conceitos gerais da relatividade geral passando pelo prin-
cípio de equivalência, fraco e forte; fundamentos matemáticos tais como variedades, espaços curvos,
leis de transformações para vetores, covetores e 1-formas, derivada covariante e conceitos básicos de
geodésica. Com isto estamos aptos à continuar o desenvolvimento da relatividade geral, culminando
com as equações de Einstein e soluções.
Problemas
17.1 Faça um estudo dos principais experimentos para comprovação do princípio de equivalência fraco.
∂x′ ν ∂x′ σ
17.2 Mostre que g′ νσ = ∂xµ ∂xλ gµλ . Sugestão: Consulte o livro dos Profs. Landau e Lifshitz [49].
17.3 Mostre que a derivada covariante de um tensor tipo (p, q) é um tensor tipo (p, q + 1).
17.5 Deduzir a regra de derivação de um vetor covariante a partir do escalar X i Xi , em que X i é um vetor
arbitrário.
17.6 Mostre explicitamente que podemos obter a conexão simétrica de um espaço de Riemann comple-
tamente em função da geometria permutando os índices da relação ∇γ gαβ = 0, i.e., obtendo uma
expressão para os símbolos de Christoffel em termos da métrica e suas derivadas parciais
1 il
Γijk = g glj , k + glk , j − gjk , l .
2
17.7 Considerando um caminho no espaço, do ponto A até o ponto B, parametrizada pelo parâmetro con-
tinuo s, ou seja, ~x(s) tais que ~x(A) = ~xA e ~x(B) = ~xB . O comprimento dado pela integral entre o
ponto A e o ponto B é
Z B 1
dxi dxj 2
L[~x] = gij ds .
A ds ds
Encontre a equação da geodésica para este problema.
17.8 A métrica de uma esfera S 2 de raio a é dada por ds2 = a2 (dθ 2 + sen2 θdφ2 ). Calcular Rbcd
a , R e R.
ab
Leitura Recomendada
Solicita-se ao leitor que estude, em paralelo à leitura deste texto, os seguintes livros:
Nestes livros, o leitor encontrará deduções detalhadas e claras das ferramentas matemáticas necessárias para
a relatividade geral. O magnífico livro dos Profs. Landau e Lifshitz é um clássico da literatura, escrito de
forma elegante e plenamente compreensível. O texto dos Profs. Einstein, Lorentz, Minkowski e Weyl trazem
os trabalhos originais sobre a relatividade. Finalmente os livros dos Profs. Hobson, Efstathiou e Lasenby e
do Prof. Schutz são textos modernos e bem detalhados.
“Z_2” — 2017/9/5 — 8:19 — page 504 — #524
Capítulo 18
Curvatura do Espaço-Tempo e Equações de
Einstein
As equações de campo de Einstein são a generalização relativista da lei da gravitação de Newton. A visão
de Einstein, com base na igualdade de massas de inércia e gravitacional, foi a de que não existe qualquer
força gravitacional em tudo. O que está se dizendo é: o movimento de partículas sob a influência da força
gravitacional na teoria newtoniana, está de acordo com a teoria da relatividade geral, i.e., temos o movi-
mento livre ao longo das curvas geodésicas em um espaço-tempo curvo. A lei gravitacional de Newton diz
como a massa gera a força gravitacional. Einstein exigiu de suas equações de campo que o espaço-tempo
dirá a matéria como se mover e a matéria dirá ao espaço-tempo como se curvar.
Tendo em vista nossa discussão, realizada no capítulo anterior, escolheremos primeiramente o terceiro mé-
todo para derivar R, embora haja similaridade matemáticas entre os três métodos. Além disso, o primeiro
método tem uma representação pictórica particularmente simples. A Fig. 18.1 mostra o resultado do trans-
porte paralelo ao redor de um triângulo fechado. A parte (a) da figura, mostra uma superfície plana de
curvatura zero; em que o vetor é transportado paralelamente de A para B para C e, em seguida, de volta
para ao ponto A, o vetor final é paralelo ao original. A parte (b) da figura, mostra uma superfície esférica
de curvatura positiva; em que o vetor é transportado paralelamente de A para B para C e, em seguida, de
volta para ao ponto A, o vetor final não é paralelo ao original. Podemos expressar a variação nos componen-
tes do vetor, após o transporte em torno do circuito fechado, em termos do tensor de Riemann-Christoffel.
Finalmente, usaremos o segundo método, para derivar R, para uma comparação com o terceiro método.
504
“Z_2” — 2017/9/5 — 8:19 — page 505 — #525
Figura 18.1 Transporte paralelo de um vetor ao redor de um circuito fechado em um espaço plano (a)
e em um espaço curvo (b).
Aceleração do Desvio Geodésico Para ver como podemos derivar o tensor de Riemann-Christoffel via
terceiro método, considere duas partículas de teste, identificada respectivamente como 1 e 2, que se move
ao longo de geodésicas próximas. Denotamos ξ µ (τ ) a separação infinitesimal das partículas em um tempo
próprio τ , então
xµ2 (τ ) = xµ1 (τ ) + ξ µ (τ ) . (18.1)
Agora a linha do universo de cada partícula é descrita pelo equação da geodésica, i.e.,
Subtraindo a Eq. (18.2) da Eq. (18.3), substituindo os termos a partir da Eq. (18.4) e mantendo apenas termos
até primeira ordem em ξ produzimos a seguinte equação para a aceleração de ξ µ , nota-se que desaparece o
subscrito 1 da equação.
d2 ξ µ µ α dξ
β
µ β dξ
α
2
+ Γ αβ v + Γ αβ v + Γµαβ ξ γ v α v β = 0 , (18.5)
dτ dτ dτ ,γ
α
em que usamos o fato de que v α ≡ dx
dτ .
A Eq. (18.5) não é uma equação tensorial, desde que os símbolos de Christoffel e suas derivadas não
se transformam como tensores. Entretanto, podemos desenvolver a expressão covariante correspondente,
tomando as derivadas covariantes do desvio geodésico. Para este fim, considere a derivada covariante de
um campo vetorial geral A~ ao longo de uma geodésica com vetor tangente ~v ≡ d~x . Escrevemos esta
dτ
~ ou na forma de componente, introduzindo o operador covariante D ,
~ ~v A,
derivada covariante como ∇ Dτ
Agora, considere a segunda derivada covariante do desvio geodésico, avaliada ao longo da geodésica se-
guida pela partícula de teste 1. A partir da Eq. (18.6), em forma de componentes, temos
Dξ µ dξ µ dxβ
= + Γµαβ ξ α . (18.7)
Dτ dτ dτ
Segue-se então que,
D2 ξ µ D Dξ µ d Dξ µ µ Dξ
σ
δ
= = + Γ σδ Dτ v . (18.8)
Dτ 2 Dτ Dτ dτ Dτ
Dξ µ
Substituindo novamente por Dτ obtemos
D2 ξ µ d dξ µ dξ σ
= + Γµαβ ξ α v β + Γµσδ + Γσαβ ξ α v β vδ . (18.9)
Dτ 2 dτ dτ dτ
d µ α β dxγ α β dξ α β dv β
Γαβ ξ v = Γµαβ ξ v + Γµαβ v + Γµαβ ξ α . (18.10)
dτ , γ dτ dτ dτ
Desde que a linha do universo de cada partícula é uma geodésica, também sabemos que
dv β d 2 xβ
= = −Γβσδ v σ v δ , (18.11)
dτ dτ 2
β
em que escrevemos v β = dxdτ .
Substituindo as Eqs. (18.10) e (18.11) na Eq. (18.9) e permutando alguns índices repetidos, obtemos
D2 ξ µ d2 ξ µ µ γ α β µ dξ
α
β µ dξ
σ
δ
= + Γ αβ , γ v ξ v + Γ αβ dτ v + Γ σδ dτ v
Dτ 2 dτ 2
+ Γµβδ Γβασ − Γµαβ Γβαδ v σ v δ ξ α . (18.12)
D2 ξ µ µ
= Rαβγ vα vβ ξ γ , (18.13)
Dτ 2
em que
µ
Rαβγ = Γσαγ Γµσβ − Γσαβ Γµσγ + Γµαγ , β − Γµαβ . (18.14)
,γ
A Eq. (18.13) é a equação do desvio geodésico. O desvio geodésico é a manifestação física das forças de
maré. Esta equação torna explicito o fato de que as forças de maré são descritas, em relatividade geral, pelo
tensor de curvatura.
d ~ ~
U β ∇β V µ = 0 ↔ V = ∇U
~ V = 0,
dλ
A expressão final é um sistema invariante, e A era um ponto arbitrário, por isso temos, de qualquer
forma,
∇~v ∇~v ξ α = Rµνβ
α
vµ vν ξ β .
O tensor (1, 3), R, nas Eqs. (18.13)-(18.15) é o tensor de Riemann-Christoffel. Este é um tensor de quarta
ordem com 256 componentes, embora as simetrias inerente a qualquer exemplo astrofísico reduzem signi-
ficativamente o número de componentes independentes.
Uma variedade plana, i.e., o espaço-tempo plano, é aquela que tem uma definição global de paralelismo.
Isto significa claramente que
µ
Rαβγ = 0, (18.16)
ou seja, todos os componentes do tensor de Riemann-Christoffel são identicamente zero. Então da Eq.
(18.15), vimos que a aceleração do desvio geodésico é identicamente zero, i.e., a separação entre geodésicas
vizinhas permanece constante. No entanto, por outro lado, se o espaço-tempo é curvo, então, a separação
geodésica muda ao longo da linha do universo das partículas vizinhas.
Comutador da derivada covariante Para derivar o tensor de Riemann-Christoffel, podemos usar também
o comutador da derivada covariante. Assim, mostrando que, em geral,
[∇β , ∇γ ] v µ = (∇β ∇γ − ∇γ ∇β ) v µ 6= 0 .
“Z_2” — 2017/9/5 — 8:19 — page 508 — #528
Logo,
∇β (∇γ v µ ) = ∂α ∂γ v µ + Γµαγ v α + Γµδβ ∂γ v δ + Γδαγ v α − Γδγβ ∂δ v µ + Γµαδ v α ,
subtraindo as duas últimas relações, a segunda da primeira, tendo em conta que ∂µ ∂β = ∂β ∂µ e que
a conexão é simétrica nos índices de baixo, encontramos
(∇β ∇γ − ∇γ ∇β ) v µ = ∂β Γµαγ − ∂γ Γµαβ + Γµδβ Γδαγ − Γµδγ Γδαβ v α
ou
1 µ
∇[β ∇γ] v µ = R vα ,
2 αβγ
sendo que
µ
Rαβγ = ∂β Γµαγ − ∂γ Γµαβ + Γµδβ Γδαγ − Γµδγ Γδαβ
1
é o tensor de Riemann-Christoffel e ∇[β ∇γ] = 2 (∇β ∇γ − ∇γ ∇β ). Na Fig. 18.2, partindo do ponto
Figura 18.2 Transporte de um vetor entre dois pontos próximos, seguindo percursos diferentes.
p calculemos a variação que se obtém ao levar um vetor v µ de p(xµ ) até ao ponto de coordenadas
xµ + δxµ + dxµ , seguindo dois percursos diferentes.2 Para o percurso (a):
com
δv µ = −Γµαβ (x) v α (x) δxβ .
Mas,
v µ (x + δx) → v µ (x + δx + dxµ ) = v µ (x + δx) + δv µ (x + δx) ,
com os termos do lado direito dados por
e
v µ (x + δx) = v µ (x) − Γµαβ (x) v α (x) δxβ .
Oras, temos ainda
Γµαβ (x + δx) = Γµαβ (x) + δxγ ∂γ Γµαβ (x)
e
v α (x + δx) = v α (x) − Γαδσ (x) v δ (x) δxσ .
Com estas duas expansões, podemos reescrever δv µ (x + δx) como,
δv µ (x + δx) = − Γµαβ + δxγ ∂γ Γµαβ v α − Γαδσ v δ δxσ dxβ
= −Γµαβ v α dxβ − ∂γ Γµαβ v α dxβ δxγ + Γµαβ Γαδσ v δ δxσ dxβ + · · ·
com o lado direito calculado no ponto p(xµ ). A expressão para v µ (x + δx + dx), desprezando termos
de ordem superior, vem dada por
v µ (x + δx + dx) = v µ − Γµαβ v α δxβ − Γµαβ v α dxβ − ∂γ Γµαβ v α dxβ δxγ + Γµαβ Γαδσ v δ δxσ dxβ .
Para o percurso (b): O cálculo é efetuado da mesma maneira e v µ (x + δx + dx) será obtido trocando
entre si, na expressão anterior, os elementos dx e δx, i.e.,
v µ (x + dx + δx) = v µ − Γµαβ v α dxβ − Γµαβ v α δxβ − ∂γ Γµαβ v α δxβ dxγ + Γµαβ Γαδσ v δ dxσ δxβ .
∆v µ = v µ (x + δx + dx) − v µ (x + dx + δx)
= ∂γ Γµαβ − ∂β Γµαβ + Γµδγ Γδαβ − Γµδβ Γδαγ v α δxβ dxγ
µ µ
= Rαγβ v α δxβ dxγ = −Rαβγ v α δxβ dxγ ,
em que o elemento de área tensorial definido pelos dois percursos, (a) e (b), é dado por
As Eqs. (18.13) e (18.15) são de fundamental importância na relatividade geral. Em certo sentido, elas são
as expressões matemáticas corretamente covariantes da idéia física encarnada na frase de Wheeler, espaço-
-tempo diz à matéria como se mover. Embora derivamos estas equações, considerando as geodésicas nas
vizinhas de partículas materiais, podemos aplicá-las igualmente para determinar como as mudanças na cur-
vatura do espaço-tempo vai influenciar o desvio geodésico de fótons. No caso da Eq. (18.13), simplesmente
precisamos substituir o tempo próprio τ ao longo da geodésia por outro parâmetro afim adequado λ, e,
α
naturalmente também substituir v α por dx
dλ . Caso contrário, a forma da Eq. (18.13) mantém-se inalterada.
A segunda parte da frase de Wheeler, a matéria diz ao espaço-tempo como se curvar, tem a sua perso-
nificação matemática nas equações de Einstein, na qual relacionam o tensor de Einstein, e, portanto, como
veremos, implicitamente o tensor de Riemann-Christoffel, ao tensor energia-momentum.
“Z_2” — 2017/9/5 — 8:19 — page 510 — #530
em que, de agora em diante usaremos unidades tais que c = ~ = 1, muito comuns em física de altas energias
e em cosmologia.
3
B. Schutz, A first Course in General Relativity (2009).
“Z_2” — 2017/9/5 — 8:19 — page 511 — #531
Tensor energia-momentum com pressão nula Trata-se de matéria incoerente ou poeira, um fluido cujas
partículas constituintes não interagem entre si e cuja pressão, em termos energéticos, é desprezível, i.e.,
p = 0. Representamos a densidade própria do fluido, aquela medida por um observador em comovimento,
por ρ0 (x). As partículas seguem trajetórias xµ (τ ), em que τ é o tempo próprio ao longo da linha do universo
µ
da partícula e a velocidade é dada por uµ = dx dτ , que será tangente à trajetória da partícula.
O tensor energia-momentum é um tensor de segunda ordem e simétrico. O tensor mais simples com
estas características formado a partir dos dados que temos, uµ e ρ0 , será da forma
T µν = ρ0 uµ uν . (18.17)
Analisemos, primeiro, o que se passa num espaço de Minkowski, na ausência de efeitos gravitacionais,
uµ = γ 1, v i , ηµν uµ uν = 1 ,
dτ 2 = ds2 = dt2 (1 − v 2 ) .
Logo,
2
00 0 0 dx0 dx0 dt
T = ρ0 u u = ρ0 = ρ0 = γ 2 ρ0 = ρ , (18.18)
dτ dτ dτ
em que ρ é a densidade de energia medida por um observador em relação ao qual a poeira se move com ve-
locidade ~v. A interpretação desta última igualdade é simples, os dois fatores γ são devidos, um ao aumento
da inércia e o outro à contração do volume provocada pela velocidade da poeira. Analogamente temos,
T 0i = ρ v i e T ij = ρ v i v j ,
em que, o significado físico destas componente são: T 00 é a densidade de energia das partículas, T 0i e
T i0 são o fluxo de energia e a densidade de momentum, respectivamente, na direção i, e, finalmente T ij
representa a taxa de fluxo da componente i do momentum por unidade de área na direção j.
Imponhamos a lei de conservação ∂ν T µν = 0. Quando µ = 0,
∂ 00 ∂ ∂ρ ∂
∂ν T 0ν = T + i T 0i = + i (ρ v i ) = 0 ,
∂t ∂x ∂t ∂x
ou
∂ρ ~
+ ∇ · (ρ~v) = 0 , (18.19)
∂t
que reconhecemos como a equação de continuidade, i.e., a conservação da energia. Quando µ = i,
∂ i0 ∂ ∂ ∂
∂ν T iν = T + j T ij = (ρ v i ) + j (ρ v i v j )
∂t ∂x ∂t
i∂x
∂ρ ∂ ∂v i
i j j ∂v
=v + j (ρ v ) + ρ +v = 0.
∂t ∂x ∂t ∂xj
A primeira parcela nos dá a equação de continuidade que é nula. Assim, escrevemos a relação anterior na
forma vetorial como
∂~v ~
ρ + ~v · ∇ ~v = 0 , (18.20)
∂t
que é a equação de Navier-Stokes4 para um fluido perfeito na ausência de pressões e forças externas.
4
Claude Louis Marie Henri Navier (1785-1836), físico e engenheiro francês.
“Z_2” — 2017/9/5 — 8:19 — page 512 — #532
A escolha feita para T µν parece estar correta e podemos generalizar da forma mais simples, atendendo
aos princípios de correspondência e de acoplamento mínimo,
T µν = ρ0 uµ uν
e
∇ν T µν = 0 ,
em que uµ é a quadrivelocidade normalizada de forma que
gµν uµ uν = 1 .
uµ uµ = 1 → uµ ∇ν uµ = 0 ,
vem que
∇ν (ρ0 uν ) = 0 .
Portanto, tiramos que
uν ∇ν uµ = 0 ,
na qual significa que o vetor uµ é tangente a uma geodésica. Assim, da lei de conservação deduzimos que o
movimento se faz ao longo de uma geodésica. Provamos isto num caso particular, mas pode-se mostrar que
de ∇ν T µν = 0 resulta que o movimento de corpos sob ação de um campo gravitacional segue as equações
das geodésicas.
Tensor energia-momentum, fluido perfeito com pressão Para construir o tensor energia-momentum de
µ
um fluido perfeito com pressão, temos a nossa disposição as quantidades uµ = dx dτ , ρ0 (x) e a pressão p(x).
Naturalmente, o tensor T µν , para este caso, deverá se reduzir ao caso anterior em que p = 0.
Este caso é apenas um pouco menos simples do que o caso da poeira. Novamente a componente T 00 é
igual a densidade de energia ρ. Uma vez que não existe movimento de grandes quantidades do elemento de
fluido e não existe condução de calor para um fluido perfeito, o fluxo de energia T 0i = 0 para i = 1, 2, 3.
Entretanto, pela simetria de T temos que a densidade de momentum T i0 = 0 para i = 1, 2, 3. Para as
componentes espaciais, T ij = 0 se i 6= j, uma vez que estes termos correspondem às forças viscosas
paralelas à interface entre os elementos de fluido e estas forças são zero para um fluido perfeito. Então, T ij
é uma matriz diagonal. Mas T ij deve ser diagonal em todos os sistemas de referência, por exemplo, em
todas as possíveis rotações. Isto é possível somente se T ij for um escalar múltiplo da matriz identidade, i.e.,
T 11 = T 22 = T 33 . Então, T ii é o fluxo da i-ésima componente do momentum na direção i, perpendicular à
interface do elemento de fluido, i.e., equivalente à força por unidade de área perpendicular à interface. Isto
é nada mais do que a pressão p exercida pelos movimentos aleatórios de partículas no elemento de fluido.
Assim, podemos escrever T como
ρ 0 0 0
0 p 0 0
T = T µν = 0 0 p 0 .
(18.21)
0 0 0 p
“Z_2” — 2017/9/5 — 8:19 — page 513 — #533
T µν = ρ0 uµ uν + p (a uµ uν + b η µν ) = (ρ0 + ap) uµ uν + bp η µν .
T µν = (ρ0 + p) uµ uν − p η µν , (18.22)
que pode ser traduzido da mesma forma para uma métrica genérica, pela prescrição do acoplamento mínimo:
em que uµ = gµν uν .
A conservação de energia e momentum requer que
∂µ T µν = 0 , i.e., T µν , µ = 0 . (18.24)
Ou seja, a divergência do tensor energia-momentum é igual à zero. Para mostrar a consequência disto fare-
mos,
1 = uν uν ⇒ 0 = ∂µ (uν uν ) = 2(∂µ uν ) uν .
que é a equação de continuidade para fluidos perfeitos relativísticos. Para encontrar o conteúdo da lei de
conservação ⊥ a uν , subtraímos uν vezes (18.26) da Eq. (18.25). Assim,
0 = (ρ0 + p) uµ ∂µ uν − ∂µ p (η µν − uµ uν )
⇒
(ρ0 + p) u ∂µ uν = (η µν − uµ uν ) ∂µ p ,
µ
(18.27)
que é a equação de movimento para fluidos perfeitos relativísticos. Estes resultados, (18.26) e (18.27), são
respectivamente as componentes de ∇µ T µν paralelas e perpendiculares a uν e nos assegura a validade da lei
proposta pela divergência nula do tensor energia-momentum. No limite não relativístico, p ≪ ρ0 e v ≪ c,
essas equações se reduzem a:
∂ρ ~
+ ∇ · (ρ~v) = 0
∂t
(18.28)
∂~v ~ v ~ ,
ρ + (~v · ∇)~ = −∇p
∂t
“Z_2” — 2017/9/5 — 8:19 — page 514 — #534
a primeira das equações acima é a conhecida equação da continuidade clássica e a segunda é conhecida
como equação de Euler, que rege o comportamento de um fluido perfeito. Como se vê, ambas são con-
sequência direta da lei de conservação associada à simetria de mudança de coordenadas.
A Eq. (18.27) pode ser apresentada em uma forma mais intuitiva se reescrevermos o termo uµ ∂µ uν na
seguinte forma, ν
dxµ ∂ dx d dxν d 2 xν
uµ ∂µ uν = µ
= = .
dτ ∂x dτ dτ dτ dτ 2
Assim, substituindo em (18.27), temos
d 2 xν ∂p
(ρ0 + p) 2
= (η µν − uµ uν ) µ . (18.29)
dτ ∂x
∂p
Então, quando ∂x µ = 0, as partículas de fluido seguem as geodésicas. Em outras palavras, as partículas de
fluido seguem trajetórias que desviam das geodésicas sempre que houver um gradiente de pressão.
Por definição o tensor de Riemann é antissimétrico nos dois últimos índices. As suas propriedades restantes
de simetria dependem da escolha da conexão.
Para o caso de nossa conexão, estas propriedades são obtidas através da forma do tensor de Riemann
num referencial local de Lorentz, ou referencial inercial local. Assumimos inicialmente que em um ponto
P em um referencial inercial local, Γαµν (P ) = 0. Mas, mais importante, as suas derivadas Γαµν , α (P ) 6= 0,
i.e., em geral não são zero, uma vez que envolvem gαβ , γµ .5 Isto significa que, mesmo que as coordenadas
possam ser encontrados, na qual Γαµν = 0 num ponto, estes símbolos geralmente não desaparecem em outras
posições. Isto difere do espaço plano, em que existe um sistema de coordenadas na qual temos Γαµν = 0 em
todos os lugares. Usando
1
Γαµν = gαβ gβµ , ν + gβν , µ − gµν , β
2
temos
1
Γαµν , σ = gαβ gβµ , νσ + gβν , µσ − gµν , βσ . (18.30)
2
Desde que as derivadas segundas de gαβ não se anulam, para um ponto P temos,
1
α
Rβµν = gασ gσβ , νµ + gσν , βµ − gβν , σµ − gσβ , µν − gσµ , βν + gβµ , σν . (18.31)
2
Usando a simetria de gαβ e o fato de que gαβ , µν = gαβ , νµ , porque as derivadas parciais sempre comutam,
encontramos em P
α 1
Rβµν = gσσ gσν , βµ − gσµ , βν + gβµ , σν − gβν , σµ .
2
Se abaixarmos o índice α, obtemos, no sistema de coordenadas localmente plana em sua origem P ,
. λ 1
Rαβµν = gαλ Rβµν = gαν , βµ − gαµ , βν + gβµ , αν − gβν , αµ . (18.32)
2
5
A equivalência dessa notação é
gαβ , γµ = ∂µ ∂γ gαβ .
“Z_2” — 2017/9/5 — 8:19 — page 515 — #535
⇒
1
Rσναβ = gσβ , να − gσα , νβ + gνα , σβ − gνβ , σα .
2
Esta forma implica as seguintes relações tensoriais e portanto são válidas em qualquer sistema de coorde-
nado, são antissimétrico na troca dos elementos do primeiro par de índices, são antissimétrico na troca dos
elementos do segundo par de índices e finalmente são simétricos na troca do primeiro par de índices pelo
segundo par de índices, i.e.,
que são as primeiras identidades de Bianchi.6 Para as demonstrar basta expandir a última equação em
termos de (18.32). Existem também as segundas identidades de Bianchi:
obedece ainda a
ν ν
pµ ; αβ − pµ ; βα = Rµαβ pν ⇔ [Dβ , Dα ] pµ = −Rµβα pν , (18.36)
para um tensor (1, 1) arbitrário. A generalização para tensores de ordem mais elevada deverá ser óbvia. O
número de termos com o tensor de Riemann do lado direito é igual ao número de índices tensoriais.
Contrações não nulas do tensor de Riemann produzem o tensor de Ricci,7
µ
Rαβ = Rαµβ , (18.38)
que é um tensor simétrico na troca α ↔ β: Rαβ = Rβα e pode ser visto como o traço do tensor de Riemann.
O traço do tensor de Ricci, por sua vez, é o escalar de Ricci
Gµν ; ν = 0 , (18.41)
por virtude das segundas identidades de Bianchi. De fato, partindo da Eq. (18.35) e usando a condição
Rσµβν ; α = −Rσµνβ ; α
temos
Rσµνα ; β − Rσµνβ ; α + Rσµαβ ; ν = 0 .
Contraindo com gσν , encontramos
então
β β 1
2 Rα; β − R; α = 0 ⇒ Rα; β − R; α = 0 ,
2
portanto, esta equação pode reescrever-se como
β 1 β
Rα − gα R =0 ⇒ Gβα; β = 0 .
2 ;β
menos de quatro funções arbitrárias que manifestam a nossa completa liberdade em escolher o sistema de
coordenadas.
Nota-se ainda que, contraindo a Eq. (18.43) com gαβ , encontramos
1
gαβ Gαβ = R − × 4 × R = −8π T αβ gαβ .
2
1
Mas, temos que R − 2 × 4 × R = −R e também −8π T αβ gαβ = −8π T , isto implica em
1 1
Gαβ = Rαβ − gαβ R = Rαβ − gαβ (8π T ) . (18.44)
2 2
Logo as equações de Einstein (18.43) podem ser reescritas como
1
Rαβ = −8π Tαβ − gαβ T . (18.45)
2
Rαβ = 0 . (18.46)
Variedades que obedecem a esta restrição são conhecidas como variedades Ricci-planas.
∂v i ∂ξ i
= . (18.47)
∂s ∂t
Seja Φ o potencial gravitacional newtoniano, então a equação do movimento que origina as trajetórias
anteriores será:
∂v i
= −∇i Φ . (18.48)
∂t
Se s2 = s1 + δs, em que δs ≪ 1, temos
∂v i ∂v i ∂ 2 vi ∂v i ∂2ξi
≃ + δs = + δs .
∂t s2 ∂t s1 ∂t∂s s1 ∂t s1 ∂t2 s1
∂v i ∂v i
= − ∇i Φ|s1 e = − ∇i Φ|s2 .
∂t s1 ∂t s2
“Z_2” — 2017/9/5 — 8:19 — page 518 — #538
∂v i ∂
= − ∇i Φ|s1 + (−∇i Φ) δs ,
∂t s2 ∂s
∂
em que ∂s (−∇i Φ) δs = −ξ j ∇j ∇i Φ δs. Comparando as três últimas expressões, obtemos
∂2ξi
= −ξ j ∇j ∇i Φ (18.49)
∂t2
≡ −Eji ξ j , para i = 1, 2, 3 ,
Eij = ∇j ∇i Φ . (18.50)
A Eq. (18.49) pode ser comparada com a equação de desvio geodésico para uma variedade riemanniana
dada em (18.13)
D 2 δxµ µ
= −Rγρβ ẋγ ẋβ δxρ (18.51)
Dτ 2
= −Eρµ δxρ , para µ = 0, 1, 2, 3 ,
em que introduzimos aqui o tensor de marés elétrico, ou parte elétrica do tensor de Riemann
µ
Eρµ = Rγρβ ẋγ ẋβ . (18.52)
Dado que δxµ e ξ i desempenham papeis semelhantes nas duas análises, podemos concluir que o papel de-
α ẋµ ẋγ ,
sempenhado pela matriz da derivada segunda de Φ é análogo ao desempenhado pela contração Rµβγ
µ
expressando em termos da quadrivelocidade, ẋ = u :µ
Nota-se que Eij e Eαβ são tensores simétricos, o primeiro em um espaço plano tridimensional, enquanto o
segundo em uma variedade riemanniana arbitrária quadridimensional.
“Z_2” — 2017/9/5 — 8:19 — page 519 — #539
Dadas as observações anteriores podemos lançar um novo olhar sobre a equação do campo de gravitação
newtoniano, i.e., a equação de Poisson que obedece o potencial de Newton,
~ 2 Φ = 4π G ρ .
∇
Esta equação relaciona o traço do tensor de marés newtoniano Eij com a densidade de matéria ρ. Portanto,
na gravitação newtoniana, a estrutura das equações de campo revela a relação fundamental entre as fontes do
campo e o tensor de marés. A tentativa de construir uma teoria covariante baseada num princípio semelhante
sugere imediatamente que as equações de campo da relatividade geral devem relacionar o traço de Eαβ ,
α
Rµαν uµ uν = Rµν uµ uν ,
que é o tensor de Ricci visto por um observador com quadrivelocidade uµ , com a densidade de maté-
ria/energia vista pelo mesmo observador que é
ρ = Tµν uµ uν .
Portanto, baseados no princípio da relação entre tensor de marés e fontes, podemos esperar que as equações
da relatividade geral sejam,
Rµν uµ uν ∝ Tµν uµ uν , (18.53)
ou, como uµ é arbitrário,
Rµν = −κ Tµν , (18.54)
em que κ é uma constante a ser determinada no limite newtoniano. Entretanto, a relação (18.54) sofre de
um problema,
Tµν ; ν = 0 ⇒ Rµν ; ν = 0 . (18.55)
Mas pelas segundas identidades de Bianchi,
1
Rµν ; ν = gµν ∇ν R ,
2
o que implicaria que o escalar de Ricci deveria ser constante. Porém, se seguirmos a escolha de Einstein e
optarmos pelas equações
Gµν = −κ Tµν , (18.56)
então pelas segundas identidades de Bianchi Gµν ; ν = 0 e a conservação de energia, essa será equivalente a
uma identidade geométrica.
Podemos imediatamente deduzir o valor de κ. Como já vimos, a Eq. (18.56) implica
ρ 0 0 0
1 0 p 0 0
Rµν = −κ Tµν − gµν T , T ≡ Tµν gµν , Tµν = 0 0 p 0 .
2
0 0 0 p
A relatividade restrita nos ensina que T = ρ − (p1 + p2 + p3 ), em que (p1 , p2 , p3 ) são as pressões principais.
Contraindo a relação anterior com uµ uν , temos
κ
Eαα = − (ρ + p1 + p2 + p3 ) . (18.57)
2
No limite newtoniano as velocidades são pequenas, i.e., v ≪ c. Logo, nesse limite temos pi ≪ ρ. Então,
κ
Eαα ≃ − ρ . (18.58)
2
“Z_2” — 2017/9/5 — 8:19 — page 520 — #540
κ = 8π G ,
em que hµν ≪ 1 descreve uma pequena perturbação na métrica de Minkowski ηµν = diag(1, −1, −1, −1).
O limite de baixas velocidades, temos v ≪ c. A linha do universo da partícula teste, de massa unitária e
velocidade v, é dada em geral pela geodésica
d 2 xµ ν
µ dx dx
σ
+ Γ νσ = 0.
dτ 2 dτ dτ
dxi
Mas, temos v ≪ c, i.e., dt ≪ c, com i = 1, 2, 3, isso é equivalente à
dxi dx0
≪ .
dt dτ
Então, podemos ignorar os termos das velocidades na equação geodésica para obter
2
d 2 xµ µ 2 dt
2
+ Γ00 c = 0. (18.61)
dτ dτ
Recorrendo a Eq. (17.47) dando a conexão em termos da métrica
1 ad
Γabc = g gdc , b + gbd , c − gbc , d
2
“Z_2” — 2017/9/5 — 8:19 — page 521 — #541
e utilizando o fórmula dada em (18.60) para gµν , encontraremos os coeficientes da conexão Γµ00 dados por
1 µκ 1 1
Γµ00 =g g0κ , 0 + g0κ , 0 − g00 , κ = − gµκ g00 , κ = − η µκ h00, κ .
2 2 2
Desde que assumamos que a métrica seja estacionária, temos
1
Γ000 = 0 e Γi00 = − c2 η ij h00, j .
2
Sendo η ij = diag(−1, −1, −1), usando o resultado anterior na Eq. (18.61), encontramos
d 2 xi 1 2 ∂h00 d2~x 1 ~
2
= − c i
ou 2
= − c2 ∇h 00 , (18.62)
dt 2 ∂x dt 2
em que a última equação está na forma vetorial.
Se compararmos esta equação com a usual equação newtoniana para o movimento de uma partícula na
presença de um campo gravitacional, i.e.,
d 2 xi ∂Φ d2~x ~ ,
2
=− i ou = −∇Φ
dt ∂x dt2
2Φ
identificamos h00 = c2
. Portanto, no limite newtoniano, temos
2Φ
g00 = 1 + 2 . (18.63)
c
Este resultado contém em si algo de muito importante, pois mostra-nos que os coeficientes da métrica
nos aparecem como generalizações do potencial de Newton, como grandezas simultaneamente físicas e
geométricas. A compreensão deste fato desempenhou um importante papel no trabalho de Einstein.
Dedução das Equações de Einstein Em um campo estático fraco produzido por uma densidade de massa
não relativística ρ, a componente tempo-tempo do tensor métrico é aproximadamente dado por (18.63), i.e.,
g00 = (1 + 2 Φ), em que Φ é o potencial newtoniano, determinado pela equação de Poisson
~ 2 Φ = 4π G ρ .
∇
A densidade de energia T00 para matéria não relativística é igual a sua densidade de massa,
T00 = ρ .
Combinando estas ideias, temos
~ 2 g00 = 8π G T00 .
∇ (18.64)
Esta equação de campo serve apenas para campos estáticos fracos gerados pela matéria não relativística, e
nem é sequer invariante de Lorentz. Porém a Eq. (18.64) mostra que as equações de campo fraco para uma
distribuição geral Tαβ de energia e momentum tomam a forma de
Kµν = 8π G Tµν , (18.65)
em que Kµν é uma combinação linear da métrica e suas primeiras derivadas. Segue-se do princípio de
equivalência que as equações que governam os campos gravitacionais de uma força arbitrária devem ter a
forma da Eq. (18.59), i.e.,
Gµν = −8π G Tµν ,
em que Gµν é um tensor que se reduz a Kµν para campos fracos.
O tensor Kµν é um tensor de segunda ordem relacionado com a curvatura do espaço-tempo. Uma
vez que a curvatura do espaço-tempo é expressa pelo tensor de curvatura Rµνσρ , o tensor Kµν deve ser
construído a partir de Rµνσρ e do tensor métrico gµν . Além disso, Kµν deve ter as seguintes propriedades:
“Z_2” — 2017/9/5 — 8:19 — page 522 — #542
b) O limite newtoniano sugere que Kµν deve conter termos não superiores ao linear nas derivadas de
segunda ordem do tensor métrico, i.e., ter apenas termos com N = 2 derivadas da métrica;
A propriedade de antissimetria do tensor de curvatura Rµνσρ diz que só há dois tensores que podem ser
formados pela contração de Rµνσρ , que são o tensor de Ricci e o escalar de curvatura. Além disso, tensor
de curvatura Rµνσρ é linear na derivada segunda da métrica, e, por isso a forma mais geral de Kµν que
satisfaz b) e c) será
Kµν = a Rµν + b R gµν + Λ gµν , (18.66)
em que Rµν é o tensor de Ricci, R é o escalar de curvatura ou escalar de Ricci e a, b e Λ são constantes.
Vamos considerar as constantes a, b e Λ. Primeiro, se considerarmos que cada termo de Kµν é linear na
derivada segunda de gµν , temos imediatamente que Λ = 0. Vamos relaxar esta condição depois, mas para o
momento temos
Kµν = a Rµν + b R gµν .
Pela propriedade d) encontramos
∇µ K µν = ∇µ (a Rµν + b R gµν ) = 0 .
Da equação anterior, temos duas possibilidades: ou b = − a2 ou R; ν vai a zero em qualquer lugar. Rejeita-se
a segunda possibilidade, já que
temos
Kµµ = (a + 4b) R = 8π G Tµµ .
∂R ∂T µ µ
Mas, se R; ν ≡ ∂x ν vai a zero, então ∂xν também deve ir a zero, que é o próprio caso da presença de matéria
Para corrigir a constante a, devemos comparar o limite fraco de campo destas equações com a equação
de Poisson na gravidade newtoniana. A comparação é apresentado na próxima seção, em que mostraremos
que, por coerência com a teoria newtoniana, a = −1 e assim
1
Rµν − gµν R = −κ Tµν , (18.67)
2
“Z_2” — 2017/9/5 — 8:19 — page 523 — #543
O Limite de Campo Fraco Para determinar o limite de campo fraco, diretamente das equações de Eins-
tein, vamos considerar as componente 00 a partir da Eq. (18.68). Assim,
1
R00 = −κ T00 − T g00 . (18.70)
2
Na aproximação deste limite, gµν = ηµν + hµν , em que hµν ≪ 1, g00 ≈ 1. Além disso, a partir da definição
do tensor de curvatura, temos
R00 = ∂0 Γµ0µ − ∂µ Γµ00 + Γν0µ Γµν0 − Γν00 Γµνµ .
No nosso sistema de coordenadas os Γµνσ são pequenos, assim podemos negligenciar os dois últimos termos
de primeira ordem em hµν . Também utilizando o fato de que a métrica é estacionária no nosso sistema de
coordenadas, então temos
R00 ≈ −∂i Γi00 .
1
De nossa discussão anterior, sabemos que Γi00 = 2 δij ∂j h00 para primeira ordem de hµν . Então,
1
R00 ≈ − δij ∂j h00 ,
2
no que implica em
1 ij 1
δ ∂i ∂j h00 ≈ κ T00 − T . (18.71)
2 2
Para prosseguir e por simplicidade, consideramos a matéria um fluido perfeito. A mais clássica das distri-
buições de matéria tem p ≪ ρ e para que possamos de fato ter o tensor energia-momentum como sendo de
poeira, temos
Tµν = ρ uµ uν ,
em que T = ρ. Sendo a velocidade u de nosso sistema de coordenada muito pequena comparada com c,
faremos a aproximação γµ ≈ 1 e, por conseguinte u0 ≈ c. Logo, da Eq. (18.71), temos
1 ij 1
δ ∂i ∂j h00 ≈ κ ρ ,
2 2
~ 2 . Além disso, temos h00 = 2 Φ, em que Φ é o potencial gravitacional.
em que, identificamos δij ∂i ∂j = ∇
Lembrando que κ = 8π G, finalmente obtemos
~ 2 Φ ≈ 4π G ρ ,
∇
na qual é a equação de Poisson na gravidade newtoniana. Esta identificação verifica nossa afirmação anterior
de que a = −1 na derivação das equações de Einstein.
“Z_2” — 2017/9/5 — 8:19 — page 524 — #544
1
Rµν − gµν R = −κ Tµν , (18.72)
2
em que κ = 8π G ou κ = 8π G/c2 , não são únicas. Einstein rapidamente descobriu que é impossível
construir um modelo estático do universo com base das equações de campo. Estas equações sempre produ-
zem soluções que correspondem a uma expansão ou contração do universo. Quando Einstein realizou este
trabalho em 1916, só a nossa Via Láctea era conhecida, que se assemelha a uma distribuição uniforme das
estrelas fixas. Com a introdução de uma constante cosmológica Λ, Einstein era capaz de criar modelos es-
táticos do universo, mais tarde todas estas soluções acabaram sendo instáveis. Posteriormente, descobriu-se
que a Via Láctea é apenas uma das muitas galáxias, enquanto que, em 1929, Hubble10 descobriu a expansão
do universo. Ele determinou distâncias e o desvio para o vermelho, i.e., redshifted de galáxias vizinhas e
concluiu que o universo está se expandindo. 11 A constante cosmológica parecia desnecessário. Se Einstein
tivesse colocado mais confiança em suas equações, ele poderia ter previsto a expansão do universo! Hoje,
temos uma visão diferente sobre estas questões.
O que Einstein notou foi o seguinte, sendo ∇µ T µν = 0, isto requer que ∇µ K µν = 0, em adição,
encontra-se ∇µ gµν = 0. Assim, podemos adicionar qualquer múltiplo constante de gµν no lado esquerdo
de (18.72) e ainda obter um conjunto consistente de equações de campo. É comum designar este múltiplo
por Λ, de modo a que as equações de campo tornam-se
1
Rµν − gµν R + Λ gµν = −κ Tµν , (18.73)
2
em que Λ é a conhecida constante cosmológica. 12 Ao escrever novamente a Eq. (18.73), com índices mistos
e, em seguida, realizar uma contração, encontramos
R = κT + 4Λ.
Vamos realizar o mesmo procedimento do item anterior e obter as equações de campo no limite de campo
fraco para a gravitação newtoniana
∇~ 2 Φ = 4π G ρ − Λ c2 .
Imaginemos que uma certa substância exista com a equação curiosa de estado p = −ρ. Nunca encontramos
tal substância, uma vez que tem uma pressão negativa! O tensor energia-momentum desta substância é dado
por
Tµν = −p gµν = ρ gµν .
Aqui, notamos o seguinte: Em primeiro lugar, o tensor energia-momentum desta substância só depende do
tensor métrico, i.e., é uma propriedade do próprio vacuum e denotamos por ρ a densidade de energia do
vacuum.13 Em segundo lugar, a expressão de Tµν é idêntica à do termo da constante cosmológica na Eq.
(18.73). Podemos ver a constante cosmológica como uma constante universal que determina a densidade de
energia do vacuum,
Λ
ρvacuum = . (18.75)
8π G
Denotando o tensor energia-momentum do vacuum por Tµν vacuum = ρ
vacuum gµν , podemos escrever as equa-
ções de campo modificadas como
1 vacuum
Rµν − gµν R = −κ Tµν + Tµν ,
2
em que Tµν é o tensor energia-momentum da matéria ou da radiação presente.
Se este é o caso em que Λ 6= 0, então pelo menos ele deve ser pequeno o suficiente para que ρvacuum te-
nha efeitos gravitacionais desprezíveis, i.e., |ρvacuum | < ρmatéria , em situações em que a teoria da gravitação
newtoniana dá uma boa descrição dos dados. Sistemas com menores densidades em que as leis de New-
ton podem ser aplicadas, são pequenos aglomerados de galáxias. Desta forma podemos colocar o seguinte
limite
Λ
|ρvacuum | = ≤ ρcluster ∼ 10−26 g/cm3
8π G
para a grandeza do parâmetro cosmológico. É evidente que, se Λ for suficientemente pequeno, será com-
pletamente sem importância na escala de uma estrela. No entanto, ele não precisa ser insignificante em
comparação com a densidade média da matéria do universo como um todo, já que a maioria é constituída
de espaço vazio, e, em escalas muito grandes, pode ter efeitos importantes sobre a evolução da curvatura do
universo.
Como podemos calcular a densidade de energia do vacuum? Os cálculos mais simples somam sobre
todas as energias de ponto singular de todos os campos quânticos conhecidos na natureza. A resposta resul-
tante excede em cerca de 120 ordens de grandeza o limite superior de Λ por observações cosmológicas. 14
Isto não é compreendido e um princípio físico deve existir para fazer a constante cosmológica pequena. 15
Dados recentes indicam que a constante cosmológica não desaparece. As indicações mais fortes resultam
de medições de supernovas tipo Ia distantes,16 que indicam que a expansão do universo, nesse momento,
está acelerando. Isto está descrito na Fig. 18.4. Estes dados foram obtidos por Perlmutter17 e colaboradores
13
Vacuum - vácuo: na química, na física e na linguagem cotidiana, o vácuo é a ausência de matéria em uma certa região do espaço.
O vácuo perfeito, porém, não é possível na natureza, ainda que ocorram situações muito próximas dele, por exemplo, no espaço
intergaláctico.
14
Recentes medidas podem ser encontradas nos seguintes artigos: para Λ = 1, 7 × 10−121 Planck units, ver A. G. Riess et
al. (Supernova Search Team Collaboration), Astron. Journal 116, 1009 (1998) e S. Perlmutter et al. (Supernova Cosmology
Project Collaboration), Astrophysical Journal 517, 565 (1999); para o valor Λ ∼ t−2U = 1, 6 × 10
−122
Planck units, em que
60
tU ∼ 8 × 10 , ver J. Garriga and A. Vilenkin, Physical Review D77, 043526 (2008) e R. Bousso, B. Freivogel, S. Leichenauer
and V. Rosenhaus, Physical Review D83, 023525 (2011).
15
Para maiores detalhes ver J. D. Barrow and D. J. Shaw, General Relativity and Gravitation 43, 2555-2560 (2011).
16
Supernova tipo Ia é uma subcategoria das estrelas variáveis cataclísmicas, resultado de uma violenta explosão de uma estrela
anã branca. Uma anã branca é o resíduo de uma estrela que completou o seu ciclo de vida normal e cessou sua fusão nuclear.
Entretanto, anãs brancas do tipo comum de carbono-oxigênio são capazes de futuras reações de fusão, que liberam uma grande
quantidade de energia se sua temperatura estiver alta o suficiente.
“Z_2” — 2017/9/5 — 8:19 — page 526 — #546
Figura 18.4 História da expansão do universo. No passado, o efeito da densidade de massa era mais
importante do que o da constante cosmológica e isto atrasou a expansão do universo. No entanto,
quando o volume do universo aumenta, então a densidade diminui. O efeito da energia do vacuum
é constante. Quando o volume é suficientemente grande, então o universo se expandirá para
sempre.
a partir da metade dos anos 1990 no século passado. 18 Sem uma constante cosmológica, esperamos que
a força de atração entre toda a matéria no universo deva desacelerar a expansão e até mesmo levar a uma
contração do universo. No entanto, quando a constante cosmológica não é nula, então a pressão negativa do
vacuum pode causar a expansão do universo aumentando a aceleração.
Problemas
18.1 Mostre que as componentes do tensor energia-momentum de um fluido perfeito em seu sistema de
repouso instantâneo pode ser escrito como em (18.21):
T µν = (ρ + p) uµ uν − p η µν .
As componentes podem ser escritas em qualquer outra forma covariante?
18.2 Mostre que, para qualquer fluido,
uν ∇µ uν = 0 .
Assim, mostre que um fluido perfeito num campo gravitacional deve satisfazer as equações
∇µ (ρuµ ) + p ∇µ uµ = 0
17
Saul Perlmutter (1959- ), astrofísico americano.
18
S. Perlmutter, Physics Today 56, 53-60 (2003); Idem, Nobel Lecture, Measuring the Acceleration of the Cosmic Expansion
Using Supernovae, December 8 (2011).
“Z_2” — 2017/9/5 — 8:19 — page 527 — #547
e
(ρ + p) uµ ∇µ uν = (gµν − uµ uν ) ∇µ p .
Obter a equação de movimento para a linha do universo xµ (τ ) de uma partícula em um fluido perfeito
com pressão, e, portanto, mostre que a partícula é empurrada para fora das geodésicas pelo gradiente
de pressão.
18.3 Considere o tensor energia-momentum para um fluido perfeito, i.e., na ausência de viscosidades e de
condução de calor. Deduza as equações de conservação que se retiram de ∇ν T µν = 0, na presença de
um campo gravitacional e interprete-as.
18.5 Mostre que, se a única forma de energia numa região do espaço-tempo é a energia eletromagnética,
então a curvatura escalar é nula nesta região.
Leitura Recomendada
Solicita-se ao leitor que estude, paralelamente, os seguintes textos:
– R. D’Inverno [24];
– B. Schutz [70];
– M. P. Hobson, G. P. Efstathiou and A. N. Lasenby, [38].
Nestes livros, o leitor encontrará deduções detalhadas e claras das equações e dos tensores de Einstein, além
da discussão da constante cosmológica. Ainda recomenda-se fortemente, como requisito paralelo, a leitura
dos seguintes livros:
Capítulo 19
Abordagem Variacional e a Solução de
Schwarzschild
A maior parte da física clássica e quântica pode ser expressa em termos de princípios variacionais, e muitas
vezes, quando escrito desta forma é que o significado físico fica mais claramente compreendido. Além
disso, uma vez que uma teoria física tenha sido escrita como um princípio variacional, geralmente é fácil
identificar quantidades conservadas, ou simetrias do sistema de interesse, que de outra forma poderia ter sido
encontrado apenas com um esforço considerável. Por outro lado, ao exigir que o princípio variacional seja
invariante sob alguma simetria, garante que as equações de movimento derivadas por este princípio também
respeitam esta simetria. Neste capítulo, apresentaremos uma introdução desta ideia através do formalismo
lagrangiano, tendo como objetivo obter novamente as equações de campo da relatividade geral a partir desta
nova perspectiva. Feito isto, acharemos a solução de Schwarzschild e discutiremos os testes clássicos como:
a precessão do periélio de Mercúrio, a deflexão dos raios luminosos e o desvio para o vermelho de origem
gravitacional.
S = SEH + SM ,
em que SEH é a ação de Einstein-Hilbert e SM é a ação para matéria. Agora, consideremos uma região
espaço-tempo quadridimensional limitada, Ω, em que os campos de interesse são definidos. Logo, reescre-
vemos a ação S em termos das densidades lagrangianas individuais
Z Z
1 √ 4 √
S= R −g d x + LM (ψ, gµν ) −g d4 x , (19.1)
2κ Ω Ω
√ √
em que κ = 8π G, −g d4 x é o elemento invariante de volume, sendo −g uma densidade escalar de
peso unitário, L = R é a lagrangiana do campo gravitacional, para qual a densidade lagrangiana será
√
LEH = R −g e LM (ψi , gµν ) é a densidade lagrangiana da matéria que depende da métrica e de um conjunto
1
David Hilbert (1862-1943), matemático alemão.
528
“Z_2” — 2017/9/5 — 8:19 — page 529 — #549
de campos de matéria ψi . Segundo o princípio da mínima ação, S possui um máximo ou mínimo, tal que
δS = 0:
Primeiramente, iremos efetuar as variações na ação de Einstein-Hilbert, i.e., no primeiro termo da
Eq. (19.1). 2 Assim, vamos derivar as equações de campo correspondentes, considerando diretamente a
variação da ação resultante de uma variação no tensor métrico. Vamos, portanto, considerar uma variação
do tensor métrico dada por
gµν → gµν + δgµν ,
em que δgµν e sua derivada primeira se anulam no limite ∂Ω da região Ω. Este será útil também para
determinar a variação correspondente δgµν nas componentes métricas inversas. Isto é mais fácil conseguir
quando notamos que gµρ gρν = δνµ e utilizando o fato de que o tensor constante δνµ não muda sob uma
variação. Portanto, para primeira ordem na variação, podemos escrever
Multiplicando por gνσ , fazendo uma nova rotulagem dos índices e reorganizando, obtemos
Escrevendo o escalar de Ricci como R = gµν Rµν , a variação em primeira ordem da ação de Einstein-
-Hilbert (19.1) será
Z
1 √ √ √
δSEH = δgµν Rµν −g d4 x + gµν δRµν −g d4 x + gµν Rµν δ( −g) d4 x . (19.2)
2κ Ω
Para calcular as variações do escalar de Ricci calcula-se primeiro a variação do tensor de curvatura e a
variação do tensor de Ricci. O tensor de curvatura é definido como
Já que o tensor de curvatura depende apenas da conexão Γλµν , a variação do tensor de curvatura pode ser
calculado como,
δRρ σµν = ∂µ δΓρνσ − ∂ν δΓρµσ + δΓρµλ Γλνσ + Γρµλ δΓλνσ − δΓρνλ Γλµσ − Γρνλ δΓλµσ .
Agora temos δΓρνµ que é a diferença de duas conexões, aqui temos um tensor e pode-se calcular esse como
derivadas covariantes,
Observa-se agora que a expressão da variação do tensor de curvatura acima é igual à diferença de ambos os
termos,
δRρ µσν = ∇σ (δΓρµν ) − ∇ν (δΓρµσ ) . (19.3)
No entanto, vemos agora que as quantidades do lado direito são tensores e, portanto, a Eq. (19.3) mantém
não somente em coordenadas geodésicas no ponto P , mas em qualquer sistema de coordenadas arbitrárias.
Desde que o ponto P seja arbitrariamente escolhido, então o resultado (19.3) mantém a forma geral e é
2
A. Einstein, Preussische Akademie der Wissenschaften, Sitzungsberichte, 844-847 (1915); Idem, Annalen der Physik (ser. 4),
49, 769-822 (1916); Idem, 51, 639-642 (1916); Idem, Preussische Akademie der Wissenschaften, Sitzungsberichte, part 1, 688-
-696 (1916); Ibidem, part 2, 1111-1116 (1916); D. Hilbert, Nachrichten von der Königl. Gesellschaft der Wissenschaften und
der Universität zu Göttingenn Math-physik. Klasse, 395-407 (1915).
“Z_2” — 2017/9/5 — 8:19 — page 530 — #550
conhecida como a equação de Palatini.3 Agora pode-se obter a variação do tensor de curvatura de Ricci
simplesmente pela contração dos dois índices, ρ e σ, da variação do tensor de curvatura,
δRµν ≡ δRρ µρν = ∇ρ δΓρνµ − ∇ν δΓρρµ . (19.4)
√
A variação δ −g é obtida a partir da seguinte propriedade. Lembrando que g = det [gµν ], o cofator do
elemento gµν no determinante é g gµν . Assim,
em que na segunda igualdade usamos o resultado δgµρ gρν + gµρ δgρν = 0. Então, temos
√ 1 1 1√
δ −g = − (−g)− 2 δg = − −g gµν δgµν . (19.5)
2 2
Inserindo as Eqs. (19.4) e (19.5) na relação (19.2), encontramos
Z Z
1 √ µν
ρ
ρ
4 1 √ µν 1
δSEH = −g g ∇ρ δΓνµ − ∇ν δΓρµ d x + −g δg Rµν − R gµν d4 x .
2κ Ω 2κ Ω 2
(19.6)
Analisando somente a primeira integral da relação anterior, e, levando em conta o fato de que ∇ρ gµν = 0,
obtemos Z
√
−g ∇ρ gµν δΓρνµ − ∇ν gµν δΓρρµ d4 x ,
Ω
após realizar uma troca nos índices ρ ↔ ν no segundo termo da integral acima, encontramos
Z
√
−g ∇ρ gµν δΓρνµ − gµρ δΓννµ d4 x .
Ω
já que esta integral de superfície se anula na fronteira. Então, substituindo em (19.6), temos
Z
1 √ 1
δSEH = −g δgµν Rµν − R gµν d4 x . (19.7)
2κ Ω 2
Aplicando agora o princípio da mínima ação para a ação de Einstein-Hilbert, δSEH = 0, recuperamos a
equação de Einstein para o vacuum,
1
Gµν = Rµν − gµν R = 0 . (19.8)
2
Consideramos, agora, a variação da ação para a matéria, i.e.,
Z
√
δSM = δ −g LM d4 x .
Ω
3
Attilio Palatini (1889-1949), matemático italiano.
A. Palatini, Rend. Circ. Mat. Palermo, 43, 203-212 (1919).
“Z_2” — 2017/9/5 — 8:19 — page 531 — #551
A Métrica Estática e Isotrópica No caso do campo gravitacional criado por uma massa M , esfericamente
simétrica e sem qualquer tipo de movimento, é perfeitamente razoável procurar uma solução que reflita a
simetria esférica e que seja estática. Logo, vamos assumir que os coeficientes da métrica são independentes
do tempo t = x0 , usaremos unidades em que c = 1, e que, para uma solução estática, a métrica seja
invariante sob a ação da operação x0 → −x0 . Nesta métrica deverão estar ausentes termos cruzados do tipo
dx0 dxi , como podemos ver escrevendo ds2 = gµν dxµ dxν para esse caso
Para que a métrica seja invariante sob a ação desta operação, devemos ter g0i = 0, i.e., temos uma métrica
estática. Quando ds2 depende somente de invariantes rotacionais de coordenadas tipo espaço xi e suas
derivadas, temos uma métrica isotrópica
Na verdade, é mais complicado obter a forma geral da métrica isotrópica sem insistirmos de que é
estática. Portanto, vamos começar construindo esta métrica mais geral. Somente após sua derivação vamos
impor a restrição adicional de que a métrica é estática.
Assim, considerando os invariantes rotacionais de coordenadas tipo espaço xi e suas derivadas, temos
em que ~x ≡ (x1 , x2 , x3 ) e r 2 = (x1 )2 + (x2 )2 + (x3 )2 . Denotando x0 ≡ t, descobrimos que a forma mais
geral de uma métrica espacialmente isotrópica será
ds2 = A(t, r) dt2 − B (t, r) dt~x · d~x − C (t, r) (~x · d~x)2 − D (t, r) d~x2 , (19.14)
5
K. Schwarzschild, Sitzungsberichte der Königlich Preussischen Akademie der Wissenschaften, 7, 189-196 (1916).
“Z_2” — 2017/9/5 — 8:19 — page 533 — #553
Solução das Equações de Campo do Espaço Vazio As funções A(r) e B (r), na métrica isotrópica está-
tica, são determinados ao solucionar as equações de campo de Einstein. Estamos interessados na geometria
espaço-tempo fora da distribuição esférica de massa, tal que para isso devemos resolver as equações de
campo do espaço vazio, i.e., o tensor de Ricci deve ser zero, Rµν = 0. Da Eq. (18.14) podemos escrever o
tensor de Ricci como
Rµν = ∂ν Γσµσ − ∂σ Γσµν + Γρµσ Γσρν − Γρµν Γσρσ
e as conexões como
1 σρ
Γσµν = g (∂ν gρµ + ∂µ gρν − ∂ρ gµν ) ,
2
ou seja, Rµν = 0 não é tão simples de resolver. Assim, temos que calcular os coeficientes das conexões
Γσµν correspondente à métrica isotrópica e estática. Usaremos o método tradicional em que Γσµν são calcu-
lados diretamente de gµν . Logo, identificando as coordenadas esféricas (t, r, θ, φ) ↔ (0, 1, 2, 3) da métrica
esfericamente simétrica e estática (19.17), temos
e
1 1 1 1
g00 = , g11 = − , g22 = − , g33 = − .
A(r) B (r) r2 r 2 sen2 θ
Substituindo as componentes da métrica na relação das conexões, após uma pequena álgebra, podemos
verificar que são diferente de zero os seguintes elementos da conexão,
A′ A′ B′
Γ001 = 2A , Γ100 = 2B , Γ111 = 2B ,
2
Γ122 = − Br , Γ133 = − r sen
B
θ
, Γ212 = 1
r ,
1
Γ233 = − sen θ cos θ , Γ313 = r , Γ323 = cot θ ,
d
em que ′ ≡ dr . A partir destes elementos podemos deduzir o tensor de Ricci:
A′′ A′ A′ B ′ A′
R00 =− + + −
2B 4B A B rB
A′′ A′ A′ B ′ B′
R11 = + + −
2A 4A A B rB
(19.18)
1 r A′ B′
R22 = −1+ −
B 2B A B
A solução de Schwarzschild é obtida exigindo que a métrica anterior seja solução das equações de Einstein
no vazio, i.e., as Eqs. (19.18) devem ser zero, mas somente as três primeiras são importantes, já que a quarta
equação repete a informação obtida na terceira. Logo,
B
Somando A× a primeira equação com a segunda equação das Eqs. (19.18), temos que
′
1 A B′ A′ B′
+ =0 ⇒ =− ⇒ A(r) B (r) = constante .
r A B A B
O problema que estamos diretamente interessado refere-se a um campo gravitacional criado por uma massa
esférica M , suposta situada na origem das coordenadas. Devemos impor as condições de que assintotica-
mente, i.e., longe das fontes, a solução tenda para solução de Minkowski
1
lim B (r) = lim A(r) = 1 ⇒ B (r) = .
r→∞ r→∞ A(r)
Substituindo em R22 , temos
d(rA)
R22 = −1 + A + rA′ = 0 ⇒ = 1,
dr
ou seja, rA = r + k ou A = 1 + kr , em que k é uma outra constante de integração. Logo,
k k −1
A(r) = 1 + e B (r) = 1 + .
r r
A uma distância grande de M o campo será fraco e já vimos que nestas condições, A = g00 ∼ 1 + 2Φ, em
que Φ é o potencial gravitacional newtoniano, i.e., Φ = − GrM , donde se conclui que k = −2G M . Então,
substituindo estes valores em A(r) e B (r), a métrica de Schwarzschild para o espaço-tempo vazio fora de
um corpo esférico de massa M é
2 2GM 2 2GM −1 2
ds = 1 − dt − 1 − dr − r 2 dθ 2 + sen2 θ dφ2 . (19.19)
r r
Este resultado é o elemento de linha de Schwarzschild que nos leva a solução de Schwarzschild obtida em
1916, cuja a métrica é dada por,
1 − 2GM
r 0 0 0
−1
0 − 1 − 2GM 0 0
gµν =
r
2
.
0 0 −r 0
0 0 0 −r 2 sen2 θ
Esta métrica é de particular importância. Ela corresponde ao espaço-tempo como um ponto de massa e pode
ser usada para descrever o espaço-tempo em torno das estrelas, planetas e buracos negros. A combinação
m = GM ≡ GM c2 é conhecida como massa geométrica, que tem as dimensões de comprimento, e quando
falarmos de buracos negros veremos a importância da grandeza RS = 2m, i.e., o raio de Schwarzschild.
No caso do Sol, RS é da ordem de 3 km.
Um resultado de grande importância, conhecido como teorema de Birkhoff,6 nos diz que uma solução
esfericamente simétrica das equações de Einstein no vazio é necessariamente estática.7 Mesmo sem a exi-
gência inicial de ser estática a métrica (19.14), o resultado obtido seria ainda a Eq. (19.19), desde que se
exigisse que a solução fosse isotrópica.
6
George David Birkhoff (1884-1944), matemático americano.
7
G. D. Birkhoff, Relativity and modern physics, p.253, Harvard University Press, Cambridge, MA (1923).
Em 1923, Birkhoff em seu livro sobre física moderna, mostrou que a métrica estática de Schwarzschild é uma solução fora de
qualquer distribuição em massa, mesmo quando isso varia com o tempo, desde que a simetria esférica seja mantida. Este é o
chamado teorema de Birkhoff. Uma aplicação astrofísica prática e importante é o colapso esférico de uma estrela que não pode
resultar em qualquer radiação gravitacional emitida. De um ponto de vista matemático, esta é derivada de uma forma elegante,
concentrando-se nas duas coordenadas essenciais (t, r).
“Z_2” — 2017/9/5 — 8:19 — page 536 — #556
d 2 xµ α
µ dx dx
β
+ Γ αβ dτ dτ = 0 .
dτ 2
Temos, adicionalmente, que: para uma geodésica não nula, i.e., massa 6= 0,
dẋµ 1 µρ
+ g gρα , β + gρβ , α − gαβ , ρ ẋα ẋβ = 0 , (19.22)
dτ 2
que pode ser reescrita na forma mais simples
d 1
(gλµ ẋµ ) = gαβ , λ ẋα ẋβ . (19.23)
dτ 2
Vamos expressar a métrica (19.21) como
ds2 = A dt2 − A−1 dr 2 − r 2 dθ 2 + sen2 θ dφ2 ,
ou, considerando a lagrangiana L = gµν ẋµ ẋν , e, usando a Eq. (19.21), em que L é dada por
−1
2m 2 2m
L= 1− ṫ − 1 − ṙ 2 − r 2 θ̇ 2 + sen2 θ φ̇2 , (19.24)
r r
ou seja,
L = A ṫ2 − A−1 ṙ 2 − r 2 θ̇ 2 + sen2 θ φ̇2 .
“Z_2” — 2017/9/5 — 8:19 — page 537 — #557
ds2
em que dτ 2 = 1 devido a trajetória ser tipo tempo. Mas como L = gµν ẋµ ẋν = b, temos
Vamos agora procurar integrar as Eqs. (19.23) para ẋµ = (ṫ, ṙ, θ̇, φ̇). Das Eqs. (19.23), que são as equações
de movimento associadas as equações de Euler-Lagrange,
d ∂L ∂L
− µ = 0,
dτ ∂ ẋµ ∂x
temos
• para λ = 0,
d
A ṫ = 0 ; (19.26)
dτ
• para λ = 1,
d 1 A′
− A−1 ṙ = A ṫ − 2 ṙ 2 − 2r θ̇ 2 − 2r sen2 θ φ̇2
′ 2
; (19.27)
dτ 2 A
• para λ = 2,
d 2
r θ̇ = r 2 sen θ cos θ φ̇2 ; (19.28)
dτ
• para λ = 3,
d 2
r sen2 θ φ̇ = 0 . (19.29)
dτ
Vamos considerar as seguintes condições iniciais de movimento, em que
π
θ= e θ̇ = 0 .
2
Logo, usando estas condições iniciais em (19.28), vemos que θ̈ e qualquer outra derivada de ordem superior
em θ serão nulas. Isto determina que a órbita da partícula fique confinada no plano equatorial dado por
θ = π2 .
As Eqs. (19.26), (19.27) e (19.29) podem ser integradas, resultando em
A ṫ = k (19.30)
m m
A−1 r̈ + 2 ṫ2 − A−2 2 ṙ 2 − r φ̇2 = 0 (19.31)
r r
r 2 φ̇ = h , (19.32)
em que k e h são constantes de integração. Estas equações são válidas para as duas geodésicas, nula e não
nula. Em cada um destes casos, porém, é mais fácil de substituir a equação em r (19.31) por uma primeira
integral das equações geodésicas, i.e., gµν ẋµ ẋν = b, em que b = 1 ≡ c2 para geodésica não nula e b = 0
“Z_2” — 2017/9/5 — 8:19 — page 538 — #558
para geodésica nula. As Eqs (19.30) e (19.32) correspondem, no limite newtoniano, respectivamente às leis
de conservação da energia (k = ε) e do momentum angular especifico (h = ℓ), i.e.,
A ṫ = ε (19.33)
r 2 φ̇ = ℓ . (19.34)
Para solucionar mais facilmente as relações (19.27) ou (19.31), podemos trabalhar diretamente com
a Eq. (19.25) que corresponde a uma primeira integral de movimento. Então, das condições iniciais de
movimento θ = π2 e θ̇ = 0 e dos resultados obtidos em (19.33)-(19.34), inserindo em (19.25), temos
2
ℓ 2m
ṙ 2 = ε2 − + b 1 − . (19.35)
r2 r
Para descrever a trajetória das partículas, r varia com a coordenada angular φ, sendo θ fixo. Assim,
2 2
2 dr dr dφ 2 2 dr ℓ2 dr 2
ṙ = = = φ̇ = 4 .
dτ dφ dτ dφ r dφ
Substituindo em (19.35), temos
2
ℓ2 dr 2 ℓ2 2m ℓ2
=ε −b− 2 + +b . (19.36)
r4 dφ r r r2
Introduzindo uma nova variável,
1 du du dr 1 dr
u= ⇒ = =− 2 ,
r dφ dr dφ r dφ
encontramos 2
du ε2 − b 2mb
+ u2 = + 2 u + 2m u3 . (19.37)
dφ ℓ2 ℓ
Esta é a equação geral para partículas teste no espaço-tempo de Schwarzschild.
• Para uma partícula teste massiva, b = 1, a equação para as órbitas possíveis será
2
du ε2 − 1 2m
+ u2 = + 2 u + 2m u3 .
dφ ℓ2 ℓ
du
Diferenciando com respeito a φ e libertando-nos de um fator dφ comum a ambos os membros da
equação anterior, temos
du d2 u du m 2
2 + u = 2 + 3m u
dφ dφ2 dφ ℓ2
⇒
d2 u m
2
+ u = 2 + 3m u2 . (19.38)
dφ ℓ
Na gravidade newtoniana, as equações de movimento de uma partícula de massa µ no plano equatorial
θ = π2 pode ser determinada a partir da lagrangiana
1 2 GM µ
L= µ ṙ + r 2 φ̇2 + .
2 r
“Z_2” — 2017/9/5 — 8:19 — page 539 — #559
r 2 φ̇ = ℓ
ℓ GM
r̈ = 3 − 2 .
r r
Agora, se substituirmos u = 1r e eliminarmos a variável temporal, a equação newtoniana de movi-
mento para órbitas planetárias será
d2 u GM
2
+u= 2 .
dφ ℓ
Assim, a menos do termo 3m u2 ≡ 3GM u2 , a Eq. (19.38) corresponde à equação newtoniana para a
órbita de uma partícula teste. No campo gravitacional produzido por um corpo massivo pontual, em
que ℓ deve ser identificado com o momentum angular newtoniano ℓN ,
dφ
ℓN = r 2 .
dt
m
Na Eq. (19.38), o termo 3m u2 corresponde a uma perturbação quando comparado ao termo ℓ2
e,
portanto, podemos considerar a solução da Eq. (19.38) por meio de uma expansão perturbativa.
• Para uma partícula teste não massiva, b = 0, a equação para as órbitas possíveis será dada por
2
du ε2
+ u2 = 2 + 2m u3 .
dφ ℓ
du
Novamente, diferenciando com respeito a φ e livrando-nos de um fator comum, dφ , em ambos os
lados da equação anterior, temos
d2 u
+ u = 3m u2 . (19.39)
dφ2
Da mesma forma em que usamos para partículas massiva, o termo 3m u2 é pequeno, comparado aos
outros, e como antes poderemos resolver esta equação usando o método perturbativo.
d2 u m
2
+ u = 2 + 3m u2 ,
dφ ℓ
em que o termo 3m u2 corresponde a uma perturbação quando comparamos com o termo ℓm2 , portanto,
consideraremos a solução desejada por meio de uma expansão perturbativa. Assim, desprezando 3m u2 da
equação anterior, resulta
d2 u0 m
2
+ u0 = 2 , (19.40)
dφ ℓ
“Z_2” — 2017/9/5 — 8:19 — page 540 — #560
cuja solução é
m
u0 = (1 + e cos φ) , (19.41)
ℓ2
na qual descreve uma elipse cuja excentricidade é dada por e. A Fig. 19.1 mostra a órbita elíptica de um
planeta ao redor do Sol e também mostra a distância mais próxima do foco (Sol), conhecida como periélio,
r1 = a(1 − e), e a distância mais afastada do foco, conhecida como afélio, r2 = a(1 + e), em que a é o
semieixo maior da elipse.
Pelo método perturbativo, vamos considerar uma expansão da solução na forma
u = u0 + u1 .
Neste caso o termo 3m u20 é considerado como um termo de segunda ordem, O(u1 ). Inserindo na Eq. (19.38)
temos
d2 m
2
(u0 + u1 ) + u0 + u1 = 2 + 3m u20 .
dφ ℓ
Usando (19.40), encontramos
d2 u1 3m3
+ u1 = 3m u2
0 = (1 + e cos φ)2
dφ2 ℓ4
ou
d2 u1 3m3 6m3 e 3m3 e2
+ u1 = + cos φ + cos2 φ . (19.42)
dφ2 ℓ4 ℓ4 ℓ4
Uma vez que | cos φ| ≤ 1 e, para os planetas do sistema solar, a excentricidade e ≤ 0, 2, podemos desprezar
3
o último termo da Eq. (19.42). O efeito do termo 3m ℓ4 na última equação é somente o de reavaliar as
constantes que aparecem na relação (19.41). Pelo fato de que estas constantes por ser ajustadas ao valores
observados, também não nos preocuparemos com este termo. Então, precisamos somente determinar uma
solução para
d2 u1 6m3 e
+ u 1 = cos φ , (19.43)
dφ2 ℓ4
que terá a forma
3m3 e
u1 = φ sen φ . (19.44)
ℓ4
“Z_2” — 2017/9/5 — 8:19 — page 541 — #561
m 3m3 e
u= (1 + e cos φ) + φ sen φ . (19.45)
ℓ2 ℓ4
Podemos reescrever a equação anterior em uma forma mais conveniente
m
u= (1 + e cos φ + e α φ sen φ) , (19.46)
ℓ2
3m2
em que definimos α = ℓ2
≪ 1. Usando a relação
podemos escrever
m
u≈ {1 + e cos [φ (1 − α)]} . (19.47)
ℓ2
2π
Desta expressão, verificamos que a órbita é periódica, mas com um período 1−α , i.e., os valores r repetem
em um ciclo que é maior do que 2π. O resultado é que a órbita não pode ser fechada, e assim a elipse
precessa, ver Fig. 19.2. Em uma revolução, a elipse irá girar sobre o foco por uma quantidade
2π 6π(GM )2
∆φ = − 2π ≈ 2π α = .
1−α ℓ2
Usando o melhor ajuste para ℓ, temos
ℓ2 = a GM (1 − e2 ) .
Assim,
6π GM
∆φ = . (19.48)
a (1 − e2 )
Inserindo o termo c2 para a devida correção nos cálculos, temos
6π GM
∆φ = .
a c2 (1 − e2 )
“Z_2” — 2017/9/5 — 8:19 — page 542 — #562
O valor observado é 5601 ′′ /século.8 No entanto, muito deste valor é devido à precessão dos equinócios
em nosso sistema de coordenadas geocêntrico, i.e., 5025 ′′ /século, para ser mais preciso. As perturbações
gravitacionais dos outros planetas contribuem em um adicional de 532 ′′ /século,9 deixando 43 ′′ /século
para ser explicado pelo relatividade geral, que o faz muito bem. Finalmente, este valor residual observado
experimentalmente é de 10
∆φ = (43, 1 ± 0, 1) ′′ /século .
Em seguida, mostramos a precessão anômala de quatro objetos internos no sistema solar baseado na
observação direta, todos os resultados estão em ′′ /século, veja Tabela 19.1. No duplo binário pulsar des-
R ELATIVIDADE O BSERVAÇÃO
G ERAL R ESIDUAL
Mercúrio 43, 0 43, 1 ± 0, 1
Vênus 8, 6 8, 4 ± 4, 8
Terra 3, 8 5, 0 ± 1, 2
Ícaro (asteróide) 10, 3 9, 8 ± 0, 8
coberto em 2003, PSR J0737-3039, o avanço do periastro é 140000 maior do que o avanço do planeta
Mercúrio e está em perfeito acordo com a relatividade geral. 11 Em 2013, uma equipe internacional de astrô-
nomos relatam novos dados a partir da observação de um sistema pulsar-anã branca PSR J0348+0432, em
que foram capazes de medir a mudança no período orbital de 8/1000000 de segundo por ano, confirmando
as previsões da relatividade geral em regime de campos gravitacionais extremos nunca sondados antes. 12
Deflexão dos Raios Luminosos A observação da reflexão da luz, emitida por uma estrela distante, ao
passar junto da superfície do Sol, foi uma importante contribuição da teoria de Einstein.
Como os raios luminosos geram geodésicas nulas, então temos
d2 u
+ u = 3GM u2 .
dφ2
8
Valor preciso é (5599, 7 ± 0, 4) ′′ /século.
9
Ao analisar a órbita de Mercúrio, devemos também ter em conta a atração gravitacional dos outros planetas, especialmente
Vênus e Terra, devido a sua proximidade e Júpiter, devido ao seu tamanho.
10
J. D. Anderson et al., Acta Astronautica 5, 43-61 (1978); C. M. Will, Living Reviews in Relativity 9, 3 (2006).
11
M. Kramer et al., Science 314 (5796), 97-102 (2006).
12
J. Antoniadis et al., Science (AAAS) 340 (6131), 1233232 (2013).
“Z_2” — 2017/9/5 — 8:19 — page 543 — #563
d2 u0
+ u0 = 0 . (19.49)
dφ2
A sua solução é
1
u0 = sen(φ − φ0 ) ,
d
com d e φ0 constantes. É fácil observar que esta solução representa uma reta inclinada de um ângulo φ0 em
relação ao eixo dos x e passando à uma distância d da origem das coordenadas, ver Fig. 19.3, no que se
u = u0 + 3GM u1 + O((3GM )2 ) .
d2 u
Derivando duas vezes e substituindo em dφ2
+ u = 3GM u2 , temos
d2 u0 d2 u1
2
+ 3GM + u0 + 3GM u1 = 3GM u20 + O((3GM )2 ) ,
dφ dφ2
separando em ordens de 3GM , encontramos a já solucionada (19.49)
d2 u0
+ u0 = 0
dφ2
e
d2 u1
+ u1 = u20
dφ2
⇒
d2 u1 1
2
+ u1 = 2 sen2 φ , (19.50)
dφ d
cuja solução é
1
u1 = 2
1 + C cos φ + cos2 φ ,
3d
em que C é uma constante a ser determinada. A expressão para u será
1 GM
u= sen φ + 2 1 + C cos φ + cos2 φ .
d d
Para calcularmos a deflexão dos raios luminosos quando passam próximos de uma massa M , por exem-
plo, o Sol, tomada como origem das coordenadas, suporemos que a estrela que emite a luz e o observador
“Z_2” — 2017/9/5 — 8:19 — page 544 — #564
se encontram a distâncias suficientemente grandes, i.e., r muito grande, para que em primeira aproxima-
ção possamos pôr u = 1r ≃ 0. Pela Fig. 19.4 vemos que o ângulo da trajetória, φ, varia de φ = π + δ2
a φ = −δ1 , sendo o desvio total dado por ∆ = δ1 + δ2 . Como os valores de δ são pequenos, vale as
aproximações sen δ ≃ δ e cos δ ≃ 1. Considerando as duas situações, temos as relações
δ1 1+C +1
− + GM ≃0
d d2
δ2 1−C +1
− + GM ≃ 0,
d d2
na qual resulta
1 4GM
− (δ1 + δ2 ) + ≃ 0,
d d2
que nos dá
4GM
∆= , (19.51)
c2 d
em que repomos mais uma vez a constante dada pela velocidade da luz c2 e designamos d a distância dos
raios luminosos ao centro do Sol. Assim, para um raio luminoso cuja trajetória tangencia o disco solar, o
desvio será
4GM
∆= 2 ≃ 1, 75 ′′ .
c d
Durante o eclipse solar de 1919, um grupo de astrônomos liderados por Arthur Eddington mediu dois
conjuntos, cujos resultados são13
∆ = (1, 98 ± 0, 16) ′′
∆ = (1, 61 ± 0, 40) ′′ ,
consistente com ∆ = 1, 75 ′′ , i.e., de acordo com o valor previsto pela teoria de Einstein, a primeira medida
foi realizada em Sobral, no Ceará e a segunda medida foi realizada na ilha de Príncipe, no então arquipélago
português de São Tomé e Príncipe na costa da África. Medidas modernas conseguiram um vínculo observa-
cional mais apurado através de observações de mais de 20 anos usando 87 sítios de VLBI – interferômetro
de linha de base muito longa – e 541 fontes de rádio produzindo mais de 1, 7 × 106 observações e, tendo
obtido um vínculo em ∆
∆ = (0, 99992 ± 0, 00023) × 1, 75 ′′
13
F. W. Dyson, A. S. Eddington and C. Davidson, Philosophical Transactions of the Royal Society, A220, 291-333 (1920).
“Z_2” — 2017/9/5 — 8:19 — page 545 — #565
Figura 19.5 Efeito de lente gravitacional, causado pela interposição de uma galáxia entre um quasar
distante e o observador na Terra.
Desvio para o Vermelho de Origem Gravitacional O desvio para o vermelho gravitacional, como vi-
mos, é um outro efeito que está presente no limite do campo fraco, e de fato será previsto por qualquer
teoria da gravidade, que obedece ao princípio da equivalência. No entanto, isto só se aplica a regiões sufici-
entemente pequenas de espaço-tempo; ao longo de distâncias maiores, a quantidade exata do desvio para o
vermelho dependerá da métrica, e, portanto, sobre a teoria em questão. Portanto, vale a pena calcular o des-
vio para o vermelho na geometria de Schwarzschild. Consideramos dois observadores em um espaço-tempo
estático, cujas coordenadas são xµ1 e xµ2 , respectivamente. O primeiro observador se encontra à superfície
da Terra, com coordenada radial x11 = r1 , e o segundo observador está situado em uma certa altitude, com
coordenada radial x12 = r2 , coordenadas medidas a partir do centro da Terra, ver Fig. 19.6.
Vamos assumir que existe um terceiro observador muito distante, que podemos tomar como euclidiano,
que se encontra em um espaço livre aonde não se faz sentir a presença do campo gravitacional. Na sua
posição g00 (xµ ) = 1. Os dois primeiros observadores tem seus relógios sincronizados na presença e no
local do observador distante, i.e., compararam e tomaram iguais os respectivos períodos, dx01 = dx02 . Estes
observadores levam consigo os relógios para as posições r1 e r2 , respectivamente. O observador distante
verificará que os dois relógios deixam de estar sincronizados, e sabemos que isto é devido ao campo gra-
vitacional, que irá alterar os valores dos coeficientes da métrica (dx0 )2 → g00 (dx0 )2 , a alteração estando
14
A. S. Shapiro, J. L. Davis, D. E. Lebach and J. S. Gregory, Physical Review Letters, 92 (12), 121101 (2004).
15
A. Einstein, Science, 84, 506-507 (1936).
16
D. Walsh, R. F. Carswell and R. J. Weymann, Nature, 279, S.381-384 (1979).
“Z_2” — 2017/9/5 — 8:19 — page 546 — #566
Figura 19.6 A luz sofre um desvio para o vermelho ao direcionar para cima no campo gravitacional da
Terra.
dτ12 = g00 (r1 ) (dx01 )2 será diferente de dτ22 = g00 (r2 ) (dx02 )2 .
Uma maneira de se verificar este efeito e fazer o observador 1 enviar para o observador 2 sinais lumino-
sos com uma frequência bem definida. O efeito descrito acima significa que o observador 2 irá detectar uma
frequência diferente. A relação entre as duas frequências será obtida a partir da comparação dos respectivos
períodos, tendo em conta que dx01 = dx02 ,
dτ1 dτ2
p =p ,
g00 (r1 ) g00 (r2 )
ou ainda p
dτ2 ν1 g00 (r2 )
= =p , (19.52)
dτ1 ν2 g00 (r1 )
sendo ν1 e ν2 as frequências de emissão e recepção dos sinais luminosos.
√
Vimos que g00 ≃ 1 + 2Φ c2
, ou g00 ≃ 1 + cΦ2 . Definindo
∆ν ν2 − ν1
= ,
ν ν1
vem que
Φ1
∆ν 1+ c2 Φ1 − Φ2
≃ Φ2
−1=
ν 1+ c2
c2
GM 1 1
=− 2 − , (19.53)
c r1 r2
no qual mostra que ν2 < ν1 se r2 > r1 . O desvio para o vermelho z do fóton é definido por
−1
ν2
1+z = .
ν1
Medidas experimentais do desvio gravitacional para o vermelho foram realizadas a partir de várias fontes
astrofísicas, bem como, por via terrestre, através do famoso experimento de Pound-Rebka. O resultado
deste experimento, que foi realizado no Jefferson Laboratory da Universidade de Harvard em uma torre
“Z_2” — 2017/9/5 — 8:19 — page 547 — #567
de 22,5 metros de altura, confirmou que as predições da relatividade geral estavam ao nível de 10%, que
posteriormente foi aprimorado até o nível de 1%,17 i.e.,
∆ν
≃ 2, 5 × 10−15 .
ν
Outro teste importante envolvendo um maser de hidrogênio espacial aumentou a precisão da medida para
cerca de 10−4 , i.e., 0,01%.18
Como já mencionamos, em 1979 o efeito da lente gravitacional foi confirmada pela primeira vez com
as imagens do quasar duplo 0957+561 A/B que apresentou uma separação de 5, 7 ′′ com um desvio para
o vermelho z = 1, 405.19 Em 2013, astrônomos alemães descobriram o que na época era o mais distante
galáxia de lente gravitacional denominado como J1000+0221 usando o telescópio espacial Hubble, esta
lente tem um desvio para o vermelho fotométrico seguro de z = 1, 53 ± 0, 09 e a fonte é confirmado por
espectroscopia com z = 3, 417.20 Enquanto esta descoberta continua a ser a mais distante galáxia de lente
quadrupolo conhecida, uma ainda mais distante galáxia de lentes bipolares foi posteriormente descoberto
por uma equipe internacional de astrônomos usando uma combinação do telescópio espacial Hubble e do
telescópio Keck e espectroscopia, cujo desvio para o vermelho confirmado é z = 1, 62 e a fonte confirmada
com z = 2, 26.21
Atraso no Tempo de Propagação da Luz Este é considerado o quarto teste clássico da relatividade
geral. Este teste foi sugerido pela primeira vez em 1964 por Shapiro.22 Um dos efeito da curvatura do
espaço-tempo nas ondas eletromagnéticas é o atraso no tempo de propagação dos sinais de radar. Assim,
este teste envolve a medição dos tempos entre a emissão de um sinal de radar da Terra para um alvo, i.e.,
um planeta ou uma sonda, e a recepção do eco, no caso em que o sinal passa perto do Sol, veja Fig. 19.7.
Figura 19.7 Atraso no tempo de um sinal, passando perto do Sol, durante a propagação do fóton de
r1 até r2 .
Para melhor entendimento deste teste vamos então determinar o tempo de viagem de um raio de luz.
Para isso, vamos considerar a trajetória de um fóton, ou qualquer outra partícula de massa zero, que é uma
geodésica nula. Comecemos por considerar o caminho para o raio de luz no plano equatorial, i.e., θ = π2 no
17
R. V. Pound and G. A. Rebka Jr., Physical Review Letters, 4 (7), 337-341 (1960); R. V. Pound and J. L. Snider, Physical Review
Letters, 13 (18), 539-540 (1964).
18
R. F. C. Vessot, M. W. Levine, E. M. Mattison, E. L. Blomberg, T. E. Hoffman, G. U. Nystrom, B. F. Farrel, R. Decher, P. B.
Eby, C. R. Baugher, J. W. Watts, D. L. Teuber and F. D. Wills, Physical Review Letters, 45 (26), 2081-2084 (1980).
19
D. Walsh, R. F. Carswell and R. J. Weymann, Nature, 279, S.381-384 (1979).
20
A. van der Wel et al., Astrophysical Journal Letters, 777, L17 (5pp) (2013).
21
K. C. Wong et al., Astrophysical Journal Letters, 789, L31 (6pp) (2014).
22
Irwin Ira Shapiro (1929- ), astrofísico americano.
I. I. Shapiro, Physical Review Letters, 13 (26), 789-791 (1964).
“Z_2” — 2017/9/5 — 8:19 — page 548 — #568
espaço-tempo de Schwarzschild. Assim, de forma análoga a trajetória de uma partícula massiva, temos
2m
1− ṫ = k (19.54)
r
2m 2 2m −1 2
1− ṫ − 1 − ṙ − r φ̇2 = 0 (19.55)
r r
r 2 φ̇ = h , (19.56)
2m 2m 2m
Expandindo a função integrando, utilizando a quantidade pequena r , tal que r ≪1e r0 ≪ 1:
" #− 1 1
1 r 2 1 − 2m 2
2m 2m 2m r0 2 − 2
0 r ∼
2m 1 − 2m = 1− 1− 1− +
1− r r 1− r0
r r r0 r
− 1
− 1 2m 1
− 1 2 2
2m r0 2 2 r0 r r0
∼
= 1−
r
1−
r
1− 2
r 2 1 − rr0
r 2 − 12
∼ 0 2m m r0
= 1− 1+ + .
r r r (r + r0 )
“Z_2” — 2017/9/5 — 8:19 — page 549 — #569
Z r
r 2 − 21
0 2m m r0
t(r, r0 ) ∼
= dr 1 − 1+ + ,
r0 r r r (r + r0 )
Para a viagem da luz a partir de r1 até r2 e sua volta, obtemos o atraso do tempo de coordenadas
q q
∆t = 2 t(r1 , r0 ) + t(r2 , r0 ) − − − − r12 r02 r22 r02
p p
r1 + r12 − r02 r2 + r22 − r02 r r
r1 − r0 r2 − r0
= 4m ln + 2m + . (19.59)
r02 r1 + r0 r2 + r0
A fórmula obtida anteriormente para o tempo em que demora a viagem do raio, não considera as correções
como o movimento orbital e rotacional da Terra, o movimento orbital do refletor, a dispersão da radiação
ao atravessar o vento solar e a corona e a dilatação do tempo no campo gravitacional da Terra. Foram feitos
dois tipos de experiências: a primeira é uma experiência passiva, i.e., o refletor é a superfície de um planeta,
como por exemplo Mercúrio, Venus; a segunda é uma experiência ativa, i.e., o refletor é um equipamento
eletrônico que se encontra a bordo de uma sonda. Ambas as experiências sofrem ruídos: as experiências
passivas sofrem de ruído por exemplo devido à topografia do planeta refletor; as experiências ativas sofrem
de instabilidade por exemplo devido à eletrônica associada às sondas. Para longas distâncias, r1 , r2 ≫ r0 ,
temos
∼ 4 r1 r2
∆t = 4m ln +1 .
r02
Para Venus, quando está em posição oposta à posição da Terra no lado mais distante do Sol,
∆t ∼
= 220 µs .
23
I. I. Shapiro et al., Physical Review Letters, 26 (18), 1132-1135 (1971).
24
Bruno Bertotti (1930- ), físico italiano.
“Z_2” — 2017/9/5 — 8:19 — page 550 — #570
Figura 19.8 Atraso no tempo de um sinal medido entre a Terra e Venus, pontos com barra de erro,
comparado com a previsão da relatividade geral, linha continua.
usando emissões de rádio em conexão com a nave espacial Cassini em 2003,25 que nos dão
em que ∆tRG , dado em (19.59), é a previsão da teoria da relatividade geral. Portanto, confirmando os
resultados apresentados na Fig. 19.8.
Problemas
19.1 Prove que para uma pequena variação do campo gravitacional
1 λσ h i
δRµκ = g (δgσµ );κ ;λ + (δgσκ );µ ;λ − (δgµκ );σ ;λ − (δgλσ );µ ;κ .
2
25
B. Bertotti, L. Iess and P. Tortora, Nature, 425 (6956), 374-376 (2003).
Cassini-Huygens é uma sonda espacial não tripulada enviada em missão ao planeta Saturno e seu sistema planetário. É um
projeto conjunto da NASA (Agência Espacial Americana), ESA (Agência Espacial Europeia) e ASI (Agência Espacial Italiana),
este projeto consiste de dois elementos principais, a nave Cassini e a sonda Huygens. Lançada ao espaço em 15 de outubro
de 1997, ela entrou em órbita de Saturno em 1 de julho de 2004 e continua em operação, estudando o planeta, seus satélites
naturais, a heliosfera e testando a teoria da relatividade. A espaçonave de duas partes foi batizada em homenagem aos astrônomos
Giovanni Cassini e Christiaan Huygens.
Giovanni Domenico Cassini (1625-1712), astrônomo e matemático franco-italiano.
“Z_2” — 2017/9/5 — 8:19 — page 551 — #571
19.2 Mostrar que o tensor energia-momentum também pode ser escrito como
∂LM 2 δSM
Tµν ≡ 2 µν
− LM gµν = √ .
∂g −g δgµν
Compare com o resultado obtido em (19.10) e mostre sua compatibilidade.
19.3 Calcule explicitamente as conexões e o tensor de Ricci para uma métrica esfericamente simétrica e
estática. Sugestão: Consulte o livro dos Profs. Hobson, Efstathiou e Lasenby [38].
19.7 Dada uma partícula massiva, discuta sua trajetória, seu movimento radial, seu movimento circular e
sua estabilidade de órbita. Sugestão: Consulte o livro dos Profs. Hobson, Efstathiou e Lasenby [38].
19.8 Repita o problema anterior quando a partícula for um fóton. Sugestão: Consulte o livro dos Profs.
Hobson, Efstathiou e Lasenby [38].
19.9 Use o teorema de Birkhoff para mostrar que uma partícula dentro de uma casca esférica de matéria
experimenta nenhuma força gravitacional.
19.10 Considere a equação de Einstein no vácuo, mas com uma constante cosmológica, i.e.,
Gµν + Λ gµν = 0 .
Resolver para a métrica esfericamente simétrica mais geral, em coordenadas (t, r) que reduzem as
coordenadas de Schwarzschild comum quando Λ = 0.
Leitura Recomendada
Recomenda-se ao leitor os seguintes livros, muito úteis para a compreensão do desenvolvimento deste ca-
pítulo,
– R. D’Inverno [24];
– B. Schutz [70];
“Z_2” — 2017/9/5 — 8:19 — page 552 — #572
Nestes livros, o leitor encontrará deduções detalhadas das soluções das equações de Einstein, ou seja, a
solução de Schwarzschild, além dos quatro testes clássicos da relatividade geral e seus principais resultados.
Recomendo fortemente uma leitura paralela com o texto por ora apresentado.
“Z_2” — 2017/9/5 — 8:19 — page 553 — #573
Capítulo 20
Cosmologia: Princípios Físicos e Modelo
Padrão
Neste capítulo iremos estudar a cosmologia, seus princípios físicos e o modelo padrão. A cosmologia é,
possivelmente, uma das mais antigas ciências praticadas pela humanidade, havendo registro de ideias ba-
bilônicas que datam de três mil anos antes de nossa era comum. Embora a abordagem feita pelos povos do
passado não tenha sido estritamente científica, da forma como concebemos, é interessante notar que ques-
tões a respeito de nossa origem e evolução, enquanto natureza, sempre estiveram presentes no pensamento
humano.
O início da cosmologia moderna está no advento da relatividade geral, assim como no desenvolvimento
de telescópios que permitem observar o universo em um grande intervalo do espectro eletromagnético,
desde as ondas de rádio até aos raios gamma. O primeiro instrumento a detectar fontes astronômicas de
ondas de rádio, em 1931, foi uma antena construída por Guthe Jansky,1 o que inspirou a criação pioneira de
Reber2 de um radiotelescópio instalado em sua casa, em 1937.3 Este tipo de instrumento foi de fundamen-
tal importância para o descobrimento de estruturas astronômicas como as estrelas de nêutrons e galáxias
distantes, por exemplo. Outros tipos de telescópios, como o de infravermelho e de raios X, desenvolvidos
mais tarde, permitiram uma melhor compreensão quanto a formação estelar, e também de maiores estru-
turas como galáxias. As observações astronômicas são fundamentais para a formulação de uma teoria de
evolução consistente do universo.
Entendemos por cosmologia, como sendo o estudo do universo à sua mais larga escala, como um todo.
Dadas as suas óbvias dificuldades, tal estudo terá que estabelecer um certo número de hipóteses simplifica-
dora que apresentem boa base observacional. Evidentemente que para podermos prosseguir, iremos aceitar
que as leis físicas descobertas e estudadas localmente e no presente continuam a ser válidas quando esten-
didas ao universo e seu passado remoto.
1
Karl Guthe Jansky (1905-1950), engenheiro e físico americano.
A detecção inicial de ondas de rádio a partir de um objeto astronômico foi feita na década de 1930, quando Karl Guthe Jansky
observou radiação proveniente da Via Láctea, observações subsequentes identificou uma série de diferentes fontes de emissão
de rádio. Ver K. G. Jansky, Nature, 132 (3323), 66 (1933).
2
Grote Reber (1911-2002), engenheiro e rádio amador americano.
3
Esta data encontra-se na biografia de Reber que apareceu em dezembro 1964 que foi publicado por IEEE Transactions on
Antennas and Propagation, Vol.AP-12 (7), página 966.
553
“Z_2” — 2017/9/5 — 8:19 — page 554 — #574
2. O universo encontra-se em expansão uniforme, com a distância média entre seus constituintes au-
mentando a uma velocidade
dl(t)
= v (t) = H0 l(t) ,
dt
conhecida como lei de Hubble, em que H0 é a constante de Hubble e l é a distância entre os consti-
tuintes. 5 Aqui os constituintes são supostos distribuídos uniformemente.
4. Esta expansão começou a partir de uma fase extremamente densa e quente, com a energia do universo
dominada, nesta altura, pela energia da radiação.
Cosmologia Newtoniana Comecemos por modelar o universo através de uma nuvem de matéria ou po-
eira, de densidade uniforme ρ e pressão p = 0. Vamos supor esta nuvem muito grande e uniforme e em
expansão uniforme. Seja um ponto P no interior desta nuvem de matéria e longe de sua fronteira, seja ~r
o vetor posição deste ponto em relação a uma origem arbitrária, mas que podemos considerar o centro da
nuvem.
Da uniformidade resulta que
d~r
= ~v = f (t)~r ,
dt
na qual a velocidade~v é proporcional à~r, sendo a única forma de manter a uniformidade durante a expansão.
Suponha uma grade em forma de teia de aranha. Puxando de tal forma que ela se expanda de maneira regular
e uniforme, sem distorção, vemos que os pontos que se cruzam os fios da grade se afastam uns com outros
com uma velocidade proporcional à respectiva distância. Se a grade definir um sistema de coordenadas,
podemos dizer que os pontos de cruzamento dos fios mantêm as suas coordenadas, porém somente a escala
do sistema aumenta, ver Fig. 20.1. Substituindo os pontos da grade pelas partículas de poeira, teremos uma
representação do que se passa com a nuvem. Assim, podemos escrever
~r = R(t)~r0 ,
em que R(t) define a escala no instante t, devido a uniformidade da nuvem e sua expansão. Então, temos
dR
dt
f (t) = ≡ H (t) → ~v = H (t)~r , (20.1)
R
que é a lei de Hubble, sendo H (t) o parâmetro de Hubble.
Aplicando a equação de Newton ao ponto material P , temos
d2~r M (r)
2
= −G 2 , (20.2)
dt r
4
Modelo do big-bang também conhecido como modelo da grande explosão.
5
E. Hubble, Proceedings of the National Academy of Sciences 15 (3), 168-173 (1929).
“Z_2” — 2017/9/5 — 8:19 — page 555 — #575
Figura 20.1 Representação de um sistema de coordenadas comóvel é dada como uma grade. Ela se
expande junto com o universo, mantendo fixa a posição dos objetos neste sistema. Cada subaresta
tem valor que define a escala no tempo t, de acordo com princípio cosmológico.
4
em que M (r) = 3 πr 3 ρ, ou
d2 R
dt2 4
= − π Gρ . (20.3)
R 3
ρ0
Substituindo ρ = R3
, multiplicando os dois lados da equação anterior por 2 dR
dt e finalmente integrando,
!2
dR
dt 8π G κ
= ρ− 2 , (20.4)
R 3 R
2
em que κ é uma constante de integração. Esta equação traduz a conservação de energia, em que dR dt
indica a energia cinética, o primeiro termo do lado direito indica a energia potencial e κ indica a energia
total que é conservada. Na descrição relativista do universo, a equação de Friedmann,6 tem a mesma forma,
porém a constante κ indica a curvatura do universo. 7 A relatividade geral mostra que a expansão do sistema
de nebulosas se deve à própria expansão do universo.
Princípio Cosmológico É uma hipótese muito simples, e prática, que é fundamentada no fato de que em
larga escalas o universo apresenta um comportamento razoavelmente homogêneo e isotrópico. Podemos
ver a homogeneidade através da contagem das galáxias e rádio-galáxias em volumes cada vez maior. Temos
ainda, o elevado grau de isotropia da radiação de fundo de micro-ondas, detectado por Penzias8 e Wilson9
em 1965, 10 confirmando previsões dos estudos sobre o big-bang realizados por Gamow,11 Alpher12 e Her-
6
Alexander Alexandrovich Friedmann (1888-1925), físico e matemático russo-soviético.
7
A. Friedmann, Zeitschrift für Physik 10 (1), 377-386 (1922); Idem, 21 (1), 326-332 (1924).
8
Arno Allan Penzias (1933- ), físico e astrônomo americano.
9
Robert Woodrow Wilson (1936- ), astrônomo americano.
10
A. A. Penzias and R. W. Wilson, Astrophysical Journal 142, 419-421 (1965).
11
George Gamow (Georgiy Antonovich Gamov) (1904-1968), físico e cosmólogo russo-soviético.
12
Ralph Asher Alpher (1921-2007), cosmólogo americano.
“Z_2” — 2017/9/5 — 8:19 — page 556 — #576
man13 em 1948. 14 Esta isotropia só será compreendida se o universo estiver em expansão uniforme, caso
contrário a temperatura seria diferente em diferentes direções, o que não ocorre. Por outro lado, as equações
de Einstein dependem da distribuição da matéria, a uniformidade da expansão implica uma distribuição
uniforme desta. Assim, assumimos o princípio cosmológico, que afirma que em um determinado tempo o
universo parece o mesmo em todas as posições no espaço em um tempo particular e todas as direções no
espaço em qualquer ponto são equivalentes.
A declaração intuitiva do princípio cosmológico dado acima necessita ser tomada com mais precisão.
Em particular, como se define um tempo particular na relatividade geral, que é válida globalmente, quando
não há referenciais inerciais globais? Além disso, como observadores em movimento relativo um ao ou-
tro irá ver o universo de forma diferente, segundo o qual os observadores exigem que o universo pareça
isotrópico?
Na relatividade geral o conceito de um momento de tempo é ambíguo e passa a ter a noção de uma
hipersuperfície tipo espaço tridimensional. Para definir um parâmetro de tempo que é válido globalmente,
devemos fatiar o espaço-tempo através da introdução de uma série de hipersuperfícies sem interseção do
tipo espaço que são rotulados por algum parâmetro t. Este parâmetro define, então, um tempo universal em
que um tempo particular significa um determinado hipersuperfície tipo espaço. Nota-se, no entanto, que
podemos construir as hipersuperfícies t = constante em várias formas. Em um espaço-tempo geral, não há
uma forma preferencial de fatiar e, portanto, não há nenhum tempo preferencial de coordenada t.
Também vamos supor que cada partícula, ou mesmo galáxia, se move ao longo longo de uma geodésica
temporal, as diferentes geodésicas somente se interceptam em um ponto singular no passado. O conjunto
destas geodésicas forma uma congruência, com uma só geodésica passando em cada ponto. Este é o conhe-
cido postulado de Weyl.
Tendo este conjunto de ideias iremos construir um sistema de coordenadas espaciais, associadas a cada
partícula ou galáxia, que se mantêm constantes ao longo do tempo. Em cada instante de tempo t as partículas
ou galáxias formam uma hipersuperfície homogênea e isotrópica que obedecem ao princípio cosmológico.
As geodésicas descritas definem o eixo dos tempos e são ortogonais à essas hipersuperfícies, veja Fig. 20.2.
Este sistema de coordenadas é conhecido como sistema de coordenadas comóvel. Assim, o elemento de
Figura 20.2 Num espaço-tempo homogêneo e isotrópico, e num sistema de coordenadas comóvel, as
geodésicas descritas pelas partículas ou galáxias definem o eixo dos tempos e são ortogonais às
hipersuperfícies espaciais.
em que R(t) define o fator de escala e gij são funções somente das coordenadas (x1 , x2 , x3 ). A ortogona-
lidade entre as geodésicas e as hipersuperfícies espaciais estão no fato dos coeficientes g0i serem nulos.
O princípio cosmológico apresenta como consequência matemática que cada hipersuperfície tipo espaço
mostra uma curvatura constante. O tempo t associado a cada hipersuperfície é o tempo cósmico. De fato,
este tempo é medido pelo aspecto físico que, para cada instante, o universo apresenta, o próprio universo
funciona como um relógio cósmico. Outra forma de expressar isso é dizer que a coordenada t é o tempo
próprio medido por um observador ligada a uma galáxia qualquer do universo.
Na verdade, um espaço maximamente simétrico é definido como tendo um tensor de curvatura da forma
(20.6). O tensor de Ricci é dado por,
1 dA(r) r r sen2 θ
Γrrr = , Γrθθ = − , Γrφφ = − ,
2A(r) dr A(r) A(r)
1
Γθrθ = Γrrφ = , Γθφφ = − sen θ cos θ , Γφφθ = cot θ .
r
O tensor de Ricci é dado em termos dos coeficientes da conexão por
logo,
1 dA 1 dA
= 2K A → = 2K r . (20.7)
r A dr A2 dr
Usando Rθθ = 2K gθθ , temos
r dA 1
1+ 2
− = 2K r 2 . (20.8)
2A dr A
Assim,
1
A(r) = . (20.9)
1 − K r2
Então, o intervalo elementar dσ 2 será
dr 2
dσ 2 = 2
+ r 2 dθ 2 + sen2 θdφ2 , (20.10)
1−Kr
em que a constante K poderá ser positiva, negativa ou nula. Redefinindo R e r:
p R2 (t) K
r̄ = |K| r , R̄2 (t) = e k= .
|K| |K|
Esquecendo as barras em R e r, é fácil mostrar que o elemento de linha será dado por,
2 2 2 dr 2 2 2 2 2
ds = dt − R (t) + r dθ + sen θdφ , (20.11)
1 − k r2
em que k = −1, 0, +1 dependendo da curvatura ser negativa, nula ou positiva, respectivamente e os coefi-
cientes
R2 (t)
gtt = 1 , grr = − , gθθ = −R2 (t) r 2 , gφφ = −R2 (t) r 2 sen2 θ .
1 − k r2
A Eq. (20.11) é conhecida como elemento de linha de Friedmann-Robertson-Walker.15 Agora estudaremos
a métrica de Friedmann-Robertson-Walker, também conhecida como métrica de Friedmann-Lemaître-Ro-
bertson-Walker,16 para cada caso de k:17
Curvatura espacial positiva: k = +1 – Neste caso, vemos que o coeficiente de dr na métrica de Fried-
mann-Robertson-Walker se torna singular quando r → 1. Portanto, introduziremos uma nova coor-
denada radial χ, definida pela relação
1
r = sen χ ⇒ dr = cos χ dχ = 1 − r 2 2
dχ ,
w = R cos χ
x = R sen χ sen θ cos φ
y = R sen χ sen θ sen φ
z = R sen χ cos θ .
w 2 + x2 + y 2 + z 2 = R 2 .
0 ≤ χ ≤ π, 0 ≤ θ ≤ π, 0 ≤ φ ≤ 2π .
Tal como o perímetro de uma circunferência, traçada sobre uma esfera, aumenta ao irmos do polo
norte norte (θ = 0) ao equador (θ = π/2), e depois começa a decrescer ao irmos do equador ao polo
sul (θ = π), A(χ) tem um valor máximo quando χ = π2 , i.e., A(χ) = 4π R2
Finalmente, o volume total de S 3 é dado por
Z π Z π Z 2π
V = (R dχ) (R sen χ dθ) (R sen χ sen θ dφ) = 2π 2 R3 ,
χ=0 θ=0 φ=0
em que neste caso, R é frequentemente referido como o raio do universo. O caso k = +1 corresponde
à um espaço esférico, fechado, de volume finito e curvatura positiva, i.e., para k = +1 temos uma
hiperesfera. O espaço-tempo apresenta uma topologia do tipo cilíndrico, R × S 3 , com R representado
o eixo temporal.
Curvatura espacial zero: k = 0 – Neste caso, se r = χ, consistente com nossa notação, o elemento de
linha será
dσ 2 = R2 dχ2 + χ2 dθ 2 + sen2 θ dφ2 ,
na qual é simplesmente o espaço euclidiano tridimensional ordinário. Sob a transformação,
Curvatura espacial negativa: k = -1 – Neste caso, é conveniente introduzir a coordenada radial χ como
1
r = senh χ ⇒ dr = cosh χ dχ = 1 + r 2 2 dχ ,
com a parte espacial do elemento de linha dada por
dσ 2 = R2 dχ2 + senh2 χ dθ 2 + sen2 θ dφ2 .
Se introduzirmos a transformação de coordenadas
w = R cosh χ
x = R senh χ sen θ cos φ
y = R senh χ sen θ sen φ
z = R senh χ cos θ ,
na qual
0 ≤ χ ≤ ∞, 0 ≤ θ ≤ π, 0 ≤ φ ≤ 2π ,
é fácil verificar que
w 2 − x2 − y 2 − z 2 = R 2
e que o elemento de linha para este caso será
dσ 2 = dw2 − dx2 − dy 2 − dz 2 .
Este é o caso de um espaço hiperbolóide tridimensional, aberto, embebido em um espaço quadridi-
mensional de Minkowski. A área é dada por
A(χ) = 4πR2 senh2 χ ,
na qual cresce indefinidamente a medida que χ cresce. Finalmente, o seu volume total é infinito e a
curvatura constante é negativa, para k = −1 temos uma hiper-hiperbólica.
A partir da discussão acima, vemos que uma forma conveniente para a métrica de Friedmann-Robertson-
-Walker é
ds2 = dt2 − R2 (t) dχ2 + S 2 (χ) dθ 2 + sen2 θdφ2 , (20.12)
em que a função r = S (χ) é dada por
sen χ se k = +1 ,
S (χ) = χ se k = 0 , (20.13)
senh χ se k = −1 .
Mais uma vez, (χ, θ, φ) são coordenadas comóvel.
Um cálculo direto permite obter Rνµ :
R̈
R00 = +3
R
!2
R̈ Ṙ 2 S ′′
R11 = + 2 −
R R R2 S
!2 " ′ 2 #
R̈ Ṙ 1 S ′′ S 1
R22 = +2 − 2 + − 2
R R R S S S
R33 = R22 ,
“Z_2” — 2017/9/5 — 8:19 — page 561 — #581
em que o sinal (−) aplica-se no caso do raio luminoso que se dirige da fonte para o observador. Integrando
esta expressão desde um tempo de emissão te até um tempo de observação to , temos
Z to
dt
Z o
dr sen−1 re se k = +1 ,
=− √ = f (re ) = r se k = 0 , (20.17)
te R(t) re 1 − kr 2 e −1
senh r se k = −1 , e
em que f (re ) é uma função independente do tempo, pois as coordenadas em um sistema comóvel mantêm-
-se fixas. Considerando um segundo raio luminoso que começa sua trajetória em um pequeno instante após
o primeiro, te + dte , este segundo raio chegará no observador em to + dto , como f (re ) é independente do
tempo, verifica-se
Z to +dto Z to Z to +dto Z te +dte
dt dt dt dt
= → = ,
te +dte R(t) te R(t) to R(t) te R(t)
ou seja,
dto dte dto νe R(to )
= → = = .
R(to ) R(te ) dte νo R(te )
Considerando o desvio espectral medido por
νe − νo
z= ,
νo
temos
νe R(to )
1+z = = , (20.18)
νo R(te )
que é justamente desvio para o vermelho que implica que a função R(t) é crescente, i.e., o universo encontra-
-se em expansão. Este foi precisamente o desvio medido por Hubble em 1929. 19 Se
caracterizando este fato como um desvio de origem cosmológica, causado pela expansão do universo.
Parâmetros de Hubble e da Desaceleração Se supormos que uma galáxia emite fótons em um tempo
cósmico t não muito diferente, à escala cosmológica, de t0 ≡ to , podemos escrever t = t0 − δt, em que
δt ≪ t0 . Fazendo uma expansão em série de Taylor do fator de escala R(t) em torno da presente época, i.e.,
t0 , temos
~r = R(t)~r0 ,
19
E. Hubble, Proceedings of the National Academy of Sciences 15 (3), 168-173 (1929).
“Z_2” — 2017/9/5 — 8:19 — page 563 — #583
Ṙ(t)
~r˙ = Ṙ(t)~r0 → ~r˙ = ~r ,
R(t)
mas
Ṙ(t)
~v(t) = H (t)~r(t) → H (t) = ,
R(t)
sendo H (t) o parâmetro de Hubble.
É importante ressaltar que, como se poderia esperar nesta aproximação, as Eqs. (20.20) e (20.21) dependem
apenas da atual valor dos parâmetros de Hubble e de desaceleração, H0 e q0 , e, portanto, podem ser avaliadas
sem o conhecimento da completa história da expansão de R(t) do universo.
Usando a expansão de Taylor (20.19), podemos também obter uma expressão aproximada para a coor-
denada χ das galáxias emissoras, que será dada pela relação
Z t0 Z t0
dt
χ= = R0−1 [1 − (t0 − t) H0 − · · · ]−1 dt .
t R(t) t
A primeira parte dentro do colchete representa a distância própria para o universo estático, enquanto a
segunda parte representa a correção pela expansão do universo.
Gostaríamos então de escrever a série em função de z. Então, usando (20.21) e substituindo na expressão
(20.22) para χ, obtemos
1
χ= z − 12 (1 + q0 ) z 2 + · · · . (20.23)
H0 R0
A partir da métrica de Friedmann-Robertson-Walker, vemos que a distância d adequada à galáxia emi-
tindo em t0 é d = R0 χ. Assim, para galáxias muito próximas, d ≈ c (t0 − t).20 Além disso, a partir
20
Aqui estamos usando a velocidade da luz c no lugar de c = 1.
“Z_2” — 2017/9/5 — 8:19 — page 564 — #584
de (20.20), neste caso temos z ≈ (t0 − t) H0 . Então, se interpretamos o desvio para o vermelho cos-
mológico como um deslocamento Doppler devido a uma velocidade v das galáxias emissores, obteríamos
v = c z = H0 d, na qual é aproximadamente válida para qualquer z pequeno. Assim, considerando c = 1,
temos a forma
z ≃ H0 d , (20.24)
que nada mais é do que a famosa lei de Hubble, em que H0 é a constante de Hubble, válida para galáxias
não muito longínquas em termos cosmológicos. Devido às incertezas nas determinações de H0 , é costume
indicar o seu valor na forma,21
H0 = 100 h km s−1 Mpc−1 ,
em que h é definido no intervalo 0, 5 ≤ h ≤ 1. Um dos projetos chave do telescópio espacial Hubble
foi a determinação de H0 através da combinação de uma série de métodos de medida de distância. Eles
utilizaram e calibraram a escala de distância baseada em cefeidas e aplicaram uma série de outros métodos
para medir galáxias mais distantes.22 Os resultados deste projeto foram: H0 = 71 ± 2 ± 6, a partir de
supernovas do tipo Ia; H0 = 71 ± 3 ± 7, da relação de Tully-Fisher;23 H0 = 70 ± 5 ± 6, das flutuações de
brilho superficial; H0 = 72 ± 9 ± 7, de supernovas do tipo II e H0 = 82 ± 6 ± 9. A contribuição destes
resultados, devidamente pesados, resulta em H0 = 72 ± 8 km s−1 Mpc−1 , i.e., h = 0, 72 ± 0, 08, valor
atualmente adotado como padrão, ver Fig. 20.3.24
Um dos mais surpreendentes resultados obtidos pelo telescópio espacial Hubble, utilizando supernovas
como indicadores de distância, foi encontrar, a partir da Eq. (20.23), um valor negativo para q0 , indicando
um universo em aceleração no momento atual, R̈0 > 0, contrariando a todas as expectativas. A matéria
usual é atrativa, e esperava-se um universo com R̈0 < 0. Daí a importância deste resultado.25 Fundamen-
talmente, a luminosidade de uma anã branca que explode é uma boa vela padrão para que a distância destas
supernovas possam ser estimadas e elas permitem que mais dados possam aparecer no gráfico d × z, com
maiores valores de d e de z, para que em particular, o termo não linear em (20.23) pode ser encontrados com
alguma precisão. Surpreendentemente, q0 acaba sendo negativo, i.e., a expansão do universo está acelerando
na verdade e não o contrário. A intuição newtoniana falha aqui, mas verifica-se que este cenário não é novo
na cosmologia. Einstein apresentou sua famosa constante cosmológica Λ para resolver um problema que
desapareceu, mas Λ corresponde exatamente a uma expansão acelerada.
Distância Para objetos distantes, temos que ter mais cuidado com o que entendemos por distância:
Distância métrica Primeiro definiremos uma distância que não é realmente observável, mas que será útil
na definição de distâncias observáveis. Considere a métrica de Friedmann-Robertson-Walker
ds2 = dt2 − R2 (t) dχ2 + S 2 (χ) dΩ2 ,
21
Mpc é a representação da unidade megaparsec valendo um milhão de parsecs, sendo que o parsec vale
ou seja, 1 pc = 206265 UA, UA é unidade astronômica, e, uma unidade astronômica vale 1, 49598 × 1011 m.
22
Uma cefeida é uma estrela gigante ou supergigante amarela, de 4 a 15 vezes mais massiva que o Sol e de 100 a 30000 vezes mais
brilhante, cuja luminosidade varia de 0,1 a 2 magnitudes segundo um período bem definido, compreendido entre 1 e 100 dias,
de onde ela tira seu nome de estrela variável. Elas foram chamadas segundo o protótipo de estrela Delta Cephei da constelação
de Cepheus.
23
Richard Brent Tully (1943- ), astrônomo canadense-americano.
James Richard Fisher (1943- ), astrônomo americano.
Em astronomia, a relação Tully-Fisher é uma relação empírica entre a luminosidade intrínseca de uma galáxia espiral e a largura
das suas linhas de emissão (a medida de sua velocidade de rotação), foi publicado em 1977 por astrônomos R. Brent Tully e J.
Richard Fisher, Astronomy and Astrophysics 54 (3), 661-673 (1977).
24
W. L. Freedman et al., The Astrophysical Journal 553, 47-72 (2001).
25
S. Perlmutter, Physics Today 56 (4), 53-60 (2003).
“Z_2” — 2017/9/5 — 8:19 — page 565 — #585
Figura 20.3 Acima: velocidade versus distância de galáxias. Abaixo: valor de H0 em função da distân-
cia.
dm = R(t) S (χ) .
A expansão afeta nossa percepção sobre os fótons incidentes de duas formas: eles sofrem o efeito
Doppler, perdendo energia; e a frequência com que esses atingem a superfície da Terra é reduzida.
Ambos os efeitos são inversamente proporcionais ao fator de escala. Se a fonte está a uma distância
R0 S (χ) de nós, a densidade de fluxo de radiação será
L(t1 )
F (t0 ) = ,
4π [R0 S (χ)]2 (1 + z)2
de onde concluímos que
dL = R0 S (χ) (1 + z) .
Esta é uma quantidade importante, que pode ser usada na prática, mas note que isto depende da
evolução temporal do fator de escala por meio da dependência em χ e do desvio para o vermelho z.
Na Fig. 20.4 temos a geometria associada com a definição da distância de luminosidade.
Distância de diâmetro angular Às vezes, podemos fazer uso de régua padrão, i.e., objetos de tamanho
físico conhecido D. Vamos assumir mais uma vez que o objeto está a uma distância comóvel R(t) χ
e os fótons que observamos hoje foram emitidos no tempo t1 . Um astrônomo simples decidi medir
a distância dA ao objeto medindo seu tamanho angular δθ e usando a fórmula euclidiana para a sua
distância,
D
dA = .
δθ
Esta quantidade é conhecida como distância de diâmetro angular, que está definida na Fig. 20.5.
A métrica de Friedmann-Robertson-Walker implica que a seguinte relação entre o tamanho físico
transversal do objeto e seu tamanho angular no céu
D = R(t1 ) S (χ) δθ ,
tal que
R(t1 ) R(t0 ) S (χ)
dA = R(t1 ) S (χ) = R(t0 ) S (χ) = .
R(t0 ) 1+z
Então, a distância de diâmetro angular é dada por
R0 S (χ)
dA = .
1+z
“Z_2” — 2017/9/5 — 8:19 — page 567 — #587
Figura 20.6 Distância medidas em um universo plano, com matéria apenas (linhas pontilhadas) e com
70% de energia escura (linhas sólidas).
A Fig. 20.6 mostra a dependência do desvio para o vermelho das três medidas de distância, dm , dL e
dA . Observe que todas as três distâncias são maiores em um universo com energia escura, i.e., na forma de
uma constante cosmológica Λ, do que em um universo sem a energia escura. Este fato foi empregado na
descoberta da energia escura.
Horizontes Teorias modernas de cosmologia exibe horizontes de dois tipos diferentes, na qual limitam as
distâncias em que eventos passados podem ser observados ou em que nunca será possível observar eventos
futuros. Estes são chamados de horizonte de partículas e horizonte de eventos, respectivamente.27
De acordo com a Eq. (20.17)
Z t0 Z r1
dt dr
= √ = f (r1 ) ,
t1 R (t) 0 1 − kr 2
então a distância real entre a origem espacial e uma partícula situada em r1 , no tempo t, é dada por
Z r1
dr
ℓ(t) = R(t) √ = R(t) f (r1 ) .
0 1 − kr 2
27
W. Rindler, Monthly Notices of the Royal Astronomical Society 116, 662 (1956).
“Z_2” — 2017/9/5 — 8:19 — page 568 — #588
e converge para um valor finito f0 . Logo, f (r0 ) = f0 , i.e., o fóton emitido em r0 , no tempo t0 , atinge a
origem, aonde se encontra o observador, em um tempo infinito. Com efeito,
Z ∞
dt
f (r) = f (r0 ) − = f (r0 ) − f0 = 0 .
t0 R(t)
Fótons emitidos no tempo t0 e afastados da origem por uma distância f (r) > f (re ), nunca serão observa-
dos pelo observador que se encontra na origem. Assim, f (r0 ) = f0 define uma região que chamamos de
horizonte de eventos, pois ela separa eventos observáveis de eventos nunca observáveis.
Um exemplo de universo em que este fenômeno ocorre é quando podemos escrever o elemento de linha
como
ds2 = dt2 − eHt dx2 + dy 2 + dz 2 ,
em que R(t) = eHt , com H constante. Esta é a conhecida geometria de de Sitter. 28 Neste caso,
Z ∞
e−Ht0
dt e−Ht = = Σ0 ,
t0 H
o modelo de de Sitter não tem singularidade do big-bang em um tempo finito no passado, i.e., a idade do
universo neste caso é infinita.
Voltamos agora para fenômenos já observados desde a origem dos tempos, t = 0, até um dado valor t0 .
Um fenômeno arbitrário terá sido observado por um observador se a distância f (r) se anulou. Temos agora
Z t0
dt
f (r) = f (re ) − .
0 R(t)
ainda não foram observadas pelo nosso observado que está na origem.
28
Willem de Sitter (1872-1934), matemático, físico e astrônomo holandês.
W. de Sitter, Proc. Koninklijke Nederlandse Akademie van Wetenschappen 19, 1217-1225 (1917); Ibidem, 20, 229-243 (1917);
Idem, Monthly Notices of the Royal Astronomical Society 78, 2 (1917).
“Z_2” — 2017/9/5 — 8:19 — page 569 — #589
!2
R̈ Ṙ k
G11 = G22 = G33 = −2 − − .
R R R2
“Z_2” — 2017/9/5 — 8:19 — page 570 — #590
Assim, usando as equações de campo de Einstein Gµν − Λ gµν = −8π G Tµν quando temos o tensor
energia-momentum isotrópico e homogêneo, após pequena álgebra, temos
Ṙ2 k Λ 8π G
2
+ 2− = ρ (20.25)
R R 3 3
R̈ Ṙ2 k
2 + + − Λ = −8πG p , (20.26)
R R2 R2
em que k ∈ {−1, 0, 1} é o símbolo da curvatura espacial. É fácil verificar que das Eqs. (20.25) e (20.26)
encontramos
!2
Ṙ k
3 + 3 2 = 8π G ρ + Λ (20.27)
R R
R̈ 4π G Λ
=− (ρ + 3p) + . (20.28)
R 3 3
Estas duas equações diferenciais determinam a evolução temporal do fator de escala R(t) e são conhecidas
como equações de Friedmann-Lemaître. No caso em que Λ = 0, estas equações são conhecidas como
equações de Friedmann. Em uma primeira aproximação, estas equações servem como modelo cosmológico
convencional do para a teoria do big-bang.
Para um determinado modelo do universo, as Eqs. (20.27) e (20.28) são suficientes para determinar R(t).
No entanto, podemos derivar uma equação, tão importante como as anteriores, útil em cálculos rápidos, a
partir do fato de que a conservação da energia-momentum exige
T µν ;µ = 0 .
O nosso tensor energia-momentum isotrópico e homogêneo requer que ρ e p dependam somente de t. Logo,
as componentes deste tensor na métrica de Friedmann-Robertson-Walker tem a forma
∂T 0µ
0 = T 0µ ;µ = + Γ0µν T νµ + Γµµν T 0ν
∂xµ
∂T 00
= + Γ0ij T ij + Γii0 T 00 ,
∂t
já que
Ṙ
Γ0ij = RṘg̃ij e Γij0 = δij ,
R
temos
Ṙ
ρ̇ + 3
(ρ + p) = 0 . (20.29)
R
A relação anterior é também conhecida por equação do fluido, pois assume a mesma forma da equação
da continuidade para um fluido em um sistema comóvel. De acordo com ela, contribuem com a variação
da densidade de energia, a mudança no volume espacial, bem como o trabalho realizado pela pressão com
“Z_2” — 2017/9/5 — 8:19 — page 571 — #591
a expansão. Esta equação não é linearmente independente das anteriores, podendo ser obtida através da
derivada temporal da Eq. (20.27), combinada com a Eq. (20.28). Admite-se que a pressão depende exclusi-
vamente das características de sua componente, p = p(ρ). Geralmente, assume-se uma equação de estado
barotrópica para os componentes,
p = ωρ,
em que o parâmetro ω pode ser constante ou variar com o tempo. Neste caso, a solução da Eq. (20.29) será
ρ ∝ R−3(1+ω) , (20.30)
na qual temos a evolução da densidade ρ como função do fator de escala R(t). Nota-se que em geral ρ é a
densidade de energia do fluido. Em particular temos,
• Quando ω = 0, i.e., p = 0, temos poeira ou a também chamada matéria fria, e a densidade será
ρ ∝ R−3 ;
ρ
• Quando ω = 31 , i.e., p = 3, temos radiação ou a também conhecida matéria quente, para a densidade
encontramos
ρ ∝ R−4 ;
• Quando ω = −1, i.e., p = −ρ, na qual ρ é uma constante, conhecido tanto como a constante cosmológica
ou a energia do vácuo.
Estes resultados se aplicam separadamente para coexistência de matéria fria, de matéria quente e de uma
constante cosmológica, desde que não haja intercâmbio de energia entre as diferentes componentes. Mais
adiante, estas componentes serão utilizadas em conjunto com as equações de campo de Einstein para o
estudo da dinâmica da expansão cósmica.
Quando a constante cosmológica Λ for nula, podemos caracterizar um modelo cosmológico através de
uma medida de densidade de energia contida no universo nos dias de hoje. Da eq. (20.27), quando Λ = 0,
temos
8π G
k= ρ R2 − Ṙ2
3
8π G 2
= R (ρ − ρc ) ,
3
ρ > ρc ⇒ k>0 ⇒ k = +1 ,
ρ = ρc ⇒ k = 0,
ρ < ρc ⇒ k<0 ⇒ k = −1 .
Modelo Cosmológico de Einstein A proposta de Einstein, 1917, para o universo partiu de que este fosse
estático. A matéria, fonte principal da curvatura do espaço-tempo, é descrita por um fluido incoerente, i.e.,
sem qualquer interação entre suas partes, de densidade ρ e velocidade comóvel uµ = (1, 0, 0, 0). O modelo
cosmológico de Einstein é estático, não possui nem expansão, nem rotação e nem deformação alguma, não
evolui.29 Mas tal universo é incompatível com as equações originais de Einstein para gravitação de 1915.30
Sendo um modelo estático, devemos ter
Rµν uµ uν = 0 . (20.32)
É fácil observar que para termos a conservação de energia, será preciso que Λ seja constante. Assim,
µ ν µ ν 1
Rµν u u = −κ Tµν u u − T + Λ
2
κ
= − ρ + Λ = 0,
2
ou seja,
κ 2
−
ρ+Λ=0 ⇒ ρ = Λ, (20.35)
2 κ
em que κ = 8π G. Mostramos assim a possibilidade de compatibilizar as novas equações de gravitação com
um fluido estacionário. Por sua vez, na solução encontrada por Einstein, ele supôs que a métrica do espaço,
caracterizada pelo tensor métrico, era ligeiramente diferente da métrica euclidiana. A métrica de Einstein é
dada por
ds2 = dt2 − R2 dχ2 + S 2 (χ) dθ 2 + sen2 θdφ2 ,
29
A. Einstein, Sitzungsberichte der Königlich Preussische Akademie der Wissenschaften, 1, 142-152 (1917).
30
A. Einstein, Sitzungsberichte der Königlich Preussische Akademie der Wissenschaften (Berlin), 2, 844-847 (1915).
“Z_2” — 2017/9/5 — 8:19 — page 573 — #593
em que R é uma constante, i.e., universo estático, e S (χ) uma função a ser determinada. Usando as relações
já determinadas para Rνµ ,
R̈
R00 = +3
R
!2
R̈ Ṙ 2 S ′′
R11 = + 2 −
R R R2 S
!2 " ′ 2 #
R̈ Ṙ 1 S ′′ S 1
R22 = +2 − 2 + − 2 = R33
R R R S S S
e " #
R̈ Ṙ2 k
R=6 + 2+ 2 ,
R R R
obtemos, da Eq. (20.33), as seguintes componentes:
• Componente (0-0)
k
3 = 8π G ρ + Λ ;
R2
• Componente (1-1)
1 S ′′
2 + 3k = Λ;
R2 S
• Componente (2-2)
1 S ′′
= −Λ ,
R2 S
em que usamos o fato de que
" #
1 (3) 1 2S ′′ S ′ 2 1
k= R=− + 2 − 2 .
6 3 S S S
quanto o tempo eram curvos. É o chamado modelo cosmológica de de Sitter, caracterizado pela métrica de
de Sitter, 31
ds2 = cos2 χdt2 − R2 dχ2 + sen2 χdθ 2 + sen2 χ sen2 θdφ2 ,
q
3
em que 0 ≤ χ ≤ π e R = Λ . Registre-se que o modelo de de Sitter é pseudoestático e não tem
nenhuma singularidade do big-bang, i.e., a idade do universo é infinita. Podemos dizer que este é um modelo
estacionário.
Modelo Cosmológico de Lemaître Nos anos de 1920, Lemaître investigou modelos cosmológicos ho-
mogêneos e isotrópicos nos quais a constante cosmológica Λ é diferente de zero, introduzindo um universo
não estático como solução das equações de Einstein, afirmando que o universo está em expansão. Este é o
chamado modelo cosmológico de Lemaître. 32 .
Vamos começar considerando o caso em que a densidade de energia da matéria seja desprezível, quando
comparada com o valor de Λ. Assim, num procedimento análogo ao anterior, as equações de Einstein, neste
caso, são !2
Ṙ k
3 +3 2 =Λ
R R
e !2
R̈ Ṙ 1 S ′′
2 + − = Λ.
R R R2 S
Vamos analisar os três possíveis valores de k.
• No caso em que k = 0 e S = χ, temos
!2
Ṙ k
3 +3 =Λ (20.36)
R R2
e !2
R̈ Ṙ 1 S ′′
2 + − = Λ. (20.37)
R R R2 S
e !2
R̈ Ṙ 1
2 + − = Λ. (20.39)
R R R2
Análogo ao caso anterior, encontramos
r r !
3 Λ
R(t) = senh t ,
Λ 3
em que Λ > 0.
e !2
R̈ Ṙ 1
2 + + = Λ. (20.41)
R R R2
Novamente, análogo ao primeiro caso, temos
s r !
3 |Λ|
R(t) = senh t ,
|Λ| 3
Modelo Cosmológico de Friedmann Nas equações de campo, (20.27)-(20.28), quando temos o caso
particular em que Λ = 0, encontramos a chamado modelo cosmológico de Friedmann. 33 Assim, aquelas
equações se reduzem nas conhecidas equações de Friedmann, i.e.,
!2
Ṙ k
+3 = 8π G ρ (20.42)
R R2
R̈ 4π G
=− (ρ + 3p) , (20.43)
R 3
em que ρ e p são as densidades de energia e de pressão, respectivamente.
Existe uma série de terminologia associadas com os parâmetros cosmológicos. Aqui, vamos apenas
apresentar o básico. A taxa de expansão é caracterizado pelo parâmetro de Hubble,
Ṙ
H= .
R
33
A. Friedmann, Zeitschrift für Physik 10, 377-386 (1922).
“Z_2” — 2017/9/5 — 8:19 — page 576 — #596
R R̈
q=− ,
Ṙ2
que mede a taxa de alteração da taxa de expansão.
Outra quantidade importante e o parâmetro de densidade,
8π G ρ
Ω= 2
ρ= ,
3H ρc
ρ > ρc ⇒ Ω>1 ⇒ k = +1 ,
ρ = ρc ⇒ Ω=1 ⇒ k = 0,
ρ < ρc ⇒ Ω<1 ⇒ k = −1 .
É possível resolver as equações de Friedmann de forma exata em vários casos mais simples, mas é
muitas vezes mais útil conhecer o comportamento qualitativo das várias possibilidades. Por momento vamos
considerar Λ = 0 e considerar o comportamento do universo cheio de fluidos de energia positiva, ρ > 0,
e pressão não negativa, p ≥ 0. Então, pela Eq. (20.43) temos R̈ < 0. Como sabemos que a partir de
observações de galáxias distantes, o universo está em expansão, Ṙ > 0, isto significa que o universo está
desacelerando. Isto é o que devemos esperar, uma vez que a atração gravitacional da matéria no universo
funciona contra o expansão. O fato de que o universo só pode desacelerar significa que ele deve ter se
expandido ainda mais rápido no passado; se traçarmos a evolução para trás no tempo, necessariamente
chegaremos a uma singularidade em R = 0. Observe que se R̈ fosse exatamente zero, R(t) seria uma linha
reta, e a idade do universo seria H0−1 , veja Fig. 20.7. Uma vez que R̈ é presentemente negativo, o universo
deve ser um pouco mais jovem do que isto.
Esta singularidade em R = 0 é o conhecido big-bang. Ela representa o início do universo a partir
de um estado singular, não uma explosão de matéria em um espaço-tempo pré-existente. Pode-se esperar
que a simetria perfeita de nosso universo de Friedmann-Lemaître-Robertson-Walker foi responsável por
essa singularidade, mas na verdade isto não é verdade; os teoremas de singularidade prevêem que qualquer
universo com ρ > 0 e p ≥ 0 deve ter começado em uma singularidade. É claro que a densidade de
energia torna-se arbitrariamente alta como R → 0, cosmólogos modernos não esperam que a relatividade
geral clássica seja uma descrição precisa da natureza neste regime; esperam que uma teoria consistente da
gravidade quântica seja capaz de fixar estes problemas.34
A evolução futura é diferente para diferentes valores de k. Para os casos abertos e planos, k ≤ 0, a Eq.
(20.42) implica em
8π G
Ṙ2 = ρ R2 + |k| . (20.45)
3
34
para maiores detalhes ver S. M. Carroll, Space and Geometry - An introduction to general relativity (2004).
“Z_2” — 2017/9/5 — 8:19 — page 577 — #597
Figura 20.7 Diagrama ilustrativo, para todos os modelos de Friedmann, a idade do universo é menor
do que o tempo de Hubble 1/H0 .
O lado direito é estritamente positivo, uma vez que estamos supondo ρ > 0, portanto, Ṙ nunca passa por
zero. Desde que sabemos que hoje ȧ > 0, isto deverá ser positivo para todos os tempos. Assim, os universos
aberto e plano expandem para sempre, eles são temporalmente bem como espacialmente aberto.
Quão rápido estes universos continuam expandindo? Considere a quantidade ρ R3 , que é constante em
universos dominado pela matéria. Usando a Eq. (20.29), temos
!
d Ṙ
ρ R3 = R3 ρ̇ + 3ρ
dt R
= −3p R2 Ṙ . (20.46)
d
ρ R3 ≤ 0 .
dt
Isto implica, por sua vez, que ρ R2 deve ir a zero em um universo em constante expansão, como R → ∞.
Assim, a relação (20.45) nos diz que
Ṙ2 → |k| . (20.47)
Assim, para k = −1 a expansão se aproxima do valor limite Ṙ → 1, enquanto que para k = 0, o universo
continua a se expandir, mas cada vez mais lentamente.
Para um universo fechado, a Eq. (20.42) implica em
8π G
Ṙ2 = ρ R2 − 1 . (20.48)
3
Nota-se que ρ R2 → 0 como R → ∞ ainda se aplica; mas, neste caso (20.48) passaria a ser negativa, o
que não pode acontecer. Portanto, o universo não se expande indefinidamente; R possui um limite superior
Rmáx . Como R se aproxima Rmáx , temos
4π G
R̈ → − (ρ + 3p) Rmáx < 0 . (20.49)
3
“Z_2” — 2017/9/5 — 8:19 — page 578 — #598
Como R̈ é finito e negativo neste ponto, então, R alcança Rmáx e começa a decrescer, depois do que, uma
vez que R̈ < 0, irá inevitavelmente continuar a contração até zero, este é o chamado big-crunch.35 Portanto,
em universos fechados, com ρ > 0 e p ≥ 0, são fechados tanto no tempo assim como no espaço.
Na Fig. 20.8, temos a ilustração esquemática da evolução do fator de escala R(t) para os três casos;
Figura 20.8 Ilustração esquemática da evolução do fator de escala R(t) em modelos de Friedmann
aberto, plano e fechado.
aberto quando k = −1, plano para k = 0 e finalmente fechado quando temos k = +1.
Neste ponto, vamos listar algumas das soluções exatas correspondentes a apenas um tipo de densidade
de energia. Para o universo apenas constituído de poeira, p = 0, é conveniente definir um ângulo de desen-
volvimento φ(t), em vez de utilizar o parâmetro t diretamente. Logo, as soluções são,
C
R= (cosh φ − 1)
2
C
t = (senh φ − φ) ,
2
• Universo plano, k = 0,
1
9C 3 2
R= t3 ,
4
C
R= (1 − cos φ)
2
C
t = (φ − sen φ) ,
2
R= C′ 1+ √ −1 ,
C′
• Universo plano, k = 0,
1 1
R = 4C ′ 4
t2 ,
8π G
em que C ′ = 3 ρ R4 = constante.
Análise Geral Dada a forma como a densidade de energia ρ de cada espécie evolui com o fator de escala
cósmico R, então, a primeira equação de Friedmann (20.42) determina como o fator de escala R(t) evolui
Ṙ
com o tempo cósmico t. Se o parâmetro de Hubble H ≡ R é expresso como uma função do fator de escala
R, então o tempo cósmico t pode ser expresso em termos de R como
Z
dR
t= . (20.50)
RH
No caso em que a densidade é constituído por radiação, matéria e vacuum, a densidade crítica será
ρc = ρk + ρr + ρm + ρΛ ,
ou seja,
k
ΩΛ + Ωm + Ωr + Ωk = 1 , com Ωk = − , (20.52)
R02 H02
e, a Eq. (20.51) será
H (t) p
= ΩΛ + Ωk R−2 + Ωm R−3 + Ωr R−4 ,
H0
em que Ωx representam seus valores no momento atual. Para as densidades compostas de radiação, de
matéria e de vacuum, substituímos a equação anterior em (20.50),
Z
1 dR
t= p , (20.53)
H0 R ΩΛ + Ωk R−2 + Ωm R−3 + Ωr R−4
Em 1998, duas equipes, a Supernova Cosmology Project e a High-z Supernova Search Team, reali-
zam uma revolução que levou ao modelo padrão da cosmologia.36 Eles relataram que as observações da
36
S. Perlmutter et al., Astrophysical Journal, 517, 565-586 (1999); A. G. Riess et al., Astronomical Journal, 116, 1009-1038
(1998).
“Z_2” — 2017/9/5 — 8:19 — page 581 — #601
supernova tipo Ia em alto valor de z indicava que o universo não está apenas em expansão, mas tam-
bém acelerando. A aceleração requer que a densidade de massa-energia do universo será dominado no
momento atual por uma componente gravitacional repulsiva, como a constante cosmológica Λ. Estes resul-
tados são apresentados na Fig. 20.9. Com um nível de confiança de 99%, para dados cosmológicos plano
com Ωk = Ωr = 0, então ΩΛ + Ωm = 1, indicando um valor
Ωm = 0, 28+0,09 +0,05
−0,08 (1σ estatístico) −0,04 (sistemático) .
Figura 20.10 Evidência para energia escura, módulo da distância versus o deslocamento para o ver-
melho z.
“Z_2” — 2017/9/5 — 8:19 — page 582 — #602
deslocamento para o vermelho z para as amostras de supernovas combinando os resultados da High-z Su-
pernova Search Team (dados pelos círculos fechados) e da Supernova Cosmology Project (dados pelos
círculos abertos). Os resultados observacionais são comparados com os resultados esperados para três mo-
delos de universo. O primeiro deles com Ωm = 1, 0 e q0 = 0, 5, o segundo com Ωm = 0, 3 e q0 = 0, 15
e finalmente o terceiro com ΩΛ = 0, 7 e q0 = −0, 55. Os resultados que melhor se ajustam combinam
com o terceiro modelo. A parte inferior da figura, mostra este resultado mais claramente.37 O melhor ajuste
combinado para um universo cosmológico plano é Ωm = 0, 28 ± 0, 10 e ΩΛ = 1 − Ωm , dando uma idade
para o universo na ordem de (14, 2 ± 1, 5) × 109 anos.
Trabalhos recentes do grupo WMAP,38 de acordo com os modelos atuais do universo, após nove anos
de observações, mostram os resultados que estão dados na Tabela 20.1.39
A presente idade do universo t0 , desde o big-bang, como sabemos, pode ser derivada a partir da Eq.
(20.53) e dos parâmetros cosmológicos, dados na Tabela 20.1. Assim, a idade do universo será
Este resultado vai de encontro com t0 = (13, 77 ± 0, 06) × 109 anos, se assumirmos que o universo é plano.
Problemas
20.1 Em um espaço de Friedmann-Robertson-Walker em expansão, uma bala é disparada com velocidade
v1 relativamente a um observador comóvel. Suponhamos que, entretanto, o universo se expande com
um fator RR1 = 1 + z; a bala terá uma velocidade v2 em relação a observadores comóveis no instante
2
t2 . Determine v2 em função de v1 e de z.
20.5 Em um espaço euclidiano quadridimensional com coordenadas (w, x, y, z), uma hiperesfera de raio
R é definida por w2 + x2 + y 2 + z 2 = R2 . Mostre que a métrica nesta superfície pode ser escrita na
forma
dσ 2 = R2 dχ2 + sen2 χ dθ 2 + sen2 θ dφ2 .
Mostre que o volume total desta superfície é dado por V = 2π 2 R3 .
20.6 Em um espaço de Minkowski quadridimensional com coordenadas (w, x, y, z), uma hiper-hiperbólica
é definida por w2 − x2 − y 2 − z 2 = R2 , em que R é o raio de curvatura. Mostre que a métrica nesta
superfície pode ser escrita na forma
dσ 2 = R2 dχ2 + senh2 χ dθ 2 + sen2 θ dφ2 .
20.7 Em coordenadas comóveis [xµ ] = (t, r, θ, φ), a métrica de Friedmann-Robertson-Walker tem a forma
2 2 2 dr 2 2 2 2 2
ds = dt − R (t) + r dθ + sen θ dφ .
1 − kr 2
Usando o método lagrangiano, calcular os correspondentes coeficientes de conexão Γσµν . Encontre os
elementos não nulos do tensor de Ricci Rµν .
Encontre a equação geodésica para observadores comóveis (xi = constante) para encontrar o parâ-
metro afim em função de t.
20.9 Mostre explicitamente que, para um universo dominado por radiação temos R ∝ t1/2 e para um
universo dominado por matéria temos R ∝ t2/3 .
20.10 Mostre que, em todos os momentos cósmicos, os parâmetros de densidade obedecem à relação
Ωm + Ωr + ΩΛ + Ωk = 1 .
20.11 Em termos dos parâmetros de densidade adimensionais, mostre que as duas equações de campo
cosmológicos podem ser escritas na forma
H 2 = H02 Ωm,0 a−3 + Ωr,0 a−4 + ΩΛ,0 + Ωk,0 a−2
1
q0 = 2 (Ωm + 2Ωr + 2ΩΛ ) ,
R
em que H e q são os parâmetros de Hubble e de desaceleração, respectivamente, e, a = R0 é o fator
de escala normalizado.
20.12 Seja a variável de tempo conforme40 definida por dη = cRdt . Mostre que a segunda equação de campo
cosmológica pode ser escrita como
2
da
dη = − Ωkk,0 Ωm,0 a + Ωr,0 + ΩΛ,0 a4 + Ωk,0 a2 ,
R
em que a = R0 é o fator de escala normalizado.
40
Tempo conforme, vem do inglês conformal time.
“Z_2” — 2017/9/5 — 8:19 — page 584 — #604
20.13 Quando temos todas as contribuições das componentes do fluido cosmológico, mostre explicitamente
a relação (20.54)
Z 1
1 dR
dk = p .
H0 1/(1+z) R2 ΩΛ + Ωk R−2 + Ωm R−3 + Ωr R−4
Leitura Recomendada
Para este capítulo, recomendo ao leitor, um estudo detalhado dos seguintes livros,
Capítulo 21
Cosmologia Inflacionária
Com a proposta da teoria da relatividade geral de Einstein, publicado em 1916, foi possível discutir a estru-
tura do espaço-tempo e a evolução do universo em termos de leis físicas. 1 Em 1922, Friedmann demonstrou
a existência de soluções cosmológicas de expansão e/ou colapso resolvendo as equações de campo de Eins-
tein. 2 Em 1929, Hubble descobriu a expansão do universo pelas observações do desvio para o vermelho
de galáxias, como a teoria de Einstein prevê. 3 Em 1948, Gamow, Alpher e Herman mostraram que o uni-
verso deve ter começado em um estado muito quente e denso a partir da teoria da nucleossíntese, nestes
trabalhos também previam que o universo atual deveria ser preenchido com micro-ondas da radiação do
corpo negro. 4 A nucleossíntese é o processo de criação de novos núcleos atômicos a partir dos núcleos
pré-existentes, prótons e nêutrons, para chegar a gerar o restante dos elementos da tabela periódica. Os nú-
cleos primogênitos pré-existentes se formaram a partir do plasma de quarks-glúons do big-bang quando o
universo se esfriou abaixo dos dez milhões de graus, este processo se pode chamar nucleogênese, a geração
de núcleos no universo. A consequente nucleossíntese dos elementos, i.e., incluindo todo o carbono, todo o
oxigênio, etc., ocorre principalmente no interior das estrelas por fusão ou fissão nuclear. A nucleossíntese
do big-bang ocorreu nos primeiros três minutos do universo e é responsável pelas relações de abundância
do 1 H (prótio), 2 H (deutério), 3 He (hélio-3) e 4 He (hélio-4), no universo. Ainda que o 4 He continua sendo
produzido por outros mecanismos (como a fusão estelar e a descomposição alfa) e certas quantidades de
1 H se seguem produzindo por fissão nuclear e certos tipos de descomposição radiativa (emissão de pró-
tons e emissão de nêutrons). Grande parte da massa destes isótopos no universo e todas as quantidades
insignificantes de 3 He e deutério produzidas por processos raros, se pensa que são produzidas no big-bang.
Os núcleos destes elementos, junto com alguns de 7 Li (lítio) se crê que se formaram quando o universo
tinha entre 100 e 300 segundos, depois de que o plasma quark-glúon primogênito se congelara para formar
prótons e nêutrons. Devido ao período tão curto em que ocorreu a nucleossíntese do big-bang antes de ser
parada pela expansão e o esfriamento, não se pode formar nenhum elemento mais pesado que o lítio. Os ele-
mentos formados durante este período estavam em estado de plasma e não se puderam esfriar ao estado de
átomos neutros até muito depois. Na Fig. 21.1, mostramos resultados recentes das abundâncias primordiais
de deutério, 3 He e 7 Li relativamente ao hidrogênio, e a fração YP da massa primordial do universo em 4 He,
como funções de η10 ≡ 1010 η, em que η é a razão entre núcleos e fótons no universo presente. 5 Em 1965,
Penzias e Wilson descobriram radiações de fundo de micro-ondas que coincidem assim com as previsões
1
A. Einstein, Annalen der Physik (ser. 4), 49, 769-822 (1916); Idem, 51, 639-642 (1916); Idem, Preussische Akademie der
Wissenschaften, Sitzungsberichte, part 1, 688-696 (1916); Idem, part 2, 1111-1116 (1916).
2
A. Friedmann, Zeitschrift für Physik 10 (1), 377-386 (1922).
3
E. Hubble, Proceedings of the National Academy of Sciences 15 (3), 168-173 (1929).
4
G. Gamow, Physical Review 74 (4), 505-506 (1948); Idem, Nature 162 (4122), 680-682 (1948); R. A. Alpher and R. Her-
man, Physical Review 74 (12), 1736-1742 (1948).
5
G. Steigman, International Journal of Modern Physics E15, 1-36 (2006).
585
“Z_2” — 2017/9/5 — 8:19 — page 586 — #606
teóricas por Gamow. 6 Estudos modernos, realizados com o satélite COBE,7 mostram uma comparação dos
dados experimentais com um espectro do corpo negro, ver Fig. 21.2, 8 e análise nos dá a radiação de fundo
de micro-ondas com temperatura de 2, 725 ± 0, 002 K com 95% de nível de confiança. 9 Essas fortes evi-
dências observacionais fizeram os cientistas aceitarem que o universo teria começado a partir de um estado
quente e denso, i.e., o chamado modelo padrão do big-bang.
No modelo cosmológico padrão do big-bang, o estado do universo é caracterizado pela fase dominada
por radiação ou pela fase dominada por matéria. Estas correspondem à expansão desacelerada do universo
em que a segunda derivada do fator de escala é negativo. Enquanto isto, esta expansão desacelerada não é
suficiente para resolver uma série de problemas cosmológicos, como problemas de planicidade e do hori-
zonte na qual afligem no cenário padrão big-bang. Para superar estes problemas fundamentais, é necessário
considerar uma época de expansão acelerada no início do universo, i.e., a inflação.
6
A. A. Penzias and R. W. Wilson, Astrophysical Journal 142, 419-421 (1965).
7
COBE - Cosmic Background Explorer, foi o primeiro satélite construído dedicado à cosmologia. Seu objetivo era investigar a
radiação cósmica de fundo do universo e fornecer medidas que pudessem ajudar na compreensão do cosmos. Foi lançado em
1989.
8
D. J. Fixsen et al., Astrophysical Journal 473, 576 (1996).
9
J. C. Mather, D. J. Fixsen, R. A. Shafer, C. Mosier, and D. T. Wilkinson, Astrophysical Journal 512, 511 (1999).
“Z_2” — 2017/9/5 — 8:19 — page 587 — #607
587
Figura 21.2 Comparação da intensidade de radiação observada, realizada pelo satélite COBE, com
um espectro de corpo negro com temperatura 2, 728 K. O eixo vertical dá a intensidade em kilo-
Jansky por esterradiano (um Jansky é igual a 10−23 erg cm−2 s−1 Hz−1 ), o eixo horizontal indica
o comprimento de onda recíproco em cm−1 . A incerteza experimental de 1σ em intensidade é
indicada pelas pequenas barras verticais, a incerteza em comprimento de onda é negligenciável.
As ideias básicas da inflação foram originalmente propostas por Starobinsky,10 em 1980, 11 e por Guth12
e Sato,13 independentemente, em 1981, 14 que passou a ser denominado como inflação antiga ou velha
inflação.15 Isto corresponde à inflação de de Sitter que fez uso da transição de primeira ordem para o vacuum
verdadeiro. No entanto, esta forma tem um defeito grave em que o universo se torna inomogêneo logo
após o termino da inflação, contradizendo a homogeneidade apresentada. A versão revista foi proposta por
Linde16 e por Albrecht17 e Steinhardt,18 em 1982, 19 que é conhecida como nova inflação. Isto corresponde
à inflação slow-roll, também conhecida como inflação de rolagem lenta, com a transição de segunda ordem
para o vacuum verdadeiro. Infelizmente, este cenário também sofre de um problema de ajuste fino por
passar bastante tempo em um falso vacuum afim de levar quantidade suficiente de inflação. Em 1983, Linde
considera uma versão variante da inflação slow-roll chamado inflação caótica, em que as condições iniciais
de campos escalares são caóticos. 20 De acordo com este modelo, o nosso universo homogêneo e isotrópico
pode ser produzido nas regiões em que a inflação ocorre de forma suficiente. Enquanto os modelos de
10
Alexei Alexandrovich Starobinsky (1948- ), físico, astrofísico e cosmólogo russo-soviético.
11
A. A. Starobinsky, Physics Letters B91, 99-102 (1980).
12
Alan Harvey Guth (1947- ), físico e cosmólogo americano.
13
Katsuhiko Sato (1945- ), físico e cosmólogo japonês.
14
A. H. Guth, Physical Review D23, 347-356 (1981); K. Sato, Monthly Notices of the Royal Astronomical Society 195, 467-479
(1981); Idem, Physics Letters B99, 66-70 (1981).
15
É bom lembrar que foi o trabalho de Guth que incitou interesse na possibilidade da inflação, observando o que era bom para o
desenvolvimento.
16
Andrei Dmitriyevich Linde (1948- ), físico russo-americano.
17
Andreas J. Albrecht, físico americano.
18
Paul Joseph Steinhardt (1952- ), físico e cosmólogo americano.
19
A. Linde, Physics Letters B108 (6), 389-393 (1982); A. Albrecht and P. Steinhardt, Physical Review Letters 48 (17), 1220-1223
(1982).
20
A. Linde, Physics Letters B129 (3,4), 177-181 (1983).
“Z_2” — 2017/9/5 — 8:19 — page 588 — #608
inflação antiga e nova baseiam-se no pressuposto de que o universo estava em um estado de equilíbrio
térmico, desde o início, a inflação caótica pode ocorrer mesmo sem tal suposição. Em adição, a inflação
c5 93 g/cm3 , resolvendo
caótica pode começar no regime perto da densidade de Planck, ρP = ~G 2 = 5, 2 × 10
assim o problema das condições iniciais. Muitos tipos de modelos inflacionários foram construídos nestes
últimos 35 anos. Em particular, a tendência recente é a construção de modelos consistentes de inflação com
base em supercordas ou modelos de supergravidade.21
O paradigma inflacionário não só proporciona uma excelente maneira de resolver os problemas de
planicidade e do horizonte, mas também gera perturbações de densidade como sementes para estruturas
de grande escala no universo.22 De fato a inflação fornece um mecanismo causal para gerar espectros de
escala invariante próximas de perturbações cosmológicas. Flutuações quânticas do campo de condução da
inflação, normalmente conhecidas como inflaton,23 normalmente são congelados pela expansão acelerada
quando as escalas de flutuações saem do raio de Hubble. Muito tempo depois do termino da inflação,
as escalas cruzam novamente dentro do raio de Hubble. Assim perturbações impressas durante a inflação
podem ser a origem da estrutura de larga escala no universo. Na verdade uma anisotropia de temperaturas
observada pelo satélite COBE, em 1992, exibem espectros de escala invariante próximas como previsto
pelo paradigma inflacionário. Observações recentes, primeiros anos do século XXI, do WMAP24 também
mostram fortes evidências para a inflação.25
A fim de conhecer a evolução dinâmica do universo, será necessário resolver as equações de Einstein da
relatividade geral. Estas equações são expressas como
1
Gµν = Rµν − gµν R = −8π G Tµν − Λ gµν , (21.2)
2
21
Para uma revisão veja A. Linde, Contemp. Concepts Phys. 5, 1-362 (2005); Idem, Prog. Theor. Phys. Suppl. 163, 295-322
(2006), D. Baumann and L .MacAllister, Inflation and string theory (2015).
22
S. W. Hawking, Physics Letters B115, 295-297 (1982); A. A. Starobinsky, Physics Letters B117, 175-178 (1982); A. H. Guth
and S. Y. Pi, Physical Review Letters 49, 1110-1113 (1982); J. M. Bardeen, P. J. Steinhardt and M. S. Turner, Physical Review
D28, 679-693 (1983).
23
Inflaton em português é ínflaton.
24
WMAP - Wilkinson Microwave Anisotropy Probe.
25
C. L. Bennett et al., The Astrophysical Journal Supplement Series, 148, 1-27 (2003); H. V. Peiris et al., The Astrophysical
Journal Supplement Series, 148, 213-231 (2003); G. Hinshaw et al., The Astrophysical Journal Supplement Series, 208 19,
25pp (2013).
“Z_2” — 2017/9/5 — 8:19 — page 589 — #609
em que Rµν , R, Tµν , G e Λ são o tensor de Ricci, o escalar de Ricci, o tensor energia-momentum, a constante
gravitacional e a constante cosmológica, respectivamente. Usando, ~ = c = 1, em que ~ é a constante de
Planck e c a velocidade da luz no vácuo, a energia de Planck será
12
2 ~ c5
EP = mP c = ⇒ EP = mP = 1, 2211 × 1019 GeV .
G
Fazendo uso da métrica (21.1) e desprezando a constante cosmológica nas equações de Einstein (21.2),
temos
Ṙ2 k 8π
+ 2 = ρ (21.3)
R 2 R 3m2P
Ṙ
ρ̇ + 3 (ρ + p) , (21.4)
R
Ṙ
em que, também podemos usar H = R como a expansão de Hubble. Combinando as Eqs. (21.3)-(21.4),
temos
R̈ 4π
= − 2 (ρ + 3p) . (21.5)
R 3mP
A equação de Friedmann (21.3) poderá ser reescrita na forma,
k
Ω−1= , (21.6)
R2 H 2
em que
ρ 3H 2 m2P
Ω≡ , com ρc ≡ .
ρc 8π
Aqui, o parâmetro de densidade Ω é a razão entre a densidade de energia ρ e a densidade crítica ρc . Quando
temos uma geometria plano, k = 0, as soluções das Eqs. (21.3) e (21.4) são:
1
R ∝ t2 , ρ ∝ R−4 ,
isto é, temos o universo dominado por radiação. Nestes casos simples, o universo está expandindo desace-
leradamente, i.e., R̈ < 0, como confirmado pela Eq. (21.5).
• Problema da planicidade - No modelo padrão do big-bang com R̈ < 0, o termo R2 H 2 = Ṙ2 na Eq.
(21.6) sempre diminui. Assim, da Eq. (21.6), vem
k
Ω−1 = ,
R2 H 2
em que podemos escrever
sendo que i representa o parâmetro em um possível início do universo, e o estado atual do universo é
representado pelo índice 0. Igualando estas expressões, temos
(R H)20
Ωi − 1 = (Ω0 − 1) ,
(R H)2i
Ṙ0
sabendo que Ṙi
≤ 10−28 ,26 temos
Ωi − 1 ≤ 10−56 .
Ou seja, observamos hoje Ω próximo da unidade,27 o que sugere um valor de Ωi muito próximo
da unidade no início do universo, o que configura um universo plano. Um exemplo interessante,
requeremos |Ω − 1| ≤ O(10−16 ) para o período da nucleossíntese, |Ω − 1| ≤ O(10−27 ) para a
escala eletrofraca e |Ω − 1| ≤ O(10−64 ) para a era de Planck.28 Existe um ajuste fino extremo das
condições iniciais. A menos que as condições iniciais sejam escolhidos de forma muito precisa, o
universo colapsa ou expande-se rapidamente, antes que a estrutura seja formada. Isto é chamado o
problema da planicidade.
• Problema do horizonte - O problema do horizonte resulta da velocidade da luz ser finita e aparece-nos
com toda a clareza na radiação de fundo de micro-ondas gerada no passado remoto do universo. Esta
radiação apresenta uma elevada isotropia, com uma temperatura que é a mesma, a menos de flutua-
ções da ordem de uma parte em 105 , qualquer que seja a direção em que é observada. O problema
é que estas não teriam condições de ter tido contato causal antes da época em que a radiação se
desacoplou da matéria e deu origem a distribuição do fundo de radiação que observamos hoje. Por-
tanto, esta observação suscita a questão óbvia de saber como o universo conseguiu atingir este grau
de homogeneidade.
Para compreender quantitativamente, vamos considerar que recebemos agora fótons vindos de duas
fontes localizadas em direção diametralmente opostas no céu. Estes fótons foram emitidos no mo-
mento em que a radiação desacoplou da matéria. No modelo cosmológico padrão, isto ocorreu em
td ≈ 1012 s, e estamos em t0 ≈ 1017 s. podemos calcular a distância da fonte até nós, considerando
a trajetória dos fótons. Vamos supor uma trajetória radial. por simplicidade, o fator de escala com-
porta-se como R(t) = R0 t1/2 , sendo R0 uma constante que fixa a escala, durante toda a história do
universo. Isto introduz, em relação ao resultado exato, um erro da ordem da unidade. Então,
dt
ds2 = c2 dt2 − R2 (t) dr 2 = 0 ⇒ dr = ±c
R(t)
Z Z
0 tr
dt 1 1/2 1/2
1 1/2
dr = −c ⇒ re = 2c t − te ≈ 2c t ,
re te R(t) R0 r R0 r
em que os índices e e r representam as quantidades de emissão e de recepção, respectivamente. Além
disso, consideramos que tr ≫ te .
Por outro lado, podemos calcular o tamanho do horizonte causal na época em que os fótons foram
emitidos. Isto define a região que possuirá conexão causal. Assim, usando o mesmo procedimento do
caso anterior,
Z te 1/2
dt te
rc = c = 2c .
0 R(t) R0
26
V. Mukhanov, Physical foundations of cosmology (2005).
27
C. L. Bennett et al., The Astrophysical Journal Supplement Series, 148, 1-27 (2003); H. V. Peiris et al., The Astrophysical
Journal Supplement Series, 148, 213-231 (2003).
28
A. Riotto, Lectures delivered at the ICTP Summer School on Astroparticle Physics and Cosmology, Trieste, 17 June - 5 July
2002, arXiv:hep-ph/0210162 (2002).
“Z_2” — 2017/9/5 — 8:19 — page 591 — #611
Logo, as regiões que emitiram os fótons que recebemos hoje em direções diametralmente oposta
estavam separadas por uma distância mil vezes maior que o horizonte causal daquela época. Portanto,
hoje, elas não poderiam se encontrar em equilíbrio térmico. Entretanto, esta radiação apresenta uma
elevada isotropia, com uma temperatura que é a mesma. Temos aqui o problema do horizonte.
• Problema da formação de estrutura de larga escala - Se for encontrada uma solução para o problema
da homogeneidade, ainda será preciso explicar como as galáxias, aglomerados de galáxias e outras
estruturas de grande escala observadas hoje poderiam ser formadas a partir de um universo tão ho-
mogêneo. Mais especificamente, a origem das inomogeneidades primordiais que as sementes das
flutuações de densidade que são observados tanto na estrutura de larga escala do universo e na radia-
ção cósmica de fundo são encontrada. Uma teoria que explica a formação da estrutura também deve
explicar a invariância de escala quase perfeita nas amplitudes das anisotropias da radiação cósmica
de fundo encontrados por WMAP.29
O problema da formação de estrutura de larga escala pode ser reformulada usando o raio de Hub-
ble H1 . Em um universo em desaceleração, como o universo na teoria do big-bang, este raio é sempre
crescente. O raio de Hubble é uma escala importante, uma vez que apenas dentro deste raio, uma fí-
sica causal poderá ser operada. Como ele aumenta durante o cenário padrão do big-bang, mais e mais
escalas tornam-se menores do que o raio Hubble e entram no horizonte. Uma vez que eles cruzam o
horizonte deverão ficar dentro dele por todo o tempo. Isso leva à questão de como estas perturbações
que continuamente entram no horizonte foram criados.
• Problema dos monopolos magnéticos - Também conhecido como problema das relíquias exóticas, que
ocorreu quando o conteúdo do universo era regido pela física de altas energias. De acordo com o
ponto de vista da física de partículas, a quebra de supersimetria leva à produção de muitas relíquias
indesejáveis, tais como monopolos magnéticos, cordas cósmicas, e defeitos topológicos. A teoria de
cordas também prevê partículas supersimétricas como gravitinos, partículas de Kaluza-Klein 30 e as
paredes de domínio.31
Se estas partículas existiram na fase inicial do universo, as densidades de energia destas devem dimi-
nuir como um componente de matéria, i.e., ∼ R−3 . Uma vez que a densidade de energia de radiação
diminui na forma ∼ R−4 na era dominada pela radiação, estas relíquias maciças poderiam ser os
materiais dominantes no universo, o que contradiz com as observações. Este problema é geralmente
chamado como o problema dos monopolos magnéticos.
ρ + 3p < 0 . (21.8)
A condição (21.7) significa, essencialmente, que Ṙ(= RH) aumenta durante a inflação. Em seguida, o raio
de Hubble comóvel, (RH)−1 , diminui na fase inflacionária. Esta propriedade é o ponto chave para resolver
os enigmas cosmológicos apresentados no modelo cosmológico padrão do big-bang.
• Problema da planicidade - Desde que o termo R2 H 2 na Eq. (21.6) aumenta durante a inflação, Ω se
aproxima rapidamente da unidade. Após o término do período inflacionário, a evolução do universo
é seguida pela fase convencional do modelo do big-bang e |Ω − 1| começa a aumentar. Apesar disto,
enquanto a expansão inflacionária ocorre temos que Ω estará muito próximo de um, Ω permanece na
ordem de unidade, mesmo na presente era.
• Problema do horizonte - Uma vez que o fator de escala evolui como R ∝ tp com p > 1 durante a
inflação, o comprimento de onda físico, Rλ, cresce mais rápido do que o raio de Hubble, H −1 (∝ t).
Portanto, o comprimento de onda físico é empurrado para fora do raio de Hubble durante a inflação.
Isto significa que a região em que a causalidade funciona é alongada em escalas muito maiores do
que o raio de Hubble, resolvendo assim o problema do horizonte.
É claro que o raio Hubble começa a crescer mais rapidamente do que o comprimento de onda físico
após a inflação, era dominante de radiação/matéria. A fim de resolver o problema do horizonte, é
necessário que a seguinte condição seja satisfeita para o horizonte de partícula comóvel:
Z tdes Z t0
dt dt
≫ ,
t∗ R(t) tdes R(t)
em que t∗ é o início da era da inflação e tdes é o tempo para o desacoplamento. Isto implica que a
distância comóvel que os fótons podem viajar antes do desacoplamento necessitam ser muito maior
do que aquelas após o desacoplamento. De acordo com os cálculos realizados, isto será alcançado
quando o universo expandir na ordem de e70 vezes, durante o processo de inflação.32
• Problema da formação de estrutura de larga escala - O fato de que o raio de Hubble comóvel diminui
durante a inflação, faz com que seja possível gerar, próximo da escala-invariante, as densidades de
perturbações em grandes escalas. Uma vez que as escalas de perturbações estão dentro do raio de
Hubble na fase inicial da inflação, a causalidade física geram pequenas flutuações quânticas. Depois
que uma escala é empurrada para fora do raio de Hubble, i.e., a passagem do primeiro horizonte,
durante a inflação, as perturbações pode ser descritas por perturbações clássicas. Quando o período
inflacionário termina, a evolução do universo é seguido pela cosmologia padrão do big-bang, e o
raio Hubble comóvel começa a aumentar. Então, as escalas de perturbações cruzam dentro do raio
de Hubble novamente, i.e., a passagem do segundo horizonte, após a qual a causalidade física nova-
mente se verifica. As pequenas perturbações impressas durante a inflação aparece como perturbações
em grande escala após a travessia do segundo horizonte. Deste modo, o paradigma da inflação na-
turalmente fornece um mecanismo causal na produção das sementes das densidades de perturbações
observadas nas anisotropias da radiação de fundo de micro-ondas.
• Problema dos monopolos magnéticos - Durante a fase da inflação, ρ + 3p < 0, a densidade de energia
do universo diminui muito lentamente. Por exemplo, quando o universo evolui como R ∝ tp com
1 2
p > 1, temos H ∝ t−1 ∝ R− p e ρ ∝ R− p . Enquanto isto, a densidade de energia das partículas
32
A. Riotto, Lectures delivered at the ICTP Summer School on Astroparticle Physics and Cosmology, Trieste, 17 June - 5 July
2002, arXiv:hep-ph/0210162 (2002).
“Z_2” — 2017/9/5 — 8:19 — page 593 — #613
maciças diminui muito mais rapidamente, i.e., em ∼ R−3 , estas partículas são deslocadas para o
vermelho durante a inflação, resolvendo assim o problema do monopolo.
Naturalmente, temos que preocupar o caso em que estas partículas não desejadas são produzidas após
a inflação. No processo de reaquecimento seguido pela inflação, a energia do universo poderá ser
transferida para outras partículas de radiação ou luz. Nesta fase partículas indesejáveis não devem ser
produzidas em excesso a fim de não violar o sucesso da cosmologia padrão, tais como a nucleossín-
tese. Geralmente, se a temperatura de reaquecimento é suficientemente baixa, a produção térmica de
relíquias indesejáveis, tais como os gravitinos pode ser evitada.
1 √ dV (φ) dV (φ)
√ ∂µ −g ∂ µ φ + =0 ⇒ φ+ = 0. (21.10)
−g dφ dφ
1
Rµν − gµν R = 8πG Tµν , (21.11)
2
em que
2 δSφ
Tµν ≡ − √ (21.12)
−g δgµν
√ √
é o tensor energia-momentum. Aqui, lembrando que δ −g = − 12 −g gµν δgµν , temos
Z Z
√ √
δSφ = δLφ −g d x + Lφ δ −g d4 x
4
Z Z
1 µν √ 1 µν √
= δg ∂µ φ ∂ν φ −g d4 x + g ∂µ φ ∂ν φ − V (φ) δ −g d4 x
2 2
Z
4 √ 1 1 1 ρσ
= d x −g ∂µ φ ∂ν φ − gµν g ∂ρ φ ∂σ φ − V (φ) δgµν .
2 2 2
Se ∂ρ φ ∂ ρ φ > 0, o tensor energia-momentum para o campo escalar pode ser reescrito na forma de um fluido
perfeito
Tµν = (ρ + p) uµ uν − p gµν (21.14)
pelas definições
1 1 ∂µφ
ρ ≡ − ∂ρ φ ∂ ρ φ + V (φ) , p≡ ∂ρ φ ∂ ρ φ − V (φ) e uµ ≡ p .
2 2 ∂ρ φ ∂ ρ φ
∂φ
Em particular, partindo do princípio de que o campo é homogêneo, ∂xi
= 0, temos a densidade de energia
e a densidade de pressão descritas por
1 2 1 2
ρ≡ φ̇ + V (φ) e p≡ φ̇ − V (φ) . (21.15)
2 2
Substituindo a Eq. (21.15) nas Eqs. (21.3) e (21.4), obtemos
2 8π 1 2
H = φ̇ + V (φ) (21.16)
3 m2pl 2
dV (φ)
φ̈ + 3H φ̇ + = 0, (21.17)
dφ
8π K2
em que κ2 ≡ 8π G = m2pl
e desprezamos o termo de curvatura R2
em (21.16).
“Z_2” — 2017/9/5 — 8:19 — page 595 — #615
Nota No fantástico livro do Prof. Weinberg34 o tensor energia-momentum para o campo escalar está como 35
µν µν 1 ρσ ∂φ ∂φ ∂φ ∂φ
Tφ = −g g ρ σ
+ V (φ) + gµρ gνσ
2 ∂x ∂x ∂xρ ∂xσ
e a densidade de energia, pressão e quadrivelocidade são dadas por
1 ∂φ ∂φ
ρ ≡ − gµν + V (φ)
2 ∂xµ ∂xν
1 ∂φ ∂φ
p ≡ − gµν − V (φ)
2 ∂xµ ∂xν
− 1
ρσ ∂φ ∂φ ∂φ
2
µ
u ≡ − −g ρ σ
gµτ .
∂x ∂x ∂xτ
Este resultado para pressão é diferente do encontrado no texto dos Prof. Kolb e Turner,36 segundo o
qual a pressão de um campo escalar em uma métrica de Robertson-Walker é 37
φ̇2 ~ 2
(∇φ)
p= − V (φ) − ,
2 6R2
em vez do resultado de uma métrica de Robertson-Walker dada por Weinberg
φ̇2 ~ 2
(∇φ)
p= − V (φ) − .
2 2R2
Ti
O resultado de Kolb-Turner é obtido se definirmos a pressão como o valor de 3i medido por um
observador em um sistema de coordenadas localmente inerciais em movimento com quadriveloci-
dade vµ
1
p ≡ (gµρ + vµ vρ ) T ρσ (δσµ + vσ v µ ) .
3
Mas tomamos as componente da quadrivelocidade vµ como v 0 = 1 e v i = 0. Assim, parece mais
natural usar esta fórmula para a pressão tomando vµ como a velocidade uµ dado por Weinberg,
para isso é a velocidade que aparece na fórmula do fluido perfeito (21.14) para o tensor de energia-
-momentum. Esta escolha de v µ leva a quadrivelocidade de Weinberg.
Continuando, durante a inflação, a relação (21.15) nos dá φ̇2 < V (φ), o que indica que a energia
potencial do inflaton domina em relação a energia cinética do mesmo. Portanto, é necessário um potencial
plano do inflaton, a fim de levar a quantidade suficiente de inflação. Impondo as condições da inflação de
rolagem lenta, ou inflação slow-roll,
1 2
φ̇ ≪ V (φ) e φ̈ ≪ 3H φ̇ ,
2
As Eqs. (21.16) e (21.17) são dadas, aproximadamente, por
8π
H2 ≃ V (φ) , (21.18)
3m2pl
34
Steven Weinberg (1933- ), físico americano.
35
S. Weinberg, Cosmology (2008).
36
Edward W. “Rocky” Kolb (1951- ), físico e cosmólogo americano.
Michael S. Turner (1949- ), físico e cosmólogo americano.
37
E. W. Kolb and M. S. Turner, The early universe (1990).
“Z_2” — 2017/9/5 — 8:19 — page 596 — #616
3H φ̇ ≃ −V ′ (φ) . (21.19)
Definindo os conhecidos parâmetros slow-roll
2
m2pl V′ m2pl V ′′
ǫ≡ , η≡ , (21.20)
16π V 8π V
podemos facilmente verificar que as aproximações slow-roll acima são válidas quando
ǫ ≪ 1, |η| ≪ 1 . (21.21)
A fase inflacionária termina quando ǫ e |η| crescem para ordem unitária. Uma quantidade útil para descrever
a quantidade de inflação é o número de e-folding, definido por
Z tf
Rf
N ≡ ln = H dt , (21.22)
Ri ti
em que usamos o fato de H ser quase constante durante a inflação. Assumindo que |Ωi − 1| é de ordem
unitária, o número e-folding será de N ≥ 70 para resolver o problema da planicidade. O tamanho atual do
universo observável, no entanto, é dada aproximadamente pela atual distância de Hubble,
Para resolver o problema do horizonte, exigimos que o fator de escala cresça ∼ 1026 -1029 durante o período
de inflação. Assim, expressando este resultado em números de e-folding, temos que N ≥ 60-70, i.e., número
similar para resolver o problema da planicidade.
V (2) (φ) geralmente leva valores positivos, enquanto que V (2) (φ) pode mudar o seu sinal no segundo modelo.
A terceira classe, i.e., do tipo III, é o modelo da inflação híbrida, 42 em que a inflação tipicamente termina
com a transição de fase desencadeada pela presença de um segundo campo escalar, ou pela segunda fase da
inflação depois da transição de fase. Vamos recapitular brevemente cada tipo dos modelos inflacionários:
Inflação Caótica O modelo da inflação caótica é descrito pelo potencial inflacionário quadrático ou
quártico,
1 2 2 1
V (φ) = m φ ou V (φ) = λ φ4 .
2 4
O termo caótica significa que as condições iniciais do inflaton são distribuídos caoticamente. De acordo
com este cenário, a região que sofreu uma quantidade suficiente de inflação deu origem ao nosso universo.
Deixa-nos a investigar a evolução do universo no caso de o potencial quadrático. Na Fig. 21.3 temos o
Figura 21.3 Potencial quadrático V (φ) = 12 m2 φ2 para o campo escalar livre. O campo é inicialmente
deslocado do mínimo do potencial devido às condições iniciais caóticas, como o universo saindo
da era de Planck..
1
campo escalar na qual V (φ) = 2 m2 φ2 , i.e., potencial quadrático. Então, das Eqs. (21.18) e (21.19) temos,
4π m2 φ2
H2 ≃ , 3H φ̇ + m2 φ ≃ 0 .
3 m2pl
aumento do segundo termo no colchete da Eq. (21.24), a taxa de expansão desacelera. Uma vez que os
parâmetros slow-roll são expressos como
m2pl
ǫ=η= ,
4π φ2
m
o período inflacionário termina ao redor de |φ| ≈ √ pl , após a qual o sistema entra numa fase de reaqueci-
4π
mento. 43 O valor total da inflação é expresso aproximadamente por,
2
φi 1
N ≃ 2π − .
mpl 2
A fim de levar a inflação suficiente, N ≥ 70, exigimos que o valor inicial seja φi ≥ 3 mpl . A massa do
inflaton, m, será vinculada pela amplitude das perturbações de densidade observadas pelo satélite COBE.
A fim de se ajustar as observações, m deverá ser dado por,44
m ≃ 10−6 mpl .
No caso potencial quártico, a autoacoplamento está vinculado a ser λ ≃ 10−13 por argumento semelhante.
Inflação Natural O modelo para inflação natural é caracterizado por pseudo bósons de Nambu-Golds-
tone 45 que aparecem quando uma simetria global aproximada é quebrado espontaneamente. 46 Esse poten-
cial é expresso por
4 φ
V (φ) = m 1 + cos ,
f
em que duas escalas de massa m e f caracterizam a altura e a largura do potencial, respectivamente, veja a
Fig. 21.4. As típicas escalas das massas são da ordem de f ∼ mpl ∼ 1019 GeV e m ∼ mGUT ∼ 1016 GeV
que são esperados pela física de partículas.
Vamos considerar o caso em que o inflaton está inicialmente localizado na região 0 < φ < πf , a
inflação ocorre enquanto o inflaton evolui lentamente em direção ao mínimo do potencial em φ = πf . Os
parâmetros slow-roll são
2
φ φ
m2pl sen f m2pl cos f
ǫ= , η= − .
16πf 2 1 + cos φ 8πf 2 1 + cos φ
f f
Nota-se que tanto ǫ quanto η dependem de f , mas não dependem de m. A inflação começa a se extinguir
quando φ está próximo de zero. Aqui, o sistema entra em uma fase de reaquecimento, exatamente quando
o inflaton começa a oscilar em torno de φ = πf .
Uma propriedade típica do modelo tipo II está no fato de que a derivada segunda do potencial infla-
ton pode alterar o seu sinal. Na inflação natural a derivada segunda do potencial inflaton é negativo, i.e.,
43
O termo reaquecimento é uma relíquia histórica das teorias iniciais de inflação em que foi assumido que o slow-roll à temperatura
zero do campo do inflaton seguiu um período anterior de alta temperatura. É neste período em que a entropia observada no
presente universo é supostamente gerada. Ver A. D. Dolgov and A. Linde, Physics Letters B116, 329 (1982); L. F. Abbott,
E. Farhi and M. B. Wise, Physics Letters B117, 29 (1982).
44
A. R. Liddle and D. H. Lyth, Cosmological inflation and large-scale structure (2000).
45
Yoichiro Nambu (1921-2015), físico americano nascido no Japão.
Jeffrey Goldstone (1933- ), físico britânico.
46
K. Freese, J. A. Frieman and A. V. Olinto, Physical Review Letters 65, 3233 (1990); F. C. Adams, J. R. Bond, K. Freese,
J. A. Frieman and A. V. Olinto, Physical Review D47, 426-455 (1993).
“Z_2” — 2017/9/5 — 8:19 — page 599 — #619
Figura 21.4 Inflação natural. Se a periodicidade 2πf é super-planckiana, o modelo pode, natural-
mente, apoiar uma grande amplitude de ondas gravitacionais..
V (2) (φ) < 0, quando o inflaton evolui na região de 0 < φ < πf 2 . Isto leva ao aumento das flutuações do
inflaton por instabilidade espinodal. 47 Quando a criação de partículas por instabilidade espinodal é negli-
genciado, o número de e-folding é expresso por 48
φf
16πf 2 sen 2f
N= ln ,
m2pl sen φi 2f
em que φi e φf são os valores inicial e final do inflaton durante a inflação, respectivamente. para obter
suficiente e-folding, que satisfaz N ≥ 70, o valor inicial do inflaton deverá ser φ(ti ) ≤ 0, 1 mpl para
f ∼ mpl .
Inflação Híbrida O modelo inflacionário construído na presença de múltiplos campos escalares é uma
tendência recente do ponto de vista da física de partículas. 49 Vamos considerar o modelo de inflação hí-
brida, 50 descrito por
2
λ 2 M2 1 1
V (φ, ψ) = ψ − + m2 φ2 + λ′ φ2 ψ 2 ,
4 λ 2 2
na qual está ilustrada na Fig. 21.5. O potencial que tem inicialmente um mínimo em ψ passa a ter dois
mínimos degenerados.
Para um campo φ inicialmente grande, o valor ψ = 0 representa um mínimo do potencial. Neste caso,
o potencial efetivo para φ dado por
M4 1 2 2
V ≃ + m φ . (21.25)
4λ 2
47
D. Cormier and R. Holman, Physical Review D60, 041301 (1999); Idem, D62, 023520 (2000); S. Tsujikawa and T. Torii, Phy-
sical Review D62, 043505 (2000); G. Felder et al., Physical Review Letters 87, 011601 (2001); Idem, Physical Review D64,
123517 (2001).
48
K. Freese, J. A. Frieman and A. V. Olinto, Physical Review Letters 65, 3233 (1990); F. C. Adams, J. R. Bond, K. Freese,
J. A. Frieman and A. V. Olinto, Physical Review D47, 426-455 (1993).
49
D. Lyth and A. Riotto, Physics Reports 314, 1-146 (1999).
50
A. Linde, Physical Review D49, 748 (1994).
“Z_2” — 2017/9/5 — 8:19 — page 600 — #620
Figura 21.5 Potencial para o modelo de inflação híbrida. O campo rola lentamente para baixo no
canal em ψ = 0 até atingir o valor crítico φ, em seguida, cai para o verdadeiro no mínimo φ = 0 e
M
ψ = ±√ λ
.
2
A inflação não termina para o potencial (21.25). Neste caso, a inflação slow-roll ocorre até φ2inst = Mλ′ , na
M
qual ψ = 0 torna-se instável e o campo cai para o verdadeiro no mínimo φ = 0 e ψ = ± √ λ
. A versão
original da inflação híbrida corresponde ao caso em que a inflação logo chega ao fim após a quebra de
simetria, φ < φinst , devido ao rápido rolamento do campo ψ. 51 Neste caso, o número de e-folding adquirido
na dupla inflação pode ser estimada utilizando o potencial (21.25),
2π M 4 φi
N≃ 2 2 ln ,
λ m mpl φinst
em que φi é o valor inicial do inflaton. Se a condição M 2 ≫ m2pl é satisfeita, a massa do campo ψ será light
em relação à taxa de Hubble em torno de φ = φinst , conduzindo assim para a segunda fase de inflação para
φ < φinst . 52 Isto corresponde ao cenário inflacionário duplo.
Um último comentário sobre o potencial apresentado em (21.25). Este é uma forma padrão normal, a
parte incomum aparece como o termo constante, o que normalmente não seria permitido porque daria uma
constante cosmológica para os dias de hoje. O regime mais interessante é aonde aquela constante domina,
e, isso dá uma fenomenologia bastante incomum. Em particular, a densidade de energia durante a inflação
pode ser muito menor do que a normal e ainda dá perturbações de densidade suficientemente grandes, e, em
segundo lugar o campo φ pode estar rolando extremamente lento que é apropriado na construção do modelo
de física de partículas. Existem ainda modelos de uma chamada inflação híbrida invertida, nos quais o
campo inflaton φ, em vez de rolar em direção ao mínimo de seu potencial, rola de maneira a se afastar da
origem. 53
51
A. Linde, Physical Review D49, 748 (1994); E. J. Copeland, A. R. Liddle, D. H. Lyth, E. D. Stewart and D. Wands, Physical
Review D49, 6410 (1994).
52
S. Tsujikawa, D. Parkinson and B. A. Bassett, Physical Review D67, 083516 (2003).
53
D. H. Lyth, Physical Review D54, 7186 (1996).
“Z_2” — 2017/9/5 — 8:19 — page 601 — #621
G(0) (0)
µν = 8πG Tµν , G(1) (1)
µν = 8πG Tµν .
A fonte da perturbação métrica, i.e., tensor de energia-momentum podem ser classificado em perturbações
escalares, vetoriais ou tensoriais. Por exemplo, o inflaton perturbado δφ são fontes escalares, mas os cam-
pos de velocidade com vórtices são as fontes vetoriais. O teorema de decomposição indica que a ordem
linear dos diferentes tipos de perturbações métricas são afetadas apenas pela fonte do mesmo tipo. As per-
turbações métricas escalares, vetoriais e tensoriais são afetadas por fontes escalares, vetoriais e tensoriais,
respectivamente, e, portanto, estas perturbações podem ser estudados de forma independente.
(1)
O tensor métrico perturbado gµν (t, x) poderá ser decomposto como57
(1) (1) (1) (1)
gµν (t, x) = g00 + g0i + gij .
(1)
Aqui g00 é um escalar e pode ser denominado como A. De acordo com o teorema de Helmholtz qualquer
vetor vi pode ser decomposto como gradiente de um escalar e um vetor de divergência nula, vi = ∂i v + ui ,
54
A. A. Penzias and R. W. Wilson, Astrophysical Journal 142, 419-421 (1965).
55
J. Martin, V. Vennin and P. Peter, Physical Review D86, 103524 (2012).
56
A. Riotto, Lectures delivered at the ICTP Summer School on Astroparticle Physics and Cosmology, Trieste, 17 June - 5 July
2002, arXiv:hep-ph/0210162 (2002).
57
L. Sriramkumar, An introduction to inflation and cosmological perturbation theory, arXiv:0904.4584 (astro-ph.CO) (2009).
“Z_2” — 2017/9/5 — 8:19 — page 602 — #622
(1)
em que ui é o vetor de divergência nula, i.e., ∂i ui = 0 e v é um escalar. Na forma semelhante g0i poderá
ser decomposto como
(1)
g0i = ∂i B + Qi ,
em que B é um escalar e ∂i Qi = 0. Da mesma forma a perturbação tensorial das componentes espaciais do
(1)
tensor métrico, gij , pode ser decomposta como
(1) 1 1 k k
gij = ψ δij + (∂i Dj + ∂j Di ) + (∂i ∂j + ∂j ∂i ) − δij ∂ ∂ E + Hij ,
2 3
em que, mais uma vez, Di é um vetor de divergência nula e E é um escalar. A função Hij é um tensor
simétrico que satisfaz as condições, δji Hij = 0 e ∂ j Hij = 0. Assim, é evidente a decomposição dos
resultados da métrica perturbada em quatro funções escalares desconhecidas: A, B, ψ e E. Também depende
de dois vetores de divergência nula, Qi e Di , e de um tensor transversal e de traço nulo Hij .
Tendo decomposto a métrica, agora, vamos calcular os graus de liberdade do tensor métrico simétrico
(1)
perturbado gµν (t, x). Se generalizarmos esta discussão para (N + 1) dimensões de espaço-tempo, então,
descobriremos que os dois vetores espaciais de divergência nula Qi e Di , cada um com N graus de liberdade
espacial, têm [2(N − 1)] graus. Os quatro escalares mencionados anteriormente adicionam até 4 graus de
liberdade. Por fim, o tensor Hij , que será simétrico, tem N (N2+1) graus de liberdade, mas se impomos a
condição de traço nulo (o que corresponde a 1 vínculo) e a condição transversal (N vínculos) os graus
independentes se reduzem em
N (N + 1) (N + 1)(N − 2)
− (N + 1) = . (21.26)
2 2
Após a adição de graus de todos os componentes individuais obtemos,
(N + 1)(N − 2) (N + 1)(N + 2)
4 + 2(N − 1) + =
2 2
(1)
na qual é essencialmente os graus de liberdade associado com a métrica perturbado gµν (t, x) em (N + 1)
dimensões de espaço-tempo.
Vamos agora entender os graus de liberdade associado com as transformações de coordenadas. Para
a métrica perturbada, as (N + 1) transformações de coordenadas podem ser explicitamente expressa em
termos dos escalares, δt e δx como
t → t + δt e xi → xi + ∂ i δx . (21.27)
Da mesma forma haveria uma transformação de coordenadas em termos de um vetor de divergência nula
δxi como
t→t e xi → xi + δxi . (21.28)
Mais uma vez, deixe-nos contar o número de graus de liberdade independentes associados ao tensor métrico
perturbado, mas desta vez incorporando os graus de liberdade das coordenadas e subtraindo-os a partir do
número total de graus de liberdade. Juntamente com as quatro funções escalares independentes A, B, ψ e E
na métrica perturbada existem dois graus escalares associados com a transformação de coordenadas. Então o
grau escalar efetivo se reduz à (4 − 2) = 2. Além disso, o vetor de divergência nula δxi introduzido através
da transformação coordenada, ver Eq. (21.28), tem (N − 1) graus. Este, quando subtraído de 2(N − 1)
graus dos dois vetores de divergência nula Qi e Di da métrica perturbado, leva a (N − 1) graus de liberdade
verdadeiros. Somando a isto o número de graus do tensor perturbação, Eq. (21.26), obtemos
(N + 1)(N − 2) N (N + 1)
2 + (N − 1) + =
2 2
na qual é na verdade o número de graus que descreve a métrica perturbada.
“Z_2” — 2017/9/5 — 8:19 — page 603 — #623
Perturbação Escalar Em ordem de derivarmos as equações que governam a evolução de cada uma das
perturbações, é conveniente trabalhar em um calibre particular. Assim, vamos trabalhar no calibre longitu-
dinal, que essencialmente corresponde à A ∝ Φ, ψ ∝ Ψ e os outros dois escalares são fixados em zero, i.e.,
B = E = 0. Neste calibre particular, o elemento de linha de Friedmann é dado por
Agora, a fim de se obter o inverso da métrica, i.e., gµν na ordem linear que precisamos para resolver a
equação
(0) (1)
g(0) µβ + g(1) µβ gνβ + gνβ = δνµ , (21.30)
µβ
em que g(0) é a métrica não perturbada de Friedmann
1 1 0
g(0) µβ = .
R2 0 −δij
Substituindo esta relação na Eq. (21.30) e restringindo-se à ordem linear, chegaremos ao tensor métrico
perturbado,
(1) µν 1 (1 − 2Φ) 0
g = 2 .
R 0 − (1 + 2Ψ) δij
A fim de chegarmos a equação de Einstein devemos avaliar as componentes do escalar perturbado de Ricci
e da curvatura escalar, em ordem linear, para se obter a expressão do tensor de Einstein perturbado, i.e.,
µ
G(1) ν . 58 Os escalares perturbados de Ricci, considerando apenas a primeira ordem de variação, são dados
por
(1) R′ ′ R′ ′
R00 = 3 Ψ +3 Φ + ∂ i ∂i Φ + 3 Ψ′′ ,
R R
(1) R′
R0i = 2 ∂i Φ + 2 ∂i Ψ′ ,
R
" ′ 2
(1) R′ ′ R′ ′ R′′ R R′′
Rij = − Φ −5 Ψ −2 Φ−2 Φ−2 Ψ
R R R R R
′ 2 #
R ′′ k
−2 Ψ − Ψ + ∂ ∂k Ψ δij + ∂i ∂j Ψ − ∂i ∂j Φ .
R
58
B. Bassett, S. Tsujikawa and D. Wands, Review of Modern Physics 78, 537 (2006); A. Riotto, Lectures delivered at the ICTP
Summer School on Astroparticle Physics and Cosmology, Trieste, 17 June - 5 July 2002, arXiv:hep-ph/0210162 (2002).
“Z_2” — 2017/9/5 — 8:19 — page 604 — #624
" 2 #
(0) R′′ R′
Rij = + δij .
R R
O valor perturbado da curvatura escalar é
(1) 1 ′′ i R′ ′ R′ ′ R′′ i
R = 2 6Ψ + ∂ ∂i Φ + 6 − Φ + 18 Ψ + 12 Φ − ∂ ∂i Ψ .
R R R R
O valor não perturbado da curvatura escalar é
6 R′′
R(0) = − .
R2 R
Finalmente, o tensor de Einstein pode ser calculado em primeira ordem de perturbação como,
(1) 0 6 ′
2
G 0 = − 2 H HΦ + Ψ + ∂i ∂ i Ψ
R R2
0 2
G(1) i = 2
∂i HΦ + Ψ′
R
i 2
G(1) j =− Ψ′′ + H 2Ψ′ + Φ′ + 2H′ + H2 Φ
R2
1
+ ∂i ∂ i (Φ − Ψ) δji + 2 ∂ i ∂j (Φ − Ψ) ,
R
R′
em que H = R.
– Tensor stress de energia perturbado:
Na Seção 23.3, vimos que o tensor stress de energia para o campo do inflaton φ é dado pela expressão
(21.13) e as correspondentes expressões da densidade de energia ρ e da densidade de pressão p, não pertur-
badas, são dadas em (21.15).
O tensor stress de energia perturbado pode ser expresso por
(1) 1
Tµν = ∂µ δφ∂ν φ + ∂ν δφ∂µ φ − δgµν gαβ ∂α φ∂β φ − V (φ)
2
1 αβ αβ
− gµν δg ∂α φ∂β φ + g ∂α δφ∂β φ − Vφ (φ)δφ ,
2
em que Vφ = dV dφ . Na seção seguinte, vamos considerar campos escalares e fluidos perfeitos como a única
fonte de perturbação. O tensor stress de energia perturbado associado com o campo escalar φ para a métrica
(21.29) pode ser representado como
0 1 2
T (1) 0 = 2 φ′ δ′ φ + R2 Vφ δφ − φ′ Φ = δρ
R
0 1
T (1) i = 2 ∂i δφ φ′ = ∂i δσ (21.31)
R
i 1
2
T (1) j = − 2 φ′ δ′ φ − R2 Vφ δφ − φ′ Φ δji = −δp δji .
R
“Z_2” — 2017/9/5 — 8:19 — page 605 — #625
– Equação de movimento:
O campo escalar φ não possui qualquer stress anisotrópico. Por isso, em tal caso, temos, Φ = Ψ. Após
i
a imposição desta condição sobre o tensor de Einstein, G(1) j , chegamos à correspondente equação de
µ µ
Einstein, G(1) ν = 8πG T (1) ν , que posteriormente leva à equação que rege a perturbação. As três equações
de Einstein podem ser expressas em termos das quantidades escalares como
3 ′
1
− 2
H HΦ + Φ + ∂ i Φ = 4πG δρ
R R2 i
1
2
∂i HΦ + Φ′ = 4πG (∂i δσ) (21.32)
R
1 ′′
2
Φ + 3HΦ′ + 2H′ + H2 Φ = 4πG δp .
R
Usando a primeira e a terceira relações das Eqs. (21.32) podemos combinar para chegar à seguinte equação
que rege a evolução do potencial de Bardeen, 59 denominado Φ,
Φ′′ + 3H 1 + c2A Φ′ − c2A ∂i ∂ i Φ + 2H′ + 1 + 3c2A H2 Φ = 4πGR2 δpN A , (21.33)
em que usamos a expressão padrão δp − δpN A = c2A δρ. Aqui, δpN A é a perturbação da pressão não
′
adiabática, enquanto c2A ≡ pρ′ representa a velocidade adiabática da perturbação.
Nas escalas super-Hubble os comprimentos de onda físicos associadas com as perturbações são muito mai-
k
ores do que o raio de Hubble, o que implica que H ≪ 1. Aqui k refere-se ao número de onda dos modos
de Fourier das perturbações. Introduzimos uma quantidade referida como a perturbação de curvatura que é
uma função do potencial de Bardeen e de sua derivada no tempo
−1 ′
2 H Φ +Φ
R=Φ+ , (21.34)
3 (1 + w)
em que w = ρp . A Eq. (21.33) poderá ser reescrita em termos da perturbação da curvatura definida acima.
Fazendo uso das equações de Friedmann, (20.15) e (20.16) com Λ = 0, de modo que
′ H
Rk = 2 ′
4πGR2 δpN A − c2A k2 Φk . (21.35)
H −H
k
Como fizemos antes, tomemos H ≪ 1, então o termo c2A k2 Φk na expressão anterior poderá ser ignorada.
Além disso, na ausência da perturbação da pressão não adiabática, i.e., δpN A = 0, a Eq. (21.35) será
R′k = 0 .
Assim, a perturbação da curvatura Rk é conservada nas escalas super-Hubble, quando os modos estão fora
do raio de Hubble e na ausência de perturbação não adiabática.
59
James Maxwell Bardeen (1939- ), físico americano.
J. M. Bardeen, Physical Review, D22, 1882-1905 (1980).
“Z_2” — 2017/9/5 — 8:19 — page 606 — #626
As equações de Einstein perturbada, ver Eqs. (21.32), podem ser reescritas usando tensor stress de energia
perturbado Eqs. (21.31) como
3 ′
1 i 1 ′ ′ 2 ′2
− H HΦ + Φ + ∂ Φ = φ δ φ + R Vφ δφ − φ Φ
R2 R2 i R2
1 ′
1 ′
∂ i HΦ + Φ = ∂i δφ φ (21.36)
R2 R2
1 ′′ ′ ′ 2
1 ′ ′ 2 ′2
Φ + 3HΦ + 2H + H Φ = − φ δ φ − R Vφ δφ − φ Φ .
R2 R2
Por conveniência, vamos expressar a equação de movimento do campo escalar (21.17) e as densidades de
energia e de pressão (21.15) durante a inflação em termos do tempo conforme como
φ′′ + 2H φ′ + R2 Vφ = 0
e
φ′ 2 φ′ 2
ρ= + V (φ) , p = − V (φ) .
2R2 2R2
Em seguida, simplificamos as equações de Einstein perturbadas usando as expressões acima para chegar à
seguinte equação para o potencial de Bardeen:
Φ′′ + 3H 1 + c2A Φ′ − c2A ∂i ∂ i Φ + 2H′ + 1 + 3c2A H2 Φ = 1 − c2A ∂i ∂ i Φ . (21.37)
Ao comparar esta equação com a expressão mais geral para a evolução do potencial de Bardeen, Eq. (21.33),
chegamos à relação do inflaton com a perturbação de pressão não adiabática,
NA 2
∂i ∂ i Φ
δp = 1 − cA .
4πGR2
Com esta condição, a Eq. (21.35) será
H
R′k = k 2 Φk . (21.38)
H − H′
2
′
Introduziremos agora uma quantidade z = RHφ . Assim, na diferenciação da Eq. (21.38) em relação ao
tempo conforme e, em seguida, simplificando através do uso das equações de Friedmann (20.15) e (20.16)
com Λ = 0, a equação de Bardeen (21.37) e a quantidade definida z chegam à seguinte equação de movi-
mento que descreve a evolução dos modos de Fourier da perturbação da curvatura, devido ao campo escalar
φ ′
′′ z
Rk + 2 R′k + k2 Rk = 0 .
z
Introduzindo outra variável v, chamada variável de Mukhanov-Sasaki, 60 que é definido como v = Rz, a
equação anterior reduz-se a seguinte equação diferencial para os modos de Fourier da variável vk ,
′′ 2 z ′′
vk + k − vk = 0 .
z
60
Viatcheslav Fyodorovich Mukhanov (1956- ), físico e cosmólogo americano russo.
Misao Sasaki (1952- ), físico e cosmólogo japonês.
M. Sasaki, Prog. Theor. Phys., 76, 1036 (1986); V. Mukhanov, Sov. Phys. JETP, 67, 1297 (1988).
“Z_2” — 2017/9/5 — 8:19 — page 607 — #627
Diferenciando ambas as expressões duas vezes e após manipulações adequadas a equação de Bardeen
(21.33), no espaço de Fourier, será
θ ′′
u′′k + c2A k2 − uk = 0 , (21.40)
θ
em que assumimos as pertubações da pressão não adiabáticas estão ausentes, i.e., δpN A = 0. No limite
′′
super-Hubble, i.e., quando k2 ≪ θθ , a Eq. (21.40) terá duas soluções,
Z η
dτ
uk (η) ∝ θ (η) e uk (η) ∝ θ (η) 2
.
θ (τ )
em que usamos as relações H = β+1 η . Para determinar a evolução do potencial de Bardeen em escalas
super-Hubble, usamos as relações anteriores na Eq. (21.41). Logo, obtemos que
β+2 β+1
Φk (η) ≃ Ac (k) + Ad (k) 2 (2β+3) .
2β + 3 a0 η
61
Em inglês, a expressão correta seria leading order.
62
L. Sriramkumar, An introduction to inflation and cosmological perturbation theory, arXiv:0904.4584 (astro-ph.CO) (2009).
“Z_2” — 2017/9/5 — 8:19 — page 608 — #628
Podemos simplificar ainda mais esta equação usando o parâmetro de estado w ≡ pρ . Sobre a simplificação
da equação acima usando as equações de Friedmann, (20.15) e (20.16) com Λ = 0, e a lei de potência
(21.42), obtém-se
1 − 3w
β= .
1 + 3w
3(1 + w) 2
Φk (η) ≃ Ac (k) + Ad (k) , (21.43)
5 + 3w (3w + 1) a20 η (2β+3)
em que, naturalmente, o primeiro termo é uma constante que representa o modo de crescimento e o segundo
termo representa o modo de decaimento.
Vamos analisar a equação de evolução durante diferentes épocas, i.e., eras. A inflação corresponde a
condição −∞ < η < 0 e β ≤ −2, com β = −2 temos inflação exponencial. Além disso, as eras de
radiação e matéria dominantes correspondem a β = 0 e β = 2, respectivamente. Nestes casos, o limite
super-Hubble representa o tempo inicial para os quais η → 0. Portanto a quantidade η (2β+3) tende a zero e
o modo de decaimento correspondente torna-se muito grande nos primeiros tempos. Assim, a fim de ter uma
expressão finita, o modo de decaimento na Eq. (21.43) será negligenciada, tal que, em escalas super-Hubble
temos
3(1 + w)
Φk (η) ≃ Ac (k) . (21.44)
5 + 3w
É evidente que esta quantidade será zero para w = −1, que corresponde à expansão conduzida pela cons-
tante cosmológica. Em outras palavras, as perturbações métricas não são produzidos pela constante cosmo-
lógica. Em escalas super-Hubble, Φk é uma constante e, portanto, a partir da Eq. (21.34), podemos expressar
a perturbação de curvatura Rk como
5 + 3w
Rk ≃ Φk ≃ Ac (k) .
3(1 + w)
3(1 + wM ) 2
ΦM
k (η) ≃ Ac (k) = Ac (k)
5 + 3wM 5
3(1 + wR ) 2
ΦR
k (η) ≃ Ac (k) = Ac (k) ,
5 + 3wR 3
em que usamos o fato de que o parâmetro de estado durante as eras dominates de matéria e de radiação são
dados por wM = 0 e wR = 31 . Assim, se tivermos em conta a transição do potencial de Bardeen nas escalas
de super-Hubble da era de radiação para a era dominada por matéria vemos que o potencial Φ mudará por um
9
fator de 10 . De fato, o padrão das anisotropias na radiação cósmica de fundo e as estruturas de grande escala
que observamos hoje, são essencialmente determinados pelo espectro do potencial de Bardeen quando os
modos entram no raio de Hubble durante as eras dominadas por matéria e radiação.
63
L. Sriramkumar, An introduction to inflation and cosmological perturbation theory, arXiv:0904.4584 (astro-ph.CO) (2009).
“Z_2” — 2017/9/5 — 8:19 — page 609 — #629
Perturbação Vetorial Vamos deduzir as equações de Einstein para as perturbações vetoriais. Assim,
vamos escolher um calibre, de tal modo que Qi seja zero e Di ∝ Di , de modo que o elemento de linha
correspondente associado à perturbação vetorial é dado per
ds2 = dt2 − R2 (t) [δij + (∂i Dj + ∂j Di )] dxi dxj .
Para esta métrica, o tensor de Einstein pode ser calculado como,
0
G(1) 0 = 0
0 1
G(1) i = ∂k ∂ k Ḋi (21.45)
2
1 h
i
i
G(1) j = −
∂i D̈j + ∂j D̈i + 3H ∂i Ḋj + ∂j Ḋi .
2
Assim, é evidente que as componentes diferentes de zero do tensor de Einstein serão iguais a zero na
ausência de fontes vetoriais. Isto implica que a perturbação métrica Di é zero e, portanto, perturbações
vetoriais não são geradas na ausência de fontes de vorticidade.
0
G(1) i = 0 (21.46)
i 1 1
G(1) j =− k
ḧij + 3H ḣij − 2 ∂k ∂ hij .
2 R
Além disso, na ausência do stress anisotrópico, a equação de Einstein diferente de zero podem ser expressos
na coordenadas de tempo conforme para chegar à seguinte equação diferencial de ondas gravitacionais de
amplitude h
h′′ + 2H − ∂k ∂ k h = 0 .
Aqui, temos os dois tipos de polarização associados com as ondas gravitacionais que são descritos pelos
dois graus correspondentes ao tensor hij transversal e de traço nolo. Ondas gravitacionais veremos adiante.
Problemas
21.1 Deduza a expressão para a fração, em massa, de hélio existente no universo,
exp (−(t − tf )/τn )
Y =2 ,
1 + exp (Q/Tf )
64
L. Sriramkumar, An introduction to inflation and cosmological perturbation theory, arXiv:0904.4584 (astro-ph.CO) (2009).
“Z_2” — 2017/9/5 — 8:19 — page 610 — #630
Ṙ2 = 1
3 ρ R2 − k ,
mostre que, se p < − 13 ρ, o termo curvatura torna-se insignificante na medida que o universo se
expande.
satisfaz a condição ∇µ T µν = 0.
21.4 Mostre explicitamente que, para um campo escalar atuando como um fluido perfeito, a densidade de
energia e a pressão são, respectivamente, dadas por
2 2
~
ρφ = 12 φ̇2 + V (φ) + 12 ∇φ e ~
pφ = 12 φ̇2 − V (φ) − 16 ∇φ .
21.5 Quais as condições necessárias para termos as Eqs. (21.15), i.e., para que
ρ= 1
2 φ̇2 + V (φ) e p= 1
2 φ̇2 − V (φ) ,
sejam observadas.
21.6 Mostre que a equação de movimento para um campo escalar com potencial V (φ) é
dV (φ)
φ̈ + 3H φ̇ + dφ = 0.
1
Encontre a solução geral para um campo escalar livre, com V (φ) = 2 m2 φ2 , no caso em que H é
aproximadamente constante.
λ
21.7 Derivar a dinâmica slow-roll para o modelo inflacionário 4 φ4 .
λ
21.8 Repita o problema anterior para o modelo inflacionário n φn .
21.9 Mostre que a inflação caótica também ocorre em teorias com potenciais exponenciais do tipo
V (φ) = V0 eαφ ,
21.10 Para a perturbação do campo escalar φ(t) → φ0 (t) + δφ(t,~x), mostre que, em primeira ordem de δφ,
as partes perturbadas do tensor energia-momentum do campo escalar são dadas por
Leitura Recomendada
Para este capítulo, recomendo ao leitor, um estudo detalhado dos seguintes livros,
Nestes livros, encontraremos deduções detalhadas do modelo inflacionário do universo, com especial aten-
ção ao texto do Prof. Weinberg, assim como da teoria de perturbações cosmológicas. Estes textos são claros
e elegantemente escritos.
“Z_2” — 2017/9/5 — 8:19 — page 612 — #632
Capítulo 22
Buracos Negros
A física dos chamados buracos negros é uma das áreas de estudos que coloca em prova a teoria da re-
latividade geral de Einstein pois abrange sistemas com campos gravitacionais tão intensos que permite o
surgimento de fenômenos que não são comuns no nosso dia a dia. A primeira idéia de buraco negro foi
apresentada em 1783 por John Michell1 que argumentou que corpos com um raio 500 vezes superior ao do
Sol e com uma densidade igual ou superior à deste não deixariam, em virtude da sua atração gravitacional,
os seus próprios raios de luz escaparem sendo assim invisíveis aos nossos sentidos.2 Michell pensou em
termos de velocidade de escape que é tanto maior quanto maior for a massa do corpo (seja este um planeta,
uma estrela, etc..) e tanto maior quanto menor for o respectivo raio. Embora no caso da Terra o seu valor seja
de apenas 11 km/s, em uma estrela de neutrons pode-se atingir 1, 5 × 105 km/s, i.e., metade da velocidade
da luz. Jogando com os valores do raio e da massa podemos imaginar, assim como Michell, uma estrela
cuja velocidade de escape seja superior à da luz. Esta estrela não seria visível por um observador distante.
Naquela época não se nomeava tais objetos de buracos negros e este conceito nem foi muito aceito quando
foi implementada a descrição ondulatória da luz, que entre outras coisas, a tornava imune aos efeitos de
qualquer campo gravitacional.
Mas esta ideia foi uma espectacular previsão de uma das propriedades dos buracos negros, i.e., apri-
sionar a luz e ser invisível. Todavia estas estrelas escuras não correspondem exatamente à definição atual
de buraco negro. Um corpo capaz de aprisionar a sua própria luz não pode ser descrito pela teoria da gra-
vitação de Newton. Em 1916 Einstein apresentou uma nova teoria, a chamada teoria da relatividade geral,
aplicável nestas situações. 3 A gravidade passa a ser interpretada como uma deformação da geometria do
espaço-tempo, associando a ele uma curvatura que influencia na trajetória de qualquer partícula. Apenas
alguns meses depois da publicação dos trabalhos de Einstein, Schwarzschild obteve sua primeira solução
que assumia um objeto esférico massivo na origem das coordenadas.4 Este resultado permitia descrever o
campo gravitacional em torno de estrelas como o Sol ou ainda em torno de estrelas mais compactas como
as anãs brancas e estrelas de neutrons em relação às quais os efeitos relativísticos são mais relevantes. O
que não ficou imediatamente evidente é que esta solução comportava também a descrição de um objecto
bem mais exótico, o chamado buraco negro.
Os buracos negros são objetos previstos pela teoria da relatividade geral. No entanto, eram objetos de
1
John Michell (1724-1793), reverendo, naturalista e geólogo inglês.
2
J. Michell, Philosophical Transactions of the Royal Society of London, 74, 35-57 (1784).
Numa monografia publicada em 1795, intitulada Systéme du Monde, Laplace também descreveu a ideia de estrelas invisíveis
recorrendo, embora sem o referir, aos mesmos argumentos de Michell. Ver P. S. Laplace, Exposition du système du Monde, Part
II, Paris (1796) (English translation by Rev. H. Harte, Dublin (1830).
3
A. Einstein, Annalen der Physik (ser. 4), 49, 769-822 (1916); Idem, 51, 639-642 (1916); Idem, Preussische Akademie der
Wissenschaften, Sitzungsberichte, part 1, 688-696 (1916); Idem, part 2, 1111-1116 (1916).
4
K. Schwarzschild, Sitzungsberichte der Königlich Preussischen Akademie der Wissenschaften, Berlin 7, 189-196 (1916); Ibi-
dem, 424-434 (1916).
612
“Z_2” — 2017/9/5 — 8:19 — page 613 — #633
tal forma fora do comum que, na falta de qualquer evidência da sua existência, o seu estudo não foi muito
motivador ao longo de muitos anos. Apenas com a descoberta de outros objetos exóticos, como os quasares
em 1963 e as estrelas de neutrons em 1967,5 é que veio reavivar o entusiasmo e o interesse pelo estudo dos
buracos negros. Desde então têm sido identificados vários candidatos a buraco negro.6 Em termos de massa,
estas vão desde os buracos negros estelares 1-102 M⊙ espalhados pela nossa galáxia, até aos super buracos
negros 106 -1010 M⊙ presentes nos núcleos de algumas galáxias incluindo a nossa. Toda esta seleção de
candidatos é feita a partir de observações indiretas.
No plano teórico conseguiram-se nas últimas décadas grandes desenvolvimentos sobre as propriedades
dos buracos negros e sobre a interação dos mesmos com o meio envolvente. Um dos resultados teóricos mais
fascinantes aponta para a emissão de radiação por buracos negros. Esta radiação, designada por radiação
de Hawking,7 inclui ondas electromagnéticas, ondas gravitacionais e, no caso de buracos negros de menor
massa, partículas com massa. A emissão de radiação de Hawking leva à evaporação do buraco negro. Na
fase final da evaporação são emitidas grandes quantidades de raios gama num curto intervalo de tempo
assistindo-se, assim, à explosão do buraco negro.8
em que dΩ2 = dθ 2 + sen2 θ dφ2 . Por conveniência vamos trabalhar com partículas sem massa.
Em geodésicas radiais nula na métrica de Schwarzschild, i.e., tipo luz, com ds2 = 0 e dΩ2 = 0
1
dt2 = dr
2
≡ dR2 , (22.2)
2M 2
1− r
em que
r − 2M
R = r + 2M ln (22.3)
M
é a coordenada radial de Regge-Wheeler.9 a coordenada r se extende de 2M a +∞ e R se extende de −∞
a +∞, desde que R → −∞ assim como r → 2M + , ver a Fig. 22.1, podemos mostrar que para r > 2M ,
este mapeamento é monotônica. Usando esta coordenada, a Eq. (22.2) se torna
d(t ± R) = 0 (22.4)
5
M. Schmidt, Nature, 197 (4872), 1040 (1963); T. A. Matthews and A. R. Sandage, Astrophysical Journal, 138, 30-56 (1963);
A. R. Sandage, Astrophysical Journal, 141, 1560-1578 (1965); A. Hewish, S. J. Bell, J. D. H. Pilkington, P. F. Scott and
R. A. Collins, Nature, 217 (5130), 709 (1968); J. D. H. Pilkington, A. Hewish, S. J. Bell, and T. W. Cole, Nature, 218 (5137),
126 (1968).
6
Durante o período entre dezembro de 1986 e abril de 1988, foram feitas observações de explosões de raios-x do sistema estelar
Cygnus X-1, indicando como forte candidato a buraco negro, ver o artigo, R. A. Schwartz, L. E. Orwig, B. R. Dennis, J. C. Ling
and W. A. Wheaton, Astrophysical Journal, Part 1 376, 312-321 (1991).
7
Stephen William Hawking (1942- ), físico e cosmólogo inglês.
8
S. W. Hawking, Nature, 248, 30-31 (1974); Idem, Communications in Mathematical Physics, 43, 199-220 (1975).
9
Tullio Eugenio Regge (1931-2014), físico italiano.
S. Regge and J. Wheeler, Physical Review, 108, 1063 (1957).
“Z_2” — 2017/9/5 — 8:19 — page 614 — #634
para todas as linhas dos universo do tipo tempo ou do tipo nulo drdv ≤ 0. Com dv > 0 para as linhas dos
universo dirigidas para o futuro, então dr ≤ 0 com igualdade quando r = 2M , dΩ = 0, i.e., geodésicas
radiais nulas de entrada em r = 2M . Agora, para r ≤ 2M e as coordenadas de Eddington-Finkelstein de
saída temos
2 2M
2drdu = ds + − 1 du2 + r 2 dΩ2
r
≥ 0, quando ds2 ≥ 0 ,
ou seja, drdu ≥ 0 nas linhas dos universo do tipo tempo ou do tipo nulo. Mas du > 0 para as linhas dos
universo dirigidas para o futuro, então dr ≥ 0 com igualdade quando r = 2M , dΩ = 0 e ds2 = 0. Neste
caso, uma estrela com uma superfície em r < 2M deve se expandir e explodir através de r = 2M , como
ilustrado no diagrama de Finkelstein apresentado na Fig. 22.3. Este é um buraco branco, o inverso temporal
de um buraco negro. Ambos os buracos negro e branco são permitidos pela relatividade geral por causa da
reversibilidade do tempo nas equações de Einstein. Mas buracos brancos exigem condições iniciais muito
especiais perto da singularidade, tal que apenas os buracos negros possam ocorrer na natureza, confira com
irreversibilidade em termodinâmica.
“Z_2” — 2017/9/5 — 8:19 — page 616 — #636
Estas são as coordenadas de Kruskal-Szekeres,13 (U, V, θ, φ). Inicialmente, a métrica é definida para U < 0
e V > 0, mas pode ser analiticamente contínua para a região U > 0 e V < 0. Agora r = 2M corresponde
a U V = 0, i.e., quer U = 0 ou V = 0, e a singularidade em r = 0 corresponde às hipérboles U V = 1.
É conveniente fazer um gráfico para as linhas de U = const. e V = const., i.e., as geodésicas radiais
nulas de entrada e de saída, em π4 radianos. O diagrama de espaço-tempo é mostrado na Fig. 22.4. Neste
13
Martin David Kruskal (1925-2006), físico e matemático americano.
George Szekeres (1911-2005), matemático húngaro australiano.
M. D. Kruskal, Physical Review, 119, 1743 (1960); G. Szekeres, Math. Debreca., 7, 285 (1960).
“Z_2” — 2017/9/5 — 8:19 — page 617 — #637
diagrama, suprimimos as coordenadas θ, φ e portanto, cada ponto é em realidade uma 2-esfera. Há quatro
regiões do espaço-tempo em coordenadas de Kruskal-Szekeres, dependendo dos sinais de U e de V . As
regiões I e II são abrangentes pelas coordenadas de Eddington-Finkelstein de entrada. Estas são as únicas
regiões relevantes para o colapso gravitacional porque as regiões III e IV representam um buraco branco.
As regiões III e IV são completamente inacessíveis a partir de regiões I e II. A região III é semelhante
à região II, mas em sentido inverso: é uma parte do espaço-tempo a partir do qual uma partícula pode
escapar (dentro de regiões I e IV) mas não entrar. Os dois universos I e IV são, na verdade, ligados por
um buraco de minhoca na origem.14
Notas sobre buraco de minhoca - buraco de minhoca é uma característica topológica hipotética do con-
tinuo espaço-tempo, a qual é, em essência, um atalho através do espaço e do tempo. Um buraco de
minhoca possui ao menos duas bocas conectadas a uma única garganta ou tubo. Se o buraco de mi-
nhoca é transponível, a matéria pode viajar de uma boca para outra passando através da garganta.
Embora não exista evidência direta da existência de buracos de minhoca, um contínuo espaço-tempo-
ral contendo tais entidades costuma ser considerado válido pela relatividade geral.
Buracos de minhoca lorentzianos, conhecidos como buracos de minhoca de Schwarzschild ou pontes
de Einstein-Rosen15 são pontes entre áreas do espaço que podem ser modeladas como soluções de
vácuo para as equações de campo de Einstein ao combinar os modelos de um buraco negro e um
buraco branco. Esta solução foi descoberta por Einstein e Rosen, os quais publicaram o resultado em
1935.16 Todavia, em 1962, Wheeler e Fuller17 publicaram um paper demonstrando que este tipo de
buraco de minhoca é instável, e que ele irá colapsar instantaneamente tão logo se forme, impedindo
que mesmo a luz consiga atravessá-lo.18
Embora buracos de minhoca de Schwarzschild não sejam transponíveis, sua existência inspirou Kip
14
Em inglês é wormhole.
15
Nathan Rosen (1909-1995), físico israelense americano.
16
A. Einstein and N. Rosen, Physical Review, 48, 73 (1935).
17
Robert Works Fuller (1936- ), físico americano.
18
R. W. Fuller and J. A. Wheeler, Physical Review, 128, 919 (1962).
“Z_2” — 2017/9/5 — 8:19 — page 618 — #638
As coordenadas U e V são coordenadas nulas dado que os vetores bases ∂U e ∂V são nulos o que
não representa problema nenhum, porém às vezes é mais conveniente utilizar sistemas constituídos por
coordenadas temporais e espaciais. Portanto, definimos
1 1
T = (V + U ) , X= (V − U ) .
2 2
Assim, para r > 2M temos
r 1 r
2 t
T = −1 e 4M senh
2M 4M
r 1 r
2 t
X= −1 e 4M cosh ,
2M 4M
32M 3 − r
ds2 = e 2M dT 2 − dX 2 − r 2 dΩ2 , (22.11)
r
em que r = r (T, X) está definido implicitamente por
r r
T 2 − X2 = 1 − e 2M . (22.12)
2M
Estas são as coordenadas de Kruskal-Szekeres para (T, X, θ, φ). Nesta situação, a singularidade r = 0
é localizada em T 2 − X 2 = 1, o que significa
√ que em lugar de uma, existem duas singularidades desta
natureza, cada uma correspondendo a T = ± 1 + X 2 . Por outro lado, o horizonte de eventos, r = 2m, é
definido por T = ±X. A região r > 2M é equivalente a T 2 − X 2 < −1 na qual podemos concluir que
temos igualmente duas regiões exteriores X > |T | e X < −|T |.
A Eq. (22.12) revela que superfícies com r = constante são hipérboles cujas assíntotas são definidas
por T = ±X. Enquanto isso, superfícies com t = constante são linhas retas que passam pela origem as
quais são dadas por
T para r > 2M
t X
tanh =
4M X
T para r < 2M .
Quando t → ±∞ as equações anteriores coincidem com o horizonte de eventos. Na Fig. 22.5 mostramos o
diagrama de Kruskal-Szekeres para essas novas coordenadas (T, X).
19
Kip Stephen Thorne (1940- ), físico americano.
20
M. S. Morris and K. S. Thorne, American Journal of Physics, 56, 395 (1988).
“Z_2” — 2017/9/5 — 8:19 — page 619 — #639
Agora, vamos derivar a geodésica radial nula xµ (λ). As geodésicas xµ (λ) tem λ como parâmetros afim.
Em geral, as geodésicas são definidas por
D dxµ
= 0,
dλ dλ
D
em que dλ é a derivada covariante ao longo da geodésica com respeito a λ. A ação Sp da partícula é
Z b
Sp = L dλ ,
a
em que a densidade lagrangiana é
1 dxµ dxν
L= gµν . (22.13)
2 dλ dλ
Portanto, se gµν e L são independentes de alguns xµ , então o momentum conjugado
∂L dxν
pµ ≡ dxµ
= gµν (22.14)
∂ dλ
dλ
será constante ao longo da geodésica. Encontramos que, na métrica de Schwarzschild, com o plano que
contém a geodésica tomada em θ = π2 , os momenta constantes pt e pφ são
∂L 2M dt
pt = dt
= 1− =E (22.15)
∂ dλ r dλ
∂L dφ
pφ = = r2 = L, (22.16)
∂ dφ dλ
dλ
em que E and L são a energia e momentum angular, respectivamente. As expressões estão em termos das
coordenadas (t, r, θ, φ). Por causa da condição na casca, temos
2
dr L2 2M
+ 2 1− = E2 , (22.17)
dλ r r
“Z_2” — 2017/9/5 — 8:19 — page 620 — #640
em que usamos o mesmo procedimento desenvolvido na Sec. 19.3, ver a Eq. (19.35). Os geodésicas radiais
nulas são aquelas com L = 0. Assim, são caracterizados por (22.15) e (22.16)
dr
= ±E (22.18)
dλ
dφ
= 0. (22.19)
dλ
Destas equações, temos
dt 2M −1 dr
∓ 1− =0
dλ r dλ
ou
d
(t ∓ R) = 0 ,
dλ
em que R está definido por
−1
dR 2M
= 1− .
dr r
Quando r → 2M , implica em R → −∞. Ao longo de qualquer geodésica radial nula de saída, a coordenada
nula u ≡ t − R é constante, enquanto ao longo de qualquer geodésica radial nula de entrada, a coordenada
nula v ≡ t + R é constante. Estas, novamente, são as coordenadas de Eddington-Finkelstein de saída e de
entrada.
Consideremos C uma geodésica radial nula de entrada definida por v = v1 para algum v1 , que passa
pelo horizonte de eventos do buraco negro de Schwarzschild. Ao longo da geodésica nula C,
du dt dR 2M −1
= − =2 1− E.
dλ dλ dλ r
dr
Da Eq. (22.18), dλ = E ao longo de C, então
r − 2M = −E λ ,
em que λ é considerado zero no horizonte de eventos r = 2M . Para r > 2M , o parâmetro afim λ será
negativo. Segue-se que
2M −1 2M du 4M
1− =1− , = 2E − .
r Eλ dλ λ
Portanto, da segunda equação acima, temos uma expressão para a geodésica nula de entrada C,
λ
u = 2Eλ − 4M ln , (22.20)
K1
em que K1 é uma constante negativa. Longe do horizonte de eventos,
u ≈ 2Eλ , (22.21)
torna-se um parâmetro afim devido a Eq. (22.21). Portanto, v − V0 deve estar relacionada com a separação
λ entre u(v) e u(v0 ) no passado infinito nulo por v0 − v = K2 λ, em que K2 é uma constante negativa.
Assim, próximo do horizonte de eventos,
v0 − v
u ≈ −4M ln . (22.23)
K1 K2
Esta curva geodésica contribui para a criação das partículas em maior número. Aqui o produto K1 K2 é um
parâmetro constante positivo.
em que a função ω 2 (xµ ) é escolhida de tal forma que todos os pontos do infinito estarão localizados a uma
distância finita na nova métrica. Esta condição implica que ω deve satisfazer ω → 0 quando xi → ∞, i.e.,
infinito espacial, ou x0 = t → ∞, i.e., infinito temporal. Para entendermos melhor esta técnica, vamos
aplicá-la ao espaço-tempo de Kruskal.
Em coordenadas de Eddington-Finkelstein, (v, u, θ, φ), o elemento de linha de Schwarzschild é
2 2M
ds = 1 − dvdu − r 2 dΩ2 . (22.24)
r
em que as coordenadas tomam os valores nos intervalos
Assim, temos
2M r 2
2 2 2
ds̃ = ω ds = 4 1 − dV dU − sen2 (V − U ) dΩ2
r R
e ω = 2 cos V cos U , como já havíamos mencionado.
Para desenhar o diagrama para Carter-Penrose é útil notar que esta métrica é assintoticamente plana, ou
seja, torna-se no infinito no espaço de Minkowski. Por essa razão, nas fronteiras do diagrama temos
Por outro lado, perto do horizonte de eventos, r = 2M , o diagrama de Kruskal nos mostra como é a
estrutura do espaço-tempo. Portanto, o diagrama de Carter-Penrose tem quatro regiões, dois dos quais são
assintoticamente plana e dois possuem singularidades r = 0, como pode ser visto na Fig. 22.6. É importante
ressaltar que os pontos i+ e i− são diferentes da singularidade e por isso há muitos caminhos como de tempo
terminando em i+ , mas não na singularidade.
∆ = (r − r+ ) (r − r− )
p
em que r± = M ± M 2 − Q2 , para os quais os valores de r± não são necessariamente reais. Desta forma
podemos distinguir três casos de interesse.
22
Hans Jacob Reissner “Reißner” (1874-1967), engenheiro, matemático e físico alemão.
Gunnar Nordström (1881-1923), físico finlandês.
H. Reissner, Annalen der Physik, 50, 106-120 (1916); G. Nordström, Verhandl. Koninkl. Ned. Akad. Wetenschap., Afdel.
Natuurk., Amsterdam, 26, 1201-1208 (1918).
“Z_2” — 2017/9/5 — 8:19 — page 624 — #644
• Caso 1: M 2 < Q2 Neste caso r± são ambos imaginário, e por isso não existe coordenadas singulares.
A métrica é, por conseguinte, regular para todos os valores positivos de r. Uma vez que a função
∆(r) sempre permanece positiva, a coordenada t é sempre do tipo tempo e r é sempre do tipo espaço.
Assim, a singularidade intrínseca em r = 0 é uma linha do tipo tempo, em oposição a uma linha do
tipo espaço no caso de Schwarzschild. Isto significa que a singularidade não estará necessariamente
no futuro das trajetórias tipo tempo e portanto, em princípio, pode ser evitada. Na ausência de quais-
quer horizontes de evento, no entanto, r = 0 é uma singularidade pura, que é visível para o mundo
exterior. As consequências físicas de uma singularidade pura, tais como a existência de curvas fecha-
das tipo tempo, parecem tão extrema que Penrose sugeriu a existência de uma hipótese de censura
cósmica, que só permitiria singularidades que estão escondidas atrás de um horizonte de eventos.
Como resultado, o caso M 2 < Q2 não é considerado fisicamente realista. Como r → ∞ a solução
se aproxima o espaço-tempo plano. O diagrama de Carter-Penrose será parecido ao apresentado no
espaço de Minkowski, exceto que aqui temos em r = 0 uma singularidade, como mostra a Fig. 22.7.
• Caso 2: M 2 > Q2 Neste caso, r± são ambos real e assim existem duas singularidades nas coordenadas,
que ocorrem nas superfícies r = r± . A situação em r = r+ é muito semelhante ao caso de Schwarzs-
child em r = 2M . Para r > r+ , a função ∆(r) é positiva e por isso as coordenadas t e r são tipo
tempo e tipo espaço, respectivamente. Na região r− < r < r+ , no entanto, ∆(r) torna-se negativa e
assim as naturezas físicas das coordenadas t e r são trocados. Assim, uma partícula massiva ou fótons
que entram na superfície r = r+ a partir do exterior deve, necessariamente mover-se no sentido de
diminuir r, e, assim, r = r+ é um horizonte de eventos. A principal diferença entre a geometria de
Schwarzschild é que a queda irreversível da partícula só precisa continuar para a superfície r = r− ,
já que para r < r− a função ∆(r) é mais uma vez positiva e assim t e r recuperam suas propriedades
tipo tempo e tipo espacial. Dentro de r = r− , podemos (com um foguete) movimentar na direção
de um dos r positivo ou negativo, ou mesmo ficar parado. Assim, pode-se evitar a singularidade in-
trínseca em r = 0, o que é consistente com o fato de que r = 0 é uma linha de tipo tempo. Talvez
ainda mais surpreendente é o que acontece se um, em seguida, optar por viajar de volta na direção
de r positivo na região r < r− . Na realização de uma extensão analítica máxima da geometria de
“Z_2” — 2017/9/5 — 8:19 — page 625 — #645
• Caso 3: M 2 = Q2 Neste caso, conhecido como buraco negro extremo de Reissner-Nordström, a função
∆(r) é positiva em todos os lugares, exceto em r = M , em que é igual a zero. Assim, a coordenada
r está em toda parte, exceto no tipo espaço em r = M , em que se torna nula e, portanto, r = M é
um horizonte de eventos. O caso extremo é basicamente o mesmo que aquele considerado no Caso 2,
mas com a região r− < r < r+ removida. Para este caso, mostramos o diagrama de Carter-Penrose
na Fig. 22.9. É importante observar que para o caso extremo de Reissner-Nordström, o diagrama de
Carter-Penrose é similar ao obtido para o Caso 2 analisado antes, porém a região II deste diagrama
desaparece. Assim, a região exterior assintoticamente plana, região I, está diretamente ligado à região
interna contendo a singularidade.
Buracos Negros Rotativos Até o momento só discutimos soluções com simetria esférica. Vamos agora
introduzir a solução de Kerr-Newman23 para as equações de Einstein-Maxwell, que descreve um buraco
negro carregado em rotação de massa M , carga Q e momentum angular J ≡ M a, tal que a é o momentum
angular por unidade de massa. Em coordenadas de Boyer-Lindquist24 (t, r, θ, φ), em que o buraco negro
gira sobre o eixo polar, a parte da métrica da solução é determinada pela relação
2 ∆ − a2 sen2 θ a sen2 θ 2
ds = dt2 + 2 r + a2 − ∆ dt dφ
Σ Σ
2 !
Σ 2 r 2 + a2 − ∆ a2 sen2 θ
− dr − Σ dθ 2 − sen2 θ dφ2 , (22.29)
∆ Σ
23
Roy Patrick Kerr (1934- ), matemático neozelandês.
Ezra Ted Newman (1929- ), físico americano.
Em 1965, Ezra Newman encontrou a solução simétrica da equação de campo de Einstein para um buraco negro que está em
rotação e é eletricamente carregado. Esta fórmula para o tensor métrico gµν é a chamada métrica de Kerr-Newman. É uma
generalização da métrica de Kerr de um ponto de massa sem carga em rotação, o qual tinha sido descoberto por Roy Kerr dois
anos antes. Quatro soluções relacionadas podem ser resumidas na seguinte tabela:
em que Q representa carga elétrica do corpo e J representa o seu momentum angular. Ver E. Newman and A. Janis, Journal
of Mathematical Physics 6 (6), 915-917 (1965); E. Newman, E. Couch, K. Chinnapared, A. Exton, A. Prakash and R. Tor-
rence, Journal of Mathematical Physics 6 (6), 918-919 (1965); R. P. Kerr, Physical Review Letters 11, 237-238 (1963).
24
Robert H. Boyer (1933-1966), físico e matemático inglês.
Richard W. Lindquist, físico e matemático americano.
Não é de amplo conhecimento que Robert H. Boyer, que faleceu aos 33 anos de idade, foi uma das vítimas do terrível ata-
que do atirador na Universidade do Texas em Austin, em 01 de agosto de 1966, enquanto era visitante naquela universidade,
menos de duas semanas depois de ter submetido o artigo com Lindquist, que foi publicado em 1967. Ver R. H. Boyer and
R. W. Lindquist, Journal of Mathematical Physics 8, 265-281 (1967).
“Z_2” — 2017/9/5 — 8:19 — page 626 — #646
em que
Σ = r 2 + a2 cos2 θ e ∆ = r 2 − 2M r + Q2 + a2 .
Qr Q a r sen θ
At = , Aφ = − , Ar = Aθ = 0 .
Σ Σ
“Z_2” — 2017/9/5 — 8:19 — page 627 — #647
Abaixo, vamos mostrar a transformação de coordenadas que remove tais singularidades. Porém, também
tem uma singularidade na curvatura
A última condição implica que a singularidade na curvatura só será quando θ = π2 , i.e., quando r = 0 é
aproximada ao longo do equador. Quando se aproxima de qualquer outro ângulo, não há singularidade em
r = 0.
Temos novamente três casos a considerar: M 2 < a2 , M 2 = a2 e M 2 > a2 . Tal como nos casos
de Reissner-Nordström, quanto M 2 < a2 , este não é considerado fisicamente realista e quando temos o
caso extremo M 2 = a2 , este é instável. Desde que estes casos são de menor interesse físico, vamos nos
concentrar na solução M 2 > a2 , para o qual existem duas coordenadas singulares em r+ , i.e., o horizonte
externo, e r− < r+ , i.e., o horizonte interno. Para removê-las, faremos uma transformação de coordenadas
para coordenadas de Eddington-Finkelstein entrando (v, r, θ, χ), em que v = t + R sendo as coordenadas
R e χ definidas por
r 2 + a2 2M r + ∆ a
dR = dr ⇒ dv = dt + dr e dχ = dφ + dr . (22.31)
∆ ∆ ∆
A definição de χ implica que se χ = constante, não corresponde à φ = constante. Por exemplo, a fim de
a
permanecer com χ = constante equivalente à dr < 0, também precisamos da rotação dφ = − ∆ dr. Em
termos destas novas coordenadas, a métrica se torna
2 ∆ − a2 sen2 θ a sen2 θ 2
ds = dv 2 − 2 dv dr + 2 r + a2 − ∆ dv dχ
Σ Σ
" 2 #
2
r +a 2 − ∆ a sen2 θ
2
2
+ 2a sen dχ dr − sen2 θ dχ2 − Σ dθ 2 . (22.32)
Σ
Não há mais fatores de ∆ nos numeradores e a métrica é regular em r+ e r− . A única singularidade rema-
nescente é a singularidade da curvatura em Σ = 0.
Para desenhar o diagrama de Carter-Penrose será mais difícil, porque a métrica não é esfericamente
simétrica. Desde que a singularidade da curvatura em r = 0 só aparece quando θ = π2 , o diagrama de
Carter-Penrose deve ser muito diferente para θ 6= π2 e θ = π2 . Para representar ambos os casos, costuma-
-se desenhar um diagrama de Carter-Penrose que é uma amálgama do diagrama de Carter-Penrose para
um observador em queda a partir do polo norte θ = 0 e de que para um observador em queda no plano
equatorial θ = π2 a um χ fixo. Nota-se que χ = constante significa que φ não é constante, de modo que o
observador em queda no plano equatorial θ = π2 rodará em torno do eixo polar.
O processo é muito semelhante ao da solução sub-extrema de Reissner-Nordström M 2 > Q2 . Em
primeiro lugar, realizamos uma transformação de coordenadas para as coordenadas (u, v, θ, φ) em que
u = t + R e v = t − R com R definido em (22.31). Então definimos coordenadas do tipo Kruskal
U ± e V ± próximos de r = r± , respectivamente, e desenhamos o diagrama de Carter-Penrose. Isto conduz
à sequência de regiões de espaço-tempo infinitamente como vimos na Fig. 22.8. Até esse ponto, a análise
é idêntica para θ = 0 e θ = π2 . A única diferença é que o diagrama de Carter-Penrose para θ = 0 tem
uma singularidade de curvatura em r = 0, enquanto o diagrama de Carter-Penrose para θ = π2 não tem
nenhuma singularidade de curvatura. Na amálgama do diagrama de Carter-Penrose para o espaço-tempo de
Kerr, indicamos por uma linha tracejada em r = 0. Para este caso, mostramos o diagrama de Carter-Penrose
na Fig. 22.10.
curvo gµν . Aqui, só usaremos um campo escalar livre quantizado para manter a simplicidade, pois torna-se
essencialmente a mesma discussão para férmions e campos de calibre.
Teoria Quântica de Campos Escalares Livres em Espaços-Tempos Curvos O elemento de linha inva-
riante é dado por
ds2 = gµν (x) dxµ dxν ,
“Z_2” — 2017/9/5 — 8:19 — page 630 — #650
em que a assinatura é (+, −, −, −) mas a métrica gµν não é plana. A ação S é construída através do campo
escalar φ como Z
S= d4 x L
com
1 1 µν
L= |g| 2 g ∂µ φ ∂ν φ − m2 φ2 ,
2
em que g = det gµν , gµν = (gµν )−1 e m é a massa do campo escalar. A equação de movimento será
+m2 φ = 0, (22.33)
em que = gµν ∇µ ∇ν e ∇µ é uma derivada covariante. Pela Eq. (22.33), o campo escalar φ será expandido
como Z
φ(x) = d3~k A~ f~ (x) + A† f ∗ (x) , k k
(22.34)
~k ~k
em que f~k (x) é uma solução de (22.33). O produto interno da equação de Klein-Gordon 26 é definido por
Z
1
(φ1 , φ2 ) = i d3 x |g| 2 g0ν (φ∗1 ∂ν φ2 − φ∗2 ∂ν φ1 ) ,
Σ
em que Σ é um t = constante. Se φ1 e φ2 são soluções da Eq. (22.33) na qual se anulam no infinito espacial,
(φ1 , φ2 ) é conservado. Então, f~k e f~k′ satisfazem
d
f~k , f~k′ = 0
dt
e
f~k , f~k′ = δ(~k − ~k′ ) , f~k∗ , f~k∗′ = −δ(~k − ~k′ ) , f~k , f~k∗′ = 0 , (22.35)
aqui f~k ~k∈R é a base ortonormal no espaço de solução. Esta base não é única e depois da quantização
canônica dos campos, haverá diferentes noções de vácuo, de acordo com cada base ortonormal diferente.
Assim, a teoria quântica de campos em espaço-tempo curvo tem muitas vácuos. Esta é a diferença entre
a teoria quântica de campos no espaço plano e a teoria quântica de campos em espaço-tempo curvo. Isto
ocorre porque não há nenhuma coordenada de tempo preferida no espaço-tempo curvo.
Pelas Eqs. (22.34) e (22.35), temos
Z
1
A~k = f~k , φ = i d3 x |g| 2 g0ν f~k∗ ∂ν φ − φ∗ ∂ν f~k .
Σ
As relações de comutação para impor a quantização do campo escalar são dadas por
h i h i
A~k , A~† ′ = δ(~k − ~k′ ) , A~k , A~k′ = 0 .
k
∂L
Destas relações e da Eq. (22.33), φ e π ≡ ∂ φ̇
satisfazem as relações de comutação,
h i h i h i
φ(~x, t), π (~x′ , t) = i δ(~x − ~x′ ) , φ(~x, t), φ(~x′ , t) = 0 , π (~x, t), π (~x′ , t) = 0 .
26
Walter Gordon (1893-1939), físico alemão.
“Z_2” — 2017/9/5 — 8:19 — page 631 — #651
podemos considerar um novo operador b~k definido como b~k ≡ α~k a~k + β~∗ a~† . Se α~k e β~k satisfazem a
k k
relação |α~k |2 − |β~k |2 = 1, a transformação a~k → b~k é conhecida como transformação de Bogoliubov. 27
Pelo fato de que |α~k |2 − |β~k |2 = 1, a relação de comutação de b~k será
h i
b~k , b~† ′ = |α~k |2 − |β~k |2 δ(~k − ~k′ ) = δ(~k − ~k′ ) .
k
na qual, com esta métrica, a equação diferencial de um campo escalar, em que por simplicidade tomamos
m = 0, será X
R−3 ∂t R3 ∂t φ − R−2 ∂i2 φ = 0 . (22.37)
i
Impondo a condição de periodicidade, i.e., φ(xi + L, t) = φ(xi , t), podemos expandir φ na forma
X
φ(x) = A~k f~k (x) + A~† f~k∗ (x) . (22.38)
k
~k
Aqui
1 ~
f~k (x) = V − 2 ei k · ~x ψk (τ ) , (22.39)
27
Nikolay Nikolayevich Bogolyubov “Bogoliubov” (1909-1992), físico e matemático russo soviético.
N. N. Bogoliubov, Journal of Physics (USSR), 11 (1), 23-32 (1947); Idem, Journal of Experimental and Theoretical Physics
(USSR), 34 (1), 58 (1958).
28
S. W. Hawking, Nature, 248, 30-31 (1974); S. W. Hawking, Communications in Mathematical Physics, 43, 199-220 (1975).
“Z_2” — 2017/9/5 — 8:19 — page 632 — #652
2πni
em que V = L3 , ki = L , ni ∈ Z, k = |~k| e
Z t
τ= R−3 (t′ ) dt′ .
conforme t → −∞.
Agora, impomos a relação de comutação para quantização do campo escalar,
h i h i
A~k , A~† ′ = δ(~k − ~k′ ) , A~k , A~k′ = 0 ,
k
Assim, vamos construir estados em espaço de Fock. 29 Existe um espaço de Fock em cada hiperplano
t = constante, por isso devemos distinguir todos os vácuos sobre os hiperplanos. Chamemos o vácuo
na condição inicial |0i tal que
A~k |0i = 0 , ∨ ~k .
O desenvolvimento temporal de ψk é governado pela equação diferencial ordinária de segunda ordem
(±)
(22.40). Esta equação tem duas soluções linearmente independentes ψk tais que quando t → +∞ te-
mos
(±) − 1 3
ψk (τ ) ∼ 2R23 ω2k 2 e∓ i ω2k R2 τ ,
k
em que ω2k ≡ R2 . Por outro lado, ψk poderá ser representada por
(+) (−)
ψk (τ ) = αk ψk (τ ) + βk ψk (τ )
− 1 h 3 3
i
∼ 2R23 ω2k 2 αk e− i ω2k R2 τ + βk e+ i ω2k R2 τ , (t → +∞) . (22.41)
ψk ∂τ ψk∗ − ψk∗ ∂τ ψk = i ,
exige que
|αk |2 − |βk |2 = 1 .
29
Vladimir Aleksandrovich Fock (1898-1974), físico russo soviético.
N. Fock, Zeitschrift für Physik, 75, 622-647 (1932).
“Z_2” — 2017/9/5 — 8:19 — page 633 — #653
com g~k sendo uma solução da equação de campo com uma frequência positiva em tempos posteriores,
− 1 1 ~
g~k (x) ∼ V R23 2
(2ω2k )− 2 ei(k · ~x)−ω2k t
e
a~k ≡ α~k A~k + β~k∗ A~† .
k
Isto resulta em h i
a~k , a~† ′ = |αk |2 − |βk |2 δ(~k − δk′ ) = δ(~k − δk′ ) . (22.43)
k
Assim, se a(t) é tal que |βk |2 é diferente de zero, tal como é geralmente o caso, as partículas são criadas por
uma troca do fator de escala do universo! Este é o exemplo mais simples da radiação de Hawking.
Aω |0i = 0 .
em que αωω′ e βωω′ são números complexos, independentes das coordenadas. De (22.35) podemos expressá-
-los como
αωω′ = (fω′ , gω ) e βωω′ = − (fω∗′ , gω ) .
“Z_2” — 2017/9/5 — 8:19 — page 634 — #654
em que S (θ, φ) são os harmônicos esféricos e os números quânticos discretos (l, n) foram suprimidos, e
1
ainda v = t + r é a coordenada nula de entrada em I − . O fator ω − 2 foi necessário para a normalização do
produto interno. Por outro lado, gω será
1
gω ∼ ω − 2 r −1 e− i ωu S (θ, φ) , (22.47)
em que novamente os números quânticos discretos (l, n) foram suprimidos e ainda u = t−r é a coordenada
nula de saída em I + . O valor de v está relacionada com o valor de u por (22.23),
v0 − v
u(v) = −4M ln , com v < v0 . (22.48)
K1 K2
Pelo fato de que as geodésicas passam através do centro do corpo em colapso pouco antes do horizonte de
eventos formado, e emergem como uma geodésica de entrada caracterizada por um valor de v ր v0 .
Usando estas formas assintóticas, αωω′ e βωω′ podem ser expressos como
Z v0 1
ω′ 2 ′
αωω′ = C dv ei ω v e− i ωu(v) (22.49)
−∞ ω
Z v0 1
ω′ 2 ′
βωω′ = C dv e− i ω v e− i ωu(v) , (22.50)
−∞ ω
Na Eq. (22.51) o contorno de integração ao longo do eixo real de 0 a ∞ no plano complexo s pode ser
acompanhado por um quarto de círculo no infinito para o contorno ao longo do eixo imaginário de − i ∞
a 0. Como não existem polos do integrando no quadrante fechado pelo contorno e o integrando desaparece
na fronteira no infinito, a integral de 0 a ∞ ao longo do eixo é real e é igual a integral de − i ∞ a 0 ao longo
do eixo imaginário. Assim, colocando s ≡ i s′ , a Eq. (22.51) torna-se
Z 0 1
′ ω′ 2
ω ′ s′ i ω ′ v0 i s′
αωω′ = − i C ds e e exp i ω4M ln .
−∞ ω K
Similarmente, na Eq. (22.52) a integral ao longo do eixo real no plano complexo s de −∞ a 0 pode ser
acompanhada por um quarto de círculo no infinito para o contorno ao longo do eixo imaginário do plano
“Z_2” — 2017/9/5 — 8:19 — page 635 — #655
complexo s de − i ∞ a 0. Como antes, as integrais são iguais. Portanto, fazendo s ≡ i s′ , para (22.52),
encontramos
Z 0 ′ 1
′ ω
2
ω ′ s′ − i ω ′ v0 − i s′
βωω′ = i C ds e e exp i ω4M ln .
−∞ ω K
Tomando o corte no plano complexo ao longo do eixo real negativo para definir um valor único da função
logarítmica natural, descobrimos que para s′ < 0, como nesses integrandos,
′ ′
is − i |s′ | π |s |
ln = ln = − i + ln
K K 2 K
′
′ ′
−is i |s | π |s |
ln = ln = i + ln .
K K 2 K
Então,
Z 0 1 ′
i ω ′ v0 2πωM ω ′ 2 ω ′ s′
′ |s |
αωω′ = −iC e e ds e exp i ω4M ln (22.53)
−∞ ω K
Z 0 ′ 1 ′
′ ω 2 ω ′ s′ |s |
βωω′ = i C e− i ω v0 e−2πωM ds′ e exp i ω4M ln . (22.54)
−∞ ω K
em que Γ(ω1 ) é a fração de um pacote de onda saindo de frequência ω1 em I + que iria propagar para trás
no tempo através do corpo em colapso para I − . Segue-se a partir das Eqs. (22.45) e (22.56) que
Z
Γ(ω1 ) δ(ω1 − ω2 ) = dω ′ α∗ω1 ω′ αω2 ω′ − βω∗ 1 ω′ βω2 ω′ . (22.57)
é o número de partículas criadas, com frequência ω, a partir do buraco negro. No entanto, encontramos uma
infinidade se tentarmos avaliar esta quantidade. O infinito é uma consequência da função δ(ω1 − ω2 ) que
aparece em (22.56). Esperamos que h0|a†ω aω |0i seja o número total de partículas criadas por unidade de
(2)
frequência que alcançam I + em tempos posteriores na onda gω . Este número total será infinito porque há
um fluxo estável de partículas que atingem I + . Uma maneira heurística para ver isso é substituir δ(ω1 − ω2 )
em (22.57) por
Z τ /2
δ(ω1 − ω2 ) = lim dt ei(ω1 −ω2 ) .
τ →∞ τ /2
em que usamos (22.55). Assim, hNω it→∞ ≡ h0|a†ω aω |0i é dada por
τ Γ(ω)
hNω it→∞ = lim
8πM ω −1
.
τ →0 2π e
A interpretação física deste processo é que em tempos posteriores, o número de partículas criadas por
unidade de frequência angular e por unidade de tempo que passam através de uma superfície r = R, em
que R é muito maior do que a circunferência do horizonte de eventos do buraco negro, é
1 Γ(ω)
8πM ω −1
.
2π e
Isto implica que um buraco negro de Schwarzschild emite e absorve a radiação exatamente como um corpo
cinza30 de absortividade Γ(ω) e temperatura T dada por
kB T = (8πM )−1 = (2π)−1 κ , (22.58)
em que kB é a constante de Boltzmann e κ = (4M )−1 é a gravidade da superfície do buraco negro de
Schwarzschild. Restaurando c, G e ~ temos
~c3 M⊙
T = ≈ 6 × 10−7 K, (22.59)
8πkB GM M
em que M⊙ é a massa do sol. A Eq. (22.58) é o principal resultado de Hawking.31 Então, por que um buraco
negro emite partículas? A resposta é que a radiação de Hawking é um efeito quântico. Em outras palavras,
pelo fato de que as bolhas de vácuo que aparecem nos diagramas de Feynman não serão mais bolhas, ver
Fig. 22.11.
Vida dos Buracos Negros Na seção anterior, derivamos a radiação de Hawking. Uma vez que os efeitos
quânticos são levados em conta, os buracos negros irradiam, portanto, os buracos negros têm vida útil finita.
De acordo com a mecânica quântica, a produção de pares de partículas virtuais, ∆E = 2mc2 , pode realizar-
-se no vácuo, desde que elas se aniquilam dentro do curto tempo permitido pelo princípio da incerteza,
~
∆t ∼ 2mc 2 . Tais flutuações do vácuo também terá lugar na vizinhança de buracos negros. Como foi
mostrado na seção anterior, um par de partículas é criado, uma delas cai para além do horizonte de eventos
e a outra se torna uma partícula real. Neste processo, a energia gravitacional do buraco negro é convertida
em energia de repouso e energia cinética das partículas produzidas, de modo que a energia da ordem de ∆E
é transferida a partir do buraco negro para o mundo exterior. Assim, o tempo que um buraco negro evapora,
ou em outras palavras, o tempo de vida τ do buraco negro, é dado por 33
3
10 M
τ ≈ 10 anos . (22.60)
1015 g
Se M ≈ 1015 g (g é grama), τ é da ordem de 10 biliões de anos. Este é quase o mesmo valor da idade do
universo, de modo que buracos negros pesados deverão ter um tempo de vida muito longo.
Minis Buracos Negros É concebível que mini buracos negros, com rs ≈ 10−15 m, poderiam ter sido
formados durante o big-bang. Substituindo este raio para a fórmula do raio de Schwarzschild, a massa
limite superior de minis buracos negros será 1015 g. Esta é a razão feita na relação (22.60). A massa limite
inferior de minis buracos negros também está definida, e é a massa de Planck ∼ 10−5 g. Porque a massa
de Planck é a escala de energia em que o efeito gravitacional e quântico são de mesma importância, e a
teoria quântica de campos em espaço curvo é a teoria efetiva de baixa energia da gravidade quântica. Para
a massa de Planck, a vida é exatamente o tempo de Planck ∼ 10−43 s. Este é o menor tempo possível na
física, é consistente com o que dissemos acima. A partir da Eq. (22.60), buracos negros com massas muito
abaixo 1015 g têm uma vida útil mais curta do que a atual idade do universo e deve, portanto, já terem
sido evaporados. Agora, vamos estimar a energia E dos raios gama γ irradiados a partir de um mini buraco
negro. De acordo com a referência anterior, da relação (22.59) temos
~c3 1015 g
E ∼ kB T ∼ ∼ 100 MeV . (22.61)
GM M
Portanto, raios cósmicos com energias ao redor ∼ 100 MeV são bons candidatos para raios gama vindos
de minis buracos negros. Há algumas tentativas, e procura, para encontrar minis buracos negros no LHC34
33
Ver o texto L. Bergström and A. Goobar, Cosmology and particle astrophysics, Springer, Chichester (2006).
34
LHC - Large Hadron Collider do CERN, é o maior acelerador de partículas e o de maior energia existente do mundo. Seu
principal objetivo é obter dados sobre colisões de feixes de partículas, tanto de prótons a uma energia de 7 TeV por partícula,
ou núcleos de chumbo a energia de 574 TeV por núcleo. O laboratório localiza-se em um túnel de 27 km de circunferência,
bem como a 175 metros abaixo do nível do solo na fronteira franco-suíça, próximo a Genebra, Suíça. O LHC está funcionando
desde 10 de Setembro de 2008 e sua primeira colisão entre prótons ocorreu em 30 de Março de 2010. No início de julho de
2012, os experimentos ATLAS e CMS no LHC apresentaram evidências da existência da partícula Higgs com massa em torno
de 125 GeV, ver os artigos originais: G. Aad et al. (ATLAS Collaboration), Physics Letters B716, 1-29 (2012); S. Chatrchyan
et al. (CMS Collaboration), Physics Letters B716, 30-61 (2012).
“Z_2” — 2017/9/5 — 8:19 — page 638 — #658
ou em aceleradores futuros. Em artigo publicado em 2010, Choptuik e Pretorius 35 apresentaram uma prova
gerada por computador que podemos formar minis buracos negros a partir de duas partículas colidindo com
energia suficiente, permitido nas energias do LHC, se dimensões adicionais estiverem presentes, diferentes
das quatro habituais (três espaciais e uma temporal).36 Não está claro se este objeto interessante, que inclui
elementos da relatividade especial e geral, mecânica quântica e da termodinâmica, pode ser confirmado.
Buracos negros e sua evaporação prevista por Hawking são os laboratórios teóricos onde as idéias atuais da
gravidade quântica estão sendo testadas. Uma fonte fascinante de pesquisa.
Problemas
22.1 Mostre explicitamente que podemos escrever a métrica de Schwarzschild, com simetria esférica, como
2M 2M −1 2
ds2 = 1− dt2 − 1 − dr − r 2 dΩ2 .
r r
Sugestão: Consulte o livro dos Profs. M. P. Hobson, G. P. Efstathiou and A. N. Lasenby [38].
22.2 Dado r = R(t): a) Use a métrica de Schwarzschild e desenvolva o caso em que temos uma geodésica
radial tipo tempo, i.e., dΩ2 e ds2 = −dτ 2 . b) Faça um esboço do gráfico de Ṙ2 por R, em que
d
2
Ṙ = dt R. c) Faça um esboço do gráfico de dR
dτ por R.
22.3 Mostre explicitamente que a métrica usando as coordenadas de Kruskal-Szekeres será dado por
32M 3 − r
ds2 = e 2M dU dV − r 2 dΩ2 ,
r
em que r está definida implicitamente por
r − 2M r
UV = − e 2M .
2M
Sugestão: Consulte o livro dos Profs. M. P. Hobson, G. P. Efstathiou and A. N. Lasenby [38].
22.4 Faça um estudo detalhado sobre buracos de minhoca e a ponte de Einstein-Rosen. Sugestão: Consulte
o livro dos Profs. M. P. Hobson, G. P. Efstathiou and A. N. Lasenby [38].
Sugestão: Consulte o livro dos Profs. M. P. Hobson, G. P. Efstathiou and A. N. Lasenby [38].
35
Matthew William Choptuik (1961- ), físico canadense.
Frans Pretorius (1975- ), físico sul-africano.
36
M. W. Choptuik and F. Pretorius, Physical Review Letters 104 (11), 111101 (2010).
37
Wolfgang Rindler (1924- ), físico austríaco.
“Z_2” — 2017/9/5 — 8:19 — page 639 — #659
22.9 Mostre que a métrica de Kerr em coordenadas de Eddington-Finkelstein, (v, r, θ, χ), é dada por
2 ∆ − a2 sen2 θ a sen2 θ 2
ds = dv 2 − 2 dv dr + 2 r + a2 − ∆ dv dχ
Σ Σ
" 2 #
2
r +a 2 − ∆ a sen2 θ
2
2
+ 2a sen dχ dr − sen2 θ dχ2 − Σ dθ 2 .
Σ
h i h i
22.10 Se a~k , a~† ′ = δ(~k − ~k′ ) e a~k , a~k′ = 0. Mostrar explicitamente que |α~k |2 − |β~k |2 = 1.
k
Leitura Recomendada
Para este capítulo, recomendo ao leitor, um estudo paralelo e detalhado dos seguintes livros,
Nestes livros, encontraremos deduções elegantemente detalhadas sobre os buracos negros e um grande
número de exercícios.
“Z_2” — 2017/9/5 — 8:19 — page 640 — #660
Capítulo 23
Ondas Gravitacionais
Na teoria da gravitação de Newton, todas as mudanças na distribuição da matéria, não importa o quão
localizada, são sentidas instantaneamente à grandes distâncias arbitrariamente. Apesar dos grandes sucessos
da teoria de Newton, essa ação instantânea a uma distância já era considerado insatisfatória por alguns de
seus contemporâneos no final do século 17. Estes tentaram chegar a algum mecanismo dinâmico através do
qual a força gravitacional seria comunicada, mas não obtiveram sucesso. A questão tornou-se especialmente
crucial após o desenvolvimento da relatividade especial em 1905, que impõe um limite de velocidade, i.e.,
a velocidade da luz, sobre a forma de comunicação rápida de qualquer tipo que poderá ser efetuada.
A teoria eletromagnética de Maxwell não tem esta ação instantânea à distância. Considere-se uma carga
localizada e/ou uma distribuição de corrente, i.e., a fonte, causando os campos elétrico e magnético ~E e ~B,
respectivamente. A partir da equações de Maxwell, podemos mostrar que, no tempo t, os valores de E e ~
~
B a uma distância D a partir da fonte dependem em que a fonte estava fazendo em um tempo t − Dc . O
intervalo de tempo, Dc , é o tempo necessário para que um sinal atravesse a distância D se está se deslocando
à velocidade da luz, i.e., o eletromagnetismo obedece ao limite da velocidade de Einstein. Os campos ~E e ~ B
obedecem a uma equação de onda, i.e., as alterações na carga/distribuição de corrente são comunicadas para
o resto do espaço por ondas eletromagnéticas. Assim, ao contrário do potencial gravitacional de Newton, o
campo eletromagnético não apenas rastreiam suas fontes; ele tem dinâmica própria.
Após o desenvolvimento da teoria da relatividade especial foi especulado que, assim como o campo
eletromagnético, o campo gravitacional pudesse também ser dinâmico. Alterações no campo gravitacional
devem propagar-se na forma de onda, não mais rápida do que a velocidade da luz, eliminando assim ação
instantânea a uma distância. A implementação matemática destas noções teria que esperar por mais uma
década, mas a teoria geral da relatividade de 1916 de fato incorporou todas estas idéias. Em particular, a
teoria da relatividade geral prevê a existência de ondas gravitacionais.
As ondas gravitacionais são ondulações na curvatura espaço-tempo na qual se propagam como ondas,
viajando para o exterior a partir da fonte. Como dito, foi previsto em 1916 por Einstein sob a base de sua
teoria da relatividade geral, 1 as ondas gravitacionais, teoricamente, transportam energia como radiação gra-
vitacional. Fontes de ondas gravitacionais detectáveis poderia incluir sistemas estelares binários compostos
de anãs brancas, estrelas de nêutrons ou buracos negros. A existência de ondas gravitacionais é uma possível
consequência da invariância de Lorentz da relatividade geral, uma vez que traz o conceito de limitação de
velocidade de propagação das interações físicas com ela. Ondas gravitacionais não pode existir na teoria da
gravitação de Newton, em que interações físicas propagam a velocidade infinita.
Antes mesmo da radiação gravitacional ser observada diretamente, havia evidências indiretas de sua
1
A. Einstein, Preussische Akademie der Wissenschaften, Sitzungsberichte, part 1, 688-696 (1916); Idem, part 1, 154-167 (1918).
640
“Z_2” — 2017/9/5 — 8:19 — page 641 — #661
641
existência. Por exemplo, medições do sistema binário PSR 1913 + 16 descoberto por Hulse2 e Taylor3
sugerem que as ondas gravitacionais são mais do que um conceito teórico. 4 O sistema hoje é chamado
binário de Hulse-Taylor ou pulsar de Taylor e Hulse. 5 Vários detectores de ondas gravitacionais estão
atualmente em construção ou estão em operação.
Em 17 de março de 2014, um grupo de astrônomos do Harvard-Smithsonian Center for Astrophysics
erroneamente alegaram que haviam detectado e produziram a primeira imagem direta de ondas gravitaci-
onais através do céu primordial dentro da radiação cósmica de fundo, fornecendo evidências falhas para a
inflação e para o big bang. 6 Em 19 de junho de 2014, reduziu o nível de confiança que confirma as conclu-
sões anteriormente relatadas 7 e em 19 de setembro de 2014 e 30 de janeiro de 2015, houve ainda maiores
redução no nível de confiança. 8 Ainda em 30 de janeiro de 2015, o periódico científico Nature foi além
com uma notícia intitulada “As ondas gravitacionais descoberta agora oficialmente mortas”, 9 isso porque a
provável descoberta foi descartada e confirmou-se que o resultado era de poeira cósmica.10
No final de 2015, 11 pesquisadores do projeto LIGO12 iniciaram novas procuras por ondas gravitacionais
e observaram distorções no espaço e no tempo causadas por um par de buracos negros com massas na ordem
de 30 massas solares em processo de fusão. Esta descoberta, foi anunciada ao público em 11 fevereiro de
2
Russell Alan Hulse (1950- ), físico americano.
3
Joseph Hooton Taylor Jr. (1941- ), físico e astrofísico americano.
4
J. M. Weisberg, J. H. Taylor and L. A. Fowler, Scientific American, 245, 74-82 (1981); J. H. Taylor and J. M. Weisberg, The
Astrophysical Journal, 253, 908-920 (1982); Idem, The Astrophysical Journal, 345, 434-450 (1989); J. M. Weisberg, D. J. Nice
and J. H. Taylor, The Astrophysical Journal, 722, 1030-1034 (2010).
5
O sistema binário PSR 1913 + 16 é um pulsar, uma estrela de nêutrons radiante, na qual juntamente com outra estrela de nêutrons
está em órbita ao redor de um centro de massa comum, formando assim um sistema estelar binário. O sistema PSR 1913 + 16 foi
o primeiro pulsar binário a ser descoberto em 1974. Ver R. A. Hulse and J. H. Taylor, The Astrophysical Journal, 195, L51-L53
(1975).
6
Staff NSF, BICEP2 2014 Results Release, National Science Foundation, 17 March 2014, Retrieved 18 March 2014; D. A. Agui-
lar and C. Pulliam, First Direct Evidence of Cosmic Inflation, http://www.cfa.harvard.edu, Harvard-Smithsonian
Center for Astrophysics, 17 March 2014, Retrieved 17 March 2014; W. Clavin, Whitney, NASA Technology Views Birth of the
Universe, NASA, 17 March 2014, Retrieved 17 March 2014; D. Overbye, Detection of Waves in Space Buttresses Landmark
Theory of Big Bang, New York Times, 17 March 2014, Retrieved 17 March 2014.
7
D. Overbye, Astronomers Hedge on Big Bang Detection Claim, New York Times, 19 June 2014, Retrieved 20 June 2014;
J. Amos, Cosmic inflation: Confidence lowered for Big Bang signal, BBC News, 19 June 2014, Retrieved 20 June 2014;
P. A. R. Ade, et al (BICEP2 Collaboration), Detection of B-Mode Polarization at Degree Angular Scales by BICEP2, Physical
Review Letters 112, 241101 (19 June 2014), Retrieved 20 June 2014.
8
Planck Collaboration Team, Planck intermediate results. XXX. The angular power spectrum of polarized dust emission at in-
termediate and high Galactic latitudes, ArXiv.arXiv:1409.5738 19 September 2014, Retrieved 22 September 2014;
D. Overbye, Study Confirms Criticism of Big Bang Finding, New York Times, 22 September 2014, Retrieved 22 September
2014; C. Clavin, Gravitational Waves from Early Universe Remain Elusive, NASA, 30 January 2015, Retrieved 30 January
2015; D. Overbye, Speck of Interstellar Dust Obscures Glimpse of Big Bang, New York Times, 30 January 2015, Retrieved 31
January 2015.
9
R. Cowen, Gravitational waves discovery now officially dead, Nature, doi:10.1038/nature.2015.16830 (2015).
10
Poeira cósmica é o complexo de pequenas partículas de matéria que, juntamente com o gás, está contido no meio interestelar,
i.e., o espaço entre as estrelas no interior das galáxias. Por extensão, também se dá o mesmo nome à poeira contida nos espaços
interplanetários. Esta poeira não é distribuída uniformemente mas forma verdadeiras nuvens interestelares mais ou menos den-
sas. É composta principalmente de silicatos, grafite e outros alótropos do carbono. Conjectura-se que a sua formação seja devida
à explosão de supernovas ou à fusão nuclear de estrelas. Estas partículas interagem com a luz, absorvendo-a ou refletindo-a. A
poeira interestelar é comumente associada a pedaços microscópicos de carbono ou silicatos, com tamanhos que podem variar
de uma fração de mícron até um mícron de diâmetro, dispersos no espaço interplanetário. Estes pedaços tem forma irregular e
são chamados de grãos interestelares. Porém, mais precisamente falando, poeira interestelar, mais apropriadamente denominada
de matéria interestelar é um conjunto de matéria e de radiação que preenche o espaço interestelar. A região onde se espalha a
matéria interestelar recebe o nome de meio interestelar. Nota-se, entretanto, que diversos autores usam indistintamente os termos
meio interestelar e matéria interestelar para designar os elementos que compõem o espaço interestelar. Ver A. Evans, The dusty
universe, John Wiley and Sons Inc., New York, NY, 1994.
11
LIGO Caltech, The Newest Search for Gravitational Waves has Begun, LIGO, 18 September 2015, Retrieved 29 November
2015.
12
LIGO - Laser Interferometer Gravitational Wave Observatory.
“Z_2” — 2017/9/5 — 8:19 — page 642 — #662
em que |hµν | ≪ 1 e a primeira derivada e as mais elevadas derivadas parciais de hµν também são ≪ 1,
i.e., a idéia é que existem sistemas de coordenadas ligeiramente curvadas e são coordenadas adequadas
para usarmos no situação de campos fracos. Podemos ainda fazer transformações de coordenadas entre tais
sistemas. Em particular, podemos fazer uma transformação de Lorentz global, tais que,
µ
x′ = Λµν xν ,
em que
ηµν = Λρµ Λσν ηρσ
e as quantidades Λµν são os elementos da transformação de Lorentz relatividade especial. Estas transformam
os coeficientes de métricas como,
′ ∂xρ ∂xσ
gµν = gρσ = Λρµ Λσν (ηρσ + hρσ ) = ηµν + Λρµ Λσν hρσ .
∂x′ µ ∂x′ ν
Nota-se, que esta relação tem a forma da Eq. (23.1), com
Podemos observar desta expressão que, sob uma transformação de Lorentz, o próprio hµν se transforma
como as componentes de um tensor no espaço-tempo de Minkowski. Assim, esta parte da métrica pode ser
tomada como um tensor de um espaço-tempo definido no plano de Minkowski. Desde que a física não trivial
esteja contido em hµν , podemos ter a representação conveniente de um campo gravitacional fraco como
sendo descrito por este campo simétrico hµν em um espaço-tempo plano, 14 de maneira análoga àquela
em que o quadripotencial Aµ descreve o campo eletromagnético no espaço-tempo de Minkowski. Nota-se,
13
Staff NSF, Gravitational waves detected 100 years after Einstein’s prediction, National Science Foundation, www.nsf.gov 11
February 2016, Retrieved 11 February 2016; D. Castelvecchi and W. Witze, Einstein’s gravitational waves found at last, Nature
News, doi:10.1038/nature.2016.19361 (2016), Retrieved 11 February 2016; P. Abbott, et al (LIGO Scientific Col-
laboration and Virgo Collaboration), Observation of Gravitational Waves from a Binary Black Hole Merger, Physical Review
Letters 116 (6), 061102 (2016), Retrieved 11 February 2016.
14
Em uma descrição quântica, hµν é um campo para os grávitons de spin-2 e também a descrição perturbativa de interações
gravitacionais devido às trocas de grávitons sem massa. O gráviton é uma partícula elementar hipotética que seria a responsável
pela transmissão da força da gravidade na maioria dos modelos da teoria quântica de campos. A teoria postula que os grávitons
sempre são atrativos, gravidade nunca repele, atuando além de qualquer distância, gravidade é universal, e vêm de um ilimitado
número de objetos. Portanto, se o gráviton existir, deve ser um bóson de spin par e igual a dois, e deve ter uma massa de repouso
zero, segundo a teoria quântica.
“Z_2” — 2017/9/5 — 8:19 — page 643 — #663
no entanto, que hµν não se transforma como um tensor sob uma transformação geral de coordenadas, mas
apenas sob a classe restrita de transformações globais de Lorentz, por essa razão hµν e os tensores derivados
dele às vezes são chamados pseudotensores.
Agora, assumimos uma transformação infinitesimal de coordenadas na qual
µ
x′ = xµ + ξ µ (x) , (23.2)
em que os ξ ν (x) são quatro funções arbitrárias de posição da mesma ordem de grandeza como o do tensor
hµν . Assim, da Eq. (23.2), as equações da teoria da relatividade geral passam a ser
∂x′ µ
= δνµ + ∂ν ξ µ .
∂xν
Portanto, da transformação inversa xµ = x′ µ − ξ µ (x), se segue que
∂xµ
= δνµ − ∂ν ξ µ . (23.3)
∂x′ ν
Assim, trabalhando novamente com a primeira ordem nas quantidades pequenas, a métrica se transforma
como,
′ ∂xρ ∂xσ ρ ρ
σ
gµν = ′ µ ′ ν gρσ = δµ − ∂µ ξ δµ − ∂µ ξ σ (ηρσ + hρσ )
∂x ∂x
= ηµν + hµν − ∂µ ξν − ∂ν ξµ ,
em que definimos ξµ = ηµν ξ ν . Consequentemente, podemos mostrar que a perturbação será escrita como
A equação anterior pode ser considerada como um análogo para uma transformação de calibre no eletro-
magnetismo. Como já discutimos, se Aµ é solução das equações do campo eletromagnético então uma outra
solução que descreve precisamente a mesma situação física é dada por
A(novo)
µ = Aµ + ∂µ Ψ ,
em que Ψ é um campo escalar qualquer. Uma situação análoga mantém-se no caso do campo gravitacional.
Da Eq. (23.4) é evidente que se hµν é uma solução para as equações do campo gravitacional linearizadas,
então a mesma situação física será descrita por
h(novo)
µν = hµν − ∂µ ξν − ∂ν ξµ . (23.5)
Nesta interpretação, no entanto, a relação (23.5) é vista como uma transformação de calibre ao invés de
uma transformação de coordenadas, i.e., ainda estamos trabalhando no mesmo conjunto de coordenadas xµ
(novo)
e definimos um novo tensor hµν cujas componentes nesta base são indicadas por (23.5).
Agora que consideramos as transformações de coordenadas que preservam a forma da métrica gµν em
(23.1), é útil obter a forma correspondente para os coeficientes contravariantes da métrica gµν . Exigindo
que gµν gνσ = δσµ , é fácil verificar que, em primeira ordem, temos
gµν = η µν − hµν ,
em que hµν = η µρ η νσ hρσ . Além disso, segue-se que os índices em pequenas quantidades podem ser
respectivamente levantados e abaixados usando η µν e ηµν em vez de gµν e gµν . Por exemplo, a primeira
ordem nas quantidades pequenas, podemos escrever
σ 1 1
Rµνρ = ∂ν ∂ρ hσµ + ∂µ hσρ − ∂ σ hµρ − ∂ρ ∂ν hσµ + ∂µ hσν − ∂ σ hµν
2 2
1
= ∂ν ∂µ hσρ + ∂ρ ∂ σ hµν − ∂ν ∂ σ hµρ − ∂ρ ∂µ hσν ,
2
o tensor de Ricci
1
= ∂ν ∂µ h + hµν − ∂ν ∂ ρ hρµ − ∂ρ ∂µ hρν (23.8)
2
e o escalar de Ricci
R = Rµµ = η µν Rµν = h − ∂ρ ∂µ hµρ , (23.9)
em que = ∂µ ∂ µ é o d’alembertiano e h = hµµ é o traço. Assim, substituindo as Eqs. (23.8) e (23.9) nas
equações de campo gravitacional de Einstein, temos
∂ν ∂µ h + hµν − ∂ν ∂ρ hρµ − ∂ρ ∂µ hρν − ηµν h − ∂ρ ∂σ hσρ = −2κ Tµν . (23.10)
Esta equação descreve a propagação de ondas gravitacionais cuja fonte, distribuição de matéria-energia,
é caracterizada pelo tensor Tµν . O número de termos no lado esquerdo da equação de campo aumentou
durante o processo de linearização. Porém podemos simplificar definindo o traço reverso ou traço de sinal
oposto de hµν , que é dado pela
1
h̄µν ≡ hµν − ηµν h .
2
¯
Na contração dos índices, ainda temos h̄ = −h e h̄ = h , i.e., h = h̄ − 1 η h̄. Assim, a Eq.
µν µν µν µν 2 µν
(23.10) ficará
h̄µν + ηµν ∂ρ ∂σ h̄σρ − ∂ν ∂ρ h̄ρµ − ∂µ∂ρ h̄ρν = −2κ Tµν . (23.11)
Portanto, estas são as equações básicas do campo gravitacional linearizado e são válidos sempre que a
métrica assume a forma (23.1). Assim, vamos adotar o ponto de vista em que hµν é simplesmente um
campo dado por tensor simétrico, sob as transformações globais de Lorentz, definida em coordenadas quase
cartesianas em um plano do espaço-tempo de Minkowski como background.
“Z_2” — 2017/9/5 — 8:19 — page 645 — #665
1 µρ ′
h̄′µρ = h′µρ − η h
2
1 µρ
= hµρ − ∂ µ ξ ρ − ∂ ρ ξ µ − η (h − 2 ∂ρ ξ ρ )
2
= h̄µρ − ∂ µ ξ ρ − ∂ ρ ξ µ + η µρ ∂ρ ξ ρ (23.12)
⇒
′µρ
∂ρ h̄ = ∂ρ h̄µρ − ξ µ .
∂ρ h̄′µρ = 0 .
Assim, os três últimos termos da Eq. (23.11) serão nulos. Portanto, com o novo calibre, temos
Por conveniência, descartamos os ′ e elevamos os índices, na qual as equações de campo linearizadas são
escritas na forma compacta,
h̄µν = −2κ T µν , (23.13)
desde que h̄µν satisfaça a condição de calibre,
∂µ h̄µν = 0 . (23.14)
Nota-se ainda que esta condição de calibre é preservada por qualquer outra transformação de calibre da
forma (23.5), desde que as funções ξ µ satisfaçam ξ µ = 0. Devido as similaridades entre o eletromag-
netismo e a teoria gravitacional, a Eq. (23.14) comumente também chamamos de calibre de Lorenz. 15 Na
Tabela 23.1, mostramos a analogia da entre o eletromagnetismo e a teoria do campo gravitacional lineari-
zado.
h̄µν = −2κ T µν ,
em que κ = 8πG. Através da relação anterior, podemos estudar o caso em que a equação de Einstein
linearizada está no vácuo, i.e., em que T µν = 0. Assim, da Eq. (23.13), temos
h̄µν = 0 , (23.15)
Lei de Conservação ∂µ j µ = 0 ∂µ T µν = 0
Campo Aµ hµν
Calibre transverso sem traço – Além disso, ainda temos a liberdade de fazer uma nova transformação de
calibre, da forma (23.5),
h(novo)
µν = hµν − ∂µ ξν − ∂ν ξµ ,
que irá preservar o calibre de Lorenz desde que escolhemos as funções ξ µ (x) de modo que satisfazem
a condição ξ µ = 0. Uma transformação adequado, que satisfaz esta condição, é dada por
ρ
ξ µ = B µ ei kρ x ,
em que B µ é uma constante e kρ é o mesmo quadrivetor que aparece na solução da equação de ondas.
Substituindo esta expressão na lei de transformação (23.12) para o tensor reverso de traço h̄µν , que
supomos ser da forma (23.17), encontra-se rapidamente que o tensor amplitude transforma"se como
µν
A′ = Aµν − i B µ kν − i B ν kµ + i η µν B ρ kρ . (23.21)
Então, podemos fazer a transformação de coordenadas de modo que a condição do calibre de Lorenz
seja preservada e de tal forma que teremos o seguinte par de restrições
nas novas coordenadas, em que uµ é um quadrivetor velocidade constante. Assim temos o calibre
transverso sem traço ou calibre transversal sem traço ou ainda calibre TT.
em que kρ é o vetor de onda de nossa solução de ondas planas com coeficientes complexos B µ . Então
temos, ξµ = 0, i.e., a condição de calibre de Lorenz será aceita nas novas coordenadas. Devemos
escolher B µ de tal forma que nas novas coordenadas (T 1) e (T 2) continuem verdadeiras. Como
primeiro passo, podemos calcular como as amplitudes Aµν se transformam.
Partimos da transformação de h̄µν que foi calculada anteriormente,
consequentemente,
A′µν = Aµν − i Bµ kν − i Bν kµ + i ηµν B ρ kρ .
Contraindo η µν com A′µν encontramos
µ 1
A′ µ = 0 ⇒ i B µ kµ = − Aµµ .
2
“Z_2” — 2017/9/5 — 8:19 — page 648 — #668
Assim,
1
A′µν = Aµν − i Bµ kν − i Bν kµ − ηµν Aρρ .
2
Neste ponto usaremos a condição (T 2) em que A′µν uν = 0:
1
Aµν − i Bµ kν − i Bν kµ − ηµν Aρ uν = 0
ρ
2
1
i Bµ (kν uν ) = Aµν uν − i kµ (Bν uν ) −uµ Aρρ .
2
A prova estará feita se podermos eliminar Bν uν no lado direito da equação anterior. Multiplicando
esta equação por uµ , o resultado é uma equação a partir do qual Bν uν poderá ser resolvida, desde
que kν uν 6= 0 quando substituímos novamente no lado direito da equação anterior. A expressão final
para Bµ não é importante, o que importa é que ele existe.
Como o calibre de Lorenz permite encontrar uma solução que satisfaz as condições (23.22) e (23.23),
a liberdade que tínhamos para fixar o calibre ficou esgotada. Retornando ao referencial de Lorentz, no
espaço-tempo de Minkowski de fundo, escolhemos o caso mais simples, i.e., uµ = δ0µ . Em seguida,
orientamos os eixos espaciais de tal forma que a onda se propague paralelamente ao eixo z. Neste
caso,
kµ = (ω, 0, 0, ω) . (23.24)
Da relação (23.23) temos
δ0µ Aµν = A0ν , ∀ν (23.25)
e de Aµν kν encontramos
Este resultado significa que não existem componentes ao longo do eixo z e que a onda gravitacional
é transversal, i.e., da origem ao rótulo transverso. as condições (23.22) e (23.23) definem uma norma
transversal de traço nulo, também conhecida como norma TT. As componentes físicas são apenas
Axx , Ayy e Axy = Ayx , para uma onda propagando-se paralelamente ao eixo z. Da condição de traço
nulo, Aµµ = 0 resulta que
Portanto, temos apenas duas componentes físicas independentes. Desta forma, podemos escrever o
tensor Aµν na notação matricial
0 0 0 0
0 Axx Axy 0
ATµνT =
0 Axy −Axx
.
0
0 0 0 0
Polarização das Ondas Gravitacionais Tal como as ondas eletromagnéticas, a polarização é uma das
características mais importantes das ondas gravitacionais. Vamos supor que a onda se propaga ao longo
do eixo z, isto corresponde dizer que a onda tem duas componentes independentes, hTxxT e hTxyT , pois da
condição de traço nulo, bem como da Eq. (23.17), temos h̄TµνT = hTµνT . Vamos estudar o efeito da passagem
desta onda sobre duas partículas, muito próximas uma da outra, que antes de serem atingidas pela onda se
“Z_2” — 2017/9/5 — 8:19 — page 649 — #669
encontram em repouso em relação a um determinado referencial de Lorentz local. Uma vez que a distância
própria entre elas é uma função do valor local dos gµν = ηµν + hµν , as oscilações de hµν traduzir-se-ão em
oscilações de sua distância relativa.
Como estes movimentos são descritos pela equação do desvio geodésico, faremos uso daquela equação.
Seja ξ µ o vetor ligando as geodésicas descrevendo o movimento de cada uma das partículas, e, uµ a sua
quadrivelocidade relativa. A equação do desvio geodésico é dada por (18.13), i.e.,
D2 ξ α α
= Rµνβ vµ vν ξ β . (23.27)
Dτ 2
Estando as partículas inicialmente em repouso, a quadrivelocidade será uµ = (1, 0, 0, 0), uma vez que
queremos manter a descrição linear em ordem aos hµν ; quaisquer alterações em uµ serão proporcionais a
hµν e o tensor de Riemann já é proporcional a hµν . Vamos supor inicialmente que ξ µ (τ = 0) = (0, δ, 0, 0)
temos partículas ao longo do eixo x, e portanto
D2 ξ α
= R00β ξ β = −R0β0
α
ξ β = −R0x0
x
δ.
Dτ 2
α , cuja expressão é dada
Estabelecidas estas preliminares, calculemos as componentes não nulas de Rµνβ
por
α 1
Rµνβ = ∂ν ∂µ hαβ + ∂β ∂ α hµν − ∂ν ∂ α hµβ − ∂β ∂µ hαν .
2
Assim, temos que
x 1
R0x0 = Rx0x0 = − hTxxT ,00
2
y x 1
R0y0 = Ry0y0 = −R0x0 = + hTxxT ,00 (23.28)
2
y 1
R0x0 = Ry0x0 = − hTxyT ,00 .
2
A equação do desvio geodésico indica que o vetor de ligação ξ µ terá uma variação temporal dada, nesta
D ∂
mesma ordem de aproximação, Dτ → ∂t , pelas equações
∂2ξx 1 ∂ 2 hTxxT
= δ
∂t2 2 ∂t2
(23.29)
∂2ξy 1 ∂ 2 hTxyT
= δ.
∂t2 2 ∂t2
A primeira equação vai provocar pequenas oscilações ao longo do eixo x, enquanto a segunda equação pro-
vocará pequenas oscilações ao longo do eixo y. Como as duas componentes hTxxT e hTxyT são independentes,
podemos estudar separadamente os casos em que será nula uma ou outra destas componentes.
Agora, vamos supor duas partículas separadas por uma quantidade igual a δ′ , mas ao longo do eixo y,
i.e., ξ ′ µ (τ = 0) = (0, 0, δ′ , 0). As equações passam a ser
∂2ξ′x 1 ∂ 2 hTxyT ′
= + δ
∂t2 2 ∂t2
(23.30)
∂2ξ′ y 1 ∂ 2 hTxxT ′
=− δ ,
∂t2 2 ∂t2
“Z_2” — 2017/9/5 — 8:19 — page 650 — #670
em que hTyyT = −hTxxT . Agora a segunda equação será responsável pelas oscilações ao longo do eixo y,
enquanto a primeira será responsável pelas oscilações ao longo do eixo x.
O formalismo descrito anteriormente ajudará a descrever a polarização da onda gravitacional. Para isso,
consideremos um anel de partículas, inicialmente em repouso no plano xy. Neste caso
Observamos o que acontecerá com duas partículas, no anel, que inicialmente têm coordenadas (x0 , y0 ) e
(x0 + dx, y0 ). Tomando o elemento de linha
e considerando hxx como uma função oscilatória, veremos que quando hxx passa por hxx = 0 para hxx ≥ 0,
as partículas se afastam entre si, caso contrário, as partículas aproximam uma da outra quando hxx passa
por hxx = 0 para hxx ≤ 0.
Uma situação análoga deverá acontecer se considerarmos as partículas com coordenadas (x0 , y0 + dy).
Assim, se uma onda se propaga na direção do eixo z e incide sobre um anel de partículas no plano xy, o
anel irá se distorcer, formando uma elipse pulsante, cujo eixo maior inicialmente irá girar até ficar paralelo
ao eixo x e posteriormente ao eixo y. Este tipo de polarização é conhecida como polarização (+), como
podemos ver na Fig. 23.1.
Figura 23.1 Deformação sofrida por um anel de partículas, quando atingido por uma onda gravitacio-
nal de polarização (+).
Agora, faremos uma análise do que acontece quando hyx = hxy = h12 = h21 6= 0. Neste caso, o
elemento de linha será,
ds2 = dt2 − dx2 − dy 2 − dz 2 + 2hxy dxdy . (23.33)
π
Efetuando uma transformação de coordenadas fazendo rodar os eixos coordenados em 4 rad no plano xy,
encontramos
1
y → y ′ = √ (y + x)
2
1
x → x′ = √ (y − x) ,
2
de tal forma que o elemento de linha será então,
Figura 23.2 Deformação sofrida por um anel de partículas, quando atingido por uma onda gravitacio-
nal de polarização (×).
Comparando este elemento de linha com o da Eq. (23.31) observamos que são os mesmos elementos de
linha e, naturalmente, causam efeitos idênticos mas após uma rotação de π4 rad dos eixos coordenados. Este
tipo de polarização é conhecida como polarização (×), como podemos ver na Fig. 23.2.
Nota-se que, em geral, uma onda gravitacional será uma superposição dos dois modos de polarização,
i.e., o modo (+) e o modo (×).
em que x denota o operador d’alembertiano com respeito as coordenadas xσ . A utilidade de uma tal
função reside no fato de que a solução geral para uma equação como (23.35) pode ser escrita na forma 16
Z
h̄µν (xσ ) = h̄µν
(0) (x σ
) − 2κ G(xσ − y σ ) T µν (y σ ) d4 y , (23.37)
em que h̄µν
(0) (x) é a solução das equações homogêneas do campo, i.e., as equações no vácuo. Para nosso
propósito, sem perda de generalidade, podemos tomar h̄µν
(0) (x) = 0. Assim,
Z
µν σ
h̄ (x ) = −2κ G(xσ − y σ ) T µν (y σ ) d4 y . (23.38)
16 √
Nota-se que não há necessidade de incluir os fatores −g na nossa integral ou definição da função δ, uma vez que estamos
considerando o problema simplesmente como um campo tensorial h̄µν (x) definido em um background do espaço-tempo de
Minkowski no sistema de coordenadas cartesiana.
“Z_2” — 2017/9/5 — 8:19 — page 652 — #672
As soluções para (23.36) podem ser pensadas como retardada ou avançada, dependendo se elas represen-
tam ondas que viajam para a frente ou para trás no tempo. O nosso interesse estão na função de Green
retardada, que representa os efeitos acumulados de sinais para o passado do ponto em consideração. Esta é
dada por
1
G(xσ − y σ ) = δ (x0 − y 0 ) − |~x − ~y| η(x0 − y 0 ) , (23.39)
4π|~x − ~y|
em que η(x0 − y 0 ) é a função degrau ou função degrau de Heaviside e denotamos em negrito os vetores
1
espaciais~x = (x1 , x2 , x3 ) e~y = (y 1 , y 2 , y 3 ), com a norma |~x−~y| = δij (xi − y i )(xj − y j ) 2 . A derivação
de (23.39) pode ser encontrada na Seção 4.9.
Substituindo a relação (23.39) na Eq. (23.38) encontramos a solução geral para as equações do campo
linearizados, i.e.,
Z 0 − y 0 ) − |~
κ δ (x x − ~
y |
h̄µν (xσ ) = − η(x0 − y 0 ) T µν (y σ ) d4 y
2π |~x − ~y|
⇒
Z
4G T µν (ct − |~x − ~y|,~y) 3
h̄µν (ct,~x) = − d y. (23.40)
c4 |~x − ~y|
A interpretação da Eq. (23.40) requer alguma explicação. Aqui ~x representa as coordenadas espaciais do
ponto do campo na qual h̄µν é determinado, ~y representa as coordenadas espaciais do ponto na fonte e
|~x − ~y| é a distância espacial entre eles. Vemos que a perturbação no campo gravitacional no evento (ct,~x)
é a integral ao longo da região de espaço-tempo ocupada pelos pontos da fonte em um tempo retardado tr
dado por
c tr = ct − |~x − ~y| ,
ou seja, a perturbação no campo gravitacional em (ct,~x) é uma soma das influências das fontes de energia
e momentum no ponto (ctr ,~x − ~y) na região do passado no cone de luz. Uma ilustração do significado
geométrico do tempo retardado é mostrado na Fig. 23.3.
Figura 23.3 Perturbação no campo gravitacional em (ct,~x) é calculada em termos de eventos que se
encontram na região do passado no cone de luz.
“Z_2” — 2017/9/5 — 8:19 — page 653 — #673
Expansão Multipolar da Solução Geral Em geral, a fonte do campo gravitacional pode ser dinâmica
e tem uma extensão espacial que não é pequena em comparação com a distância até ao ponto em que se
deseja calcular o campo. Em tais casos, a obtenção de uma expressão simples para a solução da Eq. (23.40)
é muitas vezes intratável analiticamente. De forma análoga à utilizada na eletromagnetismo, é conveniente
realizar uma expansão multipolar, que se presta para o cálculo das aproximações sucessivas para a solução.
Assim, escrevemos a expansão de Taylor
1 1 1 1 1
= + (−y i ) ∂i + (−y i )(−y j ) ∂i ∂j + ···
|~x − ~y| r r 2! r
1 i xi i j 3xi xy − r 2 δij
= +y 3 +y y + ··· ,
r r r5
∂
em que r ≡ |~x| é a distância espacial da origem ao ponto do campo e ∂i ≡ ∂x i . Logo, a solução (23.40)
será
Z Z
µν 4G 1 xi
h̄ (ct,~x) = − 4 T (ctr ,~y) d y + 3 T µν (ctr ,~y) y i d3 y
µν 3
c r r
2 Z
3xi xy − r δij µν i j 3
+ T (ctr ,~y) y y d y + · · · , (23.41)
r5
em que os momentos multipolares da distribuição da fonte, em qualquer tempo t, são dados por
Z
µνi1 i2 ···iℓ
M (ct) = T µν (ct,~y) y i1 y i2 · · · y iℓ d3 y .
Vamos supor que a fonte é alguma distribuição de matéria localizada perto da origem O do nosso
sistema de coordenadas. Se tomarmos o nosso ponto de campo ~x para ser a distância r a partir de O, que
é grande em comparação com a extensão espacial da fonte, precisamos considerar apenas o primeiro termo
na expansão multipolar (23.41). Além disso, assumimos que as partículas fontes têm velocidades que são
suficientemente pequenas comparadas com c, o que para nós a tomamos ctr = ct − r no argumento do
tensor energia-momentum. Assim, a solução na aproximação compacta é dada por
Z
4G
h̄µν (ct,~x) = − 4 T µν (ct − r,~y) d3 y . (23.42)
c r
Nesta aproximação, estamos considerando apenas a solução de campo afastado para as equações gravita-
cionais linearizadas, que varia como 1r , razão em que chamamos aproximação de campo afastado. Nesta
aproximação, os h̄µν dependem ~x apenas em termos do seu módulo de r = |~x|, i.e., as frentes de onda
são esferas, r = constante. Como os raios destas esferas são grandes, tais esferas podem ser aproximadas
como planos em uma região suficientemente pequena ao redor de qualquer ponto ~x. Isto significa que, em
qualquer região próxima, nossa onda gravitacional se assemelha a uma onda plana, do tipo que estudamos
na seção anterior. A interpretação física para as várias componentes da integral (23.42) é dada por:
R
• T 00 d3 y, energia total das partículas fonte, i.e., ≡ M c2 ;
R
• T 0i d3 y, c vezes o momentum total das partículas fonte na direção xi , i.e., ≡ P i c;
“Z_2” — 2017/9/5 — 8:19 — page 654 — #674
R
• T ij d3 y, tensões internas integradas na fonte.
Para uma fonte isolada, a quantidades M e Pi são constantes na teoria linear, isto é facilmente provado
diretamente da equação de conservação ∂µ T µν = 0. Além disso, sem perda de generalidade, podemos tomar
as nossas coordenadas espaciais xi pelo correspondente no sistema de centro de momentum das partículas
fonte, no caso em que P i = 0. Assim, a partir de (23.42), nas coordenadas de centro de momentum temos
4GM
h̄00 = − e h̄i0 = h̄0i = 0 . (23.43)
c2 r
Sendo que as demais componentes são dadas pela integral das tensões internas dentro da fonte, i.e.,
Z
ij 4G ij ′ 3
h̄ (ct,~x) = − 4 T (ct ,~y) d y . (23.44)
c r r
···
“Z_2” — 2017/9/5 — 8:19 — page 655 — #675
Nota-se que cada momento quadrupolar é determinado por sua parte de traço-livre, além de serem,
os momentos quadrupolos, de ordem mais baixa.
Para partículas que se movem lentamente temos T 00 ≈ ρc2 , em que ρ é a densidade adequada da
fonte, e assim o momento quadrupolo poderá ser escrito como
Z
kl 2
Q (t) = c ρ(ct,~r) xk xl d3 r .
Assim, a onda gravitacional produzida por uma fonte não relativística isolada é proporcional à se-
gunda derivada do momento quadrupolo da distribuição de densidade de matéria. Em contraste, a
contribuição principal para a radiação eletromagnética é a primeira derivada do momento dipolo da
distribuição de densidade de carga. Esta diferença fundamental entre as duas teorias podem ser facil-
mente compreendido a partir de considerações elementares. Usando ρ para Rdesignar a densidade de
massa adequada ou a densidade de carga apropriada, a integral de volume ρ dV através da fonte
é constante no tempo, tanto para o eletromagnetismo quantoR para a gravitação linearizada e assim
i
não gera radiação. Agora, considere o próximo momento ρ x dV , i.e., o momento dipolo. Para o
eletromagnetismo, isto dá a posição do centro de carga da fonte, que pode mover-se com o tempo
e, portanto, têm uma derivada de tempo diferente de zero, proporcionando
R a contribuição dominante
na geração de radiação electromagnética. No entanto, para gravitação ρ xi dV nos dá o centro de
massa da fonte e, para um sistema isolado, a conservação do momento significa que não pode mu-
dar com o tempo, portanto, não poderá contribuir para a geração de ondas gravitacionais. Assim, é
o momento de quadrupolo em geral que mede a forma da fonte, que é dominante na geração de on-
das gravitacionais. Este fato e o acoplamento fraco da gravitação à matéria, significa que a radiação
gravitacional é muito mais fraca do que a radiação eletromagnética.
Um momento monopolo dependente do tempo, como por exemplo, uma estrela pulsante esferica-
mente simétrica, não produz radiação gravitacional. Esta é uma consequência do teorema de Birkhoff
segundo o qual o espaço-tempo fora de uma fonte esfericamente simétrica é sempre a solução de
Schwarzschild estática. Além disso, o caso do momento dipolo dependente do tempo não produz
qualquer radiação gravitacional na aproximação de campo distante. Assim, precisamos de um mo-
mento quadrupolo dependente do tempo. Como exemplo, podemos pensar em uma bola periodica-
mente achatada. Além disso, duas massas que orbitam seu baricentro tem um momento quadrupolo
dependente do tempo.
Como ilustração da geração de ondas gravitacionais, consideremos um sistema composto por duas estre-
las (nêutrons) de aproximadamente mesma massa, por isso, orbitando em seu centro de massa comum, tendo
como trajetória o mesmo círculo. A frequência das ondas gravitacionais emitidas é o dobro da frequência
de órbita, uma vez que após uma metade do período, as massas são simplesmente trocadas entre si, que se
confunde com a configuração inicial. Se cada estrela tem uma massa M e o raio da órbita é dado por R,
seguindo a mecânica newtoniana simples, a frequência do movimento orbital é
1
2π ν GM 2
ω= = = . (23.49)
P R 4R3
[xiA ] = (R cos ωt, R sen ωt, 0) e [xiB ] = (−R cos ωt, −R sen ωt, 0)
tal que
Qij (t) = 2M xi (t) xj (t)
“Z_2” — 2017/9/5 — 8:19 — page 656 — #676
Portanto, h̄µν
rad (ct,~x) será
0 0 0 0
2 ω2
8M GR 0 cos 2ωt sen 2ωtr 0
[h̄µν
rad (ct,~x)] =
r . (23.51)
4
c r 0 sen 2ωtr − cos 2ωtr 0
0 0 0 0
Esta é a expressão para o campo gravitacional induzido por estrelas orbitando em seu centro de massa
comum e afastada à uma distância r. Vê-se, como previsto anteriormente, que a frequência do campo
gravitacional oscilante é 2ω, o dobro da frequência do movimento orbital. Uma vez que a amplitude é
proporcional a 1r , a perturbação gravitacional tem a forma de uma onda esférica, em vez de uma onda plana.
No entanto, para grande valores de r a onda é aproximada a uma onda plana em pequenas regiões de ângulos
sobre qualquer direção particular.
Tensor Energia-Momentum em Ondas Gravitacionais É natural neste momento falarmos sobre a ener-
gia emitida pela radiação gravitacional. Tal discussão, no entanto, é imediatamente cercada por problemas,
tanto técnicos como filosóficos. Como sabemos, não há medida local verdadeira da energia no campo gra-
vitacional. Claro que, no limite do campo fraco, onde pensamos em gravitação como sendo descrita por um
tensor simétrico propagando-se em uma métrica fixa como background, podemos ter a esperança de obter
um tensor energia-momentum para as flutuações hµν , assim como faríamos para o eletromagnetismo ou
qualquer outra teoria de campo. Até certo ponto isto é possível, mas ainda há dificuldades. Como resultado
destas dificuldades, há uma série de diferentes propostas na literatura para o que deve ser usado como o
tensor energia-momentum para a gravitação no limite do campo fraco, todos eles são diferentes, mas para
a maior parte, eles dão as mesmas respostas a questões fisicamente bem colocados, tais como a taxa de
energia emitido por um sistema binário.17
Do ponto de vista técnico, as dificuldades começam quando consideramos qual a forma em que o ten-
sor energia-momentum deve ser considerado. Anteriormente mencionado os tensores de energia-momentum
para o eletromagnetismo e para teoria do campo escalar, em ambos os casos temos uma característica im-
portante, eles são quadráticos nos campos relevantes. Por hipótese, nossa abordagem no limite do campo
17
S. M. Carroll, Space and Geometry - An introduction to general relativity (2004).
“Z_2” — 2017/9/5 — 8:19 — page 657 — #677
fraco tem sido a de manter apenas termos que são lineares na perturbação métrica. Assim, a fim de manter
o controle da energia transportada pelas ondas gravitacionais, vamos ter que estender os nossos cálculos,
pelo menos, até segunda ordem em hµν . Ao discutir os efeitos das ondas gravitacionais sobre as partículas
testes e a geração de ondas por um sistema binário, temos utilizado o fato de que as partículas testes se mo-
vem ao longo das geodésicas. Mas, como sabemos, esta é derivada da conservação de energia-momentum
covariante, ∇µ T µν = 0. Entretanto, atualmente trabalhamos com ∂µ T µν = 0, o que implica que as partí-
culas testes movem em linhas retas na métrica plana de background. Este é um sintoma da inconsistência
fundamental do limite de campo fraco. Na prática, devemos resolver as equações de campo fraco de alguma
ordem apropriada, e em seguida, justificar a validade de suas soluções.18
Uma quantidade que descreve a energia e momentum de um campo gravitacional pode ser definida em
relação a uma métrica de fundo. Assumimos que temos uma métrica de espaço-tempo que nos leva, nas
coordenadas escolhidas, a forma
gµν (x) = ηµν + hµν (x) .
As coordenadas são fixadas sob uma transformação de Lorentz, tais que,
µ
xµ 7→ x′ = Λµν xν , ηµν = Λρµ Λσν ηρσ . (23.52)
(n)
em que Rµν (h) abrange todos os termos de n-ésima ordem em hρσ e as suas primeira e segunda derivadas.
Similarmente, o tensor de Einstein é da forma
1
Gµν (h) = Rµν (h) − gµν gρσ Rρσ (h) = G(1) (2)
µν (h) + Gµν (h) + · · · , (23.53)
2
em que
1
G(1) (1)
gµν gρσ Rρσ
µν (h) = Rµν (h) −
(1)
(h) , (23.54)
2
1 1 1
G(2) (2)
µν (h) = Rµν (h) − ηµν η ρσ Rρσ
(2)
(h) − hµν η ρσ Rρσ
(1)
(h) + ηµν hρσ Rρσ
(1)
(h) (23.55)
2 2 2
e assim sucessivamente. Aqui utilizamos gρσ = η ρσ − hρσ + · · · .
Assumimos que nossa métrica gµν = ηµν + hµν satisfaz a equação de campo de Einstein, com a fonte
Tµν , exatamente,
Gµν (h) = −κ Tµν .
Reescrever esta equação, mantendo apenas os termos de primeira ordem no lado esquerdo e deslocando
todos os termos de ordem superior para o lado direito,
G(1)
µν (h) = −κ (Tµν + tµν ) (23.56)
⇒
1 1
tµν = Gµν (h) − G(1)
µν (h) = G (2)
µν (h) + · · · . (23.57)
κ κ
De acordo com a Eq. (23.56), h satisfaz a equação do campo linearizada com a fonte sendo Tµν + tµν .
Naturalmente, esta continua ser a mesma equação de Einstein na qual é não linear. Temos apenas renomeado
os termos não lineares em tµν e reinterpretando-as como fontes adicionais.
18
S. M. Carroll, Space and Geometry - An introduction to general relativity (2004).
“Z_2” — 2017/9/5 — 8:19 — page 658 — #678
Claramente, a notação nos sugere pensar em tµν como um tensor energia-momentum. Para fazer esta
(1)
afirmação parecer plausível, nota-se que a identidade de Bianchi para Gµν implica que tµν é conservada no
sentido espaço plano, i.e.,
∂µ tµν = 0 .
(1)
Os tµν não são as componentes de um tensor, é fácil verificar que Gµν e, portanto, tµν transformam como
componentes de tensores sob as transformações de Lorentz (23.52), mas não sob troca arbitrária de co-
ordenadas. Assim, tµν é chamado o pseudotensor energia-momentum do campo gravitacional. Esta lei de
conservação não é uma equação covariante. Ela detém apenas nas coordenadas especiais em que a nossa
métrica de background tem componentes ηµν . No entanto, ela realmente dá origem a uma lei de conserva-
ção na forma integral, se integrado ao longo de uma região de espaço-tempo, i.e., a mudança do tensor de
energia no interior de um volume espacial é igual ao fluxo de energia através da fronteira. Em contrapartida,
a lei de divergência covariante ∇µ T µν , que é satisfeita por nossa fonte de materia verdadeira, é apenas uma
lei de conservação em regiões infinitamente pequenas e não dá origem a uma lei de conservação na forma
integral.
Se a nossa fonte de matéria perde energia, exatamente a mesma quantidade de energia deve ser levado
sob a forma de ondas gravitacionais de acordo com a lei de conservação. Esta é a maneira em que as
observações do pulsar de Taylor e Hulse são interpretados, o que será discutido mais à frente. Observa-se
que o sistema perde a energia e conclui-se que esta energia é levada sob a forma de ondas gravitacionais.
Linearizando a equação de campo no que diz respeito ao hµν e suas derivadas é equivalente a fixação de
tµν igual a zero. Nesta aproximação, Tµν somente satisfaz a lei de conservação. Temos que ir pelo menos
até a segunda ordem, se quisermos ter um tµν não trivial. A teoria na segunda ordem podemos escrever a
métrica como
gµν = ηµν + h(1) (2)
µν + hµν + · · · ,
(1) (1)
em que hµν é uma solução para a equação de campo linearizada. Os termos hµν são pequenos de primeira
(2) (2)
ordem, enquanto os termos hµν são pequenos de segunda ordem, i.e., termos lineares em hµν são tratados
(1)
em pé de igualdade como os termos quadráticos em hµν . Expandindo os dois lados da Eq. (23.56) até
segunda ordem, resulta em
1 (2) (1)
G(1)
µν (h
(1)
+ h(2) ) = −κ (Tµν + tµν ) ⇒ tµν = G (h ) .
κ µν
Em outras palavras, temos o pseudotensor energia-momentum de um campo gravitacional em sua menor
(1)
aproximação não trivial se inserirmos a solução correspondente da equação de campo linearizada hρσ em
(2)
Gµν .
Embora a Eq. (23.55), e por isso tµν , seja covariante sob transformações globais de Lorentz, embora não
seja covariante sob transformações gerais de coordenadas, pode-se mostrar, depois de álgebra considerável,
que não é invariante sob a transformação de calibre (23.5), ou equivalente, a transformação infinitesimal
de coordenadas (23.4). Uma forma de contornar este problema é tomar a sério o fato de que a energia-
-momentum de um campo gravitacional em um ponto no espaço-tempo não tem nenhum significado real na
relatividade geral, uma vez que em qualquer evento particular sempre se pode transformar em um quadro de
queda livre na qual os efeitos gravitacionais desaparecem. Isto sugere que, em cada ponto no espaço-tempo,
(2)
deve-se tomar a média de Gµν sobre uma pequena região, i.e., as já comentadas regiões infinitamente
pequenas, de modo a sondar a curvatura física do espaço-tempo, o que dá uma medida de calibre invariante
da força do campo gravitacional.19 Denotando este processo médio por h· · · i, deve-se, assim, substituir a
última relação por
1 D (2) E
tµν = Gµν (23.58)
κ
19
Força aqui do inglês strength
“Z_2” — 2017/9/5 — 8:19 — page 659 — #679
ou
1 (2) 1 ρσ (2) 1 ρσ (1) 1 ρσ (1)
tµν = Rµν (h) − ηµν η Rρσ (h) − hµν η Rρσ (h) + ηµν h Rρσ (h) ,
κ 2 2 2
(N )
em que Rµν é o termo no tensor de Ricci de ordem N em hµν .
Observação Lembremos novamente que a equação de campo linearizada de primeira ordem pode ser
escrita como
(1) 1
Rµν = −κ Tµν − ηµν T ,
2
em que T ≡ Tµµ e κ ≡ 8πG
c4 . Ainda, podemos notar desta equação que R1 = κ T . Então, escreveremos
(23.55) como
1 1
G(2) (2)
µν = Rµν − ηµν R(2) − κ h̄µν − ηµν hρσ Tρσ . (23.59)
2 2
(2)
Assim, voltando ao problema, devemos calcular Rµν . Então, os termos de segunda ordem em hµν são
dados por
(2) σ σ ρ σ ρ σ
Rµν = ∂ν Γ(2) µσ − ∂σ Γ(2) µν + Γ(1) µσ Γ(1) ρν − Γ(1) µν Γ(1) σρ , (23.60)
em que, do lado direito, os sobrescritos entre parênteses indicam a ordem de expansão em hµν . Os símbolos
de Christoffel em primeira ordem foram calculados em (23.6) e, agora, incluindo os termos de segunda
ordem temos
σ σ
Γσµν = Γ(1) µν + Γ(2) µν + · · ·
1 1
= ∂ν hσµ + ∂µ hσν − ∂ σ hµν − hστ (∂ν hτ µ + ∂µ hτ ν − ∂τ hµν ) + · · · .
2 2
Inserindo em (23.6) temos
(2) 1 1
Rµν =− ∂µ hρσ ∂ν hρσ + hρσ ∂µ ∂σ hνρ + ∂ν ∂σ hµρ − ∂µ ∂ν hρσ − ∂ρ ∂σ hµν
4 2
1 σ ρ 1 1
+ ∂ hν ∂ρ hσµ − ∂σ hρµ + ∂σ hρσ − ∂ ρ h ∂µ hνρ + ∂ν hµρ − ∂ρ hµν . (23.61)
2 2 2
(2)
Para calcular (23.58), devemos calcular o valor médio hRµν i. Primeiro, usamos o resultado20
para reescrever produtos de primeiras derivadas em (23.61) em termos de segundas derivados. Usando a
equação de campo de primeira ordem (23.10) para substituir por termos da forma hµν e depois aplicando
a relação anterior mais uma vez para reescrever os termos contendo segunda derivadas como produtos de
primeira derivada, finalmente
D E 1 D
(2) ρσ ρσ ρ
Rµν = ∂µ hρσ ∂ν h − 2 ∂σ h ∂ (µ hν) ρ + 2 ∂ρ h ∂ (µ hν) − ∂µ h ∂ν h
4 E
ρ
+ κ 2hµν T + 2hTµν − ηµν hT − 4hρ (µ Tν) . (23.62)
20
Uma vez que estamos fazendo a média sobre todas as direções em cada ponto, em pequenas regiões, as primeiras derivados
média nos dão zero. Então, para uma função qualquer a(x), temos h∂µ ai = 0. Como consequência temos
e portanto
h(∂µ a)bi = −ha(∂µ b)i .
“Z_2” — 2017/9/5 — 8:19 — page 660 — #680
Contraindo esta expressão, usando o resultado h(∂µ a)bi = −ha(∂µ b)i e a equação de campo de primeira
ordem (23.10), encontramos D E 1 D E
R(2) = − κ hρσ Tρσ . (23.63)
2
Combinando as Eqs. (23.59), (23.62) e (23.63) e escrevendo o resultado em termos do campo de traço
reverso h̄µν = hµν − 12 ηµν h, encontramos
1 1
tµν = κ−1 ∂µ h̄ρσ ∂ν h̄ρσ − 2 ∂σ h̄ρσ ∂ (µ h̄ν) ρ − ∂µ h̄ ∂ν h̄
4 2
E
ρ
− κ 4h̄ρ (µ Tν) + ηµν hρσ Tρσ . (23.64)
Fisicamente, seria de se esperar que as ondas gravitacionais transportem energia para longe de uma
fonte de radiação. Levando em conta o discutido acima, a partir da Eq. (23.64) uma expressão apropriada
para o tensor energia-momentum do campo gravitacional no vácuo será
c4 ρσ ρσ 1
tµν = ∂µ h̄ρσ ∂ν h̄ − 2 ∂σ h̄ ∂ (µ h̄ν) ρ − ∂µ h̄ ∂ν h̄ ,
32πG 2
em que h· · · i denota o valor médio sobre uma pequena região em cada ponto no espaço-tempo e voltamos
a usar o valor κ ≡ 8πG c4
. Se usarmos o calibre transverso sem traço, a condição do calibre de Lorenz
∂µ h̄T T = 0 será satisfeita, assim como h̄T T = 0 e h̄µν
µν µν
T T = hT T . Então, da relação anterior, no vácuo temos
c4 D E
tµν = ∂µ hTρσT ∂ν hρσ
TT .
32πG
Vamos supor, ainda, que estamos considerando apenas a parte radiativa do campo gravitacional, em que o
calibre transverso sem traço é definido pela escolha
h̄0i
TT = 0 e h̄T T = 0 .
∂0 h̄00
TT = 0 e ∂i h̄ij
TT = 0 .
Nota-se que, se a perturbação do campo gravitacional é não estacionária, i.e., depende em t, o primeiro
µ0
vínculo acima implica que h00
T T também se anula e hT T = 0 para todos os µ. Em outras palavras, neste caso
somente as componentes espaciais hij
T T são diferentes de zero. Por essa razão, o tensor energia-momentum
será
c4 D E
tµν = ∂µ hTijT ∂ν hij
TT . (23.65)
32πG
em que o sinal negativo aparece como resultado da escolha da métrica, desde que então
como requerido.
Como ilustração, calculemos o fluxo de energia na direção de propagação para onda gravitacional plana
dada por
hij ij λ
T T = AT T cos kλ x ,
em que AijT T são constantes e escolhemos a fase arbitrária da onda tal que a amplitude seja real. Usando
(23.65) encontramos
c4
tµν = kµ kν Aij TT
T T Aij . (23.67)
64πG
Então o fluxo na direção k será
c5 c5
F = −c t0l k̂l = − k0 kl k̂l Aij TT
T T Aij = k0 k0 Aij TT 00
T T Aij = c t , (23.68)
64πG 64πG
em que o terceiro termo da igualdade usamos o fato de que k0 = |~k| = −kl k̂l , desde que o vetor de onda
seja nulo e
c2 D E
t00 = hij ,0 hij ,0 (23.69)
32πG
é a densidade de energia no campo gravitacional. Substituindo por h11 e h22 na (23.50), encontramos que o
fluxo emitido na direção z é
c3 64M 2 G2 R4 ω 4 4 16G 2 4 ω 6
Fz = 4ω = M R 2 .
16πG c8 r 2 πc5 r
No caso da radiação emitida na direção x, a correspondente fórmula contém o termo (h22 ,0 )2 + (h33 ,0 )2
na qual o valor médio do fator cos2 2ωt, oscilante no tempo, será 12 . Assim, o fluxo emitido na direção x é
2G 2 4 ω 6
Fx = M R 2 .
πc5 r
Claramente vemos que muito mais energia é emitida na direção z do que na direção x, que não é surpreen-
dente, dada a natureza da fonte. O padrão de emissão de energia é muito anisotrópico.
Energia Irradiada Desde que um sistema binário emite radiação que vai claramente perder energia, e
isto deve ter consequências observáveis, devemos calcular a taxa total de emissão de energia, mas pelo fato
do padrão de emissão não ser isotrópico, o cálculo não é inteiramente simples.
Começamos por reunir algumas fórmulas relevantes. A densidade de energia no campo gravitacional
em qualquer ponto é, a partir de (23.69) e (23.48)
G ... ...
t00 = Q Q . (23.70)
8πc10 r 2 ij ij
Nota-se que esta relação depende da terceira derivada do momento quadrupolo. Também exigimos, no
entanto, que hij , e, por conseguinte, Qij , a partir de (23.48), devem ter a forma transversa sem traço. Vimos
acima que, para um sistema binário a forma de hij relevante para emissão na direção z, dada por (23.50), já
está na forma transversa sem traço
0 0 0 0
0 h11 h12 0
hTµνT = 0 h12 −h11 0 ,
0 0 0 0
“Z_2” — 2017/9/5 — 8:19 — page 662 — #682
mas a que descreve a emissão na direção x teve de ser colocado na forma transversa sem traço à mão,
terminando com a equação dada por
0 0 0 0
2
4M GR ω 02 0 0 0
[(h̄Trad
T µν
) (ct,~x)] = .
c4 r 0 0 − cos 2ωtr 0
0 0 0 cos 2ωtr
Desde que devemos integrar sobre todas as direções, devemos incorporar um procedimento matemático que
irá garantir que hij e o equivalente Qij retenham uma forma transversa sem traço. Podemos introduzir uma
simplificação inicial, começando com Qij já na forma sem traço, que é feita simplesmente subtraindo um
múltiplo da matriz unidade vezes o traço, como foi feito na relação anterior. Ou seja, vamos supor que
Qii = 0 . (23.71)
O nosso objetivo é o de calcular a taxa de perda de energia através de uma superfície esférica de raio grande,
centrado na fonte de radiação. O fluxo de radiação é então perpendicular à superfície. Para projetar para fora
as componentes de Qij que são transversais à direção de fluxo da energia significa, portanto, que se projete
para fora as componentes no plano tangente à superfície da esfera e negligenciamos as outras situações.
Seja n̂ o vetor unitário normal à superfície em qualquer ponto e tomemos ~v como algum vetor arbitrário, o
operador de projeção Pij
Pij = δij − ni nj
projetará para fora a componente de ~v na qual é ortogonal a n̂. Assim, temos
e portanto
(P ~v) · n̂ = (Pij vj ) ni = ~v · n̂ − (n̂ · n̂) (~v · n̂) = 0 ,
como queríamos, i.e., (Pij vj ) é ortogonal a n̂. Nota-se que
como esperado para os operadores de projeção. Com tensores Mij , na qual tem a forma matricial, é fácil
ver que
Nkl = Pik Pjl Mij
é transverso
Nkl nk = Nkl nl = 0 ,
desde que
é sem traço:
1 1
Rkk = Pik Pkj − Pkk Pij Mij = 1 − Pkk Pij Mij = 0
2 2
pois Pkk = δkk − nk nk = 3 − 1 = 2. Portanto R é a versão transversa sem traço de M :
1
R = MTT = PMP − P (tr[P M ])
2
ou
1
MijT T = Pik Pjl − Pij Pkl Mkl . (23.73)
2
Isto completa a matemática necessária para encontrarmos hTijT em qualquer ponto. Por ser sem traço, h̄TijT
é igual a perturbação original hTijT . Na fórmula quadruplo, temos
2G h T T ′ i
hTijT = h̄TijT = − Q̈ij (ct ) , (23.74)
c6 r r
em que a parte transversa sem traço do momento quadrupolo é também construído via (23.73). De fato,
o momento quadrupolo definido por (23.73) não é a quantidade mais conveniente para usar na expressão
da onda gerada, uma vez que envolve uma integral sobre a densidade de energia que pode ser difícil de
determinar. Em vez disso, podemos usar o momento quadrupolo reduzido,
1
Qij = Qij − δij δkl Qkl , (23.75)
3
na qual é justamente a parte sem traço de Qij . O momento quadrupolo reduzido tem a propriedade de ser o
coeficiente do termo r −5 na expansão multipolar do potencial newtoniano
GM G 3G
Φ=− − 3 Di xi − 5 Qij xi xj + · · ·
r r 2r
e é uma aproximação mais realista para as fontes. Naturalmente, a parte transversa sem traço do momento
quadrupolo é a mesma que a parte transversa sem traço do momento quadrupolo reduzido, i.e., sem traço,
tal que
2G h i 2G h i
hTijT = − 6 Q̈TijT (ct′ ) = − 6 Q̈TijT (ct′ ) , (23.76)
c r r c r r
com
TT 1
Qij = Pik Pjl − Pij Pkl Qkl .
2
Logo,
G ...T T ...T T
t00 = 10 2
Qij Qij . (23.77)
8πc r
Para resolver (23.77), observe que
TT TT 1 1
Qij Qij = Pik Pjl − Pij Pkl Pip Pjq − Pij Ppq Qkl Qpq
2 2
= (Pik Pjl Qkl ) (Pip Pjq Qpq ) − (Pik Pjl Qkl ) (Pij Ppq Qpq )
1
+ Pij Pij (Pkl Qkl ) (Ppq Qpq ) .
4
Temos três termos do lado direito da equação anterior. Após alguma álgebra, vemos que o primeiro, o
segundo e o terceiro termos serão, respectivamente
1
−nk nl np nq Qkl Qpq e +
nk nl np nq Qkl Qpq .
2
Finalmente, agrupando estes termos na equação original, temos
1
QTijT QTijT = Qij Qij − 2np nq Qip Qiq + nk nl np nq Qkl Qpq . (23.78)
2
Temos que, da Eq. (23.77), a densidade de energia gravitacional será
G D...T T ...T T E
t00 = Qij Qij , (23.79)
8πc10 r 2
em que o sinal de média é colocado para lidar com possíveis termos oscilantes. Assim e a energia que passa
através de uma superfície esférica de raio r em unidade de tempo é
Z Z D
dE 2 G ...T T ...T T E
= − c t00 r dΩ = − Q ij Qij dΩ . (23.80)
dt 8πc9
dE G D... ... E
= − 9 Qij Qij . (23.82)
dt 5c
Como uma ilustração, vamos aplicar a fórmula geral (23.82) para o exemplo específico do sistema rotativo
de duas partículas. O tensor momento quadrupolo Qij para este sistema é dada em (23.50), a partir do qual
rapidamente descobrimos que o tensor momento quadrupolo reduzido (23.75) é dado por
1
3 + cos 2ωt sen 2ωt 0
[Qij ] = M c2 R2 sen 2ωt 1
3 − cos 2ωt 0 .
0 0 − 23
“Z_2” — 2017/9/5 — 8:19 — page 665 — #685
Então, encontramos
dE 128G
= − 5 M 2 R4 ω 6 . (23.83)
dt 5c
Substituindo o valor de ω, i.e., a frequência de rotação do sistema rotativo de duas partículas, dado em
(23.49), a taxa de perda de energia poderá ser escrita na forma,
dE 2 G4 M 5
=− . (23.84)
dt 5 c5 R5
Spin-up e o Pulsar Binário PSR 1913 + 16 Para o sistema binário, fazendo um tratamento newtoniano,
a energia total será simplesmente
1 GM 2
E = (2M v 2 ) − ,
2 2R
em que v é a velocidade orbital de cada objeto. Usando a equação radial de movimento, temos
M v2 GM 2 GM 2
= ⇒ M v2 = .
R (2R)2 4R
Diferenciando esta expressão em relação a t e invertendo-a, descobrimos que a taxa de variação do período
orbital está relacionada com a taxa de variação de energia por
dP 3 P dE
=− . (23.86)
dt 2 E dt
21
Coalescência - Fusão, união, junção ou aderência do que estava separado.
“Z_2” — 2017/9/5 — 8:19 — page 666 — #686
2
Substituindo R = − GM
4E em (23.84) e usando (23.85) para E, encontramos que (23.86) será
5
dP 96 1 π 2πGM 3
= − 43 5 . (23.87)
dt 5 c P
Esta expressão dá a taxa da variação do período orbital unicamente em termos de algumas constantes e de
P em si, que podem ser determinada diretamente a partir de observações. Inserindo os valores numéricos
em (23.87) temos
5
dP −12 M P0 3
= −3, 4 × 10 ,
dt M⊙ P
em que a massa tanto do pulsar e de sua companheira invisível é cerca de 1, 4 M⊙ , e o período orbital é de
7, 75 h, considerando P0 = 1 h encontramos
dP
= −1, 96 × 10−13 ,
dt
ou seja, o período da órbita diminui 1, 96 × 10−13 segundos a cada segundo. Esta é uma previsão dramática
da relatividade geral, surgindo como consequência da emissão de radiação gravitacional do sistema binário.
Esta previsão foi verificada em 1974 por Hulse e Taylor que observaram o decréscimo no período do
sistema binário PSR 1913 + 16, que é um pulsar.22 Porém para maior acurácia, devemos levar em conta o
fato de que temos duas massas diferentes,
m1 = 1, 4398 ± 0, 0002 M⊙
m2 = 1, 3886 ± 0, 0002 M⊙
M = m1 + m2 = 2, 828378 ± 0, 000007 M⊙ ,
as órbitas são elípticas, sendo o semieixo maior com cerca de 9 × 108 m e a excentricidade de elipse de
e = 0, 6171334 ± 0, 0000005; assim, a Eq. (23.87) necessita de correções, tais que23
5 − 5
dP RG 192πG 3 P 3 73 2 37 4 − 27 1
=− 1+ e + e 1 − e2 m1 m2 (M )− 3 . (23.88)
dt 5c5 2π 24 96
dP RG
= −(2, 402531 ± 0, 000014) × 10−12 .
dt
As duas últimas equações aplicam-se no referencial do sistema em órbita. A aceleração relativa daquele
referencial em relação ao baricentro do sistema solar causará uma pequena contribuição adicional ao va-
lor observado dP
dt . Progressos recentes na determinação dos parâmetros da estrutura galáctica nos permite
atualizar as quantidades relevantes e calcular um novo valor para a correção cinemática de dP dt . Usando
22
R. A. Hulse and J. H. Taylor, The Astrophysical Journal, 195, L51-L53 (1975).
23
P. C. Peters and J. Mathews, Physical Review, 131, 435-440 (1963).
“Z_2” — 2017/9/5 — 8:19 — page 667 — #687
R0 = 8, 4 ± 0, 6 kpc para a distância até o centro da galáxia e Θ0 = 254 ± 16 km/s para a velocidade
circular do padrão local de repouso e d = 9, 9 ± 3, 1 kpc para a distância do pulsar, obtém-se a contribuição
CC
cinemática, ∆ dPdt : 24
CC
∆ dPdt = −(0, 027 ± 0, 005) × 10−12 .
Assim, encontramos a razão da taxa observada pela taxa prevista, na relatividade geral, do decaimento do
período orbital como sendo
dP CC
dt − ∆ dPdt
= 0, 997 ± 0, 002 ,
dP RG
dt
ou seja, uma excelente concordância com o valor medido, com acurácia melhor que 0,3%. Este resultado
fundamental está ilustrado na Fig. 23.4.
Figura 23.4 Decaimento orbital causada pela perda de energia por radiação gravitacional. A parábola
ilustra a mudança esperada do tempo periastro em relação a uma órbita imutável, de acordo com
a relatividade geral. Os pontos representam as medidas observadas, as barras de erro são muito
pequenas para se ver.
24
J. H. Taylor and J. M. Weisberg, The Astrophysical Journal, 253, 908-920 (1982); Idem, The Astrophysical Journal, 345, 434-
450 (1989); J. M. Weisberg, D. J. Nice and J. H. Taylor, The Astrophysical Journal, 722, 1030-1034 (2010).
“Z_2” — 2017/9/5 — 8:19 — page 668 — #688
Assim, mesmo que as duas massas de teste fossem separadas por uma distância l0 = 1 km, a variação
δl nesta distância seria da ordem de 10−16 cm, o que corresponde a ∼ 10−6 do tamanho dos átomos que
constituem as massas testes!
A discussão acima deixa claro que é preciso utilizar detectores sensíveis para medir estas mudanças de
comprimento entre as massas testes em longas distâncias. Vários detectores foram construídos com base
na configuração do interferômetro de Michelson, i.e., um interferômetro de Michelson a laser, ver Fig.
23.5. O interferômetro a laser para detecção de ondas gravitacionais foi inventado por Weiss em 1990. 29
O sistema básico é composto de três massas testes. Dois têm espelhos M1,2 anexados a eles, o terceiro é
anexado ao divisor de feixe S. Cada massa é suspensa a partir de um suporte que isola a massa de vibrações
externas, mas permite que elas oscilem livremente na direção horizontal. Um laser, com comprimento de
onda λ ∼ 10−4 cm emite luz incidente em S, que divide a luz em dois feixes dirigidos para os braços do
interferômetro. Os feixes são refletidos pelos espelhos na extremidade de cada braço e, em seguida recombi-
nados em S antes de ser detectado no detector óptico. Quando os feixes são recombinados eles irão interferir
construtivamente, se os comprimentos dos dois braços L1 e L2 diferem por um montante ∆L = nλ, e, irá
interferir destrutivamente se ∆L = n + 12 λ, em que n é um número inteiro. O sistema é calibrado para
que os feixes interfiram destrutivamente se todas as três massas estão perfeitamente estacionárias. Na prá-
tica, o arranjo experimental melhorado é mais sofisticado do que um simples interferômetro de Michelson
29
Rainer (Rai) Weiss (1932- ), físico alemão, naturalizado americano.
R. Weiss, Interferometric Gravitational Wave Detectors, p. 331, Proceedings of the Twelfth International Conference on General
Relativity and Gravitation, Ed. by N. Ashby, D. Bartlett and W. Wyss, Cambridge University Press (1990).
“Z_2” — 2017/9/5 — 8:19 — page 670 — #690
como discutido. A mais importante melhoria é a introdução de duas outras massas testes adicionais com es-
′ em cada braço do interferômetro, formando assim uma cavidade, tal como
pelhos de reflexão parcial M1,2
ilustrado na Fig. 23.5. Um fóton típico pode viajar dentro destas cavidades muitas vezes antes de finalmente
chegar no divisor de feixe, aumentando deste modo o comprimento do braço eficaz do interferômetro. O
uso de grandes interferômetros de Michelson a laser como detector de ondas gravitacionais está em ativi-
dade e em construção em uma série de laboratórios de todo o mundo. O princípio básico de atingir uma
alta sensibilidade baseia-se na ideia de que a maioria das forças de perturbação de ruído são independentes
dos comprimentos da linha base, enquanto o deslocamento da onda gravitacional cresce com a linha base.
Comentaremos dois detectores.
• O LIGO 30 é um detector tipo interferômetro de laser construído em dois sítios: um deles fica na Reserva
Hanford em Washington Central, que abrigam dois interferômetros, sendo um com braços de 2 km
e um outro com braços de 4 km de comprimento; enquanto o outro sítio fica em Livingston Parish,
Louisiana, com braços de 4 km de comprimento. Os três interferômetros estão operando em coinci-
dência, para que o sinal poça ser confirmado por dados em todos os três locais. O LIGO é um projeto
que foi fundado em 1992 por Kip Thorne, Ronald Drever 31 e Rainer Weiss, 32 sendo patrocinado pela
National Science Foundation. 33
Comentário final Em 11 de fevereiro de 2016, as colaborações LIGO e Virgo publicaram um artigo sobre
a detecção de ondas gravitacionais. 36 Este artigo relata os dados que em 14 de setembro de 2015 as
09 : 50 : 45 UTC 37 os dois detectores H1 e L1 da colaboração LIGO observaram, simultaneamente,
um sinal de onda gravitacional transitória. O sinal varre a frequência entre 35 e 250 Hz com um pico
de tensão linear de ondas gravitacionais de 1, 0 × 10−21 . Ele coincide com a forma de onda previsto
pela relatividade geral e para a fusão de um par de buracos negros e o anel para o buraco negro único
resultante. O sinal foi observado com um filtro adaptado para a taxa da relação sinal-ruído ∼ 24 e uma
taxa de falsos alarmes estimada em menos do que 1 evento a cada 203.000 anos, equivalente a um
significado maior do que 5, 1σ. A fonte fica a uma distância de 410+160−180 Mpc correspondente a um
deslocamento para o vermelho z = 0, 09+0,03−0,04 . As massas iniciais dos buracos negros são 36+5
−4 M⊙
+4 +4 +0,5 2
e 29−4 M⊙ , e a massa do buraco negro final é 62−4 M⊙ , com 3, 0−0,5 M⊙ c irradiada em ondas
gravitacionais. Todas as incertezas definem 90% de intervalo de credibilidade. Estas observações
demonstram a existência de binários de buracos negros. Este trabalho apresentou a primeira detecção
30
LIGO - Interferometer Gravitational Observatory Laser.
31
Ronald William Prest Drever (1931- ), físico escocês.
32
A. Abramovici et al., Science, 256, 325 (1992).
33
NSF - National Science Foundation.
34
C. Bradaschia et al., Nucl. Instrum. Methods, A289, 518 (1990).
35
LIGO-M060038-v2, Memorandum of Understanding Between VIRGO and LIGO, LIGO, (2014), Retrieved 2016-02-13.
36
Staff NSF, Gravitational waves detected 100 years after Einstein’s prediction, National Science Foundation, www.nsf.gov 11
February 2016, Retrieved 11 February 2016; D. Castelvecchi and W. Witze, Einstein’s gravitational waves found at last, Nature
News, doi:10.1038/nature.2016.19361 (2016), Retrieved 11 February 2016; B. P. Abbott, et al (LIGO Scientific
Collaboration and Virgo Collaboration), Observation of Gravitational Waves from a Binary Black Hole Merger, Physical Review
Letters 116 (6), 061102 (2016), Retrieved 11 February 2016.
37
Tempo Universal Coordenado, abreviadamente UTC, do inglês Universal Time Coordinated, também conhecido como tempo
civil, é o fuso horário de referência a partir do qual se calculam todas as outras zonas horárias do mundo.
“Z_2” — 2017/9/5 — 8:19 — page 671 — #691
direta de ondas gravitacionais, além de apresentar a primeira observação de uma fusão de binário de
buraco negro. Na Fig. 23.6 mostramos as tensões lineares nos dois sítios, H1 e L1 do LIGO, no topo
Figura 23.6 Evento de onda gravitacional observada pelos dois sítios da colaboração LIGO.
Figura 23.7 Amplitude da tensão linear das ondas gravitacionais projetada no sítio H1. Isto mostra a
largura total de banda das formas de onda, sem a filtragem utilizado para a figura anterior.
sítio H1,usando os resultados dos parâmetros da fonte, i.e., binário de buracos negros e sua fusão. 38
Em 15 de junho de 2016, os detectores da colaboração LIGO detectaram uma segunda explosão de
ondas gravitacionais vindas da fusão de buracos negros, sugerindo que este tipo de detecção em breve
se tornará rotina e parte de um novo tipo de estudo de astronomia. Desta vez, modelos indicam que
os buracos negros originais eram de 7, 5+2,3 +8,3
−2,3 M⊙ e 14, 2−3,7 M⊙ , fundindo para produzir um buraco
negro final de 20, 8+6,1
−1,7 M⊙ .
39
38
B. P. Abbott, et al (LIGO Scientific Collaboration and Virgo Collaboration), Observation of Gravitational Waves from a Binary
Black Hole Merger, Physical Review Letters 116 (6), 061102 (2016).
39
B. P. Abbott, et al (LIGO Scientific Collaboration and Virgo Collaboration), GW151226: Observation of Gravitational Waves
from a 22-Solar-Mass Binary Black Hole Coalescence, Physical Review Letters 116, 241103 (2016).
“Z_2” — 2017/9/5 — 8:19 — page 672 — #692
Problemas
23.1 Em uma região do espaço-tempo com um campo gravitacional fraco, existem coordenadas em que a
métrica assume a forma gµν = ηµν + hµν . Mostre que hµν não é um tensor sob uma transformação
geral de coordenadas. Mostra ainda que, em primeira ordem em hµν , temos gµν = η µν − hµν , em
que hµν = η µρ η νσ hρσ . Sugestão: Consulte o livro dos Profs. M. P. Hobson, G. P. Efstathiou and
A. N. Lasenby [38].
23.2 Para uma transformação de coordenadas geral e infinitesimal x′ µ = xµ + ξ ν (x), mostre que em
primeira ordem em ξ ν a transformação inversa é dada por
∂xµ
= δνµ − ∂ν ξ µ .
∂x′ ν
¯ = h . Então,
23.3 O traço reverso de hµν é definido por h̄µν = hµν − 12 ηµν h. Mostre que h̄ = −h e h̄µν µν
mostre que as equações de campo de Einstein linearizadas serão escrita como
h̄µν + ηµν ∂ρ ∂σ h̄ρσ − ∂ν ∂ρ h̄ρµ − ∂µ ∂ρ h̄ρν = −2κ Tµν .
Sugestão: Consulte o livro dos Profs. M. P. Hobson, G. P. Efstathiou and A. N. Lasenby [38].
23.4 Usando a demostração feitas para as condições adicionais (T 1) e (T 2)
η µν Aµν = Aµµ = 0 → sem traço (T 1)
µ
u Aµν = 0 → transverso (T 2) ,
mostre explicitamente que podemos escrever uma solução para encontrar Bν uν como
1 ρ
2 i kµ (Bν uν ) = Aµν uν − A uµ .
2 ρ
Mostre ainda que, se µ = 0 e ν = j, temos Bj = − i k0−1 (A0j − i kj B0 ), em que o valor de B0
poderá ser obtido da relação anterior. Sugestão: Consulte o livro do Prof. S. M. Carroll [19].
23.5 Consideremos uma onda gravitacional hµν (t, xj ) em um calibre arbitrário da teoria linearizada a ser
conhecida. Como podemos calcular a métrica de perturbação hTµνT (t, xj ) para esta onda no calibre
transverso sem traço? Sugestão: Consulte o livro dos Profs. C. W. Misner, K. S. Thorne e J. A. Whe-
eler [58].
23.6 Se gµν = ηµν + hµν , mostre explicitamente que os termos no tensor de Einstein que são de segunda
ordem em hµν são dados por
1 1 1
G(2) (2)
µν = Rµν − ηµν R(2) − hµν R(1) + ηµν hρσ Rρσ
(1)
,
2 2 2
Mostre que esta quantidade não é invariante sob a transformação de calibre dada em (23.5).
23.7 Mostre explicitamente que o tensor energia-momentum do campo gravitacional linearizado é dado por
(23.64). Mostre que este tensor é invariante sob uma transformação de calibre do tipo dado em (23.5).
23.8 Para o sistema de duas partículas considerado no texto, verifique que
0 0 0 0
2 2
8M GR ω 0 cos 2ωtr sin 2ωtr 0
[h̄µν
rad (ct,~x)] = 0 sen 2ωtr − cos 2ωtr
,
c4 r 0
0 0 0 0
“Z_2” — 2017/9/5 — 8:19 — page 673 — #693
e mostre que um observador no eixo z mede uma onda gravitacional polarizada circularmente de mão
direita na forma
8M GR2 ω 2 h µν i
(h̄Trad
T µν
) = ℜ (ex − i eµν
y ) e2 i ω(t−z/c)
,
c4 r
em que eµν µν
x e ex são as polarizações dos eixos x e y respectivamente.
23.9 A emissão na direção x colocada na forma transversa sem traço será à mão. Mostre explicitamente
que terminamos com a equação dada por
0 0 0 0
4M GR2 ω 2
0 0 0 0 .
[(h̄Trad
T µν
) (ct,~x)] = 0 0 − cos 2ωtr
c4 r 0
0 0 0 cos 2ωtr
Sugestão: Consulte o livro dos Profs. M. P. Hobson, G. P. Efstathiou and A. N. Lasenby [38].
23.10 Levando em conta que o sistema binário PSR 1913 + 16 tem duas massas diferentes, m1 e m2 ,
suas órbitas são elípticas, tendo uma excentricidade e, mostre explicitamente que com as correções
necessárias teremos a taxa
5 − 5
dP RG 192πG 3 P 3 73 2 37 4 − 7 1
=− 1+ e + e 1 − e2 2
m1 m2 (M )− 3 .
dt 5c5 2π 24 96
Leitura Recomendada
Para este capítulo, recomendo ao leitor, um estudo paralelo e detalhado dos seguintes livros,
Nestes livros, encontraremos deduções detalhadas sobre as ondas gravitacionais e suas técnicas de detecção,
além de um grande número de exercícios. Vale ressaltar que o texto dos Profs. C. W. Misner, K. S. Thorne
e J. A. Wheeler é frequentemente considerado a bíblia da relatividade geral por pesquisadores devido a sua
proeminência.
“Z_2” — 2017/9/5 — 8:19 — page 674 — #694
Bibliografia
[1] M. Abraham and R. Becker, Electricity and magnetism, Blackie, London, 1952.
[2] M. Abramowitz and I. A. Stegun, Handbook of mathematical functions, Dover Publications, Inc., New York,
1965.
[3] A. I. Alexéiev, Problemas de electrodinámica clásica, Editorial MIR, Moscú, 1980.
[4] G. Arfken and H. J. Weber, Mathematical methods for physicist, Academic Press Inc., New York, 1995.
[5] N. W. Ashcroft e N. D. Mermin, Física do estado sólido, Cengage Learning Ltda., São Paulo, 2011.
[6] A. O. Barut, Electrodynamics and classical theory of fields and particles, Dover Publications, Inc., New York,
1980.
[7] J. M. F. Bassalo, Eletrodinâmica clássica, Ed. Livraria da Física, São Paulo, 2007.
[8] H. Bateman, The mathematical analysis of electrical and optical wave-motion on the basis of Maxwell’s equa-
tions, Cambridge University Press, Cambridge, 1915.
[9] R. Becker, Eletromagnetic fields and interactions, Dover Publications Inc., New York, 1982.
[10] N. N. Bogoliubov and D. V. Shirkov, Introduction to the theory of quantized fields, John Wiley and Sons, Inc.,
New York, 1959.
[11] M. Born, Einstein’s theory of relativity, Dover Publications Inc., New York, 1962.
[12] M. Born and E. Wolf, Principles of optics - electromagnetic theory of propagation, interference and diffraction
of light, 6th ed., Pergamon Press, Oxford, 1980.
[13] L. Brillouin, Wave propagation and group velocity, Academic Press, New York, 1960.
[14] H. Brown, Physical relativity, Oxford University Press, New York, 2006.
[15] D. Baumann and L .MacAllister, Inflation and string theory, Cambridge University Press, Cambridge, 2015.
[16] K. G. Budden, Radio waves in the ionosphere, Cambridge University Press, Cambridge, 1961.
[17] , The propagation of radio waves, Cambridge University Press, New York, 1988, paperback corrected,
1988.
[18] E. Butkov, Mathematical physics, Addison-Wesley, Reading, Mass, 1968.
[19] S. M. Carroll, Space and Geometry - An introduction to general relativity, Addison-Wesley, San Francisco, CA,
2004.
[20] W. C. Chew, Waves and fields in inhomogeneous media, Van Nostrand Reinhold, New York, NY, 1990.
[21] P. D. B. Collins, A. D. Martin and E. J. Squires, Particle physics and cosmology, John Wiley and Sons, Inc.,
New York, 1989.
674
“Z_2” — 2017/9/5 — 8:19 — page 675 — #695
B IBLIOGRAFIA 675
[22] R. Courant and D. Hilbert, Methods of mathematical physics, Wiley-Interscience, New York, 1962, Volumes I
and II.
[23] O. Darrigol, Electrodynamics from Ampere to Einstein, Oxford University Press, Oxford, 2000.
[24] R. D’Inverno, Introducing Einstein’s relativity, Oxford University Press, Oxford, 1998.
[25] P. A. M. Dirac, The principles of quantum mechanics, Oxford University Press, London, 1958.
[26] A. Einstein, H. A. Lorentz, H. Minkowski, and H. Weyl, The principle of relativity, Dover Publications, Inc.,
New York, 1952, Collected Papers, with notes by A. Sommerfeld.
[27] R. P. Feynman, Statistical mechanics - A set of Lectures, Addison-Wesley Publishing Company, Inc., The Ad-
vanced Book Program, Redwood City, CA, 1972.
[28] , Feynman Lectures on Gravitation, Addison-Wesley, Reading, Mass, 1995.
[29] R. P. Feynman, R. B. Leighton, and M. Sands, The Feynman lectures on physics, Addison-Wesley, Reading,
Mass, 1963, 3 vols.
[30] J. Frenkel, Princípios de eletrodinâmica clássica, Ed. da USP, São Paulo, 1996.
[31] H. Goldstein, Classical mechanics, Addison-Wesley, Reading, Mass, 1980.
[32] H. Goldstein, C. P. Poole, and J. L. Safko, Classical mechanics, 3rd ed., Addison-Wesley, Reading, Mass, 2002.
[33] G. Green, An essay on the application of mathematical analysis to the theories of electricity and magnetism, T.
Wheelhouse, Nottingham, England, 1828.
[34] W. Greiner, Classical electrodynamics, Springer-Verlag Inc., New York, 1998.
[35] S. W. Hawking and G. F. R. Ellis, The large scale structure of space-time, Cambridge University Press, Cam-
bridge, 1975.
[36] M. A. Heald and J. B. Marion, Classical electrodynamics radiation, 3rd ed., Saunders College Publishing, New
York, 1995.
[37] O. Heaviside, Electromagnetic theory, Chelsea Publishing Company, New York, 3rd ed., 1971, volume III.
[38] M. P. Hobson, G. P. Efstathiou and A. N. Lasenby, General Relativity - An introduction for physicists, Cambridge
University Press, Cambridge, 2006, 4th printing with corrections, 2011.
[39] K. Huang, Statistical mechanics, 2nd ed., John Wiley and Sons, Inc., New York, 1987.
[40] P. G. Huray, Maxwell’s equations, John Wiley and Sons, Inc., New Jersey, 2010.
[41] J. D. Jackson, Classical electrodynamics, 2nd ed., John Wiley and Sons, Inc., New York, 1975.
[42] , Classical electrodynamics, 3rd ed., John Wiley and Sons, Inc., New York, 1999.
[43] J. H. Jeans, Mathematical theory of electricity and magnetism, 5th ed., Cambridge University Press, Cambridge,
1948.
[44] H. Jeffreys and B. S. Jeffreys, Methods of mathematical physics, 3rd ed., Cambridge University Press, Cam-
bridge, 1956.
[45] O. D. Jefimenko, Electricity and magnetism: an introduction to the theory of electric and magnetic fields,
Appleton-Century-Crofts, New-York, 1966. 2nd ed.: Electret Scientific, Star City, 1989.
[46] C. Kittel, Introduction to solid state physics, 8th ed., John Wiley and Sons, Inc., New York, 2005.
[47] E. W. Kolb and M. S. Turner, The early universe, AddisonŰWesley, Redwood City, CA, 1990.
[48] A. S. Kompaneyets, A course of theoretical physics, vol. 1 and 2, Mir Publishers, Moscow, USSR, 1978.
[49] L. D. Landau and E. M. Lifshitz, The classical theory of fields, 4th revised english ed., Pergamon Press, Oxford,
1993.
[50] , Mechanics, 3rd revised english ed., Pergamon Press, Oxford, 1993.
“Z_2” — 2017/9/5 — 8:19 — page 676 — #696
676 B IBLIOGRAFIA
[51] L. D. Landau, E. M. Lifshitz, and L. P. Pitaevskiı̌, Electrodynamics of continuous media, 2nd revised ed., Perga-
mon Press, Oxford, 1984.
[52] J. Leite Lopes, Fundamentos da eletrodinâmica clássica, Ed. Universidade do Brasil, Rio de Janeiro, 1960.
[53] A. R. Liddle and D. H. Lyth, Cosmological inflation and large-scale structure, Cambridge University Press,
Cambridge, 2000.
[54] K. D. Machado, Teoria do eletromagnetismo, Editora UEPG, Ponta Grossa, Paraná, 2007, 3 Volumes.
[55] J. R. P. Mahon, Mecânica Quântica - desenvolvimento contemporâneo com aplicações, GEN/LTC Editora, Rio
de Janeiro, RJ, 2011.
[56] J. C. Maxwell, Treatise on electricity and magnetism, reprint by Dover Publications, Inc., New York, 1954, 3rd
ed. (1873) 2 vols.
[57] A. Messiah, Quantum mechanics, John Wiley and Sons, Inc., New York, 1970, Volumes I and II.
[58] C. W. Misner, K. S. Thorne and J. A. Wheeler, Gravitation, W. H. Freeman and Company, New York, NY, 1973.
[59] K. Moriyasu, An elementary primer for gauge theory, World Scientific Publishing Co., Singapore, 1983.
[60] P. M. Morse and H. Feshbach, Methods of theoretical physics, McGraw-Hill Book Co., New York, 1953, Volu-
mes I and II.
[61] H. Moysés Nussenzveig, Curso de física básica, Ed. Edgard Blücher Ltda., São Paulo, SP, 1997, Volumes 3 e 4.
[62] V. Mukhanov, Physical foundations of cosmology, Cambridge University Press, Cambridge, UK, 2005.
[63] H. C. Ohanian, Classical electrodynamics, Allyn and Bacon, Inc, Boston, Ma. 1988.
[64] W. K. H. Panofsky and M. Phillips, Classical electricity and magnetism, Addison-Wesley, Reading, Mass, 1962.
[65] W. Pauli, Theory of relativity, Pergamon Press, London, 1958, (also Published by Dover, New York, 1981).
[66] J. R. Reitz, F. J. Milford and R. W. Christy, Foundations of electromagnetic theory, Addison-Wesley, Reading,
MA, 1980.
[67] F. Rohrlich, Classical charged particles, Addison-Wesley, Reading, MA, 1965.
[68] V. Rojansky, Electromagnetic fields and waves, Dover Publications, Inc., New York, 1979.
[69] L. Ryder, Introduction to general relativity, Cambridge University Press, Cambridge, UK, 2009.
[70] B. Schutz, A first Course in General Relativity, 2nd Edition, Cambridge University Press, Cambridge, 2009.
[71] M. Schwartz, Principles of electrodynamics, Dover Publications, Inc., New York, 1987.
[72] J. Schwinger, L. L. DeRaad Jr., K. A. Milton and W.-Y. Tsai, Classical electrodynamics, Perseus Books, Reading,
MA, 1998.
[73] E. Segrè, Nuclei and particles, W. A. Benjamin, New York, 1965.
[74] A. Sommerfeld, Partial differential equations, Academic Press, New York, 1949.
[75] , Electrodynamics, Academic Press, New York, 1952.
[76] , Optics, Academic Press, New York, 1954.
[77] J. A. Stratton, Electromagnetic theory, McGraw-Hill, New York, 1941.
[78] I. E. Tamm, Fundamentos de la teoría de la electricidad, Editorial MIR, Moscú, 1979.
[79] S. Weinberg, Gravitation and cosmology: principles and applications of the general theory of relativity, John
Wiley and Sons, Inc., New York, 1972.
[80] , Cosmology, Oxford University Press, Oxford, 2008.
[81] E. T. Whittaker, History of the theories of aether and electricity, Nelson, London, 1953.
“Z_2” — 2017/9/5 — 8:19 — page 677 — #697
B IBLIOGRAFIA 677
[82] E. T. Whittaker and G. N. Watson, A course in modern analysis, 4th ed., Cambridge University Press, Cambridge,
1950.
[83] A. Zangwill, Modern electrodynamics, Cambridge University Press, Cambridge, 2012.
[84] J. M. Ziman, Principles of the theory of solids, Cambridge University Press, Cambridge, 1964.
[85] , Elements of advanced quantum theory, Cambridge University Press, Cambridge, 1969.
“Z_2” — 2017/9/5 — 8:19 — page 678 — #698
Índice
678
“Z_2” — 2017/9/5 — 8:19 — page 679 — #699
Í NDICE 679
680 Í NDICE
Í NDICE 681
dinâmica, 8 – clássica, 1
dipolar, 152 – de Ampère, 394
dipolo – de Maxwell-Lorentz, 394
– de Hertz, 388 – quântica, 79
– magnético, 175 eletromagnetismo, 10, 15
Dirac, P. A. M., 10, 31, 58, 79, 88, 163, 165, 185, 217, – clássico, 1
220, 372, 459, 481 – de Maxwell, 640
Dirichlet, J. P. G., 99, 124, 127, 146, 335, 352 elétron livre, 451
disco de Airy, 338 elevador de Einstein, 12
dispersão elipticamente polarizada, 230
– anômala, 244 energia
– normal, 244 – cinética, 44
dispersão anômala, 257 – de Planck, 589
dissipação de energia, 244 – de repouso, 37
distância – do campo magnético, 196
– comóvel, 565 – do vácuo, 571
– de diâmetro angular, 566 – vacuum, 571
– de Hubble, 596 – livre de Gibbs, 421
– de luminosidade, 565 – potencial, 42
– de penetração, 249, 251, 347 – – eletrostática, 101
– luminosa, 565 – total, 171
– métrica, 565 Eötvös, R. von, 484
– própria, 482, 565 equação
Doppler, C., 17, 36, 414, 564, 566 – BMT, 164
Drever, R., 670 – da geodésica, 501
drift, 54 – de Bardeen, 606
Drude, P., 245 – de Bargmann-Michel-Telegdi, 164
– de Bessel, 113, 131, 305, 360, 366
e-folding, 250, 596 – – de segunda ordem, 132, 305
Eddington, A. S., 484, 544, 614 – de campo, 523, 524, 644
efeito – – da relatividade geral, 13, 516
– Aharonov-Bohm, 114, 215 – – de Einstein, 13, 504, 516, 523, 524, 528, 561, 570,
– de Schwinger, 636 644
– Doppler, 17, 36, 414, 566 – – gravitacional, 13, 516
– fotoelétrico, 478 – – inomogênea, 62
– Hall, 117 – de Clausius-Mossotti, 420
– – quântico, 118 – de continuidade, 3, 511, 514
– – quântico fracionário, 118 – de Dirac, 79, 163, 165
– Meissner, 210 – de Einstein, 13, 500, 504, 509, 516, 523, 524, 528, 561,
– Meissner-Ochsenfeld, 210 570, 594, 603, 605, 627, 644
– Mössbauer, 21 – – no vácuo, 627
– skin, 250 – – perturbada, 601, 606
– Zeeman, 192 – de Einstein-Maxwell, 623, 625
Einstein, A., 10, 13, 15, 19, 23, 27, 33, 53, 71, 86, 220, – de Euler, 514
330, 422, 481, 482, 484, 485, 500, 504, 509, 516, 520, – de Euler-Lagrange, 43, 61, 80, 537, 593
521, 523, 524, 528, 532, 544, 561, 570, 572, 585, 594, – de Fresnel, 237, 250, 298
601, 603, 605, 606, 612, 617, 622, 625, 627, 640, 644, – de Friedmann, 555, 561, 570, 575, 589
645, 657 – de Friedmann-Lemaître, 561, 570
electrostriction, 173 – de Gauss, 111
elemento de linha, 186, 533 – de Heaviside-Feynman, 209
– de Friedmann, 603 – de Heisenberg, 164
– de Friedmann-Robertson-Walker, 558 – de Helmholtz, 202, 227, 304, 308, 333, 335, 365, 396
– de Schwarzschild, 535 – – inomogênea, 202
eletrodinâmica – de Jefimenko, 206, 386
“Z_2” — 2017/9/5 — 8:19 — page 682 — #702
682 Í NDICE
Í NDICE 683
684 Í NDICE
Í NDICE 685
686 Í NDICE
Í NDICE 687
688 Í NDICE
Í NDICE 689
690 Í NDICE
Í NDICE 691
692 Í NDICE