Artigos

3: Álgebra de Pauli e Eletrodinâmica - Matemática


  • 3.1: Transformação de Lorentz e força de Lorentz
    A principal importância da álgebra de Pauli é nos fornecer um trampolim para a teoria dos espaços spinor. No entanto, é útil parar neste ponto para mostrar que o formalismo já desenvolvido nos fornece uma estrutura eficiente para aspectos limitados, mas importantes da eletrodanâmica clássica (CED).
  • 3.2: O Campo Maxwell Livre

Eletrodinâmica quântica

Na física de partículas, eletrodinâmica quântica (QED) é a teoria quântica de campo relativística da eletrodinâmica. Em essência, ele descreve como a luz e a matéria interagem e é a primeira teoria em que um acordo completo entre a mecânica quântica e a relatividade especial é alcançado. O QED descreve matematicamente todos os fenômenos que envolvem partículas eletricamente carregadas interagindo por meio da troca de fótons e representa a contraparte quântica do eletromagnetismo clássico, dando uma descrição completa da interação da matéria e da luz.

Em termos técnicos, QED pode ser descrito como uma teoria de perturbação do vácuo quântico eletromagnético. Richard Feynman chamou de "a joia da física" por suas previsões extremamente precisas de quantidades como o momento magnético anômalo do elétron e a mudança de Lamb dos níveis de energia do hidrogênio. [1]: Ch1


3: Pauli Álgebra e Eletrodinâmica - Matemática

Introduzimos algumas fórmulas-chave da relatividade especial e as aplicamos ao movimento de uma partícula pontual carregada e sem spin de massa unitária, sujeita à força de Lorentz devido a um campo eletromagnético externo.

Pauli Álgebra

Um elemento da álgebra de Pauli consiste em um escalar complexo, digamos, e um vetor complexo tridimensional, denotado, que tem, portanto, oito dimensões reais. Na verdade, esta é uma generalização da álgebra de quatérnio, mas com componentes complexos em vez de reais. Neste artigo, chamamos esses elementos de & # 8220spinors. & # 8221

Um produto de dois espinores é um espinor definido por

onde e são os produtos pontuais e cruzados, respectivamente. Observe que essa multiplicação é associativa, o que significa que não precisamos de parênteses ao multiplicar três ou mais espinores. Mas a multiplicação não é comutativa (o resultado depende da ordem dos fatores).

Existem duas operações unárias importantes (argumento único) em espinores: a primeira é chamada de reflexão (denotada), que muda o sinal da parte do vetor, ou seja, a segunda pega o conjugado complexo de e de cada componente dela é denotado. Finalmente, apenas por conveniência, vamos denotar a combinação de ambos, ou seja, observe que

que são bastante fáceis de verificar.

O correspondente Mathematica as rotinas se parecem e funcionam assim.

De agora em diante, consideramos um vetor tridimensional um caso especial de um spinor, o que significa que é uma abreviação de Podemos facilmente computar várias funções de espinores (e de vetores tridimensionais, como um caso especial). Assim, por exemplo, assumindo que é um vetor tridimensional com componentes reais, encontramos

onde é o comprimento de e é um vetor unitário na mesma direção.

Da mesma forma, para um vetor tridimensional com componentes imaginários puros (que expressamos na forma de manter os elementos de real), o mesmo tipo de expansão produz

novamente, onde é o comprimento de e é um vetor unitário na mesma direção.

Isso pode ser facilmente estendido para um argumento de vetor complexo, como segue.

Relatividade especial

A ideia básica da teoria de Einstein & # 8217s é unir espaço e tempo em uma única entidade de espaço-tempo, cujos & # 8220points & # 8221 (ou eventos) podem então ser representados por real espinores de tipo. A separação entre quaisquer dois desses eventos constitui um assim chamado vetor 4 que, quando multiplicado (no sentido de spinor) por sua própria reflexão, produz um escalar puro. É agora postulado que esta quantidade deve ser invariante (tendo o mesmo valor) em todos os sistemas de coordenadas inerciais (ou seja, aqueles que diferem uns dos outros por uma rotação fixa e / ou um impulso & # 8212a movimento em velocidade constante). Para simplificar, nossa escolha de unidades define a velocidade da luz (que deve ser a mesma em todos os sistemas inerciais) igual a 1.

A questão é: como transformamos 4 vetores de um referencial inercial para outro, mantendo esta invariância? A resposta é fornecida por

onde e representam um vetor 4 no antigo e no novo quadro de referência, respectivamente, e é um spinor tal que. É óbvio que permanece real sempre que é real, e que

onde (o invariante escalar de). Isso mostra que tem o mesmo valor em todos os referenciais inerciais. Exigir que a reflexão seja uma operação independente de quadro (o que significa que para cada vetor de 4) leva a

A partir disso, podemos ver que se transforma de forma diferente de, sendo um exemplo de um quadridimensional covetor (um vetor, em nossa notação). Outro exemplo importante de um -vetor é o operador, onde representa o gradiente tridimensional usual (espacial) (a coleção de, e derivadas parciais).

Pode-se mostrar que se e somente se, onde está um vetor & # 8220pure & # 8221 (ou seja, tridimensional, mas com valor potencialmente complexo). Esta é uma forma totalmente geral, mas bastante inconveniente, de felizmente, pode-se provar que qualquer uma pode ser expressa como um produto de uma rotação tridimensional comum e um impulso, onde e são vetores de valor real. Para ver que resulta em uma rotação normal da parte do vetor de (onde a magnitude de especifica o ângulo e a direção de define o eixo de rotação), considere

onde é a decomposição de em componentes paralelos e perpendiculares a, respectivamente. Observe que comuta com (e qualquer função disso), conseqüentemente, ele permanece inalterado por essa transformação. Por outro lado, e anticomutação (ou seja), implicando

e, conseqüentemente, o restante de (8). Pode-se então ver que esta transformação deixa a parte escalar de um vetor 4 intacta, e gira a parte do vetor usando e como eixo e ângulo de rotação (do quadro antigo em relação ao novo), respectivamente.

Aqui, pode ser substituído por, onde e representam a direção da unidade e a magnitude de um vetor tridimensional (uma velocidade do quadro antigo em relação ao novo), respectivamente. Isso leva ao seguinte resultado simplificado (e fisicamente mais significativo) de tal aumento, aplicado a:

Campos electromagnéticos

Um campo de 4 vetores de importância central é o potencial eletromagnético, onde e cada componente de são funções de valor real de uma localização do espaço-tempo (ou seja, de,, e). Agora vem um ponto importante: dentro da estrutura atual, é fisicamente sem sentido multiplicar dois vetores de 4 (não saberíamos como transformar tal produto de uma estrutura inercial para outra), mas é possível multiplicar um vetor por um vetor de 4, criando o que chamamos de vetor misto. Portanto, é bastante legítimo fazer

criando um vetor misto, que tem sua própria maneira de transformar (mostrada em breve).

Para interpretar fisicamente o lado direito de (12), primeiro impomos a chamada condição de Lorenz (muitas vezes atribuída erroneamente ao mais famoso Lorentz) de (provamos brevemente que esta condição é invariante de quadro), e nos identificamos com, onde e são os campos elétricos e magnéticos resultantes (com valor real), respectivamente.

Agora pode-se mostrar com bastante facilidade que simplesmente girará os dois campos. Por outro lado, um impulso resulta em

já que a transformação de um vetor misto é feita por. Em ambos os casos (rotação e aumento), a parte escalar permanece igual a zero, comprovando a invariância da condição de Lorenz.

Ao contrário dos 4 vetores, os vetores mistos podem ser multiplicados, gerando um novo vetor misto (em termos de suas propriedades de transformação). Assim, por exemplo,

nos diz que e são campos escalares invariantes.

Da mesma forma, a multiplicação de um vetor 4 por um vetor misto retorna um vetor 4, por exemplo,

Desta vez, o resultado deve ser igual à densidade de carga / corrente (outro 4 vetor básico da teoria), o que resulta em uma formulação compacta de álgebra de Dirac das equações usuais de Maxwell. Como exemplo, o programa a seguir calcula o campo eletromagnético de uma partícula massiva semelhante a um ponto de uma carga unitária, movendo-se a uma velocidade uniforme ao longo do eixo e também verifica se o resultado satisfaz as equações de Maxwell & # 8217s.

Dinâmica de uma partícula carregada semelhante a um ponto

Escolhemos unidades nas quais a massa de repouso e a carga da partícula são iguais a 1. Sua localização instantânea é denotada, onde os três componentes de são funções de. Para tornar as equações subsequentes independentes do quadro (tendo a mesma forma em todos os quadros inerciais), agora precisamos introduzir a partícula & # 8217s, o chamado tempo adequado por

Já sabemos que as transformadas como um vetor 4, portanto e, conseqüentemente, são invariantes relativisticamente (o ponto acima implica em diferenciação em relação a). O tempo adequado é então calculado pela integral correspondente, a saber

que, sendo uma & # 8220sum & # 8221 de quantidades invariantes, também é um escalar invariante. Isso implica que

transforma-se como um vetor 4 (nós o chamamos de momento 4 da partícula em movimento).

O movimento da partícula carregada em um determinado campo eletromagnético pode agora ser estabelecido resolvendo

onde o lado direito é a chamada força de Lorentz, e & # 8220 & # 8221 pega a parte real de seu argumento (também um vetor 4). Observe que & # 8220 & # 8221 aplicado a um vetor 4 permanece um vetor 4 (uma vez que o conjugado complexo de um vetor 4 se transforma em um vetor 4, como se pode verificar prontamente).

Com base em (18), o lado direito de (19) é igual

Para uma partícula com carga unitária negativa, o sinal desse vetor 4 seria invertido.

Uma maneira de resolver a equação de 4 vetores resultante é expandir o lado esquerdo de (19):

que tem que ser igual a (20). Cancelando o fator escalar de, obtemos

Finalmente, a primeira (parte escalar) dessas quatro equações pode ser obtida tomando o produto escalar das três equações restantes (a parte do vetor) e, portanto, é redundante. Tudo o que precisamos resolver no final é

ou, de forma equivalente (resolvendo para),

cuja exatidão pode ser facilmente verificada substituindo-o no lado esquerdo de (23) e obtendo o lado direito. Essas equações podem, em geral, ser resolvidas apenas numericamente. O resultado será uma função de três componentes de um tempo dependente do quadro (o tempo adequado foi usado apenas como uma ferramenta intermediária para garantir a concordância entre os quadros de referência inerciais, nossa solução permanece correta em qualquer outro quadro, após a transformação correspondente). O programa a seguir encontra o movimento de uma partícula carregada negativamente (escolhida porque uma força atrativa torna o caminho resultante de alguma forma mais interessante, em comparação com a repulsão de mesma carga) no campo da seção anterior.

A partícula de massa unitária originalmente estacionária foi & # 8220capturada & # 8221 pela partícula massiva em movimento (que é considerada tão pesada que seu próprio movimento permanece inalterado) e continuará orbitando (enquanto segue seu movimento uniforme). É importante perceber que essa formulação do problema ignorou o fato de que uma partícula em movimento gera (e irradia) um campo eletromagnético próprio, que modificaria ainda mais seu movimento. Mais importante, também sabemos que, em nível atômico, o mundo é governado pela mecânica quântica, resultando em uma descrição totalmente diferente de uma partícula em órbita. Esta é a razão pela qual a última solução é apenas de interesse matemático. Sob uma ampla gama de condições iniciais, a partícula leve seria atraída para colidir com a pesada.

Movimento em um campo eletromagnético constante

As coisas se tornam mais fáceis quando e são campos constantes (no espaço e no tempo). Pode-se então expressar como, onde é o valor inicial da partícula & # 8217s 4-momentum, e é um spinor análogo a isso (em vez de transformar 4-vetores entre quadros inerciais) avança para sua localização atual. Desta vez, achamos mais conveniente fazer as funções e do tempo adequado. Além disso, não se deve esquecer de atender à condição, que é mantida automaticamente pelo em todos os momentos futuros.

Expandir o lado direito de (19) produz

Isso deve ser igual ao lado esquerdo de (19), a saber

tendo a solução óbvia

uma função de um vetor misto se transforma em um vetor misto. Depois de computar e, conseqüentemente, tudo que precisamos fazer é integrar esta última expressão em termos de para obter uma solução para. Segue um exemplo simples.

Neste exemplo, conseguimos obter uma solução analítica explícita.


A descrição mais comum do campo eletromagnético usa dois campos vetoriais tridimensionais chamados de campo elétrico e campo magnético. Cada um desses campos vetoriais tem um valor definido em cada ponto do espaço e do tempo e, portanto, são frequentemente considerados como funções das coordenadas do espaço e do tempo. Como tal, muitas vezes são escritos como E(x, y, z, t) (campo elétrico) e B(x, y, z, t) (campo magnético).

Se apenas o campo elétrico (E) é diferente de zero e é constante no tempo, o campo é considerado um campo eletrostático. Da mesma forma, se apenas o campo magnético (B) é diferente de zero e é constante no tempo, o campo é chamado de campo magnetostático. No entanto, se o campo elétrico ou magnético tiver uma dependência do tempo, os dois campos devem ser considerados juntos como um campo eletromagnético acoplado usando as equações de Maxwell.

As equações de Maxwell na abordagem do campo vetorial Editar

O comportamento dos campos elétricos e magnéticos, seja em casos de eletrostática, magnetostática ou eletrodinâmica (campos eletromagnéticos), é regido pelas equações de Maxwell:

Equações de Maxwell (campos de vetor)
∇ ⋅ E = ρ ε 0 < displaystyle nabla cdot mathbf = < frac < rho> < varepsilon _ <0> >>> Lei de gauss
∇ ⋅ B = 0 < displaystyle nabla cdot mathbf =0> Lei de Gauss para o magnetismo
∇ × E = - ∂ B ∂ t < displaystyle nabla times mathbf = - < frac < partial mathbf > < partial t >>> Lei de faraday
∇ × B = μ 0 J + μ 0 ε 0 ∂ E ∂ t < displaystyle nabla times mathbf = mu _ <0> mathbf + mu _ <0> varepsilon _ <0> < frac < partial mathbf > < partial t >>> Lei de Ampère-Maxwell

Onde ρ é a densidade de carga, que pode (e muitas vezes depende) depender do tempo e da posição, ε0 é a constante elétrica, µ0 é a constante magnética, e J é a corrente por unidade de área, também em função do tempo e da posição. As equações assumem esta forma com o Sistema Internacional de Quantidades.

Ao lidar apenas com materiais lineares isotrópicos não dispersivos, as equações de Maxwell são freqüentemente modificadas para ignorar as cargas ligadas, substituindo a permeabilidade e a permissividade do espaço livre pela permeabilidade e permissividade do material linear em questão. Para alguns materiais que têm respostas mais complexas a campos eletromagnéticos, essas propriedades podem ser representadas por tensores, com dependência do tempo relacionada à capacidade do material de responder a mudanças de campo rápidas (dispersão (óptica), relações Green-Kubo) e, possivelmente, também dependências de campo que representam respostas de material não linear e / ou não local a campos de grande amplitude (óptica não linear).

Muitas vezes, no uso e cálculo de campos elétricos e magnéticos, a abordagem usada primeiro calcula um potencial associado: o potencial elétrico, φ, para o campo elétrico e o potencial do vetor magnético, UMA, para o campo magnético. O potencial elétrico é um campo escalar, enquanto o potencial magnético é um campo vetorial. É por isso que às vezes o potencial elétrico é denominado potencial escalar e o potencial magnético é denominado potencial vetorial. Esses potenciais podem ser usados ​​para encontrar seus campos associados da seguinte forma:

Equações de Maxwell na formulação potencial Editar

Essas relações podem ser substituídas nas equações de Maxwell para expressar as últimas em termos dos potenciais. A lei de Faraday e a lei de Gauss para o magnetismo reduzem-se a identidades (por exemplo, no caso da Lei de Gauss para o magnetismo, 0 = 0). As outras duas equações de Maxwell são menos simples.

Essas equações juntas são tão poderosas e completas quanto as equações de Maxwell. Além disso, o problema foi reduzido um pouco, pois os campos elétrico e magnético juntos tinham seis componentes para resolver. [1] Na formulação do potencial, existem apenas quatro componentes: o potencial elétrico e os três componentes do potencial vetorial. No entanto, as equações são mais complicadas do que as equações de Maxwell usando os campos elétrico e magnético.

Medir liberdade Editar

Essas equações podem ser simplificadas aproveitando-se do fato de que os campos elétrico e magnético são quantidades fisicamente significativas que podem ser medidas, mas os potenciais não. Há liberdade para restringir a forma dos potenciais, desde que isso não afete os campos elétricos e magnéticos resultantes, chamada liberdade de medida. Especificamente para essas equações, para qualquer escolha de uma função escalar duas vezes diferenciável de posição e tempo λ, E se (φ, UMA) é uma solução para um determinado sistema, então também é outro potencial (φ′, UMA') dado por:

Essa liberdade pode ser usada para simplificar a formulação potencial. Qualquer uma dessas funções escalares é normalmente escolhida: o medidor de Coulomb e o medidor de Lorenz.

Edição de calibre Coulomb

Esta escolha de função resulta na seguinte formulação das equações de Maxwell:

Vários recursos sobre as equações de Maxwell no calibre de Coulomb são os seguintes. Em primeiro lugar, resolver o potencial elétrico é muito fácil, pois a equação é uma versão da equação de Poisson. Em segundo lugar, resolver o potencial do vetor magnético é particularmente difícil. Essa é a grande desvantagem desse medidor. A terceira coisa a se notar, e algo que não é imediatamente óbvio, é que o potencial elétrico muda instantaneamente em todos os lugares em resposta a uma mudança nas condições em uma localidade.

Por exemplo, se uma carga é movida em Nova York às 13h, horário local, um observador hipotético na Austrália que pudesse medir o potencial elétrico diretamente mediria uma mudança no potencial às 13h, horário de Nova York. Isso aparentemente viola a causalidade na relatividade especial, ou seja, a impossibilidade de informações, sinais ou qualquer coisa viajando mais rápido do que a velocidade da luz. A solução para este aparente problema reside no fato de que, como afirmado anteriormente, nenhum observador pode medir os potenciais que medem os campos elétricos e magnéticos. Então, a combinação de φ e ∂UMA/∂t usado na determinação do campo elétrico restaura o limite de velocidade imposto pela relatividade especial para o campo elétrico, tornando todas as quantidades observáveis ​​consistentes com a relatividade.

Edição da condição do medidor Lorenz

Um medidor frequentemente usado é a condição do medidor Lorenz. Neste, a função escalar λ é escolhido de tal forma que

significa que λ deve satisfazer a equação

O medidor de Lorenz resulta na seguinte forma das equações de Maxwell:

O operador ◻ 2 < displaystyle Box ^ <2>> é chamado de d'Alembertiano (alguns autores denotam isso apenas pelo quadrado ◻ < displaystyle Box>). Essas equações são versões não homogêneas da equação da onda, com os termos do lado direito da equação servindo como as funções de origem da onda. Como acontece com qualquer equação de onda, essas equações levam a dois tipos de solução: potenciais avançados (que estão relacionados com a configuração das fontes em pontos futuros no tempo) e potenciais retardados (que estão relacionados com as configurações passadas das fontes). Os primeiros são geralmente desconsiderados quando o campo é analisado a partir de uma perspectiva de causalidade.

Como apontado acima, o medidor de Lorenz não é mais válido do que qualquer outro medidor, uma vez que os potenciais não podem ser medidos diretamente, no entanto, o medidor de Lorenz tem a vantagem de as equações serem invariantes de Lorentz.

Extensão para eletrodinâmica quântica Editar

A quantização canônica dos campos eletromagnéticos prossegue elevando os potenciais escalares e vetoriais φ(x), UMA(x), de campos para operadores de campo. Substituindo 1 /c 2 = ε0µ0 nas equações de calibre de Lorenz anteriores dá:

Aqui, J e ρ são a densidade de corrente e carga do campo da matéria. Se o campo da matéria é considerado de modo a descrever a interação dos campos eletromagnéticos com o elétron de Dirac dado pelo campo espinor de Dirac de quatro componentes ψ, as densidades de corrente e carga têm a forma: [2]

Onde α são as três primeiras matrizes de Dirac. Usando isso, podemos reescrever as equações de Maxwell como:

que é a forma usada na eletrodinâmica quântica.

Analogamente à formulação do tensor, dois objetos, um para o campo e outro para a corrente, são introduzidos. Em álgebra geométrica (GA), eles são multivetores. O multivetor de campo, conhecido como vetor de Riemann-Silberstein, é

e o multivetor atual é

As equações de Maxwell são reduzidas a uma única equação [3]

Em três dimensões, a derivada tem uma estrutura especial que permite a introdução de um produto vetorial:

da qual é facilmente visto que a lei de Gauss é a parte escalar, a lei de Ampère-Maxwell é a parte vetorial, a lei de Faraday é a parte pseudovectora e a lei de Gauss para o magnetismo é a parte pseudoescalar da equação. Depois de expandir e reorganizar, isso pode ser escrito como

O Riemann – Silberstein torna-se um bivetor

e a carga e a densidade da corrente tornam-se um vetor

As equações de Maxwell reduzem-se à equação única

Edição do formulário do campo 2

Em espaço livre, onde ε = ε0 e µ = µ0 são constantes em todos os lugares, as equações de Maxwell simplificam consideravelmente, uma vez que a linguagem da geometria diferencial e das formas diferenciais é usada. A seguir, unidades cgs-Gaussianas, e não unidades SI, são usadas. (Para converter para SI, veja aqui.) Os campos elétrico e magnético são agora descritos em conjunto por uma forma 2 F em um coletor de espaço-tempo quadridimensional. O tensor de Faraday F μ ν < displaystyle F _ < mu nu >> (tensor eletromagnético) pode ser escrito como uma forma 2 no espaço de Minkowski com assinatura métrica (- + + +) como

As equações livres de fonte podem ser escritas pela ação da derivada externa nesta forma 2. Mas para as equações com termos de origem (lei de Gauss e a equação de Ampère-Maxwell), o dual de Hodge dessa forma 2 é necessário. O operador estrela de Hodge leva um p-forma para um ( np ) -form, onde n é o número de dimensões. Aqui, ele assume a forma 2 (F) e dá outra forma 2 (em quatro dimensões, np = 4 - 2 = 2). Para os vetores cotangentes básicos, o dual de Hodge é dado como (ver operador estrela de Hodge § Quatro dimensões)

e assim por diante. Usando essas relações, o dual da forma 2 de Faraday é o tensor de Maxwell,

Edição atual de 3 formas, dual atual 1 forma

Aqui, o formulário de 3 J é chamado de forma de corrente elétrica ou 3 formas atuais:

com a forma 1 dual correspondente:

As equações de Maxwell então se reduzem à identidade de Bianchi e à equação de origem, respectivamente: [4]

onde d denota a derivada externa - um operador diferencial independente de coordenada e métrica natural agindo sobre as formas, e o operador estrela de Hodge (dual) ⋆ < displaystyle < star >> é uma transformação linear do espaço de 2 formas para o espaço de (4 - 2) -formas definidas pela métrica no espaço de Minkowski (em quatro dimensões, mesmo por qualquer métrica conforme a esta métrica). Os campos estão em unidades naturais onde 1 / 4πε0 = 1 .

Como d 2 = 0, a forma 3 J satisfaz a conservação da corrente (equação de continuidade):

A forma tridimensional atual pode ser integrada em uma região de espaço-tempo tridimensional. A interpretação física desta integral é a carga nessa região se for semelhante a um espaço, ou a quantidade de carga que flui através de uma superfície em um certo período de tempo se essa região for uma superfície semelhante a um intervalo de tempo. Como a derivada externa é definida em qualquer variedade, a versão da forma diferencial da identidade Bianchi faz sentido para qualquer variedade 4-dimensional, enquanto a equação de origem é definida se a variedade for orientada e tiver uma métrica de Lorentz. Em particular, a versão da forma diferencial das equações de Maxwell é uma formulação conveniente e intuitiva das equações de Maxwell na relatividade geral.

Influência macroscópica linear da matéria Editar

Em uma teoria linear macroscópica, a influência da matéria no campo eletromagnético é descrita por meio de uma transformação linear mais geral no espaço de 2 formas. Nós chamamos

a transformação constitutiva. O papel dessa transformação é comparável à transformação da dualidade de Hodge. As equações de Maxwell na presença de matéria tornam-se então:

onde a forma atual de 3 J ainda satisfaz a equação de continuidade dJ = 0 .

Quando os campos são expressos como combinações lineares (de produtos externos) de formas básicas θ p ,

a relação constitutiva assume a forma

onde as funções de coeficiente de campo são antisimétricas nos índices e os coeficientes constitutivos são antisimétricos nos pares correspondentes. Em particular, a transformação de dualidade de Hodge que leva às equações de vácuo discutidas acima é obtida tomando

que até a escala é o único tensor invariável desse tipo que pode ser definido com a métrica.

Nesta formulação, o eletromagnetismo generaliza imediatamente para qualquer variedade orientada em 4 dimensões ou com pequenas adaptações para qualquer variedade.

Edição de assinatura métrica alternativa

A curvatura de Faraday 2-forma torna-se

e o tensor de Maxwell torna-se

A forma atual de 3 J é

e a forma 1 dual correspondente é

A norma atual agora é positiva e igual

Formulação tradicional Editar

Matéria e energia geram curvatura do espaço-tempo. Este é o assunto da relatividade geral. A curvatura do espaço-tempo afeta a eletrodinâmica. Um campo eletromagnético com energia e momento também gera curvatura no espaço-tempo. As equações de Maxwell no espaço-tempo curvo podem ser obtidas substituindo as derivadas nas equações no espaço-tempo plano por derivadas covariantes. (Se esta é a generalização apropriada requer investigação separada.) As equações com fonte e sem fonte tornam-se (unidades cgs-Gaussianas):

é um símbolo de Christoffel que caracteriza a curvatura do espaço-tempo e ∇α é a derivada covariante.

Formulação em termos de formas diferenciais Editar

A formulação das equações de Maxwell em termos de formas diferenciais pode ser usada sem mudança na relatividade geral. A equivalência da formulação relativística geral mais tradicional usando a derivada covariante com a formulação da forma diferencial pode ser vista como segue. Escolha as coordenadas locais x α que dá uma base de 1-formas dx α em cada ponto do conjunto aberto onde as coordenadas são definidas. Usando esta base e unidades cgs-Gaussianas, definimos

  • O tensor de campo anti-simétrico Fαβ, correspondendo ao campo 2-formulário F
  • A forma de 3 infinitesimal do vetor atual J

O tensor épsilon contraído com a forma diferencial 3 produz 6 vezes o número de termos necessários.

Aqui g é, como de costume, o determinante da matriz que representa o tensor métrico, gαβ. Um pequeno cálculo que usa a simetria dos símbolos de Christoffel (ou seja, a liberdade de torção da conexão de Levi-Civita) e a constante covariante do operador estrela de Hodge mostra que nesta vizinhança de coordenadas temos:

Uma maneira elegante e intuitiva de formular as equações de Maxwell é usar feixes de linhas complexas ou um feixe U (1) principal, em cujas fibras U (1) atua regularmente. A principal conexão U (1) ∇ no feixe de linhas tem uma curvatura F = ∇ 2 que é uma forma dupla que satisfaz automaticamente dF = 0 e pode ser interpretado como uma intensidade de campo. Se o pacote de linha é trivial com conexão de referência plana d podemos escrever ∇ = d + UMA e F = dUMA com UMA a forma 1 composta do potencial elétrico e do potencial vetorial magnético.

Na mecânica quântica, a própria conexão é usada para definir a dinâmica do sistema. Esta formulação permite uma descrição natural do efeito Aharonov – Bohm. Neste experimento, um campo magnético estático passa por um longo fio magnético (por exemplo, um fio de ferro magnetizado longitudinalmente). Fora desse fio, a indução magnética é zero, em contraste com o potencial vetorial, que depende essencialmente do fluxo magnético através da seção transversal do fio e não desaparece fora. Uma vez que também não há campo elétrico, o tensor de Maxwell F = 0 em toda a região do espaço-tempo fora do tubo, durante o experimento. Isso significa, por definição, que a conexão ∇ é plana lá.

No entanto, como mencionado, a conexão depende do campo magnético através do tubo, uma vez que a holonomia ao longo de uma curva não contrátil que circunda o tubo é o fluxo magnético através do tubo nas unidades adequadas. Isso pode ser detectado pela mecânica quântica com um experimento de difração de elétrons de dupla fenda em uma onda de elétrons viajando ao redor do tubo. A holonomia corresponde a uma mudança de fase extra, que leva a uma mudança no padrão de difração. [6] [7]

A seguir estão as razões para usar cada uma dessas formulações.

Formulação potencial Editar

Na mecânica clássica avançada, muitas vezes é útil, e na mecânica quântica frequentemente essencial, expressar as equações de Maxwell em um formulação potencial envolvendo o potencial elétrico (também chamado de potencial escalar) φ, e o potencial magnético (um potencial vetorial) UMA. Por exemplo, a análise de antenas de rádio faz pleno uso dos potenciais vetoriais e escalares de Maxwell para separar as variáveis, uma técnica comum usada na formulação de soluções de equações diferenciais. Os potenciais podem ser introduzidos usando o lema de Poincaré nas equações homogêneas para resolvê-los de uma forma universal (isso pressupõe que consideramos um topologicamente simples, por exemplo, espaço contratável). Os potenciais são definidos conforme a tabela acima. Alternativamente, essas equações definem E e B em termos dos potenciais elétricos e magnéticos que, em seguida, satisfazem as equações homogêneas para E e B como identidades. A substituição dá as equações de Maxwell não homogêneas em forma potencial.

Muitas opções diferentes de UMA e φ são consistentes com determinados campos elétricos e magnéticos observáveis E e B, então os potenciais parecem conter mais informações (classicamente) não observáveis. A não singularidade dos potenciais é bem compreendida, no entanto. Para cada função escalar de posição e tempo λ(x, t), os potenciais podem ser alterados por uma transformação de medidor como

sem alterar o campo elétrico e magnético. Dois pares de potenciais transformados de calibre (φ, UMA) e (φ′, UMA') são chamados medidor equivalente, e a liberdade de selecionar qualquer par de potenciais em sua classe de equivalência de calibre é chamada de liberdade de calibre. Novamente pelo lema de Poincaré (e sob suas suposições), a liberdade de calibre é a única fonte de indeterminação, então a formulação de campo é equivalente à formulação potencial se considerarmos as equações potenciais como equações para classes de equivalência de calibre.

As equações potenciais podem ser simplificadas usando um procedimento chamado fixação de medidor. Uma vez que os potenciais são definidos apenas até a equivalência de calibre, somos livres para impor equações adicionais sobre os potenciais, desde que para cada par de potenciais haja um par equivalente de calibre que satisfaça as equações adicionais (ou seja, se as equações de fixação de calibre definem um fatia para a ação do medidor). Os potenciais fixos por medidor ainda têm uma liberdade de medidor em todas as transformações de medidor que deixam as equações de fixação de medidor invariantes. A inspeção das equações potenciais sugere duas escolhas naturais. No calibre de Coulomb, impomos UMA = 0 que é usado principalmente no caso de magneto estático, quando podemos negligenciar o c −2 ∂ 2 UMA/∂t 2 termo. Na bitola Lorenz (em homenagem ao dinamarquês Ludvig Lorenz), impomos

A condição de medidor de Lorenz tem a vantagem de ser invariante de Lorentz e levar a equações invariantes de Lorentz para os potenciais.

Abordagem manifestamente covariante (tensor) Editar

As equações de Maxwell são exatamente consistentes com a relatividade especial - ou seja, se elas são válidas em um referencial inercial, então são automaticamente válidas em todos os outros referenciais inerciais. Na verdade, as equações de Maxwell foram cruciais no desenvolvimento histórico da relatividade especial. No entanto, na formulação usual das equações de Maxwell, sua consistência com a relatividade especial não é óbvia, ela só pode ser provada por um cálculo laborioso.

Por exemplo, considere um condutor movendo-se no campo de um ímã. [8] Na estrutura do ímã, esse condutor experimenta um magnético força. Mas na estrutura de um condutor que se move em relação ao ímã, o condutor experimenta uma força devido a um elétrico campo. O movimento é exatamente consistente nesses dois referenciais diferentes, mas surge matematicamente de maneiras bem diferentes.

Por esta e outras razões, muitas vezes é útil reescrever as equações de Maxwell de uma forma que seja "manifestamente covariante" - ou seja, obviamente consistente com a relatividade especial, mesmo com apenas um relance nas equações - usando quatro vetores e tensores covariantes e contravariantes. Isso pode ser feito usando o tensor EM F, ou o 4-potencial UMA, com o 4-atual J - ver formulação covariante do eletromagnetismo clássico.

Abordagem de formas diferenciais Editar

A lei de Gauss para o magnetismo e a lei de Faraday-Maxwell podem ser agrupadas uma vez que as equações são homogêneas e podem ser vistas como geométricas identidades expressando o campo F (uma forma 2), que pode ser derivada da 4-potencial UMA. A lei de Gauss para eletricidade e a lei de Ampère-Maxwell podem ser vistas como o equações dinâmicas de movimento dos campos, obtidos por meio do princípio Lagrangeano da menor ação, a partir do "termo de interação" AJ (introduzido por meio de derivadas covariantes de calibre), acoplando o campo à matéria. Para a formulação de campo das equações de Maxwell em termos de um princípio de ação extrema, consulte tensor eletromagnético.

Freqüentemente, a derivada de tempo na equação de Faraday-Maxwell motiva a chamar essa equação de "dinâmica", o que é um tanto enganoso no sentido da análise anterior. Este é antes um artefato de quebrar a covariância relativística escolhendo uma direção de tempo preferida. Para ter graus físicos de liberdade propagados por essas equações de campo, deve-se incluir um termo cinético FF para UMAe leve em consideração os graus de liberdade não físicos que podem ser removidos pela transformação do medidor UMAUMA - dα . Veja também fixação de bitola e fantasmas Faddeev – Popov.

Abordagem de cálculo geométrico Editar

Essa formulação usa a álgebra que o espaço-tempo gera por meio da introdução de um produto distributivo e associativo (mas não comutativo) chamado produto geométrico. Os elementos e operações da álgebra podem geralmente ser associados a significados geométricos. Os membros da álgebra podem ser decompostos por grau (como no formalismo das formas diferenciais) e o produto (geométrico) de um vetor com um k-vetor se decompõe em um (k - 1) -vetor e um (k + 1) -vetor. O (k - 1) - o componente do vetor pode ser identificado com o produto interno e o (k + 1) -componente do vetor com o produto externo. É de conveniência algébrica que o produto geométrico seja invertível, enquanto os produtos interno e externo não. As derivadas que aparecem nas equações de Maxwell são vetores e os campos eletromagnéticos são representados pelo bivetor de Faraday F. Esta formulação é tão geral quanto a das formas diferenciais para variedades com um tensor métrico, pois então estas são naturalmente identificadas com r-formas e há operações correspondentes. As equações de Maxwell reduzem-se a uma equação neste formalismo. Esta equação pode ser separada em partes, como feito acima, por razões comparativas.


Conteúdo

A teoria de campo mais antiga tendo uma simetria de calibre foi a formulação de Maxwell, em 1864-65, da eletrodinâmica ("Uma Teoria Dinâmica do Campo Eletromagnético"), que afirmava que qualquer campo vetorial cuja ondulação desaparece - e pode, portanto, normalmente ser escrito como um gradiente de uma função - pode ser adicionada ao potencial vetorial sem afetar o campo magnético. A importância dessa simetria permaneceu despercebida nas primeiras formulações. Da mesma forma despercebido, Hilbert derivou as equações de campo de Einstein postulando a invariância da ação sob uma transformação geral de coordenadas. Mais tarde, Hermann Weyl, em uma tentativa de unificar a relatividade geral e o eletromagnetismo, conjeturou que Eichinvarianz ou invariância sob a mudança de escala (ou "calibre") também pode ser uma simetria local da relatividade geral. Após o desenvolvimento da mecânica quântica, Weyl, Vladimir Fock e Fritz London modificaram o calibre substituindo o fator de escala por uma quantidade complexa e transformaram a transformação da escala em uma mudança de fase, que é uma simetria de calibre U (1). Isso explicava o efeito do campo eletromagnético na função de onda de uma partícula mecânica quântica carregada. Esta foi a primeira teoria de calibre amplamente reconhecida, popularizada por Pauli em 1941. [1]

Em 1954, tentando resolver algumas das grandes confusões na física de partículas elementares, Chen Ning Yang e Robert Mills introduziram teorias de calibre não abelianas como modelos para entender a forte interação que mantém os núcleos unidos nos núcleos atômicos. [2] (Ronald Shaw, trabalhando com Abdus Salam, introduziu independentemente a mesma noção em sua tese de doutorado.) Generalizando a invariância de calibre do eletromagnetismo, eles tentaram construir uma teoria baseada na ação do SU (não abeliano) (2 ) grupo de simetria no dupleto isospin de prótons e nêutrons. Isso é semelhante à ação do grupo U (1) nos campos spinor da eletrodinâmica quântica. Na física de partículas, a ênfase estava no uso de teorias de calibre quantizado.

Essa ideia mais tarde encontrou aplicação na teoria quântica do campo da força fraca e sua unificação com o eletromagnetismo na teoria eletrofraca. As teorias de calibre tornaram-se ainda mais atraentes quando se percebeu que as teorias de calibre não abelianas reproduziam uma característica chamada liberdade assintótica. A liberdade assintótica era considerada uma característica importante de interações fortes. Isso motivou a busca por uma teoria de medidor de força forte. Essa teoria, agora conhecida como cromodinâmica quântica, é uma teoria de calibre com a ação do grupo SU (3) no tripleto de cores dos quarks. O modelo padrão unifica a descrição do eletromagnetismo, interações fracas e interações fortes na linguagem da teoria de gauge.

Na década de 1970, Michael Atiyah começou a estudar a matemática das soluções para as equações clássicas de Yang-Mills. Em 1983, o aluno de Atiyah, Simon Donaldson, desenvolveu este trabalho para mostrar que a classificação diferenciável de 4-variedades suaves é muito diferente de sua classificação até o homeomorfismo. [3] Michael Freedman usou o trabalho de Donaldson para expor R 4 s, ou seja, estruturas exóticas diferenciáveis ​​no espaço euclidiano de quatro dimensões. Isso levou a um interesse crescente na teoria de calibre por si mesma, independente de seus sucessos na física fundamental. Em 1994, Edward Witten e Nathan Seiberg inventaram técnicas teóricas de calibre baseadas na supersimetria que permitiam o cálculo de certos invariantes topológicos [4] [5] (os invariantes de Seiberg-Witten). Essas contribuições para a matemática da teoria de calibre levaram a um interesse renovado nesta área.

A importância das teorias de calibre na física é exemplificada no tremendo sucesso do formalismo matemático em fornecer uma estrutura unificada para descrever as teorias de campo quântico do eletromagnetismo, a força fraca e a força forte. Essa teoria, conhecida como Modelo Padrão, descreve com precisão as previsões experimentais a respeito de três das quatro forças fundamentais da natureza e é uma teoria de calibre com o grupo de calibre SU (3) × SU (2) × U (1). Teorias modernas como a teoria das cordas, bem como a relatividade geral, são, de uma forma ou de outra, teorias de calibre.

Veja Pickering [6] para mais informações sobre a história das teorias de campo quântico e de calibre.

Simetrias globais e locais Editar

Simetria global Editar

Na física, a descrição matemática de qualquer situação física geralmente contém graus de liberdade excessivos; a mesma situação física é igualmente bem descrita por muitas configurações matemáticas equivalentes. Por exemplo, na dinâmica newtoniana, se duas configurações são relacionadas por uma transformação galileana (uma mudança inercial do referencial), elas representam a mesma situação física. Essas transformações formam um grupo de "simetrias" da teoria, e uma situação física corresponde não a uma configuração matemática individual, mas a uma classe de configurações relacionadas entre si por esse grupo de simetria.

Essa ideia pode ser generalizada para incluir simetrias locais e globais, análogas a "mudanças de coordenadas" muito mais abstratas em uma situação onde não existe um sistema de coordenadas "inercial" preferido que cubra todo o sistema físico. Uma teoria de calibre é um modelo matemático que possui simetrias desse tipo, junto com um conjunto de técnicas para fazer previsões físicas consistentes com as simetrias do modelo.

Exemplo de edição de simetria global

Quando uma quantidade que ocorre na configuração matemática não é apenas um número, mas tem algum significado geométrico, como uma velocidade ou um eixo de rotação, sua representação como números arranjados em um vetor ou matriz também é alterada por uma transformação de coordenadas. Por exemplo, se uma descrição de um padrão de fluxo de fluido afirma que a velocidade do fluido na vizinhança de (x=1, y= 0) é 1 m / s no positivo x direção, em seguida, uma descrição da mesma situação em que o sistema de coordenadas foi girado no sentido horário em 90 graus indica que a velocidade do fluido na vizinhança de (x=0, y= 1) é 1 m / s no positivo y direção. A transformação de coordenadas afetou tanto o sistema de coordenadas usado para identificar o localização da medição e a base em que é valor é expressado. Contanto que essa transformação seja realizada globalmente (afetando a base de coordenadas da mesma forma em todos os pontos), o efeito sobre os valores que representam o taxa de variação de alguma quantidade ao longo de algum caminho no espaço e no tempo à medida que passa pelo ponto P é o mesmo que o efeito sobre os valores que são verdadeiramente locais para P.

Simetria local Editar

Uso de feixes de fibra para descrever simetrias locais Editar

Para descrever adequadamente as situações físicas em teorias mais complexas, muitas vezes é necessário introduzir uma "base de coordenadas" para alguns dos objetos da teoria que não têm essa relação simples com as coordenadas usadas para rotular pontos no espaço e no tempo. (Em termos matemáticos, a teoria envolve um feixe de fibras em que a fibra em cada ponto do espaço de base consiste em possíveis bases de coordenadas para uso ao descrever os valores de objetos naquele ponto.) Para definir uma configuração matemática, uma deve escolher uma base de coordenada particular em cada ponto (um seção local do feixe de fibras) e expressar os valores dos objetos da teoria (geralmente "campos" no sentido físico) usando essa base. Duas dessas configurações matemáticas são equivalentes (descrevem a mesma situação física) se estiverem relacionadas por uma transformação desta base de coordenada abstrata (uma mudança de seção local, ou transformação de calibre).

Na maioria das teorias de calibre, o conjunto de transformações possíveis da base de calibre abstrata em um ponto individual no espaço e no tempo é um grupo de Lie de dimensão finita. O mais simples desses grupos é U (1), que aparece na formulação moderna da eletrodinâmica quântica (QED) por meio do uso de números complexos. QED é geralmente considerada como a primeira e mais simples teoria de calibre físico. O conjunto de possíveis transformações de calibre de toda a configuração de uma dada teoria de calibre também forma um grupo, o grupo de calibre da teoria. Um elemento do grupo de calibre pode ser parametrizado por uma função que varia suavemente dos pontos do espaço-tempo ao grupo de Lie (dimensão finita), de modo que o valor da função e seus derivados em cada ponto representam a ação da transformação do calibre em a fibra sobre esse ponto.

Uma transformação de medidor com parâmetro constante em cada ponto no espaço e no tempo é análoga a uma rotação rígida do sistema de coordenadas geométricas que representa uma simetria global da representação de medidor. Como no caso de uma rotação rígida, esta transformação de medidor afeta expressões que representam a taxa de mudança ao longo de um caminho de alguma quantidade dependente de medidor da mesma forma que aquelas que representam uma quantidade verdadeiramente local. Uma transformação de medidor cujo parâmetro é não uma função constante é chamada de simetria local e seu efeito em expressões que envolvem uma derivada é qualitativamente diferente daquele em expressões que não envolvem. (Isso é análogo a uma mudança não inercial do referencial, que pode produzir um efeito Coriolis.)

Campos do medidor Editar

A versão "covariante de calibre" de uma teoria de calibre explica esse efeito, introduzindo um campo de medição (em linguagem matemática, uma conexão de Ehresmann) e formular todas as taxas de mudança em termos da derivada covariante com respeito a esta conexão. O campo de medida torna-se uma parte essencial da descrição de uma configuração matemática. Uma configuração na qual o campo de calibre pode ser eliminado por uma transformação de calibre tem a propriedade de que sua intensidade de campo (em linguagem matemática, sua curvatura) é zero em todos os lugares que uma teoria de calibre é não limitado a essas configurações. Em outras palavras, a característica distintiva de uma teoria de calibre é que o campo de calibre não apenas compensa uma má escolha do sistema de coordenadas - geralmente não há transformação de calibre que faça o campo de calibre desaparecer.

Ao analisar a dinâmica de uma teoria de gauge, o campo de gauge deve ser tratado como uma variável dinâmica, semelhante a outros objetos na descrição de uma situação física. Além de sua interação com outros objetos por meio da derivada covariante, o campo de medidor normalmente contribui com energia na forma de um termo de "autoenergia". Pode-se obter as equações para a teoria de calibre por:

  • começando de um ansatz ingênuo sem o campo de calibre (no qual os derivados aparecem em uma forma "nua")
  • listando as simetrias globais da teoria que podem ser caracterizadas por um parâmetro contínuo (geralmente um equivalente abstrato de um ângulo de rotação)
  • computar os termos de correção que resultam de permitir que o parâmetro de simetria varie de um lugar para outro e
  • reinterpretar esses termos de correção como acoplamentos a um ou mais campos de calibre e dar a esses campos termos de autoenergia apropriados e comportamento dinâmico.

Este é o sentido em que uma teoria de calibre "estende" uma simetria global a uma simetria local e se assemelha muito ao desenvolvimento histórico da teoria de calibre da gravidade conhecida como relatividade geral.

Experimentos físicos Editar

Teorias de calibre usadas para modelar os resultados de experimentos físicos envolvidos em:

  • limitar o universo de configurações possíveis àquelas consistentes com as informações usadas para configurar o experimento, e então
  • computar a distribuição de probabilidade dos resultados possíveis que o experimento foi projetado para medir.

Não podemos expressar as descrições matemáticas das "informações de configuração" e os "resultados de medição possíveis", ou as "condições de contorno" do experimento, sem referência a um sistema de coordenadas particular, incluindo uma escolha de medidor. Supõe-se que um experimento adequado isolado da influência "externa" é, em si mesmo, uma afirmação dependente do medidor. O manuseio incorreto de cálculos de dependência de medidor em condições de contorno é uma fonte frequente de anomalias, e as abordagens para evitar anomalias classificam as teorias de medidor [ esclarecimento necessário ] .

Teorias do Continuum Edit

As duas teorias de calibre mencionadas acima, eletrodinâmica do contínuo e relatividade geral, são teorias de campo do contínuo. As técnicas de cálculo em uma teoria do contínuo assumem implicitamente que:

  • dada uma escolha completamente fixa de bitola, as condições de contorno de uma configuração individual são completamente descritas
  • dado uma bitola completamente fixa e um conjunto completo de condições de contorno, a menor ação determina uma configuração matemática única e, portanto, uma situação física única consistente com esses limites
  • fixar a bitola não introduz anomalias no cálculo, devido à dependência da bitola na descrição de informações parciais sobre as condições de contorno ou à incompletude da teoria.

A determinação da probabilidade de possíveis resultados de medição prossegue por:

  • estabelecer uma distribuição de probabilidade sobre todas as situações físicas determinadas por condições de contorno consistentes com as informações de configuração
  • estabelecer uma distribuição de probabilidade de resultados de medição para cada situação física possível, essas duas distribuições de probabilidade para obter uma distribuição de resultados de medição possíveis consistentes com as informações de configuração

Essas suposições têm validade suficiente em uma ampla gama de escalas de energia e condições experimentais para permitir que essas teorias façam previsões precisas sobre quase todos os fenômenos encontrados na vida diária: luz, calor e eletricidade, eclipses, voos espaciais, etc. Eles falham apenas nas escalas menores e maiores devido a omissões nas próprias teorias, e quando as próprias técnicas matemáticas quebram, mais notavelmente no caso de turbulência e outros fenômenos caóticos.

Teorias quânticas de campo Editar

Além dessas teorias clássicas de campo contínuo, as teorias de calibre mais amplamente conhecidas são as teorias de campo quântico, incluindo a eletrodinâmica quântica e o modelo padrão da física de partículas elementares. O ponto de partida de uma teoria quântica de campos é muito parecido com o de seu análogo contínuo: uma integral de ação covariante-calibre que caracteriza situações físicas "permitidas" de acordo com o princípio da menor ação. No entanto, as teorias do continuum e do quantum diferem significativamente na maneira como lidam com os graus de liberdade em excesso representados pelas transformações de calibre. Teorias contínuas e a maioria dos tratamentos pedagógicos das teorias quânticas de campo mais simples usam uma prescrição de fixação de calibre para reduzir a órbita de configurações matemáticas que representam uma determinada situação física para uma órbita menor relacionada por um grupo de calibre menor (o grupo de simetria global, ou talvez mesmo o grupo trivial).

Teorias quânticas de campo mais sofisticadas, em particular aquelas que envolvem um grupo de calibre não abeliano, quebram a simetria de calibre dentro das técnicas da teoria de perturbação ao introduzir campos adicionais (os fantasmas de Faddeev-Popov) e contra-termos motivados pelo cancelamento de anomalia, em uma abordagem conhecida como quantização de BRST. Embora essas preocupações sejam, em certo sentido, altamente técnicas, elas também estão intimamente relacionadas à natureza da medição, aos limites do conhecimento de uma situação física e às interações entre condições experimentais incompletamente especificadas e teoria física incompletamente compreendida. [ citação necessária ] As técnicas matemáticas que foram desenvolvidas para tornar as teorias de calibre tratáveis ​​encontraram muitas outras aplicações, desde a física do estado sólido e cristalografia até a topologia de baixa dimensão.

Eletromagnetismo clássico Editar

As transformações de calibre geral agora se tornam não apenas V ↦ V + C < displaystyle V mapsto V + C>, mas

Onde f é qualquer função duas vezes continuamente diferenciável que depende da posição e do tempo. Os campos permanecem os mesmos sob a transformação de medidor e, portanto, as equações de Maxwell ainda estão satisfeitas. Ou seja, as equações de Maxwell têm uma simetria de calibre.

Um exemplo: Escalar O (n) Teoria de calibre Editar

O seguinte ilustra como a invariância de medida local pode ser "motivada" heuristicamente a partir de propriedades de simetria global e como isso leva a uma interação entre campos originalmente não interagentes.

Considere um conjunto de n campos escalares reais não interagentes, com massas iguais m. Este sistema é descrito por uma ação que é a soma da ação (normal) para cada campo escalar φ i < displaystyle varphi _>

O Lagrangiano (densidade) pode ser escrito de forma compacta como

introduzindo um vetor de campos

Agora é transparente que o Lagrangiano é invariante sob a transformação

Isso caracteriza o global simetria deste Lagrangiano particular, e o grupo de simetria é freqüentemente chamado de grupo de calibre o termo matemático é grupo de estrutura, especialmente na teoria das estruturas G. A propósito, o teorema de Noether implica que a invariância sob este grupo de transformações leva à conservação do correntes

onde o T a matrizes são geradoras do SO (n) grupo. Existe uma corrente conservada para cada gerador.

Agora, exigindo que este Lagrangiano deveria ter local O (n) -invariância requer que o G matrizes (que antes eram constantes) devem ser permitidas para se tornarem funções das coordenadas do espaço-tempo x.

Neste caso, o G matrizes não "passam" pelas derivadas, quando G = G(x),

A falha da derivada em comutar com "G" introduz um termo adicional (de acordo com a regra do produto), que estraga a invariância do Lagrangeano. Para corrigir isso, definimos um novo operador derivado de modo que a derivada de Φ < displaystyle Phi> novamente se transforme de forma idêntica com Φ

Esta nova "derivada" é chamada de derivada covariante (calibre) e assume a forma

Onde g é chamada de constante de acoplamento, uma quantidade que define a força de uma interação. Após um cálculo simples, podemos ver que o campo de medição UMA(x) deve se transformar da seguinte maneira

O campo de calibre é um elemento da álgebra de Lie e pode, portanto, ser expandido como

Existem, portanto, tantos campos de calibre quanto geradores da álgebra de Lie.

Finalmente, agora temos um invariante de medida local Lagrangiana

A diferença entre este Lagrangiano e o original globalmente invariante de bitola Lagrangian é visto como o interação Lagrangiana

Este termo apresenta interações entre o n campos escalares apenas como uma conseqüência da demanda por invariância de gauge local. No entanto, para tornar essa interação física e não completamente arbitrária, o mediador UMA(x) precisa se propagar no espaço. Isso é tratado na próxima seção com a adição de outro termo, L g f < displaystyle < mathcal > _ < mathrm >>, para o Lagrangiano. Na versão quantizada da teoria de campo clássica obtida, os quanta do campo de gauge UMA(x) são chamados de bósons de calibre. A interpretação da interação Lagrangiana na teoria quântica de campos é de bósons escalares interagindo pela troca desses bósons de calibre.

O Lagrangiano de Yang-Mills para o campo de medidor Editar

e o f a b c < displaystyle f ^> são as constantes de estrutura da álgebra de Lie dos geradores do grupo de calibre. Esta formulação do Lagrangiano é chamada de Ação de Yang-Mills. Outras ações invariantes de calibre também existem (por exemplo, eletrodinâmica não linear, ação de Born-Infeld, modelo de Chern-Simons, termo teta, etc.).

O Lagrangiano completo para a teoria de calibre é agora

Um exemplo: Edição Eletrodinâmica

Como uma aplicação simples do formalismo desenvolvido nas seções anteriores, considere o caso da eletrodinâmica, com apenas o campo de elétrons. A ação básica que gera a equação de Dirac do campo de elétrons é

A simetria global para este sistema é

O grupo de calibre aqui é U (1), apenas rotações do ângulo de fase do campo, com a rotação particular determinada pela constante θ .

"Localizando" esta simetria implica a substituição de θ de θ(x) Uma derivada covariante apropriada é então

Identificando a "cobrança" e (não deve ser confundido com a constante matemática e na descrição da simetria) com a carga elétrica usual (esta é a origem do uso do termo nas teorias de calibre), e o campo de calibre UMA(x) com o potencial de quatro vetores do campo eletromagnético resulta em uma interação Lagrangiana

onde J μ (x) = e ℏ ψ ¯ (x) γ μ ψ (x) < displaystyle J ^ < mu> (x) = < frac < hbar >> < bar < psi >> (x) gamma ^ < mu> psi (x)> é o vetor quatro da corrente elétrica no campo de Dirac. O princípio do calibre é, portanto, visto introduzir naturalmente o chamado acoplamento mínimo do campo eletromagnético ao campo de elétrons.

Adicionando um Lagrangiano para o campo de calibre A μ (x) < displaystyle A _ < mu> (x)> em termos do tensor de intensidade de campo exatamente como na eletrodinâmica, obtém-se o Lagrangeano usado como ponto de partida na eletrodinâmica quântica.

As teorias de calibre são geralmente discutidas na linguagem da geometria diferencial. Matematicamente, um medidor é apenas uma escolha de uma seção (local) de algum pacote principal. UMA transformação de calibre é apenas uma transformação entre duas dessas seções.

Embora a teoria de calibre seja dominada pelo estudo de conexões (principalmente porque é estudada principalmente por físicos de alta energia), a ideia de uma conexão não é central para a teoria de calibre em geral. Na verdade, um resultado na teoria de calibre geral mostra que representações afins (isto é, módulos afins) das transformações de calibre podem ser classificadas como seções de um feixe de jato que satisfaz certas propriedades. Existem representações que se transformam covariante pontualmente (chamadas pelos físicos de transformações de calibre do primeiro tipo), representações que se transformam como uma forma de conexão (chamadas pelos físicos de transformações de calibre do segundo tipo, uma representação afim) - e outras representações mais gerais, como o campo B na teoria BF. Existem representações (realizações) não lineares mais gerais, mas são extremamente complicadas. Ainda assim, os modelos sigma não lineares se transformam de forma não linear, portanto, há aplicações.

Se houver um pacote principal P cujo espaço de base é espaço ou espaço-tempo e o grupo de estrutura é um grupo de Lie, então as seções de P formam um espaço homogêneo principal do grupo de transformações de calibre.

Conexões (conexão de calibre) definem este pacote principal, gerando uma derivada covariante ∇ em cada pacote vetorial associado. Se um quadro local for escolhido (uma base local de seções), então esta derivada covariante é representada pela forma de conexão UMA, uma forma 1 com valor de álgebra de Lie, que é chamada de medir o potencial em física. Evidentemente, essa não é uma quantidade intrínseca, mas dependente do quadro. A forma de curvatura F, uma forma 2 com valor de álgebra de Lie que é uma quantidade intrínseca, é construída a partir de uma forma de conexão por

As transformações de calibre infinitesimais formam uma álgebra de Lie, que é caracterizada por um escalar com valor de álgebra de Lie suave, ε. Sob tal transformação de medida infinitesimal,

Nem todas as transformações de medidor podem ser geradas por transformações de medidor infinitesimais em geral. Um exemplo é quando a variedade de base é uma variedade compacta sem limite, de modo que a classe de homotopia de mapeamentos dessa variedade para o grupo de Lie é não trivial. Veja instanton para um exemplo.

O Ação de Yang-Mills agora é dado por

onde * representa o Hodge dual e o integral é definido como na geometria diferencial.

Uma quantidade que é invariante de bitola (ou seja, invariante sob transformações de calibre) é o loop de Wilson, que é definido sobre qualquer caminho fechado, γ, da seguinte forma:

O formalismo da teoria de gauge transporta-se para um cenário geral. Por exemplo, é suficiente pedir que um feixe vetorial tenha uma conexão métrica, quando se faz isso, descobre-se que a conexão métrica satisfaz as equações de movimento de Yang-Mills.

As teorias de calibre podem ser quantizadas pela especialização de métodos que são aplicáveis ​​a qualquer teoria quântica de campo. No entanto, por causa das sutilezas impostas pelas restrições de calibre (consulte a seção sobre Formalismo matemático, acima), há muitos problemas técnicos a serem resolvidos que não surgem em outras teorias de campo. Ao mesmo tempo, a estrutura mais rica das teorias de calibre permite a simplificação de alguns cálculos: por exemplo, as identidades de Ward conectam diferentes constantes de renormalização.

Métodos e objetivos Editar

A primeira teoria de calibre quantizada foi a eletrodinâmica quântica (QED). Os primeiros métodos desenvolvidos para isso envolviam a fixação do medidor e, em seguida, a aplicação da quantização canônica. O método Gupta – Bleuler também foi desenvolvido para lidar com esse problema. As teorias de calibre não abelianas são agora tratadas por uma variedade de meios. Os métodos de quantização são abordados no artigo sobre quantização.

O ponto principal da quantização é ser capaz de calcular amplitudes quânticas para vários processos permitidos pela teoria. Tecnicamente, eles se reduzem aos cálculos de certas funções de correlação no estado de vácuo. Isso envolve uma renormalização da teoria.

Quando o acoplamento contínuo da teoria é pequeno o suficiente, todas as quantidades necessárias podem ser calculadas na teoria de perturbação. Os esquemas de quantização destinados a simplificar tais cálculos (como quantização canônica) podem ser chamados esquemas de quantização perturbativa. Atualmente, alguns desses métodos conduzem aos testes experimentais mais precisos das teorias de calibre.

No entanto, na maioria das teorias de calibre, existem muitas questões interessantes que não são perturbativas. Os esquemas de quantização adequados para esses problemas (como a teoria de calibre de rede) podem ser chamados esquemas de quantização não perturbativos. Cálculos precisos em tais esquemas geralmente requerem supercomputação e, portanto, são menos desenvolvidos atualmente do que outros esquemas.

Edição de anomalias

Algumas das simetrias da teoria clássica são então vistas como não sustentando na teoria quântica um fenômeno chamado de anomalia. Entre os mais conhecidos estão:


Propriedades algébricas

Todas as três matrizes de Pauli podem ser compactadas em uma única expressão:

Onde eu = & # 8730 −1 é a unidade imaginária, e δab é o delta de Kronecker, que é igual a +1 se uma = b e 0 caso contrário. Esta expressão é útil para "selecionar" qualquer uma das matrizes numericamente, substituindo os valores de uma = 1, 2, 3, por sua vez útil quando qualquer uma das matrizes (mas nenhuma em particular) deve ser usada em manipulações algébricas.

Os determinantes e traços das matrizes de Pauli são:

A partir disso, podemos deduzir que os valores próprios de cada σeu são ± 1.

Com a inclusão da matriz de identidade, eu (às vezes denotado σ0 ), as matrizes de Pauli formam uma base ortogonal (no sentido de Hilbert – Schmidt) do espaço de Hilbert real de matrizes Hermitianas complexas 2 × 2, />, e do espaço de Hilbert complexo de todas as matrizes 2 × 2, />.

Autovetores e autovalores

Cada uma das matrizes (Hermitianas) de Pauli tem dois autovalores, +1 e -1. Usando uma convenção em que antes da normalização, o 1 é colocado nas posições superior e inferior das funções de onda + e - respectivamente, os autovetores normalizados correspondentes são:

Uma vantagem de usar esta convenção é que as funções de onda + e - podem estar relacionadas entre si, usando as próprias matrizes de Pauli, por , e .

Vetor Pauli

O vetor Pauli é definido por

e fornece um mecanismo de mapeamento de uma base de vetor para uma base de matriz de Pauli como segue,

seus autovalores sendo , e além disso (veja completude, abaixo)

Seus autovetores (não normalizados) são

Relações de comutação

As matrizes de Pauli obedecem às seguintes relações de comutação:

onde a estrutura é constante εabc é o símbolo de Levi-Civita, a notação de soma de Einstein é usada, δab é o delta de Kronecker, e eu é a matriz de identidade 2 × 2.

Relação com ponto e produto cruzado

Os vetores de Pauli mapeiam elegantemente essas relações de comutação e anticomutação para os produtos de vetor correspondentes. Adicionar o comutador ao anticomutador dá

Se é identificado com o pseudoescalar então o lado direito se torna que também é a definição para o produto de dois vetores em álgebra geométrica.

Algumas relações de rastreamento

Os traços a seguir podem ser derivados usando as relações de comutação e anticomutação.

Exponencial de um vetor Pauli

alguém tem, até mesmo poderes,

que pode ser mostrado primeiro para o caso usando as relações anticomutação. Por conveniência, o caso é considerado por convenção.

Para poderes estranhos,

.

Na última linha, a primeira soma é o cosseno, enquanto a segunda soma é o seno, então, finalmente,

,

enquanto o determinante do exponencial em si é apenas 1, o que o torna o elemento de grupo genérico de SU (2).

Uma versão mais abstrata da fórmula (2) para uma matriz 2 × 2 geral pode ser encontrada no artigo sobre exponenciais de matriz. Uma versão geral de (2) para um analítico (em uma e & # 8722uma) função é fornecida pela aplicação da fórmula de Sylvester,

que pode ser reescrito em termos de índices de matriz como onde a soma está implícita sobre os índices repetidos γ e δ. Uma vez que isso é verdade para qualquer escolha da matriz M, a relação de integridade segue conforme declarado acima.

Como observado acima, é comum denotar a matriz de unidade 2 & # 215 2 por σ0, assim σ 0 αβ = δαβ. A relação de completude pode, alternativamente, ser expressa como

, a matriz de densidade idempotente

com autovalor 1, como um operador de projeção para ele.

Relação com o operador de permutação

Deixar Peu j ser a transposição (também conhecida como permutação) entre dois spins σeu e σj vivendo no espaço do produto tensorial ℂ 2 & # 8855 ℂ 2,

Este operador também pode ser escrito de forma mais explícita como o operador de troca de rotação de Dirac,

Seus autovalores são, portanto, 1 ou -1. Ele pode, portanto, ser utilizado como um termo de interação em um hamiltoniano, dividindo os autovalores de energia de seus autossimétricos e antissimétricos.

O grupo SU (2) é o grupo de Lie de matrizes 2 × 2 unitárias com determinante de unidade e sua álgebra de Lie é o conjunto de todas as matrizes anti-Hermitianas 2 × 2 com traço 0. O cálculo direto, como acima, mostra que a álgebra de Lie é a álgebra real tridimensional abrangida pelo conjunto <j >. Em notação compacta,

Como resultado, cada j pode ser visto como um gerador infinitesimal de SU (2). Os elementos de SU (2) são exponenciais de combinações lineares desses três geradores e se multiplicam conforme indicado acima na discussão do vetor de Pauli. Embora isso seja suficiente para gerar SU (2), não é uma representação adequada de su (2), pois os autovalores de Pauli são escalados de forma não convencional. A normalização convencional é λ = & # 160 1 2, de modo que

Como SU (2) é um grupo compacto, sua decomposição de Cartan é trivial.

A álgebra de Lie su(2) é isomórfico à álgebra de Lie assim(3), que corresponde ao grupo de Lie SO (3), o grupo de rotações no espaço tridimensional. Em outras palavras, pode-se dizer que o j são uma realização (e, de fato, a realização de dimensão mais baixa) de infinitesimal rotações no espaço tridimensional. No entanto, embora su(2) e assim(3) são isomórficos como álgebras de Lie, SU (2) e SO (3) não são isomórficos como grupos de Lie. SU (2) é na verdade uma capa dupla de SO (3), o que significa que há um homomorfismo de grupo dois para um de SU (2) a SO (3), consulte a relação entre SO (3) e SU (2) .

Quatérnions

A extensão linear real de <eu, 1, 2, 3> é isomorfo à álgebra real de quatérnions ℍ. O isomorfismo de ℍ a este conjunto é dado pelo seguinte mapa (observe os sinais invertidos para as matrizes de Pauli):

Alternativamente, o isomorfismo pode ser obtido por um mapa usando as matrizes de Pauli em ordem reversa,

Como o conjunto de versores você ⊂ ℍ forma um grupo isomórfico a SU (2), você fornece ainda outra maneira de descrever SU (2). O homomorfismo dois para um de SU (2) a SO (3) pode ser dado em termos das matrizes de Pauli nesta formulação.

Os quatérnions formam uma álgebra de divisão - todo elemento diferente de zero tem um inverso - ao passo que as matrizes de Pauli não.


1 resposta 1

O que você escreveu como uma matriz 4x4 explícita pode ser escrito na notação & quotsigma & quot mais compacta como $ x_0 sigma_0 + boldsymbol < sigma> cdot mathbf. $ Não é apropriado descrever este multivetor como um quatérnio, nem como uma rotação. Os quatérnios podem ser representados na álgebra de Pauli como multivetores com componentes escalares + bivetores, como $ x_0 sigma_0 + i boldsymbol < sigma> cdot mathbf. $ (lembre-se de que $ i sigma_0 = sigma_1 sigma_2 sigma_3 $ é o pseudoescalar na representação de Pauli, e que um pseudoescalar e produto vetorial é um bivetor.) Em particular, definindo $ mathbf = sigma_2 sigma_3, mathbf = sigma_1 sigma_3, mathbf = sigma_1 sigma_2 $, é fácil ver que a tabuada de multiplicação de quatérnios usual pode ser recuperada.

Quanto às rotações na álgebra de Pauli, girar um vetor em torno de um $ mathbf normal $ pode ser realizado imprensando o vetor entre dois rotores conjugados, exponenciais com argumentos bivetores $ sigma cdot mathbf rightarrow e ^ <-i boldsymbol < sigma> cdot mathbf/ 2> sigma cdot mathbf e ^ cdot mathbf/ 2> $ Isso funciona como uma rotação desde $ e ^ <-i boldsymbol < sigma> cdot mathbf/ 2> $ comuta com qualquer componente de $ sigma cdot mathbf $ que se encontra na direção normal e o conjugado comuta com qualquer componente que se encontra no plano de rotação (ou seja, o plano representado pelo bivetor $ i mathbf$.) Por exemplo, se $ sigma cdot mathbf = sigma cdot mathbf_ parallel + sigma cdot mathbf_ perp $, onde $ mathbf_ parallel cdot mathbf = 0 $, então temos $ begin sigma cdot mathbf & amp rightarrow e ^ <-i boldsymbol < sigma> cdot mathbf/ 2> left (< sigma cdot mathbf_ parallel + sigma cdot mathbf_ perp> right) e ^ cdot mathbf/ 2> & amp = left (< sigma cdot mathbf_ parallel> direito) e ^ cdot mathbf > + sigma cdot mathbf_ perp. end$ O componente perpendicular ao plano de rotação não é alterado, enquanto temos uma rotação de estilo complexo-exponencial de qualquer componente do vetor que se encontra no plano. Por exemplo, com $ i mathbf = i theta sigma_3 = sigma_1 sigma_2 $, temos uma rotação no plano x-y. Cada um dos rotores é um multivetor com componentes escalar + bivetor $ e ^ < theta sigma_1 sigma_2 / 2> = sigma_0 cos theta / 2 + sigma_1 sigma_2 sin theta / 2. $

Então, se um vetor escalar + não é uma rotação, nem um quatérnio, o que é? Não tenho uma boa resposta para isso em geral, mas existem alguns casos especiais interessantes de multivetores desse tipo. Um é o projetor, um exemplo do qual é $ P = frac <1> <<2>> left (< sigma_0 + sigma_3> right). $ Este se forma quadratura e consome qualquer fator de $ sigma_3 $ $ begin P ^ 2 & amp = frac <1> <<4>> left (< sigma_0 + sigma_3> right) left (< sigma_0 + sigma_3> right) & amp = frac <1> <<4>> left (< sigma_0 + 2 sigma_3 + sigma_3 ^ 2> right) & amp = frac <1> <<4>> left (<2 sigma_0 + 2 sigma_3> right) & amp = P, end$ e $ P sigma_3 = frac <1> <<2>> left (< sigma_0 + sigma_3> right) sigma_3 = frac <1> <<2>> left (< sigma_3 + sigma_3 ^ 2> right) = P. $ Projetores desta forma aparecem como fatores em soluções (onda eletromagnética multivetor) da equação de Maxwell nas regiões livres de carga e corrente.

Quanto ao resto da sua pergunta, o que é um pseudoescalar + vetor? Na notação sigma, essa soma tem a forma $ i sigma_0 alpha + boldsymbol < sigma> cdot mathbf. $ Em vez de responder à pergunta & quot o que é & quot, vou trapacear e dar um exemplo onde vemos tal soma. Em particular, na rotação acima, tivemos produtos como $ boldsymbol < sigma> cdot mathbf e ^ cdot mathbf/ 2> $. Vamos $ mathbf = theta hat < mathbf> $, então este produto se expande para $ boldsymbol < sigma> cdot mathbf left (< cos theta / 2 + i boldsymbol < sigma> cdot hat < mathbf> sin theta / 2> right). $ O coeficiente multivetor do seno é $ i ( boldsymbol < sigma> cdot mathbf) ( boldsymbol < sigma> cdot hat < mathbf>) $. Se $ mathbf $ e $ hat < mathbf> $ são perpendiculares, tal produto é um vetor, e se eles são paralelos, tal produto é um pseudoescalar. No entanto, em geral, esse produto é a soma de um vetor e um pseudoescalar. Acontece que todos os produtos pseudoescalar que ocorrem na expansão da rotação, se cancelam no final, deixando apenas um vetor.

Outro exemplo (embora um tanto artificial), de um vetor + soma pseudoescalar, pode ser encontrado considerando a generalização da equação de Maxwell encontrada na teoria da antena de engenharia que inclui fontes magnéticas fictícias. Pode-se construir um campo de potencial multivetor que inclui um potencial vetorial e um potencial escalar magnético, da seguinte forma: $ A = c boldsymbol < sigma> cdot mathbf - eta i phi_m sigma_0. $ Este potencial tem ambos componentes vetoriais e pseudoescalar, mas em geral teriam componentes escalares e bivetores também.


Conjugação com matrizes de Pauli

onde $ | 0 rangle = begin1 0 fim$ e $ | 1 rangle = begin0 1 fim$. Agora desenvolvendo a primeira parte da igualdade proposta usando os relacionamentos acima:

começar começar frac <1> <4> sum_^ 3 sigma_jA sigma_j & amp = frac <1> <4> ( sigma_0A sigma_0 + sigma_1A sigma_1 + sigma_2A sigma_2 + sigma_3A sigma_3) & amp = frac <1> <4> [(| 0 rangle langle0 | + | 1 rangle langle1 |) A | (0 rangle langle0 | + | 1 rangle langle1 |) + (| 0 rangle langle1 | + | 1 rangle langle0 |) A (| 0 rangle langle1 | + | 1 rangle langle0 |) & amp + i ^ 2 (| 1 rangle langle0 | - | 0 rangle langle1 |) A (| 1 rangle langle0 | - | 0 rangle langle1 |) + (| 0 rangle langle0 | - | 1 rangle langle1 |) A (| 0 rangle langle0 | - | 1 rangle langle1 |)] & amp = frac <1> <4> [| 0 rangle langle0 | A | 0 rangle langle0 | + | 0 rangle langle0 | A | 1 rangle langle1 | + | 1 rangle langle1 | A | 0 rangle langle0 | + | 1 rangle langle1 | A | 1 rangle langle1 | & amp + | 0 rangle langle1 | A | 0 rangle langle1 | + | 0 rangle langle1 | A | 1 rangle langle0 | + | 1 rangle langle0 | A | 0 rangle langle1 | + | 1 rangle langle0 | A | 1 rangle langle0 | & amp - (| 1 rangle langle0 | A | 1 rangle langle0 | + | 1 rangle langle0 | A | 0 rangle langle1 | + | 0 rangle langle1 | A | 1 rangle langle0 | + | 0 rangle langle1 | A | 0 rangle langle1 |) & amp + | 0 rangle langle0 | A | 0 rangle langle0 | - | 0 rangle langle0 | A | 1 rangle langle1 | - | 1 rangle langle1 | A | 0 rangle langle0 | + | 1 rangle langle1 | A | 1 rangle langle1 |] & amp = frac <1> <4> [ 2 | 0 rangle langle0 | A | 0 rangle langle0 | +2 | 1 rangle langle1 | A | 1 rangle langle1 | +2 | 0 rangle langle1 | A | 1 rangle langle0 | +2 | 1 rangle langle0 | A | 0 rangle langle1 |] & amp = frac <1> <2> [| 0 rangle langle0 | A | 0 rangle langle0 | + | 1 rangle langle1 | A | 1 rangle langle1 | + | 0 rangle langle1 | A | 1 rangle langle0 | + | 1 rangle langle0 | A | 0 rangle langle1 |]. fim fim

Neste ponto, o efeito da multiplicação dessas matrizes pela matriz $ A = begina & amp b c & amp d end$ deve ser analisado:

  • $ | 0 rangle langle0 | A | 0 rangle langle0 | = begin1 & amp 0 0 & amp 0 endcomeçara & amp b c & amp d endcomeçar1 & amp 0 0 & amp 0 end= begina & amp 0 0 & amp 0 end$.
  • $ | 1 rangle langle1 | A | 1 rangle langle1 | = begin0 & amp 0 0 & amp 1 endcomeçara & amp b c & amp d endcomeçar0 & amp 0 0 & amp 1 end= begin0 & amp 0 0 & amp d end$.
  • $ | 0 rangle langle1 | A | 1 rangle langle0 | = begin0 & amp 1 0 & amp 0 endcomeçara & amp b c & amp d endcomeçar0 & amp 0 1 & amp 0 end= begind & amp 0 0 & amp 0 end$.
  • $ | 1 rangle langle0 | A | 0 rangle langle1 | = begin0 & amp 0 1 & amp 0 endcomeçara & amp b c & amp d endcomeçar0 & amp 1 0 & amp 0 end= begin0 & amp 0 0 & amp a end$.

E assim, usando tais relações e o fato de $ tr (A) = a + d $, continuamos a derivação iniciada acima a partir da última etapa

começar começar frac <1> <4> sum_^ 3 sigma_jA sigma_j & amp = frac <1> <2> [| 0 rangle langle0 | A | 0 rangle langle0 | + | 1 rangle langle1 | A | 1 rangle langle1 | + | 0 rangle langle1 | A | 1 rangle langle0 | + | 1 rangle langle0 | A | 0 rangle langle1 |] & amp = frac <1> <2> left [ begina & amp 0 0 & amp 0 end + begin0 & amp 0 0 & amp d end + begind & amp 0 0 & amp 0 end + begin0 & amp 0 0 & amp a end right] = frac <1> <2> begina + d & amp 0 0 & amp a + d end & amp = frac<2> begin1 & amp 0 0 & amp 1 end= frac<2> I. fim fim

Observe que na derivação da igualdade, a restrição de que $ A $ deve ser definido positivo não foi usada, então a igualdade é válida para todas as matrizes $ 2 vezes 2 $.


Riassunto

Este é o caso de um número qualificador de partícula semelhante (spin 1/2) no sistema de partícula devida, a derivação de um proprietário de um campo não linear de uma nova teoria de uma nova teoria quântica, que indica todos os resultados do princípio de exclusão de Pauli para um sistema de conto. O risultato segue exatamente por um procedimento não linear e puramente baseado na teoria do campo, aplicado a todas as descrições do sisteman particelle, e basato sui due postulati fondamentali cheuma) richiedono l’invarianza rispetto todas as transformações apropriadas del gruppo non omogeneo di Lorentz, eb) che si prenda come intità elementare l’interazione fra particelle anzichè i campi liberi delle particelle. Se estende o risultato ottenuto a um limite não relativístico de partícula não interagente em cui si dimostra que o campo de interação da teoria e riduce alla funzione d’onda antisimetrica para o sistema din particularmente da teoria de Schrödinger.


Álgebra geométrica em mecânica quântica

Prefácio. Esses artigos analisam a teoria de Dirac da mecânica quântica do elétron com relação à sua estrutura geométrica revelada pela reformulação em termos de Álgebra do Espaço-Tempo. O resultado principal é que a função de onda de Dirac psi pode ser decomposta na forma de operador invariável

enquanto a unidade imaginária na equação de Dirac é necessariamente identificado com o spin do elétron. Este resultado notável foi derivado pela primeira vez [1] de uma formulação no livro STA, que, aliás, já mostrou que escalares imaginários são supérfluos na teoria de Dirac. Derivações alternativas mais diretamente relacionadas à formulação da matriz padrão são fornecidas em [3] e um apêndice a [2]. O método empregado em [2] deixa claro que as chamadas "identidades de Fierz para covariantes bilineares" são consequências triviais da forma invariante acima para a função de onda. Artigo [2] fornece uma formulação compacta e completa e análise das leis de conservação local na teoria de Dirac de uma partícula. Derivações comparáveis ​​por métodos de matriz e tensor padrão são quase dez vezes mais longas, como pode ser visto no trabalho de Takabayashi referenciado em [2]. Um tratamento análogo das leis de conservação local na teoria de Schroedinger desempenha um papel essencial na interpretação bohmiana da mecânica quântica. O artigo [2] torna explícitas as complicações de estender a abordagem de Bohm para a QM relativística.

O tratamento não relativístico das leis de conservação locais, incluindo spin, é dado em [5] e posteriormente discutido em [6]. A principal mensagem desses jornais é que interpretações padrão da mecânica quântica (incluindo o de Bohm) deixam de levar em conta a relação entre spin e números imaginários que é inerente à teoria de Dirac. As conexões necessárias entre as teorias de Dirac, Pauli e Schroedinger são derivadas em [4], onde inconsistências entre as interpretações padrão são apontadas.

Artigo [3] enfatiza o ponto que as interpretações comuns das matrizes de Pauli e Dirac como operadores da mecânica quântica são injustificadas e mal concebidas. GA deixa absolutamente claro que essas matrizes representam direções no espaço e no espaço-tempo, sem quaisquer implicações sobre o spin. Na verdade, ao contrário da afirmação de Dirac e da crença popular, o spin não é introduzido na teoria de Dirac por matrizes gama, mas pela definição de operadores de energia-momento. A formulação STA da teoria de Dirac torna este fato explícito. Mais sobre este e outros assuntos de interpretação QM na Seção III do Cálculo Geométrico Universal.

[1] Campos Spinor reais.

[2] Observáveis ​​locais na teoria de Dirac

[3] Observáveis, Operadores e Números Complexos na Teoria de Dirac

[4] Consistência na Formulação das Teorias de Dirac, Pauli e Schroedinger

[5] Observáveis ​​locais na teoria quântica

[6] Spin e incerteza na interpretação da mecânica quântica

Resumo: Uma derivação rigorosa da teoria de Schroedinger da teoria de Pauli (ou Dirac) implica que a equação de Schroedinger descreve um elétron em um estado próprio de spin. Além disso, a energia cinética do estado fundamental é completamente determinada pela densidade de spin do elétron. Isso pode ser explicado interpretando o spin como um momento angular orbital, que é necessariamente acompanhado por uma energia cinética. Desse modo, o spin é um momento angular de ponto zero associado à energia de ponto zero do elétron. Como a dispersão no momento do elétron é determinada pela energia do ponto zero, as relações de incerteza de Heisenberg para um elétron podem ser interpretadas como uma propriedade do movimento de rotação do elétron. A interpretação cinética do spin e a interpretação estatística da mecânica quântica podem ser sustentadas em conjunto considerando o elétron como uma partícula pontual. Segue-se que os estados estacionários de elétrons são fontes de campos elétricos flutuantes. Há razões para acreditar que esses campos flutuantes são responsáveis ​​pela força de Van der Waals e podem ser identificados com as flutuações do campo de vácuo eletromagnético. A interpretação cinética do spin então implica que as forças de Van der Waals são dependentes do spin. Essas idéias não são apenas consistentes com o formalismo matemático convencional da mecânica quântica, mas fornecem uma interpretação mais completa e coerente de muitos detalhes do formalismo do que a interpretação alternativa de Copenhagen. Eles apresentam algumas dificuldades, no entanto, que, se a interpretação cinética do spin estiver correta, provavelmente requerem alguma modificação da eletrodinâmica quântica para serem resolvidas.

[7] Geometria da Teoria de Dirac

Resumo: A função de onda de Dirac é representada de uma forma em que todos os seus componentes têm interpretações geométricas e físicas óbvias. Seis componentes que compõem uma transformação de Lorentz determinando a velocidade do elétron são direções de spin. Isso fornece a base para uma conexão rigorosa entre a dinâmica relativística do corpo rígido e a evolução temporal da função de onda. A matriz de espalhamento recebe uma nova forma como um operador com valor de spinor, em vez de uma função complexa. A abordagem revela uma estrutura geométrica da matriz de espalhamento e simplifica os cálculos de espalhamento. Esta afirmação é apoiada por um cálculo explícito da seção transversal diferencial e mudança de polarização no espalhamento de Coulomb. Implicações para a estrutura e interpretação da teoria quântica relativística são discutidas.

D. Hestenes, publicado originalmente em: Simpósio de Matemática do Espaço-Tempo Físico, Facultad de Quimica, Universidad Nacional Autonoma de Mexico, Mexico City, Mexico (1981), 67-96.
D. Hestenes

[8] Mistérios e percepções da teoria de Dirac

Resumo: A equação de Dirac tem uma estrutura geométrica oculta que se manifesta reformulando-a em termos de uma álgebra do espaço-tempo real. Isso revela uma conexão essencial entre spin e números complexos com profundas implicações para a interpretação da mecânica quântica. Entre outras coisas, sugere que, para alcançar uma interpretação completa da mecânica quântica, o spin deve ser identificado com um zitterbewegung intrínseco.

D. Hestenes, publicado em: Annales de la Fondation Louis de Broglie, Vol. 28, 390-408 (2003).
D. Hestenes

[9] Zitterbewegung em Mecânica Quântica

Resumo: A possibilidade de que zitterbewegung abre uma janela para a subestrutura das partículas na mecânica quântica é explorada através da construção de um modelo de partículas com características estruturais inerentes à equação de Dirac. Este artigo desenvolve um modelo dinâmico autocontido do elétron como uma partícula semelhante à luz com zitterbewegung helicoidal e interações eletromagnéticas. O modelo admite soluções periódicas com energia quantizada, e o momento magnético correto é gerado pela circulação de carga. Atribui ao elétron um momento de dipolo elétrico girando com ultra-alta frequência, e a possibilidade de observar isso diretamente como uma ressonância na canalização de elétrons é analisada em detalhes. A correspondência com a equação de Dirac é discutida. Uma modificação da equação de Dirac é sugerida para incorporar o momento dipolar rotativo.

D. Hestenes, publicado em: Fundamentos da Física, Vol. 40, 1-54 (2010) DOI 10.1007 / s10701-009-9360-3.
D. Hestenes


Assista o vídeo: Aula 01 - Plano de Curso, Vetores e Campos escalares e Vetoriais, Gradiente, Divergente e Rotacional (Outubro 2021).