Artigos

10.3: A matriz exponencial como uma soma de poderes - matemática


Você deve se lembrar de Cálculo que, para quaisquer números aa e tt, pode-se obter comer através de

[e ^ {at} = sum_ {k = 0} ^ { infty} frac {(at) ^ k} {k!} nonumber ]

A definição da matriz natural é, portanto,

[e ^ {At} = sum_ {k = 0} ^ { infty} frac {(At) ^ k} {k!} nonumber ]

onde (A ^ {0} = I ) é a matriz de identidade n por n.

Exemplo ( PageIndex {1} )

O caso mais fácil é o caso diagonal, por exemplo,

[A = begin {pmatrix} {1} & {0} {0} & {2} end {pmatrix} nonumber ]

para então

[(At) ^ k = begin {pmatrix} {t ^ k} & {0} {0} & {(2t) ^ k} end {pmatrix} nonumber ]

e entao

[e ^ {At} = begin {pmatrix} {e ^ t} & {0} {0} & {e ^ {2t}} end {pmatrix} nonumber ]

Observe que este é NÃO o exponencial de cada elemento de (A ).

Exemplo ( PageIndex {2} )

Como um segundo exemplo, vamos supor

[A = begin {pmatrix} {0} & {1} {-1} & {0} end {pmatrix} nonumber ]

Reconhecemos que seu ciclo de poderes, ou seja,

[A ^ 2 = begin {pmatrix} {-1} & {0} {0} & {- 1} end {pmatrix} nonumber ]

[A ^ 3 = begin {pmatrix} {0} & {- 1} {1} & {0} end {pmatrix} nonumber ]

[A ^ 4 = begin {pmatrix} {1} & {0} {0} & {1} end {pmatrix} nonumber ]

[A ^ 5 = begin {pmatrix} {0} & {1} {-1} & {0} end {pmatrix} = A nonumber ]

e entao

[e ^ {At} = begin {pmatrix} {1- frac {t ^ 2} {2} + frac {t ^ 4} {4} + cdots} & {t- frac {t ^ 3} {3!} + Frac {t ^ 5} {5!} - cdots} {-t + frac {t ^ 3} {3!} - frac {t ^ 5} {5!} + cdots} & {1- frac {t ^ 2} {2} + frac {t ^ 4} {4} + cdots} end {pmatrix} = begin {pmatrix} { cos (t) } & { sin (t)} {- sin (t)} & { cos (t)} end {pmatriz} nonumber ]

Exemplo ( PageIndex {3} )

Se

[A = begin {pmatrix} {0} & {1} {0} & {0} end {pmatrix} nonumber ]

então

[A ^ 2 = A ^ 3 = A ^ k = begin {pmatrix} {0} & {1} {0} & {0} end {pmatrix} nonumber ]

e entao

[e ^ {At} = (I + tA) begin {pmatrix} {1} & {t} {0} & {1} end {pmatrix} nonumber ]


Isso é o que quero dizer, teríamos que usar o exponencial para defini-lo como ## e ^ < pi log ( begin-1 e amp3 1 e amp-5 end)> ## fazendo da “identidade” uma definição.

Eu estava ignorando esse ponto, obrigado.

Ainda estou curioso sobre o análogo escalar da questão. Eu sei que é inútil, mas estou apenas me perguntando se alguém tem uma solução para o seguinte, porque não tenho ideia de como abordá-lo:

Suponha que nós definiram ## e ^ x ## por sua série de potências ## e ^ x = 1 + x + 0,5x ^ 2 +. + frac+. ## (onde x é um escalar agora não uma matriz)

Partindo dessa definição, como provaríamos que ## (e ^ x) ^ n = e ^## para qualquer n real?

Estou apenas curioso que deve haver uma maneira. Então, se vocês, pessoas espertas, estão entediados, esse é o meu problema para você.


Conteúdo

O termo potência (Latim: potentia, potestas, dignitas) é uma tradução incorreta [4] [5] do grego antigo δύναμις (dúnamis, aqui: "amplificação" [4]) usada pelo matemático grego Euclides para o quadrado de uma linha, [6] seguindo Hipócrates de Quios. [7] Arquimedes descobriu e provou a lei dos expoentes, 10 uma ⋅ 10 b = 10 uma+b , necessário para manipular poderes de 10. [8] [ melhor fonte necessária ] No século 9, o matemático persa Muhammad ibn Mūsā al-Khwārizmī usou os termos مَال (mal, "posses", "propriedade") para um quadrado - os muçulmanos, "como a maioria dos matemáticos daquela época e de outras épocas, pensavam em um número quadrado como uma representação de uma área, especialmente de terras, portanto propriedade" [9] - e كَعْبَة (Kaʿbah, "cubo") para um cubo, que posteriormente os matemáticos islâmicos representaram em notação matemática como as letras mim (m) e kāf (k), respectivamente, por volta do século 15, conforme visto na obra de Abū al-Hasan ibn Alī al-Qalasādī. [10]

No final do século 16, Jost Bürgi usava numerais romanos para expoentes. [11]

Nicolas Chuquet usou uma forma de notação exponencial no século 15, que mais tarde foi usada por Henricus Grammateus e Michael Stifel no século 16. A palavra expoente foi cunhado em 1544 por Michael Stifel. [12] [13] Samuel Jeake introduziu o termo índices em 1696. [6] No século 16, Robert Recorde usou os termos quadrado, cubo, zenzizenzico (quarta potência), sursólido (quinto), zenzicubo (sexto), segundo sursólido (sétimo) e zenzizenzizenzico (oitavo). [9] Biquadrate também foi usado para se referir ao quarto poder.

No início do século 17, a primeira forma de nossa notação exponencial moderna foi introduzida por René Descartes em seu texto intitulado La Géométrie lá, a notação é introduzida no Livro I. [14]

Alguns matemáticos (como Isaac Newton) usavam expoentes apenas para potências maiores que dois, preferindo representar quadrados como multiplicação repetida. Assim, eles escreveriam polinômios, por exemplo, como machado + bxx + cx 3 + d .

Outro sinônimo histórico, involução, agora é raro [15] e não deve ser confundido com seu significado mais comum.

"considere exponenciais ou potências em que o próprio expoente é uma variável. É claro que quantidades desse tipo não são funções algébricas, uma vez que nelas os expoentes devem ser constantes." [16]

Com esta introdução de funções transcendentais, Euler lançou as bases para a introdução moderna do logaritmo natural - como a função inversa para a função exponencial natural, f(x) = e x .

A expressão b 2 = bb é chamado de "o quadrado de b" ou "b quadrado ", porque a área de um quadrado com comprimento lateral b é b 2 .

Da mesma forma, a expressão b 3 = bbb é chamado de "o cubo de b" ou "b cubado ", porque o volume de um cubo com comprimento lateral b é b 3 .

Quando é um número inteiro positivo, o expoente indica quantas cópias da base são multiplicadas juntas. Por exemplo, 3 5 = 3 ⋅ 3 ⋅ 3 ⋅ 3 ⋅ 3 = 243. A base 3 aparece 5 vezes na multiplicação, pois o expoente é 5. Aqui, 243 é o 5ª potência de 3, ou 3 elevado à 5ª potência.

A palavra "elevado" geralmente é omitida e, às vezes, "potência" também, portanto, 3 5 pode ser simplesmente lido "3 à 5ª" ou "3 à 5". Portanto, a exponenciação b n pode ser expresso como "b ao poder de n", "b ao no poder ","b ao nth ", ou mais resumidamente como"b ao n".

Uma fórmula com exponenciação aninhada, como 3 5 7 (que significa 3 (5 7) e não (3 5) 7), é chamada de torre de poderes, ou simplesmente um torre.

A operação de exponenciação com expoentes inteiros pode ser definida diretamente a partir de operações aritméticas elementares.

Editar expoentes positivos

Potências com expoentes inteiros positivos podem ser definidas pelo caso base [17]

A associatividade da multiplicação implica que para quaisquer inteiros positivos m e n,

Edição de expoente zero

Qualquer número diferente de zero elevado à potência 0 é 1: [18] [2]

Uma interpretação de tal poder é como um produto vazio.

O caso de 0 0 é mais complicado, e a escolha de atribuir a ele um valor e qual valor atribuir pode depender do contexto. Para obter mais detalhes, consulte Zero à potência de zero.

Edição de expoentes negativos

A seguinte identidade é válida para qualquer número inteiro n e diferente de zero b:

Elevar 0 a um expoente negativo é indefinido, mas em algumas circunstâncias, pode ser interpretado como infinito (∞).

A identidade acima pode ser derivada por meio de uma definição destinada a estender o intervalo de expoentes a inteiros negativos.

Para b diferente de zero e n positivo, a relação de recorrência acima pode ser reescrita como

Ao definir esta relação como válida para todos os inteiros ne diferentes de zero b, segue-se que

e mais geralmente para qualquer b diferente de zero e qualquer número inteiro não negativo n,

Isso é então prontamente mostrado como verdadeiro para todo inteiro n.

Editar identidades e propriedades

As seguintes identidades são válidas para todos os expoentes inteiros, desde que a base seja diferente de zero: [2]

Ao contrário da adição e multiplicação:

  • A exponenciação não é comutativa. Por exemplo, 2 3 = 8 ≠ 3 2 = 9.
  • A exponenciação não é associativa. Por exemplo, (2 3) 4 = 8 4 = 4096, enquanto 2 (3 4) = 2 81 = 2 417 851 639 229 258 349 412 352. Sem parênteses, a ordem convencional de operações para exponenciação serial em notação sobrescrita é de cima para baixo (ou certo-associativo), não ascendente [19] [20] [21] [22] (ou deixou-associativo). Ou seja, b p q = b (p q), < displaystyle b ^<>> = b ^ < left (p ^ right)>,>

que, em geral, é diferente de

Poderes de uma soma Editar

As potências de uma soma podem normalmente ser calculadas a partir das potências das somas pela fórmula binomial

No entanto, esta fórmula é verdadeira apenas se a soma comutar (ou seja, ab = BA ), o que está implícito se pertencerem a uma estrutura comutativa. Caso contrário, se aeb são, digamos, matrizes quadradas do mesmo tamanho, esta fórmula não pode ser usada. Segue-se que em álgebra computacional, muitos algoritmos envolvendo expoentes inteiros devem ser alterados quando as bases de exponenciação não comutam. Alguns sistemas de álgebra computacional de uso geral usam uma notação diferente (às vezes ^^ em vez de ^) para exponenciação com bases não comutativas, que é então chamada exponenciação não comutativa.

Interpretação combinatória Editar

Para inteiros não negativos n e m, o valor de n m é o número de funções de um conjunto de m elementos para um conjunto de n elementos (consulte exponenciação cardinal). Essas funções podem ser representadas como m-duplas de um conjunto de n-elementos (ou como palavras de m-letras de um alfabeto de n-letras). Alguns exemplos para valores específicos de m e n são fornecidos na tabela a seguir:

n m O n m possíveis m -tuplos de elementos do conjunto <1,. n>
0 5 = 0 Nenhum
1 4 = 1 (1,1,1,1)
2 3 = 8 (1,1,1),(1,1,2),(1,2,1),(1,2,2),(2,1,1),(2,1,2),(2,2,1),(2,2,2)
3 2 = 9 (1,1),(1,2),(1,3),(2,1),(2,2),(2,3),(3,1),(3,2),(3,3)
4 1 = 4 (1),(2),(3),(4)
5 0 = 1 ()

Editar bases particulares

Poderes de dez Editar

No sistema numérico de base dez (decimal), potências inteiras de 10 são escritas como o dígito 1 seguido ou precedido por um número de zeros determinado pelo sinal e magnitude do expoente. Por exemplo, 10 3 = 1000 e 10 −4 = 0,0001.

A exponenciação com base 10 é usada em notação científica para denotar números grandes ou pequenos. Por exemplo, 299 792 458 m / s (a velocidade da luz no vácuo, em metros por segundo) pode ser escrita como 2,997 924 58 × 10 8 m / s e então aproximada como 2,998 × 108 m / s.

Os prefixos SI baseados em potências de 10 também são usados ​​para descrever pequenas ou grandes quantidades. Por exemplo, o prefixo quilo significa 10 3 = 1000, então um quilômetro é 1000 m.

Poderes de três Editar

Poderes de dois Editar

As primeiras potências negativas de 2 são comumente usadas e têm nomes especiais, por exemplo: metade e trimestre.

Potências de 2 aparecem na teoria dos conjuntos, uma vez que um conjunto com n membros tem um conjunto de energia, o conjunto de todos os seus subconjuntos, que tem 2 n membros.

Potências inteiras de 2 são importantes na ciência da computação. O número inteiro positivo potencia 2 n dê o número de valores possíveis para um n -bit número binário inteiro, por exemplo, um byte pode ter 2 8 = 256 valores diferentes. O sistema numérico binário expressa qualquer número como uma soma de potências de 2 e denota-o como uma sequência de 0 e 1, separados por um ponto binário, onde 1 indica uma potência de 2 que aparece na soma em que o expoente é determinado pelo lugar deste 1: os expoentes não negativos são a classificação do 1 à esquerda do ponto (começando em 0), e os expoentes negativos são determinados pela classificação à direita do ponto.

Poderes de uma edição

Os poderes de um são todos um: 1 n = 1 .

Poderes de zero Editar

Se o expoente n for positivo ( n & gt 0), a enésima potência de zero é zero: 0 n = 0 .

Se o expoente n for negativo ( n & lt 0), a enésima potência de zero 0 n é indefinido, porque deve ser igual a 1/0 - n < displaystyle 1/0 ^ <-n>> com -n & gt 0, e isso seria 1/0 < displaystyle 1/0> de acordo com acima.

A expressão 0 0 é definida como 1 ou é deixada indefinida (veja Zero à potência de zero).

Poderes do negativo Editar

Se n é um número inteiro par, então (-1) n = 1 .

Se n é um número inteiro ímpar, então (-1) n = −1 .

Por causa disso, potências de -1 são úteis para expressar sequências alternadas. Para uma discussão semelhante sobre os poderes do número complexo eu , consulte § Poderes dos números complexos.

Edição de expoentes grandes

O limite de uma sequência de poderes de um número maior que um diverge em outras palavras, a sequência cresce sem limites:

b n → ∞ como n → ∞ quando b & gt 1

Isso pode ser lido como "b ao poder de n tende a + ∞ conforme n tende ao infinito quando b é maior que um ".

Potências de um número com valor absoluto menor que um tendem a zero:

b n → 0 como n → ∞ quando | b | & lt 1

Qualquer poder de um é sempre um:

b n = 1 para todos n E se b = 1

Os poderes de -1 alternam entre 1 e -1 como n alterna entre pares e ímpares e, portanto, não tende a nenhum limite como n cresce.

Se b & lt -1, b n , alterna entre números positivos e negativos maiores e maiores como n alterna entre pares e ímpares e, portanto, não tende a nenhum limite como n cresce.

Se o número exponenciado varia enquanto tende para 1, já que o expoente tende para o infinito, então o limite não é necessariamente um daqueles acima. Um caso particularmente importante é

(1 + 1/n) ne Como n → ∞

Outros limites, em particular os das expressões que assumem forma indeterminada, são descritos nos § Limites de competências a seguir.

Funções de energia Editar

Lista de poderes de número inteiro Editar

n n 2 n 3 n 4 n 5 n 6 n 7 n 8 n 9 n 10
2 4 8 16 32 64 128 256 512 1024
3 9 27 81 243 729 2187 6561 19 683 59 049
4 16 64 256 1024 4096 16 384 65 536 262 144 1 048 576
5 25 125 625 3125 15 625 78 125 390 625 1 953 125 9 765 625
6 36 216 1296 7776 46 656 279 936 1 679 616 10 077 696 60 466 176
7 49 343 2401 16 807 117 649 823 543 5 764 801 40 353 607 282 475 249
8 64 512 4096 32 768 262 144 2 097 152 16 777 216 134 217 728 1 073 741 824
9 81 729 6561 59 049 531 441 4 782 969 43 046 721 387 420 489 3 486 784 401
10 100 1000 10 000 100 000 1 000 000 10 000 000 100 000 000 1 000 000 000 10 000 000 000

Um na raiz de um número b é um número x de tal modo que x n = b .

Se b é um número real positivo e n é um número inteiro positivo, então há exatamente uma solução real positiva para x n = b . Esta solução é chamada de diretor na raiz do b. É denotado nb , onde √ é o radical símbolo alternativamente, o principal na raiz de b pode ser escrito b 1/n . Por exemplo: 9 1/2 = √ 9 = 3 e 8 1/3 = 3 √ 8 = 2.

Se b é igual a 0, a equação x n = b tem uma solução, que é x = 0 .

Se n é par e b é positivo então x n = b tem duas soluções reais, que são a positiva e a negativa nas raízes de b, isso é, b 1/n & gt 0 e - (b 1/n ) & lt 0.

Se n é par e b for negativo, a equação não tem solução em números reais.

Se n é estranho então x n = b tem exatamente uma solução real, que é positiva se b é positivo ( b 1/n & gt 0) e negativo se b é negativo ( b 1/n & lt 0).

Pegando um número real positivo b para um expoente racional você/v, Onde você é um inteiro e v é um número inteiro positivo e, considerando apenas as raízes principais, produz

Pegando um número real negativo b para um poder racional você/v, Onde você/v está em termos mais baixos, produz um resultado real positivo se você é par, e portanto v é estranho, porque então b você é positivo e produz um resultado real negativo, se você e v são ambos estranhos, porque então b você é negativo. O caso de mesmo v (e, portanto, estranho você) não pode ser tratado desta forma dentro dos reais, uma vez que não existe um número real x de tal modo que x 2k = -1, o valor de b você/v neste caso deve usar a unidade imaginária eu, conforme descrito mais detalhadamente na seção § Poderes dos números complexos.

Assim, temos (−27) 1/3 = −3 e (−27) 2/3 = 9. O número 4 tem dois poderes 3/2, a saber 8 e −8, no entanto, por convenção, a notação 4 3/2 emprega o raiz principale resulta em 8. Para empregar o v-ésima raiz o você/v-º poder também é chamado de v/você-ésima raiz, e para par v O termo raiz principal denota também o resultado positivo.

Essa ambigüidade de sinal precisa ser cuidada ao aplicar as identidades de poder. Por exemplo:

está claramente errado. O problema começa já na primeira igualdade, introduzindo um padrão notação para uma situação inerentemente ambígua - pedindo uma raiz uniforme - e simplesmente confiar erroneamente em apenas um, o convencional ou diretor interpretação. O mesmo problema ocorre também com uma notação surd introduzida de forma inadequada, impondo inerentemente um resultado positivo:

Em geral, o mesmo tipo de problema ocorre para números complexos, conforme descrito na seção § Falha de energia e identidades logarítmicas.

A exponenciação para potências reais de números reais positivos pode ser definida estendendo-se as potências racionais para reais por continuidade ou, mais comumente, como dado em § Potências via logaritmos abaixo. O resultado é sempre um número real positivo e as identidades e propriedades mostradas acima para expoentes inteiros também são verdadeiras para bases reais positivas com expoentes não inteiros.

Por outro lado, a exponenciação para uma potência real de um número real negativo é muito mais difícil de definir de forma consistente, pois pode ser não real e ter vários valores (ver § Expoentes reais com bases negativas). Pode-se escolher um desses valores, chamado de valor principal, mas não há escolha do valor principal para o qual uma identidade como

é verdadeiro, consulte § Falha de identidades de energia e logaritmo. Portanto, a exponenciação com uma base que não é um número real positivo é geralmente vista como uma função multivalorada.

Limites de expoentes racionais Editar

Uma vez que qualquer número irracional pode ser expresso como o limite de uma sequência de números racionais, a exponenciação de um número real positivo b com um expoente real arbitrário x pode ser definido pela continuidade com a regra [24]

onde o limite é r chega perto de x é tomado apenas sobre os valores racionais de r. Este limite só existe para positivo b. O (ε, δ) -definição de limite é usada, isso envolve mostrar que, para qualquer precisão desejada do resultado b x pode-se escolher um intervalo suficientemente pequeno em torno de x para que todas as potências racionais no intervalo estejam dentro da precisão desejada.

Por exemplo, se x = π , a representação decimal não terminante π = 3,14159 ... pode ser usado (com base na monotonicidade estrita do poder racional) para obter os intervalos delimitados por poderes racionais

A função exponencial Editar

A importante constante matemática e, às vezes chamada de número de Euler, é aproximadamente igual a 2,718 e é a base do logaritmo natural. Embora exponenciação de e poderia, em princípio, ser tratado da mesma forma que a exponenciação de qualquer outro número real, tais exponenciais acabaram por ter propriedades particularmente elegantes e úteis. Entre outras coisas, essas propriedades permitem exponenciais de e a ser generalizado de forma natural para outros tipos de expoentes, como números complexos ou mesmo matrizes, enquanto coincide com o significado familiar de exponenciação com expoentes racionais.

Como consequência, a notação e x geralmente denota uma definição de exponenciação generalizada chamada de função exponencial, exp (x), que pode ser definido de muitas maneiras equivalentes, por exemplo, por

Entre outras propriedades, exp satisfaz a identidade exponencial

exp ⁡ (x + y) = exp ⁡ (x) ⋅ exp ⁡ (y).

A função exponencial é definida para todos os valores inteiros, fracionários, reais e complexos de x. Na verdade, a matriz exponencial é bem definida para matrizes quadradas (neste caso, esta identidade exponencial só se mantém quando x e y comutar) e é útil para resolver sistemas de equações diferenciais lineares.

Como exp (1) é igual a e, e exp (x) satisfaz esta identidade exponencial, segue-se imediatamente que exp (x) coincide com a definição de multiplicação repetida de e x para inteiro x, e também segue que os poderes racionais denotam raízes (positivas) como de costume, então exp (x) coincide com o e x definições na seção anterior para todos os reais x por continuidade.

Poderes via logaritmos Editar

Quando e x é definido como a função exponencial, b x pode ser definido, para outros números reais positivos b, em termos de e x . Especificamente, o logaritmo natural ln (x) é o inverso da função exponencial e x . É definido para b & gt 0, e satisfaz

Se b x é preservar as regras de logaritmo e expoente, então deve-se ter

Isso pode ser usado como uma definição alternativa da potência do número real b x e concorda com a definição dada acima usando expoentes racionais e continuidade. A definição de exponenciação usando logaritmos é mais comum no contexto de números complexos, conforme discutido abaixo.

Expoentes reais com bases negativas Editar

Potências de um número real positivo são sempre números reais positivos. A solução de x 2 = 4, entretanto, pode ser 2 ou −2. O valor principal de 4 1/2 é 2, mas −2 também é uma raiz quadrada válida. Se a definição de exponenciação de números reais for estendida para permitir resultados negativos, o resultado não será mais bem-comportado.

Nem o método do logaritmo nem o método do expoente racional podem ser usados ​​para definir b r como um número real para um número real negativo b e um número real arbitrário r. De fato, e r é positivo para cada número real r, então ln (b) não é definido como um número real para b ≤ 0 .

O método do expoente racional não pode ser usado para valores negativos de b porque depende da continuidade. A função f(r) = b r tem uma extensão única contínua [24] dos números racionais aos números reais para cada b & gt 0. Mas quando b & lt 0, a função f nem mesmo é contínuo no conjunto de números racionais r para o qual está definido.

Por exemplo, considere b = -1. O na raiz de -1 é -1 para cada número natural ímpar n. Então se n é um número inteiro positivo ímpar, (-1) (m/n) = -1 se m é ímpar, e (−1) (m/n) = 1 se m é mesmo. Assim, o conjunto de números racionais q para o qual (-1) q = 1 é denso nos números racionais, assim como o conjunto de q para o qual (-1) q = -1. Isso significa que a função (-1) q não é contínuo em nenhum número racional q onde é definido.

Por outro lado, poderes complexos arbitrários de números negativos b pode ser definido escolhendo um complexo logaritmo de b.

Expoentes irracionais Editar

Se b é um número algébrico real positivo, e x é um número racional, foi mostrado acima que b x é um número algébrico. Isso permanece verdadeiro mesmo se alguém aceitar qualquer número algébrico para b, com a única diferença que b x pode assumir vários valores (um número finito, veja abaixo), que são todos algébricos. O teorema de Gelfond-Schneider fornece algumas informações sobre a natureza da b x quando x é irracional (isto é, não é racional) Afirma:

Se b é um número algébrico diferente de 0 e 1, e x um número algébrico irracional, então todos os valores de b x (há infinitamente muitos) são transcendentais (ou seja, não algébricos).

Se b é um número real positivo e z é qualquer número complexo, a potência b z é definido por

Onde x = ln (b) é a única solução real para a equação e x = b , e o complexo poder de e é definido pela função exponencial, que é a função única de uma variável complexa que é igual à sua derivada e assume o valor 1 para x = 0 .

Como, em geral, b z não é um número real, uma expressão como (b z ) C não é definido pela definição anterior. Deve ser interpretado através das regras para potências de números complexos e, a menos que z seja real ou w seja inteiro, geralmente não é igual b zw , como se poderia esperar.

Existem várias definições da função exponencial, mas elas se estendem de forma compatível a números complexos e satisfazem a propriedade exponencial. Para quaisquer números complexos z e C, a função exponencial satisfaz e z + w = ​​e z e w < displaystyle e ^= e ^e ^>. Em particular, para qualquer número complexo z = x + i y

Esta fórmula vincula problemas em trigonometria e álgebra.

Portanto, para qualquer número complexo z = x + i y,

Edição de definição de série

A função exponencial sendo igual à sua derivada e satisfazendo e 0 = 1, < displaystyle e ^ <0> = 1,> sua série de Taylor deve ser

Esta série infinita, que muitas vezes é tomada como a definição da função exponencial e z para expoentes complexos arbitrários, é absolutamente convergente para todos os números complexos z.

Quando z é puramente imaginário, ou seja, z = iy para um número real y, a série acima se torna

que (porque converge absolutamente) pode ser reordenado para

As partes real e imaginária desta expressão são expansões de Taylor de cosseno e seno, respectivamente, centradas em zero, implicando a fórmula de Euler:

Limite de definição Editar

Edição de periodicidade

Ou seja, a função exponencial complexa e z = exp ⁡ (z) = exp ⁡ (z + 2 k π i) < displaystyle e ^= exp (z) = exp (z + 2k pi i)> para qualquer inteiro k é uma função periódica com período 2 π i < displaystyle 2 pi i>.

Edição de exemplos

Potências inteiras de números complexos diferentes de zero são definidas por multiplicação ou divisão repetida como acima. Se eu é a unidade imaginária e n é um inteiro, então eu n é igual a 1, eu, -1 ou -eu, de acordo com se o inteiro n é congruente com 0, 1, 2 ou 3 módulo 4. Por causa disso, os poderes de eu são úteis para expressar sequências do período 4.

Os poderes complexos de reais positivos são definidos via e x como na seção Expoentes complexos com bases reais positivas acima. Estas são funções contínuas.

Tentar estender essas funções ao caso geral de potências não inteiras de números complexos que não são reais positivos leva a dificuldades. Podemos definir funções descontínuas ou funções multivaloradas. Nenhuma dessas opções é totalmente satisfatória.

O poder racional de um número complexo deve ser a solução para uma equação algébrica. Portanto, sempre tem um número finito de valores possíveis. Por exemplo, C = z 1/2 deve ser uma solução para a equação C 2 = z . Mas se C é uma solução, então é -C, porque (−1) 2 = 1. Uma solução única, mas um tanto arbitrária, chamada de valor principal, pode ser escolhida usando uma regra geral que também se aplica a poderes não racionais.

Poderes complexos e logaritmos são tratados mais naturalmente como funções de valor único em uma superfície de Riemann. As versões de valor único são definidas ao escolher uma folha. O valor apresenta uma descontinuidade ao longo de um corte de galho. A escolha de uma entre muitas soluções como o valor principal nos deixa com funções que não são contínuas, e as regras usuais para manipular poderes podem nos levar ao erro.

Qualquer potência não racional de um número complexo tem um número infinito de valores possíveis devido à natureza multivalorada do logaritmo complexo. O valor principal é um valor único escolhido entre estes por uma regra que, entre as suas outras propriedades, garante potências de números complexos com parte real positiva e parte imaginária zero dão o mesmo valor que a regra definida acima para a base real correspondente.

Exponenciar um número real para uma potência complexa é formalmente uma operação diferente daquela para o número complexo correspondente. No entanto, no caso comum de um número real positivo, o valor principal é o mesmo.

As potências dos números reais negativos nem sempre são definidas e são descontínuas mesmo quando definidas. Na verdade, eles são definidos apenas quando o expoente é um número racional com o denominador sendo um inteiro ímpar. Ao lidar com números complexos, a operação de números complexos é normalmente usada.

Expoentes complexos com bases complexas Editar

Para números complexos C e z com C ≠ 0, a notação C z é ambíguo no mesmo sentido que log C é.

Para obter um valor de C z , primeiro escolha um logaritmo de C chamá-lo de log C . Essa escolha pode ser o valor principal Log C (o padrão, se nenhuma outra especificação for fornecida), ou talvez um valor fornecido por algum outro ramo do log C fixada com antecedência. Então, usando a função exponencial complexa, define-se

porque isso concorda com a definição anterior no caso em que C é um número real positivo e o valor principal (real) do log C é usado.

Se z é um número inteiro, então o valor de C z é independente da escolha do log C , e concorda com a definição anterior de exponenciação com um expoente inteiro.

Se z é um número racional m/n em termos mais baixos com n & gt 0, então o número infinitamente contável de opções de log C rendimento apenas n valores diferentes para C z esses valores são os n soluções complexas s para a equação s n = C m .

Se z é um número irracional, então o número infinitamente contável de opções de log C levam a infinitos valores distintos para C z .

O cálculo de poderes complexos é facilitado pela conversão da base C para a forma polar, conforme descrito em detalhes abaixo.

Uma construção semelhante é empregada em quatérnios.

Raízes complexas da unidade Editar

Um número complexo C de tal modo que C n = 1 para um número inteiro positivo n é um na raiz da unidade. Geometricamente, o nas raízes da unidade encontram-se no círculo unitário do plano complexo nos vértices de um n-gon com um vértice no número real 1.

Se C n = 1 mas C k ≠ 1 para todos os números naturais k de modo que 0 & lt k & lt n , então C é chamado de primitivo na raiz da unidade. A unidade negativa -1 é a única raiz quadrada primitiva da unidade. A unidade imaginária eu é uma das duas 4ª raízes primitivas da unidade, a outra é -eu.

O nas raízes da unidade podem, então, ser expressas naturalmente como

Raízes de números complexos arbitrários Editar

Embora haja infinitos valores possíveis para um logaritmo complexo geral, há apenas um número finito de valores para a potência w q no caso especial importante onde q = 1/n e n é um número inteiro positivo. Estes são os n as raízes do C eles são soluções da equação z n = C . Tal como acontece com as raízes reais, uma segunda raiz também é chamada de raiz quadrada e uma terceira raiz também é chamada de raiz cúbica.

É comum em matemática definir C 1/n como o valor principal da raiz, que é, convencionalmente, o n a raiz cujo argumento tem o menor valor absoluto. Quando C é um número real positivo, isso é coerente com a convenção usual de definição C 1/n como o único real positivo n a raiz. Por outro lado, quando C é um número real negativo e n é um número inteiro ímpar, o real único n a raiz não é uma das duas n as raízes cujo argumento tem o menor valor absoluto. Neste caso, o significado de C 1/n pode depender do contexto, e alguns cuidados podem ser necessários para evitar erros.

O conjunto de n as raízes de um número complexo C é obtido multiplicando o valor principal C 1/n por cada um dos n as raízes da unidade. Por exemplo, as quartas raízes de 16 são 2, −2, 2 eu , e -2 eu , porque o valor principal da quarta raiz de 16 é 2 e as quartas raízes da unidade são 1, -1, eu , e - eu .

Computando poderes complexos Editar

Freqüentemente, é mais fácil calcular potências complexas escrevendo o número a ser exponenciado na forma polar. Cada número complexo z pode ser escrito na forma polar

Onde r é um número real não negativo e θ é o (real) argumento de z. A forma polar tem uma interpretação geométrica simples: se um número complexo você + 4 é considerado como representando um ponto (você, v) no plano complexo usando coordenadas cartesianas, então (r, θ) é o mesmo ponto em coordenadas polares. Isso é, r é o "raio" r 2 = você 2 + v 2 e θ é o "ângulo" θ = atan2 (v, você) O ângulo polar θ é ambíguo, pois qualquer múltiplo inteiro de 2π pode ser adicionado a θ sem alterar a localização do ponto. Cada escolha de θ dá em geral um valor possível diferente do poder. Um corte de ramo pode ser usado para escolher um valor específico. O valor principal (o corte de ramo mais comum), corresponde a θ escolhido no intervalo (−π, π]. Para números complexos com uma parte real positiva e parte imaginária zero, usando o valor principal dá o mesmo resultado que usar o número real correspondente.

A fim de calcular o poder complexo C z , Escreva C na forma polar:

Se z é decomposto como c + di , então a fórmula para C z pode ser escrito de forma mais explícita como

Esta fórmula final permite que poderes complexos sejam calculados facilmente a partir de decomposições da base na forma polar e do expoente na forma cartesiana. É mostrado aqui tanto na forma polar quanto na forma cartesiana (via identidade de Euler).

Os exemplos a seguir usam o valor principal, o corte do ramo que causa θ estar no intervalo (−π, π]. Para calcular eu eu , Escreva eu nas formas polares e cartesianas:

Da mesma forma, para encontrar (−2) 3 + 4eu , calcule a forma polar de −2:

e use a fórmula acima para calcular

O valor de um poder complexo depende do ramo usado. Por exemplo, se a forma polar eu = 1e 5πi/ 2 é usado para calcular eu eu , o poder é encontrado para ser e −5π/ 2 o valor principal de eu eu , calculado acima, é e −π / 2. O conjunto de todos os valores possíveis para eu eu é dado por [28]

Portanto, há uma infinidade de valores que são possíveis candidatos para o valor de eu eu , um para cada inteiro k. Todos eles têm uma parte imaginária zero, então pode-se dizer eu eu tem uma infinidade de valores reais válidos.

Falha de energia e identidades logarítmicas Editar

Algumas identidades para potências e logaritmos para números reais positivos falharão para números complexos, não importa como potências complexas e logaritmos complexos são definidos como funções de valor único. Por exemplo:

  • O log de identidade (bx ) = x ⋅ log b é válido sempre que b for um número real positivo e x for um número real. Mas para o ramo principal do logaritmo complexo temos i π = log ⁡ (- 1) = log ⁡ [(- i) 2] ≠ 2 log ⁡ (- i) = 2 (- i π 2) = - i π < displaystyle i pi = log (-1) = log left [(- i) ^ <2> right] neq 2 log (-i) = 2 left (- < frac <2>> ight)=-ipi >

Independentemente de qual ramificação do logaritmo é usada, uma falha semelhante da identidade existirá. O melhor que pode ser dito (se apenas usando este resultado) é que:

Essa identidade não se mantém, mesmo quando se considera o log como uma função de vários valores. Os possíveis valores de log (C z ) contêm aqueles de z ⋅ log C como um subconjunto. Usando Log (C) para o valor principal do log (C) e m, n como quaisquer números inteiros, os valores possíveis de ambos os lados são:

Por outro lado, quando x é um inteiro, as identidades são válidas para todos os números complexos diferentes de zero.

Edição Monoids

A exponenciação com expoentes inteiros pode ser definida em qualquer monóide multiplicativo. [30] Um monóide é uma estrutura algébrica que consiste em um conjunto X junto com uma regra de composição ("multiplicação") que satisfaça uma lei associativa e uma identidade multiplicativa, denotada por 1. A exponenciação é definida indutivamente por

Monóides incluem muitas estruturas de importância em matemática, incluindo grupos e anéis (sob multiplicação), com exemplos mais específicos dos últimos sendo anéis e campos de matriz.

Matrizes e operadores lineares Editar

Se UMA is a square matrix, then the product of UMA with itself n times is called the matrix power. Also A 0 > is defined to be the identity matrix, [32] and if UMA is invertible, then A − n = ( A − 1 ) n =left(A^<-1> ight)^> .

These examples are for discrete exponents of linear operators, but in many circumstances it is also desirable to define powers of such operators with continuous exponents. This is the starting point of the mathematical theory of semigroups. [34] Just as computing matrix powers with discrete exponents solves discrete dynamical systems, so does computing matrix powers with continuous exponents solve systems with continuous dynamics. Examples include approaches to solving the heat equation, Schrödinger equation, wave equation, and other partial differential equations including a time evolution. The special case of exponentiating the derivative operator to a non-integer power is called the fractional derivative which, together with the fractional integral, is one of the basic operations of the fractional calculus.

Finite fields Edit

A field is an algebraic structure in which multiplication, addition, subtraction, and division are all well-defined and satisfy their familiar properties. The real numbers, for example, form a field, as do the complex numbers and rational numbers. Unlike these familiar examples of fields, which are all infinite sets, some fields have only finitely many elements. The simplest example is the field with two elements F 2 = < 0 , 1 >=<0,1>> with addition defined by 0 + 1 = 1 + 0 = 1 and 0 + 0 = 1 + 1 = 0 , and multiplication 0 ⋅ 0 = 1 ⋅ 0 = 0 ⋅ 1 = 0 and 1 ⋅ 1 = 1 .

Exponentiation in finite fields has applications in public key cryptography. For example, the Diffie–Hellman key exchange uses the fact that exponentiation is computationally inexpensive in finite fields, whereas the discrete logarithm (the inverse of exponentiation) is computationally expensive.

In abstract algebra Edit

Exponentiation for integer exponents can be defined for quite general structures in abstract algebra.

Deixar X be a set with a power-associative binary operation which is written multiplicatively. Então x n is defined for any element x do X and any nonzero natural number n as the product of n copies of x, which is recursively defined by

One has the following properties

If the operation has a two-sided identity element 1, then x 0 is defined to be equal to 1 for any x: [ citação necessária ]

If the operation also has two-sided inverses and is associative, then the magma is a group. The inverse of x can be denoted by x −1 and follows all the usual rules for exponents:

If the multiplication operation is commutative (as, for instance, in abelian groups), then the following holds:

If the binary operation is written additively, as it often is for abelian groups, then "exponentiation is repeated multiplication" can be reinterpreted as "multiplication is repeated addition". Thus, each of the laws of exponentiation above has an analogue among laws of multiplication.

When there are several power-associative binary operations defined on a set, any of which might be iterated, it is common to indicate which operation is being repeated by placing its symbol in the superscript. Desse modo, xn é x ∗ . ∗ x , enquanto x #n é x # . # x , whatever the operations ∗ and # might be.

Superscript notation is also used, especially in group theory, to indicate conjugation. Isso é, g h = h −1 gh , Onde g e h are elements of some group. Although conjugation obeys some of the same laws as exponentiation, it is not an example of repeated multiplication in any sense. A quandle is an algebraic structure in which these laws of conjugation play a central role.

Over sets Edit

Se n is a natural number, and UMA is an arbitrary set, then the expression UMA n is often used to denote the set of ordered n-tuples of elements of UMA. This is equivalent to letting UMA n denote the set of functions from the set <0, 1, 2, . n − 1> to the set UMA a n-tuple (uma0, uma1, uma2,. uman−1) represents the function that sends eu para umaeu.

For an infinite cardinal number κ and a set UMA, the notation UMA κ is also used to denote the set of all functions from a set of size κ to UMA. This is sometimes written κ UMA to distinguish it from cardinal exponentiation, defined below.

This generalized exponential can also be defined for operations on sets or for sets with extra structure. For example, in linear algebra, it makes sense to index direct sums of vector spaces over arbitrary index sets. That is, we can speak of

where each Veu is a vector space.

Then if Veu = V para cada eu, the resulting direct sum can be written in exponential notation as VN , ou simplesmente V N with the understanding that the direct sum is the default. We can again replace the set N with a cardinal number n obter V n , although without choosing a specific standard set with cardinality n, this is defined only up to isomorphism. Tirando V to be the field R of real numbers (thought of as a vector space over itself) and n to be some natural number, we get the vector space that is most commonly studied in linear algebra, the real vector space R n .

If the base of the exponentiation operation is a set, the exponentiation operation is the Cartesian product unless otherwise stated. Since multiple Cartesian products produce an n-tuple, which can be represented by a function on a set of appropriate cardinality, S N becomes simply the set of all functions from N para S in this case:

This fits in with the exponentiation of cardinal numbers, in the sense that | S N | = | S | | N | , where | X | is the cardinality of X. When "2" is defined as <0, 1 >, we have | 2 X | = 2 | X | , where 2 X , usually denoted by P(X), is the power set of X each subset Y do X corresponds uniquely to a function on X taking the value 1 for xY and 0 for xY .

In category theory Edit

In a Cartesian closed category, the exponential operation can be used to raise an arbitrary object to the power of another object. This generalizes the Cartesian product in the category of sets. If 0 is an initial object in a Cartesian closed category, then the exponential object 0 0 is isomorphic to any terminal object 1.

Of cardinal and ordinal numbers Edit

In set theory, there are exponential operations for cardinal and ordinal numbers.

Se κ e λ are cardinal numbers, the expression κ λ represents the cardinality of the set of functions from any set of cardinality λ to any set of cardinality κ. [35] If κ e λ are finite, then this agrees with the ordinary arithmetic exponential operation. For example, the set of 3-tuples of elements from a 2-element set has cardinality 8 = 2 3 . In cardinal arithmetic, κ 0 is always 1 (even if κ is an infinite cardinal or zero).

Exponentiation of cardinal numbers is distinct from exponentiation of ordinal numbers, which is defined by a limit process involving transfinite induction.

Just as exponentiation of natural numbers is motivated by repeated multiplication, it is possible to define an operation based on repeated exponentiation this operation is sometimes called hyper-4 or tetration. Iterating tetration leads to another operation, and so on, a concept named hyperoperation. This sequence of operations is expressed by the Ackermann function and Knuth's up-arrow notation. Just as exponentiation grows faster than multiplication, which is faster-growing than addition, tetration is faster-growing than exponentiation. Evaluated at (3, 3) , the functions addition, multiplication, exponentiation, and tetration yield 6, 9, 27, and 7 625 597 484 987 ( = 3 27 = 3 3 3 = 3 3 ) respectively.

Zero to the power of zero gives a number of examples of limits that are of the indeterminate form 0 0 . The limits in these examples exist, but have different values, showing that the two-variable function x y has no limit at the point (0, 0) . One may consider at what points this function does have a limit.

More precisely, consider the function f(x, y) = x y defined on D = <(x, y) ∈ R 2 : x > 0>. Então D can be viewed as a subset of R 2 (that is, the set of all pairs (x, y) with x , y belonging to the extended real number line R = [−∞, +∞] , endowed with the product topology), which will contain the points at which the function f has a limit.

Na verdade, f has a limit at all accumulation points of D , except for (0, 0) , (+∞, 0) , (1, +∞) and (1, −∞) . [36] Accordingly, this allows one to define the powers x y by continuity whenever 0 ≤ x ≤ +∞ , −∞ ≤ y ≤ +∞ , except for 0 0 , (+∞) 0 , 1 +∞ and 1 −∞ , which remain indeterminate forms.

Under this definition by continuity, we obtain:

  • x +∞ = +∞ and x −∞ = 0 , when 1 < x ≤ +∞ .
  • x +∞ = 0 and x −∞ = +∞ , when 0 ≤ x < 1 .
  • 0 y = 0 and (+∞) y = +∞ , when 0 < y ≤ +∞ .
  • 0 y = +∞ and (+∞) y = 0 , when −∞ ≤ y < 0 .

These powers are obtained by taking limits of x y para positivo values of x . This method does not permit a definition of x y quando x < 0 , since pairs (x, y) with x < 0 are not accumulation points of D .

On the other hand, when n is an integer, the power x n is already meaningful for all values of x , including negative ones. This may make the definition 0 n = +∞ obtained above for negative n problematic when n is odd, since in this case x n → +∞ as x tends to 0 through positive values, but not negative ones.

Computing b n using iterated multiplication requires n − 1 multiplication operations, but it can be computed more efficiently than that, as illustrated by the following example. To compute 2 100 , note that 100 = 64 + 32 + 4 . Compute the following in order:

2 2 = 4
(2 2 ) 2 = 2 4 = 16
(2 4 ) 2 = 2 8 = 256
(2 8 ) 2 = 2 16 = 65 536
(2 16 ) 2 = 2 32 = 4 294 967 296
(2 32 ) 2 = 2 64 = 18 446 744 073 709 551 616
2 64 2 32 2 4 = 2 100 = 1 267 650 600 228 229 401 496 703 205 376

This series of steps only requires 8 multiplication operations (the last product above takes 2 multiplications) instead of 99.

In general, the number of multiplication operations required to compute b n can be reduced to Θ(log n) by using exponentiation by squaring or (more generally) addition-chain exponentiation. Encontrando o mínimo sequence of multiplications (the minimal-length addition chain for the exponent) for b n is a difficult problem, for which no efficient algorithms are currently known (see Subset sum problem), but many reasonably efficient heuristic algorithms are available. [37]

Placing an integer superscript after the name or symbol of a function, as if the function were being raised to a power, commonly refers to repeated function composition rather than repeated multiplication. [38] [39] [40] Thus, f 3 (x) may mean f(f(f(x))) [41] in particular, f −1 (x) usually denotes the inverse function of f . This notation was introduced by Hans Heinrich Bürmann [ citação necessária ] [39] [40] and John Frederick William Herschel. [38] [39] [40] Iterated functions are of interest in the study of fractals and dynamical systems. Babbage was the first to study the problem of finding a functional square root f 1/2 (x) .

To distinguish exponentiation from function composition, the common usage is to write the exponential exponent after the parenthesis enclosing the argument of the function that is, f(x) 3 means (f(x)) 3 , and f(x) –1 means 1/f(x) .

For historical reasons, and because of the ambiguity resulting of not enclosing arguments with parentheses, a superscript after a function name applied specifically to the trigonometric and hyperbolic functions has a deviating meaning: a positive exponent applied to the function's abbreviation means that the result is raised to that power, [42] [43] [44] [45] [46] [47] [48] [20] [40] while an exponent of −1 still denotes the inverse function. [40] That is, sin 2 x is just a shorthand way to write (sin x) 2 = sin(x) 2 without using parentheses, [16] [49] [50] [51] [52] [53] [54] [20] whereas sin −1 x refers to the inverse function of the sine, also called arcsin x . Each trigonometric and hyperbolic function has its own name and abbreviation both for the reciprocal (for example, 1/(sin x) = (sin x) −1 = sin(x) −1 = csc x ), and its inverse (for example cosh −1 x = arcosh x ) A similar convention exists for logarithms, [40] where today log 2 x usually means (log x) 2 , not log log x . [40]

To avoid ambiguity, some mathematicians [ citação necessária ] choose to use ∘ to denote the compositional meaning, writing fn (x) for the n -th iterate of the function f(x) , as in, for example, f ∘3 (x) meaning f(f(f(x))) . For the same purpose, f [n] (x) was used by Benjamin Peirce [55] [40] whereas Alfred Pringsheim and Jules Molk suggested n f(x) instead. [56] [40] [nb 1]

Programming languages generally express exponentiation either as an infix operator or as a (prefix) function, as they are linear notations which do not support superscripts:

  • x ↑ y : Algol, Commodore BASIC, TRS-80 Level II/III BASIC. [57][58]
  • x ^ y : AWK, BASIC, J, MATLAB, Wolfram Language (Mathematica), R, Microsoft Excel, Analytica, TeX (and its derivatives), TI-BASIC, bc (for integer exponents), Haskell (for nonnegative integer exponents), Lua and most computer algebra systems. Conflicting uses of the symbol ^ include: XOR (in POSIX Shell arithmetic expansion, AWK, C, C++, C#, D, Go, Java, JavaScript, Perl, PHP, Python, Ruby and Tcl), indirection (Pascal), and string concatenation (OCaml and Standard ML).
  • x ^^ y : Haskell (for fractional base, integer exponents), D.
  • x ** y : Ada, Z shell, KornShell, Bash, COBOL, CoffeeScript, Fortran, FoxPro, Gnuplot, Groovy, JavaScript, OCaml, F#, Perl, PHP, PL/I, Python, Rexx, Ruby, SAS, Seed7, Tcl, ABAP, Mercury, Haskell (for floating-point exponents), Turing, VHDL.
  • pown x y : F# (for integer base, integer exponent).
  • x⋆y : APL.

Many other programming languages lack syntactic support for exponentiation, but provide library functions:

  • pow(x, y) : C, C++.
  • Math.Pow(x, y) : C#.
  • math:pow(X, Y) : Erlang.
  • Math.pow(x, y) : Java.
  • [Math]::Pow(x, y) : PowerShell.
  • (expt x y) : Common Lisp.

For certain exponents there are special ways to compute x y much faster than through generic exponentiation. These cases include small positive and negative integers (prefer x · x sobre x 2 prefer 1/x sobre x −1 ) and roots (prefer sqrt(x) over x 0.5 , prefer cbrt(x) over x 1/3 ).


Powers and Exponentials

This topic shows how to compute matrix powers and exponentials using a variety of methods.

Positive Integer Powers

If A is a square matrix and p is a positive integer, then A^p effectively multiplies A by itself p-1 times. Por exemplo:

Inverse and Fractional Powers

If A is square and nonsingular, then A^(-p) effectively multiplies inv(A) by itself p-1 times.

MATLAB® calculates inv(A) and A^(-1) with the same algorithm, so the results are exactly the same. Both inv(A) and A^(-1) produce warnings if the matrix is close to being singular.

Fractional powers, such as A^(2/3) , are also permitted. The results using fractional powers depend on the distribution of the eigenvalues of the matrix.

Element-by-Element Powers

The .^ operator calculates element-by-element powers. For example, to square each element in a matrix you can use A.^2 .

Square Roots

The sqrt function is a convenient way to calculate the square root of each element in a matrix. An alternate way to do this is A.^(1/2) .

For other roots, you can use nthroot . For example, calculate A.^(1/3) .

These element-wise roots differ from the matrix square root, which calculates a second matrix B such that A = BB . The function sqrtm(A) computes A^(1/2) by a more accurate algorithm. The m in sqrtm distinguishes this function from sqrt(A) , which, like A.^(1/2) , does its job element-by-element.

Scalar Bases

In addition to raising a matrix to a power, you also can raise a scalar to the power of a matrix.

When you raise a scalar to the power of a matrix, MATLAB uses the eigenvalues and eigenvectors of the matrix to calculate the matrix power. If [V,D] = eig(A) , then 2 A = V 2 D V - 1 .

Matrix Exponentials

The matrix exponential is a special case of raising a scalar to a matrix power. The base for a matrix exponential is Euler's number e = exp(1) .

The expm function is a more convenient way to calculate matrix exponentials.

The matrix exponential can be calculated in a number of ways. See Matrix Exponentials for more information.

Dealing with Small Numbers

The MATLAB functions log1p and expm1 calculate log ( 1 + x ) and e x - 1 accurately for very small values of x . For example, if you try to add a number smaller than machine precision to 1, then the result gets rounded to 1.


Mike's Toolbox

In mathematics, a frequently occurring computation is to find the sum of consecutive powers of a number. For example, we may need to find the sum of powers of a number x:

Sum = x 5 + x 4 + x 3 + x 2 + x + 1

Recall that a power such as x 3 means to multiply 3 x's together (3 is called the exponent):

If you knew the value of x, it would be possible to compute all of the powers and add them together to find the sum. For example, if x had the value 2, Sum would be:

Soma = 2 5 + 2 4 + 2 3 + 2 2 + 2 + 1
= 32 + 16 + 8 + 4 + 2 + 1
= 63

Even though it is possible to compute the sum as just shown, it is both tedious and error prone. Fortunately there is a compact equation that computes the sum without needing to calculate all of the powers. To derive the formula, we just need to notice what happens when we multiply both sides of the original equation by x:

Sum · x = (x 5 + x 4 + x 3 + x 2 + x + 1) · x
= x 6 + x 5 + x 4 + x 3 + x 2 + x

All of the exponents increased by one. Notice that most of the terms on the right side of the equation are the same as in the original Sum above. In fact, they are all there except for the value 1, so let's add one to both sides:

Sum · x + 1 = x 6 + x 5 + x 4 + x 3 + x 2 + x + 1
= x 6 + (x 5 + x 4 + x 3 + x 2 + x + 1)
= x 6 + Sum

We can rearrange this equation so that all terms containing Sum end up on the left side:

Dividing both sides by (x &minus 1) gives us a nice compact formula for the sum of consecutive powers of a number:

Note that the power in the compact formula is just one more than the highest power in the sum that you are trying to determine. If we evaluate the equation with x set equal to 2 we see that it computes the correct answer:

Soma = 2 6 &minus 1 = 64 &minus 1 = 63
2 &minus 1 1

One caveat to this is that the equation does not work when x = 1. This is because we divided both sides of the above equation by (x &minus 1). When x = 1, this term evaluates to zero, and you can't divide by zero. Fortunately it is easy to see what the value of the Sum would be if x was equal to one. Each of the powers in the Sum evaluate to 1, so the Sum is just the number of terms added together, which in this case would be 6, or one more than the highest exponent in the Sum.


Rip’s Applied Mathematics Blog

There was a lot going on in the example of the SN decomposition (2 of 3). First off, we found eigenvalues of a non-diagonable matrix A, and constructed a diagonal matrix D from them. Then we found 2 eigenvectors and 1 generalized eigenvector of A, and used them to construct a transition matrix P. We used that transition matrix to go from our diagonal D back to the original basis, and find S similar to D.

So S is diagonable while A is not. And A and S have the same eigenvalues and the columns of P should be eigenvectors of S. They are. The generalized eigenvector that we found for A is an (ordinary) eigenvector of S, but we had to get a generalized eigenvector of A in order to construct S from D.

I wonder. Can I understand the distinction between eigenvectors and generalized eigenvectors by studying S and A? We’ll see.

I would also remark that A was special in one sense: it was lower triangular. It is not an accident that the eigenvalues of A are its diagonal elements. We could have written the diagonal matrix D by inspection. Instead, I got it together with the eigenvectors.

A question: what does P do to A? We compute

It brings A to Jordan Canonical Form. (Did I make an especially good choice for the generalized eigenvector? I don’t know. It may be that any choice would have led to the JCF or maybe not. My vague recollection from examples years ago is that I lucked out, that in general I have to use some of that considerable freedom I found in v to get JCF.)

If finding generalized eigenvectors is relatively painless for you, you may be happy with the N+S decomposition. (Of course, if you have a “matrix exponential” command available, you’re done.) If not, another possibility is to use the Cayley-Hamilton theorem: any matrix satisfies it’s own characteristic equation. In this example, the characteristic equation is

(The roots of that are the eigenvalues, of course.) The Cayley-Hamilton says that

where the RHS must be the 3ࡩ zero matrix, and the –4 on the LHS must multiply the 3ࡩ identity matrix. And, indeed, A and its powers satisfy that equation.

I used to wonder what the Cayley-Hamilton theorem was good for. One thing it’s good for is turning higher powers of A into lower ones. Use it to express A^3 in terms of I, A, and A^2. then reduce A^4, and keep going. For our example, we could replace the infinite series in A by 3 infinite series of scalars: one series multiplies I, another multiplies A, and the third multiplies A^2. Maybe we could see the patterns for the three scalar series more easily than a pattern for the series in A itself.

There is yet another way to so this we’ll see it when I look at the spectral decomposition theorem out of Halmos.

Ah, there’s one last point I want to make. Schur’s lemma told us that any matrix could be brought to upper triangular form. I didn’t say this, but any nilpotent matrix is similar to a strictly upper triangular matrix (i.e. upper triangular with zero diagonal). It’s also similar to a strictly lower triangular form I think upper or lower should just depend on an ordering of the basis.

So why not have just split our triangular matrix into diagonal plus nilpotent? Because we need S and N to commute. Our example is a perfect illustration: we have a lower triangular matrix

so we can write it as the sum of diagonal

While B is, indeed, nilpotent, it turns out that it’s B^3 which is equal to zero instead of B^2.

Do B and commute? We compute one

No, they do not commute. It is nontrivial that we can find N and S which commute. We needed to go from D back to S, and get N = A – S.


3 respostas 3

This is a slightly modified version of my response on math.stackexchange. One standard approach to computing matrix functions times a vector $f(M)x$ or quadratic forms $x^Tf(M)x$ when $M$ is symmetric is via the Lanczos algorithm. Lanczos computes an orthonormal basis $Q_k = [q_1, ldots, q_k]$ for Krylov subspace $operatorname(x,Ax,ldots, A^x)$ by a Gram-Schmidt like procedure. This results in a factorization $AQ_k =Q_kT_k + eta_k q_e_k^T$ , where $e_k$ is the $k$ -th canonical basis vector and $T_k$ is a $k imes k$ symmetric tridiagonal matrix.

The "Lanczos approximation" to $f(M)x$ is defined as $Q_k f(T_k) Q_k^T x$ , and the approximation to $x^Tf(M)x$ is defined as $x^TQ_k f(T_k) Q_k^T x$ . Note that $f$ can be any scalar function, for instance $f(x) = exp(x)$ or $f(x) = x^i$ . There are software packages to compute $Q_k exp(T_k) Q_k^T x$ . This can easily be turned into the Lanczos approximation to $x^Texp(M)x$ by taking the inner product with $x$ . The Lanczos approximation to the quadratic form can be viewed as a certain Gaussian quadrature approximation to $x^T f(M) x$ and converges extremely quickly in $k$ if $f$ is analytic (see Golub Meurant "Matrices Moments and Quadrature").

This approach has runtime $O(T_k + nk)$ (or $O(T_k + nk^2)$ with full reorthogonalization), where $T_$ is the cost of evaluating $vmapsto Mv$ . This will almost certainly be cheaper than an SVD or any $n^3$ algorithm since $k$ can typically be taken to be fairly small even for a machine precision accurate output.

Note that if $x$ is unit length $Q_k^Tx = e_1$ . This means the Lanczos approximation to $x^Tf(M)x$ is given by $e_1^T f(T_k) e_1$ and that $Q_k$ doesn't need to be stored. There are also some subtleties about whether full reorthogonalization should be used or not. Whether or not it is used, the output will still be accurate for the matrix exponential, but without reorthogonalization $k$ may need to be larger. However, reorthogonalizaton is more computationally expensive, so there is some tradeoff.

Lanczos and a function to compute the approximation of the quadratic form are easy to implement. Note that if you do not want to use reorthogonalization, you could rewrite the code to avoid storing Q.

To use the code you simply do something like:

Even for a matrix of $n=3000$ , its pretty easy to see that this approach is much faster than SVD or eigenvalue decomposition. For instance, we can generate a matrix with the specificed eigenvalues:

For $k=7$ , the Lanczos approximation obtains full machine precision for the matrix exponential in 50ms on my machine:

On the other hand, even computing the (symmetric) eigendecomposition of M takes 2-3 seconds.


Handbook of Statistics

Pavan Turaga , . Anuj Srivastava , in Handbook of Statistics , 2013

4 Common manifolds arising in image analysis

In this section, we list a few commonly occurring manifolds in image and video understanding. We also list the required tools needed to perform statistical analysis such as tangent spaces, exponential maps, inverse exponential maps, etc. under some standard Riemannian metrics.

The hypersphere: The n -dimensional hypersphere, denoted by S n , can be shown to be a submanifold of R n + 1 . The tangent space at a point p , T p ( S n ) , is just the orthogonal complement of p ∈ R n + 1 . Geodesics on a unit sphere S n are great circles ( Boothby, 1975 ). Using the standard Riemannian metric, i.e., for any v 1 , v 2 ∈ T p ( S n ) , we use the Riemannian metric v 1 , v 2 = v 1 T v 2 , the geodesics can be computed. The distance minimizing geodesic between two points p and q is the shorter of the two arcs of a great circle joining them between them. As a parameterized curve, this geodesic is given by

The exponential map on a sphere, exp : T p ( S n ) ↦ S n , is given by exp p ( v ) = cos ( ‖ v ‖ ) p + sin ( ‖ v ‖ ) v ‖ v ‖ .

Special orthogonal group: The set of orthogonal matrices O ( n ) is a subset of the manifold GL ( n ) that satisfy the condition OO T = I . Those orthogonal matrices with determinant + 1 form the special orthogonal group, and denoted by SO ( n ) . One can show that the tangent space T O O ( n ) = < OX | X is an n × n skew-symmetric matrix >. Define the inner product for any Y , Z ∈ T O O ( n ) by Y , Z = trace ( YZ T ) , where trace denotes the sum of diagonal elements.

To define geodesics on SO ( n ) with respect to the Riemannian metric defined above, we need the matrix exponential. For any O ∈ SO ( n ) and any skew-symmetric matrix X , α ( t ) ≡ Oexpm ( tX ) is the unique geodesic in SO ( n ) passing through O with velocity OX at t = 0 ( Boothby, 1975 ). The exponential maps for SO ( n ) are given by exp O ( X ) = Oexpm ( O T X ) , and the inverse exponential maps are given by exp O 1 - 1 ( O 2 ) = O 1 logm ( O 1 T O 2 ) , where expm and logm refer to the matrix exponential and matrix logarithm, respectively.

Stiefel and Grassmann manifolds: The Stiefel and Grassmann manifolds are studied as quotient spaces of SO ( n ) . The Stiefel manifold S n , d is the set of all d -dimensional orthogonal bases in R n , while the Grassmann manifold G n , d is the space of d -dimensional subspaces of R n . Elements of S n , d are denoted by n × d orthogonal matrix, i.e., U ∈ S n , d implies U ∈ R n × d such that U T U = I d . The tangent space at any point U is

where O = [ UV ] such that V is any arbitrary basis of the space perpendicular to U in R n . Similarly, elements of G n , d are denoted by [ U ] = < UQ | Q ∈ SO ( d ) >and the tangent space at any point [ U ] is

and O is a completion of U as earlier. Geodesics in S n , d and G n , d can be realized as geodesics in the larger space SO ( n ) as long as they are perpendicular to the corresponding orbits.

Symmetric positive definite matrices: The space of d × d symmetric positive definite (tensors/covariance matrices) is denoted as Sym + ( d ) . The tangent space at any point X in Sym + ( d ) is given by the set of d × d symmetric matrices, i.e., Sym ( d ) . For a given point X , and any two tangent vectors Y , Z ∈ T X Sym + ( d ) , we use the inner product Y , Z X = trace ( X - 1 / 2 YX - 1 ZX - 1 / 2 ) ( Pennec et al., 2006 ). Under this Riemannian metric, the geodesic passing through a point X in the direction specified by tangent vector W is given by γ ( t ) = X 1 / 2 expm ( tX - 1 / 2 WX - 1 / 2 ) X 1 / 2 . The exponential map of a point y ∈ T X at X is given by

and the inverse exponential map is given by

where the expm and logm refer to the matrix exponential and matrix logarithm, respectively.


Este é um dos mais de 2.400 cursos do OCW. Explore os materiais para este curso nas páginas com links à esquerda.

MIT OpenCourseWare é uma publicação gratuita e aberta de material de milhares de cursos do MIT, cobrindo todo o currículo do MIT.

Sem inscrição ou registro. Navegue livremente e use materiais OCW em seu próprio ritmo. Não há inscrição nem datas de início ou término.

O conhecimento é a sua recompensa. Use o OCW para orientar sua própria aprendizagem ao longo da vida ou para ensinar outras pessoas. Não oferecemos crédito ou certificação para usar OCW.

Feito para compartilhar. Baixe os arquivos para mais tarde. Envie para amigos e colegas. Modifique, remixe e reutilize (lembre-se de citar o OCW como a fonte).


Answers and Replies

##ln(P)## is only well-defined when P is invertible otherwise P does not have a logarithm.

The wikipedia article on matrix logarithms has some discussion on computing the logarithm in the non-diagonalizable case.

MATLAB has a logm function to take matrix logs for numerical calculations.

If you're doing symbolic work, there's one trick I remember from doing exponentials by hand. I don't know the fancy/correct term for it, but often times when evaluating a matrix power series the powers of the matrix will repeat after a certain number of powers. For example, the generator of the 2D special orthogonal group is [0, -1 1, 0]. Square that and you get [-1, 0 0, -1]. Cube it and you get [0, 1 -1, 0]. Fourth power gives you [1, 0 0, 1]. Since that's just the identity you the fifth power is [0, -1 1, 0] and the cycle repeats. The fifth power equals the first, the sixth equals the second, and so on. I suppose you could say that in such cases the sequence of all powers of [0, -1 1, 0] is homomorphic to Z4 under matrix multiplication, or I could be just making a fool outta myself. That way the power series reduces to a sum over four terms. It should apply to any convergent Taylor series if the powers of the generating matrix repeat.

Can you give us a little more info on what logs you want to take?

MATLAB has a logm function to take matrix logs for numerical calculations.

If you're doing symbolic work, there's one trick I remember from doing exponentials by hand. I don't know the fancy/correct term for it, but often times when evaluating a matrix power series the powers of the matrix will repeat after a certain number of powers. For example, the generator of the 2D special orthogonal group is [0, -1 1, 0]. Square that and you get [-1, 0 0, -1]. Cube it and you get [0, 1 -1, 0]. Fourth power gives you [1, 0 0, 1]. Since that's just the identity you the fifth power is [0, -1 1, 0] and the cycle repeats. The fifth power equals the first, the sixth equals the second, and so on. I suppose you could say that in such cases the sequence of all powers of [0, -1 1, 0] is homomorphic to Z4 under matrix multiplication, or I could be just making a fool outta myself. That way the power series reduces to a sum over four terms. It should apply to any convergent Taylor series if the powers of the generating matrix repeat.


Assista o vídeo: Matrizes - Determinante 4x4 (Outubro 2021).