Artigos

1.3: O que é uma matriz? - Matemática


Matrizes são funções lineares de um certo tipo. Uma maneira de aprender sobre eles é estudando sistemas de equações lineares.

Exemplo 4

Uma sala contém (x ) sacos e (y ) caixas de frutas:

Cada saco contém 2 maçãs e 4 bananas e cada caixa contém 6 maçãs e 8 bananas. Existem 20 maçãs e 28 bananas na sala. Encontre (x ) e (y ).

Os valores são os números (x ) e (y ) que simultaneamente tornam verdadeiras as seguintes equações:

begin {eqnarray *}
2 , x + 6 , y & = & 20
4 , x + 8 , y & = & 28 ,.
end {eqnarray *}

Aqui temos um exemplo de um ( textit {Sistema de Equações Lineares} ). É uma coleção de equações em que as variáveis ​​são multiplicadas por constantes e somadas, e nenhuma variável é multiplicada entre si: não há potências de variáveis ​​maiores do que um (como (x ^ 2 ) ou (b ^ 5 )), não inteiros ou potências negativas de variáveis ​​(como (y ^ {- 1/2} ) ou (a ^ { pi} )), e nenhum lugar onde as variáveis ​​são multiplicadas juntas (como (ab ) ou (xy )).


As informações sobre o conteúdo frutado da sala podem ser armazenadas de duas maneiras:

  1. Em termos de número de maçãs e bananas.
  2. Em termos de quantidade de sacos e caixas.

Intuitivamente, conhecer as informações em um formulário permite que você descubra as informações no outro formulário.

Ir de (ii) para (i) é fácil:

Se você soubesse que havia 3 sacos e 2 caixas, seria fácil calcular o número de maçãs e bananas, e fazer isso teria a sensação de multiplicação (recipientes vezes frutas por recipiente). No exemplo acima, somos obrigados a ir na outra direção, de (i) para (ii). Parece o oposto da multiplicação, ( textit {i.e.} ), Divisão. A notação de matriz deixará claro o que estamos "dividindo".

O objetivo do Capítulo 2 é resolver com eficiência sistemas de equações lineares. Em parte, trata-se apenas de encontrar uma notação melhor, mas que indique uma estrutura matemática subjacente mais profunda. Para isso, precisamos de regras para adição e multiplicação escalar de 2 vetores:

[
c begin {pmatrix} x y end {pmatrix}: = begin {pmatrix} cx cy end {pmatrix} mbox {e} begin {pmatrix} x y end {pmatrix} + begin {pmatrix} x ' y' end {pmatrix}: = begin {pmatrix} x + x ' y + y' end {pmatrix}.
]

Escrevendo nossas equações frutadas como uma igualdade entre 2 vetores e, em seguida, usando estas regras, temos:

[ left. begin {matrix} 2x + 6y = 20 4x + 8y = 28 end {matrix} right } Leftrightarrow begin {pmatrix} 2x + 6y 4x + 8y end {pmatrix } = begin {pmatrix} 20 28 end {pmatrix} Leftrightarrow x begin {pmatrix} 2 4 end {pmatrix} + y begin {pmatrix} 6 8 end {pmatrix} = begin {pmatrix} 20 28 end {pmatrix}. ]

Agora, introduzimos um operador que recebe 2 vetores e fornece 2 vetores. Nós o denotamos por uma matriz de números chamada ( textit {matriz} ).

A função ( begin {pmatrix} 2 e 6 4 e 8 end {pmatrix} ) é definido por ( begin {pmatrix} 2 e 6 4 & 8 end {pmatrix} begin {pmatrix} x y end {pmatrix}: = x begin {pmatrix} 2 4 end {pmatrix } + y begin {pmatrix} 6 8 end {pmatrix} ).

Uma definição semelhante se aplica a matrizes com diferentes números e tamanhos:

Exemplo 5: uma matriz maior

[
begin {pmatrix} 1 & 0 & 3 & 4
5&0&3&4\
-1&6&2&5
end {pmatrix}
begin {pmatrix} x y z w end {pmatrix}
: = x
begin {pmatrix} 1 5 - 1
end {pmatrix}
+ y
begin {pmatrix} 0 0 6
end {pmatrix}
+ z
begin {pmatrix} 3 3 2
end {pmatrix}
+ w begin {pmatrix} 4 4 5
end {pmatrix} ,.
]

Vista como uma máquina que dá entrada e saída de 2 vetores, nossa matriz (2 times2 ) faz o seguinte:


( begin {pmatrix} x y end {pmatrix} ) ( begin {pmatrix} 2x + 6y 4x + 8y end {pmatrix} ).

Nosso problema de frutas agora é bastante conciso.

Exemplo 6: Desta vez em linguagem puramente matemática

Qual vetor ( begin {pmatrix} x y end {pmatrix} ) satisfaz

(
begin {pmatrix}
2 & 6 \
4 & 8
end {pmatrix}
begin {pmatrix} x y end {pmatrix}
= begin {pmatrix} 20 28 end {pmatrix}
)?

Solução

É da mesma forma (Lv = w ) dos nossos exemplos iniciais. A matriz codifica frutas por contêiner. A equação é aproximadamente fruta por contêiner vezes o número de contêineres. Para resolver para frutas, queremos "dividir" pela matriz.

Outra maneira de pensar sobre o exemplo acima é lembrar a regra para multiplicar uma matriz por um vetor. Se você se esqueceu disso, pode realmente adivinhar uma boa regra, certificando-se de que a equação da matriz é a mesma que o sistema de equações lineares. Isso exigiria que
$$
begin {pmatrix}
2 & 6 \
4 & 8
end {pmatrix}
begin {pmatrix} x y end {pmatrix}
: = begin {pmatrix} 2x + 6y 4x + 8y end {pmatrix}
]

Na verdade, este é um exemplo da regra geral que você provavelmente já viu antes

[
begin {pmatrix}
p & q
r & s
end {pmatrix}
begin {pmatrix} x y end {pmatrix}
:=
begin {pmatriz} px + qy rx + sy end {pmatriz} = x begin {pmatriz} p r end {pmatriz} + y begin {pmatriz} q s end {pmatriz} .
]

Observe que a segunda maneira de escrever a saída no lado direito desta equação é muito útil porque nos diz como todas as saídas possíveis de uma matriz vezes um vetor se parecem - são apenas somas das colunas da matriz multiplicadas por escalares. O conjunto de todas as saídas possíveis de uma matriz vezes um vetor é chamado de ( textit {espaço da coluna} ) (é também a imagem da função linear definida pela matriz).

Uma matriz é um exemplo de ( textit {Função Linear} ), porque pega um vetor e o transforma em outro de forma "linear". Claro, podemos ter matrizes muito maiores se nosso sistema tiver mais variáveis.

Matrizes são funções lineares. A declaração disso para a matriz em nosso exemplo frutado parece

1. ( begin {pmatrix}
2 &6 \
4 &8
end {pmatrix}
c begin {pmatrix} x y end {pmatrix}
= c begin {pmatrix}
2 &6 \
4 &8
end {pmatrix}
begin {pmatrix} a b end {pmatrix} e )

2. ( begin {pmatrix}
2 &6 \
4 &8
end {pmatrix}
left [ begin {pmatrix} x y end {pmatrix} + begin {pmatrix} x ' y' end {pmatrix} right]
= begin {pmatrix}
2 &6 \
4 &8
end {pmatrix}
begin {pmatrix} x y end {pmatrix}
+
begin {pmatrix}
2 &6 \
4 &8
end {pmatrix}
begin {pmatrix} x ' y' end {pmatrix}
)

Essas igualdades já podem ser verificadas usando apenas as regras que apresentamos até agora.

Exemplo 7

Verifique se ( begin {pmatrix}
2 &6 \
4 &8
end {pmatrix} ) é um operador linear.

Homogeneidade:

[ begin {pmatrix} 2 & 6 4 & 8 end {pmatrix} left [c begin {pmatrix} a b end {pmatrix} right] = begin {pmatrix} 2 & 6 4 & 8 end { pmatriz} begin {pmatrix} ca cb end {pmatrix} = ca begin {pmatrix} 2 4 end {pmatrix} + cb begin {pmatrix} 6 8 end {pmatrix} = begin {pmatrix} 2ac 4ac end {pmatrix} + begin {pmatrix} 6bc 8bc end {pmatrix} = underline { begin {pmatrix} 2ac + 6bc 4ac + 8bc end {pmatrix} }. ]

que deve (e dá) o mesmo resultado que

[c begin {pmatrix}
2 &6 \
4 &8
end {pmatrix}
begin {pmatrix} a b end {pmatrix}
=
c left [a begin {pmatrix} 2 4 end {pmatrix}
+
b begin {pmatrix} 6 8 end {pmatrix} right]
= c left [ begin {pmatrix} 2a 4a end {pmatrix} + begin {pmatrix} 6b 8b end {pmatrix} right] = c begin {pmatrix} 2a + 6b 4a + 8b end {pmatriz} = underline { begin {pmatrix} 2ac + 6bc 4ac + 8bc end {pmatrix}}. ]

Aditividade:

$$ begin {pmatrix}
2 &6 \
4 &8
end {pmatrix}
left [ begin {pmatrix} a b end {pmatrix} + begin {pmatrix} c d end {pmatrix} right]
=
begin {pmatrix}
2 &6 \
4 &8
end {pmatrix}
begin {pmatrix} a + c b + d end {pmatrix}
=
(a + c) begin {pmatrix} 2 4 end {pmatrix}
+
(b + d) begin {pmatrix} 6 8 end {pmatrix}
=
begin {pmatriz} 2 (a + c) 4 (a + c) end {pmatriz}
+
begin {pmatriz} 6 (b + d) 8 (b + d) end {pmatriz} ]

[= underline { begin {pmatrix} 2a + 2c + 6b + 6d 4a + 4c + 8b + 8d end {pmatrix}} ]

que precisamos comparar com

[ begin {pmatrix}
2 &6 \
4 &8
end {pmatrix}
begin {pmatrix} a b end {pmatrix}
+
begin {pmatrix}
2 &6 \
4 &8
end {pmatrix}
begin {pmatrix} c d end {pmatrix}
=
a begin {pmatrix} 2 4 end {pmatrix} + b begin {pmatrix} 6 8 end {pmatrix} + c begin {pmatrix} 2 4 end {pmatrix} + d begin {pmatrix} 6 8 end {pmatrix} = begin {pmatrix} 2a 4a end {pmatrix} + begin {pmatrix} 6b 8b end {pmatrix} + begin {pmatrix} 2c 4c end {pmatriz} + begin {pmatriz} 6d 8d end {pmatriz} $$
$$ = underline { begin {pmatrix} 2a + 2c + 6b + 6d 4a + 4c + 8b + 8d end {pmatrix}}. ]

Nós temos um círculo completo; matrizes são apenas exemplos dos tipos de operadores lineares que aparecem em problemas de álgebra como os da seção 1.2. Qualquer equação da forma (Mv = w ) com (M ) uma matriz e (v, w ) (n ) - vetores é chamada de ( textit {equação da matriz} ). O Capítulo 2 trata da solução eficiente de sistemas de equações lineares ou equações matriciais equivalentes.


Aula nº 3: Algoritmo de PageRank - A matemática da Pesquisa Google

Vivemos na era do computador. A Internet faz parte do nosso dia-a-dia e a informação está a apenas um clique de distância. Basta abrir seu mecanismo de pesquisa favorito, como Google, AltaVista, Yahoo, digitar as palavras-chave e o mecanismo de pesquisa exibirá as páginas relevantes para sua pesquisa. Mas como um mecanismo de pesquisa realmente funciona?

À primeira vista, parece razoável imaginar que o que um mecanismo de pesquisa faz é manter um índice de todas as páginas da web, e quando um usuário digita em uma pesquisa de consulta, o mecanismo navega por seu índice e conta as ocorrências das palavras-chave em cada arquivo da web. As vencedoras são as páginas com maior número de ocorrências das palavras-chave. Eles são exibidos de volta para o usuário.

Essa costumava ser a imagem correta no início dos anos 90, quando os primeiros mecanismos de pesquisa usaram sistemas de classificação baseados em texto para decidir quais páginas são mais relevantes para uma determinada consulta. No entanto, houve uma série de problemas com esta abordagem. Uma pesquisa sobre um termo comum como "Internet" era problemática. A primeira página exibida por um dos primeiros motores de busca foi escrita em chinês, com ocorrências repetidas da palavra "Internet" e não contendo nenhuma outra informação sobre a Internet. Além disso, suponha que desejamos encontrar algumas informações sobre Cornell. Digitamos a palavra "Cornell" e esperamos que "www.cornell.edu" seja o site mais relevante para nossa consulta. No entanto, pode haver milhões de páginas na web usando o mundo Cornell, e www.cornell.edu pode não ser aquele que o usa com mais frequência. Suponha que decidimos escrever um site que contenha a palavra "Cornell" um bilhão de vezes e nada mais. Então, faria sentido que nosso site fosse o primeiro a ser exibido por um mecanismo de pesquisa? A resposta é obviamente não. No entanto, se tudo o que um mecanismo de pesquisa faz é contar as ocorrências das palavras fornecidas na consulta, é exatamente isso que pode acontecer.

A utilidade de um mecanismo de pesquisa depende do relevância do conjunto de resultados que ele devolve. É claro que pode haver milhões de páginas da web que incluem uma palavra ou frase específica, mas algumas delas serão mais relevantes, populares ou confiáveis ​​do que outras. O usuário não tem capacidade ou paciência para percorrer todas as páginas que contêm as palavras de consulta fornecidas. Espera-se que as páginas relevantes sejam exibidas entre as 20-30 páginas principais retornadas pelo mecanismo de pesquisa.

Os mecanismos de pesquisa modernos empregam métodos de classificação dos resultados para fornecer os "melhores" resultados primeiro, que são mais elaborados do que simplesmente classificação de texto. Um dos algoritmos mais conhecidos e influentes para calcular a relevância das páginas da web é o algoritmo Page Rank usado pelo mecanismo de busca Google. Foi inventado por Larry Page e Sergey Brin quando eles eram estudantes de graduação em Stanford e se tornou uma marca registrada do Google em 1998. A ideia que o Page Rank trouxe era que, a importância de qualquer página da web pode ser avaliada olhando para as páginas esse link para ele. Se criarmos uma página i e incluirmos um hiperlink para a página j, isso significa que consideramos j importante e relevante para o nosso tópico. Se houver muitas páginas com links para j, isso significa que a crença comum é que a página j é importante. Se, por outro lado, j tem apenas um backlink, mas vem de um site oficial k, (como www.google.com, www.cnn.com, www.cornell.edu) dizemos que k transfere sua autoridade para j em outras palavras, k afirma que j é importante. Quer falemos sobre popularidade ou autoridade, podemos atribuir iterativamente uma classificação a cada página da web, com base nas classificações das páginas que apontam para ela.

Para tanto, começamos retratando a rede da Web como um grafo direcionado, com nós representados por páginas da Web e arestas representadas pelos links entre elas.

Suponha, por exemplo, que temos uma pequena Internet consistindo de apenas 4 sites www.page1.com, www.page2.com, www.page3.com, www.page4.com, referenciando uns aos outros da maneira sugerida pela imagem :

Nós "traduzimos" a imagem em um gráfico direcionado com 4 nós, um para cada site. Quando o site i faz referência a j, adicionamos uma aresta direcionada entre o nó i e o nó j no gráfico. Para calcular a classificação da página, ignoramos todos os links de navegação, como os botões voltar e avançar, pois só nos importamos com as conexões entre diferentes sites. Por exemplo, os links da Página1 para todas as outras páginas, portanto, o nó 1 no gráfico terá arestas de saída para todos os outros nós. A página 3 tem apenas um link, para a página 1, portanto, o nó 3 terá uma aresta de saída para o nó 1. Após analisar cada página da web, obtemos o seguinte gráfico:

Em nosso modelo, cada página deve transferir uniformemente sua importância para as páginas às quais se vincula. O nó 1 possui 3 arestas de saída, então ele passará sua importância para cada um dos outros 3 nós. O nó 3 possui apenas uma aresta de saída, então ele passará toda sua importância para o nó 1. Em geral, se um nó tiver k arestas de saída, ele passará sua importância para cada um dos nós aos quais se vincula. Vamos visualizar melhor o processo atribuindo pesos a cada aresta.

Vamos denotar por A a matriz de transição do gráfico, A =.

Suponha que inicialmente a importância esteja uniformemente distribuída entre os 4 nós, cada um recebendo & # 188. Denote por v o vetor de classificação inicial, tendo todas as entradas iguais a & # 188. Cada link de entrada aumenta a importância de uma página da web, portanto, na etapa 1, atualizamos a classificação de cada página adicionando ao valor atual a importância dos links de entrada. Isso é o mesmo que multiplicar a matriz A por v. Na etapa 1, o novo vetor de importância é v 1 = Av. Podemos iterar o processo, portanto, na etapa 2, o vetor de importância atualizado é v 2 = A (Av) = A 2 v. Os cálculos numéricos fornecem:

Notamos que as sequências das iterações v, Av,. A k v tende para o valor de equilíbrio v * = . Chamamos isso de vetor PageRank de nosso gráfico da web.

Vamos denotar por x 1, x 2, x 3, e x 4 a importância das quatro páginas. Analisando a situação em cada nó, obtemos o sistema:

Isso equivale a pedir as soluções das equações. A partir do Exemplo 6 na Aula 1, sabemos que os autovetores correspondentes ao autovalor 1 são da forma. Como o PageRank deve refletir apenas a importância relativa dos nós, e como os autovetores são apenas múltiplos escalares uns dos outros, podemos escolher qualquer um deles para ser nosso vetor de PageRank. Escolha v * para ser o autovetor único com a soma de todas as entradas igual a 1. (Às vezes nos referiremos a ele como o autovetor probabilístico correspondente ao autovalor 1). O autovetor é o nosso vetor PageRank.

Como a importância de uma página da web é medida por sua popularidade (quantos links de entrada ela possui), podemos ver a importância da página i como a probabilidade de um surfista aleatório na Internet que abre um navegador para qualquer página e começa a seguir os hiperlinks , visita a página i. Podemos interpretar os pesos que atribuímos às arestas do gráfico de maneira probabilística: Um surfista aleatório que está visualizando a página 2 da web tem & # 189 probabilidade de ir para a página 3 e & # 189 probabilidade de ir para a página 4 Podemos modelar o processo como um passeio aleatório em gráficos. Cada página tem probabilidade igual & # 188 de ser escolhida como ponto de partida. Portanto, a distribuição de probabilidade inicial é dada pelo vetor coluna [& # 188 & # 188 & # 188 & # 188] t. A probabilidade de que a página i seja visitada após uma etapa é igual a Ax e assim por diante. A probabilidade de que a página i seja visitada após k passos é igual a A k x. A sequência Ax, A 2 x, A 3 x,. A k x,. converge, neste caso, para um vetor probabilístico único v *. Neste contexto, v * é chamado de distribuição estacionária e será nosso vetor de Page Rank. Além disso, a i-ésima entrada no vetor v * é simplesmente a probabilidade de que a cada momento um surfista aleatório visite a página i. Os cálculos são idênticos aos que fizemos na interpretação dos sistemas dinâmicos, apenas o significado que atribuímos a cada etapa sendo ligeiramente diferente.

O vetor Page Rank v * que calculamos por diferentes métodos indica que a página 1 é a página mais relevante. Isso pode parecer surpreendente, pois a página 1 tem 2 backlinks, enquanto a página 3 tem 3 backlinks. Se dermos uma olhada no gráfico, vemos que o nó 3 tem apenas uma aresta de saída para o nó 1, então ele transfere toda a sua importância para o nó 1. Equivalentemente, uma vez que um internauta que segue apenas hiperlinks visita a página 3, ele só pode vá para a página 1. Observe também como a classificação de cada página não é trivialmente apenas a soma ponderada das arestas que entram no nó. Intuitivamente, na etapa 1, um nó recebe um voto de importância de seus vizinhos diretos, na etapa 2 dos vizinhos de seus vizinhos e assim por diante.

Alterar o gráfico da web pode causar alguns problemas.

Calculamos iterativamente a classificação das 3 páginas:

Portanto, neste caso, a classificação de cada página é 0. Isso é contra-intuitivo, pois a página 3 tem 2 links de entrada, então ela deve ter alguma importância!

Uma solução fácil para esse problema seria substituir a coluna correspondente ao nó pendente 3 por um vetor de coluna com todas as entradas 1/3. Dessa forma, a importância do nó 3 seria igualmente redistribuída entre os outros nós do grafo, ao invés de ser perdida.

Um surfista aleatório que começa no primeiro componente conectado não tem como chegar à página 5 da web, pois os nós 1 e 2 não têm links para o nó 5 que ele possa seguir. A álgebra linear também não ajuda. A matriz de transição para este gráfico é. Observe que ambos são autovetores correspondentes ao autovalor 1 e não são apenas trivialmente um e um múltiplo escalar um do outro. Portanto, tanto na teoria quanto na prática, a notação das páginas de classificação do primeiro componente conectado em relação às do segundo componente conectado é ambígua.

A web é muito heterogênea por natureza, e certamente enorme, então não esperamos que seu gráfico esteja conectado. Da mesma forma, haverá páginas totalmente descritivas e sem links de saída. O que deve ser feito neste caso? Precisamos de um significado não ambíguo da classificação de uma página, para qualquer gráfico da Web direcionado com n nós.

Para superar esses problemas, fixe uma constante positiva p entre 0 e 1, que chamamos de fator de amortecimento (um valor típico para p é 0,15). Defina a matriz do Page Rank (também conhecida como matriz do Google) do gráfico por onde.

A matriz M modela o modelo do surfista aleatório da seguinte maneira: na maioria das vezes, um surfista seguirá os links de uma página: de uma página i, o surfista seguirá os links de saída e seguirá para um dos vizinhos de i. Em uma porcentagem menor, mas positiva do tempo, o surfista irá despejar a página atual e escolher arbitrariamente uma página diferente da web e "teletransportar" para lá. O fator de amortecimento p reflete a probabilidade de o surfista sair da página atual e se "teletransportar" para uma nova. Uma vez que ele / ela pode se teletransportar para qualquer página da web, cada página tem probabilidade de ser escolhida. Isso justifica a estrutura da matriz B.

Intuitivamente, a matriz M "conecta" o gráfico e elimina os nós pendentes. Um nó sem arestas de saída agora tem probabilidade de se mover para qualquer outro nó. Rigorosamente, para a matriz M, os seguintes teoremas se aplicam:

  1. 1 é um autovalor de multiplicidade um.
  2. 1 é o maior autovalor: todos os outros autovalores têm valor absoluto menor que 1.
  3. os autovetores correspondentes ao autovalor 1 têm apenas entradas positivas ou apenas entradas negativas. Em particular, para o autovalor 1 existe um único autovetor com a soma de suas entradas igual a 1.

Tendo em vista tudo o que foi discutido acima, concluímos que:

Do ponto de vista matemático, uma vez que temos M, calcular os autovetores correspondentes ao autovalor 1 é, pelo menos em teoria, uma tarefa simples. Como na Aula 1, apenas resolva o sistema Ax = x! Mas quando a matriz M tem tamanho 30 bilhões (como acontece com o gráfico real da Web), mesmo softwares matemáticos como Matlab ou Mathematica ficam claramente sobrecarregados.

Uma forma alternativa de calcular o autovetor probabilístico correspondente ao autovalor 1 é fornecida pelo Método da Potência. O teorema garante que o método funciona para matrizes estocásticas de colunas positivas. Raciocinamos que o processo de iteração corresponde à maneira como a importância se distribui na rede seguindo a estrutura do link (Lembre-se do modelo surfista aleatório). Em termos computacionais, é muito mais fácil, partindo do vetor com todas as entradas 1, multiplicar x, M x. M n x até a convergência, então é para calcular os autovetores de M. Na verdade, neste caso, é necessário apenas calcular o primeiro par de iterações para obter uma boa aproximação do vetor PageRank. Para uma matriz aleatória, o método da potência é geralmente conhecido por ser lento para convergir. O que o faz funcionar rápido neste caso, entretanto, é o fato de que o gráfico da web é escasso. Isso significa que um nó i tem um pequeno número de links de saída (algumas centenas, na melhor das hipóteses, que é extremamente pequeno correspondendo aos 30 bilhões de nós aos quais ele poderia teoricamente se conectar). Portanto, a matriz de transição A tem muitas entradas iguais a 0.


O que é uma matriz?

Antes de mergulharmos no reino da simplificação de matrizes, surge a primeira pergunta: o que é uma matriz?

A matriz é definida como uma matriz retangular de números ou expressões organizadas em linhas e colunas na matemática. As operações de matriz são usadas para lidar com equações lineares chamadas de sistema de equações lineares.

Por exemplo, considere uma equação (1) que é dada abaixo:

Tem infinitas soluções e forma uma linha reta. Mas se considerarmos outra equação (2) que é dada como:

Agora, resolver ambas as equações simultaneamente dá apenas uma solução para xey que é o ponto:

Também pode ser considerado como o ponto onde ambas as equações se cruzam.

As duas equações podem ser representadas usando uma notação de matriz. A notação de matriz para o sistema de equação linear acima será uma matriz 2 x 2 dada como

onde a linha 1 da matriz mencionada acima representa a equação (1) e a linha 2 representa a equação (2). Portanto, as operações de matriz podem ser usadas para simplificar matrizes de equações complexas.


Motivação para a Eliminação Gaussiana

A Eliminação Gaussiana é uma maneira de resolver um sistema de equações de forma metódica e previsível usando matrizes.

Vejamos um exemplo de sistema e resolva-o usando a eliminação.

Nós não precisa de álgebra linear para resolver isso, obviamente. Heck, podemos resolvê-lo em um piscar de olhos. A resposta é bastante óbvia x = y = 1. Mas as coisas ficam exponencialmente mais difíceis com mais incógnitas e equações que temos.

Podemos armazenar todas essas informações em uma matriz e dois vetores, uma matriz que armazena todos os nossos coeficientes UMA, um vetor de desconhecidos x e nossas respostas b.

Se multiplicarmos isso, obteremos o mesmo sistema de equações. Mais importante, podemos realmente nos livrar do vetor xey durante a eliminação, uma vez que ele não contribui com nenhuma informação. Nós conhecer que o sistema é 2 x 2 e, portanto, tem duas incógnitas.

Assim, podemos criar um aumentado matriz de UMA e b.

Podemos ler o acima como duas equações: 1x + 1y = 2 e 2x + 1y = 3 (se você imaginar o x e y o vetor ainda está lá - ou, mais fácil, imagine a incógnita correspondente ao lado de cada coeficiente.

Podemos fazer a eliminação nesta forma de matriz de maneira semelhante. O que queremos fazer é transformar a matriz de coeficiente A em VOCÊ - o que chamamos de triangular superior.


Por que encontrar a classificação?

A classificação nos diz muito sobre a matriz.

É útil para nos informar se temos uma chance de resolver um sistema de equações lineares: quando a classificação é igual ao número de variáveis, podemos ser capazes de encontrar uma solução única.

Exemplo: Maçãs e Bananas

Então podemos descobrir que a maçã extra deve custar $ 2 e, portanto, as bananas custam $ 1 cada.

(Existem 2 variáveis ​​e a classificação também é 2.)

Não podemos ir mais longe porque a segunda linha de dados é apenas o dobro da primeira e não nos fornece nenhuma informação nova. (Existem 2 variáveis ​​e a classificação é apenas 1.)

Ele também tem usos em comunicação, estabilidade de sistemas e muito mais.


Operações de matriz

Adição

A soma de duas matrizes, UMA e B, é realizado adicionando ou subtraindo o elemento de uma matriz com o elemento correspondente de outra matriz. Essas operações só podem ser realizadas em matrizes de dimensões idênticas.

Multiplicação escalar

Multiplicação de uma matriz por um escalar, c, multiplica cada elemento dentro da matriz pelo escalar.

Multiplicação da matriz

A multiplicação da matriz envolve a computação do produto escalar da linha de uma matriz, UMA, com a coluna de outra matriz, B. A multiplicação da matriz só é definida se o número for colunas de UMA, denotado por n, é igual ao número de linhas de B, denotado por m. Seu produto é então a matriz m & vezes n, C. A multiplicação de matrizes envolve algumas propriedades matemáticas. Primeiro, é associativo em outras palavras, (UMA e vezes B) e tempos C = UMA & vezes (B e vezes C) Além disso, a multiplicação da matriz não é comutativa em outras palavras, UMA e vezes B =/= B e vezes UMA

Operações de linha

Existem três tipos de operações elementares de linha que são usadas para transformar uma matriz:

( mathrm_+ k mathrm_ rightarrow mathrm_)


Tipos de Matrizes

Existem vários tipos de matrizes, mas as mais comumente usadas são:

Matriz de linha:
Uma matriz é considerada uma matriz de linha se tiver apenas uma linha.

Matriz de coluna:
Uma matriz é considerada uma matriz de coluna se tiver apenas uma coluna.

Matriz Retangular:
Uma matriz é considerada retangular se o número de linhas não for igual ao número de colunas.

Matriz quadrada:
Uma matriz é considerada quadrada se o número de linhas for igual ao número de colunas.

Matriz diagonal:
Uma matriz quadrada é considerada diagonal se pelo menos um elemento da diagonal principal for diferente de zero e todos os outros elementos forem zero.

Matriz escalar:
Uma matriz diagonal é considerada escalar se todos os seus elementos diagonais forem iguais.

Identidade ou Matriz de Unidade:
Uma matriz diagonal é considerada identidade se todos os seus elementos diagonais forem iguais a um, denotado por $ I $.

Matriz triangular:
Uma matriz quadrada é considerada triangular se todos os seus elementos acima da diagonal principal forem zero (matriz triangular inferior) ou todos os seus elementos abaixo da diagonal principal são zero (matriz triangular superior).

Nulo ou Matriz Zero:
Uma matriz é considerada nula ou zero se todos os seus elementos forem iguais a zero. É denotado por $ O $.

Transposição de uma matriz:
Suponha que $ A $ seja uma matriz dada, então a matriz obtida pela troca de suas linhas em colunas é chamada de transposta de $ A $. É denotado por $$.


Resumo do Capítulo 10

Três conjuntos de matrizes unitárias S são considerados (i) o de matrizes simétricas unitárias S invariantes sob as transformações SW SW, conhecido como o conjunto ortogonal (circular) (ii) o de matrizes unitárias S invariante sob as transformações SUSV, conhecido como o conjunto unitário (circular) e (iii) o de matrizes unitárias autoduais S invariante sob as transformações SW R SW, conhecido como conjunto simplético (circular). Aqui W, U e V são quaisquer matrizes unitárias, W T é a transposição de C, e W R é o dual de C.

A densidade de probabilidade conjunta dos valores próprios exp (euθj), j = 1, …,N, é encontrado para ser

onde β = 1 para o ortogonal, β = 2 para o unitário e β = 4 para o conjunto simplético (circular).


Quatérnions duais

Em uma palavra, Dual-Quaternion é um belo conceito matemático. Ele combina a teoria dos números duais com a matemática do quaternion. Um quaternion fornece um rotação representação sobre um eixo, mas não fornece nenhuma representação de translação. UMA Dual-Quaternion nos permite representar a rotação e translação de um vetor em uma única entidade.

Em vez de usar uma matriz 4x4 para girar e traduzir um vetor, tudo o que precisamos usar é um Dual-Quaternion. UMA Dual-Quaternion consiste em dois quatérnions chamados: Quaternion Real e Quaternion Dual. O Real Quaternion representa rotação, enquanto Quaternion Dual representa tradução.


Assista o vídeo: O que é uma matriz? MATRIZ 1 de 20 (Outubro 2021).