Artigos

3: Regras de Diferenciação - Matemática


Este mapa de texto está em construção ... por favor, seja paciente conosco.


3: Regras de Diferenciação - Matemática

Ferramentas matemáticas para aulas intermediárias de economia
Iftekher Hossain

Derivados e seus usos

Seção 3

Regras de Diferenciação

A diferenciação de uma função (f (x) ) em relação a (x ) é o processo para obter a derivada da função. Abaixo, listamos algumas regras de diferenciação usadas com frequência na economia:

    A diferenciação de um termo constante é zero.

Exemplo 1:

Exemplo 2:

Suponha que (y = f (x) = 3x + 2 ) $ frac = '(x) = frac(3x) + frac(2) = 3 + 0 = 3$

Se (y = f (x) = kx ^ < color> ), onde (k ) é o coeficiente, ( color) é o expoente e (n neq 0 ), então a derivada é:

( frac = (coeficiente) cdot (expoente) cdot x ^ = k cdot color cdot x ^ < color>)

Exemplo 3:

A derivada de um produto de duas funções, (f (x) = color cdot color <# 42a1f4>) onde (g (x) ) e (h (x) ) são funções diferenciáveis, é:

Exemplo 4

('(x) = color <(x ^ <2> + 2)> frac color <# 42a1f4> <(2x - 5)> + color <# 42a1f4> <(2x - 5)> frac cor <(x ^ <2> + 2)> ) $ = (x ^ <2> + 2) (2) + (2x - 5) (2x) qquad quad $ $ = 2x ^ <2> + 4 + 4x ^ <2> - 10x qquad qquad qquad $ $ = 6x ^ <2> - 10x + 4 qquad qquad qquad qquad $

Exemplo 5:

A derivada de uma função elevada a uma potência, (f (x) = [g (x)] ^), onde (g (x) ) é uma função diferenciável, é: $'(x) = color[g (x)] ^ < color> cdot '(x) $

Dado (f (x) = e ^), onde (g (x) ) é uma função diferenciável, a derivada é: $'(x) = e ^ cdot '(x) $

Dado (f (x) = ln <(g (x))> ), onde (g (x) ) é uma função diferenciável estritamente positiva, a derivada é: $'(x) = frac <1> cdot '(x) $


No tutorial a seguir, ilustramos como a regra de potência pode ser usada para encontrar o função derivada (função gradiente) de uma função que pode ser escrita (f (x) = ax ^ n ), quando (n ) é um inteiro positivo.

Encontre o derivado do função definido por: [f (x) = 2x ^ 4 ]

Solução Detalhada

Comparando a função (f (x) = 2x ^ 4 ) com o genérico "Função liga-desliga" (f (x) = ax ^ n ), podemos ver que: [a = 2 quad text quad n = 4 ] O regra de poder para diferenciação: [f '(x) = n vezes ax ^] portanto, leva a: [ begin f '(x) & = 4 vezes 2x ^ <3-1> f' (x) & = 8x ^ 2 end] O derivado é, portanto: [f '(x) = 8x ^ 2 ]


Limites como x Aproximações 0

Devemos lembrar que não podemos dividir por zero - é indefinido.

Mas existem alguns limites interessantes e importantes onde há um valor limitante como x aproxima-se de `0` e onde parece que temos um denominador` 0`.

Exemplo 3

Encontre o limite como x aproxima-se de `0` de` (sin x) / x`

Observe que não podemos simplesmente substituir 0 porque `(sin 0) / 0` é indefinido.

Não há processo algébrico para encontrar esse limite. Podemos substituir valores de x que se aproximam cada vez mais de `0` (tanto do lado esquerdo quanto do lado direito) e concluem que

Uma maneira de verificar isso é representar graficamente e ver que, de fato, o limite como x chega mais perto de `0` é` 1`:


A diferenciação nos permite encontrar taxas de mudança. Por exemplo, permite-nos encontrar a taxa de variação da velocidade em relação ao tempo (que é a aceleração). Também nos permite encontrar a taxa de variação de x em relação ay, que em um gráfico de y contra x é o gradiente da curva. Existem várias regras simples que podem ser usadas para nos permitir diferenciar muitas funções facilmente.

Se y = alguma função de x (em outras palavras, se y for igual a uma expressão contendo números ex), então o derivado de y (em relação ax) é escrito dy / dx, pronunciado "dee y por dee x".

Diferenciando x ao poder de algo

2) Se y = kx n, dy / dx = nkx n-1 (onde k é uma constante - em outras palavras, um número)

Portanto, para diferenciar x à potência de algo, você reduz a potência para a frente de x e, em seguida, reduz a potência em um.

Se y = x 4, dy / dx = 4x 3
Se y = 2x 4, dy / dx = 8x 3
Se y = x 5 + 2x -3, dy / dx = 5x 4 - 6x -4

Parece difícil, mas não é. O truque é simplificar a expressão primeiro: faça a divisão (divida cada termo no numerador por 3x ½. Obtemos:
(1/3) x 3/2 + (5/3) x ½ - x -½ (usando as leis dos índices).

Assim, diferenciando termo a termo: ½ x ½ + (5/6) x -½ + ½x -3/2.

Existem várias maneiras de escrever a derivada. Eles são todos essencialmente iguais:

(1) Se y = x 2, dy / dx = 2x
Isso significa que se y = x 2, a derivada de y, em relação a x, é 2x.

(2) d (x 2) = 2x
dx
Isso diz que a derivada de x 2 em relação ax é 2x.

(3) Se f (x) = x 2, f '(x) = 2x
Isso diz que é f (x) = x 2, a derivada de f (x) é 2x.

Encontrando o Gradiente de uma Curva

Uma fórmula para o gradiente de uma curva pode ser encontrada diferenciando a equação da curva.

Qual é o gradiente da curva y = 2x 3 no ponto (3,54)?
dy / dx = 6x 2
Quando x = 3, dy / dx = 6 × 9 = 54


Conteúdo

Uma função de uma variável real y = f(x) é diferenciável em um ponto a de seu domínio, se seu domínio contém um intervalo aberto I contendo a, e o limite

onde as barras verticais denotam o valor absoluto (ver (ε, δ) -definição de limite).

Diferenciação é a ação de calcular uma derivada. A derivada de uma função y = f(x) de uma variável x é uma medida da taxa em que o valor y das mudanças de função em relação à mudança da variável x . É chamado de derivado do f em relação a x . Se x e y são números reais, e se o gráfico de f é conspirado contra x , a derivada é a inclinação deste gráfico em cada ponto.

O caso mais simples, além do caso trivial de uma função constante, é quando y é uma função linear de x , o que significa que o gráfico de y é uma linha. Nesse caso, y = f(x) = mx + b , para números reais m e b , e a inclinação m É dado por

A fórmula acima é válida porque

Isso fornece o valor para a inclinação de uma linha.

Se a função f não é linear (ou seja, seu gráfico não é uma linha reta), então a mudança em y dividido pela mudança em x varia ao longo do intervalo considerado: a diferenciação é um método para encontrar um valor único para esta taxa de mudança, não em um determinado intervalo (Δ x), < displaystyle ( Delta x),> mas em qualquer valor dado de x .

A ideia, ilustrada pelas Figuras 1 a 3, é calcular a taxa de mudança como o valor limite da razão das diferenças Δy / Δx como Δx tende para 0.

Em direção a uma definição

A abordagem mais comum para transformar essa ideia intuitiva em uma definição precisa é definir a derivada como um limite de quocientes de diferença de números reais. [1] Esta é a abordagem descrita abaixo.

Deixar f ser uma função de valor real definida em uma vizinhança aberta de um número real uma . Na geometria clássica, a linha tangente ao gráfico da função f no uma era a única linha através do ponto (uma, f(uma)) que fez não Conheça o gráfico de f transversalmente, o que significa que a linha não passou direto pelo gráfico. A derivada de y em relação a x no uma é, geometricamente, a inclinação da linha tangente ao gráfico de f no (uma, f(uma)). A inclinação da linha tangente é muito próxima da inclinação da linha através de (uma, f(uma)) e um ponto próximo no gráfico, por exemplo (uma + h, f(uma + h)). Essas linhas são chamadas de linhas secantes. Um valor de h perto de zero dá uma boa aproximação da inclinação da linha tangente, e valores menores (em valor absoluto) de h irá, em geral, fornecer melhores aproximações. A inclinação m da linha secante é a diferença entre o y valores desses pontos divididos pela diferença entre os x valores, isto é,

Esta expressão é o quociente de diferença de Newton. A passagem de uma aproximação para uma resposta exata é feita usando um limite. Geometricamente, o limite das linhas secantes é a linha tangente. Portanto, o limite do quociente de diferença como h aproxima-se de zero, se existir, deve representar a inclinação da linha tangente para (uma, f(uma)). Este limite é definido como a derivada da função f no uma :

Quando o limite existe, f é dito ser diferenciável no uma . Aqui f ′ (uma) é uma das várias notações comuns para a derivada (veja abaixo). A partir desta definição, é óbvio que uma função diferenciável f está aumentando se e somente se sua derivada for positiva, e está diminuindo se sua derivada for negativa. Este fato é amplamente utilizado ao analisar o comportamento da função, por exemplo, ao encontrar extremos locais.

Equivalentemente, a derivada satisfaz a propriedade que

que tem a interpretação intuitiva (ver Figura 1) de que a linha tangente a f no uma dá o melhor aproximação linear

f (a + h) ≈ f (a) + f ′ (a) h

para f perto uma (ou seja, para pequenas h ) Esta interpretação é a mais fácil de generalizar para outras configurações (veja abaixo).

Substituindo 0 por h no quociente de diferença causa divisão por zero, então a inclinação da reta tangente não pode ser encontrada diretamente usando este método. Em vez disso, defina Q(h) para ser o quociente de diferença em função de h :

Q(h) é a inclinação da linha secante entre (uma, f(uma)) e (uma + h, f(uma + h)). Se f é uma função contínua, o que significa que seu gráfico é uma curva contínua sem lacunas, então Q é uma função contínua longe de h = 0. Se o limite limh→0Q(h) existe, o que significa que há uma maneira de escolher um valor para Q(0) que faz Q uma função contínua, então a função f é diferenciável em uma , e sua derivada em uma é igual a Q(0) .

Na prática, a existência de uma extensão contínua do quociente de diferença Q(h) para h = 0 é mostrado modificando o numerador para cancelar h no denominador. Tais manipulações podem tornar o valor limite de Q para pequeno h claro, embora Q ainda não está definido em h = 0. Esse processo pode ser longo e tedioso para funções complicadas e muitos atalhos são comumente usados ​​para simplificar o processo.

Exemplo

A função quadrada dada por f(x) = x 2 é diferenciável em x = 3, e sua derivada é 6. Este resultado é estabelecido calculando o limite como h aproxima-se de zero do quociente de diferença de f(3) :

f ′ (3) = lim h → 0 f (3 + h) - f (3) h = lim h → 0 (3 + h) 2 - 3 2 h = lim h → 0 9 + 6 h + h 2 - 9 h = lim h → 0 6 h + h 2 h = lim h → 0 (6 + h). < displaystyle < beginf '(3) & amp = lim _< frac > = lim _-3^<2>>> [10pt] & amp = lim _-9>> = lim _>> = lim _<(6 + h)>. Fim>>

A última expressão mostra que o quociente de diferença é igual a 6 + h quando h ≠ 0 e é indefinido quando h = 0, devido à definição do quociente de diferença. No entanto, a definição do limite diz que o quociente de diferença não precisa ser definido quando h = 0. O limite é o resultado de deixar h ir para zero, o que significa que é o valor que 6 + h tende a como h torna-se muito pequeno:

Portanto, a inclinação do gráfico da função quadrada no ponto (3, 9) é 6 e, portanto, sua derivada em x = 3 é f ′ (3) = 6 .

Mais geralmente, um cálculo semelhante mostra que a derivada da função quadrada em x = uma é f ′ (uma) = 2uma :

f ′ (a) = lim h → 0 f (a + h) - f (a) h = lim h → 0 (a + h) 2 - a 2 h = lim h → 0 a 2 + 2 ah + h 2 - a 2 h = lim h → 0 2 ah + h 2 h = lim h → 0 (2 a + h) = 2 a < displaystyle < beginf '(a) & amp = lim _< frac > = lim _-a^<2>>> [0.3em] & amp = lim _< frac + 2ah + h ^ <2> -a ^ <2>>> = lim _>> [0.3em] & amp = lim _<(2a + h)> = 2a fim>>

Se f é diferenciável em uma , então f também deve ser contínuo em uma . Por exemplo, escolha um ponto uma e deixar f seja a função de etapa que retorna o valor 1 para todos x Menor que uma e retorna um valor diferente de 10 para todos x Melhor que ou igual a uma . f não pode ter uma derivada em uma . Se h é negativo então uma + h está na parte baixa do degrau, então a linha secante de uma para uma + h é muito íngreme, e como h tende a zero a inclinação tende ao infinito. Se h é positivo então uma + h está na parte alta do degrau, então a linha secante de uma para uma + h tem inclinação zero. Conseqüentemente, as linhas secantes não se aproximam de nenhuma inclinação única, então o limite do quociente de diferença não existe.

No entanto, mesmo se uma função for contínua em um ponto, ela pode não ser diferenciável lá. Por exemplo, a função de valor absoluto dada por f(x) = | x | é contínuo em x = 0, mas não é diferenciável aí. Se h é positivo, então a inclinação da linha secante de 0 a h é um, enquanto se h é negativo, então a inclinação da linha secante de 0 a h é negativo. Isso pode ser visto graficamente como uma "torção" ou uma "cúspide" no gráfico em x = 0. Mesmo uma função com um gráfico suave não é diferenciável em um ponto onde sua tangente é vertical: Por exemplo, a função dada por f(x) = x 1/3 não é diferenciável em x = 0 .

Em resumo, uma função que possui uma derivada é contínua, mas existem funções contínuas que não possuem uma derivada.

A maioria das funções que ocorrem na prática tem derivadas em todos os pontos ou em quase todos os pontos. No início da história do cálculo, muitos matemáticos presumiram que uma função contínua era diferenciável na maioria dos pontos. Em condições moderadas, por exemplo, se a função for monótona ou uma função de Lipschitz, isso é verdade. No entanto, em 1872, Weierstrass encontrou o primeiro exemplo de uma função que é contínua em todos os lugares, mas diferenciável em nenhum lugar. Este exemplo agora é conhecido como função Weierstrass. Em 1931, Stefan Banach provou que o conjunto de funções que possuem uma derivada em algum ponto é um conjunto escasso no espaço de todas as funções contínuas. [2] Informalmente, isso significa que dificilmente qualquer função contínua aleatória tem uma derivada em até mesmo um ponto.

Deixar f seja uma função que possui uma derivada em todos os pontos de seu domínio. Podemos então definir uma função que mapeia cada ponto x ao valor da derivada de f em x. Esta função é escrita f ′ E é chamado de função derivada ou o derivado de f .

Às vezes f tem uma derivada no máximo, mas não em todos os pontos de seu domínio. A função cujo valor em a é igual a f ′ (uma) sempre que f ′ (uma) é definido e em outro lugar é indefinido também é chamado de derivado de f . Ainda é uma função, mas seu domínio é estritamente menor do que o domínio de f .

Usando essa ideia, a diferenciação torna-se uma função de funções: A derivada é um operador cujo domínio é o conjunto de todas as funções que possuem derivadas em todos os pontos de seu domínio e cujo intervalo é um conjunto de funções. Se denotarmos este operador por D , então D(f) é a função f ′. Desde D(f) é uma função, ela pode ser avaliada em um ponto a. Pela definição da função derivada, D(f)(uma) = f ′ (uma) .

Para comparação, considere a função de duplicação dada por f(x) = 2x f é uma função com valor real de um número real, o que significa que toma números como entradas e tem números como saídas:

O operador D , no entanto, não é definido em números individuais. É definido apenas nas funções:

Porque a saída de D é uma função, a saída de D pode ser avaliado em um ponto. Por exemplo, quando D é aplicado à função quadrada, xx 2 , D produz a função de duplicação x ↦ 2x , que chamamos de f(x) Esta função de saída pode então ser avaliada para obter f(1) = 2 , f(2) = 4 e assim por diante.

Deixar f seja uma função diferenciável, e deixe f ′ Ser seu derivado. A derivada de f ′ (Se houver) está escrito f ′ ′ E é chamado de segunda derivada de f . Da mesma forma, a derivada da segunda derivada, se existir, é escrita f ′ ′ ′ E é chamado de terceira derivada de f . Dando continuidade a esse processo, pode-se definir, caso exista, o n th derivado como o derivado do (n-1) ésima derivada. Esses derivados repetidos são chamados derivados de ordem superior. O n a derivada também é chamada de derivado de ordem n.

Se x(t) representa a posição de um objeto no momento t , então as derivadas de ordem superior de x têm interpretações específicas em física. A primeira derivada de x é a velocidade do objeto. A segunda derivada de x é a aceleração. A terceira derivada de x é o idiota. E, finalmente, da quarta à sexta derivadas de x são snap, crackle e pop mais aplicáveis ​​à astrofísica.

Uma função f não precisa ter uma derivada (por exemplo, se não for contínua). Da mesma forma, mesmo que f tem uma derivada, pode não ter uma segunda derivada. Por exemplo, deixe

O cálculo mostra que f é uma função diferenciável cuja derivada em x < displaystyle x> é dada por

Na linha real, toda função polinomial é infinitamente diferenciável. Pelas regras de diferenciação padrão, se um polinômio de grau n é diferenciado n vezes, então se torna uma função constante. Todas as suas derivadas subsequentes são iguais a zero. Em particular, eles existem, então polinômios são funções suaves.

As derivadas de uma função f em um ponto x fornecer aproximações polinomiais para essa função perto x . Por exemplo, se f é duas vezes diferenciável, então

Se f é infinitamente diferenciável, então este é o início da série de Taylor para f avaliado em x + h por aí x .

Ponto de inflexão

Um ponto onde a segunda derivada de uma função muda de sinal é chamado de ponto de inflexão. [3] Em um ponto de inflexão, a segunda derivada pode ser zero, como no caso do ponto de inflexão x = 0 da função dada por f (x) = x 3 < displaystyle f (x) = x ^ <3>>, ou pode não existir, como no caso do ponto de inflexão x = 0 da função dada por f (x) = x 1 3 < displaystyle f (x) = x ^ < frac <1> <3> >>. Em um ponto de inflexão, uma função muda de ser uma função convexa para ser uma função côncava ou vice-versa.

Notação de Leibniz

Os símbolos d x < displaystyle dx>, d y < displaystyle dy> e d y d x < displaystyle < frac >> foram introduzidos por Gottfried Wilhelm Leibniz em 1675. [4] Ainda é comumente usado quando a equação y = f(x) é visto como uma relação funcional entre variáveis ​​dependentes e independentes. Então, a primeira derivada é denotada por

e já foi considerado um quociente infinitesimal. Derivadas mais altas são expressas usando a notação

A notação de Leibniz permite especificar a variável de diferenciação (no denominador), que é relevante na diferenciação parcial. Também pode ser usado para escrever a regra da cadeia como [Nota 2]

Notação de Lagrange

Às vezes referido como notação primária, [5] uma das notações modernas mais comuns para diferenciação é devida a Joseph-Louis Lagrange e usa a marca primária, de forma que a derivada de uma função f < displaystyle f> é denotada por f ′ < displaystyle f '>. Da mesma forma, a segunda e a terceira derivadas são denotadas

Para denotar o número de derivadas além deste ponto, alguns autores usam numerais romanos sobrescritos, enquanto outros colocam o número entre parênteses:

Notação de Newton

A notação de Newton para diferenciação, também chamada de notação de ponto, coloca um ponto sobre o nome da função para representar uma derivada de tempo. Se y = f (t) < displaystyle y = f (t)>, então

denotam, respectivamente, a primeira e a segunda derivadas de y < displaystyle y>. Esta notação é usada exclusivamente para derivadas com respeito ao tempo ou comprimento do arco. É normalmente usado em equações diferenciais em física e geometria diferencial. [6] [7] A notação de ponto, entretanto, torna-se incontrolável para derivadas de alta ordem (ordem 4 ou mais) e não pode lidar com múltiplas variáveis ​​independentes.

Notação de Euler

Se y = f(x) é uma variável dependente, então frequentemente o subscrito x está ligado ao D para esclarecer a variável independente x. A notação de Euler é então escrita

embora este subscrito seja frequentemente omitido quando a variável x é entendida, por exemplo, quando esta é a única variável independente presente na expressão.

A notação de Euler é útil para estabelecer e resolver equações diferenciais lineares.

A derivada de uma função pode, em princípio, ser calculada a partir da definição considerando o quociente de diferença e calculando seu limite. Na prática, uma vez que as derivadas de algumas funções simples são conhecidas, as derivadas de outras funções são calculadas mais facilmente usando as regras para obter derivadas de funções mais complicadas das mais simples.

Regras para funções básicas

Aqui estão as regras para os derivados das funções básicas mais comuns, onde uma é um número real.

  • Derivados de poderes: d d x x a = a x a - 1. < displaystyle < frac > x ^ = ax ^.>
  • Funções exponenciais e logarítmicas: d d x e x = e x. < displaystyle < frac > e ^= e ^.> d d x a x = a x ln ⁡ (a), a & gt 0 < displaystyle < frac > a ^= a ^ ln (a), qquad a & gt0> d d x ln ⁡ (x) = 1 x, x & gt 0. < displaystyle < frac > ln (x) = < frac <1>>, qquad x & gt0.> d d x log a ⁡ (x) = 1 x ln ⁡ (a), x, a & gt 0 < displaystyle < frac > log _ (x) = < frac <1>>, qquad x, a & gt0>
  • Funções trigonométricas: d d x sin ⁡ (x) = cos ⁡ (x). < displaystyle < frac > sin (x) = cos (x).> d d x cos ⁡ (x) = - sen ⁡ (x). < displaystyle < frac > cos (x) = - sin (x).> d d x tan ⁡ (x) = sec 2 ⁡ (x) = 1 cos 2 ⁡ (x) = 1 + tan 2 ⁡ (x). < displaystyle < frac > tan (x) = sec ^ <2> (x) = < frac <1> < cos ^ <2> (x) >> = 1+ tan ^ <2> (x).>
  • Funções trigonométricas inversas: d d x arcsin ⁡ (x) = 1 1 - x 2, - 1 & lt x & lt 1. < displaystyle < frac > arcsin (x) = < frac <1> < sqrt <1-x ^ <2> >>>, qquad -1 & ltx & lt1.> ddx arccos ⁡ (x) = - 1 1 - x 2, - 1 & lt x & lt 1. < displaystyle < frac > arccos (x) = - < frac <1> < sqrt <1-x ^ <2> >>>, qquad -1 & ltx & lt1.> ddx arctan ⁡ (x) = 1 1 + x 2 < displaystyle < frac > arctan (x) = < frac <1> <1 + x ^ <2> >>>

Regras para funções combinadas

Aqui estão algumas das regras mais básicas para deduzir a derivada de uma função composta a partir de derivadas de funções básicas.

Exemplo de computação

A derivada da função dada por

Aqui, o segundo termo foi calculado usando a regra da cadeia e o terceiro usando a regra do produto. As derivadas conhecidas das funções elementares x 2 , x 4, pecado (x), ln (x) e exp (x) = e x , bem como a constante 7, também foram usados.

Em relação a uma extensão hiperreal R ⊂ ⁎ R dos números reais, a derivada de uma função real y = f(x) em um ponto real x pode ser definida como a sombra do quociente ∆y / ∆x para infinitesimal ∆x , onde ∆y = f(x + ∆x) − f(x) Aqui, a extensão natural de f para os hiperreals ainda é denotado f . Aqui, diz-se que a derivada existe se a sombra for independente do infinitesimal escolhido.

Funções com valor vetorial

Uma função com valor vetorial y de uma variável real envia números reais para vetores em algum espaço vetorial R n . Uma função com valor vetorial pode ser dividida em suas funções de coordenadas y1(t), y2(t), . yn(t) , significa que y(t) = (y1(t), . yn(t)). Isso inclui, por exemplo, curvas paramétricas em R 2 ou R 3 As funções de coordenadas são funções de valor real, então a definição acima de derivada se aplica a elas. A derivada de y(t) é definido como o vetor, denominado vetor tangente, cujas coordenadas são as derivadas das funções de coordenadas. Isso é,

se o limite existe. A subtração no numerador é a subtração de vetores, não escalares. Se a derivada de y existe para cada valor de t, então y′ É outra função com valor vetorial.

Se e1, . en é a base padrão para R n , então y(t) também pode ser escrito como y1(t)e1 + ⋯ + yn(t)en . Se assumirmos que a derivada de uma função com valor vetorial retém a propriedade de linearidade, então a derivada de y(t) devemos ser

porque cada um dos vetores de base é uma constante.

Esta generalização é útil, por exemplo, se y(t) é o vetor de posição de uma partícula no tempo t então a derivada y′(t) é o vetor de velocidade da partícula no tempo t.

Derivadas parciais

Suponha que f é uma função que depende de mais de uma variável - por exemplo,

f pode ser reinterpretado como uma família de funções de uma variável indexada pelas outras variáveis:

Em outras palavras, cada valor de x escolhe uma função, denotada fx, que é função de um número real. [Nota 3] Ou seja,

Uma vez que um valor de x é escolhido, digamos uma, então f(x, y) determina uma função fuma que envia y para uma 2 + ay + y 2 :

Nesta expressão, uma é um constante, não um variável, assim fuma é uma função de apenas uma variável real. Consequentemente, a definição da derivada para uma função de uma variável se aplica:

O procedimento acima pode ser realizado para qualquer escolha de uma. Reunir as derivadas em uma função fornece uma função que descreve a variação de f no y direção:

Esta é a derivada parcial de f em relação a y. Aqui ∂ é um arredondado d Chamou o símbolo de derivada parcial. Para distingui-lo da letra d, ∂ às vezes é pronunciado "der", "del" ou "parcial" em vez de "dee".

Em geral, o derivativo parcial de uma função f(x1, …, xn) na direção xeu no ponto (uma1, . uman) é definido como:

∂ f ∂ x i (a 1,…, a n) = lim h → 0 f (a 1,…, a i + h,…, a n) - f (a 1,…, a i,…, a n) h. < displaystyle < frac < partial f> < partial x_>> (a_ <1>, ldots, a_) = lim _< frac , ldots, a_+ h, ldots, a_) -f (a_ <1>, ldots, a_, ldots, a_)>>.>

No quociente de diferença acima, todas as variáveis, exceto xeu são mantidos fixos. Essa escolha de valores fixos determina a função de uma variável

Em outras palavras, as diferentes escolhas de uma indexe uma família de funções de uma variável exatamente como no exemplo acima. Esta expressão também mostra que o cálculo de derivadas parciais se reduz ao cálculo de derivadas de uma variável.

Isso é fundamental para o estudo das funções de várias variáveis ​​reais. Deixar f(x1, . xn) ser uma função com valor real. Se todas as derivadas parciais ∂f / ∂xj de f são definidos no ponto uma = (uma1, . uman), essas derivadas parciais definem o vetor

que é chamado de gradiente de f no uma . Se f é diferenciável em todos os pontos em algum domínio, então o gradiente é uma função com valor vetorial ∇f que mapeia o ponto (uma1, . uman) para o vetor ∇f(uma1, . uman) Consequentemente, o gradiente determina um campo vetorial.

Derivadas direcionais

Se f é uma função de valor real em R n, então as derivadas parciais de f medir sua variação na direção dos eixos coordenados. Por exemplo, se f é uma função de x e y, então seus derivados parciais medem a variação em f no x direção e o y direção. Eles não medem, no entanto, diretamente a variação de f em qualquer outra direção, como ao longo da linha diagonal y = x . Estes são medidos usando derivadas direcionais. Escolha um vetor

O derivada direcional do f na direção de v no ponto x é o limite

Em alguns casos, pode ser mais fácil calcular ou estimar a derivada direcional após alterar o comprimento do vetor. Freqüentemente, isso é feito para transformar o problema no cálculo de uma derivada direcional na direção de um vetor unitário. Para ver como isso funciona, suponha que v = λvocê Onde você é um vetor unitário na direção de v. Substituto h = k/λ no quociente de diferença. O quociente de diferença torna-se:

Isso é λ vezes o quociente de diferença para a derivada direcional de f em relação a você. Além disso, considerando o limite como h tende a zero é o mesmo que tomar o limite como k tende a zero porque h e k são múltiplos um do outro. Portanto, Dv(f) = λDvocê(f) Por causa dessa propriedade de redimensionamento, as derivadas direcionais são freqüentemente consideradas apenas para vetores unitários.

Se todas as derivadas parciais de f existem e são contínuos em x, então eles determinam a derivada direcional de f na direção v pela fórmula:

Esta é uma consequência da definição da derivada total. Segue-se que a derivada direcional é linear em v, significa que Dv + C(f) = Dv(f) + DC(f) .

A mesma definição também funciona quando f é uma função com valores em R m . A definição acima é aplicada a cada componente dos vetores. Neste caso, a derivada direcional é um vetor em R m .

Derivada total, diferencial total e matriz Jacobiana

Quando f é uma função de um subconjunto aberto de R n para R m , então a derivada direcional de f em uma direção escolhida é a melhor aproximação linear para f naquele ponto e naquela direção. Mas quando n & gt 1, nenhuma derivada direcional única pode dar uma imagem completa do comportamento de f. A derivada total fornece uma imagem completa considerando todas as direções ao mesmo tempo. Ou seja, para qualquer vetor v Começando às uma, a fórmula de aproximação linear é válida:

Assim como a derivada de variável única, f ′(uma) é escolhido de forma que o erro nesta aproximação seja o menor possível.

Se n e m são ambos um, então a derivada f ′(uma) é um número e a expressão f ′(uma)v é o produto de dois números. Mas em dimensões superiores, é impossível para f ′(uma) para ser um número. Se fosse um número, então f ′(uma)v seria um vetor em R n enquanto os outros termos seriam vetores em R m e, portanto, a fórmula não faria sentido. Para que a fórmula de aproximação linear faça sentido, f ′(uma) deve ser uma função que envia vetores em R n para vetores em R m , e f ′(uma)v deve denotar esta função avaliada em v.

Para determinar que tipo de função é, observe que a fórmula de aproximação linear pode ser reescrita como

Observe que se escolhermos outro vetor C, então esta equação aproximada determina outra equação aproximada, substituindo C para v. Ele determina uma terceira equação aproximada, substituindo ambos C para v e uma + v para uma. Subtraindo essas duas novas equações, obtemos

Se assumirmos que v é pequeno e que a derivada varia continuamente em uma, então f ′(uma + v) é aproximadamente igual a f ′(uma) e, portanto, o lado direito é aproximadamente zero. O lado esquerdo pode ser reescrito de uma maneira diferente usando a fórmula de aproximação linear com v + C substituído por v. A fórmula de aproximação linear implica:

Isso sugere que f ′(uma) é uma transformação linear do espaço vetorial R n para o espaço vetorial R m . Na verdade, é possível fazer uma derivação precisa medindo o erro nas aproximações. Suponha que o erro nesta fórmula de aproximação linear seja limitado por uma constante de tempos ||v||, onde a constante é independente de v mas depende continuamente de uma. Então, depois de adicionar um termo de erro apropriado, todas as igualdades aproximadas acima podem ser reformuladas como desigualdades. Em particular, f ′(uma) é uma transformação linear até um pequeno termo de erro. No limite como v e C tendem a zero, deve, portanto, ser uma transformação linear. Uma vez que definimos a derivada total tomando um limite como v vai para zero, f ′(uma) deve ser uma transformação linear.

Em uma variável, o fato de a derivada ser a melhor aproximação linear é expresso pelo fato de ser o limite dos quocientes das diferenças. No entanto, o quociente de diferença usual não faz sentido em dimensões superiores porque geralmente não é possível dividir vetores. Em particular, o numerador e o denominador do quociente de diferença não estão no mesmo espaço vetorial: O numerador está no codomínio R m enquanto o denominador está no domínio R n . Além disso, a derivada é uma transformação linear, um tipo diferente de objeto tanto do numerador quanto do denominador. Para tornar precisa a ideia de que f ′(uma) é a melhor aproximação linear, é necessário adaptar uma fórmula diferente para a derivada de uma variável em que esses problemas desaparecem. Se f : RR , então a definição usual da derivada pode ser manipulada para mostrar que a derivada de f no uma é o número único f ′(uma) de tal modo que

porque o limite de uma função tende a zero se e somente se o limite do valor absoluto da função tende a zero. Esta última fórmula pode ser adaptada à situação de muitas variáveis ​​substituindo os valores absolutos por normas.

A definição do derivada total do f no uma, portanto, é que é a única transformação linear f ′(uma) : R nR m de tal modo que

Aqui h é um vetor em R n , então a norma no denominador é o comprimento padrão em R n . No entanto, f′(uma)h é um vetor em R m , e a norma no numerador é o comprimento padrão em R m . Se v é um vetor começando em uma, então f ′(uma)v é chamado de pushforward de v de f e às vezes é escrito fv .

Se a derivada total existe em uma, então todas as derivadas parciais e direcionais de f existe em uma, e para todos v, f ′(uma)v é a derivada direcional de f na direção v. Se escrevermos f usando funções de coordenadas, de modo que f = (f1, f2, . fm), então a derivada total pode ser expressa usando as derivadas parciais como uma matriz. Esta matriz é chamada de Matriz Jacobiana do f no uma:

A existência da derivada total f′(uma) é estritamente mais forte do que a existência de todas as derivadas parciais, mas se as derivadas parciais existem e são contínuas, então a derivada total existe, é dada pelo Jacobiano e depende continuamente de uma.

A definição da derivada total inclui a definição da derivada em uma variável. Ou seja, se f é uma função com valor real de uma variável real, então a derivada total existe se e somente se a derivada usual existe. A matriz Jacobiana se reduz a uma matriz 1 × 1, cuja única entrada é a derivada f′(x) Esta matriz 1 × 1 satisfaz a propriedade de que f(uma + h) − (f(uma) + f ′(uma)h) é aproximadamente zero, em outras palavras que

f (a + h) ≈ f (a) + f ′ (a) h.

Até a mudança de variáveis, esta é a afirmação de que a função x ↦ f (a) + f ′ (a) (x - a) < displaystyle x mapsto f (a) + f '(a) (xa)> é the best linear approximation to f at uma.

The total derivative of a function does not give another function in the same way as the one-variable case. This is because the total derivative of a multivariable function has to record much more information than the derivative of a single-variable function. Instead, the total derivative gives a function from the tangent bundle of the source to the tangent bundle of the target.

The natural analog of second, third, and higher-order total derivatives is not a linear transformation, is not a function on the tangent bundle, and is not built by repeatedly taking the total derivative. The analog of a higher-order derivative, called a jet, cannot be a linear transformation because higher-order derivatives reflect subtle geometric information, such as concavity, which cannot be described in terms of linear data such as vectors. It cannot be a function on the tangent bundle because the tangent bundle only has room for the base space and the directional derivatives. Because jets capture higher-order information, they take as arguments additional coordinates representing higher-order changes in direction. The space determined by these additional coordinates is called the jet bundle. The relation between the total derivative and the partial derivatives of a function is paralleled in the relation between the kth order jet of a function and its partial derivatives of order less than or equal to k.

By repeatedly taking the total derivative, one obtains higher versions of the Fréchet derivative, specialized to R p . O kth order total derivative may be interpreted as a map

which takes a point x em R n and assigns to it an element of the space of k-linear maps from R n para R m – the "best" (in a certain precise sense) k-linear approximation to f at that point. By precomposing it with the diagonal map Δ, x → (x, x) , a generalized Taylor series may be begun as

where f(uma) is identified with a constant function, xeuumaeu are the components of the vector xuma , and (Df)eu and (D 2 f)jk are the components of Df e D 2 f as linear transformations.

The concept of a derivative can be extended to many other settings. The common thread is that the derivative of a function at a point serves as a linear approximation of the function at that point.

  • An important generalization of the derivative concerns complex functions of complex variables, such as functions from (a domain in) the complex numbers C para C. The notion of the derivative of such a function is obtained by replacing real variables with complex variables in the definition. Se C is identified with R 2 by writing a complex number z as x + iy , then a differentiable function from C para C is certainly differentiable as a function from R 2 to R 2 (in the sense that its partial derivatives all exist), but the converse is not true in general: the complex derivative only exists if the real derivative is complex linear and this imposes relations between the partial derivatives called the Cauchy–Riemann equations – see holomorphic functions.
  • Another generalization concerns functions between differentiable or smooth manifolds. Intuitively speaking such a manifold M is a space that can be approximated near each point x by a vector space called its tangent space: the prototypical example is a smooth surface in R 3 . The derivative (or differential) of a (differentiable) map f: MN between manifolds, at a point x em M, is then a linear map from the tangent space of M at x to the tangent space of N at f(x) The derivative function becomes a map between the tangent bundles of M e N. This definition is fundamental in differential geometry and has many uses – see pushforward (differential) and pullback (differential geometry).
  • Differentiation can also be defined for maps between infinite dimensionalvector spaces such as Banach spaces and Fréchet spaces. There is a generalization both of the directional derivative, called the Gateaux derivative, and of the differential, called the Fréchet derivative.
  • One deficiency of the classical derivative is that very many functions are not differentiable. Nevertheless, there is a way of extending the notion of the derivative so that all continuous functions and many other functions can be differentiated using a concept known as the weak derivative. The idea is to embed the continuous functions in a larger space called the space of distributions and only require that a function is differentiable "on average".
  • The properties of the derivative have inspired the introduction and study of many similar objects in algebra and topology — see, for example, differential algebra.
  • The discrete equivalent of differentiation is finite differences. The study of differential calculus is unified with the calculus of finite differences in time scale calculus.
  • Also see arithmetic derivative.

Calculus, known in its early history as infinitesimal calculus, is a mathematical discipline focused on limits, functions, derivatives, integrals, and infinite series. Isaac Newton and Gottfried Leibniz independently discovered calculus in the mid-17th century. However, each inventor claimed the other stole his work in a bitter dispute that continued until the end of their lives.


Lecture Video and Notes

Video Excerpts

Flash and JavaScript are required for this feature.

Clip 1: Introduction to Rates of Change

Flash and JavaScript are required for this feature.

Flash and JavaScript are required for this feature.

Clip 3: Physical Interpretation of Derivatives

Flash and JavaScript are required for this feature.

Clip 4: Physical Interpretation of Derivatives, Continued


The classic generalization of derivatives most intuitively similar to higher dimensions is partial derivatives.

The notion of a derivative is inherently (up through real analysis) tied to the idea of a limit. Recall $ f'(x) = lim_ frac$ defines the derivative of $f$ at $x$ . If we extend to $mathbb R^n$ ( $n>1$ ) and set $x, h in mathbb R^n$ for $f: mathbb R^n o mathbb R^n$ , This limit is not defined as we don't have a rigorous notion of dividing two length- $n$ vectors.

Your question about using norms to define derivatives doesn't specify a specific construct, so let's look at a few.

In general, we want the derivative operator to return real numbers (both positive and negative) and ensure that the 1-dimensional case can "fall out" under simplification.

$ f'(x) = lim_ frac<||f(x+h) - f(x)||><||h||>$ We run into a first immediate problem with signs - all the 'derivatives' here must be positive (as both norms are always positive), so we could never have a negative derivative.

If we want Calculus 1 rules to fall out, this type of construct simply won't work. You can try this out with your favorite polynomial using $|| cdot || = |cdot|$ as a norm on $mathbb R$ .

The closest generalization of a derivative that uses norms is the total derivative of $f: mathbb R^n o mathbb R^m$ , defined implicitly as $f'(x)$ such that $ lim_ frac<||f(x+h) - (f(x) + f'(x) mathbf) ||> <|| mathbf||> = 0$

where $h in mathbb R^n$ is a vector. As $f(x)$ is a vector, $f'(x)$ is a $m imes n$ matrix. If $n=m=1$ , then we have a derivative in in the classical sense using $| cdot |$ as a norm. How do we compute $f'(x)$ then? It's actually a jacobian matrix, so we can build this concept using partial derivatives.


1 resposta 1

The chain rule for vector differentiation is a bit more complicated than that for scalar functions since you need to ensure the dimensions of each multiplication are well defined. For instance, suppose $dot(t) = f(y(t))$ for $tinmathbb$ . Then egin frac

dot_i(t) = frac
f_i(y(t)) = abla_y f_i(y(t))^ op dot(t)

ext$>. fim Compactly, we have that egin ddot(t) = egin abla_y f_1(y(t))^ op abla_y f_2(y(t))^ op vdots abla_y f_n(y(t))^ op end dot(t) = Df(y(t)) dot(t), end where $Df$ is the Jacobian of $f$ . Taking another derivative, egin frac

ddot_i(t) = frac
abla_y f_i(y(t))^ op dot(t) = left(frac
abla_y f_i(y(t)) ight)^ opdot(t) + abla_ f_i(y(t))^ op ddot(t) = left( abla^2_y f_i(y(t)) dot(t) ight)^ op dot(t) + abla_y f_i(y(t))^ op ddot(t) = dot(t)^ op abla^2_y f(y(t)) dot(t) + abla_y f_i(y(t))^ op ddot(t), end for $iin<1,2,dots,n>$ . Now, since the Hessian $ abla_y^2 f_i(y(t))$ is an $n imes n$ matrix, there is not really a simple method for combining the above equations into a vector equation for $frac
ddot(t)$ without introducing tensors or bi-linear forms.