У математиці , зокрема математичному аналізі похідною за напрямком у деякій точці називається величина, що інтуїтивно показує швидкість зміни значення функції під час руху в напрямку деякого вектора.
Поняття похідної за напрямком узагальнює часткові похідні , які є похідними в напрямку координатних прямих.
У випадку аналізу на многовидах узагальненням похідної за напрямком є дотичний вектор .
Формальне визначення
Похідною функції
f
(
p
)
=
f
(
p
1
,
p
2
,
…
,
p
n
)
{\displaystyle f(p)=f(p_{1},p_{2},\ldots ,p_{n})}
за напрямком
v
=
(
v
1
,
…
,
v
n
)
{\displaystyle \mathbf {v} =(v_{1},\ldots ,v_{n})}
є функція визначена рівністю:
∇
v
f
(
p
)
=
lim
h
→
0
f
(
p
+
h
v
)
−
f
(
p
)
h
.
{\displaystyle \nabla _{\mathbf {v} }{f}(p)=\lim _{h\rightarrow 0}{\frac {f(p+h\mathbf {v} )-f(p)}{h}}.}
Властивості
Властивості оператора
∇
v
{\displaystyle \nabla _{\mathbf {v} }}
Похідна по напрямку має багато властивостей, які задовольняє і звичайна похідна . Нижче
v
=
(
v
1
,
…
,
v
n
)
{\displaystyle \mathbf {v} =(v_{1},\ldots ,v_{n})}
— деякий фіксований вектор , а f і g — функції визначені в деякому околі точки p для яких в цій точці існує похідна за напрямком v . Тоді справедливі наступні твердження:
∇
v
(
f
+
g
)
=
∇
v
f
+
∇
v
g
{\displaystyle \nabla _{\mathbf {v} }(f+g)=\nabla _{\mathbf {v} }f+\nabla _{\mathbf {v} }g}
Множення на константу : Для довільного числа
c
∈
R
{\displaystyle c\in \mathbb {R} }
,
∇
v
(
c
f
)
=
c
∇
v
f
{\displaystyle \nabla _{\mathbf {v} }(cf)=c\nabla _{\mathbf {v} }f}
∇
v
(
f
g
)
=
g
∇
v
f
+
f
∇
v
g
{\displaystyle \nabla _{\mathbf {v} }(fg)=g\nabla _{\mathbf {v} }f+f\nabla _{\mathbf {v} }g}
Правило частки : Якщо також
g
(
x
)
≠
0
,
{\displaystyle g(x)\neq 0,}
то
∇
v
(
f
g
)
=
(
g
∇
v
f
−
f
∇
v
g
)
g
−
2
{\displaystyle \nabla _{\mathbf {v} }\left({\frac {f}{g}}\right)=(g\nabla _{\mathbf {v} }f-f\nabla _{\mathbf {v} }g)g^{-2}}
∇
v
(
h
∘
g
)
(
p
)
=
h
′
(
g
(
p
)
)
∇
v
g
(
p
)
.
{\displaystyle \nabla _{\mathbf {v} }(h\circ g)(p)=h'(g(p))\nabla _{\mathbf {v} }g(p).}
Властивості простору похідних за напрямками
Нехай для функції f в точці p існує похідна за напрямком v . Тоді для цієї функції в точці p існує похідна за напрямком c v для довільного числа
c
∈
R
{\displaystyle c\in \mathbb {R} }
і виконується рівність:
∇
c
v
(
f
)
=
c
∇
v
f
.
{\displaystyle \nabla _{c\mathbf {v} }(f)=c\nabla _{\mathbf {v} }f.}
Якщо функція
∇
v
f
(
p
)
{\displaystyle \nabla _{\mathbf {v} }{f}(p)}
визначена в деякому околі точки p і неперервна в цій точці і також у точці p існує похідна функції f за напрямком
u
=
(
u
1
,
…
,
u
n
)
{\displaystyle \mathbf {u} =(u_{1},\ldots ,u_{n})}
то визначена також
∇
v
+
u
f
(
p
)
{\displaystyle \nabla _{\mathbf {v+u} }{f}(p)}
і виконується рівність:
∇
v
+
u
f
(
p
)
=
∇
v
f
(
p
)
+
∇
u
f
(
p
)
{\displaystyle \nabla _{\mathbf {v+u} }{f}(p)=\nabla _{\mathbf {v} }{f}(p)+\nabla _{\mathbf {u} }{f}(p)}
З попереднього також випливає що якщо всі часткові похідні
∂
f
∂
x
i
(
p
)
{\displaystyle {\frac {\partial f}{\partial x_{i}}}(p)}
є визначені в околі точки p і неперервні в ній то існує похідна
∇
v
f
(
p
)
{\displaystyle \nabla _{\mathbf {v} }{f}(p)}
для довільного вектора
v
=
(
v
1
,
…
,
v
n
)
{\displaystyle \mathbf {v} =(v_{1},\ldots ,v_{n})}
і вона рівна:
∇
v
f
(
p
)
=
∑
i
=
1
n
v
i
∂
f
∂
x
i
(
p
)
.
{\displaystyle \nabla _{\mathbf {v} }{f}(p)=\sum _{i=1}^{n}v_{i}{\frac {\partial f}{\partial x_{i}}}(p).}
Множина похідних за напрямком у цьому випадку є векторним простором розмірності n .
Випадок диференційовних функцій
Якщо функція
f
{\displaystyle f}
є диференційовною в точці
p
{\displaystyle p}
, тоді в цій точці функція має похідні по усіх напрямках і
∇
v
f
(
p
)
=
∇
f
(
p
)
⋅
v
{\displaystyle \nabla _{\mathbf {v} }{f}(p)=\nabla {f}(p)\cdot \mathbf {v} }
де
∇
{\displaystyle \nabla }
— градієнт функції , а
⋅
{\displaystyle \cdot }
— скалярний добуток .
Доведення
Для диференційовної функції в точці
p
{\displaystyle p}
маємо:
f
(
p
+
h
v
)
=
f
(
p
)
+
∇
f
(
p
)
⋅
h
v
+
o
(
h
)
{\displaystyle f(p+h\mathbf {v} )=f(p)+\nabla f(p)\cdot h\mathbf {v} +o(h)}
Звідси отримуємо:
∇
v
f
(
p
)
=
lim
h
→
0
f
(
p
+
h
v
)
−
f
(
p
)
h
=
lim
h
→
0
∇
f
(
p
)
⋅
h
v
+
o
(
h
)
h
=
lim
h
→
0
∇
f
(
p
)
⋅
h
v
h
+
lim
h
→
0
o
(
h
)
h
{\displaystyle \nabla _{\mathbf {v} }{f}(p)=\lim _{h\to 0}{\frac {f(p+h\mathbf {v} )-f(p)}{h}}=\lim _{h\to 0}{\frac {\nabla f(p)\cdot h\mathbf {v} +o(h)}{h}}=\lim _{h\to 0}{\frac {\nabla f(p)\cdot h\mathbf {v} }{h}}+\lim _{h\to 0}{\frac {o(h)}{h}}}
І оскільки згідно означення:
lim
h
→
0
o
(
h
)
h
=
0
{\displaystyle \lim _{h\to 0}{\frac {o(h)}{h}}=0}
Остаточно отримуємо:
∇
v
f
(
p
)
=
∇
f
(
p
)
⋅
v
{\displaystyle \nabla _{\mathbf {v} }{f}(p)=\nabla f(p)\cdot \mathbf {v} }
Приклад
Загалом проте функція може бути недиференційовною навіть якщо вона має похідні за всіма напрямками.
Прикладом є функція
f
(
x
,
y
)
=
x
2
y
3
.
{\displaystyle f(x,y)={\sqrt[{3}]{x^{2}y}}.}
Для неї
∂
f
∂
x
(
0
,
0
)
=
∂
f
∂
y
(
0
,
0
)
=
0
{\displaystyle {\frac {\partial f}{\partial x}}(0,0)={\frac {\partial f}{\partial y}}(0,0)=0}
і загалом для вектора
v
=
(
v
1
,
v
2
)
{\displaystyle \mathbf {v} =(v_{1},v_{2})}
похідна за напрямком
∇
v
(
f
)
(
0
,
0
)
=
v
1
2
v
2
3
.
{\displaystyle \nabla _{\mathbf {v} }(f)(0,0)={\sqrt[{3}]{v_{1}^{2}v_{2}}}.}
Якщо
v
1
,
v
2
≠
0
,
{\displaystyle v_{1},v_{2}\neq 0,}
то очевидно
∇
v
(
f
)
≠
0
,
{\displaystyle \nabla _{\mathbf {v} }(f)\neq 0,}
тоді як
∇
f
(
0
,
0
)
⋅
v
=
0.
{\displaystyle \nabla f(0,0)\cdot \mathbf {v} =0.}
Тож
∇
f
(
0
,
0
)
⋅
v
≠
∇
v
(
f
)
(
0
,
0
)
{\displaystyle \nabla f(0,0)\cdot \mathbf {v} \neq \nabla _{\mathbf {v} }(f)(0,0)}
і функція не може бути диференційовною.
Характеристика похідних за напрямком для диференціальних функцій
Якщо деякий оператор
D
(
f
)
,
{\displaystyle D(f),}
що кожній диференційовній в околі точки p функції присвоює деяке дійсне число , задовольняє описаним вище правилам суми, добутку і множення на константу то
D
(
f
)
=
∇
v
f
,
{\displaystyle D(f)=\nabla _{\mathbf {v} }{f},}
для деякого вектора
v
=
(
v
1
,
…
,
v
n
)
.
{\displaystyle \mathbf {v} =(v_{1},\ldots ,v_{n}).}
Доведення
Функція f згідно означення є диференційовною зокрема в деякій кулі з центром у точці
p
=
(
p
1
,
…
,
p
n
)
{\displaystyle p=(p_{1},\ldots ,p_{n})}
. Позначаючи
y
=
(
y
1
,
…
,
y
n
)
{\displaystyle y=(y_{1},\ldots ,y_{n})}
— деяку точку в цій кулі можна записати:
f
(
y
1
,
…
,
y
n
)
=
f
(
y
1
,
…
,
y
n
)
−
f
(
y
1
,
…
,
y
n
−
1
,
p
n
)
+
f
(
y
1
,
…
,
y
n
−
1
,
p
n
)
−
f
(
y
1
,
…
,
y
n
−
2
,
p
n
−
1
,
p
n
)
+
…
+
f
(
y
1
,
p
2
,
…
,
p
n
)
−
f
(
p
1
,
…
,
p
n
)
+
f
(
p
1
,
…
,
p
n
)
.
{\displaystyle {\begin{aligned}f(y_{1},\ldots ,y_{n})=&f(y_{1},\ldots ,y_{n})-f(y_{1},\ldots ,y_{n-1},p_{n})+\\&f(y_{1},\ldots ,y_{n-1},p_{n})-f(y_{1},\ldots ,y_{n-2},p_{n-1},p_{n})+\ldots +\\&f(y_{1},p_{2},\ldots ,p_{n})-f(p_{1},\ldots ,p_{n})+f(p_{1},\ldots ,p_{n}).\end{aligned}}}
Зважаючи, що
f
(
y
1
,
…
,
y
k
,
p
k
+
1
,
…
,
p
n
)
−
f
(
y
1
,
…
,
y
k
−
1
,
p
k
,
…
,
p
n
)
=
∫
0
1
d
f
d
x
k
(
y
1
,
…
,
p
k
+
t
(
y
k
−
p
k
)
,
p
k
+
1
,
…
,
p
n
)
(
y
k
−
p
k
)
d
t
{\displaystyle f(y_{1},\ldots ,y_{k},p_{k+1},\ldots ,p_{n})-f(y_{1},\ldots ,y_{k-1},p_{k},\ldots ,p_{n})=\int _{0}^{1}{df \over dx_{k}}{\Big (}y_{1},\ldots ,p_{k}+t(y_{k}-p_{k}),p_{k+1},\ldots ,p_{n}{\Big )}(y_{k}-p_{k})dt}
де
d
f
d
x
k
{\displaystyle {df \over dx_{k}}}
позначає часткову похідну по k - ій змінній, можна записати:
f
(
y
1
,
…
,
y
n
)
=
f
(
p
1
,
…
,
p
n
)
+
∑
i
=
1
n
(
y
i
−
p
i
)
f
i
(
y
1
,
…
,
y
n
)
,
{\displaystyle f(y_{1},\ldots ,y_{n})=f(p_{1},\ldots ,p_{n})+\sum _{i=1}^{n}(y_{i}-p_{i})f_{i}(y_{1},\ldots ,y_{n}),}
де
f
k
(
y
1
,
…
,
y
n
)
=
∫
0
1
d
f
d
x
k
(
y
1
,
…
,
p
k
+
t
(
y
k
−
p
k
)
,
p
k
+
1
,
…
,
p
n
)
d
t
.
{\displaystyle f_{k}(y_{1},\ldots ,y_{n})=\int _{0}^{1}{df \over dx_{k}}{\Big (}y_{1},\ldots ,p_{k}+t(y_{k}-p_{k}),p_{k+1},\ldots ,p_{n}{\Big )}dt.}
Зокрема
f
k
(
p
1
,
…
,
p
n
)
=
d
f
d
x
k
(
p
1
,
…
,
p
n
)
.
{\displaystyle f_{k}(p_{1},\ldots ,p_{n})={df \over dx_{k}}(p_{1},\ldots ,p_{n}).}
З властивостей оператора маємо
D
(
c
)
=
c
D
(
1
)
=
c
D
(
1
⋅
1
)
=
c
(
1
⋅
D
(
1
)
+
D
(
1
)
⋅
1
)
=
2
c
D
(
1
)
⟹
D
(
c
)
=
0
,
{\displaystyle D(c)=cD(1)=cD(1\cdot 1)=c(1\cdot D(1)+D(1)\cdot 1)=2cD(1)\implies D(c)=0,}
де c — довільна стала функція .
Тому з використанням попереднього запису функції в межах кулі:
D
(
f
)
(
p
)
=
∑
i
=
1
n
(
D
(
x
i
)
f
i
(
x
1
,
…
,
x
n
)
+
(
x
i
−
p
i
)
D
(
f
(
x
1
,
…
,
x
n
)
)
)
(
p
)
=
∑
i
=
1
n
(
D
(
x
i
)
f
i
)
(
p
)
{\displaystyle {\begin{aligned}D(f)(p)&=\sum _{i=1}^{n}{\Big (}D(x_{i})f_{i}(x_{1},\ldots ,x_{n})+(x_{i}-p_{i})D(f(x_{1},\ldots ,x_{n})){\Big )}(p)\\&=\sum _{i=1}^{n}(D(x_{i})f_{i})(p)\end{aligned}}}
Позначивши
v
i
:=
D
(
x
i
)
{\displaystyle v_{i}:=D(x_{i})}
і зважаючи, що
f
k
(
p
)
=
d
f
d
x
k
(
p
)
{\displaystyle f_{k}(p)={df \over dx_{k}}(p)}
маємо
D
(
f
)
(
p
)
=
∇
f
(
p
)
⋅
v
,
{\displaystyle D(f)(p)=\nabla {f}(p)\cdot \mathbf {v} ,}
тобто
D
(
f
)
(
p
)
{\displaystyle D(f)(p)}
є похідною в напрямку
v
=
(
v
1
,
…
,
v
n
)
.
{\displaystyle \mathbf {v} =(v_{1},\ldots ,v_{n}).}
Напрямок найшвидшого зростання функції
Оскільки похідну за напрямком можна інтерпретувати, як швидкість зміни функції піч час руху в даному напрямку, то природно виникає питання про напрямок по якому функція зростає найшвидше.
Оскільки похідна за напрямком пропорційна довжині вектора то це питання має зміст лише при розгляді векторів однієї довжини, наприклад одиничних векторів . Тоді можна записати
v
=
(
cos
α
1
,
…
,
cos
α
n
)
,
{\displaystyle \mathbf {v} =(\cos \alpha _{1},\ldots ,\cos \alpha _{n}),}
де
α
1
,
…
,
α
n
{\displaystyle \alpha _{1},\ldots ,\alpha _{n}}
— кути між вектором
v
{\displaystyle \mathbf {v} }
і базисними векторами
e
1
,
…
,
e
n
.
{\displaystyle \mathbf {e} _{1},\ldots ,\mathbf {e} _{n}.}
Для довільного такого вектора можна записати:
∇
v
f
(
p
)
=
∇
f
(
p
)
⋅
v
=
|
∇
f
(
p
)
|
(
∇
f
(
p
)
|
∇
f
(
p
)
|
⋅
v
)
=
|
∇
f
(
p
)
|
⋅
cos
γ
{\displaystyle \nabla _{\mathbf {v} }{f}(p)=\nabla {f}(p)\cdot \mathbf {v} =|\nabla {f}(p)|\left({\frac {\nabla {f}(p)}{|\nabla {f}(p)|}}\cdot \mathbf {v} \right)=|\nabla {f}(p)|\cdot \cos \gamma }
, де
γ
{\displaystyle \gamma }
— кут між одиничними векторами
∇
f
(
p
)
|
∇
f
(
p
)
|
{\displaystyle {\frac {\nabla {f}(p)}{|\nabla {f}(p)|}}}
і
v
{\displaystyle \mathbf {v} }
. Очевидно, що значення косинуса буде найбільшим коли ці вектори будуть рівними, тобто
v
=
∇
f
(
p
)
|
∇
f
(
p
)
|
.
{\displaystyle \mathbf {v} ={\frac {\nabla {f}(p)}{|\nabla {f}(p)|}}.}
Тоді
∇
v
f
(
p
)
=
|
∇
f
(
p
)
|
=
(
d
f
d
x
1
)
2
+
…
+
(
d
f
d
x
n
)
2
.
{\displaystyle \nabla _{\mathbf {v} }{f}(p)=|\nabla {f}(p)|={\sqrt {\left({df \over dx_{1}}\right)^{2}+\ldots +\left({df \over dx_{n}}\right)^{2}}}.}
Отож напрямок найшвидшого зростання функції задається вектором
∇
f
(
p
)
|
∇
f
(
p
)
|
,
{\displaystyle {\frac {\nabla {f}(p)}{|\nabla {f}(p)|}},}
а сама швидкість зростання в цьому напрямку рівна
|
∇
f
(
p
)
|
.
{\displaystyle |\nabla {f}(p)|.}
Див. також
Література