Loading [MathJax]/jax/output/CommonHTML/jax.js

Lagrange Multiplier

序言:對 n 維變數 X=[x1xn]
函數 f(X) 在 g(X)-c=0 的限制條件下 ( f(X) 為連續可導實函數 )
在相對極值處, Lagrange function F(X,λ)=f(X)+λ(g(X)c) 符合:
F=FX=[Fx1Fxn]=0    和    Fλ=0

用途:F 的極值,即為符合限制條件的 f 極值。可以透過 設 F 對 x1,x2,...,xn 與對 λ 梯度 = 0 求解



1. g(X)-c 的梯度函式,如代入座標 A=[a1, a2, ..., an]^T,即為 hyperplane g(X)-c=0 位於該座標的法向量

sol. using Taylor Expansion: g(X+ϵ)=g(X)+g(X)Tϵ+O(ϵ2)
如果  g(X+ϵ)=g(X),則g(X)Tϵ=0


2. f(X) 的梯度函式,如代入座標 B=[b1, b2, ..., bn]^T,即為函數f(X) 在該座標的最大上升方向

sol. using Taylor Expansion: f(X+ϵ)=f(X)+f(X)Tϵ+O(ϵ2)
if ϵ is fixed, f(X)Tϵ has maximum when ϵ=kf(X),k>0

如果 f(X)=0,則該點本身就是 f 即值的必要條件


3. 在相對極值處,f(X) 的梯度函式與 g(X) 的梯度函式 有比例關係 

sol. 假設在相對極值處的座標為 C=[c1, c2, ..., cn]^T,如果 f(C) 在 "g(C)之切空間"(g(C+ϵ)=g(C)) 上 的投影 不為0
則可以順著該投影方向以及反方向移動
g(C) 不變,但f(C) 可以變大及變小,矛盾


不會有往兩個方向都變大或都變小的狀況:如果如此,f 函數本身在C有極值,f(C) 會等於 0


故求解時,變數須滿足:f(X)+λg(X)=0


4. Lagrange Multiplier (單一限制條件)

在f(X)為相對極值,且g(X)-c=0 的條件下:

df(X)=fx1dx1+...+fxndxn
dg(X)=gx1dx1+...+gxndxn

{fx1dx1+λgx1dx1=0fx2dx2+λgx2dx2=0fxndxn+λgxndxn=0

加總上式:
df(X)+λdg(X)=0
integrate:
f(X)+λg(X)=constant
上式可改寫為:
f(X)+λ(g(X)c)=constant

而式中f(X)+λ(g(X)c)符合
1. (f(X)+λ(g(X)c))=0
2. (f(X)+λ(g(X)c))λ=0


5. 當有多個限制條件

設有m個限制條件:g1(X)=c1,g2(X)=c2,...,gm(X)=cm
設在相對極值的座標D=[d1,d2,...,dn]T,則在與 g1(D),g2(D),...,gm(D)共同垂直的空間中,g1(D+ϵ)=g1(D),g2(D+ϵ)=g2(D),...,gm(D+ϵ)=gm(D),

3.推導過程同理可得 f(D) 在其共同垂直的空間中,投影為0
故求解時,變數須滿足:f(X)+mk=1λkgk(X)=0

4.推導過程同理可得F=f(X)+mk=1λk(gk(X)ck)
F的極值,即為符合限制條件的f極值。可以透過 設F對x1,x2,...,xn與對λ1,λ2,...,λm偏微分=0求解

沒有留言:

張貼留言