0 nên f(x°) < f(x). Vì X e c được chọn tùy ý nên x" là điếm cực tiểu toàn cục của f trên c . Nếu a = min (f(x) : X e C | thì A rgm inxeCf(x) trùng với tập c n )x : f(x) < a Ị .
Tập này lồi do hàm f(x) lồi (xem Định lý 2.18).
Hệ qu ả 2.7. Bất cứ điểm cực (lại địa pliương nào của một hàm lõm trên một tập lồi cũng là điểm cực đại toàn cục. Tập tất cả các điểm cực dại của m ột liàm lõm trẽn một tập lồi là lồi.
Định lý 2.20. M ột lìàm lồi chặt f trên một tập lồi c có nlứêit nhất một điểm cực tiểu trên c , nglũa là lập Argmin xeC f(x) gồm nhiêu nliất m ột phần lử.
C h ứ n g m in h . N êu f c ó hai điểm cực tiểu khác nhau X1, X2 e c thì do tính lồi chặt của f nên
f ( | x ' + j r ) < f ( x ' ) = f(x2),
điều này không thể xảy ra!
67
Ví dụ 2.9. Hàm lồi chặt một biến f(x) = X2 có duy nhất mội điểm cực tiểu X* = 0. Còn hàm lồi chặt f(x) = e x (x e R) không có điểm cực tiểu nào.
■&. Hàm lồi n biến có mối quan hệ chặt chẽ với hàm lồi mội biến. Ta có:
Đ ịnh lý 2.21. Hàm f(x), X e K", là liàm lồi khi và clù khi hàm một biến số(ỹ{ì.) = f(x + Àd) là liàm lồi tlieo X với mỗi X, d e R". Chứng minh. Điều kiện cần là rõ ràng. Ta chứng minh điều kiện đủ. Giả sử w)x + Ằy) = f(x + x.d) = ọ (X) = cp(( 1 - A.).0 + 'h. 1 ) < ( 1 - X)q>(0 ) + 1 ) = ( 1 - X)f(x) + >J(y).
2.2.2. H àm lói liên tục
Định lý 2.22. Hàm lồi chính thường f trên R n liên tục tại mọi điểm trong của miền hữu dụng của nó (f liên tục trên int (dom f))-
Chứng m inh. Giả sử x° 6 int (dom 0- Với mọi i = 1, , n, hàm thu hẹp của f trên khoảng mở {t : Xo + te' e int (dom f)l liên tục trên khoảng này. Vì thế, với mọi E > 0 cho trước và với mọi i = 1 , , n ta có thể chọn 5, > 0 đủ nhỏ sao cho
lf(x° + X) - f(x°)l < 8 V x e [- 6,e\ + 5,e'].
Giả sừ ỗ = min ) ô, : i = 1....... n Ị > 0 và
B = (x : llxll, < ÔỊ (llxll, = max {lxàl , ..., lxnl|).
Ký hiệu d' = Se1. dn+' = - Se1, i = 1. , n. Khi đó, có thể thấy rằng mọi X e B có dạng X = ^ d ' + ... + A.2nd2n với Xị + ... + = 1, > 0. Từ đó
f(x° + x) < A.,f(x° + d 1) + ... + X,2nf(x° + d2n).
68
Vì thế,
f(x° + X) - f(x°) < Ầ,[f(x° + d1) - f(x°)] + ... + ^ n[f(x° + d2") - «Xo)]. Như vậy,
lf(x° + X) - f(x°)l
< Ầ ,lf(x n + d 1) - f(x °)l + ... + X.2nlf(x° + d 2n) - f(x °)l < E với mọi X e B. Điều này chứng tỏ f(x) liên tục tại x°.
N hận xét 2.4. Một hàm lồi chính thường chỉ có thể gián đoạn tại những điểm biên của miền hữu dụng của nó.
Ví dụ 2.10. Xét hàm một biến số xác định trên tập D = [0, + oo) có dạng: f(x) = ex với mọi X > 0 và f(0) = 2. Dễ thấy epi f là tập lồi nên f là hàm lồi trên D. Hàm f liên tục tại mọi điểm trong X > 0 và gián đoạn tại điểm biên X = 0. Tại X = 0 hàm f nửa liên tục trên.
Đ ịnh lý 2.23. Giả sử f là một liàm lồi clĩính tliườiig trên R". Klii đó, các điều sau đây là tương đương:
a) f liên tục tại điểm Xo.
b) f bị chặn trên trong một tập m ỏ chứa x°.
c) int (epi f ) * 0 .
d) int (dom f) * 0 và f liên lục trên int (dom f).
C hứng m inh.
a) => b) Nếu f liên tục tại điểm x° thì tồn tại một lân cận mờ u của Xo sao cho f(x) < f(x°) + 1 với mọi X e u , tức là f(x) bị chặn trên trong u .
b) => c) N ếu f(x) < M với mọi X trong một tập m ở u thì u X [M, +00) c epi f, vì thế int (epi f) * 0-
c) => d) Nếu int (epi f) * 0 thì tồn tại một tập mở u c 1" và một khoảng mở I c: K sao cho u XI c epi f, nên u c dom f, nghĩa
69
là int (dom f) khác rỗng. Theo Định lý 2.22 hàm f liên tục Irẽn int (d o m f).
d) => a) là hiên nhiên.
2.2.3. H àm lồi khá vi
Định lý 2.24 ([17], trang 44).
a) Một hàm thực một bien cp(l) kliá vi troiiỊỊ một klioàiiỊỊ mà lù lồi klìi và chỉ kill dạo hàm của nó cp’(t) là một hàm không ỊỊŨim.
b) Mội liàm thực một biến cp(t) liai lần kluỉ vi trong một klittàng nui là lồi klii và chi khi (lạo liàm cấp liai cùa nó ọ"(t) không âm Il l’ll loàn bộ khoảniỊ mở Iiàv.
Ví dụ 2.11. Các hàm c \ x2k với k = 1,2, ... và hàm xlogx (dược xác định bằng 0 khi X = 0) lồi trong R +. Các hàm Inx, yf\ lõm trong
's. Đè nhận biết hùm lồi. người ta còn sử dụng các tiêu chuẩn sau (trường hợp khá vi).
Định lý 2.25. Clio một tập lồi C c R " và một liíim f : R" -> R khá vi trên c .
a) H ừ m f lồ i Il l'll c k lii và c l i ỉ U ú
f(y) > f(x) + với mọi X. y 6 c.
b) N ế u f(y ) > f(x ) + < V f( x ), y - x > với m ọ i X, y e c , X * y thì hùm f lồi chặt trên c .
C hứng m inh, a) Giá sử hàm f lồi trên c . Vứi mọi X. V 6 c và với mọi số Ằ e [0. 1 ], ta có
Âf(y) + (1 - Â)f(x) > t'[Ây + ( 1 ->.)x].
Từ đó suy ra
v ) 6 | 0
70
Cho qua giới hạn ở vế phải khi X 4 0+, ta được
f(y) - f(x) > .
Ngược lại, giả sử f(y) > f(x) + với mọi X, y e c . Với bất kỳ X, y 6 c và 0 < X < 1, đặt z = A.X + (1 - >0y. Do c lồi nên z e c .
Với X và z ta có f(x) - f(z) > .
Với y và z ta có f(y) - f(z) > .
Nhân bất đẳng thức đầu với X, bất đẳng thức sau với (1 - X) và cộng lại ta có
Xf(x) - Xf(z) + ( 1 - x.)f(y) - ( 1 - X)f(z)
> Ả + (1 - X.)
hay Xf(x) + ( 1 - X)f(y) > f(z) + - = f(z). Nhớ rằng z = Xx + ( 1 - Ầ)y nên bất đẳng thức trên trở thành Xf(x) + (1 - Ằ)f(y) > f(A.x + (1 - X)y).
điều này chứng lỏ hàm f lồi.
Phần b) chứng minh hoàn toàn tương tự như chứng minh điều kiện đù của a) ờ trên.
Định lý 2.26. Cho một tập lồi m ở C a Rn và một hàm f : Rn —» R liai lần kliả vi liên tục trên c . v 2f(x) là ma trận Hessian các dạo luìni riêng cấp 2 của ỉ tại X.
a) Nếu v 2f(x) nửa xác định dương Yin mỗi X e c ( > 0. với mọi y 6 R n) hoặc nếu v 2f(x) có mọi giá trị riêng không úm thì liàm f lồi trên c .
71
b) Nếu v 2f(x) xác định dương với m ỗi X 6 c (tức là > 0 , với mọi y e 0T \ (0 )) hoặc nếu v 2f(x) có mọi giá trị riêng dương thì hàm f lối chặt trẽn c .
c) Nếu c = 1" và hàm ỉ lồi tlù v 2f(x) nửa xác định dương với mọi X e R".
Chứng m inh, a) Với mọi X, y E c , theo công thức khai triển Taylor bậc 2 la có
f(y) = f(x) + + —
với a e [0, 1]. Vì thế, do v 2f nửa xác định dương nên ta nhận được f(y) > f(x) + < V f(x), y - x> với mọi X, y E c.
Từ Định lý 2.25 a) suy ra hàm f lồi.
b) Chứng minh tương tự như trong phần a) suy ra
f(y) > f(x) + < V f(x), y - x> với mọi X, y e c .
Theo Định lý 2.25 b) hàm f lồi chặt.
c) Giả sử f : r -» R là hàm lồi. Nếu v 2f(x) không nửa xác đ ị n h d ư ơ n g v ớ i m ọ i X € K n t h ì p h ả i c ó m ộ t p h ầ n t ử X e K n v à m ộ t phần tử y e IRn sao cho < 0. Do v 2f(x) gồm các hàm l i ê n t ụ c t h e o X n ê n t a c ó t h ể c h ọ n y v ớ i llyll đ ủ n h ỏ s a o c h o < 0 với mọi a € [0, 1], Khi đó. lại dùng cõng thức khai triển Taylor bậc 2 ta suy ra
f(x + y) < f(x) + ,
trái với kết luận a) Định lý 2.25 vì f là hàm lồi. Vậy v 2f(x) nửa xác định dương với mọi X 6 Kn.
Hệ quả 2.8 (Điểu kiện cần cho hàm lồi I lõm). Giá sứ f : ỊRn -> R là một hàm hai lấn khả vi liên tục và fỹ(x) là dạo hàm riêng hai
lần của f theo cùng biến Xj.
72
a) N ếu f(x ) lồ i thì fjj (x ) > O, j = 1, . . . , n với m ọi X.
b) N ếu f(x) lõm thì fjj (x) < o, j = 1 ,..., n với mọi X.
c) N ếu f(x) lồi cliặt liay lõm chặt thì các bất đẳng thức trên được thay tương ứng bảng các bất đẳng thức thực sự > hay <■
Định lý 2.27. Cho Q là một ma trận vuông đối xứng thực cấp nxn. Hàm toàn phương f(x) = lồi khi và chỉ kill Q nửa xác định dương. Hơit nữa, hàm f lồi chặt klii và chỉ khi Q xác định dương.
C hứng m inh. Dễ kiểm tra rằng v 2f(x) = 2Q với mọi X e Kn. Vì thế, theo Định lý 2.26 a), c) hàm f lồi khi và chi khi ma trận Q nửa xác định dương.
Nếu Q xác định dương thì theo Định lý 2.26 b) hàm f lồi chặt. Ngược lại, nếu hàm f lồi chặt (do đó, f lồi) thì từ kết luận a) suy ra Q nửa xác định dương và do đó Q có mọi giá trị riêng không âm. Ta sẽ chứng tỏ Q xác định dương bằng cách chỉ ra Q không thể có giá trị riêng 0. Thật vậy, giả sử có một véctơ riêng X * 0 tương ứng với giá trị riêng 0, tức là X thỏa mãn Qx = 0. Nếu
. h í , M . R . „ . 0 * d . « i KU> * « . , ) ] - 0 . RO), .rái
với tính lồi chạt của hàm f.
H ệ qu ả 2.9. Hàm bậc hai
f(x) = — + + a
2
lồi (lồi chặt) trên R n khi và clii' khi ma trận Q nửa xác định dương (xác định dươìig) và f lõm (lõm cliặt) trên K" khi và chỉ khi ma trận Q nửa xác clịiìli ám (xác địnli âm).
Ví dụ 2.12. Xét hàm f(x) = f(X|, x2) = X f - 2x,x2 + 3x 2 . Ta thấy
Vf(x) =' 2x, - 2 x 2 ' V-2 X | + 6 x 2y
và v 2f(x) =
[ 2 -2 1
1 -2 6
73
Do v 2f(x) xác định dương với mọi X nên hàm f đã cho lồi chặt trên [R2.
2.2.4. Dưới vi phân
Định nghĩa 2.24. Cho hàm lồi chính thường f trên K", véctơ p e R" gọi là dưới gradient của f tại điểm x" nếu
+ f(x") < f(x), Vx £ 1". (2.8)
Nếu f lõm và trong (2.8) thay < bởi > thì p là dưới gradicnt cùa r ế ■ 0 r tại X .
Hình 2.24. Dưói gradient p e <9f(x°)
Tập tất cá các dưới gradient của f tại x" gọi là dưới vi pluìn cúa f tại x" và ký hiệu là ỡf(x"). Hàm f được gọi là kliá diári vi phán tại x" nếu + tn+lf(x") > + tn+la với mọi (x, a ) e epi f. 74
Vì (x, a ) e epi f kéo theo (x, ß) e epi f với mọi ß > a cho nên ta cũng có
+ tn+|f(xH) > + tn+lp với mọi ß > a
và cho ß —» + 00 ta suy ra tn+| < 0. Nhưng nếu tn+| = 0 thì bất đẳng thức này trở thành > với mọi X E dom f, tức là Xo đạt cự c đ ại c ủ a h à m tu y ế n tính trê n dom f, m à Xo 6 int (dom 0 , nên điều này chỉ có thể xảy ra khi t = 0, mâu thuẫn với (t. tn+|) * 0. Vậy tn+l < 0. Đặt p = - t/tn+| và a = f(x) ta sẽ nhận được bất đẳng thức (2.8).
Để chi rõ ỡf(x") lồi ta lấy bất kỳ p1, p2 e ổf(x"), X € [0, 1]. Khi đó với mọi x e r thì
<Ầp', X - x"> < Ầ(f(x) - f(x")) và
<(l -7i)p2, x - x " > < ( l -Ầ )(f(x)-f(x'’))
=> <^p' + ( 1 - Ầ)p2, X - x"> < f(x ) - f(x")
=> Ằ.p' + ( 1 - Ầ)p" 6 ổf(x") => ổf(x") lồi.
Đê chi rõ ổf(x°) là tập đóng, lấy pk e ổf(x"), pk -> p. Từ
< p k, X - x " > + f ( x " ) < f ( x ) v ớ i m ọ i X e D&"
s u y r a < p , X - x " > + f ( x ° ) < f ( x ) v ớ i m ọ i X e R n, c h ứ n g t ỏ p € ổ f( x " ). Ví dụ 2.13. Sau đây là dưới vi phân của một số hàm quen thuộc. I ) Hàm afin f(x) = + a (il e IR", a e R) có
ỡf(x) = (aỊ, (Vx e Kn).
2) Dưới vi phân cùa hàm chi ỗc(x) của một tập lồi c 5É 0 tại một điểm Xo e c chính là nón pháp tuyến ngoài của C:
ổôc(\°) = (p : < 0 Vx e C |.
3) Nếu f(x) = Il X il (chuẩn Euclid) thì
75
0 _ í { p : | | p | | < l } k h i X o = 0,
5f(x ) - | | xoỵ||xO||ỊkhẮ
is. Liên hệ giữa dưới vi phàn và đạo hàm: Theo định nghĩa, hàm f khả vi tại điểm x° nếu tồn tại véctơ Vf(x°) (véctơ gradieni cùa f tại x") sao cho f(x" + d) = f(x°) + + o(lldll). Điều nảy tương đương với
f(x ° + X .d ) - f ( x J = < v f(x «)i d>) Vd e
Ü0 X
Định lý 2.29. Nếu f là hàm loi chính thường, kliả vi lại điểm Xo € dom f thì ổf(x") = |V f(x")}, tức là Vf(x°) là véctơ dưới gradient duy nhất của f tại Xo.
Chứng m inh. Nếu p € ỡf(x°) thì với mọi d e IRn, d # 0, và mọi X > 0 ta có
+ f(x°) < f(x° + ^.d)
h a y f ( x ° + ?Ld) - f ( x ° ) > Ả.
.
Chia bất đẳng thức sau cho À. và cho qua giới hạn khi K -> 0+ ta được
> với mọi d e IRn.
Do đó > 0 với mọi d e R n. Từ đó suy ra p = Vf(x°).
Ngược lại có thể chứng minh rằng nếu f có tại x" một véctơ dưới gradient duy nhất thì f khả vi tại x°. Như vậy, khái niệm dưới gradient là sự mở rộng của khái niệm gradient (tại những điểm ờ đó hàm không khá vi).
• Đạo hàm theo hướng. Cho f : o r -> [-00, +00] là một hàm bất kỳ và Xo là một điểm tại đó f hữu hạn (nghĩa là lf(x°)l < + 00).
76
Đ ịnh nghĩa 2.25. Với d e R " \ (0 | nếu tồn tại giới hạn (hữu hạn hay không)
i:_ f ( x ° + M ) - f ( x ° ) lim ------------- ------------
Ü0 X
thì giới hạn đó gọi là đạo hàm theo hướng d của f tại Xo, ký hiệu là f (x , d).
Định lý 2.30ỗ Nếu f là hàm lồi clìínli tlìường thì f có đạo liàm tlieo mọi hướng tại mọi điểm Xo e d o m f v à f( x ° + d ) - f i x '1) > f ( x (l, d).
Chứng minh. Do hàm f lồi nên hàm một biến (p(Ầ) = f(x" + tai) lồi và theo Định nghĩa 2.25 thì
f (Xo, d) = lim k ± M z í < í ! > = Ị to ỉ & t m = cp' (0). ÜÖ X ÜÖ X
Nếu với mọi X > 0 mà x° + A.d Ể dom f thì f(x° + Ầd) = 0 cho nên (p+ (0) = + 00, và định lý đúng. Còn nếu
có một Ä-0 > 0 để x° + A,od e dom f thì với 0 < À. < A-0 ta có
X = — + ( 1 - — )x0 và 0 < — < 1.
X0 Ằ,0 X0
Do hàm (p lồi nên
cp(A.) < ^ tp ( ^ o ) + (1 - ^ )
0+. Vì thế tỉ số này dần tới một giới hạn (hữu hạn hoặc - 00)
lim Í Í M z S E „ i„ f î W z S Îg ) ,
, UÖ X >->0 Ả
đồng thời với mọi Ằ > 0 ta luôn có
77
(p(X) ^ > ẹ'+ (0 ) = f’(x". d).
A,
C h o K = 1 ta c ó (f)(1) - cp(0) > (p'+ (0), lức là f(x" + d ) - f(\" ) > r(x". d).
Định lý sau nêu mối liên hệ giữa dưới vi phân và đạo hàm theo hướng.
Định lý 2.31. Nếu f là một liàm lồi cliínli thường và x" 6 dom f th ì p e ỡ f(x (l) k h i v à c liỉ k lìi
< f ’(x". li) v ở i II1ỌI d 6 R " \ | 0 | .
C hứng m inh. Bàng cách đặt X = x" + A.d và .d), ta có thể viết lại bất đảng Ihức về dưới gradient (2.8) thành
< [f(x" + h i) - f(x")]A = [(P(X.) - cp(0)]A Vd * 0, V/. > 0. bất đẳng thức này tương đương với
< in f)>() [(p(>.) - cp(0)] / với mọi d. Từ chứng minh Định lý 2.30 cho thây in f>>0[ọ(/.) - cp(0)]A = f’(x", d) với mọi d 0. Vì thế, ta có
< f ’(x", d) với mọi d * 0.
2.2.5. H àm lồi m ạnh
Sau đây ta xét một lớp hàm luôn có cực tiểu trôn mọi tập đóng khác rỗng. Hơn nữa, giống như đối với hàm lồi chặt, cực tiêu này là duy nhất nếu tập đó là lồi.
Định nghĩa 2.26. Hàm f(x) xác định trên một tập lồi C c R " gọi là lồi m ạnh, nếu tồn tại hằng số p > 0 (hằng sô' lồi mạnh) sao cho với V X, y € c và mọi số Ằ e [0, 1] ta có bất đáng thức:
f U x + ( 1 - À )y ] < /,f(x ) + ( 1 - X )f(y ) - M 1 - À.)pllx - yll".
Có thể chứng minh rằng hàm f(x) lồi mạnh khi và chỉ khi hàm f(x) - p.llxll lồi. Rõ ràng một hàm lồi mạnh thì lồi chặt, nhưng điều ngược lại không chắc đúng. Chẳng hạn, hàm e x với m ọi X e R . lồi chặt nhưng không lồi mạnh.
78
Các hàm lồi mạnh có vai trò đặc biệt quan trọng trong nghiên cứu các bài toán tối ưu.
Ví dụ 2.14ế Hàm f(X|, x2) = x f + 2x? lồi mạnh. Tống quát, xét hàm bậc hai
f(x) = — + ,
với Q là một ma trận vuông đối xứng cấp n xác định dương và p 6 R". Tính lồi mạnh của f được suy ra từ hệ thức (sau khi thực hiện một số tính toán đơn giản):
f[Ằx + ( 1 - Ầ)y] < ;ư(x) + ( ] - ^)f(y) - Ằ( 1 - X)<\ - y, Q(x - y)> < Ảf(x) + ( 1 - Ầ)f(y) - Ằ( 1 - A.)pllx - yll2,
đè ý rằng với 0 < X < 1 thì Ằ.2 < Ấ, ( 1 - A.)2 < ( 1 - ^-) và vì rằng > pllx - yll2,
trong đó p là giá trị riêng nhỏ nhất (dương) của ma trận Q.
Định lý 2 .32. N ếu liàm f(x) lồi mạnh và khả vi trên tập lồi dóng c thì
a) > pllx - yll2 với mọi X, y 6 C;
b) với bất kỳ x° 6 c tập mức dưới C() = ( X e c : f(x) < f(x°) Ị bị chặn;
c) tồn tại duy nliâ't điểm X* e c sao cho f(x*) = min ( f(x) : X e C ).
C hứng m inh, a) Do f lồi khả vi nên theo Định lý 2.25, với mọi X, y e c thì
f(x) - f(y) < .
Hơn nữa, do f lồi mạnh nên với X = — ta có:
2
79