《最优化交流讲席》2008-01各位同学:大家好!欢迎诸位选择《最优化理论基础》这门课,作为你从大学数学走向近代应用数学的学习过程中的一门课。最优化是应用数学的一个研究对象,它源于各类最优化问题,所形成的数学理论称为最优化理论,它的核心是探索和寻找问题的最优解,即使目标函数在各种约束条件下的最小值或最大值的解。在高等数学里我们学习了求一元和二元函数的极值,当然这还不够,最优化问题丰富多彩,所以,求解方法也多种多样。我们认为,学习最优化理论,第一步先要有问题意识,也就是你要有问题,这对中国学生来说,是个薄弱的环节,在这个网站里有一个《最优化练习题》,第一次练习我们就提供了不少题目,引导大家去观察、感觉身边的最优化问题。当然光有问题还不够,更需要建模。第2步是求解相应的最优化问题,也就是本课程的大部分内容。在这个讲席中,我们给大家对寻找最优解有一个直观的认识。看,这么复杂的函数,找出最优解真的不太容易。正因为如此,最优化理论和方法才那么有趣!在下面,我们用计算机画出了若干个特别的目标函数的图像,希望大家能够产生自己画这些图像的冲动,学习用计算机从不同的视角画出它们。这些直观的像对于启发产生求解问题的最优解时有用的。你会用计算机软件吗?如不会,赶紧学,对研究生来说,这是基本技能!祝你画图成功!在这门课中,动手试十分重要的!任课老师周国标范金燕王增琪2008.9.11无约束最优化问题的多个局部最优解和全局最优解例1222121121()()cos()cos()1400021010,1010xfXxxxxx=+−+−≤≤−≤≤(0-1)其图形如下:图1-1公式(1-2)的图形由等高线图可以看出在其定义域范围内存在17个局部优化极值点,但只存在唯一的一个全局极值点*(0,0)x=。例2“Two-dimensionalShubertfunction”55121211(,){cos[(1)]}{cos[(1)]}1010,1,2iiifxxiixiiixixi===++++−≤≤=∑∑(3-1)函数(3-1)的图像图3-1图3-2函数(3-1)的局部等高线图由等高线图可以看出,本函数极其不规则。定义域范围内,共有18点全局极小值点,局部极小值点的数量远远超过全局极小值点的数量。全局极小值12(,)186.73091fxx=−,每个全局极小值点具体坐标如下:全局极值点(5.48286,4.8580全局极值点(4.85805,5.4828(-7.08350,-7.70831),(-0.80032,-7.70831),(5.48286,-7.70831),(-7.70831,-7.08350),(-1.42513,-7.08350),(4.85805,-7.08350),(-7.08350,-1.42513),(-0.80032,-1.42513),(5.48286,-1.42513),(-7.70831,-0.80032),(-1.42513,-0.80032),(4.85805,-0.80032),(-7.08350,4.85805),(-0.80032,4.85805),(5.48286,4.85805),(-7.70831,5.48286),(-1.42513,5.48286),(4.85805,5.48286).例3“Two-dimensionalShubertfunction”551212112212(,){cos[(1)]}{cos[(1)]}(1.42513)(0.80032)1010,1,2iiifxxiixiiixixxxi===++++++++−≤≤=∑∑(3-2)函数(3-2)的图像图3-3函数(3-2)的局部等高线图由等高线图可以看出,本函数极其不规则。定义域范围内,只有唯一一个全局极小值点*(-1.42513,-0.80032)x=,局部极小值点的数量远远超过全局极小值点的数量。全局极小值12(,)186.73091fxx=−。例4“Six-humpcamelbackfunction”24222121111222221(,)[42.1][44],333,22fxxxxxxxxxxx=−+++−+−≤≤−≤≤(3-3)图3-4函数(3-3)的图像图3-5函数(3-3)的局部放大图像图3-6函数(3-3)的局部放大图像的等高线图这个函数有两个全局极小值点,分别在(0.08983,0.7126)−和(0.08983,0.7126)−处,同时函数的全局极小值()1.0316285fx=−。例5一般函数12222111(){sin()[()(1sin())]()}, 10 10, 1, 2, ,
n
i i n
i
i
f x k x x A k x x A
n
x i n
π
π π
−
+
=
= + − + + −
− ≤ ≤ =
∑
L
(3-4)
其中参数k 和A分别取10 和1,n表示这个问题的维数。
全 局 极 值 点
(-0.08983,0.712
全 局 极 值 点
(0.08983,-0.712
图3-7 函数(3-4)n=2 时的图像
图3-8 函数(3-4)n=2 时的局部图像
图3-9 函数(3-4)n=2 时的等高线图
图3-10 函数(3-4)n=2 时的局部等高线图
函数(3-3)只有唯一的一个全局极小值点,即 1, 1, 2, ,
i
x i n = = L 表示的点。函数极小值
为 (1,1, ,1) 0 f = L 。就此问题,本文测试的是 4 n = 的情况。
全局极值点(1,1)
局部极值点
全局极值点(1,1)
例6 “Generalized Rosenbrock’s Function”
29
2 2 2
1
1
( ) [100( ) (1 ) ], 30
i i i i
i
f X x x x x
+
=
= − + − ≤
∑
(3-5)
图3-11 函数(3-5)n=2 时的图像
图3-12 函数(3-5)n=2 时的等高线图
图3-13 函数(3-5)n=2 时的局部等高线图
函数(3-4)只有唯一的一个全局极小值点,即 1, 1, 2, ,
i
x i n = = L 表示的点。函数极小值为
(1,1, ,1) 0 f = L
。
例7 “Generalized Rastrigin’s Function”
30
2
1
( ) [ 100cos(2 ) 10], 5.12
i i i
i
f X x x x π
=
= − + ≤
∑
(3-6)
全局极值点(0,0)
图3-14 函数(3-6)n=2 时的图像
图3-15 函数(3-6)n=2 时的等高线图
函数(3-5)只有唯一的一个全局极小值点,即 0, 1, 2, ,
i
x i n = = L 表示的点。函数极小值为
(0, 0, , 0) 0 f = L ,
全局极值点(0,0)
例8 “Generalized Griewank Function”
30 30
2
1 1
1
( ) cos( ) 1, 600
4000
i
i i
i i
x
f X x x
i
= =
= − + ≤
∑ ∏
(3-7)
图3-14 函数(3-7)n=2 时的图像
函数(3-6)只有唯一的一个全局极小值点,即 0, 1, 2, ,
i
x i n = = L 表示的点。函数极小值为
(0, 0, , 0) 0 f = L 。
例8 “Shekel’s Foxholes Function”
1
25
2
6 1
1
1 1
( ) , 65.56
500
( )
i
j
i ij
i
f X x
j x a
−
=
=
⎡ ⎤
⎢ ⎥
⎢ ⎥ = + ≤
⎢ ⎥
+ −
⎢ ⎥
⎣ ⎦
∑
∑
(3-8)
其中,
32, 16, 0, 16, 32, 32, , 0, 16, 32
( )
32, 32, 32, 32, 32, 16, , 32, 32, 32
ij
a
− − − ⎛ ⎞
=
⎜ ⎟
− − − − − −
⎝ ⎠
L
L
图3-15 函数(3-8)的图像
函数(3-7)只有唯一的一个全局极小值点
*
( 32, 32) x = − − 。函数极小值为 ( 32, 32) 1 f − − ≈
例10 “Schaffer”
2 2
1 2
2 2 2
1 2
sin( 0.5)
( ) 0.5, 100
[1 0.01( ) ]
i
x x
f X x
x x
+ −
= − ≤
+ +
(3-9)
图3-16 函数(3-10)的图像
图3-17 函数(3-10)的局部图像
图3-18 函数(3-10)的局部等高线图
函数(3-9)只有唯一的一个全局极小值点
*
(0, 0) x = ,函数极小值为
(0, 0) 0.97943 f = − 。
全局极值点(0,0)