无约束优化之单纯形法只需要计算目标函数值,是无需要一维搜索,也无需进行求导的一种直接法。 其优点计算比较简单,几何概念清晰,适用于目标函数求导比较困难或不知道目标函数的具体表达式而仅知道其具体计算方法的情况。
在优化算法的世界里,无约束优化是一个重要的领域,而单纯形法在其中独具特色。单纯形法作为一种直接法,有着令人瞩目的特性——它只需要计算目标函数值,既不需要进行一维搜索,也无需对函数进行求导。这使得它在许多复杂场景下都能大显身手。
单纯形法的独特优势
- 计算简便:相较于一些依赖复杂数学推导和计算的优化算法,单纯形法的计算过程相对简单。它避开了一维搜索和求导这两个可能带来较高计算成本的操作,直接通过目标函数值来推进优化进程。这就好比在错综复杂的迷宫中,单纯形法找到了一条相对直接的路径,无需在一些复杂的岔路上徘徊。
- 几何概念清晰:从几何角度来看,单纯形法的原理易于理解。想象在多维空间中,单纯形是一个具有特定几何形状的多面体(在二维空间是三角形,三维空间是四面体等)。算法通过不断调整这个单纯形的顶点位置,向着目标函数值更优的方向移动,就像在空间中逐步“挪动”这个多面体,直到找到最优解。
- 适用场景广泛:在实际应用中,我们常常会遇到目标函数求导困难的情况,或者根本不知道目标函数的具体表达式,只知道如何计算其值。比如在一些基于实验数据的模型优化中,我们只能通过一次次实验获取目标函数值,却难以用数学公式精确描述其导数。这时候,单纯形法就成为了我们的得力助手。
代码示例与分析
下面我们来看一段简单的Python代码示例,展示如何使用单纯形法进行无约束优化。这里我们以一个简单的二维目标函数为例:
import numpy as np def objective_function(x): return x[0] ** 2 + x[1] ** 2 def simplex_method(func, initial_points, alpha=1, gamma=2, rho=0.5, sigma=0.5, max_iter=1000, tol=1e - 6): n = len(initial_points[0]) points = np.array(initial_points) values = np.array([func(point) for point in points]) for _ in range(max_iter): worst_index = np.argmax(values) best_index = np.argmin(values) centroid = np.sum(points[np.arange(len(points))!= worst_index], axis=0) / (n) reflection = centroid + alpha * (centroid - points[worst_index]) reflection_value = func(reflection) if reflection_value < values[best_index]: expansion = centroid + gamma * (reflection - centroid) expansion_value = func(expansion) if expansion_value < reflection_value: points[worst_index] = expansion values[worst_index] = expansion_value else: points[worst_index] = reflection values[worst_index] = reflection_value else: if reflection_value < values[worst_index]: points[worst_index] = reflection values[worst_index] = reflection_value else: contraction = centroid + rho * (points[worst_index] - centroid) contraction_value = func(contraction) if contraction_value < values[worst_index]: points[worst_index] = contraction values[worst_index] = contraction_value else: points = (points - points[best_index]) * sigma + points[best_index] values = np.array([func(point) for point in points]) if np.max(values) - np.min(values) < tol: break return points[best_index], func(points[best_index]) initial_points = [[0, 0], [1, 0], [0, 1]] optimal_point, optimal_value = simplex_method(objective_function, initial_points) print("Optimal point:", optimal_point) print("Optimal value:", optimal_value)代码分析
- 目标函数定义:
def objective_function(x): return x[0] ** 2 + x[1] ** 2这里定义了我们要优化的目标函数,它是一个简单的二维函数,在这个例子中是一个以原点为中心的抛物面,其最小值在原点(0, 0)处。
- 单纯形法主体函数:
def simplex_method(func, initial_points, alpha=1, gamma=2, rho=0.5, sigma=0.5, max_iter=1000, tol=1e - 6):函数接受多个参数,包括目标函数func,初始单纯形的顶点initialpoints,以及控制算法行为的参数alpha(反射系数)、gamma(扩张系数)、rho(收缩系数)、sigma(压缩系数),最大迭代次数maxiter和收敛容差tol。
- 初始化:
n = len(initial_points[0]) points = np.array(initial_points) values = np.array([func(point) for point in points])确定单纯形的维度n,将初始顶点转换为numpy数组,并计算每个顶点对应的目标函数值。
- 迭代优化:
for _ in range(max_iter): worst_index = np.argmax(values) best_index = np.argmin(values) centroid = np.sum(points[np.arange(len(points))!= worst_index], axis=0) / (n)在每次迭代中,首先找到目标函数值最大(最坏)和最小(最好)的顶点索引,然后计算除最坏顶点外其他顶点的重心centroid。
- 反射操作:
reflection = centroid + alpha * (centroid - points[worst_index]) reflection_value = func(reflection)通过重心和最坏顶点计算反射点reflection,并计算其目标函数值reflection_value。
- 扩张或替换操作:
if reflection_value < values[best_index]: expansion = centroid + gamma * (reflection - centroid) expansion_value = func(expansion) if expansion_value < reflection_value: points[worst_index] = expansion values[worst_index] = expansion_value else: points[worst_index] = reflection values[worst_index] = reflection_value如果反射点的目标函数值比最好点还好,尝试进行扩张操作。如果扩张点更好,则用扩张点替换最坏点;否则用反射点替换。
- 收缩或压缩操作:
else: if reflection_value < values[worst_index]: points[worst_index] = reflection values[worst_index] = reflection_value else: contraction = centroid + rho * (points[worst_index] - centroid) contraction_value = func(contraction) if contraction_value < values[worst_index]: points[worst_index] = contraction values[worst_index] = contraction_value else: points = (points - points[best_index]) * sigma + points[best_index] values = np.array([func(point) for point in points])如果反射点不如最坏点,尝试收缩操作。如果收缩点仍不理想,则进行压缩操作,重新调整单纯形的大小和位置。
- 收敛判断:
if np.max(values) - np.min(values) < tol: break当单纯形各顶点目标函数值的差异小于收敛容差时,认为算法收敛,结束迭代。
通过这段代码,我们能直观地看到单纯形法是如何在二维空间中对目标函数进行优化的,也进一步体会到它简单直接又高效的特点。
总之,单纯形法以其独特的优势,在无约束优化领域占据着重要的一席之地,无论是理论研究还是实际应用,都值得我们深入探索和学习。