优化问题中的近似方法与滚动算法
1. 价值空间近似
在优化问题中,我们常常会用到价值空间近似方法。通过拉格朗日乘数法对问题进行分解,可得到一个下界近似。对于原问题的每个可行解,拉格朗日项(2.17)在加入成本函数时贡献非正。当约束放松时,得到的最优成本会进一步降低。
将子系统解耦后,我们能分别求解每个子系统问题,从而得到可分离的下界近似:
(\sum_{i=1}^{n} \tilde{J}{i}^{k}(x{i}^{k}, \lambda)),其中 (k = 1, \ldots, N - 1)。
这个近似可用于获得次优的一步前瞻策略。我们还可以尝试对 (\lambda) 优化该近似,可以通过临时实验或更系统的优化方法。另外,也可以用更一般的拉格朗日项:
(\sum_{k=0}^{N - 1} \lambda_{k} \left(\sum_{i=1}^{n} c_{i} u_{i}^{k} - Nb\right)) 来替代项(2.17),其中 (\lambda_{0}, \ldots, \lambda_{N - 1} \geq 0) 是时变标量乘数。
2. 概率近似 - 确定性等价控制
确定性等价控制器(CEC)是基于修改底层概率结构进行问题近似的常见例子。它用固定在某些“典型”值的确定性变量替代随机干扰,就好像确定性等价原则成立一样。
CEC 的优势在于其计算需求远低于随机动态规划(DP)算法,它只需要在每个阶段求解一个确定性最优控制问题。该问题会得到一个最优控制序列,我们使用当前阶段的第一个控制分量,而丢弃其余分量。因此,CEC 能够利用确定性最优控制更灵活和强大的方法