最优控制 编辑
最优控制理论是数学最优化中的分支,要找到动力系统在特定一段时间的控制,可以使特定的损失函数最佳化。最佳控制在科学、工程及作业研究上都有很多应用,例如其控制的系统可能是航天器,控制为其动力来源的火箭推进器,目标是在消耗最小燃料的情形下登陆月球,其系统也可能是国家的经济,目标是使失业降到最低,控制是财政政策货币政策。系统也可以是作业研究的运筹学,以最佳控制的框架来进行研究。
1
相关
贝尔曼拟谱法是针对最优控制的拟谱法,以贝尔曼方程为基础,是I. Michael Ross提出拟谱最佳控制中的一部分。此方法得名自理查德·贝尔曼,是由I. Michael Ross开始使用,一开始是用来求解多尺度的最佳控制问题,后来扩展到一般最佳问题的次佳解。
罗斯π引理,得名自以撒·麦克·罗斯,是计算最优控制的结果。以产生反馈控制的Caratheodory-π解为基础,罗斯π引理提到存在基本的时间常数,是一控制系统需要针对其可控制性及稳定性理论进行计算的。此时间常数称为罗斯时间常数,和统御非线性控制系统之向量场的利普希茨连续成反比。
最优控制中的控制是指控制器选定的变数,用来调整状态变数,类似实际控制阀的情形。控制和状态变数不同,没有事先指定的运动方程。最优控制理论的目标是要在可行集内找到控制量的序列,让状态变数在最佳路径上,使损失函数最小。
切比雪夫拟谱法是以切比雪夫多项式为基础的最优控制方法,是Michael Ross所创的拟谱最佳控制理论中的一部分。切比雪夫拟谱法和勒壤得拟谱法不同,无法立刻提供高精度的积分解。因此有二种从切比雪夫拟谱法衍生的技术,一个是Elnagar等人所提出的,另一个则是Fahroo和Ross所提出的。这两种方式的差异是其求积的技术。现今Ross–Fahroo拟谱法较常使用,因为Clenshaw–Curtis求积比较容易实现,比Elnagar–Kazemi的栏元平均法要容易。Trefethen在2008年证明Clenshaw–Curtis求积法几乎和高斯求积一样的准确
。这个突破性的结果开启了针对切比雪夫拟谱法的伴随向量映射原理研究。有关切比雪夫拟谱法的完整数学原理已在2009年由Gong、Ross及Fahroo所提出。
代数Riccati方程是最优控制的非线性方程,和连续时间或是离散时间下,无限时间的最优控制有关。
最优控制中的勒壤得拟谱法是以勒让德多项式为基础的方式。是拟谱最佳控制中的一部分,后者是由I. Michael Ross所命名的理论。勒壤得拟谱法的基本版本最早是由Elnagar等人在1995年提出。之后,I. Michael Ross、Fariba Fahroo等人延伸扩展此方法,应用到更大范围的问题中。其中一个受到广泛宣传的应用是用此方法来产生国际空间站的实时轨迹。
协态方程最优控制中用到的状态方程有关,也称为辅助方程、伴随方程、影响方程或是乘数方程。协态方程是向量一阶常微分方程
最优控制中的哈密顿量是由列夫·庞特里亚金所发展,是庞特里亚金最小化原理的一部分。哈密顿量的概念是由古典力学中的哈密顿力学所引发,但两者是不同的概念。庞特里亚金证明了求解最优控制问题的必要条件,就是要选择可使哈密顿量最小化的控制输入。细节可参考庞特里亚金最小化原理。
最优控制中的哈密顿量是由列夫·庞特里亚金所发展,是庞特里亚金最小化原理的一部分。哈密顿量的概念是由古典力学中的哈密顿力学所引发,但两者是不同的概念。庞特里亚金证明了求解最优控制问题的必要条件,就是要选择可使哈密顿量最小化的控制输入。细节可参考庞特里亚金最小化原理。
最优控制中的奇异控制是指一些不容易求解,无法利用庞特里亚金最小化原理求出完整解的问题。这类问题中只有少部分已有解答,例如金融经济学中的默顿的投资组合问题或是航空学中的轨迹最佳化问题。以下有进一步的技术说明。