最佳控制 - The mini wiki

最佳控制编辑

最优控制理论是数学最优化中的分支，要找到动力系统在特定一段时间的控制，可以使特定的损失函数最佳化。最佳控制在科学、工程及作业研究上都有很多应用，例如其控制的系统可能是航天器，控制为其动力来源的火箭推进器，目标是在消耗最小燃料的情形下登陆月球，其系统也可能是国家的经济，目标是使失业降到最低，控制是财政政策及货币政策。系统也可以是作业研究的运筹学，以最佳控制的框架来进行研究。

2

相关

哈密顿-雅可比-贝尔曼方程是一个偏微分方程，是最佳控制的中心。HJB方程式的解是针对特定动态系统及相关成本函数下，可以有最小成本的控制实值函数。

在数学中，马可夫决策过程是离散时间随机最佳控制过程。它提供了一个数学框架，用于在结果部分随机且部分受决策者控制的情况下对决策建模。 MDP对于研究通过动态规划解决的最佳化问题很有用。 MDP至少早在1950年代就已为人所知；一个对马可夫决策过程的核心研究是
罗纳德·霍华德于1960年出版的《动态规划和马可夫过程》。它们被用于许多领域，包括机器人学，自动化，经济学和制造业。 MDP的名称来自俄罗斯数学家安德雷·马可夫，因为它们是马可夫链的推广。

在数学中，马可夫决策过程是离散时间随机最佳控制过程。它提供了一个数学框架，用于在结果部分随机且部分受决策者控制的情况下对决策建模。 MDP对于研究通过动态规划解决的最佳化问题很有用。 MDP至少早在1950年代就已为人所知；一个对马可夫决策过程的核心研究是
罗纳德·霍华德于1960年出版的《动态规划和马可夫过程》。它们被用于许多领域，包括机器人学，自动化，经济学和制造业。 MDP的名称来自俄罗斯数学家安德雷·马可夫，因为它们是马可夫链的推广。

在数学中，马可夫决策过程是离散时间随机最佳控制过程。它提供了一个数学框架，用于在结果部分随机且部分受决策者控制的情况下对决策建模。 MDP对于研究通过动态规划解决的最佳化问题很有用。 MDP至少早在1950年代就已为人所知；一个对马可夫决策过程的核心研究是
罗纳德·霍华德于1960年出版的《动态规划和马可夫过程》。它们被用于许多领域，包括机器人学，自动化，经济学和制造业。 MDP的名称来自俄罗斯数学家安德雷·马可夫，因为它们是马可夫链的推广。

在数学中，马可夫决策过程是离散时间随机最佳控制过程。它提供了一个数学框架，用于在结果部分随机且部分受决策者控制的情况下对决策建模。 MDP对于研究通过动态规划解决的最佳化问题很有用。 MDP至少早在1950年代就已为人所知；一个对马可夫决策过程的核心研究是
罗纳德·霍华德于1960年出版的《动态规划和马可夫过程》。它们被用于许多领域，包括机器人学，自动化，经济学和制造业。 MDP的名称来自俄罗斯数学家安德雷·马可夫，因为它们是马可夫链的推广。

在数学中，马可夫决策过程是离散时间随机最佳控制过程。它提供了一个数学框架，用于在结果部分随机且部分受决策者控制的情况下对决策建模。 MDP对于研究通过动态规划解决的最佳化问题很有用。 MDP至少早在1950年代就已为人所知；一个对马可夫决策过程的核心研究是
罗纳德·霍华德于1960年出版的《动态规划和马可夫过程》。它们被用于许多领域，包括机器人学，自动化，经济学和制造业。 MDP的名称来自俄罗斯数学家安德雷·马可夫，因为它们是马可夫链的推广。

可控制性是控制系统中的重要特性，在许多控制问题中都很重要，例如是否可以透过回授稳定一个本身不稳定的系统，或是最佳控制的相关问题。

可控制性是控制系统中的重要特性，在许多控制问题中都很重要，例如是否可以透过回授稳定一个本身不稳定的系统，或是最佳控制的相关问题。

哈密顿-雅可比-贝尔曼方程是一个偏微分方程，是最佳控制的中心。HJB方程式的解是针对特定动态系统及相关成本函数下，可以有最小成本的控制实值函数。

可控制性是控制系统中的重要特性，在许多控制问题中都很重要，例如是否可以透过回授稳定一个本身不稳定的系统，或是最佳控制的相关问题。