当前位置首页 > 百科> 正文

自适应最优控制

2019-04-02 16:10:01 百科

自适应最优控制

自适应最优控制(Adaptive optimal control )是指根据控制对象本身参数或周围环境的变化,自动调整控制器参数以使控制系统的性能指标实现最最佳化的基本条件和综合方法,满意性能的自动控制系统。不论外界发生巨大变化或系统产生不确定性,控制系统能自行调整参数或产生控制作用,使系统仍能按某一性能指标运行在最佳状态的一种控制方法。

基本介绍

  • 中文名:自适应最优控制
  • 外文名:Adaptive optimal control 
  • 涉及学科:信息科学
  • 套用:自动化
  • 目的:性能指标实现最最佳化
  • 根据:本身参数或周围环境的变化

背景

为了有效地控制液压非线性系统,提出基于RYF神经网路的自适应最优控制系统,套用于机器人液压驱动器。首先,建立了液压系统的动力学模型;然后,输入幅值和频率连续变化的信号,套用卡尔曼滤波器估计液压系统状态,进而计算出模型参数,对模型参数进行分组用于训练RYF神经网路;接着,对不同组参数求平均作为参考点,用RYF神经网路学习最优控制器反馈增益随系统参数的变化规律;最后,训练完成的神经网路根据卡尔曼滤波器参数估计值线上预测并调节控制器增益.经实验验证,该控制系统调节时间和跟蹤误差仅为普通线性二次型最优控制器的1 /2和1/3左右。

自适应控制

在日常生活中,所谓自适应是指生物能改变自己的习性以适应新的环境的一种特徵。因此,直观地说,自适应控制器应当是这样一种控制器,它能修正自己的特性以适应对象和扰动的动态特性的变化。
自适应控制系统,指的是根据控制对象本身参数或周围环境的变化, 自动调整控制器参数以获得满意性能的自动控制系统。

定义

1、不论外界发生巨大变化或系统产生不确定性,控制系统能自行调整参数或产生控制作用,使系统仍能按某一性能指标运行在最佳状态的一种控制方法。
所属学科:航空科技(一级学科) ;飞行控制、导航、显示、控制和记录系统(二级学科)
2、採用自动方法改变或影响控制参数,以改善控制系统性能的控制。
所属学科:机械工程(一级学科) ;工业自动化仪表与系统(二级学科) ;自动控制器及系统-自动控制器及系统一般名词(三级学科)

简介

自适应控制的研究对象是具有一定程度不确定性的系统,这里所谓的“不确定性”是指描述被控对象及其环境的数学模型不是完全确定的,其中包含一些未知因素和随机因素。
任何一个实际系统都具有不同程度的不确定性,这些不确定性有时表现在系统内部,有时表现在系统的外部。从系统内部来讲,描述被控对象的数学模型的结构和参数,设计者事先并不一定能準确知道。作为外部环境对系统的影响,可以等效地用许多扰动来表示。这些扰动通常是不可预测的。此外,还有一些测量时产生的不确定因素进入系统。面对这些客观存在的各式各样的不确定性,如何设计适当的控制作用,使得某一指定的性能指标达到并保持最优或者近似最优,这就是自适应控制所要研究解决的问题。
自适应控制和常规的反馈控制和最优控制一样,也是一种基于数学模型的控制方法,所不同的只是自适应控制所依据的关于模型和扰动的先验知识比较少,需要在系统的运行过程中去不断提取有关模型的信息,使模型逐步完善。具体地说,可以依据对象的输入输出数据,不断地辨识模型参数,这个过程称为系统的线上辩识。随着生产过程的不断进行,通过线上辩识,模型会变得越来越準确,越来越接近于实际。既然模型在不断的改进,显然,基于这种模型综合出来的控制作用也将随之不断的改进。在这个意义下,控制系统具有一定的适应能力。比如说,当系统在设计阶段,由于对象特性的初始信息比较缺乏,系统在刚开始投入运行时可能性能不理想,但是只要经过一段时间的运行,通过线上辩识和控制以后,控制系统逐渐适应,最终将自身调整到一个满意的工作状态。再比如某些控制对象,其特性可能在运行过程中要发生较大的变化,但通过线上辩识和改变控制器参数,系统也能逐渐适应。
常规的反馈控制系统对于系统内部特性的变化和外部扰动的影响都具有一定的抑制能力,但是由于控制器参数是固定的,所以当系统内部特性变化或者外部扰动的变化幅度很大时,系统的性能常常会大幅度下降,甚至是不稳定。所以对那些对象特性或扰动特性变化範围很大,同时又要求经常保持高性能指标的一类系统,採取自适应控制是合适的。但是同时也应当指出,自适应控制比常规反馈控制要複杂的多,成本也高的多,因此只是在用常规反馈达不到所期望的性能时,才会考虑採用。

最优控制理论

最优控制理论(optimal control theory),是现代控制理论的一个主要分支,着重于研究使控制系统的性能指标实现最最佳化的基本条件和综合方法。 最优控制理论是研究和解决从一切可能的控制方案中寻找最优解的一门学科。它是现代控制理论的重要组成部分。

简介

这方面的开创性工作主要是由贝尔曼(R.E.Bellman)提出的动态规划和庞特里亚金等人提出的最大值原理。这方面的先期工作应该追溯到维纳(N.Wiener)等人奠基的控制论(Cybernetics)。1948年维纳发表了题为《控制论—关于动物和机器中控制与通讯的科学》的论文,第一次科学的提出了信息、反馈和控制的概念,为最优控制理论的诞生和发展奠定了基础。

研究内容

最优控制理论所研究的问题可以概括为:对一个受控的动力学系统或运动过程,从一类允许的控制方案中找出一个最优的控制方案,使系统的运动在由某个初始状态转移到指定的目标状态的同时,其性能指标值为最优。这类问题广泛存在于技术领域或社会问题中。
例如,确定一个最优控制方式使空间飞行器由一个轨道转换到另一轨道过程中燃料消耗最少,选择一个温度的调节规律和相应的原料配比使化工反应过程的产量最多,制定一项最合理的人口政策使人口发展过程中老化指数、抚养指数和劳动力指数等为最优等,都是一些典型的最优控制问题。最优控制理论是50年代中期在空间技术的推动下开始形成和发展起来的。苏联学者Л.С.庞特里亚金1958年提出的极大值原理和美国学者R.贝尔曼1956年提出的动态规划,对最优控制理论的形成和发展起了重要的作用。线性系统在二次型性能指标下的最优控制问题则是R.E.卡尔曼在60年代初提出和解决的。

自适应最优控制

自适应最优控制(Adaptive optimal control)是指根据控制对象本身参数或周围环境的变化,自动调整控制器参数以使控制系统的性能指标实现最最佳化的基本条件和综合方法,满意性能的自动控制系统。不论外界发生巨大变化或系统产生不确定性,控制系统能自行调整参数或产生控制作用,使系统仍能按某一性能指标运行在最佳状态的一种控制方法。

主要方法

为了解决自适应最优控制问题,必须建立描述受控运动过程的运动方程,给出控制变数的允许取值範围,指定运动过程的初始状态和目标状态,并且规定一个评价运动过程品质优劣的性能指标。通常,性能指标的好坏取决于所选择的控制函式和相应的运动状态。系统的运动状态受到运动方程的约束,而控制函式只能在允许的範围内选取。因此,从数学上看,确定最优控制问题可以表述为:在运动方程和允许控制範围的约束下,对以控制函式和运动状态为变数的性能指标函式(称为泛函)求取极值(极大值或极小值)。解决自适应最优控制问题的主要方法有古典变分法、极大值原理和动态规划。

古典变分法

研究对泛函求极值的一种数学方法。古典变分法只能用在控制变数的取值範围不受限制的情况。在许多实际控制问题中,控制函式的取值常常受到封闭性的边界限制,如方向舵只能在两个极限值範围内转动,电动机的力矩只能在正负的最大值範围内产生等。因此,古典变分法对于解决许多重要的实际最优控制问题,是无能为力的。

极大值原理

极大值原理,是分析力学中哈密顿方法的推广。极大值原理的突出优点是可用于控制变数受限制的情况,能给出问题中最优控制所必须满足的条件。

动态规划

动态规划是数学规划的一种,同样可用于控制变数受限制的情况,是一种很适合于在计算机上进行计算的比较有效的方法。
最优控制理论已被套用于最省燃料控制系统、最小能耗控制系统、线性调节器等。

最佳化技术

自适应最优控制的实现离不开最最佳化技术,自适应最最佳化技术是研究和解决最最佳化问题的一门学科,它研究和解决如何从一切可能的方案中寻找最优的方案。也就是说,最最佳化技术是研究和解决如何将最最佳化问题表示为数学模型以及如何根据数学模型儘快求出其最优解这两大问题。一般而言,用最最佳化方法解决实际工程问题可分为三步进行:
①根据所提出的最最佳化问题,建立最最佳化问题的数学模型,确定变数,列出约束条件和目标函式;
②对所建立的数学模型进行具体分析和研究,选择合适的最最佳化方法;
③根据最最佳化方法的算法列出程式框图和编写程式,用计算机求出最优解,并对算法的收敛性、通用性、简便性、计算效率及误差等作出评价。

求解方法

所谓自适应最最佳化问题,就是寻找一个最优控制方案或最优控制规律,使系统能最优地达到预期的目标。在最最佳化问题的数学模型建立后,主要问题是如何通过不同的求解方法解决寻优问题。一般而言,最最佳化方式有离线静态最佳化方式和线上动态最佳化方式,而自适应最最佳化问题的求解方法大致可分为四类:

解析法

对于目标函式及约束条件具有简单而明确的数学表达式的最最佳化问题,通常可採用解析法来解决。其求解方法是先按照函式极值的必要条件,用数学分析方法求出其解析解,然后按照充分条件或问题的实际物理意义间接地确定最优解。
这种方法适用于性能指标及约束有明显解析表达式的情况。其一般步是先用求导方法或变分法求出最优控制的必要条件,得到一组方程或不等式,然后求解这组方程或不等式,得到最优控制的解析解即为所求的最优控制。解析法大致可分为两大类。第一类,无约束时,採用微分法或变分法。第二类,有约束时,採用极大值原理或动态规划。
(1)变分法:当控制向量不受约束时,引入哈密顿函式,套用变分法可以导出最优控制的必要条件,即正则方程、控制方程、边界条件、横截条件。
(2)极大值原理:在用变分法求解最优控制问题时,是假定控制向量u(O)不受任何限制,即容许控制集合可以看成是整个P维控制空间开集,控制变分u是任意的,同时还要求哈密顿出数H对u连续可微,但在实际工程上,控制变数往往受到一定的限制,这时可以用极大值原理来求解最优控制问题,这种方法其实是由变分法引申而来的,但由于它能套用于控制变数u(t)受边界限制的情况,并且不要求哈密顿出数H对u连续可微,因此获得了广泛的套用。
(3)动态规划:极大值原理一样,是处理控制向量限制在一定闭集内的最优控制问题的有效数学方法,它把複杂的最优控制间题变为多级决策过程的递推函式关係,其基础和核心时最优性原理即在一个多级决策问题中无论初始状态和初始决策如何,当把其中的任何一级和状态再作为初始级和初始状态时,如下的决定对与这一级开始往后的多级决策过程的一部分必定仍然是一个最优决策。因此,利用这一最优性原理必然可把一个多级决策问题化为最优的单级决策问题并且本级决策与本级以前的任何决策无关,只与本级的初始位置和初始决策有关。对于连续系统用动态规划法求最优控制问题时,可以先把连续系统离散化,用有限差分方程近似代替连续方程,然后用离散动态规划法求解。

数值解法(直接法)

对于目标函式较为複杂或无明确的数学表达式或无法用解析法求解的最最佳化问题,通常可採用直接法来解决。直接法的基本思想,就是用直接搜寻方法经过一系列的叠代以产生点的序列,使之逐步接近到最优点。直接法常常是根据经验或实验而得到的。
性能指标比较複杂或不能用变数显函式表示时,可以採用直接搜寻法,经过若干次叠代搜寻到最优点,数值计算法可以分为两大类:
(1)区间消去法,又称为一维搜寻法,适用于求解单变数极值问题。主要有黄金分割法、多项式插值法等。
(2)爬山法,又称多维搜寻法,适用于求解多变数极值问题。主要有坐标轮转法、步长加速法等。

解析与数值相结合的寻优方法(梯度型法)

是一种解析与数值计算相结合的方法。主要包括两大类:一种是无约束梯度法,如陡降法、拟牛顿法等。第二类是有约束梯度法,如可行方向法、梯度投影法。

网路最最佳化方法

这种方法以网路图作为数学模型,用图论方法进行搜寻的寻优方法。

最新进展

线上最佳化方法

基于对象数学模型的离线最佳化方法是一种理想化方法。这是因为儘管工业过程(对象)被设计得按一定的正常工况连续运行,但是环境的变动、触媒和设备的老化以及原料成分的变动等因素形成了对工业过程的扰动,因此原来设计的工况条件就不是最优的。
解决此类问题的常见方法。
(1)局部参数最最佳化和整体最最佳化设计方法
局部参数最最佳化方法的基本思想是:按照参考模型和被控过程输出之差来调整控制器可调参数,使输出误差平方的积分达到最小。这样可使被控过程和参考模型儘快地精确一致。
此外,静态最优与动态最优相结合,可变局部最优为整体最优。整体最优由总体目标函式体现。整体最优由两部分组成:一种是静态最优(或离线最优),它的目标函式在一段时间或一定範围内是不变的;另一种是动态最优(或线上最优),它是指整个工业过程的最最佳化。工业过程是一个动态过程,要让一个系统始终处于最最佳化状态,必须随时排除各种干扰,协调好各局部最佳化参数或各现场控制器,从而达到整个系统最优。
(2)预测控制中的滚动最佳化算法
预测控制,又称基于模型的控制(Model-based Control),是70年代后期兴起的一种新型最佳化控制算法。但它与通常的离散最优控制算法不同,不是採用一个不变的全局最佳化目标,而是採用滚动式的有限时域最佳化策略。这意味着最佳化过程不是一次离线进行,而是反覆线上进行的。这种有限化目标的局部性使其在理想情况下只能得到全局的次优解,但其滚动实施,却能顾及由于模型失配、时变、干扰等引起的不确定性,及时进行弥补,始终把新的最佳化建立在实际的基础之上,使控制保持实际上的最优。这种启发式的滚动最佳化策略,兼顾了对未来充分长时间内的理想最佳化和实际存在的不确定性的影响。在複杂的工业环境中,这比建立在理想条件下的最优控制更加实际有效。
预测控制的最佳化模式具有鲜明的特点:它的离散形式的有限最佳化目标及滚动推进的实施过程,使得在控制的全过程中实现动态最佳化,而在控制的每一步实现静态参数最佳化。用这种思路,可以处理更複杂的情况,例如有约束、多目标、非线性乃至非参数等。吸取规划中的分层思想,还可把目标按其重要性及类型分层,实施不同层次的最佳化。显然,可把大系统控制中分层决策的思想和人工智慧型方法引入预测控制,形成多层智慧型预测控制的模式。这种多层智慧型预测控制方法的,将克服单一模型的预测控制算法的不足,是当前研究的重要方向之一。
(3)稳态递阶控制
对複杂的大工业过程(对象)的控制常採用集散控制模式。这时计算机线上稳态最佳化常採用递阶控制结构。这种结构既有控制层又有最佳化层,而最佳化层是一个两级结构,由局部决策单元级和协调器组成。其最佳化进程是:各决策单元并行回响子过程最佳化,由上一级决策单元(协调器)协调各最佳化进程,各决策单元和协调器通过相互叠代找到最优解。这里必须提到波兰学者Findeisen等所作出的重要贡献。
由于工业过程较精确的数学模型不易求得,而且工业过程(对象)往往呈非线性及慢时变性,因此波兰学者Findesien提出:最佳化算法中採用模型求得的解是开环最佳化解。在大工业过程线上稳态控制的设计阶段,开环解可以用来决定最优工作点。但在实际使用上,这个解未必能使工业过程处于最优工况,相反还会违反约束。他们提出的全新思想是:从实际过程提取关联变数的稳态信息,并反馈至上一层协调器(全局反馈)或局部决策单元(局部反馈),并用它修正基于模型求出的的最优解,使之接近真实最优解。
(4)系统最佳化和参数估计的集成研究方法
稳态递阶控制的难点是,实际过程的输入输出特性是未知的。波兰学者提出的反馈校正机制,得到的只能是一个次优解。但其主要缺点在于一般很难準确估计次优解偏离最优解的程度,而且次优解的次优程度往往依赖于初始点的选取。一个自然的想法是将最佳化和参数估计分开处理并交替进行,直到叠代收敛到一个解。这样计算机的线上最佳化控制就包括两部分任务:在粗模型(粗模型通常是能够得到的)基础上的最佳化和设定点下的修正模型。这种方法称为系统最佳化和参数估计的集成研究方法。 (Integrated System Optimizationand Parameter Estimation)

智慧型最佳化方法

对于越来越多的複杂控制对象,一方面,人们所要求的控制性能不再单纯的局限于一两个指标;另一方面,上述各种最佳化方法,都是基于最佳化问题具有精确的数学模型基础之上的。但是许多实际工程问题是很难或不可能得到其精确的数学模型的。这就限制了上述经典最佳化方法的实际套用。随着模糊理论、神经网路等智慧型技术和计算机技术的发展。
智慧型式的最佳化方法得到了重视和发展。
(1)神经网路最佳化方法
人工神经网路的研究起源于1943年和Mc Culloch和Pitts的工作。在最佳化方面,1982年Hopfield首先引入Lyapuov能量函式用于判断网路的稳定性,提出了Hopfield单层离散模型;Hopfield和Tank又发展了Hopfield单层连续模型。1986年,Hopfield和Tank将电子电路与Hopfield模型直接对应,实现了硬体模拟;Kennedy和Chua基于非线性电路理论提出了模拟电路模型,并使用系统微分方程的Lyapuov函式研究了电子电路的稳定性。这些工作都有力地促进了对神经网路最佳化方法的研究。
根据神经网路理论,神经网路能量函式的极小点对应于系统的稳定平衡点,这样能量函式极小点的求解就转换为求解系统的稳定平衡点。随着时间的演化,网路的运动轨道在空间中总是朝着能量函式减小的方向运动,最终到达系统的平衡点——即能量函式的极小点。因此如果把神经网路动力系统的稳定吸引子考虑为适当的能量函式(或增广能量函式)的极小点,最佳化计算就从一初始点随着系统流到达某一极小点。如果将全局最佳化的概念用于控制系统,则控制系统的目标函式最终将达到希望的最小点。这就是神经最佳化计算的基本原理。
与一般的数学规划一样,神经网路方法也存在着重分析次数较多的弱点,如何与结构的近似重分析等结构最佳化技术结合,减少叠代次数是今后进一步研究的方向之一。
由于Hopfield模型能同时适用于离散问题和连续问题,因此可望有效地解决控制工程中普遍存在的混合离散变数非线性最佳化问题。
(2)遗传算法
遗传算法和遗传规划是一种新兴的搜寻寻优技术。它仿效生物的进化和遗传,根据“优胜劣汰”原则,使所要求解决的问题从初始解逐步地逼近最优解。在许多情况下,遗传算法明显优于传统的最佳化方法。该算法允许所求解的问题是非线性的和不连续的,并能从整个可行解空间寻找全局最优解和次优解,避免只得到局部最优解。这样可以为我们提供更多有用的参考信息,以便更好地进行系统控制。同时其搜寻最优解的过程是有指导性的,避免了一般最佳化算法的维数灾难问题。遗传算法的这些优点随着计算机技术的发展,在控制领域中将发挥越来越大的作用。
研究表明,遗传算法是一种具有很大潜力的结构最佳化方法。它用于解决非线性结构最佳化、动力结构最佳化、形状最佳化、拓扑最佳化等複杂最佳化问题,具有较大的优势。
(3)模糊最佳化方法
最最佳化问题一直是模糊理论套用最为广泛的领域之一。
自从Bellman和Zadeh在 70年代初期对这一研究作出开创性工作以来,其主要研究集中在一般意义下的理论研究、模糊线性规划、多目标模糊规划、以及模糊规划理论在随机规划及许多实际问题中的套用。主要的研究方法是利用模糊集的a截集或确定模糊集的隶属函式将模糊规划问题转化为经典的规划问题来解决。
模糊最佳化方法与普通最佳化方法的要求相同,仍然是寻求一个控制方案(即一组设计变数),满足给定的约束条件,并使目标函式为最优值,区别仅在于其中包含有模糊因素。普通最佳化可以归结为求解一个普通数学规划问题,模糊规划则可归结为求解一个模糊数学规划(fuzzymathematicalprogramming)问题。包含控制变数、目标函式和约束条件,但其中控制变数、目标函式和约束条件可能都是模糊的,也可能某一方面是模糊的而其它方面是清晰的。例如模糊约束的最佳化设计问题中模糊因素是包含在约束条件(如几何约束、性能约束和人文约束等)中的。求解模糊数学规划问题的基本思想是把模糊最佳化转化为非模糊最佳化即普通最佳化问题。方法可分为两类:一类是给出模糊解(fuzzysolution);另一类是给出一个特定的清晰解(crispsolution)。必须指出,上述解法都是对于模糊线性规划(fuzzylinearprogramming)提出的。然而大多数实际工程问题是由非线形模糊规划(fuzzynonlinearprogramming)加以描述的。于是有人提出了水平截集法、限界搜寻法和最大水平法等,并取得了一些可喜的成果。
在控制领域中,模糊控制与自学习算法、模糊控制与遗传算法相融合,通过改进学习算法、遗传算法,按给定最佳化性能指标,对被控对象进行逐步寻优学习,从而能够有效地确定模糊控制器的结构和参数。
声明:此文信息来源于网络,登载此文只为提供信息参考,并不用于任何商业目的。如有侵权,请及时联系我们:baisebaisebaise@yeah.net