图1 ILC控制原理框图
原理
ILC控制的原理框图如图1所示。其中为理想输出。假设一个全局利普希茨连续的被控对象如下:
(1)
(2)
其中为系统在有限跟踪区间内所处的时刻,为迭代次数,为第次迭代时系统的状态向量,为第次迭代时系统的输出向量,和为对应维度的向量函数。控制的最终目标是在有限跟踪区间内,对于给定的理想输出,寻找对应的输入,使得系统的输出误差在有限跟踪区间内全域收敛为0。
为了寻找合适的,需要对其进行不断的迭代。如图1所示,在第次迭代时,存储器存储过去所有的误差和输出,并通过迭代学习率得到
(3)
学习率:根据学习率的不同,迭代的效果也有所不同。常用的学习率有PID型学习率、高阶学习率、鲁棒学习率等等。对于PID型学习率而言,若积分常数和微分常数为零,则被称为P型学习率。假设比例常数为,则有
(4)
其收敛条件为[2] (5)
可以预见,存在足够小的P使得式(5)成立,系统收敛。关于收敛条件的具体证明过程,已经有相当多的文献给出。
参考文献
[1] 马航,杨俊友,袁琳.迭代学习控制研究现状与趋势[J].控制工程,2009,16(3):286-290
[2] 方忠,韩正之,陈彭年.迭代学习控制新进展[J].控制理论与应用,2002,19(2):161-166
[3] 李仁俊,韩正之.迭代学习控制综述[J].控制与决策,2005,20(9):961-966
[4] Bristow D.A.,Alleyne A.G.,Tharayil M..A survey of iterative learning control[J].IEEE Control Systems Magazine, 2006, 26(3):96-114.