10.4. Regulador Cuadr´atico Lineal en Estado Estacionario...

12
Universidad Nacional de Ingenier´ ıa - Facultad de Ingenier´ ıaMec´anica Departamento Acad´ emico de Ingenier´ ıa Aplicada CONTROL MODERNO Y ´ OPTIMO (MT 227B) Clase10-02 Elizabeth Villota 10.4. Regulador Cuadr´ atico Lineal en Estado Estacionario - Horizonte Infinito El control LQR antes mostrado es el control ´ optimo que minimiza el ´ ındice de desempe˜ no sobre un inter- valo de tiempo finito [t o ,T ]. Se demuestra que lleva a una ganancia de control variante en el tiempo que puede ser calculada offline. En la mayoria de los casos es m´as conveniente tener una matriz de ganancia constante. Es preferible entonces analizar el problema de control ´ optimo con un ´ ındice de desempe˜ no extendido hasta el infinito: J (u)= l´ ım t→∞ t to [x T (t)Qx T (t)+ u T (t)Ru(t) dt. (38) Adicionalmente asumiremos que el sistema es invariante en el tiempo: ˙ x(t)= Ax(t)+ Bu(t), (39) tal que todas las matrices son consideradas constantes y Q = Q T 0y R = R T > 0. Siendo que el problema de control LQR est´ andar consiste en mover los estados del sistema hacia cero de forma ´ optima, el vector de estados x(t) se aproximar´ a al vector cero a medida que T →∞ si el sistema en lazo cerrado es estable. Luego no es relevante incluir el t´ ermino del estado final en el ´ ındice de desempe˜ no, que es lo mismo que considerar F = 0 en (??). 10.4.1. Ecuaci´on de Riccati Algebraica (ARE, por sus siglas en ingles) El valor ´ optimo del ´ ındice est´ a dado por (??). Siendo que el sistema es LTI, el valor de J ın es indepen- diente del tiempo, lo que significa que la matriz P debe ser constante. Esto implica que ˙ P = 0 y la ecuaci´ on de Riccati se reduce a: 0= Q PBR -1 B T P + PA + A T P. (40) Este es un conjunto de ecuaciones algebraicas no lineales acopladas cuadr´ aticas. En la pr´actica se le llama ecuaci´ on de Riccati algebraica. La ecuaci´ on (40) pueda tener m´ ultiples soluciones pero solo una de ellas provee una matriz P semidefinida positiva (siempre y cuando el sistema sea estabilizable) y la soluci´ on particular lleva a: J ın = 1 2 x T o P x o . (41) donde P es la soluci´ on constante de (40). La matriz de ganancias ´ optima para el control LQR en estado estacionario queda definida por: K = R -1 B T P , (42) y la se˜ nal de control resulta: u(t)= K x(t). (43) En conclusi´on, el controlador lineal por realimentaci´ on de estados ´ optimo que minimiza el ´ ındice de desempe˜ no: J (u)= l´ ım t→∞ t 0 [x T (t)Qx T (t)+ u T (t)Ru(t) dt. sujeto a ˙ x(t)= Ax(t)+ Bu(t), x(0) = x o

Transcript of 10.4. Regulador Cuadr´atico Lineal en Estado Estacionario...

Page 1: 10.4. Regulador Cuadr´atico Lineal en Estado Estacionario ...bionanouni.wdfiles.com/local--files/teaching-mt227-horario-2011i/Clase10-02.pdf10.4. Regulador Cuadr´atico Lineal en

Universidad Nacional de Ingenierıa - Facultad de Ingenierıa MecanicaDepartamento Academico de Ingenierıa Aplicada

CONTROL MODERNO Y OPTIMO (MT 227B)

Clase10-02 Elizabeth Villota

10.4. Regulador Cuadratico Lineal en Estado Estacionario - Horizonte Infinito

El control LQR antes mostrado es el control optimo que minimiza el ındice de desempeno sobre un inter-valo de tiempo finito [to, T ]. Se demuestra que lleva a una ganancia de control variante en el tiempo que puedeser calculada offline. En la mayoria de los casos es mas conveniente tener una matriz de ganancia constante.Es preferible entonces analizar el problema de control optimo con un ındice de desempeno extendido hastael infinito:

J(u) = lımt→∞

[∫ t

to

[xT (t)QxT (t) + uT (t)Ru(t)

]

dt. (38)

Adicionalmente asumiremos que el sistema es invariante en el tiempo:

x(t) = Ax(t) +Bu(t), (39)

tal que todas las matrices son consideradas constantes y Q = QT ≥ 0 y R = RT > 0.

Siendo que el problema de control LQR estandar consiste en mover los estados del sistema hacia cero deforma optima, el vector de estados x(t) se aproximara al vector cero a medida que T → ∞ si el sistema enlazo cerrado es estable. Luego no es relevante incluir el termino del estado final en el ındice de desempeno,que es lo mismo que considerar F = 0 en (??).

10.4.1. Ecuacion de Riccati Algebraica (ARE, por sus siglas en ingles)

El valor optimo del ındice esta dado por (??). Siendo que el sistema es LTI, el valor de Jmın es indepen-diente del tiempo, lo que significa que la matriz P debe ser constante. Esto implica que P = 0 y la ecuacionde Riccati se reduce a:

0 = Q− PBR−1BTP + PA+ATP. (40)

Este es un conjunto de ecuaciones algebraicas no lineales acopladas cuadraticas. En la practica se le llamaecuacion de Riccati algebraica.

La ecuacion (40) pueda tener multiples soluciones pero solo una de ellas provee una matriz P semidefinidapositiva (siempre y cuando el sistema sea estabilizable) y la solucion particular lleva a:

Jmın = 1

2xTo P∞xo. (41)

donde P∞ es la solucion constante de (40).

La matriz de ganancias optima para el control LQR en estado estacionario queda definida por:

K∞ = R−1BTP∞, (42)

y la senal de control resulta:

u(t) = −K∞x(t). (43)

En conclusion, el controlador lineal por realimentacion de estados optimo que minimiza el ındice dedesempeno:

J(u) = lımt→∞

[∫ t

0

[xT (t)QxT (t) + uT (t)Ru(t)

]

dt.

sujeto ax(t) = Ax(t) +Bu(t), x(0) = xo

Page 2: 10.4. Regulador Cuadr´atico Lineal en Estado Estacionario ...bionanouni.wdfiles.com/local--files/teaching-mt227-horario-2011i/Clase10-02.pdf10.4. Regulador Cuadr´atico Lineal en

CONTROL OPTIMO - REGULADOR CUADRATICO LINEAL

satisface el teorema mas abajo.

El objetivo es construir un controlador lineal por realimentacion de estados de la forma u = −Kx queestabiliza al sistema y minimiza el ındice de desempeno J(u). Denotar dicha ley de control lineal como u∗.Primero, asumimos que el controlador lineal por realimentacion de estados optimo existe tal que el sistemaen lazo cerrado optimo

x = (A−BK)x

es asintoticamente estable. Esta suposicion implica que existe una funcion de Lyapunov V = xTPx para elsistema en lazo cerrado; esto es, para alguna matriz definida positiva P la derivada en funcion del tiempodVdt

evaluada en las trayectorias del sistema en lazo cerrado es definida negativa.

Teorema 1. Si el controlador por realimentacion de estados u∗ = −Kx es tal que

minu

(

dV

dt+ xTQx+ uTRu

)

= 0, (44)

para algun V = xTPx, entonces el controlador es optimo. ⋄

Demostracion Teorema 1 Podemos escribir la condicion del teorema como:

dV

dt

u=u∗

+ xTQx+ u∗TRu∗ = 0.

Luego,dV

dt

u=u∗

= −xTQx− u∗TRu∗.

Integrando ambos lados de la ecuacion resultante con respecto al tiempo desde 0 hasta ∞, obtenemos

V (x(∞))− V (x(0) = −∫

0

(xTQx+ u∗TRu∗)dt.

Debido a la suposicion de que el sistema en lazo cerrado es asintoticamente estable, x(∞) = 0, y luego

V (x(0) = xTo Pxo =

0

(xTQx+ u∗TRu∗)dt.

Entonces, hemos demostrado que si un controlador lineal por realimentacion de estados satisface lasuposicion del teorema, entonces el valor del ındice de desempeno para tal controlador es

J(u∗) = xTo Pxo.

Para demostrar que tal controlador es de hecho optimo, usamos una prueba por contradiccion. Asumimosque (44) se cumple y que u∗ no es optima. Supongase que u resulta en un menor valor de J , esto es,

J(u) < J(u∗).

De (44) tenemos quedV

dt

u=u

+ xTQx+ uTRu ≥ 0,

esto es,dV

dt

u=u

≥ −xTQx− uTRu.

Integrando la expresion arriba con respecto al tiempo de 0 a ∞ resulta

V (x(0)) ≤∫

0

(xTQx+ uTRu)dt

lo que implica queJ(u∗) ≤ J(u),

lo que es una contradiccion, y la demostracion se ha completado. ⋄

Clase10-02, pag. 12

Page 3: 10.4. Regulador Cuadr´atico Lineal en Estado Estacionario ...bionanouni.wdfiles.com/local--files/teaching-mt227-horario-2011i/Clase10-02.pdf10.4. Regulador Cuadr´atico Lineal en

CONTROL OPTIMO - REGULADOR CUADRATICO LINEAL

10.4.2. Ejemplos

Ejemplo 1

Considere el siguiente modelo de un sistema dinamico:

x = 2u1 + 2u2, x(0) = 3,

asi como el ındice de desempeno asociado

J =

0

(x2 + ru2

1 + ru2

2)dt,

donde r > 0 es un parametro.

1. Primero encontramos las solucion de ARE correspondiente al controlador lineal por realimentacion deestados optimo. Tenemos

A = 0, B =[

2 2]

, Q = 1, R = rI2.

La ARE para este problema es

0 = ATP + PA+Q− PBR−1BTP = 1− 8

rp2,

cuya solucion es

p =

r

8.

2. Ahora escribimos el sistema en lazo cerrado que se obtiene usando el controlador optimo. El controladoroptimo tienen la forma

u = −R−1BTPx = − 1√2r

[

11

]

x.

Entonces, el sistema en lazo cerrado optimo es descrito por

x =[

2 2]

u = − 4√2r

x.

3. Finalmente, encontramos el valor de J para el sistema en lazo cerrado optimo. Tenemos que

J = x(0)TPx(0) =9

2

r

2.

Ejemplo integrador doble con LQR en estado estacionario

Considere un integrador doble descrito por la ecuacion espacio de estado:

x(t) =

[

0 10 0

]

x(t) +

[

01

]

u(t)

El controlador tiene que minimizar el siguiente ındice de desempeno:

J =

0

[

xT (t)Qx(t) + ρu2(t)]

dt

Aqui las matrices han sido seleccionadas como:

Q =

[

rp 00 rv

]

,

ρ > 0,

Clase10-02, pag. 13

Page 4: 10.4. Regulador Cuadr´atico Lineal en Estado Estacionario ...bionanouni.wdfiles.com/local--files/teaching-mt227-horario-2011i/Clase10-02.pdf10.4. Regulador Cuadr´atico Lineal en

CONTROL OPTIMO - REGULADOR CUADRATICO LINEAL

donde rp y rv son los pesos de posicion y velocidad respectivamente. Con los valores dados la ecuacion deRiccati algebraica resulta en las siguientes ecuaciones acopladas:

0 = rp − 1

ρp212

0 = p11 − 1

ρp12p22

0 = rv + 2p12 − 1

ρp222

Aqui, P =

[

p11 p12p12 p22

]

, es la solucion de la ARE. Resolviendo estas ecuaciones algebraicas se obtiene

la solucion definida positiva unica:

p11 =√rp√

2ρ√rpρ+ rvρ

p12 =√rpρ

p22 =√

2ρ√rpρ+ rvρ

El controlador resulta en el control por realimentacion de estados con la senal de control:

u(t) = −K∞x(t) = −(R−1BTP∞)x(t)

= −[

rpρ

2

rpρ

+rvρ

]

x(t)

Se observa que la ganancia de control se incrementa a medida que los pesos de los estados se incrementan,en otras palabras, rp y rv se incrementan en comparacion al peso de la senal de control. La ecuacioncaracterıstic del sistema en lazo cerrado puede ser encontrada como:

s2 +

2

rpρ

+rvρs+

rpρ

= 0

La frecuencia natural correspondiente al sistema en lazo cerrado ω y el factor de amortiguamiento ζ soncalculados como:

ω = 4

rpρ

ζ =1√2

1 +rv

2√ρ√rp

Para ρ = 1, si rv = 0 los polos en lazo cerrado tienen un factor de amortiguamiento de 1/√2 ≈ 0,71.

El “root locus” como funcion de las ponderaciones se observa en la Fig. (1), donde rp varia desde 0 hasta10. Para este sistema en particular se observa que el factor de amortiguamiento de los polos en lazo cerradosiempre seran mayores que 0.71 para elementos de la matriz de ponderacion positivos.

–2 –1.5 –1 –0.5 0 0.5 1–1.5

–1

–0.5

0

1

1.5

0.5

2 1 0.5rv

= 5 0.1 0

Figura 1: Root-locus del sistema integrador doble con LQR en estado estacionario para una variacion de rp.

Clase10-02, pag. 14

Page 5: 10.4. Regulador Cuadr´atico Lineal en Estado Estacionario ...bionanouni.wdfiles.com/local--files/teaching-mt227-horario-2011i/Clase10-02.pdf10.4. Regulador Cuadr´atico Lineal en

CONTROL OPTIMO - REGULADOR CUADRATICO LINEAL

10.4.3. Resolviendo la ARE usando el Metodo del Autovector

A continuacion presentamos un metodo para resolver la ARE referido como el metodo del autovector.Comenzamos representando la ARE de la forma

[

P −In]

[

A −BR−1BT

−Q −AT

] [

InP

]

= 0. (45)

La matriz 2n × 2n en la mitad es denominada de matriz Hamiltoniana. usamos el sımbolo H para denotara la matriz Hamiltoniana, esto es,

H =

[

A −BR−1BT

−Q −AT

]

.

Entonces, la ARE puede ser representada como

[

P −In]

H

[

InP

]

= 0

Si premultiplicamos la ecuacion arriba por X−1 y luego postmultiplicamos esta por X, donde X es unamatriz no singular n× n,

[

X−1P −X−1]

H

[

XPX

]

= 0. (46)

Observar que si pudiesemos encontrar matrices X y PX tal que

H

[

XPX

]

=

[

XPX

]

Λ,

luego la ecuacion (46) resulta en

[

X−1P −X−1]

[

XPX

]

Λ = 0.

Luego hemos reducido el problema de resolver la ARE a aquel en el que construimos matrices X y PXapropiadas. Continuando, sea vi el autovector de H y sea si el autovalor correspondiente; entonces

Hvi = sivi.

Si asumimos que H tiene al menos n autovalores reales distintos entre sus 2n autovalores. (Los resultadosobtenidos pueden ser generalizados para cuando los autovalores de H son complejos o iguales.) Entonces,podemos escribir

H[

v1 v2 ... vn]

=[

v1 v2 ... vn]

s1 0 ... 00 s2 ... 0...

......

0 0 ... sn

.

Sea[

XPX

]

=[

v1 v2 ... vn]

y

Λ =

s1 0 ... 00 s2 ... 0...

......

0 0 ... sn

.

La seleccion de X y PX constituye una posible solucion de la ecuacion

[

X−1P −X−1]

[

XPX

]

Λ = 0.

Clase10-02, pag. 15

Page 6: 10.4. Regulador Cuadr´atico Lineal en Estado Estacionario ...bionanouni.wdfiles.com/local--files/teaching-mt227-horario-2011i/Clase10-02.pdf10.4. Regulador Cuadr´atico Lineal en

CONTROL OPTIMO - REGULADOR CUADRATICO LINEAL

Para construir P , particionamos la matriz de autovectores[

v1 v2 ... vn]

de orden 2n × n en dossubmatrices de orden n× n como sigue

[

v1 v2 ... vn]

=

[

WZ

]

.

Luego,[

XPX

]

=

[

WZ

]

.

Tomando X = W y PX = Z y asumiendo que W es invertible, obtenemos

P = ZW−1. (47)

Ahora tenemos que elegir que conjunto de n autovalores elegir, dentro de todos los autovalores de H,para poder contruir P . En el caso en que los 2n autovalores de H son diferentes, el numero de matrices Pgeneradas con el metodo descrito arriba son

(2n)!

(n!)2.

Sea Q = CTC una factorizacion de rango completo de Q. Del Teorema 3 de Kucera (ver referencias alfinal) se concluye que la matriz Hamiltoniana H tiene n autovalores en el semiplano complejo izquierdo y nen el semiplano complejo derecho si y solo si el sistema como definido en (1) es estabilizable y detectable.La matriz P que nosotros buscamos corresponde a los autovalores asintoticamente estables de H. Con Pconstruido como deseado, tenemos el siguiente resultado.

Teorema 2. Los polos del sistema en lazo cerrado

x(t) = (A−BR−1BTP )x(t)

son aquellos autovalores de H que tienen parte real negativa. ⋄

Demostracion Siendo que[

v1 v2 ... vn]

=

[

WZ

]

, podemos escribir

[

A −BR−1BT

−Q −AT

] [

WZ

]

=

[

WZ

]

Λ.

Realizando las multiplicaciones apropiadas de bloques de matrices n× n resulta

AW −BR−1BTZ = WΛ,

oA−BR−1BTZW−1 = A−BR−1BTP = WΛW−1,

dado que P = ZW−1. Entonces, la matriz A−BR−1BTP es similar a la matriz Λ cuyos autovalores sonlos autovalores asintoticamente estables de H. Luego, la demostracion ha sido completada. ⋄

Ejemplo 1

Considere el siguiente modelo de un sistema dinamico

x = 2x+ u,

asi como el ındice de desempeno asociado

J =

0

(x2 + ru2)dt.

Encuentre el valor de r tal que el sistema en lazo cerrado optimo tenga un polo en −3.

Clase10-02, pag. 16

Page 7: 10.4. Regulador Cuadr´atico Lineal en Estado Estacionario ...bionanouni.wdfiles.com/local--files/teaching-mt227-horario-2011i/Clase10-02.pdf10.4. Regulador Cuadr´atico Lineal en

CONTROL OPTIMO - REGULADOR CUADRATICO LINEAL

1. Formamos la matriz Hamiltoniana asociada

H =

[

A −BR−1BT

−Q −AT

]

=

[

2 − 1

r

−1 −2

]

.

2. La ecuacion caracterıstica de H es

det(sI2 −H) = s2 − 4− 1

r= 0.

Luego,

r =1

5

resulta en el sistema en lazo cerrado optimo teniendo su polo localizado en −3.

Ejemplo 2

Considere un modelo simple de un robot manipulador como mostrado en la Fig. 2. El movimiento delbrazo del robot es controlado por un motor DC a traves de un engranaje. El motor DC es controlado porarmadura y su figura esquematica es presentada en la Fig. 3. Asumimos que el momento de inercia del motores despreciable en comparacion con el del brazo del robot. Modelamos el brazo como una masa puntual mubicada en el extremo final de la barra (sin masa) de longitud l. Entonces el momento de inercia del brazoIb = ml2. Asumimos que el tren de engranajes no tiene juego, y que todos los ejes conectores son rıgidos.Como podemos ver de la Fig. 2, la rotacion del brazo en sentido contrario a las agujas del reloj es definidacomo positiva, y la rotacion siguiendo las agujas del reloj es considerada como negativa; mientras que larotacion del eje del motor en sentido contrario a las agujas del reloj es definida como negativa, y la rotaciondel eje siguiendo las agujas del reloj es definida como positiva. El torque entregado por el motor es

Tm = Kmia,

donde Km es la constante del torque del motor, y ia es la corriente de armadura. Sea N la razon de losengranajes. Luego tenemos:

θpθm

=radio del engranaje del motor

radio del engranaje del brazo=

numero de dientes del engranaje del motor

numero de dientes del engranaje del brazo=

1

N.

Gear

1:N

Massless rod of length l

p

Mass m

DC motor

Control voltage

u

Figura 2: Robot manipulador controlador por un motorDC via un engranaje.

RaLa

if constant

eb back emf

m motor shaft

position

Field circuit

Armature circuit

u

ia

Figura 3: Figura esquematica de un motor DCcontrolado por armadura.

Esto ocurre puesto que los engranajes estan en contacto y luego:

θp × radio del engranaje del brazo = θm × radio del engranaje del motor,

Clase10-02, pag. 17

Page 8: 10.4. Regulador Cuadr´atico Lineal en Estado Estacionario ...bionanouni.wdfiles.com/local--files/teaching-mt227-horario-2011i/Clase10-02.pdf10.4. Regulador Cuadr´atico Lineal en

CONTROL OPTIMO - REGULADOR CUADRATICO LINEAL

y los radios de los engranajes son proporcionales a sus numeros de dientes. El trabajo realizado por cadaengranaje debe ser igual. Sea Tp que denota el torque aplicado al brazo del robot. Entonces,

Tpθp = Tmθm.

Entonces, el torque aplicado al pendulo es

Tp = NTm = NKmia.

Usando la segunda Ley de Newton para escribir la ecuacion que modela la dinamica del brazo,

Ibd2θpdt2

= mgl sin θp + Tp.

Sustituyendo las expresiones para Ib y Tp y luego rearreglando tenemos

ml2d2θpdt2

= mgl sin θp +NKmia,

donde g = 9,8m/s2 es la aceleracion de la gravedad. Aplicado la Ley de Kirchhoff (voltaje) al circuito dearmadura resulta en

La

diadt

+Raia +KbNdθpdt

= u,

donde Kb es la constante emf. Asumiendo que La ≈ 0. Entonces,

u = Raia +KbNdθpdt

,

A continuacion calculamos ia de la expresion anterior y sustituimos el resultado en la ecuacion de movimientopara obtener:

ml2d2θpdt2

= mgl sin θp +NKm

(

u

Ra

− KbNdθpdt

Ra

)

.

Ahora podemos construir el modelo de espacio de estados para el robot de un brazo. Escogiendo los siguientesestados y variables de salida:

x1 = θp, x2 =dθpdt

= ωp, y y = x1.

Entonces, obtenemos el siguiente modelo de espacio de estados simple del robot manipulador:

[

x1

x2

]

=

[

x2

glsinx1 − KbKmN2

ml2Rax2 +

NKm

ml2Rau

]

y = x1.

Parametros razonables para el robot son: l = 1m, m = 1kg, N = 10, Km = 0,1Nm/A, Kb = 0,1Vsec/rad,Ra = 1Ω. Usando los valores de los parametros el modelo del robot toma la siguiente forma:

[

x1

x2

]

=

[

x2

9,8 sinx1 − x2 + u

]

y = x1.

Respuestas en el tiempo para las trayectorias de estado del sistema no lineal sin control, u = 0, sonmostrados en la Fig. 4 para las condiciones iniciales x1(0) = 1 y x2(0) = 0. Un plano de fase del sistema nolineal sin control es mostrado en la Fig. 5. El modelo linealizado alrededor de x = 0, u = 0 tiene la forma

d

dt∆x =

[

0 19,8 −1

]

∆x+

[

01

]

∆u,

∆y =[

1 0]

∆x.

En la Fig. 6 son mostradas las graficas de y = x1 y x2 versus tiempo para el sistema lineal sin control.Un plano de fase del sistema linealizado es mostrado en la Fig. 7. Sea

J =

0

(y2 + u2)dt.

Clase10-02, pag. 18

Page 9: 10.4. Regulador Cuadr´atico Lineal en Estado Estacionario ...bionanouni.wdfiles.com/local--files/teaching-mt227-horario-2011i/Clase10-02.pdf10.4. Regulador Cuadr´atico Lineal en

CONTROL OPTIMO - REGULADOR CUADRATICO LINEAL

0 2 4 6 8 10

Time (sec)

5

4

3

2

1

0

1

2

3

x1,x

2x1

x2

Figure 5.13

Figura 4: Graficas de y = x1 y x2 versus tiempo para elsistema no lineal sin control.

10

8

6

4

2

0

2

4

6

8

5 0 5 101010

x1

x2

Figura 5: Un plano de fase del sistema no linealsin control.

25

20

15

10

5

00 10.2 0.4 0.6 0.8

x1,x

2

Time (sec)

x1

x2

Figura 6: Graficas de y = x1 y x2 versus tiempo para elsistema linealizado sin control.

10

x2

x1

8

6

4

2

0

2

4

6

8

1010 5 0 5 10

Figura 7: Un plano de fase del sistema linealizadosin control.

Encontraremos una ley de control lineal por realimentacion de estados u = −kx que minimice J sujeto a lasecuaciones dadas por la representacion espacio de estados lineal. Tenemos

Q = cT c =

[

1 00 0

]

y R = [1].

Resolviendo la ecuacion de Riccati, se define la matriz Hamiltoniana asociada como

H =

[

A −BR−1BT

−Q −AT

]

=

0 1 0 09,8 −1 0 −1−1 0 0 −9,80 0 −1 1

,

y calculando los autovalores y autovectores de H tenemos que

H

−0,3443 −0,0485 0,2604 0,0496−0,9298 −0,1770 −0,9499 −0,1339−0,1124 −0,9196 0,1691 0,95550,0661 0,3473 0,0364 0,2582

=

−0,3443 −0,0485 0,2604 0,0496−0,9298 −0,1770 −0,9499 −0,1339−0,1124 −0,9196 0,1691 0,95550,0661 0,3473 0,0364 0,2582

2,7003 0 0 00 3,6481 0 00 0 −3,6481 00 0 0 −2,7003

.

Identificando los autovectores correspondientes a los autovalores con parte real negativa se puede definir

W =

[

0,2604 0,0496−0,9499 −0,1339

]

y Z =

[

0,1691 0,95550,0364 0,2582

]

,

Clase10-02, pag. 19

Page 10: 10.4. Regulador Cuadr´atico Lineal en Estado Estacionario ...bionanouni.wdfiles.com/local--files/teaching-mt227-horario-2011i/Clase10-02.pdf10.4. Regulador Cuadr´atico Lineal en

CONTROL OPTIMO - REGULADOR CUADRATICO LINEAL

luego sabiendo que P = ZW−1 se obtiene

P =

[

72,3371 19,650919,6509 5,3484

]

.

Entonces:k =

[

19,6509 5,3484]

,

y

Ac =

[

0 1−9,8509 −6,3484

]

∆x.

Las graficas de x1 y x2 versus tiempo del sistema en lazo cerrado

x = (A− bk)x = Acxy = x1,

cuando las condiciones iniciales son x1(0) = 1 y x2(0) = 0, son mostradas en la Fig. 8. Un plano de fasedel sistema linealizado en lazo cerrado es mostrado en la Fig. 9. Aplicando el controlador optimo al modelono lineal, las graficas de x1 y x2 versus tiempo para el sistema no lineal en lazo cerrado son mostradas enla Fig. 10. Un plano de fase del sistema no lineal en lazo cerrado es mostrado en la Fig. 11. Los polos delsistema linealizado en lazo cerrado -esto es, los autovalores de Ac- son λ1 = −2,7003 y λ2 = −3,6481.

1

0.5

0

0 1 2

Time (sec)

x1,x 2

x1

x2

3 4

0.5

1

1.55

Figura 8: Graficas de x1 y x2 versus tiempo para el sis-tema linealizado en lazo cerrado.

10

x2

x1

8

6

4

2

0

2

4

6

8

1010 105 0 5

A phase portrait of the linear closed­loop system of Example 5.13.

Figura 9: Un plano de fase del sistema linealizadoen lazo cerrado.

x1,x 2

x1

x2

0

1

0.5

0.5

1

1.50 1 2

Time (sec)

3 4 5

Figura 10: Graficas de x1 y x2 versus tiempo para elsistema no lineal en lazo cerrado.

x2

x1

10

8

6

4

2

0

2

4

6

8

1010 105 0 5

Figura 11: Un plano de fase del sistema no linealen lazo cerrado.

Clase10-02, pag. 20

Page 11: 10.4. Regulador Cuadr´atico Lineal en Estado Estacionario ...bionanouni.wdfiles.com/local--files/teaching-mt227-horario-2011i/Clase10-02.pdf10.4. Regulador Cuadr´atico Lineal en

CONTROL OPTIMO - REGULADOR CUADRATICO LINEAL

Ejemplo Aeronave de Impulsion

Considere la dinamica original de la aeronave de impulsion presentada en clases anteriores:

dz

dt=

z4z5z6

−g sin θ − cmz4

−g cos θ − cmz5

0

+

000

1

mcos θF1 − 1

msin θF2

1

msin θF1 +

1

mcos θF2

rJF1

.

Los parametros del sistema son m = 4kg, J = 0,0475kgm2, r = 0,25m, g = 9,8m/s2, c = 0,05Ns/m, quecorresponden a un modelo escalado del sistema. El punto de equilibrio para el sistema esta dado por F1 = 0,F2 = mg y ze = (xe, ye, 0, 0, 0, 0). Calculamos el sistema linealizado:

A =

0 0 0 1 0 00 0 0 0 1 00 0 0 0 0 10 0 −g −c/m 0 00 0 0 0 −c/m 00 0 0 0 0 0

, B =

0 00 00 01

m0

0 1

mrJ

0

, C =

[

1 0 0 0 0 00 1 0 0 0 0

]

, D =

[

0 00 0

]

.

Haciendo z = z − ze y v = u− ue, el sistema linealizado esta dado por:

dz

dt= Az +Bv,

y = Cz.

Se puede verificar que el sistema es alcanzable.

Para calcular el regulador cuadratico lineal para el sistema, escribimos la funcion costo como:

J =

0

(zTQz + vTRv)dt,

donde z = z − ze y v = u − ue representan las coordenadas locales en torno al punto de equilibrio (ze, ue).Comenzamos con matrices diagonales para los costos del estado y la entrada:

Q = I6×6, R = I2×2.

Luego la ley de control de la forma v = −Kz sera usada para derivar la ley de control en terminos de lasvariables originales:

u = v + ue = −K(z − ze) + ue.

Como especificado en clases anteriores, los puntos de equilibrio corresponden a ue = (0,mg) y ze =(xe, ye, 0, 0, 0, 0). La respuesta del controlador a un cambio de la funcion escalon para la posicion desea-da es mostrada en la Fig. 3a. La respuesta puede ser afinada cambiando los pesos en la funcion de costo. LaFig. 12b muestra la respuesta en la direccion x para diferentes selecciones del peso ρ, siendo que R = ρI2.

6.3. STATE FEEDBACK DESIGN 193

0 2 4 6 8 100

0.5

1

Time t [s]

Positionx,

y[m

]

xy

(a) Step response in x and y

0 2 4 6 8 100

0.5

1

Time t [s]

Positionx[m

]

ρ

(b) Effect of control weight ρ

Figure 6.12: Step response for a vectored thrust aircraft. The plot in (a) shows the x and ypositions of the aircraft when it is commanded to move 1 m in each direction. In (b) the xmotion is shown for control weights 1, 102, 104. A higher weight of the input term inthe cost function causes a more sluggish response.

level. Since other processes may be running on the server, the web server mustadjust its parameters in response to changes in the load.

A block diagram for the control system is shown in Figure 6.13. We focus onthe special case where we wish to control only the processor load using both the

and parameters. We also include a “disturbance” onthemeasured load that represents the use of the processing cycles by other processesrunning on the server. The system has the same basic structure as the generic controlsystem in Figure 6.5, with the variation that the disturbance enters after the processdynamics.

The dynamics of the system are given by a set of difference equations of theform

x[k 1] Ax[k] Bu[k] ycpu[k] Ccpux[k] dcpu[k]

where x xcpu xmem is the state, u uka umc is the input, dcpu is the processingload from other processes on the computer and ycpu is the total processor load.

We choose our controller to be a state feedback controller of the form

u K ycpuxmem

krrcpu

Feedback

rcpu u

d

yPrecompensation Controller

kre

C

1

Server

P

Figure 6.13: Feedback control of a web server. The controller sets the values of the webserver parameters based on the difference between the nominal parameters (determined bykrr ) and the current load ycpu. The disturbance d represents the load due to other processesrunning on the server. Note that the measurement is taken after the disturbance so that wemeasure the total load on the server.

Figura 12: Respuesta al escalon de una aeronave de impulsion. La Fig. a muestra las posiciones “x” e “y”de la aeronave cuando se le comanda moverse 1m en cada direccion. En Fig. b se muestra el movimientox variando los pesos de control ρ = 1, 102, 104. Un peso mas grande en el termino de control de la funcioncosto causa una respuesa mas lenta.

Clase10-02, pag. 21

Page 12: 10.4. Regulador Cuadr´atico Lineal en Estado Estacionario ...bionanouni.wdfiles.com/local--files/teaching-mt227-horario-2011i/Clase10-02.pdf10.4. Regulador Cuadr´atico Lineal en

CONTROL OPTIMO - REGULADOR CUADRATICO LINEAL

10.4.4. Propiedades de robustez del diseno LQR

Un sistema de control que usa el regulador cuadratico lineal presenta las siguientes caracterısticas derobustez. Esto es, los margenes de estabilidad de la matriz de funciones de transferencia en lazo L(s) =K(sI −A)−1B (equivalentemente, las condiciones para que |1 + L(iω)| > 1) estan dados por:

Margen de ganancia (GM): 1

2< GM < 1.

Margen de fase (PM): PM > 60o.

La Fig. 13 presenta el diagrama de Nyquist de la funcion de transferencia de lazo, L(s), para un modelosimplificado de un satelite.

A =

[

0 10 0

]

, B =

[

01

]

, C =[

1 0]

, D = 0.

Figura 13: Diagram de Nyquist mostrando margenes de estabilidad del LQR.

10.5. Regla de Bryson para seleccion de matrices Q y R

Si se conocen los valores maximos de los estados finales, estados contınuos y entradas contınuas, luego sepuede aplicar la siguiente regla para la seleccion de matrices de ponderacion F , Q y R:

Fii =1

max([xi(T )]2)

Qii =1

(T − to)max([xi(t)]2)

Rjj =1

(T − to)max([ui(t)]2)

donde i = 1, 2, ..., n y j = 1, 2, ...,m. Si el tiempo no es importante en la aplicacion evaluada luego el intervalode tiempo entre parentesis, (T−to), puede elegirse igual a 1. Los terminos fuera de la diagonal de las matricesde ponderacion pueden ser usados si existe interaccion entre los componentes de las entradas o estados.

Fuente: Capıtulo 5 del libro Systems and Control de Stanislaw H. Zak, Oxford University Press, 2003.

Fuente: Capıtulo 5 del libro Linear Systems Control - Deterministic and Stochastic Methods de ElbertHendricks, Ole Jannerup y Paul Sorensen, Springer, 2008.

Fuente: Capıtulo 6 del libro Feedback Systems: An Introduction for Scientists and Engineers, de Karl J.Astrom y Richard M. Murray.

Clase10-02, pag. 22