Estudio - esi2.us.esjaar/Datos/Articles/ja.pdf · endulo no est a con trolada p or ning un...

Estudio comparativo de diferentes estrategias

de control para el p�endulo de Furuta

J.A. Acosta, J. Aracil, F. Gordillo

Dep. Ingenier��a de Sistemas y Autom�atica

Universidad de SevillaCamino de los descubrimientos s/n

41092 - SevillaSpain

email:(jaar, aracil, gordillo)@cartuja.us.es

Resumen

En este art��culo se presenta un estudio comparati-

vo de diferentes estrategias de control que se han

propuesto en la literatura para controlar en posici�on

vertical (hacia arriba) el p�endulo rotativo de Furu-

ta. Se estudian tanto las estrategias para \levantar"el

p�endulo (problema del \swing-up") desde la posici�on

colgante inferior, como las de estabilizaci�on en es-

ta �ultima posici�on. Se hace un an�alisis cr��tico de las

ventajas e inconvenientes de las diferentes estrategias

consideradas.

Palabras clave: P�endulo de Furuta. Swing up.

Moldeo de energ��a potencial. Moldeo de energ��a

cin�etica.

1 Introducci�on

En este art��culo se comparan diversas estrategias de

control para el p�endulo invertido rotatorio, tambi�en

conocido como p�endulo de Furuta [5]. Este sistema

es un banco de pruebas excelente para estrategias de

control no lineal, especialmente cuando los experi-

mentos no se limitan a un entorno del punto de op-

eraci�on deseado. El p�endulo en el que se han reali-

zado los experimentos y del que se puede ver una

representaci�on esquem�atica en la Fig. 1, consta de

un brazo de 23.5 cm, movido por un motor de corri-

ente continua que puede proporcionar 5 Nm de par,

accionado por un servo PWM, del cual pende un

p�endulo de 28 cm de longitud y 67.8 g de masa, que

puede girar libremente en el plano paralelo al eje,

o perpendicular al brazo. Se trata de controlar la

posici�on del p�endulo, mediante la �unica acci�on posi-

ble, el motor. �Este es un sistema de control subac-

tuado, ya que la articulaci�on que une el brazo con

el p�endulo no est�a controlada por ning�un actuador.

El control de dicho p�endulo se realiza mediante una

tarjeta de adquisici�on y control de datos basada en

DSP's (Procesadores Digitales de Se~nal), instalada en

un PC.

El art��culo est�a estructurado del siguiente modo:

primero se hace un estudio mec�anico de las ecua-

ciones del sistema, con el objeto de tener un modelo

aproximado del sistema. El estudio se hace a trav�es

de la formulaci�on de Lagrange. Con esto se obtiene

un modelo lineal aproximado para su posterior con-

trol. Posteriormente se estudia el control del p�endulo

en torno a la posici�on superior. Se deducen las leyes

de control tanto para acercar al p�endulo a la posici�on

inferior, como para estabilizarlo en la misma. Se har�a

una comparaci�on de las leyes no lineales frente a una

lineal obtenida por LQR que se utilizar�a como base.

Por �ultimo, se exponen los resultados obtenidos en el

sistema experimental.

1

2 Modelo mec�anico del sistema

Se deduce el modelo del sistema a trav�es de las ecua-

ciones de Euler-Lagrange. En la Fig. 1 se puede

ver una representaci�on de dicho sistema mec�anico as��

como las referencias de �angulos elegidas para el de-

sarrollo matem�atico. Las coordenadas del centro de

Figura 1: P�endulo rotatorio.

masa del p�endulo de longitud 2l y masa m, son:

xcm = r cos'� lsen�sen'

ycm = rsen'+ lsen� cos �

zcm = l cos � (1)

derivando �estas se obtiene la velocidad del centro de

masa:

v =

qr2 _'2 + l2 _'2sen2� + 2rl _' _� cos � + l2 _�2 (2)

Ahora ya se puede plantear la ecuaci�on de la energ��a

cin�etica del p�endulo respecto al sistema de referencia

propuesto:

2T = mv2 + Ja _'2 + Jp

�_�2 + _'2sen2�

�=�Ja +mr2 +

�Jp +ml2

�sen2�

�_'2

+2mrl _' _� cos � +�Jp +ml2

�_�2 (3)

con Ja el momento de inercia del motor m�as el brazo

y Jp el momento de inercia del p�endulo respecto al eje

de giro del mismo. Tomando como origen de energ��a

potencial la posici�on superior, �esta ser�a:

V = mgl(cos � � 1) (4)

La lagrangiana se obtiene como la diferencia L =

T � V :

L =1

2f

�Ja +mr2 +

�Jp +ml2

�sen2�

�_'2

+2mrl _' _� cos � +�Jp +ml2

�_�2g

+mgl(cos � � 1) (5)

Las ecuaciones de Euler-Lagrange en los t�erminos ha-

bituales son:

d

dt

@L

@ _��

@L

@ _�+@D( _�)

@ _�= 0

d

dt

@L

@ _'�

@L

@'= F �Fr (6)

donde Fr es la fuerza de fricci�on en el brazo, la cual

se ha modelado mediante el modelo de LuGre, debido

a que un simple modelo de fricci�on viscosa no es su�-

ciente. D( _�) = 1

2cp _�2 es la funci�on de disipaci�on de

Rayleigh, para modelar la fricci�on viscosa de la uni�on

del p�endulo con el brazo. Para obtener dichas ecua-

ciones se de�nen unos par�ametros m�as manejables

que las variables f��sicas:

J = Jp +ml2 !0 =q

mgl

J

� = mrl

J� = Ja+mr

2

J

= K

mglcp =

cp

Jp+ml2

F = Ku Fr = Kur

(7)

donde K es la ganancia equivalente desde el motor

hasta el control, m y l son la masa y longitud del

p�endulo, r es la longitud del brazo y cp el coe�ciente

de fricci�on viscosa del p�endulo. Las ecuaciones con

estos par�ametros quedan:

�� _'2sen� cos � + � �' cos � � !20sen� + cp _� = 0

�� cos � � � _�2sen� + 2 _� _'sen� cos �

+(� + sen2�) �' = !20(u � ur) (8)

Reescribiendo estas ecuaciones en la forma matri-

cial est�andar D(q)�q + C(q; _q) + g(q) = Mu, donde

2

q = [�; ']T y _q = [ _�; _']T (ecuaciones (9)), se pueden

despejar expl��citamente las aceleraciones angulares

del brazo �' y del p�endulo ��, para luego obtener un

modelo lineal asociado. Se tiene:�1 � cos �

� cos � � + sen2�

��

�'

�+

�cp � _'sen� cos �

�� _�sen� + _'sen� cos � _�sen� cos �

��_�

_'

�+

��!20sen�

0

�=

�0

!20(u � ur)

�(9)

Despejando �' y ��, por simple premultiplicaci�on de

la ecuaci�on (9) por la matriz D(q)�1, cuyo determi-

nante es � = � + sen2� � �2cos2� 1.Se tienen las

aceleraciones angulares en forma expl��cita:

�� =1

�f��2 _�2sen� cos � + (� + sen2�) _'2sen� cos �

+2� _� _'sen� cos2 � + �!20sen� + !20sen3�

�cp(� + sen�2) _� � � !20 cos �u + � !20 cos �urg

�' =1

�f� _�2sen� � � _'2sen� cos2 � � 2 _� _'sen� cos �

��!20sen� cos � + �cp cos � _� + !20u � !20urg

(10)

Se obtiene un modelo lineal asociado simplemente

truncando en el desarrollo de Taylor de las ecuaciones

(10) a partir del t�ermino de primer orden en adelante,

particularizando en el punto de equilibrio deseado

[�; _�; ' _'] = [0; 0; 0; 0]. Se escribe el sistema de ecua-

ciones en la forma matricial _x = Ax+Bu, con vector

de estados [�; _�; '; _'], en el que se ha de�nido en la

forma habitual _x1 = x2 y _x3 = x4. Como la variable

x3 = ' es c��clica se puede hacer una reducci�on del or-

den del sistema. Por tanto, el nuevo vector de estado

que de�ne el sistema de ecuaciones diferenciales de

coe�cientes constantes es [x1; x2; x3] = [�; _�; _']. Con

1N�otese que D(q) es una matriz sim�etrica con determinante

� 6= 0.

ello el sistema es:0@ _x1_x2_x3

1A =1

�

0@ 0 1 0

�!20 �cp� 0

��!20 cp� 0

1A0@x1x2x3

1A+1

�

0@ 0

�� !20 !20

1A (u � ur) (11)

con

� = � � �2

En este punto ya se tiene un modelo completo

para simulaciones fuera del entorno de estabilizaci�on

(ecuaciones (10)), y un modelo lineal entorno al mis-

mo de tres variables de estado (ecuaciones (11)).

3 Problema del Swing up

El problema del swing-up consiste en la inyecci�on de

energ��a para llevar el p�endulo desde la posici�on in-

ferior (colgante) hasta la superior (erecta). Una vez

el p�endulo en la posici�on superior se procede a la es-

tabilizaci�on local del p�endulo en esa posici�on. Este

segundo problema se estudia en la secci�on 4. En esta

se van a presentar las dos estrategias m�as empleadas

para la inyecci�on de energ��a con el �n de \levantar"el

p�endulo. Ambas est�an basadas en el m�etodo de Frad-

kov 1996 [16], que permite obtener leyes de control a

partir de una funci�on objetivo (que tambi�en juega el

papel de funci�on de Liapunov). La primera, debida

a �Astr�om y Furuta, emplea un modelo muy simpli-

�cado de segundo orden (s�olo considera la posici�on

y la velocidad del p�endulo), pero es particularmente

simple y efectiva; mientras que la segunda emplea un

modelo de tercer orden (considera adem�as la veloci-

dad de giro del brazo), lo que da lugar a una ley de

control m�as compleja, aunque m�as rica en e�ciencia,

como se pondr�a de mani�esto en un ejemplo.

3.1 Ley obtenida por el m�etodo de

Fradkov basada en un modelo de

dimensi�on 2

La ley de control propuesta por �Astr�om y Furuta [5],

est�a basada en controlar la energ��a del p�endulo pres-

3

cindiendo del brazo (modelo simpli�cado de 2 dimen-

siones), y se deduce por el m�etodo de Fradkov. El sis-

tema de ecuaciones de dos dimensiones que describe

el movimiento del p�endulo, despreciando la fuerza de

reacci�on que el brazo ejerce sobre el mismo, es:

_x1 = x2

_x2 =mgl

Jp

senx1 �ml

Jp

cosx1u (12)

Se toma como referencia de energ��a potencial al

p�endulo en posici�on horizontal, de modo que la e-

nerg��a total del p�endulo en bucle abierto es:

H =1

2Jpx

22 +mgl cosx1 (13)

Se puede ver que la energ��a coincide con el valor de la

homoclina en el plano [x1; x2]. Se toma como funci�on

objetivo o funci�on de Liapunov

Q = H2

aplicando la derivada de Lie a la funci�on objetivo,

LgfQ(x)g = ru_Q(x)

y como

ru_Q(x) = ru

�@Q(x)

@x_x

�= gT (x)

@Q(x)

@x

la ley de control viene dada por

u = �kgT (x)@Q(x)

@x

operando se tiene

u = kHx2 cosx1 (14)

donde la constante k se puede hacer tan grande como

sea posible en nuestro sistema de control, es decir,

saturando la se~nal de control u. Se pierde la con-

trolabilidad para x2 = 0 �o x1 = ��

2, es decir con

el p�endulo horizontal o con el cambio de sentido de

giro. Esta ley lleva al p�endulo a energ��a cero (H = 0),

que es que la homoclina en el plano (x1; x2). �Astr�om

propone variantes de (14), tales como:

u = sat fk(H�H�)g sign (x2 cosx1) (15)

la cual, aprovecha al m�aximo el par motor. Tambi�en

existen otras variantes de (14) por los motivos que se

aprecian el la simulaci�on. Algunas de estas variantes

intentan corregir el aumento de la velocidad del brazo

(ya que �esta no se controla en la ley (14)), con un

t�ermino adicional en la ley de control proporcional a

la misma. Todas estas variantes son m�as e�cientes

pero, en esencia, son equivalentes. La �unica que se

considera aqu�� es la (14) que permite un tratamiento

anal��tico m�as sencillo.

3.2 Ley obtenida por el m�etodo de

Fradkov basada en un modelo de

dimensi�on 3

Ahora se tendr�a en cuenta el brazo para la deducci�on

de la ley por el m�etodo de Fradkov, mediante un mo-

delo m�as completo. Las ecuaciones del sistema en la

forma de sistemas Hamiltonianos generalizados a�nes

en el control:

_x = f(x) + g(x)u

y = h(x)

las cuales para el sistema de dimensi�on 3 son,0@ _x1_x2_x3

1A =

0@ f1(x1; x2; x3)

f2(x1; x2; x3)

f3(x1; x2; x3)

1A+1

�

0@ 0

�� !20 !20

1A u

(16)

con variables de estado [x1; x2; x3] = [�; _�; _'].

Planteamos la funci�on objetivo tal que lleve al sis-

tema hacia la trayectoria en el espacio de estados

[x1; x2; x3], intersecci�on de la super�cie de energ��a

cero y la de momento generalizado de la variable

x3 = _' cero, luego la funci�on objetivo es:

Q = �11

2(H�H

�)2| {z } + �2

1

2(p2 � p�2)

2| {z }Q1 Q2

4

donde

p2 =@L

@x3= J f�x2 cosx1 + (� + sen2x1)x3g (17)

y �1 y �2 son constantes arbitrarias. Se aplica el

m�etodo de Fradkov a cada funci�on por separado.

Primero se obtiene la ley que nos proporciona di-

cho m�etodo para Q1, del modo siguiente:

_Q1 = (H�H�) _H

_H =1

2_qTD(q) _q + V(q)

y conociendo el resultado,

_H =1

2_qTD(q) _q + V(q)

= _qM(q)u

se obtiene en general:

u1 = � !20x3(H�H�) (18)

donde H� es la energ��a de referencia, que en nuestro

caso es 0. Por otro lado ahora se plantea como fun-

0 1 2 3 4 5

−5

0

5

t(seg)

x 1(rad

)

0 1 2 3 4 5−40

−20

0

20

40

t(seg)

x 2(rad

/seg

)

0 1 2 3 4 5−20

−10

0

10

20

30

t(seg)

x 3(rad

/seg

)

0 0.5 1 1.5 2−0.5

0

0.5

t(seg)

u

−10 −5 0 5 10−40

−20

0

20

40

x1(rad)

x 2(rad

/seg

)

−10 −5 0 5 10−40

−20

0

20

40

x1(rad)

x 3(rad

/seg

)

Figura 2: Swing up del p�endulo con la ley de dimen-

si�on 2. Simulaci�on.

ci�on objetivo alcanzar momento generalizado de la

variable _' cero. Se tiene:

Q2 =1

2(p2 � p�2)

2

0 1 2 3 4 5

−5

0

5

t(seg)

x 1(rad

)

0 1 2 3 4 5−40

−20

0

20

40

t(seg)

x 2(rad

/seg

)

0 1 2 3 4 5−20

−10

0

10

20

t(seg)

x 3(rad

/seg

)

0 1 2 3 4 5−0.5

0

0.5

t(seg)

u

−10 −5 0 5 10 15−40

−20

0

20

40

x1(rad)

x 2(rad

/seg

)

−10 −5 0 5 10 15−20

−10

0

10

20

x1(rad)

x 3(rad

/seg

)

Figura 3: Swing up del p�endulo con la ley de dimen-

si�on 3, obtenido por simulaci�on.

luego

_Q2 = (p2 � p�2) _p2

y recordando que la variable ' es c��clica, en las ecua-

ciones de Hamilton

_p2 = �

@H

@'+ J !20u

se tiene

_Q2 = (p2 � p�2)J !20u

Luego la ley de control vendr�a dada por:

u2 = �ru_Q2 = �J !20(p2 � p�2) (19)

con lo que la ley de control ser�a la suma de ambos

objetivos:

u = � !20(H�H�)x3 �J !

20(p2 � p�2) (20)

donde del mismo modo p�2 es el momento de referencia

de la variable _', que en nuestro caso es 0. En (20)

las constantes �1 y �2 toman los valores �1 = � !20 y

�2 = �J !20.

5

0 0.01 0.02 0.03

−0.18

−0.16

−0.14

−0.12

−0.1

−0.08

−0.06

−0.04

−0.02

0

t(seg)

H

1 2 3 4 50

2

4

6

8

10

12

14

16

x 10−4

t(seg)Q

Figura 4: Funciones de energ��a H y de Liapunov Q

en el swing up del p�endulo con la ley de dimensi�on 3.

3.3 Comparaci�on de las estrategias de

control para hacer swing up

As�� como la comparaci�on de leyes que estabilizan al

p�endulo en la posici�on superior, posee un claro crite-

rio como es el de la cuenca de atracci�on, en la com-

paraci�on de las leyes para hacer swing up se hace

dif��cil establecer un criterio tan gr�a�co. Por ello se

ha elegido la opci�on opuesta, es decir, buscar un con-

traejemplo que garantice un criterio de comparaci�on.

Se simulan ambas leyes de control con condiciones

iniciales arbitrarias [x1; x2; x3] = [3:14; 0:1; 0:1], y se

observa que la ley de dimensi�on 2 pasa la primera vez

por la posici�on superior con las variables x1 y x2 cer-

canas a cero mientras que se \olvida"de la variable

x3 (ya que esta ley no la tiene en cuenta). En los

sucesivos pasos por la posici�on superior la ley hace

que las variables x1 y x2 se alejen cada vez m�as de

los valores deseados. Por el contrario la ley de dimen-

si�on 3 posee informaci�on de la variable x3, y siempre

hace los pasos por la posici�on superior con los val-

ores de las variables x1 y x2 cercanos a cero. Estos

fen�omenos se pueden ver en las Fig. 2 y 3. Tambi�en

pueden observarse en la Fig. 4 como, en la ley de

dimensi�on 3, la funci�on de energ��a H tiende a cero y

la funci�on de Liapunov Q es mon�otona decreciente.

4 Control local estabilizante

En esta secci�on se deducen las leyes para la estabi-

lizaci�on del p�endulo en torno a la posici�on de equi-

librio. Se obtienen las leyes por los correspondientes

m�etodos, intentando ser los m�as claro posible, pero

debe quedar claro que no es objetivo del art��culo la

deducci�on detallada de las mismas. El objetivo de las

leyes que aqu�� se van a tratar es mantener el p�endulo

en su posici�on superior a la vez que se mantiene el

brazo en reposo (x3 = 0). La posici�on del brazo ' es

indiferente. Como se ha comentado previamente, no

se conoce ninguna estrategia de este tipo que alcance

con �exito el objetivo partiendo de cualquier condici�on

inicial. En otras palabras, estas estrategias tienen un

�ambito de aplicaci�on local en torno al punto de o-

peraci�on deseado, de manera que consiguen que �este

sea un equilibrio del sistema dotado de estabilidad

local con una cuenca de atracci�on limitada. Como

medida de bondad de las diversas leyes se va tomar

el \tama~no"de esta cuenca de atracci�on por medio

del siguiente experimento: se parte de una posici�on

en reposo (x2 = 0, x3 = 0) y se busca el mayor valor

inicial de x1 para el que una determinada ley tiene

�exito. Con ello se obtiene una medida de la cuenca

de atracci�on para el sistema. En cada secci�on adem�as

de exponer la ley de control, se disponen los resulta-

dos de el experimento citado. Al �nal se har�a una

comparaci�on de estos resultados.

4.1 Ley lineal

La ley estabilizante m�as extendida es la resultante del

m�etodo LQR. Para ello se debe partir de un modelo

linealizado (se ha elegido el modelo (11)) y elegir las

matrices de ponderaci�on de�nidas positivas Q y R del

��ndice de funcionamiento

J =

Z 1

0

(xTQx+ uTRu)dt

La ley de control �optima es de la forma u = �Kx =

�R�1BTP . Donde P es la soluci�on de�nida positiva

de la ecuaci�on de Riccati:

Q� PB�1BTP +ATP + PA = 0

6

las matrices A y B son las del sistema linealizado

_x = Ax+Bu

El sistema de control resultante de aplicar esta ley

de control al modelo lineal ser�a globalmente estable.

Sin embargo, en nuestro caso el modelo lineal s�olo es

v�alido en torno a la posici�on superior. Adem�as existe

otra limitaci�on no considerada que es la saturaci�on de

la se~nal de control. Esta limitaci�on no permite ele-

gir leyes de control demasiado en�ergicas (Q \mucho

mayor"que R). Despu�es de un proceso iterativo se

puede llegar a una ley de control se comporte de for-

ma aceptable en un entorno adecuado de la posici�on

superior. El resultado elegido es:

Q =

0@97 0 0

0 0:33 0

0 0 10�6

1A (21)

R = 8 (22)

P =

0@5:7444 0:0054 0:0024

0:0054 0:0003 0:0002

0:0024 0:0002 0:0002

1A (23)

K =�3:5 0:2 0:0004

�(24)

Obs�ervese que el �ultimo valor de la matriz Q

es extremadamente peque~no. Se ha elegido as��

porque de hacerlo mayor la ley de control saturar��a

r�apidamente. Esto es l�ogico, ya que la �unica forma de

actuar sobre el p�endulo es acelerar o frenar el brazo

con lo que el objetivo de llevar x3 a cero se debe inter-

pretar como un objetivo secundario tras el de hacer

que x1 = 0 y x2 = 0. Debido a la gran fricci�on del

brazo, para poder mantenerlo en la posici�on de equi-

librio se a~nade al control un compensador de fricci�on

basado en el modelo de Coulomb. Esta adici�on del

compensador da lugar a un ciclo l��mite estable alrede-

dor de la posici�on de equilibrio. Se simula el sistema

(ecuaciones (10)) con el compensador y los resulta-

dos se muestran en la Fig. 5 y lo comparamos con

los experimentos de la Fig. 6. Por �ultimo se hace el

experimento correspondiente para la detecci�on de la

cuenca de atracci�on de la ley de control lineal, Fig.

7.

−0.04 −0.02 0 0.02 0.04−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

x1(rad)

x2(r

ad/s

eg)

−0.03 −0.02 −0.01 0 0.01 0.02−2

−1

0

1

2

x1(rad)

x3(r

ad)

−0.04 −0.02 0 0.02 0.040.4

0.42

0.44

0.46

0.48

0.5

x1(rad)

Φ(r

ad)

−0.10

0.1

−2

0

2−4

−2

0

2

x1(rad)x2(rad)

x3(r

ad/s

eg)

Figura 5: Simulaci�on del control LQR del p�endulo en

torno a la posici�on de equilibrio. Ciclo l��mite formado

debido a la fricci�on del brazo.

−0.04 −0.02 0 0.02 0.04−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

x1(rad)

x2(r

ad/s

eg)

−0.03 −0.02 −0.01 0 0.01 0.02−2

−1

0

1

2

x1(rad)

x3(r

ad/s

eg)

−0.04 −0.02 0 0.02 0.040.47

0.48

0.49

0.5

0.51

0.52

0.53

x1(rad)

Φ

−0.050

0.05

−1

0

1−2

0

2

x1(rad)x2(rad)

x3(r

ad/s

eg)

Figura 6: Control experimental LQR del p�endulo en

torno a la posici�on de equilibrio. Ciclo l��mite que se

forma debido a la fricci�on del brazo.

7

0 5 10 15 20−1

−0.5

0

0.5

t(seg)

x 1(rad

)

0 5 10 15 20−2

0

2

4

6

t(seg)

x 2(rad

/seg

)

0 5 10 15 20−20

0

20

40

60

t(seg)

x 3(rad

/seg

)

0 5 10 15 20−0.2

0

0.2

0.4

0.6

t(seg)u

5.4 5.6 5.8 6 6.2 6.4−2

0

2

4

6

x1(rad)

x 2(rad

/seg

)

5.4 5.6 5.8 6 6.2 6.4−20

0

20

40

60

x1(rad)

x 3(rad

/seg

)

Figura 7: Experimento para la detecci�on de la cuenca

de atracci�on de la ley LQR.

4.2 Ley obtenida por moldeo energ��a

potencial

La ley que se obtiene a continuaci�on est�a basada en el

m�etodo expuesto en [14], y que aqu�� se desarrollar�a

de una forma m�as intuitiva. La energ��a debida al

p�endulo1, en bucle abierto, posee un punto de silla2

en la posici�on del equilibrio deseado. Esta energ��a es

H =1

2J _�2 + J !20(cos � � 1)

la cual tiene la forma geom�etrica de la Fig. 8a en

el espacio de estados [x1; x2] = [�; _�], y cuyo retrato

de estados tambi�en puede observarse en la Fig. 8b.

Por tanto, con la adici�on de la energ��a potencial Va se

desea obtener una energ��a en bucle cerrado, de forma

que el equilibrio se vuelva estable. As�� necesitamos

una energ��a potencial adicional Va = �2V , con la

cual se moldea la energ��a total a la forma de la Fig.

9. De otro modo, la energ��a potencial del p�endulo en

bucle abierto, Fig. 10 se modi�ca a una nueva energ��a

1Ahora al referirnos al p�endulo, estamos considerando s�olo

el p�endulo como sistema, sin el brazo.2Los equilibrios del sistema son los m�aximos y m��nimos de

la energ��a potencial V. Los m��nimos son equilibrios estables,

mientras que los m�aximos son puntos de silla o equilibrios in-

estables.

−4

−2

0

2

4

−1

−0.5

0

0.5

1−2

−1.5

−1

−0.5

0

0.5

θ°θ

H

−1.5

−1

−0.5

0

0.5

−3 −2 −1 0 1 2 3−1

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

0.8

1

θ

° θ

Figura 8: Energ��a del p�endulo en bucle abierto. Re-

trato de estados.

potencial que ser�a la suma de V + Va. �Esta posee un

m��nimo en el equilibrio deseado (Fig. 11) Se tiene el

sistema en bucle abierto dado por la ecuaci�on (25).�_x1_x2

�=

1

J

�0 1

�1 0

��@H

@x1@H

@x2

�+

0

!2

0K

gcosx1

!u

(25)

Se desea que en bucle cerrado el sistema sea el si-

guiente:

_x = [J � Ra]@ eH@x

donde la matriz Ra es la de amortiguamiento a~nadido

al sistema, luego�_x1_x2

�=

1

J

��0 1

�1 0

��

�0 0

0 ka

�� @ eH

@x1

@ eH

@x2

!(26)

−4

−2

0

2

4

−3

−2

−1

0

1

2

30

1

2

3

4

5

6

7

θ°θ

H

1

2

3

4

5

6

−3 −2 −1 0 1 2 3−3

−2

−1

0

1

2

3

θ

°

θ

Figura 9: Energ��a del p�endulo en bucle cerrado. Re-

trato de estados.

8

−4 −3 −2 −1 0 1 2 3 4−2

−1.8

−1.6

−1.4

−1.2

−1

−0.8

−0.6

−0.4

−0.2

0

θ

V

Figura 10: Energ��a potencial del p�endulo en bucle

abierto.

donde la funci�on eH es el Hamiltoniano deseado,

que tendr�a la expresi�on:

eH =1

2J_�2 �J !20(cos � � 1) (27)

Igualando las ecuaci�on en bucle abierto (25) y la

ecuaci�on en bucle cerrado (26), se puede determinar

la ley de control.

1

J

�0 1

�1 0

��@H

@x1@H

@x2

�+

0

!2

0K

gcosx1

!u

=

�1

J

�0 1

�1 0

��

�0 0

0 �ka

�� @ eH

@x1

@ eH

@x2

!

Se tiene un sistema de 2 ecuaciones. La primera

ecuaci�on (primera �la) se cumple ya que tanto H co-

mo eH tienen la misma dependencia con la variable _�.

−4 −3 −2 −1 0 1 2 3 40

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

1.8

2

θ

V

Figura 11: Energ��a potencial del p�endulo en bucle

cerrado.

De la segunda ecuaci�on, tenemos:

�1

J

@H

@�+ Bu =

�1

J

@ eH@�

� ka@ eH@ _�

!20sen� +!20K

gcos �u = !20sen� � kaJ _�

u =�2g

Ktan � �

kaJ g _�

!20K cos �

que en general ajustando las constantes con el criterio

lineal LQR quedar�a:

u = K1 tan � +K2

_�

cos �(28)

En la Fig. 12 pueden verse los resultados del ex-

perimento de detecci�on de la cuenca de atracci�on.

Aunque en teor��a esta ley es una ley global para

el sistema de ecuaciones (25), no est�a de�nida para

� = �

2; �, y adem�as en la pr�actica no es posible ha-

cer swing up, debido a la que el t�ermino cos � en el

denominador provoca la saturaci�on del actuador.

0 5 10 15 20−1

−0.5

0

0.5

t(seg)

x 1(rad

)

0 5 10 15 20−2

0

2

4

6

t(seg)

x 2(rad

/seg

)

0 5 10 15 20−20

0

20

40

60

t(seg)

x 3(rad

/seg

)

0 5 10 15 20−0.5

0

0.5

t(seg)

u

5.4 5.6 5.8 6 6.2 6.4−2

0

2

4

6

x1(rad)

x 2(rad

/seg

)

5.4 5.6 5.8 6 6.2 6.4−20

0

20

40

60

x1(rad)

x 3(rad

/seg

)

Figura 12: Experimento para la detecci�on de la cuen-

ca de atracci�on de la ley potencial.

4.3 Ley obtenida por el m�etodo del

Lagrangiano Controlado

Parte de la deducci�on de la ley por el m�etodo del

Lagrangiano Controlado ya se public�o por el grupo

9

ucons = �

J senx1[�x22 � 2 cosx1x2x3 � � cosx21x

23 � �!20 cosx1]

c�+ 1

udiss = �c��([J (� + senx21)]x3 + J � cosx1x3(� + 1)

� = J (� + senx21 � �2 cosx21)

� = �

(J� cosx1)2[J (� + senx21)� (J (� + senx21)

2]

cJ (� + senx21)[J (� + senx21) +1

c]2

u = ucons + (� + 1)udiss (29)

de trabajo Bloch, Leonard y Marsden (BLM) en [4],

concretamente la parte conservativa de la ley. Aqu��

se hace lo mismo para el modelo planteado y se termi-

na de deducir la parte no conservativa mediante las

f�ormulas coordenadas publicadas tambi�en por dicho

grupo, f�ormulas que son directamente aplicables para

sistemas mec�anicos con simetr��as y subactuados. La

deducci�on de la ley se puede consultar en las refe-

rencias [1], [2], [3] y [4]. Aqu�� se utilizan las f�ormulas

coordenadas de [2], para obtener la ley de control.

Sin m�as pre�ambulo, la ley de control uBLM se puede

0 1 2 3 4 5−1

−0.5

0

0.5

1

t(seg)

x1(r

ad)

0 1 2 3 4 5−5

0

5

t(seg)

x2(r

ad/s

eg)

0 1 2 3 4 5−10

−5

0

5

10

t(seg)

x3(r

ad/s

eg)

0 1 2 3 4 5−0.1

−0.05

0

0.05

0.1

t(seg)

u

Figura 13: Simulaci�on del control del p�endulo en

torno a la posici�on de equilibrio con la ley uBLM .

Variables de estado.

dividir en dos t�erminos, uno que ser��a el correspon-

diente al sistema puramente conservativo ucons, y la

otra que hace que el sistema sea asint�oticamente es-

table udiss (se mantiene la notaci�on de las referen-

cias para facilidad del lector). Aplicando el m�etodo

con las variables [x1; x2; x3] = [�; _�; _']. En efecto,

−0.5 0 0.5−6

−4

−2

0

2

4

6

x1(rad)x2

(rad

/seg

)

−0.5 0 0.5−6

−4

−2

0

2

4

6

8

x1(rad)

x3(r

ad)

−0.5 0 0.5−1

0

1

2

3

4

5

x1(rad)

Φ(r

ad)

−0.5 0 0.5−10

010−5

0

5

10

x1(rad)x2(rad)

x3(r

ad/s

eg)

Figura 14: Simulaci�on del control del p�endulo en

torno a la posici�on de equilibrio con la ley BLM.

Planos de fase.

se puede ver por simulaci�on como controla la ley al

p�endulo. La simulaci�on hecha es para el p�endulo sin

fricci�on, para ver como la ley udiss lleva al p�endulo al

equilibrio, haci�endolo asint�otico. En la Fig. 13 se ven

las variables de estado frente al tiempo y en la Fig. 14

los planos y el espacio de fases. Por �ultimo se exponen

en la Fig. 15, los resultados experimentales. Antes

de presentar los resultados pr�acticos conviene resaltar

en esta ley que se pueden establecer las condiciones

de estabilidad, bien por linealizaci�on del sistema en

bucle cerrado o bien por minimizaci�on de la energ��a

controlada. En cualquier caso estas condiciones ya

10

0 5 10 15 20−0.1

0

0.1

0.2

0.3

t(seg)

x 1(rad

)

0 5 10 15 20−2

−1

0

1

t(seg)

x 2(rad

/seg

)

0 5 10 15 20−10

−5

0

5

t(seg)

x 3(rad

/seg

)

0 5 10 15 20−0.3

−0.2

−0.1

0

0.1

t(seg)

u

6.2 6.3 6.4 6.5 6.6 6.7−2

−1

0

1

x1(rad)

x 2(rad

/seg

)

6.2 6.3 6.4 6.5 6.6 6.7−10

−5

0

5

x1(rad)

x 3(rad

/seg

)

Figura 15: Experimento para la detecci�on de la cuen-

ca de atracci�on de la ley BLM.

fueron presentadas en [4]. Adem�as cabe destacar que

el denominador de dicha ley limitar�a mucho la cuen-

ca de atracci�on, lo que hace crucial la elecci�on de la

constante c.

4.4 Comparaci�on de las estrategias de

control estabilizantes

Para la comparaci�on se llev�o a cabo el experimento

descrito al principio de esta secci�on, y se exponen los

resultados de una forma gr�a�ca en la Fig. 15. Como

se puede ver en la Fig. 16 la ley que mayor cuen-

ca de atracci�on presenta es la ley potencial (secci�on

4.2) seguida de la lineal (secci�on 4.1) y por �ultimo la

BLM (secci�on 4.3). �Esta cuenca est�a limitada por la

saturaci�on de las leyes de control. Se aprecia que la

ley lineal sigue siendo muy pr�actica, ya que combi-

na una facilidad de c�alculo, muy por encima de las

otras, con unos resultados emp��ricos semejantes. De

la ley potencial decir que, parece que de alguna for-

ma es el m�etodo apropiado para ampliar la cuenca.

Hay que tener en cuenta que la ley obtenida est�a

basada en un modelo de dimensi�on 2, lo que limi-

ta mucho al m�etodo, ya que no posee informaci�on

su�ciente. Una ley obtenida por dicho m�etodo con

un modelo m�as completo, parece prever un aumen-

to de la cuenca mucho mayor, pero as�� como la ley

deducida para el modelo aproximado de dimensi�on 2

Figura 16: Comparaci�on de las distintas cuencas de

atracci�on.

es sencilla de obtener, la di�cultad de la resoluci�on

del m�etodo con modelos m�as completos es elevada.

Por �ultimo, el �ultimo m�etodo presenta la mayor com-

plejidad matem�atica, y adem�as los resultados experi-

mentales son los \menos buenos". Hay que destacar,

de este �ultimo m�etodo, la e�cacia del control, como

no pod��a ser menos a tenor de la e�cacia del m�etodo.

E�cacia, que viene re ejada f��sicamente, por la suavi-

dad del control, mucho mayor que las leyes anteriores.

En t�erminos de control se podr��a decir que presenta

el comportamiento m�as sobreamortiguado.

Decir tambi�en que e la saturaci�on del la acci�on de

control disminuye la cuenca de atracci�on. En [8] se

11

estudia con detenimiento el este efecto, mostr�andose

que la saturaci�on produce la aparici�on de un ciclo

l��mite inestable, al que est�a asociada la limitaci�on de

la cuenca de atracci�on.

5 Control h��brido

Se denomina control h��brido la utilizaci�on las dos es-

trategias descritas. Primero, mediante la ley global

se lleva al p�endulo a la posici�on superior, y una vez en

el entorno de la cuenca de atracci�on se conmuta a la

ley local que lo estabilice. Puesto que las condiciones

iniciales de las leyes locales las \imponen"las glo-

bales, se har�a una comparaci�on llevando al p�endulo a

la posici�on superior con las dos estrategias descritas,

y se conmutar�a a una de las leyes locales, por ejemplo

la lineal que es la que posee una cuenca de atracci�on

intermedia. Un primer criterio de comparaci�on es el

0 0.5 1 1.5 20

2

4

6

t(seg)

x 1(rad

)

0 0.5 1 1.5 2−40

−20

0

20

40

t(seg)

x 2(rad

/seg

)

0 0.5 1 1.5 2−10

0

10

20

30

t(seg)

x 3(rad

/seg

)

0 0.5 1 1.5 2−0.5

0

0.5

t(seg)

u

0 2 4 6−40

−20

0

20

40

x1(rad)

x 2(rad

/seg

)

0 2 4 6

−20

0

20

x1(rad)

x 3(rad

/seg

)

Figura 17: Control h��brido. Swing up con la ley de

dimensi�on 2, conmutando a la ley local lineal. Simu-

laci�on sin fricci�on

del tiempo de alcance de la posici�on inferior, que nos

puede dar una idea de la e�ciencia de la ley. Ob-

servando las Fig. 17 y 18, se puede ver que la ley

de �Astr�om es m�as r�apida. Ello es debido a la propia

f��sica del problema. La ley de �Astr�om s�olo tiene en

cuenta la energ��a de la varilla del p�endulo, y por tan-

to, s�olo calcula la diferencia de esta energ��a con la

de referencia, no controlando ni la posici�on ni la ve-

locidad del brazo. Con la otra ley obtenida se lle-

van a cabo dos objetivos llevar al p�endulo hacia la

homoclina y adem�as hacerlo minimizando la energ��a

del sistema completo. �Este es el principal motivo

por el cual esta ley tarda m�as en llevar al p�endulo a

la posici�on superior, ya que los objetivos propuestos

son opuestos. En las simulaciones se aprecia como

la velocidad del brazo alcanza valores menores en el

segundo caso. Otro criterio que se puede apreciar es

que la se~nal de control toma valores menores durante

el swing up con la segunda ley, tambi�en debido al mis-

mo fen�omeno. Esto ultimo tambi�en puede verse en la

comparaci�on anterior de las leyes para hacer el swing

up. Esta comparaci�on no expone una manera de dis-

criminar entre una u otra estrategia, pero si aclara

que el objetivo de llevar al p�endulo hacia la posici�on

superior es opuesto al de estabilizarlo. En la Fig. 19

0 0.5 1 1.5 20

2

4

6

t(seg)

x 1(rad

)

0 0.5 1 1.5 2

−20

0

20

t(seg)

x 2(rad

/seg

)

0 0.5 1 1.5 2−20

−10

0

10

20

t(seg)

x 3(rad

/seg

)

0 0.5 1 1.5 2−0.5

0

0.5

t(seg)

u

0 2 4 6

−20

0

20

x1(rad)

x 2(rad

/seg

)

0 2 4 6−20

−10

0

10

20

x1(rad)

x 3(rad

/seg

)

Figura 18: Control h��brido. Swing up con la ley de

dimensi�on 3, conmutando a la ley local lineal. Simu-

laci�on sin fricci�on

se realiza un experimento con el control h��brido sobre

el sistema f��sico experimental.

12

6 Conclusiones

En este art��culo se ha presentado un estudio compara-

tivo de diversas estrategias de control para el p�endulo

de Furuta. Estas estrategias combinan una ley que

lleva al p�endulo al entorno de la posici�on superior

(swing up), con otra ley estabilizante en torno a esta

posici�on. Las leyes para realizar el swing up consi-

deradas est�an basadas en el m�etodo del gradiente de

velocidad de Fradkov (SG). En una de ellas se apli-

ca este m�etodo a un modelo reducido de dimensi�on

2 y en otra a un modelo de dimensi�on 3, con distin-

tos objetivos de control. En el estudio se ponen de

mani�esto las ventajas de esta �ultima. En cuanto a

las leyes estabilizantes, se ha considerado tres alter-

nativas: una ley lineal, una ley basada en el moldeo

de energ��a potencial y otra basada en el moldeo de

energ��a cin�etica. Con la comparaci�on de los resulta-

dos se ponen de mani�esto las diferencias de tama~no

de la cuenca de atracci�on de estas leyes. Tambi�en se

ha realizado una comparaci�on de la combinaci�on de

estas leyes, denominada control h��brido.

0 5 10 15 20−2

0

2

4

6

t(seg)

x 1(rad

)

0 5 10 15 20−100

−50

0

50

100

t(seg)

x 2(rad

/seg

)

0 5 10 15 20−20

−10

0

10

20

t(seg)

x 3(rad

/seg

)

0 5 10 15 20−0.4

−0.2

0

0.2

0.4

t(seg)

u

−2 0 2 4 6−100

−50

0

50

100

x1(rad)

x 2(rad

/seg

)

−2 0 2 4 6−20

−10

0

10

20

x1(rad)

x 3(rad

/seg

)

Figura 19: Control h��brido experimental. Swing up

con la ley de dimensi�on 3, conmutando a la ley local

lineal.

Referencias

[1] Anthony M. Bloch, Naomi Ehrich Leonard And

Jerrold E. Marsden \Stabilization of the Pen-

dulum on a Rotor Arm by the Method of Con-

trolled Lagrangians", Proc of the 1999 IEEE Int.

Conf. on Robotics an Automation.


Jerrold E. Marsden, \Potencial Shaping and

the Metgod of Controlled Lagrangians", Proc of

IEEE Conf. on Decision and Control, December

1999.


Jerrold E. Marsden, \Stabilization of Mechani-

cal System Using Controlled Lagrangians".


Jerrold E. Marsden,\Matching and Stabilization

the Method of Controlled Lagrangians", Proc.

of IEEE Conf. Decision and Control, December

1998.

[5] K.J. �AStr�om And K. Furuta, \Swinging up a

Pendulum by energy control", Autom�atica, 36

(2000) 287-295.

[6] C. Canudas-De-Wit, \Control of System with

Dynamic Friction", Laboratory of Automat-

ic Control of Grenoble, INPG-ENSIEG-CNRS,

1999.

[7] D. Pagano, \Bifurcaciones en los sistemas de

control", ESI, Sevilla, 1999.

[8] D. Pagano, L. Pizarro, J. Aracil, \Hopf Bifur-

cation Analysis in a Rotational Inverted Pen-

dulum", in N.E. Mastorakis (ed.), Modern Ap-

plied Mathematics Techniques in Circuits, Sys-

tems and Control, World Scienti�c, 1999, 144-

149.

[9] D. Pagano, L. Pizarro, J. Aracil, \Local Bifurca-

tion Analysis in the Furuta Pendulum via Nor-

mal Forms", International Journal of Bifurca-

tions and Chaos, Vol. 10, No. 4, April, 2000.

13

[10] Departamento de Ingenier��a de Sistemas y Au-

tom�atica, Seminarios sobre sistemas Hamilto-

nianos, ESI, Sevilla, 5 de Octubre de 1999.

[11] E. Ponce, J. Aracil, F. Salas, D. Pagano,

\Bifurcation Analysis of an Inverted Pendu-

lum with Saturated Hamiltonian Control Laws",

IFAC Workshop on Lagrangian and Hamiltonian

Methods for Nonlinear Control, Princeton, 2000,

179-180.

[12] J. Aracil, \Notas sobre sistemas de control no

lineales", ESI, Sevilla, 5 de Octubre de 1999.

[13] J. Aracil, K. Astr�om, D. Pagano, \Global Bifur-

cations in the Furuta Pendulum", NOLCOS'98,

1998, Enschebe, The Netherlands, 35-40.

[14] Romeo Ortega, Arjan J. Van Der Shaft, Bern-

hard Maschke And Gerardo Escobar, \Stabiliza-

tion of Port-Controlled Hamiltonian Systems:

Passivation an Energy-Balancing", February 3,

1999.

[15] Van Der Schaft, A. J., \L2 - Gain an Passivity.

Techniques in Nonlinear Control", Ed. Springer

[16] Alexander F. Fradkov and Alexander Yu.

Pogromsky, \Introduction to control of oscilla-

tions and chaos". World Scienti�c, 1998.

14

Estudio - esi2.us.esjaar/Datos/Articles/ja.pdf · endulo no est a con trolada p or ning un...

Documents

Transcript of Estudio - esi2.us.esjaar/Datos/Articles/ja.pdf · endulo no est a con trolada p or ning un...