Estudio - esi2.us.esjaar/Datos/Articles/ja.pdf · endulo no est a con trolada p or ning un...
Transcript of Estudio - esi2.us.esjaar/Datos/Articles/ja.pdf · endulo no est a con trolada p or ning un...
Estudio comparativo de diferentes estrategias
de control para el p�endulo de Furuta
J.A. Acosta, J. Aracil, F. Gordillo
Dep. Ingenier��a de Sistemas y Autom�atica
Universidad de SevillaCamino de los descubrimientos s/n
41092 - SevillaSpain
email:(jaar, aracil, gordillo)@cartuja.us.es
Resumen
En este art��culo se presenta un estudio comparati-
vo de diferentes estrategias de control que se han
propuesto en la literatura para controlar en posici�on
vertical (hacia arriba) el p�endulo rotativo de Furu-
ta. Se estudian tanto las estrategias para \levantar"el
p�endulo (problema del \swing-up") desde la posici�on
colgante inferior, como las de estabilizaci�on en es-
ta �ultima posici�on. Se hace un an�alisis cr��tico de las
ventajas e inconvenientes de las diferentes estrategias
consideradas.
Palabras clave: P�endulo de Furuta. Swing up.
Moldeo de energ��a potencial. Moldeo de energ��a
cin�etica.
1 Introducci�on
En este art��culo se comparan diversas estrategias de
control para el p�endulo invertido rotatorio, tambi�en
conocido como p�endulo de Furuta [5]. Este sistema
es un banco de pruebas excelente para estrategias de
control no lineal, especialmente cuando los experi-
mentos no se limitan a un entorno del punto de op-
eraci�on deseado. El p�endulo en el que se han reali-
zado los experimentos y del que se puede ver una
representaci�on esquem�atica en la Fig. 1, consta de
un brazo de 23.5 cm, movido por un motor de corri-
ente continua que puede proporcionar 5 Nm de par,
accionado por un servo PWM, del cual pende un
p�endulo de 28 cm de longitud y 67.8 g de masa, que
puede girar libremente en el plano paralelo al eje,
o perpendicular al brazo. Se trata de controlar la
posici�on del p�endulo, mediante la �unica acci�on posi-
ble, el motor. �Este es un sistema de control subac-
tuado, ya que la articulaci�on que une el brazo con
el p�endulo no est�a controlada por ning�un actuador.
El control de dicho p�endulo se realiza mediante una
tarjeta de adquisici�on y control de datos basada en
DSP's (Procesadores Digitales de Se~nal), instalada en
un PC.
El art��culo est�a estructurado del siguiente modo:
primero se hace un estudio mec�anico de las ecua-
ciones del sistema, con el objeto de tener un modelo
aproximado del sistema. El estudio se hace a trav�es
de la formulaci�on de Lagrange. Con esto se obtiene
un modelo lineal aproximado para su posterior con-
trol. Posteriormente se estudia el control del p�endulo
en torno a la posici�on superior. Se deducen las leyes
de control tanto para acercar al p�endulo a la posici�on
inferior, como para estabilizarlo en la misma. Se har�a
una comparaci�on de las leyes no lineales frente a una
lineal obtenida por LQR que se utilizar�a como base.
Por �ultimo, se exponen los resultados obtenidos en el
sistema experimental.
1
2 Modelo mec�anico del sistema
Se deduce el modelo del sistema a trav�es de las ecua-
ciones de Euler-Lagrange. En la Fig. 1 se puede
ver una representaci�on de dicho sistema mec�anico as��
como las referencias de �angulos elegidas para el de-
sarrollo matem�atico. Las coordenadas del centro de
Figura 1: P�endulo rotatorio.
masa del p�endulo de longitud 2l y masa m, son:
xcm = r cos'� lsen�sen'
ycm = rsen'+ lsen� cos �
zcm = l cos � (1)
derivando �estas se obtiene la velocidad del centro de
masa:
v =
qr2 _'2 + l2 _'2sen2� + 2rl _' _� cos � + l2 _�2 (2)
Ahora ya se puede plantear la ecuaci�on de la energ��a
cin�etica del p�endulo respecto al sistema de referencia
propuesto:
2T = mv2 + Ja _'2 + Jp
�_�2 + _'2sen2�
�=�Ja +mr2 +
�Jp +ml2
�sen2�
�_'2
+2mrl _' _� cos � +�Jp +ml2
�_�2 (3)
con Ja el momento de inercia del motor m�as el brazo
y Jp el momento de inercia del p�endulo respecto al eje
de giro del mismo. Tomando como origen de energ��a
potencial la posici�on superior, �esta ser�a:
V = mgl(cos � � 1) (4)
La lagrangiana se obtiene como la diferencia L =
T � V :
L =1
2f
�Ja +mr2 +
�Jp +ml2
�sen2�
�_'2
+2mrl _' _� cos � +�Jp +ml2
�_�2g
+mgl(cos � � 1) (5)
Las ecuaciones de Euler-Lagrange en los t�erminos ha-
bituales son:
d
dt
@L
@ _��
@L
@ _�+@D( _�)
@ _�= 0
d
dt
@L
@ _'�
@L
@'= F �Fr (6)
donde Fr es la fuerza de fricci�on en el brazo, la cual
se ha modelado mediante el modelo de LuGre, debido
a que un simple modelo de fricci�on viscosa no es su�-
ciente. D( _�) = 1
2cp _�2 es la funci�on de disipaci�on de
Rayleigh, para modelar la fricci�on viscosa de la uni�on
del p�endulo con el brazo. Para obtener dichas ecua-
ciones se de�nen unos par�ametros m�as manejables
que las variables f��sicas:
J = Jp +ml2 !0 =q
mgl
J
� = mrl
J� = Ja+mr
2
J
= K
mglcp =
cp
Jp+ml2
F = Ku Fr = Kur
(7)
donde K es la ganancia equivalente desde el motor
hasta el control, m y l son la masa y longitud del
p�endulo, r es la longitud del brazo y cp el coe�ciente
de fricci�on viscosa del p�endulo. Las ecuaciones con
estos par�ametros quedan:
�� � _'2sen� cos � + � �' cos � � !20sen� + cp _� = 0
��� cos � � � _�2sen� + 2 _� _'sen� cos �
+(� + sen2�) �' = !20(u � ur) (8)
Reescribiendo estas ecuaciones en la forma matri-
cial est�andar D(q)�q + C(q; _q) + g(q) = Mu, donde
2
q = [�; ']T y _q = [ _�; _']T (ecuaciones (9)), se pueden
despejar expl��citamente las aceleraciones angulares
del brazo �' y del p�endulo ��, para luego obtener un
modelo lineal asociado. Se tiene:�1 � cos �
� cos � � + sen2�
����
�'
�+
�cp � _'sen� cos �
�� _�sen� + _'sen� cos � _�sen� cos �
��_�
_'
�+
��!20sen�
0
�=
�0
!20(u � ur)
�(9)
Despejando �' y ��, por simple premultiplicaci�on de
la ecuaci�on (9) por la matriz D(q)�1, cuyo determi-
nante es � = � + sen2� � �2cos2� 1.Se tienen las
aceleraciones angulares en forma expl��cita:
�� =1
�f��2 _�2sen� cos � + (� + sen2�) _'2sen� cos �
+2� _� _'sen� cos2 � + �!20sen� + !20sen3�
�cp(� + sen�2) _� � � !20 cos �u + � !20 cos �urg
�' =1
�f� _�2sen� � � _'2sen� cos2 � � 2 _� _'sen� cos �
��!20sen� cos � + �cp cos � _� + !20u � !20urg
(10)
Se obtiene un modelo lineal asociado simplemente
truncando en el desarrollo de Taylor de las ecuaciones
(10) a partir del t�ermino de primer orden en adelante,
particularizando en el punto de equilibrio deseado
[�; _�; ' _'] = [0; 0; 0; 0]. Se escribe el sistema de ecua-
ciones en la forma matricial _x = Ax+Bu, con vector
de estados [�; _�; '; _'], en el que se ha de�nido en la
forma habitual _x1 = x2 y _x3 = x4. Como la variable
x3 = ' es c��clica se puede hacer una reducci�on del or-
den del sistema. Por tanto, el nuevo vector de estado
que de�ne el sistema de ecuaciones diferenciales de
coe�cientes constantes es [x1; x2; x3] = [�; _�; _']. Con
1N�otese que D(q) es una matriz sim�etrica con determinante
� 6= 0.
ello el sistema es:0@ _x1_x2_x3
1A =1
�
0@ 0 1 0
�!20 �cp� 0
��!20 cp� 0
1A0@x1x2x3
1A+1
�
0@ 0
�� !20 !20
1A (u � ur) (11)
con
� = � � �2
En este punto ya se tiene un modelo completo
para simulaciones fuera del entorno de estabilizaci�on
(ecuaciones (10)), y un modelo lineal entorno al mis-
mo de tres variables de estado (ecuaciones (11)).
3 Problema del Swing up
El problema del swing-up consiste en la inyecci�on de
energ��a para llevar el p�endulo desde la posici�on in-
ferior (colgante) hasta la superior (erecta). Una vez
el p�endulo en la posici�on superior se procede a la es-
tabilizaci�on local del p�endulo en esa posici�on. Este
segundo problema se estudia en la secci�on 4. En esta
se van a presentar las dos estrategias m�as empleadas
para la inyecci�on de energ��a con el �n de \levantar"el
p�endulo. Ambas est�an basadas en el m�etodo de Frad-
kov 1996 [16], que permite obtener leyes de control a
partir de una funci�on objetivo (que tambi�en juega el
papel de funci�on de Liapunov). La primera, debida
a �Astr�om y Furuta, emplea un modelo muy simpli-
�cado de segundo orden (s�olo considera la posici�on
y la velocidad del p�endulo), pero es particularmente
simple y efectiva; mientras que la segunda emplea un
modelo de tercer orden (considera adem�as la veloci-
dad de giro del brazo), lo que da lugar a una ley de
control m�as compleja, aunque m�as rica en e�ciencia,
como se pondr�a de mani�esto en un ejemplo.
3.1 Ley obtenida por el m�etodo de
Fradkov basada en un modelo de
dimensi�on 2
La ley de control propuesta por �Astr�om y Furuta [5],
est�a basada en controlar la energ��a del p�endulo pres-
3
cindiendo del brazo (modelo simpli�cado de 2 dimen-
siones), y se deduce por el m�etodo de Fradkov. El sis-
tema de ecuaciones de dos dimensiones que describe
el movimiento del p�endulo, despreciando la fuerza de
reacci�on que el brazo ejerce sobre el mismo, es:
_x1 = x2
_x2 =mgl
Jp
senx1 �ml
Jp
cosx1u (12)
Se toma como referencia de energ��a potencial al
p�endulo en posici�on horizontal, de modo que la e-
nerg��a total del p�endulo en bucle abierto es:
H =1
2Jpx
22 +mgl cosx1 (13)
Se puede ver que la energ��a coincide con el valor de la
homoclina en el plano [x1; x2]. Se toma como funci�on
objetivo o funci�on de Liapunov
Q = H2
aplicando la derivada de Lie a la funci�on objetivo,
LgfQ(x)g = ru_Q(x)
y como
ru_Q(x) = ru
�@Q(x)
@x_x
�= gT (x)
@Q(x)
@x
la ley de control viene dada por
u = �kgT (x)@Q(x)
@x
operando se tiene
u = kHx2 cosx1 (14)
donde la constante k se puede hacer tan grande como
sea posible en nuestro sistema de control, es decir,
saturando la se~nal de control u. Se pierde la con-
trolabilidad para x2 = 0 �o x1 = ��
2, es decir con
el p�endulo horizontal o con el cambio de sentido de
giro. Esta ley lleva al p�endulo a energ��a cero (H = 0),
que es que la homoclina en el plano (x1; x2). �Astr�om
propone variantes de (14), tales como:
u = sat fk(H�H�)g sign (x2 cosx1) (15)
la cual, aprovecha al m�aximo el par motor. Tambi�en
existen otras variantes de (14) por los motivos que se
aprecian el la simulaci�on. Algunas de estas variantes
intentan corregir el aumento de la velocidad del brazo
(ya que �esta no se controla en la ley (14)), con un
t�ermino adicional en la ley de control proporcional a
la misma. Todas estas variantes son m�as e�cientes
pero, en esencia, son equivalentes. La �unica que se
considera aqu�� es la (14) que permite un tratamiento
anal��tico m�as sencillo.
3.2 Ley obtenida por el m�etodo de
Fradkov basada en un modelo de
dimensi�on 3
Ahora se tendr�a en cuenta el brazo para la deducci�on
de la ley por el m�etodo de Fradkov, mediante un mo-
delo m�as completo. Las ecuaciones del sistema en la
forma de sistemas Hamiltonianos generalizados a�nes
en el control:
_x = f(x) + g(x)u
y = h(x)
las cuales para el sistema de dimensi�on 3 son,0@ _x1_x2_x3
1A =
0@ f1(x1; x2; x3)
f2(x1; x2; x3)
f3(x1; x2; x3)
1A+1
�
0@ 0
�� !20 !20
1A u
(16)
con variables de estado [x1; x2; x3] = [�; _�; _'].
Planteamos la funci�on objetivo tal que lleve al sis-
tema hacia la trayectoria en el espacio de estados
[x1; x2; x3], intersecci�on de la super�cie de energ��a
cero y la de momento generalizado de la variable
x3 = _' cero, luego la funci�on objetivo es:
Q = �11
2(H�H
�)2| {z } + �2
1
2(p2 � p�2)
2| {z }Q1 Q2
4
donde
p2 =@L
@x3= J f�x2 cosx1 + (� + sen2x1)x3g (17)
y �1 y �2 son constantes arbitrarias. Se aplica el
m�etodo de Fradkov a cada funci�on por separado.
Primero se obtiene la ley que nos proporciona di-
cho m�etodo para Q1, del modo siguiente:
_Q1 = (H�H�) _H
_H =1
2_qTD(q) _q + V(q)
y conociendo el resultado,
_H =1
2_qTD(q) _q + V(q)
= _qM(q)u
se obtiene en general:
u1 = � !20x3(H�H�) (18)
donde H� es la energ��a de referencia, que en nuestro
caso es 0. Por otro lado ahora se plantea como fun-
0 1 2 3 4 5
−5
0
5
t(seg)
x 1(rad
)
0 1 2 3 4 5−40
−20
0
20
40
t(seg)
x 2(rad
/seg
)
0 1 2 3 4 5−20
−10
0
10
20
30
t(seg)
x 3(rad
/seg
)
0 0.5 1 1.5 2−0.5
0
0.5
t(seg)
u
−10 −5 0 5 10−40
−20
0
20
40
x1(rad)
x 2(rad
/seg
)
−10 −5 0 5 10−40
−20
0
20
40
x1(rad)
x 3(rad
/seg
)
Figura 2: Swing up del p�endulo con la ley de dimen-
si�on 2. Simulaci�on.
ci�on objetivo alcanzar momento generalizado de la
variable _' cero. Se tiene:
Q2 =1
2(p2 � p�2)
2
0 1 2 3 4 5
−5
0
5
t(seg)
x 1(rad
)
0 1 2 3 4 5−40
−20
0
20
40
t(seg)
x 2(rad
/seg
)
0 1 2 3 4 5−20
−10
0
10
20
t(seg)
x 3(rad
/seg
)
0 1 2 3 4 5−0.5
0
0.5
t(seg)
u
−10 −5 0 5 10 15−40
−20
0
20
40
x1(rad)
x 2(rad
/seg
)
−10 −5 0 5 10 15−20
−10
0
10
20
x1(rad)
x 3(rad
/seg
)
Figura 3: Swing up del p�endulo con la ley de dimen-
si�on 3, obtenido por simulaci�on.
luego
_Q2 = (p2 � p�2) _p2
y recordando que la variable ' es c��clica, en las ecua-
ciones de Hamilton
_p2 = �
@H
@'+ J !20u
se tiene
_Q2 = (p2 � p�2)J !20u
Luego la ley de control vendr�a dada por:
u2 = �ru_Q2 = �J !20(p2 � p�2) (19)
con lo que la ley de control ser�a la suma de ambos
objetivos:
u = � !20(H�H�)x3 �J !
20(p2 � p�2) (20)
donde del mismo modo p�2 es el momento de referencia
de la variable _', que en nuestro caso es 0. En (20)
las constantes �1 y �2 toman los valores �1 = � !20 y
�2 = �J !20.
5
0 0.01 0.02 0.03
−0.18
−0.16
−0.14
−0.12
−0.1
−0.08
−0.06
−0.04
−0.02
0
t(seg)
H
1 2 3 4 50
2
4
6
8
10
12
14
16
x 10−4
t(seg)Q
Figura 4: Funciones de energ��a H y de Liapunov Q
en el swing up del p�endulo con la ley de dimensi�on 3.
3.3 Comparaci�on de las estrategias de
control para hacer swing up
As�� como la comparaci�on de leyes que estabilizan al
p�endulo en la posici�on superior, posee un claro crite-
rio como es el de la cuenca de atracci�on, en la com-
paraci�on de las leyes para hacer swing up se hace
dif��cil establecer un criterio tan gr�a�co. Por ello se
ha elegido la opci�on opuesta, es decir, buscar un con-
traejemplo que garantice un criterio de comparaci�on.
Se simulan ambas leyes de control con condiciones
iniciales arbitrarias [x1; x2; x3] = [3:14; 0:1; 0:1], y se
observa que la ley de dimensi�on 2 pasa la primera vez
por la posici�on superior con las variables x1 y x2 cer-
canas a cero mientras que se \olvida"de la variable
x3 (ya que esta ley no la tiene en cuenta). En los
sucesivos pasos por la posici�on superior la ley hace
que las variables x1 y x2 se alejen cada vez m�as de
los valores deseados. Por el contrario la ley de dimen-
si�on 3 posee informaci�on de la variable x3, y siempre
hace los pasos por la posici�on superior con los val-
ores de las variables x1 y x2 cercanos a cero. Estos
fen�omenos se pueden ver en las Fig. 2 y 3. Tambi�en
pueden observarse en la Fig. 4 como, en la ley de
dimensi�on 3, la funci�on de energ��a H tiende a cero y
la funci�on de Liapunov Q es mon�otona decreciente.
4 Control local estabilizante
En esta secci�on se deducen las leyes para la estabi-
lizaci�on del p�endulo en torno a la posici�on de equi-
librio. Se obtienen las leyes por los correspondientes
m�etodos, intentando ser los m�as claro posible, pero
debe quedar claro que no es objetivo del art��culo la
deducci�on detallada de las mismas. El objetivo de las
leyes que aqu�� se van a tratar es mantener el p�endulo
en su posici�on superior a la vez que se mantiene el
brazo en reposo (x3 = 0). La posici�on del brazo ' es
indiferente. Como se ha comentado previamente, no
se conoce ninguna estrategia de este tipo que alcance
con �exito el objetivo partiendo de cualquier condici�on
inicial. En otras palabras, estas estrategias tienen un
�ambito de aplicaci�on local en torno al punto de o-
peraci�on deseado, de manera que consiguen que �este
sea un equilibrio del sistema dotado de estabilidad
local con una cuenca de atracci�on limitada. Como
medida de bondad de las diversas leyes se va tomar
el \tama~no"de esta cuenca de atracci�on por medio
del siguiente experimento: se parte de una posici�on
en reposo (x2 = 0, x3 = 0) y se busca el mayor valor
inicial de x1 para el que una determinada ley tiene
�exito. Con ello se obtiene una medida de la cuenca
de atracci�on para el sistema. En cada secci�on adem�as
de exponer la ley de control, se disponen los resulta-
dos de el experimento citado. Al �nal se har�a una
comparaci�on de estos resultados.
4.1 Ley lineal
La ley estabilizante m�as extendida es la resultante del
m�etodo LQR. Para ello se debe partir de un modelo
linealizado (se ha elegido el modelo (11)) y elegir las
matrices de ponderaci�on de�nidas positivas Q y R del
��ndice de funcionamiento
J =
Z 1
0
(xTQx+ uTRu)dt
La ley de control �optima es de la forma u = �Kx =
�R�1BTP . Donde P es la soluci�on de�nida positiva
de la ecuaci�on de Riccati:
Q� PB�1BTP +ATP + PA = 0
6
las matrices A y B son las del sistema linealizado
_x = Ax+Bu
El sistema de control resultante de aplicar esta ley
de control al modelo lineal ser�a globalmente estable.
Sin embargo, en nuestro caso el modelo lineal s�olo es
v�alido en torno a la posici�on superior. Adem�as existe
otra limitaci�on no considerada que es la saturaci�on de
la se~nal de control. Esta limitaci�on no permite ele-
gir leyes de control demasiado en�ergicas (Q \mucho
mayor"que R). Despu�es de un proceso iterativo se
puede llegar a una ley de control se comporte de for-
ma aceptable en un entorno adecuado de la posici�on
superior. El resultado elegido es:
Q =
0@97 0 0
0 0:33 0
0 0 10�6
1A (21)
R = 8 (22)
P =
0@5:7444 0:0054 0:0024
0:0054 0:0003 0:0002
0:0024 0:0002 0:0002
1A (23)
K =�3:5 0:2 0:0004
�(24)
Obs�ervese que el �ultimo valor de la matriz Q
es extremadamente peque~no. Se ha elegido as��
porque de hacerlo mayor la ley de control saturar��a
r�apidamente. Esto es l�ogico, ya que la �unica forma de
actuar sobre el p�endulo es acelerar o frenar el brazo
con lo que el objetivo de llevar x3 a cero se debe inter-
pretar como un objetivo secundario tras el de hacer
que x1 = 0 y x2 = 0. Debido a la gran fricci�on del
brazo, para poder mantenerlo en la posici�on de equi-
librio se a~nade al control un compensador de fricci�on
basado en el modelo de Coulomb. Esta adici�on del
compensador da lugar a un ciclo l��mite estable alrede-
dor de la posici�on de equilibrio. Se simula el sistema
(ecuaciones (10)) con el compensador y los resulta-
dos se muestran en la Fig. 5 y lo comparamos con
los experimentos de la Fig. 6. Por �ultimo se hace el
experimento correspondiente para la detecci�on de la
cuenca de atracci�on de la ley de control lineal, Fig.
7.
−0.04 −0.02 0 0.02 0.04−0.8
−0.6
−0.4
−0.2
0
0.2
0.4
0.6
x1(rad)
x2(r
ad/s
eg)
−0.03 −0.02 −0.01 0 0.01 0.02−2
−1
0
1
2
x1(rad)
x3(r
ad)
−0.04 −0.02 0 0.02 0.040.4
0.42
0.44
0.46
0.48
0.5
x1(rad)
Φ(r
ad)
−0.10
0.1
−2
0
2−4
−2
0
2
x1(rad)x2(rad)
x3(r
ad/s
eg)
Figura 5: Simulaci�on del control LQR del p�endulo en
torno a la posici�on de equilibrio. Ciclo l��mite formado
debido a la fricci�on del brazo.
−0.04 −0.02 0 0.02 0.04−0.8
−0.6
−0.4
−0.2
0
0.2
0.4
0.6
x1(rad)
x2(r
ad/s
eg)
−0.03 −0.02 −0.01 0 0.01 0.02−2
−1
0
1
2
x1(rad)
x3(r
ad/s
eg)
−0.04 −0.02 0 0.02 0.040.47
0.48
0.49
0.5
0.51
0.52
0.53
x1(rad)
Φ
−0.050
0.05
−1
0
1−2
0
2
x1(rad)x2(rad)
x3(r
ad/s
eg)
Figura 6: Control experimental LQR del p�endulo en
torno a la posici�on de equilibrio. Ciclo l��mite que se
forma debido a la fricci�on del brazo.
7
0 5 10 15 20−1
−0.5
0
0.5
t(seg)
x 1(rad
)
0 5 10 15 20−2
0
2
4
6
t(seg)
x 2(rad
/seg
)
0 5 10 15 20−20
0
20
40
60
t(seg)
x 3(rad
/seg
)
0 5 10 15 20−0.2
0
0.2
0.4
0.6
t(seg)u
5.4 5.6 5.8 6 6.2 6.4−2
0
2
4
6
x1(rad)
x 2(rad
/seg
)
5.4 5.6 5.8 6 6.2 6.4−20
0
20
40
60
x1(rad)
x 3(rad
/seg
)
Figura 7: Experimento para la detecci�on de la cuenca
de atracci�on de la ley LQR.
4.2 Ley obtenida por moldeo energ��a
potencial
La ley que se obtiene a continuaci�on est�a basada en el
m�etodo expuesto en [14], y que aqu�� se desarrollar�a
de una forma m�as intuitiva. La energ��a debida al
p�endulo1, en bucle abierto, posee un punto de silla2
en la posici�on del equilibrio deseado. Esta energ��a es
H =1
2J _�2 + J !20(cos � � 1)
la cual tiene la forma geom�etrica de la Fig. 8a en
el espacio de estados [x1; x2] = [�; _�], y cuyo retrato
de estados tambi�en puede observarse en la Fig. 8b.
Por tanto, con la adici�on de la energ��a potencial Va se
desea obtener una energ��a en bucle cerrado, de forma
que el equilibrio se vuelva estable. As�� necesitamos
una energ��a potencial adicional Va = �2V , con la
cual se moldea la energ��a total a la forma de la Fig.
9. De otro modo, la energ��a potencial del p�endulo en
bucle abierto, Fig. 10 se modi�ca a una nueva energ��a
1Ahora al referirnos al p�endulo, estamos considerando s�olo
el p�endulo como sistema, sin el brazo.2Los equilibrios del sistema son los m�aximos y m��nimos de
la energ��a potencial V. Los m��nimos son equilibrios estables,
mientras que los m�aximos son puntos de silla o equilibrios in-
estables.
−4
−2
0
2
4
−1
−0.5
0
0.5
1−2
−1.5
−1
−0.5
0
0.5
θ°θ
H
−1.5
−1
−0.5
0
0.5
−3 −2 −1 0 1 2 3−1
−0.8
−0.6
−0.4
−0.2
0
0.2
0.4
0.6
0.8
1
θ
° θ
Figura 8: Energ��a del p�endulo en bucle abierto. Re-
trato de estados.
potencial que ser�a la suma de V + Va. �Esta posee un
m��nimo en el equilibrio deseado (Fig. 11) Se tiene el
sistema en bucle abierto dado por la ecuaci�on (25).�_x1_x2
�=
1
J
�0 1
�1 0
��@H
@x1@H
@x2
�+
0
!2
0K
gcosx1
!u
(25)
Se desea que en bucle cerrado el sistema sea el si-
guiente:
_x = [J � Ra]@ eH@x
donde la matriz Ra es la de amortiguamiento a~nadido
al sistema, luego�_x1_x2
�=
1
J
��0 1
�1 0
��
�0 0
0 ka
�� @ eH
@x1
@ eH
@x2
!(26)
−4
−2
0
2
4
−3
−2
−1
0
1
2
30
1
2
3
4
5
6
7
θ°θ
H
1
2
3
4
5
6
−3 −2 −1 0 1 2 3−3
−2
−1
0
1
2
3
θ
°
θ
Figura 9: Energ��a del p�endulo en bucle cerrado. Re-
trato de estados.
8
−4 −3 −2 −1 0 1 2 3 4−2
−1.8
−1.6
−1.4
−1.2
−1
−0.8
−0.6
−0.4
−0.2
0
θ
V
Figura 10: Energ��a potencial del p�endulo en bucle
abierto.
donde la funci�on eH es el Hamiltoniano deseado,
que tendr�a la expresi�on:
eH =1
2J_�2 �J !20(cos � � 1) (27)
Igualando las ecuaci�on en bucle abierto (25) y la
ecuaci�on en bucle cerrado (26), se puede determinar
la ley de control.
1
J
�0 1
�1 0
��@H
@x1@H
@x2
�+
0
!2
0K
gcosx1
!u
=
�1
J
�0 1
�1 0
��
�0 0
0 �ka
�� @ eH
@x1
@ eH
@x2
!
Se tiene un sistema de 2 ecuaciones. La primera
ecuaci�on (primera �la) se cumple ya que tanto H co-
mo eH tienen la misma dependencia con la variable _�.
−4 −3 −2 −1 0 1 2 3 40
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
2
θ
V
Figura 11: Energ��a potencial del p�endulo en bucle
cerrado.
De la segunda ecuaci�on, tenemos:
�1
J
@H
@�+ Bu =
�1
J
@ eH@�
� ka@ eH@ _�
!20sen� +!20K
gcos �u = !20sen� � kaJ _�
u =�2g
Ktan � �
kaJ g _�
!20K cos �
que en general ajustando las constantes con el criterio
lineal LQR quedar�a:
u = K1 tan � +K2
_�
cos �(28)
En la Fig. 12 pueden verse los resultados del ex-
perimento de detecci�on de la cuenca de atracci�on.
Aunque en teor��a esta ley es una ley global para
el sistema de ecuaciones (25), no est�a de�nida para
� = �
2; �, y adem�as en la pr�actica no es posible ha-
cer swing up, debido a la que el t�ermino cos � en el
denominador provoca la saturaci�on del actuador.
0 5 10 15 20−1
−0.5
0
0.5
t(seg)
x 1(rad
)
0 5 10 15 20−2
0
2
4
6
t(seg)
x 2(rad
/seg
)
0 5 10 15 20−20
0
20
40
60
t(seg)
x 3(rad
/seg
)
0 5 10 15 20−0.5
0
0.5
t(seg)
u
5.4 5.6 5.8 6 6.2 6.4−2
0
2
4
6
x1(rad)
x 2(rad
/seg
)
5.4 5.6 5.8 6 6.2 6.4−20
0
20
40
60
x1(rad)
x 3(rad
/seg
)
Figura 12: Experimento para la detecci�on de la cuen-
ca de atracci�on de la ley potencial.
4.3 Ley obtenida por el m�etodo del
Lagrangiano Controlado
Parte de la deducci�on de la ley por el m�etodo del
Lagrangiano Controlado ya se public�o por el grupo
9
ucons = �
J senx1[�x22 � 2 cosx1x2x3 � � cosx21x
23 � �!20 cosx1]
c�+ 1
udiss = �c��([J (� + senx21)]x3 + J � cosx1x3(� + 1)
� = J (� + senx21 � �2 cosx21)
� = �
(J� cosx1)2[J (� + senx21)� (J (� + senx21)
2]
cJ (� + senx21)[J (� + senx21) +1
c]2
u = ucons + (� + 1)udiss (29)
de trabajo Bloch, Leonard y Marsden (BLM) en [4],
concretamente la parte conservativa de la ley. Aqu��
se hace lo mismo para el modelo planteado y se termi-
na de deducir la parte no conservativa mediante las
f�ormulas coordenadas publicadas tambi�en por dicho
grupo, f�ormulas que son directamente aplicables para
sistemas mec�anicos con simetr��as y subactuados. La
deducci�on de la ley se puede consultar en las refe-
rencias [1], [2], [3] y [4]. Aqu�� se utilizan las f�ormulas
coordenadas de [2], para obtener la ley de control.
Sin m�as pre�ambulo, la ley de control uBLM se puede
0 1 2 3 4 5−1
−0.5
0
0.5
1
t(seg)
x1(r
ad)
0 1 2 3 4 5−5
0
5
t(seg)
x2(r
ad/s
eg)
0 1 2 3 4 5−10
−5
0
5
10
t(seg)
x3(r
ad/s
eg)
0 1 2 3 4 5−0.1
−0.05
0
0.05
0.1
t(seg)
u
Figura 13: Simulaci�on del control del p�endulo en
torno a la posici�on de equilibrio con la ley uBLM .
Variables de estado.
dividir en dos t�erminos, uno que ser��a el correspon-
diente al sistema puramente conservativo ucons, y la
otra que hace que el sistema sea asint�oticamente es-
table udiss (se mantiene la notaci�on de las referen-
cias para facilidad del lector). Aplicando el m�etodo
con las variables [x1; x2; x3] = [�; _�; _']. En efecto,
−0.5 0 0.5−6
−4
−2
0
2
4
6
x1(rad)x2
(rad
/seg
)
−0.5 0 0.5−6
−4
−2
0
2
4
6
8
x1(rad)
x3(r
ad)
−0.5 0 0.5−1
0
1
2
3
4
5
x1(rad)
Φ(r
ad)
−0.5 0 0.5−10
010−5
0
5
10
x1(rad)x2(rad)
x3(r
ad/s
eg)
Figura 14: Simulaci�on del control del p�endulo en
torno a la posici�on de equilibrio con la ley BLM.
Planos de fase.
se puede ver por simulaci�on como controla la ley al
p�endulo. La simulaci�on hecha es para el p�endulo sin
fricci�on, para ver como la ley udiss lleva al p�endulo al
equilibrio, haci�endolo asint�otico. En la Fig. 13 se ven
las variables de estado frente al tiempo y en la Fig. 14
los planos y el espacio de fases. Por �ultimo se exponen
en la Fig. 15, los resultados experimentales. Antes
de presentar los resultados pr�acticos conviene resaltar
en esta ley que se pueden establecer las condiciones
de estabilidad, bien por linealizaci�on del sistema en
bucle cerrado o bien por minimizaci�on de la energ��a
controlada. En cualquier caso estas condiciones ya
10
0 5 10 15 20−0.1
0
0.1
0.2
0.3
t(seg)
x 1(rad
)
0 5 10 15 20−2
−1
0
1
t(seg)
x 2(rad
/seg
)
0 5 10 15 20−10
−5
0
5
t(seg)
x 3(rad
/seg
)
0 5 10 15 20−0.3
−0.2
−0.1
0
0.1
t(seg)
u
6.2 6.3 6.4 6.5 6.6 6.7−2
−1
0
1
x1(rad)
x 2(rad
/seg
)
6.2 6.3 6.4 6.5 6.6 6.7−10
−5
0
5
x1(rad)
x 3(rad
/seg
)
Figura 15: Experimento para la detecci�on de la cuen-
ca de atracci�on de la ley BLM.
fueron presentadas en [4]. Adem�as cabe destacar que
el denominador de dicha ley limitar�a mucho la cuen-
ca de atracci�on, lo que hace crucial la elecci�on de la
constante c.
4.4 Comparaci�on de las estrategias de
control estabilizantes
Para la comparaci�on se llev�o a cabo el experimento
descrito al principio de esta secci�on, y se exponen los
resultados de una forma gr�a�ca en la Fig. 15. Como
se puede ver en la Fig. 16 la ley que mayor cuen-
ca de atracci�on presenta es la ley potencial (secci�on
4.2) seguida de la lineal (secci�on 4.1) y por �ultimo la
BLM (secci�on 4.3). �Esta cuenca est�a limitada por la
saturaci�on de las leyes de control. Se aprecia que la
ley lineal sigue siendo muy pr�actica, ya que combi-
na una facilidad de c�alculo, muy por encima de las
otras, con unos resultados emp��ricos semejantes. De
la ley potencial decir que, parece que de alguna for-
ma es el m�etodo apropiado para ampliar la cuenca.
Hay que tener en cuenta que la ley obtenida est�a
basada en un modelo de dimensi�on 2, lo que limi-
ta mucho al m�etodo, ya que no posee informaci�on
su�ciente. Una ley obtenida por dicho m�etodo con
un modelo m�as completo, parece prever un aumen-
to de la cuenca mucho mayor, pero as�� como la ley
deducida para el modelo aproximado de dimensi�on 2
Figura 16: Comparaci�on de las distintas cuencas de
atracci�on.
es sencilla de obtener, la di�cultad de la resoluci�on
del m�etodo con modelos m�as completos es elevada.
Por �ultimo, el �ultimo m�etodo presenta la mayor com-
plejidad matem�atica, y adem�as los resultados experi-
mentales son los \menos buenos". Hay que destacar,
de este �ultimo m�etodo, la e�cacia del control, como
no pod��a ser menos a tenor de la e�cacia del m�etodo.
E�cacia, que viene re ejada f��sicamente, por la suavi-
dad del control, mucho mayor que las leyes anteriores.
En t�erminos de control se podr��a decir que presenta
el comportamiento m�as sobreamortiguado.
Decir tambi�en que e la saturaci�on del la acci�on de
control disminuye la cuenca de atracci�on. En [8] se
11
estudia con detenimiento el este efecto, mostr�andose
que la saturaci�on produce la aparici�on de un ciclo
l��mite inestable, al que est�a asociada la limitaci�on de
la cuenca de atracci�on.
5 Control h��brido
Se denomina control h��brido la utilizaci�on las dos es-
trategias descritas. Primero, mediante la ley global
se lleva al p�endulo a la posici�on superior, y una vez en
el entorno de la cuenca de atracci�on se conmuta a la
ley local que lo estabilice. Puesto que las condiciones
iniciales de las leyes locales las \imponen"las glo-
bales, se har�a una comparaci�on llevando al p�endulo a
la posici�on superior con las dos estrategias descritas,
y se conmutar�a a una de las leyes locales, por ejemplo
la lineal que es la que posee una cuenca de atracci�on
intermedia. Un primer criterio de comparaci�on es el
0 0.5 1 1.5 20
2
4
6
t(seg)
x 1(rad
)
0 0.5 1 1.5 2−40
−20
0
20
40
t(seg)
x 2(rad
/seg
)
0 0.5 1 1.5 2−10
0
10
20
30
t(seg)
x 3(rad
/seg
)
0 0.5 1 1.5 2−0.5
0
0.5
t(seg)
u
0 2 4 6−40
−20
0
20
40
x1(rad)
x 2(rad
/seg
)
0 2 4 6
−20
0
20
x1(rad)
x 3(rad
/seg
)
Figura 17: Control h��brido. Swing up con la ley de
dimensi�on 2, conmutando a la ley local lineal. Simu-
laci�on sin fricci�on
del tiempo de alcance de la posici�on inferior, que nos
puede dar una idea de la e�ciencia de la ley. Ob-
servando las Fig. 17 y 18, se puede ver que la ley
de �Astr�om es m�as r�apida. Ello es debido a la propia
f��sica del problema. La ley de �Astr�om s�olo tiene en
cuenta la energ��a de la varilla del p�endulo, y por tan-
to, s�olo calcula la diferencia de esta energ��a con la
de referencia, no controlando ni la posici�on ni la ve-
locidad del brazo. Con la otra ley obtenida se lle-
van a cabo dos objetivos llevar al p�endulo hacia la
homoclina y adem�as hacerlo minimizando la energ��a
del sistema completo. �Este es el principal motivo
por el cual esta ley tarda m�as en llevar al p�endulo a
la posici�on superior, ya que los objetivos propuestos
son opuestos. En las simulaciones se aprecia como
la velocidad del brazo alcanza valores menores en el
segundo caso. Otro criterio que se puede apreciar es
que la se~nal de control toma valores menores durante
el swing up con la segunda ley, tambi�en debido al mis-
mo fen�omeno. Esto ultimo tambi�en puede verse en la
comparaci�on anterior de las leyes para hacer el swing
up. Esta comparaci�on no expone una manera de dis-
criminar entre una u otra estrategia, pero si aclara
que el objetivo de llevar al p�endulo hacia la posici�on
superior es opuesto al de estabilizarlo. En la Fig. 19
0 0.5 1 1.5 20
2
4
6
t(seg)
x 1(rad
)
0 0.5 1 1.5 2
−20
0
20
t(seg)
x 2(rad
/seg
)
0 0.5 1 1.5 2−20
−10
0
10
20
t(seg)
x 3(rad
/seg
)
0 0.5 1 1.5 2−0.5
0
0.5
t(seg)
u
0 2 4 6
−20
0
20
x1(rad)
x 2(rad
/seg
)
0 2 4 6−20
−10
0
10
20
x1(rad)
x 3(rad
/seg
)
Figura 18: Control h��brido. Swing up con la ley de
dimensi�on 3, conmutando a la ley local lineal. Simu-
laci�on sin fricci�on
se realiza un experimento con el control h��brido sobre
el sistema f��sico experimental.
12
6 Conclusiones
En este art��culo se ha presentado un estudio compara-
tivo de diversas estrategias de control para el p�endulo
de Furuta. Estas estrategias combinan una ley que
lleva al p�endulo al entorno de la posici�on superior
(swing up), con otra ley estabilizante en torno a esta
posici�on. Las leyes para realizar el swing up consi-
deradas est�an basadas en el m�etodo del gradiente de
velocidad de Fradkov (SG). En una de ellas se apli-
ca este m�etodo a un modelo reducido de dimensi�on
2 y en otra a un modelo de dimensi�on 3, con distin-
tos objetivos de control. En el estudio se ponen de
mani�esto las ventajas de esta �ultima. En cuanto a
las leyes estabilizantes, se ha considerado tres alter-
nativas: una ley lineal, una ley basada en el moldeo
de energ��a potencial y otra basada en el moldeo de
energ��a cin�etica. Con la comparaci�on de los resulta-
dos se ponen de mani�esto las diferencias de tama~no
de la cuenca de atracci�on de estas leyes. Tambi�en se
ha realizado una comparaci�on de la combinaci�on de
estas leyes, denominada control h��brido.
0 5 10 15 20−2
0
2
4
6
t(seg)
x 1(rad
)
0 5 10 15 20−100
−50
0
50
100
t(seg)
x 2(rad
/seg
)
0 5 10 15 20−20
−10
0
10
20
t(seg)
x 3(rad
/seg
)
0 5 10 15 20−0.4
−0.2
0
0.2
0.4
t(seg)
u
−2 0 2 4 6−100
−50
0
50
100
x1(rad)
x 2(rad
/seg
)
−2 0 2 4 6−20
−10
0
10
20
x1(rad)
x 3(rad
/seg
)
Figura 19: Control h��brido experimental. Swing up
con la ley de dimensi�on 3, conmutando a la ley local
lineal.
Referencias
[1] Anthony M. Bloch, Naomi Ehrich Leonard And
Jerrold E. Marsden \Stabilization of the Pen-
dulum on a Rotor Arm by the Method of Con-
trolled Lagrangians", Proc of the 1999 IEEE Int.
Conf. on Robotics an Automation.
[2] Anthony M. Bloch, Naomi Ehrich Leonard And
Jerrold E. Marsden, \Potencial Shaping and
the Metgod of Controlled Lagrangians", Proc of
IEEE Conf. on Decision and Control, December
1999.
[3] Anthony M. Bloch, Naomi Ehrich Leonard And
Jerrold E. Marsden, \Stabilization of Mechani-
cal System Using Controlled Lagrangians".
[4] Anthony M. Bloch, Naomi Ehrich Leonard And
Jerrold E. Marsden,\Matching and Stabilization
the Method of Controlled Lagrangians", Proc.
of IEEE Conf. Decision and Control, December
1998.
[5] K.J. �AStr�om And K. Furuta, \Swinging up a
Pendulum by energy control", Autom�atica, 36
(2000) 287-295.
[6] C. Canudas-De-Wit, \Control of System with
Dynamic Friction", Laboratory of Automat-
ic Control of Grenoble, INPG-ENSIEG-CNRS,
1999.
[7] D. Pagano, \Bifurcaciones en los sistemas de
control", ESI, Sevilla, 1999.
[8] D. Pagano, L. Pizarro, J. Aracil, \Hopf Bifur-
cation Analysis in a Rotational Inverted Pen-
dulum", in N.E. Mastorakis (ed.), Modern Ap-
plied Mathematics Techniques in Circuits, Sys-
tems and Control, World Scienti�c, 1999, 144-
149.
[9] D. Pagano, L. Pizarro, J. Aracil, \Local Bifurca-
tion Analysis in the Furuta Pendulum via Nor-
mal Forms", International Journal of Bifurca-
tions and Chaos, Vol. 10, No. 4, April, 2000.
13
[10] Departamento de Ingenier��a de Sistemas y Au-
tom�atica, Seminarios sobre sistemas Hamilto-
nianos, ESI, Sevilla, 5 de Octubre de 1999.
[11] E. Ponce, J. Aracil, F. Salas, D. Pagano,
\Bifurcation Analysis of an Inverted Pendu-
lum with Saturated Hamiltonian Control Laws",
IFAC Workshop on Lagrangian and Hamiltonian
Methods for Nonlinear Control, Princeton, 2000,
179-180.
[12] J. Aracil, \Notas sobre sistemas de control no
lineales", ESI, Sevilla, 5 de Octubre de 1999.
[13] J. Aracil, K. Astr�om, D. Pagano, \Global Bifur-
cations in the Furuta Pendulum", NOLCOS'98,
1998, Enschebe, The Netherlands, 35-40.
[14] Romeo Ortega, Arjan J. Van Der Shaft, Bern-
hard Maschke And Gerardo Escobar, \Stabiliza-
tion of Port-Controlled Hamiltonian Systems:
Passivation an Energy-Balancing", February 3,
1999.
[15] Van Der Schaft, A. J., \L2 - Gain an Passivity.
Techniques in Nonlinear Control", Ed. Springer
[16] Alexander F. Fradkov and Alexander Yu.
Pogromsky, \Introduction to control of oscilla-
tions and chaos". World Scienti�c, 1998.
14