Tema 2 M´etodos de resoluci´on de Ecuaciones no...

29
Tema 2 etodos de resoluci´on de Ecuaciones no Lineales 2.1. Generalidades. Orden de convergencia Nos planteamos en este tema el problema de la resoluci´on aproximada de Ecuaciones no Lineales. Este problema se puede escribir de manera general como f (x)=0, (1.1) siendo f una funci´on dada de la variable real x, que toma valores reales, y que en general vamos a suponer, al menos, continua. Un caso particular importante de ecuaci´on de la forma (1.1) es aqu´ el en que f es un polinomio de grado n 2, en cuyo caso el problema adopta la forma a n x n + a n1 x n1 + ... + a 1 x + a 0 =0, (1.2) siendo los a k , k =0, 1, ..., n, umeros reales dados, y a n =0. Este ´ ultimo tipo de ecuaciones ha sido muy estudiado, y de ´ el son bien conocidos los siguientes hechos: si n =2, se tiene la f´ormula de resoluci´on, conocida de todos, a 2 x 2 + a 1 x + a 0 =0 x = a 1 ± a 2 1 4a 2 a 0 2a 2 , que expresa el valor exacto de la soluci´on. Desde el punto de vista del An´alisis Num´ erico, el ´ unico tipo de errores que se introducen con esta f´ormula son los errores de redondeo debido a las operaciones aritm´ eticas. si n = 3 ´o 4, existen tambi´ en f´ormulas que expresan el valor exacto de la o las soluciones de (1.2), mediante sumas, productos y ra´ ıces de los coeficientes. Son f´ormulas complicadas y dif´ ıcilmente aplicables en la pr´actica. 21

Transcript of Tema 2 M´etodos de resoluci´on de Ecuaciones no...

Page 1: Tema 2 M´etodos de resoluci´on de Ecuaciones no Linealesdepartamento.us.es/edan/php/asig/LICMAT/LMCN1/Tema2CN10809.pdf · Tema 2 M´etodos de resoluci´on de Ecuaciones no Lineales

Tema 2

Metodos de resolucion de Ecuaciones

no Lineales

2.1. Generalidades. Orden de convergencia

Nos planteamos en este tema el problema de la resolucion aproximada de Ecuacionesno Lineales. Este problema se puede escribir de manera general como

f(x) = 0, (1.1)

siendo f una funcion dada de la variable real x, que toma valores reales, y que en generalvamos a suponer, al menos, continua.

Un caso particular importante de ecuacion de la forma (1.1) es aquel en que f es unpolinomio de grado n ≥ 2, en cuyo caso el problema adopta la forma

anxn + an−1x

n−1 + ... + a1x + a0 = 0, (1.2)

siendo los ak, k = 0, 1, ..., n, numeros reales dados, y an 6= 0.Este ultimo tipo de ecuaciones ha sido muy estudiado, y de el son bien conocidos los

siguientes hechos:

si n = 2, se tiene la formula de resolucion, conocida de todos,

a2x2 + a1x + a0 = 0 ⇔ x =

−a1 ±√

a21 − 4a2a0

2a2

,

que expresa el valor exacto de la solucion. Desde el punto de vista del AnalisisNumerico, el unico tipo de errores que se introducen con esta formula son los erroresde redondeo debido a las operaciones aritmeticas.

si n = 3 o 4, existen tambien formulas que expresan el valor exacto de la o lassoluciones de (1.2), mediante sumas, productos y raıces de los coeficientes. Sonformulas complicadas y difıcilmente aplicables en la practica.

21

Page 2: Tema 2 M´etodos de resoluci´on de Ecuaciones no Linealesdepartamento.us.es/edan/php/asig/LICMAT/LMCN1/Tema2CN10809.pdf · Tema 2 M´etodos de resoluci´on de Ecuaciones no Lineales

22 Calculo Numerico I.

si n ≥ 5, se sabe que en general no existen formulas como las anteriores, y solo sepueden resolver de manera exacta estas ecuaciones, por aplicacion de la regla deRuffini, en los casos particulares en que se conocen una o varias soluciones de lamisma.

En consecuencia, se hace necesario desarrollar procedimientos de calculo aproximadode las soluciones, tanto para las ecuaciones polinomicas, como, con mayor razon, para lasno lineales en general.

Antes que nada, hagamos notar que la ecuacion (1.1) puede ser escrita de distintasformas equivalentes, por ejemplo g(x) = x, o g(x) = h(x).

Ası por ejemplo, si consideramos la ecuacion x log x − 1 = 0, teniendo en cuentaque para que este definido el logaritmo como un numero real, x ha de ser estrictamentepositivo, dicha ecuacion puede ser escrita de varias maneras equivalentes. Por ejemplo enla forma log x − 1/x = 0, o tambien en la forma (EPF ) dada por x = 1/ log x, o en laforma log x = 1/x, que es del tipo g(x) = h(x). En los dos primeros casos, el problemade hallar la solucion x de f(x) = 0 puede ser interpretado geometricamente como el deencontrar la abscisa del punto de corte de la curva de ecuacion en el plano cartesianoy = f(x) con el eje OX, es decir con la recta y = 0. En el caso en que la ecuacion seescribe en forma g(x) = x, se puede interpretar de manera geometrica el problema comoel de hallar la abscisa del punto de corte de la curva y = g(x) con la bisectriz del primercuadrante, es decir, la recta y = x. Finalmente, si la ecuacion se ha escrito en la formag(x) = h(x), el significado geometrico consiste en hallar la abscisa del punto de corte delas curvas de ecuacion y = g(x) e y = h(x).

En particular, denominaremos ecuacion de punto fijo a la de la forma

(EPF ) g(x) = x.

Hagamos notar que existen muchas maneras de escribir una ecuacion dada en la forma(EPF ). Ası por ejemplo, si consideramos la ecuacion polinomica x3 − 3x2 + x − 2 = 0,teniendo en cuenta que la o las soluciones de la misma no pueden ser x = 0, esta puedeser escrita de manera equivalente en distintas formas de (EPF ). Por ejemplo

(EPF )1 x = −x3 + 3x2 + 2,

o dividiendo por x, se obtiene x2 − 3x + 1− 2/x = 0, con lo que despejando,

(EPF )2 x =1

3

(x2 + 1− 2

x

).

Tambien, se puede dividir la ecuacion de partida por x2, obteniendose x− 3 + 1/x−2/x2 = 0, con lo que despejando,

(EPF )3 x = 3− 1

x+

2

x2.

Page 3: Tema 2 M´etodos de resoluci´on de Ecuaciones no Linealesdepartamento.us.es/edan/php/asig/LICMAT/LMCN1/Tema2CN10809.pdf · Tema 2 M´etodos de resoluci´on de Ecuaciones no Lineales

Tema 2: Metodos de resolucion de Ecuaciones no Lineales. 23

Por supuesto, tambien se puede escribir la ecuacion en la forma

(EPF )4 x = x + (x3 − 3x2 + x− 2)h(x),

siendo h cualquier funcion real continua en todo R tal que h(x) 6= 0 para todo x ∈ R.Desde el punto de vista del Analisis Numerico, estas cuatro formas no son equivalen-

tes. Con unas se aproxima la solucion buscada de manera mas rapida y con menos costede calculos que con otras.

A continuacion, vamos a realizar algunas consideraciones generales sobre el problema(1.1). A cualquier solucion de la citada ecuacion, es decir, a cualquier x ∈ R tal quef(x) = 0, se le denomina un cero o una raız de f .

Recordemos los siguientes conceptos

Definicion 2.1 Sean I ⊂ R un intervalo de interior no vacıo, y f una funcion realdefinida en dicho intervalo.

a) Se dice que f es creciente (respectivamente, decreciente) en el intervalo I, si dadocualquier par de puntos x1, x2 en I, si x1 < x2, entonces f(x1) ≤ f(x2) (respecti-vamente, f(x1) ≥ f(x2)). Se dice que f es monotona en I si es creciente en I o sidecreciente en I.

b) Se dice que f es estrictamente creciente (respectivamente, estrictamente decreciente)en el intervalo I, si dado cualquier par de puntos x1, x2 en I, si x1 < x2, entoncesf(x1) < f(x2) (respectivamente, f(x1) > f(x2)). Se dice que f es estrictamentemonotona en I si es estrictamente creciente en I o si estrictamente decreciente enI.

De la definicion, resulta evidente el resultado siguiente

Proposicion 2.2 Sean I ⊂ R un intervalo de interior no vacıo, y f una funcion realdefinida en dicho intervalo. Si f es estrictamente monotona en I, entonces la ecuacion(1.1) tiene a lo mas una solucion en el intervalo I.

Observacion 2.3 Es bien conocido que si f es derivable en el intervalo I y f ′(x) > 0 entodo punto x ∈ I, entonces f es estrictamente creciente en I. Analogamente, si f ′(x) < 0en todo punto x ∈ I, entonces f es estrictamente decreciente en I.

En consecuencia, si f ′ es siempre positiva en I, o siempre negativa en I, entonces laecuacion (1.1) tiene a lo mas una solucion en dicho intervalo.

Observacion 2.4 Si f es monotona, pero no estrictamente monotona, en I, entonces laecuacion (1.1) puede tener infinitas soluciones en este intervalo.

Page 4: Tema 2 M´etodos de resoluci´on de Ecuaciones no Linealesdepartamento.us.es/edan/php/asig/LICMAT/LMCN1/Tema2CN10809.pdf · Tema 2 M´etodos de resoluci´on de Ecuaciones no Lineales

24 Calculo Numerico I.

Observacion 2.5 Las consideraciones anteriores no son validas para la ecuacion de pun-to fijo g(x) = x. La funcion g puede ser estrictamente monotona, pero la (EPF ) puede

tener infinitas soluciones. Ası por ejemplo, si consideramos la funcion g(x) = x+1

2sen x,

su derivada es g′(x) = 1 +1

2cos x > 0 en todo punto x ∈ R. En consecuencia, esta fun-

cion g es estrictamente creciente en I = R, pero la ecuacion g(x) = x ⇔ sen x = 0, tieneinfinitas soluciones en R, dadas por xk = kπ, k ∈ Z.

Introducimos a continuacion el concepto de orden de multiplicidad de un cero de f .

Definicion 2.6 Sean (a, b) ⊂ R un intervalo abierto, f una funcion real definida y con-tinua en todo punto de (a, b), y m ≥ 1 un numero entero. Se dice que α ∈ (a, b) es uncero de multiplicidad m de f , si la funcion f puede ser escrita en la forma

f(x) = (x− α)mq(x) para todo x ∈ (a, b) tal que x 6= α, (1.3)

con q una funcion definida en (a, b) \ {α} tal que existe

lımx→α

q(x) ∈ R \ {0}. (1.4)

Un cero simple de f es cualquier cero que sea de multiplicidad 1.

Respecto del concepto de orden de multiplicidad de un cero, se tienen los siguientesresultados.

Proposicion 2.7 Sean f ∈ C1(a, b) y α ∈ (a, b). La funcion f tiene un cero simple (i.e.de multiplicidad 1) en α, si y solo si

f(α) = 0, f ′(α) 6= 0. (1.5)

Demostracion.- Supongamos en primer lugar que f tiene un cero simple en α. Ental caso, evidentemente f(α) = 0. Ademas, f puede ser escrita en la forma (1.3), y enconsecuencia, la funcion

q(x) =f(x)

x− α, x ∈ (a, b) \ {α},

con lo que, teniendo en cuenta que f(α) = 0, se tiene

0 6= lımx→α

q(x) = lımx→α

f(x)− f(α)

x− α= f ′(α).

Recıprocamente, supongamos que se satisface (1.5). Consideremos la funcion q definidapor

q(x) =f(x)

x− α, x ∈ (a, b) \ {α}.

Page 5: Tema 2 M´etodos de resoluci´on de Ecuaciones no Linealesdepartamento.us.es/edan/php/asig/LICMAT/LMCN1/Tema2CN10809.pdf · Tema 2 M´etodos de resoluci´on de Ecuaciones no Lineales

Tema 2: Metodos de resolucion de Ecuaciones no Lineales. 25

Evidentemente se satisface

f(x) = (x− α)q(x), x ∈ (a, b) \ {α}.

Ademas por la regla de l’Hopital,

lımx→α

q(x) = lımx→α

f ′(x)

1= f ′(α) 6= 0.

Proposicion 2.8 Sean m ≥ 2 entero, f ∈ Cm(a, b) y α ∈ (a, b). La funcion f tiene uncero de multiplicidad m en α, si y solo si

f(α) = f ′(α) = ... = fm−1)(α) = 0, fm)(α) 6= 0. (1.6)

Demostracion.- Se deja como ejercicio.

En cualquier proceso de calculo de raıces de una ecuacion no lineal se distinguen tresfases: localizacion, separacion y aproximacion.

a) En la fase de localizacion se busca conocer una zona donde se encuentra una ovarias soluciones de la ecuacion, haciendo uso para ello de metodos analıticos, tablas,representacion aproximada, etc.... El propio origen de la ecuacion (fısico, tecnico,etc...) puede dar indicaciones de donde se encuentran las soluciones.

b) La separacion consiste en encontrar intervalos que contengan una y solo una solucionde la ecuacion, ello es fundamental en el caso de raıces muy proximas. En general,se puede conseguir la separacion combinando el teorema de Bolzano y la Proposi-cion 2.2. Cuando se ha conseguido esto, se dice que la solucion esta aislada. Ello nosiempre se puede conseguir, ası por ejemplo si consideramos la funcion

f(x) =

x sen(1/x), si x 6= 0,

0, si x = 0;

la solucion x = 0 de la ecuacion f(x) = 0 no puede ser aislada.

c) En la fase de aproximacion, se construye una sucesion de valores que converja haciala solucion buscada, ello se realiza, habitualmente, mediante un metodo iterativo.Nosotros vamos a estudiar metodos iterativos de los denominados de un paso.

Definicion 2.9 Un metodo iterativo de un paso es un proceso que genera una sucesion{xk}k≥0 de la manera siguiente:

Page 6: Tema 2 M´etodos de resoluci´on de Ecuaciones no Linealesdepartamento.us.es/edan/php/asig/LICMAT/LMCN1/Tema2CN10809.pdf · Tema 2 M´etodos de resoluci´on de Ecuaciones no Lineales

26 Calculo Numerico I.

1) Se parte de un valor inicial x0 que se supone suficientemente proximo a la raızbuscada.

2) Se itera, es decir, se obtiene una sucesion definida por recurrencia mediante laformula

xk+1 = G(xk), k ≥ 0, (1.7)

siendo G una funcion real de variable real dada.

Ası pues, un metodo iterativo depende de la formula (1.7) que se utilice, y tambiendel punto inicial x0 que se tome.

El primer problema que se presenta con todo metodo iterativo de un paso es sabersi partiendo de x0, con el esquema (1.7) se construye una verdadera sucesion. Ası porejemplo, si consideramos la sucesion definida por recurrencia mediante la formula

xk+1 = 3− 3

xk

, k ≥ 0,

y partimos de x0 = 2, es inmediato ver que se van obteniendo sucesivamente, x1 = 3/2,x2 = 1, x3 = 0, y en consecuencia x4 no esta definida.

De hecho, las preguntas que se plantean cuando se define un metodo iterativo de unpaso son:

si se genera con (1.7) realmente una sucesion,

si la sucesion es convergente,

si el lımite de la sucesion es la solucion de f(x) = 0 que se pretende aproximar,

determinar el numero de iteraciones que hay que hacer para que el error que secometa sea menor que una cantidad ε > 0 prefijada,

conocer como evoluciona el error en el curso de las iteraciones.

En este Tema vamos estudiar dos metodos iterativos de un paso para los que respon-deremos a estas cuestiones.

Definicion 2.10 Se dice que un metodo iterativo dado por la formula (1.7) tiene lapropiedad de convergencia global hacia α ∈ R en un subconjunto D ⊂ R, si para tododato inicial x0 ∈ D se puede construir la sucesion xk correspondiente con la formula(1.7), siendo lım

k→∞xk = α.

Page 7: Tema 2 M´etodos de resoluci´on de Ecuaciones no Linealesdepartamento.us.es/edan/php/asig/LICMAT/LMCN1/Tema2CN10809.pdf · Tema 2 M´etodos de resoluci´on de Ecuaciones no Lineales

Tema 2: Metodos de resolucion de Ecuaciones no Lineales. 27

Definicion 2.11 Se dice que un metodo iterativo dado por la formula (1.7) tiene lapropiedad de convergencia local hacia α ∈ R si existe un numero δ > 0 tal que dichometodo tiene la propiedad de convergencia global hacia α en el intervalo (α − δ, α + δ),es decir, si para todo dato inicial x0 ∈ (α − δ, α + δ) se puede construir la sucesion xk

correspondiente con la formula (1.7), y lımk→∞

xk = α.

En tal caso, diremos que α es un punto atractivo para dicho metodo iterativo, y encaso contrario, diremos que α es un punto repulsivo para dicho metodo.

Observese que distintas raıces de una misma ecuacion pueden ser unas atractivas yotras repulsivas para un mismo metodo iterativo (veremos ejemplos de ello en clase deproblemas).

Una cuestion de interes es la determinacion del mayor conjunto D ⊂ R en el que undeterminado metodo iterativo es globalmente convergente hacia un numero α ∈ R. Adicho conjunto lo denominaremos el campo de convergencia del metodo hacia α.

Otra propiedad muy importante es el orden de convergencia de un metodo, que pro-porciona una medida de la velocidad de convergencia de una sucesion construida con elmismo hacia su lımite.

Definicion 2.12 Sea xk una sucesion de numeros reales tal que lımk→∞

xk = α, y sea p > 0.

Se dice que la sucesion tiene orden de convergencia al menos p si existen k0 ≥ 0 y C > 0(0 < C < 1 si p = 1) tales que

|xk+1 − α| ≤ C|xk − α|p para todo k ≥ k0. (1.8)

Notese que en la definicion precedente, p no tiene que ser necesariamente un numeroentero. En la terminologıa clasica, si p = 1, 2 o 3, se habla de convergencia al menoslineal, cuadratica o cubica, respectivamente. Si p < 1, o si p = 1 y C = 1, se dice que laconvergencia es sublineal, y si p > 1 se dice que la convergencia es superlineal.

Es frecuente usar la notacion

dk = xk − α (error en el termino k),

ek = |xk − α| (error en valor absoluto en el termino k),

y de esta manera (1.8) se escribe

ek+1 ≤ Cepk para todo k ≥ k0.

Observese que no toda sucesion convergente tiene orden de convergencia en el sentidode la definicion anterior. Por ejemplo, la sucesion

0, 1, 1,1

2,

1

22,1

3,

1

33, ...,

1

n,

1

nn, ...,

Page 8: Tema 2 M´etodos de resoluci´on de Ecuaciones no Linealesdepartamento.us.es/edan/php/asig/LICMAT/LMCN1/Tema2CN10809.pdf · Tema 2 M´etodos de resoluci´on de Ecuaciones no Lineales

28 Calculo Numerico I.

converge a cero, pero|x2j+1||x2j|p

=1/(j + 1)

1/jpj,

sucesion que converge a +∞ cuando j → +∞, cualquiera que sea p > 0.

Proposicion 2.13 Sea xk una sucesion de numeros reales tal que lımk→∞

xk = α, y sea p >

0. La condicion necesaria y suficiente para que la sucesion xk tenga orden de convergenciaal menos p es que

lım supk→∞

|xk+1 − α||xk − α|p = L < +∞ (L < 1 si p = 1), (1.9)

donde usamos el convenio de que 0/0 = 0.

Demostracion.- Si el orden de convergencia es al menos p, entonces

|xk+1 − α||xk − α|p ≤ C para todo k ≥ k0,

y en consecuencia

lım supk→∞

|xk+1 − α||xk − α|p = L ≤ C.

Recıprocamente, si se verifica (1.9), entonces fijado ε > 0 arbitrariamente pequeno,existe un k0(ε) tal que

|xk+1 − α||xk − α|p ≤ L + ε para todo k ≥ k0(ε),

⋄Observese que en el caso en que exista lım

k→∞

|xk+1 − α||xk − α|p , la proposicion anterior afirma

que la sucesion xk tiene orden de convergencia al menos p si y solo si

lımk→∞

|xk+1 − α||xk − α|p = L < +∞ (L < 1 si p = 1).

Definicion 2.14 Sea xk una sucesion de numeros reales tal que lımk→∞

xk = α, y sea p > 0.

Se dice que la sucesion tiene orden de convergencia p si existe

lımk→∞

|xk+1 − α||xk − α|p = L ∈ (0, +∞) (L ∈ (0, 1) si p = 1). (1.10)

En tal caso, a la constante L definida por (1.10) se le denomina la constante asintoticadel error.

Page 9: Tema 2 M´etodos de resoluci´on de Ecuaciones no Linealesdepartamento.us.es/edan/php/asig/LICMAT/LMCN1/Tema2CN10809.pdf · Tema 2 M´etodos de resoluci´on de Ecuaciones no Lineales

Tema 2: Metodos de resolucion de Ecuaciones no Lineales. 29

Definicion 2.15 Dado p > 0, se dice que el metodo iterativo dado por la formula (1.7)tiene orden de convergencia al menos p hacia α ∈ R si existe un numero δ > 0 tal quedicho metodo tiene la propiedad de convergencia global hacia α en el intervalo (α−δ, α+δ),y para todo dato inicial x0 ∈ (α− δ, α + δ), la sucesion xk correspondiente construida conla formula (1.7) tiene orden de convergencia al menos p.

Observese que si una sucesion tiene orden de convergencia p, entonces

lımk→∞

|xk+1 − α||xk − α|q =

+∞ si q > p,

0 si q < p.

Como ya hemos dicho, el orden de convergencia de una sucesion mide la velocidadde convergencia de la misma. Para comprobar este extremo, supongamos que xk es unasucesion de numeros reales tal que lım

k→∞xk = α, y que la sucesion tiene orden de conver-

gencia al menos p > 0. Entonces existen k0 ≥ 0 y C > 0 (0 < C < 1 si p = 1) tales queek+1 ≤ Cep

k para todo k ≥ k0. Por consiguiente, si k ≥ k0,

ek+1 ≤ Cepk ≤ C(Cep

k−1)p = C1+pep2

k−1 ≤ C1+p(Cepk−2)

p2

= C1+p+p2

ep3

k−2 ≤ · · · ≤ C1+p+p2+...+pk−k0epk−k0+1

k0,

es decir,

ek+1 ≤ Cpk−k0+1

−1

p−1 epk−k0+1

k0,

o, cambiando k + 1 por k,

ek ≤ Cpk−k0−1

p−1 epk−k0

k0para todo k > k0. (1.11)

Supongamos ahora el caso particular en que p > 1, y que nos planteamos saber hastaque k hay que llegar para que el error ek sea menor que un ε > 0 prefijado. De (1.11),tenemos que para ello basta que

Cpk−k0−1

p−1 epk−k0

k0≤ ε,

es decirpk−k0 − 1

p− 1log C + pk−k0 log ek0

≤ log ε,

con lo que como p− 1 > 0, basta con que k satisfaga

(log C + (p− 1) log ek0)pk−k0 ≤ (p− 1) log ε + log C. (1.12)

Si, por simplificar, suponemos que C = 1, y ek0< 1, entonces (1.12) se transforma en

Page 10: Tema 2 M´etodos de resoluci´on de Ecuaciones no Linealesdepartamento.us.es/edan/php/asig/LICMAT/LMCN1/Tema2CN10809.pdf · Tema 2 M´etodos de resoluci´on de Ecuaciones no Lineales

30 Calculo Numerico I.

(log ek0)pk−k0 ≤ log ε,

es decir

pk−k0 ≥ log ε

log ek0

,

o lo que es lo mismo,

k − k0 ≥1

log plog

(log ε

log ek0

),

y por tanto

k ≥ k0 +1

log plog

(log ε

log ek0

).

Queda claro de esta ultima estimacion, que cuando p aumenta, el valor necesario de kdisminuye.

2.2. Metodo de biseccion

El metodo de biseccion (o de dicotomıa) se basa en el Teorema de Bolzano. Suponga-mos dados un intervalo cerrado [a, b] ⊂ R, una funcion f : [a, b] → R, y consideremos laecuacion

f(x) = 0. (2.13)

Supongamos que f es continua en [a, b] y que f(a)f(b) < 0. En tal caso, sabemos queexiste un punto α ∈ (a, b) tal que f(α) = 0. Supongamos que dicho punto α es el unicopunto de [a, b] que anula a f .

Bajo las condiciones precedentes, vamos a construir una sucesion de intervalos enca-jados

[a, b] = [a0, b0] ⊃ [a1, b1] ⊃ [a2, b2] ⊃ . . . [ak, bk] ⊃ . . . ,

conteniendo al punto α, de la siguiente manera.

Etapa 1.- Tenemos que f(a0)f(b0) = f(a)f(b) < 0. Sea

c0 =a0 + b0

2.

Si f(c0) = 0, ya hemos encontrado la solucion α = c0.

Si f(c0) 6= 0, entonces se pueden presentar dos casos:

a) Si f(a0)f(c0) < 0, tomamos a1 = a0 y b1 = c0.

b) Si f(a0)f(c0) > 0, entonces f(c0)f(b0) < 0, y tomamos a1 = c0 y b1 = b0.

Page 11: Tema 2 M´etodos de resoluci´on de Ecuaciones no Linealesdepartamento.us.es/edan/php/asig/LICMAT/LMCN1/Tema2CN10809.pdf · Tema 2 M´etodos de resoluci´on de Ecuaciones no Lineales

Tema 2: Metodos de resolucion de Ecuaciones no Lineales. 31

Tanto en el caso a) como en el b), el intervalo [a1, b1] construido tiene la mitadde longitud que [a0, b0], y satisface f(a1)f(b1) < 0, por lo cual contiene a α en suinterior.

Etapa k.- Supongamos que f(ak−1)f(bk−1) < 0. Sea

ck−1 =ak−1 + bk−1

2.

Si f(ck−1) = 0, ya hemos encontrado la solucion α = ck−1.

Si f(ck−1) 6= 0, entonces se pueden presentar dos casos:

a) Si f(ak−1)f(ck−1) < 0, tomamos ak = ak−1 y bk = ck−1.

b) Si f(ak−1)f(ck−1) > 0, entonces f(ck−1)f(bk−1) < 0, y tomamos ak = ck−1 ybk = bk−1.

Nuevamente, tanto en el caso a) como en el b), el intervalo [ak, bk] construido tienela mitad de longitud que [ak−1, bk−1], y satisface f(ak)f(bk) < 0, por lo cual contienea α en su interior.

De esta manera, o bien en un numero finito de etapas se ha encontrado α, o en casocontrario construimos una sucesion de intervalos encajados [ak, bk] tales que

bk − ak =1

2k(b− a), y α ∈ (ak, bk) para todo k ≥ 0.

En particular,

α− ak ≤1

2k(b− a), y bk − α ≤ 1

2k(b− a) para todo k ≥ 0,

y por tanto ak ↑ α y bk ↓ α, cuando k →∞.Despues de haber efectuado k pasos, se puede tomar como aproximacion de la solucion

α a ck =ak + bk

2, con lo que el error en valor absoluto cometido sera

ek = |ck − α| ≤ 1

2k+1(b− a).

Se tiene pues probado el siguiente teorema:

Teorema 2.16 Sea f una funcion continua en el intervalo acotado [a, b] y tal que f(a)f(b) <0. Sea {ck} la sucesion generada por el metodo de la biseccion. Entonces existe α ∈ [a, b]tal que f(α) = 0 y ademas se tiene la siguiente estimacion del error:

|ck − α| ≤ b− a

2k+1, ∀k = 0, 1, · · ·

En particular lımk→+∞

ck = α.

Page 12: Tema 2 M´etodos de resoluci´on de Ecuaciones no Linealesdepartamento.us.es/edan/php/asig/LICMAT/LMCN1/Tema2CN10809.pdf · Tema 2 M´etodos de resoluci´on de Ecuaciones no Lineales

32 Calculo Numerico I.

El metodo de biseccion presenta varios inconvenientes. Es lento, ya que no aprovechaninguna otra propiedad de f que no sea el signo de la misma. Es un metodo en que pasadesapercibido si se acerca uno mucho o no a la solucion, y es computacionalmente costoso,ya que hay que efectuar muchas comparaciones.

Sin embargo, el metodo de biseccion presenta tambien algunas ventajas. Ası por ejem-plo, es convergente con una expresion explıcita de la cota del error, y es aplicable siemprea partir de la propia funcion.

La convergencia del algoritmo no llega a ser lineal.

2.3. Metodos de primer orden: metodo de aproxima-

ciones sucesivas

En esta seccion vamos a estudiar la ecuacion de punto fijo

(EPF ) g(x) = x.

Sobre la existencia y unicidad de solucion para esta ecuacion, tenemos en primer lugarlos dos resultados siguientes:

Proposicion 2.17 (existencia de solucion para (EPF )) Sea g : [a, b] → R unafuncion continua en el intervalo [a, b], y supongamos que satisface la condicion

(g(a)− a)(g(b)− b) < 0. (3.14)

Entonces, existe al menos un α ∈ (a, b) tal que g(α) = α.

Demostracion.- Basta aplicar el Teorema de Bolzano a la funcion h(x) = g(x)− x. ⋄

Observacion 2.18 Una condicion suficiente para que se satisfaga (3.14) es que g([a, b])⊂ [a, b].

Proposicion 2.19 (unicidad de solucion para (EPF )) Sea g : [a, b] → R una funciontal que

|g(x)− g(y)| < |x− y| para todo par x, y ∈ [a, b], tal que x 6= y. (3.15)

Entonces, existe a lo mas una solucion de (EPF ).

Demostracion.- Si α1 y α2 son dos puntos distintos de [a, b], soluciones de (EPF ),entonces

|α1 − α2| = |g(α1)− g(α2)| < |α1 − α2|,lo cual es imposible. ⋄

Observese que la condicion (3.15) implica en particular la continuidad de g en todo elintervalo [a, b].

Page 13: Tema 2 M´etodos de resoluci´on de Ecuaciones no Linealesdepartamento.us.es/edan/php/asig/LICMAT/LMCN1/Tema2CN10809.pdf · Tema 2 M´etodos de resoluci´on de Ecuaciones no Lineales

Tema 2: Metodos de resolucion de Ecuaciones no Lineales. 33

A continuacion, pasamos a estudiar el metodo de aproximaciones sucesivas (MAS)para la (EPF ). Es este un metodo iterativo de un paso definido por

(MAS)

x0 ∈ R dado,

xk+1 = g(xk), k ≥ 0.

Observese en primer lugar que para que (MAS) este bien definido, todos los puntosxk han de estar en el dominio de definicion de la funcion g.

Definicion 2.20 Sea g : [a, b] → R una funcion dada. Se dice que g es contractiva en elintervalo [a, b], si existe una constante L ∈ [0, 1) tal que

|g(x)− g(y)| ≤ L|x− y| para todo x, y ∈ [a, b]. (3.16)

En tal caso, a L se la denomina una constante de contractividad para g en [a, b].

Observacion 2.21

1. La condicion (3.16) implica (3.15), y en particular la continuidad de g en todo elintervalo [a, b], ası como la unicidad de solucion para (EPF ).

2. Una funcion g : [a, b] → R, se dice que es Lipschitziana en el intervalo [a, b], siexiste una constante L > 0 tal que se verifica la condicion (3.16). En consecuencia,una funcion es contractiva si es Lipschitziana con constante L ∈ [0, 1).

Una condicion de caracter elemental suficiente para que una funcion sea contractiva,es la siguiente.

Proposicion 2.22 Sea g : [a, b] → R una funcion continua en el intervalo [a, b], y deriv-able en (a, b). Supongamos que satisface la condicion

L := supx∈(a,b)

|g′(x)| < 1. (3.17)

Entonces, g es contractiva en el intervalo [a, b], siendo L definida en (3.17) una constantede contractividad para g en [a, b].

Demostracion.- Por el teorema del valor medio, si x, y ∈ [a, b], existe un punto z ∈ (a, b)tal que

g(x)− g(y) = g′(z)(x− y),

con lo que en particular,

|g(x)− g(y)| ≤ ( sups∈(a,b)

|g′(s)|)|x− y|.

Page 14: Tema 2 M´etodos de resoluci´on de Ecuaciones no Linealesdepartamento.us.es/edan/php/asig/LICMAT/LMCN1/Tema2CN10809.pdf · Tema 2 M´etodos de resoluci´on de Ecuaciones no Lineales

34 Calculo Numerico I.

⋄De acuerdo con las consideraciones precedentes, si g : [a, b] → R es contractiva en

el intervalo [a, b], y satisface g([a, b]) ⊂ [a, b], entonces existe una y solo una solucion de(EPF ) en dicho intervalo. El resultado que sigue, proporciona convergencia global de(MAS) y acotacion del error.

Teorema 2.23 (convergencia global de (MAS) y acotacion del error) Suponga-mos que g : [a, b] → R es contractiva en el intervalo [a, b] y tal que g([a, b]) ⊂ [a, b]. SeaL ∈ [0, 1) una constante de contractividad para g en [a, b].

En estas condiciones, (MAS) es globalmente convergente en [a, b] a la unica solucionα ∈ [a, b] de (EPF ), es decir, para todo x0 ∈ [a, b], la sucesion xk definida por

xk+1 = g(xk) para todo k ≥ 0, (3.18)

esta bien definida y satisfacelımk→∞

xk = α. (3.19)

Ademas, se tienen las siguientes estimaciones de error,

|xk − α| ≤ Lk|x0 − α| para todo k ≥ 0, x0 ∈ [a, b], (3.20)

|xk − α| ≤ Lk

1− L|x1 − x0| para todo k ≥ 0, x0 ∈ [a, b]. (3.21)

Demostracion.- Como ya se ha dicho con anterioridad, por las Proposiciones 2.17 y 2.19,existe una y solo una solucion α de (EPF ) en [a, b].

Por otra parte, gracias a que g([a, b]) ⊂ [a, b], para cualquier punto inicial x0 ∈ [a, b]la formula (3.18) define de manera recursiva una sucesion xk de puntos de [a, b]. Ademas,

|xk − α| = |g(xk−1)− g(α)| ≤ L|xk−1 − α|= L|g(xk−2)− g(α)| ≤ L2|xk−2 − α| ≤ · · · ≤ Lk|x0 − α|,

es decir, se satisface (3.20), y en consecuencia, dado que 0 ≤ L < 1 implica que Lk → 0cuando k →∞, se obtiene que xk converge a α.

Finalmente, para obtener la estimacion (3.21), se parte de que en general

|xp − xp−1| = |g(xp−1)− g(xp−2)| ≤ L|xp−1 − xp−2| ≤ · · · ≤ Lp−1|x1 − x0|,

para todo p ≥ 1. Con esto, si k ≥ 0 esta fijo, para todo m > k se obtiene

|xm − xk| ≤ |xm − xm−1|+ · · ·+ |xk+1 − xk| ≤ (Lm−1 + · · ·+ Lk)|x1 − x0|

= Lk(1 + · · ·+ Lm−k−1)|x1 − x0| ≤Lk

1− L|x1 − x0|,

con lo que, haciendo m →∞, se obtiene (3.21). ⋄

Page 15: Tema 2 M´etodos de resoluci´on de Ecuaciones no Linealesdepartamento.us.es/edan/php/asig/LICMAT/LMCN1/Tema2CN10809.pdf · Tema 2 M´etodos de resoluci´on de Ecuaciones no Lineales

Tema 2: Metodos de resolucion de Ecuaciones no Lineales. 35

Observacion 2.24 De la estimacion (3.21) se deduce que el (MAS) converge mas rapi-damente cuanto mas proxima a cero sea L.

Observacion 2.25 En el proceso de la demostracion del Teorema 2.23 hemos probadoque

|xk − α| ≤ L|xk−1 − α|, para todo k ≥ 1,

con 0 ≤ L < 1, y por tanto, el (MAS) tiene orden de convergencia al menos lineal. Dehecho, en muchas ocasiones es exactamente lineal. Ası por ejemplo, si bajo las condicionesdel Teorema 2.23 suponemos que ademas existe g′(x) para todo x ∈ (a, b), y la funcion g′

es continua en (a, b) (es decir, g ∈ C1(a, b)), entonces para todo k ≥ 0,

|xk+1 − α| = |g(xk)− g(α)| = |g′(θk)(xk − α)|,

con θk un punto entre xk y α, con lo que, si suponemos que xk 6= α para todo k ≥ 0,tenemos

|xk+1 − α||xk − α| = |g′(θk)| para todo k ≥ 0,

y en consecuencia, como xk → α implica que θk → α cuando k → ∞ y g′ es continua,obtenemos

lımk→∞

|xk+1 − α||xk − α| = |g′(α)|,

de modo que si g′(α) 6= 0, la convergencia de (MAS) a la solucion α es exactamentelineal. Mas adelante veremos que si g′(α) = 0, la convergencia es superlineal (por ejemploen las condiciones del Teorema 2.28).

Como un ejemplo de situacion en que el (MAS) no es convergente, tenemos el siguienteresultado:

Proposicion 2.26 Sea g : [a, b] → R continua, y α ∈ (a, b) un punto tal que g(α) = α.Supongamos que existe la derivada g′(x) en todo punto x de un entorno (α − δ, α + δ),con δ > 0, y |g′(x)| > 1, para todo x ∈ (α− δ, α + δ).

En estas condiciones, el punto α es repulsivo para el (MAS).

Demostracion.- Si xk ∈ (α− δ, α + δ), entonces

xk+1 − α = g(xk)− g(α) = g′(xk)(xk − α),

con xk un punto intermedio entre xk y α, y por tanto,

|xk+1 − α| > |xk − α|.

Page 16: Tema 2 M´etodos de resoluci´on de Ecuaciones no Linealesdepartamento.us.es/edan/php/asig/LICMAT/LMCN1/Tema2CN10809.pdf · Tema 2 M´etodos de resoluci´on de Ecuaciones no Lineales

36 Calculo Numerico I.

Sea g : [a, b] → R continua, tal que g([a, b]) ⊂ [a, b], y existe la derivada g′(x) en todopunto de (a, b).

Supongamos que |g′(x)| ≤ L < 1, para todo x ∈ (a, b). En tal caso, sabemos que el(MAS) es convergente a la unica solucion α de la (EPF ). Ademas, suponiendo que lasiterantes xk−1 y xk son distintas, es decir, que no se ha llegado a α, se tiene

xk+1 − xk = g(xk)− g(xk−1) = g′(x)(xk − xk−1),

con x un punto intermedio entre xk−1 y xk.En estas condiciones, si g′(x) > 0 para todo x ∈ (a, b), de la igualdad precedente

tenemos

sgn(xk+1 − xk) = sgn(xk − xk−1), y |xk+1 − xk| < |xk − xk−1|,

con lo cual, geometricamente, el proceso de acercamiento de xk a α es convergente enescalera.

Analogamente, si g′(x) < 0 para todo x ∈ (a, b), se tiene

sgn(xk+1 − xk) 6= sgn(xk − xk−1), y |xk+1 − xk| < |xk − xk−1|,

con lo cual, geometricamente, el proceso de acercamiento de xk a α es convergente enespiral.

Como un ejemplo de aplicacion del (MAS), consideremos la ecuacion e−x = x, en elintervalo [1/2, log 2]. Supongamos que nos planteamos demostrar que esta ecuacion esta enlas condiciones del Teorema 2.23, y calcular un numero de iteraciones que sea suficientepara que, partiendo de x0 = 1/2, el error cometido, en ausencia de errores de redondeo,sea menor que 10−3.

En primer lugar, la funcion g(x) = e−x es continua y derivable en todo punto x ∈ R, conderivada g′(x) = −e−x < 0. En particular, g es estrictamente decreciente en el intervalo[1/2, log 2]. Ademas,

1/2 < e−1/2 = g(1/2) = 0′606... < log 2 = 0′69...,

g(log 2) = e− log 2 = 1/2.

En consecuencia, g([1/2, log 2]) ⊂ [1/2, log 2].Por otra parte, para todo x ∈ [1/2, log 2],

|g′(x)| = e−x ≤ e−1/2 = L < 1,

y por tanto se satisfacen todas las condiciones del Teorema 2.23. Si aplicamos (MAS)partiendo de x0 = 1/2, en la etapa k ≥ 1, de acuerdo con (3.21), tenemos

|xk − α| ≤ e−k/2

1− e−1/2

∣∣∣∣e−1/2 − 1

2

∣∣∣∣ =2−√e

2(√

e− 1)(√

e)k,

Page 17: Tema 2 M´etodos de resoluci´on de Ecuaciones no Linealesdepartamento.us.es/edan/php/asig/LICMAT/LMCN1/Tema2CN10809.pdf · Tema 2 M´etodos de resoluci´on de Ecuaciones no Lineales

Tema 2: Metodos de resolucion de Ecuaciones no Lineales. 37

con lo que, si queremos |xk − α| < 10−3, basta tomar k tal que

(√

e)k >(2−√e)103

2(√

e− 1),

es decir,

k > 2 log

((2−√e)103

2(√

e− 1)

)= 11′2...,

y por tanto tenemos garantizado que |x12 − α| < 10−3.Si se efectuan los calculos con 4 cifras decimales, partiendo de x0 = 0′5, y usando las

iteraciones xk+1 = e−xk , se obtienen

x1 = 0′6065, x2 = 0′5452, x3 = 0′5797, x4 = 0′5601,

x5 = 0′5712, x6 = 0′5649, x7 = 0′5684, x8 = 0′5664,

x9 = 0′5676, x10 = 0′5669, x11 = 0′5673, x12 = 0′5671,

con lo que si tomamos como valor de α = 0′567, el error que se comete es inferior a 10−3.Observese como en la tabla anterior las iteraciones xk van convergiendo a α, oscilando enespiral.

A continuacion, exponemos un resultado de convergencia local del (MAS), en unasituacion en que no se verifica la hipotesis (3.14) de la Proposicion 2.17, y por tanto, apriori, no sabemos si existe solucion de (EPF ).

Teorema 2.27 (convergencia local de (MAS)) Supongamos dados x0 ∈ R, ρ > 0y g : [x0 − ρ, x0 + ρ] → R una funcion contractiva en el intervalo [x0 − ρ, x0 + ρ]. SeaL ∈ [0, 1) una constante de contractividad para g en [x0 − ρ, x0 + ρ], y supongamos que

|x0 − g(x0)| ≤ (1− L)ρ. (3.22)

Entonces

i) la sucesion xk definida por (MAS) esta bien definida,

ii) existe lımk→∞

xk = α, el numero α es solucion de la (EPF ), es decir, g(α) = α, y

ademas,|xk − α| ≤ Lkρ para todo k ≥ 0, (3.23)

iii) α es la unica solucion en el intervalo [x0 − ρ, x0 + ρ] de la (EPF ) g(x) = x.

Demostracion.-

i) Hay que probar que

x0 − ρ ≤ xk ≤ x0 + ρ para todo k ≥ 1. (3.24)

Page 18: Tema 2 M´etodos de resoluci´on de Ecuaciones no Linealesdepartamento.us.es/edan/php/asig/LICMAT/LMCN1/Tema2CN10809.pdf · Tema 2 M´etodos de resoluci´on de Ecuaciones no Lineales

38 Calculo Numerico I.

Procedamos por induccion. En primer lugar,

|x0 − x1| = |x0 − g(x0)| ≤ (1− L)ρ < ρ,

y por tanto x1 satisface (3.24). Supongamos ahora que (3.24) es satisfecha para k =1, ...,m. En tal caso, para todo 1 ≤ k ≤ m se satisface

|xk+1 − xk| = |g(xk)− g(xk−1)| ≤ L|xk − xk−1| ≤ · · · ≤ Lk|x1 − x0| ≤ Lk(1− L)ρ,

y por tanto

|xm+1 − x0| ≤ |xm+1 − xm|+ · · ·+ |x1 − x0| ≤ (Lm + Lm−1 + · · ·+ 1)(1− L)ρ

<1

1− L(1− L)ρ = ρ,

es decir, (3.24) es tambien satisfecha para k = m + 1.

ii) Veamos en primer lugar que la sucesion xk es de Cauchy, con lo cual sera conver-gente.

Tenemos

|xm+p − xm| ≤ |xm+p − xm+p−1|+ · · ·+ |xm+1 − xm|≤ (Lm+p−1 + · · ·+ Lm)(1− L)ρ = Lm(Lp−1 + · · ·+ 1)(1− L)ρ

< Lm 1

1− L(1− L)ρ = Lmρ.

Como 0 ≤ L < 1, fijado ε > 0, existe un m0 ≥ 1, dependiente de ε, tal que 0 ≤ Lmρ ≤ εpara todo m ≥ m0, y en consecuencia, por la estimacion anterior,

|xm+p − xm| ≤ ε para todo m ≥ m0, p ≥ 0,

es decir, xk es de Cauchy.Por tanto, existe lım

k→∞xk = α. Que el numero α es solucion de la (EPF ), es conse-

cuencia de que g es continua en el intervalo [x0 − ρ, x0 + ρ], y por tanto

α = lımk→∞

xk+1 = lımk→∞

g(xk) = g( lımk→∞

xk) = g(α).

Por otra parte,

|xk − α| = |g(xk−1)− g(α)| ≤ L|xk−1 − α| ≤ · · · ≤ Lk|x0 − α| ≤ Lkρ.

iii) La unicidad de solucion de la (EPF ) es consecuencia inmediata de la Proposi-cion 2.19. ⋄

Terminamos esta seccion con un resultado sobre orden de convergencia superior a unodel (MAS).

Page 19: Tema 2 M´etodos de resoluci´on de Ecuaciones no Linealesdepartamento.us.es/edan/php/asig/LICMAT/LMCN1/Tema2CN10809.pdf · Tema 2 M´etodos de resoluci´on de Ecuaciones no Lineales

Tema 2: Metodos de resolucion de Ecuaciones no Lineales. 39

Teorema 2.28 Sea g : [a, b] → R continua, y α ∈ (a, b) un punto tal que g(α) = α.Supongamos que existe un entorno (α− δ, α + δ) ⊂ (a, b), con δ > 0, tal que el (MAS) endicho entorno es localmente convergente hacia α, g ∈ Cm(α − δ, α + δ), con m ≥ 2, gm)

esta acotada en (α− δ, α + δ), y

g′(α) = · · · = gm−1)(α) = 0.

Entonces, el (MAS) tiene orden de convergencia a α al menos m.Si ademas gm)(x) 6= 0 para todo x ∈ (α − δ, α + δ), entonces para cualquier x0 ∈

(α− δ, α + δ), tal que x0 6= α, el (MAS) genera una sucesion xk tal que xk 6= α para todok ≥ 0, y xk → α con orden de convergencia m.

Demostracion.- Evidentemente,

g(xk)− g(α) =1

m!gm)(xk)(xk − α)m,

con xk un punto intermedio entre xk y α.Si denotamos C = sup

x∈(α−δ,α+δ)

|gm)(x)|, resulta evidente que

|xk+1 − α| ≤ C|xk − α|m,

y por tanto el (MAS) tiene orden de convergencia a α al menos m.Supongamos que ademas gm)(x) 6= 0 para todo x ∈ (α−δ, α+δ), y x0 ∈ (α−δ, α+δ),

es tal que x0 6= α. Razonando por induccion, supongamos que k ≥ 0 es tal que xk 6= α,en tal caso,

xk+1 − α = g(xk)− g(α) =1

m!gm)(xk)(xk − α)m 6= 0,

y por tanto tambien xk+1 6= α. Ademas,

|xk+1 − α||xk − α|m =

1

m!gm)(xk) →

1

m!gm)(α) 6= 0,

cuando k →∞, con lo que el orden de convergencia a α es m. ⋄

2.4. Metodos de segundo orden: metodo de Newton

y variantes

Como ya hemos dicho, dada una funcion f : [a, b] → R continua, la ecuacion

(EH) f(x) = 0,

Page 20: Tema 2 M´etodos de resoluci´on de Ecuaciones no Linealesdepartamento.us.es/edan/php/asig/LICMAT/LMCN1/Tema2CN10809.pdf · Tema 2 M´etodos de resoluci´on de Ecuaciones no Lineales

40 Calculo Numerico I.

puede escribirse de manera equivalente en la forma

(EPF )h x− h(x)f(x) = x,

siendo h : [a, b] → R cualquier funcion continua tal que h(x) 6= 0 para todo x ∈ [a, b].

La idea del metodo de Newton consiste en determinar h de tal modo que al aplicar el(MAS) a la ecuacion (EPF )h, resulte un metodo convergente de al menos segundo orden.Para ello, teniendo en cuenta el Teorema 2.28, parece natural pedir que si denotamosg(x) = x−h(x)f(x), y α es la solucion de (EH), se satisfaga g′(α) = 0, es decir, teniendoen cuenta que

g′(x) = 1− h′(x)f(x)− h(x)f ′(x), y f(α) = 0,

se ha de satisfacer

h(α)f ′(α) = 1,

de modo que, suponiendo f ′(x) 6= 0 en [a, b], basta tomar h(x) = 1/f ′(x), con lo que laecuacion (EPF )h se escribe

x− f(x)

f ′(x)= x, (4.25)

ecuacion para la que el (MAS) adopta la forma

(MN)

x0 ∈ [a, b] dado,

xk+1 = xk −f(xk)

f ′(xk), k ≥ 0.

El metodo iterativo (MN) recibe el nombre de metodo de Newton. Dicho metodotiene una interpretacion geometrica sencilla, que en realidad esta en el origen historicodel mismo. En efecto, en cada etapa k, el valor xk+1 corresponde a la abscisa del puntode corte con el eje OX de la recta tangente a la curva y = f(x) en el punto (xk, f(xk)).Esta interpretacion geometrica justifica metodo de Newton tambien reciba el nombre demetodo de la tangente.

Teorema 2.29 (de convergencia global del (MN)) Sea f ∈ C2([a, b]) tal que

i) f(a)f(b) < 0,

ii) f ′(x) 6= 0, para todo x ∈ [a, b],

iii) el signo de f ′′(x) es constante en [a, b] (es decir, o f ′′(x) ≥ 0 para todo x ∈ [a, b], of ′′(x) ≤ 0 para todo x ∈ [a, b]),

Page 21: Tema 2 M´etodos de resoluci´on de Ecuaciones no Linealesdepartamento.us.es/edan/php/asig/LICMAT/LMCN1/Tema2CN10809.pdf · Tema 2 M´etodos de resoluci´on de Ecuaciones no Lineales

Tema 2: Metodos de resolucion de Ecuaciones no Lineales. 41

iv) si c ∈ {a, b} es tal que |f ′(c)| = mın(|f ′(a)|, |f ′(b)|), entonces

|f(c)||f ′(c)| ≤ b− a.

Bajo estas condiciones, existe una y solo una solucion α ∈ (a, b) de (EH), para todopunto inicial x0 ∈ [a, b] el (MN) esta bien definido, y converge hacia α. Ademas laconvergencia es al menos de orden dos, y de hecho, si se denotan

m1 = mınx∈[a,b]

|f ′(x)|, y M2 = maxx∈[a,b]

|f ′′(x)|, (4.26)

se satisfacen

|xk+1 − α| ≤ M2

2m1

|xk − α|2, para todo k ≥ 0, (4.27)

|xk+1 − α| ≤ M2

2m1

|xk+1 − xk|2, para todo k ≥ 0. (4.28)

Demostracion.- La existencia y unicidad de α es consecuencia inmediata de las condi-ciones i) y ii). Para demostrar el resto del teorema, observemos que se pueden presentarcuatro situaciones:

a) f(a) < 0, f(b) > 0, y f ′′(x) ≤ 0 para todo x ∈ [a, b],

b) f(a) < 0, f(b) > 0, y f ′′(x) ≥ 0 para todo x ∈ [a, b],

c) f(a) > 0, f(b) < 0, y f ′′(x) ≤ 0 para todo x ∈ [a, b],

d) f(a) > 0, f(b) < 0, y f ′′(x) ≥ 0 para todo x ∈ [a, b].

Nosotros vamos a comprobar que el teorema se satisface en la situacion a), quedandocomo ejercicio el comprobar que los otros tres casos se pueden demostrar mediante razona-mientos analogos, o bien ser llevados al caso a) mediante cambios de variables adecuados(ver [3]).

Suponemos por tanto, a partir de ahora, que f(a) < 0, f(b) > 0, y f ′′(x) ≤ 0 paratodo x ∈ [a, b]. En tal caso, por ii), f ′(x) > 0 para todo x ∈ [a, b], y al ser f ′′(x) ≤ 0, f ′

es no creciente, con lo que en la hipotesis iv), c = b, y esta se traduce en

f(b)

f ′(b)≤ b− a. (4.29)

Denotemos

g(x) = x− f(x)

f ′(x).

Page 22: Tema 2 M´etodos de resoluci´on de Ecuaciones no Linealesdepartamento.us.es/edan/php/asig/LICMAT/LMCN1/Tema2CN10809.pdf · Tema 2 M´etodos de resoluci´on de Ecuaciones no Lineales

42 Calculo Numerico I.

Para ver que el (MN) esta bien definido, basta comprobar que g([a, b]) ⊂ [a, b]. Para ello,observemos que

g′(x) = 1− (f ′(x))2 − f(x)f ′′(x)

(f ′(x))2=

f(x)f ′′(x)

(f ′(x))2, para todo x ∈ [a, b],

y en consecuencia, como suponemos f ′′(x) ≤ 0 para todo x ∈ [a, b], tenemos

g′(x) ≥ 0, para todo x ∈ [a, α),

g′(x) ≤ 0, para todo x ∈ (α, b],

por tanto g es creciente en [a, α), y decreciente en (α, b], y por consiguiente, en α sealcanza el maximo de g en [a, b], es decir,

g(x) ≤ g(α) = α < b, para todo x ∈ [a, b]. (4.30)

Por otra parte, si x ∈ [a, α), entonces g(a) ≤ g(x), es decir,

a− f(a)

f ′(a)≤ g(x),

con lo que, como f(a) < 0 y f ′(a) > 0, tenemos

a < g(x), para todo x ∈ [a, α). (4.31)

De manera analoga, si x ∈ (α, b] entonces g(b) ≤ g(x), es decir,

g(x) ≥ b− f(b)

f ′(b),

con lo que, teniendo en cuenta (4.29), obtenemos

a ≤ g(x), para todo x ∈ (α, b]. (4.32)

Finalmente, es evidente que g(α) = α > a. Esta desigualdad, junto con (4.30), (4.31)y (4.32), demuestran que g([a, b]) ⊂ [a, b].

Para demostrar que (MN) es convergente a α cualquiera que sea el punto inicialx0 ∈ [a, b], observemos en primer lugar que si xk ∈ [a, α], entonces f(xk) ≤ 0 y f ′(xk) > 0,con lo que

xk+1 = xk −f(xk)

f ′(xk)≥ xk,

yxk+1 = g(xk) ≤ α,

Page 23: Tema 2 M´etodos de resoluci´on de Ecuaciones no Linealesdepartamento.us.es/edan/php/asig/LICMAT/LMCN1/Tema2CN10809.pdf · Tema 2 M´etodos de resoluci´on de Ecuaciones no Lineales

Tema 2: Metodos de resolucion de Ecuaciones no Lineales. 43

por ser α = g(α) el maximo de g en [a, b].Ası pues, procediendo por induccion, tenemos que si x0 ∈ [a, α], entonces la sucesion

xk satisfacexk ≤ xk+1 ≤ α, ∀ k ≥ 0,

y por tanto, existelımk→∞

xk := α ≤ α.

En tal caso, tomando lımites en la igualdad

xk+1 = xk −f(xk)

f ′(xk),

obtenemos

α = α− f(α)

f ′(α),

por tanto f(α) = 0, y en consecuencia α = α.Por otro lado, si x0 ∈ (α, b], entonces x1 = g(x0) ≤ α, y por tanto x1 ∈ [a, α], con lo

que, por lo anteriormente obtenido, obtenemos nuevamente que xk converge a α.Para demostrar (4.27), usando desarrollo de Taylor y que f(α) = 0, obtenemos que

xk+1 − α = xk − α− f(xk)

f ′(xk)=

=1

f ′(xk)[f ′(xk)(xk − α) + f(α)− f(xk)] =

f ′′(yk)

2f ′(xk)(α− xk)

2,

con yk un punto intermedio entre xk y α. De esta igualdad se deduce de manera inmediata(4.27).

Para obtener (4.28), observemos que

f(xk+1) = f(xk+1)− f(α) = f ′(xk+1)(xk+1 − α),

con xk+1 un punto intermedio entre xk+1 y α, con lo que

|xk+1 − α| ≤ |f(xk+1)|m1

. (4.33)

Por otra parte, hacemos el siguiente desarrollo de Taylor

f(xk+1) = f(xk) + f ′(xk)(xk+1 − xk) +1

2f ′′(ξk)(xk+1 − xk)

2,

con ξk un punto intermedio entre xk+1 y xk, y usamos que por (MN) se satisface que

f(xk) + f ′(xk)(xk+1 − xk) = 0.

Page 24: Tema 2 M´etodos de resoluci´on de Ecuaciones no Linealesdepartamento.us.es/edan/php/asig/LICMAT/LMCN1/Tema2CN10809.pdf · Tema 2 M´etodos de resoluci´on de Ecuaciones no Lineales

44 Calculo Numerico I.

Entonces, obtenemos

f(xk+1) =f ′′(ξk)

2(xk+1 − xk)

2,

y, por tanto,

|f(xk+1)| ≤M2

2(xk+1 − xk)

2,

con lo que, teniendo en cuenta (4.33), obtenemos (4.28). ⋄

Observaciones 2.30 a) La sucesion {xk}k≥1 que se construye con el (MN) en elteorema precedente, es monotona.

b) La desigualdad (4.27) permite obtener una estimacion a priori del error. En con-creto, de (4.27) se tiene

ek ≤M2

2m1

e2k−1 ≤

(M2

2m1

)1+2

e4k−2 ≤ . . .

(M2

2m1

)1+2+···+2k−1

e2k

0 ,

es decir,

ek ≤(

M2

2m1

)2k−1

e2k

0 , para todo k ≥ 0. (4.34)

c) La estimacion (4.28) justifica el uso de un test de parada del tipo |xk+1 − xk| ≤ ε.

d) La convergencia del (MN), y la convergencia al menos superlineal, tambien se tienensi f ∈ C1([a, b]), se satisfacen i), ii), iv), y

iii’) f ′ es monotona en [a, b].

e) El Teorema 2.29 es aplicable a toda funcion de clase C2 y monotona, cuya raız nocoincida con un punto de inflexion. La condicion iv) limita el tamano del intervaloa considerar.

El resultado siguiente elimina la restriccion sobre el tamano del intervalo, fijando acambio el punto por donde hay que comenzar a iterar para que (MN) converja a lasolucion del problema.

Corolario 2.31 (Regla de Fourier) Sea f ∈ C2([a, b]), y supongamos que se satisfacenlas hipotesis i), ii) y iii) del Teorema 2.29. Ademas, supongamos que f(a)f ′′(a) > 0,y tomemos x0 = a, o supongamos que f(b)f ′′(b) > 0, y en tal caso tomemos x0 = b.Entonces, en cualquiera de los dos casos, el algoritmo (MN) es convergente hacia α deforma monotona.

Page 25: Tema 2 M´etodos de resoluci´on de Ecuaciones no Linealesdepartamento.us.es/edan/php/asig/LICMAT/LMCN1/Tema2CN10809.pdf · Tema 2 M´etodos de resoluci´on de Ecuaciones no Lineales

Tema 2: Metodos de resolucion de Ecuaciones no Lineales. 45

Demostracion.- Consideraremos el caso en que x0 = a, con f(a) > 0, y por tantof ′′(a) > 0, y f ′′(x) ≥ 0, con f ′(x) < 0, para todo x ∈ [a, b], siendo analogos los demascasos.

En este caso, la funcion g(x) = x − f(x)/f ′(x) considerada en la demostracion delTeorema 2.29 satisface

g′(x) =f(x)f ′′(x)

(f ′(x))2⇒

g′(x) ≥ 0 si x ∈ [a, α),

g′(x) ≤ 0 si x ∈ (α, b].

Ası pues, g es creciente en [a, α), y decreciente en . Por tanto,

x0 = a < α ⇒ x1 = g(x0) ≤ g(α) = α,

y por induccion,xk ≤ α ⇒ xk+1 = g(xk) ≤ g(α) = α,

es decir,xk ≤ α, para todo k ≥ 0. (4.35)

Como consecuencia de (4.35),

xk+1 = xk −f(xk)

f ′(xk)≥ xk, para todo k ≥ 0,

y por tanto, la sucesion {xk}k≥1 es creciente y acotada por α, por lo que existe lımk→∞

xk =

α ≤ α. Para probar que α = α, se razona como en el Teorema 2.29. ⋄Terminamos el Tema con un resultado de convergencia local para el metodo de Newton.

Teorema 2.32 Sean (a, b) ⊂ R un intervalo abierto, f : (a, b) → R una funcion dada, yα ∈ (a, b) un punto tal que f(α) = 0. Para cada ρ > 0, denotemos Iρ = [α− ρ, α + ρ]. Enestas condiciones se satisfacen:,

a) Si f ∈ C1(a, b) y f ′(α) 6= 0, entonces existe un ρ > 0 tal que Iρ ⊂ (a, b), y el (MN),tomando x0 ∈ Iρ, converge a α, con convergencia al menos superlineal.

b) Si bajo las condiciones de a), se satisface que existe una constante L > 0 tal que

|f ′(x)− f ′(α)| ≤ L|x− α|, para todo x ∈ Iρ, (4.36)

entonces la convergencia del (MN) a α partiendo de x0 ∈ Iρ, es al menos cuadratica.

c) Si bajo las condiciones de a), se satisface que f ∈ C2(Iρ), entonces la sucesion{xk}k≥1 construida por el (MN) partiendo de un punto x0 ∈ Iρ, satisface

lımk→∞

|xk+1 − α||xk − α|2 =

|f ′′(α)|2|f ′(α)| , (4.37)

y por consiguiente, si f ′′(α) 6= 0, entonces la convergencia a α es cuadratica, y sif ′′(α) = 0, entonces la convergencia a α es supercuadratica.

Page 26: Tema 2 M´etodos de resoluci´on de Ecuaciones no Linealesdepartamento.us.es/edan/php/asig/LICMAT/LMCN1/Tema2CN10809.pdf · Tema 2 M´etodos de resoluci´on de Ecuaciones no Lineales

46 Calculo Numerico I.

Demostracion.- Antes de proceder a la demostracion, observemos que bajo las condi-ciones impuestas sobre f , para la funcion g(x) = x− f(x)/f ′(x) resultante solo tenemosgarantizado que es continua, y por tanto no podemos aplicarle el Teorema 2.28.

a) Supongamos que f ∈ C1(a, b) y f ′(α) 6= 0.En primer lugar, evidentemente existe un δ1 > 0 tal que Iδ1 ⊂ (a, b), y f ′(x) 6= 0 para

todo x ∈ Iδ1 . Consideremos la funcion

g(x) = x− f(x)

f ′(x), x ∈ Iδ1 ,

y denotemosµ = mın

x∈Iδ1

|f ′(x)|.

Demostremos en primer lugar que existe un 0 < ρ ≤ δ1 tal que

|g(x)− g(α)| ≤ 1

2|x− α|, para todo x ∈ Iρ. (4.38)

Para todo x ∈ Iδ1 se satisface

g(x)− g(α) = g(x)− α = x− α− f(x)

f ′(x)=

1

f ′(x)[f ′(x)(x− α)− f(x)]

=1

f ′(x)[f ′(x)(x− α)− (f(x)− f(α))] =

1

f ′(x)[f ′(x)− f ′(y)] (x− α),

con y ∈ Iδ1 un punto comprendido entre x y α. En consecuencia,

|g(x)− g(α)| = |f ′(x)− f ′(y)||f ′(x)| |x− α| ≤ |f

′(x)− f ′(y)|µ

|x− α|. (4.39)

Ahora bien, como f ′ es uniformemente continua en Iδ1 , existe un 0 < δ ≤ δ1 tal que

|f ′(x)− f ′(x)| ≤ µ

2, para todo x, x ∈ Iδ1 , tales que |x− x| ≤ δ,

y por tanto, tomando ρ = δ, por (4.39) obtendremos (4.38).Sea x0 ∈ Iρ, fijado, y denotemos xk+1 = g(xk). Observemos en primer lugar que si

xk ∈ Iρ, entonces

|xk+1 − α| = |g(xk)− g(α)| ≤ 1

2|xk − α| ≤ ρ,

y por consiguiente la sucesion {xk}k≥0 esta contenida en el intervalo Iρ. Para comprobarque dicha sucesion converge a α, basta observar que por la desigualdad anterior,

0 ≤ |xk+1 − α| ≤ 1

2|xk − α| ≤ 1

22|xk−1 − α| ≤ · · · ≤ 1

2k|x0 − α| → 0, cuando k →∞.

Page 27: Tema 2 M´etodos de resoluci´on de Ecuaciones no Linealesdepartamento.us.es/edan/php/asig/LICMAT/LMCN1/Tema2CN10809.pdf · Tema 2 M´etodos de resoluci´on de Ecuaciones no Lineales

Tema 2: Metodos de resolucion de Ecuaciones no Lineales. 47

Finalmente, por (4.39),

|xk+1 − α| = |g(xk)− g(α)| ≤ |f′(xk)− f ′(yk)|

µ|xk − α|, (4.40)

para todo k ≥ 0, con yk un punto intermedio entre xk y α, y en consecuencia, si xk 6= α,

|xk+1 − α||xk − α| ≤

|f ′(xk)− f ′(yk)|µ

→ 0, cuando k →∞,

con lo que la convergencia de xk a α es superlineal.

b) Si bajo las condiciones de a), se satisface ademas (4.36), entonces, por (4.40),

|xk+1 − α| ≤ |f′(xk)− f ′(yk)|

µ|xk − α|

≤ 1

µ(|f ′(xk)− f ′(α)|+ |f ′(α)− f ′(yk)|)|xk − α|

≤ 1

µ(L|xk − α|+ L|yk − α|)|xk − α|

≤ 2L

µ|xk − α|2, para todo k ≥ 0,

con lo que la convergencia de xk a α es de orden 2 al menos.

c) Si bajo las condiciones de a), se satisface ademas que f ∈ C2(Iρ), entonces, por laformula de Taylor,

xk+1 − α =1

f ′(xk)[f ′(xk)(xk − α)− (f(xk)− f(α))] =

f ′′(ξk)

2f ′(xk)(xk − α)2,

con ξk un punto intermedio entre xk y α, de donde se obtiene de manera inmediata (4.37).⋄

Como variantes del metodo de Newton citemos el metodo de la secante y el metodode la regula falsi.

El metodo de la secante es, a grandes rasgos, como el metodo de Newton pero tomandola recta secante como aproximacion de la recta tangente. En este metodo de nuevo seconstruye una sucesion de numeros {xn} que converja hacia la raız buscada; para ello, separte de dos valores x0 y x1 y se traza la recta secante a la curva y = f(x) por los puntos(x0, f(x0)) y (x1, f(x1)), tomandose x2 como la abscisa del punto de corte de esta rectacon el eje OX. El proceso continua construyendo x3 a partir de x1 y x2. De esta manerase obtiene

xk+1 = xk − f(xk)xk − xk−1

f(xk)− f(xk−1), ∀k ≥ 2.

Page 28: Tema 2 M´etodos de resoluci´on de Ecuaciones no Linealesdepartamento.us.es/edan/php/asig/LICMAT/LMCN1/Tema2CN10809.pdf · Tema 2 M´etodos de resoluci´on de Ecuaciones no Lineales

48 Calculo Numerico I.

Respecto de la convergencia solo comentamos que no esta siempre asegurada, perocuando se da es bastante rapida.

Una variante del metodo de la secante es el metodo de la regula falsi: se parte de losvalores x0 y x1 de forma que f(x0)f(x1) < 0 y se encuentra x2 por el metodo de la secante.Para el calculo de x3 se utilizaran x1 y x2 si f(x1)f(x2) < 0; en caso contrario, se usaranx0 y x2 puesto que entonces f(x0)f(x2) < 0 (en este aspecto el metodo recuerda al debiseccion).

Este metodo es mas lento que el de la secante pero tiene la ventaja que siempre esconvergente.

Page 29: Tema 2 M´etodos de resoluci´on de Ecuaciones no Linealesdepartamento.us.es/edan/php/asig/LICMAT/LMCN1/Tema2CN10809.pdf · Tema 2 M´etodos de resoluci´on de Ecuaciones no Lineales

Bibliografıa

[1] A. Aubanell, A. Benseny & A. Delshams, Utiles basicos de Calculo Numerico, Labor,Barcelona 1993.

[2] F. Garcıa & A. Nevot, Metodos Numericos, Universidad Pontificia de Comillas,Madrid, 1997.

[3] P. Henrici: Elementos de Analisis Numerico, John Wiley and Sons-Ed. Trillas, Mexi-co, 1972.

[4] J. A. Infante y J. M. Rey, Metodos Numericos: Teorıa, problemas y practicas conMATLAB , Ediciones Piramide, Madrid, 1999.

Como bibliografıa complementaria se pueden consultar:

[5] K.E. Atkinson, An introduction to Numerical Analysis, Wiley, New York 1978.

[6] R.L. Burden & J.D. Faires, Metodos Numerico, International Thomson EditoresSpain Paraninfo, Madrid, 2004.

[7] D. Kincaid & W. Cheney, Analisis Numerico, Addison-Wesley Iberoamericana, Wilm-ington, 1994.

49