Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using...

498
“Basisboek Analyse” Not another ε-book Dutch one-page intro on y = f (x) on second page followed by new cross-referencing Chapter 1 on fundamentals in real context: Archimedes, Babylon, Newton, Cardano, zero’s not roots then another Dutch page on the whole book before yet another few Dutch pages on recent stuff: Chapters 7, 8 and behind the index Table of contents before the first Dutch Chapter Old fundamenten hoofdstuk moved to very end, Hoofdstuk 27

Transcript of Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using...

Page 1: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

“Basisboek Analyse”

Not another ε-book

Dutch one-page intro on y = f(x) on second page

followed by new cross-referencing Chapter 1 on fundamentals in real context:

Archimedes, Babylon, Newton, Cardano, zero’s not roots

then another Dutch page on the whole book before

yet another few Dutch pages on recent stuff:

Chapters 7, 8 and behind the index

Table of contents before the first Dutch Chapter

Old fundamenten hoofdstuk moved to very end, Hoofdstuk 27

Page 2: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

“Basisboek Analyse”

Not another ε-book

JH

Het vak analyse omvat de differentiaal- en integraalrekening, onmisbaar inde exacte wetenschappen. Die rekening kan niet zonder de middelwaarde-stelling (Sectie 4.1), die weer niet kan zonder de uitspraak dat een continuefunctie f : [a, b] → IR een maximum en een minimum heeft (Opgave 2.35).Daartoe volstaan Stelling 2.30 als definitie van continuiteit met behulp vanconvergente rijen en Stelling 3.1 over het bestaan van convergente deelrijenvan begrensde rijen als axioma voor de verzameling IR van de reele getallen.

De elementaire opgaven in Sectie 3.2 zijn vervolgens meer dan voldoendeom Hoofdstuk 3 de verhaallijn van integraalrekening in Hoofdstuk 2 naar dif-ferentiaalrekening in Hoofdstuk 4 niet te laten onderbreken. Via het bestaanvan monotone deelrijen in Stelling 3.14 kan dit wat ongebruikelijke axiomagerelateerd worden aan de discussie over kleinste bovengrenzen in Sectie 27.2aan de hand van de voorbeelden in Hoofdstuk 27 voor het speelkwartier be-gint in Sectie 27.1. Zo’n discussie zou iedere cursus Analyse vooraf moetengaan.

Cauchy zal het misschien niet leuk vinden maar continuiteit en convergen-tie zijn zo hulpmiddelen van maar geen doel op zich in een cursus differentiaal-en integraalrekening voor exacte wetenschappers in spe, en passen als on-derwerp veel beter in een module voor wiskundestudenten over metrischeruimten waarin IR als prominent voorbeeld kan figureren.

Sectie 12.3, een oud Leids dictaatje, is zo’n module, waarin aan het eindook het voor de maximale doelstelling daar nog niet benodigde begrip eindigedeeloverdekkingen van open overdekkingen wordt behandeld. Dat begrip ispas nodig1 voor de partities met fading2 functions in de analyse op manifolds,zie Sectie 8.15 in het betreffende nieuwe Chapter 8 dat voorafgaand aan deinhoudsopgave van dit boek apart wordt besproken.

I have added another chapter in English to discuss some historical context,Hoofdstuk 1, which you may read instead of what is now Hoofdstuk 27 overdie zogenaamde fundamenten. The table of contents will come after thatchapter and the discussion of Chapter 8.

Oegstgeest, Amsterdam1 Zie ook het ruwe materiaal in Hoofdstuk 15 dat aan maattheorie vooraf kan gaan.2 https://www.youtube.com/watch?v=y8OrKLH8GBY

Page 3: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

The Netherlands

c© 2016 tekst Joost Hulshofc© 2016 illustratie Ruud Hulshof

Fotografie omslag: nog onbekendVormgeving omslag: nog onbekend

ISBNNUR

All rights reserved. No part of this book may be reproduced, stored in aretrieval system, or transmitted, in any form or by any means, electronic,mechanical, photocopying, recording, or otherwise, without the prior writtenconsent of the publisher.

De auteursinkomsten3 uit dit boek komen ten goede aan de “geluksmachine”:

http://orchestra18c.com

3 Als het ervan komt...

Page 4: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

1 Archimedes, algebra and all that really

Forget about the math you had if you can. Some 23 centuries ago Archimedesknew that

1 + 4 + 9 + 16 + 25 + 36 + 49 + 64 + 81 + 100 =1000

3+

100

2+

10

6.

On the left you see a calculation with positive integers, how’s that for a start?On the right you see a sum of positive fractions, that you should think of asrationals, because they involve ratio’s, the ratio being that dividing positiveintegers we encounter noninteger positive numbers that we often think of asratio’s.

The positive integers are the numbers 1, 2, 3, 4, etc, aka the naturalnumbers, which together make up what mathematicians call the set IN of allnatural numbers. We say that 1 belongs to IN, notation 1 ∈ IN, and with1 ∈ IN also 2 = 1 + 1 ∈ IN, 3 = 2 + 1 ∈ IN, 4 = 3 + 1 ∈ IN, and so on. Thisis not a course about the undeniable joys of set theory, so we simply write

IN = 1, 2, 3, 4, . . . ,

a notation that is of course dubious to some1 of us mathematicians.The sum of the first 10 squared natural numbers is another natural num-

ber, 385, the product of the primes 5, 7 and 11. I take it for granted thatevery natural number is a product of primes. This is a course about analysisand not about number theory.

A modern notation for the curious sum above is

(C10)10∑k=1

k2 =103

3+

102

2+

10

6,

in which k is an index that runs from 1 to 10. It’s a dummy index, you canreplace it by any other letter in any alphabet you like. I’ve labelled this sumby (C10), the C is for curious, and the 10 is obvious.

On the right you recognise 10 again, one of your favorite natural numbers:you should learn to count to 10 as soon you can:

1, 2, 3, 4, 5, 6, 7, 8, 9, 10!

Be careful with ! because 10-factorial is defined by and written as

10! = 1× 2× 3× 4× 5× 6× 7× 8× 9× 10 =10∏k=1

k = 3628800,

1https://www.youtube.com/watch?v=4bez05AT1u4

4

Page 5: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

the product of the first 10 natural numbers, which happens to be 6 weeks inseconds, whereas 6 weeks in days is 42, the answer to life, the universe andeverything really, for which no nice algebraic formula exists.

The sum of the first 10 natural numbers is of course

10∑k=1

k =102

2+

10

2=

1

2× 11× 10,

the young Gauss knew that, but Archimedes was (perhaps not) the first,replacing 10 by any other natural number 11, 12, 42, 1010, 101010

or whatever2,to consider such sums for arbitrarily large n. Long before Gauss was youngArchimedes knew that3

n∑k=1

k =n2

2+n

2,

n∑k=1

k2 =n3

3+n2

2+n

6,

n∑k=1

k3 =n4

4+n3

2+n2

4,

lovely sums from which a pattern emerges.The one in the middle is

(Cn)n∑k=1

k2 =n3

3+n2

2+n

6.

You may prove (Cn) for every natural number by first guessing4 it and thenshowing that starting with n = 1 and (C1) being a statement that is triviallytrue, it holds that

(Cn) =⇒ (Cn+1),

by evaluatingn+1∑k=1

k2 =n3

3+n2

2+n

6+ (n+ 1)2

and verifiying you then get what you have guessed5, since it happens be thecase that

n3

3+n2

2+n

6+ (n+ 1)2 =

(n+ 1)3

3+

(n+ 1)2

2+n+ 1

6.

This proves a merry little but supernatural theorem6: For every naturalnumber (Cn) holds, as a rearrangement of larger and larger sums of squarednatural numbers into simple 3-term sums of supernatural numbers.

2 Have a look at Section 5.4 when you have some time.3 I’m using search and replace to substitute 10 = n in our modern notation.4 Guess what, you should learn how to guess.5 Or discovered via tables of squares, cubes and differences, see Opgave 2.5.6 This theorem predates set theory by at least two millennia.

5

Page 6: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Note that k is still the dummy, but n is a variable natural number thatyou can take as large as you want, because a number bounding all the naturalnumbers is simply not real. In particular the sums get larger with n, not asfast as n! of course, but still.

However, dividing the sum of the first n squares by n-cubed, you get

1

n3

n∑k=1

k2 =1

3+

1

2n+

1

6n2=

1

n

n∑k=1

(k

n

)2

,

in which 2n = 2 × n, 6n = 6 × n2, as we do away with the symbol ×in multiplications with variable numbers7 as soon as we leave elementaryschool. Now you see that for n larger and larger, you get a sum that is closerand closer to 1

3, a number well known to the Egyptians in the days of the

pyramids8 that relates to the context presented next9.

1.1 Area in the Cartesian plane

Draw yourself the nice Cartesian xy-plane10 that Archimedes never had, inwhich you make a big sketch by hand of the parabola consisting of all pointswith equal distances to the point (0, 1

4) and to the line defined by y = −1

4.

This parabola is in fact the curve defined by y = x2, and you may enjoyverifying that in particular (1, 1) fits its geometric description11, before yougo on.

Now evaluate y = x2 with

0 =0

10,

1

10,

2

10,

3

10,

4

10,

5

10,

6

10,

7

10,

8

10,

9

10,10

10= 1.

These particular x-values give you points in the unit square S, the squareconsisting of all points (x, y) with 0 ≤ x ≤ 1 and 0 ≤ y ≤ 1. Look at theregion A2 in S bounded by y = 0, x = 1 and y = x2, and let us agree thatthe area of S is equal to 1. Can you convince yourself that consequently thearea of A2 is less than

1

1000+

4

1000+

9

1000+

16

1000+

25

1000+

36

1000+

49

1000+

64

1000+

81

1000+

100

1000,

but more than

1

1000+

4

1000+

9

1000+

16

1000+

25

1000+

36

1000+

49

1000+

64

1000+

81

1000?

7 Denoted by letters.8 Pyramids later found themselves a crappy application as learning gadgets.9 I actually don’t know if Archimedes ever considered this particular context.

10 You were likely not able to forget about that plane anyhow, let alone about x and y.11 Since 32 + 42 = 52.

6

Page 7: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

To do so you have to relate every term in the sums above to the area ofa rectangle12 with 4 corner points, one of which is the point on the curve.There are two obvious ways to do so, providing you with the above (upperand lower) sums13 for the area of A2.

If this worked, you can also convince yourself, denoting the area of A2 by|A2| from now on, that

|A2| <1

n3

n∑k=1

k2 =1

3+

1

2n+

1

6n2<

1

3+

1

n

for every natural number n, and likewise that

|A2| >1

n3

n−1∑k=1

k2 =1

3+

1

2n+

1

6n2− 1

n=

1

3− 1

2n+

1

6n2>

1

3− 1

n.

Combining it follows that

1

3− 1

n< |A2| <

1

3+

1

n,

whence

− 1

n< |A2| −

1

3<

1

nfor every natural number n, and that will imply that

|A2| −1

3= 0 whence |A2| =

1

3,

won’t it?Think about it, but think14 about pyramids first, and see how the layered

structures of the voluminous worn off pyramids of Cheops and Chefren consistof squares that were bound to lead to sums Riemann would have liked.

1.1.1 Really? What’s the ratio behind all this?

A number a with

− 1

n< a <

1

nfor every natural number simply can’t be different from 0, can it? Otherwiseit is either positive, in which case

0 < a <1

n,

12 Parallel to the axes.13 Riemann sums in fact.14 Don’t think of activities.

7

Page 8: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

or negative, in which case

0 < −a < 1

n,

and positive numbers with a < 1n

for every natural number n cannot be real,because that would imply that

n < M =1

a

for all natural numbers n, something you thought unreal probably15. No realnumber is an upperbound for all the positive numbers.

How’s that? Nowadays mathematicians16 think of the set

IN = 1, 2, 3, 4, . . .

as a subset of the set IR+, whose elements are all the positive real numbers,whatever real may be. The set IR+ in turn is a subset of the set IR ofall real numbers. This set can be introduced in many ways17, but it mostcertainly contains IN and all the numbers obtained from IN via subtractionand division, such as 0 = 1 − 1, −1 = 1 − 2, the sometimes forbidden18

number 13

as 1 divided by 3, and so on.These numbers derived from the natural numbers by algebra are called

the rational numbers, and the set whose elements are all the rational numbersis denoted by IQ, which contains the set

IZ = . . . . ,−4,−3,−2,−1, 0, 1, 2, 3, 4, . . .

whose elements are all the integers, positive, negative, and the zero numberthat separates them. You may think of IZ as a bi-infinite sequence of markedpoints on a line with no endpoints, the other numbers in IQ lying in theintervals between.

1.1.2 Counting it?

It is easy to enumerate IQ. Just take a path in your Cartesian xy-planethat starts in (0, 1) and then passes through every point (x, y) with y ∈ INand 0 6= x ∈ IZ. Along this path x

yruns through the whole of IQ, with

multiple hits of course19, but skipping the fractions xy

with common factors

15 https://www.youtube.com/watch?v=V8l7ErLb-qM16 But who are they?17 Read all about it in Dutch: Chapter 27.18 In Dutch educational law.19 In view of 1

3 = 26 = 3

9 = · · · for instance.

8

Page 9: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

in numerator and denominator, every element of IQ occurs precisely once inan enumeration of fractions thus obtained. It is thereby clear that the set INis in a one to one correspondence with the set IQ.

You really should convince yourself that such a one to one correspondencebetween IN and the set of all points on the number line via an enumeration

x1, x2, x3, . . .

is unreal. Such an enumeration would allow you to completely cover thenumber line with intervals20

(x1 −1

4, x1 +

1

4),

(x2 −1

8, x1 +

1

8),

(x3 −1

16, x3 +

1

16),

(x4 −1

32, x4 +

1

32),

(x4 −1

64, x4 +

1

64),

(x4 −1

128, x4 +

1

3128),

(x4 −1

256, x4 +

1

256),

(x4 −1

512, x4 +

1

512),

et cetera, the total length of these intervals being

1

2+

1

4+

1

8+

1

16+

1

32+

1

64+

1

128+

1

256+ · · · ≤ 1,

an absurdity that we are not quite willing to accept21.

20 For numbers a < b we denote by (a, b) the set of all numbers x with a < x < b.21 A strict inequality < in this last estimate may be something you thought unreal.

9

Page 10: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

1.1.3 The square root of two?

In IQ we have the usual operations +,−×, / with the usual rules. You shouldemploy your knowledge of those natural numbers to prove that the magicnumber

√2 cannot belong to IQ. That is to say, IQ does not contain a

positive number r with r2 = 2. Every q ∈ IQ either has q2 > 2 or q2 < 2, andit is not so difficult to generate the increasing sequence of numbers

q1 = 1 < q2 = 1.4 < q3 = 1.41 < q4 = 1.414 < q5 = 1.4142 < q6 = 1.41421

< q7 = 1.414213 < q8 = 1.4142135 < q9 = 1.41421356 < · · · < 2,

2 being an upper bound because of the 1 in front of every decimal point ofevery single number in this sequence.

Every new digit in every next number in this sequence is chosen as largeas possible to have the square below 2. Of course the resulting sequence ofdigits can be only be generated by a machine that runs a suitable programmetill the very end of time, but still we can agree to say that the number r isdefined by putting all those digits in an never-ending expansion

r = 1.41421356 . . . ,

even if it is impossible to write all these damned digits down.Clearly the number r is then larger than all finitely represented expansions

in the increasing sequence q1 < q2 < q3 < . . . , and r is thus an upper boundbelow the crude upper bound 2. You should try to convince yourself thatthere is actually no lower upper bound than r, making r the lowest upperbound for the sequence.

1.1.4 Elementary school representations of real numbers

A proper definition of the multiplication of such numbers represented bynever-ending decimal expansions then must yield that

r2 = 2,

a possible convention being that 2 is represented as

2 = 1.9999999 · · · = 1 +9

10+

9

102+

9

103+ · · · ,

excluding expansions which only have finitely many nonzero digits. In par-ticular 1 ∈ IN should be considered as represented in IR by

1 = 0.9999999 . . . ,

10

Page 11: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

thereby having all real numbers represented by never-ending sequences22 ofdigits, with a decimal point that separates the integer part of the numberfrom its remainder23.

All this can be done, but is somewhat cumbersome24 in base 10. Binaryrepresentations with base 2 = 10 do a much beter job here. With

1 =1

2+

1

4+

1

8+

1

16+ · · ·

represented by the bits 1, 1, 1, 1, 1, 1 . . . , and a zero before the binary pointin

1 = 0.11111111 . . . ,

you may enjoy the details of the resulting construction of the real numbersand their arithmetic25.

1.1.5 More bounded increasing sequences

Anyhow, you can now consider bounded sequences

r1 < r2 < r3 < · · ·

of such numbers.With the proper definition of < it is not hard to then construct the lowest

possible upper bound of such a sequence as such a number. The existenceof such lowest upper bounds is a crucial property of the set IR, either viathe construction above, or by any other construction: the real numbers26

really have the property that every strictly increasing bounded sequence hasa lowest upper bound.

It is this property of the real numbers really then that proves27 to mathe-maticians that IN is not bounded by any real number, for that would implythe existence of a smallest S ∈ IR with n ≤ S for all n ∈ IN. But then S − 1

2

is not an upper bound whence n ∈ IN exists with n > S − 12

and thus thenumber n + 1 ∈ IN satisfies n + 1 > S + 1

2> S contradicting S being an

upper bound for IN, as you must have thought of as being unreal from thevery beginning28, since you’ve used the smallest upper bound property ever

22 Why can such representations not be enumerated? In Dutch: Section 3.5.23 If you like after division by 1.24 But quite amusing, see Section 27.1 on what might be called kolomcijferen in Dutch.25 https://www.youtube.com/watch?v=x9DejWMJoOA26 You may wish to reflect on how to state that there is only one set of real numbers.27 More in Dutch here: Section 27.2.28 Some progress report, is this the beginning or the end?

11

Page 12: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

since elementary school: did you not take it for granted that

0.333333333 . . .

defines a real number, which happens to be a rational equal to 13

really, thearea |A2| of the set A2 introduced above?

1.2 Integrals now!

Of course you’ve already been told that |A2| = 13, via

|A2| =∫ 1

0

x2 dx =[x3

3

]1

0=

1

3,

but that’s based on differential calculus, which did not exist in the daysof Archimedes. Summing up, based on the properties of the real numbers,including the Archimedian property that below every positive number thereexits a 1

nwith n ∈ IN, we have shown that∫

x∈[0,1]

x2 dx =

∫ 1

0

x2 dx =1

3,

if we define and compute the integral of x2 from 0 to 1 via lower and uppersums as above, with n arbitrarily large.

As for notation, using the values of x2 for

x ∈ [0, 1]n =kn

: k = 1, 2, . . . , n

and setting ∆nx =1

n,

the upper sums rewrite as

1

n

n∑k=1

(k

n

)2

=∑

x∈[0,1]n

x2 ∆nx,

not so different from the notation for the integral. It’s really just∫x∈[0,1]

x2 dx versus∑

x∈[0,1]n

x2 ∆nx,

the latter being a finite sum, the former having all subscripts n dropped, Σreplaced by the curly

∫, and ∆nx by dx.

An almost immediate consequence now is that it follows that∫ b

0

x2 dx =b3

3,

12

Page 13: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

by similar definition and computation, with all the sketches you may havedrawn copied with b replacing 1 on the x-axis and b2 replacing 1 on the y-axis, multiplying every term in the lower and upper sums by b3. Moreover,the pattern you saw emerging replacing the exponent 2 by 3, 4, 5, . . . , canand should be proved outside the domain of analysis.

It thus follows that ∫ b

0

xn dx =bn+1

n+ 1

for all b ∈ IR+ and n ∈ IN. Likewise for any 0 ≤ a < b, a similar definitionleads29 to ∫ b

a

xn dx =bn+1

n+ 1− an+1

n+ 1,

and such identities and the inequalities that prove them combine. Zum Bei-spiel, with

pn(x) = 1 + x+ x2 + · · ·+ xn and Pn(x) = x+x2

2+ · · ·+ xn+1

n+ 1,

it holds that ∫ 1

0

pn(x) dx = Pn(1)− Pn(0),

i.e. ∫ 1

0

(1 + x+ x2 + · · ·+ xn

)dx = 1 +

1

2+ · · ·+ 1

n+ 1.

It really all adds up, also if we first multiply by positive scalars. With

En(x) = 1 + x+x2

2+

x3

2× 3+ · · ·+ xn

n!

for instance we have30∫ 1

0

En(x) dx = En+1(1)− En+1(0),

i.e. ∫ 1

0

(1 + x+

x2

2+

x3

2× 3+ · · ·+ xn

n!

)dx = 1 +

1

2!+ · · ·+ 1

(n+ 1)!,

and the question about what will hold for

p(x) = 1+x+x2+· · ·+, Pn(x) = x+x2

2+· · · , E(x) = 1+x+

x2

2!+x3

3!+· · ·

29 Subtraction may also convince you.30 Pay attention to the constant 1 in En+1(1) and En+1(0).

13

Page 14: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

is immediate. Does

1 +1

2+

1

3+

1

4+

1

5+ · · ·

define a positive number for instance?Never-ending summings and integrals, we can define and compute them

guided by what Archimedes knew long before differential calculus was inven-ted, with a complete theory for expressions of the form

f(x) = a0 + a1x+ a2x2 + a3x

3 + a4x4 + · · · ,

in which x is a positive real variable and a0, a1, a2, a2 real nonnegative coeffi-cients31. Of course we also consider negative x and negative a0, a1, a2, a2, . . . ,not much of a worry, but calling for some care32. All this can be done beforeeven worrying about the natural domain and properties of the map

f →∫ b

a

f(x)dx

as defined using the sums of Riemann. The worries are minor, starting inSection 2.1 with first Stelling 2.20 and then Stelling 2.23, based on the naturalconcept of uniform continuity in Defintie 2.22.

1.3 Back to Babylonian times: YBC7289

So what about differential calculus? You may have heard of Newton andNewton’s method for a calculation of algebraic numbers like

√2 which is

more efficient then the generation of digits by trial and error. The firstrecorded attempt to find a positive r with r2 = 2 that I know of can befound on YBC7289, dating back to some 40 centuries ago, using calculationscarried out in base 60, long before the distinction between IQ and IR as wejust discussed it.

These calculations are now believed to employ the approximation

√1 + x ≈ 1 +

x

2

for x close to 0. The right hand side is an expression which you may relate tothe line defined by y = 1 + x

2in your Cartesian plane, and y =

√1 + x with

x+ 1 ≥ 0 defines half of a parabola via 1 + x = y2. You should relate this to

31 See Section 5.9.32 Read Section 27.3 in Dutch to get a feel.

14

Page 15: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

your knowledge33 of tangent lines and the differential calculus in highschool,12

being the value of F ′(0) if

F (x) =√

1 + x.

Replacing x by y − 1 the approximation is equivalent to

g(y) =√y ≈ 1 +

1

2(y − 1),

which relates to g′(1) = 12.

Apparently this idea of linear approximations was used in the Babyloniancalculations to find

√2, which in our modern language would look like

√2 =√r2 + 2− r2 = r

√1 +

2− r2

r2≈ r

(1 +

2− r2

2r2

)=r

2+

1

r,

in which the above approximation of F (x) =√

1 + x is used as an interme-diate step, with

x =2− r2

r2

to be precise. In terms of g the approximation is strikingly equivalent to

√2 = g(2) ≈ g(r2) +

1

2r(2− r2),

in which the coefficient 12r

is the value of the derivative g′(y) in y = r2. Thus

the line tangent in y = r2 to the graph x = g(y) is used to approximate√

2.In terms of f(x) = x2 this is equivalent to intersecting the line defined by

y = r2 + 2r(x− r)

with the line defined by y = 2, and solving voor x to find a new and betterapproximation for

√2, starting from a previous x = r. You may recognise

this as Newton’s method. Starting with r = 1 the approximation 32

voor√

2is obtained (which is not that bad really). Redoing the approximation withr = 3

2then gives 17

12, much better, and r = 17

12in turn gives

17

24+

12

17=

289 + 288

24× 17=

577

408= 1 +

24

60+

51

602+

10

603+ · · · ,

the Babylonian approximation on YBC7289, in which the 10 will return ifyou continue the expansion in base 60.

33 You did not forget all of your differential calculus, did you?

15

Page 16: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Iterating the input-output relation34

r → r

2+

1

r,

as was also done by Heron in Alexandria some 22 centuries later, one obtains

3

2>

17

12>

577

408>

665857

470832>

886731088897

627013566048> · · · > 1

and thus an enumerated set of decreasing numbers which is bounded frombelow by 1. The largest such lower bound is of course

√2, as you may

want35 to know for sure. Again the existence of such a largest lower boundL is a property of the set IR, either by assumption, or by construction, and aproof that L2 = 2 is easily concocted. See e.g. my Dutch book with RonaldMeester on fingers and math.

The limits of difference quotients you have seen in highschool will be avoi-ded in this material, as everything you have seen in the calculus of derivativesis to be based on linear approximations if we want to develop an underlyingtheory that will allow a generalisation to multivariate calculus. All this maystart from elementary examples like

x2 = 1 + x2 − 1 = 1 + (x+ 1)(x− 1) = 1 + 2(x− 1) + (x− 1)2,

to obtain y = 1 + 2(x − 1) = 2x − 1 as the formula for the line tangent in(1, 1) to the parabola given by y = x2. Babylonian math really. And again,if you know how to deal with x2 you know how to deal with

f(x) = a0 + a1x+ a2x2 + a3x

3 + a4x4 + · · · ,

really, it’s not the big deal you may have thought it was, as a little algebrawill help to clarify.

1.4 Differential calculus founded in algebra

The formula

(BL7) x7 = a7+7a6(x−a)+(x5+2ax4+3a2x3+4a3x2+5a4x+6a5)(x−a)2

is a nice piece of easy but meaningful algebra that tells you a lot about hardanalyis. You can find it36 using long division to first write the differencequotient

x7 − a7

x− a34 You don’t actually need the considerations above to come up with this method...35 I would.36 By looking at this page.

16

Page 17: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

as

x7 − a7

x− a= x6 + ax5 + a2x4 + a3x3 + a4x2 + a5x+ a6 = 7a6 + (· · · )(x− a),

and what’s on the dots you find from another long division37. It gives you thelong term in the algebra formula which I labeled (BL7), BL for Babylonianlinear approximation, the first two terms on the right hand side being alinear approximation of x7 around x = a, just like we saw in the context ofYBC7289 above.

To fix ideas restrict the attention to the fixed a and variable x lying in theinterval [−1, 1] which consists of all numbers between −1 and 1, including−1 and 1. The error in the linear approximation is then bounded by

(1 + 2 + 3 + 4 + 5 + 6)(x− a)2,

that is to say, writing

x7 = a7 + 7a6(x− a) +R7(x, a),

we have

|R7(x, a)| ≤ 7× 6

2(x− a)2

as young Gauss would write is. No other linear approximation comes withsuch an estimate, so therefore

a7 + 7a6(x− a)

is the only linear approximation to be called THE linear approximation of x7

around x = a. This then is the algebraic foundation of differential calculus,and again it all adds up in Section 5.2. There are no limits it would seem38.

1.5 The mystery of the tangent

So, if we believe the historians, the only thing about

f(x) =√

1 + x ≈ 1 +x

2

not going back to Babylonian times is the notation really. Neither does theconcept of a tangent line I guess. We say that

y = 1 +x

237 Which one?38 Indeed: Sectie 5.2, though under Opgave 5.14 the first ε and δ appear.

17

Page 18: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

defines a line tangent tangent in (x, y) = (0, 1) to the graph of f , whichshould be the same as saying that

x = 2y − 2

defines a line tangent to the graph of g in (y, x) = (1, 0) as in

x = g(y) = y2 − 1.

Are the statements about tangent lines symmetric in x and y? Section6.7 adresses this question in the context of one-to-one order preserving cor-respondences

y = f(x) and x = g(y)

between x- and y-intervals, first in the case that f(0) = 0 and x = y definesa line tangent to the graph of f in (0, 0). Enter the epsilons again.

1.6 So what about continuity?

Good question. It messes up analysis, that’s for sure, but the main theoremof algebra cannot do without it. Why? Because most algebraic equationshave solutions we cannot find really, as we first discuss next.

1.6.1 Quadratics

You may be inclined to think of the quadratic equation

(I) 1 + x2 = 0

as an example. Solutions of (I) are unreal, imagine a real number thatsquares to −1! Square roots of negative numbers don’t exist in IR. Yourgeneral quadratic equation

x2 + px+ q = 0

with real coefficients p, q is not always solvable by completing the square via(x+

p

2

)2

=p2

4− q,

because if the right hand side is negative you’re done.The solution formula

x = −p2

+

√p2

4− q

18

Page 19: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

does make sense ifp2

4> q,

although you should not forget that

x = −p2−√p2

4− q

defines another solution then, making for two solutions39. The borderlinecase is the equation

x2 + px+p2

4= 0,

which only has x = −p2

as a solution, counted with multiplicity 2 as mathe-maticians often do.

1.6.2 Cubics

No continuity arguments were needed for the quadratic equation. The storyis the same for not quite your general cubic equation

x3 + px+ q = 0,

which was solved in the days of Cardano by putting

x = u+ v with 3uv + p = 0,

leading to a quadratic equation for u3 solvable by completing the square. Thestudy of this method and the general solution of the cubic offers a feast40 initself that we leave for some other party to crash. It does unavoidably lead tothe consideration of squares of square roots of negative numbers so, it reallymust be done, imagine a square root of −1.

1.6.3 Imagine what?

Since no square root of −1 exists as a real number we imagine one andcall it i. The square of this imaginairy i equals −1, and so then does thesquare of −i if we stick by the usual rules for +,−,×, /. Combining with thereal numbers whose collective fundamental properties Archimedes basicallyalready understood we now find many complex numbers.

Here they all are:z = x+ iy = x+ yi

39 And no more, a little algebra theorem.40 The quartic is another feast, but then the party’s over, as Galois tragically found out.

19

Page 20: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

with x and y real. Every point in the Cartesian xy-plane defines a complexnumber, numbers we can add, substract and multiply as we like, simplifyingcomplicated expressions using the old rules combined with the new rule thati2 = −1, as in a little trick for division,

x+ iy

u+ iv=x+ iy

u+ iv

u− ivu− iv

=ux+ yv + i(uy − vx)

u2 + v2=ux+ yv

u2 + v2+ i

uy − vxu2 + v2

,

in which u2 + v2 appears.This Pythagorean sum is called the square of the absolute value of

w = u+ iv,

the complex number defined by the reals u and v, the absolute value of wbeing defined by

|w| = |u+ iv| =√u2 + v2, and likewise |z| = |x+ iy| =

√x2 + y2.

Note that|z| = 0 ⇐⇒ z = 0

generalises what you know for |x| and x. In fact, for any complex expressionp(z) with z an unknown complex number, the equation

p(z) = 0

is equivalent to solving|p(z)| = 0,

just like solving p(x) = 0 is equivalent to solving |p(x)| = 0 for real expressi-ons, with x a real unknown.

If p(z) is just p(x) with x replaced by z it gets interesting. The function

x→ |x2 + 1|

is positive for every real x, whereas

z → |z2+1| = |(x2−y2+1+2ixy| =√x2 + (y + 1)2

√x2 + (y − 1)2 = f(x, y)

is a realvalued function of z ∈ IC with two global zero minima, in z = i andz = −i, as you see immediately from the formula above, and these globalmimimisers are the roots of the equation

z2 + 1 = 0,

which solved by merely finding the roots as z = i and z = −i.

20

Page 21: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

1.6.4 Minimise it!

Let’s imagine41 that you could not find these roots42. Then you may look atthe formula for f(x, y) to see that for (x, y) on large circles centered in theorigin, f(x, y) is bounded from below by a positive number. The larger thecircle, the larger the lower bound. This should guarantee the existence of asmallest value m of f(x, y) in some (x0, y0), i.e.

f(x0, y0) ≤ f(x, y)

for alle (x, y) with x, y ∈ IR, equivalent to |z2 + 1| being minimal and equalto m in z0 = x0 + iy0.

Now substitute z = z0 + w. Then

|(z0 + w)2 + 1| = |1 + z20 + 2z0w + w2|

is minimal in w = 0. Can it happen that 1 + z20 6= 0? If so then

m = |1 + z20 | > 0,

and thus the complex number 1 + z20 corresponds to a point in the xy-plane

which, among all points corresponding to values of 1+z20 +2z0w+w2 varying

w, has minimal distance m to the origin.Suppose then that the coefficient of w is nonzero. In this example it

would mean that z0 6= 0, and all complex numbers w with

|w| = ε

2|z0|

for some ε > 0 then produce values of 2z0w. It’s a little exercise to show thatthese values have |2z0w| = ε, and that all complex numbers with absolutevalue equal to ε > 0 appear as such a product 2z0w.

It follows that for some such w the complex number 1 + z20 + 2z0w cor-

responds to a point with distance m− ε to the origin, while

|w2| = |w|2 =ε2

4|z0|2

then guarantees that the point corresponding to 1 + z20 + 2z0w + w2 has

distance to the origin at most

m− ε+ε2

4|z0|2< m

41 I know that’s unreal really, unless we lost it.42 Or the solution of any other polynomial equation! N.B. not every zero is a root.

21

Page 22: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

if ε > 0 is chosen small, a contradiction.Thus |z0| > 0 cannot be if m > 0, so m is achieved by z0 = 0: |1 + z2| is

minimal in z = 0, and m = 1. But this too cannot be: examine the valuesof |z2| for |z| = ε > 0 and derive another contradiction. If follows that theassumption m > 0 was false and therefore |z2

0 + 1| = m = 0. Therefore z0 isa solution43 of z2 + 1 = 0.

1.6.5 Generalise it!

Not a big deal, but the key idea applies to every equation of the form

z2 + αz + β = 0

with α, β ∈ IC, and then to every equation of the form

z3 + αz2 + βz + γ = 0,

as you may enjoy figuring out, and likewise for every polynomial equation

zn + αn−1zn−1 + · · ·+ α1z + α0 = 0.

The existence of a global minimiser z = z0 for

z → |zn + αn−1zn−1 + · · ·+ α1z + α0|

leads to the conclusion that

zn0 + αn−1zn−10 + · · ·+ α1z0 + α0 = 0,

and existence of a global minimiser in turn is guaranteed by the continuityof

(x, y)→ x+ iy = z → |zn + αn−1zn−1 + · · ·+ α1z + α0| = f(x, y) ≥ 0,

and the largeness of f on large circles centered in the origin. The latterinvolves a simple geometric estimate explained in Section 1.6.6 next, theformer a proper introduction and definition of the concept of continuity thatallows a simple existence proof, based on properties of real number sequencesonly, in search of minima and minimisers, see Section 1.6.7 below.

43 We found it again.

22

Page 23: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

1.6.6 Estimates and order in the complex plane

For α, β, γ ∈ IR44 and z a variable complex number45 the third order poly-nomial

C(z) = z3 + αz2 + βz + γ

defines a varying complex number which corresponds to a varying point inthe Cartesian plane. Note that C(z) is the sum of z3 and the quadratic46

polynomial Q(z) = αz2 + βz + γ.For fixed R > 0 the complex numbers z with |z| = R correspond to a

circle with radius R centered in the origin. Since |z3| = |z|3, the varyingcomplex number z3 corresponds to a point on the circle with the same centerand (larger) radius R3 (if we take R > 1).

For the absolute value of the smaller sum Q(z) we have

|Q(z)| = |αz2 + βz + γ| ≤ |αz2|+ |βz|+ |γ|,

which says that the distance to the origin of the point corresponding to Q(z)is at most the sum of the distances of the points corresponding to the 3indivual terms, which have respective distances

|αz2| = |α| |z2| = |α| |z|2 = |α|R2, |βz| = |β| |z| = |β|R, |γ|

to the origin if |z| = R. Thus the distance to the origin of the point corres-ponding to C(z) is at least

R3 − |α|R2 − |β|R− |γ| ≥ R3 − (|α|+ |β|+ |γ|)R2

= R3(1− |α|+ |β|+ |γ|R

) ≥ 1

2R3

if we choose R ≥ 2(|α|+ |β|+ |γ|).Without words this argument reads

|C(z)| = |z3 +αz2 +βz+ γ| ≥ |z3|− |αz2 +βz+ γ| ≥ |z3|− |αz2|− |βz|− |γ|

≥ |z|3(1− |α|+ |β|+ |γ||z|

) ≥ 1

2|z|3 =

1

2R3

if |z| = R ≥ 1 and |z| = R ≥ 2(|α|+ |β|+ |γ|).Now fix such an R. Clearly then

|C(0)| = |γ| ≤ R

2while |C(z)| > 1

2R3 ≥ 1

2R for |z| > R,

whence a smallest value of |C(z)|, if it exists, can only be attained by a z ∈ ICwith |z| ≤ R. If it exists.

44 No, that’s not an exponent. To be read as: for real numbers α, β, γ.45 Notation: for variable z ∈ IC.46 Quadratic, unless α = 0.

23

Page 24: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

1.6.7 In search of minima and minimisers

Now definef(x, y) = |C(x+ iy)|

with C(z) = C(x+ iy) as just above, and let R be as chosen. Then

f(x, y) ≥ 0

for every real number pair (x, y), and in addition it holds that

f(x, y) > f(0, 0) if x2 + y2 > R2.

We look for a globally minimal value m of f(x, y) and a corresponding mini-miser (x0, y0) with f(x0, y0) = m.

Now if f(x0, y0) = 0 for some (x0, y0) we’re done47. So suppose thatf(x, y) > 0 for every real x and y. In search of the minimum we can forgetabout the points (x, y) outside the circle defined by x2 +y2 = R2, as we knowthat we can only have m ≤ f(0, 0). If there are no values f(x, y) < f(0, 0)we’re also done48.

So assume that f(0, 0) is not a global minimal value of f(x, y). Withoutloss of any generality we now assume that f(0, 0) = 1 and it may happenthat there are values f(x, y) < 1

2. If so let I1 = [0, 1

2).

If not it may happen that there are values f(x, y) < 34, if so let I1 = [1

2, 3

4),

if not, then consider [34, 7

8), and so on. This proces must terminate otherwise

Archimedes happily tells us there are no values f(x, y) below 1 at all. Itfollows that in the sequence of intervals

[0,1

2), [

1

2,3

4), [

3

4,7

8), [

7

8,15

16), . . .

there is a first interval I1 that contains a value f(x, y), say p1 = f(x1, y1). Inthat interval we repeat the argument above and obtain a first interval I2 ina similar sequence with a p2 = f(x2, y2) ∈ I2, and so one.

It may happen that p2 = p1 and or a1 = a2 and likewise in every nextstep, but no matter what, we get

an ≤ pn = f(xn, yn) < bn

with both an and bn fractions whose denominators are pure powers of 2, and

0 < bn − an ≤1

2n.

47 By the way, this is what we wanted in this example, remember?48 This is what we wanted to force a contradiction.

24

Page 25: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

By construction the minimum we look for must lie in every [an, bn).The sequence an has

0 ≤ a1 ≤ a2 ≤ a3 ≤ · · · < 1

and its smallest lower bound defines a real number that we call m. It’s reallyArchimedes again who now tells us this m is in fact the only possible valuea global minimum of f(x, y) can have, if it exists.

1.6.8 Conclusion

The by construction bounded sequences xn and yn do not necessarily havethe property that

x1 ≤ x2 ≤ x3 ≤ x4 ≤ · · · or x1 ≥ x2 ≥ x3 ≥ x4 ≥ · · ·

and likewise for yn, but a nice little argument49 provides us with subsequencesxn and yn which do have this property and thereby define real numbers x0 andy0, either as lowest upperbound of the particular subsequence, or as largestlower bound. What remains is to come up with a definition of continuity thatapplies to the example from Section 1.6.6 under consideration and impliesthat f(x0, y0) = m. A quick way to do so is via the concept of convergentsequences and to say that continuity amounts to xn → x0 and yn → y0

implying that f(xn, yn) → f(x0, y0). In Sectie 2.2 this characterisation isdiscussed in the context of functions of one variable and related to the conceptof uniform continuity in Stelling 2.32.

49 See Sectie 3.6. BTW, Thomas Rot worked out Opgave 3.16.

25

Page 26: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

‘I like fonctions of one variable’Xavier Cabre adressing Abel prize winner Louis Nirenberg and a small analysis group at Tor Vergata in June 2015.

Dit vak gaat over integraal- en differentiaalrekening voor f : IR→ IR, met ge-neralisaties naar f : X → IR, f : IR→ X, f : X → Y , en veel voorbeelden50

met vooral maar niet alleen51 X = IR2.

Na een uitgebreid inleidend thuis te lezen overzicht in Hoofdstuk 27 eerstintegraalrekening in Hoofdstuk 2, waarin convergente deelrijen nodig zijn omintegreerbaarheid van continue functies te bewijzen. Na Hoofdstuk 3 overdie deelrijen en wat je zeker wil weten over absoluut convergente reeksen,volgt dan de link met (en) differentiaalrekening in Hoofdstuk 4 voor func-ties f : IR → IR, waaronder ook impliciete functies, met de bijbehorendestelling in Hoofdstuk 4, voor de kettingregel. Het bewijs van de implicietefunctiestelling doen we in detail en is gebaseerd op een contractieargumentdat nog vaker zal terugkomen. Daarna zijn er wat inkoppertjes, bijvoorbeeldde multiplicator(en) van Lagrange, waarvan de resultaten later twee keerovergeschreven52 kunnen worden. Rekenregels, voorbeelden en toepassingenin Hoofdstuk 5 sluiten wat je Analyse 1 zou kunnen noemen af.

Integraalrekening leidt in Hoofdstuk 2 al tot een eerste Banachruimte ruimteX, X = C([a, b]) de verzameling van continue functies f : [a, b]→ IR op eenbegrensd gesloten interval [a, b]. Met de goede versie van de kettingregel in debagage kan de lezer in principe Hoofdstuk 5 en Hoofdstuk 6 overslaan en zichin Hoofdstuk 10 de benodigde analyse met X i.p.v. IR eigen maken om detoepassingen op differentiaal- en integraalvergelijkingen met parameters deelszelf in te vullen. Waar je een college Reele Analyse mee zou kunnen beginnen,met in Hoofdstuk 11 een (hele) kleine aanzet tot een vak Variatierekening.

Daarvoor is er nog een aanzet tot wat meestal Analyse 2 heet. Aan het beginvan Hoofdstuk 6 een kort bewijsje van de hoofdstelling van de algebra, endan verder met vooral differentiaal- en een beetje integraalrekening in meervariabelen, waarbij stellingen en bewijzen vooral overgeschreven worden uitde eerste hoofdstukken en de betekenis duidelijk wordt bij het uitpakken vande notatie. Eerst voor functies van IC naar IC, en dan voor afbeeldingen vanIRn naar IRm. Verschillende perspectieven en toepassingen komen aan deorde. Als afsluiting wordt de complexe structuur direct en zonder krommepoespas gebruikt om met lijnintegralen over lijnstukjes te laten zien dat com-plex differentieerbare functies (zonder enige extra aannames) geweldige mooieeigenschappen hebben, denk ook aan f(A) met A 6∈ IC.

50 Wat X en Y nog meer kunnen zijn zie je vanzelf, metrische topologie in de appendix.51 Gebruik ook de index! Nog niet alles is helemaal klaar maar het meeste wel.52 Uitgangspunt: alles voor f : IR→ IR op zo’n manier dat het naadloos generaliseert.

26

Page 27: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Nog een woord achter- en vooraf

Ik verwijs af en toe naar het boekje Wiskunde in je Vingers met RonaldMeester [HM]. Het verwerken van reacties van collega’s (Bas Edixhoven, JanWiegerinck, Bob Rink, en met name Rene Swarttouw) wissel ik af met hetlezen in [Eves], de zesde editie van An Introduction to the History of Ma-thematics van (vader) Howard Eves (en zoon Jamie voor de cultural connec-tions). Ik verwijs daarom af en toe naar [Eves]. Verder is ook commentaarvan studenten van de Mastermath zij-instroomcursus Analyse voor lerarenzoveel mogelijk verwerkt. Ik verwijs ook naar [BE], het Leidse dictaat:

https://drive.google.com/file/d/0B_AYW-l1PhK-TVo0X2FVNWpYdGM/view

Hoofdstuk 27 van het huidige boek is bedoeld als enerzijds een alternatievebeschrijving voor de fundamenten waar we op bouwen in de analyse. Datbetreft met name de verzameling van de reele getallen, de eigenschappen vandeze verzameling, en de bewerkingen met elementen ervan53. Anderzijds be-schrijft Hoofdstuk 27 ook al wat van de inhoud die komen gaat, in samenhangmet die fundamenten van de wiskunde.

Hoofdstuk 2 begint de facto bij Archimedes in een nu veel uitgebreidereinleiding die aan Sectie 2.1 vooraf gaat. De besproken formules voor sommenvan machten zouden voorkennis voor dit vak kunnen zijn. Voor bewijzen (metvolledige inductie) van die formules zie eventueel ook Hoofdstuk 6 van [HM].

Hoofdstuk 3 was een tussenhoofdstuk met twee opties voor het behande-len van de stelling over convergente deelrijen van begrensde rijen die nodigwas in Hoofdstuk 2 om de Riemann integreerbaarheid van continue functieste bewijzen, maar is nu uitgebreid tot een algemene behandeling van het con-vergentiebegrip voor rijen en reeksen, met elementaire opgaven in een nieuweSectie 3.2.

In Hoofdstuk 4 vat Stelling 4.12 nu samen hoe differentiaal- en integraal-rekening samenhangen. Sectie 4.1 over de middelwaardestelling is uitgebreidmet opgaven die hiertoe dienend zijn. Sectie 4.4, de moeilijkste sectie vanhet hoofdstuk over de impliciete functiestelling, heeft nu een inleiding die hetverband legt met de inverse functiestelling die als speciaal geval besprokenwordt (en wellicht beter is om eerst te doen), en een nodeloos technischetussenformulering is geschrapt.

Nieuw54: het outlook Chapter 7 en de behandeling van integralen overmanifolds die daarna volgt. Nummering schuift op. Achter de nog nietbijwerkte index ruw materiaal voor diverse doeleinden.

53 Meningen zijn soms verdeeld of een cursus Fundamenten Analyse vooraf moet gaan.54 Ad hoc geschreven tijdens het geven van een college aan 2-dejaars.

27

Page 28: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Chapter 8

Hoofdstuk 8 over multilineaire algebra en lijn- en oppervlakteintegralen isnieuw, lees het stukje van formule (8.1) en de eerste sectie van Hoofdstuk 8met de lokale vorm van de analysestellingen waar het om gaat, gevonden nade vraagstelling met betrekking tot (8.7) over wat er komt uit de integraalvan een partiele afgeleide over een begrensd gebied in (eerst maar) IR2 en hetantwoord in (8.9).

In dat antwoord (8.9) verschijnt voor het eerst de normaalvector op de randvan het gebied, en de manier waarop je die over de rand integreert metde technieken in Sectie 8.8: eerst in het speciale55 geval dat N = 2 en deparameterisatie van de vorm (8.36) is met n = 1.

De stap van lokaal naar globaal kan via de introductie van de fading56 func-tions al informeel gemaakt worden om (8.10) in ieder geval al te noemenmet als speciaal geval de eerste integration by parts formule (8.11). Voor despeciale fading function in (8.11) is de stap van lokaal naar globaal niet eensnodig.

Na Sectie 8.1 komen Secties 8.2,8.3 over lijnintegralen. Sectie 8.8 over in-tegralen van functies over beelden van blokken onder parametriserende af-beeldingen Φ : IRn → IRN kan pas komen na Stelling 8.4 over maten vanparalellelotopen en de daarmee verband houdende voorkennis uit de (multi)-lineaire algebra.

Secties 8.5, 8.6 (met deze vorm van de spectraalstelling57) en 8.7 passen goedin een college Lineaire Algebra, in een module over de algemene stelling vanPythagoras, te beginnen met de vraag naar de oppervlakte van een paralel-lelogram in IR3.

Een alternatieve versie van Sectie 8.8 begint gewoon met Sectie 8.4, en heefteventueel Sectie 8.2 als deelsectie over lijnintegralen, waarvoor een recht-streeks aanpak met Riemannsommen58 en reparametrisatie naar booglengte59

mogelijk is.

De stap van lokaal naar globaal is met Secties 8.9, 8.15, 8.16, 8.17, 8.18,8.19 nog niet helemaal compleet omdat we ook over manifolds met randwillen integreren, teneinde in Sectie 8.13 de algemene stelling van Stokesover integralen over manifolds van niet alleen dimensie n = N− 1 maar ook

55 Zie Sectie 9.6 en verder voor een polygonale aanpak in complexe context.56 Cut-off functions.57 In inprodruktruimten!58 Zoals nu alleen genoemd aan het begin van Sectie 8.2.59 Nu alleen genoemd aan het eind van Sectie 8.2.

28

Page 29: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

n ≤ N− 2 in IRN te formuleren. Alleen Sectie 8.9 is onderdeel van de flow inhet hoofdstuk. De andere secties zijn naar achteren geschoven.

Het ligt voor de hand om daarvan eerst Sectie 8.15 over partities van 1 tedoen, dat sluit aan bij de appendix van Sectie 12.3. over kompaktheid metopen overdekkingen.

Ik kan me goed voorstellen dat de stap van lokaal naar globaal pas helemaalachteraf gedaan wordt en dat eerst de differentiaalvormen worden geintrodu-ceerd, en voorlopig heb ik daar nu voor gekozen.

De stap van integralen met dS-notatie naar integralen met produkten vandxi-tjes in differentiaalvormen begint met Sectie 8.10, met aan het eind delijnintegralen uit Sectie 8.3, waarin ik voor het eerst60 differentiaalvormenbenoem. De subsecties van Hoofdstuk 6.9 zijn hier relevant.

In Sectie 8.14 (met leerzame en besproken sommen nu) verwijs ik naar (8.34)en (8.32). Er moet nog een stukje bij over stuksgewijs gladde randen61, enwel naar aanleiding van de failure besproken na Opgave 8.11, maar wat erdaarna komt vond ik voor nu leuker: het folium van Descartes voor algemenedimensie n en exponent p, via eerst de impliciete functiestelling in Opgave8.13 en dan Opgave 8.13, resulterend in formules voor oppervlakte en inhoudin (8.89) en Opgave 8.17.

Tenslotte heb ik nauwelijks iets gezegd over de werking van differentiaalvor-men op vectorvelden. Dat kan volgens mij het best gebeuren in samenhangmet de fysische interpretaties die tot nu toe in dit college nooit aan de ordekwamen denk ik. Maar zie ook Hoofdstuk 19 en het plan in Hoofdstuk 22.

60 In dit Hoofdstuk 8 althans.61 Met wat overwegingen over hoe het zou gaan met ∂Ω alleen maar Lipschitz continu.

29

Page 30: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Inhoudsopgave

1 Archimedes, algebra and all that really 41.1 Area in the Cartesian plane . . . . . . . . . . . . . . . . . . . 6

1.1.1 Really? What’s the ratio behind all this? . . . . . . . . 71.1.2 Counting it? . . . . . . . . . . . . . . . . . . . . . . . . 81.1.3 The square root of two? . . . . . . . . . . . . . . . . . 101.1.4 Elementary school representations of real numbers . . . 101.1.5 More bounded increasing sequences . . . . . . . . . . . 11

1.2 Integrals now! . . . . . . . . . . . . . . . . . . . . . . . . . . . 121.3 Back to Babylonian times: YBC7289 . . . . . . . . . . . . . . 141.4 Differential calculus founded in algebra . . . . . . . . . . . . . 161.5 The mystery of the tangent . . . . . . . . . . . . . . . . . . . 171.6 So what about continuity? . . . . . . . . . . . . . . . . . . . . 18

1.6.1 Quadratics . . . . . . . . . . . . . . . . . . . . . . . . . 181.6.2 Cubics . . . . . . . . . . . . . . . . . . . . . . . . . . . 191.6.3 Imagine what? . . . . . . . . . . . . . . . . . . . . . . 191.6.4 Minimise it! . . . . . . . . . . . . . . . . . . . . . . . . 211.6.5 Generalise it! . . . . . . . . . . . . . . . . . . . . . . . 221.6.6 Estimates and order in the complex plane . . . . . . . 231.6.7 In search of minima and minimisers . . . . . . . . . . . 241.6.8 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . 25

2 Integraalrekening 382.1 Integralen via onder- en bovensommen . . . . . . . . . . . . . 432.2 Toch maar wat meer over continuıteit en limieten . . . . . . . 502.3 Integreerbaar: definities, regels, voorbeelden . . . . . . . . . . 532.4 Terug- en vooruitblik . . . . . . . . . . . . . . . . . . . . . . . 572.5 Verdiepingsmoment: tussensommen . . . . . . . . . . . . . . . 59

3 Convergente (deel)rijen en zo 613.1 Spelen met kwantoren . . . . . . . . . . . . . . . . . . . . . . 613.2 Elementaire opgaven over convergente rijen . . . . . . . . . . . 623.3 Limietpunten en convergente deelrijen . . . . . . . . . . . . . . 633.4 Begrensde rijen continue functies . . . . . . . . . . . . . . . . 653.5 Overaftelbaarheid van de reele getallen . . . . . . . . . . . . . 653.6 Directer bewijs voor de convergente deelrijstelling . . . . . . . 663.7 Onvoorwaardelijke convergentie . . . . . . . . . . . . . . . . . 68

30

Page 31: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

4 Van integraal- naar differentiaalrekening 714.1 De middelwaardestelling . . . . . . . . . . . . . . . . . . . . . 734.2 Integralen via primitieve functies . . . . . . . . . . . . . . . . 754.3 Inverse functies . . . . . . . . . . . . . . . . . . . . . . . . . . 784.4 Impliciete functies . . . . . . . . . . . . . . . . . . . . . . . . . 794.5 Differentieerbare impliciete functies . . . . . . . . . . . . . . . 854.6 Totale afgeleide, ketting- en Leibnizregel . . . . . . . . . . . . 894.7 Stationair onder randvoorwaarde . . . . . . . . . . . . . . . . 924.8 Zijstapje: convergentie van Newton’s methode . . . . . . . . . 934.9 Integralen met parameters . . . . . . . . . . . . . . . . . . . . 954.10 Partieel integreren en Taylorpolynomen . . . . . . . . . . . . . 974.11 Meer calculus: substitutieregels voor integralen . . . . . . . . 1014.12 Conclusie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1014.13 Wat uitwerkingen . . . . . . . . . . . . . . . . . . . . . . . . . 103

5 Rekenregels en voorbeelden 1055.1 Rekenregels voor de afgeleide . . . . . . . . . . . . . . . . . . 1065.2 Mooie voorbeelden: machtreeksen . . . . . . . . . . . . . . . . 1095.3 De natuurlijke logaritme . . . . . . . . . . . . . . . . . . . . . 1145.4 Zijstapje: tetratie . . . . . . . . . . . . . . . . . . . . . . . . . 1185.5 Meer differentiaalvergelijkingen . . . . . . . . . . . . . . . . . 1195.6 Meer inverse functies . . . . . . . . . . . . . . . . . . . . . . . 1225.7 Rare voorbeelden . . . . . . . . . . . . . . . . . . . . . . . . . 1235.8 Stirling’s formule via schalen en limieten . . . . . . . . . . . . 1245.9 Makkelijke convergentiestellingen . . . . . . . . . . . . . . . . 128

6 Analyse met meer variabelen 1306.1 Zijstapje: de hoofdstelling van de algebra . . . . . . . . . . . . 1316.2 Differentiaalrekening, ook met complexe getallen . . . . . . . . 1336.3 Randvoorwaarden en de methode van Lagrange . . . . . . . . 1396.4 Toepassing: de ongelijkheid van Holder . . . . . . . . . . . . . 1436.5 Aftelbare sommen van vierkante matrices . . . . . . . . . . . . 1456.6 Impliciete functiestelling in Euclidische ruimten . . . . . . . . 1476.7 Flashback . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1506.8 Karakterisaties van deelvarieteiten . . . . . . . . . . . . . . . . 152

6.8.1 Niet per se lineaire deelvarieteiten . . . . . . . . . . . . 1536.8.2 Beelden (van randen) van bollen . . . . . . . . . . . . . 1566.8.3 Overgang op andere coordinaten . . . . . . . . . . . . . 1576.8.4 Meer dan continu differentieerbaar . . . . . . . . . . . 157

6.9 Integralen over rechthoeken . . . . . . . . . . . . . . . . . . . 1586.9.1 Notationele kwesties met die d-tjes . . . . . . . . . . . 158

31

Page 32: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

6.9.2 Formele d-algebra zonder betekenis? . . . . . . . . . . 1606.9.3 Transformaties en parametrisaties . . . . . . . . . . . . 1626.9.4 Een transformatiestelling . . . . . . . . . . . . . . . . . 163

7 Standing at the crossroads 166

8 Multilinear algebra and integration 1708.1 Local integrals with the normal at the boundary . . . . . . . . 1728.2 The length of curve . . . . . . . . . . . . . . . . . . . . . . . . 1758.3 Line integrals of vector fields along curves . . . . . . . . . . . 1768.4 Surface area . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1788.5 The transpose, quadratic forms and operator norms . . . . . . 1798.6 Eigenvalues of compact linear symmetric operators . . . . . . 1818.7 Singular values and measures of parallelotopes . . . . . . . . . 1838.8 Surface integrals . . . . . . . . . . . . . . . . . . . . . . . . . . 1868.9 Integrals of functions over compact manifolds . . . . . . . . . 1878.10 More integration of differential forms . . . . . . . . . . . . . . 1888.11 From Green’s Theorem to Stokes’ curl theorem . . . . . . . . 1928.12 Pullbacks and the action of d . . . . . . . . . . . . . . . . . . 1948.13 From Gauss’ to Stokes’ Theorem . . . . . . . . . . . . . . . . 1988.14 More exercises . . . . . . . . . . . . . . . . . . . . . . . . . . . 2018.15 Cut-off functions and partitions of unity . . . . . . . . . . . . 2088.16 Partitions of compact manifolds . . . . . . . . . . . . . . . . . 2098.17 Changing partitions . . . . . . . . . . . . . . . . . . . . . . . . 2108.18 Again: local descriptions of a manifold . . . . . . . . . . . . . 2128.19 Coordinate transformations . . . . . . . . . . . . . . . . . . . 214

9 Toepassingen met een zuiver toetje 2169.1 Integraalrekening in poolcoordinaten . . . . . . . . . . . . . . 2169.2 Integraalrekening en kansverdelingen . . . . . . . . . . . . . . 2189.3 Gradient, kettingregel, coordinatentransformaties . . . . . . . 220

9.3.1 Gradient, divergentie en Laplaciaan . . . . . . . . . . . 2209.3.2 Kettingregel uitgeschreven voor transformaties . . . . . 2239.3.3 Kettingregel met Jacobimatrices . . . . . . . . . . . . . 2259.3.4 Omschrijven van differentiaaloperatoren . . . . . . . . 226

9.4 Harmonische polynomen . . . . . . . . . . . . . . . . . . . . . 2289.5 Intermezzo: het waterstofatoom . . . . . . . . . . . . . . . . . 2329.6 Lijnintegralen over polygonen en Coursat . . . . . . . . . . . . 2339.7 Machtreeksen via een Cauchy integraalformule . . . . . . . . . 2399.8 De Cauchy Integraal Transformatie . . . . . . . . . . . . . . . 2439.9 Kromme lijnintegralen . . . . . . . . . . . . . . . . . . . . . . 244

32

Page 33: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

10 Analyse in genormeerde ruimten 24810.1 Calculus voor X-waardige functies . . . . . . . . . . . . . . . . 25010.2 Differentiaalrekening voor functies op X . . . . . . . . . . . . . 25310.3 Partieel differentieerbaar =⇒ ? . . . . . . . . . . . . . . . . . 25610.4 Differentiaal- en integraalvergelijkingen . . . . . . . . . . . . . 25910.5 Impliciete functiestelling en integraalvergelijkingen . . . . . . . 26410.6 Calculus in Banachalgebra’s van operatoren . . . . . . . . . . 265

11 Extremisme 27511.1 Tweede afgeleide, Hessiaan, Lemma van Morse . . . . . . . . . 27511.2 Nog een keer de methode van Lagrange . . . . . . . . . . . . . 283

12 Appendix: al of niet metrische topologie 28512.1 Metrische ruimten . . . . . . . . . . . . . . . . . . . . . . . . . 28512.2 Omgevingen, open en gesloten verzamelingen . . . . . . . . . . 28712.3 Metrische ruimten; continue afbeeldingen . . . . . . . . . . . . 291

13 Terug naar het platte vlak 31313.1 Punten en vectoren in het platte vlak . . . . . . . . . . . . . . 31313.2 Kortste afstanden . . . . . . . . . . . . . . . . . . . . . . . . . 31613.3 Vlakke meetkunde met het inprodukt . . . . . . . . . . . . . . 31813.4 Projecteren op convexe verzamelingen . . . . . . . . . . . . . . 32013.5 Andere inprodukten en bilineaire vormen . . . . . . . . . . . . 32213.6 Om te onthouden . . . . . . . . . . . . . . . . . . . . . . . . . 32513.7 Poolcoordinaten in het (complexe) vlak . . . . . . . . . . . . . 326

14 De Hilbertruimte in 32814.1 Standaardassenkruizen . . . . . . . . . . . . . . . . . . . . . . 32914.2 Symmetrische matrices . . . . . . . . . . . . . . . . . . . . . . 33114.3 Reele Hilbertruimten . . . . . . . . . . . . . . . . . . . . . . . 33214.4 De standaard Hilbertruimte . . . . . . . . . . . . . . . . . . . 33714.5 Riesz of geen Riesz? . . . . . . . . . . . . . . . . . . . . . . . 34014.6 Convergente deelrijen . . . . . . . . . . . . . . . . . . . . . . . 34514.7 Positieve eigenwaarden van wat? . . . . . . . . . . . . . . . . . 34614.8 The French Connection . . . . . . . . . . . . . . . . . . . . . . 350

15 Lebesgue’s Differentiatie Stelling 352

16 Functies op de cirkel 35816.1 Een Hilbert ruimte voor (periodieke) functies? . . . . . . . . . 35916.2 Standaard Hilbertruimten voor ‘functies’ . . . . . . . . . . . . 36316.3 Fourierreeksen . . . . . . . . . . . . . . . . . . . . . . . . . . . 365

33

Page 34: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

16.4 Convergentie van Fourierreeksen . . . . . . . . . . . . . . . . . 37016.5 Dat andere inprodukt met afgeleiden . . . . . . . . . . . . . . 37716.6 Blipfuncties . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38016.7 Intermezzo: out of Hilbertspace . . . . . . . . . . . . . . . . . 382

17 Sobolev spaces 38417.1 Sobolev spaces . . . . . . . . . . . . . . . . . . . . . . . . . . 38417.2 Estimates and embeddings for W 1,p

0 (U) . . . . . . . . . . . . . 38517.3 Compactness for W 1,p

0 (U) . . . . . . . . . . . . . . . . . . . . 38617.4 Statements for W 1,p(U) via extension . . . . . . . . . . . . . . 39017.5 Density of smooth functions in W 1,p(U) . . . . . . . . . . . . . 39117.6 The extension and trace operators . . . . . . . . . . . . . . . . 39317.7 Additional exercises . . . . . . . . . . . . . . . . . . . . . . . . 39517.8 Holder continuity via Morrey’s estimate . . . . . . . . . . . . . 39617.9 GNS-estimates . . . . . . . . . . . . . . . . . . . . . . . . . . 397

18 Evans’ Chapter 6 and Navier-Stokes 40018.1 Existence of weak solutions via Lax-Milgramm . . . . . . . . . 400

18.1.1 Weak solutions . . . . . . . . . . . . . . . . . . . . . . 40018.1.2 The Lax-Milgramm Theorem . . . . . . . . . . . . . . 40118.1.3 Lax-Milgramm; boundedness condition . . . . . . . . . 40318.1.4 Lax-Milgramm; coercivity . . . . . . . . . . . . . . . . 40318.1.5 The general case with first order terms . . . . . . . . . 404

18.2 The selfadjoint case . . . . . . . . . . . . . . . . . . . . . . . . 40518.2.1 Second hand in homework set . . . . . . . . . . . . . . 40518.2.2 Maximum principles . . . . . . . . . . . . . . . . . . . 405

18.3 The Navier-Stokes equations . . . . . . . . . . . . . . . . . . . 40518.4 Navier-Stokes related exercises . . . . . . . . . . . . . . . . . . 407

19 Geostuff 41119.1 Submanifolds of IRd are Riemannian . . . . . . . . . . . . . . 41119.2 Covariant differentiation . . . . . . . . . . . . . . . . . . . . . 41319.3 Tangent vectors as derivatives . . . . . . . . . . . . . . . . . . 41419.4 Commutators of tangent vector fields . . . . . . . . . . . . . . 41619.5 Covariant differentiation of tangent vectors . . . . . . . . . . . 41719.6 Second fundamental form . . . . . . . . . . . . . . . . . . . . 41819.7 Curvature . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41819.8 Geodesic curves . . . . . . . . . . . . . . . . . . . . . . . . . . 42019.9 A special metric with radial symmetry . . . . . . . . . . . . . 42219.10The Jacobi equations . . . . . . . . . . . . . . . . . . . . . . . 423

34

Page 35: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

20 Newton’s method the hard way 42420.1 Newton’s method: a convergence proof . . . . . . . . . . . . . 42420.2 The optimal result . . . . . . . . . . . . . . . . . . . . . . . . 42620.3 A suboptimal result . . . . . . . . . . . . . . . . . . . . . . . . 42620.4 Alternative proof of convergence . . . . . . . . . . . . . . . . . 42720.5 The optimal alternative result . . . . . . . . . . . . . . . . . . 42720.6 A suboptimal alternative result . . . . . . . . . . . . . . . . . 42820.7 A lousy alternative result . . . . . . . . . . . . . . . . . . . . . 42920.8 A much better suboptimal alternative result . . . . . . . . . . 429

21 Nash’ modification of Newton’s method 43021.1 The modified scheme . . . . . . . . . . . . . . . . . . . . . . . 43121.2 The new error term . . . . . . . . . . . . . . . . . . . . . . . . 43221.3 The system of inequalities . . . . . . . . . . . . . . . . . . . . 43321.4 Estimating the increments . . . . . . . . . . . . . . . . . . . . 43421.5 Estimating the error terms . . . . . . . . . . . . . . . . . . . . 43521.6 Sufficient conditions for a convergence result . . . . . . . . . . 43721.7 Sufficient convergence condition on initial value . . . . . . . . 43821.8 The optimal choice of parameters . . . . . . . . . . . . . . . . 43921.9 Continuity . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 441

22 The Nash embedding theorem 442

23 From Fourier series to integral 443

24 Airy scary 445

25 Hartman-Grobman stelling 459

26 Welke horizon? 464

27 Welke fundamenten? 46727.1 Academisch speelkwartier: kolomcijferen . . . . . . . . . . . . 468

27.1.1 Optellen . . . . . . . . . . . . . . . . . . . . . . . . . . 47327.1.2 Vermenigvuldigen? . . . . . . . . . . . . . . . . . . . . 47727.1.3 Andere aftelbare sommen? . . . . . . . . . . . . . . . . 48027.1.4 Een cijfer keer een kommagetal . . . . . . . . . . . . . 48227.1.5 Produkten van kommagetallen . . . . . . . . . . . . . . 483

27.2 Kleinste bovengrenzen . . . . . . . . . . . . . . . . . . . . . . 48627.3 Absoluut convergente reeksen . . . . . . . . . . . . . . . . . . 48827.4 Verzamelingen in de praktijk . . . . . . . . . . . . . . . . . . . 48927.5 Equivalentierelaties . . . . . . . . . . . . . . . . . . . . . . . . 492

35

Page 36: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

27.6 Analyse in en van wat? . . . . . . . . . . . . . . . . . . . . . . 494

36

Page 37: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

De tekening hierboven is van mijn broertje, die ook de 11 tekeningen in hetgroene boekje met Ronald Meester maakte. Dit is nummer 12. Met 11hoofdstukken bleef er eentje over die illustreert wat er op 3 maart 1945 inhet Bezuidenhout in Den Haag gebeurde. De bommen kwamen niet op deDuitse lanceerinstellingen in het Haagse Bos terecht maar op woonwijken.De school van mijn moeder, vlak bij de hoge toren tussen de A12 en die laanwaar NWO tegenwoordig zit, bleef net gespaard.

De Nederlandse wikipedia pagina over het bombardement op Den Haag isde moeite waard, en vermeldt het verwisselen van coordinaten. De tekeningillustreert dit met een x en een y in de cockpit, en met vliegtuigen die inrichtingen loodrecht op elkaar vliegen. Het is altijd leuk om in woorden eenidee te beschrijven en te kijken wat de tekenaar er van bakt. Helaas pastedeze tekening niet in het format van het groene boekje.

De keuze van letters als namen voor wiskundige objecten is verder eenbron van leerzaam vermaak. Bij het introduceren van nieuwe stof is het eengoede gewoonte om systematisch te zijn in de keuze van de letters, maarvroeg of laat moet je de stap maken om flexibel te zijn en letters en notatieste veranderen, al is het alleen maar om te leren de notaties van anderen tebegrijpen. Sterker, andere vakgebieden gebruiken soms notaties die je vanuiteen star en strict wiskundig standpunt als fout zou moeten duiden. Het issoms wat contraproductief om dat dan vervolgens ook altijd maar te doen.

37

Page 38: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Dit boek is opgedragen aan het thuisfront dat voor de klas en in de strijd voor beter onderwijs haar mannetje staat.

2 Integraalrekening

Voor functies f : IR → IR begint integraalrekening met de vraag naar deoppervlakte van verzamelingen in het x, y-vlak begrensd door de x-as en degrafiek van f . Die grafiek wordt gegeven door y = f(x). Om niet meteenover onbegrensde gebieden te praten kijken we eerst naar verzamelingen vande vorm

A+ = (x, y) : x, y ∈ IR, 0 < y < f(x), a < x < ben

A− = (x, y) : x, y ∈ IR, f(x) < y < 0, a < x < b,met a, b ∈ IR en a < b, waarbij we opmerken dat de “grotere” verzamelingendie ontstaan als we hierin elke < door ≤ vervangen dezelfde oppervlaktezouden moeten hebben. Althans bij een zinvolle definitie van het begripoppervlakte, een definitie die we hier echter achterwege laten!

Dat lijnstukken oppervlakte nul hebben, en grafieken van niet al te lelijkefuncties ook, lijkt vanzelfsprekend, maar komt hier nog niet aan de orde. Inwat hieronder volgt gaat het alleen over welomschreven benaderingen vanoppervlakten van verzamelingen waarvan we kunnen aannemen dat die opde een of andere manier meetbaar zijn, bijvoorbeeld met een gereedschaps-kist vol rechthoekjes waarvan de oppervlakte als lengte en breedte buitenkijf staat. De wiskunde hieronder is correct ook zonder dat aan het begripoppervlakte wordt gedacht. Uitgangspunt is wel de consensus dat de opper-vlakte tussen de lijnen x = 0, x = 1, y = 0, y = 1 in het xy-vlak gelijk is aan1× 1 = 1 · 1 = 1, let wel, zonder fysische eenheden erbij.

We beginnen met het geval dat A− = ∅: we nemen aan dat f(x) ≥ 0 voorx ∈ [a, b]. Het geval [a, b] = [0, 1] en f(x) = xn met n ∈ IN is een leerzaameerste voorbeeld. We rekenen wat we de oppervlakte van de verzameling

An = (x, y) : 0 ≤ y ≤ xn ≤ 1

zouden willen noemen expliciet uit. Als notatie voor de oppervlakte1 van eenverzameling A ⊂ IR2 gebruiken we |A|. Als uitgangspunt nemen we dat over

1 Of elke A ⊂ IR2 een oppervlakte |A| heeft is natuurlijk wel de vraag.

38

Page 39: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

de oppervlakte van een rechthoek geen twijfel bestaat, waarbij we zondereenheden (dus geen vierkante centimeters of zo) werken. De oppervlakte vaneen rechthoek die parallel ligt aan de assen wordt eenvoudig bepaald door deschaalverdeling op de assen.

Voor n = 1 gaat het om het gebied in het xy-vlak begrensd door

x = 1, y = 0 en y = x,

een driehoek met oppervlakte 12, precies de helft van de oppervlakte van het

vierkant met hoekpunten (0, 0), (1, 0), (1, 1) en (0, 1). Kortom |A1| = 12.

Hoe zit het met A2? Omdat A2 ⊂ A1 is het duidelijk dat moet geldendat |A2| ≤ |A1|, nog voor je de vraag stelt hoe en of de oppervlakte eigenlijkprecies gedefinieerd is. Het is ook duidelijk2 dat |A2| niet kleiner kan zijnzijn dan de oppervlakte van een rechthoek die geheel in A2 ligt, bijvoorbeeldde rechthoek met hoekpunten (1

2, 0), (1, 0), (1, 1

4) en (1

2, 1

4). We concluderen

hieruit dat |A2| minimaal 12× 1

4moet zijn.

Opgave 2.1. Laat met rechthoekjes zien dat ook moet gelden dat

1

3· 1

9+

1

3· 4

9< |A2| <

1

3· 1

9+

1

3· 4

9+

1

3· 9

9.

Opgave 2.2. Laat zien dat voor elke N ∈ IN moet gelden dat

12 + 22 + · · ·+ (N − 1)2

N3< |A2| <

12 + 22 + · · ·+N2

N3.

Als je even nadenkt over hoe je de grenzen in Opgave 2.2 hebt gevondendan is duidelijk dat het verschil precies 1

Nis, en dat kunnen we zo klein maken

als we willen door N groot te nemen. Bovendien kunnen we deze onder- enbovengrenzen gewoon uitrekenen:

Opgave 2.3. Laat zien dat voor elke N ∈ IN geldt dat

N∑n=1

n2 = 12 + 22 + · · ·+N2 =N3

3+N2

2+N

6.

2 Maak een plaatje.

39

Page 40: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

We gebruiken hier de somnotatie waarin de index n aangeeft dat we de somnemen van de kwadraten van n over alle n in de verzameling

n ∈ IN : 1 ≤ n ≤ N.

In [Eves] lezen we op pagina 47 dat de formule in Opgave 2.3 al doorArchimedes gevonden is. Het rechterlid factoriseert als

N(N + 1)(2N + 1)

6

maar het gaat ons in het vervolg alleen om de coefficient van N3 in hetrechterlid. De bovengrens voor |A2| in Opgave 2.2 is nu immers gelijk aan

1

3+

1

2N+

1

6N2

en wordt kleiner als N groter genomen wordt. De ondergrens is (niet opnieuwuitrekenen maar gewoon 1

Neraf)

1

3− 1

2N+

1

6N2,

en dat wordt juist groter als N groter genomen wordt (al zie je dat misschienniet meteen). De onvermijdelijke conclusie is dat |A2| = 1

3. In termen van

de integralen3 die je natuurlijk al eerder gezien hebt is hiermee de uitspraakdat ∫ 1

0

x2 dx =1

3

gedaan zonder dat er een functie geprimitiveerd is!Wat aardig en nuttig is om op te merken is dat we van het derdegraads-

polynoom in Opgave 2.3 alleen de kopcoefficient in het antwoord terugzien.Het is een leerzame oefening dat het voor bijvoorbeeld4 A42 precies hetzelfdegaat, je bewijst en gebruikt

142 + 242 + · · ·+N42 =N43

43+ · · ·

om via oppervlakten van rechthoekjes op |A42| = 143

uit te komen.

Opgave 2.4. Doe |A1| ook op deze manier. Hint: 1 + 2 + · · ·+N is5 een som dieGauss ooit als strafwerk zou hebben gekregen.

3 Maar denk ook aan volumes van piramiden, zie Hoofdstuk 2 van [Eves].4 Amusant in [Eves, §3.16]: bewijs meetkundig dat 13 + · · ·+N3 = (1 + · · ·+N)2.5 Met N = 100.

40

Page 41: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 2.5. Schrijf de differenties (n + 1)2 − n2, (n + 1)3 − n3, (n + 1)4 − n4,enzovoorts uit.

Opgave 2.6. De ad hoc notaties

N1 =N∑n=1

n, N2 =N∑n=1

n2, N3 =N∑n=1

n3, . . .

definieren sommen die voor elke index 1, 2, 3, . . . van N ∈ IN afhangen6. Gebruik nuOpgave 2.5: laat met de differenties van n2 zien dat

(N + 1)2 = 1 +N + 2N1,

met de differenties van n3 dat

(N + 1)3 = 1 +N + 3N1 + 3N2,

met de differenties van n4 dat

(N + 1)4 = 1 +N + 4N1 + 6N2 + 4N3,

enzovoorts.

Opgave 2.7. Laat voor k = 1, 2, 3, . . . zien7 dat Nk een polynoom is van graadk + 1 met kopcoefficient 1

k+1 . Hint: los uit de in Opgave 2.6 gevonden indentitei-ten achtereenvolgens N1, N2, N3, . . . op; voor elke volgende k alle vorige resultatengebruiken en goed kijken wat de graad van elke term is.

Nog voor dat we aan precieze definities zijn toegekomen is de onvermij-delijke conclusie dat wel moet gelden dat

|An| =∫ 1

0

xn dx =1

n+ 1,

en een kleine variant hier op is:

6 Met eventueel

N0 =

N∑n=1

1.

7 Index k omdat de index n al in gebruik is, het geval k = 42 is al genoemd.

41

Page 42: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 2.8. Voor b > 0 en n ∈ IN is de oppervlakte van

(x, y) : 0 ≤ y ≤ xn ≤ bn

gelijk aan het quotient van bn+1 en n + 1. Laat dit zien door met schaling van deeenheden op de assen de vraag te herleiden tot het geval b = 1.

Lezend in [Eves] is het duidelijk dat Archimedes deze conclusie al had kunnentrekken en dat wellicht ook gedaan heeft voor n = 2 en n = 3. In modernenotatie: ∫ b

0

xn dx =bn+1

n+ 1.

Opgave 2.9. Voor 0 ≤ a < b en n ∈ IN is de oppervlakte van

(x, y) : a ≤ x ≤ b, 0 ≤ y ≤ xn

(in moderne notatie) gelijk aan∫ b

axn dx = [

xn

n+ 1]b

a=

bn+1

n+ 1− an+1

n+ 1.

De functie

x→ xn+1

n+ 1

noemen we tegenwoordig de primitieve van de functie

x→ xn

omdat de afgeleide van de eerste functie gelijk is aan de tweede. Het isniet waarschijnlijk dat de lezer8 de begrippen primitieve en afgeleide functiesnog niet in de een of andere vorm gezien heeft maar het advies is om eenen ander bij verder lezen in het achterhoofd te houden. In (4.6) komt deuitspraak hierboven terug in algemene vorm.

Opgave 2.10. Tijdens de vakantiecursus voor wiskundeleraren op 25-8-2017 in Eind-hoven maakte een van de toehoorders de terechte opmerking dat uit

∫ 10 x

2 dx = 13

ook de integraal∫ 1

0

√x dx volgt. Kun je

∫ 10

n√x dx berekenen voor iedere n ∈ IN?

8 Ik zal de lezer doorgaans tutoyeren, sorry.

42

Page 43: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 2.11. De dag na die cursus mailde Frits Beukers me een manier om op∫ 10 x

k dx = 1k+1 uit te komen zonder een formule voor 1k + 2k + · · ·+ nk, gebruikma-

kend van de differenties in Opgave 2.5, maar dan uitgeschreven via het merkwaardigeproduct ak+1 − bk+1 = (a− b)(ak + · · ·+ bk). Vul de puntjes in en schrijf uit wat jekrijgt met a = n+ 1 en b = n. Je krijgt k+ 1 termen, die elk uit factoren n+ 1 en nbestaan. Als je al zulke factoren n vervangt door n+ 1 wordt de som groter en als jeal zulke n + 1 vervangt door n wordt de som kleiner. Sommeer de ongelijkheden dieje krijgt van n = 0 tot n = N en deel door k + 1. Laat zien dat

1k + 2k + · · ·+Nk <(N + 1)k+1

k + 1< 1k + 2k + · · ·+Nk + (N + 1)k,

en gebruik dit om via onder- en bovensommen∫ 1

0 xk dx te bepalen.

2.1 Integralen via onder- en bovensommen

De integraal van x = 0 tot x = 1 van x2 in de inleiding hierboven is bijafspraak de nog niet wiskundig gedefinieerde oppervlakte van de verzameling9

A = (x, y) : x, y ∈ IR, 0 ≤ y ≤ f(x), a ≤ x ≤ b, (2.1)

met in dit voorbeeld a = 0, b = 1 en f(x) = x2. Voor a, b ∈ IR met a < ben een functie f : [a, b] → IR met f(x) ≥ 0 voor a ≤ x ≤ b, beoogt dewiskundige definitie van ∫ b

a

f(x) dx (2.2)

wiskundig betekenis te geven aan de oppervlakte |A| van A in (2.1).Daartoe worden zogenaamde ondersommen en bovensommen gedefini-

eerd, waarvan het evident is dat ze bij de beoogde definitie van de opper-vlakte van A kleiner respectievelijk groter10 dan |A| zijn. Als vervolgensblijkt dat er precies een reeel getal is dat groter is dan alle ondersommenen kleiner dan alle bovensommen, dan is dit getal de enige kandidaat voor|A|, en vervolgens wordt dit getal de integraal van f over [a, b] genoemd, i.e.(2.2). Het is natuurlijk niet verplicht om dan vervolgens te zeggen dat dezeintegraal gelijk is aan de oppervlakte |A| van A.

We bekijken deze aanpak eerst voor het geval dat f : [a, b] → IR eenniet-dalende niet-negatieve functie is.

9 Nu maar met ≤ i.p.v. <.10 Precies gezegd: groter dan of gelijk aan.

43

Page 44: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Definitie 2.12. Als a, b ∈ IR met a < b en f : [a, b] → IR, dan heet f niet-negatief als f(x) ≥ 0 voor alle x ∈ [a, b]; f heet niet-dalend als de implicatie

x1 ≤ x2 =⇒ f(x1) ≤ f(x2)

geldt voor alle x1, x2 ∈ [a, b].

Voor zo’n niet-dalend niet-negatieve functie ligt het voor de hand omde oppervlakte |A| van A in (2.1) van onder te benaderen met in dit geval Teken

plaatje!ondersommen van de vorm

SN =N∑k=1

f(xk−1)(xk − xk−1) (2.3)

= f(x0)(x1 − x0) + · · ·+ f(xN−1)(xN − xN−1),

waarina = x0 ≤ x1 ≤ · · · ≤ xN = b met N ∈ IN. (2.4)

Zo’n keuze van x1, . . . , xN−1 noemen we een partitie P van [a, b] en SN isniets anders dan de som van de oppervlakten van de rechthoekjes11

Rk = [xk−1, xk]× [0, f(xk−1)] (k = 1, . . . , N).

Hoe |A| verder ook gedefinieerd wordt, je kunt je zelf er makkelijk van over-tuigen dat bij iedere zinvolle definitie van |A| wel moet gelden dat SN ≤ |A|.Teken maar een plaatje met grafiek en rechthoekjes.

Evenzo maken de oppervlakten van de rechthoekjes

Rk = [xk−1, xk]× [0, f(xk)] (k = 1, . . . , N)

de bovensom

SN =N∑k=1

f(xk)(xk − xk−1). (2.5)

Voor een zinvolle definitie van de oppervlakte van A moet dus wel gelden dat

SN ≤ |A| ≤ SN . (2.6)

Slordig12 gezegd, de gezochte waarde |A| zitten tussen13 de ondersom SN ende bovensom SN , en het verschil van die twee is

SN − SN =N∑k=1

(f(xk)− f(xk−1))(xk − xk−1).

11 Zo’n rechthoekje kan ook een lijnstuk of een punt zijn.12 Het kan gebeuren dat SN = |A| en/of |A| = SN .13 Als SN < |A| < SN spreken we van strict tussen.

44

Page 45: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Als we nu de partitie P in (2.4) equi-distant kiezen, i.e.

xk − xk−1 =b− aN

(k = 1, . . . , N),

dan volgt

SN − SN =N∑k=1

(f(xk)− f(xk−1))b− aN

= (f(b)− f(a))b− aN

en dat kunnen we willekeurig klein maken door N groot te kiezen14. De on-vermijdelijke conclusie is dan dat er maar een getal tussen alle ondersommenen bovensommen kan liggen.

Opgave 2.13. MetN = 1, 2, 4, 8, 16 . . . vormen de ondersommen S1, S2, S4, S8, . . .een niet-dalende rij getallen. Laat dit zien.

Evenzo vormen de bovensommen S1, S2, S4, S8, . . . een niet-stijgende rij. Om-dat

S1 ≤ S2 ≤ S4 ≤ S8 ≤ · · · ≤ S8 ≤ S4 ≤ S2 ≤ S1,

zijn beide rijen begrensd.

Definitie 2.14. Als a ≤M ∈ IR respectievelijk a ≥M voor alle a ∈ A ⊂ IRdan heet M een bovengrens respectievelijk een ondergrens voor A, en A naarboven respectievelijk beneden begrensd.

De kleinste bovengrens15 J van deze rij ondersommen kan niet groter zijndan een bovensom en is daarmee een ondergrens voor alle bovensommen indeze rij bovensommen. Voor de grootste ondergrens16 J van alle bovensom-men geldt dus J ≥ J . Omdat

J − J ≤ S2n − S2n = (f(b)− f(a))b− a

2n

en 2n willekeurig groot gekozen kan worden volgt J − J = 0. Zo definierenwe een uniek getal J = J = J dat vervolgens genoteerd wordt als

J =

∫[a,b]

f =

∫ b

a

f =

∫ b

a

f(x) dx,

14 Anders zou IN naar boven begrensd zijn in IR.15 Ander woord voor kleinste bovengrens: supremum. Waarom bestaat die/dat?16 Ander woord voor grootste ondergrens: infimum. Waarom bestaat die/dat?

45

Page 46: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

spreek naar keuze uit als: de integraal van f over [a, b], respectievelijk deintegraal van f of f(x) van a of x = a tot b of x = b. In de notatie is x eendummy variabele, die door elke andere letter vervangen kan worden, maarbij voorkeur niet door a of b, en liever ook niet door d of f .

Opgave 2.15. Voor niet-stijgende niet-negatieve functies is het verhaal hierbovenop details na hetzelfde. Schrijf dat uit.

Opgave 2.16. Niet-stijgende functies en niet-dalende functies worden monotonefuncties genoemd. Ook als deze functies zowel positieve als negatieve waarden aan-nemen, definieren eindige sommen als in (2.3) en (2.5) via N = 2n een uniek getalJ dat de integraal van f over [a, b] genoemd wordt. Wat is de interpretatie van dezeintegraal in termen van de gebieden in het x, y-vlak begrensd door x = a, x = b,y = 0 en y = f(x)? Leg uit waarom.

De integraal van een monotone functie f is nu gedefinieerd aan de handvan equi-distante partities van het interval [a, b]. Hoe zit het met andere par-tities en de ordening van onder- en bovensommen? Een vraag om algemeente stellen maar nu eerst nog even het voor specifieke geval van monotonefuncties.

Opgave 2.17. Neem weer het geval dat f niet-dalend is. Neem een partitie Pgedefinieerd door (2.4) en een partitie Q gedefinieerd door

a = y0 ≤ y1 ≤ · · · ≤ yM = b met M ∈ IN.

Neem17 bij P de bovensom S in (2.5) en bij Q de ondersom

S =

M∑l=1

f(yl−1)(yl − yl−1)

Laat zien dat S ≤ S. Hint: eerst zelf proberen, maar kijk eventueel al naar (2.11).

Definitie 2.18. Laat A en B twee deelverzamelingen zijn van IR. We zeggendat A ≤ B als a ≤ b voor alle a ∈ A en alle b ∈ B. In dat geval zeggen wedat J ∈ IR tussen A en B ligt als A ≤ J ≤ B.

17 Even zonder index in de notatie.

46

Page 47: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Al onze onder- en bovensommen maken twee zulke verzamelingen A en B.De volgende opgave is nu van belang.

Opgave 2.19. Laat A en B twee niet-lege deelverzamelingen zijn van IR met deeigenschap dat A ≤ B. Bewijs dat er een getal J ∈ IR is dat tussen A en B ligt.Hint: zie de redenatie onder Definitie 2.14.

Stelling 2.20. Laat f : [a, b] → IR een monotone functie zijn. Dan bestaater precies een getal J dat tussen de verzameling van alle sommen van devorm (2.3) en de verzameling van alle sommen van de vorm (2.5) ligt. Ditgetal J is per definitie de integraal van f(x) van x = a tot x = b, notatie

J =

∫ b

a

f(x) dx.

Bewijs. Het werk is hierboven gedaan, tenzij Opgave 2.17 niet gelukt is,maar lees dan toch maar verder. Zonder beperking der algemeenheid18 nemenwe f niet-dalend. De ondersommen vormen een niet-lege verzameling A ende bovensommen een niet-lege verzameling B. Er geldt dat A ≤ B, dus erbestaat een J tussen A en B. Met equi-distante partities zien we dat er maareen zo’n J kan zijn. Klaar.

Monotone functies zijn dus integreerbaar. Merk op dat gegeven een par-titie P zoals in (2.4), en iedere keuze van zogenaamde tussenpunten

xk−1 ≤ ξk ≤ xk (k = 1, . . . , N),

ook

S =N∑k=1

f(ξk)(xk − xk−1) (2.7)

een voor de hand liggende benadering van∫ baf(x) dx zou moeten zijn, ook

als f : [a, b] → IR niet monotoon is, maar we kunnen dan niet meer op eennatuurlijke manier van boven- of ondersommen spreken.

Als de waardenverzameling19

f(x) : a ≤ x ≤ b = ∪x∈[a,b]f(x)

echter begrensd is, i.e. als er m,M ∈ IR bestaan zodat m ≤ f(x) ≤ M vooralle x ∈ [a, b], dan is op elke deelinterval [xk−1, xk] de waardenverzameling

18 Afkorting: zbda.19 Het bereik Bf van f : [a, b]→ IR, door sommigen ook het codomein van f genoemd.

47

Page 48: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

ook begrensd en bestaan er bijbehorende ondergrenzen mk en bovengrenzenMk met m ≤ mk ≤Mk ≤M , waarmee we

S =N∑k=1

mk(xk − xk−1) en S =N∑k=1

Mk(xk − xk−1) (2.8)

weer als onder- en bovensommen voor zowel (2.7) als de te definieren in-

tegraal∫ baf(x) dx kunnen introduceren. Bij dezelfde partitie P geldt dan

onmiddellijk dat S ≤ S.Wat hebben we nu nodig om het bewijs van Stelling 2.20 over te schrij-

ven? Twee dingen goed begrijpen nu. Ten eerste, de verzamelingen vanondersommen A en bovensommen B moeten weer voldoen aan A ≤ B. Tentweede, we moeten de uniciteit van het getal J tussen A en B aantonen, endaartoe nemen we voor mk en Mk natuurlijk de grootst respectievelijk kleinstmogelijk waarde, teneinde het verschil

S − S =N∑k=1

(Mk −mk)(xk − xk−1)

zo klein mogelijk20 te krijgen.Kies dus

Mk = sup[xk−1,xk]

f = supf(x) : xk−1 ≤ x ≤ xk en mk = inf[xk−1,xk]

f.

Hierin staat sup voor supremum van de verzameling in kwestie. Iedere niet-lege verzameling A ⊂ IR die begrensd is naar boven, middels een bovengrensM ≥ a voor alle a ∈ A, heeft een kleinste bovengrens die het supremum vanA genoemd wordt. In Sectie 27.2 heb je hier al over gelezen natuurlijk. Ditis een van de vanzelfsprekende eigenschappen die IR moet21 hebben. Evenzostaat inf voor infimum of grootste ondergrens.

Opgave 2.21. Laat zien dat bij het verfijnen van de partitie, i.e. extra puntentoevoegen in (2.4), ondersommen niet kleiner en bovensommen niet groter kunnenworden.

Als nu voor alle k = 1, . . . , N geldt dat

Mk −mk ≤ ε (2.9)

20 Hopelijk willekeurig klein.21 Anders IR terugsturen naar de verzamelingsgeleerden!

48

Page 49: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

(voor een ε > 0), dan volgt dat

S − S =N∑k=1

(Mk −mk)(xk − xk−1) ≤ ε(b− a). (2.10)

Wat we dus nodig hebben voor uniciteit van J is dat elke ε > 0 reali-seerbaar is in (2.9), middels een geschikte keuze van (2.4). In dat geval geldtvoor iedere andere J tussen A en B dat

|J − J | ≤ S − S ≤ ε(b− a),

en omdat ε > 0 dan zo klein gekozen mag worden als we maar willen volgt22

J = J .De definitie van (meteen maar) uniforme continuıteit brengt nu uitkomst.

Dit is de eerste keer dat we een uitspraak formuleren waarin voor alle ε > 0iets moet gelden dat met die ε te maken heeft, en zo’n uitspraak meteengebruiken om een fundamentele stelling te bewijzen. Merk op dat je zo’nuitspraak alleen maar echt gebruikt als je meerdere (de facto oneindig veel)keren een ε kiest23.

Definitie 2.22. Als a, b ∈ IR met a < b en f : [a, b] → IR, dan heet funiform continu als er voor alle ε > 0 een δ > 0 bestaat zodanig dat voor allex, y ∈ [a, b] geldt dat

|x− y| ≤ δ =⇒ |f(x)− f(y)| ≤ ε.

Stelling 2.23. Laat f : [a, b] → IR een uniform continue functie zijn. Danbestaat er precies een getal J dat tussen de verzameling van alle onder-sommen en de verzameling van alle bovensommen ligt, waarbij we onderde onder- en bovensommen de sommen in (2.8) verstaan. Dit getal J is perdefinitie de integraal van f(x) van x = a tot x = b, notatie

J =

∫ b

a

f(x) dx.

Bewijs. Wederom is vrijwel al het werk al gedaan. De ondersommen vormeneen niet-lege verzameling A en de bovensommen een niet-lege verzameling B.Met δ > 0 bij ε > 0 zoals in Definitie 2.23 volgt24 (2.9) als de partitie P in(2.4) zo gekozen wordt dat xk − xk−1 ≤ δ voor alle k = 1, . . . , N .

22 Ook dit gebruikt weer dat IN niet begrensd is in IR via het kiezen van ε = 1n .

23 Houd het met ε = 1n bij voorkeur simpel, en je slaagt met vlag en wimpel.

24 Ga dit na, al volgt aanstonds dat mk en Mk aangenomen worden in [xk−1, xk].

49

Page 50: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Als we nu ook nog laten zien dat A ≤ B zijn we klaar. Neem daartoeP als in (2.4) en Q net als in Opgave 2.17, en vorm de gemeenschappelijkeverfijning

a = z0 ≤ z1 ≤ · · · ≤ zK = b, (2.11)

door x1 ≤ · · · ≤ xN−1 en y1 ≤ · · · ≤ yM−1 op een gemeenschappelijkevolgorde te zetten. Dus K − 1 = M − 1 +N − 1 en iedere zi is een xk of eenyl, waarmee met

ml = inf[yl−1,yl]

f, mi = inf[zi−1,zi]

f ≤ sup[zi−1,zi]

f = Mi, Mk = sup[xk−1,xk]

f

volgt dat

M∑l=1

ml(yl−yl−1) ≤K∑i=1

ml(zi−zi−1) ≤K∑i=1

Ml(zi−zi−1) ≤N∑k=1

Mk(xk−xk−1).

Waarom? Omdat de eerste ongelijkheid de ondersommen betreft van eenpartitie en een verfijning25 daarvan, en de derde ongelijkheid de bovensom-men van een andere partitie naar dezelfde verfijning. De tweede ongelijkheidspreekt vanzelf en Stelling 2.23 is nu voor eens en altijd inzichtelijk metonder- en bovensommen bewezen.

Opgave 2.24. Bewijs dat je antwoord in Opgave 2.10 juist is.

2.2 Toch maar wat meer over continuıteit en limieten

Uniform continue functies f : [a, b]→ IR zijn dus integreerbaar met dezelfdeaanpak als monotone functies. Maar hoe weet je of een functie uniformcontinu is? Wel, bijvoorbeeld als je een schatting van de vorm

|f(x)− f(y)| ≤ C|x− y|α (2.12)

hebt voor alle x, y ∈ [a, b] met een vaste α > 0 en een vaste C > 0. In hetgeval dat α ∈ (0, 1) spreekt men van uniform Holder continu met exponentα, en als α = 1 van uniform Lipschitz continu. Het geval α > 1 is niet heelrelevant26.

Uniforme continuıteit betreft functies op hun hele domein, hierbovensteeds [a, b]. Gewone continuıteit betreft het gedrag van een functie in debuurt van een gegeven punt.

25 Zie Opgave 2.21.26 Waarom niet? Leuke opgave: bewijs dat zulke functies constant zijn.

50

Page 51: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Definitie 2.25. Als we in Definitie 2.22 de y vast nemen en gegeven iedereε > 0, altijd een δ > 0 kunnen vinden waarvoor de implicatie geldt voor allex met x ∈ [a, b], dan heet f continu in y. We zeggen dan ook dat

f(y) = limx→y

f(x),

of ook welf(x)→ f(y)

als x→ y (steeds met x ∈ [a, b]). Als deze uitspraak geldt met uitsluiting vanx = y, en de functiewaarde f(y) vervangen door een L ∈ IR, dan zeggen wedat L de limiet is van f(x) voor x→ y.

In Definitie 2.25 kan [a, b] vervangen worden door een willekeurige I ⊂ IR enin de uitspraak f(x)→ L hoeft y dan niet per se in I te liggen.

De voor de hand liggende vraag is natuurlijk of een f : [a, b] → IR diecontinu is in elke y ∈ [a, b] ook uniform continu is op heel [a, b]. Daartoeherformuleren we nu eerst de definitie van f(x) → L als x → y in termenvan convergente rijen.

Definitie 2.26. Een door n ∈ IN genummerde27 rij reele getallen xn heetconvergent als er een (limiet) x ∈ IR bestaat zodanig dat er voor alle ε > 0een N ∈ IN bestaat waarvoor de implicatie

n ≥ N =⇒ |xn − x| ≤ ε

geldt voor alle n ∈ IN. Zonder woorden luidt deze uitspraak

∃x ∈ IR∀ε > 0∃N ∈ IN∀n ∈ IN : n ≥ N =⇒ |xn − x| ≤ ε.

We zeggen dat xn → x (als n→∞).

Opgave 2.27. Laat zien dat een convergente rij reele getallen xn maar een limietheeft. Hint: stel niet dan zijn er minstens twee limieten, zeg x en x; gebruik

|x− x| = |x− xn + xn − x| ≤ |x− xn|+ |xn − x|

en kies een geschikte ε om een tegenspraak af te leiden met Definitie 2.26.

27 Of door n ∈ k + IN = k + j : j ∈ IN, met k ∈ IZ.

51

Page 52: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 2.28. Laat zien dat iedere convergente rij reele getallen xn begrensd is, i.e.er is een M ≥ 0 waarvoor geldt dat |xn| ≤ M voor alle n in IN. Hint: pas Definitie2.26 toe met een ε > 0 naar vrije keuze en kies M zo dat M ≥ |xn| voor alle n kleinerdan de bijbehorende N en M ≥ |xN | + ε. Geef een voorbeeld van een begrensde rijdie niet convergent en maak die rij convergent door voldoende veel termen van de rijweg28 te laten.

Opgave 2.29. Laat f : I → IR en y, L ∈ IR. De uitspraak f(x)→ L als x→ y isequivalent met de uitspraak dat voor elke rij xn in I de implicatie

xn → y =⇒ f(xn)→ L

geldt. Bewijs dit. Hint: rijgen van definities, noem de ε in de uitspraak dat xn → ydaartoe maar δ.

NB. Het kan gebeuren in Opgave 2.29 dat y 6∈ I en dat er geen rijen xn inI zijn met xn → y. In dat geval zijn beide uitspraken zinloos29 voor elkeL ∈ IR. Zo’n punt y 6∈ I heet geen limietpunt van I. Opgave 2.29 bewijst devolgende stelling30:

Stelling 2.30. Laat I ⊂ IR, f : I → IR en x0 ∈ I. Dan is f continuin x0 dan en slechts dan als voor elke rij xn in I met xn → x0 geldt datf(xn)→ f(x0).

Opgave 2.31. De enige manier waarop f : [a, b]→ IR niet uniform continu kan zijnis als er een ε > 0 bestaat waarvoor geen bijbehorende δ > 0 te vinden is waarmee deuitspraak in Definitie 2.22 geldt. Kies nu een willekeurige rij 0 < δn → 0. Voor iederen ∈ IN zijn er dan xn, yn ∈ [a, b] met wel |xn−yn| ≤ δn maar niet |f(xn)−f(yn)| ≤ ε.Neem nu aan31 dat yn → η ∈ [a, b] en leid een tegenspraak af met de continuıteit vanf in η. Hint: laat zien dat ook xn → η; wat geldt er dus voor f(xn) en f(yn)?

Stelling 2.32. Laat f : [a, b] → IR continu zijn in elk punt van [a, b]. Danis f : [a, b]→ IR uniform continu.

Bewijs. Stel dat f : [a, b] → IR niet uniform continu is. Redeneer dan alsin Opgave 2.31: als de rij yn niet convergent is dan kan de rij convergent

28 Grapje: denk aan ongewenste data.29 Maar wel waar.30 Waarin n in IN en 0 beschikbaar is voor x0 als naam voor de limiet van de rij xn.31 Absurde aanname?

52

Page 53: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

gemaakt worden door voldoende elementen van de rij weg te laten (metandere woorden, neem een deelrij) zodanig dat de rij convergent wordt (ende andere rij dus ook). Gebruik hiertoe Stelling 3.1 die zegt dat iederebegrensde rij in IR een convergente deelrij heeft. Noem de limiet van dedeelrij η, laat zien dat η ∈ [a, b] en het werk is gedaan.

De in het bewijs gebruikte Stelling 3.1 is belangrijk genoeg om een eigenhoofdstuk te krijgen. Het is de eerste stelling die we formuleren over hetbestaan van een limiet van een (in dit geval deel-)rij zonder die limiet al op deeen of andere manier bepaald te hebben. Een poging om het convergent zijnvan een rij xn te formuleren zonder de limiet in de definitie te gebruiken gaatterug tot Cauchy en correspondeert met we wat tegenwoordig een Cauchyrijnoemen. Vergelijk de volgende definitie daarom nauwkeurig met de eerstezin in Definitie 2.26.

Definitie 2.33. Een door n ∈ IN genummerde rij reele getallen xn heet eenCauchyrij als er voor alle ε > 0 een N ∈ IN bestaat waarvoor de implicatie

m,n ≥ N =⇒ |xn − xm| ≤ ε

geldt voor alle m,n ∈ IN.

In Definitie 2.33 is m,n ≥ N te lezen als m ≥ N en ook n ≥ N . Evenzois m,n ∈ IN te lezen als m ∈ IN en ook n ∈ IN. In het volgende hoofdstukvolgt het convergent zijn van Cauchyrijen via Stelling 3.1 uit het begrensdzijn van Cauchyrijen. Voor nu volstaat een eenmalig beroep op Stelling 3.1zelf.

Opgave 2.34. Laat f : [a, b] → IR uniform continu zijn. Bewijs dat f begrensd isop [a, b].

Opgave 2.35. Laat f : [a, b]→ IR continu zijn in elk punt van [a, b]. Bewijs dat feen maximum M en een minimum m op [a, b] heeft. Hint: omdat f uniform continuis op [a, b], is f begrensd op [a, b]. Laat M = supf(x) : a ≤ x ≤ b. Dan bestaater een rij xn in [a, b] met f(xn)→M . Neem daarvan een convergente deelrij.

2.3 Integreerbaar: definities, regels, voorbeelden

We weten tot nu toe alleen dat voor monotone en voor continue f : [a, b]→ IRmet behulp van onder- en bovensommen een ondubbelzinnige betekenis kan

53

Page 54: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

worden gegeven aan de integreerbaarheid van f en de waarde van de integraal∫ b

a

f(x) dx.

Voor iedere begrensde functie kunnen we echter bij een partitie (2.4)

Mk = sup[xk−1,xk]

f en mk = inf[xk−1,xk]

f

definieren en de bijbehorende onder- en bovensom. Net als in het bewijsvan Stelling 2.23 volgt nu dat de verzameling van alle ondersommen A en deverzameling van alle bovensommen B voldoen aan A ≤ B. Op grond vanOpgave 2.19 is er dus tenminste een getal J dat tussen A en B ligt.

Definitie 2.36. Een begrensde functie f : [a, b]→ IR heet Riemann integreer-baar als er precies een getal J tussen de verzameling A van alle ondersommenen de verzameling B van alle bovensommen ligt. In dat geval is per definitie

J =

∫ b

a

f(x) dx.

Het is wel handig om een paar variaties op het thema te hebben bij devraag welke functies nog meer integreerbaar zijn, en welke regeltjes er geldendie wel moeten gelden. De volgende opgaven zijn daartoe nuttig. Zorg datje begrijpt wat de uitspraken zijn en waarom ze waar (moeten) zijn. Hetbegrip oneigenlijk integreerbaar komt ook langs en daar doen we vooral nietmoeilijk over.

Opgave 2.37. Bewijs dat met

Mk = supf(x) : xk−1 < x < xk en mk = inff(x) : xk−1 < x < xk

dezelfde begrensde functies integreerbaar worden als in Definitie 2.36, met dezelfdewaarde van J .

Opgave 2.38. Bewijs dat de functie f gedefinieerd door f(x) = 1 voor alle x ∈ IQen f(x) = 0 voor alle x 6∈ IQ niet integreerbaar is op [0, 1].

Opgave 2.39. Bewijs dat de functie f gedefinieerd door f(0) = 0 en f(x) = sin 1x

voor x 6= 0 integreerbaar is op [0, 1]. Hint: gebruik van sin alleen dat x → sinxbegrensd, periodiek en continu is. In welke x is x→ sin 1

x dan continu? Waarom nieten waarom wel?

54

Page 55: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 2.40. Iedere begrensde integreerbare functie f : [a, b] → IR die op depunten van een partitie

a = x0 < x1 < · · · < xN = b met N ∈ IN

wordt veranderd door g(xk) = ck te stellen voor k = 0, . . . , N voor gegeven waardenck ∈ IR, en g(x) = f(x) voor alle x ∈ [a, b] die niet to P behoren, definieert een

begrensde integreerbare functie g : [a, b] → IR met∫ ba f(x) dx =

∫ ba g(x) dx. Bewijs

dit.

Opgave 2.41. Iedere begrensde functie f : [a, b]→ IR waarvoor er een partitie

a = x0 < x1 < · · · < xN = b met N ∈ IN

bestaat met f monotoon of continu op elk open interval (xk−1, xk) is integreerbaar.Bewijs dit32.

Definitie 2.42. Als a < b dan is∫ b

a

f(x) dx = −∫ a

b

f(x) dx,

vermits f : [b, a]→ IR begrensd en integreerbaar is33.

Opgave 2.43. Laat f : [a, b] → IR begrensd zijn en c ∈ (a, b). Bewijs dat fintegreerbaar is op [a, b] dan en slechts dan als f integreerbaar is op zowel [a, c] als[c, b], en dat in dat geval∫ b

af(x) dx =

∫ c

af(x) dx+

∫ b

cf(x) dx.

Definitie 2.44. Laat −∞ ≤ a < b ≤ ∞ en f : (a, b)→ IR integreerbaar zijnop elke interval [A,B] ⊂ (a, b). Dan is per definitie de (eventueel) oneigen-lijke34 integraal van a tot b gelijk aan∫ b

a

f(x) dx = limA↓a

limB↑b

∫ B

A

f(x) dx,

als deze limiet van een limiet bestaat.32 Hiermee ben je van een hoop gezeur af.33 Consistent met de intuıtie dat dx in

∫ baf(x) dx negatief is als a > b.

34 Denk aan a en of b niet eindig, of f niet gewoon integreerbaar op [a, b].

55

Page 56: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Limieten van limieten zijn verwarrend. Daarom deze opgave die via split-sen tot (twee) gewone limieten leidt, zoals dat bij calculus doorgaans aange-leerd wordt.

Opgave 2.45. Neem in Definitie 2.44 een c ∈ (a, b). Bewijs dat∫ b

af(x) dx =

∫ c

af(x) dx+

∫ b

cf(x) dx

als beide integralen, eventueel als∫ c

af(x) dx = lim

A↓a

∫ c

Af(x) dx en

∫ b

cf(x) dx = lim

B↑b

∫ B

cf(x) dx,

bestaan35.

Terug naar de gewone integralen merken we nu op dat de Riemann inte-greerbare functies een (vector)ruimte36 over IR vormen. As je nog niet weetwat een vectorruimte is lees dan de voetnoot, doe even alsof

f =

(f1

f2

)en g =

(g1

g2

)2-vectoren in IR2 zijn, waarvoor de gebruikelijk vectoroptelling en vermenig-vuldiging met scalairen λ, µ uit het lichaam IR wel bekend zullen zijn, en jebegrijpt waarom IR2 een vectorruimte genoemd wordt. Iedere f ∈ IR2 heeftcoordinaten fi genummerd door i ∈ 1, 2 en met functies f : [a, b] → IRis het net zo. De “coordinaten” van f worden alleen niet genoteerd met fxmaar met f(x), genummerd door x ∈ [a, b] (en niet in een kolommetje gezet).De verzameling van alle functies f : [a, b]→ IR is zo op een vanzelfsprekendemanier net zo’n vectorruimte als IR2.

Meer over vectorruimten hoef je hier voorlopig niet te weten, maar ishet wel goed om op te merken dat dat deze vectorruimte van alle functiesf : [a, b] → IR een heleboel deelvectorruimten heeft, bijvoorbeeld RI([a, b]),de verzameling van alle Riemann integreerbare functies f : [a, b]→ IR.

Opgave 2.46. De verzameling van begrensde integreerbare functies f : [a, b]→ IRis een vectorruimte37 over IR, hier RI([a, b]) genaamd. Bewijs dit, en ook dat

f →∫ b

af(x) dx

35 Vaak schrijft men limA↓a = limA→a+ en limB↑b = limB→b− .36 Met f, g Riemann integreerbaar is λf + µg het ook voor alle λ, µ ∈ IR.37 Is met met f, g ∈ RI([a, b]) ook fg ∈ RI([a, b])? Hint: neem f, g eerst positief.

56

Page 57: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

een lineaire38 afbeelding is van deze vectorruimte naar IR. Hint: laat met name ziendat met f, g ∈ RI([a, b]) ook f + g ∈ RI([a, b]) en∫ b

a(f(x) + g(x)) dx =

∫ b

af(x) dx+

∫ b

ag(x) dx.

Opgave 2.47. Als f ∈ RI([a, b]) dan is ook x → |f(x)| begrensd en integreerbaarop [a, b] en geldt de “3-hoeksongelijkheid”

|∫ b

af(x) dx| ≤

∫ b

a|f(x)| dx,

te vergelijken met (25). Bewijs dit rechtstreeks uit de definities en geef een voorbeeldvan een begrensde functie f : [a, b]→ IR die niet integreerbaar is waarvoor x→ |f(x)|het wel is.

Opmerking 2.1. Een functie f : [a, b]→ IR kan alleen maar Riemann inte-greerbaar zijn als f begrensd is. Maar welke begrensde functies integreerbaarzijn is een vraag die we nog niet gesteld hebben. Zonder bewijs: het antwoordis dat daartoe de verzameling N van x-waarden waarin f niet continu is eenzogenaamde nulverzameling moet zijn. Dat is een verzameling die voor elkeε > 0 overdekt kan worden met intervallen [an, bn] genummerd door n ∈ IN,waarbij voor elke N ∈ IN geldt dat

N∑n=1

(bn − an) ≤ ε.

Overdekken betekent hier dat

N ⊂ ∪n∈IN [an, bn],

en de overdekking hangt af van ε. Intuıtief: met een willekeurig klein inter-valletje opgegeknipt in aftelbaar veel stukjes is N te bedekken.

2.4 Terug- en vooruitblik

Begrensde functies f : [a, b] → IR kunnen via onder- en bovensommen die

willekeurig dicht bij elkaar liggen integreerbaar zijn met integraal∫ baf(x) dx.

38 Wat lineair betekent staat op de volgende bladzijde.

57

Page 58: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Zulke integreerbare functies vormen een lineaire vectorruimte over IR, hiergenoteerd met RI([a, b]). Deze vectorruimte bevat alle (uniform) continuefuncties f : [a, b] → IR, die zelf ook een lineaire vectorruimte over IR vor-men, doorgaans met C([a, b]) aangeduid. Ook bevat RI([a, b]) alle monotonefuncties f : [a, b]→ IR maar die vormen geen vectorruimte39.

De vectorruimte RI([a, b]) is zelf ook weer een deelvectorruimte van allefuncties f : [a, b]→ IR, die met de bewerkingen gedefinieerd door

(f + g)(x) = f(x) + g(x), (λf)(x) = λf(x)

voor alle f, g : [a, b] → IR, alle λ ∈ IR en alle x ∈ [a, b], een lineaire vec-torruimte over IR vormen, waarbinnen de integraaltheorie zoals hierbovenbehandeld zich afspeelt.

De vectorruimte C([a, b]) kan voorzien worden van diverse normen40,bijvoorbeeld de maximum-norm

f → maxa≤x≤b

|f(x)| = |f |∞ ,

of de zogenaamde 1-norm

f →∫ b

a

|f(x)| dx = |f |1.

Met een norm kunnen we praten over convergentie, waarbij fn → f betekentdat |fn − f | → 0 als n → ∞. Alles hierboven dat met convergente rijenis gekarakteriseerd kan worden overschreven, maar begrensde rijen hebbeni.h.a. geen convergente deelrijen.

De maximum-norm maakt van C([a, b]) een genormeerde ruimte waarinCauchyrijtjes convergent zijn. Zulke ruimten heten Banachruimten, abstractvaak genoteerd met hoofdletters achterin het alphabet, zie Hoofdstuk 10.Met deze norm is de lineaire afbeelding in Opgave 2.46 continu in de zin datfn → f in de maximum norm (uniforme convergentie) impliceert dat∫ b

a

fn →∫ b

a

f,

een uitspraak die onder vele andere zwakkere voorwaarden ook geldt. Merkop dat C([a, b]) ook een algebra41 is, i.e. met f, g ∈ C([a, b]) zit ook x →f(x)g(x) in C([a, b]) en aan een voor de hand liggend lijstje42 axioma’s isvoldaan.

In Hoofdstuk 4 beginnen we met de differentiaalrekening43 voor functies

39 Waarom niet?40 Wikipidia: normed vector space: Hier: notatie met enkele strepen, |x| i.p.v. ||x||.41 Een commutatieve Banachalgebra zelfs.42 See in wikipedia: algebra over a field.43 Af en toe terugbladerend verder lezen vanaf (9.37) is nu een optie.

58

Page 59: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

van IR naar IR, om uiteindelijk ook differentiaalrekening te doen voor func-ties44 van X naar Y . Daartoe zullen we ook integraalrekening voor functiesvan IR naar X nodig hebben. De beschouwingen over integralen van functiesvan IR naar IR sluiten we nu af met een reflecterende opgave, en in IR is erdan eerst nog een hoofdstukje over die convergente deelrijen en zo.

Opgave 2.48. Teken een plaatje met een x-as en een y-as zonder pijltjes, markeer Tekenplaatje!

een x = a en een x = b op de x-as en teken een grafiek van zo maar een continuef(x) zonder nulpunten of tekenwisselingen gedefinieerd voor x tussen a en b. Kies pasna dat je dit gedaan hebt de pijltjes op de assen die aangeven of x naar links of naarrechts loopt en y naar beneden of naar boven. Er zijn vier mogelijkheden om dat tedoen. Relateer in alle vier de gevallen de integraal∫ b

af(x) dx

aan de (bij algemene afspraak) positieve oppervlakte van het gebied ingesloten door

x = a, x = b, y = 0 en y = f(x). In welk geval is zowel f als∫ ba f(x) dx positief?

Verifieer dat dan b > a en dat je de positieve x-as 3 uren tegen de klok in om deoorsprong moet draaien om de positieve y-as te krijgen. Hint: als je dit een stommeopgave vindt lees dan alvast Sectie 6.9 en kijk naar Opgave 6.21.

2.5 Verdiepingsmoment: tussensommen

We zijn begonnen met onder- en bovensommen om integralen van monotonefuncties f : [a, b] → IR zo eenvoudig mogelijk te behandelen. Voor continuefuncties kunnen we echter net zo goed kijken naar sommen van de vorm

SN =N∑k=1

f(ξk)(xk − xk−1), met ξk ∈ [xk−1, xk] (2.13)

gegeven de partitie (2.4) vrij te kiezen voor elke k = 1, . . . , N . Vanzelfspre-kend geldt

SN ≤ SN ≤ SN ,

met SN en SN als in (2.8) en het bewijs van Stelling 2.23 herlezend is via(2.10) duidelijk dat ook |SN − J | ≤ ε(b − a) als xk − xk−1 ≤ δ voor allek = 1, . . . , N .

Het is nu een aardige en nuttige oefening om wederom via een rij equi-distante partities met N = 1, 2, 4, 8, 16, . . . , met voor ξk steeds ξk = xk

44 Of, ander woord, afbeeldingen.

59

Page 60: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

gekozen, direct en zonder de ordening van boven- en ondersommen te ge-bruiken te laten zien dat er een limietwaarde J bestaat, en daarna voor dezeJ op dezelfde conclusie uit te komen.

Stelling 2.49. Als f : [a, b] → IR uniform continu is dan is er een uniekeJ ∈ IR waarvoor voor iedere SN als in (2.13) geldt dat |SN − J | ≤ ε(b− a),mits xk − xk−1 ≤ δ voor alle k = 1, . . . , N , waarbij δ > 0 bij ε > 0 gekozenis zoals in de definitie van uniforme continuıteit van f : [a, b]→ IR.

Opgave 2.50. Bewijs Stelling 2.49 zonder de ordening van boven- en ondersommente gebruiken. Hint: nodig voor zo’n bewijs is de convergentie van Cauchyrijen.

60

Page 61: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

3 Convergente (deel)rijen en zo

In het bewijs van Stelling 2.32 hebben we voor het eerst gebruik gemaaktvan de volgende stelling, waarvan het belang in de analyse moeilijk is teonderschatten, ook als je van mening bent dat’ie eigenlijk triviaal is en verdergeen betoog behoeft.

Stelling 3.1. Iedere begrensde rij xn in IR heeft een convergente deelrij.

De lezer die de verhaallijn over integraal- en differentiaalrekening niette veel wil onderbreken kan eventueel de volgende drie secties overslaan endoorlezen in Sectie 3.6 voor een direct bewijs van Stelling 3.1, maar mistdan leerzame oefeningen met kwantoren en een belangrijke techniek uit deanalyse: de truc van de diagonaalrij, waarmee meerdere belangrijke stellingenworden bewezen, waaronder een stelling over begrensde rijen in C([a, b]).

3.1 Spelen met kwantoren

Voor we laten zien waarom deze stelling eigenlijk triviaal is spelen we eerstnog wat met de kwantoren ∀ en ∃.

De kale definitie in Definitie 2.26 met kwantoren van het convergent zijnvan de rij xn wordt ook wel getekstzet als

∃x∈IR ∀ε>0 ∃N∈IN ∀n∈IN : n ≥ N =⇒ |xn − x| ≤ ε,

hetgeen misschien net iets prettiger oogt dan alles op dezelfde regelhoogte.We kunnen ook zeggen dat x ∈ IR een limiet is van de rij xn ∈ IR als geldtdat

∀ε>0 ∃N∈IN ∀n∈IN : n ≥ N =⇒ |xn − x| ≤ ε,

en vergelijken deze definitie met de kale versie van f : [a, b] → IR uniformcontinu:

∀ε>0 ∃δ>0 ∀x,y∈[a,b] : |x− y| ≤ δ =⇒ |f(x)− f(y)| ≤ ε. (3.1)

Beide definities eindigen met een implicatie, maar x ∈ IR limiet van derij xn ∈ IR schrijven we net zo lief als

∀ε>0 ∃N∈IN ∀n≥N : |xn − x| ≤ ε,

waarin we stilzwijgend n altijd in IN nemen. De variant op deze uitspraakdie Cauchy bedacht, zie Definitie 2.33, is

∀ε>0 ∃N∈IN ∀m,n≥N : |xn − xm| ≤ ε,

61

Page 62: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

een rij die hieraan voldoet noemen we een Cauchyrij.

De (logische) ontkenning van f : [a, b]→ IR uniform continu is gebruikt inOpgave 2.31. Die ontkenning krijg1 je door in een keten van zulke kwantorende verwisseling

∀ ↔ ∃

toe te passen en de laatste uitspraak te ontkennen. Dit geeft

∃ε>0 ∀δ>0 ∃x,y∈[a,b] : |x− y| ≤ δ ∧ |f(x)− f(y)| > ε

als ontkenning van de uniforme continuiteit van f : [a, b]→ IR, waarbij het deimplicatie is die in de laatste stap ontkend is: x en y voldoen wel |x− y| ≤ δmaar het is niet zo dat |f(x)− f(y)| ≤ ε.

Evenzo is de ontkenning van het convergent zijn van de rij xn ∈ IR teformuleren met als laatste stap de ontkenning van de implicatie, maar deformulering dat x ∈ IR geen limiet is van de rij xn ∈ IR is natuurlijk ookgewoon de ontkenning van de uitspraak zonder implicatie, i.e.

∃ε>0 ∀N∈IN ∃n≥N : |xn − x| > ε.

Dat en-tekentje ∧ voor de ontkenning van een implicatie is dan niet nodig.

Opgave 3.2. Formuleer de logische ontkenningen van alle quantorenuitspraken hier-boven.

3.2 Elementaire opgaven over convergente rijen

Een sectie om over te slaan als je de verhaallijn integraal- en differentiaalre-kening niet te veel wil onderbreken, maar deze opgaven zijn een must voorde beheersing van de stof.

Opgave 3.3. Iedere convergente rij in IR is begrensd. Bewijs dit.

Opgave 3.4. Iedere Cauchyrij in IR is begrensd. Bewijs dit.

1 Overtuig zelf hiervan zonder waarheidstabellen.

62

Page 63: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 3.5. Iedere convergente rij in IR is een Cauchyrij. Bewijs dit.

Opgave 3.6. Als xn en yn convergente rijen zijn in IR dan is de rij xn + yn ookconvergent in IR met de limiet die je verwacht. Bewijs dit.

Opgave 3.7. Als xn en yn convergente rijen zijn in IR dan is de rij xnyn ookconvergent in IR met de limiet die je verwacht. Bewijs dit.

Opgave 3.8. Als xn een convergente rij is in IR met xn 6= 0 voor alle n dan is derij 1

xnook convergent in IR met de limiet die je verwacht, tenzij de limiet van de rij

xn gelijk is aan 0. Bewijs dit.

Opgave 3.9. Als xn een convergente rij is in IR dan is de rij |xn| ook convergent inIR met de limiet die je verwacht. Bewijs dit.

3.3 Limietpunten en convergente deelrijen

Het grappige is dat een wellicht per abuis opgeschreven mix van de uitspraakdat x ∈ IR de limiet van de rij xn ∈ IR en de uitspraak dat x ∈ IR juist geenlimiet is van de rij xn ∈ IR precies de definitie is van een nieuw belangrijkbegrip: we zeggen dat x ∈ IR limietpunt van de rij xn ∈ IR is als

∀ε>0 ∀N∈IN ∃n≥N : |xn − x| ≤ ε, (3.2)

hetgeen iets anders is dan x ∈ IR is limiet van de rij xn ∈ IR, want dat was

∀ε>0 ∃N∈IN ∀n≥N : |xn − x| ≤ ε. (3.3)

De uitspraak in (3.2) is er een om goed te lezen. Je ziet namenlijk vastniet meteen deze uitspraak equivalent is met het bestaan van een convergentedeelrij van xn met limiet x. Om te onthouden nu is dat een rij met eenlimiet begrensd is en maar een limiet heeft, terwijl een begrensde rij altijdtenminste een limietpunt (de limiet van een convergente deelrij) heeft2. Merk

2 En wellicht een heleboel limietpunten, je kunt het zo gek niet verzinnen.

63

Page 64: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

op dat iedere strict stijgende rij nk ∈ IN een deelrij van de rij xn in IRdefinieert, genummerd door k in xnk . Als we het hebben over een deelrij vanxn is dit precies wat we bedoelen: we maken de deelrij door uit de door ngenummerde rij xn alle xn weg te laten waarvoor n niet als nk in de gegevenstrict stijgende rij nk ∈ IN voorkomt. De laatste cursief gedrukte uitspraakis een herformulering van Stelling 3.1 waar dit hoofdstuk in eerste instantieover gaat.

Opgave 3.10. Bewijs dat een limietpunt van de rij xn altijd de limiet is van eenconvergente deelrij xnk .

Opgave 3.11. Bewijs dat iedere convergente rij begrensd is en geef een voorbeeldvan een rij xn ∈ [0, 1] die als limietpunten alle punten in [0, 1] heeft.

Bewijs van Stelling 3.1. Neem nu een rij xn ∈ IR die begrensd is, zeg zon-der beperking der algemeenheid geheel bevat in [0, 1]. Dan moet tenminsteeen van de twee intervallen [0

2, 1

2] of [1

2, 2

2] voor oneindig veel n het element

xn bevatten. Noem dat interval I1 = [m1

2, m1+1

2]. Dus m1 = 0 of m1 = 1,

al naar gelang het interval waarin die oneindig veel xn zitten. Nummer debijbehorend n met een index j als een strict stijgende rij n1j ∈ IN. De eersteindex 1 geeft aan dat dit de eerste deelrij is die we kiezen.

Herhaal vervolgens het argument voor deze deelrij maar nu met de in-tervallen [m1

2+ 0

4, m1

2+ 1

4] en [m1

2+ 1

4, m1

2+ 2

4]. Er is dus een verdere deelrij

die geheel in een van de twee intervallen zit. Noem het betreffende intervalI2 = [m1

2+ m2

4, m1

2+ m2+1

4] en de indices van die verdere deelrij n2j ∈ IN.

Enzovoorts. Dit geeft

xnkj ∈ Ik = [k∑l=1

ml

2l,

k∑l=1

ml

2l+

1

2k+1]

voor alle j ∈ IN. Omdat we steeds verdere deelrijen nemen zijn de nkj strictstijgend in j en niet-dalend in k. We zien dat xnkk een deelrij van de (doorn ∈ IN genummerde) rij xn is omdat nkk ∈ IN een strict stijgende rij is.

Opgave 3.12. Maak het bewijs af door de laten zien dat de door k genummerde“diagonaalrij”xnkk een convergente deelrij is. Bewijs dat de limiet x van deze deelrijeen limietpunt is van de rij, dus dat voldaan is aan (3.2).

64

Page 65: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

3.4 Begrensde rijen continue functies

We merken we op dat in onze mooie Banachruimte3 C([a, b]) de uitspraak overconvergente deelrijen van begrensde rijen niet waar is. Niet elke begrensderij fn ∈ C([a, b]) heeft een deelrij die in de maximumnorm convergent is4.Maar wel als de rij aan deze extra aanname voldoet:

∀ε>0 ∃δ>0 ∀n∈IN ∀x,y∈[a,b] : |x− y| ≤ δ =⇒ |fn(x)− fn(y)| ≤ ε. (3.4)

De rij fn heet dan equicontinu op [a, b].De stelling van Ascoli-Arzela zegt nu dat iedere begrensde en op [a, b]

equicontinue rij fn : [a, b] → IR een uniform convergente5 deelrij heeft metlimiet f in C([a, b]). Deze stelling is iets minder6 triviaal maar je bewijsthem met Stelling 3.1, en weer een “diagonaalargument”.

Opgave 3.13. Moeilijk: formuleer en bewijs de Stelling van Ascoli-Arzela zoalshierboven verwoord. Hint: neem zonder beperking der algemeenheid [a, b] = [0, 1] engebruik diagonaalargumenten om een deelrij fnk te maken die in elk binaire getal

k

2l

convergeert. Met de equicontinuiteit van de rij fn kun je daarna bewijzen dat fnk eenCauchyrij is in de maximumnorm.

3.5 Overaftelbaarheid van de reele getallen

De diagonaalargumenten hierboven zijn varianten op het argument in hetbewijs dat ( IQ wel maar) IR geen aftelbare verzameling is. Een bekend bewijsuit het ongerijmde gaat uit van een aftelling van alle getallen tussen 0 en 1met

rk =∞∑j=1

nkj10j

,

waarbij de decimalen nkj in een blok

3 Met de maximumnorm.4 Verzin een voorbeeld met functies fn die alleen waarden tussen 0 en 1 aannemen.5 Moeilijke woorden voor convergentie in de maximumnorm.6 Lees: gewoon moeilijk.

65

Page 66: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

n11 n12 n13 n14 n15 n16 n17 n18 · · ·n21 n22 n23 n24 n25 n26 n27 n28 · · ·n31 n32 n33 n34 n35 n36 n37 n38 · · ·n41 n42 n43 n44 n45 n46 n47 n48 · · ·n51 n52 n53 n54 n55 n56 n57 n58 · · ·n61 n62 n63 n64 n65 n66 n67 n68 · · ·n71 n72 n73 n74 n75 n76 n77 n78 · · ·n81 n82 n83 n84 n85 n86 n87 n88 · · ·

......

......

......

......

gezet worden dat naar rechts en naar onder doorloopt. Gegeven de doorlo-pende diagonaalrij nkk kies je dan decimalen dk met |dk−nkk| = 2 of zo. Hetgetal

∞∑j=1

dj10j

kan dan niet in de rij rk voorkomen.

3.6 Directer bewijs voor de convergente deelrijstelling

Wat nu volgt is de uitwerking van een opgave die Han Peters me ooit gaf:bewijs dat een rij xn altijd een monotone deeltij heeft.

Als een rij xn ∈ IR begrensd is dan heeft’ie een kleinste bovengrens M1 ∈IR. Kan het zijn dat M1 geen rijelement is? Vast wel, en als dat het geval isdan moeten er dus rijelementen dicht van onder bij M1 liggen. Bijvoorbeeldboven de M1 − 1, dus zeg dat xn1 het eerste rijelement is waarvoor

M1 − 1 < xn1 < M1

geldt. Omdat xn1 zelf geen bovengrens kan zijn, is er dus ook een eerste n2

waarvoorM1 − 1 < xn1 < xn2 < M1,

en dan geldt n2 > n1 want anders was xn1 niet de eerste in de rij die boven7

M1−1 ligt. En zo gaat dat verder. De conclusie is dat een kleinste bovengrensM1 van een rij xn ∈ IR die zelf niet in de rij voorkomt, de limiet is van eenstrict stijgende rij xnk in IR, met nk een strict stijgende rij nk in IN.

7 Voor de beeldvorming zien we IR hier even als verticale getallenlijn.

66

Page 67: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Wat nu als we aannemen dat de rij xn zulke strict stijgende deelrijenhelemaal niet heeft? Dan is M1 dus een rijelement, zeg M1 = xn1 (met eentotaal andere n1 dan hierboven8). Maar de deelrij xn die begint bij n = n1+1heeft dan een kleinste9 bovengrens M2 die op zijn hoogst gelijk is aan M1, endie M2 moet weer aangenomen worden door een xn2 met n2 > n1. Dat gaatzo weer door en dus is er dan een strict stijgende rij nk in IN waarvoor xnkeen niet-stijgende rij in IR is.

We concluderen dat iedere begrensde rij xn in IR een (niet per se strict)monotone deelrij xnk heeft, en als je er even over nadenkt dan geldt de uit-spraak voor elke rij in IR. Deze stelling, die Han weer kende uit het boek Ele-mentary Analysis van Ross, trivialiseert10 Stelling 3.1, wederom vanwege hetbestaan van grootste ondergrenzen en kleinste bovengrenzen van begrensdeverzamelingen in IR, en dus onthouden we hem!

Stelling 3.14. Iedere rij xn in IR heeft een monotone deelrij.

Voor wie de twee secties hierboven heeft overgeslagen, de stelling in Op-gave 3.13 is wel erg relevant voor later, maar merk nu in de context vanrijen en reeksen in IR vooral op hoe de conclusies aan het eind van Sectie27.3 met het bestaan van kleinste bovengrenzen samenhangen. Daarom nade volgende opgaven nog een belangrijke subsectie over (onvoorwaardelijke)convergentie van reeksen.

Opgave 3.15. Vul de details in: iedere Cauchyrij xn in IR is begrensd, heeft eenmonotone en dus convergente deelrij, en is daarmee convergent.

Opgave 3.16. Achteraf merken we nu op dat Stelling 3.14 ook geldt voor rijen inIQ, want IQ ⊂ IR. Dus dat moet te bewijzen zijn zonder die kleinste bovengrenzen diealleen maar in IR altijd bestaan. Denk daar maar eens over na.

8 Nog afgezien van het feit dat die n1 hierboven nu niet meer hoeft te bestaan.9 Als sk = supn≥k xn dan is sk een niet-stijgende rij met limiet

limk→∞

sk = infk∈IN

sk = infk∈IN

supn≥k

xn = lim supn→∞

xn

10 Maakt’ie ook het diagonaalargument voor de overaftelbaarheid van IR overbodig?

67

Page 68: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

3.7 Onvoorwaardelijke convergentie

Dat gezeur over die convergentie van reeksen willen we zo veel mogelijk ver-mijden. Maar toch. We willen nu eenmaal met aftelbare sommen als

S =∞∑n=0

an = a0 + a1 + a2 + · · · (3.5)

rekenen alsof het getallen zijn en alles mag11. En wat moet mogen is

a0 + a1 = a1 + a0,

de volgorde van optellen moet niet uitmaken. Voor sommen als in (3.5)betekent dit dat we willen dat

S =∞∑n=0

aφ(n) (3.6)

voor elke bijectie12 φ : IN0 → IN0, maar waarom zou dit zo moeten zijn in dealledaagse wiskundige werkelijkheid?

De basale aanname die we steeds maken is (23), i.e.

∞∑n=0

|an| <∞,

te lezen als dat de rij partiele sommen

N∑n=0

|an|

begrensd is, met dus een kleinste bovengrens die we T noemen. Bij iedereε > 0 is er dan een N = Nε ∈ IN0 waarvoor met m = Nε geldt dat

T − ε <Nε∑n=0

|an| ≤ T, (3.7)

want anders was T geen kleinste bovengrens. Bijgevolg is

m∑n=Nε+1

|an| < ε (3.8)

11 Lees: goed is.12 Ongetwijfeld kent de lezer deze tot het algemene cultuurgoed behorende term.

68

Page 69: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

voor alle m > Nε, want anders was T geen bovengrens.Hopelijk betekent dit voor

SN =N∑n=0

an en SφN =N∑n=0

aφ(n)

en

TN =N∑n=0

|an| en T φN =N∑n=0

|aφ(n)|

datSN → S, SφN → S, TN → T, T φN → T (3.9)

als N →∞, en|S| ≤ T, (3.10)

maar voorlopig weten we behalve |SN | ≤ T en |SφN | ≤ T alleen dat TN → T .Het gaat dus nog om convergentie van de andere drie in (3.9). Hoe zit

het met T φN? De bijectie φ : IN0 → IN0 is een permutatie van IN0. Als we

IN0 = n = φ(m) : m ∈ IN0

aftellen met m ∈ IN0, dan hebben we vroeg of laat, zeg met m = 0, 1 . . . ,Mε,alle n ∈ IN0 tot en met Nε gehad. Bijgevolg is

T − ε < TNε ≤ T φMε≤ T.

Voor de gewone partiele sommen hebben we

|SφMε− SNε| ≤

∞∑n=Nε+1

|an| ≤ ε

want SφMε− SNε is een eindige som van termen an met alleen maar n > Nε,

en evenzo is voor alle m > Nε

|Sm − SNε | ≤∞∑

n=Nε+1

|an| ≤ ε.

Dan staat het er eigenlijk al wat we willen.

Opgave 3.17. Gebruik (3.7) en (3.8) en met ε = 1k , k ∈ IN, om te laten zien dat

ook T φN → T , en dat SN en SφN convergeren, naar een en dezelfde S ∈ IR, eerst langs(verschillende) deelrijen Nk.

69

Page 70: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Hiermee zijn (3.9) en (3.10) bewezen, en we vatten het resultaat samen ineen nog iets algemenere stelling die toereikend is voor wat we later nog nodighebben, en die ook geldt voor aftelbare sommen van complexe getallen.

Stelling 3.18. Laat an genummerd door n ∈ IN0 een rij in IR zijn. Als departiele sommen

TN =N∑n=0

|an|

een door N ∈ IN0 genummerde begrensde rij vormen, dan zijn voor elkebijectie φ : IN0 → IN0 de rijen

SφN =N∑n=0

aφ(n) en T φN =N∑n=0

|aφ(n)|

convergent, met limieten respectievelijk S en T die niet van φ afhangen, ener geldt dat |S| ≤ T . We schrijven

S =∞∑n=0

an =∞∑n=0

aφ(n) en |∞∑n=0

an| ≤∞∑n=0

|an| = T.

De uitspraak over de rijen SφN en T φN geldt ook voor (iedere) bijectie φ :IN0 → A als A een (dan per definitie) aftelbare verzameling is, en voor degetallen aα ∈ IR met α ∈ A geldt dat

N∑n=0

|aφ(n)|

een begrensde rij is. In dat geval schrijven we

S =∑α∈A

aα, T =∑α∈A

|aα|, met wederom |S| ≤ T.

70

Page 71: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

4 Van integraal- naar differentiaalrekening

Wat voor eigenschappen heeft de functie F : [a, b]→ IR gedefinieerd door

F (x) =

∫ x

a

f(s) ds (4.1)

als f ∈ RI([a, b])? Om deze vraag te beantwoorden schrijven we, voor eenvaste x0 ∈ [a, b] en een variable h, de integraal met bovengrens x0 + h als

F (x0 + h) =

∫ x0+h

a

f(s) ds =

∫ x0

a

f(s) ds︸ ︷︷ ︸F (x0)

+

∫ x0+h

x0

f(s) ds.

Als M een bovengrens is voor de waarden die |f(x)| aanneemt voor x ∈ [a, b]dan geldt voor de tweede term dat

|∫ x0+h

x0

f(s) ds| ≤M |h|,

en dus is F uniform Lipschitz continu op [a, b], want met x = x0 + h eny = x0 volgt

|F (x)− F (y)| ≤M |x− y|

voor alle x, y ∈ [a, b].Dit scherpen we aan door

F (x0 + h) = F (x0) +

∫ x0+h

x0

(f(x0) + f(s)− f(x0)) ds

= F (x0) +

∫ x0+h

x0

f(x0) ds+

∫ x0+h

x0

(f(s)− f(x0)) ds

te schrijven. Met

R(h;x0) =

∫ x0+h

x0

(f(s)− f(x0)) ds, (4.2)

volgt nu datF (x0 + h) = F (x0) + f(x0)h+R(h;x0), (4.3)

waarin we de eerste twee termen zien als lineaire1 benadering van F (x0 + h)als h klein is.

1 Beter: affien. De afbeelding h→ f(x0)h is lineair, h→ F (x0) + f(x0)h niet.

71

Page 72: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Hoe groot kan de restterm (4.2) zijn? Als f continu is in x0, dan is ergegeven iedere ε > 0 een δ > 0 zodanig dat

|f(s)− f(x0)| ≤ ε als |s− x0| ≤ δ.

Voor de s in de integrand is dit laatste zeker het geval als |h| ≤ δ en met de3-hoeksongelijkheid voor integralen volgt dan dat

|R(h;x0)| ≤ ε|h| als |h| ≤ δ (4.4)

en x0 + h ∈ [a, b]. Deze uitspraak wordt genoteerd als

R(h;x0) = o(h) als h→ 0,

spreek uit: R(h;x0) is kleine o van h voor h gaat naar nul2.

Definitie 4.1. Een functie F : [a, b]→ IR heet differentieerbaar in x0 ∈ [a, b]als er een getal f(x0) ∈ IR bestaat zodanig dat (4.3) geldt voor alle x =x0 + h ∈ [a, b], met een restterm R(h;x0) waarvoor geldt dat R(h;x0) = o(h)als h→ 0.

In deze definitie kan [a, b] vervangen worden door een willekeurig intervalI ⊂ IR. Als x0 = a dan wel x0 = b spreken we van rechts- dan wel linksdif-ferentieerbaar. Alleen h ≥ 0 dan wel h ≤ 0 zijn dan toegestaan. De waardef(x0) heet de afgeleide van F in x0, notatie F ′(x0) = f(x0).

In Hoofdstuk 5 komen we uitgebreid te spreken over de basale rekenregelsvoor en voorbeelden van differentieerbare functies. De enige rekenregel diewe hier zometeen al nodig hebben is:

Opgave 4.2. Als F : [a, b] → IR en G : [a, b] → IR differentieerbaar zijn in x0 ∈[a, b], dan is ook de verschilfunctie F − G differentieerbaar in x0 ∈ [a, b] met (F −G)′(x0) = F ′(x0)−G′(x0). Bewijs dit.

De andere rekenregels voor differentieerbare functies zullen we in dit hoofd-stuk al tegenkomen als bijprodukten in de behandeling van een eerste vormvan de kettingregel in Sectie 4.6 na de impliciete functies in Sectie 4.4 diehier eerder aan de orde komen dan doorgaans gebruikelijk.

De afgeleide kan voor zo’n vaste x0 gezien worden als een lineaire afbeel-ding3 van IR naar IR, gegeven door

h→ F ′(x0)h. (4.5)

2 Niet te verwarren met de grote O van h die nog komt (en je misschien al gezien hebt).3 Voor F : X → IR wordt dit F ′(x0) : X → IR in Sectie 10.2.

72

Page 73: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Als F in elke x0 ∈ [a, b] differentieerbaar is, met afgeleide F ′(x0), dan isdaarmee een functie f : [a, b] → IR gedefinieerd die de afgeleide functie vanF wordt genoemd. De functie F heet dan een primitieve functie voor f(ook wel: anti-afgeleide van). Daarvan hebben we met (4.1) hierboven eenbelangrijk voorbeeld al gezien, en dat is meteen een eerste hoofdstelling vande integraalrekening.

Stelling 4.3. Definieer voor f ∈ RI([a, b]) de functie F ∈ C([a, b]) door

F (x) =

∫ x

a

f(s) ds.

Dan is F differentieerbaar in elke x0 ∈ [a, b] waar f continu is, met afgeleideF ′(x0) = f(x0).

Stelling 4.3 zegt dus dat iedere continue functie f : [a, b]→ IR een primi-tieve functie heeft. Met de functie F uit de stelling geldt4 dat∫ b

a

f(x) dx = F (b)− F (a), (4.6)

omdat F (a) = 0. Tellen we bij deze F een constante op dan blijft (4.6)natuurlijk waar omdat we in het rechterlid een verschil van F -waarden heb-ben staan. Maar geldt (4.6) nu ook voor alle primitieve functies van f?Het antwoord is ja, maar daar is een nieuwe stelling voor nodig die nog veelmeer toepassingen heeft. Een stelling over differentiequotienten, differentie-quotienten waarvan we de limiet5 pas nemen in het volgende hoofdstuk, zieOpgave 5.2. Deze subsectie besluiten we met een opgave waarin we de boelomdraaien:

Opgave 4.4. Gebruik Opgave 2.9 en de resultaten hierboven om te laten zien datde afgeleide van x → xn gelijk is aan x → nxn−1. Hint: niet de definitie vandifferentieerbaarheid zelf gebruiken nu. Beperk je argumenten tot het geval x ≥ 0.

4.1 De middelwaardestelling

Zijn er functies die differentieerbaar zijn op een interval met afgeleide overalnul, maar zelf niet constant? De stelling die dit uitsluit is de middelwaarde-stelling:

4 In je achterhoofd: vergelijk dit met Opgave 2.9.5 De limiet van een differentiequotient krijgt pas daar de naam differentiaalquotient.

73

Page 74: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Stelling 4.5. Laat F ∈ C([a, b]) differentieerbaar zijn op het open interval(a, b). Dan is er een ξ in (a, b) zodanig dat

F (b)− F (a)

b− a= F ′(ξ)

Onthoud de uitspraak in deze stelling bijvoorbeeld als dat een differentie-quotient (alleen van IR-waardige functies!) altijd een afgeleide is in een tus-senpunt, en teken een plaatje van de grafiek met (niet zo maar) twee lijnen Teken

plaatje!die allebei dezelfde richtingscoefficient hebben.

Deze middelwaardestelling is een gevolg van de uitspraak in Opgave 2.35over maxima en minima van functies F ∈ C([a, b]), en een uitspraak overde afgeleide in het geval dat zo’n extreme waarde wordt aangenomen in eenx0 ∈ (a, b) waar F differentieerbaar is. De volgende opgaven laten dat zien.

Stelling 4.6. Laat F : (a, b) → IR een functie zijn. Als er een punt x0 ∈(a, b) is waarin F differentieerbaar is, en ook geldt dat F (x) ≤ F (x0) vooralle x ∈ (a, b), dan is F ′(x0) = 0.

Definitie 4.7. Een x0 ∈ (a, b) waarin F : (a, b) → IR differentieerbaar ismet F ′(x0) = 0 heet een stationair punt van F en F heet dan stationair inx0.

Opgave 4.8. Bewijs Stelling 4.6 rechtstreeks vanuit Definitie 4.1.

Opgave 4.9. Bewijs Stelling 4.5 in het geval dat F (a) = F (b) = 0 (dit gevalstaat bekend als de Stelling van Rolle6). Hint: gebruik Stelling 4.6 en Opgave 2.35.Onderscheid de gevallen m < 0 ≤M , m ≤ 0 < M en m = 0 = M .

Opgave 4.10. Herleid het algemene geval in Stelling 4.5 tot het resultaat in Opgave4.9 door van F een lineaire7 functie G met G(x) = αx+β af te trekken, met α, β ∈ IRzo gekozen dat F (a) = G(a) en F (b) = G(b).

Opgave 4.11. Als (a, b) ⊂ IR een interval is en F : (a, b)→ IR een differentieerbarefunctie met F ′(x) = 0 voor alle x ∈ (a, b) dan is er een C ∈ IR zo dat F (x) = C voor

6 Read about Rolle in wikipidia.7 Beter gezegd: een functie waarvan de grafiek een rechte lijn is.

74

Page 75: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

alle x ∈ (a, b). Bewijs deze niet-triviale uitspraak! Wat betekent deze uitspraak in hetlicht van Opgave 4.2 voor twee differentieerbare functies F en G van (a, b) naar IRwaarvoor geldt dat F ′(x) = G′(x) voor alle x ∈ (a, b)?

4.2 Integralen via primitieve functies

Met I = [a, b] verwijst Definitie 4.1 naar het voorbeeld gedefinieerd door(4.1), waarin F differentieerbaar in elk punt x0 ∈ [a, b] waar f continu is. Inhet geval dat een functie F : [a, b]→ IR de eigenschap heeft dat F ′ ∈ C([a, b])concluderen we nu dat

F (x) = F (a) +

∫ x

a

F ′(s) ds. (4.7)

Links en rechts in (4.7) staan immers twee functies die als afgeleide F ′ = fhebben: de integraal in het rechterlid is met F ′(x) = f(x) precies de formule(4.1) waarmee we begonnen zijn en tot Stelling 4.3 zijn gekomen, waarna ook(4.6) volgde.

De functie

x→ F (x)−∫ x

a

F ′(s) ds

heeft dus als afgeleide de nulfunctie en is daarmee vanwege Stelling 4.5 toege-past op iedere [a, b] ⊂ [a, b] constant op [a, b]. In Opgave 4.11 is dit argumentuitgespeld. Door x = 0 in te vullen zien we dat de constante F (a) is. Zokomen we tot een tweede hoofdstelling van de integraalrekening:

Stelling 4.12. Voor f ∈ C([a, b]) geldt dat∫ b

a

f(x) dx = F (b)− F (a),

als F een primitieve functie is van f . Als G een andere primitieve is dan deprimitieve F gedefinieerd door (4.1), dan is F −G constant op [a, b].

Bewijs. Wie goed leest ziet dat het bewijs hierboven al gegeven is: de functieF gedefinieerd door (4.1) is op grond van Stelling 4.3 een primitieve waarvoorvanwege (4.6) de uitspraak in Stelling 4.12 geldt; als G een andere primitieve8

is dan geldt vanwege Stelling 4.5 (nu zonder Opgave 4.11 maar met Opgave4.2) toegepast op de verschilfunctie dat F (b) − G(b) = F (a) − G(a) en dus

8 Bij afspraak boven Stelling 4.3 een functie die differenteerbaar is op heel [a, b].

75

Page 76: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

F (b) − F (a) = G(b) − G(a). Opgave 4.11 geeft tenslotte weer de uitpraakdat F −G constant is.

Kijk nog eens naar Opgave 2.9. De formule in Stelling 4.12 wordt ookwel geschreven als∫

[a,b]

dF = F (x)|ba

met dF = F ′(x)dx = f(x)dx (4.8)

enF (x)|b

a= [F (x)]

b

a= F (b)− F (a),

een formele notatie met de d van F die later in de vectorcalculus nog (al-gemenere) betekenis zal krijgen. De uitdrukking f(x)dx heet een 1-vorm,F = F (x) heet een 0-vorm, en een 1-vorm kan de d van een 0-vorm zijn. Eenen ander is hier nog van latere zorg: te weten als we bij integraal- en dif-ferentiaalrekening met twee of meer variabelen onvermijdelijk uitdrukkingenmet dx en dy voor onze kiezen krijgen, waarbij de d van F (x, y) iets met dxen dy moet zijn, dus dF = f(x, y)dx + g(x, y)dy. Met expressies f(x, y)dxen g(x, y)dy die niet alleen bij elkaar opgeteld worden maar ook met elkaarvermenigvuldigd.

Zoals gezegd, van later zorg, maar merk nu alvast op dat in Stelling 4.12de uitdrukking links kan worden gezien als∫ b

a

werkend op f(x)dx,

en de uitdrukking rechts als

|ba

werkend op F (x),

een wisselwerking tussen “integralen” en differentiaalvormen, waarin verwis-selen van a en b een minteken geeft. Zie in dit verband ook Definitie 2.42 enOpgave 2.48 daaronder.

Opgave 4.13. Als I een interval is en f : I → IR de eigenschap heeft dat f ∈RI([a, b]) voor elk gesloten interval [a, b] ⊂ I, dan varieert

∫ ba f continu met a en b.

Leg nog een keer uit wat dat betekent en waarom.

Opgave 4.14. Stelling 4.12 kan ook geformuleerd worden voor F : [a, b] → IRcontinu differentieerbaar, i.e. F : [a, b] → IR is differentieerbaar en x → F ′(x)definieert een continue functie op [a, b]. Herschrijf de uitspraak

F (b)− F (a) =

∫ b

aF ′(x) dx

76

Page 77: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

via de substitutiex = (1− t)a+ tb = a+ t(b− a)

als

F (b)−F (a) =

∫ 1

0F ′((1− t)a+ tb)(b−a) dt =

∫ 1

0F ′((1− t)a+ tb) dt (b−a), (4.9)

en bewijs deze uitspraak rechtstreeks vanuit de definities, dus zonder het regeltje

dx = (b− a)dt

te gebruiken.

De formule (4.9) zal nog terugkomen9, ook met b en a variabel, niet alleenmet a en b in IR, en niet alleen met IR-waardige functies. Zo’n differentieF (b) − F (a) kan altijd als een integraal van t = 0 tot t = 1 geschrevenworden, als de integrand maar continu is. Maar alleen voor IR-waardigefuncties kunnen we vervolgens zeggen dat de integraal in ligt tussen hetminimum en het maximum van de integrand, en dus gelijk moet zijn aan eenwaarde van F ′(x) op het interval [a, b]: een F ′(ξ) met ξ ∈ [a, b]. Een net ietszwakkere uitspraak dan in Stelling 4.5, onder een veel sterkere aanname danin Stelling 4.5 , nog steeds exclusief voor IR-waardige functies.

Merk op dat als x→ F ′(x) zelf Lipschitz continu is op [a, b], met Lipschitzconstante L, de eerste integraal in (4.9) met b = x herschrijft als∫ 1

0

F ′(a)(x− a) dt+

∫ 1

0

(F ′((1− t)a+ tx)− F ′(a))(x− a) dt,

waarmeeF (x) = F (a) + F ′(a)(x− a) +R(x; a) (4.10)

met

R(x; a) =

∫ 1

0

(F ′((1− t)a+ tx)− F ′(a))(x− a) dt,

en dus

|R(x; a)| ≤∫ 1

0

Lt|x− a|2 dt =L

2|x− a|2. (4.11)

In (4.10) zien we een lineaire benadering met een restterm, die in (4.11)expliciet wordt afgeschat op een constante keer |x−a|2. We schrijven dit als,

R(x; a) = O(|x− a|2),

9 In principe is vanaf hier de sprong naar Sectie 9.6 mogelijk.

77

Page 78: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

spreek uit grote O van x − a in het kwadraat. Zo’n schatting is voldoendeom convergentie van de methode van Newton te bewijzen onder milde voor-waarden, zie Sectie 4.8. Merk op dat O(|x−a|2) = o(|x−a|) als x→ a maari.h.a. niet10 o(|x− a|) = O(|x− a|2).

4.3 Inverse functies

Als I een open interval is met F : I → IR differentieerbaar en F ′(x) > 0voor alle x ∈ I, dan volgt uit de middelwaardestelling (Stelling 4.5) dat Fstrict monotoon stijgend is op I. Voor iedere [a, b] ⊂ I met a < b is het beeldonder F van [a, b] dus bevat in (F (a), F (b)), het beeld van (a, b) onder F in(F (a), F (b)), en kan elke waarde c ∈ (F (a), F (b)) maar een keer11 wordenaangenomen.

Wordt elke waarde c ∈ (F (a), F (b)) ook daadwerkelijk aangenomen? Hetantwoord is ja12 en daarvoor is alleen maar nodig dat F ∈ C([a, b]). ZieHoofdstuk 10 van [HM] of [BE] over die fundamenten van de wiskunde. Ofmaak de volgende opgave.

Opgave 4.15. Laat F ∈ C([a, b]) en neem aan dat F (a) < c < F (b). Beschouwde kleinste bovengrens ξ van de niet-lege verzameling x-waarden in [a, b] waarvoorF (x) < c, dus

ξ = supx ∈ [a, b] : F (x) < c.

Bewijs dat F (ξ) = c.

Stelling 4.16. Laat F ∈ C([a, b]) en neem aan dat F differentieerbaar is metF ′(x0) > 0 in elke x0 ∈ (a, b). Dan bestaat er een functie G ∈ C([F (a), F (b)])met G(F (x)) = x voor alle x ∈ [a, b], F (G(y)) = y voor alle y ∈ [F (a), F (b)]en G is differentieerbaar in elke y0 ∈ [F (a), F (b)] met afgeleide gedefinieerddoor F ′(x0)G′(y0) = 1 als y0 = F (x0) (en x0 = G(y0)).

Opgave 4.17. Het bestaan van G volgt onmiddellijk13 uit de overwegingen bovende stelling en de opgave. We hoeven alleen nog te laten zien dat G differentieerbaar is.Neem daartoe zonder beperking der algemeenheid het geval dat x0 = 0, F (0) = 0 = y0

(dus G(0) = 0), en F ′(x0) = 1. Maak14 het bewijs af door F ′(0) = 1 te relaterenaan het liggen van de grafiek y = F (x) tussen y = (1 + ε)x en x = (1 + ε)y in de Teken

plaatje!

10 Het is gelijkteken wordt hier op een niet-symmetrische manier gebruikt!11 Men zegt dan wel eens dat F injectief is.12 Men zegt dan wel eens dat F surjectief is.13 F en G zijn allebei zowel injectief als surjectief en heten daarom bijecties.14 Na discussie met Thomas Rot is Sectie 6.7 toegevoegd, zou te lezen moeten zijn.

78

Page 79: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

buurt van (x, y) = (0, 0) voor gegeven willekeurige ε > 0. Zorg dat je herformuleringsymmetrisch is in x en y en concludeer dat G′(0) bestaat en gelijk is aan 1.

Opgave 4.18. Reduceer het algemene geval via geschikte hulpfuncties tot het spe-ciale geval F (0) = 0 en F ′(0) = 1 in Opgave 4.17.

Opgave 4.19. De functies x→ xn op IR+ = x ∈ IR : x > 0 met n ∈ IN hebbeninverse functies. Gebruik Opgave 4.4 en Stelling 4.17 om de afgeleiden van de inversefuncties y → n

√y te bepalen.

Op dit moment hebben we nog niet zoveel andere voorbeelden. Maar zie lateren verderop Sectie 5.6, en leg Stelling 4.16 daar dan nog eens naast. Wel ishet aardig om hier op te merken dat lineaire benaderingen15 van wortels al300 jaar voor Christus voorkwamen, zie [Eves, §2.17].

4.4 Impliciete functies

Als voor een functie van twee reele variabelen, zeg

IR2 = (x, y) : x, y ∈ IR F−→ IR,

geldt dat F (0, 0) = 0, dan heeft de vergelijking

F (x, y) = 0

in het algemeen nog meer oplossingen in de buurt16 van (x, y) = (0, 0). Indeze sectie gaat het over het vinden van die andere oplossingen. De aanpakdie we presenteren is in wezen hetzelfde als17 die voor F : X × Y → Y .

Een bijzonder geval van de vraagstelling is het geval waarin

F (x, y) = g(y)− x,

en we dus eigenlijk vragen naar de inverse functie f van een gegeven functieg, maar anders dan in de vorige sectie gaat het nu om de inverse in de buurtvan een gegeven punt (het punt (0, 0) als g(0) = 0) op de grafiek van g, enniet om een globale inverse.

15 Equivalent met√

1 + x = 1 + 12x+ · · · .

16 Lees: in een omgeving van, zie de appendix, Section 12.17 Voor Banachruimten X en Y , bijvoorbeeld X = IRn en Y = IRm.

79

Page 80: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Voor we een (locale impliciete functie) stelling formuleren schetsen weeerst de methode van Newton voor het vinden van die oplossingen18, waarbijwe aannemen dat voor vaste x in de buurt van x = 0 de functie

y → F (x, y)

differentieerbaar is in de buurt van y = 0. De afgeleide noteren we nu niet metF ′(x, y) maar met Fy(x, y). Het subscript y geeft aan dat het om de afgeleidenaar y gaat. Docent en student kunnen het onderstaande natuurlijk eerstin het speciale geval F (x, y) = g(y) − x doen, met Fy(x, y) = g′(y). Nietwezenlijk anders, maar lichter kwa notatie. Het eindresultaat is dan eenlocale inverse functie stelling19.

Neem voor zo’n vaste x in de startwaarde y0 = 0 de lineaire benaderingvan F (x, y) als functie van y rond y = y0. Stel nu niet F (x, y) maar dielineaire benadering gelijk aan 0, los daaruit y = y1 op, en gebruik de lineairebenadering van F (x, y) rond y = y1 om dan weer y2 te vinden, en ga zo door.Als yn−1 al gevonden is en Fy(x, yn−1) weer inverteerbaar20 als afbeelding

h→ Fy(x, yn−1)h

van IR naar IR, dan geeft dit een volgende yn uniek gedefinieerd door

F (x, yn−1) + Fy(x, yn−1)(yn − yn−1) = 0.

Voor n = 1, 2, . . . geldt dan dat

yn = yn−1 − (Fy(x, yn−1))−1F (x, yn−1), beginnend met y0 = 0. (4.12)

In het algemeen21 breekt dit proces, dat de methode van Newton wordtgenoemd, niet af.

Als yn vervolgens convergeert, en de x-afhankelijke limiet y een zoge-naamde impliciete functie

x→ y = f(x) (4.13)

definieert waarvoor (hopelijk) geldt dat

F (x, f(x)) = 0, (4.14)

dan kan daarna ook nog de vraag gesteld worden onder welke voorwaardenf continu of differentieerbaar is in x = 0.

18 Convergentie van die methode bespreken we pas in Sectie 4.8.19 In de algemene situatie volgt de impliciete ook uit de inverse functiestelling.20 Hier hetzelfde als Fy(x, yn−1) 6= 0 aannemen zodat (Fy(x, yn−1))−1 = 1

Fy(x,yn−1).

21 Probeer het maar met een voorbeeldje.

80

Page 81: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Een rechtstreeks maar lastig bewijs van (snelle) convergentie van de rij ynwaarmee y = f(x) gemaakt moet worden is mogelijk via een schatting vande vorm

|yn+1 − yn| ≤ C|yn − yn−1|2,

afgeleid uit o.a. een aanname op de tweede22 afgeleide van y → F (x, y). Zo’naanname doen we hier echter niet want voor het aangepaste schema

yn = yn−1 − (Fy(0, 0))−1F (x, yn−1) (4.15)

kan (langzamere) convergentie eenvoudiger bewezen worden zonder zo’n aan-name.

Behalve een voldoende kleine bovengrens op |F (x, 0| en de inverteerbaar-heid van Fy(0, 0), gebruikt het convergentiebewijs dat nu volgt alleen decontinuıteit23 van

(x, y)→ Fy(x, y)

in (x, y) = (0, 0). Dit zal voldoende blijken om in de buurt van (0, 0) alleoplossingen van F (x, y) = 0 te vinden, als x-afhankelijke limieten van derijen yn gedefinieerd door (4.15), beginnende met

y0 = 0 en y1 = −(Fy(0, 0))−1F (x, 0).

Merk op dat als y1 = y0 = 0 meteen ook volgt dat 0 = y0 = y1 = y2 = · · ·en dat in dat geval y = y0 = 0 zelf al de oplossing is van F (x, y) = 0. Wespellen nu eerst uit hoe convergentie van de rij yn bewezen kan worden, ennemen daarbij aan dat y1 6= y0, want y1 = y0 is alleen maar het geval alsF (x, y0) = 0. Hoe groot kan y1 nu zijn als F (x, y0) = F (x, 0) 6= 0? Wel, als|(Fy(0, 0))−1| ≤M dan geldt voor y1 dat

|y1| = |(Fy(0, 0))−1| |F (x, 0)| ≤M |F (x, 0)|

en als F (x, y1) gedefinieerd is volgt ook dat

|y2 − y1| = |(Fy(0, 0))−1| |F (x, y1)| ≤M |F (x, y1)|,

als we (4.15) gebruiken met n = 2.Als we echter (4.15) gebruiken met n = 1 en n = 2 dan volgt

y2 − y1 = y1 − (Fy(0, 0))−1F (x, y1)− y0 + (Fy(0, 0))−1F (x, y0)

= (Fy(0, 0))−1 (F (x, y0)− F (x, y1) + Fy(0, 0)y1 − Fy(0, 0)y0) ,

22 In feite: Lipschitz continuıteit van y → Fy(x, y), zie (4.10) en (4.11).23 Nog niet gedefinieerd wat dat is, maar dat kun je wellicht al bedenken nu.

81

Page 82: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

waarin we (Fy(0, 0))−1 aan de voorkant buiten haakjes hebben gehaald en inde grote factor die overblijft in de eerste twee termen het verschil F (x, y0)−F (x, y1) herkennen. Dat verschil kunnen we schrijven als

F (x, y0)− F (x, y1) =

∫ 1

0

Fy(x, ty0 + (1− t)y1) dt (y0 − y1),

de integraal die we krijgen door (4.9), de middelwaardestelling in integraal-vorm24, voor vaste x toe te passen op de functie y → F (x, y) met a = y1 enb = y0. Samen met de derde en vierde term herschrijft de hele factor nu als∫ 1

0

(Fy(x, ty0 + (1− t)y1)− Fy(0, 0)) dt (y0 − y1),

door de andere twee termen binnen de integraal te brengen. We concluderendat

y2 − y1 = (Fy(0, 0))−1

∫ 1

0

(Fy(x, ty0 + (1− t)y1)− Fy(0, 0)) dt (y0 − y1).

Tot hier is alleen de continuıteit voor vaste x van y → Fy(x, y) gebruikt,op een nog te kiezen (x, y)-domein dat nu kan worden gekozen door con-tinuıteit van (x, y) → Fy(x, y) in (0, 0) te eisen25, en daarmee het bestaanvan Fy(x, y) voor (x, y) in de buurt van (0, 0). Om precies te zijn, we nemendan aan dat er voor iedere η > 0 een ε > 0 is waarmee voor alle x en y in IRde implicatie

|x| ≤ ε en |y| ≤ ε =⇒ |Fy(0, 0)− Fy(x, y)| ≤ η (4.16)

geldt. Daarmee volgt dat voor x, y0, y1 met |x| ≤ ε, |y0| ≤ ε en |y1| ≤ ε deintegraal in absolute waarde hoogstens gelijk kan zijn η en dus dat

|y2 − y1| ≤Mη |y1 − y0| met M = |(Fy(0, 0))−1| > 0,

i.e. de grootte van het tweede stapje is begrensd door

θ = Mη

keer de grootte van het eerste stapje.Voor deze conclusie is in het bijzonder ook aangenomen dat y → F (x, y)

voor alle x met |x| ≤ ε differentieerbaar in elke y met |y| ≤ ε. Merk ook op

24 Om later het bewijs te kunnen overschrijven voor F : X × Y → Y .25 In het geval dat F (x, y) = g(y)− x is dit geen extra eis natuurlijk.

82

Page 83: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

dat we hier i.p.v. een ε, δ-definitie een η, ε-definitie van continuıteit gebrui-ken. Dat is omdat uiteindelijk de limiet y = f(x) van de rij yn straks ooknog moet voldoen aan |y| ≤ ε, voor x met |x| ≤ δ, δ > 0 bij ε > 0 nog tekiezen26, om f continu in x = 0 te krijgen.

Als vervolgens ook geldt dat |y2| ≤ ε, dan geeft hetzelfde argument dat

|y3 − y2| ≤ θ |y2 − y1|,

enzovoorts. Zolang |yn| ≤ ε volgt dat27

|yn+1| = |yn+1 − y0| ≤ |yn+1 − yn|+ · · ·+ |y1 − y0| ≤

(θn + · · ·+ 1)|y1 − y0| <|y1 − y0|

1− θ≤ M |F (x, 0)|

1− θ≤ ε

als θ < 1, en F (x, 0) voldoet aan

|F (x, 0)| ≤ ε

M(1− θ) =

ε

M(1−Mη) = ε(

1

M− η) = ε. (4.18)

De laatste ongelijkheid wordt geforceerd door bij deze positieve ε de bijbe-horende δ > 0 van de continuıteit van x→ F (x, 0) in x = 0 te nemen en x tebeperken tot |x| ≤ δ. We nemen dus aan dat x → F (x, 0) in x = 0 continuis28.

Kies nu η = η0 < 1M

vast en laat zoals in (4.16) hierboven ε0 de bij-behorende ε zijn. Deze ene η0 en ε0 zijn genoeg om nu de convergentie tebewijzen. Neem daartoe ε0 bij η0 en ε0 zoals in (4.18), en vervolgens δ0 bijε0 gegeven middels de continuıteit van x→ F (x, 0) in x = 0. Neem tenslottevoor δ0 het minimum van ε0 en δ0.

De (aannamen voor de) schattingen hierboven zijn nu hieronder alleennog nodig voor x met |x| ≤ δ0 en y met |y| ≤ ε0. Voor iedere x met |x| ≤ δ0

volgt nu dat de x-afhankelijke som

∞∑n=0

(yn+1 − yn)

absoluut convergent is, en dus29 ook gewoon convergent. Maar dat betekentdat de x-afhankelijke rij yn, gedefinieerd door y0 = 0 en (4.15) voor n ∈ IN,

26 Dit rijgen van de kleine Griekse letters hebben we eerder gezien in Opgave 2.29.27 Gebruik de meetkundige reeks

1 + θ + θ2 + · · · = 1

1− θ. (4.17)

28 Geen extra eis in het speciale geval F (x, y) = x− g(y) natuurlijk.29 De eerste keer dat we dit gebruiken!

83

Page 84: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

convergeert naar een limiet y = f(x) met |y| ≤ ε0. Deze y nu moet de uniekeoplossing van F (x, y) = 0 in

Bε0 = y ∈ IR : |y| ≤ ε0

zijn.In feite hebben we hierboven laten zien dat de x-afhankelijke afbeelding

Φ gedefinieerd door

yΦ−→ y − (Fy(0, 0))−1F (x, y), (4.19)

voor x in een geschikt gekozen x-interval, op een geschikt gekozen maar nietvan x afhankelijk y-interval precies een y op zichzelf afbeeldt. Zo’n y wordteen vast punt van Φ genoemd en, omdat (Fy(0, 0))−1 als inverse van Fy(0, 0)zelf inverteerbaar is, zijn vaste punten van y → Φ(x, y) precies de oplossingenvan F (x, y) = 0.

De facto blijkt dat Φ voldoet aan een schatting van de vorm

|Φ(x, y)− Φ(x, y)| ≤ θ|y − y| (4.20)

met θ < 1. De afbeelding y → Φ(x, y) heet dan strict contractief, i.e. uniformLipschitz continu met Lipschitz constante θ < 1. Dat kan hier met een endezelfde constante voor alle x in de buurt van 0.

Merk nog een keer goed op dat F (x, y) = 0 via (4.19) equivalent is mety = Φ(x, y) omdat (F (0, 0))−1 als inverse van F (0, 0) inverteerbaar is. Daary → Φ(x, y) op Bε0 voor alle x met |x| ≤ δ0 uniform Lipschitz continu ismet Lipschitz constante Mη0 < 1, is er voor iedere zulke x hoogstens eenzo’n y ∈ Bε0 met y = Φ(x, y). Voor de limiet y = f(x) geldt vanwege decontinuıteit30 van y → Φ(x, y) inderdaad dat

y = limn→∞

yn+1 = limn→∞

Φ(x, yn) = Φ(x, y).

De formule direct boven (4.18) geeft via de nu geslaagde limietovergangyn+1 → y = f(x) dat f : Bδ0 → Bε0 welgedefinieerd is en voldoet aan

|f(x)| ≤ M |F (x, 0)|1− θ

=|F (x, 0)|

1M− η0

. (4.21)

Met de grafiek y = f(x) van f op Bδ0 hebben we dus precies alle oplossingen Tekenplaatje!

van F (x, y) = 0 in Bδ0 × Bε0 te pakken:

∀(x, y) ∈ Bδ0 × Bε0 : F (x, y) = 0 ⇐⇒ y = f(x). (4.22)

30 Die volgt uit de differentieerbaarheid.

84

Page 85: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Hiermee is het bewijs van het bestaan van de impliciete functie f welklaar. Het enige dat we gebruikt hebben om in (4.22) de nulverzameling vanF in een geschikt gekozen omgeving Bδ0 × Bε0 van (x, y) = 0 als een grafiekvan de vorm y = f(x) te karakteriseren met f : Bδ0 → Bε0 continu in x = 0,is dat

F (0, 0) = 0;x→ F (x, 0) is continu in x = 0;(x, y)→ Fy(x, y) is continu in (x, y) = (0, 0);y → Fy(x, y) is een continue functie voor x vast31;Fy(0, 0) is inverteerbaar.

Omgekeerd is gegeven zo’n f de functie gedefinieerd door (x, y)→ f(x)− yeen i.h.a. andere (eenvoudigere) functie die precies aan de aannamen op dealgemene F voldoet om f bij F te maken zoals hierboven.

4.5 Differentieerbare impliciete functies

Met het eindresultaat in Sectie 4.4 zijn we nog niet tevreden32, want het enigedat we van x→ f(x) nu weten is de continuiteit in x = 0, via de continuiteitvan x→ F (x, 0) en (4.21).

Om ook differentieerbaarheid van x→ f(x) in x = 0 te krijgen schrijvenwe, wederom met (4.9),

0 = F (x, f(x)) = F (x, 0) + F (x, f(x))− F (x, 0)

= F (x, 0) +

∫ 1

0

Fy(x, tf(x))f(x) dt

= F (x, 0) + Fy(0, 0)f(x) +R(x),

waarin

R(x) =

∫ 1

0

(Fy(x, tf(x))− Fy(0, 0))f(x) dt,

en waarmee de aanname dat x → F (x, 0) differentieerbaar is in x = 0 voorde hand ligt. In dat geval weten we dat F (x, 0) = O(|x|) en via (4.21) ookdat

f(x) = O(|x|) als x→ 0,

hetgeen alvast een sterke uitspraak is dan de continuiteit van x → f(x) inx = 0.

31 Waarbij |x| ≤ δ0 en |y| ≤ ε0, met δ0 > 0 en ε0 > 0 als in de constructie van (4.22).32 Hoewel resultaat nu al geschikt is voor (11.23) en het Lemma van Morse, Sectie 11.1.

85

Page 86: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Neem nu aan dat (x, y)→ G(x, y) = Fy(x, y) continu is in (x, y) = (0, 0),hierboven geformuleerd met η en ε in (4.16), maar nu weer gewoon met eenε, δ-definitie.

Definitie 4.20. Een functie (x, y) → G(x, y) heet continu in (0, 0) als ervoor iedere ε > 0 een δ > 0 is zodanig dat voor alle x ∈ IR en y ∈ IR deimplicatie

|x| ≤ δ en |y| ≤ δ =⇒ |G(x, y)−G(0, 0)| ≤ ε

geldt.

Voor x ∈ IR met |x| ≤ δ en |f(x)| ≤ δ geldt dus dat

|R(x)| ≤ ε|f(x)|,

en de continuiteit van f(x) in x = 0 geeft dat er δ ∈ (0, δ] is zodanig datdeze afschatting geldt voor |x| ≤ δ. We concluderen nu dat aan

R(x) = o(|x|) als x→ 0

is voldaan, zie (4.4). Maar nu geldt

0 = F (x, f(x)) = Fx(0, 0)x+ r(x) + Fy(0, 0)f(x) +R(x),

met ook r(x) = o(|x|) voor x→ 0 omdat x→ F (x, 0) differentieerbaar is inx = 0. Links en rechts de inverse van Fy(0, 0) toepassen en differentieerbaar-heid van f in x = 0 volgt.

Opgave 4.21. Onder de sterkere aanname dat (x, y) → Fy(x, y) continu is in(x, y) = (0, 0), en de extra aanname dat x→ F (x, 0) differentieerbaar is in x = 0, isde impliciete functie x→ f(x) differentieerbaar in x = 0 met

f ′(0) = −(Fy(0, 0))−1Fx(0, 0).

Bewijs dit nu verder zelf.

In het convergentiebewijs hebben we gebruikt dat absoluut convergentereeksen convergent zijn. Per definitie wordt voor een rij an ∈ IR de som Svan de bijbehorende reeks gedefinieerd door

S =∞∑n=1

an = limN→∞

N∑n=1

an,

als deze limiet bestaat. De volgende opgave moet je een keer gemaakt hebben.Wellicht is dit de eerste keer. Je hebt hem hierna nog vaker nodig. Zie ookSectie 3.6 en Opgave 3.15.

86

Page 87: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 4.22. Neem aan dat voor een rij an ∈ IR geldt dat er een M ≥ 0 iswaarvoor geldt dat

TN =

N∑n=1

|an| ≤M

voor alle N ∈ IN. Bewijs dat er een kleinste M ≥ 0 is waarvoor dit geldt, en dat dezekleinste M de limiet is van TN als N →∞, genoteerd als

T =∞∑n=1

|an|.

Bewijs ook dat

SN =

N∑n=1

an

een Cauchyrij is, en dus convergent met een unieke limiet S, die genoteerd als

S =∞∑n=1

an

voldoet aan

|∞∑n=1

an| ≤∞∑n=1

|an|.

Blijft nog de vraag hoe het in de andere x-waarden zit met de implicietefunctie die we nu gemaakt hebben. Natuurlijk willen we een uitspraak diezegt dat, voor x eventueel wat dichter in de buurt van x = 0, dat

f ′(x) = −(Fy(x, f(x)))−1Fx(x, f(x)), (4.23)

en dat het rechterlid in (4.23) continu van x afhangt. Het enige dat daarvoornodig is dat Fy(x, y) in de buurt van (x, y) = (0, 0) continu en inverteerbaaris en dat x→ F (x, y) voor y in de buurt van y = 0 differentieerbaar is in elkex in de buurt van 0. Daarover doen we nu moeilijk, met als belangrijkstehulpmiddel (4.17).

Opgave 4.23. De inverteerbaarheid van A = Fy(x, y) in de buurt van van (x, y) =(0, 0) volgt uit de inverteerbaarheid van A0 = Fy(0, 0). Bewijs dit met algebra enconvergente meetkundige reeksen. Gebruik van de inverse B0 van A0 alleen datA0B0 = B0A0 = 1. Delen is streng verboden evenals de regel |AB| = |A| |B| (voorwillekeurige A en B). Je mag wel de ongelijkheid |AB| ≤ |A| |B| gebruiken. Laat zien

87

Page 88: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

dat er een B is met AB = BA = 1, onder de aanname dat |A− A0| klein genoeg isin termen van o.a. |B0|, en dat

A→ A−1

continu is in A = A0.

Na deze opgave33 kunnen we voor x = x0 in de buurt van x = 0 rond(x0, y0) met y0 = f(x0) alles hierboven herhalen onder de aanname datFx(x0, y0) bestaat en Fy continu is in (x0, y0). Tenslotte is voor het con-tinu zijn van

x→ f ′(x) = −(Fy(x, f(x)))−1Fx(x, f(x))

in x = x0 ook de continuıteit van (x, y)→ Fx(x, y) in (x0, y0) nodig. Kortom,uiteindelijk zegt de impliciete functiestelling dat in de buurt van een eenwillekeurig punt (x0, y0) waar (x, y) → Fx(x, y) en (x, y) → Fy(x, y) allebeibestaan en continu zijn, niet alleen in (x0, y0) maar in die hele buurt, in eeniets kleinere buurt de oplossingen van F (x, y) = F (x0, y0) worden gegevenals grafiek van een continu differentieerbare functie x → f(x), mits in datene punt (x0, y0) de partiele afgeleideFy(x0, y0) inverteerbaar is.

Stelling 4.24. Hierboven staat de definitieve versie van de impliciete func-tiestelling die je nu zelf kunt formuleren.

Opgave 4.25. Formuleer Stelling 4.24, ook voor het geval dat F (x, y) = g(y)− xmet g(0) = 0. Dit speciale geval is de inverse functiestelling, die zegt dat de inversefunctie f van g in een omgeving van x = 0 als continu differentieerbare functie isgedefinieerd met de afgeleide die je verwacht.

Opgave 4.26. Alleen in het geval dat y en dus F (x, y) in dezelfde 1-dimensionaleIR liggen, kan in plaats van (4.9) direct de gewone middelwaardestelling (Stelling 4.5)gebruikt worden, op alle plekken waar (4.9) gebruikt is, om tot dezelfde resultaten(onder wellicht iets zwakkere aannamen) te komen. Ga dit na.

Opgave 4.27. De formule (4.23) kan gezien worden als een differentaalvergelijkingvoor x → f(x). Neem een beetje mooie F (x, y) naar keuze, bepaal Fx en Fy, zetf(x) = y in (4.23), en schrijf (4.23) op een apart blaadje als

dy

dx= G(x, y)

33 Waarom doen we zo moeilijk in deze opgave? Zie Sectie 6.3.

88

Page 89: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

met G(x, y) zo vereenvoudigd dat je niet meer ziet met welke F (x, y) je begonnenbent. Geef aan een collega met de vraag: los even op als je kan.

4.6 Totale afgeleide, ketting- en Leibnizregel

In Opgave 4.21 is het bewijs voor het bestaan van een unieke implicietefunctie f met f(0) = 0, waarvoor geldt dat

x→ F (x, f(x))

constant is in de buurt van x = 0, afgerond met de differentieerbaarheid vanf in x = 0. Voldoende hiertoe is de aanname dat

x→ F (x, 0) differentieerbaar34 is in x = 0;(x, y)→ Fy(x, y) continu is in een omgeving van (0, 0);Fy(0, 0) inverteerbaar is.

De continuiteit van Fy is hier gemakshalve wat sterker geformuleerd dan aanhet eind van Sectie 4.4. We bekijken nu wat de eerste twee aannames voorde functie (x, y)→ F (x, y) zelf betekenen.

Met de definitie van differentieerbaarheid van x → F (x, 0) in x = 0, ende middelwaardestelling35 schrijven we

F (x, y) = F (x, 0)+F (x, y)−F (x, 0) = F (0, 0)+Fx(0, 0)x+R(x)+Fy(x, η)y

= F (0, 0) + Fx(0, 0)x+ Fy(0, 0)y +R(x) + (Fy(x, η)− Fy(0, 0))y︸ ︷︷ ︸R(x,y)

,

voor een η tussen 0 en y en met R(x) = o(x) als x→ 0.Dit leest zich nu als

F (x, y) = F (0, 0) + Fx(0, 0)x+ Fy(0, 0)y +R(x, y) (4.24)

metR(x, y) = o(r) als r =

√x2 + y2 → 0, (4.25)

precies wat we voortaan de (totale) differentieerbaarheid van (x, y)→ F (x, y)in (0, 0) noemen. Merk op dat in (4.24) het lineaire stuk te schrijven is als

Fx(0, 0)x+ Fy(0, 0)y =

(Fx(0, 0)

Fy(0, 0)

)·(x

y

),

waarin de vector met de partiele afgeleiden de gradient36 van F in (0, 0)wordt genoemd.

34 Differentieerbaarheid van de “partiele functie” x→ F (x, 0) in x = 0.35 Hier dus met Stelling 4.5, maar zie Opgave 4.28.36 Notatie ∇F , spreek uit nabla F .

89

Page 90: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 4.28. Laat r > 0 en neem aan dat voor x met |x| ≤ r geldt dat y → F (x, y)differentieerbaar is voor |y| ≤ r met y → Fy(x, y) continu, en (x, y) → Fy(x, y)continu is in (0, 0). Bewijs de differentieerbaarheid van (x, y) → F (x, y) in (x, y) =(0, 0) met (4.9), dus zonder x-afhankelijke tussenpunten η te gebruiken.

In (4.24) staat een al precies gemaakte lineaire benadering van F (x, y)rond (0, 0) met een restterm die voldoet aan (4.25). Natuurlijk kunnen uit-drukking als x→ F (x, f(x)) ook naar x gedifferentieerd worden met de nogte behandelen kettingregel, als x → f(x) en (x, y) → F (x, y) (totaal) diffe-rentieerbaar zijn. Die kettingregel komt uitgebreid aan de orde in Hoofdstuk6, en is gebaseerd op Opgave 5.10 in Sectie 5.1. Het kan geen kwaad dezeregel hier al in een speciaal geval te behandelen.

Voor functies van de vorm

t→ F (x(t), y(t))

luidt de kettingregel dat

d

dtF (x(t), y(t)) = Fx(x(t), y(t))x′(t) + Fy(x(t), y(t))y′(t) (4.26)

= x′(t)Fx(x(t), y(t)) + y′(t)Fy(x(t), y(t)),

te onthouden als F differentieren naar elke t-afhankelijke variabele, daarnadoordifferentieren naar t, en alles optellen. Als t→ (x(t), y(t)) toevallig eenkromme parametrizeert waarlangs F constant is dan volgt in t = 0 dat

Fx(0, 0)x′(0) + Fy(0, 0)y′(0) =

(Fx(0, 0)

Fy(0, 0)

)·(x′(0)

y′(0)

)= 0,

waarin de tweede vector de raakvector aan de kromme in (0, 0) genoemdwordt37, waar de gradient van F in (0, 0) dan loodrecht op staat.

Allebei de vormen in (4.26) zijn nuttig. Je kunt ervoor kiezen de afgeleidevan de eerste schakel in de ketting systematisch38 voor of systematisch na deafgeleide(n) van de tweede schakel in de ketting te zetten. Zie eventueelalvast (9.20) en (9.21) en wat daarna volgt. Het bijzonder geval dat x(t) = t,y(t) = f(t) hebben we hierboven gezien met de impliciete functie f waarmeeF (t, f(t)) constant is.

In het geval dat F (x, y) = xy zien we

(x(t)y(t))′ =d

dt(x(t)y(t)) = x′(t)y(t) + x(t)y′(t) (4.27)

37 Tenzij deze vector de nulvector is.38 Willen we co- of willen we contravariante differentiaalrekening?

90

Page 91: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

verschijnen, de produktregel van Leibniz39.

Bewijs van deze kettingregel. Toch maar meteen een bewijsje van (4.26)hier, zonder beperking der algemeenheid in t = 0. Dus neem aan dat t →x(t) en t → y(t) differentieerbaar zijn in t = 0, en dat (x, y) → F (x, y)totaal differentieerbaar is in (x(0), y(0)) en, wederom zonder beperking deralgemeenheid, dat 0 = x(0) = y(0) = F (0, 0) = 0. Dan volgt met dedifferentieerbaarheid van x(t) en y(t) in t = 0, via de expansies

x(t) = x′(0)t+ r(t) en y(t) = y′(0)t+ s(t), (4.28)

voor de samengestelde functie dat

F (x(t), y(t)) = Fx(0, 0)x(t) + Fy(0, 0)y(t) +R(x(t), y(t)) =

Fx(0, 0)(x′(0)t+ r(t)) + Fy(0, 0)(y′(0)t+ s(t)) +R(x(t), y(t))

= (Fx(0, 0)x′(0) + Fy(0, 0)y′(0))t+ S(t),

waarinS(t) = Fx(0, 0)r(t) + Fy(0, 0)s(t) +R(x(t), y(t))

kleine o van t moet zijn als t→ 0. Per definitie is dat het geval voor r(t) ens(t), de resttermen uit de lineaire benaderingen van x(t) en s(t) rond t = 0.

Opgave 4.29. Bewijs nu zelf met (4.28) en de aannames op r(t), s(t) en R(x, y)dat R(x(t), y(t)) = o(t) als t→ 0. Daarmee is het bewijs dan klaar.

Zoals al opgemerkt volgt met F (x, y) = xy de Leibniz regel (4.27). Metx(t) = y(t) volgt natuurlijk ook de kettingregel voor

t→ x(t)→ F (x(t)) = φ(t),

metφ′(t0) = F ′(x(t0))x′(t0) (4.29)

als t → x(t) differentieerbaar is in t0 en x → F (x) differentieerbaar is inx(t0). Ook de quotientregel is nu niet moeilijk meer, misschien eerst voor

t→ y(t)

1 + x(t)

met

x→ 1

1 + x

als leuke oefening vooraf.

39 Die schrijven we liever met x en y steeds in dezelfde volgorde.

91

Page 92: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

4.7 Stationair onder randvoorwaarde

Als we twee functies Φ and F van x en y hebben die allebei (totaal) differen-tieerbaar zijn in (x, y) = (0, 0), en een40 functie f van x die differentieerbaaris in x = 0, waarvoor geldt dat

Fx(0, 0) + Fy(0, 0)f ′(0) = 0, (4.30)

hetgeen zeker geldt als F (x, f(x)) constant is, dan is

xφ−→ φ(x) = Φ(x, f(x))

met de kettingregel differentieerbaar in x = 0, met

φ′(0) = Φx(0, 0) + Φy(0, 0)f ′(0). (4.31)

Als Fy(0, 0) inverteerbaar is volgt nu uit (4.30) en (4.31) dat

φ′(0) = 0 ⇐⇒ Φx(0, 0) = Φy(0, 0)(Fy(0, 0))(−1)Fx(0, 0) (4.32)

de karakterisatie is voor het stationair zijn van φ(x) in x = 0.Inverteerbaar betekent hier voor Fy(0, 0) ∈ IR gewoon dat Fy(0, 0) 6= 0,

waarmee

φ′(0) = 0 ⇐⇒ Φx(0, 0)Fy(0, 0) = Φy(0, 0)Fx(0, 0).

Het criterium voor φ′(0) = 0 is dus dat de gradient van Φ in (0, 0) eenveelvoud is van de gradient van F .

Opgave 4.30. Bewijs de laatste uitspraak, die zegt dat φ′(0) = 0 in dit geval, dusonder de aanname dat Fy(0, 0) 6= 0, equivalent is met het bestaan van een λ ∈ IRwaarmee (

Φx(0, 0)

Φy(0, 0)

)= λ

(Fx(0, 0)

Fy(0, 0)

).

Een soortgelijk uitspraak is te doen voor functies x = g(y) met y →F (g(y), y)) constant en het stationair zijn van

yψ−→ ψ(y) = Φ(g(y), y)

40 Bijvoorbeeld met de inverteerbaarheid van Fy(0, 0) gemaakte impliciete functie.

92

Page 93: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

in y = 0, onder de aanname dat Fx(0, 0) 6= 0.We komen nog terug op het stationair zijn van functies Φ : X → IR onder

randvoorwaarde(n) in Sectie 6.3: Opgave 4.30 is een eerste voorbeeld van demultiplicatorenstelling van Lagrange, die hier in het geval dat X = IR2 zegtdat de gradient van Φ loodrecht moet staan op de door de randvoorwaardegedefinieerde verzameling. De wiskundige formulering daarvan in Euclidischeruimten kan niet zonder de impliciete functies zoals gemaakt in de vorigesectie. De stelling zelf beperkt zich niet tot ruimten waarin een inproduktvoorhanden is en kent ook formuleringen in Banachruimten.

4.8 Zijstapje: convergentie van Newton’s methode

We borduren nog wat verder op de methode van Newton waar we in Sectie4.4 mee begonnen zijn, maar doen dat zonder x-afhankelijkheid in F (x, y).En dus noemen we de y maar weer x en gebruiken maar eens een kleine fin plaats van een grote F : voor f van x, is f(x) = 0 nu de op te lossenvergelijking.

Voor zo’n functie f : IR→ IR die voor een gegeven ε0 > 0 differentieerbaaris op

Bε = x ∈ IR : |x| ≤ ε,met x → f ′(x) uniform Lipschitz continu op Bε0 , en een rij xn in Bε0 vanNewton- of andere iteraties die de oplossing x van f(x) = 0 moeten benade-ren, schrijven we (4.10) over als

f(xn) = f(xn−1) + f ′(xn−1)(xn − xn−1)︸ ︷︷ ︸lineaire benadering

+R(xn;xn−1), (4.33)

waarin

|R(xn;xn−1)| ≤ L

2|xn − xn−1|2,

met L de Lipschitz constante van f ′ op Bε0 . We nemen nu ook aan dat vooralle x ∈ Bε0 geldt dat

|(f ′(x))−1| ≤ C

voor een positieve constante C > 0.Introduceer nu

pn = |xn − xn−1| and qn = |f(xn)|, (4.34)

en neem xn gedefinieerd door het Newton schema41

xn = xn−1 − (f ′(xn−1))−1f(xn−1) (n ∈ IN), (4.35)

41 Het is hier niet nodig om aan raaklijnen te denken maar het mag wel.

93

Page 94: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

met x0 = 0. Dan zit xn ∈ Bε0 zolang

p1 + p2 + · · ·+ pn ≤ ε0, (4.36)

en in dat geval volgt

pn ≤ Cqn−1 en qn ≤1

2Lp2

n, (4.37)

omdat (4.35) de lineaire benadering in (4.33) nul stelt.De ongelijkheden in (4.37) worden nu in stelling gebracht beginnende met

q0 = |f(0)| en p1 ≤ Cq0 = C|f(0)|, (4.38)

door (4.37) en (4.38) te combineren als

pn ≤ µp2n met µ =

1

2LC and p1 ≤ C|f(0)|, (4.39)

en de vraag is voor welke P = P (µ) we kunnen concluderen dat de implicatie

C|f(0)| ≤ P =⇒∞∑n=1

pn ≤ ε0 (4.40)

geldt.Hoe groter P , hoe sterker de uitspraak in de zin dat grotere |f(0)| toe-

gestaan zijn om een oplossing x ∈ Bε0 van f(x) = 0 te vinden via (4.35)startend vanaf x0 = 0. De grootste P vinden we door in (4.39) en (4.40)overal gelijkheden te nemen. Dat geeft

pn = µp2n−1 voor n ∈ IN; p1 = P ;

∞∑n=1

pn = ε0. (4.41)

Via ξn = µpn en ξn = ξ2n−1 is dit equivalent met

µε0 = G(µP ) met G(ξ) = ξ + ξ2 + ξ4 + ξ8 + ξ16 + · · · , (4.42)

maar dit geeft geen simpele formule P = P (µ, ε0).

Opgave 4.31. Gebruik nu

G(ξ) ≤ ξ

1− ξom een simpele conditie van de vorm |f(0)| ≤ . . . in termen van C en L te formuleren,die convergentie xn → x ∈ Bε0 garandeert met f(x) = 0.

94

Page 95: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

In Hoofdstuk 3 van [HM] wordt de bij de functie x → f(x) horendeNewtonafbeelding

x→ x− f(x)

f ′(x)= F (x)

in detail onderzocht voor simpele functies van IR naar IR, bijvoorbeeld voorf(x) = x2 − 2. Die analyse, die weer42 terugvoert tot kleitabletten, zullenwe hier niet herhalen. Over discrete dynamische systemen gedefinieerd doorschema’s van de vorm

xn = F (xn−1) (4.43)

komen we nog wel te spreken in Sectie 5.4.

4.9 Integralen met parameters

Een niet onbelangrijk onderwerp is hoe integralen van parameters afhangen.Eerst maar even zien hoe het zit met de eigenschappen van een integraal metvaste grenzen, voor het gemak 0 en 1, en een integrand met een parameter.We beschouwen43

j(t) =

∫ 1

0

F (x, t) dx

met, voor elke t in een t-interval [0, 1], de functie x→ F (t, x) continu op eenx-interval [0, 1]. Daan weten we zeker dat j(t) welgedefinieerd is.

We gebruiken nu maar eens middelwaardestelling in de vorm van Stelling4.5 zelf, toegepast voor iedere vaste x ∈ [0, 1] op t → F (x, t), die voor ditargument differentieerbaar moet zijn op [0, 1], of op een kleiner interval dat0 bevat maar niet van x afhangt. Dan is

F (t, x) = F (0, x) + Ft(τ, x) t,

met τ = τ(x) ∈ (0, t). We kunnen dus schrijven

F (t, x) = F (0, x) + Ft(0, x)t+R(t, x), (4.44)

metR(t, x) = (Ft(τ(x), x)− Ft(0, x))t.

Als nu in (4.44) voor vaste t alles continu is in x dan geldt

j(t) =

∫ 1

0

F (t, x) dx =

∫ 1

0

(F (0, x) + Ft(0, x)t+R(t, x)) dx

42 In [Eves §2-5,2.7,6-6] zien we Heron’s methode voor√

2 teruggaan tot YBC7289!43 Dit woord gebruiken we te weinig.

95

Page 96: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

= j(0) + t

∫ 1

0

Ft(x, 0) dx+

∫ t

0

R(t, x) dx (4.45)

= j(0) + t

∫ 1

0

Ft(x, 0) dx+ r(t),

waarin

r(t) =

∫ t

0

R(t, x) dx.

Tot nu toe is daarbij alleen gebruikt dat x→ F (t, x) en x→ Ft(0, x) continuzijn op [0, 1] om de integralen te laten bestaan. De integraal r(t) van R(t, x)in (4.45) is dan ook continu. De tweede uitdrukking met τ(x) ∈ (0, t) boven(4.44) kan nu gebruikt worden om r(t) = o(t) voor t→ 0 te krijgen.

Voor deze restterm r(t) willen we dat |r(t)| ≤ εt voor t klein genoeg,en daarvoor is (misschien niet nodig maar zeker wel) voldoende dat voor(t, x)→ Ft(t, x) = f(t, x) geldt dat

|f(t, x)− f(0, x)| ≤ ε (4.46)

voor alle x ∈ [0, 1] tegelijk, en dat voor alle t ∈ (0, δ), met δ > 0 bij ε tevinden.

Opgave 4.32. Neem aan dat (t, x) → f(t, x) in elk punt (0, x) met x ∈ [0, 1]continu is. Bewijs dat er voor alle ε > 0 een δ > 0 is zodanig dat (4.46) geldt vooralle t ∈ (0, δ) en alle x ∈ [0, 1]. Hint: denk aan het bewijs dat uniforme continuıteitop gesloten begrensde intervallen uit continuıteit volgt en redeneer uit het ongerijmdezoals in Opgave 2.31. Bij de ε > 0 waarvoor de uitspraak niet geldt is een rij punten(tn, xn) te vinden met 0 < tn → 0. Neem een convergente deelrij van xn, formuleerde tegenspraak en de volgende stelling is bewezen.

Stelling 4.33. Niet eenvoudig om te onthouden, maar laat (t, x) → F (t, x)gedefinieerd zijn voor x ∈ [a, b] ⊂ IR met a < b, en t ∈ (t0 − δ, t0 + δ) mett0 ∈ IR en δ > 0. Neem aan dat voor iedere vaste t ∈ (t0−δ, t0 +δ) de functiex→ F (t, x) continu is op [a, b] en

j(t) =

∫ b

a

F (t, x) dx

dus bestaat. Als voor iedere vaste x ∈ [a, b] de functie t→ F (t, x) differenti-eerbaar is op (t0−δ, t0 +δ) en (t, x)→ Ft(t, x) continu is in iedere (t0, x) met

x ∈ [a, b], dan is t→ j(t) differentieerbaar in t0 met j′(t0) =∫ baFt(t0, x) dx.

96

Page 97: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Stelling 4.34. Makkelijker te onthouden is: als F en Ft bestaan en continuzijn op I × [a, b], met I een t-interval, dan is j : I → IR continu differenti-eerbaar met

j′(t) =

∫ b

a

Ft(t, x) dx.

Opgave 4.35. Laat zien dat t →∫ ba f(t, x) dx continu is op een interval I als

t → f(t, x) continu is op I × [a, b]. Hieruit volgt de continuıteit van j′ in de laatsteuitspraak van Stelling 4.34. Hint: gebruik een argument zoals in Opgave 4.32.

4.10 Partieel integreren en Taylorpolynomen

We verlaten hier nu de analyse om een stukje calculus te doen, waaruitvervolgens weer een belangrijke stelling volgt die tot de analyse gerekend kanworden. De regel voor partieel integreren is via Stelling 4.12 de tegenhangervan de produktregel van Leibniz, zie (4.27), waarin van alle drie de termen deintegraal over een t-interval I = [α, β] kan worden genomen, als bijvoorbeeldt→ x′(t) en t→ y′(t) continu zijn op I. Na herordenen volgt dat∫ β

α

x(t)y′(t) dt = [x(t)y(t)]βα −∫ β

α

x′(t)y(t) dt. (4.47)

We passen deze regel nu toe in een leerzaam voorbeeldje met andere lettersvoor de variabelen.

Voor gegeven f ∈ C([0, 1]) is het randwaardeprobleem gegeven door

−u′′(x) = f(x) voor alle 0 ≤ x ≤ 1, en u(0) = u(1) = 0 (4.48)

uniek oplosbaar, door f twee keer te primitiveren en de twee vrije integratie-constanten zo te kiezen dat de dubbele primitieve u in x = 0 en x = 1 gelijkis aan 0. Het is instructief om dit in detail te doen.

Een keer primitiveren geeft

u′(x) = u′(0)−∫ x

0

f(s) ds︸ ︷︷ ︸F (x)

,

met een nog onbepaalde u′(0), en de primitieve van F van f die voldoet aanF (0) = 0, waarna nog een keer primitiveren geeft dat

u(x) = u′(0)x−∫ x

0

F (s) ds,

97

Page 98: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

u′(0) nog steeds onbepaald, x →∫ x

0F (s) ds de primitieve van F die 0 is in

x = 0, en u(1) = 0 nog niet gebruikt.Met de produktregel van Leibniz is F (s) te schrijven als

1F (s)︸ ︷︷ ︸G′(s)F (s)

= (s− a)′︸ ︷︷ ︸G′(s)

F (s) = ((s− a)︸ ︷︷ ︸G(s)

F (s))′ − (s− a)︸ ︷︷ ︸G(s)

F ′(s)

= ((s− a)F (s))′︸ ︷︷ ︸(G(s)F (s))′

− (s− a)f(s)︸ ︷︷ ︸G(s)F ′(s)

(afgeleiden naar s). Onder de formules is aangegeven dat we 1 zien als G′(s)met G(s) = s− a en a nog vrij te kiezen.

De primitieve van F (x) is dus te schrijven als∫ x

0

F (s) ds = [(s− a)F (s)]x0 −∫ x

0

(s− a)f(s) ds =

∫ x

0

(x− s)f(s) ds. (4.49)

Met a = x volgt dat

u(x) = u′(0)x−∫ x

0

(x− s)f(s) ds

en door x = 1 in te vullen vinden we dat

u′(0) =

∫ 1

0

(1− s)f(s) ds.

Daarmee is

u(x) =

∫ 1

0

(1− s)f(s) ds x−∫ x

0

(x− s)f(s) ds

= x

∫ 1

x

(1− s)f(s) ds+ (1− x)

∫ x

0

sf(s) ds =

∫ 1

0

A(x, s)f(s) ds.

In deze laatste formule wordt

A(x, s) =

(1− x)s als 0 ≤ s ≤ x

(1− s)x als x ≤ s ≤ 1(4.50)

de kern van de oplossingsoperator44 wordt genoemd. Deze operator geeft uin termen van f als

u(x) =

∫ 1

0

A(x, s)f(s) ds. (4.51)

44 De kern A is te vergelijken met een (symmetrische) matrix, maar dat voor nu terzijde.

98

Page 99: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

We hebben hierboven (4.51) met (4.50) afgeleid als oplossing voor (4.48)via de produktregel voor de afgeleide van s → F (s)G(s). Ook als je deregel voor partieel integreren ben vergeten, Stelling 4.12 toepassen op deproduktregel van Leibniz voor primitieven functies F en G van f = F ′ eng = G′ in C([a, b]) geeft je snel dat∫ b

a

F (x)G′(x) dx = [F (x)G(x)]b

a−∫ b

a

F ′(x)G(x) dx, (4.52)

de bekende regel voor integration by parts.Partieel integreren is voor alles en nog wat handig. Bijvoorbeeld voor her-

haald primitiveren zoals hierboven. Daarover nu een serie opgaven die leidentot de Stelling van Taylor over polynomiale benaderingen van voldoende vaakcontinu differentieerbare functies.

Opgave 4.36. Neem f ∈ C([a, b]) en definieer

F1(x) = F (x) =

∫ x

af(s) ds en F2(x) =

∫ x

aF1(s) ds.

Laat met (4.52) zien dat

F2(x) =

∫ x

a(x− s)f(s) ds.

Hint: de integratievariabele is s en de 1 die je niet ziet voor F1(s) is de afgeleide naars van s− x.

Opgave 4.37. Definieer in de context van Opgave 4.36

Fn+1(x) =

∫ x

aFn(s) ds (n = 1, 2, 3 . . . ),

en laat met herhaald partieel integreren zien dat

Fn(x) =1

(n− 1)!

∫ x

a(x− s)n−1f(s) ds.

Hint: voor F3 moet je twee keer partieel integreren, voor F4 drie keer, et cetera. Endan zie je wel hoe het gaat.

99

Page 100: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 4.38. De formule in Opgave 4.37 produceert de zoveelste primitieve van fals een gewone in plaats van een meervoudige integraal. Verander het schema nu in

F0(x) = f(x), Fn(x) = bn +

∫ x

aFn−1(s) ds (n = 1, 2, 3 . . . ), (4.53)

en geef weer een formule voor Fn(x) zoals hierboven (met meer termen natuurlijk).Bij constructie is Fn(a) = bn, F ′n(a) = bn−1, F ′′n (a) = bn−2, . . . , en je ziet hier eenzogenaamde Taylorbenadering van orde n−1 staan voor een functie waarvan de eersten−1 afgeleiden in a gegeven zijn door b-tjes. Verifieer nu dat voor elke n keer continuedifferentieerbare functie gedefinieerd op een interval I dat 0 bevat voor x ∈ I geldtdat

f(x) = f(a) + f ′(a)(x− a) + f ′′(a)(x− a)2

2!+ · · ·+ f (n−1)(a)

(x− a)n−1

(n− 1)!

+1

(n− 1)!

∫ x

a(x− s)n−1f (n)(s) ds.

De laatste term is de restterm. Als M = Mn(x, a) en m = mn(x, a)het maximum respectievelijk het minimum zijn van f (n)(s) als s varieert vans = a naar s = x, dan zit deze term tussen

M

n!(x− a)n en

m

n!(x− a)n

in. Omdat f (n)(s) tussen s = a en s = x alle waarden tussen M = Mn(x, a)en m = mn(x, a) aanneemt, is er een zekere maar i.h.a. verder niet nader tebepalen s = σ tussen s = a en s = x waarvoor de restterm gelijk is aan

f (n)(σ)

n!(x− a)n.

Kortom,

f(x) =n−1∑k=0

f (k)(0)

k!(x− a)k +

f (n)(σ)

n!(x− a)n︸ ︷︷ ︸

1(n−1)!

∫ xa (x−s)n−1f (n)(s) ds.

, (4.54)

met σ tussen a en x.Het resultaat in formule (4.54) is ook te bewijzen zonder de aanname dat

f (n) continu is, met een σ strict tussen a en x. In het geval dat n = 1 reduceertde uitspraak dan tot de middelwaardestelling (Stelling 4.5), en het is weer eenslimme toepassing van diezelfde in Sectie 4.1 bewezen middelwaardestellingwaarmee (4.54) kan worden bewezen. In sommige analyse colleges gebeurtdat wellicht nog.

100

Page 101: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

4.11 Meer calculus: substitutieregels voor integralen

In de vorige secties was partieel integreren de tegenhanger voor de Leibniz-regel voor de afgeleide van het produkt van twee differentieerbare functies.Merk op dat in (4.47), geschreven als∫ β

α

x(t) y′(t) dt︸ ︷︷ ︸dy

= [x(t)y(t)]βα −∫ β

α

y(t)x′(t) dt︸ ︷︷ ︸dx

,

een tweede regel zich aandient als we gebruik maken van de notaties bespro-ken na Stelling 4.12.

De integraal links suggereert een omschrijving naar een integraal met yals nieuwe variabele, en de integraal rechts een integraal met x als nieuwevariabele. De betreffende regel correspondeert via Stelling 4.12 met de ket-tingregel zoals geformuleerd in (4.29) en is af te lezen uit∫ β

α

F ′(x(t))︸ ︷︷ ︸f(x(t))

x′(t) dt = F (x(β))− F (x(α)) =

∫ x(β)

x(α)

F ′(x) dx =

∫ b

a

F ′(x)︸ ︷︷ ︸f(x)

dx,

en geldt sowieso voor continue functies f : [a, b] → IR en continu differenti-eerbare surjectieve functies t → x(t) met x(α) = a en x(β) = b in de vorm∫ b

a

f(x) dx =

∫ β

α

f(x(t))x′(t) dt. (4.55)

De voor hand liggende naam van (4.55) is de substitutieregel: is de inte-graal in het linkerlid slecht hanteerbaar, dan kan een substitutie van de vormx = x(t) soms uitkomst brengen. Omgekeerd kan het zijn dat in een integraalover een t-interval een factor van de vorm x′(t) staat en dat t → x(t) inver-teerbaar is, en een slecht hanteerbare t-integraal kan worden omgeschrevennaar een beter hanteerbare x-integraal.

4.12 Conclusie

We hebben in dit hoofdstuk de belangrijkste aspecten van de theorie onderde differentiaalrekening voor functies van x ∈ IR naar IR wel behandeld. Metlineaire benaderingen en zonder differentiaalquotienten. Omdat we ook hetbestaan van differentieerbare impliciete functies hebben behandeld, hebbenwe de facto bijna alles dat essentieel is voor de theorie onder de differenti-aalrekening voor functies van x en y ook al gezien.

Totale differentieerbaarheid van

(x, y)→ F (x, y)

101

Page 102: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

in een (x0, y0) volgde, let wel, pas na het behandelen van de impliciete func-tiestelling voor oplossingen y = f(x) van F (x, y) = 0, uit aannamen zwakkerdan de makkelijker en bij voorkeur te onthouden aanname dat

Fx(x, y) en Fy(x, y)

in de buurt van (x0, y0) bestaan en continu zijn in (x0, y0). Vervolgens hebbenwe voor functies F (x, y), Φ(x, y) en f(x) met

x→ F (x, f(x))

constant, het stationair zijn van

x→ Φ(x, f(x))

geformuleerd in termen van de gradienten van Φ en F .Daarmee is het belangrijkste45 wel gedaan. Wel zullen we nog tweede

orde afgeleiden nodig hebben voor een criterium dat het positief/negatiefzijn van F ′′(x0) in een stationair punt van F : IR → IR, waar per definitieF ′(x0) = 0, generaliseert, essentieel voor de studie van extreme waarden. Inzo’n criterium voor F : IR2 → IR in een punt waar Fx(x0, y0) = Fy(x0, y0) =0 komen dan onvermijdelijk ook gemengde tweede orde partiele afgeleidenvoor46. Dat de volgorde van zulke afgeleiden bij functies van meer variabelenniet uitmaakt is essentieel, en komt al eerder aan de orde als we van (complex)differentieerbare functies van z = x+iy ∈ IC naar w = u+iv ∈ IC willen latenzien dat hun reele en imaginaire delen u en v toch wel tamelijk bijzonderefuncties van x en y zijn.

De reele stelling waar het dan nog om gaat is dat de totale differentieer-baarheid van

(x, y)→ Fx(x, y) en (x, y)→ Fy(x, y)

in een (x0, y0) voldoende is voor

Fxy(x0, y0) = Fyx(x0, y0),

ook geformuleerd als∂2F

∂y∂x=

∂2F

∂x∂y

in (x0, y0), met kromme d’s voor partiele afgeleiden. Hiermee hebben wehet dan voorlopig wel gehad voor wat betreft de streng wiskundige onder-bouwing van differentiaalrekening voor functies van meer variabelen47 en kan

45 TO DO: werk wat hierna komt goed uit voor φ in (4.31).46 Stelling 11.6 zegt wanneer F (x, y) lokaal eigenlijk een kwadratische functie IS.47 Integraalrekening, en samenhang met differentiaalrekening, is een ander verhaal.

102

Page 103: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

de calculus beginnen dan wel doorgaan, met het uitpakken van al bewezenresultaten.

In de laatste twee secties hebben de twee belangrijkste regels uit de cal-culus voor de 1-dimensionale integraalrekening afgeleid door de met analysebewezen stellingen over differentiaalrekening via de hoofdstellingen van deintegraalrekening toe te passen. Daar was verder geen analyse meer voornodig.

4.13 Wat uitwerkingen

Opgave 4.15. Hoe doen we dit? Als F (ξ) < c dan is ξ < b omdat F (b) > c.Neem bij een ε > 0 met ε < c − F (ξ) de bijbehorende δ > 0 uit de definitievan continuiteit. Dan is F (x)−F (ξ) ≤ |F (x)−F (ξ)| ≤ ε < c−F (ξ) voor allex ∈ [a, b] met |x− ξ| ≤ δ en in het bijzonder is dus ξ+ δ < b en F (ξ+ δ) < c,een tegenspraak met de aanname dat ξ een bovengrens is. Dus F (ξ) ≥ c. StelF (ξ) > c. Neem dan bij ε > 0 met ε < F (ξ)− c de bijbehorende δ > 0 uit dedefinitie van continuiteit. Dan is F (ξ)−F (x) ≤ |F (x)−F (ξ)| ≤ ε < F (ξ)−cvoor alle x ∈ [a, b] met |x − ξ| ≤ δ. Voor die x-waarden geldt dus datF (x) > c. Omdat F (a) < c volgt ξ − δ > a. Maar nu is ξ − δ ook eenbovengrens, in tegenspraak met ξ zijnde de kleinste bovengrens. De enigemogelijkheid is dus dat F (ξ) = c.

Opgave 4.17. Zonder beperking der algemeenheid nemen we nu aan datx0 = 0 = F (x0) en F ′(0) > 0. De differentieerbaarheid van F in x = 0betekent dat er voor elke ε > 0 een δ > 0 is zodanig dat voor alle x ∈ IR met|x| ≤ δ geldt dat

|F (x)− F ′(0)x| ≤ ε|x|,hetgeen voor positieve x equivalent is met

(F ′(0)− ε)x ≤ F (x) ≤ (F ′(0) + ε)x.

De grafiek y = F (x) ligt voor x ∈ [0, δ] dus in de driehoek begrensd door delijnen y = (F ′(0)− ε)x, y = (F ′(0) + ε)x en x = δ.

We kunnen de ongelijkheden voor x ∈ [0, δ] schrijven als

1

F ′(0) + εF (x) ≤ x ≤ 1

F ′(0)− εF (x),

en omdat we al weten dat F en G elkaars inverse functies zijn volgt nu dat

1

F ′(0) + εy ≤ G(y) ≤ 1

F ′(0)− εy,

103

Page 104: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

voor y in een interval [0, η], waarbij we η = (F ′(0) − ε)δ kunnen kiezen.Met die keuze van η ligt de grafiek x = G(y) voor y ∈ [0, η] in de driehoekbegrensd door dezelfde twee “scheve” lijnen en de lijn y = η.

De ongelijkheden voor G(y) gelden voor y ∈ [0, η]. Toewerkend naar dedefinitie van differentieerbaarheid van G in y = 0 volgt

(1

F ′(0) + ε− 1

F ′(0)) y ≤ G(y)− y

F ′(0)≤ (

1

F ′(0)− ε− 1

F ′(0)) y,

i.e.− ε

F ′(0)(F ′(0) + ε)y ≤ G(y)− y

F ′(0)≤ ε

F ′(0)(F ′(0)− ε)y

als0 ≤ y ≤ η = (F ′(0)− ε)δ.

Om academische gezeur over delen door 0 te vermijden beperken we onze εnu door

0 < ε ≤ F ′(0)

2

waarmee voor η volgt dat

η ≥ F ′(0)δ

2,

en vervolgens voor G(y) dat

− ε

F ′(0)2y ≤ G(y)− y

F ′(0)≤ 2ε

F ′(0)2y als 0 ≤ y ≤ F ′(0)δ

2.

Verifieer nu (voor y < 0 is het argument precies hetzelfde) dat

|G(y)− y

F ′(0)| ≤ 2ε

F ′(0)2|y| als |y| ≤ F ′(0)δ

2,

met nog steeds dezelfde δ > 0 bij 0 < ε ≤ F ′(0)2

. We concluderen dat G iny = 0 differentieerbaar is met

G′(0) =1

F ′(0),

de positieve voorfactoren bij ε en δ doen er immers niet toe.

104

Page 105: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

5 Rekenregels en voorbeelden

We hebben de afgeleide van F in x0 gedefinieerd als coefficient van de lineairebenadering in (4.3) waarbij de restterm in verhouding to h willekeurig kleinis voor h → 0. Om de afgeleide ook als limiet van differentiequotienten teschrijven herhalen we nu de definitie van het limietbegrip voor functies.

Definitie 5.1. Als I ⊂ IR een interval is en f : I → IR dan zeggen we voor1

x0 ∈ I en L ∈ IR datL = lim

x→x0

f(x)

als er voor elke ε > 0 een δ > 0 bestaat zodanig dat voor alle x ∈ I deimplicatie

|x− x0| ≤ δ =⇒ |f(x)− L| ≤ ε

geldt. We schrijven ook f(x)→ L als x→ x0.

Opgave 5.2. Als I ⊂ IR een interval is en F : I → IR differentieerbaar is in x0 ∈ I,dan is

F ′(x0) = limx→x0

F (x)− F (x0)

x− x0.

Omgekeerd, als deze limiet bestaat dan is F differentieerbaar in x0 met afgeleideF ′(x0). Bewijs dit.

In de vorm

F ′(x) =dF

dx= lim

h→0

F (x+ h)− F (x)

h(5.1)

is de formule in Opgave 5.2 de gebruikelijke definitie voor de afgeleide functieF ′ die meestal voorafgaat aan de behandeling van differentiaalrekening metlineaire benaderingen. De limiet, indien deze bestaat, heet dan het differen-tiaalquotient, ogenschijnlijk genoteerd als breuk met teller dF en noemer dx,hetgeen ook de notatie dF = F ′(x)dx in Sectie 4.2 suggereert. Met h = ∆xheet de breuk

F (x+ ∆x)− F (x)

∆x=

∆F

∆x

een differentiequotient. Het differentiaalquotient is de limiet van het diffe-rentiequotient als ∆x → 0. We maken in het vervolg en waar dan ook zomin mogelijk gebruik van deze limieten van differentiequotienten.

1 I ⊂ IR is het gesloten interval dat je krijgt door de randpunten van I erbij te stoppen.

105

Page 106: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

5.1 Rekenregels voor de afgeleide

De rekenregels voor de afgeleide functies volgen eenvoudig uit de definitie metlineaire benaderingen, en die lineaire benaderingen worden vaak met x− x0

i.p.v. h geschreven. We behandelen de rekenregels hieronder in het gevalvan IR-waardige functies van x ∈ IR, maar de meeste regels en bewijzenkunnen later overschreven worden voor vectorwaardige functies van meervariabelen. Lees eventueel Sectie 4.6 nog even terug en merk op dat hetuiteindelijk de kettingregel is waarvoor je dit zeker wil weten in je begrip vande differentiaalrekening. Het meeste hieronder is na Sectie 4.6 wat dubbelop,maar te leerzaam om over te slaan, ook omdat het hier alleen over functiesvan een variabele x gaat en de regels voor F (x)+G(x), F (x)G(x), F (x)/G(x)en F (G(x)), respectievelijk de som-, produkt-, quotient- en kettingregel.

Opgave 5.3. Schrijf voor F : I → IR en x0 ∈ I de expansie (4.3) als

F (x) = F (x0) + F ′(x0)(x− x0) +R(x).

Herformuleer de conditie op de restterm2 R(x) die zegt dat F differentieerbaar is inx0 met afgeleide F ′(x0). Laat zien dat die conditie ook impliceert dat F continu is inx0.

Als eerste voorbeeld van een rekenregel die we rechtstreeks uit de lineairebenadering halen bekijken we de functie

x→ 1

F (x),

die natuurlijk wel eerst gedefinieerd moet zijn.

Opgave 5.4. Neem in Opgave 5.3 aan dat I een open interval is en dat F (x0) 6= 0met F continu in x0. Bewijs dat

x→ 1

F (x)

bestaat op een interval [a, b] ⊂ I met a < x0 < b en continu is in x0. Hint: gebruikeerst de definitie van continuıteit met ε = 1

2 |F (x0)| om het interval [a, b] te maken.

In het bijzonder zegt deze opgave dat iedere F ∈ C([a, b]) die geen nulpuntenheeft een “omgekeerde” functie definieert die ook in C([a, b]) zit.

2 We schrijven R(x) i.p.v. R(x;x0) nu.

106

Page 107: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 5.5. Neem in Opgave 5.4 aan dat F differentieerbaar is in x0. Bewijs dat

x→ 1

F (x)

differentieerbaar is in x0 met afgeleide

− F′(x0)

F (x0)2

door1

F (x)=

1

F (x0)+F (x0)− F (x)

F (x)F (x0)

uit werken met behulp van de expansie in Opgave 5.3.

Opgave 5.6. Dezelfde vraag als in Opgave 5.5 maar nu voor

x→ 1

|F (x)|.

Opgave 5.7. Schrijf voor F : I → IR en x0 ∈ I de expansie (4.3) als in Opgave5.3, en gebruik eenzelfde expansie

G(x) = G(x0) +G′(x0)(x− x0) + S(x).

voor G : I → IR. Vermenigvuldig beide expansies, werk uit als

F (x)G(x) = F (x0)G(x0) + (F ′(x0)G(x0) + F (x0)G′(x0))(x− x0) + T (x),

en bewijs dat met F en G ook

x→ F (x)G(x)

differentieerbaar is in x0. Hint: de afgeleide in x0 leest zich onmiddellijk af, laat ziendat de restterm de juiste eigenschappen heeft.

De regel voor de afgeleide van F (x)G(x) heet de regel van Leibniz of ookwel de produktregel: in elke x waar F en G differentieerbaar zijn is ook hetprodukt van F en G differentieerbaar met

(F (x)G(x))′ = F ′(x)G(x) + F (x)G′(x), (5.2)

zie ook (4.27).

107

Page 108: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 5.8. Dezelfde (gaap) vraag als in Opgave 5.7 voor x→ F (x) +G(x).

Opgave 5.9. Schrijf je bewijzen nog een keer over met x − x0 vervangen doorh en zie hoe in de produktregel de twee lineaire benaderingen F (x0) + F ′(x0)h enG(x0) +G′(x0)h met elkaar vermenigvuldigd worden tot

F (x0) +G(x0) + (F ′(x0)G(x0) + F (x0)G′(x0))h+ o(h),

waarbij de term met h2 in o(h) is verdwenen.

Iets lastiger maar ook niet echt moeilijk is de rekenregel voor functiesvan de vorm x→ G(F (x)). Deze regel staat bekend als de kettingregel. Webeperken ons nu tot open intervallen als definitiegebieden.

Opgave 5.10. Neem F : (a, b)→ IR met beeld in (c, d) en G : (c, d)→ IR met Fdifferentieerbaar in x0 ∈ (a, b) en G differentieerbaar in y0 = F (x0) ∈ (c, d). Vul deexpansie voor y = F (x) in in de expansie

G(y) = G(y0) +G′(y0)(y − y0) + S(y)

en bewijs datx→ G(F (x))

differentieerbaar is in x0. Hint: de afgeleide in x0 leest zich af uit

G(F (x)) = G(y) = G(y0) +G′(y0)(F (x− F (x0)) + S(y) =

G(y0) +G′(y0)F ′(x0)(x− x0) +G′(y0)R(x) + S(y)

Laat zien zien dat ook hier de (deels nog uit te werken) restterm de juiste eigenschappenheeft.

Opgave 5.11. Schrijf de lineaire benaderingen ook met h = x− x0 en k = y − y0

als F (x0) + F ′(x0)h en G(y0) +G′(y0)k en zie hoe in de lineaire benadering

G(F (x0 + h)) = G(F (x0)) +G′(y0)F ′(x0)h+ o(h)

de term met h verschijnt door k = F ′(x0)h te substitueren in G′(y0)k. Anders gezegd,verifieer dat

hF ′(x0)−−−−→ F ′(x0)h = k

G′(y0)−−−−→ G′(y0)k = G′(y0)F ′(x0)h. (5.3)

De coefficient G′(y0)F ′(x0) van h = x− x0 lezen we af als de afgeleide van G(F (x))in x0.

108

Page 109: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Met x = x0 + h is h een coordinaat om het gedrag van y = F (x) en dus ookvan k = F (x)− F (x0) rond (h, k) = (0, 0) te beschrijven. In de kettingregelhebben we met y = F (x) en z = G(y) voor

k = F (x)− F (x0) en l = G(F (x))−G(F (x0))

de grafieken

k = F ′(x0)h+ o(h) en l = G′(y0)k + o(k) = G′(y0)F ′(x0)h+ o(h)

in het h, k-vlak, het k, l-vlak en het h, l-vlak rond respectievelijk (h, k) =(0, 0), (k, l) = (0, 0) en (h, l) = (0, 0).

Opgave 5.12. Leg uit waarom Opgave 5.5 achteraf overbodig was. Gebruik devorige opgaven om de eveneens overbodige quotientregel voor de afgeleide van

x→ G(x)

F (x)

in x0 af te leiden in het geval dat F (x0) 6= 0.

Opgave 5.13. Differentieerbaar in x0 impliceert continu in x0 en daarmee dat alle“nieuwe” functies hierboven onder de aannamen ook continu zijn in x0. Daarvoor wascontinuıteit van de ingredienten natuurlijk voldoende. Formuleer en bewijs de voor dehand liggende uitspraken over continuıteit.

5.2 Mooie voorbeelden: machtreeksen

We doen even een voorbeeldje om te laten zien hoe we de analyse zo alge-braısch kunnen houden als maar kan. Neem I = [−r, r] met r > 0, F (x) = x7,vervang x0 door a, x0+h door x en maak voor dit geval (4.3) expliciet middels

x7 = a7 +7a6(x−a)+(x5 +2ax4 +3a2x3 +4a3x2 +5a4x+6a5)(x−a)2, (5.4)

waarin we de afgeleide van x7 in x = a aflezen als de coefficient van x− a.Met x− a in plaats van h is de algebra hier een stuk aangenamer, vooral

omdat

x7 − a7 = (x− a)(x6 + ax5 + a2x4 + a3x3 + a4x2 + a5x+ a6),

109

Page 110: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

en de laatste factor met x = a al de 7a6 geeft, waarna met een staartdelinghet verschil van die factor met 7a6 is te schrijven als (x − a) maal de grotefactor in het rechterlid van (5.4). Leerzame algebra met een mooie uitkomstwaar je meteen een patroon in ziet, en een formule voor de restterm herkentdie je met inductie kunt bewijzen.

Opgave 5.14. Voor n ∈ IN, r > 0 en x, a ∈ [−r, r] geldt dat

xn = an + nan−1(x− a) +Ra,n(x) met |Ra,n(x)| ≤ n(n− 1)

2rn−2(x− a)2.

Geef de formule voor Ra,n(x) (bewijs die met inductie3 als je dat leuk vindt) en bewijsde schatting. Hint: Gebruik 1 + 2 + · · ·+ n = 1

2n(n+ 1) met n− 1.

We zien voor n ≥ 2 dat xn in a afgeleide nan−1 heeft omdat

(a+ h)n = an + nan−1h+R(h; a),

met de expliciete resttermschatting

|R(h; a)| ≤ n(n− 1)

2rn−2h2 ≤ ε|h| voor |h| ≤ δ =

n(n− 1)rn−2.

Merk op dat voor n = 0 en n = 1 deze schatting minder relevant (en in dezevorm onjuist) is omdat in die twee gevallen R(h; a) = 0 voor alle h.

Voor een polynoom

P (x) =k∑

n=0

αnxn

van graad k ≥ 2 gaat het net zo. Vermenigvuldig links en rechts in Opgave5.14 met αn en sommeer. Goed kijkend naar n = 0, 1, 2 volgt

P (x) =k∑

n=0

αnxn = α0 +

k∑n=1

αnnan−1(x− a) +

k∑n=2

αnRa,n(x),

waarin we

P ′(a) =k∑

n=1

nαnan−1

aflezen omdat

|k∑

n=2

αnRa,n(x)| ≤k∑

n=2

|αn|n(n− 1)

2rn−2(x− a)2 ≤ ε|x− a|

3 Ontdekken zul je de formule daarmee zeker niet.

110

Page 111: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

als

|x− a| ≤ δ met δ

k∑n=2

|αn|n(n− 1)

2rn−2 = 2ε.

Maar ja, dan gaat het met (macht)reeksen precies hetzelfde. In

(copy/paste in latex, replace ^k by ^\infty)

P (x) =∞∑n=0

αnxn = α0 +

∞∑n=1

αnnan−1(x− a) +

∞∑n=2

αnRa,n(x), (5.5)

lezen we

P ′(a) =∞∑n=1

nαnan−1 (5.6)

af omdat

|∞∑n=2

αnRa,n(x)| ≤∞∑n=2

|αn|n(n− 1)

2rn−2(x− a)2 ≤ ε|x− a| (5.7)

voor

|x− a| ≤ δ met δ∞∑n=2

|αn|n(n− 1)

2rn−2 = 2ε. (5.8)

De enige eis om te stellen is dat de reeksen

∞∑n=0

αnxn,

∞∑n=1

αnnan−1,

∞∑n=2

|αn|n(n− 1)

2rn−2

convergeren en omdat |x| ≤ r en |a| ≤ r is dat via het gewoon convergentzijn van absoluut convergente reeksen en

1 ≤ n ≤ n(n− 1)

2≤ 1

2n2 (n ≥ 2)

zeker het geval als∞∑n=1

n2|αn|rn ≤ ∞. (5.9)

Opgave 5.15. Bepaal voor de gevallen αn = 1, αn = 1n! en αn = n! het maximale

interval waarop de machtreeks gegeven door (5.5) gedefinieerd is, en doe hetzelfdevoor P ′(x).

111

Page 112: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

In (5.9) is r > 0 nog variabel. Is voor een r > 0 aan (5.9) voldaan, dan is

P (x) =∞∑n=0

αnxn

differentieerbaar op [−r, r] , met (vervang a in (5.6) door x)

P ′(x) =∞∑n=1

nαnxn−1 =

∞∑n=0

(n+ 1)αn+1xn

voor alle x ∈ [−r, r]. De r-waarden waarvoor (5.9) geldt vormen een intervalI2 ⊂ [0,∞) met 0 ∈ I2.

Dit interval hangt niet heel erg sterk van de exponent 2 in (5.9) af. Voorelke k ∈ IN is

Ik = r ≥ 0 :∞∑n=1

nk|αn|rn ≤ ∞

zo’n interval en ze zijn allemaal hetzelfde, maar net niet helemaal.

Opgave 5.16. Het is evident dat

I1 ⊃ I2 ⊃ I3 ⊃ · · · ,

want met grotere k zijn de termen in de reeks groter. Bewijs dat er een R ∈ [0,∞] ismet de eigenschap dat voor elke k ∈ IN geldt dat Ik = [0, R) of Ik = [0, R] en geefvoorbeelden van R = 0, R = 1 en R =∞.

De volgende stelling vat samen wat we nu weten.

Stelling 5.17. Elke machtreeks

P (x) =∞∑n=0

αnxn

met αn ∈ IR voor n ∈ IN0 = 0∪ IN heeft een convergentiestraal R ∈ [0,∞].Voor x ∈ IR met |x| < R geldt dat de termen αnx

n en nαnxn−1 van de

machtreeksen voldoende hard naar 0 gaan om absolute convergentie van zowelP (x) als van

p(x) =∞∑n=1

nαnxn−1 =

∞∑n=0

(n+ 1)αn+1xn

te garanderen, waarbij p de afgeleide is van P op x ∈ IR : |x| < R enP DE primitieve van p met P (0) = α0. Voor x ∈ IR met |x| > R zijn determen van beide machtreeksen onbegrensd en de machtreeksen dus allebeiniet convergent.

112

Page 113: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Op het met hoofdletters gedrukte DE komen we nog even terug. Zonderverdere voorkennis zouden we hier tevreden moeten zijn met de uitspraakdat P (x), met een vrije keuze voor α0, de enige machtreeks is die p(x) alsafgeleide machtreeks heeft. Merk op dat Stelling 5.17 eigenlijk een uitspraakis over P en p samen. Dat voor |x| < R de enige vrijheidsgraad die er isin de primitieve van p overeenkomt met de waarde van (de constante term)α0 ∈ IR is hier in eerste instantie een uitspraak over machtreeksen.

Het zou natuurlijk kunnen zijn dat er nog andere primitieve functies zijn.In het eenvoudigste voorbeeld dat p(x) = 0 voor alle x ∈ IR leidt dit tot devraag of er functies zijn die differentieerbaar zijn op een interval met afgeleideoveral nul, maar zelf niet constant. Je bent het misschien vergeten, maar hetantwoord op die vraag was gelukkig al nee, zie Stelling 4.5 en verder.

Met uitdrukkingen zoals P (x) kunnen we nu eenvoudige differentiaal-vergelijkingen oplossen. Bijvoorbeeld de differentiaalvergelijking

F ′(x) = F (x). (5.10)

Welke functies zijn differentieerbaar met afgeleide gelijk aan zichzelf? Pro-beer maar een machtreeks. Term voor term uitschrijven helpt om te zien water gebeurt. Als

P (x) = α0 + α1x+ α2x2 + α3x

3 + α4x4 + α5x

5 + α6x6 + α7x

7 + · · ·

met convergentiestraal R dan is voor |x| < R de afgeleide gelijk aan

P ′(x) = α1 + 2α2x+ 3α3x2 + 4α4x

3 + 5α5x4 + 6α6x

5 + 7α7x6 + 8α8x

7 + · · · ,

en dus is

P ′(x)−P (x) = (α1−α0) + (2α2−α1)x+ (3α3−α2)x2 + (4α4−α3)x3 + · · · ,

hetgeen alleen maar 0 is als

0 = α1 − α0 = 2α2 − α1 = 3α3 − α2 = 4α4 − α3 = · · · !

Het uitroepteken staat er niet voor niets bij. Een waarheid als een koe. Toch?Of niet? Ja, wel!

Opgave 5.18. Neem aan dat r > 0 en dat P (x) convergent is voor alle x ∈ IR met|x| < r, en dat P (x) = 0 voor al die x. Waarom is α0 = 0? Haal vervolgens x buitenhaakjes en concludeer dat α1 = 0, waarom? Etc.

113

Page 114: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Toegepast op de verschilmachtreeks zien we de recurrente betrekking

αn =αn−1

n

verschijnen. Als bijvoorbeeld α0 = 1 worden de volgende coefficienten gege-ven door

α1 = 1, α2 =1

2, α3 =

1

2

1

3, α4 =

1

2

1

3

1

4, · · · ,

m.a.w.

αn =1

n!voor alle n ∈ IN0.

Stelling 5.19. Laat r > 0. De enige machtreeks die voldoet aan zowelP ′(x) = P (x) voor alle x ∈ IR met |x| < r als aan P (0) = 1 is

P (x) = exp(x) =∞∑n=0

xn

n!= 1 + x+

x2

2+x3

6+x4

24+

x5

120+

x6

720+ · · · .

Opgave 5.20. Laat zien dat de reeks in Opgave 5.19 voor elke x ∈ IR convergentis. De machtreeks heeft dus convergentiestraal R =∞ en is zijn eigen afgeleide.

Definitie 5.21. Voor een functie F : [a,∞) → IR zeggen we dat F (x) → 0als x→∞, als er voor elke ε > 0 een ξ ∈ [a,∞) bestaat waarmee geldt:

x ≥ ξ =⇒ |F (x)| ≤ ε.

.

Opgave 5.22. Laat zien dat voor elke n ∈ IN geldt dat

xn

exp(x)→ 0 als x→∞,

de bekende standaardlimiet die zegt dat exp(x) het wint van elke macht van x.

5.3 De natuurlijke logaritme

Expliciete schattingen zijn handig als je sommen wil nemen zoals in de stapvan monomen xn naar machtreeksen als in (5.5). Bijvoorbeeld om de vraagte beantwoorden voor welke x ∈ IR de Laurentreeks

L(x) =∞∑

n=−∞

αnxn = · · ·+ α−2

x2+α−1

x+ α0 + αx+ α2x

2 + · · ·

114

Page 115: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

convergent is en term voor term gedifferentieerd kan worden, met |x| niette groot voor de positieve machten en |x| niet te klein voor de negatievemachten. Verzin hiertoe eerst maar een mooie variant op (5.4) in de vorm

1

x7=

1

a7− 7

a8(x− a) +Ra(x).

Misschien doe je dit liever eerst voor de functie

x→ 1

x,

die bij de omgekeerde operatie (primitiveren) meteen het buitenbeentje is,want geen afgeleide van een algebraısche functie!

Definitie 5.23. Voor x > 0 wordt lnx, de natuurlijke logaritme van x, watonnatuurlijk gedefinieerd door

lnx =

∫ x

1

1

sds.

Opgave 5.24. Leidt rechtsreeks uit de definities af dat voor 0 < a < b, f ∈ RI([a, b])en c > 0 geldt dat ∫ b

a(f(x) dx =

1

c

∫ cb

caf(x

c) dx,

en gebruik dit om voor x > 1 en y > 1 de integraal voor ln y te schrijven als integraalvan x tot xy. Concludeer dat

lnxy = lnx+ ln y.

Bewijs dat deze identiteit geldt voor alle x, y ∈ IR+. Hint: laat apart zien dat

lnx+ ln1

x= 0

voor alle x > 0.

Opgave 5.25. Uit de definitie volgt dat ln een strict stijgende functie is op IR+.Bewijs en gebruik de ongelijkheid

lnn ≥ 1

2+

1

3+

1

4+ · · ·+ 1

n=

n∑k=2

1

k

om te laten zien4 dat lnx→∞ als x→∞. Geef daarvan en daartoe ook een definitiezoals Definitie 5.21. Wat geldt er voor x→ 0?

4 Kijk nog even naar (22).

115

Page 116: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 5.26. Vanwege Opgave 5.25 en Stelling 4.16 heeft ln een inverse functieF : IR→ IR+. Laat zie dat uit de stelling ook volgt dat F (0) = 1 en F ′(y) = F (y)voor alle y ∈ IR. Leg uit waarom ln maar een inverse functie kan hebben en concludeerdat F = exp.

Opgave 5.27. Laat zien dat exp(x + y) = exp(x) exp(y) voor alle x, y ∈ IR, endat met e = exp(1) gedefinieerd door

ln e =

∫ e

1

1

xdx = 1

geldt dat

exp(p

q) = e

pq = q√ep

voor alle p ∈ IZ en alle q ∈ IN. Bij afspraak is ex = exp(x) ook voor alle anderex ∈ IR.

Waarom die afspraak? In Opgave 5.27 zijn machten van ex van e eerstvoor x = p

q∈ IQ uitgewerkt. Voor zulke x vallen exp(x) en ex dus samen.

Omdat x → exp(x) een differentieerbare en dus continue functie is geldt nudat er = exp(r) → exp(x) als r → x langs r ∈ IQ, hetgeen de algemeneconsensus dat ex als limiet van er gedefinieerd MOET worden wel rechtvaar-digt: bij deze is ex dus voortaan gelijk aan exp(x) voor alle x ∈ IR. Over deuitspraak e tot de macht x kan in rede5 getwist worden.

Voor machten xα van een willekeurige x > 0 is het verhaal precies het-zelfde. Met de hierboven gevonden rekenregels voor exp en ln is eerst

xn = (elnx)n = en lnx

voor n ∈ IN, vervolgens leid je af dat n ∈ IN door r = pq∈ IQ vervangen mag

worden en eenzelfde consensus als voor de e-macht is nu gerechtvaardigd:

xα = eα lnx voor x > 0 en α ∈ IR. (5.11)

Het is leuk om daar even reeel mee te spelen. De volgende twee opgavenzijn een eerste kennismaking met asymptotische formules. De notatie

f(x) ∼ g(x) voor x→ a (5.12)

5 Over e tot de macht πi niet natuurlijk, komt geen machtsverheffen bij van pas.

116

Page 117: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

betekent bij afspraak dat

f(x)

g(x)→ 1 als x→ a,

waarbij voor a bijvoorbeeld 0 of ∞ mag worden gelezen. Zulke formulesworden ook gebruikt met n ∈ IN i.p.v. x ∈ IR. Bijvoorbeeld

n! ∼ (n

e)n√

2πn als n→∞, (5.13)

de formule van Stirling waarover we hier iets minder uitgebreid dan in [HM]nog over komen te spreken.

Als wat links van het ∼ teken lastig te doorgronden is en de rechterkantwel transparant is dan kunnen dit soort uitspraken bijzonder nuttig zijn.Kwestie van smaak soms, want de keuze van g(x) ligt uiteraard niet vast.

Opgave 5.28. Onderzoek de functie F : x → xx met x ∈ IR+ m.b.v. de definitiein (5.11). Schets de grafiek. Bepaal een zo simpel mogelijke functie g : IR+ → IRzodanig dat

F (x)− 1 ∼ xg(x)

als x→ 0, i.e.F (x)− 1

xg(x)→ 1.

Als we F (0) = 1 stellen is F dan (rechts)differentieerbaar in x = 0?

Opgave 5.29. Omdat xx strict stijgend is in x als x voldoende groot is (groterdan wat?) heeft x→ xx een inverse functie y → f(y) gedefinieerd voor y voldoendegroot. Laat zien dat f gedefinieerd is door de vergelijking x lnx = ln y, breng lnx naarde andere kant en gebruik de formule die je dan krijgt voor x weer in de rechterkantteneinde een zo simpel mogelijke g(y) te vinden zodanig dat

f(y) ∼ ln y

g(y)

als y → ∞. Hint: uitdrukkingen met x en y die je naar 1 wil laten gaan kun je in xuitdrukken en vervolgens via t = lnx en Opgave 5.22 behandelen.

117

Page 118: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

5.4 Zijstapje: tetratie

Dit is een verhaaltje over a tot de macht a tot de macht a tot de macht a enga zo maar door, dat voor a > 1 niet alleen in verband staat met een echte6

toepassing, maar ook voor a→ 0 laat zien hoe a tot de macht a tot de machta tot huppeldepup maar niet kan kiezen tussen 0 en 1.

Neem daartoe voor a > 0 de rij gegeven door

x0 = 1, x1 = a, x2 = aa, x3 = aaa

, x4 = aaaa

, . . . ,

dus xn, notatie ook wel xn = na, is gedefinieerd door

xn = axn−1 = Fa(xn−1) (n ∈ IN) met x0 = 1.

Een zogenaamd discreet dynamisch systeem waarbij de afbeelding

x→ Fa(x) = ax = ex ln a

wordt geitereerd.

Opgave 5.30. Voor a > 1 is er een kritieke waarde a = ac waarvoor de grafieky = Fa(x) de diagonaal y = x in het x, y-vlak raakt7. Bepaal ac en de limiet van derij nac voor n→∞. Bewijs de uitspraken die je doet.

Opgave 5.31. Laat zien dat de vergelijking Fa(x) = x voor 1 < a < ac tweeoplossingen a < a heeft, en dat de rij na voor n → ∞ naar a convergeert. Laat ziendat voor a > ac de rij na naar oneindig gaat als n→∞ .

Opgave 5.32. Laat zien dat de vergelijking Fa(x) = x voor 0 < a < 1 een oplossingx = a heeft, en dat de rij na voor n → ∞ naar a convergeert als a > a∗ met a∗

gegeven door een conditie op F ′a(a). Wat is die conditie? Bepaal a∗ exact.

Opgave 5.33. Laat zien dat voor 0 < a < a∗ de rij 2na convergeert naar eenvan de drie oplossingen van de vergelijking Fa(Fa(x)) = x die geen oplossing is vanFa(x) = x, en dat de rij 2n−1a naar de andere oplossing convergeert. Noem dielimieten b en b. Deze hangen van a af. Wat gebeurt er met b en b als a→ 0?

6 Vraag het Henk Knoester van Tejin Twaron of anders Federico Camia (die zag het).7 Lees: Fa(x) = x, F ′a(x) = 1.

118

Page 119: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

5.5 Meer differentiaalvergelijkingen

De machtreeks voor exp(x) als oplossing van een differentiaalvergelijkingsmaakt naar meer.

Stelling 5.34. Laat r > 0. De enige machtreeks die voldoet aan zowelP ′′(x) + P (x) = 0 voor alle x ∈ IR met |x| < r, als aan P (0) = 0 enP ′(0) = 1, is

P (x) = sinx = x− x3

6+

x5

120− x7

5040+ · · · .

Opgave 5.35. Bewijs Stelling 5.34. Schrijf P (x) in de fatsoenlijke somnotatiezonder stippels. Wat is de convergentiestraal? Wat is de afgeleide van sin? Noemdeze functie maar cos. Wat is de afgeleide van cos?

Dat exp(x), sin x, cos x zijn8 wat ze, moeten zijn, namelijk e = exp(1) totde macht x, en sinus en cosinus van een hoek x in radialen, is nog niet meteenduidelijk9 . Ook willen we wel even zeker weten dat er geen andere functiesdan deze machtreeksen zijn met de eigenschappen die exp(x), cosx, sinx alsmachtreeks uniek definieren. Eenzelfde vraag is reeds beantwoord voor func-ties met de eigenschap dat F ′(x) = 0 voor alle x met |x| < r.

De eigenschappen van cos en sin zijn natuurlijk te halen uit het feit datde reeksen van cosx en sinx net als die voor exp(x) absoluut convergent zijnvoor alle x ∈ IR en dus uitvermenigvuldigd10 kunnen worden. Dat is watgepriegel.

Opgave 5.36. Laat zien dat voor alle x ∈ IR geldt dat

cos2 x+ sin2 x = 1,

door voor cosx en sinx de machtreeksen in te vullen, de kwadraten11 uit te werkenen op te tellen.

8 We zouden eigenlijk sin(x) en cos(x) moeten schrijven, maar dat doet vrijwel niemand.9 Voor exp inmiddels wel, maar alleen dankzij ln.

10 Bewijs (met Stelling 3.18) en gebruik daarna dat voor absoluut convergente reeksen

(

∞∑n=0

an)(

∞∑m=0

bm) =

∞∑k=0

(

k∑j=0

ajbk−j). (5.14)

11 Lees cos2 x = (cosx)2 en idem voor sin.

119

Page 120: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 5.37. Bewijs de gelijkheid in Opgave 5.36 zonder al dat rekenwerk doorop te merken dat cos2 x en sin2 x als kwadraten van machtreeksen weer machtreeksenzijn. Hint: hun som is dus ook een machtreeks. Wat weet je via Opgave 5.34 van deafgeleide van die machtreeks? Dus?

Bovenstaande opgaven zijn nuttige oefeningen12, maar inzicht bieden zeniet echt. De machtreeksen zijn oplossingsformules voor een differentiaalver-gelijking die met F ′′(x) + F (x) = 0 een notatie heeft die de tenen van eennatuurkundige terecht doen krommen. Dit is namelijk de vergelijking vooreen harmonische oscillator die we bij voorkeur schrijven als

x+ x = 0,

waarin x de afhankelijke grootheid (plaats) is en t de onafhankelijke groot-heid, die overeenkomt met wat wiskundigen de hoek in radialen noemen. Dusx = x(t) en x staat voor de tweede afgeleide van t→ x(t). Oplossingen zijnperiodiek met periode 2π. Het verband met cirkels en met name eenparigecirkelbewegingen13 via y = −x in het x, y-vlak is natuurlijk de moeite vanhet bespreken waard en we verwijzen in dit verband naar [HM].

Met name omdat formules als

cos(a+ b) = cos a cos b− sin a sin b

en de vorm van de grafiek van x = sin t in het t, x-vlak bij voorkeur uit dedifferentiaalvergelijking gehaald worden en juist niet uit de oplossingsformu-les. Maar voor wie meer wil rekenen met zulke formules, het is zeker nietverboden, zeer leerzaam zelfs:

Opgave 5.38. Bewijs met de theorie tot nu toe door middel van o.a. machtsreeks-berekeningen dat sin een periodieke functie is met een periode die we wel 2π mogennoemen, en dat − sin(−x) = sinx = sin(π − x) > 0 voor 0 < x < π. Schets degrafiek van sin.

Terug naar de differentiaalvergelijking F ′(x) = F (x): wat nog niet duide-lijk is of er nog andere oplossingen zijn dan machtreeksoplossingen. Te prefe-reren is wellicht een directe uitspraak dat oplossingen van zulke differentiaal-vergelijkingen altijd wel machtreeksen moeten zijn. Voor nu is het echter de

12 En aanbevolen voor wie niet van formules houdt.13 Zie op Valentijnsdag 2017 de Bildungsscheurkalender van Henk Sissing.

120

Page 121: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

(later wellicht overbodige14) vraag of een functie F die aan F ′(x) = F (x)voldoet op een interval I, op dat interval nulpunten kan hebben, zonder15 opdat zelfde interval de nulfunctie te zijn.

We beantwoorden die vraag nu door juist te kijken naar oplossingen dieergens positief zijn (voor negatief is het argument hetzelfde door naar −F (x)te kijken).

Opgave 5.39. Laat I ⊂ IR een open interval zijn en F : I → IR differentieerbaarmet F ′(x) = F (x) voor alle x ∈ I en (a, b) ⊂ I een maximaal open interval waaropF (x) > 0. Dan is (a, b) = I. Bewijs dit door de vergelijking op te lossen via schei-ding van variabelen onder de aanname dat F (x) > 0, gebruikmakend van ondermeerOpgave 5.10 en

F ′(x) = F (x) ⇐⇒ F ′(x)

F (x)= 1 ⇐⇒ ln(F (x)) = x+ C ⇐⇒ F (x) = ex+c

Opgave 5.40. Dezelfde vraag als in Opgave 5.39 maar nu voor F : I → IR dievoldoet aan F ′(x) = F (x)g(x) met g : I → IR continu. Los de differentiaalvergelijkingook weer (zoals dat op school genoemd wordt) exact op m.b.v. een primitieve G vang.

Opgave 5.41. Voor α ∈ IR voldoet de functie Fα : (−1,∞) → IR+ gedefinieerddoor Fα(x) = (1 + x)α aan een differentiaalvergelijking zoals in Opgave 5.40. Schrijfdeze in de vorm (1 + x)F ′(x) = αF (x) en bepaal een machtreeksoplossing van devorm

1 + a1x+ a2x2 + a3x

3 + · · · .

Schrijf de coefficienten in een vorm waarmee je in het geval α = n ∈ IN het binomiumvan Newton herkent. De convergentiestraal van deze machtreeks (voor α 6∈ IN0) isR = 1. Kun je dat aantonen? Waarom volgt nu dat Fα(x) (alleen) voor |x| < 1 gelijkis aan de machtreeks16 die je net hebt uitgerekend?

14 Dat zijn soms de belangrijkste vragen...15 Als je weet dat F (x+ y) = F (x)F (y) ben je natuurlijk wel meteen klaar.16 Om echt te onthouden is α = −1, ook α = ± 1

n komt vaak van pas.

121

Page 122: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 5.42. Schrijf een paar termen uit van17

n√

1 + x = 1 +x

n+ · · · en

1n√

1 + x= 1− x

n+ · · ·

Bovenstaande opgaven bevatten ad hoc argumenten om de oplossing vaneen eerste orde lineaire differentiaalvergelijking gegeven een randvoorwaardeals machtreeks te identificeren. Voor vergelijkingen als F ′′(x)+F (x) = 0 gaathet rekenwerk net zo, maar zijn de ad hoc argumenten wat anders, een redente meer om de ad hoc redenaties te vervangen door een aanpak gebaseerdop integraalvergelijkingen, die we oplossen in de vectoruimte van continuefuncties op gesloten begrensde intervallen, in C([a, b]) dus. Dat doen we inSectie 10.4.

Een alternatieve vraag om wellicht hier al te stellen blijft hoe je van eenfunctie gedefinieerd als oplossing van zo’n integraalvergelijking, bijvoorbeeld

F (x) = 1 +

∫ x

0

F (s) ds, (5.15)

meteen ziet dat de functie, in ieder geval voor |x| kleiner dan een te bepalenen zo groot mogelijke r, gegeven wordt door een ondubbelzinnig gedefinieerdemachtreeks.

5.6 Meer inverse functies

In Sectie 4.3 hadden we nog niet zoveel functies tot onze beschikking, maarnu wel. Hier volgen wat opgaven om de belangrijkste functies de revue telaten passeren.

Opgave 5.43. Laat zien dat de functie

x→ sinx

cosx= tanx

strict stijgend is op (−π2 ,

π2 ) en een inverse

y → arctan y

heeft op IR met afgeleide1

1 + y2

17 Zie weer [Eves, §2.5] over het gebruik van zulke reeksen voor YBC7289?

122

Page 123: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

en leid hieruit af dat

arctan y = y − 1

3y3 +

1

5y5 − · · ·

voor |y| < 1.

Opgave 5.44. Laat zien dat de functie

x→ sinx

strict stijgend is op (−π2 ,

π2 ) en een inverse

y → arcsin y

heeft op (−1, 1) met afgeleide1√

1− y2

en leid hieruit een machtreeks af voor arcsin y voor |y| < 1.

Opgave 5.45. Ookx→ cosx

is strict montonoon op een maximaal open interval, bijvoorbeeld op (0, π). Laat ziendat voor de inverse geldt dat arccos y + arcsin y constant is op (−1, 1). Wat is deconstante?

5.7 Rare voorbeelden

Er zijn ook functies F : [a, b]→ IR die in elke x0 ∈ [a, b] differentieerbaar zijnmet een afgeleide F ′(x0), waarvoor F ′ : [a, b]→ IR wel als functie

x→ F ′(x) (5.16)

is gedefinieerd maar niet in C([a, b]) zit. Dat komt omdat de meest vreemdefuncties differentieerbaar kunnen zijn.

Opgave 5.46. Als g : IR → IR een functie is die continu is in x = 0 met waardeg(0) = 0, dan is de functie R : IR → IR gedefinieerd door R(x) = xg(x) differenti-eerbaar in x = 0 met afgeleide R′(x) = 0. Laat dit zien rechtstreeks vanuit Definitie4.1.

123

Page 124: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Voor de functie g in Opgave 5.46 kun je bijvoorbeeld g(x) = 0 voor x ∈ IQen g(x) = x voor x 6∈ IQ nemen. Zo krijg je een functie f : IR → IR die ingeen enkele x 6= 0 continu is maar wel differentieerbaar is in x = 0.

Opgave 5.47. Definieer f : IR→ IR door f(0) = 0 en (voor x 6= 0)

f(x) = x2 sin1

x2.

Laat zien dat f in elke x ∈ IR differentieerbaar is maar dat f ′(x) niet eens begrensdis op het interval [0, 1]. Hint: gebruik dat de functies cos en sin periodiek zijn maarniet constant.

Opgave 5.48. Definieer f : IR→ IR door f(0) = 0 en (voor x 6= 0)

exp(− 1

x2).

Schets de grafiek van f . Laat met de theorie tot nu toe zien dat f afgeleiden f ′, f ′′, . . .van iedere orde heeft en dat in x = 0 alle afgeleiden van f gelijk zijn aan 0.

5.8 Stirling’s formule via schalen en limieten

We hebben partieel integreren in Sectie 4.10 gebruikt om Taylorbenaderingente maken, maar partieel integreren wordt natuurlijk ook gebruikt om gewoonintegralen uit te rekenen. Een mooi voorbeeld is de integraalformule voor n!met n ∈ IN.

Opgave 5.49. Bereken∫ ∞0

exp(−x) dx,

∫ ∞0

x exp(−x) dx,

∫ ∞0

x2 exp(−x) dx,

∫ ∞0

x3 exp(−x) dx,

en geef voor n! een integraalformule18. NB Dit zijn zogenaamde oneigenlijke integra-len, zie Definitie 2.44. Lees dus ∫ ∞

0= lim

R→∞

∫ R

0

en doe daar verder vooral niet te moeilijk over (maar leg wel uit welke al behandeldestandaardlimiet je steeds gebruikt).

18 Het is niet verboden om die formule met inductie te bewijzen hoor.

124

Page 125: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Met Opgave 5.49 komen we nu terug op (5.13). Waar die formule vandaankomt wordt aanstonds duidelijk.

Opgave 5.50. Schets de grafiek y = xne−x (voor n nog niet te groot) in het Tekenplaatje!

x, y-vlak. Waar ligt de top van de berg?

Opgave 5.51. Door de in Opgave 5.49 gevonden integraal voor n! met het maximumvan de integrand te schalen en horizontaal te schuiven volgt dat

n! = (n

e)n∫ ∞−n

gn(x)dx

metgn(x) = (1 +

x

n)ne−x

Laat dit zien m.b.v. (5.11) en schets de nieuwe grafiek y = gn(x).

Opgave 5.52. De eerste factor van gn(x) is de rente op rente benadering vanex die in [HM] in detail wordt besproken alvorens exp(x) wordt gedefinieerd als depuntsgewijze limiet van

en(x) = (1 +x

n)n

voor n→∞. Verifieer deze limiet met wat je nu aan tools tot je beschikking hebt ,enook dat en(x) stijgt met n voor x > −n.

Bijgevolg stijgt gn(x) dus naar 1 voor elke x ∈ IR. Omdat gn(x) stijgend isin x voor x ∈ [−n, 0] en dalend in x voor x ≥ 0 is wel duidelijk dat∫ ∞

−ngn(x)dx→∞

als n → ∞. Kunnen we het gebied waarvan deze integraal de oppervlaktegeeft horizontaal schalen (met een n-afhankelijke schaalfactor) teneinde weleen eindige limiet te krijgen?

Opgave 5.53. Schrijf daartoe

gn(x) = e−ψn(x) met ψn(x) = − ln(gn(x)),

125

Page 126: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

en verifieer dat

ψn(x) = x− n ln(1 +x

n) = n(

x

n− ln(1 +

x

n)) = nψ1(

x

n).

De rij functies ψn ontstaat dus door schalen uit een en dezelfde functie Ψ =ψ1, en die functie heeft als formulevoorschrift

Ψ(x) = x− ln(1 + x). (5.17)

Hoe ziet de grafiek van Ψ eruit? Je weet al dat Ψ(0) = Ψ′(0) = 0 omdatgn(x) een maximum ter grootte 1 heeft in x = 0. Omdat

Ψ′(x) = 1− 1

1 + x=

x

1 + x∼ x

als x→ 0, volgt voor Ψ zelf dat

Ψ(x) ∼ 1

2x2

als x → 0. De grafiek van Ψ wordt verder gekenmerkt door een verticaleasymptoot bij x = −1 en bijna-lineaire groei voor x→∞.

Wel een schetsje waard deze grafiek maar belangrijker is dat voor ψn nu Tekenplaatje!

geldt dat

ψn(x) = nΨ(x

n) ∼ x2

2n,

niet alleen voor x → 0, maar ook voor xn→ 0, hetgeen steeds grotere x

toelaat, maar waarbij in de limiet n→∞ niets overblijft.Een schaling waarbij wel wat overblijft lezen we onmiddellijk af. We

moeten x zo schalen dat de n in het rechterlid verdwijnt, en dus substituterenwe x = s

√n. Met deze schaling volgt nu dat

n! = (n

e)n√n

∫ ∞−√n

e−nΨ( s√

n)ds (5.18)

In de integrand zien we een nieuwe anders geschaalde versie van Ψ, diewe zo hebben gekozen dat voor elke n geldt dat

nΨ(s√n

) ∼ 1

2s2, (5.19)

nu niet alleen voor s → 0, maar ook voor s√n→ 0. Het fraaie is dat met

grotere n deze geschaalde Ψ(s) steeds meer op zijn kwadratische benadering

126

Page 127: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

bij s = 0 gaat lijken. We zoomen zo in op de oorsprong dat in de limietalleen de parabool overblijft, juist omdat we (de grafiek van) Ψ verticaal enhorizontaal anders schalen. De schaling is zo gekozen dat 1

2s2 van schalen

niets merkt en in de limiet n → ∞ wordt het linkerlid in (5.19) gelijk aanhet rechterlid. De linkergrens van de integraal schuift daarbij op naar −∞.

Wat we nu nog moeten doen om te kunnen concluderen dat

n! ∼ (n

e)n√n

∫ ∞−∞

e−12s2ds (5.20)

als n→∞ is bewijzen dat∫ ∞−√n

e−nΨ( s√

n)ds→

∫ ∞−∞

e−12s2ds (5.21)

als n→∞. Puntsgewijs geldt weliswaar dat

fn(s) = e−nΨ( s√

n) → e−

12s2

als n→∞, maar dat op zich is niet genoeg om (5.21) te kunnen concluderen.

Opgave 5.54. Bereken de afgeleide van fn(s) naar n voor vaste s en laat zien datdeze afgeleide een teken heeft dat alleen van het teken van s afhangt. Hint: gebruikde formule voor Ψ pas op het allerlaatst.

We zien nu dat, net als hun integranden, de integralen∫ 0

−√n

e−nΨ( s√

n)ds en

∫ ∞0

e−nΨ( s√

n)ds

stijgend respectievelijk dalend zijn in n. Zijn deze rijen convergent met limietrespectievelijk ∫ 0

−∞e−

12s2ds en

∫ ∞0

e−12s2ds?

Een positief antwoord vertelt ons dan dat (5.20) waar is, en alleen de limie-tintegraal zelf moet dan nog worden uitgerekend. Wat we nodig hebben zijneen paar niet te moeilijke stellingen over het verwisselen van integralen enlimieten.

127

Page 128: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

5.9 Makkelijke convergentiestellingen

Opgave 5.55. We bekijken nu eerst het geval van eindige intervallen [a, b] en inte-gralen van rijen functies fn : [a, b]→ IR met

∀x ∈ [a, b] 1 ≤ n1 ≤ n2 =⇒ fn1(x) ≤ fn2(x),

en∀n ∈ IN a ≤ x1 ≤ x2 ≤ b =⇒ fn(x1) ≤ fn(x2).

Neem aan dat zo’n rij fn begrensd is. Bewijs rechtstreeks vanuit de definitie metonder- en bovensommen van de integraal voor monotone functies dat∫ b

af(x)dx = lim

n→∞

∫ b

afn(x)dx,

waarbij f : [a, b]→ IR is gedefinieerd door

f(x) = limn→∞

fn(x).

Er zijn nog drie versies van deze stelling. Welke drie?

Merk op dat we niets aannamen over het teken van fn(x). In de volgendeopgave doen we dat wel.

Opgave 5.56. We bekijken nu het geval van het interval [0,∞) en integralen vanrijen functies fn : [0,∞)→ [0,∞) met

∀x ∈ [0,∞) 1 ≤ n1 ≤ n2 =⇒ fn1(x) ≥ fn2(x),

en∀n ∈ IN 0 ≤ x1 ≤ x2 =⇒ fn(x1) ≥ fn(x2).

Neem aan dat ∫ ∞0

f1(x)dx = limb→∞

∫ b

0f1(x)dx

bestaat. Bewijs rechtstreeks vanuit de definities dat dan∫ ∞0

f(x)dx = limn→∞

∫ ∞0

fn(x)dx,

waarbijf(x) = lim

n→∞fn(x).

128

Page 129: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Van deze stelling zijn er geen drie versies omdat positieve monotoon stij-gende functies niet integreerbaar zijn op [0,∞) en ook omdat het geval fnstijgend echt anders is.

Opgave 5.57. Formuleer en bewijs een bruikbare stelling als in Opgave 5.56 voorrijen functies met

∀x ∈ [0,∞) 1 ≤ n1 ≤ n2 =⇒ fn1(x) ≤ fn2(x),

en∀n ∈ IN 0 ≤ x1 ≤ x2 =⇒ fn(x1) ≥ fn(x2).

Opgave 5.58. Bewijs (5.20) met behulp van de laatste twee opgaven.

129

Page 130: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

6 Analyse met meer variabelen

In dit hoofdstuk doen we vooral differentiaal- en wat integraalrekening voorfuncties van meer variabelen. We beginnen in IR2 met rechthoekige coordinatenx, y ∈ IR en maken veelvuldig gebruik van de transformatie

x = r cos θ;

y = r sin θ,

waarmee punten (x, y) 6= (0, 0) in het vlak via hun afstand r =√x2 + y2 tot

de oorsprong (0, 0) en hoek θ tussen de halfrechte

(tx, ty) : t ≥ 0

en de positieve x-as beschreven worden. Ook identificeren we indien gewenstIR2 met de verzameling IC van de complexe getallen

z = x+ iy

en schrijven |z| = r voor wat de absolute waarde van z genoemd wordt, deafstand van z tot de oorsprong z = 0. De hoek θ = arg z heet het argumenten is voor iedere z 6= 0 modulo 2π uniek bepaald.

Naast de gewone optelling

w+ z = (u+ iv) + (x+ iy) = u+x+ i(v+ y) = (u+x, v+ y) = (u, v) + (x, y)

is er de wat complexere vermenigvuldiging

wz = (u+iv)(x+iy) = ux−vy+i(uy+vx) = (ux−vy, uy+vx) = (u, v)(x, y)

gebaseerd op de rekenregel i2 = −1, voor w = u+ iv = (u, v) en z = x+ iy =(x, y) ∈ IR2 = IC. Hiermee wordt IC een lichaam1 dat algebraisch gesloten is.Erg fijn is het regeltje dat bij vermenigvuldigen van twee complexe getallende absolute waarden vermenigvuldigd en de argumenten opgeteld moetenworden om absolute waarde en argument van het produkt te krijgen.

Opgave 6.1. Schrijf zj = rj(cos θj + i sin θj) voor j = 1, 2 en gebruik de somregelsvoor cos en sin om te laten zien dat

z1z2 = r1r2(cos(θ1 + θ2) + i sin(θ1 + θ2)).

Dit regeltje is een van de vele redenen om

cos θ + i sin θ = exp(iθ)

te schrijven en exp(z) = exp(x) exp(iy).

1 Lees: heeft dezelfde rekenregels als IR. Ook geldt |w+ z| ≤ |w|+ |z| en |wz| = |w| |z|.

130

Page 131: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

De poolcoordinaten zijn overigens niet nodig2 om tot het inzicht te komendat voor vaste γ ∈ IC de afbeelding

z → γz (6.1)

een draaivermenigvuldiging is, zie (6.11) en Opgave 6.4.

6.1 Zijstapje: de hoofdstelling van de algebra

De uitspraak dat IC algebraisch gesloten is betekent dat elk polynoom

P (z) =n−1∑k=0

αkzk + zn (6.2)

met α0, . . . , αn−1 ∈ IC en n ≥ 2 een nulpunt z1 ∈ IC heeft, en vervolgens geldtmet dank aan de staartdeling dat

P (z) =n−1∑k=0

αkzk + zn = (z − z1)Q(z)

waarin

Q(z) =n−2∑k=0

βkzk + zn−1,

met β0, . . . , βn−2 ∈ IC. Herhaald toepassen geeft

P (z) = Πnk=1(z − zk) met z1, . . . , zn ∈ IC. (6.3)

Deze uitspraak wordt helaas de hoofdstelling van de algebra genoemd.Een sympathieke wiskundige geboren in Reeuwijk heeft meer dan 50 ver-schillende bewijzen van deze stelling verzameld. Geen daarvan is echt al-gebraisch en het bewijs dat nu volgt is er daar een van. Ik vond het toenik probeerde het standaardbewijs met complexe functies te vermijden. Datcomplexe bewijs zie je doorgaans bij een college over complexe functietheorieals toepassing van de Stelling van Liouville die zegt dat er geen begrensdecomplex differentieerbare functies f : IC → IC zijn behalve de constantefuncties. Zie ook

www-groups.dcs.st-and.ac.uk/history/HistTopics/Fund_theorem_of_algebra.html

2 Waar zijn die hoeken eigenlijk wel voor nodig?

131

Page 132: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Een vergelijkbare stelling zegt dat er geen positieve harmonische3 functiesf : IRN → IR zijn. Dat bewijs probeerde ik hier in stelling te brengenen toen ging het argument een eigen leven leiden. Uiteindelijk maakt hetalleen gebruik van Stelling 12.11 in de appendix, die voor het geval N = 1overeenkomt met Opgave 2.35, de opgave die de exercities na Definitie 2.25afsluit.

Didaktisch wel aardig is dat je het bewijs eerst kunt doen voor een twee-degraads polynoom4 zonder wortelformules5 te gebruiken, en dan ziet dat hetvoor elke hogere graad hetzelfde gaat. Hieronder doe ik het echter meteenvoor het algemene geval en dat is min of meer hoe Argand het deed.

Als z → P (z) = p(x, y) + iq(x, y) geen nulpunten heeft in IC dan is

(x, y) = x+ iy = z → |P (z)| > 0

vanwege enig voorwerk als in Opgave 5.13 een continue strict positieve IR-waardige functie op IR2 die op cirkels van de vorm x2 +y2 = r2 naar benedenbegrensd is middels6

|P (z)| = |n−1∑k=0

αkzk + zn| ≥ |zn| − |

n−1∑k=0

αkzk| ≥ rn −

n−1∑k=0

|αk|rk

≥ rn−1(r −n−1∑k=0

|αk|)→∞

als r →∞. Maar dan heeft (x, y)→ |P (z)| op iedere disk

(x, y) : x2 + y2 ≤ r2

een strict positief globaal minimum dat voor grote r niet meer verandert alsr nog groter genomen wordt, en dus een globaal minimum op IR2, zeg inz = z0.

Stel nu w = z − z0 en

Q(w) =P (z)

P (z0).

Dan is

Q(w) = 1 +n∑k=1

γkwk (6.4)

3 Functies met ∆f = 0, zie (6.14) en Sectie 9.4.4 Met z2 + 1 bijvoorbeeld, als je de lachers op je hand wil krijgen.5 Die zijn er niet voor graad vijf en hoger.6 Bewijs en gebruik |a+ b| ≥ |a| − |b| voor a, b ∈ IC = IR2.

132

Page 133: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

met γ1, γ2, . . . , γn ∈ IC, γn 6= 0, en w → |Q(w)| heeft nu een globaal minimumter grootte Q(0) = 1.

Hetzelfde geldt7 voor z → |Q(z)| en dus neemt u + iv = w = Q(z) =Q(x + iy) geen w-waarden aan met u2 + v2 < 1. Maar met Opgave 6.1 isγk = ck exp(iφk) en dus

w = Q(z) = 1 +n∑k=1

ckrk exp(i(φk + kθ)), (6.5)

een uitdrukking8 waarin de φk-tjes als parameters9 gezien kunnen wordenmet r klein maar vast genomen. En dat geeft een tegenspraak:

Opgave 6.2. Leidt nu een tegenspraak af door aan te tonen dat er waarden metu2 + v2 < 1 worden aangenomen. Hint: er is een eerste ck die niet nul is, en voor rklein is die term groter dan de rest van de som.

6.2 Differentiaalrekening, ook met complexe getallen

In Sectie 5.2 hebben we gezien, uitgaande van het voorbeeld x→ x7, dat

x→ α0 + α1x+ α2x2 + · · · =

∞∑n=1

αnxn

voor iedere keuze van αn ∈ IR voor n ∈ IN0 een functie definieert op een

BR = x ∈ IR : |x| < R

met R ∈ [0,∞], een functie waarmee voor wat betreft differentiaalrekeningmag worden gerekend als met polynomen. Het punt om hier te maken is dat,met een search en replace waarbij het linker gedeelte van

x, x0, a, αn ∈ IR ↔ z = x+iy, z0 = x0 +iy0, c = a+bi, γn = αn+iβn ∈ IC

wordt vervangen door het rechtergedeelte10, de hele vrijwel algebraische be-handeling van differentiaalrekening van machtreeksen gewoon doorgaat, methet begrip complex differentieerbaar voor functies

H : IC→ IC,

7 We komen letters te kort, dus hergebruiken we ze hier maar voor de dummy variabele.8 Niet zo fraai aan het bewijs is het gebruik van die niet-algebraische poolcoordinaten.9 Ptolemaeus had dit wel mooi gevonden.

10 Ik probeer systematisch te zijn met het alphabet voor zolang het duurt.

133

Page 134: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

overgeschreven van gewoon differentieerbaar voor F : IR→ IR.We beginnen dus met de complexe versie van (4.3) in de vorm

w = H(z) = H(z0) + γ(z − z0) + T (z; z0) (6.6)

= H(z0) +H ′(z0)(z − z0) + o(|z − z0|)

als z → z0, en pakken dit nu uit, waarbij w = u + iv en u en v dus functiesvan x en y zijn, u = F (x, y) en v = G(x, y), en11 H(z) = F (x, y) + iG(x, y).

We kunnen H dan natuurlijk ook zien als vectorwaardige functie

H : IR2 → IR2

via de identificatie IC = IR2, met componenten H1 = F en H2 = G alsfuncties van12 x1 = x en x2 = y.

Voor zulke functies hebben we ook de gewone aanpak van differentieer-baarheid, met lineaire expansies

H1(x1, x2) = H2(a1, a2) + A11(x1 − a1) + A12(x2 − a2) +R1(x1, x2; a1, a2);

H2(x1, x2) = H2(a1, a2) + A21(x1 − a1) + A22(x2 − a2) +R2(x1, x2; a1, a2),

en resttermen R1,2 die klein moeten zijn in verhouding tot het lineaire stuk13

als x1 → a1 en x2 → a2. Dat zeggen we zo wat precieser, maar eerst nog eenopgave om te laten zien waar de observaties hierboven toe leiden als je eeneenvoudige voorbeeldje uitwerkt.

Opgave 6.3. Werk w = exp(z) = exp(x+iy) uit met de machtreeks voor exp(z) enverifieer dat exp(z) = exp(x) exp(iy) met exp(iy) = cosx+ i sinx. Leg uit waaromdit leidt het invoeren van de meerwaardige14 functie

w → logw = ln |w|+ i argw.

In vectorvorm schrijven we de expansies voor H1 en H2 als H(x1, x2) =(H1(x1, x2)

H2(x1, x2)

)=

(H2(x1, x2)

H2(a1, a2)

)+

(A11(x1 − a1) + A12(x2 − a2)

A21(x1 − a1) + A22(x2 − a2)

)+R,

11 Met toevallig de H van holomorf.12 Variabelen nummeren we met alphabet en indices, al naar wat uitkomt.13 De termen met de coefficienten A11, A12, A21, A22.14 Een kniesoor die er op let: meerwaardige functies zijn geen functies.

134

Page 135: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

waarin ook R = R(x1, x2; a1, a2), net als H(x1, x2) en H(a1, a2), weer een 2-vector is. Met hi = xi − ai is het lineaire stuk in de expansie voor H(x1, x2)hierboven in matrixnotatie15 gelijk aan

Ah =

(A11h1 + A12h2

A21h1 + A22h2

)=

(A11 A12

A21 A22

)(h1

h2

), (6.7)

en af te schatten via bijvoorbeeld

|A11h1 + A12h2| ≤√A2

11 + A212

√h2

1 + h22;

|A21h1 + A22h2| ≤√A2

21 + A222

√h2

1 + h22,

als

|A11h1 + A12h2|2 + |A21h1 + A22h2|2 ≤ (A211 + A2

12 + A221 + A2

22︸ ︷︷ ︸|A|2

)(h21 + h2

2),

ofwel|Ah|

2≤ |A|

2|h|

2, (6.8)

waarin de “absolute waarde strepen” met subindex 2 nu voor Euclidischelengte van h = x− a, Ah en ook A staan16, steeds de wortel uit de som vande kwadraten van de entries, ook voor de matrix A geintroduceerd in (6.7),die we steeds ook zien als (lineaire) afbeelding17

hA−→ Ah.

De conditie voor differentieerbaarheid18 is met

H(x) = H(a) + A(x− a) +R(x; a) dat |R(x; a)|2

= o(|x− a|2) (6.9)

als |x − a|2→ 0. Dit is typografisch nu niet meer te onderscheiden van de

differentieerbaarheid van H : IRm → IRn, met bijvoorbeeld m = n = 1. Ookvoor H : X → Y met X en Y genormeerde ruimten, A : X → Y lineair encontinu19, ziet het er, afgezien van de subindex 2, precies hetzelfde uit, zieeventueel al Sectie 10.2.

15 Spot the matrix.16 Dus |h|2

2= h21 + h22 en |A|2

2= A2

11 +A212 +A2

21 +A222.

17 Wat moet je hier van matrices weten? Deze afspraak en de matrixnotatie als in (6.7).18 Vergelijk ook met (4.25) in Sectie 4.6, waar a = (0, 0) genomen is in (4.24).19 Lineaire afbeeldingen zijn dan niet meer automatisch continu!

135

Page 136: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Door per component van H steeds een variabele tegelijk te varieren zienwe dat A de afgeleiden van de partiele functies

x1 → H1(x1, x2), x2 → H1(x1, x2), x1 → H2(x1, x2), x2 → H2(x1, x2)

geevalueerd in (x1, x2) = (a1, a2) als entries heeft, dus

A =

(A11 A12

A21 A22

)=

(∂H1

∂x1

∂H1

∂x2

∂H2

∂x1

∂H2

∂x2

)= H ′(x) = DH(x) =

∂H

∂x(6.10)

als m = n = 2. In Sectie 9.3 komen we hier nog op terug. We zien A = H ′(x)als lineaire afbeelding20 van in dit geval IR2 naar IR2, die we identificerenmet zijn Jacobimatrix DH(x), een matrix die we ook graag noteren met ∂H

∂x.

In die Jacobimatrix staan in de rijen (horizontaal) de coordinaten van degradienten van de IR-waardige functies H1 en H2.

Vergelijk dit nu met (6.6), waarin, met h = x − x0 en k = y − y0, delineaire term herschrijft als

γ(z − z0) = (α + iβ)(h+ ik) = αh− βk + i(βh+ αk),

en correspondeert met(αh− βkβh+ αk

)=

(α − ββ α

)(h

k

), (6.11)

met daarin de matrix die de afbeelding (6.1) beschrijft. In het bijzonder staatin de eerste kolom het beeld van de eerste eenheidsvector, en in de tweedekolom het beeld van de tweede eenheidsvector.

Opgave 6.4. Overtuig jezelf ervan dat (6.1) een draaivermenigvuldiging is, i.e. desamenstelling van een rotatie rond de oorsprong en een puntvermenigvuldiging vanuitde oorsprong.

We zien nu dat (6.9) dan moet gelden met een bijzondere vorm voor de2× 2 matrix A. Dat formuleren we als stelling.

Stelling 6.5. Laat H : IR2 → IR2 differentieerbaar zijn in (a1, a2) met line-aire benadering gegeven door (6.7). Dan is H gezien als H : IC → IC ookcomplex differentieerbaar in (a1, a2) dan en slechts dan als voor de matrix Ageldt dat

∂H1

∂x1

= A11 = A22 =∂H2

∂x2

en∂H1

∂x2

= A12 = −A21 = −∂H2

∂x1

,

de afgeleiden geevalueerd in (x1, x2) = (a1, a2).

20 Wat moet je met zulke A kunnen? Vooral de inverse uitrekenen, zie Sectie 6.3.

136

Page 137: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Is H op deze manier complex differentieerbaar, dan schrijven we nu evenliever (x, y) = (x0, y0) dan (x1, x2) = (a1, a2). Via

z = x+ iy ∈ IC↔ (x, y) ∈ IR2 en w = u+ iv ∈ IC↔ (u, v) ∈ IR2

en metα + iβ = H ′(z0)

geldt dan dat α en β gegeven worden door

α =∂u

∂xen β = −∂u

∂y, (6.12)

waarbij u en v als functies van x en y voldoen aan de zogenaamde Cauchy-Riemann vergelijkingen

∂u

∂x=∂v

∂yen

∂v

∂x= −∂u

∂y(6.13)

in (x, y) = (x0, y0).Zijn deze partiele afgeleiden zelf differentieerbaar21 in (x, y) = (x0, y0)

dan volgt dat

∂2u

∂x2=

∂x

∂v

∂y=

∂y

∂v

∂x= − ∂

∂y

∂u

∂y= −∂

2u

∂y2,

als de volgorde van differentieren er niet toe doet, en net zo voor v(x, y). Indat geval geldt

∆u =∂2u

∂x2+∂2u

∂y2= 0 =

∂2v

∂x2+∂2v

∂y2= ∆v (6.14)

in (x0, y0).Op de differentiaaloperator ∆, die de Laplaciaan heet, komen we nog

uitgebreid terug, en juist daarom willen we nu wel even zeker weten hoe hetzit met de volgorde van de partiele afgeleiden. Dit is daarom zo’n beetjede laatste stelling uit de analyse over differentiaalrekening die we echt nodighebben.

Stelling 6.6. Laat v : IR2 → IR de eigenschap hebben dat

(x, y)→ ∂v

∂x= vx(x, y) en (x, y)→ ∂v

∂y= vy(x, y)

differentieerbaar zijn in (x0, y0). Dan bestaan in (x0, y0) de tweede ordepartiele afgeleiden en geldt

vyx(x0, y0) =∂

∂x

∂v

∂y=

∂y

∂v

∂x= vxy(x0, y0).

21 Geldt onder de aanname dat f complex differentieerbaar is in de buurt van (x0, y0)!

137

Page 138: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Bewijs. Neem zonder beperking der algemeenheid (x0, y0) = (0, 0). De aan-name impliceert dat de eerste orde partiele afgeleiden bestaan in de buurtvan (0, 0). Voor x 6= 0 en y 6= 0 voldoende klein geldt vanwege de middel-waardestelling (Stelling 4.5), toegepast op

y → v(x, y)− v(0, y)

voor zekere (ook x-afhankelijke) η tussen 0 en y, en de differentieerbaarheidvan vy in (0, 0) dat

v(x, y)− v(0, y)− v(x, 0) + v(0, 0) = (vy(x, η)− vy(0, η))y

= (vy(0, 0)+vyx(0, 0)x+vyy(0, 0)η+R(x, η)−vy(0, 0)−vyy(0, 0)η−R(0, η))y

= (vyx(0, 0)x+R(x, η)−R(0, η))y,

waarin

R(x, η) = o(√x2 + η2) en dus ook R(0, η) = o(η) als

√x2 + η2 → 0.

De differentieerbaarheid van

(x, y)→ vy(x, y)

in (0, 0) is hier dus twee keer gebruikt, met dezelfde “resttermfunctie” R.Omdat |η| ≤ |y| concluderen we dat

v(x, y)− v(0, y)− v(x, 0) + v(0, 0) = vyx(0, 0)xy + y o(r)

= vyx(0, 0)xy + o(r2) = vxy(0, 0)xy + o(r2) (6.15)

als r =√x2 + y2 → 0.

De tweede versie onder (6.15) volgt door de rollen van x en y te verwis-selen. Merk op dat het eerste gelijkteken op de regel in (6.15) hierbovenvan links naar rechts moet worden gelezen. Als een restterm y keer kleineo van r is, dan is die term zeker kleine o van r2, en zo bewijst (6.15) datvyx(0, 0) = vyx(0, 0).

Opgave 6.7. Zie (4.4) en gebruik de definitie van kleine o om de conclusie datvyx(0, 0) = vyx(0, 0) te rechtvaardigen.

138

Page 139: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Twee keer differentieerbare functies u(x, y) en v(x, y) die op een open22

verzameling van IR2 voldoen aan (6.14) heten harmonisch. Bijgevolg zijn defuncties

(x, y)→ Re(x+ iy)n en (x, y)→ Im(x+ iy)n

harmonisch op heel IR2. Dit zijn de zogenaamde homogene harmonischepolynomen van graad n = 1, 2, 3, . . . die in (6.17) nog terugkomen.

Twee keer differentieerbaar betekent hier dat de afbeelding

(x, y)→ (∂u

∂x

∂u

∂y)

zelf weer differentieerbaar is. Met de kettingregel23 zijn dan ook

(x, y)→ (∂u

∂x

∂u

∂y)→ ∂u

∂xen (x, y)→ (

∂u

∂x

∂u

∂y)→ ∂u

∂y

differentieerbaar en dus heeft ∆u = 0 betekenis als

∂2u

∂x2+∂2u

∂y2= 0, (6.16)

zonder dat daar een v bij hoort24 via een complexwaardige functie.Niet-constante oplossingen van (6.16) zijn er in overvloed. Bijvoorbeeld

de homogene harmonische polynomen

x, y, x2−y2, 2xy, x3−3xy2, 3x2y−y3, x4−6x2y2 +y4, 4x3y−4xy3, . . . (6.17)

van respectievelijk graad 1, 1, 2, 2, 3, 3, 4, 4, . . . hierboven.

6.3 Randvoorwaarden en de methode van Lagrange

Dit onderwerp is al begonnen in Sectie 4.7 waar we de formule

Φx = Φy(Fy)(−1)Fx (6.18)

in (x, y) = (0, 0) hebben afgeleid voor het stationair zijn van

xφ−→ φ(x) = Φ(x, f(x))

in x = 0 met de in Sectie 4.6 gevonden impliciete functie

y = f(x)

22 Zie Opgave 12.14 in Hoofdstuk 12 voor een definitie van open.23 Triviaal toegepast op een ketting waarin de tweede schakel lineair is.24 Althans niet a priori.

139

Page 140: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

als lokale beschrijving van F (x, y) = 0 in de buurt van (x, y) = (0, 0).De continuiteit van de partiele afgeleiden

(x, y)→ Fx(x, y) en (x, y)→ Fy(x, y)

in de buurt van (0, 0), en de inverteerbaarheid van Fy in (0, 0) waren vol-doende voor een bewijs dat de niveauverzameling

S = (x, y) : F (x, y) = F (0, 0) (6.19)

in de buurt van (x, y) = (0, 0) beschreven wordt als de grafiek van een impli-ciet gedefinieerde continu differentieerbare functie f .

De verzameling S is zo lokaal geparametrizeerd door

x→ X(x) = (x, f(x))

met een 2×1 Jacobimatrix ∂X∂x

. De parametrizatie is lokaal een bijectie tussenS en een omgeving van x = 0, en dat is dankzij de inverteerbaarheid van de1× 1 matrix

A = Fy (6.20)

in (0, 0).Differentieerbaarheid van

(x, y)→ Φ(x, y)

was vervolgens voldoende voor (6.18) als noodzakelijke en voldoende voor-waarde voor φ′(x) = 0, niet alleen in x = 0 maar in de hele omgeving vanx = 0 waar f(x) gemaakt en Fy(x, f(x)) inverteerbaar is, en daar deden weeen beetje moeilijk over in Opgave 4.23, waar delen door werd vermeden metmeetkundige reeksen.

Dat had een reden want met bijvoorbeeld

x ∈ IR2, y ∈ IR3,

F : IR5 → IR3, Φ : IR5 → IR,

f : IR2 → IR3, φ : IR2 → IR,

zijn de stellingen en bewijzen hetzelfde als in Secties 4.4, 4.5, 4.6, 4.7. In hetbijzonder geldt dat voor het bestaan van de functie f en conditie (6.18) alskarakterisatie voor het stationair zijn van de functie

xφ−→ Φ(x, f(x)).

140

Page 141: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

We laten nu eerst zien hoe dat uitpakt als de multiplicatoren methode vanLagrange en lezen (6.18) daartoe als een uitspraak voor Jacobimatrices en debijbehorende lineaire afbeeldingen. Als je vertrouwd bent met matrixreke-ning kun je het volgende overslaan en verder lezen vanaf (6.23), de getrans-poneerde versie van (6.18).

In het algemeen is een25 m× n reele matrix A een blok met reele entriesaij, de verticale index i lopend van 1 tot en met m, de horizontale index jvan 1 tot en met n. Als lineaire afbeelding stuurt A dan een n-vector x ∈ IRn

met coordinaten x1, . . . , xn naar een een m-vector y ∈ IRm met coordinaten

yi =n∑j=1

aijxj.

We zeggen datA ∈ L(IRn, IRm),

de verzameling van lineaire afbeeldingen van IRn naar IRm, die zelf weer eenvectorruimte vormen.

Is B een reele n × p matrix met entries bjk, de verticale index j lopendvan 1 tot en met n, de horizontale index k van 1 tot en met p, dan is perdefinitie AB de m× p matrix met entries

n∑j=1

aijbjk, (6.21)

met bijbehorende lineaire afbeelding26

A B : IRp B−→: IRn A−→ IRm.

Klappen we beide blokken om door met de eerste index juist horizontaal, enmet de tweede index verticaal te nummeren, dan krijgen we getransponeerdematrices AT en BT met entries aTji = aij en bTkj = bjk, leest (6.21) als deentries van BTAT , en is (AB)T = BTAT .

In het bijzonder geval dat m = n = p kan het voorkomen dat AB = I, den×n matrix met op de diagonaal alleen maar 1-en en voor de rest alleen maar0-en. Met I correspondeert de lineaire afbeelding I = In die elke x ∈ IRn

naar zichzelf stuurt. Wat je van lineaire albegra nu echt moet weten27 is nietalleen dat in dat geval de lineaire afbeelding AB gelijk is aan de afbeelding

25 Met m en n in IN natuurlijk.26 A voorafgegaan door B.27 Een bewijs zou bij Lineaire Algebra in een van de eerste colleges moeten zitten.

141

Page 142: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

In, maar ook dat A en B nu elkaars inverse zijn als lineaire afbeeldingen:A B = B A = In, B = A(−1), A = B(−1). En hetzelfde geldt dan voor degetransponeerden. Uitspraken die alleen te maken hebben met het oplossenvan vergelijkingen van de vorm Ax = y met A een vierkante matrix, endaarop komen we in Sectie 6.5 nog terug.

Met nog een derde p × r matrix C met entries ckl is (AB)C de matrixmet entries

p∑k=1

(n∑j=1

aijbjk)ckl =

p∑k=1

n∑j=1

aijbjkckl, (6.22)

hetgeen ook de entries zijn van A(BC) door de sommatie volgorde te verwis-selen. Kortom (AB)C = A(BC) en dus schrijven we ABC voor het produktvan A, B en C. De bijbehorende lineaire afbeelding is A B C. Transpo-neren geeft dan weer dat (ABC)T = CTBTAT , en dat gebruiken we nu voor(6.18).

We schrijven (6.18) getransponeerd als

∇xF (∇yF )(−1)∇Φy = ∇xΦ, (6.23)

waarin∇xF,∇yF,∇xΦ,∇yΦ

de getransponeerde matrices zijn van de “partiele” Jacobimatrices

∂F

∂x,∂F

∂y,∂Φ

∂x,∂Φ

∂y

behorende bij Fx, Fy,Φx,Φy.Uitpakken28 van de notatie geeft

∇xF = (∇xF1 ∇xF2 ∇xF3) =

(∂F1

∂x1

∂F2

∂x1

∂F3

∂x1

∂F1

∂x2

∂F2

∂x2

∂F3

∂x2

)en hetzelfde voor ∇yF , een bij aanname in (0, 0, 0, 0, 0) vierkante inverteer-bare 3× 3 matrix, waarvan de inverse als afbeelding de gradientvectoren

∇yF1,∇yF2,∇yF3

terugstuurt29 naar de eenheidsvectoren e1, e2, e3 in IR3.Schrijf nu ∇yΦ ∈ IR3 als lineaire combinatie30

∇yΦ = λ1∇yF1 + λ2∇yF2 + λ3∇yF3, (6.24)

28 Meer is het niet, maar ga dat wel na!29 Ga na: de kolomvectoren van een matrix A zijn de beelden onder A van de e-tjes.30 Dit kan vanwege de inverteerbaarheidseis op Fy.

142

Page 143: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

met λ1, λ2, λ3 ∈ IR. Dan volgt dat ∇xF (∇yF )(−1) in het linkerlid van (6.23)werkt op (6.24) als

∇yΦ(∇yF )(−1)

−−−−−−→ λ1e1 + λ2e2 + λ3e3∇xF−−→ λ1∇xF1 + λ2∇xF2 + λ3∇xF3 = ∇xΦ

vanwege (6.23), hetgeen met (6.24) combineert tot

∇Φ = λ1∇F1 + λ2∇F2 + λ3∇F3, (6.25)

simpelweg31 omdat het voor ∇x en ∇y apart geldt! Het stationair zijn van

Φ : S → IR

in (0, 0) is zo equivalent met het bestaan van multiplicatoren λ1, λ2, λ3 ∈ IRwaarvoor (6.25) geldt in (0, 0, 0, 0, 0).

6.4 Toepassing: de ongelijkheid van Holder

In (6.8) was|Ah|

2≤ |A|

2|h|

2

een bijzonder geval van|AB|

2≤ |A|

2|B|

2,

met A en B die op elkaar passen in de zin dat AB als produktmatrix bestaat,zie de uitleg rond (6.21), en (6.30) war verderop. In het speciale geval datA = a een rijmatrix is met entries ai en B = b een kolommatrix met entriesbi, staat hier dat

|n∑i=1

aibi| ≤ 2

√∑i

|ai|2 2

√∑i

|bi|2,

een ongelijkheid die bekend staat als de ongelijkheid van Cauchy-Schwarz32,en die zegt dat het inprodukt van twee vectoren in absolute waarde op zijnhoogst gelijk is aan het produkt van hun lengten uitgerekend met Pythago-ras. Let wel, deze ongelijkheid wordt standaard bij elk eerste Lineaire Algebracollege bewezen, en vervolgens gebruikt om te laten zien dat de Pythagoras-norm aan de driehoeksongelijkheid voldoet, en op die ongelijkheid is alleswat we tot nu doen wel zo’n beetje gebaseerd. Wat nu volgt voor algemenereexponenten is dus niet zomaar een alternatief bewijs van de ongelijkheid van

31 Er hoeft dus geen 3× 3 matrix geinverteerd te worden.....32 Die elkaar royaal niet gekend hebben.

143

Page 144: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Cauchy-Schwarz zelf, want we stellen nu alleen de vraag voor welke anderewaarden van p en q ook geldt dat

|n∑i=1

aibi| ≤ |a|p |b|q , (6.26)

als |a|p

en |b|q

gedefinieerd zijn door (we vermijden de wortels)

|a|pp

=n∑i=1

|ai|p en |b|qq

=n∑i=1

|bi|q.

Met p = q = 2 is (6.26) ongelijkheid van Cauchy-Schwarz.Merk op dat voor elke p > 0 en q > 0 de ongelijkheid (6.26) schaalt met

a en b. De vraag voor welke p en q de ongelijkheid geldt kan dus beantwoordworden door het linkerlid te bekijken op de verzameling van vectoren a en bgegeven door |a|

p= |b|

q= 1, ofwel

φ(a1, . . . , an) = |a1|p + · · ·+ |an|p = 1;

ψ(b1, . . . , bn) = |b1|q + · · ·+ |bn|q = 1,

twee randvoorwaarden waaronder we het maximum en het minimum van defunctie

(a1, . . . , an, b1, . . . , bn)F−→ a1b1 + · · ·+ anbn

zoeken. We weten dat dat maximum en minimum bestaan want de rand-voorwaarden definieren een begrensde gesloten deelverzameling van IR2n enF is continu.

De randvoorwaarden worden gegeven door de functies φ en ψ die echteralleen voor p > 1 en q > 1 continu differentieerbaar zijn, omdat de afgeleidevan x→ |x|p gelijk is aan x→ pxp−1, waarbij we even de tijdelijke afspraakmaken dat we voor r > 0 de functie x → xr als oneven functie definieren.Met twee Lagrange multiplicatoren λ en µ krijgen we nu de 2n vergelijkingen

bi = λpap−1i ; ai = µqbq−1

i (i = 1, . . . , n)

om op te lossen samen met

n∑i=1

|ai|p =n∑i=1

|bi|q = 1.

144

Page 145: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 6.8. Neem aan dat (p − 1)(q − 1) 6= 1. Bewijs dat in dat geval voor deoplossingen van deze vergelijkingen geldt dat alle |ai| aan elkaar gelijk zijn en alle |bi|aan elkaar gelijk zijn, en dat bijgevolg

n∑i=1

|aibi| = n(1

n)

1p

+ 1q = n

1− 1p− 1q . (6.27)

Leid hieruit af dat (6.26) geldt voor p > 1 en q > 1 met 1p + 1

q = 1.

6.5 Aftelbare sommen van vierkante matrices

Het enige dat we na Opgave 4.23 nog moeten doen om zeker te weten datalles uit Secties 4.4, 4.5, 4.6, 4.7 hier overgeschreven kan worden, is hoe hetzit met meetkundige reeksen als

I + A+ A2 + A3 + · · · , (6.28)

met A een vierkante matrix, bijvoorbeeld een 2× 2 matrix als in (6.7). Dievraag verdient nu deze aparte sectie. In de volgende sectie behandelen wedan de impliciete functiestelling voor F : IRn+m → IRm.

Voor een 2× 2 matrix als in (6.7) hebben we voor de bijhorende lineaireafbeelding A : IR2 → IR2 een schatting van de vorm (6.8). Je gaat eenvoudigna33 dat voor elke n× n matrix en elke reele n-vector h geldt dat

|Ah|2≤M |h|

2, (6.29)

waarin M ≥ 0 gedefinieerd is door

M2 =n∑

i,j=1

a2ij,

zeg maar de Pythagoraslengte van A, dus M = |A|2. De kleinste M waarvoor

(6.29) geldt heet de operatornorm van A, notatie |A|op

, waarbij we A nu zienals lineaire afbeelding van IRn naar IRn. Deze |A| is dus de grootst mogelijkeverhouding tussen de Euclidische lengtes van Ah en h.

We zeggen weer dat

A ∈ L(IRn, IRn) = L(IRn),

33 Voor mijn part met volledige inductie.

145

Page 146: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

waarmee de verzameling L(IRn) gedefinieerd is, niet alleen een lineaire vec-torruimte over IR, maar ook een genormeerde algebra, vanwege de extrabewerking

(A,B)→ AB,

en de eigenschappen van de operatornorm

A→ |A|op.

Het is eenvoudig om rechtstreeks uit de definities te zien dat niet alleen

|A|op

= 0 ⇐⇒ A = 0, |λA|op

= |λ| |A|op≥ 0, |A+B|

op≤ |A|

op+ |B|

op,

maar ook|AB|

op≤ |A|

op|B|

op

voor alle A,B ∈ L(IRn) en λ ∈ IR.

Merk op dat L(IRn) als vectorruimte hetzelfde34 is als IRn2

, met de stan-daard Pythagorasnorm

A→ |A|2

gegeven door

|A|22

=n∑

i,j=1

a2ij.

Aardig is dat ook|AB|

2≤ |A|

2|B|

2(6.30)

geldt35, maar omdat |A|op≤ |A|

2voor alle A ∈ L(IRn) gebruiken we in

Opgave 6.10 liever de kleinere norm | · |op

waarvoor deze ongelijkheid ookgeldt.

.

Opgave 6.9. Bewijs dat er een µn ∈ (0, 1] bestaat waar mee geldt dat

µn|A|2 ≤ |A|op ≤ |A|2voor alle A ∈ L(IRn). Hint36: stel niet, dan kun je op

A ∈ L(IRn) : |A|op

= 1

de Pythagorasnorm |A|2, en dus ook een van de lengtes van de kolomvectoren wille-

keurig groot krijgen, en dat zal toch een tegenspraak moeten geven met |A|op

= 1.

34 Of je de entries nu in een blok of in een kolom of rij zet maakt niet echt uit.35 Bewijs dat dit zo is!36 Terzijde: |A|

opis de wortel uit de grootste eigenwaarde van ATA.

146

Page 147: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 6.10. Neem aan dat A ∈ L(IRn) voldoet aan |A|op< 1. Laat zien dat

voor de reeks in (6.28) geldt dat

(I −A)(I +A+A2 +A3 + · · · ) = I,

en leg uit waarom

(I +A)(−1) = I −A+A2 −A3 + · · · =∞∑j=0

(−A)j

als |A|op< 1, hetgeen zeker het geval is als |A|

2< 1.

De details van de impliciete functiestelling voor vectorwaardige functiesvan meer variabelen en de multiplicatorenmethode van Lagrange kun je nuwel invullen. Maar ook zie je met een wat suggestieve notatie dat de macht-reeks

∞∑j=0

xj

van de functiex

f−→ (1− x)−1

correspondeert met

Af−→∞∑j=0

Aj = I + A+ A2 + A3 + · · · . (6.31)

Voor welke functies f en welke A ∈ L(IRn) is f(A) op een natuurlijke maniergedefinieerd met rekenregels die uit de rekenregels voor de functies volgens?Een vraag om op terug te komen, maar voor machtreeksen37 kun je eenpartieel antwoord wel geven nu.

6.6 Impliciete functiestelling in Euclidische ruimten

We gebruiken de notatie

x ∈ X = IRn, y ∈ Y = IRm, (x, y) ∈ X × Y = IRn+m,

en formuleren de impliciete functiestelling in de buurt van een vast punt(x, y) = (a, b). Omdat we net als in (4.23) continue differentieerbaarheid vande impliciete functie willen hebben eisen we nu meteen dat (x, y)→ Fx(x, y)en (x, y) → Fy(x, y) continu zijn in een omgeving van (x, y) = (a, b), en datis hetzelfde38 als F continu differentieerbaar op die omgeving.

37 Denk als eerste aan exp(A).38 Daar komen we nog op terug in algemenere context.

147

Page 148: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Stelling 6.11. (Impliciete functiestelling) Laat voor r > 0 de functie Fcontinu differentieerbaar zijn op Br(a)× Br(b). Als Fy(a, b) inverteerbaar isdan bestaan er δ0 > 0 en ε0 > 0, en een continu differentieerbare functief : Bδ0(a)→ Bε0(b), zodanig dat

(x, y) ∈ Bδ0(a)× Bε0(b) : F (x, y) = F (a, b) = (x, f(x)) : x ∈ Bδ0(a),

waarbij geldt dat f ′(x) = −(Fy(x, f(x)))−1Fx(x, f(x)) voor alle x ∈ Bδ0(a).

Het bewijs kan nu worden overgeschreven van de bewijzen in Secties 4.4 en4.5. In het bijzonder wordt de samengestelde functie x → F (x, f(x)) nietgedifferentieerd om de uitdrukking voor f ′(x) af te leiden.

Omdat in de constructie van y = f(x) eerst 0 < ε0 ≤ r en daarnaδ0 > 0 klein genoeg gekozen wordt, en vervolgens δ0 nog kleiner moet wordengekozen om f ′(x) = −(Fy(x, f(x)))−1Fx(x, f(x)) gedefinieerd te hebben voor|x| ≤ δ0, zal in het algemeen niet gelden dat δ0 > ε0. De facto kan Stelling6.11 dus gelezen worden als het bestaan van 0 < δ0 ≤ ε0 ≤ r waarvoor deuitspraken in de stelling gelden.

Passen we Stelling 6.11 toe op

F (x, y) = x− g(y),

dan krijgen we de inverse functiestelling via de uitspraak

(x, y) ∈ Bδ0(a)× Bε0(b) : g(y) = x = (x, f(x)) : x ∈ Bδ0(a),

waarbij geldt dat f ′(x) = (g′(f(x))−1 voor alle x ∈ Bδ0(a). Merk op dat deoplossing y = f(x) van x = g(y) nu wordt geconstrueerd met

yn+1 = yn − g′(0)−1(g(yn)− x),

startend vanaf y0 = 0. We formuleren het resultaat voor X = Y = IRn eng : Y → Y .

Stelling 6.12. (Inverse functiestelling) Laat voor r > 0 de functie g : Y → Ycontinu differentieerbaar zijn op Br(b) en laat a = g(b). Als g′(b) inver-teerbaar is dan bestaan er 0 < δ0 ≤ ε0 ≤ r, en een continu differentieer-bare injectieve functie f : Bδ0(a) → Bε0(b), zodanig dat voor alle (x, y) ∈Bδ0(a) × Bε0(b) geldt: x = g(y) ⇐⇒ y = f(x). Bovendien geldt datf ′(x) = (g′(f(x))−1 voor alle x ∈ Bδ0(a).

N.B. Stelling 6.11 geeft de f : Bδ0(a) → Bε0(b) in Stelling 6.12 alleen alscontinu differentieerbare functie. Omdat y = f(x) voor x ∈ Bδ0(a) geldt

148

Page 149: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

echter x = g(y) = g(f(x)), dus f is injectief op Bδ0(a), en vanwege f ′(x) =(g′(f(x))−1 is f ′(x) inverteerbaar in elke x ∈ Bδ0(a).

Voor g werkt dit argument niet zonder meer: om x = g(y) in y = f(x)in te mogen vullen moet g(y) wel in het domein van f liggen. Stelling 6.12kan echter nog een keer worden toegepast (draai de rollen van x en y om)om 0 < ε1 ≤ δ1 ≤ δ0 en een continu differentieerbare g1 : Bε1(b)→ Bδ1(a) tevinden zodanig dat voor (x, y) ∈ Bδ1(a)× Bε1(b) weer geldt: x = g1(y) ⇐⇒y = f(x). Met de eerdere equivalentie x = g(y) ⇐⇒ y = f(x) vooralle (x, y) ∈ Bδ0(a) × Bε0(b) zien we dat g1 = g op Bε1(b). Net als eerdervoor f : Bδ0(a) → Bε0(b) volgt nu dat g1 en dus g injectief is op Bε1(b).Samenvattend concluderen we dat in de keten

Bε1(b)g−→ Bδ1(a)→ Bδ0(a)

f−→ Bε0(b)g−→ X = Y = IRn

behalve f ook g in de eerste schakel injectief is. Het tweede pijlte (zonderbovenschrift) is de inclusieafbeelding. De keten kan steeds naar links wor-den uitgebreid. Om precies te zijn, nu maar eens startend met een continudifferentieerbare

IRn ⊃ Bδ0(a)f→ IRn (6.32)

en f ′(a) inverteerbaar, hebben we met b = f(a) een doorlopend diagram

Bδ0(a)f→ IRn

↑ ↑

Bδ1(a)g← Bε1(b)

↑ ↑

Bδ2(a)f→ Bε2(b)

↑ ↑

Bδ3(a)g← Bε3(b)

↑ ↑

De door Stelling 6.12 gemaakte continu differentieerbare

Bε1(b)g→ Bδ1(a)

en iedere schakel behalve de bovenste f zijn injectief (maar in het algemeenniet surjectief), met inverteerbare f ′(x) en g′(y) (vanwege f ′(x) = (g′(f(x))−1

en g′(y) = (f ′(g(y))−1). Teruglopend langs de horizontale functiepijltjes en

149

Page 150: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

de verticale inclusiepijltjes worden de epsilons en delta’s alleen maar kleiner39.Over het beeld van ieder bolletje onder f dan wel g is nog wel wat te zeggennatuurlijk, maar eerst kijken we in Sectie 6.8 naar andere vragen waarbijStelling 6.11 een rol speelt.

Opgave 6.13. Leid Stelling 6.11 af uit Stelling 6.12. Hint: maak m.b.v. F eenfunctie F : IRN = IRn × IRm → IRn × IRm, waarvan de laatste m componentengegeven worden door F (x, y) en de eerste n door x zelf.

6.7 Flashback

Exercise 4.17 concerned a bijection between two closed intervals [a, b] and[c, d]. Compared to (6.32) and the discussion that follows now think of n = 1and [a, b] as a closed ball in IR, and a bijection

f : [a, b]→ [c, d]. (6.33)

By definition [c, d] is the image under f of [a, b] and vise versa [a, b] is theimage under the inverse function g of [c, d]. The inverse function existsbecause f is assumed to be a bijection40. Thus, unlike the discussion of (6.32),the present discussion is not about the existence of the inverse function.It already exists by assumption. Instead we ask, in Opgave 4.17 that is,about the differentiability of g in some y0 = f(x0) with x0 ∈ (a, b) and fdifferentiable in x0 with f ′(x0) 6= 0. The positive answer to this question isthat g is differentiable in y0 and that

f ′(x0)g′(y0) = 1, (6.34)

a statement which is symmetric in f and g. The exercise calls for a proofof this statement that will not involve the continuity41 of f and g and relieson a reformulation of the special case that f(0) = 0 and f ′(0) = 1 whichis symmetric in x and y, whence the diffferentiability of g in y = 0 withg′(0) = 1 will be immediate.

To establish the positive answer you should first make you life that easyby showing42 that without loss of generality you may assume that 0 = x0 =y0 = 0 = f(0), and that f ′(x0) = 1, meaning that

f(x) = x+ o(x) as x→ 0, (6.35)

39 In Section 6.7 below we discuss the case n = 1 in relation to Section 4.3.40 In dimension n > 1 we rarely have bijections between balls of course.41 But do prove that f and g are continuous without any further assumptions.42 You really should.

150

Page 151: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

i.e.∀ε > 0 ∃δ > 0 : |x| ≤ δ =⇒ |f(x)− x| ≤ ε|x|. (6.36)

The inequality for |f(x)− x| means that

(1− ε)x ≤ y ≤ (1 + ε)x if 0 ≤ x ≤ δ and y = f(x), (6.37)

and the other way around for −δ ≤ x ≤ 0. We want to replace this statementby an equivalent statement which is symmetric in x and y, and thereby alsoequivalent to

g(y) = y + o(y) as y → 0. (6.38)

How do we get the equivalent symmetric statement? Clearly the conditiony = f(x) already is symmetric because

y = f(x) ⇐⇒ x = g(y),

but the inequalities with x and y are not. Note though that

(1− ε)x ≤ y ≤ (1 + ε)x =⇒ (1− ε)x ≤ y ≤ 1

1− εx

if x ≥ 0 and 0 < ε < 1. In other words (6.36) implies that

∀ε ∈ (0, 1)∃δ > 0 :0 ≤ x ≤ δ

y = f(x)=⇒ (1− ε)x ≤ y ≤ 1

1− εx, (6.39)

and likewise43 for −δ ≤ x ≤ 0.Next observe that (6.39) and its version for x ≤ 0 in turn imply

∀ε ∈ (0, 1)∃δ > 0 : |x| ≤ δ =⇒ |f(x)− x| ≤ ε

1− ε|x|, (6.40)

since1

1− ε= 1 +

ε

1− ε.

But (6.40) and (6.36) are equivalent, by setting

ε =ε

1− ε,

and thus (6.39) and its version for x ≤ 0 make up for an equivalent definitionof (6.35) stating that

∀ε ∈ (0, 1)∃δ > 0 : Gδ = (x, y) : 0 < |x| ≤ δ, y = f(x) ⊂ Sε, (6.41)

43 With the same δ given 0 < ε < 1, and with reversed inequalities for y.

151

Page 152: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

in which

Sε = (x, y) 6= (0, 0) :1

1− ε≤ y

x≤ 1− ε (6.42)

is clearly symmetric in x and y. Now choose δ > 0 such that, for the sameε ∈ (0, 1), it holds that

Fδ = (x, y) : 0 < |y| ≤ δ, x = g(y) ⊂ Sε.

How? Draw a picture to see that

δ = (1− ε)δ

does the job. This completes the proof.

6.8 Karakterisaties van deelvarieteiten

Lineaire deelvarieteiten van IRN zijn per definitie oplossingsverzamelingenvan lineaire vergelijkingen. Denk aan punten, lijnen en vlakken als de niet-triviale voorbeelden in IR3. Bij lineaire algebra heb je gezien dat, behalve inhet geval van punten, deze niet-triviale lineaire deelvarieteiten, na eventueelhernummeren van de coordinaten, altijd te beschrijven zijn als grafiek vaneen lineaire functie

y = Ax+ b, (6.43)

waarbij x ∈ IRn, y ∈ IRm, A :∈ IRn → IRm lineair, b ∈ IRm, en N = n + mmet n,m ∈ IN.

Aan (6.43) is nog niet te zien of we matrixnotatie gebruiken. Als we x en yzien als kolomvectoren dan is (6.43) te lezen met A een matrix bestaande uitm rijen en n kolommen. In (6.43) staan dan m vergelijkingen die geschrevenkunnen worden in de vorm Ax− y = b voor (x, y) ∈ IRN, i.e.

(A − I)

(x

y

)= b ∈ IRm,

met C = (A − I) een (wat bijzondere) matrix met m rijen en N kolommen,waarvan de eerste n kolommen de matrix A vormen, en de laatste m kolom-men een diagonaal matrix met −1 op de diagonaal. Die matrix C werkt opkolomvectoren

z =

(x

y

)in IRN. Zo gelezen is (6.43) dus een voorbeeld van een stelsel van m lineairevergelijkingen voor N onbekenden z1, z2, . . . , zN.

152

Page 153: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Uitgeschreven met puntjes is dat stelsel

C11z1 + C12z2 + · · ·+ C1NzN = b1;

C21z1 + C22z2 + · · ·+ C2NzN = b2;

...

Cm1z1 + Cm2z2 + · · ·+ CmNzN = bm.

In het voorbeeld heeft de coefficientenmatrix C maximale rang, hetgeen equi-valent is met het kunnen kiezen van m kolommen van C die samen een in-verteerbare (vierkante) matrix vormen, hier de laatste m kolommen, en is ydoor inverteren van in dit geval −I in x uit te drukken. Dat is net als inhet algemene geval, waarin C = (A B) en B inverteerbaar is, en oplossen viay = B−1(b − Ax) weer een grafiek van de vorm (6.43) produceert. We zienhier dus de equivalentie van Cz = b en y = Ax+ b als beschrijvingen in IRN

van de niet-triviale lineaire deelvarieteiten anders dan de singletons, waarbijC bij aanname maximale rang heeft.

6.8.1 Niet per se lineaire deelvarieteiten

Voor niet-lineaire deelvarieteiten44 stellen we nu de vraag of er ook zo’nequivalentie is, uitgaande van de niet-lineaire versie van Cz = b, geschrevenzoals in de impliciete functiestelling, dus45

F (z) = F (x, y) = 0,

met F : IRN → IRm continu differentieerbaar. Omdat (6.43) een beschrijvingis zonder verdere condities op A gebruiken we de niet-lineaire versie van (6.43)om af te spreken wat we onder een deelvarieteit M ⊂ IRN willen verstaan:we zeggen dat een n-dimensionale deelvarieteit M ⊂ IRN een verzameling isdie in de buurt van elk punt van M na hernummeren van de coordinatente schrijven is zoals de verzameling waar F (x, y) = F (a, b) in Stelling 6.11,dus als de grafiek van een continu differentieerbare functie46. Hierbij is dedimensie n ∈ 1, . . . ,N − 1 vast gekozen en sluiten we het analagon vansingletons uit47.

44 We moet nog een definitie geven van wat we daaronder verstaan!45 Er is een reden waarom we hier liever y achter x schrijven.46 Preciezer: M heet dan een C1-deelvarieteit, en een hypersurface if n = N− 1.47 Dat analogon zou een deelverzameling van geisoleerde punten zijn.

153

Page 154: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 6.14. Laat F : IRN → IRm continu differentieerbaar zijn. Als voor allez ∈ IRN met F (z) = 0 geldt dat F ′(z), gezien als matrix, maximale rang heeft, danis z ∈ IRN : F (z) = 0 een n-dimensionale deelvarieteit van IRN, met n + m = N.Bewijs dit.

Opgave 6.15. Geef een voorbeeld van een n-dimensionale deelvarieteit M ⊂ IRN

die niet gegeven wordt door een functie F zoals in Opgave 6.14.

Een standaardvoorbeeld bij Opgave 6.14 is de rand van een bol in IRn metmiddelpunt (a1, a2, . . . , an) en straal δ > 0, beschreven door

(x1 − a1)2 + · · ·+ (xn − an)2 − δ2 = 0. (6.44)

Opgave 6.16. Bewijs dat de verzameling van x ∈ IRn die voldoen aan (6.44) een(n− 1)-dimensionale deelvarieteit is.

Er zijn drie equivalente manieren om te zeggen datM ⊂ IRN een n-dimensionaledeelvarieteit is

(A) M is lokaal de grafiek van een continu differentieerbare

f : IRn → IRm (n+m = N),

gegeven door y = f(x) na hernummeren in z = (x, y).

(B) M is lokaal de nulverzameling van een continu differentieerbare

F : IRN → IRm (n+m = N),

Fy inverteerbaar in de betreffende hernummerde z = (x, y) ∈M .

(C) M is lokaal het beeld48 van een continu differentieerbare injectieve

Φ : IRn → IRN,

met Φ′ van maximale rang.

Stelling 6.11 liet al (B) =⇒ (A) zien, en (A) =⇒ (B) geldt omdat (A) eenspeciaal geval is van B met F (x, y) = g(y) − x. Evenzo is (A) een speciaal

48 Als afbeelding naar dat beeld heeft Φ een inverse die een kaart op M genoemd wordt.

154

Page 155: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

geval van C met Φ(x) = (x, f(x)). Om de implicatie (C) =⇒ (A) te latenzien en zo het kringetje rond te maken gebruiken we Stelling 6.12, maarhebben we ook de kettingregel nodig, de regel die meestal voor de implicietefunctiestelling wordt behandeld.

De kettingregel generaliseert de regel in Opgave 5.10, zie ook Sectie 4.6,Opgave 5.11 en later Opgave 10.19. Met de opmerking dat (5.3) gelezen moetworden met matrices49 is de regel met bewijs en al over te schrijven en numeteen50 toepasbaar. We zien Φ daartoe nu als

Φ : IRn → IRn × IRm,

met, na hernummeren weer, Φ(x) = (Ψ(x), χ(x)), Ψ : Br(a) → IRn enχ : Br(a) → IRm continu differentieerbaar, en Ψ′(a) inverteerbaar in a, bijaanname van de maximale rang van Φ′(x) in x = a. Stelling 6.12, toegepastop g = Ψ met y = x, geeft nu een continu differentieerbare injectieve functief die we φ noemen, φ : Bδ0(Ψ(a)) → IRn, met φ′(ξ) inverteerbaar voor alleξ ∈ Bδ0(Ψ(a)), al gebruiken we dat verder niet, en Ψ(φ(ξ)) = ξ voor alleξ ∈ Bδ0(Ψ(a)). Zo parametriseert

ξ → Φ(φ(ξ)) = (Ψ(φ(ξ)), χ(φ(ξ))) = (ξ, f(ξ))

met f(ξ) = χ(f(ξ)) nu ook M in de buurt van b = Ψ(a) en is M lokaal dusgegeven door de grafiek van f : Bδ0(b)→ IRN. De continue differentieerbaar-heid van f volgt uit de kettingregel, en het is de eerste keer dat we die hiergebruiken. Hiermee is het bewijs van

(A)⇐⇒ (B)⇐⇒ (C)

klaar.Opgave 6.14 betrof het geval dat M met een F als in (B) globaal te

beschrijven is zoals bijvoorbeeld in Opgave 6.16. In Stelling 6.12 en de daar-opvolgend discussie werd zo’n bol met rand en al injectief afgebeeld door eeninjectieve continu differentieerbare functie f (met f ′(x) inverteerbaar vooralle x in die gesloten bol) naar een deelverzameling van (een bol in) IRn.Is het beeld van de rand van de bol nu ook weer een (n − 1)-dimensionaledeelvarieteit?

Opgave 6.17. Laat M ⊂ IRn een deelvarieteit zijn en f : IRn → IRn continudifferentieerbaar in een omgeving van elk punt van M . Als f ′(x) inverteerbaar is voorelke x ∈M en f injectief is op M , dan is het beeld van f ook een deelvarieteit.

49 Beter: lineaire afbeeldingen, in dit hele hoofdstuk de facto matrices.50 Nou ja, aan het eind van het argument dat nu komt.

155

Page 156: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 6.18. Precies als Opgave 6.17, maar met f : IRn → IRm en f ′(x) vanmaximale rang voor elke x ∈M .

6.8.2 Beelden (van randen) van bollen

Stelling 6.12 leidde met 0 < ε1 ≤ δ1 ≤ δ0 ≤ ε0 tot een keten

Bε1(b)g−→ Bδ1(a)

f−→ Bε0(b)

waarin beide afbeeldingen injectief maar in het algemeen niet surjectief zijn.De kleinere δ1 en ε1 waren nodig voor de injectiviteit van g op de kleinere(gesloten) bol Bε1(b).

De randen ∂Bε1(b) en ∂Bε0(a) hebben als beeld de deelvarieteiten g(∂Bε1(b))en f(∂Bε0(a)). In het geval dat g en f lineaire afbeeldingen zijn en a = b = 0,ga je eenvoudig na dat deze beelden te zien zijn als grafiek over de eenheids-sfeer

Sn−1 = x ∈ IRn : |x| = 1.Als A : IRn → IRn zo’n inverteerbare lineaire afbeelding is, dan kun je eengladde hoogtefunctie h : Sn−1 → IR+ maken zodanig dat het beeld van (debolrand) ∂B1(0) onder A van de vorm

Sh = h(x)x : x ∈ Sn−1 (6.45)

is, al moeten we nog precies maken wat we hier met gladheid van h bedoelen.Je maakt de functie h door voor elke x ∈ Sn−1 de halfrechte

λx : λ > 0

met A(∂B1(0)) te snijden, waarbij je x misschien liever een andere naam wilgeven als je denkt in termen van y = Ax.

Opgave 6.19. Laat A : IRn → IRn een inverteerbare lineaire afbeelding zijn. Bewijsdat er voor elke ξ ∈ Sn−1 precies een λ > 0 is waarvoor λξ ∈ A(∂B1(0)). Doorλ = hA(ξ) te stellen is hA : Sn−1 → IR+ gedefinieerd. Het beeld van ∂Bδ(0) onderA heeft als hoogtefunctie ξ → δhA(ξ).

De eerdere vragen over g(∂Bε1(b)) en f(∂Bε0(a)) geven aanleiding tot devraag of de uitspraak in Opgave 6.19 ook waar is voor het beeld van de randvan een voldoende klein gekozen bol Bδ1(0) onder het beeld van een continuedifferentieerbare functie F : Bδ(0) :→ IRn van de vorm

F (x) = Ax+R(x) met R(x) = o(|x|) voor |x| → 0.

156

Page 157: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Op grond van Stelling 6.12 weten we dat F injectief is op een kleinere bolBδ0(0) met F ′(x) invertbaar (niet alleen voor x = 0 maar ook) voor allex ∈ Bδ0(0). De volgende opgave is een klein project waarin ook Stelling 6.11gebruikt moet worden, nog uit te werken in een definitieve versie van ditbasisboek.

Opgave 6.20. Bewijs de uitspraak in Opgave 6.19 voor het beeld F (∂Bδ1(0)) vande rand van een voldoende kleine bol Bδ1(0). Laat zien dat de hoogtefunctie h die jemaakt continu differentieerbaar is in de buurt van ieder punt op Sn−1, als functie vangeschikt gekozen coordinaten in een omgeving van dat punt.

6.8.3 Overgang op andere coordinaten

Als een punt P in n-dimensionale deelvarieteit M van IRN zowel in het beeldvan een Φ als van een Ψ ligt zoals in beschrijving (C) in Sectie 6.8.1, zeg metΦ(ξ) en Ψ(η), en P = Φ(0) = Ψ(0), met 0 een inwendig punt van de in (C)gebruikte domeinen van Φ en Ψ, dan wordt het verband tussen ξ en η in debuurt van 0 gegeven door uitspraken zoals in Stelling 6.12.

6.8.4 Meer dan continu differentieerbaar

Om uit te werken nog. Als F : X → Y continu differentieerbaar is, metbijvoorbeeld X = IRm en Y = IRn, dan is x→ F ′(x) een continue functie (ofafbeelding) van X naar

L(X, Y ) = A : X → Y : A is lineair,

waarin we als norm op L(X, Y ) naar keuze de normen

|A|op

= max|x|≤1|Ax| of |A|

2=

√∑ij

a2ij

kunnen gebruiken. Deze F ′ kan weer continu differentieerbaar zijn en in datgeval is ook

F : (x, h)→ (F (x), F ′(x)h)

continu differentieerbaar. In het geval dat X = Y is inverteerbaarheid vanF ′ in x = x0 equivalent met inverteerbaarheid van F ′ in (x, h) = (x0, 0).Dit leidt tot een formulering van Stelling 6.12 voor twee keer continu dif-ferentieerbare functies. Ook de impliciete functiestelling krijgt zo een tweekeer differentieerbare versie, en deelvarieteiten kunnen vervolgens C2 zijn inplaats van C1. Of Ck met k ∈ IN.

157

Page 158: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

6.9 Integralen over rechthoeken

Integraalrekening voor continue functies

u : [a, b]× [c, d]→ IR,

met [a, b] × [c, d] een rechthoek in IR2 gaat met partities P als in (2.4) voor[a, b], en

c = y0 ≤ y1 ≤ · · · ≤ yM = b (6.46)

voor [c, d].Om kort te gaan, met onder- en bovensommen, of met tussensommen van

de vormN∑k=1

M∑l=1

u(ξk, ηl)(xk − xk−1)(yl − yl−1),

met tussenwaarden ξk ∈ [xk−1, xk] en ηl ∈ [yl−1, yl], volgt het bestaan van eenunieke J ∈ IR die de integraal van u over [a, b] × [c, d] genoemd wordt, metnotatie (en stelling over het vrij mogen kiezen van de integratievolgorde)

J =

∫[a,b]×[c,d]

u =

∫ b

a

∫ d

c

u(x, y) dy dx =

∫ d

c

∫ b

a

u(x, y) dx dy. (6.47)

De herhaalde integralen worden uitgewerkt met de technieken en regels voorgewone integralen.

We maken daar hier nu verder geen woorden aan vuil maar wijzen welnog even op de details in de hier gebruikte notaties in relatie tot de discussiena Stelling 4.12 en Opgave 2.48 onder Definitie 2.42.

6.9.1 Notationele kwesties met die d-tjes

Anders dan de notatie suggereert is (6.47) geen uitdrukking met de onderStelling 4.12 aangekondigde 2-vormen. In (6.47) is de herhaalde integraalimmers te lezen als ∫ d

c

∫ b

a

u(x, y) dx

dy,

een integraal van een integraal, net als de herhaalde integraal direct daar-voor, met de afsluitende accolade stevig tussen dx en dy in. Beide herhaaldeintegralen zijn gelijk aan ∫

[a,b]×[c,d]

u,

gedefinieerd via Riemannsommen en een limietovergang, met een notatiewaarin dxdy of dydx als produkt van dx en dy vermeden is.

158

Page 159: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 6.21. Net als in Opgave 2.48 kun je je nu drie assen (nu in de ruimte inplaats van in het vlak) voorstellen die loodrecht op elkaar staan in hun gemeenschap-pelijke snijpunt x = y = z = 0, met richtingen nog te kiezen, maar dat pas nadat jeop de x-as a en b gemarkeerd hebt, op de y-as c en d, en de grafiek van zo maar eencontinue functie zonder nulpunten en tekenwisselingen hebt gekozen. Nu zijn er achtgevallen waarin je de integraal kunt relateren aan de inhoud ingesloten door x = a,x = b, y = c, y = d, z = 0 en z = u(x, y). Kijk nu naar de tekens van b− a en d− c,zeg maar van dx en dy, in de twee gevallen dat zowel u als de integraal positief zijn,en laat zien dat ze hetzelfde teken hebben: zeg maar dxdy > 0.

Opgave 6.22. Neem nu eventueel voor het gemak a = c = 0, |b| = |d| = 1. In hetgeval dat dxdy en u(x, y) allebei positief zijn is er een orienterende ordening tussende drie assen die overeenkomt met de correpondentie

positieve x-as ↔ middelvingerpositieve y-as ↔ wijsvingerpositieve z-as ↔ duim

op je linkerhand. Overtuig jezelf daarvan en ook van het volgende: teken je een x-asen een y-as op het schoolbord die elkaar loodrecht snijden in x = y = 0 dan vertellende positieve x-as en de positieve y-as als geordend assenpaar welke kant van het bordz > 0 heeft; bij de standaardkeuze met x naar rechts en y naarboven komt de positievez-as naar voren het bord uit. Het bijbehorende assenkruis heet dan rechtsdraaiend51.

Als je wil rekenen met formules waarin produkten van dx en dy voorkomendan kun je in het licht van Opgave 6.21 en Opgave 6.22 tot de conclusie komendat het handig is om af te spreken dat

dxdy = −dydx,

zonder de afsluitende accolade tussen dx en dy, in de zin dat

J =

∫[a,b]×[c,d]

u =

∫∫[a,b]×[c,d]

u(x, y) dxdy,

gezien als ∫∫[a,b]×[c,d]

werkend op u(x, y) dxdy,

gelijk is aan

−∫∫

[a,b]×[c,d]

u(x, y) dydx,

51 Dit is moeilijk voor jongens.

159

Page 160: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

gezien als

−∫∫

[a,b]×[c,d]

werkend op u(x, y) dydx,

waarbij die werking dan precies gedefinieerd moet worden op zo’n manier datonder coordinatentransformaties de integralen transformeren op een manierdie consistent is met wat er gebeurt met de inhouden waar het verhaal meebegonnen is. Maar dat hebben we hier nog niet behandeld.

6.9.2 Formele d-algebra zonder betekenis?

Ondertussen spreekt de algebra voor differentiaalvormen deels voor zich. Nadu = u′(x)dx voor u = u(x) hebben we natuurlijk ook

du = uxdx+ uydy =∂u

∂xdx+

∂u

∂ydy (6.48)

als de d van de 0-vorm u = u(x, y), een uitdrukking van de vorm

fdx+ gdy = f(x, y)dx+ g(x, y)dy,

een 1-vorm waarvan de d via

d(f(x, y)dx+ g(x, y)dy)

vraagt52 om een som en produktregel met d van f(x, y) en g(x, y), en eennog te definieren d van dx en dy.

Voor de hand als som- en daarna twee keer de produktregel ligt

d(fdx+ gdy) = d(fdx) + d(gdy) =

dfdx+ fddx+ dgdy + gddy =

fxdxdx+ fydydx+ gxdxdy + gydydy + fddx+ gddy.

Als dxdy = −dydx volgt dan

d(fdx+ gdy) = fxdxdx+ gydydy + (gx − fy)dxdy + fddx+ gddy.

Met y = x leest dxdy = −dydx nu toch echt als dxdx = −dxdx, dus dxdx =0 = dydy als consistent voor te schrijven tweede rekenregel ligt dan ook voorde hand. Daarmee reduceert het bovenstaande tot

d(fdx+ gdy) = (gx − fy)dxdy + fddx+ gddy,

52 Wat d is dat kun je straks weten.

160

Page 161: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

en blijft de vraag wat ddx en ddy dan wel mogen zijn.Keine blasse Ahnung zou ik zeggen dus doe dan maar NUL. Dan wordt

de werking van d op 1-vormen

f(x, y)dx+ g(x, y)dyd−→ (gx(x, y)− fy(x, y))dxdy,

en dus

u(x, y)d−→ ux(x, y)dx+ uy(x, y)dy

d−→ (uyx(x, y)− uxy(x, y))dxdy = 0.

Der blasse Ansatz ddx = ddy = 0 gibt ddu = 0 voor alle u = u(x, y).Ik zou zeggen: machen wir. Dus d2 = 053, en met f = f(x, y), g = g(x, y)

hebben we in de notatie met partiele differentiaalquotienten nu dat

fd−→ ∂f

∂xdx+

∂f

∂ydy, fdx+ gdy

d−→ (∂g

∂x− ∂f

∂y)dxdy, gdxdy

d−→ 0 (6.49)

Opgave 6.23. Doe de algebra voor

fd−→ ∂f

∂xdx+

∂f

∂ydy +

∂f

∂zdz,

fdx+ gdy + hdzd−→ (

∂h

∂y− ∂g

∂z)dydz + (

∂f

∂z− ∂h

∂x)dzdx+ (

∂g

∂x− ∂f

∂y)dxdy,

fdydz + gdzdx+ hdxdyd−→ (

∂f

∂x+∂g

∂y+∂h

∂z)dxdydz,

hdxdydzd−→ 0,

met f = f(x, y, z), g = g(x, y, z), h = h(x, y, z), gebruikmakend van de som- enproduktregel voor d, dxdy = −dydx, dxdz = −dzdx, dydz = −dzdy, en ddx =ddy = ddz = 0. Verifieer dat niet alleen ddf = 0 maar ook dd(fdx+ gdy+hdz) = 0:dd maakt alles nul en zo hoort dat kennelijk.

Opgave 6.24. Doe de algebra nog een keer voor Fd−→ F ′(x)dx en f(x)dx

d−→ 0met f(x) en F (x).

53 Daar kan i een puntje aan zuigen.

161

Page 162: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

6.9.3 Transformaties en parametrisaties

Als x → f(x) = F ′(x) en t → x′(t) continu zijn met bijvoorbeeld x(0) = aen x(1) = b, dan is∫ b

a

f(x) dx =

∫ b

a

F ′(x) dx =

∫ b

a

dF = F (b)− F (a) = F (x(1))− F (x(0)) =

[F (x(t))]10 =

∫ 1

0

F ′(x(t))x′(t) dt =

∫ 1

0

f(x(t))x′(t) dt,

waarin wedx = x′(t)dt (6.50)

als een stukje van de formele d-algebra in Sectie 6.9.2 herkennen.Een 1-vorm f(x)dx in x wordt via t → x(t) zo teruggetrokken tot een

1-vormf(x)dx = f(x(t))x′(t)dt (6.51)

in t. Evenzo wordt de 1-vorm

f(x, y)dx+ g(x, y)dy

via t→ x(t) en t→ y(t) met dezelfde algebra teruggetrokken tot een 1-vorm

f(x, y)dx+ g(x, y)dy = (f(x(t), y(t))x′(t) + g(x(t), y(t))y′(t))dt (6.52)

in t.De gelijktekens in (6.51) en zeker (6.52) zijn wat dubieus, het is wellicht

beter om (6.51) en (6.52) nu als afbeeldingen te lezen, bijvoorbeeld

f(x, y)dx+ g(x, y)dyterugtrekken−−−−−−−→ (f(x(t), y(t))x′(t) + g(x(t), y(t))y′(t))dt,

waarbij het terugtrekken gebeurd via de afbeelding in kwestie, in dit voor-beeld t→ (x(t), y(t)), die van 1 naar 2 variabelen gaat.

Nemen we in plaats van een 1-vorm een 2-vorm, zeg dxdy zelf, dan geeftterugtrekken via dezelfde t→ (x(t), y(t)) dat

dxdy → x′(t)dt y′(t)dt = x′(t)y′(t)dtdt = 0.

Weinig zinvol wellicht, maar met

(r, θ)→ (x(r, θ), y(r, θ))

162

Page 163: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

krijgen we

dxdy → (∂x

∂rdr +

∂x

∂θdθ)(

∂y

∂rdr +

∂y

∂θdθ) = (

∂x

∂r

∂y

∂θ− ∂y

∂r

∂x

∂θ)drdθ, (6.53)

met de determinant54 van de Jacobimatrix.In het geval dat x = r cos θ, y = r sin θ wordt dit

dxdy → rdrdθ,

op grond van een algebra die zich (ook) voor coordinatentransformaties ge-nereert uit de regeltjes die we in de d-algebra hebben geponeerd.

Merk op dat (6.52) niet met een coordinatentransformatie kan correspon-deren maar (6.53) wel, en lees de afleiding van (6.52) nog eens terug met tvervangen door φ in bijvoorbeeld [0, 2π]. Met x(0) = x(2π) en y(0) = y(2π)kun je dit voorbeeld nu goed vergelijken met (6.53) waarin r vast is genomen,alvorens verder te ontdekken hoe de terugtrekalgebra werkt voor

(θ, φ)→ (x(θ, φ), y(θ, φ), z(θ, φ) (6.54)

en 2-vormen in x, y, z.

Opgave 6.25. Trek f(x, y, z)dx+g(x, y, z)dy+h(x, y, z)dz terug naar een 2-vormin θ en φ.

6.9.4 Een transformatiestelling

Voor R ⊂ IR2 en f : R→ IR geldt dat∫∫R

f(x, y) dxdy =

∫∫Q

f(x(r, θ), y(r, θ)) (∂x

∂r

∂y

∂θ− ∂y

∂r

∂x

∂θ)drdθ,

als

Q(r,θ)→(x,y)−−−−−−→ R

aan wat aannamen voldoet. Voorbeeld: Sectie 9.1. Hoe doen we dit? On-derstaande is om de gedachten te bepalen.

Met een bijectie

(x, y)Φ−→ (u, v)

54 Plus of min de oppervlakte van de ruit opgespannen door de twee kolomvectoren.

163

Page 164: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

tussen R ⊂ IR2x,y en A ⊂ IR2

u,v is wat we willen een uitspraak die de integraal∫∫A

g(u, v) dudv

relateert aan een integraal met g(u(x, y), v(x, y)) en dxdy over R, liefst met-een al met de conventie dat dudv = −dvdu en dxdy = −dydx.

Als de bijectie niet-lineair is dan zijn R en A zeker niet allebei een recht-hoek, laat staan van de vorm zoals in Sectie 6.9, dus neem in eerste instantiealleen R van die vorm. We nemen R gesloten, dus met de rand erbij, en Φgedefinieerd55 op heel IR2, met continue partiele afgeleiden. Voor het gemaknemen we R = [0, 1]× [0, 1].

Zie nu Opgave 4.25 en lees i.p.v

F (x, y) = g(y)− x nu F (x, y, u, v) =

(Φ1(x, y)− uΦ2(x, y)− v

).

De uitgepakte versie van de stelling die je daar bewezen hebt is de inversefunctiestelling die we nu nodig hebben. Die stelling zegt dat als in (x0, y0)de Jacobimatrix

J(x, y) =

(∂Φ1

∂x∂Φ1

∂y

∂Φ2

∂x∂Φ2

∂y

)inverteerbaar is, in een omgeving van (u0, v0) = (Φ1(x0, y0),Φ2(x0, y0)) deinverse functie

(u, v)Φ(−1)

−−−→ (x, y)

bestaat en continu differentieerbaar is. De Jacobimatrix van de inverse af-beelding is de inverse van de Jacobimatrix van Φ.

Voor de te formuleren transformatiestelling nemen we nu aan dat de Ja-cobimatrix J(x, y) in elk punt van R inverteerbaar is. Daarmee is A eengebied in IR2

u,v met vier randen geparametrizeerd56 door

x→ Φ(x, 0), y → Φ(1, y), x→ Φ(x, 1), y → Φ(0, y).

Bij partities

(P ) 0 = x0 ≤ x1 ≤ · · · ≤ xN = 1 met N ∈ IN,

55 Zonder beperking der algemeenheid, maar dat moet nog blijken.56 Het alternatief dat later nog komt wellicht is:

t→ Φ(t, 0), t→ Φ(1, t), t→ Φ(1− t, 1), t→ Φ(1− t, 0),

164

Page 165: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

(Q) 0 = y0 ≤ y1 ≤ · · · ≤ yM = 1 met M ∈ IN,

horen (M + 1)(N + 1) parametrisaties

x→ Φ(x, yj) en y → Φ(xi, y) (i = 0, . . . ,M, j = 0 . . . ,N),

die een rooster van vervormde rechthoekjes Sij maken in A.De goede definitie van Riemann integreerbaarheid van g : A→ IR moet57

nu geven dat metMij = sup

Sij

g en mij = infSijg

geldt dat ∑ij

mij|Sij| ≤∫∫

A

g ≤∑ij

Mij|Sij|,

waarin Sij de oppervlakte is van Sij, hetgeen we herschrijven als∑ij

mij|Sij||Rij|

|Rij| ≤∫∫

A

g ≤∑ij

Mij|Sij||Rij|

|Rij|,

en opmerken dat ook geldt dat

Mij = supRij

f en mij = infRij

f

met f = g Φ.Het is niet zo moeilijk58 om precies te maken dat

|Sij||Rij|

∼ |detJ(xi, yi)| (6.55)

als M,N→∞ om op de Riemann integreerbaarheid van

(x, y)→ f(x, y)|J(x, y)|

over R uit te komen MET gelijkheid van de integralen:∫∫R

f |detJ | =∫∫

A

g.

57 Moet nog blijken!58 Zie e.g. Sectie 5 van Hoofdstuk III in het Advanced Calculus boek van Edwards.

165

Page 166: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

7 Standing at the crossroads

This chapter relates to the courses in Functional Analysis and Partial Diffe-rential Eqations as given in the bachelor pogrammes in Amsterdam, as wellas courses run under the same name in the national mastermath programme.Have a look at Section 4.10, in particular at the solution method for (4.48),which clearly does not generalise to the problem of solving

−∆u = f in Ω with u = 0 on ∂Ω (7.1)

for given f : Ω→ IR and Ω ⊂ IRN on a bounded open set with boundary ∂Ω.Moreover, even is ∂Ω is smooth, it does not in general hold that (7.1) has

a twice differentiable solution which solves the partial differential equation−∆u = f for the given f ∈ C(Ω). Below we show another way of solving(4.48) which does generalise to a large class of problems including (7.1).This technique is based on integration by parts1 and the theory of Hilbertspaces, mainly the unique and obvious generalisation2 of the inner productspace IR2 with the dimension 2 replaced by the first cardinal to come overall the integers, see de Hoofdstukken 13 en 14. The chapters thereafter willhopefully fit in some future version of this book.

Als we de vergelijking in (4.48) vermenigvuldigen met een functie v ∈C1[0, 1] dan bestaan onder de aanname dat u ∈ C2[0, 1] en f ∈ C0[0, 1] beideintegralen

−∫ 1

0

u′′(x)v(x) dx =

∫ 1

0

f(x)v(x) dx

en kan de linkerkant partieel geintegreerd worden. Het resultaat is

−[u′(x)v(x)]10 +

∫ 1

0

u′(x)v′(x) dx︸ ︷︷ ︸symmetrisch in u,v

=

∫ 1

0

f(x)v(x) dx︸ ︷︷ ︸symmetrisch in f,v

, (7.2)

waarbij de lelijke eerste term verdwijnt als we de extra aanname maken datv(0) = v(1) = 0.

De oplossing u ∈ C2[0, 1] van (4.48) heeft dus de eigenschap dat u(0) =u(1) = 0 en ∫ 1

0

u′(x)v′(x) dx =

∫ 1

0

f(x)v(x) dx ∀v ∈ C10 [0, 1], (7.3)

waarinC1

0 [0, 1] = v ∈ C1[0, 1] : v(0) = v(1) = 0,1 Now have a look at (8.11).2 In different guises.

166

Page 167: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

en de gelijkheid in (7.3) kan voor elke u ∈ C10 [0, 1] geverifieerd worden.

Kortom, we zouden dus kunnen afspreken om u ∈ C10 [0, 1] een oplossing

van (4.48) te noemen als aan (7.3) voldaan is.Rechts in (7.3) zien we een integraal die te zien is als een inwendig product

van f en v, dat we kunnen noteren als

f · v =

∫ 1

0

f(x)v(x) dx, (7.4)

waarmee (4.48) zich uiteindelijk herschrijft als

u ∈ C10 [0, 1], u′ · v′︸ ︷︷ ︸

((u,v))

= f · v︸︷︷︸(f,v)

∀v ∈ C10 [0, 1], (7.5)

een uitdrukking waarin twee inwendige producten voorkomen en u ∈ C10 [0, 1]

en f ∈ C0[0, 1] vast zijn, en v ∈ C10 [0, 1] willekeurig.

Opgave 7.1. Waarom is (u, v) → u′ · v′ wel een inprodukt op C10 [0, 1] en niet op

C1[0, 1]?

Opgave 7.2. Laat L > 0, bijvoorbeeld L = 2π of L = 1. De vectorruimte vancontinue L-periodieke functies noemen we C(IRL) = C0(IRL), en de deelruimte vank keer (k ∈ IN) continu differentieerbare functies noemen we Ck(IRL). Voor welkef ∈ C(IRL) is de vergelijking −u′′ = f oplosbaar met u in C2(IRL)? Is de oplossinguniek? Hint: neem eerst L = 1 natuurlijk.

Opgave 7.3. Neem L = 1 en los de vergelijking−u′′ = f voor f continu, 1-periodiekmet

∫ 10 f(x) dx = 0: geef een uitdrukking van de vorm (4.51) voor de oplossing u die

(ook) voldoet aan∫ 1

0 u(x) dx = 0. Hint: zonder deze laatste conditie is de oplossingniet uniek bepaald en evenzo is de (wederom symmetrische!) kern A(x, s) niet uniekbepaald. Maar wel onder de conditie dat

∫ 10 A(x, s) dx =

∫ 10 A(x, s) ds = 0.

Opgave 7.4. Laat

Ck(IRL) = u ∈ Ck(IRL) :

∫ L

0u(x)dx = 0

en geef een herformulering van −u′′ = f voor f ∈ C0(IRL) en u ∈ C1(IRL) zoals in(7.5).

167

Page 168: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Hopelijk is duidelijk dat de twee laatste opgaven kwa bewerkelijkheidnogal uiteenliepen. Formuleringen als in (7.5) gebaseerd op integration byparts, zonder dat het doel daarvan het uitrekenen van getallen is, bieden eenander en vaak algemener perspectief om eigenschappen van oplossingsopera-toren te begrijpen dan expliciete oplossingsmethoden gebaseerd op primiti-veren. In wat volgt zullen we daartoe v als een variabele zien en

v → ((u, v)) en f → (f, v)

als dezelfde lineaire functie, maar anders gepresenteerd.Lineaire functies en inprodukten, hoe zit dat? Hoe weet je dat er bij

f via dezelfde lineaire functie van v een u hoort? En kan dat algemener?Daarvoor gaan we in Hoofstuk 13 terug naar de makkelijkste niet-flauweinproductruimte die we kennen, het platte vlak. Dit hoofdstuk besluiten wemet een paar opgaven die laten zien hoe intrinsiek de herformulering als (7.5)verbonden is met de eigenschappen van de oplossingsoperator

A : f∀ v((u,v))=(f,v)−−−−−−−−−→ u, (7.6)

waarbij het van het specifieke probleem afhangt welke inproducten en welkefunctieruimten gedefinieerd moeten worden om een A te maken die in sim-pele gevallen samenvalt met expliciet uitgerekende integraaloperatoren als in(4.51).

Opgave 7.5. Laat zien dat een solver als A in (7.6) de eigenschap heeft dat((Au, v)) = ((u,Av)) en (Af, g) = (f,Ag) voor alle u, v en f, g in de nog te kiezenruimten V ⊂ H en H waarop de inproducten zijn gedefinieerd met de eigenschappendie we nodig hebben om alles precies te maken.

De operator A is dus symmetrisch3 met betrekking tot twee inproducten,waaronder het ‘gewone’ inproduct (7.4) dat in eerste instantie was opgeschre-ven onder verschillende aannames voor f en v.

Opgave 7.6. Gebruik de symmetrie van A om te laten zien dat eigenvectoren4 vanA bij verschillende eigenwaarden van A loodrecht op elkaar staan.

3 We praten nog niet over complexwaardige functies hier.4 Aφ = λφ, λ ∈ IR, φ een (eigen)functie.

168

Page 169: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 7.7. Gebruik de vorige opgave en Opgave 7.4 om zonder rekenwerk te latenzien dat∫ π

−πsinnx sinmxdx = 0 =

∫ π

−πcosnx cosmxdx (m,n ∈ IN, m 6= 0)

∫ π

−πsinnx cosmxdx = 0 (m,n ∈ IN)

Natuurlijk wist je dit al, waarschijnlijk via exp(inx) = cosnx+i sinnx ende gebruikelijke rekenregeltjes gebaseerd op de somformules5 voor cos(a+ b)en sin(a + b) die niet meer tot de tegenwoordig zelden precies gerechtvaar-digde basiskennis van de gemiddelde β-student horen. De functie sin kangedefinieerd worden als de unieke oplossing van het beginwaardeprobleem

u′′ + u = 0; u(0) = 0; u′(0) = 1, (7.7)

en cos als de afgeleide van sin. Alle eigenschappen van cos en sin, i.h.b. desomformules volgen uit deze definities en kunnen gebruikt worden voor devolgende opgave.

Opgave 7.8. Bepaal alle λ > 0 waarvoor u′′ + λu = 0 oplossingen van periode 2πheeft en bepaal alle even en oneven oplossingen voor die waarden λ.

De even oplossingen die je zo vindt zijn veelvouden van c1 : x→ cosx, c2 :x → cos 2x, c3 : x → cos 3x, . . . , en de oneven oplossingen zijn veelvoudenvan s1 : x→ sinx, s2 : x→ sin 2x, s3 : x→ sin 3x, . . . , en ieder tweetal vandeze functies staat loodrecht op elkaar, zoals we in Opgave 7.7 gezien hebben.En ze zijn gemiddeld allemaal nul, hetgeen betekent dat ze loodrecht staanop de functie 1 : x→ 1, bijvoorbeeld

(1, s1) = 1 · s1 =

∫ π

−π1 sinx dx =

∫ π

−πsinx dx = 0.

Wat we in vervolg gaan doen is 1, c1, c2, c3, . . . , s1, s2, s3, . . . zien als vectorendie lijnen door de oorsprong6 definieren. En die lijnen zien we als een assen-kruis waarmee we een oneindig-dimensionale ruimte opspannen, een ruimtewaarin we willen werken zoveel mogelijk als we dat in het platte vlak doen.

5 Zie Wiskunde in je Vingers, sectie 10.4.6 Die oorsprong is de nulfunctie 0 : x→ 0.

169

Page 170: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

8 Multilinear algebra and integration

This chapter is at the crossroads of analysis and algebra1. Let us first statethe main analytical result, which concerns a bounded open set Ω ⊂ IRN with∂Ω ∈ C1 and v ∈ C1(Ω). We will establish that∫

Ω

vxi =

∫∂Ω

νi v. (8.1)

The integral on the left in (8.1) is a Riemann integral of the continuouspartial derivative

vxi =∂v

∂xi= Div = ∂iv

of v with respect to the ith variable. It is defined if ∂Ω is a set with zeroN-dimensional measure, see Opmerking 2.1. This is the case if the boundedclosed set ∂Ω is the zero level set of a function F ∈ C1(IRN) with ∇F (x) 6= 0for every2

x ∈ x ∈ IRN : F (x) = 0 = ∂Ω.

If the bounded open set Ω is given by

Ω = x ∈ IRN : F (x) < 0, (8.2)

the vector

ν =∇F|∇F |

2

is defined in every point of ∂Ω, and thereby we have a unit vector field on∂Ω normal3 to ∂Ω, which is then a compact C1-hypersurface4 in IRN, andthe integral on the right in (8.1) is the integral of the continuous function

x→ νj(x) v(x)

over ∂Ω, as defined for continuous functions on compact n-dimensional ma-nifolds M ⊂ IRN such as M = ∂Ω in Section 8.9 below.

This analytical result is later restated for continuously differentiable vec-tor valued functions

Ω 3 x V−→ IRN

at the beginning of Section 8.13 as the Gauss Divergence Theorem in (8.68),while it is first proved in Section 8.1 for functions v that vanish outside anN-dimensional block [a, b] in which ∂Ω∩ [a, b] is the graph of a C1-function asexplained at the beginning of that section, with Ω∩ [a, b] on one5 side of the

1 Written while teaching from Edwards’ book Advanced Calculus of Several Variables.2 Zero is then called a regular value of F , google Sard’s Theorem.3 To the local tangent space in every point of.4 See Opgave 6.14.5 Which easily leads to mistakes in the direction of ν so be careful.

170

Page 171: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

graph. In the 2-dimensional case N = 2 this formulation avoids the JordanCurve Theorem6.

The local statement under (8.42) becomes a global statement droppingthe tildes and skipping the intermediate term. It then reads∫

∂Ω

ν · v dS1 =

∫∫Ω

(∂v1

∂x1

+∂v2

∂x2

)dx1 dx2, (8.3)

which putting v2 = −p and v1 = q rewrites as (8.43), the 2-dimensional of theStokes Curl Theorem, in which the line integral is the integral over ∂Ω of theinner product of the vectorfield with components p and q and the tangent7

vectorfield τ with components −ν2 and ν1. Renaming p and q as v1 and v2

the result ∫∂Ω

τ · v dS1 =

∫∫Ω

(∂v2

∂x1

− ∂v1

∂x2

)dx1 dx2 (8.4)

=

∫∂Ω

v1(x1, x2)dx1 + v2(x1, x2)dx2,

is known as Green’s Theorem, the second formulation being valid if ∂Ω isparameterised by continuously differentiable parameterisations

t→ x(t) = (x1(t), x2(t))

defining normalised tangent and normal vectors

τ(t) =1√

x′1(t)2 + x′2(t)2

(x′1(t)

x′2(t)

)and ν(t) =

1√x′1(t)2 + x′2(t)2

(x′2(t)

−x′1(t)

)with ∇F in x(t) being a positive multiple of ν(t) if Ω is defined by (8.2).

The local statement in Section 8.1 does indeed lead to the global state-ment via arguments which involve cut-off functions8 and partitions of unity,which are discussed as an independent topic in Section 8.15. These are alsoneeded for a proper definition of integrals over manifolds in Section 8.9, theother analytical tool being the transformation theorem discussed in Section6.9.4 applied in Section 8.17 to the transformations in Section 8.19.

So far for analysis. In Section 8.10 we rewrite (8.1) as stated in (8.10) inthe language of the differential forms introduced in Section 6.9.2 and belowformula (8.4) just above. This language is re-presented in the language alsoused by Edwards in Section 8.12. In Section 8.13 we spell out the algebra

6 Which I should discuss in the context of Section 9.6 and polygons, to do.7 Edwards writes ν = N and τ = T.8 A misnomer, I would call them fading functions.

171

Page 172: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

to explain how the general Stokes Theorem for integrals of differential formsthen follows9. This general theorem then has the Stokes Curl Theorem in(8.74) for certain10 closed closed curves in IR3 as a reformulation withoutdifferential forms as a second most commonly occuring example.

8.1 Local integrals with the normal at the boundary

This section is influenced by all the local boundary flattening arguments inChapter 5 on Sobolev spaces (see Chapter 17 below) in Evans’ PDE book,which involve applications of the Gauss Divergence Theorem (in essence in-tegration by parts) stated in an appendix, without proof. The flatteningargument introduced here effectively puts that horse in front of the wagonagain.

Let Ω be a bounded open set in IRN = IRn+1 and M = ∂Ω the unionof finitely many patches P = M ∩ (a, b), each of which, after renumbering,comes with a description of [a, b] ∩ Ω as given by

an+1 ≤ xn+1 < f(x1, . . . , xn) < bn+1 (8.5)

oran+1 < f(x1, . . . , xn) ≤ xn+1 < bn+1. (8.6)

Then there exist finitely many patches as above such that

M ⊂ P1 ∪ · · · ∪ PI

If Pi ∩ Pj 6= ∅, the transformations used in Section 8.19 respect the localdescriptions of Ω, which we can use to compute a unique normal ν whichpoints out of Ω in every patch on M = ∂Ω. Overlapping patches then havethe same outward normal vector ν.

In the simplest11 relevant case with n < N and N > 1, which is n = 1 andN = 2, and Ω ⊂ IR2 bounded and open, M = ∂Ω is a 1-dimensional compactmanifold covered by finitely many graphs

(x, fi(x)) : ai < x < bi and (gj(y), y) : cj < y < dj,

with fi ∈ C1([ai, bi]), gj ∈ C1([cj, dj]). The question we ask is how theintegrals ∫

Ω

vx(x, y) dxdy and

∫∫Ω

wy(x, y) dxdy (8.7)

9 Still to be done: integrals over manifolds with boundaries.10 The ones obtained as the image of ∂Ω under injective C1 maps Φ : Ω→ IR3.11 What follows will generalise to N = n+ 1 > 1.

172

Page 173: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

evaluate in terms of the values of v and w on the boundary M = ∂Ω for vand w in C1(Ω). Here I use the common notation dxdy = dydx. With x1

and x2 replacing x and y the notation∫Ω

vx1 =

∫Ω

vx1(x) dx =

∫∫Ω

vx1(x1, x2) d(x1, x2)

(and likewise for the other integral) is more to my liking, but everybodywrites dx1 dx2 and dx], dy, rather than d(x, y).

To answer the question we first consider a piece of the boundary describedby y = f(x), with f ∈ C1([a, b]) and c < f(x) < d for all x ∈ [a, b], such that

Ω = Ω ∩ ([a, b]× [c, d]) = (x, y) : a ≤ x ≤ b, f(x) < y ≤ d, (8.8)

and multiply w by a function ζ ∈ C1(IR2) as in Section 8.9 which is zerooutside a subset [a, b]× [c, d] of (a, b)× (c, d). Denoting the resulting productby w = ζw we now evaluate∫

Ω

wy =

∫∫Ω

wy(x, y) dx dy =

∫ b

a

(∫ d

f(x)

wy(x, y)dy

)dx

= −∫ b

a

w(x, f(x)) dx

=

∫ b

a

−1√1 + f ′(x)2︸ ︷︷ ︸

νy

w(x, f(x))√

1 + f ′(x)2dx︸ ︷︷ ︸ds=dS1

=

∫Φ

νyw ds,

in which we recognised the y-component of the normal vector

ν =1√

1 + f ′(u)2

(−f ′(u)

1

)and

dS1 = ds = |Φ′(u)|2 du =√

1 + f ′(u)2 du

evaluated via the parameterisation Φ(u) = (u, f(u)).For the integral of v = ζv we use the new coordinates

ξ = x, η = y − f(x) whence x = ξ, y = η − f(ξ) and dx dy = dξ dη

when transforming the integral over (x, y) ∈ Ω to an integral over

(ξ, η) ∈ D = (x, y − f(x)) : a ≤ x ≤ b, f(x) ≤ y ≤ d.

173

Page 174: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Defining φ(ξ, η) by

φ(ξ, η) = v(x, y) we have vx(x, y) = φξ(ξ, η)− f ′(ξ)φη(ξ, η)

via the chainrule, whence12∫Ω

vx =

∫∫Ω

vx(x, y) dx dy =

∫∫D

(φξ(ξ, η)− f ′(ξ)φη(ξ, η)) dξ dη

=

∫0

(∫ b

a

φξ(ξ, η) dξ

)dη −

∫ b

a

(∫0

f ′(ξ)φη(ξ, η) dη

)dξ

=

∫0

(φ(b, η)− φ(a, η)) dη −∫ b

a

f ′(ξ)

∫0

φη(ξ, η) dη dξ

=

∫ b

a

f ′(ξ)φ(ξ, f(ξ)) dξ =

∫Φ

νxv ds,

just as before, after inserting√

1 + f ′(ξ)2 and recognising ds = dS1 as wellas the x-component of the normal vector ν. In conclusion we have∫

Ω

vx =

∫∂Ω

νxv dS1 and

∫Ω

wy =

∫∂Ω

νyw dS1 (8.9)

Now look at (8.33), and choose13 functions ζ0 ∈ C1c (Ω) and ζ1, · · · , ζI ,

such that 0 ≤ ζi ≤ 1 for i = 0, . . . , I, ζ1, . . . , ζI as ζ above, such that

ζ0 + ζ1 + · · ·+ ζI ≡ 1 on Ω,

to conclude, via v = ζ0v + ζ1v + · · ·+ ζIv that∫Ω

vxi =

∫∂Ω

νiv dSn (8.10)

for v ∈ C1(Ω) with M = ∂Ω and ν a globally defined14 normal vector fieldon M such that locally a description as above holds.

In (8.10) we stated the formula for Ω ⊂ IRN open and M = ∂Ω a compact(N − 1)-dimensional manifold. The local proof involves

dSN−1 = dSn =

√1 + (

∂f

∂u1

)2 + · · ·+ (∂f

∂un)2 du1 · · · dun

12 We drop a conveniently chosen fixed upper bound in the η-integrals from the notation.13 This requires a technique we take for granted now.14 This is no additional assumption on Ω and its boundary.

174

Page 175: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

and the normal vector ν with

ν1 =1√

1 + |∇f(u)|2∂f

∂u1

, . . . , νn =1√

1 + |∇f(u)|2∂f

∂un,

νN = νn+1 =−1√

1 + |∇f(u)|2.

Formula (8.10) is often called Green’s Theorem. Applying it to the pro-duct of v and some other function ζ ∈ C1(Ω) we obtain the integration byparts formula ∫

Ω

vxiζ =

∫∂Ω

ζv νidSn −∫

Ω

ζxiv. (8.11)

8.2 The length of curve

In the 1-dimensional case I now follow Edwards and write x = γ(t) witht ∈ [a, b] and γ : [a, b] → IRN. For any such γ the natural definition of thelength would be the smallest upper bound on the set of numbers obtainedvia

m∑j=1

|γ(tj)− γ(tj−1)|2

witha = t0 < t1 < · · · < tm = b.

Clearly this definition of length is invariant under reparameterisation of γ viastrictly monotone bijections φ : [a, b]→ [c, d] as in Section 4.3. It’s not a veryhard exercise to show that for continuously differentiable γ : [a, b]→ IRN thelength is given by

s(γ) =

∫ b

a

|γ′(t)|2dt,

and the change of variables formula applied to u = φ(t) with φ ∈ C1([a, b])with φ′(t) 6= 0 confirms that

Φ : u→ γ(φ−1(u)) (8.12)

is in C1([c, d]) with [c, d] = φ([a, b]), and has the same length15. Also, iff = f(x) is continuous on γ([a, b]) = Φ([c, d]), it follows that∫

γ

f =

∫γ

fds =

∫ b

a

f(γ(t))|γ′(t)|2dt =

∫ d

c

f(Φ(u))|Φ′(u)|2du =

∫Φ

fds.

(8.13)

15 The condition that γ′(t) 6= 0 also carries over to Φ′(u) 6= 0.

175

Page 176: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

As a special case we have that

s = φ(t) =

∫ t

a

|γ′(τ)|2dτ

defines a reparameterisation for which γ = Φ defined by γ(t) = γ(s) = Φ(s)has

|γ′(s)|2

= |Φ′(s)|2

= 1.

Such a reparametrised γ is called a unit speed path.

8.3 Line integrals of vector fields along curves

Besides (8.13) as a 1-dimensional example of what is to come in (8.31) we canalso define an integral for F = F (x) ∈ IRn continuous on γ([a, b]), namely∫

γ

F · ds =

∫ b

a

F (γ(t)) · γ′(t) dt =

∫ b

a

F (γ(t)) · γ′(t)

|γ′(t)|2︸ ︷︷ ︸

T (t)

|γ′(t)|2dt, (8.14)

but Edwards avoids the commonly used notation in the left hand side of(8.14), and instead writes ∫

γ

F · T ds,

with T the unit tangent vector16 defined by

T (t) =γ′(t)

|γ′(t)|2

.

For reparametrisations u = φ(t) with φ ∈ C1([a, b]) and φ′(t) > 0 and Φdefined as in (8.12) above you easily verify that the work

W =

∫γ

F · ds =

∫γ

F · T ds =

∫Φ

F · T ds =

∫Φ

F · ds.

done by the force field F does not change under reparametrisations u = φ(t)with φ′(t) > 0. Of course

W =

∫γ

F · ds =

∫γ

F · T ds =

∫ b

a

(F1(γ(t))γ′1(t) + · · ·+ Fn(γ(t))γ′n(t))) dt

16 I will use τ = T .

176

Page 177: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

=

∫ b

a

F1(γ(t)) γ′1(t) dt︸ ︷︷ ︸dx1

+ · · ·+∫ b

a

Fn(γ(t)) γ′n(t) dt︸ ︷︷ ︸dxn

leads to the notational convention∫γ

F · ds =

∫γ

F1dx1 + · · ·+∫γ

Fndxn =

∫γ

F1dx1 + · · ·+ Fndxn. (8.15)

If F = ∇f it is then common to write∫γ

df =

∫γ

∂f

∂x1

dx1 + · · ·+ ∂f

∂xndxn︸ ︷︷ ︸

df

=

∫γ

∇f · ds =

∫ b

a

∇f(γ(t)) · γ′(t) dt = f(γ(t))|ba= f(γ(b))− f(γ(a)),

a notation which generalises (4.8), after which d was seen17 as acting on f toproduce df = f ′(x)dx. Here we have d acting on f as

df =∂f

∂x1

dx1 + · · ·+ ∂f

∂xndxn, (8.16)

producing what is called a 1-form in Section 1 of Chapter V in Edwards.These 1-forms act on vectors. Whereas the x-dependent vector

F (x) = F1(x)e1 + · · ·+ Fn(x)en (8.17)

and the vectorv = v1e1 + · · ·+ vnen

have and x-dependent inner product

F (x) · v = F1(x)v1 + · · ·+ Fn(x)vn,

the 1-formω = F1(x)dx1 + · · ·+ Fn(x)dxn (8.18)

assigns to the same vector v the same x-dependent scalar

F1(x)v1 + · · ·+ Fn(x)vn,

in which we can insert x = γ(t) and vi = γ′i(t) to get a t-dependent quantitythat we can integrate from t = a to t = b to define∫ b

a

(F1(γ(t))γ′1(t) + · · ·+ Fn(γ(t))γ′n(t)) dt =

∫γ

ω.

17 Writing f instead of F again.

177

Page 178: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Thus, ω evaluated in x = γ(t) acts on γ′(t) and is integrated from t = ato t = b to define

∫γω. Note a reparameterisation of γ with u = φ(t) and

φ′(t) < 0 changes the sign of the integral.The notation for ω hides the x-dependence and may look like the abuse

of notation in f = f(x), but (13) and (14) in Section 1 of Chapter V inEdwards are mathematically precise18. In conclusion we have

∫γf =

∫γf ds

defined for continuous scalar functions f = f(x) and∫γω for 1-forms ω =

F1(x)dx1 + · · ·+ F (x)dxn.

8.4 Surface area

We need some linear algebra for integrals over more general surface patchesthen the ones encountered in Section 8.1 , a surface patch being a set in IR3

parameterised by a continuously differentiable injective map

Φ : [0, 1]× [0, 1]→ IR3, (8.19)

with

∇Φ = (∇Φ1 ∇Φ2 ∇Φ3) =

(∂Φ1

∂u1

∂Φ2

∂u1

∂Φ3

∂u1

∂Φ1

∂u2

∂Φ2

∂u2

∂Φ3

∂u2

)denoting the matrix of which the columns are the gradients of the N = 3components Φ1,Φ2,Φ3 of Φ with respect to the n = 2 variables19 u1, u2 inΦ = Φ(u) = Φ(u1, u2), consistent with the notation in Section (6.3).

Momentarily switching to a notation with Φ1,Φ2,Φ3 as functions of u, v,∇Φ is the transpose of the Jacobian matrix

(∂Φ

∂u

∂Φ

∂v),

which has column vectors ∂Φ∂u

, ∂Φ∂v

.In the special linear case with

Φi(u, v) = aiu+ biv (8.20)

the Jacobian matrix is the transpose of

∇Φ = A =

(a1 a2 a3

b1 b2 b3

),

the matrix example in (8.28) starting the discussion in Section 8.7 below on

18 We also write∫ baf for the integral of a function.

19 Everything that follows should generalise or trivialise to 1 ≤ n ≤ N.

178

Page 179: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

the area M2(a, b) of a parallelogram spanned by two vectors a and b

with entries a1, a2, a3 and b1, b2, b3 respectively. This parallelogram is thenthe image of [0, 1]× [0, 1] under Φ defined by (8.20), and its area is then equalto ∫ 1

0

∫ 1

0

M2(∂Φ

∂u,∂Φ

∂v) dudv, (8.21)

the integrand being independent of u, v, as a = ∂Φ∂u

and b = ∂Φ∂v

are constantvectors is the linear case (8.20).

It will be no surprise that (8.21) will also be used to define the area ofthe surface patch defined by Φ if Φ is not a linear map from [0, 1]2 to IR3,and that everything generalises to Φ : [0, 1]n → IRN with 1 ≤ n < N. Weexpand on the linear case of this generalisation next.

8.5 The transpose, quadratic forms and operator norms

In (6.21) we can put B = AT , the transpose of the matrix A with entries aijused in

yi =n∑j=1

aijxj,

which defined A ∈ L(IRn, IRm). This gives

S = AAT ∈ L(IRm, IRm) with entries sik =n∑j=1

aijakj = ski. (8.22)

Since

|A|op

= max06=x∈IRn

|Ax|2

|x|2

= max|x|

2=1|Ax|

2,

and likewise for |AT |op

, we have

|AT |2op

= max|z|

2=1|AT z|2

2︸ ︷︷ ︸AT z·AT z

= max|z|

2=1AAT z ·z = max

|z|2

=1Sz ·z = max

06=z∈IRm

Sz · zz · z

, (8.23)

and we note that the bilinear mapping

(z, w)→ Sz · w

from IRm× IRm to IR then satisfies all the axioms of an inner product, exceptthat Sz · z = 0 does not imply that z = 0.

179

Page 180: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 8.1. Rederive the Cauchy-Schwarz inequality for z, w ∈ IRm by inspectionof the minimum of the nonnegative function

λ→ |λw − z|22

= (λw − z) · (λw − z),

and show that the same reasoning leads to

|Sz · w| ≤√Sz · z

√Sw · w.

Note the special case m = n and S = A = I and don’t forget to discuss the possibilitythat the function you use is not a quadratic but a linear function.

For S = AAT as above we set

M = max|z|

2=1Sz · z,

whereby we note that S is a symmetric matrix for which Sz · z ≥ 0 holds forall z ∈ IRm. Just like it is easy to prove from the definition of the 2-norm via

|w|2

=√w · w

that|z + w|2

2+ |z − w|2

2= 2 |z|2

2+ 2 |w|2

2,

you easily verify that

S(z + w) · (z + w) + S(z − w) · (z − w) = 2Sz · z + 2Sw · w, (8.24)

an identity to play with, with S = AATas above, but also with S = I theidentity:

Opgave 8.2. The Cauchy-Schwarz inequality and the definition of the operator normin Section 6.5 immediately imply that M ≤ |S|

op. Write

4Sz · w = S(z + w) · (z + w)− S(z − w) · (z − w)

and estimate the right hand side in terms of M to obtain that in particular for allz, w ∈ IRm with |z|

2= |w|

2= 1 it holds that |Sz ·w| ≤M . Conclude that |S|

p= M .

The mapz → Q(z) = Sz · z

defined by the symmetric matrix S is called a quadratic form. You shouldnever forget the remarkable fact that the maxima of z → |Q(z)| and z → |Sz|on the unit ball coincide.

180

Page 181: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

8.6 Eigenvalues of compact linear symmetric operators

The above carries over to S : H → H when H is any inner product spaceand S : H → H is linear and symmetric with respect to that inner product,and has the property that Sz · z ≥ 0 for all z ∈ H, except that we no longerknow that the maxima exist. Introducing

|S|op

= sup06=z∈H

|Sz||z|

= sup0 6=z∈H

√Sz · Szz · z

= supz·z=1

√Sz · Sz, (8.25)

andM = sup

z·z=1

√Sz · z, (8.26)

it suffices to have that S is bounded on the unit ball in H to have M =|S|

op<∞.

Ignoring the trivial case that M = 0 we now observe that the Cauchy-Schwarz inequality in Exercise 8.1 also holds with S replaced by M − S =MI − S, I being the identity map, and it thus holds that

|(M − S)z · w| ≤√

(M − S)z · z√

(M − S)w · w, (8.27)

whence (varying w over the unit ball)

|(M − S)z| ≤√

(M − S)z · z√|M − S|

op≤√

(M − S)z · z√M + |S|

op

Taking a sequence zn ∈ H with |zn| = 1 and Szn ·zn →M , it then followsthat the right hand side goes to zero, and thus

Mzn − Szn → 0.

If the sequence zn can be chosen to have Szn converging to a limit y ∈ H, itfollows that also Mzn → y and that M = |y| > 0. But then w = y

Mis a unit

eigenvector of S with eigenvalue M . We have therefore proved the followingTheorem.

Stelling 8.3. If H is an inner product space and S : H → H is linear,symmetric with Sz · z ≥ 0 for all z ∈ H, and if for every bounded sequencezn in H it holds that Szn has a convergent subsequence, then

λ1 = max06=z∈H

Sz · zz · z

> 0

exists, and λ1 is an eigenvalue of S whose eigenvectors are the maximizersof the maximum.

181

Page 182: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Given an eigenvector w1 with |w1| = 1 it easily follows that S maps

H1 = z ∈ H : z · w1 = 0

to itself. Unless H1 = 0 it then follows that

λ2 = maxz·w1=06=z∈H

Sz · zz · z

≥ 0

is also an eigenvalue of S with eigenvector w2 with |w2| = 1. Note that wecannot exclude that λ2 = 0. If this happens than H1 is the null space of S.

Repeating the argument with

H2 = z ∈ H : z · w1 = z · w2 = 0

we obtain a sequence of eigenvalues

λ1 ≥ λ2 ≥ · · · ≥ 0

and a sequence of corresponding mutually perpendicular unit eigenvectors

w1, w2, . . . ,

which either terminate (if H is finite-dimensional) or have the property thatλn → 0 as n→∞. The latter statement is a consequence of the convergentsubsequences assumption.

If we do not assume that Sz · z ≥ 0 for all z ∈ H then the absolute valueof the first eigenvalue is still obtained as

|λ1| = max0 6=z∈H

|Sz · z|z · z

> 0,

because, changing from S to −S if necessary, it is no restriction to assumethat

M = sup06=z∈H

|Sz · z|z · z

= sup06=z∈H

Sz · zz · z

,

and reason as above. With the Cauchy-Schwarz inequality in (8.27) stillholding20 while the version in Exercise 8.1 fails, the upshot is that we stillobtain eigenvalues with

|λ1| ≥ |λ2| ≥ · · · ≥ 0,

with eigenvectors as before. This is essentially the spectral theorem for com-pact symmetric linear operators S from an inner product space H to itself.It does not require any knowledge of the determinants which will becomeimportant next in the finite-dimensional case.

20 I first saw this Cauchy-Schwarz trick in the appendix of the PDE book of Craig Evans.

182

Page 183: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

8.7 Singular values and measures of parallelotopes

In the case that H = IRm the subsequence argument is not needed as themaximizer w for the maximum in Theorem 8.3 exists in view of the com-pactness of the unit ball in IRm. In particular, in relation to (8.22), we haveachieved that IRm has an orthonormal basis basis of eigenvectors w1, . . . , wmcorresponding to eigenvalues σ1 ≥ · · · ≥ σm ≥ 0 of AAT . If n ≥ m theseeigenvalues are called the singular values of A.

As an example consider the case that

A =

(a1 a2 a3

b1 b2 b3

)(8.28)

and

AAT =

(a2

1 + a22 + a2

3 a1b1 + a2b2 + a3b3

b1a1 + b2a2 + b3a3 b21 + b2

2 + b23

)=

(a · a a · bb · a b · b

)(8.29)

The outer product a× b of these two 3-column vectors a and b with, respec-tively, entries a1, a2, a3 and entries b1, b2, b3, is defined as the 3-vector withentries

a2b3 − a3b2, a3b1 − a1b3, a1b2 − a2b1,

and has squared length

|a× b|2 = (a2b3 − a3b2)2 + (a3b1 − a1b3)2 + (a1b2 − a2b1)2 = det(AAT),

as you should verify. That is to say, det(AAT) is the sum of all the squaresof all the 2× 2-determinants of 2× 2 submatrices of A. Here we count these2× 2 submatrices modulo the column permutations in (8.28).

As you may know, the length of the outer product a× b of a and b equalsthe area of the parallellogram spanned by a and b. Thus this area is thesquare root of the sum of the squares of the three 2 × 2-determinants in(8.28). It is precisely this statement that generalises to the n-dimensionalmeasure of a parallelotope spanned by n vectors x1, . . . , xn in IRN.

Stelling 8.4. Let 1 ≤ n ≤ N. Consider the parallelotope P spanned by thevectors x1, . . . , xn in IRN. After putting these vectors in the columns21 of amatrix A, the n-dimensional measure Mn(x1, . . . , xn) of P is the square rootof the determinant of ATA, and this determinant in turn is the sum of allthe squares of the determinants of all n× n submatrices, and also equals theproduct σ1 · · · σn of the singular values of A.

21 NB! Compared to (8.28) we switch from A to AT in the notation.

183

Page 184: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Let us sketch a proof of this statement, first for (8.28), without using theouter product, using the invariance of the area under shear transformations.That is to say, the area of the parallelogram spanned by the vectors a and bis the same as that of the parallelogram spanned by the vectors a + tb andb with t ∈ IR arbitrary. The same statement holds for the determinant ofS = ATA and the determinant of St = ATt At where At is the matrix withcolumn vectors a+ tb and b. Indeed, writing At = A+ tB we have

ATt At = (A+ tB)T (A+ tB) = ATA+ tATB + tBTA+ t2BTB

= ATA+ tATB︸ ︷︷ ︸Ct

+t(BTA+ tBTB︸ ︷︷ ︸Dt

) = St

The matrix Ct is the matrix obtained from S = ATA by adding t timesthe second (last) row of S to its first row. Therefore Ct and S have thesame determinant. In turn, the matrix St is obtained from Ct by addingt times the second (last) column of Ct to its first column. Therefore Stand Ct have the same determinant. It follows that St and S have the samedeterminant. So both the area and the determinant are invariant under thisshear transformation, which allows us to restrict our proof to the case inwhich a · b = 0. Then the square of the area is equal to the product ofthe squares of the lengths of a and b, which is also the determinant of thediagonal matrix with entries a · a and b · b. To prove the general statementin the theorem we use repeated shear transformations which leave both thedeterminant and the measure invariant and reduce the statement to be provedto the case that xi · xj = 0 if i 6= j and a corresponding diagonal matrixS with entries x1 · x1, . . . , xn · xn. But this should be obvious from anyformal definition of the n-dimensional measure of parallelotopes spanned byn vectors, a definition we happily leave here to be for what it is.

It remains to show that the determinant of the matrix S defined in (8.22)is also equal to the sum of the squares of the determinants of all the maximalsquare submatrices of A. These are also invariant under the shear transfor-mations used above. Rather than using these transformations to reduce thestatement to be proved to the case that the column vectors satisfy xi ·xj = 0for i 6= j we now use them diagonalise a maximal square part of the matrix A.Note that if the matrix A has no n×n submatrix with nonzero determinant,then the sum of the squared n× n determinants is zero, while also it cannotbe the case that the column vectors are independent. Then our reductionto the case that the column vectors satisfy xi · xj = 0 leads to one of thesevectors being zero making the n-dimensional measure of P , and thereby thedeterminant of ATA zero as well.

Thus we may as well assume that the upper n× n part of A has nonzerodeterminant. It is a straightforward linear algebra exercise to show that, most

184

Page 185: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

likely after relabeling the first n coordinates, shear transformations bring Ain the form

A =

B

)where Λ is an n×n diagonal matrix with nonzero entries λ1, . . . , λn. Here wealready assumed that n < N because otherwise there was nothing to prove22

in the first place. It now follows that

ATA = Λ2 +BTB = Λ2 + S,

where B is an m× n matrix with entries bik and S has entries

sij =m∑k=1

bikbjk.

We therefore have, writing B = [B1, . . . , Bn] with B1, . . . , Bn the columnvectors of B and using product notation, that

det(ATA) = Πjλ2j︸︷︷︸

λ1j ···λ

nj

+s11 Πj 6=1λ2j︸ ︷︷ ︸

λ2j ···λ

nj

+ · · ·+ snnΠj 6=nλ2j

+det

(s11 s12

s12 s22

)Πj 6=1,2λ

2j + · · ·+ detS =

Πjλ2j + (B1 ·B1)Πj 6=1λ

2j + · · ·+ det

(B1 · B1 B1 · B2

B1 · B2 B2 · B2

)Πj 6=1,2λ

2j + · · · ,

in which we wrote the term of degree n and only the first terms of degree2n − 2 and degree 2n − 4 in λ1, . . . , λn. It should be obvious what theremaining terms are.

On the other hand, the sum of the squared determinants of the n × nsubmatrices of A is

Πjλ2j+(b2

11+b221+· · ·+b2

m1)Πj 6=1λ2j+· · ·+

(det

(b11 b12

b12 b22

)2

+ · · ·

)Πj 6=1,2λ

2j+· · ·

It remains to show that

B1 ·B1 = b211 + b2

21 + · · ·+ b2m1,

which is clearly the case, and then that

det

(B1 · B1 B1 · B2

B1 · B2 B2 · B2

)= det

(b11 b12

b12 b22

)2

+ · · ·+ det

(b(m−1)1 b(m−1)2

bm2 bm2

)2

,

22 If you know your determinants.

185

Page 186: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

etcetera. These are the statements we set out to prove for A, before applyingshear transformations, but with shorter columnvectors, namely of length N−n, respectively for two such vectors, up to m such vectors. We can thussystematically reduce the statement we want to proof to lower dimensions ofthe matrix under consideration, until we reach the easy case that m = 1.

8.8 Surface integrals

The treatment of Theorem 8.4 above is somewhat different from Edwards’exposition. I now return to (8.21). Generalising to 1 ≤ n ≤ N we consider∫

[0,1]nMn(

∂Φ

∂u) du =

∫ 1

0

· · ·∫ 1

0

Mn(∂Φ

∂u1

, . . . ,∂Φ

∂un) du1 · · · dun (8.30)

in which

Mn(∂Φ

∂u1

, . . . ,∂Φ

∂un) =Mn(Φu1 , . . . ,Φun)

is given by Theorem 8.4. Here du = du1 · · · dun and∫

[0,1]n=∫ 1

0· · ·∫ 1

0are

just notational conventions.In the special case that n = 1 we have

M1(Φu) =√

Φ′1(u)2 + · · ·+ Φ′n(u)2,

andds =M1(Φu) du =

√Φ′1(u)2 + · · ·+ Φ′n(u)2 du

is a common notation, introduced in Edwards23 after a change of coordinatesdefined by

ds

du=√

Φ′1(u)2 + · · ·+ Φ′n(u)2.

While not corresponding to a change of coordinates the notation

dS =M2(Φu,Φv)dudv,

with the S of surface, is also common. Here I will use dSn for

dSn =Mn(∂Φ

∂u) du =Mn(Φu1 , . . . ,Φun) du1 · · · dun

in (8.30), i.e.∫Φ

dSn =

∫ 1

0

· · ·∫ 1

0

Mn(∂Φ

∂u1

, . . . ,∂Φ

∂un) du1 · · · dun,

23 In Section V.1 his γ(t) would correspond Φ(u).

186

Page 187: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

and, for a function f = f(x) = f(x1, · · · , xn) which is continuous on

x = Φ(u) : u ∈ [0, 1]n,

write∫Φ

fdSn =

∫ 1

0

· · ·∫ 1

0

f(Φ(u1, . . . , un))Mn(∂Φ

∂u1

, . . . ,∂Φ

∂un) du1 · · · dun,

(8.31)the subscript Φ on the integral being at least consistent with the case n = 1and ds = dS1, and in fact coinciding with the notation in the second part of(8.13). Personally I often drop the dSn from the notation and just write

∫Φf

instead of∫

ΦfdSn, and

∫γf if n = 1 and γ = Φ is a path in IRN. Below we

will also allow general closed blocks

[a, b] = [a1, b1]× · · · × [an, bn].

8.9 Integrals of functions over compact manifolds

Section 6.8.1 and Section 8.18 concern 3 descriptions of what it means forM ⊂ IRN to be an n-dimensional manifold in IRN. We now use characteri-sation (C) just below Exercise 6.16, and assume in addition that there existfinitely many injective continuously differentiable

Φi : [ai, bi]→ IRN

defined on blocks [ai, bi] as in the elaboration on (C) in Section 8.18 above24,such that

M = Φ1((a1, b1))∪ · · · ∪ΦI((aI , bI)) = Φ1([a1, b1])∪ · · · ∪ΦI([aI , bI ]), (8.32)

and moreover that there exist corresponding smooth functions

ζi : IRN → [0, 1]

withζ1 + · · ·+ ζI ≡ 1 on M and supp ζi Φi ⊂ (ai, bi)

for every i = 1, . . . , I. Here supp ζi Φi is the support of the functionu→ ζi(Φi(u)), defined as the closure of the set

u ∈ (ai, bi) : ζi(Φi(u)) 6= 0.24 The index i numbering the blocks now.

187

Page 188: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

We say that u → ζi(Φi(u)) belongs to C1c ((ai, bi)), the class of C1-functions

with support contained in the open set (ai, bi).You can think of each function ζi as fading the patch Φi((ai, bi)), making

it fade away completely near its boundary where ζi ≡ 0, while together the ζileave the whole of M as bright as it was before. Such brightness functions ζican be chosen to vanish outside a neighbourhood in IRN of the image Φi(Ki),and the collection ζ1, . . . , ζI is called a finite partition of unity on M , whichis then (turning25 a theorem around which says that such partitions exist ifM is compact) a closed and bounded subset of IRN.

If f : M → IR is continuous we now wish to define∫M

fdSn =

∫Φ1

fζ1dSn + · · ·+∫

ΦI

fζIdSn, (8.33)

which requires a theorem that says this is independent of the choice of patchesand brightness functions. We leave this issue26 for now.

Of course the exposition above involves the change of variables theoremand Section 6.8.3. At the end of the day every theorem that we may wishto prove involving integrals of functions over M may be proved by restatingand proving a local form only.

Finally we note that if the blocks [ai, bi] and the injective continuouslydifferentiable functions Φi : [ai, bi] → IRN with Φ′(u) of maximal rank canbe chosen such that27

M = Φ1([a1, b1]) ∪ · · · ∪ ΦI([aI , bI ]) with Φi((ai, bi)) ∩ Φj((aj, bj)) = ∅(8.34)

for i 6= j, then ∫M

fdSn =

∫Φ1

f dSn + · · ·+∫

ΦI

fdSn (8.35)

is the obvious definition which Edwards uses, and which is what you do inexamples.

8.10 More integration of differential forms

We look again at the right hand side of (8.10) with N = n+ 1, evaluated forvi = ζvi with ζ a cut-off function vanishing outside and near the boundaryof some window

[a, b] = [a1, b1]× · · · × [aN, bN],

25 Following Steenbrink in his exposition of the Poincare conjecture in Noordwijkerhout.26 But see later sections.27 Edwards: a hard theorem says this can be done.

188

Page 189: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

in which we now assume a local representation of Ω ∩ [a, b] given by28

(x1, . . . , xn) ∈ [a1, b1]× · · · × [an, bn] and an+1 ≤ xn+1 < f(x1, . . . , xn),

with f ∈ C1([a1, b1]× · · · × [an, bn]) taking values in (an+1, bn+1), and

Φ(u1, . . . , un) = (u1, . . . , un, f(u1, . . . , un)) (8.36)

parameterising M ∩ [a, b] = ∂Ω ∩ [a, b]. We denote the unit basis vectors bye1, . . . , en+1.

For n = 2 the vector obtained by the formal determinant manipulation∣∣∣∣∣∣∂Φ1

∂u1

∂Φ2

∂u1

∂Φ3

∂u1∂Φ1

∂u2

∂Φ2

∂u2

∂Φ3

∂u2

e1 e2 e3

∣∣∣∣∣∣ =

∣∣∣∣∂Φ1

∂u1

∂Φ2

∂u1∂Φ1

∂u2

∂Φ2

∂u2

∣∣∣∣ e3 +

∣∣∣∣∂Φ2

∂u1

∂Φ3

∂u1∂Φ2

∂u2

∂Φ3

∂u2

∣∣∣∣ e1 +

∣∣∣∣∂Φ3

∂u1

∂Φ1

∂u1∂Φ3

∂u2

∂Φ1

∂u2

∣∣∣∣ e2 (8.37)

is commonly called the cross product of the vectors Φu1 and Φu2 , and forΦ(u1, u2) = (u1, u2, f(u1, u2)) it evaluates as29

e3 −∂f

∂u1

e1 −∂f

∂u2

e2 = − ∂f

∂u1

e1 −∂f

∂u2

e2 + e3, (8.38)

which is a positive multiple of the unit vector ν characterised by having itslast component positive and being perpendicular to the graph defined byu3 = f(u1, u2). For any continuously differentiable

Φ : [a1, b1]× [a2, b2]→ IR3

with Φu1 and Φu2 linearly independent, the vector defined by (8.37) is per-pendicular to the plane spanned by Φu1 and Φu2 , and can be normalised bydividing it by its length, which we recognise as

M2(Φu1 ,Φu2)

in view of Theorem 8.4. If we call this normalised vector ν, which in case of(8.38) is simply30

ν =1√

1 + f 2u1

+ f 2u2

(− ∂f

∂u1

e1 −∂f

∂u2

e2 + e3

), (8.39)

28 Like (8.5), whereas I did most local arguments using (8.6).29 Denoting the partial with subscripts u1 and u2.30 Please allow the simultaneous use of both expressions in fui

= ∂f∂ui

.

189

Page 190: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

and consider vi as the ith component of a vector field v = ζv defined onM ∩ [a, b], with v a vector field on M , then∫

M

ν · v dS2 =

∫∫[a1,b1]×[a2,b2]

(v1

∣∣∣∣∂Φ2

∂u1

∂Φ3

∂u1∂Φ2

∂u2

∂Φ3

∂u2

∣∣∣∣+ v2

∣∣∣∣∂Φ3

∂u1

∂Φ1

∂u1∂Φ3

∂u2

∂Φ1

∂u2

∣∣∣∣+ v3

∣∣∣∣∂Φ1

∂u1

∂Φ2

∂u1∂Φ1

∂u2

∂Φ2

∂u2

∣∣∣∣) du1 du2︸ ︷︷ ︸du

,

which we may be inclined to write as∫Φ

v1 dx2dx3 + v2 dx3dx1 + v3 dx1dx2 =

∫Φ

ω, (8.40)

withω = v1 dx2dx3 + v2 dx3dx1 + v3 dx1dx2,

using formal rules such as

dx2dx3 =

∣∣∣∣∂x2

∂u1

∂x3

∂u1∂x2

∂u2

∂x3

∂u2

∣∣∣∣ du1 du2︸ ︷︷ ︸du

=

∣∣∣∣∂Φ2

∂u1

∂Φ3

∂u1∂Φ2

∂u2

∂Φ3

∂u2

∣∣∣∣ du1 du2︸ ︷︷ ︸du

.

We then have that (8.40) is equal to∫Ω

∇ · v =

∫Ω

∇ · v(x) dx =

∫∫∫Ω

(∂v1

∂x1

+∂v2

∂x2

+∂v3

∂x3

)dx1 dx2 dx3︸ ︷︷ ︸

dx

,

which we will wish to write as an integral of the differential form

dω =

(∂v1

∂x1

+∂v2

∂x2

+∂v3

∂x3

)dx1dx2dx3︸ ︷︷ ︸

6= dx

,

in which dx1dx2dx3 is part of a 3-form and not be read as dx = dx1 dx2 dx3.All of the above generalises31 to arbitrary N = n+ 1, e.g. we also have∫

Ω

(∂v1

∂x1

+∂v2

∂x2

+∂v3

∂x3

+∂v4

∂x4

)dx (8.41)

=

∫Φ

v1 dx2dx3dx4 + · · · (cyclicly permutated terms) · · · =∫

Φ

ω,

31 This is why we put the unit vectors in the last row of the determimant in (8.37).

190

Page 191: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

using rules like

dx2dx3dx4 =

∣∣∣∣∣∣∂x2

∂u1

∂x3

∂u1

∂x4

∂u1∂x2

∂u2

∂x3

∂u2

∂x4

∂u2∂x2

∂u3

∂x3

∂u3

∂x4

∂u3

∣∣∣∣∣∣ du1 du2 du3︸ ︷︷ ︸du

,

and (8.41) should be the integral of the 4-form

dω =

(∂v1

∂x1

+∂v2

∂x2

+∂v3

∂x3

+∂v4

∂x4

)dx1dx2dx3dx4.

Clearly such a d-calculus requires rules such as dxidxj = −dxjdxi. I playedwith the formal rules that one might like to have in Section 6.9, see also thediscussion after Stelling 4.12. This notation, used in Edwards, is cumbersomeas the difference between spaces or no spaces between dxi and dxj is hardlyvisible, which is a reason to write dxi ∧ dxj instead of dxidxj.

We conclude with the simplest but slightly confusing case, n = 1 andN = 2, when (8.37) should be replaced by∣∣∣∣∂Φ1

∂u∂Φ2

∂u

e1 e2

∣∣∣∣ =∂Φ2

∂ue1 −

∂Φ1

∂ue2, (8.42)

which forΦ(u) = (u, f(u))

e2 − f ′(u)e1,

and leads to∫M

ν · v dS1 =

∫[a,b]

(−v1

∂Φ2

∂u+ v2

∂Φ1

∂u

)du =

∫∫Ω

(∂v1

∂x1

+∂v2

∂x2

)dx1 dx2,

in which we dropped the subscripts in a1, b1, u1. Here we have

ω = −v1 dx2 + v2 dx1 with dω =

(∂v1

∂x1

+∂v2

∂x2

)dx1dx2,

and ∫∂Ω

ω =

∫Ω

dω.

In x, y notation for ω = p(x, y)dx + q(x, y)dy we have dω = (qx − py)dxdyand ∫

∂Ω

p(x, y)dx+ q(x, y)dy =

∫Ω

(qx − py)dxdy, (8.43)

191

Page 192: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

which should make you wonder about∫γ

p(x, y, z)dx+ q(x, y, z)dy + r(x, y, z)dz,

for γ : [a, b] → IR3 as in Section 8.3. Section 8.11 below explores what’sgoing on here.

Note that in all these examples the N-form ω = f(x)dx1 · · · dxN integratedover the domain Ω should sensibly be agreed to give32∫

Ω

ω =

∫Ω

f(x)dx1 · · · dxN =

∫Ω

f.

8.11 From Green’s Theorem to Stokes’ curl theorem

Now consider (8.36) as a local description of a manifold M and forget aboutΩ as being a domain with M = ∂Ω. Instead let Ω be as in (8.1) withN = 2 and let M be the graph of f : Ω → IR. Assume for simplicitythat ∂Ω is parameterised by a 1-periodic continuously differentiable functiont→ u(t) = (u1(t), u2(t)). Then

tγ−→ (u1(t), u2(t), f(u1(t), u2(t))) (8.44)

parameterises the “boundary”

∂M = (u, f(u))︸ ︷︷ ︸Φ(u)

: u ∈ ∂Ω,

andu

Φ−→ (u, f(u)) (8.45)

parameterises M , with u = (u1, u2) ∈ Ω.For

F (x) = F1(x)e1 + F2(x)e2 + F3(x)e3

we introduceω = F1(x)dx1 + F2(x)dx2 + F3(x)dx3

as in (8.17) and (8.18) and consider the integral∫∂M

ω

32 Don’t confuse this f with f in the local description above.

192

Page 193: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

as in (8.15). It evaluates as∫∂M

ω =

∫ 1

0

(F1(γ(t))γ′1(t) + F2(γ(t))γ′2(t)) + F3(γ(t))γ′3(t))) dt

=

∫ 1

0

(F1(u(t), f(u(t))u′1(t) + F3(u(t), f(u(t)))fu1(u(t)u′1(t)) dt

+

∫ 1

0

(F2(u(t), f(u(t))u′2(t) + F3(u(t), f(u(t)))fu2(u(t)u′2(t)) dt =∫∂Ω

ζ =

∫Ω

dζ, (8.46)

in which

ζ =

(F1 + F3

∂f

∂u1

)du1 +

(F2 + F3

∂f

∂u2

)du2

Next we compute

dζ =

(∂F1

∂x2

+∂F1

∂x3

∂f

∂u2

+∂F3

∂x2

∂f

∂u1

+∂F3

∂x3

∂f

∂u2

∂f

∂u1

+ F3∂2f

∂u2∂u1

)du2du1

+

(∂F2

∂x1

+∂F2

∂x3

∂f

∂u1

+∂F3

∂x1

∂f

∂u2

+∂F3

∂x3

∂f

∂u1

∂f

∂u2

+ F3∂2f

∂u1∂u2

)du1du2,

which in view of du2du1 = −du1du2 reduces to

dζ = φ(u1, u2)du1du2 (8.47)

with φ(u1, u2) given by

φ = −(∂F3

∂x2

− ∂F2

∂x3

)︸ ︷︷ ︸

G1

∂f

∂u1

−(∂F1

∂x3

− ∂F3

∂x1

)︸ ︷︷ ︸

G2

∂f

∂u2

+

(∂F2

∂x1

− ∂F1

∂x2

)︸ ︷︷ ︸

G3

(8.48)

= −G1∂f

∂u1

−G2∂f

∂u2

+G3.

You should note that the second order derivatives of (8.45) are dropouts inthe calculations that lead to (8.48).

Now compare (8.48) to ν in (8.39) and recall that for Φ given by (8.45)we know that

M2(Φu1 ,Φu2) =√

1 + f 2u1

+ f 2u2.

193

Page 194: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Summing up we thus have ∫∂M

(F · τ) dS1 =

(hello forms)∫∂M

ω =

∫∂Ω

ζ =

∫Ω

dζ =

∫Ω

φ du1du2︸ ︷︷ ︸dζ

=

(goodbye forms)∫Ω

φ =

∫Ω

(G · ν)M2(Φu1 ,Φu2) =

∫M

(G · ν) dS2,

with G derived from F as indicated in (8.48), and commonly denoted asG = ∇× F , i.e.∫

∂M

(F · τ) dS1 =

∫M

(G · ν) dS2 with G = ∇× F, (8.49)

using the parameterisations as indicated33. But don’t say goodbye:

8.12 Pullbacks and the action of d

We already saw in the reasoning from (8.15) to (8.16) that d acting on aC1-function f = f(x1, . . . , xN) produces a 1-form

df =∂f

∂x1

dx1 + · · ·+ ∂f

∂xN

dxN =∂f

∂xidxi, (8.50)

using the convention that we sum over repeated indices. With f(x1, . . . , xN)replaced by u(x, y) this is (6.48) in Section 6.9.2. There I played with thed-algebra that emerges whenever you do integration using formal notationssuch as (4.8), which is just (8.50) with n = 1 and f(x1, · · · , xN) replaced byF (x).

Now consider a parameterisation x = Φ(u) as in (C) in Section 6.8.1. Weuse Φ to pull back expressions with x and dx1, . . . , dxN back to expressionswith u and du1, . . . , dun, in a way that is consistent with the discussion

33 Figure out that annoying ± afterwards? We have, depending on the parameterisation:∫∂M

(F · τ) dS1 = ±∫M

(G · ν) dS2.

194

Page 195: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

leading to (8.40) and the formal rules that emerge in the calculations to doso. Thus we certainly want to deal with

f(x) = φ(u) via x = Φ(u). (8.51)

A mathematician’s way to do so is to introduce

φ = Φ∗(f) = f Φ, (8.52)

the pullback of f via Φ, which then also provides us with

dφ =∂φ

∂u1

du1 + · · ·+ ∂φ

∂undun. (8.53)

If g is another function of x then clearly

Φ∗(f + g) = Φ∗(f) + Φ∗(g), Φ∗(fg) = Φ∗(f)Φ∗(g),

which suggests as a definition of the pullback of a 1-form ω = fidxi that

Φ∗(fidxi) = Φ∗(fi)︸ ︷︷ ︸φi

Φ∗(dxi), (8.54)

in which φi(u) = fi(Φ(u)) as before. This definition would imply that

Φ∗(df) =∂f

∂xi((Φ(u))︸ ︷︷ ︸

Φ∗(Dif)(u)

Φ∗(dxi). (8.55)

Note that Dif as notation for the ith first order partial derivative of f hasthe advantage of not using the variable x in the notation.

On the other hand (8.53) implies via the chain rule that

d(Φ∗(f)) =∂

∂uj(f(Φ(u)) duj =

∂f

∂xi(Φ(u))

∂Φi

∂ujduj, (8.56)

and comparing to (8.55) we see that, if we define the pullback of dxi underΦ to be

Φ∗(dxi) =∂Φi

∂ujduj, (8.57)

it follows thatΦ∗(df) = Φ∗(df). (8.58)

The definition of Φ∗(dxi) by (8.57) is just a formalisation of the familiar“rule”

dxi =∂xi∂uj

duj

195

Page 196: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

for expressing dxi in u, du1, . . . , dun, just like expressing f(x) in u via (8.51)is formalised by (8.52). It implies that the pullback of the 1-form in (8.54)evaluates as

Φ∗(fidxi) = φi∂Φi

∂ujduj︸ ︷︷ ︸

with φi(u)=fi(Φ(u))

= fi(Φ(u))∂Φi

∂ujduj = fi(Φ(u))DjΦi(u) duj. (8.59)

Next we observe that d acting on the resulting 1-form in (8.59) may beevaluated, using the chain rule and dukduj = −dujduk, as

d(Φ∗(fidxi)) = d(fi(Φ(u))∂Φi

∂ujduj) =

∂uk(fi(Φ(u))

∂Φi

∂uj) dukduj

= (∂

∂uk(fi(Φ(u)))

∂Φi

∂ujdukduj + fi(Φ(u))

∂2Φi

∂uk∂ujdukduj︸ ︷︷ ︸

zero the hero!

=

∂fi∂xk

(Φ(u))∂Φk

∂uk

∂Φi

∂ujduk duj = Φ∗(Dkfi)

∂Φk

∂uk

∂Φi

∂ujduk duj, (8.60)

in which we used

d(fidxi) =∂fi∂xk

dxk dxi (8.61)

in the u-variables. Recall that this was the definition34 in Section 6.9.2 ofthe action of d on 1-forms. With

Φ∗(fijdxidxj) = Φ∗(fij)︸ ︷︷ ︸φij

Φ∗(dxidxj) (8.62)

as the obvious defining analog of (8.54), we have that

Φ∗(d(fidxi)) = Φ∗(∂fi∂xk

dxkdxi) = Φ∗(Dkfi) Φ∗(dxkdxi). (8.63)

Comparing to (8.63) to (8.60) it follows that

Φ∗(d(fidxi)) = d(Φ∗(fidxi)), (8.64)

provided we define

Φ∗(dxkdxi) =∂Φk

∂uk

∂Φi

∂ujduk duj︸ ︷︷ ︸

sum over 1≤k,j≤n

= (∂Φk

∂uk

∂Φi

∂uj− ∂Φk

∂uk

∂Φi

∂uj) duk duj︸ ︷︷ ︸

sum over 1≤k<j≤n

34 Recall the choice to set ddxi = 0, leading to ddω = 0 for any form ω.

196

Page 197: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

=∂(Φk,Φi)

∂uk∂ujduk duj, (8.65)

in which the underline indicates that we sum over all k, j with 1 ≤ k < j ≤ n.Just as in (8.58) we see that the actions of d and Φ∗ commute.

Note that the second order derivatives have disapperared in (8.60). Thederivation is typically done under the assumption that Φ ∈ C2, also in Ed-wards, and an additional analysis argument is needed35 to give meaning tothe results if Φ is only in C1, because the determinants in (8.65) are exactlythe determinants that showed up in (8.37) and the subsequent derivationof (8.40), where effectively dx = dx1 dx2 dx3 is first replaced by a 3-formdx1dx2dx3 pulled back to a 2-form du1du2, which in turn is replaced bydu = du1 du2 again.

The step by step generalisation to the action of d and Φ∗ on k-forms ofany order k is easily made once the reasoning above is understood. For anyk-form

ω = fi1,...,ikdxi1 · · · dxikwe have

Φ∗(dω) = d(Φ∗(ω)) (8.66)

Every such form may be written as

ω = fi1,...,ikdxi1 · · · dxik = fi1,...,ik dxi1 · · · dxik , (8.67)

where in the second expression we sum only over those i1, . . . , ik for which1 ≤ i1 < · · · < ik ≤ N. For instance

ω = fij dxidxj = (fij − fji)︸ ︷︷ ︸fij

dxidxj,

but this is not compulsory, as the examples

ω = f1 dx1 + f2 dx2 + f3 dx3

with cyclic notation for

dω = (∂f3

∂x2

− ∂f2

∂x3

)︸ ︷︷ ︸g1

dx2dx3 + (∂f1

∂x3

− ∂f3

∂x1

)︸ ︷︷ ︸g2

dx3dx1 + (∂f2

∂x1

− ∂f1

∂x2

)︸ ︷︷ ︸g3

dx1dx2

andζ = g1 dx2dx3 + g2 dx3dx1 + g3 dx1dx2

35 Using approximation arguments.

197

Page 198: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

with

dζ = (∂g1

∂x1

+∂g2

∂x2

+∂g3

∂x3

) dxdydz

in Section 8.13 show.Finally we observe that if we put the coefficients f1, f2, f3 of this ω in

a vector F = f1e1 + f2e2 + f3e3 and the coefficients g1, g2, g3 in this cyclicrepresentation of dω in a vector G = g1e1 + g2e2 + g3e3, we obtain that

G = ∇× F,

the curl of F , whereas with the coefficients of η we obtain the coefficient ofdζ as

∂g1

∂x1

+∂g2

∂x2

+∂g3

∂x3

= ∇ ·G,

the divergence of G. These appear in the Gauss divergence and the Stokescurl theorems for vectorfields in IR3 in Section 8.13 below36. The generalstatement (8.77) is also called Stokes Theorem. It has both theorems in IR3

and Green’s Theorem in IR3 as special cases.

8.13 From Gauss’ to Stokes’ Theorem

From Section 8.10 and partitions of unity arguments we have that for Ω ⊂IRN = IRn+1 open and bounded, with ∂Ω a compact (N − 1)-dimensionalC1-manifold, and in every p ∈ M , after renumbering, a local description ofΩ ∩ [a, b] given by

an+1 ≤ xn+1 < f(x1, . . . , xn) < bn+1

oran+1 < f(x1, . . . , xn) ≤ xn+1 < bn+1,

with f ∈ C1 and p ∈ (a, b), that there exists a globally defined normalvectorfield ν : ∂Ω → IRN with ν(p) pointing out of Ω in every patch asabove. For every continuously differentiable V : Ω→ IRN it now holds that∫

Ω

∇ · V =

∫∂Ω

ν · V dSN−1, (8.68)

and this statement is called the Gauss Divergence Theorem.

36 The statement that ddω = 0 corresponds to the div of a curl being always zero:

∇ · ∇ × F = 0.

198

Page 199: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

We now use the reformulation with differential forms and pullbacks offorms with Φ : IRn+1 → IRN with N > n + 1 to formulate Stokes’ Theoremfor integral n-forms over Φ(M) considered as the boundary of Φ(Ω), first forn+ 1 = 2 and N = 3. So let

ω = f1(x)dx1 + f2(x)dx2 + f3(x)dx3 (8.69)

and Φ : IR2 → IR3. Then

Φ∗(dx1) =∂Φ1

∂u1

du1 +∂Φ1

∂u2

du2; Φ∗(dx2) =∂Φ2

∂u1

du1 +∂Φ2

∂u2

du2;

Φ∗(dx3) =∂Φ3

∂u1

du1 +∂Φ3

∂u2

du2,

and with φ1 = Φ∗f1, φ2 = Φ∗f2, φ3 = Φ∗f3 we have

Φ∗(F ) = (φ1∂Φ1

∂u1

+ φ2∂Φ2

∂u1

+ φ3∂Φ3

∂u1

) du1 + (φ1∂Φ1

∂u2

+ φ2∂Φ2

∂u2

+ φ3∂Φ3

∂u2

) du2

= p1(u1, u2)du1 + p2(u1, u2)du2 = ζ,

a 1-form that can be integrated over M = ∂Ω, and to which (8.43) applies,whence∫∂Ω

ζ =

∫∂Ω

p1(u1, u2)du1 + p2(u1, u2)du2 =

∫Ω

(∂p2

∂u1

− ∂p1

∂u2

)du1du2 =

∫Ω

dζ.

(8.70)Observe that the second equality in (8.70) holds in view of (8.43), which

is a rewritten version of (8.68) with N = 2, while the first and the thirdmerely substitute ω = p1du1 + p2du2 and evaluate dω according to (8.61).

We need ∫∂Ω

ζ =

∫∂Ω

Φ∗ω =

∫Φ(∂Ω)

ω, (8.71)

and ∫Ω

dζ =

∫Ω

dΦ∗ω =

∫Ω

Φ∗(dω) =

∫φ(Ω)

dω (8.72)

to conclude for ω given by (8.69) that∫dS

ω =

∫dS

f1dx1 + f2dx2 + f3dx3 =

∫S

dω, (8.73)

in which S = Φ(Ω). It is the last equality in each of (8.71) and (8.72) thathas to be checked, the other equalities follow from our d-algebra and thecommutation of d and Φ∗.

199

Page 200: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Let us once more spell out the d-algebra by which (8.61) evaluates as

dω = (∂f1

∂x1

dx1 +∂f1

∂x2

dx2 +∂f1

∂x3

dx3)dx1

+(∂f2

∂x1

dx1 +∂f2

∂x2

dx2 +∂f2

∂x3

dx3)dx2

+(∂f3

∂x1

dx1 +∂f3

∂x2

dx2 +∂f3

∂x3

dx3)dx3 =

∂f1

∂x2

dx2dx1 +∂f2

∂x1

dx1dx2 +∂f1

∂x3

dx3dx1 +∂f3

∂x1

dx1dx3 +∂f2

∂x3

dx2 +∂f3

∂x2

dx2dx3

= (∂f2

∂x1

− ∂f1

∂x2

)dx1dx2 + (∂f3

∂x2

− ∂f2

∂x3

)dx2dx3 + (∂f1

∂x3

− ∂f3

∂x1

)dx3dx1

(∂f3

∂x2

− ∂f2

∂x3

)dx2dx3 + (∂f1

∂x3

− ∂f3

∂x1

)dx3dx1 + (∂f2

∂x1

− ∂f1

∂x2

)dx1dx2

= g1dx2dx3 + g2dx3dx1 + g3dx1dx2.

Comparing to (8.40) we recognise for F (x) = f1(x)e1 +f2(x)e2 +f3(x)e3 that∫dS

f1dx1 + f2dx2 + f3dx3 =

∫S

(∂f3

∂x2

− ∂f2

∂x3

)dx2dx3 + (∂f1

∂x3

− ∂f3

∂x1

)dx3dx1 + (∂f2

∂x1

− ∂f1

∂x2

)dx1dx2

=

∫S

G · ν =

∫S

(∇× F ) · ν, (8.74)

in which g1(x)e1 + g2(x)e2 + g3(x)e3 = G(x) = ∇ × F and ν is the normalvector on S = Φ(Ω) defined by (8.37).

It thus remains to check the two analytical statements∫∂Ω

Φ∗ω =

∫Φ(∂Ω)

ω and

∫Ω

Φ∗(dω) =

∫Φ(Ω)

dω, (8.75)

which complement the d-algebra presented above, and which are both of theform ∫

M

Φ∗ω =

∫Φ(M)

ω, (8.76)

with respectively M = ∂Ω and M = Ω. For this we need again Section 6.9.4combined with the usual localisations via partitions of unity. Not very hardbut still to be done.

200

Page 201: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

It will be convenient here to have Φ(M) described by compositions of Φand patches of M , see the remark at the end of Section 8.19. Also, we stillhave to deal with integrals over manifolds with boundaries, to obtain∫

Φ(∂Ω)

ω =

∫Φ(Ω)

dω, (8.77)

as the final result in which M = Φ(Ω) is a manifold with boundary ∂M =Φ(∂Ω), with Ω ∈ IRn as described at the beginning of this section, Φ acontinuously differentiable injective map from Ω to IRN with Jacobian matrixof rank n throughout Ω, and ω an n-form with continuously differentiablecoefficients. Generalisations to piecewise C1-boundaries then still have to bediscussed.

8.14 More exercises

LaatΩ = (x, y) ∈ IR2 : x2 + y2 < 1. (8.78)

Op ∂Ω is ν de normaalvector met componenten νx = x en νy = y in denotatie zoals in de uitleg in Sectie 8.1 en de route van (8.7) naar (8.9). Mety =

√1− x2, y = −

√1− x2, x =

√1− y2, en x = −

√1− y2 hebben we

vier grafieken van functies f zoals in (8.5) and (8.6), op te kiezen domeinen,bijvoorbeeld [−a, a] met 1√

2< a < 1 if we think in terms of (8.32), or a = 1√

2

if we think in terms of (8.34).The graph parameterisations

x→ (x,√

1− x2), x→ (x,−√

1− x2), (8.79)

y → (√

1− y2, y), y → (−√

1− y2, y)

may look uglier thanφ→ (cosφ, sinφ), (8.80)

which requires only two φ-domains, e.g. [−3π4, 3π

4] and [π

4, 7π

4] for (8.32), and

[−π2, π

2] and [π

2, 3π

2] for (8.34).

Parameterisations obtained from substitutions like y = tx in the definingequation x2 + y2 = 1 for ∂Ω are also handy: from x2 + t2x2 = 1 we have

x =1√

1 + t2; y =

t√1 + t2

and x = − 1√1 + t2

; y = − t√1 + t2

parameterising the two semicircles on the left and on the right, and likewisex = ty for the upper and lower semicircle, with t running from −∞ to +∞,and you can put

t =s

1− sor t = − s

1− s(8.81)

201

Page 202: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

in each of them to obtain.

x =1− s√

1− 2s+ 2s2; y =

s√1− 2s+ 2s2

parameterising (x, y) ∈ IR2 : x ≥ 0, y ≥ 0, x2 + y2 = 1 with s ∈ [0, 1].

Opgave 8.5. Use the t-parameterisations above to calculate the area of the unitdisk via integrals such as

∫xdy of

∫ydx over ∂Ω. You should get and evaluate

integrands37 liket2

(1 + t2)2=

1

1 + t2− 1

(1 + t2)2.

Opgave 8.6. Refering to (8.4) and the subsequent line integral notation with 1-forms, consider the form

ω = (a20x2 + a11xy + a02y

2)dx+ (b20x2 + b11xy + b02y

2)dy

and evaluate∫∂Ω ω for Ω = (x, y) ∈ IR2 : x2 + y2 < 1 with ∂Ω parameterised such

that (8.42) defines a vector pointing out of Ω.

Opgave 8.7. Same as Exercise 8.6 but with

ω = (a30x3 + a21x

2y + a12xy2 + a03y

3)dx+ (b30x3 + b21x

2y + b12xy2 + b03y

3)dy

Which coefficients disappear in the calculations? Generalise to the obvious nth ordercase.

Opgave 8.8. In physics results like (8.3) are usually taken for granted in view of thetrivial case that

Ω = (a, b) = (a1, b1)× (a2, b2)

is a rectangle parallel to the axes38. Verify directly that (8.3) holds for v : [a, b]→ IR2

continuously differentiable.

37 Recall∫∞−∞

11+t2 dt = π,

∫∞−∞

1(1+t2)2 dt = π

2 ,∫∞−∞

1(1+t2)3 dt = 3π

8 , . . .38 https://www.quora.com/What-is-the-plural-of-axis

202

Page 203: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Note that Ω in Exercise 8.8 is given by

F (x1, x2) = (x1 − a1)(x1 − b1)(x2 − a2)(x2 − b2) < 0,

which has a zero gradient in the corners of Ω, just as (8.84) for Exercise 8.10below. Here is an example without an F to define Ω.

Opgave 8.9. Suppose that the boundary of a bounded open set Ω ⊂ IR2 is given bya periodic solution of a system of differential equations x = P (x, y) and y = Q(x, y),with P,Q : IR2 → IR continuously differentiable on Ω. Show that∫∫

Ω(∂P

∂x+∂Q

∂y) dxdy = 0.

Edwards has a nice exercise about Descartes’ Folium from which I liftedthe y = tx-trick above. It allows to find the solutions of

F (x, y) = x3 + y3 − 3xy = 0, (8.82)

in the form

x = x(t) =3t

1 + t3; y = y(t) =

3t2

1 + t3, (8.83)

with t ∈ (0,∞), t ∈ (−1, 0) and t ∈ (−∞,−1) giving the smooth parts of thecurve. The origin (0, 0) is the intersection of two solution curves, one givenby (8.83) with t ∈ (−1, 1), the other by (8.83) with x and y interchanged.Exercise 2.3 in Chapter V of Edwards is about

Ω = (x, y) ∈ IR2 : x > 0, y > 0, F (x, y) = x3 + y3 − 3xy < 0. (8.84)

with ∂Ω given by (8.83) and t ∈ [0,∞). You should examine the graphs of xand y as functions of t in (8.83). You can get the area of Ω as

−∫ ∞

0

y(t)x′(t) dt =

∫ ∞0

x(t)y′(t) dt, (8.85)

or the average of the two integrals, which may turn out to be easier, usingGreen’s Theorem the way we derived it. Edwards tells you to cut the foliumalong the diagonal y = x, in which case you have the boundary consisting oftwo curves, the part described by (8.83) with 0 ≤ t ≤ 1, and the diagonalpart given by y = x = t with 0 ≤ t ≤ 3

2, which you should parameterise as

y = x = 32− t if you think about it. Still, I wonder whether Edwards actually

did the exercise:

203

Page 204: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 8.10. Substitute y = t13x in the equation for the folium to get x and

y in terms of t and evaluate (8.85) above to obtain the value 32 for the area of

(x, y) ∈ IR2 : x > 0, y > 0, x3 + y3 − 3xy < 0.

Opgave 8.11. As Exercise 8.10 but use (8.81) to get the boundary parameterisedwith 0 ≤ s ≤ 1.

In the last exercise you see that the boundary of (8.84) is actually givenby one single parameterisation with the parameter s in the unit interval [0, 1],with s = 0 and s = 1 both mapped to the origin where the condition for thelocal description as used in Section 8.1 fails. The same issue occurs in thetrivial case of Exercise 8.8.

Note that (8.84) is a special case of an obvious general question with twoparameters, these being p = 3 and n = 2 here39. Dropping the coefficient ofxy we have for general p > 2 that

x = s1

p(p−2) (1− s)p−1p(p−2) ; y = s

p−1p(p−2) (1− s)

1p(p−2) , (8.86)

parameterises the loop in the solution set of xp + yp = xy, with

xdy

ds− ydx

ds=

1

ps

1p−2−1(1− s)

1p−2−1, (8.87)

which looks much better than the individual terms xdyds

and y dxds

. With theβ-function40 defined by

B(x, y) =

∫ 1

0

sx−1(1− s)y−1 ds,

the area surrounded by [0, 1] 3 s→ (x(s), y(s)), the loop in

xp + yp = xy (8.88)

is thus equal to

Ap =1

2pB(

1

p− 2,

1

p− 2), (8.89)

which gives 16

for p = 3 and differs from Exercise 8.10 by a factor 32, consistentwith (8.83).

39 See Exercise 8.18.40 More on the β-function in [HM].

204

Page 205: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Note that in deriving (8.87) from (8.86) you may get lost if you don’tintroduce

α =1

p(p− 2)and β =

p− 1

p(p− 2)= (p− 1)α

and continue your calculations with α and β. I also suggest to write deriva-tives such as

d

dssα(1− s)β = (

α

s− β

1− s) sα(1− s)β = (α− (α + β)s) sα−1(1− s)β−1,

which will help you to factor out common factors when such expressions haveto be combined later on, as you will notice if you tackle this question: howabout the volume Vp in (x, y, z) ∈ IR3 : x ≥ 0, y ≥ 0, z ≥ 0 surroundedby xp + yp + zp = xyz when p > 3?

Opgave 8.12. Substitute y = s1px and z = t

1px in xp + yp + zp = xyz to obtain a

parameterisation of the solutions with x, y, z > 0 in the form

x = sαtα(1+s+ t)−pα, y = s(p−2)αtα(1+s+ t)−pα, z = sαt(p−2)α(1+s+ t)−pα,

and evaluate

xdydz = x(∂y

∂s

∂z

∂t− ∂y

∂t

∂z

∂s)

as xyz times a factor that you have to computer carefully, to find the correct doubleintegral in s and t that gives the desired volume. The integral is the difference of twosimilar terms each of which is st to some power times (1 + s + t) to some power.Substituting t = (1 + s)x both integrals reduce to products of single integrals thatreduce to β-functions again.

Just in case, I arrived via

xyz =(st)

1p−3

(1 + s+ t)3p−3

and1

yz(∂y

∂s

∂z

∂t− ∂y

∂t

∂z

∂s) =

1

p2(p− 3)st

(p

1 + s+ t− 1

)at

1

p(p− 3)

∫ ∞0

∫ ∞0

(st)1p−3−1 dsdt

(1 + s+ t)pp−3︸ ︷︷ ︸

S( 1p−3

, pp−3

)

− 1

p2(p− 3)

∫ ∞0

∫ ∞0

(st)1p−3−1 dsdt

(1 + s+ t)3p−3︸ ︷︷ ︸

S( 1p−3

, 3p−3

)

.

205

Page 206: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

These integrals are known. With

B(a, b) =

∫ 1

0

sa−1(1− s)b−1 ds

we have41

T (a, b) =

∫ ∞0

sa−1 ds

(1 + s)b= B(a, b− a)

and42

S(a, b) =

∫ ∞0

∫ ∞0

(st)a−1 dsdt

(1 + s+ t)b= T (a, b)T (a, b− a),

so Vp can be expressed in p via β-functions. It should lead to what we get inExercise 8.17, which is really nice43.

Opgave 8.13. How general is the y = tx-trick in IR2? Let F : IR2 → IR becontinuously differentiable, and suppose that F (x0, y0) for some (x0, y0) ∈ IR2 withx0 6= 0. Define t0 by y0 = t0x0 and apply the implicit function theorem to derivea condition that guarantees the existence of a C1-solution curve of the form t →(x(t), y(t) = (x(t), tx(t)) defined on an t-interval which has t0 as an interior point.

Don’t forget you want to have nonzero speed, which is a second condition on topof the usual condition from the the implicit function theorem. The latter conditionwill involve a simple combination of x, y, Fx, Fy in (x0, y0) with a clear (but local)geometric interpretation.

Verify that in the end the nonzero speed condition follows from x 6= 0 and thecondition from the implicit function theorem. Note that if (x0, y0) 6= (0, 0) you alwaysrealise at least one of t→ (x(t), y(t) = (x(t), tx(t)) and t→ (x(t), y(t) = (ty(t), y(t))if this condition is satisfied. Relate your results to polar coordinates.

Opgave 8.14. Verify that computing the area of (8.84) using polar coordinates iseven a bigger pain than using the y = tx-trick.

Opgave 8.15. In Exercise 8.13 you must have computed the time derivatives ofx(t) and y(t) = tx(t). Verify44 that the derivative of

y(t)

x(t)

41 Via s = t1−t , a substitution I avoided for (8.12).

42 Via t = (1 + s)τ .43 There were mistakes in an earlier version and then it did not, but now it does.44 You should have got x = − x2Fy

xFx+yFy, y = x2Fx

xFx+yFy

206

Page 207: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

is what it should be, and that the area of such a curve parameterised by t ∈ IR with(x(t), y(t)→ (0, 0) as t→ 0 and t→∞ is given by45

1

2

∫ ∞0

x(t)2 dt,

and compute again the area in Exercise 8.10 from the formula for x(t) in (8.83).

Opgave 8.16. Verify (8.89) by putting y = tx in (8.88), solve for x, and set tp = sin the integral you get from Exercise 8.15 and convert to β-functions.

Opgave 8.17. See Exercise 8.15. How would F (x, y, z) = 0 lead to

1

3

∫ ∞0

∫ ∞0

x(s, t)3 dsdt?

Hint: in relation toxp + yp + zp = xyz

and for

x = x(s, t) =

(st

1 + sp + tp

) 1p−3

this integral is equal to46

Vp =1

3p2B(

1

p− 3,

1

p− 3)B(

1

p− 3,

2

p− 3),

and you might see a pattern emerge.

Opgave 8.18. Let p > 4. The 4-dimensional measure of the bounded open set inIR4 with all coordinates positive and bounded by

xp1 + xp2 + xp3 + xp4 = x1x2x3x4

is1

4p3B(

1

p− 4,

1

p− 4)B(

1

p− 4,

2

p− 4)B(

1

p− 4,

3

p− 4),

45 Compare this to a similar formula with polar coordinates.46 Earlier mistakes have have been corrected....

207

Page 208: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

and likewise47 forn∑j=1

xpj = Πnj=1 xj

in IRn for p > n.

8.15 Cut-off functions and partitions of unity

This section explains the basic tools for cutting up functions in smaller partswhich are localised. This involves two tricks, each of which you can playwith.

The first trick concerns an open set O ⊂ IRN and a compact subset K ⊂ Owhich should be non-empty48. Then every a ∈ K is contained in an openball B centered at a such that the closed ball with the same center but twicethe radius is contained in O. We denote this larger ball by 2B. Thus wehave

K 3 a ∈ B ⊂ 2B ⊂ O.

These balls cover K and the (sequential) compactness49 of K implies that Kis covered bij finitely many of such balls, i.e.

K ⊂ B1 ∪ · · · ∪Bk ⊂ 2B1 ∪ · · · ∪ 2Bk ⊂ O.

On each such ball 2Bi we choose a smooth function ηi ∈ C∞c (2B) with0 ≤ ηi ≤ 1 and ηi ≡ 1 on Bi, and we extend these functions50 to the whole ofIRN by setting ηi ≡ 0 outside 2Bi. Then ηi ∈ C∞c (IRN) for i = 1, . . . , k and anew function χ ∈ C∞c (IRN) may be defined by51

1− χ(x) = (1− η1(x)) · · · (1− ηk(x)). (8.90)

Indeed, if x is not contained in the union of the supports of η1, . . . , ηk then allfactors in the right hand side of (8.90) are equal to 1 and hence χ(x) = 0. Onthe other hand, if x is contained in one of the balls Bi then the correspondingfactor in the right hand side of (8.90) is equal to zero making the right handside vanish whence χ(x) = 1. In particular χ(x) ≡ 1 on K. Moreover, sinceall factors take values in [0, 1] the same holds for χ(x), for any x ∈ IRN. Weconclude that

χ ∈ C∞c (O), ∀x ∈ Ω χ(x) ∈ [0, 1], ∀x ∈ K χ(x) = 1, (8.91)

47 Exponents and dimensions, another story: Chapter 17.48 The set K could be the closure of a bounded domain Ω, or its boundary.49 This characterisation of compactness was not discussed yet in these notes.50 We can use the p-norm to our liking, the choice p = 2 allows radially symmetric ηi.51 I first saw this elegant trick in Folland’s Real Analysis book.

208

Page 209: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

and this is why χ is called a cut-off function for K in O.The second trick applies the first trick to a finite collection of such sets

∅ 6= K1 ⊂ O1, . . . , ∅ 6= Km ⊂ Om with ηj ∈ C∞c (Oj) (8.92)

cut-off functions as in (8.91). We define ζj ∈ C∞c (Oj) by

ζj(x) =χj(x)

χ1(x) + · · ·+ χm(x)(8.93)

and extend ζj to IRN via ζj(x) ≡ 0 outside Oi. Note that below we don’treally use the last part of (8.91) as χj(x) > 0 for all x ∈ Ki suffices to obtainthe essential properties of the collection ζ1, . . . , ζm, which is called a partitionof unity. For every x for which one of the χj(x) > 0 it follows that

ζ1(x) + · · ·+ ζm(x) = 1. (8.94)

Certainly this holds for x in K1 ∪ · · · ∪Km. On the other hand, outside theunion of O1, . . . , Om this sum is by definition equal to zero.

Any functionf : K1 ∪ · · · ∪Km → IR

splits up via

f(x) = f1 + · · ·+ fm = ζ1(x)f(x) + · · ·+ ζm(x)f(x),

with the smaller parts fj = ζjf compactly supported in Oj, and ζj notharming any smoothness the original function f may enjoy. Adding moreKj to the collection changes the functions ζj only via (8.93), with (8.94)remaining valid.

8.16 Partitions of compact manifolds

This section was written before Section 8.18. For Ω and M = ∂Ω you canjump to the end of this section. We now apply the techniques in Section 8.15to a non-empty compact set M ⊂ IRN for which (C) in Section 6.8.1 appliesin a sense we made more precise in Section 8.18 specifying blocks [a, b] ⊂ IRN

in which the description (A) of Section 6.8.1 can be given, see (8.102). Belowwe rather choose blocks [ai, bi] ⊂ IRn, given Φi as in (8.32). Thus for eachp ∈M there exists a continuously differentiable injective

Φi : [a, b] = [a1, b1]× · · · × [an, bn]→ IRN

209

Page 210: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

with M(∂Φ∂u

) > 0 such that p ∈ Φ((a, b)) for some [a, b] ⊂ (a, b), and in some

open neighbourhood O of the compact set K = Φ([a, b]) it holds that

x ∈M ⇐⇒ x ∈ Φ((a, b)) (8.95)

We would now like to consider the sets Φ((a, b)) as open sets covering M ,so that by compactness

M ⊂ Φ1((a1, b1)) ∪ · · · ∪ Φm((am, bm)), (8.96)

for some finite collection Φj, but clearly the sets Φ((a, b)) are not open52 inIRN, unless n = N. Nevertheless such a finite subcover exists.

To see this first choose [a, b] ⊂ (a, b) with p ∈ Φ((a, b)) and a suitable openneighbourhood O of K = Φ([a, b]) with O ⊂ O to have the characterisationin (8.95) hold for all x ∈ O as well, and such that O does not intersect the(compact) image under Φ of the compact set [a, b]\(a, b). It then follows thatM ∩O ⊂ Φ((a, b)) because Φ is injective.

Varying p ∈M the open sets O cover M and by compactness there existsa finite collection O1, . . . , Om such that

M ⊂ O1 ∪ · · · ∪Om ⊂ Φ1((a1, b1)) ∪ · · · ∪ Φm((am, bm)),

which is the desired finite covering (8.96) consisting of patches.We can now put Kj = Φj([aj, bj]) and the corresponding open neigh-

bourhoods Oj of Kj in which (8.95) characterises the elements of M . Thedescription following (8.32) in Section 8.9 with unit blocks then results fromSection 8.15.

We note that we can also have our partition of unity defined using cut-offfunctions χ = χ(u) for [a, b] ⊂ (a, b), such as the blocks appearing in (8.96),but it is then slightly more complicated to formulate (8.93), because each χjis then a function of u. This allows us to deal with manifolds which are notnecessarily embedded in IRN.

Finally we observe that any Ω andM = ∂Ω as in Section 8.1 allow a choiceof functions ζ1, . . . , ζI ∈ C∞c ((ai, bi)) with 0 ≤ ζi ≤ 1 and ζ1 + · · ·+ ζI ≡ 1 ona neighbourhood of Ω such that every for every i either [ai, bi] ⊂ Ω holds, orPi = M ∩ (ai, bi) is a patch such as in Section 8.1.

8.17 Changing partitions

We still have to check that the integrals do not depend on the choice of thepartitioning functions ζ1, . . . , ζI . We observe that (8.33) defines a linear map

52 Of course they should be open in M .

210

Page 211: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

fL−→∫M

f dSn (8.97)

from X = C(M), the space of continuous real valued functions on M , to IR.Note that L is bounded in the sense that |Lf | ≤ C|f |∞ , just as in Section2.4, but we will not be using this below53.

The partition naturally defines linear subspaces

Xi = ζif : f ∈ C(M),

and the same holds for any other partition of M , given by say η1, . . . , ηJ ,which also defines a linear map

fK−→∫M

f dSn (8.98)

via (8.33), and corresponding linear subspaces Yj. Now let ζij

= ζiηj, with

i = 1, . . . , I and j = 1, . . . , J . Then

f = fI∑i=1

ζi =I∑i=1

ζif =I∑i=1

ζifJ∑j=1

ηj =I∑i=1

J∑j=1

ζiηjf, (8.99)

whence

Lf = L(I∑i=1

ζif) =I∑i=1

∫Φi

ζif dSn =I∑i=1

J∑j=1

∫Φi

ζiηjf dSn,

and likewise

Kf =J∑j=1

I∑i=1

∫Ψj

ηjζif dSn,

and thus it remains to show that∫Φi

ζiηjf dSn =

∫Ψj

ηjζif dSn (8.100)

The integral on the left is defined via (8.31) as∫Φi

ζiηjfdSn =

∫ b1

a1

· · ·∫ bn

an

ζi(Φi(u))ηj(Ψj(v))f(Φi(u))Mn(∂Φi

∂u) du1 · · · dun.

53 But we will need it to get rid of the annoying assumption Φ ∈ C2 in Section 8.12.

211

Page 212: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

It should be equal to the integral on the right which is defined via (8.31) as∫Ψj

ηjζifdSn =

∫ d1

c1

· · ·∫ dn

cn

ηj(Ψj(v))ζi(Φi(u))f(Ψj(v))Mn(∂Ψj

∂v) dv1 · · · dvn.

The coordinates v have to be expressed in u and vice versa via coordinatetransformations such as the ones in Section 8.19. These were defined inneighbourhoods of a given points p ∈ Φi((a, b)) ∩ Ψj((c, d)) only. Thereforewe need another localisation argument54 before we can apply Section 6.9.4to conclude that the two integrals are the same.

8.18 Again: local descriptions of a manifold

Let us be very precise in what we established for the local descriptions asin (A), (B) and (C) of Section 6.8.1, which correspond to (a,b,c) in III.4 ofEdwards. Writing z = (x, y) we take as a starting point that F = F (z) iscontinuously differentiable on a block

[a, b] = [a1, b1]× · · · × [an, bn]× [an+1, bn+1]× · · · × [aN, bN] ⊂ IRN

and that for some p ∈ (a, b) the derivative F ′(p) is of maximal rank. Rena-ming and relabeling the variables in z = (x, y) we can then arrange for the“partial”derivative Fy(p) to be invertible. Theorem 6.11 then implies thatthere exists (a, b) ⊂ (a, b) with p ∈ (a, b) and a continuously differentiablefunction

f : [ax, bx]→ (ay, by)

such that p = (px, py) ∈ (a, b) and

F−1(p) ∩ [a, b] = (x, f(x)) : x ∈ [ax, bx] ⊂ [ax, bx]× (ay, by), (8.101)

with subscripts indicating the x and the y-parts of p, a and b. Thus in thesmaller block [a, b] the level set of F (p) coincides with the graph of f , andin the same block [a, b] this graph then coincides with the zero-level set ofF (z) = F (x, y) = y − f(x).

As for (C), if we have, with subscripts denoting the x and the y-partsof Φ, that Φ(u) = (Φx(u),Φy(u)) is continuously differentiable on [a, b] with0 ∈ (a, b) and p = Φ(0), then via Theorem 6.12 the invertibility of Φ′x(0) issufficient for the existence of [ax, bx] with px ∈ (ax, bx) and a continuouslydifferentiable function φ : [ax, bx] → (a, b) such that Φx(φ(x)) = x for all

54 Try this one by yourself.

212

Page 213: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

x ∈ [ax, bx]. Moreover55, we can choose [ax, bx] such that φ((ax, bx)) is anopen set as the inverse image of (ax, bx) under Φx.

The function f defined by f(x) = Φy(φ(x)) now defines a graph

(x, f(x)) : x ∈ [ax, bx]

which is a subset of Φ([a, b]). If in addition Φ is injective on [a, b] then theimage under Φ of the closed bounded set [a, b]\φ((ax, bx)) is bounded andclosed, and does not contain p. Thus there exists a block [a, b] with p ∈ (a, b)such that [ax, bx] ⊂ (ax, bx) with

Φ([a, b]\φ((ax, bx))) ∩ [a, b] = ∅.

The continuity of f implies that we can restrict ax and bx a bit further toensure that f([ax, bx]) ⊂ (ay, by). We note we also have that

Φ([a, b]\φ((ax, bx))) ∩ [a, b] = ∅,

since the additional points in the larger image Φ([a, b]\φ((ax, bx))) are on thegraph of f outside [ax, bx]. Thus we have arrived from (C) to exactly thesame formulation of (A) as above starting from (B): p ∈ (a, b) and

Φ([a, b] ∩ [a, b] = (x, f(x)) : x ∈ [ax, bx] ⊂ [ax, bx]× (ay, by). (8.102)

The two statements (8.101) and (8.102) should be compared to the defi-nition Edwards gives in Section 4 of his Chapter III for M ⊂ IRN to be ann-dimensional manifold. Every p ∈M should, after relabeling and renamingin z = (x, y), be contained in an open set O in which

P = O ∩M = (x, f(x)) : x ∈ U,

with U ⊂ IRn open and f : U → IRm continuously differentiable, is calleda C1-patch of M . Of course it is then clear that U ⊃ [ax, bx] ⊃ (ax, bx) andO ⊃ [a, b] ⊃ (a, b) for some (a, b) 3 p, and thus it is completely equivalent toask that p ∈ (a, b) and

p ∈M ∩ [a, b] = (x, f(x)) : x ∈ [ax, bx] ⊂ [ax, bx]× (ay, by) (8.103)

for some closed block [a, b] with (ax, bx) 3 px, and some continuously diffe-rentiable f : [ax, bx] → (ay, by), exactly as in (8.101,8.102), the patch being

M ∩ (a, b) = (x, f(x)) : x ∈ (ax, bx) 3 p = (px, f(px)). (8.104)

In the closed N-block [a, b] there are no other points of M than the pointson the graph of f : [ax, bx]→ (ay, by).

55 See the discussion after Theorem 6.12.

213

Page 214: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

8.19 Coordinate transformations

By definition every p ∈M is in such a patch as above and typically patchesoverlap. If p is in two such patches, say with functions f and g, it may happenthat f and g are functions of the x-part of z. In that case the patches areparameterised by

u→ Φ(u) = (u, f(u)) and v → Ψ(v) = (v, g(v)) (8.105)

defined on overlapping blocks with px in the interior of the intersection ofthe blocks, which is an open block itself. The common part of M is thencontained in the intersection of the two N-blocks.

Viewing the n-tuples u and v as local coordinates on M near p, a trans-formation of these coordinates is simply given by v = u. In all other cases,we may renumber the variables of IRN to have the patches parameterised as

u→ Φ(u) = (u1, u2, f3(u1, u2), f4(u1, u2));

v → Ψ(v) = (v1, g2(v1, v3), v3, g4(v1, v3)),

with (u1, u2) and (v1, v3) in some open block in IRn, or as

u→ Φ(u) = (u1, f2(u1), f3(u1));

v → Ψ(v) = (g1(v2), v2, g3(v2)),

with u1 and v3 in some open block in IRn. Note that the first case abovecannot occur if N = n+ 1.

To rewrite Ψ in the form Φ we need the invertibility of respectively

∂g2

∂v3

and∂g1

∂v2

, (8.106)

in which case we we obtain respectively

w → Φ(w) = (w1, w2, h3(w1, w2), h4(w1, w2))

andw → Φ(w) = (w1, h2(w1), h3(w1))

as local descriptions of the Ψ-patches near p. The definition of what a ma-nifold is then implies that

Φ ≡ Φ

on an open block containing (p1, p2) in the first case and p1 in the second case.It then follows as above that u = w is a coordinate transformation just as

214

Page 215: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

u = v for (8.105) while w is obtained from v via a coordinate transformationjust as x from u in the proof of (A) from (C) above.

It thus remains to establish the invertibility of the partial Jacobian ma-trices in (8.106) in p to conclude there exists a local C1-transformation fromu to v near p. Note that these are also the conditions for solving part56 ofΦ(u) = Ψ(v) via

v1 = u1, v3 = f3(u1, u2) and u1 = v1, u2 = g2(v1, v3) (8.107)

in the first case, and

u1 = g1(v2) and v2 = f2(u1) (8.108)

in the second case. The invertiblity of the partial Jacobian matrices in (8.106)in p follows because otherwise the Ψ-patch cannot achieve all respectively(u1, u2)-directions and u1-directions that occur in the Φ-patch, contradictingthe assumption that the Ψ-patch covers all of M in its defining neighbour-hood.

The restriction to patches of the form (8.104) looks like an obvious choicefor simplicity, but may bother us later when dealing with (8.76), we’ll see.

56 All equations but the last one, which then requires some argument to hold as well.

215

Page 216: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

9 Toepassingen met een zuiver toetje

Wat bruggetjes naar hoe de natuurkundigen en scheikundigen het doen, enaan het eind wat complexe functietheorie, met de lijnintegralen alleen maarover rechte lijnstukjes. Voldoende voor de functional calculus waarmee voor zin f(z) ook iets heel anders mag worden ingevuld, bijvoorbeeld een vierkantematrix.

9.1 Integraalrekening in poolcoordinaten

Merk op dat we in het echte leven over meer verzamelingen zullen willenintegreren dan over rechthoeken. Bijvoorbeeld over heel IR2. Voor niet-negatieve functies u : IR2 → IR is∫∫

IR2

u = limR→∞

∫∫[−R,R]×[−R,R]

u(x, y)d(x, y)︸ ︷︷ ︸J(R)

= limR→∞

J(R) (9.1)

op natuurlijke manier gedefinieerd in [0,∞] als limiet van een niet-dalendefunctie R→ J(R) ≥ 0.

Er is natuurlijk geen enkele reden om een integraal over heel IR2 per seals een limiet van integralen in rechthoekige coordinaten over in dit gevalvierkanten te introduceren. Poolcoordinaten zijn vaak veel handiger. VoorRiemannsommen in poolcoordinaten ten behoeve van de rechtstreekse defi-nitie en uitwerking van∫∫

x2+y2≤R2

u(x, y)d(x, y) =

∫ 2π

0

∫ R

0

u(r cos θ, r sin θ) rdr dθ

=

∫ R

0

∫ 2π

0

u(r cos θ, r sin θ) dθ rdr (9.2)

gebruiken we

0 = r0 ≤ r1 ≤ · · · ≤ rM = R met M ∈ IN (9.3)

en0 = θ0 ≤ θ1 ≤ · · · ≤ θN = 2π met N ∈ IN, (9.4)

en tussensommen van de vorm

M∑k=1

N∑l=1

u(ρk cosφl, ρk sinφl)1

2(r2k − r2

k−1)(θl − θl−1)︸ ︷︷ ︸waarom dit dan?

=

216

Page 217: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

M∑k=1

N∑l=1

u(ρk cosφl, ρk sinφl)rk + rk−1

2︸ ︷︷ ︸ρk

(rk − rk−1)(θl − θl−1),

met tussenwaarden ρk, ρk ∈ [rk−1, rk] en φl ∈ [θl−1, θl]. De details zijn zelf inte vullen. Leuker is deze mooie toepassing van (9.2) in de volgende stellingover harmonische functies.

Opgave 9.1. Een twee keer continu differentieerbare functie (x, y) → u(x, y) =u(r cos θ, r sin θ) heet harmonisch als ∆u = 0. Laat zien dat

u(0, 0) =1

∫ 2π

0u(r cos θ, r sin θ) dθ,

en dat harmonische functies dus in elk punt het gemiddelde van hun waarden op eendiskvormige omgeving zijn. Hint: gebruik Stelling 4.34 als je de integraal van ∆u overBR hebt vertaald naar een integraal met alleen maar dθ.

Ook leuk is dat voor niet-negatieve continue functies u : IR2 → IR deintegraal ∫∫

IR2

u = limR→∞

∫∫x2+y2≤R2

u(x, y)d(x, y) (9.5)

nu net zo natuurlijk gedefinieerd is in [0,∞] als door (9.1). Alleen een wis-kundige vraagt zich dan af dit consistent is. Dat moet en dat mag hoor:

Opgave 9.2. Voor niet-negatieve continue u : IR2 → IR geldt

limR→∞

∫∫x2+y2≤R2

u(x, y)d(x, y) = limR→∞

∫∫[−R,R]×[−R,R]

u(x, y)d(x, y).

Zoek maar uit waarom en onthoud dat∫∫IR2u

op twee (eigenlijk vier) manieren is uit te rekenen als dat nodig is, zie (6.47) en (9.2).

217

Page 218: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

9.2 Integraalrekening en kansverdelingen

In de formule van Stirling, zie (5.20), stond nog een integraal die we nu netjeskunnen uitrekenen met behulp van Opgave 9.2 en de functie

(x, y)u−→ e−

12

(x2+y2)

Kort door de bocht opgeschreven concluderen we dat(∫ ∞−∞

e−12x2

dx

)2

=

∫ ∞−∞

e−12x2

dx

∫ ∞−∞

e−12y2

dy =

∫∫IR2

e−12

(x2+y2) d(x, y)

=

∫ ∞0

∫ 2π

0

e−12r2

rdθdr =

∫ ∞0

2πe−12r2

rdr = 2π[−e−12r2

]∞0 = 2π.

Opgave 9.3. Laat met Opgave 9.2 zien dat∫ ∞−∞

e−12x2dx =

√2π.

Bijgevolg hebben

f(x) =1√2πe−

12x2

en u(x, y) =1

2πe−

12

(x2+y2) (9.6)

dus de eigenschap dat ze (positief zijn en) en totale integraal gelijk aan 1hebben. We noemen zulke functies kansdichtheden. De dichtheid f(x) hoortbij een stochastische grootheid X waarvoor geldt dat de kans op uitkomstX ∈ [a, b] gelijk is aan

P (X ∈ [a, b]) =

∫ b

a

f(x) dx,

en

P (X ≤ x) =

∫ x

−∞f(s) ds

wordt de cumulatieve verdelingsfunctie van X genoemd.Een van X onafhankelijke stochastische grootheid Y kan een kansdicht-

heid g(y) hebben die beschrijft dat de kans op Y ∈ [c, d] gelijk is aan

P (Y ∈ [c, d]) =

∫ d

c

g(y) dy.

218

Page 219: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

De simultane kansdichtheid u(x, y) = f(x)g(y) geeft dan de kans opX ∈ [a, b]en Y ∈ [c, d] als ∫∫

IR2

u =

∫ b

a

f(x) dx

∫ d

c

g(y) dy.

De kansdichtheden in (9.6) worden de 1-en 2-dimensionale standaard nor-male verdeling genoemd. Is de functie g hetzelfde als de functie f in (9.6),dan zijn X en Y allebei standaard normaal verdeeld. De twee stochastischegrootheden X en Y kunnen op elkaar gedeeld worden. De kans op

Q =Y

X∈ [a, b]

is dan gelijk aan de integraal van u(x, y) over het gebied ingesloten door delijnen y = ax en y = bx.

In het geval dat X en Y standaard normaal verdeeld en onderling on-afhankelijk zijn, bestaat die integraal uit twee identieke stukken waarvan ereen gegeven wordt door

(x, y) : x ≥ 0, ax ≤ y ≤ bx,

een gebied dat in poolcoordinaten beschreven wordt door θ in een deelintervalvan (−π

2, π

2).

We willen concluderen dat

P (Q ∈ [a, b]) = 2

∫ ∞0

∫ bx

ax

1

2πe−

12

(x2+y2) dy dx

=1

π

∫ ∞0

∫ arctan b

arctan a

e−12r2

rdθdr =1

π(arctan b− arctan a) =

∫ b

a

1

π

1

1 + q2dq.

De stochastische grootheid Q heeft dan een kansdichtheid gegeven door defunctie

q → 1

π

1

1 + q2.

Opgave 9.4. Hierboven manipuleerden we met meervoudige oneigenlijke integralenover “taartpunten” in IR2. De daarvoor benodigde theorie vraagt om een uitbreidingvan de theorie van integralen over het hele vlak in poolcoordinaten. Dat kun je ookzelf proberen precies te maken nu.

219

Page 220: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

9.3 Gradient, kettingregel, coordinatentransformaties

De kettingregel generaliseert de regel in Opgave 5.10, zie ook Sectie 4.6,Opgave 5.11 en later Opgave 10.19. Met de opmerking dat (5.3) gelezenmoet worden met matrices1 is de regel met bewijs en al over te schrijven ennu meteen toepasbaar.

We spellen een en ander nu uit in het geval van coordinatentransformaties,met als belangrijk voorbeeld de overgang op poolcoordinaten die we al ge-bruikten om IC te beschrijven en in IC te rekenen: ieder punt (x, y) ∈ IR2

kunnen we viax = r cos θ en y = r sin θ (9.7)

zien als gegeven door poolcoordinaten r, θ ∈ IR voor (x, y) 6= (0, 0).Een differentieerbare scalaire functie F (x, y) van x en y is zo automatisch

ook een differentieerbare functie van r en θ. In wat volgt zien we (9.7) alstransformatie

Z : IR2 → IR2

van de onafhankelijke plaatsvariabelen, en F (x, y) = F (Z(r, θ)) als de afhan-kelijke variabele. Buiten de wiskunde, met name in de natuurkunde, is hetgebruikelijk om de afhankelijke variabele met hetzelfde symbool te noterenals alleen de onafhankelijke variabelen worden getransformeerd.

9.3.1 Gradient, divergentie en Laplaciaan

Voor F : IR2 → IR is de definitie van differentieerbaarheid in de gewonerechthoekige coordinaten x en y en h = x− x0, k = y − y0 te lezen als

F (x0 + h, y0 + k) = F (x0, y0) + ah+ bk +R(h, k;x0, y0), (9.8)

met a, b ∈ IR en

R(h, k;x0, y0)√h2 + k2

→ 0 als√h2 + k2 → 0, (9.9)

zie ook Sectie 4.6 en vergelijk met het uitpakken van (6.9) hierboven. Devolgende opgave is misschien nu wat dubbelop, maar dat kan geen enkelkwaad.

Opgave 9.5. Neem voor F : IR2 → IR, (x0, y0) ∈ IR2 en a, b ∈ IR aan dat (9.8)geldt met (9.9). Dan volgt dat

F (x0 + h, y0)− F (x0, y0)

h→ a en

F (x0, y0 + k)− F (x0, y0)

k→ b

1 Beter: lineaire afbeeldingen, in dit hele hoofdstuk de facto matrices.

220

Page 221: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

als h, k → 0. Laat dit zien.

Meerdere notaties worden gebruikt, zoals

a = Fx(x0, y0) =∂F

∂x(x0, y0) = (δxF )(x0, y0) = (D1F )(x0, y0); (9.10)

b = Fy(x0, y0) =∂F

∂y(x0, y0) = (δyF )(x0, y0) = (D2F )(x0, y0), (9.11)

waarbij (x0, y0) en haakjes vaak worden weggelaten want

a = Fx =∂F

∂x= δxF = D1F en b = Fy =

∂F

∂y= δyF = D2F

ziet er gewoon fijner uit.Als kolomvector schrijven we ook, met

ex =

(1

0

)en ey =

(0

1

), (9.12)

(a

b

)= ∇F =

∂F

∂xex +

∂F

∂yey = ex

∂F

∂x+ ey

∂F

∂y, (9.13)

de gradient van F in (x0, y0), geschreven zonder (x0, y0). Merk op dat hetlineaire gedeelte in (9.8) te schrijven is als

ah+ bk =

(a

b

)·(h

k

)=

(h

k

)·(a

b

)= h

∂F

∂x+ k

∂F

∂y, (9.14)

het inprodukt2 van ∇F en de verschilvector(hk

).

We zien dus hoe de gradient de vector is die de lineaire afbeelding DF :IR2 → IR via het inprodukt representeert als(

h

k

)DF−−→ ∇F ·

(h

k

),

maar ook dat (9.14) te lezen is als de differentiaaloperator

h∂

∂x+ k

∂ywerkend op F.

2 Het inprodukt van twee vectoren in IR2 wordt gegeven door(ab

)·(hk

)= ah+ bk.

221

Page 222: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Evenzo zien we ∇ als

∇ = ex∂

∂x+ ey

∂ywerkend op F geeft ∇F, (9.15)

een vectorwaardige differentiaaloperator.Middels het inprodukt kan ∇ ook werken op een vectorwaardige differen-

tieerbare functie

(x, y)→(Vx(x, y)

Vy(x, y)

)=

(VxVy

)= Vxex + Vyey,

en wel als

∇ · V = (ex∂

∂x+ ey

∂y) · (Vxex + Vyey) =

∂Vx∂x

+∂Vy∂y

, (9.16)

de divergentie van V .We schrijven hier nu V met subscripten3 x, y voor de x- en y-coordinaten

Vx en Vy van V t.o.v. de orthonormale vectoren (9.12) die samen de stan-daardbasis van IR2 vormen. Merk wel op dat Vx en Vy van x en y afhangenmaar ex en ey niet. De indices x en y staan voor de x-richting en de y-richting,en die richtingen zijn overal in het x, y-vlak hetzelfde.

Elk van de twee termen in ∇ werkt nu alleen op Vx en Vy, en omdat

ex · ex = ey · ey = 1 en ex · ey = ey · ex = 0, (9.17)

blijven er maar twee termen over in (9.16). Omdat ex en ey niet van x en yafhangen geeft elk van de vier termen

ex∂

∂x· Vxex, ex

∂x· Vyey, ey

∂y· Vxex, ey

∂x· Vyey

die we krijgen bij het uitwerken van (9.16) maar een term, te weten

ex∂

∂x· Vxex = ex

∂x· Vxex = ex ·

∂xVxex = ex ·

∂Vx∂x

ex =∂Vx∂x

ex · ex =∂Vx∂x

voor de eerste,

ex∂

∂x· Vyey = ex

∂x· Vyey = ex ·

∂xVyey = ex ·

∂Vx∂x

ey =∂Vx∂y

ex · ey = 0

voor de tweede, en

ey∂

∂y· Vxex = 0, ey

∂x· Vyey =

∂Vy∂y

3Niet te verwarren met het gebruik van subscripten voor partiele afgeleiden!

222

Page 223: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

voor de derde en vierde. Van de vier termen worden er dus nog twee nulvanwege ex · ey = 0 in (9.17) en de andere twee vereenvoudigen en blijven indie vorm over in (9.16).

Als V = ∇F differentieerbaar is dan volgt zo dat

∇·∇F = (ex∂

∂x+ ey

∂y) · (∂F

∂xex +

∂F

∂yey) =

∂x

∂F

∂x+

∂y

∂F

∂y= ∆F, (9.18)

de Laplaciaan van F , die weer gezien kan worden als

∆F is ∆ =∂

∂x

∂x+

∂y

∂y=

∂2

∂x2+

∂2

∂y2werkend op F. (9.19)

Omschrijven van gradient, divergentie en Laplaciaan naar poolcoordinatenis nu een nuttige oefening waarvoor de volgende subsecties van belang zijn.Het is handig om daarbij naar twee net iets anders uitgewerkte notaties voorde kettingregel te kijken, zie ook Sectie 4.6 waar dat voor t→ F (x(t), y(t) alis gedaan.

9.3.2 Kettingregel uitgeschreven voor transformaties

We weten dat we de kettingregel toe mogen passen op

(r, θ)→ (r cos θ, r sin θ) = (X(r, θ), Y (r, θ)) = (x, y)→ F (x, y) = G(r, θ),

door de lineaire benadering van

(r, θ)→ (r cos θ, r sin θ)

rond (r0, θ0) in te vullen in de lineaire benadering van

(x, y)→ F (x, y)

rond (x0, y0). We doen dit nu met h = r − r0 en k = θ − θ0, met weglatingvan (r0, θ0) in de partiele afgeleiden.

Omdat we in deze sectie F (x, y) = G(r, θ) als onbekende afhankelijkegrootheid willen zien, bijvoorbeeld de oplossing van een partiele differenti-aalvergelijking, kiezen we nu eerst voor de schrijfwijze zoals rechts in (9.14).De lineaire termen in de expansies

X(r0 + h, θ0 + k) = X(r0, θ0) + h∂X

∂r+ k

∂X

∂θ+ · · · ,

Y (r0 + h, θ0 + k) = Y (r0, θ0) + h∂Y

∂rh+ k

∂Y

∂θ+ · · ·

223

Page 224: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

moeten dan als

h = h∂X

∂r+ k

∂X

∂θen k = h

∂Y

∂r+ k

∂Y

∂θ

in (9.14) worden ingevuld4, en het resultaat

(h∂X

∂r+ k

∂X

∂θ)∂F

∂x+ (h

∂Y

∂r+ k

∂Y

∂θ)∂F

∂y=

h(∂X

∂r

∂F

∂x+∂Y

∂r

∂F

∂y) + k(

∂X

∂θ

∂F

∂x+∂Y

∂θ

∂F

∂y)

is dan volgens de kettingregel gelijk aan

h∂G

∂r+ k

∂G

∂θ.

Er volgt dus dat∂G

∂r=∂X

∂r

∂F

∂x+∂Y

∂r

∂F

∂y(9.20)

∂G

∂θ=∂X

∂θ

∂F

∂x+∂Y

∂θ

∂F

∂y, (9.21)

in vector-matrixnotatie te schrijven als(∂G∂r∂G∂θ

)=

(∂X∂r

∂F∂x

+ ∂Y∂r

∂F∂y

∂X∂θ

∂F∂x

+ ∂Y∂θ

∂F∂y

)=

(∂X∂r

∂Y∂r

∂X∂θ

∂Y∂θ

)(∂F∂x∂F∂y

), (9.22)

waarin we links een 2 bij 1 matrix zien met de partiele afgeleiden van G, enrechts net zo’n matrix voor F , en een 2 bij 2 matrix voor

(r, θ)Z−→ (X(r, θ), Y (r, θ)),

met Z : IR2 → IR2 via (9.7) gedefinieerd door

Z(r, θ) = (X(r, θ), Y (r, θ)) = (r cos θ, r sin θ).

Horizontaal worden deze matrices genummerd met de variabele groothe-den in het beeld, verticaal met die in het domein van de betreffende afbeel-ding. Precies andersom als in (6.10) dus, omdat we de schrijfwijze rechts in(9.14) hebben gebruikt. Transponeren geeft natuurlijk de vorm die consistentis met (5.3).

De kolomvectoren in (9.22) zien er uit als gradienten, maar dat is slechtsmisleidende schijn, zoals we in Sectie 9.3.4 zullen zien.

4 We gaan er nu niet echt vanuit dat de lezer al met matrices heeft leren rekenen.

224

Page 225: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

9.3.3 Kettingregel met Jacobimatrices

Mooie voorbeelden van matrixprodukten als in (6.22) zien we als we in (9.22)aan beide kanten links (h k) erbij zetten. Dan is

(h k)

(∂G∂r∂G∂θ

)= (h k)

(∂X∂r

∂Y∂r

∂X∂θ

∂Y∂θ

)(∂F∂x∂F∂y

), (9.23)

nu links en rechts uit te werken tot een 1 bij 1 matrix, met daarin preciesde twee lineaire stukken die we hierboven aan elkaar gelijkstelden bij hetuitwerken van de kettingregel, om tot (9.20) en (9.21) te komen.

Via links en rechts transponeren is (9.23) equivalent met

(∂G

∂r

∂G

∂θ)

(h

k

)= (

∂F

∂x

∂F

∂y)

(∂X∂r

∂X∂θ

∂Y∂r

∂Y∂θ

)(h

k

), (9.24)

waarin we de Jacobimatrices van G, F en Z herkennen, waarin de beeldvari-abelen niet horizontaal maar verticaal genummerd worden, zoals we in (6.10)al gezien hebben. Ook zien we dat de volgorde in (9.24) nu net is als in (5.3),hetgeen prettig is als we h en k zien als variabel.

Als F (x, y) = G(r, θ) een grootheid is met twee componenten

F1(x, y) = G1(r, θ) en F2(x, y) = G2(r, θ),

dan kan (5.3) voor beide componenten in een keer opgeschreven worden als(∂G1

∂r∂G1

∂θ∂G2

∂r∂G2

∂θ

)(h

k

)=

(∂F1

∂x∂F1

∂y

∂F2

∂x∂F2

∂y

)(∂X∂r

∂X∂θ

∂Y∂r

∂Y∂θ

)(h

k

), (9.25)

en zien we hoe de kettingregel toegepast op

IR2 Z−→ IR2 F−→ IR2

de Jacobimatrix van G produceert via het matrixprodukt van de Jacobima-trices van F en Z.

Deze notatie suggereert om de afhankelijke grootheid F (x, y) = G(r, θ)als 2-vector te zien, dus

F (x, y) =

(F1(x, y)

F2(x, y)

)en G(r, θ) =

(G1(r, θ)

G2(r, θ)

),

en dus ook x, y en r, θ als componenten van de 2-vectoren(x

y

)en

(r

θ

).

We blijven echter F = F (x, y) en G = G(r, θ) schrijven.

225

Page 226: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

9.3.4 Omschrijven van differentiaaloperatoren

De notatie (9.23) is handiger als we zoals gebruikelijk in de natuurkunde aanF (x, y) = G(r, θ) denken als een en dezelfde afhankelijke grootheid, en nietals een functie zoals gebruikelijk in de wiskunde.

In dat geval ligt het voor de hand om die grootheid af te splitsen uit de no-tatie in (9.22) en de kettingregel voor coordinatentransformaties te schrijvenals ( ∂

∂r∂∂θ

)=

(∂X∂r

∂Y∂r

∂X∂θ

∂Y∂θ

)( ∂∂x∂∂y

), (9.26)

hetgeen de matrixnotatie is voor

∂r=∂X

∂r

∂x+∂Y

∂r

∂y;

∂θ=∂X

∂θ

∂x+∂Y

∂θ

∂y,

waaruit de differentiaaloperatoren

∂xen

∂y

kunnen worden opgelost in termen van de coefficienten

∂X

∂r,∂Y

∂r,∂X

∂θ,∂Y

∂θen de differentiaaloperatoren

∂r,∂

∂θ.

Opgave 9.6. In het concrete geval van poolcoordinaten geeft dit

∂x= cos θ

∂r− sin θ

r

∂θ;

∂y= sin θ

∂r+

cos θ

r

∂θ.

Laat dit zien.

Met Opgave 9.6 zijn we nog niet klaar als we in (9.15)

∇ =

( ∂∂x∂∂y

)= ex

∂x+ ey

∂y

willen omschrijven naar r en θ. De vraag is ook hoe we ex en ey omschrijvennaar er en eθ, en daarvoor komt de vraag wat er en eθ eigenlijk zijn.

226

Page 227: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Een natuurkundige zal hier niet lang over nadenken Teken maar eenplaatje en het is evident dat Teken

plaatje!

er =

(cos θ

sin θ

)en eθ =

(− sin θ

cos θ

),

en

∇ = ex∂

∂x+ ey

∂y= er

∂r+

1

reθ∂

∂θ(9.27)

de gradient in poolcoordinaten geeft. Daar had’ie de hele kettingregel uberhauptniet voor nodig. Omdat

er · er = eθ · eθ = 1 en er · eθ = eθ · er = 0,

staan de vectoren er en eθ in ieder punt onderling loodrecht5, met elk lengte1, en wijzen in de richtingen waarin het punt (x, y) = (r cos θ, r sin θ) looptals je r respectievelijk θ varieert. De voorfactor 1

rcompenseert de met r

evenredige snelheid bij gelijkmatige toename van θ.

Opgave 9.7. In (9.27) staan twee representaties van dezelfde operator. Door ex eney in er en eθ uit te drukken en Opgave 9.6 te gebruiken kun je zien dat ze inderdaadhetzelfde zijn. Doe dat. Schrijf ook V = Vxex + Vyey om als V = Vrer + Vθeθ.

Opgave 9.8. Laat zien dat de divergentie in poolcoordinaten wordt gegeven door

∇ · V = (er∂

∂r+

1

reθ∂

∂θ) · (Vrer + Vθeθ) =

∂Vr∂r

+Vrr

+1

r

∂Vθ∂θ

.

Hint: Omdat er en eθ van θ afhangen werkt met de produktregel van Leibniz de eθ∂∂θ

in de factor links nu ook op er en eθ in de factor rechts, en een van die twee geeft nainprodukt met de voorfactor eθ een bijdrage.

Opgave 9.9. Pas de regel in Opgave 9.8 nu toe op ∇ zelf en laat zien dat

∆ = ∇ · ∇ =∂2

∂r2+

1

r

∂r︸ ︷︷ ︸∆r

+1

r2

∂2

∂θ2︸︷︷︸∆S

Hint: wellicht eerst Opgave 9.8 toepassen op ∇ als werkend op de afhankelijke groot-heid G = F , waarvoor de natuurkundige dezelfde letter gebruikt en de wiskundige dan

5 Wiskundig is dit per definitie en consistent met wat je ziet als je pijltjes tekent.

227

Page 228: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

met G(r, θ) = F (r cos θ, r cos θ) in de war raakt, omdat G en F niet dezelfde functieszijn.

In Opgave 9.9 zien we

∆ = ∆r +1

r2∆S, (9.28)

waarin ∆r de radiele Laplaciaan is, die ook werkt op functies R = R(r), en∆S de Laplace-Beltrami operator op

S = (x, y) ∈ IR2 : x2 + y2 = 1,

uitgedrukt in de hoekvariabele θ als

∆S =∂2

∂θ2.

Het aardige nu is dat de integraal van de Laplaciaan van een nette functie

u(x, y) = u(r cos θ, r sin θ)

over een disk BR met straal R > 0 in poolcoordinaten meteen tot een belang-rijke conclusie leidt, maar daarvoor moeten we eerst weten wat meervoudigeintegralen zijn.

9.4 Harmonische polynomen

We vinden deze polynomen ook als we de Laplace vergelijking

uxx + uyy = 0

voor u = u(x, y) met scheiding van variabelen in poolcoordinaten oplossendoor de operator in Opgave 9.9 los te laten op

u(x, y) = R(r)Θ(θ), (9.29)

en het resultaat gelijk aan nul te stellen. Dit geeft

0 = (∂2

∂r2+

1

r

∂r+

1

r2

∂2

∂θ2)R(r)Θ(θ)

= Θ(θ)(∂2

∂r2+

1

r

∂r)R(r) +

R(r)

r2

∂2

∂θ2Θ(θ)

228

Page 229: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

= Θ(θ)(R′′(r) +1

rR′(r)) +

R(r)

r2Θ′′(θ).

Als Θ′′ een veelvoud is van Θ, zeg

−Θ′′ = µΘ (9.30)

dan volgt Euler’s vergelijking

R′′(r) +1

rR′(r) = µ

R(r)

r2(9.31)

voor R(r).Merk op dat (9.30) gezien kan worden als een (eigenwaarde)probleem voor

−∆S = −d2

op de eenheidscirkel waar bij Θ een 2π-periodieke functie moet zijn om eenfunctie op de cirkel

S = (x, y) : x2 + y2 = 1

te definieren.

Opgave 9.10. Welke µ zijn toegestaan in (9.30) voor oplossingen (9.29) die opheel IR2 zijn gedefinieerd? Leg uit dat je die waarden ook meteen6 aan de harmoni-sche polynomen kunt zien zonder de precieze vorm van (9.30) te kennen. Schrijf dieharmonische polynomen in gescheiden variabelen r en θ als R(r)Θ(θ) en verifieer datR(r) een oplossing is van (9.31) met de bijbehorende µ.

Opgave 9.11. Voor elke N ∈ IN en a0, . . . , aN, b1, . . . , bN in IR is

a0

2+

N∑k=1

(ak cos kθ + bk sin kθ)rn

via x = r cos θ, y = r sin θ een harmonische functie. Overtuig jezelf van de juistheidvan de informele uitspraak dat deze oplossing in (0, 0) gelijk is aan zijn gemiddelde opelke disk met middelpunt (0, 0).

6 In IR3 eigenwaarden en -functies van Laplace-Beltrami operator ook via polynomen.

229

Page 230: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 9.11 suggereert

u(x, y) =a0

2+∞∑k=1

(ak cos kθ + bk sin kθ)rn

als een algemene oplossing voor de Laplacevergelijking op de eenheidsdiskmet randvoorwaarde

u(cos θ, sin θ) = f(θ) =a0

2+∞∑k=1

(ak cos kθ + bk sin kθ), (9.32)

een zogenaamde Fourierreeks7 voor een 2π-periodieke functie θ → f(θ). Ookdeze u(x, y) is dan in (x, y) = (0, 0) het gemiddelde van u(x, y) op elke diskmet middelpunt (0, 0) en straal voldoende klein, kleiner dan 1 in dit geval.

Opgave 9.12. In IR3 gebruiken we bolcoordinaten

x = r sin θ cosφ;

y = r sin θ sinφ;

z = r cos θ,

en

er = sin θ cosφ ex + sin θ sinφ ey + cos θ ez

eθ = cos θ cosφ ex + cos θ sinφ ey − sin θ ez

eφ = − sinφ ex + cosφ ey.

Schrijf er, eθ, eφ al of niet als kolomvectoren, en verifieer dat

er · er = eθ · eθ = eφ · eφ = 1; er · eθ = er · eφ = eθ · eφ = 0.

Overtuig jezelf van

∇ = er∂

∂r+

1

reθ∂

∂θ+

1

r sin θeφ

∂φ, (9.33)

en gebruik (9.33) om voor

V = Vrer + Vθeθ + Vφeφ

eerst af te leiden dat

∇ · V =∂Vr∂r

+2

rVr +

1

r(∂Vθ∂θ

+cos θ

sin θVθ +

1

sin θ

∂Vφ∂φ

),

7 Uitgebreid behandeld in de mamanotes van vorig jaar.

230

Page 231: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

en vervolgens via V = ∇F dat

∆ =∂2

∂r2+

2

r

∂r︸ ︷︷ ︸∆r

+1

r2(∂2

∂θ2+

cos θ

sin θ

∂θ+

1

sin θ

∂2

∂φ2︸ ︷︷ ︸∆S

).

Wederom zien we hier (9.9), maar nu met ∆S gedefinieerd op

S = (x, y) ∈ IR2 : x2 + y2 + z2 = 1,

De formules in IRn laten zich nu raden, afgezien wellicht van de exacte vormvan ∆S in de hoekvariabelen θ1, . . . , θn−1, maar met

∆r =∂2

∂r2+n− 1

r

∂r

voor het radiele gedeelte.

Opgave 9.13. In IR3 gebruiken we bolcoordinaten

x = r sin θ cosφ;

y = r sin θ sinφ;

z = r cos θ,

ener = sin θ cosφ ex + sin θ sinφ ey + cos θ ez

eθ = cos θ cosφ ex + cos θ sinφ ey − sin θ ez

eφ = − sinφ ex + cosφ ey.

Schrijf er, eθ, eφ al of niet als kolomvectoren en verifieer dat

er · er = eθ · eθ = eφ · eφ = 1; er · eθ = er · eφ = eθ · eφ = 0.

Overtuig jezelf van

∇ = er∂

∂r+

1

reθ∂

∂θ+

1

r sin θeθ∂

∂φ(9.34)

en gebruik (9.34) om voorV = Vrer + Vθeθ + Vφ

eerst af te leiden dat

∇V =∂Vr∂r

+2

rVr +

1

r(∂Vθ∂θ

+cos θ

sin θVθ +

1

sin θ

∂Vφ∂φ

),

231

Page 232: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

en vervolgens via V = ∇F dat

∆ =∂2

∂r2+

2

r

∂r︸ ︷︷ ︸∆r

+1

r2(∂2

∂θ2+

cos θ

sin θ

∂θ+

1

sin θ

∂2

∂φ2︸ ︷︷ ︸∆S

).

Wederom zien we hier (9.9), maar nu met ∆S gedefinieerd op

S = (x, y) ∈ IR2 : x2 + y2 + z2 = 1,

De formules in IRn laten zich nu raden, afgezien wellicht van de exacte vormvan ∆S in de hoekvariabelen θ1, . . . , θn−1, maar met

∆r =∂2

∂r2+n− 1

r

∂r

voor het radiele gedeelte.

9.5 Intermezzo: het waterstofatoom

Met

V (r) = −e2

ris de stationaire Schrodinger vergelijking voor het waterstofatoom

h2

2m∆ψ − e2

rψ = Eψ, (9.35)

waarin m de massa van het electron is, e de lading van het electron, h deconstante van Planck. De negatieve waarden van E waarvoor (9.35) eenoplossing met ∫∫∫

IR3

|ψ(x, y, z)|2 d(x, y, z) = 1

heeft zijn de energieniveaus die het electron in gebonden toestand kan aan-nemen.

We hebben gezien dat

∆ =∂2

∂r2+

2

r

∂r︸ ︷︷ ︸∆r

+1

r2(∂2

∂θ2+

cos θ

sin θ

∂θ+

1

sin θ

∂2

∂φ2︸ ︷︷ ︸∆S

).

Viaψ(x, y, z) = R(r)Pl(

x

r,y

r,z

r),

232

Page 233: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

waarin Pl(x, y, z) = Y (θ, φ) een harmonisch homogeen polynoom van graadl in x, y, z is, en een nieuwe x en n gedefinieerd door

x =1

h

√−2mE r en − E =

me4

2h2n2,

leidt dit totd2R

dx2+

2

x

dR

dx− l(l + 1)

x2R +

2n

xR = R

met R(x) ∼ xl voor x→ 0 en R(x) ∼ e−x voor x→∞.Substitueer daarom R(x) = xle−xu(x) en leidt voor u(x) af dat

d2u

dx2+ (

4l

x− 2)

du

dx= 2

n− l − 1

xu.

Opgave 9.14. Corrigeer eventuele typo’s hierboven. De machtreeksoplossing8

u(x) = 1 + a1x+ a2x2 + a3x

3 + · · ·

breekt af voor een n die van l afhangt. Welke n is dat?

9.6 Lijnintegralen over polygonen en Coursat

We beginnen met formule (4.9) uit Sectie 4.1, al of niet via de “verboden”operaties daarboven, geschreven als

F (x1)− F (x0) =

∫ 1

0

F ′((1− t)x0 + tx1)︸ ︷︷ ︸f(x(t))

(x1 − x0)dt︸ ︷︷ ︸dx

=

∫ x1

x0

f(x) dx,

waarin, met x, x(t), x0, x1, f(x) vervangen door z, z(t), z0, z1, f(z),

t→ z(t) = (1− t)z0 + tz1 (9.36)

het interval [z0, z1] parametriseert, en∫ 1

0

f(z(t))z′(t)dt =

∫ 1

0

f((1− t)z0 + tz1)dt (z1 − z0) =

∫ z1

z0

f(z) dz. (9.37)

8Instructief om eerst d2Rdx2 + 2

xdRdx = R op te lossen.

233

Page 234: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Dit is een formule die we, zonder dat (4.9) daarvoor nog nodig is, nu kun-nen lezen met z0, z1 ∈ IC en f : IC→ IC, met het linkerlid als ondubbelzinnigedefinitie van het rechterlid: de lijnintegraal∫ z1

z0

f(z) dz

over het rechte lijnstuk van z0 naar z1, van de functie z → f(z). Niet meerpraten over andere parametervoorstellingen van [z0, z1] dan (9.36), tenzij hetnodig9 is zou ik zeggen. Merk op dat [z0, z1] voor alle z0, z1 ∈ IC is gedefi-nieerd, dus [1, 0] heeft nu ook betekenis. Je moet er even aan wennen maarhet spreekt vanzelf. Het ligt voor de hand om aan z0 als het begin- en z1 alshet eindpunt van [z0, z1] te denken. Daarmee wordt [z0, z1] meer dan alleeneen verzameling: [z0, z1] is zo een georienteerd lijnstuk.

Opgave 9.15. Laat zien dat∫ z1

z0

z dz =1

2(z2

1 − z20).

Evalueer vervolgens∫ z1z0zn dz voor alle n ∈ IN.

Opgave 9.16. Evalueer∫ z1z0zn dz voor alle n ∈ −IN = −1,−2,−3, · · · . Doe

n = −1 als laatste10. Welke voorwaarde moet je leggen op z0 en z1?

Opgave 9.17. Laat zien dat

|∫ z1

z0

f(z) dz| ≤ |z0 − z1| maxz∈[z0,z1]

|f(z)|.

Integralen gedefinieerd als hierboven door (9.37) kunnen we rijgen tot eenintegraal over een polygonaal pad

z0 → z1 → · · · → zn

9 Quod non.10 De eersten zullen de laatsten zijn.

234

Page 235: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

middels∫ z1

z0

f(z) dz +

∫ z2

z1

f(z) dz + · · ·+∫ zn

zn−1

f(z) dz =

∫z0,...,zn

f(z) dz, (9.38)

als z → f(z) een continue functie

[z0, z1] ∪ · · · ∪ [zn−1, zn]f−→ IC

definieert. In het bijzondere geval dat z0 = zn is eenvoudig na te gaan dathier NUL uitkomt als n = 2.

Opgave 9.18. Ga dit na. Hint: neem eerst z0 = z2, z1 ∈ IR om te zien hoe hetmoet werken.

Wat deze opgave zegt is dat heen en weer lopen geen bijdrage aan eenketen als in (9.38) geeft omdat vrijwel per definitie∫

z0,z1,z0

f(z) dz =

∫ z1

z0

f(z) dz +

∫ z0

z1

f(z) dz = 0,

voor iedere [z0, z1]f−→ IC continu. We kunnen integralen dus vereenvoudigen

door heen en weer stukjes weg te laten, ook als die niet achter elkaar zittenin het polygonale pad.

Neem nu in je complexe vlak z0, z1, z2, not all on a line11, en neem aandat

∆ = ∆z0,z1,z2 = t0z0 + t1z1 + t2z2 : t0, t1, t2 ≥ 0, t0 + t1 + t2 = 1 f−→ IC

continu is. De verzameling ∆ bestaat dus uit alle convexe combinaties vanz0, z1, z2 gezien als punten in het complexe vlak. Dat is een driehoekige tegelwaarvan de rand een driehoek12 is. Teken

plaatje!

Laat z3, z4, z5 de middens zijn van [z0, z1], [z1, z2], [z2, z0], die je krijgt doorachtereenvolgens t2, t0, t1 nul, en steeds de andere twee t-tjes 1

2te kiezen. Dan

is ∫z0,z1,z2,z0

f(z) dz =

∫z0,z3,z5,z4,z3,z1,z4,z2,z5,z0

f(z) dz =∫z0,z3,z5,z0

f(z) dz +

∫z3,z4,z5,z3

f(z) dz +

∫z3,z1,z4,z3

f(z) dz +

∫z5,z4,z2,z5

f(z) dz.

11 Sommigen horen hierbij de stem van Erdos.12 Vereniging van 3 lijnstukjes: [z0, z1]∪ [z1, z2]∪ [z2, z0], met zo gewenst een orientatie.

235

Page 236: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

De integraal over het gesloten13 pad

z0 → z3 → z5 → z4 → z3 → z1 → z4 → z2 → z5 → z0

is zo enerzijds gelijk aan de integraal over het gesloten pad

z0 → z1 → z2 → z0

rond de grote driehoek, en anderzijds de som van vier integralen over de viergesloten paden

z0 → z3 → z5 → z0, z3 → z4 → z5 → z3,

z3 → z1 → z4 → z3, z5 → z4 → z2 → z5

rond de vier kleinere driehoeken.Als de oorspronkelijke integraal niet nul was, zeg gelijk14 aan 1, dan is

tenminste een van de vier integralen in absolute waarde minstens gelijk aan14, en kan daarna met die integraal het argument herhaald worden om een rij

geneste driehoeken

∆ = ∆z0,z1,z2 ⊃ ∆z

(1)0 ,z

(1)1 ,z

(1)2⊃ ∆

z(2)0 ,z

(2)1 ,z

(2)2⊃ ∆

z(3)0 ,z

(3)1 ,z

(3)2⊃ · · ·

te maken met

|∫z

(k)0 ,z

(k)1 ,z

(k)2 ,z

(k)0

f(z) dz| ≥ 1

4k

voor k = 0, 1, 2, 3, . . . .

Opgave 9.19. Bewijs dat de rijen z(k)0 , z

(k)1 , z

(k)2 convergeren naar een limiet in

∆z0,z1,z2 als k →∞.

Zonder beperking der algemeenheid mogen we nu wel aannemen15 datdeze limiet gelijk is aan 0, i.e.

z(k)0 , z

(k)1 , z

(k)2 → 0.

Kan het zo zijn dat f complex differentieerbaar is in 0? Zo ja, dan geldt voorz ∈ ∆ dat

f(z) = f ′(0)z +R(z)

13 Teken het in je plaatje.14 Door f(z) te delen door zijn integraal over de rand van ∆z0,z1,z2 .15 Schuif de boel anders op.

236

Page 237: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

met R(z) = o(|z|) als |z| → 0.Maar dan is∫z

(k)0 ,z

(k)1 ,z

(k)2 ,z

(k)0

f(z) dz =

∫z

(k)0 ,z

(k)1 ,z

(k)2 ,z

(k)0

f ′(0)z dz +

∫z

(k)0 ,z

(k)1 ,z

(k)2 ,z

(k)0

R(z) dz

=

∫z

(k)0 ,z

(k)1 ,z

(k)2 ,z

(k)0

R(z) dz,

omdat de eerste integraal nul is vanwege (9.15) toegepast op∫ z1z0z dz,

∫ z2z1z dz,∫ z0

z2z dz. Dus volgt

1

4k≤ |∫z

(k)0 ,z

(k)1 ,z

(k)2 ,z

(k)0

R(z) dz| ≤ |z0 − z1|+ |z1 − z2|+ |z2 − z0|2k

maxz∈δ∆(k)

|R(z)|,

waarin δ∆(k) de rand is van

∆(k) = ∆z

(k)0 ,z

(k)1 ,z

(k)2 ,z

(k)03 0.

Omdat |z| op zijn hoogste gelijk is aan de grootste afstand tussen tweepunten in ∆(k) geldt

|z| ≤ d

2kmet d = max

z,w∈∆|z − w|,

en samen met de 2k die we al hadden krijgen nu ook een bovengrens voor deintegraal, met een 4k in de noemer en een ε > 0 naar keuze in de teller:

Opgave 9.20. Gebruik (de definitie van) |R(z)| = o(|z|) als |z| → 0 om met delaatste twee ongelijkheden een tegenspraak te forceren.

Stelling 9.21. Voor iedere f : ∆z0,z1,z2 → IC die complex differentieerbaar isop de gesloten16 driehoek ∆z0,z1,z2 met hoekpunten z0, z1, z2 ∈ IC geldt dat∮

z012

f(z) dz =

∫z0,z1,z2,z0

f(z) dz = 0,

nu ook met een notatie17 die wellicht hierboven al voor de hand lag.

16 Voor w op de rand f(z) = f(w) + f ′(w)(z − w) +R(z;w) met z ∈ ∆z0,z1,z2 lezen.17 Zie het rondje door de integraalslang heen maar als driehoekje.

237

Page 238: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Eenzelfde uitspraak geldt voor iedere n-hoek (n > 3) gemaakt uit n drie-hoeken

∆w0,z0,z1 ,∆w0,z1,z2 , . . . ,∆w0,zn−1,z0 ,

met

∆w0,z0,z1 ∩∆w0,z1,z2 = [w0, z1], ∆w0,z1,z2 ∩∆w0,z2,z3 = [w0, z2],

. . .

∆w0,zn−2,zn−1 ∩∆w0,zn−1,zn = [w0, zn−1], ∆w0,zn−1,z0 ∩∆w0,z0,z1 = [w0, z0].

Als de lijnstukjes waarmee (9.38) is gemaakt de zijden zijn van zo’n door

zn = z0, . . . , zn−1 (9.39)

gemaakte n-hoek met een punt w0 in de n-hoek waarvoor alle [w0, zk] in deveelhoek liggen18, dan is∮

z0,...,zn

f(z) dz =n∑k=1

∮w0,zk−1,zk,w0

f(z) dz.

Als z → f(z) complex differentieerbaar is in elk punt van

Pz0,...,zn−1 = ∪nk=1∆w0,zk−1,zk ,

dan volgt zo dat ∮zn=z0,...,zn

f(z) dz = 0. (9.40)

Bovendien kan ieder punt zk dan met de andere punten vastgehouden naarbinnen geschoven worden naar een zk in de door (9.39) gemaakte veelhoek,waarbij (9.40) niet verandert met eenzelfde argument waarin driehoeken methoekpunten zk−1, zk, zk, zk+1 voorkomen. Kortom, (9.40) geldt voor iederecomplex differentieerbare

f : Pz0,...,zn−1 → IC

op ieder domein Pz0,...,zn−1 begrensd door lijnstukjes [zk−1, zk] ⊂ Pz0,...,zn−1 .Merk op dat we op een vanzelfsprekende manier kunnen praten over het

links- of rechtsom genummerd zijn van de hoekpunten (9.39), ook als de n-hoek niet gemaakt is zoals boven (9.39) beschreven is. Als er er (maar) eindigveel punten ζ1, . . . , ζp zijn in Pz0,...,zn−1 (maar niet op de rand van) waar f niet

18 De veelhoek is dan convex.

238

Page 239: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

complex differentieerbaar is, dan het niet moeilijk om na te gaan dat (9.40)gelijk is aan de som van de integralen over de randen van kleine driehoekjes

∆(j) = ∆z

(j)0 ,z

(j)1 ,z

(j)2 ,z

(j)0

in Pz0,...,zn−1 waar ζj echt in ligt, als die allemaal maar met dezelfde orientatiegenomen worden. In dat geval is dus∮

zn=z0,...,zn

f(z) dz =

p∑j=1

∮z

(j)2 =z

(j)0 ,z

(j)1 ,z

(j)2 ,

f(z) dz, (9.41)

en we werken dat idee in het geval dat p = 1 met een hele bijzondere integrandnu uit in de volgende sectie, teneinde uiteindelijk ook te zien dat de termenin het rechterlid van (9.41) een verrassend simpele vorm krijgen.

9.7 Machtreeksen via een Cauchy integraalformule

Neem nu aan datD = z ∈ IC : |z| < 1 f−→ IC

een complex differentieerbare functie is op de open eenheidsdisk. Neem eenζ ∈ IC met |ζ| = ρ < 1. We laten nu rechtstreeks zien dat

f(ζ) =∞∑n=0

anζn,

met integraalformules voor de coefficienten an ∈ IC. De integralen zijn daarbijover regelmatige polygonen in D, met hoekpunten dicht bij de cirkelvormige19

rand van D.We leiden de formules of door Stelling 9.21 toe te passen op integralen

van

z → f(z)− f(ζ)

z − ζover geschikt gekozen driehoeken. Voor iedere r ∈ (0, 1) en n ∈ IN met n ≥ 3definieren de punten

zk = r exp(2πik

n)

de hoekpunten van een regelmatig n-hoek Cr,n in D met middelpunt 0. Maakeen plaatje met 0 < |ζ| < r en n = 8 of zo. Laat k van 0 tot en met n lopen Teken

plaatje!om het kringetje rond20 te maken.

19 Denk aan deze contouren: http://www.fi.uu.nl/publicaties/literatuur/7244.pdf20 Nou ja, rond...

239

Page 240: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Op dezelfde manier maken

wk = ζ + ρ exp(2πik

n)

de hoekpunten van een regelmatig n-hoek ζ + Cρ,n, met middelpunt ζ datbinnen Cr,n ligt als ρ < r− |ζ|. Teken beide polygonen in je plaatje en merkop dat voor iedere complex differentieerbare functie

z ∈ D : z 6= ζ g−→ IC

nu geldt dat ∮z0−n

g(z) dz =∫z0,z1,...,zn=z0

g(z) dz =

∫w0,w1,...,wn=w0

g(z) dz (9.42)

=

∮w0−n

g(z) dz,

voor elke n ≥ 3, waarbij we ook hier de voor de hand liggende notatie21

met∮

gebruiken voor de integralen van g(z) over de linksom22 doorlopenn-hoeken.

Opgave 9.22. Bewijs (9.42) door de zigzagintegraal∫w0,z0,w1,z1,...,wn,zn

g(z) dz

mee te nemen in de beschouwingen en de stelling van Coursat toe te passen op intotaal 2n driehoekjes.

Nu nemen we voor g(z) het differentiaalquotient

f(z)− f(ζ)

z − ζ

en concluderen dat∮w0−n

f(z)− f(ζ)

z − ζdz =

∮z0−n

f(z)− f(ζ)

z − ζdz. (9.43)

21 Voor grote n is de veelhoek bijna een rondje.22 Dat is maar een woord hier, de punten bepalen de richting.

240

Page 241: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 9.23. De integraal in het linkerlid van (9.43) hangt van ρ af. Gebruik dedifferentieerbaarheid van f in ζ om te laten zien dat∮

w0−n

f(z)− f(ζ)

z − ζdz → 0

als ρ→ 0.

Maar de integraal in het linkerlid van (9.43) is gelijk aan de integraal inhet rechterlid en hing niet van ρ af als ρ < r − |ζ|. Hij ging23 dus niet naar0 want hij was al 0. Zo reduceert (9.43) tot

0 =

∮z0−n

f(z)

z − ζdz −

∮z0−n

f(ζ)

z − ζdz,

en volgt

f(ζ)

∮z0−n

1

z − ζdz =

∮z0−n

f(z)

z − ζdz.

Opgave 9.24. Laat zien dat∮z0−n

1

z − ζdz =

∮w0−n

1

z − ζdz = 2πi.

Hint: de eerste gelijkheid volgt als in Opgave 9.22 en de tweede integraal hangt nietvan ζ of ρ af. In het linkerlid kan dus ζ = 0 genomen worden. Op elke [zk−1, zk] heeft1z een primitieve: de meerwaardige functie gedefinieerd in Opgave 6.3 die je als hetgoed is in Opgave 9.16 als laatste hebt gebruikt.

Stelling 9.25. Als ζ ligt binnen een n-hoek zoals hierboven in de open een-heidsdisk D, en f : D → IC complex differentieerbaar is, dan is

f(ζ) =1

2πi

∮z0−n

f(z)

z − ζdz.

This is the Cauchy Integral Formula, maar dan met n-hoeken in plaats vande gebruikelijke cirkels met middelpunt 0 en straal r < 1 groot genoeg.

Tenslotte volgt na het invullen van24 de meetkundige reeksontwikkeling

1

z − ζ=

1

z

1

1− ζz

=1

z+

ζ

z2+ζ2

z3+ζ3

z4+ · · ·

23 Letterlijk gesproken.24 We prefereren weer de notatie met puntjes natuurlijk.

241

Page 242: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

de machtreeksontwikkeling in de vorm als aangekondigd, via

f(ζ) =1

2πi

∮z0−n

f(z)(1

z+

ζ

z2+ζ2

z3+ζ3

z4+ · · · ) dz =

1

2πi

∮z0−n

f(z)

zdz +

1

2πi

∮z0−n

f(z)

z2dz ζ +

1

2πi

∮z0−n

f(z)

z3dz ζ2 + · · · ,

met

aj =1

2πi

∮z0−n

f(z)

zj+1dz (9.44)

voor alle j ∈ IN0.

Stelling 9.26. Als f : D → IC complex differentieerbaar is, dan geldt

f(z) =∞∑j=0

anzn

met aj gegeven door (9.44), waarin de integraal nu door zk = r exp(2πi kn)

(k = 0, 1, . . . , n) wordt gedefinieerd. En achteraf zijn dan zowel r ∈ (0, 1) alsn ≥ 3 arbitrair.

Het rechtvaardigen van het verwisselen van∮

en∑

is wezen niets andersdan opmerken dat voor elke α en β in IC de verzameling

f : [α, β]→ IC : f is continu

een (complexe) Banachruimte is, net zoals C([a, b]) een reele Banachruimteis. Het wordt dus tijd voor het volgende hoofdstuk.

Voor hier is het nog de vraag of we de limiet n → ∞ willen nemen inStelling 9.25 en (9.44) teneinde de

∮te nemen over de cirkel geparametrizeerd

doorz = r exp(iθ) met dz = ir exp(iθ)dθ (9.45)

und so weiter.Dat laatste kan komen na de observatie dat voor 0 ≤ ρ < R en complex

differentieerbare

Aρ,R = z ∈ IC : ρ < |z| < R f−→ IC

geldt dat f(z) te schrijven is als een zogenaamde Laurentreeks, i.e.

f(z) =∞∑

j=−∞

ajzj =

∞∑j=0

ajzj +

∞∑j=1

a−jzj, (9.46)

242

Page 243: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

met aj gegeven door (9.44) voor alle j ∈ IZ, maar n ≥ 3 en r ∈ (ρ,R) wel zogekozen dat met de punten zk = r exp(2πi k

n) de n-hoek in de annulus Aρ,R

ligt.Je bewijst dit met drie veelhoeken in Aρ,R, waar ζ dan tussen twee van de

drie in moet liggen, en in de kleinste. Als je eenmaal op het idee25 bent geko-men wijst het zich vanzelf. De integraal over de nieuwe veelhoek wordt ookweer via een net iets andere meetkundige reeks in een machtreeks vertaald,nu met 1

ζdie naar buiten gehaald wordt uit 1

z−ζ .Deze zo verkregen spectaculaire uitspraak wordt gewoonlijk bewezen na

het invoeren van lijnintegralen over echte krommen26 zoals gegeven door(9.45) en de hele machinerie die nodig is om netjes te beschrijven wat krom-men27 eigenlijk zijn, waarbij vaak ook de continuiteit van z → f ′(z) wordtgebruikt om de nog te bespreken stellingen van Green te kunnen gebruiken.

Die laatste stellingen zijn dus hier niet nodig. En de veelhoeken bie-den veel meer mogelijkheden. Bijvoorbeeld voor functies die gedefinieerden complex differentieerbaar zijn op gebieden ingesloten door twee genesteveelhoeken. Dat is misschien nog leuk om uit te zoeken.

Opgave 9.27. Natuurlijk geldt Stelling 9.26 niet alleen voor de eenheidsdisk, en kanr zowel zo klein als zo groot mogelijk gekozen worden voor het polygon waarmee decoefficienten worden berekend. Gebruik dit om te bewijzen dat er geen niet-constantebegrensde complex differentieerbare functies f : IC→ IC zijn.

9.8 De Cauchy Integraal Transformatie

De formule in Stelling 9.25 schrijven we met 1 = I en ζ = A als

f(A) =1

2πi

∮z0−n

f(z)(zI − A)−1 dz, (9.47)

nu voor een willekeurig polygon waar A binnen ligt en waarop

z → (zI − A)−1 (9.48)

dus bestaat als zeker een continue functie. Het polygon hoeft ook niet per sein de eenheidsdisk te liggen. Van de functie z → f(z) hoeven we bij nadere

25 Gauss en Cauchy gingen ons voor.....26 Denk aan die goal van nummer 14 in het Zuiderpark en de enige echte Kromme.27 Denk ook aan hoe Murre dit woord uitspreekt.

243

Page 244: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

beschouwing alleen maar aan te nemen dat f complex differentieerbaar is ophet gebied begrensd door een polygon, inclusief het polygon28 zelf.

Let op, de hoekpunten van het polygon moeten wel “linksom” genummerdworden, hetgeen ondubbelzinnig gedefinieerd kan worden aan de hand van devergelijkingen voor de lijnen door de opeenvolgende hoekpunten, met iederezk = xk + iyk opgevat als (xk, yk) ∈ IR2, waarbij je wil formuleren dat hetbinnengebied van het polygon steeds links van ieder georienteerde interval[zk−1, zk] ligt.

Met deze notatie kunnen we (9.47) nu ook lezen lezen met A een vierkanteeerst nog reele matrix gezien als een continue lineaire afbeelding van X = IRn

naar zichzelf, afbeeldingen die een algebra29 vormen. Hier is nog het een enander mee te doen, met behulp ook van

(zI − A)−1 =1

z(I +

1

zA+ · · · )

als |z| voldoende groot is, misschien beter meteen maar voor algemene X inSectie 10.6.

De vraag is natuurlijk wel eerst wat we precies onder A binnen het polygongedefinieerd door

z0 → z1 → · · · → zn = z0

moeten verstaan, als we (9.47) zomaar overschrijven met ζ vervangen dooreen lineaire operator A : X → X. Voor de hand ligt dat A zo moet zijndat met een groter polygon de zigzagtruc weer werkt, en de integrand alsL(X)-waardige functie complex differentieerbaar is op het gebied tussen detwee polygonen, en ook op de twee polygonen zelf, en dat weer voor iedergroter polygon.

Daartoe moeten X en ook L(X) zelf eerst complex uitgebreid worden,hetgeen abstract een constructie vereist maar in voorbeelden automatisch30

gaat. En daarna is dan de natuurlijke eis dat (9.48) op het polygon en zijnbuitengebied moet bestaan in de complexe versie van L(X). Lees wat ditbetreft verder in Sectie 10.6.

9.9 Kromme lijnintegralen

Met behulp van (9.37) is in (9.38)∫z0,...,zn

f(z) dz =n∑k=1

∫ zk

zk−1

f(z) dz (9.49)

28 Via een zigzagintegraal als in Opgave 9.22 volgt de geldigheid van (9.47).29 Een Banachalgebra zelfs, zie Charlie’s teleurstelling in Flowers for Algernon.30 Denk hier even over na.

244

Page 245: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

gedefinieerd voor een rij punten die we (nog) niet als partitie zien, waarvoorwe ook (nog) niet Riemanntussensommen als

n∑k=1

f(ζk)(zk − zk−1) met ζk ∈ [zk−1, zk] (9.50)

hebben ingevoerd, zie Sectie 2.5. Maar als de “incrementen” zk − zk−1 kleinzijn ligt gezien (9.37) iedere term in (9.50) voor de hand als benadering voorde overeenkomstige term in het rechterlid van (9.49) via∫ zk

zk−1

f(z) dz =

∫ 1

0

f((1− t)zk−1 + tzk)dt (zk − zk−1) ≈ f(ζk)(zk − zk−1).

De vraag wat er gebeurt als n→∞ is echter nog niet goed gesteld, want derij “partities” kan in principe willekeurig zijn.

In iedere schatting die het limietgedrag onder controle moet krijgen zal,behalve het klein worden van de incrementen, ook het gedrag van

n∑k=1

|zk − zk−1|

een rol spelen, metzk = z

(n)k

zinvol afhankelijk van n gekozen, maar wat is zinvol? Hieronder wat overwe-gingen en een aanzet tot een uitgewerkt antwoord.

Het stuksgewijs lineaire pad Pn van z(n)0 via z

(n)1 , . . . , z

(n)n−1, naar z

(n)n voor

n → ∞ moet een nog te formuleren limietgedrag hebben, waarmee in iedergeval voor continue z → f(z) volgt dat∫

Pn

f(z) dz =n∑k=1

∫ z(n)k

z(n)k−1

f(z) dz enn∑k=1

f(ζ(n)k )(z

(n)k − z

(n)k−1) (9.51)

convergeren naar een limiet die we∫Pf(z) dz zouden willen noemen.

Voor het verschil van deze sommen geldt

|n∑k=1

∫ z(n)k

z(n)k−1

f(z) dz −n∑k=1

f(ζ(n)k )(z

(n)k − z

(n)k−1)| =

|n∑k=1

∫ 1

0

f((1− t)z(n)k−1 + tz

(n)k )dt (z

(n)k − z

(n)k−1)−

n∑k=1

f(ζ(n)k )(z

(n)k − z

(n)k−1)| ==

245

Page 246: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

|n∑k=1

∫ 1

0

(f((1− t)z(n)k−1 + tz

(n)k )− f(ζ

(n)k ))dt (z

(n)k − z

(n)k−1)| ≤

maxk=1,...,n

|f((1− t)z(n)k−1 + tz

(n)k )− f(ζ

(n)k )|

n∑k=1

|z(n)k − z

(n)k−1| ≤

maxk=1,...,n

supz,w∈[z

(n)k−1,z

(n)k ]

|f(z)− f(w)|n∑k=1

|z(n)k − z

(n)k−1|,

en dat zou klein moeten zijn als f uniform continu is op een geschikt gekozendomein dat alle paden Pn bevat. In dat geval zijn de aannames dat

µn = maxk=1,...,n

|z(n)k − z

(n)k−1| → 0 (9.52)

en

Ln =n∑k=1

|z(n)k − z

(n)k−1| begrensd (9.53)

is als n→∞ voldoende om het verschil tussen de termen in (9.51) naar 0 tedoen gaan als n→∞.

Voor we een definitie geven bekijken we wat we langs deelrijen sowiesokunnen bereiken kwa convergentie van Pn onder de aanname dat (9.52) en(9.53) gelden, en

z(n)0 = a en z(n)

n = b (9.54)

vastgehouden worden in IC. We kijken dus naar mogelijke limieten van stuks-gewijs lineaire paden van a naar b.

Het ligt voor de hand meteen een deelrij te nemen waarlangs Ln conver-gent is, zeg Lnk → L ≥ |b − a| met nk een stijgende rij in IN. Vanaf zekerezulke n is er dan steeds een eerste j = jn waarvoor geldt dat de totale lengtelangs Pn van a tot z

(n)jn

minstens L2

is, en langs een verdere deelrij convergeren

dan zowel z(n)jn

als z(n)jn−1 naar een limiet z 1

2.

Maar dit argument werkt niet alleen voor 12. Voor elke t ∈ (0, 1) kunnen

we vanaf zekere n een eerste j = jtn vinden waarvoor de totale lengte langs

Pn van a tot z(n)jtn

minstens tL is. Doen we dit voor

t =1

2,

1

4,

3

4,

1

8,

3

8,

5

8,

7

8, . . . ,

dan geeft een diagonaalrijargument31 dat, voor elke rationale t ∈ (0, 1) meteen noemer die een pure macht van 2 is, dat langs de geconstrueerde deelrijgeldt dat

z(n)jtn

31 Zie Sectie 3.3.

246

Page 247: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

convergeert naar een limiet zt voor al zulke t. Dit definieert een afbeelding

t→ z(t) = zt,

waarvoor per constructie geldt32 dat

|z(t1)− z(t2)| ≤ |t1 − t2|L, (9.55)

en die uniek uitbreidt tot een afbeelding z : [0, 1] → IC met dezelfde eigen-schap.

Onze eerste geparametrizeerde kromme die niet per se van de vorm (9.36)is. Een kromme waarvan de lengte nog niet gedefinieerd maar wel gelijkaan L is, als alles goed is33, en waarlangs we kunnen integreren, middelsbenaderingen met Riemannsommen van de vorm∑

j

f((z(τj))(z(tj)− z(tj−1).

Wat we van dit alles hier willen uitwerken is nog de vraag, maar voorcontinu differentieerbare zulke t→ z(t) is∫

P

f(z) dz =

∫ 1

0

f(z(t))z′(t) dt

een uitspraak die we willen hebben, waarbij het linkerlid gedefinieerd is als

limn→∞

∫Pn

f(z) dz

en de limiet langs de deelrij wordt genomen en moet bestaan. Dat vergt nogeen stelling voor bijvoorbeeld continue z → f(z).

32 Wel even nagaan!33 En de lengte van het stuk tussen t1 en t2 gelijk aan |t1 − t2|L.

247

Page 248: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

10 Analyse in genormeerde ruimten

We hebben het al gehad over vectorruimten van functies. In zulke vector-ruimten willen we over limieten kunnen spreken net zoals we dat doen in IR.In IR gebruiken we daarvoor absolute waarden van verschillen, in algemenevectorruimten zoeken we naar een geschikte norm waarmee we de verschillenmeten. Een eerste voorbeeld is de zogenaamde 1-norm.

Definitie 10.1. Voor iedere f ∈ RI[a, b] schrijven we

|f |1

=

∫ b

a

|f(x)| dx.

Definitie 10.2. Als X een lineaire vectorruimte over IR is, en

x ∈ X → |x|X∈ IR

een afbeelding met de eigenschap dat voor alle x, y ∈ X en voor alle λ ∈ IRgeldt dat

(i) |x|X≥ 0, |x|

X= 0 ⇐⇒ x = 0; (ii) |λx|

X= |λ| |x|

X

(iii) |x+ y|X≤ |x|

X+ |y|

X,

dan heet X genormeerd met norm | · |X

. De subscript X laten we graag weg.Een Cauchyrij in X is een door n ∈ IN genummerde rij xn ∈ X met

|xn − xm|X→ 0 als m,n→∞.

Als alle Cauchyrijen in X convergent zijn, met per definitie hun limiet inX, dan heet X volledig. Volledige ruimten worden Banachruimten genoemd.

Opgave 10.3. Geef de ε-definitie van |xn−xm|X→ 0 als m,n→∞. Geef ook de

definitie van het convergent zijn van de rij xn in X.

Opgave 10.4. Waarom is | · |1

geen norm op RI([a, b]) maar wel op C([a, b])?

De voor de liggende norm op C([a, b]) is de ∞-norm, die de limiet is vande p-normen1

|f |p =

(∫ b

a

|f(x)|p dx) 1

p

(10.1)

1 p ≥ 1.

248

Page 249: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

voor p→∞, al zie je dat aan de definitie

|f |∞ = maxx∈[a,b]

|f(x)| (10.2)

misschien niet meteen. Deze norm wordt op C([a, b]) ook wel de maximum-norm genoemd.

Stelling 10.5. Met de maximumnorm (10.2) is C([a, b]) een Banachruimte.

Bewijs. We bewijzen alleen dat C([a, b]) met de maximum norm (wel) vol-ledig is. Neem een Cauchyrij in fn in C([a, b]). Je had in Opgave 10.3 albedacht dat de uitspraak dat |fn − fm|∞ → 0 als m,n → ∞ equivalent ismet

∀ε > 0 ∃N ∈ IN : m,n ≥ N =⇒ |fn − fm|∞ ≤ ε, (10.3)

ofwel

∀ε > 0 ∃N ∈ IN : m,n ≥ N =⇒ |fn(x)− fm(x)| ≤ ε ∀x ∈ [a, b]. (10.4)

Maar dan is voor elke vast gekozen x ∈ [a, b] de rij fn(x) een Cauchyrij in IRen dus convergent met een limiet die we f(x) noemen. Daarmee is een functief : [a, b]→ IR gedefinieerd en te bewijzen is natuurlijk dat f ∈ C([a, b]).

Voor we dat doen merken we op dat in (10.4) nu de limiet m → ∞genomen kan worden waarmee de uitspraak

∀ε > 0∃N ∈ IN : n ≥ N =⇒ |fn(x)− f(x)| ≤ ε ∀x ∈ [a, b] (10.5)

zich aandient. Als nu f (en dus ook f − fn) inderdaad in C([a, b]) zit dan is(10.5) equivalent met

∀ε > 0 ∃N ∈ IN : m,n ≥ N =⇒ |fn − f |∞ ≤ ε (10.6)

en zijn we klaar.Waarom zit f in C([a, b])? Neem weer ε > 0 en probeer |f(x)− f(y)| ≤ ε

te krijgen door |x − y| ≤ δ voor een bijbehorende δ > 0 te eisen. Dat moetwel via de fn want die zijn uniform continu. Schrijf daartoe

f(x)− f(y) = f(x)− fn(x) + fn(x)− fn(y) + fn(y)− f(y),

waarmee

|f(x)− f(y)| ≤ |f(x)− fn(x)|︸ ︷︷ ︸≤ ε als n≥N

+|fn(x)− fn(y)|+ |fn(y)− f(y)|︸ ︷︷ ︸≤ ε als n≥N

. (10.7)

249

Page 250: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

In (10.7) kiezen we nu n = N en bij die vaste N een δ > 0 zodanig datvoor de middelste term geldt dat

|fN(x)− fN(y) ≤ ε als |x− y| ≤ δ,

culminerend in|f(x)− f(y) ≤ 3ε als |x− y| ≤ δ

vanwege (10.7). Hiermee is het bewijs klaar omdat ε > 0 willekeurig gekozenwas.

Opgave 10.6. De voorfactor 3 doet er niet toe. Waarom niet?

Definitie 10.7. Als de rij fn : [a, b] → IR voldoet aan (10.5) in het bewijshierboven dan heet de rij fn uniform convergent op [a, b]. In deze definitiekan [a, b] natuurlijk vervangen worden door een willekeurig interval I.

10.1 Calculus voor X-waardige functies

Als X een genormeerde ruimte is dan kunnen we voor f : [a, b] → X dedefinitie van uniform continu overschrijven met |f(x) − f(y)| in plaats van|f(x)− f(y)|, zie Definitie 2.22. Als de aardige en nuttige oefening in Sectie2.5 is gelukt dan heb je nu een bewijs van de volgende stelling.

Stelling 10.8. Laat X een Banachruimte zijn en f : [a, b] → X uniformcontinu. Dan bestaat er een unieke J ∈ X waarvoor geldt dat

|S − J | ≤ ε(b− a)

voor elke S van de vorm (2.7), mits xk − xk−1 ≤ δ voor alle k = 1, . . . ,Nwaarmee de bijbehorende partitie P in (2.4) genummerd wordt. Per definitieis

J =

∫ b

a

f(x) dx.

Dat uniforme continuıteit ook hier uit puntsgewijze continuıteit volgt is ookweer een kwestie van overschrijven.

Opgave 10.9. Als g : X → IR een lineaire functie is, hetgeen nog steeds betekentdat

g(x+ y) = g(x) + g(y) en g(λx) = λg(x) voor alle x, y ∈ X, λ ∈ IR,

250

Page 251: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

dan is x→ g(f(x)) weer een IR-waardige functie. Met een schatting van de vorm

|g(x)| ≤ L|x| voor alle x ∈ X, (10.8)

en dat voor een vaste L ≥ 0, moet uit je bewijs voor Stelling 10.8 nu volgen dat

g(J) =

∫ b

ag(f(x)) dx,

als integraal van een gewone continue IR-waardige functie op [a, b]. Verifieer dit eerstvoor L = 1. Hint: de relevante schattingen voor ondermeer de Riemannsommen bijx→ g(f(x)) zijn voor L = 1 identiek aan die voor de sommen bij f .

Definitie 10.10. Een lineaire afbeelding g : X → IR van een genormeerderuimte X naar IR heet begrensd als (10.8) geldt voor een zekere L ≥ 0.2

Opgave 10.11. Bewijs voor lineaire afbeeldingen g : X → IR van een genormeerderuimte X naar IR dat

g is uniform Lipschitz continu ⇐⇒ g is begrensd ⇐⇒ g is continu in x = 0

Bewijs ook de volgende stelling.

Stelling 10.12. Laat X∗ de verzameling van alle begrensde lineaire functiesg : X → IR zijn. Dan is X∗ met de voor de hand liggende bewerkingen en de(operator)norm

|g|op

= sup06=x∈X

|g(x)||x|

X

een Banachruimte, die de duale ruimte van X genoemd wordt. We schrijvenmeestal gewoon |g| voor |g|

open |x| voor |x|

X, maar in de formule staan drie

verschillende normen.

Voor F : [a, b] → X kunnen we de definitie van differentieerbaarheid ineen vaste x0 ∈ [a, b] overschrijven van Definitie 4.1 met de expansie

F (x0 + h) = F (x0) + hF ′(x0) +R(h;x0), (10.9)

waarin

hF ′(x0)−−−→ hF ′(x0)

2 Op IRn zijn alle lineaire functies begrensd.

251

Page 252: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

met F ′(x0) ∈ X gezien wordt als continue lineaire afbeelding en de resttermmoet voldoen aan

|R(h;x0)| = o(|h|) als h→ 0. (10.10)

Ook Stelling 4.3 kan nu met bewijs en al worden overgeschreven voor f :[a, b]→ X (uniform) continu.

Stelling 10.13. Laat X een Banachruimte zijn. Definieer voor een continuefunctie f : [a, b]→ X de functie F : [a, b]→ X door

F (x) =

∫ x

a

f(s) ds.

Dan is F differentieerbaar in elke x0 ∈ [a, b], met afgeleide F ′(x0) = f(x0).

Merk op dat in het bewijs de 3-hoeksongelijkheid voor integralen werdgebruikt. Die geldt ook hier, rechtstreeks vanuit de definities. Voor f als inStelling 10.8 geldt

|∫ b

a

f(x) dx| ≤∫ b

a

|f(x)| dx,

waarbij de continuıteit van x→ |f(x)| volgt uit

| |f(x)| − |f(y)| | ≤ |f(x)− f(y)|,

de omgekeerde3 3-hoeksongelijkheid toegepast op f(x) en f(y).Stelling 10.13 zegt weer dat F een primitieve is van kleine f en voor deze

primitieve geldt met x = b dat∫ b

a

f(s) ds = F (b)− F (a), (10.11)

omdat F (a) = 0. Als F een andere primitieve is van f dan geldt voor

G = F − F : [a, b]→ X

dat G differentieerbaar is met G′(x) = 0 voor alle x ∈ [a, b].

Opgave 10.14. Laat zien dat voor elke g ∈ X∗ de reeelwaardige functie

xφ−→ g(G(x))

3 Onthouden als x→ |x| is uniform Lipschitz continu met Lipschitz constante L = 1.

252

Page 253: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

nu differentieerbaar is op [a, b] met afgeleide in iedere x ∈ [a, b] gedefinieerd door

hφ′(x)−−−→ g(G(x))G′(x)h = 0

voor h ∈ IR. Dus φ(b) = φ(a) via de middelwaardestelling (Stelling 4.5).

We concluderen hieruit dat g(G(b))−g(G(a)) = 0 voor elke g ∈ X∗. Voory = G(b) − G(a) geldt dus dat g(y) = 0 voor alle g ∈ X∗. We zeggen datde continue lineaire functies de punten in X scheiden als dit impliceert daty = 0. In dat geval zijn we klaar want dan is F (b) − F (a) = F (b) − F (a).Hiermee is de volgende stelling bewezen, waarin we F weer F noemen.

Stelling 10.15. Laat X een Banachruimte zijn waarop de continue lineairefuncties de punten scheiden4. Als f : [a, b] → X continu is op [a, b] en decontinue differentieerbare functie F : [a, b]→ X als primitieve heeft5, dan is∫ b

a

f(s) ds = F (b)− F (a).

10.2 Differentiaalrekening voor functies op X

Ook als X een genormeerde ruimte is en

F : X → IR

een reeelwaardige functie6 op X, dan kunnen we de definitie van differenti-eerbaarheid in een vaste x0 ∈ X overschrijven van Definitie 4.1, beginnendemet de expansie

F (x0 + h) = F (x0) + F ′(x0)(h) +R(h;x0), (10.12)

waarinF ′(x0) : X → IR

lineair is en de restterm moet voldoen aan

|R(x0, h)| = o(|h|) als |h| → 0. (10.13)

Definitie 10.16. Een functie F : X → IR op een genormeerde ruimte heetdifferentieerbaar in x0 ∈ X als er een g = F ′(x0) : X → IR in X∗ bestaat7

zodanig dat (10.12) geldt met (10.13).4 Op Banachruimten scheiden de continue lineaire functies de punten (Hahn-Banach).5 Hetgeen ook hier betekent dat F ′(x) = f(x) voor alle x ∈ [a, b].6 Iedere F : A→ IR met A ⊂ X breidt uit tot F : X → IR via F (x) = 0 voor x 6∈ A.7 Let op, de continuiteit van de lineaire F ′(x0) : X → IR is essentieel: Opgave 10.17!

253

Page 254: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 10.17. Als een reeelwaardige F : X → IR op een genormeerde ruimtedifferentieerbaar in x0 ∈ X dan is F ook continu in x0. Bewijs dit.

Opgave 10.18. Formuleer en bewijs de regel van Leibniz voor F,G : X → IR. Hint:schrijf Opgave 5.7 en je uitwerking van die opgave over met normstrepen in plaats vanabsolute waarde strepen.

Ook van F ′ : X → X∗ willen we kunnen zeggen of F ′ differentieerbaar isin een x0 ∈ X en daartoe schrijven we Definitie 10.16 over voor F : X → Yals X en Y genormeerde ruimten zijn.

Een search op → IR en replace by → Y dus, waarbij absolute waardestrepen in IR weer vervangen worden door normstrepen voor de norm in Y , enF ′(x0) ∈ X∗ moet worden vervangen door F ′(x0) ∈ L(X, Y ), de genormeerderuimte van lineaire afbeeldingen A : X → Y waarvoor |Ax|

Y≤ |A|

op|x|

X

voor alle x ∈ X, nu met de norm van Ax in Y , en |A|op

weer de kleinsteconstante M waarvoor |Ax|

Y≤ M |x|

Xvoor alle x ∈ X. Met Y = X∗

hebben we dan ook de definitie van twee keer differentieerbaar, enzovoorts.Zonder extra algebraische structuur is de Leibnizregel niet meer zo maar

over te schrijven, maar de kettingregel gaat weer precies hetzelfde.

Opgave 10.19. Schrijf Opgaven 5.10 en 5.11 en je uitwerking over voor F : X → Yen G : Y → Z met X,Y, Z genormeerde ruimten.

Kortom, veel van de gewone differentiaalrekening is precies hetzelfde in dealgemene context. Belangrijke uitzonderingen zijn de middelwaardestelling(Stelling 4.5) en de inverse functiestelling zoals geformuleerd voor monotonefuncties. Beide stellingen maken echt gebruikt gebruik van de 1-dimensionalestructuur die IR heeft en de bijbehorende argumenten waarin het woordje“tussen” essentieel is.

De middelwaardestelling kan echter wel mooi in stelling gebracht wordenvoor

F : X → IR,

door voor twee punten x, y ∈ X een functie t → ξ(t) ∈ X te introducerendie x en y met elkaar “verbindt”, bijvoorbeeld

ξ(t) = (1− t)x+ ty, ξ : [0, 1]→ X, (10.14)

254

Page 255: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

waarbij we spreken over het interval

[x, y] = ξ(t) = (1− t)x+ ty; 0 ≤ t ≤ 1, (10.15)

de door t ∈ [0, 1] geparametrizeerde convexe combinaties van x en y, en ookover het interval

(x, y) = ξ(t) = (1− t)x+ ty; 0 < t < 1. (10.16)

Stelling 10.20. Als F : X → IR differentieerbaar is op X, dan is er voorelke x, y ∈ X een ξ ∈ (x, y) waarvoor geldt dat

F (y)− F (x) = F ′(ξ)(y − x).

Bewijs. Volgens de kettingregel is φ : [0, 1]→ IR gedefinieerd door

tφ−→ F (ξ(t)) ∈ IR (10.17)

differentieerbaar op [0, 1], met

φ′(t) = F ′(ξ(t))(y − x).

De middelwaardestelling (Stelling 4.5) geeft nu een τ ∈ (0, 1) waarvoor geldtdat φ(1)− φ(0) = φ′(τ). Noem ξ(τ) nu ξ en het bewijs is klaar.

Neem nu een willekeurige Banachruimte Y en F : X → Y continu dif-ferentieerbaar. Als we Stelling 10.15 toepassen met a = 0 en b = 1 op defunctie φ : [0, 1]→ Y gedefinieerd door (10.17), dan volgt uit

φ(1)− φ(0) =

∫ 1

0

φ′(t) dt

enφ′(t) = F ′((1− t)x+ ty)(y − x)

dat

F (y)− F (x) =

∫ 1

0

F ′((1− t)x+ ty)(y − x) dt (10.18)

als Y -waardige integraal.In het geval dat Y = IR wordt deze IR-waardige integraal begrensd door

het maximum en het minimum van de integrand, en dus volgt dat F (y) −F (x) = F ′(ξ)(y − x) voor een zekere

ξ ∈ [x, y] = (1− t)x+ ty, 0 ≤ t ≤ 1,

255

Page 256: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

een iets zwakkere uitspraak dan in Stelling 10.20.Als F niet IR-waardig maar Y -waardig dan werkt dit argument niet.

Echter, als we Stelling 10.15 toepassen met a = 0 en b = 1 op de functieφ : [0, 1]→ Y gedefinieerd door

φ : tξ−→ (1− t)x+ ty

F−→ Y

met x, y ∈ X en F : X → Y continu differentieerbaar, dan volgt uit

φ(1)− φ(0) =

∫ 1

0

φ′(t) dt

enφ′(t) = F ′((1− t)x+ ty)(y − x)

dat

F (y)− F (x) =

∫ 1

0

F ′((1− t)x+ ty)(y − x) dt (10.19)

als Y -waardige integraal, hetgeen ook te schrijven is als

F (y)− F (x) =

∫ 1

0

F ′((1− t)x+ ty) dt(y − x), (10.20)

een B(X, Y )-waardige integraal werkend op y − x ∈ X.Vanwaar al deze uitwijdingen? Omdat formulering en bewijs van de im-

pliciete functiestelling voor F : X × Y → Z nu kunnen worden overgeschre-ven van Stelling 4.24 in Sectie 4.4. Speciaal geval Z = Y . Nog specialer:X = IRm en Y = Z = IRn. Ook interessant: X = IR en Y = Z = C([a, b]).Denk aan Sectie 10.5.

10.3 Partieel differentieerbaar =⇒ ?

We hebben gezien dat F : IR2 differentieerbaar is in x0, y0 als er a, b ∈ IRbestaan zo dat (9.8) geldt en de restterm voldoet aan de conditie onder (9.8).In dat geval bestaan de partiele afgeleiden

a = (∂F

∂x)(x0, y0) = Fx(x0, y0) en b = (

∂F

∂y)(x0, y0) = Fx(x0, y0),

en leest (9.8) met x = x0 + h en y = y0 + k als

F (x, y) = F (x0, y0) + Fx(x0, y0)(x− x0) + Fy(x0, y0)(y − y0) + restterm.

256

Page 257: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

We gebruiken de subscripts hier dus weer voor de partiele afgeleiden diewe in Opgave 9.5 gevonden hebben voor a en b als

a = Fx(x0, y0) = limh→0

F (x0 + h, y0)− F (x0, y0)

h= lim

x→x0

F (x, y0)− F (x0, y0)

x− x0

,

b = Fy(x0, y0) = limk→0

F (x0, y0 + k)− F (x0, y0)

k= lim

y→y0

F (x0, y)− F (x0, y0)

y − y0

,

door de eigenschap van de restterm te gebruiken.Het kan natuurlijk zijn dat voor een gegeven F : IR2 → IR en x0 ∈ IR

en y0 ∈ IR de partiele afgeleiden Fx(x0, y0) en Fy(x0, y0) zo bestaan als tweelimieten, maar op zich zegt dat weinig. Als bijvoorbeeld F : IR2 → IRgedefinieerd is door F (x, y) = 0 als xy = 0 en F (x, y) = 1 als xy 6= 0 dan isFx(0, 0) = Fy(0, 0) = 0, maar F is zeker niet differentieerbaar in (0, 0), wantde lineaire benadering zou dan de nulfunctie zijn en die komt voor xy 6= 0niet de buurt van de functiewaarde 1.

Dus wat hebben we nodig van x→ F (x, y) en y → F (x, y) als we alleendeze “partiele” functies mogen gebruiken om te kunnen concluderen dat

F : IR× IR→ IR

differentieerbaar is in (x0, y0)? We denken bij deze vraag aan het algemeneregeval van

F : X × Y → IR,

en x0 ∈ X, y0 ∈ Y , en nemen aan dat x → F (x, y) en y → F (x, y) voorrespectievelijk vaste y ∈ Bδ(y0) en vaste x ∈ Bδ(x0) differentieerbaar8 zijnop respectievelijk Bδ(x0) en Bδ(y0), met δ0 > 0 vast.

Via de middelwaardestelling (Stelling 10.20) voor functies van genor-meerde ruimten naar IR is

F (x, y) = F (x0, y0) + F (x, y)− F (x0, y0) =

F (x0, y0) + F (x, y)− F (x0, y)︸ ︷︷ ︸vary x

+F (x0, y)− F (x0, y0)︸ ︷︷ ︸vary x

=

F (x0, y0) + Fx(ξ(y), y)(x− x0) + Fy(x0, η)(y − y0),

voor x ∈ Bδ(x0) en y ∈ Bδ(y0) met ξ(y) ∈ (x0, x) en η ∈ (y0, y). Bijgevolg is

F (x, y) = F (x0, y0) + Fx(x0, y0)(x− x0) + Fy(x0, y0)(y − y0) +R (10.21)

8 We gebruiken van y → F (x, y) alleen maar de differentieerbaarheid voor y = y0.

257

Page 258: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

met restterm

R = (Fx(ξ(y), y)− Fx(x0, y0))(x− x0) + (Fy(x0, η)− Fy(x0, y0))(y − y0).

Als(x, y)→ Fx(x, y) en y → Fy(x0, y)

continu zijn in respectievelijk (x0, y0) en y0 dan voldoet R nu aan

|R| ≤ |(Fx(ξ(y), y)−Fx(x0, y0))(x−x0)|+ |(Fy(x0, η)−Fy(x0, y0))(y− y0)| ≤

|Fx(ξ(y), y)− Fx(x0, y0)|︸ ︷︷ ︸≤ε

|x− x0|+ |Fy(x0, η)− Fy(x0, y0)|︸ ︷︷ ︸≤ε

|y − y0)|

≤ εmax(|x− x0|, |y − y0|) = ε |(x, y)− (x0, y0)|als δ > 0 voldoende klein is. We gebruiken hier als norm op X × Y de norm

|(x, y)| = max(|x|, |y|).

We onthouden dit resultaat als de volgende stelling waarin we de milderevoorwaarde van continuiteit van y → Fy(x0, y) vervangen door de voor dehand liggende sterkere voorwaarde op (x, y)→ Fy(x0, y).

Stelling 10.21. Laat X en Y genormeerde ruimten zijn. Als F : X×Y → IRpartiele functies

x→ F (x, y) en y → F (x, y)

heeft die voor x ∈ Bδ(x0) en y ∈ Bδ(y0) met x0 ∈ X, y0 ∈ Y, δ > 0 gedefini-eerd en differentieerbaar zijn, met

(x, y)→ Fx(x, y) ∈ X∗ en (x, y)→ Fy(x, y) ∈ Y ∗

continu in (x0, y0), dan is F differentieerbaar in (x0, y0), met F ′(x0, y0) ge-definieerd door

(h, k)F ′(x0,y0)−−−−−→ Fx(x0, y0)h+ Fy(x0, y0)k.

Opgave 10.22. De karakterisatie van F ′(x0, y0) wekt natuurlijk geen verbazing.Als F : X × Y differentieerbaar is in (x0, y0) dan zijn zowel x → F (x, y0) als y →F (x0, y) differentieerbaar in respectievelijk x0 en y0 en hun afgeleiden heten de partieleafgeleiden, notatie o.a. Fx(x0, y0), Fy(x0, y0). Verifieer dit rechtstreeks aan de handvan de definities, en ook dat

F ′(x0, y0)

(h

k

)= Fx(x0, y0)h+ Fy(x0, y0)k

voor alle h ∈ X en k ∈ Y .

258

Page 259: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 10.23. Als X, Y , Z genormeerde ruimten zijn en F : X × Y → Z danwerkt de bewijstechniek met de middelwaardestelling niet. Schrijf echter weer

F (x, y) = F (x0, y0) + F (x, y)− F (x0, y)︸ ︷︷ ︸vary x

+F (x0, y)− F (x0, y0)︸ ︷︷ ︸vary x

en behandel de twee varierende termen met (10.18), waarbij je moet aannemen datZ volledig is. Neem hiertoe aan dat x → F (x, y0) continu differentieerbaar is voorx ∈ X met |x − x0| < δx, en dat voor elke van deze x de functie y → F (x, y)continu differentieerbaar is voor y ∈ Y met |y−y0| < δy, δx, δy > 0, en bovendien dat(x, y)→ Fy(x, y) continu is in (x0, y0). Bewijs dat F differentieerbaar is in (x0, y0).

Opgave 10.24. Als X, Y , Z genormeerde ruimten zijn, met Z volledig, en F :X × Y → Z heeft partiele functies met partiele afgeleiden Fx en Fy die continu zijnop een open verzameling O in X × Y , dan is F differentieerbaar in elk punt van Oen F ′ : O → L(X × Y,Z) is continu, gedefinieerd in elke (x0, y0) ∈ O als in Opgave10.22.

10.4 Differentiaal- en integraalvergelijkingen

Terug naar functies van t ∈ IR naar x ∈ IR. In (5.15) is de differentiaalver-gelijking die de functie exp definieert omgeschreven tot integraalvergelijking.Vanaf hier kiezen we zo veel mogelijk voor de t van tijd als onafhankelijkevariabele in de differentiaalvergelijkingen onder consideratie, en voor x alsde afhankelijke variabele. Daarbij we spreken over x = x(t) als de oplossing,en de lezer wordt gevraagd deze “abuse of notation” voor lief te nemen. Dusx = x(t) voor t ∈ I is een verkorte schrijfwijze om een functie x : I → IR aante duiden.

Bijvoorbeeld x(t) = exp(t), de unieke oplossing van

x′ = x met x(0) = 1 op I = IR,

een probleem van de vorm

x′(t) = f(x(t)) voor alle t ∈ I met x(0) = ξ. (10.22)

Merk op dat een oplossing van (10.22) per definitie differentieerbaar is op Ien dus continu.

Voor iedere f : IR → IR en ξ ∈ IR is (10.22) een probleem om op telossen voor t in een liefst maximaal interval I, met 0 ∈ I omdat anders de

259

Page 260: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

voorwaarde x(0) = ξ geen betekenis heeft. We beperken ons hier nu totdifferentiaalvergelijkingen waarin de onafhankelijke variabele t niet explicietvoorkomt. Dus x′(t) = f(x(t)) en niet x′(t) = f(t, x(t)).

Zulke differentiaalvergelijkingen hebben de eigenschap dat een horizontaalverschoven grafiek van een oplossing in het t, x-vlak weer de grafiek van eenoplossing is. Met een oplossing heb je er dankzij deze translatie-variantie dusmeteen een heleboel en soms zelfs allemaal (als f geen nulpunten heeft).

Opgave 10.25. Teken in het x, y-vlak een grafiek y = f(x) van een mooie functief met een paar nulpunten en gebruik de informatie uit die grafiek om grafieken vanoplossingen in t, x-vlak te schetsen. Hint: schets eerst de grafieken van de constanteoplossingen.

Onder de aanname dat f continu is op IR is (10.22) equivalent met

x(t) = ξ +

∫ t

0

f(x(s)) ds voor alle t ∈ I. (10.23)

Opgave 10.26. Bewijs de equivalentie van (10.22) en (10.23) voor continue f :IR→ IR en ξ ∈ IR gebruikmakend van de integraal- en differentiaalrekening ontwikkeldtot nu toe.

Opgave 10.27. Dezelfde vraag (met f : IR→ IR continu en ξ, η ∈ IR) voor

x′′ = f(x) met x(0) = ξ en x′(0) = η

en de integraalvergelijking die je krijgt door twee keer te integreren. Hint: gebruik jeuitwerking van Opgave 4.36 om de herhaalde integraal om te schrijven tot een enkeleintegraal.

Om een oplossing van (10.23) te maken kunnen we eerst a, b ∈ IR kiezenmet 0 ∈ [a, b] ⊂ I en (10.23) herschrijven als een vergelijking

x = ξ + Φ(x), (10.24)

voor x ∈ C([a, b]), met Φ : C([a, b])→ C([a, b]) gedefinieerd door

(Φ(x))(t) =

∫ t

0

f(x(s)) ds, (10.25)

260

Page 261: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

een formulevoorschrift voor de “nieuwe” functie Φ(x) ∈ C([a, b]) gegeven de“oude” functie x ∈ C([a, b]).

In (10.24) is ξ nu te lezen als een constante functie x0 : t→ ξ en met hetschema

xn+1 = ξ + Φ(xn) (n ∈ IN0) (10.26)

ontstaat dan een rij xn in C([a, b]) waarvan we nu willen weten of deze viazijn limiet een unieke oplossing van (10.23) definieert. De vraag nu is onderwelke aannames op f en [a, b] dit lukt. Om dat te onderzoeken nemen weeerst zonder beperking der algemeenheid ξ = 0.

In wat volgt vermijden we notationeel gepriegel met bovengrenzen t diekleiner zijn dan de ondergrens 0 in (10.25), door de afbeelding Φ te bekijkenop X = C([0, T ]). Vaste punten van Φ zijn dan oplossingen van (10.23) metξ = 0 en daarmee van (10.22). Oplossingen van (het beginwaardeprobleem)

x′(t) = f(x(t)) voor t ∈ [0, T ] en x(0) = 0

corresponderen dus met vaste punten van Φ : X → X. En voor het vindenvan zulke “dekpunten” is er een stelling die iedereen die wiskunde doceertgezien moet hebben9.

Stelling 10.28. Laat X een Banachruimte zijn. Als Φ : X → X een afbeel-ding is die voor een vaste θ ∈ [0, 1) voldoet aan

|Φ(x)− Φ(y)| ≤ θ|x− y| ∀x, y ∈ X,

dan heeft Φ een uniek vast punt x = Φ(x) ∈ X. Gegeven iedere x0 ∈ X geldtvoor de rij gedefinieerd door xn = Φ(xn−1) voor alle n ∈ IN dat xn → x alsn→∞.

Bewijs. Dat Φ geen twee vaste punten kan hebben volgt meteen uit de aan-name. Gegeven een willekeurige x0 en x1 = Φ(x0) volgt ook uit de aannamedat

|x2 − x1| = |Φ(x1)− Φ(x0)| ≤ θ|x1 − x0|,

|x3 − x2| = |Φ(x2)− Φ(x1)| ≤ θ|x2 − x1| ≤ θ2|x1 − x0|,

etc. Voor de incrementen geldt dus dat10

|xn+1 − xn| ≤ θn|x1 − x0|, (10.27)

9 We hebben deze stelling al een keer niet gebruikt toen het wel kon. In welke bewijs?10 Eigenlijk moet dit weer met inductie......

261

Page 262: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

en dus volgt

∞∑n=0

|xn+1 − xn| ≤∞∑n=0

θn|x1 − x0| = |x1 − x0|∞∑n=0

θn = |x1 − x0|1

1− θ.

De reeks∞∑n=0

(xn+1 − xn)

is dus convergent met een limiet S ∈ X vanwege de uitspraak in Opgave10.29 hieronder.

Omdat

xN+1 = x0 +N∑n=0

(xn+1 − xn)

volgt datxN+1 = Φ(xN)→ x0 + S als N→∞.

Met x = x0 + S hebben we de limiet van de rij xn dus te pakken en omdat

|Φ(x)− x| ≤ |Φ(x)− Φ(xn)|+ |Φ(xn)− xn|+ |xn − x|

≤ |xn+1 − xn|+ 2|xn − x| → 0

is x een vast punt van Φ. Daarmee is het bewijs klaar.

Opgave 10.29. Laat X een Banachruimte zijn en an ∈ X voor n ∈ IN0. Schrijf11

het bewijs van het convergent zijn van absoluut convergente reeksen in IR over metnormstrepen i.p.v. absolute waarde strepen en bewijs zo dat

∞∑n=0

|an| <∞ =⇒∞∑n=0

an bestaat en |∞∑n=0

an| ≤∞∑n=0

|an|.

Opgave 10.30. Neem aan dat f : IR → IR uniform Lipschitz continu is metLipschitz constante L > 0. Dus

|f(x)− f(y)| ≤ L|x− y| ∀x, y ∈ IR.

Bewijs dat Φ in (10.25) voldoet aan

|Φ(x)− Φ(y)|∞ ≤ LT |x− y|∞ ∀x, y ∈ X = C([0, T ]).

11 Zie Stelling 3.18.

262

Page 263: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Stelling 10.31. Neem aan dat f : IR→ IR uniform Lipschitz continu is, endat ξ ∈ IR. Dan heeft de differentiaalvergelijking

x′(t) = f(x(t))

precies een oplossing met x(0) = ξ. Die oplossing is gedefinieerd voor allet ∈ IR.

Bewijs. Met ξ = 0 volgt het bestaan van een unieke oplossing op [0, T ] viaOpgave 10.26, Stelling 10.28 en Opgave 10.30 onder de aanname dat LT < 1.

Voor ξ 6= 0 is het bewijs precies hetzelfde, niet alleen op [0, T ] maar ookop [−T, 0], of in een keer op [−T, T ]. Maar vanwege de translatie-invariantiegeldt dit ook voor oplossingen met x(T ) = η ∈ IR op [T, 2T ].

Kies nu η = x(T ) met x de oplossing die we al hadden op [0, T ]. Dit geefteen oplossing op [T, 2T ] met x(0) = ξ. Enzovoort. Stap voor stap, naar linksen naar rechts, steeds met dezelfde stapgrootte T , breiden we de oplossingzo uit tot uiteindelijk heel IR en het bewijs is klaar.

Opgave 10.32. Neem aan dat f : IR→ IR uniform Lipschitz continu is en τ, ξ ∈ IRwillekeurig. Als we de unieke oplossing van x′(t) = f(x(t)) met x(τ) = ξ noterenals x(t; τ, ξ) dan geldt x(t; τ, ξ) = x(t − τ ; 0, ξ). Leg uit waarom. Definieer nu deafbeeldingen St : IR→ IR door St(ξ) = x(t; 0, ξ). Leg uit waarom voor alle s, t ∈ IRgeldt dat St+s = St(Ss(ξ)) voor alle ξ ∈ IR, i.e.

St+s = St Ss.

We schrijven ook St(ξ) = x(t; ξ) en dan luidt deze regel dat

x(t+ s; ξ) = x(t;x(s; ξ)) = x(s;x(t; ξ)).

Gebruik dit met f(x) = x om te concluderen dat exp(t+ s) = exp(t) exp(s), waarbijexp(t) gedefinieerd is door exp(t) = x(t; 1).

Opgave 10.33. Neem aan dat f : IR → IR uniform Lipschitz continu is, en datξ, η ∈ IR. Dan heeft de differentiaalvergelijking

x′′(t) = f(x(t))

precies een oplossing met x(0) = ξ en x′(0) = η. Die oplossing is gedefinieerd vooralle t ∈ IR. Schets een bewijs van deze uitspraak gebruikmakend van Opgave 10.27en de strategie in het voorafgaande.

263

Page 264: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 10.34. De oplossing in Opgave 10.33 kan genoteerd worden als x(t; ξ, η).Herschrijf x(t + s; ξ, η) zoals in Opgave 10.32. Gebruik dit met f(x) = −x om debekende regels voor cos(s+ t) en sin(s+ t) af te leiden rechtstreeks vanuit de definitiedat sin(t) = x(t; 0, 1) en cos(t) = x(t; 1, 0).

Opgave 10.35. Verifieer dat exp, cos, sin als machtreeksoplossingen samenvallenmet de oplossingen hierboven door de iteratieschema’s voor de betreffende integraal-vergelijkingen expliciet uit te voeren.

10.5 Impliciete functiestelling en integraalvergelijkin-gen

We besluiten met het uitwerken onder welke voorwaarden x in (10.24) eencontinu differentieerbare functie van ξ ∈ IR wordt. Zie Sectie 7 in

http://www.few.vu.nl/~jhulshof/NOTES/fa.pdf

Voor a, b ∈ IR met 0 ∈ [a, b] en ξ ∈ IR gaat dit om de vergelijking

x = ξ + Φ(x) met (Φ(x))(t) =

∫ t

0

f(x(s)) ds, (10.28)

als formulevoorschrift voor de (nieuwe) functie Φ(x) ∈ C([a, b]) gegeven de(“oude”) functie x ∈ C([a, b]), waarbij we aannemen dat f : IR → IR ten-minste continu is. De impliciete functiestelling is toepasbaar als

Φ : C([a, b])→ C([a, b])

continu differentieerbaar is.Immers, neem h ∈ C([a, b]) en schrijf, de neus volgend,

(Φ(x+ h))(t) =

∫ t

0

f(x(s) + h(s)) ds =

∫ t

0

[f(x(s) + τh(s))]10 ds

=

∫ t

0

∫ 1

0

f ′(x(s) + τh(s))h(s) dτ ds

=

∫ t

0

∫ 1

0

f ′(x(s))h(s) dτ ds+

∫ t

0

∫ 1

0

(f ′(x(s) + τh(s))− f(x(s))h(s) dτ ds︸ ︷︷ ︸R(h;x)(t)

264

Page 265: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

= (Φ′(x)h)(t) +R(h;x)(t),

waarin

hΦ′(x)−−−→ Φ′(x)h met (Φ′(x)h)(t) =

∫ t

0

f ′(x(s))h(s) ds, (10.29)

en

|R(h;x)(t)| = |∫ t

0

∫ 1

0

(f ′(x(s) + τh(s))− f(x(s))h(s) dτ ds|

≤ |∫ t

0

|∫ 1

0

(f ′(x(s) + τh(s))− f(x(s))h(s) dτ | ds|

≤ |∫ t

0

|∫ 1

0

|(f ′(x(s) + τh(s))− f(x(s))h(s)| dτ | ds|

≤ |∫ t

0

|∫ 1

0

|f ′(x(s) + τh(s))− f(x(s)|︸ ︷︷ ︸≤ε

|h(s)|︸ ︷︷ ︸|h|∞

dτ | ds| ≤ (b− a)ε|h|∞

als |h|∞ ≤ δ, met δ > 0 bij ε > 0 uit de definitie van uniforme continuiteitvan f ′ : [−A,A] → IR op een interval gegeven door bijvoorbeeld A = |x|∞plus een beetje.

Opgave 10.36. Op zijn kortst door de bocht: pas de impliciete functiestelling toeom te laten zien dat voor de oplossing x = x(ξ) van (10.28) geldt dat

ξ → x(ξ)

continu differentieerbaar is, en xξ de oplossing is van de integraalvergelijking die hoortbij

y′(t) = f ′(x(t))y(t) met y(0) = 1,

eerst onder de voorwaarde dat a en b dicht bij 0 zitten.

10.6 Calculus in Banachalgebra’s van operatoren

Deze sectie is nog wat schetsmatig maar niettemin precies. We willen (9.47)uitwerken voor A ∈ L(X) en schrijven met z vervangen door λ

f(A) =1

2πi

∮P

f(λ)(λ− A)−1 dλ, (10.30)

265

Page 266: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

nu voor een willekeurig polygon12 met hoekpunten λ1, . . . , λn = λ0, waaropen waarbuiten13

λ→ (λ− A)−1 = (λI − A)−1 (10.31)

gedefinieerd is. Het complement van het domein van (10.31) in IC heet hetspectrum van A, notatie σ(A). Het domein zelf heet de resolvente verzame-ling, notatie ρ(A), en de afbeelding in (10.31) heet de resolvente van A.

Opgave 10.37. Gebruik berekeningen met meetkundige reeksen om te laten ziendat iedere λ ∈ IC met λ > |A| in ρ(A) ligt en dat ρ(A) open is. Bewijs ook dat(10.31) complex differentieerbaar is op ρ(A). Wat is de afgeleide?

Opgave 10.38. Kan het zijn dat ρ(A) = IC? Het antwoord is nee, maar dat vergtnog een argument dat we weer zo licht mogelijk willen houden. Uit het ongerijmde,we zouden dan hebben dat (10.31) een L(X)-waardige functie definieert die naar0 ∈ L(X) gaat als λ → ∞ en dat moet niet kunnen, met een argument dat over teschrijven zou moeten zijn van wat we voor gewone complexwaardige functies weten,zie Opgave 9.27.

In deze opgaven heb je niet gebruikt dat met AB = BA = I en A ∈ L(X)ook volgt dat B ∈ L(X), een wat diepere stelling voor Banachruimten, dieook maar eens heel kort en clean moet worden uitgelegd. Dat komt nog weleen keer. Denk in het vervolg voorlopig bijvoorbeeld eerst aan X = IC2 alscomplexe uitbreiding van IR2 en A een lineaire afbeelding gegeven door een2×2 matrix, met complexe of reele entries. In dat geval bestaat σ(A) meestaluit 2 punten, en met twee disjuncte driehoekjes ∆1 en ∆2 om die punten heenkunnen we al aan de slag met ieder paar complex differentieerbare functies

f1 : ∆1 → IC en f1 : ∆1 → IC

die samen een functief : ∆1 ∪∆2 → IC

maken waarvan de twee stukken elkaar niet zien. Maar ook het rechterlid van(4.51) gezien als afbeelding van een gecomplexificeerde X = C([0, 1]) naarzichzelf is een voorbeeld.

12 Of een vereniging daarvan.13 Wat bedoelen we daarmee?

266

Page 267: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

In het algemeen kan σ(A) van alles zijn en daarom kijken we nu eerst watvoor gebieden we met eindig veel disjuncte polygonen kunnen maken. Elk po-lygon P heeft op natuurlijke manier een binnengebied C en een buitengebiedU , waar we steeds de rand bijnemen, dus

P = U ∩ C.

Als binnen een polygon P0 een aantal kleinere polygonen P1, . . . , Pn ligt, wierbinnengebieden onderling disjunct zijn, dus

Ci ∩ Cj = ∅ als i 6= j voor i, j = 1, . . . , n,

dan kan het zijn dat

σ(A) ⊂ Kint ⊂ K = C0 ∩ U1 ∩ · · · ∩ Un, (10.32)

waarbij we K zien als begrensd door de buitenkant P0 naarbuiten en doorbinnenkanten P1, . . . , Pn naar binnen, en

Kint = K ∩ P c0 ∩ · · · ∩ P c

n

de doorsnijding van K met de complementen van de polygonen P0, . . . , Pn is,dus alles in K dat niet op de rand ligt. Als we polygonen altijd als linksomdoorlopen zien dan schrijven we in dit geval

f(A) =1

2πi

∮δK

f(λ)(λ− A)−1 dλ =

1

2πi

(∮P0

f(λ)(λ− A)−1 dλ−n∑j=1

∮Pj

f(λ)(λ− A)−1 dλ

)(10.33)

voor f : K → IC complex differentieerbaar.Ligt σ(A) in een disjuncte eindige vereniging

K1 ∪ · · · ∪Km

van zulke Kj, en zijn

fj : Kj → IC (j = 1, . . . ,m)

complex differentieerbaar, dan vormen die samen weer een complex differen-tieerbare functie

f : K = K1 ∪ · · · ∪Kn → IC

267

Page 268: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

waarvoor we

f(A) =1

2πi

m∑j=1

∮δKj

f(λ)(λ− A)−1 dλ (10.34)

met iedere term in de som gedefinieerd als in (10.33) als definitie van f(A)gebruiken.

Elk van de Kj kan van de vorm alleen maar Kj = Cj zijn, en een K = C isaltijd mogelijk om dat σ(A) begrensd is, maar hoe kleiner K gekozen wordt,hoe meer speelruimte er is. De mogelijk steeds grotere14 uitdrukkingen voorK moet daarbij graag op de koop toe worden genomen, en als Kj 6= Cjkunnen de bijbehorende buitenkanten ook genest liggen. In het simpele gevaldat σ(A) een eindige discrete puntverzameling is kunnen we natuurlijk toemet K = Cj = ∆j, met de driehoekjes ∆j zo klein als we maar willen en

σ(A) ⊂ Kint ⊂ K = ∆1 ∪ · · · ∪∆m.

Wat we nu sowieso in alle gevallen willen is dat, als we de hoekpuntenvan de polygonen een beetje naar binnen schuiven, K in dus, de integralendie in (10.33) en (10.34) de nieuwe lineaire afbeelding f(A) : X → X moetenmaken, niet veranderen. En hetzelfde als we K groter maken door de puntennaar buiten te schuiven, zolang we maar niet uit het definitiegebied van decontinu differentieerbare complexwaardige f lopen. Bij het verder kleiner ofgroter maken kan de structuur van K versimpelen als twee polygonen elkaarontmoeten en vervolgens samen een polygon vormen. Strict genomen hebbenwe niet nodig hoe dat precies kan gaan, maar het is toch aardig om daar evenover na te denken.

Opgave 10.39. Het is een aardige project om dat versimpelen precies te maken. Bijhet groter maken van K kunnen twee buitenkanten van twee Kj-tjes elkaar ontmoetenwaarna verder groter maken tot een nieuwe buitenkant leidt waarmee de bijbehorendebinnenkanten dan samen de nieuwe binnenkanten van een nieuwe Kj worden. Ookkan uit een groeiende buitenkant die binnen een krimpende binnenkant ligt meteenna het eerste contact een nieuwe binnenkant ontstaan. Bij kleiner maken kunnen eenbinnen- en een buitenkant van eenzelfde Kj-tje elkaar ontmoeten en daarna een nieuwebuitenkant vormen, en ook kunnen twee binnenkanten elkaar ontmoeten en een nieuwebinnenkant vormen. Ga in alle gevallen na wat de nieuwe structuur wordt en welkeandere scenario’s er nog zijn, zoals ondermeer polygonen tot een punt laten krimpenen verdwijnen.

14 Als we alle zijden van alle poygonen dicht bij σ(A) willen hebben.

268

Page 269: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Via de inmiddels vertrouwde zigzagkrommen vernandert bij het geschuifmet de hoekpunten (10.34) niet, mits de Stelling van Coursat geldt voordriehoekjes waarop en waarbinnen (10.31) complex differentieerbaar is. Debetreffende integralen bestaan weer uit integralen over lijnstukjes. Integralendie gedefinieerd zijn dankzij het werk in Sectie 10.1, waarvoor het voorwerkal in Sectie 2.5 was gedaan: continue L(X)-waardige functies van t ∈ [0, 1]zijn integreerbaar via de tussensommen van Riemann, en

t→ f((1− t)λk−1 + tλk)((1− t)λk−1 + tλk − A)−1

is zo’n functie waarmee L(X)-waardige integralen als∫ λk

λk−1

f(λ)(λ− A)−1 dλ

nu gedefinieerd zijn.Mooi, dan kan voor

λ→ f(λ)(λ− A)−1

de Stelling van Coursat met bewijs en al worden overgeschreven15 en is (10.33)een goede definitie van f(A). Voorlopig houden we nu A vast en kijken naarnog zo’n f , een g dus, waarbij we eerst aannemen dat we het allersimpelstegeval hebben, een polygon rond σ(A) waarmee de berekeningen gedaan wor-den. In dat geval is de samenstelling van de afbeeldingen f(A) en g(A) teschrijven als

f(A)g(A) =1

2πi

∮λ0−n

f(λ)(λ− A)−1 dλ1

2πi

∮µ0−n

g(µ)(µ− A)−1 dµ,

met in de Cauchyintegraal voor g(A) de hoekpunten µl een klein beetje naarbinnen geschoven hebben, niet omdat het moet, maar omdat het kan, ietsminder ver naar binnen dan de hoekpunten λk. Het µ-polygon komt zobinnen het λ-polygon te liggen.

Omdat

f(A) =1

2πi

n∑k=1

∫ λk

λk−1

f(λ)(λ− A)−1 dλ,

g(A) =1

2πi

n∑l=1

∫ µl

µl−1

g(µ)(µ− A)−1 dµ,

15 Op detail nog te bespreken.

269

Page 270: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

wordt f(A)g(A) afgezien van de voorfactoren dankzij overwegingen als bij(6.47) een som van produkten∫ λk

λk−1

f(λ)(λ− A)−1 dλ

∫ µl

µl−1

g(µ)(µ− A)−1 dµ =

∫ µl

µl−1

∫ λk

λk−1

f(λ)g(µ)(λ− A)−1(µ− A)−1 dλ dµ =

∫ λk

λk−1

∫ µl

µl−1

f(λ)g(µ)(λ− A)−1(µ− A)−1 dµ dλ.

Dankzij wat fraaie algebra, te weten

(λ− A)−1(µ− A)−1 =1

µ− λ(λ− A)−1 +

1

λ− µ(µ− A)−1,

kunnen de integralen gesplitst worden in∫ λk

λk−1

f(λ)(λ− A)−1

∫ µl

µl−1

g(µ)

µ− λdµ dλ

en ∫ µl

µl−1

g(µ)(µ− A)−1

∫ λk

λk−1

f(λ)

λ− µdλ dµ,

en in beide herhaalde integralen zien we een bij sommeren over de index inde binnenste integraal een gewone complexwaardige lijnintegraal verschijnenwaar nul uit komt als de noemer niet nul is in het binnengebied, en eenfunctiewaarde anders, kijk maar naar de Cauchy integraalformule. Sommerenover l in de eerste geeft derhalve 0, en sommeren over k in de tweede∫ µl

µl−1

g(µ)(µ− A)−1 2πi f(µ) dµ = 2πi

∫ µl

µl−1

f(µ) g(µ)(µ− A)−1 dµ,

en nog een keer sommeren vervolgens (2πi)2(fg)(A). We concluderen dat

(fg)(A) =1

2πi

∮λ0−n

f(λ)g(λ)(λ− A)−1 dλ = f(A)g(A) = g(A)f(A),

(10.35)en daar is nog veel mee te spelen.

270

Page 271: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 10.40. Ga na dat in het algemene geval (10.34), wanneer f(A) en g(A)de som zijn van een eindig aantal integralen over links- dan wel rechtsom16 doorlo-pen polygonen Pj , er in de compositie alleen bijdragen zijn van de vorm zoals juistbehandeld en dat ook in dat geval volgt dat (fg)(A) = f(A)g(A).

De tweede gelijkheid in (10.35) is een gelijkheid in de niet-commutatieveBanachalgebra L(X) van continue lineaire afbeeldingen van X naar zichzelf,en f → f(A) is een afbeelding die gedefinieerd is voor een klasse van functiesgedefinieerd op een omgeving van het σ(A). Die omgeving mag van f afhan-gen, dus met f en g moeten we ons beperken tot de doorsnede van de tweedefinitiegebieden. Wat we nog willen laten zien is dat een schrijfwijze met(10.33) en (10.34) altijd mogelijk is met alle polygonen zo dicht bij σ(A) alswe maar willen. Daarmee bewijzen we dan ook meteen de volgende stelling.

Stelling 10.41. Laat voor A ∈ L(X) en een complexwaardige f de operatorf(A) gedefinieerd zijn via (10.33) en (10.34). Dan geldt

σ(f(A)) = f(σ(A)).

Om deze stelling te bewijzen maken we nu precies hoe we K kiezen. Kiesdaartoe een triangulatie van het complexe vlak opgespannen door ρ > 0 enρ exp(πi

6). De verzameling van al deze driehoekjes noemen we I. Voor elke

∆ ∈ I maken we onderscheid tussen

∆ ∩ σ(A) = ∅, ∆ ∩ σ(A) 6= ∅ = δ∆ ∩ σ(A), δ∆ ∩ σ(A) 6= ∅,

waarmee I = I0∪I1∪J , met I0, I1, J de onderling disjuncte deelverzamelingenwaarvoor respectievelijk de eerste, tweede dan wel derde karakterisatie geldt.Zowel I1 als J hebben maar eindig veel elementen omdat σ(A) begrensd is.Iedere ∆ ∈ I1 kan als een Kj genomen worden in (10.34).

De driehoekjes in I0 zijn niet relevant voor (10.34), maar iedere ∆ ∈ Jheeft 12 buren17 waarvan er tenminste een ook in J ligt, zeg ∆, gekarakteri-seerd door

δ∆ ∩ δ∆ ∩ σ(A) 6= ∅,

en in dat geval noemen we ∆ en ∆ fijne buren in J . Twee zulke fijne buren dieverder geen andere fijne buren hebben vormen samen een fijn duo verenigdin

∆ ∪ ∆,

16 Lees: linksom, maar met een min voor het integraalteken.17 Waarvan er drie een zijde met ∆ gemeen hebben en de rest alleen een hoekpunt.

271

Page 272: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

en I2 is per definitie de verzameling van zulke verder geisoleerde fijne buren,die verenigd steeds een ruit vormen, een ruit die als een Kj kan wordenmeegenomen in (10.34).

Een paar niet geisoleerde fijne buren kan nog 1 of meerdere fijne burenhebben, en als het maar 1 is, zeg ∆, dan kan het zijn dat die verder zelf geenfijne buren meer heeft. Dan vormen ze een fijn triootje waarbij verschillendestandjes denkbaar zijn. Dit definieert de verzameling I3, alle driehoeken ∆die onderdeel vormen van een fijn trio verenigd in

∆ ∪ ∆ ∪ ∆,

dat een parallelogram of een halve zeshoek is.En zo gaat dat door met fijne quatrootjes, fijne quintootjes, etc totdat J

op is, waarbij het aantal standjes flink maar niet oneindig toe kan nemen.Kortom, met I gepartioneerd als

I = I0 ∪ I1 ∪ I2 ∪ · · · ∪ Ip

is het nu nog de vraag wat de mogelijke onderlinge standjes zijn: als ∆1 ∈ Ikmet k−1 andere driehoeken in Ik een fijn k-stel vormt hoe kan de vereniging

∆1 ∪∆2 ∪ · · · ∪∆k

er dan uitzien?Antwoord: als een binnengebied van een polygon, of als het rechterlid

van (10.32). Dat moet dus nog door iemand18 bewezen worden, als dat nietal eens gebeurd is. Maar verder zijn we nu wel klaar met de beschrijving vanf(A). Dat kan altijd met eindig veel polygonen die willekeurig dicht bij σ(A)liggen door ρ klein te kiezen. Hoe dichter bij σ(A) hoe meer je er nodig hebten hoe wilder de standjes kunnen worden.

We zijn nu klaar voor het bewijs van Stelling 10.41. Neem een µ 6∈f(σ(A)) en definieer g door

λg−→ 1

µ− f(λ),

met f complex differentieerbaar op een omgeving van σ(A). Kies een mogelijkkleinere omgeving waarop f(λ) 6= µ. Uit de functional calculus volgt nu datg(A) gedefinieerd is en de algebra geeft

g(A)(µ− f(A) = (µ− f(A)g(A) = I,

18 Ik pas, maar dat is voor even.

272

Page 273: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

waarmee µ ∈ ρ(f(A)). Dus σ(f(A)) ⊂ f(σ(A)).Kan de inclusie strict zijn? In dat geval is er een µ0 = f(λ0) ∈ σ(f(A))

waarvoor µ0−f(A) inverteerbaar is terwijl λ0−A het niet is. Door schuivenen schalen van f , en schuiven van A en λ kunnen we zonder beperking deralgemeenheid wel aannemen dat λ0 = 0 = µ0 en dat de machtreeks van fbegint met λn voor zekere n ∈ IN omdat f(0) = 0. In dat geval is

f(λ) = λng(λ) met g(λ) = 1 + b1λ+ b2λ2 + · · ·

en dus is g(A) inverteerbaar, net als f(A). Maar de algebra geeft

f(A) = Ang(A).

Voor n = 1 is de tegenspraak onmiddellijk. Voor n > 1 niet helemaal.Pas daarom het argument hierboven aan en concludeer eerst dat µ0 = f(λ0)zo gekozen kan worden dat f ′(λ0) 6= 0. Hiermee is het bewijs van de stellingwel klaar. Als g een andere functie is die complex differentieerbaar is op eenomgeving van σ(f(A)) = f(σ(A)) dan volgt ook vrij direct uit de definitiesdat

g(f(A)) = (g f)(A).

Opgave 10.42. Bewijs dit.

Nog een expliciet voorbeeld. Als

λ = λN∑j=1

χj(λ) =N∑j=1

λχj(λ),

metχj(λ) = δij voor λ ∈ Ki,

dan

I =N∑j=1

Iχj.

Definieer de “spectraalprojecties”

Pj = χj(A).

Opgave 10.43. Laat zien dat PiPj = δijPj , APj = PjA, σ(APj) = σ(A) ∩Kj ,

I =

N∑j=1

Pj en A =

N∑j=1

APj =

N∑j=1

PjA.

273

Page 274: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Zo wordtX = R(P1)⊕ · · · ⊕R(Pn),

en beeld A iedere Xi = R(Pi)) op zich zelf af, en volgt voor

Aj : XiAPj−−→ Xi

dat σ(Aj) = σ(A) ∩Kj.Zo, en dat alles met een beetje lijnintegreren.

274

Page 275: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

11 Extremisme

Nu we de differential calculus voor afbeeldingen van Banachruimten naarBanachruimten min of meer in onze vingers hebben is de te beantwoordenvraag hoe het zit met extrema1 van reeelwaardige functies op Banachruim-ten. De eerste probleemstelling in dit hoofdstuk is hoe we gegeven een reeleBanachruimte X, een functie F : X → IR, en een deelverzameling A ⊂ X,de extremen van F beperkt tot A vinden door vergelijkingen op te schrijven,en die op te lossen.

Als A = X en f differentieerbaar is op heel X dan neemt f eventueleextrema alleen maar aan in stationaire punten van f , oplossingen van

F ′(x) = 0,

dus stel nu dat F ′(x0) = 0 met x0 ∈ X. De eerste vraag is dan of F in x0

een maximum of een minimum aanneemt, en voor functies F : IR→ IR doeje dit met wat vroeger het functieonderzoek heette, dat culmineerde in hetzonder hulpmiddelen tekenen van de grafiek van F .

11.1 Tweede afgeleide, Hessiaan, Lemma van Morse

Welnu, dat functieonderzoek is afgeschaft. Er is bijna geen schoolboek meerdat vraagstellingen over een functie presenteert zonder je de grafiek kado tedoen. Wat nog wel behandeld wordt is het criterium van de tweede afgeleide.Het teken van F ′′(x0) vertelt je of de grafiek er lokaal als ^ of als _ uitziet2.

Op zoek naar de happy minimizers is nu de eerste vraag hoe voor

F : X → IR

de restterm in

F (x) = F (x0) + F ′(x0)(x− x0) +R(x;x0)

er expliciet uitziet. In het geval dat F : IR→ IR weten we dat

F (x) = F (x0) + F ′(x0)(x− x0) +1

2F ′′(x0)(x− x0)2 + o((x− x0)2)

als F ′′ : IR→ IR continu is in x0, en zien we waarom het teken van F ′′(x0) ineen punt waar F ′(x0) = 0 het verschil maakt tussen happy minima and sadmaxima: ^ or _.

1maxima EN minima.2 Happy or sad parabolas in case of F (x) = α(x− x0)2 + β.

275

Page 276: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Kijk nog even naar Opgave 4.14 en Opgave 4.38 voor we een eerste Tay-lorbenadering maken van F : X → IR rond x0, en vervolgens kijken wat wedan kunnen zien in stationaire punten, punten waar F ′(x0) = 0. Voor hetgemak nemen we zo x0 = 0 en brengen Opgave 4.38 in stelling via

[0, 1]g−→ IR gedefinieerd door g(t) = F (tx)

als

g(t) = g(0) + g′(0) +

∫ 1

0

(1− t)g′′(t) dt,

waarin g(0) = F (0) en g′(0) = F ′(0)x. Als x = 0 een stationair punt is vanF dan gaat het dus om

R(x) =

∫ 1

0

(1− t)g′′(t) dt met g′(t) = F ′(tx)x, (11.1)

waarbij de uitdrukking voor g′(t) rechtstreeks uit de definities volgt maarnatuurlijk ook consistent is met de kettingregel.

Opgave 11.1. Verifieer dit!

In (11.1) komt de afgeleide van t→ F ′(tx)x voor, dus we hebben nu voorhet eerst de differentieerbaarheid van

x→ F ′(x) ∈ X∗

nodig, die in x = x0 ∈ X per definitie geformuleerd wordt als

F ′(x) = F (x0) + F ′′(x0)(x− x0) + S(x;x0),

met F ′′(x0) : X → X∗ begrensd en lineair en |S(x;x0)|X∗ = o(|x − x0|) als|x− x0| → 0.

Met x0 = t0x volgt dus dat

F ′(tx) = F ′(t0x) + F ′′(t0x)(tx− t0x) + S(tx; t0x)

= F ′(t0x) + (t− t0)F ′′(t0x)x+ S(tx; t0x),

en dusg′(t) = g′(t0) + (t− t0)(F ′′(t0x)x)x+ S(tx; t0x)x,

waaruit we aflezen dat g′(t) uit (11.1) differentieerbaar is in t0, met

g′′(t0) = (F ′′(t0x)x)x. (11.2)

276

Page 277: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Merk op dat F ′′(x0)h ∈ X∗ voor alle h ∈ X∗ en F ′′(x0)hk ∈ IR, dus

(h, k)F ′′(x0)−−−−→ F ′′(x0)hk ∈ IR (11.3)

is een kwadratische vorm die natuurlijk symmetrisch is, met een bewijs datuit Stelling 6.6 volgt. Neem daartoe zonder beperking der algemeenheidx0 = 0, maak de volgende opgave en lees meteen door!

Opgave 11.2. Definieer voor h en k in X en F : X → IR, met x → F ′(x)differentieerbaar in x = 0, de functie

(s, t)g−→ F (sh+ tk)

en bewijs rechtstreeks uit de definities dat gst(0, 0) = F ′′(0)k h en gts(0, 0) = F ′′(0)h k.

Via Opgave 11.2 is (11.3) te schrijven als

〈F ′′(0)h, k〉 = 〈F ′′(0)k, h〉, (11.4)

waarin de haken nu staan voor de onderlinge actie3 tussen X∗ en X, dus

〈φ, x〉 = φ(x) voor φ ∈ X∗ en x ∈ X.

In (11.4) zien we hoe A = F ′′(x0) ∈ L(X,X∗) voldoet aan

〈Ah, k〉 = 〈Ak, h〉,

hetgeen we als definierende eigenschap voor

A ∈ S(X,X∗) (11.5)

en S(X,X∗) ⊂ L(X,X∗) zien.Met ook F ′′(tx) ∈ S(X,X∗) volgt nu dat in (11.1) de restterm gegeven

wordt door

R(x) =

∫ 1

0

(1− t)F ′′(tx)x x dt =

∫ 1

0

(1− t)F ′′(tx)x dt x

=

∫ 1

0

(1− t)F ′′(tx) dt x x = 〈∫ 1

0

(1− t)F ′′(tx) dt x, x〉

3 The French notation, on ecrit aussi X ′ = X∗.

277

Page 278: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

=1

2〈F ′′(0)x, x〉+ 〈

∫ 1

0

(1− t)(F ′′(tx)− F ′′(0)) dt x, x〉

=1

2Q0(x, x) + T (x), (11.6)

met T (x) = o(|x|2) als |x| → 0 omdat F ′′ continu is in x = 0.

Opgave 11.3. Ga na dat F ′′ continu in x = 0 betekent dat er voor elke ε > 0 eenδ > 0 is zo dat de implicatie

|x| ≤ δ =⇒ |(F ′′(x)− F ′′(0))y| ≤ ε|y|

geldt voor alle y ∈ X.

Opgave 11.4. Werk het bovenstaande uit voor X = IR2 en laat zien dat

Q0(x, x) = Fx1x1(0, 0)x21 + 2Fx1x2(0, 0)x1x2 + Fx2x2(0, 0)x2

2

voor x = (x1, x2) ∈ IR2.

Opgave 11.5. Laat zien dat er r > 0 is zo dat voor elke x ∈ X met |x| ≤ r geldtdat er een θ = θ(x) ∈ [0, 1] is waarvoor

T (x) =

∫ 1

0(1− t)(F ′′(tx)− F ′′(0))xx dt =

1

2F ′′(θ(x))xx

(dit geldt onder de zwakkere aanname dat F twee keer differentieerbaar is in de buurtvan x = 0).

In (11.6) is hebben we evenzo dat

|Q0(x, x)| ≤ |F ′′(0)| |x|2.

Als4 er een µ > 0 is metQ0(x, x) ≥ µ|x|2

voor alle x ∈ X kunnen we dus concluderen dat F (x) in x = 0 lokaal mini-maal is.

4 Maar kan dat?

278

Page 279: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

We merken op dat in plaats van (11.6) we ook kunnen schrijven dat

R(x) = (Φ(x)x)x = 〈Φ(x)x, x〉

met

Φ(x) =

∫ 1

0

(1− t)F ′′(tx) dt ∈ S(X,X∗) ⊂ L(X,X∗), (11.7)

en dat vervolgens de vraag gesteld kan worden of via een coordinatentransformatie

x→ 〈Φ(x)x, x〉 en y → 〈Φ(0)y, y〉

in wezen dezelfde functies zijn.Bob Rink liet me zijn oude dictaat van Hans Duistermaat en Joop Kolk

zien, en daarin wordt daartoe zo’n transformatie gezocht in de vorm

y = A(x)x,

hetgeen leidt tot de vraag of A = A(x) ∈ L(X,X) zo gevonden kan wordendat

〈Φ(x)x, x〉 = (Φ(x)x)x = (Φ(0)y) y = 〈Φ(0)y, y〉 (11.8)

voor x in de buurt van x = 0. Dus voor y = A(x)x willen we

xA(x)−−→ A(x)x = y

Φ(0)y−−−→ (Φ(0)y)y = (Φ(0)A(x)x) A(x))x = (Φ(x)x)x,

waarin x aan beide kanten twee keer lineair op zichzelf voorkomt.Hieraan is zeker voldaan als

(Φ0Ax) A = Φ(x)x (11.9)

in X∗, waarin we A = A(x) zoeken bij x 6= 0 en Φ(x) met Φ(0) = Φ0. Aan(11.9) is vervolgens zeker voldaan als de afbeelding

h→ Φ(x)h in L(X,X∗) gelijk is aan h→ Φ0Ah A, (11.10)

een kwadratische L(X,X∗)-waardige vergelijking voor A ∈ L(X,X), abstractte schrijven als

κ0(A,A) = Φ(x). (11.11)

In (11.11) is

X ×X κ0−→ L(X,X∗) in L(X ×X,L(X,X∗))

gedefinieerd doorh→ κ0(A,B)h = Φ0Ah B

279

Page 280: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

als afbeelding in L(X,X∗) voor iedere A,B ∈ L(X). Voor x = 0 is A = Ieen oplossing van κ0(A,A) = Φ(x) omdat Φ(0) = Φ0.

De impliciete functiestelling is toepasbaar als de afgeleide van de kwadra-tische functie

A→ κ0(A,A)

in A = I inverteerbaar is, en x → Φ(x) continu is in x = 0. Dat laatste isbij aanname dat F ′′ continu is in 0 het geval.

Met betrekking tot de afgeleide naar A in I schrijven we A = I + Hen merken voordat we gaan expanderen in de kleine H op dat (11.11) nuherschrijft als

χ0(H)h = Φ0Hh+ Φ0h H + Φ0Hh H = (Φ(x)− Φ0)h (11.12)

voor alle h ∈ X. Het linkerlid definieert een X∗-waardige functie

Hχ0−→ χ0(H)

van H in X, met een χ0(H) die twee lineaire termen en een kwadratisch termheeft, waarin Φ0 steeds als coefficient gezien kan worden.

Omdat de afgeleide in H = 0 evident gegeven wordt door

hχ′0(I)H−−−−→ Φ0Hh+ Φ0h H,

lijkt de inverteerbaarheidsconditie te zijn dat

Φ0Hh+ Φ0h H = Ch (11.13)

voor alle h ∈ X, oplosbaar moet zijn voor elke C ∈ L(X,X∗). Merk echterop dat het rechterlid van de op te lossen vergelijking

χ0(H) = Φ(x)− Φ0 (11.14)

in S(X,X∗) zit, zie (11.5). Nadere beschouwing van het linkerlid van (11.12)middels

〈χ0(H)h, k〉 = 〈Φ0Hh, k〉+ 〈Φ0h H, k〉+ 〈Φ0Hh H, k〉

= 〈Φ0Hh, k〉+ 〈Φ0h,Hk〉+ 〈Φ0Hh,Hk〉

= 〈Φ0Hh, k〉+ 〈Φ0Hk, h〉+ 〈Φ0Hh,Hk〉 (11.15)

voor h en k in X omdat Φ0 ∈ S(X,X∗), leert ons dat χ′0(0)H ∈ L(X,X∗)gekarakteriseerd wordt door

〈χ′0(0)Hh, k〉 = 〈Φ0Hh, k〉+ 〈Φ0Hk, h〉, (11.16)

280

Page 281: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

en daarom volgt dat χ′0(0)H ∈ S(X,X∗).De kwadratische restterm R0(H) ∈ L(X,X∗) in

χ0(H) = χ′0(0)H +R0(H)

is af te lezen in(11.15) als gekarakteriseerd door

〈R0(H)h, k〉 = 〈Φ0Hh,Hk〉, (11.17)

en derhalve is ook R0(H) ∈ S(X,X∗). We kunnen en moeten (11.14) duslezen als de vergelijking

χ0(H) = χ′0(0)H +R0(H) = Φ(x)− Φ0 in S(X,X∗). (11.18)

Daarmee wordt ook (11.13) beperkt tot C ∈ S(X,X∗) en herschrijft als

〈Φ0Hh, k〉+ 〈Φ0Hk, h〉 = 〈Ch, k〉 (11.19)

voor alle h, k ∈ X.In het geval dat X = IR2 zijn Φ0 en C symmetrische 2 × 2 matrices en

staan hier vier vergelijkingen voor een 2 × 2 matrix H in termen van maardrie coefficienten in C. Zonder extra aannamen op H is (11.19) dan eenonderbepaald stelsel. De voor hand liggende extra conditie op H is nu datΦ0H ∈ S(X,X∗). In dat geval is (11.19) equivalent met

2Φ0H = C, (11.20)

een vergelijking die weer equivalent is met

H =1

2Ψ0C, (11.21)

alsΨ0 = Φ

(−1)0 (11.22)

bestaat, en in dat geval is Φ0H = Φ0(12Φ

(−1)0 )C = 1

2C ∈ S(X,X∗).

Aan de conditie voor het toepassen van de impliciete functiestelling op(11.18) in S(X,X∗) rond H = 0 en x = 0 is dus voldaan als (11.18) als eenvergelijking voor

H ∈ L(X,X∗) : Φ0H ∈ S(X,X∗) χ0−→ S(X,X∗)

gezien wordt. Met B = Φ0H als nieuw onafhankelijke variabele verandertdit in

2Bh+Bh (Ψ0B) = (Φ(x)− Φ0)h

281

Page 282: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

voor alle h ∈ X, ofwel

2B + T0(B) = C(x) = Φ(x)− Φ0 (11.23)

in S(X,X∗), met T0 : S(X,X∗)→ S(X,X∗) gedefinieerd door

T0(B)h = Bh (Ψ0B) (11.24)

voor alle h ∈ X, en

XC−→ S(X,X∗)

continu en C(0) = 0.De impliciete functiestelling kan nu gebruikt worden om, zonder meer5

te eisen dan continuiteit van Φ(x), een unieke oplossing B(x) te vinden voorx in de buurt van x = 0, die daar continu van x afhangt. Hiermee is devolgende stelling bewezen.

Stelling 11.6. Laat X een Banachruimte zijn en F : X → IR twee keercontinu differentieerbaar in de buurt van x = 0. Neem aan dat F ′(0) = 0 endat F ′′(0) ∈ L(X,X∗) inverteerbaar is, met een inverse in L(X,X∗). Dan iser een coordinatentransformatie van de vorm

y = A(x)x = (I + Φ(−1)0 B(x))x,

waarin

Φ0 =1

2F ′′(0)

enx

B−→ S(X,X∗)

continu is met B(0) = 0, zodanig dat

F (x) = 〈Φ0A(x)x,A(x)x〉,

in de buurt van x = 0.

De aanname dat F ′′(0) inverteerbaar is, is nogal zwaar en sluit een aantalstandaardruimten meteen uit. Is dit eigenlijk een Hilbertruimtestelling, vraagje6 dan achteraf af7. Ook is op te merken dat de impliciete functiestellinghier achteraf helemaal niet8 nodig was. Merk daartoe op dat via φ = Φ0h enψ = Φ0k geldt dat

〈φ,Ψ0ψ〉 = 〈ψ,Ψ0φ〉 voor alle φ, ψ ∈ X∗,5 Zie (4.21) en formulering en bewijs daarboven.6 To check: X en X∗ lineair homeomorf =⇒ X is a Hilbert space in disguise?7 Via Andre Ran kwam van Jan Fourie antwoord: nee, X ⊕X∗, met X reflexief.8 Maar de stelling zette ons wel op het juiste spoor.

282

Page 283: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

i.e. Ψ0 ∈ S(X∗, X), en enig spelen met deze definitie en die van B,Φ0 ∈S(X,X∗) geeft dat (11.23) equivalent is met

2Ψ0B + Ψ0BΨ0B = Ψ0C(x). (11.25)

Voor H zelf betekent dit dat

I + 2H +H2 = I + P (x) in L(X) = L(X,X), (11.26)

waarbij9 zowelH(x) als P (x) (moeten) voldoen aan Φ0P (x),Φ0H(x) ∈ S(X,X∗).Met de machtreekstechnieken die we gezien hebben10 voor matrices volgt dat

H =1

2P − 1

2!

1

2

1

2P 2 +

1

3!

1

2

1

2

3

2P 3 − 1

4!

1

2

1

2

3

2

5

2P 4 + · · · (11.27)

als |P | < 1, en dus y = A(x)x met11

A(x) = I + E(x)− 1

2!E(x)2 +

1 · 33!

E(x)3 − 1 · 3 · 54!

E(x)4 + · · ·

en

E(x) =

∫ 1

0

(1− t)(F ′′(0)(−1)F ′′(tx)− I) dt,

wel aardig. Modulo rekenfouten wellicht maar ik denk het niet. Aan deformules zie je niet meer dat het niet alleen over X = IR gaat.

11.2 Nog een keer de methode van Lagrange

In Sectie 6.3 hebben we essentieel gebruikt gemaakt van de gradienten van Φ,F1, F2, F3. Dat was niet echt nodig, en dat laten we nu zien in de abstractesetting met x ∈ X, y ∈ Y , F : X × Y → Y en Φ : X × Y → IR.

Onder de aanname dat

(x, y)Fx−→ Fx(x, y) en (x, y)

Fy−→ Fy(x, y)

continu zijn in de buurt van (x, y) = (0, 0) met Fy inverteerbaar, volgt weerhet bestaan van een continu differentieerbare impliciete functie y = f(x) eneen lokale beschrijving van S zoals voor (6.19). Voor differentieerbare Φ, metdus (x, y)→ Φx(x, y) ∈ X∗ en (x, y)→ Φy(x, y) ∈ Y ∗, is (6.18) weer over teschrijven als criterium voor het stationair zijn van Φ beperkt tot S.

9 De omweg via H was ook niet nodig. De vergelijking was gewoon A2 = I + Ψ0C(x).10 Zie Opgave 5.42.11 Er vallen een heleboel 2-en weg bij de terugvertaling naar F ′′.

283

Page 284: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Als nu Φy ∈ Y ∗ te schrijven is als

Φy = Λ Fy,

dan volgt

Φx = Φy(Fy)(−1)Fx = Λ Fy(Fy)(−1)Fx = Λ Fx,

en samengenomen datΦ′ = Λ F ′

als criterium voor het stationair zijn.Wat we hierboven nodig hebben is een stelling die zegt dat bij iedere

begrensde lineaire A : Y → Y en ψ ∈ Y ∗ een (unieke) Λ ∈ Y ∗ hoort metψ = Λ A. Dat is voor een college functionaalanalyse.

284

Page 285: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

12 Appendix: al of niet metrische topologie

Een aardig dictaatje is hier te vinden, uit de tijd dat Leiden de R nog in denaam had:

http://www.few.vu.nl/~jhulshof/NOTES/anal.pdf

Hieronder neem ik het over met wat aanvullingen en correcties.....

12.1 Metrische ruimten

Onze genormeerde ruimten X, waaronder IR, IR2 en ook C([a, b]) met demaximumnorm, maar helaas niet R([a, b]) met de 1-norm, zijn voorbeeldenvan metrische ruimten met het afstandsbegrip gedefinieerd door de metriek

(x, y)d−→ d(x, y) = |x− y|, (12.1)

een afbeelding1 d van X×X naar [0,∞) met de eigenschappen dat voor allex, y, z ∈ X geldt dat

(i) d(x, y) = 0 ⇐⇒ x = y; (ii) d(x, y) = d(y, x);

(iii) d(x, y) ≤ d(x, z) + d(z, x). (12.2)

Iedere niet-lege deelverzameling A van X is zo een metrische ruimte, waarbijwe de algebraische vectorruimte operaties nu vergeten.

Definitie 12.1. Een metrische ruimte is een niet-lege verzameling X met eenafbeelding d : X ×X → [0,∞) waarvoor (i),(ii) en (iii) uit (12.2) hierbovengelden voor alle x, y, z ∈ X.

Opgave 12.2. Zie Opgave 10.3. De ε,N -definitie van d(xn, xm)→ 0 als m,n→∞definieert wat een Cauchyrij in X is. Geef die definitie. Geef ook de definitie van hetconvergent zijn van de rij xn in X.

We gebruiken hieronder de notatie xn → x voor x1, x2, x3, . . . , x ∈ Xzonder er steeds n → ∞ bij te zetten en spreken over ook een rij xn zonderte vermelden dat n ∈ IN (of een andere deelverzameling van IZ van de vormm+ IN met m ∈ IZ, bijvoorbeeld IN0).

1 De d van distance, a van afstand doen we maar niet.

285

Page 286: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 12.3. Een flauwe opgave om aan de de notaties, definities en axioma’s tewennen: laat zien dat als xn → x en xn → y (alles in X) voor de limieten x en ygeldt dat x = y. De limiet van een convergente rij is dus uniek.

Met convergente rijen kunnen we voor metrische ruimten X en Y zeggenwat het voor een afbeelding

F : X → Y

betekent om continu te zijn in a ∈ X.

Definitie 12.4. Een afbeelding F van een metrische ruimte X naar een (nietper se andere) metrische ruimte Y heet continu in a ∈ X als de implicatie

xn → a =⇒ F (xn)→ F (a)

geldt voor elke rij xn in X. Als dit het geval is voor elke a ∈ X dan zeggenwe dat F : X → Y continu is.

Opgave 12.5. Als X,Y, Z metrische ruimten en

XF−→ Y en Y

G−→ Z

afbeeldingen dan is de afbeelding

XGF−−−→ Z gedefinieerd door X

F−→ YG−→ Z

continu in a ∈ X als F continu is in a en G continu is in b = F (a). Hint: triviaal, leguit.

Definitie 12.6. Een metrische ruimte heet rijkompakt als elke rij in X eenconvergente deelrij heeft, en volledig als elke Cauchyrij in X convergent is(in beide gevallen met limiet in X dus).

Opgave 12.7. Bewijs dat rijkompakte metrische ruimten volledig zijn.

Opgave 12.8. Als X en Y metrische ruimten zijn, met X rijkompakt, dan is iederecontinue F : X → Y uniform continu, i.e.

∀ε > 0∃δ > 0∀x, a ∈ X : d(x, a) ≤ δ =⇒ d(F (x), F (a)) ≤ ε.

Bewijs dit door een eerder bewijs (van Stelling 2.32) over te schrijven.

286

Page 287: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 12.9. Als X een rijkompakte metrische ruimte is, dan heeft iedere continueF : X → IR een globaal maximum en een globaal minimum op X. Bewijs ook ditdoor een eerder bewijs over te schrijven.

12.2 Omgevingen, open en gesloten verzamelingen

Continuiteit kunnen we ook met open verzamelingen beschrijven. In hetstandaardjargon heet een deelverzameling G ⊂ X van een metrische ruimteX gesloten als voor iedere rij xn in G met xn → x ∈ X de limiet x in G zit(je kan G niet uit door limieten te nemen). Een verzameling O ⊂ X heetopen2 als zijn complement gesloten is.

Opgave 12.10. Bewijs dat in een Banachruimte iedere rijkompakte deelverzamelingbegrensd en gesloten is en dat in IRn ook de omgekeerde uitspraak geldt.

Uit Opgave 12.9 en Opgave 12.10 volgt dat de stelling over maxima enminima van continue functies op gesloten begrensde deelverzamelingen vanIRN.

Stelling 12.11. Laat K ⊂ IRN begrensd en gesloten zijn en F : K → IRcontinu zijn. Dan zijn er a, b ∈ K met F (a) ≤ F (x) ≤ F (b) voor alle x ∈ K.De punten a en b heten de minimizer en de maximizer voor F , en de waardenF (a) en F (b) het minimum en het maximum van F .

Opgave 12.12. De collectie G van alle gesloten deelverzamelingen van een metrischeruimte X heeft drie belangrijke eigenschappen:

(i) ∅ ∈ G, X ∈ G; (ii) G1, G2 ∈ G =⇒ G1 ∪G2 ∈ G;

en (voor elke indexverzameling I)

(iii) Gi ∈ G ∀i ∈ I =⇒ ∩i∈IGi ∈ G.

Bewijs dit via de definitie dat G ∈ G als voor iedere rij xn in G met xn → x ∈ X voorde limiet geldt x ∈ G.

2 Minder gelukkige naamgeving, sorry, is niet anders.

287

Page 288: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 12.13. De collectie O van alle open deelverzamelingen van een metrischeruimte X heeft de volgende eigenschappen:

∅ ∈ O, X ∈ O; O1, O2 ∈ O =⇒ O1 ∩O2 ∈ O;

en (voor elke indexverzameling I)

Oi ∈ O ∀i ∈ I =⇒ ∪i∈IOi ∈ O.

Bewijs dit via de definitie dat O ∈ O als

Oc = x ∈ X : x 6∈ O ∈ G.

Opgave 12.14. Laat zien dat in een metrische ruimte X een deelverzameling O ⊂ Xopen is dan en slechts dan als voor elke a ∈ O er een r > 0 is zo dat

Br(a) = x ∈ A : d(x, a) ≤ r ⊂ O.

Bewijs ook dat Br(a) gesloten is.

Om te weten welke verzamelingen open zijn moet je dus weten wat degesloten bollen Br(a) zijn maar niet eens dat. Heb je bijvoorbeeld tweenormen en noemen we de bijbehorende bollen Br(a) en Ks(a) dan krijgenwe precies dezelfde open verzamelingen als elke Br(a) met r > 0 altijd eenKs(a) bevat met s > 0 en omgekeerd. Is X een vectorruimte over IR mettwee normen dan noemen we die normen equivalent als ze dezelfde collectie Odefinieren. Via Opgave 12.12 leidt dat tot deze karakterisatie van equivalentenormen op X.

Opgave 12.15. Als twee normen

x→ |x|1 en x→ |x|2

dezelfde collectie O van open verzamelingen definieren dan zijn er constanten A1 enA2 zo dat voor alle x ∈ X geldt

|x|1 ≤ A2|x|2 en |x|2 ≤ A1|x|1 .

Bewijs dit. Terzijde, omgekeerd geldt ook en is makkelijker.

288

Page 289: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 12.16. Laat zien dat in een metrische ruimte X een deelverzameling O ⊂ Xopen is dan en slechts dan als voor elke a ∈ O er een r > 0 is zo dat

Br(a) = x ∈ A : d(x, a) < r ⊂ O.

Bewijs ook dat Br(a) open is.

Stelling 12.17. Laat X en Y metrische ruimten zijn en F : X → Y . Dan isF continu dan en slechts dan als alle inverse beelden van open verzamelingenin Y open zijn in X.

Opgave 12.18. Wel een kluifje: bewijs Stelling 12.17. Triviaal daarna is dat alsX,Y, Z metrische ruimten zijn en

XF−→ Y en Y

G−→ Z

continue afbeeldingen, dat de afbeelding

XGF−−−→ Z gedefinieerd door X

F−→ YG−→ Z

continu is. Waarom? Zie nog even Opgave 12.5.

In IR2 hebben we behalve the standaardnorm

|x| =√x2

1 + x22 =√x · x voor x =

(x1

x2

),

afkomstig van het standaardinprodukt

x · y =

(x1

x2

)·(y1

y2

)= x1y1 + x2y2,

de normen

|x|p = p√|x1|p + |x2|p voor p ≥ 1 en |x|∞ = max(|x1|, |x2|).

Als deze normen zijn equivalent.

Opgave 12.19. Bewijs dat al deze p-normen equivalent zijn en teken in het x1, x2-vlak de gesloten eenheidsbollen Bp = x ∈ IR2 : |x|p ≤ 1 voor p = 1, 2 en p = ∞,en voor nog twee p’s naar keuze. Blader nog even terug naar Opgave 12.15 en dekarakterisatie daaronder en boven van open verzamelingen met behulp bollen, geslotenof open, zoals Bp

ε (ξ) = x ∈ IR2 : |x− x0|p < ε met ξ ∈ IR2 en ε > 0.

289

Page 290: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 12.20. De bollen B1 en B∞ zijn ook te beschrijven als doorsnijdingen vanopen halfvlakken van de form K = x ∈ IR2 : f(x) < b met f : IR2 → IR lineairgegeven door f(x) = a1x1 + a2x2 en a1, a2, b ∈ IR. Laat dat zien.

Opgave 12.21. Een alternatieve manier om te zeggen dat een O ∈ IR2 open is tezeggen dat er voor elke ξ ∈ O drie3 open halfvlakken K1,K2,K3 zijn zoals in Opgave12.20, waarvoor geldt

ξ ∈ K1 ∩K2 ∩K3 ⊂ O.Waarom definieert dit dezelfde open verzamelingen? Geef ook zo’n definitie van openin IR3.

Opgave 12.22. Een verzameling W in een genormeerde ruimte X heet zwak openals er voor elke ξ ∈W geldt dat er er eindig veel open halfvlakken zijn zo dat geldt

ξ ∈ K1 ∩ · · · ∩Kn ⊂W.

Bewijs dat voor deze zwak open verzamelingen W dezelfde eigenschappen gelden als inOpgave 12.13. Met eindige doorsnijdingen van open halfvlakken is dus een topologiete maken: een collectie van “open” verzamelingen die voldoet aan de “axioma’s” inOpgave 12.13. In het geval dat X = IRn zijn alle normen op X en deze topologieequivalent.

https://www.youtube.com/watch?v=fmTcSGukO4o

Opgave 12.23. Bewijs dat iedere norm x → |x| op IR2 equivalent is met de 2-norm. Hint: laat eerst zien dat x→ |x| op S = x ∈ IR2 : x2

1 + x22 = 1 een positief

minimum en maximum heeft.

Opgave 12.24. Laat X1 en X2 genormeerde ruimten zijn. Bewijs dat

X1 ×X2 = x = (x1, x2) : x1 ∈ X1, x2 ∈ X2

met de voor de hand liggende bewerkingen weer een genormeerde ruimte is met (equi-valente) normen (voor p ≥ 1)

x→ p√|x1|p + |x2|p en x→ max(|x1|, |x2|).

33 = 2 + 1.

290

Page 291: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 12.25. Laat X1 en X2 genormeerde ruimten zijn en X = X1×X2. Bewijsdat iedere f ∈ X∗ van de vorm

x = (x1, x2)f−→ f1(x1) + f2(x2)

is met f1 ∈ X∗1 , f2 ∈ X∗2 . Met andere woorden X∗ = X∗1 ×X∗2 .

Opgave 12.26. Laat X1 en X2 genormeerde ruimten zijn en f ∈ X∗ = X∗1 ×X∗2 .Bepaal de norm van f in X∗ als voor de norm op X = X1×X2 de norm x→ |x1|+|x2|genomen wordt. Zelfde vraag voor x→ max(|x1|, |x2|).

12.3 Metrische ruimten; continue afbeeldingen

Aanvullend materiaal voor het college Analyse 1

J. Hulshof (destijds RUL)

Cursief wat opmerkingen van 24 jaar later ingevoegd tijdens het geven vanhet college Analyse 3 in het tweede jaar, met verwijzingen naar het boekPrinciples of Topology van Croom.

1. Inleiding. In deze syllabus behandelen we een aantal fundamenteleonderwerpen uit de analyse. Uitgangspunt hierbij is de volgende algemeneprobleemstelling:

Laat X een puntverzameling zijn en A een niet-lege deelverzameling van X,eventueel X zelf. Zij f : A → IR een reeelwaardige functie. Hoe en onderwat voor veronderstellingen kunnen we dan concluderen dat de functie f opA een globaal maximum aanneemt, m.a.w. bestaat er een punt x0 ∈ A, zodat

f(x) ≤ f(x0) ∀x ∈ A?

Om deze vraag te beantwoorden beschouwen we het supremum van f opA,

M = supf(x) : x ∈ A ∈ IR∪ +∞.

Wat we van M nu willen weten is ten eerste of M eindig is, en zo ja, ofde waarde M ook door de functie f wordt aangenomen. Omdat M hetsupremum is van alle door f aangenomen functiewaarden, kunnen we Mbenaderen met deze functiewaarden. We onderscheiden twee gevallen.

291

Page 292: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

(i) M < +∞. Dan bestaat er voor elk natuurlijk getal n een xn ∈ A, zodat

f(xn) > M − 1

n.

(ii) M = +∞. Dan bestaat er voor elk natuurlijk getal n een xn ∈ A, zodat

f(xn) > n.

In beide gevallen geeft dit ons een rij punten, genoteerd als (xn)∞n=1, inA. Als we nu kunnen concluderen dat, eventueel door een aantal van dezepunten uit de rij weg te laten, deze punten voor grote waarden van n ∈ INsteeds dichter komen te liggen bij een ”limietpunt”dat zelf ook in A ligt, endat de waarde van f in dat limietpunt gelijk is aan

limn→∞

f(xn),

dan hebben we in een klap de beide bovenstaande vragen met ja beantwoord.In deze syllabus zullen we de voor bovenstaande probleemstelling relevantebegrippen behandelen, met hier en daar een zijstapje.

In de vorige alinea staat de zinsnede ”dichterbij”. Aangezien we van Xalleen maar hebben aangenomen dat X een puntverzameling is, heeft ditzonder verdere veronderstellingen geen betekenis. Een natuurlijke manierom dit de verhelpen is de invoering van een zogenaamde afstandsfunctieof metriek op X. Dit leidt dan tot de definitie van een metrische ruimte(Sectie 2). De deelverzamelingen waarvoor altijd een limietpunt van eenrij bestaat blijken de zogenaamde rijkompakte verzamelingen te zijn (Sectie3). Voor functies op (deelverzamelingen van) metrische ruimten kan hetbegrip ”continu”worden gedefinieerd (Sectie 5), waarmee de bovenstaandelimietovergang kan worden gerechtvaardigd. Als voorbeeld behandelen wede gevallen dat X = IR en X = IRN (Sectie 6). In de appendix komen nogenige iets meer geavanceerde onderwerpen met betrekking tot kompaktheidaan de orde.

De schrijver van deze syllabus is van mening dat iedere student in dewiskunde of theoretische natuurkunde, onafhankelijk van wat hij/zij in dedoctoraalfase als afstudeerrichting kiest, zich de basisstof in Sectie 1 tot enmet 6 van deze syllabus moet eigen maken. In de meeste theoretische analyseboeken is deze stof, althans voor het geval X = IRN , terug te vinden in deinleidende hoofdstukken. Zie bijvoorbeeld het boek ”Mathematical Analysis,a modern approach to advanced calculus”van T.M. Apostol (Addison-Wesley1957), waarin bijna alle analyse die in de eerste twee jaar van de studie aan deorde komt, is terug te vinden, of ”Principles of Mathematical Analysis”van

292

Page 293: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

W. Rudin (McGraw Hill 1964). Voor meer algemene metrische (en topolo-gische) ruimten zijn er o.a. de boeken ”Topology and Normed Spaces”vanG.J.O. Jameson (Wiley 1974) en ”Introduction to Topology and ModernAnalysis”van G.F. Simmons (McGraw Hill 1963).

Als voorkennis wordt verondersteld dat de lezer bekend is met de ele-mentaire verzamelingsleer, begrippen als aftelbaar oneindig en overaftelbaaroneindig, en met de axioma’s voor de natuurlijke getallen IN en de reele getal-len IR. Hoofdstuk 1 uit het boek ”Calculus 1 2nd edition”van T.M. Apostol(Wiley 1967) is ruim voldoende.

2. Metrische ruimten. Laat X weer een puntverzameling zijn.

Definitie 2.1. Een functie d : X ×X → IR heet een metriek op X als(i) ∀x, y ∈ X:

d(x, y) ≥ 0 en d(x, y) = 0 ⇐⇒ x = y.

(ii) ∀x, y ∈ X:d(x, y) = d(y, x).

(iii) ∀x, y, z ∈ X:

d(x, z) ≤ d(x, y) + d(y, z) (driehoeksongelijkheid).

Als d : X ×X → IR een metriek is, dan heet het paar (X, d) een metrischeruimte.

Het is duidelijk dat op een verzameling X meerdere metrieken kunnen zijngedefinieerd. Toch spreekt men vaak over de metrische ruimte X i.p.v. overde metrische ruimte (X, d). Aangenomen is dan dat over de stilzwijgendgemaakte keuze van de metriek d geen misverstand kan bestaan. In hetvervolg is X nu steeds een metrische ruimte met metriek d.

Voorbeeld 2.2. X = IR is de verzameling van de reele getallen, metd(x, y) = |x− y|.Opmerking 2.3. Iedere deelverzameling van een metrische ruimte is metdezelfde metriek weer een metrische ruimte.

Definitie 2.4. Laat A ⊂ X.(i) Een punt a ∈ A heet een inwendig punt van A als

εxistsδ > 0 : Bδ(a) = x ∈ X : d(x, a) < δ ⊂ A.

De verzameling Bδ(a) heet de open bol met straal δ en middelpunt a.

293

Page 294: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

(ii) Een punt a ∈ A heet een geisoleerd punt van A als

∃δ > 0 : Bδ(a) ∩ A = a.

(iii) Een punt p ∈ X heet een ophopingspunt van A als

∀δ > 0 ∃a ∈ A : a 6= p en d(a, p) < δ.

(iv) Als elk punt van A een inwendig punt van A is, dan heet A een opendeelverzameling van X.(v) Als het complement van A,

Ac = X − A = x ∈ X : x 6∈ A,

open is, dan heet A een gesloten deelverzameling van X.

In het vervolg zullen we kortweg zeggen dat A open (gesloten) is als A eenopen (gesloten) deelverzameling van X is.

LET OP! Definitie 2.4 benoemt eigenschappen van punten a ∈ A en p ∈ Xmet A ⊂ X en X een metrische ruimte. Maar A is zelf ook weer een metrischeruimte en dus te zien in de rol van X hierboven. Je kunt de grotere X danverder vergeten bij het doen van uitspraken over deelverzamelingen van A.Bijvoorbeeld over A ⊂ A, net zoals je uitspraken over X kunt doen, gezienals deelverzameling van de metrische ruimte X.

Voorbeeld: De gehele getallen vormen een verzameling waarvoor geldt datIZ ⊂ IR. In IZ is elk punt een geisoleerd punt en elke bol met straat 1

2

een singleton, dus 0 is een open deelverzameling van IZ maar geen opendeelverzameling van IR.

Stelling 2.5. (i) Iedere open bol is een open verzameling.(ii) Een verzameling A in X is open dan en slechts dan als A een verenigingvan open bollen is.

Bewijs. Opgave.

Stelling 2.6. (i) X is open, de lege verzameling is open.(ii) De vereniging van elke collectie open deelverzamelingen is open.(iii) De doorsnede van elk eindig aantal open deelverzamelingen is open.

Bewijs. Opgave.

Stelling 2.7. (i) X is gesloten, de lege verzameling is gesloten.(ii) De doorsnede van elke collectie gesloten deelverzamelingen is gesloten.(iii) De vereniging van elk eindig aantal gesloten verzamelingen is gesloten.

294

Page 295: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Bewijs. Opgave.

Stelling 2.8. Laat A ⊂ X. Dan is A gesloten dan en slechts dan als A alzijn ophopingspunten bevat.

Bewijs. Neem eerst aan dat A gesloten is en laat p een ophopingspunt zijnvan A. We moeten laten zien dat p ∈ A. Stel niet. Dan p ∈ Ac. Maar Ac isopen, dus p is een inwendig punt van Ac. Zodoende is er een δ > 0 waarvoorBδ(p) ⊂ Ac, in tegenspraak met de veronderstelling dat p een ophopingspuntis van A. Dus p ligt wel in A.

Neem vervolgens aan dat A een verzameling is die al zijn ophopingspuntenbevat. We tonen aan dat A gesloten is door te bewijzen dat Ac open is. Zijp ∈ Ac. Dan is p geen ophopingspunt van A, dus er is een δ > 0 zo datBδ(p) geen punten van A − p bevat, en wegens p ∈ Ac betekent dit datBδ(p) ⊂ Ac. m.a.w. p is een inwendig punt van Ac. Dit geldt voor elkep ∈ Ac, en dus is Ac open. Q.e.d.

Definitie 2.9. Een rij (xn)∞n=1 in X heet convergent als er een x0 ∈ X is zodat

∀ε > 0 ∃nε ∈ IN : n ≥ nε =⇒ d(xn, x0) < ε.

Het punt x0 heet de limiet van de rij.

Stilzwijgend zijn n, nε,m en met andere letters in het midden van het alp-habet genoteerde variabelen vaak elementen van IN. De definitie wordt vaakgeschreven zonder de subindex ε:

∀ε > 0 ∃N : n ≥ N =⇒ d(xn, x0) < ε.

Stelling 2.10. Als de rij (xn)∞n=1 in X convergent is, dan is de limiet x0

eenduidig bepaald, notatie

limn→∞

xn = x0 of xn → x0.

Bewijs. Neem aan dat de rij twee verschillende limieten heeft, zeg x0 en x′0.Omdat x0 6= x′0, is d(x0, x

′0) > 0. Kies 0 < ε < 1

2d(x0, x

′0). Dan is er een nε zo

dat d(xn, x0) < ε voor alle n ≥ nε. Evenzo is er een n′ε zo dat d(xn, x′0) < ε

voor alle n ≥ n′ε. Met behulp van de driehoeksongelijkheid volgt nu

d(x0, x′0) ≤ d(x0, xn) + d(xn, x

′0) < ε+ ε < d(x0, x

′0).

voor n ≥ max(nε, n′e), tegenspraak. Q.e.d.

In plaats van ”de rij (xn)∞n=1 is convergent”, zegt men ook wel dat ”limn→∞ xnbestaat”.

295

Page 296: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Stelling 2.11. Als de rij (xn)∞n=1 in X convergent is, dan is de rij begrensd,d.w.z. bevat in een vaste (open) bol Bδ(a) ⊂ X.

Bewijs. Opgave.

Stelling 2.12. Laat A ⊂ X gesloten zijn. Als de rij (xn)∞n=1 in A convergentis in X, dan ligt de limiet in A.

Bewijs. Opgave.

Stelling 2.13. Laat A ⊂ X en p ∈ X. De volgende drie uitspraken zijnequivalent:(i) p is een ophopingspunt van A.(ii) Er bestaat een rij (an)∞n=1 in A− p = x ∈ A : x 6= p die convergentis met p als limiet.(iii) Iedere (niet-lege) open bol met middelpunt p bevat oneindig veel puntenvan A.

Bewijs. (i =⇒ ii). Neem aan dat p een ophopingspunt van A is. Weconstrueren de rij (an)∞n=1 in A. Kies ε1 > 0. Dan is er een a1 ∈ A − pmet d(a1, p) < ε1. De rij (an)∞n=1 wordt nu verder inductief gedefinieerddoor voor n = 1, 2, . . . , nadat an gekozen is, εn+1 = 1

2d(an, p) te stellen, en

an+1 ∈ A − p met d(an+1, p) < εn+1 te kiezen. Opgave: laat zien datεn+1 <

12εn en dat de rij naar p convergeert.

(ii =⇒ iii). Opgave.(iii =⇒ i). Triviaal.

Correctie! In de 1993-versie stond in Stelling 2.13 en in het bewijs daarvanhier en daar nog een a waar een p moest staan.Het gebruik van definities met de quantor voor alle (∀). Belangrijk isom te onthouden dat een definitie die begint met ∀δ > 0 geldt “iets” waarbijδ een rol speelt, pas echt gebruikt is als voor een rij δn ↓ 0 dat “iets” gebruiktis. En in plaats van δ’s kunnen natuurlijk ook ε’s gebruikt worden.Variaties op het bewijs. Het dalend kiezen van de rij εn > 0 in (i =⇒ ii)kan natuurlijk op vele manieren. Met ε1 = 1 en vervolgens

εn+1 = min(d(an, p),1

n+ 1)

voor ε2, ε3, . . . werkt het bewijs net zo goed. Met die constructie volgt danmeteen dat εn ≤ 1

n. In het als opgave te geven bewijs van an → p moet je

voor alle ε > 0 een N vinden zoals onder Definitie 2.9. Kies daartoe N met1N< ε (waarom kan dat?) en gebruik de bijbehorende εN gedefinieerd zoals

hier direct boven.

296

Page 297: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

De Archimedische eigenschap van de verzameling van de reele ge-tallen. Waarom bestaat er voor elke ε eigenlijk een n met 1

n< ε? Wel,

indien niet dan zou er een ε > 0 zijn met 1n≥ ε en dus n ≤ 1

εvoor alle

n ∈ IN. De (niet-lege) verzameling IN zou dan naar boven begrensd zijn in IRen in IR een kleinste bovengrens S hebben. Dan is S− 1

2geen bovengrens en

dus bestaat er een N ∈ IN met S − 12< N ≤ S en bijgevolg N + 1 > S + 1

2.

Om dat N + 1 ∈ IN kan S dus geen bovengrens zijn van IN, laat staan dekleinste.Zonder epsilons kan het dus ook. De nu bewezen uitspraak dat onderelke ε > 0 altijd een 1

nzit met n ∈ IN wordt de Archimedische eigenschap van

IR genoemd en maakt dat iedere definitie die begint met ∀ε > 0 en eindigtmet < ε kan worden vervangen door een definitie die begint met ∀n ∈ IN eneindigt met < 1

n. Alleen komen we dan al snel letters in het midden van het

alphabet te kort.Om welk axioma voor, of eigenschap van de verzameling van dereele getallen ging het? De Archimedische eigenschap geldt dankzij hetaxioma over het bestaan van kleinste bovengrenzen in IR voor naar boven-grensde niet-lege deelverzamelingen van IR. In het boek van Croom wordtdit besproken in Sectie 2.1.Croom gebruikt in zijn Sectie 3.2 het woord limietpunt als ander woordvoor ophopingspunt. Ik reserveer de term limietpunt voor het gebruik zoals inDefinitie 3.1 hieronder: limiet van een convergente deelrij van een gegeven rij.Dus rijen kunnen limietpunten hebben en verzamelingen ophopingspunten.Een rij in (A of) X is strict genomen ook geen deelverzameling van (A of)X maar een functie of afbeelding van IN naar (A of) X. Croom’s indexverwijst voor limit point naar pagina 66 waar Stelling 3.6 komt na de definitieonderaan pagina 65, en daar zie je dat limietpunt bij Croom een anderenaam is voor ophopingspunt. Een naamgeving wellicht verdedigbaar door deuitspraak dat bij een ophopingspunt p van A in X altijd een rij (an)∞n=1 tevinden is waarvoor d(an, p) strict dalend is in n en convergeert naar 0. Merkop dat voor n→∞ de equivalentie

an → p ⇐⇒ d(an, p)→ 0

vanuit de definitie van convergentie vanzelfsprekend is.

Definitie A-1. Laat weer A ⊂ X met X een metrische ruimte. De afsluitingvan A is de vereniging van A met al zijn ophopingspunten, notatie A. Dusp ∈ A betekent dat de implicatie

p 6∈ A =⇒ p is een ophopingspunt van A

moet gelden.

297

Page 298: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave A-2. Bewijs dat A gesloten is in X. Hint: bewijs dat een opho-pingspunt van A ook een ophopingspunt van A is gebruik Stelling 2.8.

Opgave A-3. De sterkere uitspraak is dat A de kleinste gesloten verzame-ling in X is die A bevat: bewijs dat A de doorsnede is van alle geslotendeelverzamelingen F van X met A ⊂ F . Hint: die doorsnede D is vanvanwege Stelling 2.7 gesloten dus vanwege Opgave A-2 is D ⊂ A. Kan Aophopingspunten hebben die niet in die doorsnede liggen?

Croom noemt de verzameling van alle ophopingspunten de afgeleide verza-meling van A, zonder verdere notatie, en schrijft cl(A) voor A.

We merken nog eens op dat de bovenstaande begrippen in principe afhangenvan de keuze van de metriek op X. Toch kunnen verschillende metrieken tothetzelfde leiden.

Definitie 2.14. Laat X een metrische ruimte zijn met metriek d, en laat deen andere metriek op X zijn. Dan heten d en d equivalent op X als er eenreeel getal λ > 0 bestaat zo dat

1

λd(x, y) ≤ d(x, y) ≤ λd(x, y) ∀x, y ∈ X.

Opgave 2.15. Laat zien dat bij overgang op een equivalente metriek opX de in deze Sectie geintroduceerde begrippen (open, gesloten, convergent,etc.) niet veranderen. Hetzelfde geldt voor de begrippen die in de volgendedrie secties worden behandeld (rijkompaktheid, volledigheid en continuiteit).

Op grond van het voorafgaande is het duidelijk dat voor het welslagen vande in de inleiding geschetste bewijsmethode, de geslotenheid van A vereistis. Dit staat echter los van de vraag of de in de inleiding geconstrueerde rijeen limietpunt heeft.

3. Rijkompakte verzamelingen. We gaan nu de deelverzamelingen Akarakteriseren waarvoor de in de inleiding geschetste bewijsmethode zal sla-gen.

Definitie 3.1. Laat (xn)∞n=1 een rij zijn in X.(i) Als (nk)

∞k=1 een strict stijgende rij natuurlijke getallen is, dan heet de rij

(xnk)∞k=1 een deelrij van (xn)∞n=1.

(ii) Als x0 ∈ X de limiet is van een convergente deelrij van (xn)∞n=1, dan heetx0 een limietpunt (ook wel: rijophopingspunt) van (xn)∞n=1.

Stelling 3.2. Een rij (xn)∞n=1 in X heeft een convergente deelrij met limietx0 dan en slechts dan als

∀ε > 0 ∀n ∃k ≥ n : d(xk, x0) < ε.

298

Page 299: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Bewijs. Opgave.

Definitie 3.3. Laat A ⊂ X. A heet rijkompakt als iedere rij in A eenlimietpunt in A heeft.

Er is nog een andere definitie van kompaktheid die niet uitgaat van de me-triek op X, maar van de open deelverzamelingen van X. In de appendixzullen we deze definitie behandelen, en laten zien dat de beide definities voordeelverzamelingen van metrische ruimten hetzelfde betekenen.

Stelling 3.4. Gesloten deelverzamelingen van rijkompakte verzamelingenzijn rijkompakt.

Bewijs. Merk eerst op: als G ⊂ A ⊂ X, dan kan het gesloten zijn van G optwee manieren worden opgevat: gesloten in A of gesloten in X. Opgave: laatzien dat, als A gesloten is in X, dan

G is gesloten in A ⇐⇒ G is gesloten in X.

Stel dat (an)∞n=1 een rij is in G. Omdat A rijkompakt is, bestaat er eenconvergente deelrij met limiet in A. Daar G gesloten is ligt de limiet in G.Conclusie: elke rij in G heeft een convergente deelrij met limiet in G. Q.e.d.

Stelling 3.5. (i) Laat (X1, d1) en (X2, d2) twee metrische ruimten zijn. Danis het Cartesisch produkt X van X1 en X2,

X = X1 ×X2 = (x1, x2) : x1 ∈ X1, x2 ∈ X2,

weer een metrische ruimte t.a.v. de metriek gedefinieerd door

d(x, y) = d1(x1, y1) + d2(x2, y2) ∀x = (x1, x2), y = (y1, y2) ∈ X = X1 ×X2.

(ii) Als A1 rijkompakt is in X1 en A2 rijkompakt is in X2, dan is A = A1×A2

rijkompakt in X = X1 ×X2.

Bewijs. Opgave.

Stelling 3.6. Laat A een rijkompakte deelverzameling zijn van X. Dan isA gesloten en begrensd.

Bewijs. Opgave.

4. Volledigheid.

Definitie 4.1. Een rij (xn)∞n=1 in X heet een Cauchyrij als

∀ε > 0 ∃nε : m,n ≥ nε =⇒ d(xm, xn) < ε.

Stelling 4.2. Iedere convergente rij is een Cauchyrij.

299

Page 300: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Bewijs. Zij (xn)∞n=1 een convergente deelrij met limiet x0. Laat ε > 0, engebruik de definitie van convergentie met 1

2ε. Dan,

∀m,n ≥ n 12ε : d(xm, xn) ≤ d(xm, x0) + d(x0, xn) <

1

2ε+

1

2ε = ε.

ε > 0 was willekeurig, dus de rij is een Cauchyrij. Q.e.d.

Stelling 4.3. Iedere Cauchyrij is begrensd.

Bewijs. Opgave.

Stelling 4.4. Als een Cauchyrij een limietpunt heeft, dan is de Cauchyrijconvergent.

Bewijs. Laat (xn)∞n=1 een Cauchrij zijn die een convergente deelrij heeft. Laatε > 0 en gebruik de definitie van Cauchyrij. Dus

∀m,n ≥ nε : d(xm, xn) <1

2ε.

Anderzijds, omdat de rij een convergente deelrij heeft, zeg met limiet x0,bestaat er een kε > nε zodat

d(xkε , x0) <1

2ε.

Beide ongelijkheden combinerend vinden we

∀n ≥ nε : d(xn, x0) ≤ d(xn, xkε) + d(xkε , x0) <1

2ε+

1

2ε = ε.

Definitie 4.5. Als iedere Cauchyrij in X convergent is, dan heet X volledig.

Om na te gaan of een rij (xn)∞n=1 in een volledige metrische ruimte X con-vergent is, hoeft men slechts na te gaan dat de rij een Cauchyrij is. Daarbijis het niet nodig om a priori de limietwaarde te kennen. Het bewijs van eenbelangrijke stelling in de analyse, de Banach contractie stelling, berust opdit principe:

Stelling 4.6. Laat X een volledige metrische ruimte zijn, en T : X → Xeen contractie, d.w.z. een afbeelding met de eigenschap dat

∃θ ∈ [0, 1) ∀x, y ∈ X d(T (x), T (y)) ≤ θd(x, y).

Dan is er precies een vast punt van T , d.w.z. een punt x in X met deeigenschap dat T (x) = x. Bovendien geldt voor elke x ∈ X dat de rijgedefinieerd door

x1 = T (x), xn+1 = T (xn) (n = 1, 2, . . . ),

300

Page 301: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

convergent is met limiet x.

Bewijs. Merk eerst op dat er hoogstens een vast punt kan zijn, immers als xen y vaste punten zijn, dan

d(x, y) = d(T (x), T (y)) ≤ θd(x, y) =⇒ d(x, y) = 0 =⇒ x = y.

Laat nu x ∈ X willekeurig en laat de rij (xn)∞n=1 de in de stelling gedefini-eerde rij zijn. We gaan bewijzen dat dit een Cauchyrij is. Neem hiertoe tweenatuurlijke getallen m,n met m < n. Dan, door herhaald toepassen van dedriehoeksongelijkheid,

d(xm, xn) ≤ d(xm, xm+1) + d(xm+1, xm+2) + · · ·+ d(xn−1, xn).

We gebruiken de notatie

T 0(x) = x, T 1(x) = T (x), T 2(x) = T (T (x)), T 3(x) = T (T (T (x))), etc.

Omdatd(xk, xk+1) = d(T k(x), T k+1(x)) ≤ θkd(x, T (x)),

volgt nu dat

d(xm, xn) ≤ (θm+θm+1+· · ·+θn−1)d(x, T (x)) ≤ θm

1− θd(x, T (x))→ 0 als m→∞.

Dus (xn)∞n=1 is een Cauchyrij. Omdat X volledig is heeft deze rij een limietx, dus T n(x)→ x. Maar dan geldt ook dat T n+1(x)→ x, terwijl

d(T n+1(x), T (x)) = d(T (T n(x)), T (x)) ≤ θd(T n(x), x) ≤ d(T n(x), x)→ 0.

Dit impliceert dat T n+1(x) → T (x). Omdat de limiet van een convergenterij uniek bepaald is, kunnen we dus concluderen dat x = T (x). Q.e.d.

Er is nog een andere karakterisatie van het begrip volledigheid, die wordtgegeven door de volgende stelling.

Stelling 4.7. (Cantor) Een metrische ruimte X is volledig dan en slechtsdan als voor elke dalende rij gesloten deelverzamelingen

F1 ⊃ F2 ⊃ F3 . . . ,

met de eigenschap dat

diam(Fn) = supx,y∈Fn

d(x, y)→ 0 als n→∞,

geldt dat de doorsnede∩∞n=1Fn

precies een punt bevat.

301

Page 302: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

5. Continue afbeeldingen.

Definitie 5.1. Laat X en Y metrische ruimten zijn, A ⊂ X, en f : A → Yeen afbeelding. (i) f heet continu in a ∈ A, als

∀ε > 0 ∃δ > 0 ∀x ∈ A : d(x, a) < δ =⇒ d(f(x), f(a)) < ε.

(ii) f heet continu in A als f continu is in elke a ∈ A.

Stelling 5.2. Laat X en Y metrische ruimten zijn, A ⊂ X, f : A → Yeen afbeelding, en a ∈ A. Dan is f continu in a dan en slechts dan als voorelke rij (an)∞n=1 in A met an → a in X geldt dat f(an)→ f(a) in Y .

Bewijs. Neem aan dat f continu is in a en laat (an)∞n=1 een rij zijn in Amet an → a. Kies ε > 0 willekeurig, en laat δ > 0 de bijbehorende δ uitde definitie van continuiteit van f in a zijn. Gebruik deze δ nu als ε in dedefinitie van convergentie. Dan

n ≥ nδ =⇒ d(an, a) < δ =⇒ d(f(an), f(a)) < ε.

Dus de rij (f(an))∞n=1 convergeert naar f(a).Anderzijds, als f niet continu is in a, dan

∃ε > 0 ∀δ > 0 ∃aδ ∈ A : d(aδ, a) < δ en d(f(aδ), f(a)) ≥ ε.

Kies nu δ = 1n, en noem de bijbehorende aδ nu an, dan is (an)∞n=1 een rij in

A met an → a, terwijl de rij (f(an))∞n=1 niet convergeert naar f(a). Q.e.d.

Stelling 5.3. Laat X en Y metrische ruimten zijn, en f : X → Y eenafbeelding. Dan is f continu op X dan en slechts dan als het inverse beeld on-der f van iedere open deelverzameling van Y weer een open deelverzamelingvan X is.

Bewijs. Neem aan dat f continu is, en zij B een open verzameling in Y .We moeten bewijzen dat het inverse beeld onder f van B open is. We latenzien dat elk punt van A = f−1(B) een inwendig punt is. Laat hiertoe a ∈ Aen b = f(a) ∈ B. Omdat B open is, is b een inwendig punt van B, dus erbestaat een ε > 0 met Bε(b) ⊂ B. Kies de bij ε horende δ uit de definitievan continuiteit. Dan f(Bδ(a)) ⊂ Bε(b) waardoor Bδ(a) ⊂ A = f−1(B). Ditgeldt voor elke a ∈ A, dus A is open.

Omgekeerd, als het inverse beeld van elke open verzameling open is, is tebewijzen dat f continu is in elk punt van X. Laat hiertoe a ∈ X en b = f(a),en zij ε > 0 willekeurig. Dan is Bε(b) open in Y , dus A = f−1(Bε(b)) is openin X, en omdat a ∈ A, is er een δ > 0 zo dat Bδ(a) ⊂ A. Met deze δ is danaan de uitspraak in de definitie van continuiteit voldaan. Q.e.d.

302

Page 303: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Tot nu toe hebben we gesproken over afbeeldingen f : X → Y . Vaakworden afbeeldingen ook functies genoemd, met name in het geval dat Y =IR. We keren nu terug naar de vraagstelling in de inleiding.

Stelling 5.4. Laat A ⊂ X, en f : A → IR een continue functie. Als Arijkompakt is, dan heeft f een maximum in A.

Bewijs. Met dit bewijs waren we al begonnen in de inleiding. Dus laat(xn)∞n=1 de rij zijn waarvan de functiewaarden het supremum M van f op Abenaderen, zoals precies gemaakt in de inleiding. Omdat A rijkompakt is,heeft deze rij een convergente deelrij (xnk)

∞k=1 met limiet a ∈ A. Vanwege

de continuiteit van f in a is de rij (f(xnk))∞k=1 convergent met limiet f(a).

Omdat een convergente rij begrensd is sluit dit de mogelijkheid M = +∞uit, zo dat

M − 1

n< f(xn) ≤M.

Dit impliceert dat de rij (f(xn))∞n=1 convergeert naar M . Maar een deelrijconvergeert naar f(a). Dus f(a) = M . Q.e.d.

Stelling 5.5. Laat X en Y metrische ruimten zijn, A ⊂ X, en f : A → Yeen continue afbeelding. Als A rijkompakt is in X, dan is het beeld van Aonder f ,

R(f) = f(a) : a ∈ A,rijkompakt in Y .

Bewijs. Opgave.

Definitie 5.6. Laat X en Y metrische ruimten zijn, A ⊂ X, en f : A → Yeen afbeelding. Dan heet f uniform continu in A, als

∀ε > 0 ∃δ > 0 ∀x, y ∈ A : d(x, y) < δ =⇒ d(f(x), f(y)) < ε.

Stelling 5.7. Laat X en Y metrische ruimten zijn, A ⊂ X, en f : A → Yeen continue afbeelding. Als A rijkompakt is in X, dan is f uniform continuin A.

Bewijs. Stel niet, dan

∃ε > 0 ∀δ > 0 ∃x, y ∈ A : d(x, y) < δ en d(f(x), f(y)) ≥ ε.

Kies δ = 1n

en laat xn en yn de bijbehorende x en y zijn zoals in de regelhierboven. Omdat A rijkompakt is heeft de rij (xn)∞n=1 een convergente deelrij(xnk)

∞k=1, zeg met limiet a ∈ A. Dan is ook de rij (ynk)

∞k=1 convergent met

dezelfde limiet. (Waarom?) Maar nu geldt

limk→∞

f(xnk) = limk→∞

f(ynk) = f(a),

303

Page 304: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

terwijl d(f(xnk), f(ynk)) ≥ ε, tegenspraak. Q.e.d.

6. Het geval X = IR en X = IRN . We hebben gezien dat rijkompaktedeelverzamelingen van X altijd gesloten en begrensd zijn. Als X = IR, geldtook het omgekeerde. We laten dit eerst zien voor een gesloten begrensdinterval.

Stelling 6.1. (Heine-Borel) Laat a, b ∈ IR. Dan is het gesloten begrensdeinterval

[a, b] = x ∈ IR : a ≤ x ≤ b

rijkompakt.

Bewijs. Laat (xn)∞n=1 een rij zijn in [a, b]. We moeten bewijzen dat deze rijeen convergente deelrij heeft met limiet in [a, b]. We delen hiertoe het intervalin twee gelijke stukken, d.w.z. in

[a,a+ b

2] en [

a+ b

2, b].

Dan bevat tenminste een van deze twee intervallen voor oneindig veel waardenvan n het rijelement xn. Als we dit interval [a1, b1] noemen, kunnen we duseen deelrij van (xn)∞n=1 kiezen die volledig bevat is in [a1, b1]. Noteer deze rijals (x1

n)∞n=1. Dit argument herhalende, krijgen we een dalende rij intervallen

[a, b] ⊃ [a1, b1] ⊃ [a2, b2] ⊃ [a3, b3] ⊃ . . . ,

en bijbehorende steeds verdere deelrijen, genoteerd als (xjn)∞n=1, met dezelfdeeigenschap, namenlijk dat elke deelrij (xjn)∞n=1 steeds volledig bevat is in[aj, bj].

Vervolgens nemen we de zogenaamde diagonaalrij, dat is de rij (xnn)∞n=1.Dit is zelf weer een deelrij van de oorspronkelijke rij (xn)∞n=1, en er geldt datxnn ∈ [an, bn].

Nu is (an)∞n=1 een begrensde niet-dalende rij getallen, en (bn)∞n=1 een be-grensde niet-stijgende rij getallen. Dus bestaan

α = supnan en β = inf

nbn,

a ≤ α ≤ β ≤ b, en α, β ∈ [an, bn] voor elk natuurlijk getal n.

Bovendien is |β − α| ≤ bn − an = 2−n(b− a) voor elk natuurlijk getal n, dusα = β.

Zij ε > 0. Dan is er een nε zodat

α− ε < anε ≤ α = β ≤ bnε < β + ε.

304

Page 305: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Maar dan geldt voor elke n ≥ nε dat

α− ε < anε ≤ an ≤ xnn ≤ bn ≤ bnε < β + ε.

Dusxnn ∈ (α− ε, α + ε), m.a.w. |xnn − α| < ε.

Omdat ε > 0 willekeurig was betekent dit dat de (deel)rij (xnn)∞n=1 convergentis met limiet α ∈ [a, b]. Q.e.d.

Gevolg 6.2. (Bolzano-Weierstrass) Iedere begrensde rij in IR heeft eenconvergente deelrij.

Stelling 6.3. Laat A ⊂ IR. Dan geldt

A is rijkompakt ⇐⇒ A is gesloten en begrensd.

Bewijs. Opgave.

Stelling 6.4. Laat A een gesloten begrensde deelverzameling van IR zijn.Als f : A → IR een continue functie is, dan heeft f een maximum in A.

Bewijs. Opgave.

Stelling 6.5. Iedere Cauchyrij in IR is convergent (m.a.w. IR is volledig).

Bewijs. Opgave.

Stelling 6.6. (absoluut convergente reeksen zijn convergent) Als (an)∞n=1

een rij is in IR, en∞∑n=1

|an| = limk→∞

k∑n=1

|an|

bestaat, dan bestaat ook

∞∑n=1

an = limk→∞

k∑n=1

an.

Bewijs. Opgave. Hint: laat zien dat de rij (sk)∞k=1, gedefinieerd door

sk =k∑

n=1

an,

een Cauchyrij is.

De laatste vijf stellingen gelden ook voor de metrische ruimte

IRN = x = (x1, x2, . . . , xN) : x1, x2, . . . , xN ∈ IR, (N ∈ IN)

305

Page 306: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

met de standaard Euclidische metriek

d(x, y) =√

(x1 − y1)2 + (x2 − y2)2 + · · ·+ (xN − yN)2.

Dit kunnen we inzien door IRN op te vatten als het herhaald Cartesischprodukt van IR met zich zelf. Echter, de produktmetriek zoals gedefinieerdin Sectie 3, is niet de Euclidische metriek, maar

dprod(x, y) = |x1 − y1|+ |x2 − y2|+ · · ·+ |xN − yN |.

Opgave 6.7. Laat zien dat deze twee metrieken equivalent zijn, en bewijsStelling 6.2 tot en met 6.6 voor IRN .

Appendix. Kompaktheid en rijkompaktheid.

Definitie. Laat A ⊂ X.(i) Een door een verzameling I geindexeerde collectie (open) deelverzamelin-gen Oi : i ∈ I van X heet een (open) overdekking van A als

A ⊂ ∪i∈IOi.

(ii) Als iedere open overdekking Oi : i ∈ I van A een eindige deeloverdek-king van A bevat, d.w.z.

∃i1, i2, . . . , im ∈ I : A ⊂ ∪j=1,2,...,mOij ,

dan heet A kompakt .

Stelling. Laat A ⊂ X. Dan

A is kompakt ⇐⇒ A is rijkompakt.

Bewijs. ( =⇒ ). Stel A is kompakt en laat (an)∞n=1 en rij zijn in A. Wemoeten bewijzen dat A een convergente deelrij met limiet in A heeft. Stelniet, dan is er voor elke p ∈ A een εp > 0 en een np zodanig dat an 6∈ Bεp(p)voor alle n > np. Neem nu als open overdekking van A de zojuist gevondenopen bollen, dus

Bεp(p) : p ∈ A.Omdat A kompakt is heeft deze overdekking een eindige deeloverdekking,dus er zijn p1, p2, . . . , pm in A zodat

A ⊂ Bεp1(p1) ∪Bεp2

(p2) ∪ · · · ∪Bεpm (pm),

waardoor A op zijn hoogst n1 + n2 + · · · + nm punten van de rij kan be-vatten, m.a.w. de rij bevat slechts eindig veel verschillende punten van A,

306

Page 307: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

en tenminste een punt moet dus oneindig vaak voorkomen. Dus kunnen weeen deelrij maken waarin dit punt alleen maar voorkomt, en dit is dan degezochte deelrij.

(⇐) Dit heeft wat meer voeten in de aarde. Daartoe eerst het volgende.

Definitie. Laat A een deelverzameling zijn van een metrische ruimte X.Dan heet A aftelbaar kompakt als voor elke rij open verzamelingen (On)∞n=1

metA ⊂ ∪∞n=1On,

er een index k is zo datA ⊂ ∪kn=1On.

Stelling. Als A ⊂ X rijkompakt is, dan is A aftelbaar kompakt.

Bewijs. Neem aan dat A rijkompakt is maar niet aftelbaar kompakt. Danis er een rij open verzamelingen (On)∞n=1 van A die A geheel bedekt, en diegeen eindige deeloverdekking heeft. Dat betekent dat er voor elk natuurlijkgetal k een punt pk in A is met

pk 6∈ ∪kn=1On.

Omdat A rijkompakt is heeft de rij (pn)∞n=1 een convergente deelrij met limietp in A. Dus moet er een m zijn waarvoor p ∈ Om. Omdat Om open is zijner dus oneindig veel punten van de rij (pn)∞n=1 die in Om liggen. Voor n > mis dit in tegenspraak met de keuze van pn. Q.e.d.

Definitie. Laat A een deelverzameling zijn van een metrische ruimte X.Dan heet A totaal begrensd als er voor elke ε > 0 een eindige deelverzamelingp1, p2, . . . , pn van A bestaat met

A ⊂ Bε(p1) ∪Bε(p2) ∪ · · · ∪Bε(pn).

Stelling. Als A ⊂ X rijkompakt is, dan is A totaal begrensd.

Bewijs. Stel A is niet totaal begrensd. Dan is er een ε > 0 waarvoor geeneindige verzameling als in de definitie kan worden gevonden. Kies nu p1 ∈ A.Inductief kiezen we nu voor n = 1, 2, . . . een punt pn+1 ∈ A met de eigenschapdat

pn+1 6∈ Bε(p1) ∪Bε(p2) ∪ · · · ∪Bε(pn).

Maar dan is d(pi, pj) ≥ ε voor alle i 6= j. Dus de rij (pn)∞n=1 kan geenconvergente deelrij hebben, in tegenspraak met de rijkompaktheid van A.Q.e.d.

307

Page 308: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Definitie. Een metrische ruimte X heet separabel als er een rij is in X zodat elk punt van X een limietpunt is van deze rij.

Stelling. Als A ⊂ X totaal begrensd is, dan is A separabel.

Bewijs. Voor elke k bestaat er een eindige deelverzameling Ak van A zo datelk punt van A dichter dan 1

kbij een punt van Ak ligt. Maak nu een rij door

eerst de elementen van A1 te kiezen, dan de elementen van A2, A3, enzovoort.Dan is elk punt van A een limietpunt van de aldus verkregen rij. Q.e.d.

Stelling. Als A ⊂ X separabel is, dan heeft elke open overdekking van Aeen aftelbare deeloverdekking.

Bewijs. Laat (pn)∞n=1 een rij zijn in A met de eigenschap dat elk punt vanA limietpunt is van deze rij, en laat Oi : i ∈ I een open overdekking zijnvan A. Dan is elk punt p in A bevat in een Oi. Kies nu een natuurlijk getalm zo groot dat B 2

m(p) ⊂ Oi, en daarna een n zo dat d(pn, p) <

1m

. Dan is

p ∈ B 1m

(pn) ⊂ Oi.

Laat J de verzameling zijn van de paren natuurlijke getallen (m,n) die wezo tegenkomen als p de verzameling A doorloopt. Dan is J aftelbaar en

A ⊂ ∪(m,n)∈JB 1m

(pn).

Maar voor elke (m,n) ∈ J is er tenminste een Oi die B 1m

(pn) bevat. Kies er

voor elke (m,n) ∈ J precies een. Dit geeft een aftelbare deelcollectie die Aoverdekt. Q.e.d.

Uit bovenstaande stellingen volgt dat als A ⊂ X rijkompakt is, dat A ook”gewoon”kompakt is.

Leiden, juni 1993.

308

Page 309: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

TUSSENWOORD

Dit boek is een redelijk systematische inleiding in de analyse geworden.

Er is (nog) geen literatuurlijst. Alles is uit de lucht geplukt. Alleen aan hetLemma van Morse had ik niet gedacht om het op te nemen. De formuleringen het bewijs van Stelling 11.6 zijn een aanpassing van wat de Utrechterskennen uit het vermaarde Analyse dictaat van Duistermaat en Kolk. BobRink gaf me dat dictaat, dat daarna een boek geworden is, in verband metwat iedereen over sub- en immersies zou moeten weten. Nu, dat wordt doordit nieuwe manuscript wel gedekt, al worden de woorden nog niet explicietgebruikt. En toen zag ik daar dat Lemma van Morse als toepassing van deimpliciete functiestelling. Aardig nu is dat je die impliciete functiestellinghelemaal niet nodig hebt omdat de matrixvergelijking in het bewijs van hetLemma van Morse makkelijker is dan’ie eruit ziet. Maar dat zag ik pas bij hetin stelling brengen van die stelling ten behoeve van (11.10). Wel leerzaam,in meerdere opzichten.

Het nieuwe Hoofdstuk 8 is geschreven terwijl ik uit de boeken van Edwardsen Evans college gaf. In Hoofdstuk 12 heb ik ook een oude Leids dictaatjegehangen waarvan ik de texfile onlangs teruggevonden heb. Dat dictaatjeheeft flinke overlap met de eerste twee secties van die appendix. Uit de tijddat ik nog braaf < ε schreef i.p.v. ≤ ε.

De index moet nog bijgewerkt worden. Wat er na de index komt wordtonderdeel van een groter boek, zie Hoofdstuk 7.

309

Page 310: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Index

∀ε > 0, zie voetnoten, 25e tot de macht x, 95

absolute waarde van z ∈ IC, 106absoluut convergent, 62, 464afgeleide functie, 49afgeleide in punt: F ′(x0) = f(x0), 48afhankelijke variabelen, 196algebra voor afgeleide van x7, 86alles via convergente rijen, 27arctangens en zo, 99argument van z ∈ IC: arg z, 106asymptotische formules, 92axioma’s voor de natuurlijke getallen,

467

Banachruimte C([a, b]), 34Basisboek Wiskunde, 464bijecties komen in paren, 54bolcoordinaten, 206Boolese algebra, 467bovengrens, 24bovensom, 20

Cauchy integraalformule, 217Cauchy integraaltransformatie, 219Cauchyrij, 464cijferen, 448, 449, 453, 456commutatieve Banachalgebra, 34complexe getallen, 106continu in een punt, 26continuıteit: regels, 85convergent, 464convergentiestraal, 88cosinus, 95

delen vermijden., 116delta expliciet bij 2ε, 87differentiaaloperator, 197

differentiaalquotient, 81differentiaalvergelijking, 89differentieerbaarheid impliciete f , 61differentieerbare functie, 49differentiequotienten, 49differenties als

∫ 1

0, 53

divergentie, 198divergentie in poolcoordinaten, 203domein, 470driehoeksongelijkheid integralen, 33dummy, 22dynamisch systeem, 94

echte toepassing, 94eenparige cirkelbeweging, 96epsilons en delta’s rijgen, 28, 59equivalentieklasse, 469equivalentierelatie, 469exp, 95

Flowers for Algernon, 220Fourierreeks, 206

gehele getallen IZ, 443gemeenschappelijke verfijning, 26gradient, 65, 197gradient in poolcoordinaten, 203grafiek, 14, 470grote O van, 54

Holder continu, 26harmonische polynomen, 115hoofdstelling van de algebra, 107

iedere begrensde rij in IR heeft......, 29implicatie, 466impliciete functiestelling, 64in de buurt van, 55in het echte leven, 192

310

Page 311: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

index nog niet klaar, 3infimum, 24injectief, 54inleveren, 469integraal

∫ baf(x) dx, 22

integraal met parameter, 73integraalrekening: hoofdstelling 1, 49integraalrekening: hoofdstelling 2, 51integreerbaar: definitie, 30inverse functies op intervallen, 54inverse via meetkundige reeks, 63IS, 78

Jacobimatrix, 201

kansdichtheden, 194kettingregel, 3, 82, 84, 131, 196, 199kleine o van, 48kleinste bovengrens, 462kopen dat boekje, 443kwadratische vorm, 253

Laplaciaan, 113Laurentreeks, 218Lemma van Morse, 251limiet van een functie voor x→ a, 27limietpunt, 28, 39lineaire benadering met restterm, 47Lipschitz continu, 26, 47, 53, 60, 69

machtreeksen, 87, 471matrix, 111matrixrekening, 117matrixvergelijking, 474maxima en minima, Opgave 2.35, 29meerwaardige functie, 110meetkundige reeks, 59, 63, 116, 121,

123, 217, 219middelwaardestelling, 49, 58, 471mulitplicatorenstelling, 69

natuurlijke getallen IN, 443

Newton schema aangepast, 57Newton’s methode voor nulpunten, 56normale verdeling, 195

omgekeerde 3-hoeksongelijkheid, 228ondersommen, 20onvoorwaardelijk convergent, 464oppervlakte, 468

partitie, 20polygonaal pad, 210primitieve functie, 49probleemstelling, 251, 471, 472produktregel, 83

quotientregel, 85

radialen, 95, 96rationale getallen IQ, 470reele getallen IR, 443reeks, 462regel van Leibniz, 83relatie, 469resolvente van A, 242restterm, 48, 66, 72, 76, 83, 110rijnotatie, 465Ronald, 469

scheiding van variabelen, 204sinus, 95spectrum σ(A) van A, 242sport, 472standaardlimiet, 90startwaarde voor iteratie, 56stationair (punt), 50stationair punt, 251Stirling uitroepteken, 93substitutieregel voor integralen, 77supremum, 24surjectief, 54

tautologie, 462Taylor benaderingen, 75

311

Page 312: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

techniek, 472totaal differentieerbaar, 65transponeren, 117, 201tussen, 23tussen (al of niet strict), 20tussenpunten, 23tweede orde afgeleiden, 78, 113

uniform continu, 25

vast punt van stricte contractie, 60vectorruimte over IR, 32verfijnen van een partitie, 24verwisselen integralen limieten, 34, 103volledige inductie, 466voor alle ε > 0, zie voetnoten, 25vreemde functies, 99

waardenverzameling, 23wat praktischer: ≤ ε, 465wiskundig netjes, 467

zigzagintegraal, 216, 220zonder ordening boven- en onder, 36zonder woorden alleen kwantoren, 27

312

Page 313: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

13 Terug naar het platte vlak

In dit hoofdstuk verzamelen we op informele wijze onze basiskennis over hetplatte vlak, met in ons achterhoofd de gedachte dat we later niet in twee maarin meer dimensies willen denken en werken: 3, 4, . . . , tot en met aftelbaaroneindig. Bij het schrijven van dit hoofdstuk beginnen we in taal die hopelijkook aansluit bij de schoolles, en nemen we soms ook dat perspectief als hetgaat om wat we met inproducten van vectoren formuleren. Wie voor de klasstaat of gaat staan heeft daar wellicht profijt van. De meeste opgaven zijnbedoeld als onderdeel van de uitleg. Convexe en gesloten deelverzamelingen,Cauchyrijen, en projecties zijn de belangrijkste begrippen die langskomen.

13.1 Punten en vectoren in het platte vlak

Opgave 13.1. Neem pen en blanco papier en teken een xy-vlak1.

Zo, nu kunnen we aan de slag. Met en in een plat vlak waarin elk punt Pgegeven is door 2 reele coordinaten, zeg a ∈ IR en b ∈ IR. De assen labelen wemet x en y. Het punt P is dus het punt met x = a en y = b. We nummerenin deze notatie dus met het alfabet en zolang we in het vlak zitten is datgeen probleem. Ook in de 3-dimensionale ruimte kunnen we met 3 assen enx = a, y = b, z = c prima uit de voeten maar vanaf dimensie 4 is het alfabetop als we beginnen bij x.

Op enig moment zullen we dus liever vanaf het begin met x1 = a1 enx2 = a2 willen werken. Een punt P gegeven door x1 = a1 en x2 = a2

kunnen we dan gewoon x noemen, soms dik gedrukt als x, hetgeen met penen papier weer vervelend is. Daarom ook vaak de notatie x = (x1, x2) vooreen willekeurig, onbekend of variabel punt in het vlak, en vaak a = (a1, a2)voor een gegeven (vast) punt2 in het vlak. De assen zijn dan de x1-as en dex2-as.

De punten (1, 0) en (0, 1) markeren we door er een 1 bij te zetten waarmeede schaalverdeling op de assen vast ligt. Beide punten zien we als liggend opafstand 1 tot de oorsprong (0, 0), zonder fysische eenheid3. Het punt (1, 1)heeft met Pythagoras dan afstand

√2 tot (0, 0).

Van een punt kun je een vector maken. In de tekening door een lijntjete trekken van de oorsprong O = (0, 0) naar een punt a = (a1, a2) met een

1 Suggestie: x-as horizontaal naar rechts, y-as verticaal omhoog.2 Dat we ook weer kunnen varieren natuurlijk.3In de schoolpraktijk wordt vaak 1 cm als afstand tussen (0, 0) en (1, 0) aangehouden.

313

Page 314: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

pijlkopje in a. Het pijltje associeren we met de vector

~a =

(a1

a2

),

en de lengte van het pijltje is met Pythagoras weer gelijk aan√a2

1 + a22.

Correspondentie met de tekening of niet, de (Euclidische) norm van a en ~ais bij afspraak gelijk aan en genoteerd als

|a| = |~a| =√a2

1 + a22,

en voldoet aan de driehoeksongelijkheid. Er geldt voor alle ~a,~b ∈ IR2 dat

|~a+~b| ≤ |~a|+ |~b|,

het derde axioma voor de eigenschappen waar normen aan moeten voldoen.

Opgave 13.2. De eerste twee norm-axioma’s zijn |~a| > 0 als ~a niet de nulvectoris en |t~a| = |t||~a| voor t ∈ IR en ~a ∈ IR2. Verifieer dat de Euclidische norm aan denorm-axioma’s voldoet.

We denken aan ~a als een pijltje dat we op kunnen schuiven4 zodat destaart in een ander punt komt te liggen. Bijvoorbeeld in het punt b, zodatde kop van het pijltje in het punt

c = a+ b = (a1, a2) + (b1, b2) = (a1 + b1, a2 + b2)

komt te liggen, waarbij we dan de vector

~c = ~a+~b =

(a1

a2

)+

(b1

b2

)=

(a1 + b1

a2 + b2

)hebben. De vector ~a ligt dan met zijn staart in b en met zijn kop in c. Datkan natuurlijk ook andersom, met de staart van ~b in a en de kop van ~b in c.De afstand tussen c en b is dus de lengte van het pijltje ~a = ~c−~b: de normvan de vector ~a = ~c−~b.

We switchen regelmatig heen en weer tussen rij- en kolomnotatie en tussenpunten en vectoren, al naar gelang het zo uitkomt. Een in de tijd bewegendpunt x heeft op elk moment een snelheid ~v die we ons vanwege de fysische

4 In het platte vlak geen probleem maar google op Gauss en kromming.

314

Page 315: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

interpretatie het liefst met de staart in x voorstellen. En als het handig isdan zien we x ook als ~x. Bijvoorbeeld in

~x = ~s+ t~v =

(s1

s2

)+ t

(v1

v2

)=

(s1

s2

)+

(tv1

tv2

)=

(s1 + tv1

s2 + tv2

),

de formule5 voor een punt dat beweegt over een rechte lijn l door het punt smet snelheidsvector ~v.

Opgave 13.3. De lijn l door s ∈ IR2 met richtingsvector ~v ∈ IR2 kan ook gegevenworden door een vergelijking van de vorm

a1x1 + a2x2 = c

voor de punten x = (x1, x2) op de lijn l. Voor welke lijnen kan dat met c = 1? Bepaalvoor die lijnen de bijbehorende a1 en a2.

Naast de vectoroptelling is in de vectorvoorstelling van een rechte lijnmet steunvector ~s en richtingsvector ~v ook de scalaire vermenigvuldiginggebruikt. Voor iedere t ∈ IR en ~v ∈ IR2 is t~v gedefinieerd zoals je zouverwachten. De formule voor ~c = ~a +~b gaat via ~c = ~x, ~a = ~s en ~b = t~v overin de vectorvoorstelling van de lijn, waarin ~x de met t varierende vector isbij het punt x.

In de formules mogen alle punten in het platte vlak voorkomen. En allepunten dat zijn alle punten van de vorm x = (x1, x2) met x1, x2 ∈ IR. Hetplatte vlak past daarmee weliswaar niet in ons universum maar gelukkigwel in ons hoofd, waar het de naam IR2 gekregen heeft, met de 2 van 2-dimensionaal.

Ieder element uit de verzameling IR2 wordt gegeven door een geordendreeel getallenpaar dat we aan kunnen geven met de letters die we willen, enmet de notatie die we willen. Nummerend met het alfabet of met indices 1en 2, achter elkaar of boven elkaar als

v1

(10

)+ v2

(01

)= v1~e1 + v2~e2

geschreven, of eventueel ook als

v1 + iv2,

5 Vectorvoorstelling van een lijn.

315

Page 316: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

als maar duidelijk is dat v1 de eerste, en v2 de twee coordinaat is. De laatstetwee vormen suggereren alvast de correspondentie

1 ↔ ~e1 =

(10

)i ↔ ~e2 =

(01

)en de representatie van de complexe getallen IC als het (complexe) vlak IR2

met een wat rare notatie6.

13.2 Kortste afstanden

De kortste verbinding tussen twee punten in het vlak is de rechte lijn. Inwelk vlak? In het vlak dat we in ons hoofd hebben via de introductie vanIR2 in Sectie 13.1. Welke punten? Iedere a en b in die IR2. Welke rechte lijn?Geen rechte lijn, maar het lijnstuk

ta+ (1− t)b : 0 ≤ t ≤ 1,

een stuk van de rechte lijn door steunvector b met richtingsvector ~a−~b.Er zijn geen andere paden van b naar a met een kortere afgelegde weg, een

in het dagelijks leven op het Groningse platte land geboren uitspraak overalle paden van b naar a, waarin twee begrippen voorkomen die wiskundiggezien hier nog niet eens gedefinieerd7 zijn. Maar die kortste afgelegde wegmoet natuurlijk wel gelijk zijn aan wat we de afstand tussen a en b noemen.Kortom, kortste afstanden gaan hier niet nog even niet over de weg van anaar b. Er is maar een afstand tussen a en b en dat is

d(a, b) = |a− b| =√

(a1 − b1)2 + (a2 − b2)2 = |~a−~b|,

de lengte van de vector ~a−~b.Over de kortste afstand tussen a en b hoeven we het dus in het platte

vlak niet te hebben. Daar is een formule voor die we als vanzelfsprekendzien. En die formule definieert een afstandsbegrip dat voldoet aan axioma’s:de axioma’s van een metriek8.

Maar wat is de kortste afstand tussen een niet-lege deelverzameling Avan IR2 en een punt b? Met andere woorden, als de functie fb : IR2 → IRgedefinieerd wordt door

fb(x) = d(x, b) = |~x−~b|,6 En extra algebra gebaseerd op de afspraak dat i keer i is i2 = −1.7 Om welke twee begrippen gaat het?8 Wat is een metriek? Zoek op.

316

Page 317: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

wat kun je dan zeggen over de waardenverzameling

W = fb(x) : x ∈ A ?

Heeft deze deelverzameling van IR een kleinste element?Wel, de waardenverzameling W is niet leeg en naar beneden begrensd

door 0. Op grond van de axioma’s (of eigenschappen) van de reele getallenheeft W dus een grootste ondergrens9 d die we vanaf nu de afstand van b toA noemen:

d = d(b, A) = inf W = infx∈A

d(x, b).

Dus ook als de kleinste waarde niet bestaat, of als we dat niet a priori weten,is zo de afstand d tussen b en A wiskundig gedefinieerd. Of d nu wordtaangenomen door d(x, b) voor een x in W of niet.

De wiskundige definitie vertelt ons dat voor iedere10 positieve gehele n ereen xn ∈ A is met

d(b, A) ≤ d(b, xn) < d(b, A) +1

n,

want iedere n waarvoor zo’n x niet bestaat zou een grotere ondergrens voorW zijn. Of je de wiskundige de afstand d ook echt kan vinden als horendebij een a ∈ A via d = d(a, b) is maar de vraag natuurlijk.

Een strategie om aan de kleinste waarde d te komen is om de rij xn con-vergent te kiezen. Als dat kan dan heeft de rij een limiet a. Als vervolgensblijkt dat a in A ligt volgt hopelijk ook dat d(b, A) = d(b, a). En blijft vervol-gens nog de vraag of het punt in A waarin de kleinste afstand aangenomenwordt uniek is. Het gaat dus om twee zaken. Het vinden van convergerendeminimaliserende rijen in A en daarna de vraag om daar altijd dezelfde limietbij hoort.

Maar soms kun je d meteen uitrekenen. Hoewel?

Opgave 13.4. Wat is de kortste afstand tussen a = (1, 1) en de lijn met vergelijking3x1 + x2 = 1?

Opgave 13.5. De kortste afstand tussen a = (1, 1) en de deelverzameling E ⊂ IR2

gegeven door 9x21 + x2

2 ≤ 1 is niet zo eenvoudig uit te rekenen. Probeer het maar.Maar is het punt in E met minimale afstand tot a uniek denk je? Waarom? Maakeen plaatje.

9 Ander woord: infimum.10 We mijden hier de ε > 0, for all practical purposes is 1

n net zo goed.

317

Page 318: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 13.6. Reflecteer11 op wat het begrip loodrecht met het begrip afstand temaken heeft.

Opgave 13.7. Teken voor verschillende (reele) waarden van a en b in je xy-vlak devectoren12 (

a

b

)en

(−ba

)en reflecteer op het begrip loodrecht. Kun je andere paren vectoren in het vlak be-denken waarop het begrip loodrecht van toepassing is?

Opgave 13.8. Een deelverzameling K ⊂ IR2 heet convex als met elk tweetal puntena en b in K ook het lijnstuk

ta+ (1− t)b : 0 ≤ t ≤ 1

dat a en b verbindt in K ligt. Kunnen er twee punten in K zijn die fO(x) = |x|minimaliseren op K? Maak een plaatje dat je helpt om de vraag te beantwoorden.

13.3 Vlakke meetkunde met het inprodukt

Bij het maken van deze opgaven heb je ongetwijfeld rechte hoeken en drie-hoeken getekend en de (Stelling van) Pythagoras weer gebruikt, en wellichtal het inwendige produkt van vectoren gebruikt. Het standaard inwendigeprodukt in IR2 wordt gedefinieerd door(

a

b

)·(x

y

)= ax+ cy,

hetgeen voor elke keuze van de 2-vectoren(a

b

)en

(x

y

)een reeel getal definieert, dat vastgelegd wordt door de vier reele getallena, b, x, y. De opgaven hebben je overtuigd dat twee vectoren in IR2 loodrechtop elkaar staan precies dan als hun inwendig produkt nul is.

11 Minimum op de rand, denk ook aan multiplicatoren van Lagrange.12 Al of niet met de staart in de oorsprong O.

318

Page 319: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Loodrecht is hier een begrip dat je buiten de wiskunde kende en nu inde wiskunde van betekenis hebt voorzien, en wel in het abstracte platte vlakin je hoofd, en de meetkunde die je daarin hebt leren bedrijven, al of nietgebruikmakend van twee onderling loodrecht voorgestelde coordinaatassen,gemarkeerd met 0 en 1.

De afstand van (0, 0) tot a = (a1, a2) is met Pythagoras gelijk aan√~a · ~a,

de wortel uit het inwendige produkt van de bijbehorende vector ~a met zich-zelf. Zo hebben we de begrippen afstand en loodrecht die we uit de dagelijksewerkelijkheid kennen in verband gebracht met het standaard inwendig pro-dukt in IR2, ons model voor het platte vlak. Dit verband zit stevig tussenonze oren, wat het verder ook moge betekenen. Wiskundige uitspraken doenwe vanaf nu in termen van IR2 met zijn vectoroptelling en het standaardinwendige produkt.

Opgave 13.9. Bewijs dat |~a ·~b| ≤ |~a||~b|, met andere woorden, dat

(a1b1 + a2b2)2 ≤ (a21 + a2

2)(b21 + b22).

Hint: breng alles naar de rechterkant, doe de algebra en herken het kwadraat. Doevervolgens ook

(a1b1 + a2b2 + a3b3)2 ≤ (a21 + a2

2 + a23)(b21 + b22 + b23),

en overtuig jezelf ervan dat (even wat combinatoriek)

(

n∑k=1

a2k)(

n∑k=1

b2k)− (

n∑k=1

akbk)2

de som is van n(n−1)2 kwadraten.

Opgave 13.10. Teken twee vectoren ~a en ~b waarvoor ~a ·~b = 0 en schuif een van detwee vectoren op en wel zo dat de kop van deze ene vector in de staart van de anderevector ligt (en een rechthoekige driehoek ontstaat). Werk (~a+~b) · (~a+~b) uit tot debekende formule voor |~a|, |~b| en |~a+~b|.

Opgave 13.11. Leid met Opgave 13.9 en Opgave 13.10 nog een keer af dat denorm aan de driehoeksongelijkheid |~a+~b| ≤ |~a|+ |~b| voldoet, ook voor ~a ·~b 6= 0.

319

Page 320: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 13.12. Teken twee vectoren ~a en ~b waarvoor niet per se ~a ·~b = 0 en schuifeen van de twee op zo dat de kop van deze ene in de staart van de ander vector ligt(en een driehoek ontstaat). Werk (~a + ~b) · (~a + ~b) en doe hetzelfde voor ~a en −~b.Beide uitdrukkingen bevatten ~a · ~b maar na sommatie vallen deze kruistermen weg.Formuleer wat bekend staat als de parallellogramwet.

Opgave 13.13. Een elegant bewijs van de Stelling van Pythagoras zonder vecto-ren maar met bijvoorbeeld vierkanten heeft iedereen wel eens gezien natuurlijk. Ziebijvoorbeeld

http://www.few.vu.nl/~jhulshof/RYB.mov

Is er ook zo’n elegant bewijs13 van de parallellogramwet?

13.4 Projecteren op convexe verzamelingen

Vlakke en Euclidische meetkunde betreffen tamelijk expliciete zaken. Denkaan lijnen, vlakken etc. Teken een lijn in het vlak en doe wat. Het plaatje isaltijd hetzelfde. Projecteren op een lijn, iedereen kan het. Bij projecteren opconvexe verzamelingen gaat over een veel grotere klasse van verzamelingenmaar met de algebra van het inprodukt is goed te begrijpen hoe dat gaat.Die algebra is niet beperkt tot het platte vlak. Maar nu eerst even wel.

Opgave 13.14. Als b ∈ IR2 en K ⊂ IR2 niet leeg en convex is, dan heeft iedereminimaliserende rij xn ∈ K met d(xn, b)→ d de eigenschap dat

d(xn, xm)→ 0 als m,n→∞

en dat kun je algemeen bewijzen. Neem zonder beperking der algemeenheid b = O end(xn, O) dalend, en laat dit zien door voor m > n met de parallellogramwet |xn−xm|2af te schatten op εn = 4(d + 1

n)2 − d2). Hint: je hebt alleen nodig dat het middenvan elk lijnstuk tussen twee punten in K weer in K zit (t = 1

2 in de definitie).

Onze meetkundige kennis is in de opgaven hierboven in uitspraken overvectoren en inwendige produkten vertaald, met als opmerkelijk conclusie hetresultaat in Opgave 13.14 dat zegt dat de minimaliserende rij een Cauchyrij14

13 Vast wel, maar ik heb het zelf nog nooit gezien.14 Wat was dat ook al weer?

320

Page 321: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

is. Net als in IR zijn in IR2 Cauchyrijen convergent. De limiet a, waarvoorgeldt dat

d(xn, a)→ 0 als n→∞,hoeft natuurlijk niet per se in A te liggen, maar doet dat wel als A geslotenis.

Opgave 13.15. A ⊂ IR2 heet gesloten als iedere convergente rij xn in A ook zijnlimiet in A heeft. Als A niet gesloten is dan zijn er dus convergente rijen in A waarvande limiet niet in A ligt. Bewijs dat de afsluiting A, dat is A verenigd met al dielimieten, altijd gesloten is.

Opgave 13.16. Voor iedere niet-lege convexe K ⊂ IR2 en voor iedere b ∈ IR2

bestaat er een a ∈ K met d(b, a) = d(b,K). Bewijs dit met de voorafgaande resultatenen laat zien dat a uniek is. Concludeer dat b → a een afbeelding PK : IR2 → Kdefinieert. Laat ook zien (PK(~a)−~a) · (~x−PK(~a)) ≥ 0 voor alle x ∈ K en maak eenplaatje om de betekenis van deze uitspraak meetkundig te begrijpen.

Opgave 13.17. Laat zien dat de afbeelding PK een contractie is in de zin dat vooralle x, y ∈ IR2 geldt dat d(PK(x), PK(y)) ≤ d(x, y). Hint: deze is lastig, spelen methet inprodukt, te leuk om voor te zeggen. Let op, voor variabele punten in K heb jenu een andere letter nodig.

Opgave 13.18. Pas de vorige opgave toe op het geval K = l, met l de lijn door smet richtingsvector ~v en geef een formule voor Pl. Hint: waarom wordt de ongelijkheidin Opgave 13.16 nu een gelijkheid voor alle x ∈ l? Gebruik dit en reken Pl(b) gewoonuit voor gegeven b.

Opgave 13.19. Neem in de vorige opgave s = O en laat zien dat de nulverzameling

N(Pl) = x ∈ IR2 : Pl(x) = 0

van Pl weer een lijn is, zeg lijn m, en dat m en l loodrecht op elkaar staan in dat vlakin je hoofd.

321

Page 322: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

13.5 Andere inprodukten en bilineaire vormen

Het standaard inwendig produkt van

~x =

(x1

x2

)en ~y =

(y1

y2

)is een voorbeeld van een bilineaire functie, ook wel bilineaire vorm genoemd.Zulke bilineaire vormen B : IR2 × IR2 → IR zijn altijd te schrijven als

B(~x, ~y) = a11x1y1 + a12x1y2 + a21x2y1 + a22x2y2,

dit vanwege wat je in de volgende opgave nu uitwerkt.

Opgave 13.20. Laat zien dat als B : IR2 × IR2 → IR voldoet aan

B(~x1 + ~x2, ~y) = B(~x1, ~y) +B(~x2, ~y);

B(~x, ~y1 + ~y2) = B(~x, ~y1) +B(~x, ~y2);

B(t~x, ~y) = B(~x, t~y) = tB(~x, ~y),

voor alle t ∈ IR en ~x, ~x1, ~x2, ~y, ~y1, ~y2 ∈ IR2, dat B gegeven wordt door15

B(~x, ~y) =

2∑i,j=1

aijxiyj ,

en dat B(~x, ~y) = B(~y, ~x) voor alle ~x, ~y ∈ IR2 gelijkwaardig is met aij = aji voor allei, j ∈ 1, 2.

Kortom, B(~x, ~y) is van de vorm

B(~x, ~y) = A~x · ~y,

waarbij A : IR2 → IR2 de lineaire afbeelding is gegeven is door

A

(x1

x2

)=

(a11x1 + a12x2

a21x1 + a22x2

)=

(a11 a12

a21 a22

)(x1

x2

),

en de symmetrie van B equivalent is met de symmetrie van de lineaire af-beelding A en de bijbehorende matrix (aij):

B(~x, ~y) = B(~y, ~x) ⇔ A~x · ~y = ~x · A~y ⇔ aij = aji

15 Let op: xi en yj zijn nu componenten van ~x en ~y.

322

Page 323: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Een symmetrische bilineaire vorm definieert een inwendig produkt als debijbehorende kwadratische vorm positief definiet is, dat wil zeggen

A~x · ~x > 0 als ~x 6= ~0 =

(0

0

),

en in dat geval heet A zelf ook positief16 definiet17. Voorlopig zullen we inde notatie geen onderscheid maken tussen A als lineaire afbeelding en A alsmatrix. We schrijven dus ook

A =

(a11 a12

a21 a22

)en spreken over ook positief definiete (symmetrische) matrices.

Kwadratische vormen zijn homogene poynomen van graad twee in devariabelen. Een kwadratische vorm Q : IR2 → IR wordt dus gegeven door

Q(~x) = Q(x) = Q(x1, x2) = q11x21 + q12x1x2 + q22x

22 =

2∑1≤i≤j=2

qijxixj

en is altijd te schrijven als Q(x1, x2) = B(~x, ~x) = A~x · ~x, met

aii = qii en aij = aji =1

2qij (i < j).

Omdat

m = min|x|≤1

Q(x) = min|x|=1

Q(x) en M = max|x|≤1

Q(x) = max|x|=1

Q(x)

bestaan als (op de rand aangenomen18) minimum en maximum van Q op degesloten disk gegeven door

x21 + x2

2 ≤ 1,

definieert een symmetrische A dus een (niet-standaard) inwendig produkt alsm > 0.

Opgave 13.21. Neem aan dat 0 ≤ m ≤M . Laat zien dat

m~x · ~x ≤ A~x · ~x ≤M ~x · ~x

voor alle ~x ∈ IR2. Wat kun je zeggen zonder de aanname op de tekens van m en M?

16 Echt iets anders dan aij > 0 voor i, j = 1, 2.17 Impliciet is A dus symmetrisch verondersteld.18 Mini- en maximaliserende rijen x1, x2, . . . kunnen convergent gekozen worden.

323

Page 324: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

De rand van de disk is een cirkel die kunnen we parametriseren met

x1 = cos(t) en x2 = sin(t),

waarin de functies cos en sin uniek gedefinieerd zijn door bijvoorbeeld19

cos t = cos(t) =∞∑n=0

(−t)2n

(2n)!= 1− t2

2!+t4

4!− t6

6!+ · · ·

sin t = sin(t) =∞∑n=0

(−t)2n+1

(2n+ 1)!= t− t3

3!+t5

5!− t7

7!+ · · · ,

met20 sin′ = cos, cos′ = − sin, cos(0) = 1, sin(0) = 0.

Opgave 13.22. Bereken het maximum M en het minimum m van de functie q :IR→ IR gedefinieerd door

q(t) = Q(cos t, sin t) =

(a11 a12

a21 a22

)(cos(t)

sin(t)

)·(

cos(t)

sin(t)

)Hint, herschrijf als q(t) = a cos2 t+ b cos t sin t+ c sin2 t, neem eerst b 6= 0 en herleidq′(t) = 0 tot een vierkantsvergelijking voor tan t. Verifieer dat in de minimizers

A

(cos t

sin t

)= m

(cos t

sin t

)geldt, en in de maximizers

A

(cos t

sin t

)= M

(cos t

sin t

).

Deze opgave laat zien dat m en M de twee reele eigenwaarden zijn vande symmetische matrix A. In het geval dat A positief definiet is nummerenwe deze eigenwaarden λ1 = M ≥ λ2 = m > 0. Je ziet21 dat de bijbehorendeeigenvectoren loodrecht staan. In het geval dat M = m zijn alle vectoreneigenvectoren en kunnen ze loodrecht gekozen worden, ~e1 en ~e2 bijvoorbeeld.

19 Zie [HM, hoofdstuk 10].20 De twee differentiaalvergelijkingen en beginvoorwaarden definieren sin en cos.21 Misschien niet meteen.

324

Page 325: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 13.23. Bewijs direct, dus zonder cosinussen en sinussen, dat voor elke sym-metrische (hier nog twee bij twee) matrix A geldt dat het maximum µ van de absolutewaarde van de bijbehorende kwadratische vorm Q op |~x| = 1 wordt aangenomen ineen eigenvector, en dat iedere maximizer een eigenvector is, bij µ of bij −µ (of bijallebei in bijzonder gevallen).

Opgave 13.24. De eigenvector in Opgave 13.23 bij λ1 = ±µ noemen we ~v1. Delijn door O met richtingsvector ~v1 noemen we l1. Pas nu Opgave 13.19 toe22 op l = l1en noem m = l2. Laat zien dat A deze l2 op zichzelf afbeeldt.

13.6 Om te onthouden

Symmetrische twee bij twee matrices komen met paren onderling loodrechtelijnen die we, zo we willen, als nieuwe coordinaatassen kunnen gebruiken.Met in die lijnen (eigen)vectoren ~v1 en ~v2 die onderling loodrecht staan enlengte 1 hebben,

~v1 · ~v1 = ~v2 · ~v2 = 1 en ~v1 · ~v2 = 0,

bij eigenwaarden λ1 en λ2,

A~v1 = λ1~v1 en A~v2 = λ2~v2.

In het bijzondere geval dat A een diagonaalmatrix(λ1 00 λ2

)is, krijgen we als eigenvectoren de standaardbasisvectoren ~e1 en ~e2.

Het andere belangrijke resultaat is dat we op (gesloten) convexe verza-melingen kunnen projecteren, Opgave 13.16. Niet benadrukt nog is wat deessentie was van het bewijs dat je in Opgave 13.23 hebt gegeven. Waar hetresultaat in Opgave 13.16 via Opgave 13.14 en een convergente minimalise-rende rij tot stand kwam, is in Opgave 13.23 een maximaliserende rij nietautomatisch convergent en moet eerst een convergente deelrij genomen wor-den. En iedere begrensde rij in IR2 heeft zo’n convergente deelrij. Alles watwe hier behandeld hebben gaat dus door voor IR3, IR4,. . . , met een kleineaanpassing bij Opgave 13.19. Pas in IR∞ gaat het een beetje anders.

22 De notaties x en ~x liepen al door elkaar heen, liever x = x = ~x vanaf nu?

325

Page 326: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

13.7 Poolcoordinaten in het (complexe) vlak

We besluiten dit hoofdstuk met een korte herhaling van IR2 gezien als deverzameling van complexe getallen IC. Het punt (1, 0) zien we als het getal1 en het punt (0, 1) als het imaginaire getal i. We introduceren IC door decorrespondentie

(x, y) ∈ IR2 ↔ z = x+ yi = x+ iy ∈ IC

met in IC de gebruikelijke rekenoperaties: de complexe optelling en de com-plexe vermenigvuldiging. Die krijg je door te rekenen met uitdrukkingen alsz = x + iy en c = a + bi alsof het eerstegraads polynomen in i zijn, met deafspraak dat i2 = −1. De rollen van i en −i zijn daarbij uitwisselbaar wantook (−i)2 = 1. De coefficienten x, y, a, b zijn zelf reeel, en x en a heten dereele delen van respectievelijk z en c. De imaginaire delen zijn y en b en zijnnet zo reeel als de reele delen.

We gaan ervan uit dat de lezer vertrouwd23 is met deze complexe getallenen het waarom van de notatie en correspondentie

(cos(t), sin(t)) ↔ exp(it) = cos(t) + i sin(t)

voor het over de eenheidscirkel bewegende punt (cos(t), sin(t)).Die eenheidscirkel wordt gegeven door |z| = 1, waarbij de absolute waarde

van z = x+ iy per definitie gelijk is aan

|z| =√x2 + y2,

meestal r genoemd. Voor elke r > 0 doorloopt het punt

(r cos(t), r sin(t)) ↔ r exp(it) = r(cos(t) + i sin(t))

een cirkel met straal r in het al of niet complexe vlak, en de (tijd) t is perdefinitie de hoek in radialen die de met dit punt corresponderende vectormaakt met de positieve x-as. Ieder punt in het vlak wordt zo gegeven dooreen r en een t, en elke 2-vector is van de vorm

~x =

(r cos(t)

r sin(t)

)= r

(cos(t)

sin(t)

), het scalaire product van r en

(cos(t)

sin(t)

).

Behalve de oorsprong heeft ieder punt x en iedere vector ~x een unieker en een unieke t, waarbij je moet afspreken dat de t-waarden module 2πworden gerekend. En 2π per definitie het reele getal is waarvoor deze laatstekarakterisatie correct is. In (tijd) t = 2π ga je de cirkel rond.

23 Zie anderes eventueel [HM, hoofdstuk 11].

326

Page 327: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Met behulp van deze poolcoordinaten volgt voor

~c = p

(cos(s)

sin(s)

)en ~x = r

(cos(t)

sin(t)

)dat

~c · ~x = pr(cos(s) cos(t) + sin(s) sin(t)) = pr cos(s− t),

het product van de twee lengten en de cosinus van wat de ingesloten hoekwordt genoemd. Is die hoek gelijk aan ±π

2dan is het inproduct nul en staan

de vectoren loodrecht op elkaar.

Opgave 13.25. De complexe afbeelding z → 1z laat zich in rechthoekige coordinaten

x, y en in poolcoordinaten r en t bestuderen. Verifieer dat deze afbeelding de samen-stelling is van z → z, een spiegeling in de x-as, en een andere afbeelding die spiegelingin de eenheidscirkel wordt genoemd, gegeven door r → 1

r . Construeer gegeven eenpunt binnen de cirkel zijn spiegelbeeld in de cirkel met behulp van een bij het gegevenpunt geschikt gekozen raaklijn aan de cirkel.

Opgave 13.26. Merk op dat de uitkomst voor het inwendig product te vergelijkenis met het gewone complexe product van de met de vectoren ~c en ~x corresponderendec en z. Verifieer dat voor

c = p exp(is) en z = r exp(it)

geldt dat

cz = p(cos(s) + i sin(s))r(cos(t) + i sin(t)) = pr(cos(s+ t) + i sin(s+ t)),

en bepaal het reele deel van cz, waarin z = x − iy de complex geconjugeerde is vanz = x+ iy.

327

Page 328: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

14 De Hilbertruimte in

Met IR3, IR4,.... kunnen we algebraısch precies hetzelfde doen als wat we inHoofdstuk 13 deden met IR2. Typografisch wat lastig omdat we 2-vectorengewoon met het LaTeχ-commando (backslash) choose voor binomiaalcoefficientenmaakten en nu echt array nodig hebben, maar verder geen wezenlijk verschil.In IR3 bijvoorbeeld met a

bc

· x

yz

= ax+ by + cz of

a1

a2

a3

· x1

x2

x3

=3∑i=1

aixi,

in IR42 met

~a · ~x =42∑i=1

aixi voor ~a =

a1

a2...a42

en ~x =

x1

x2...x42

,

en tenslotte in IR∞, met

a · x =∞∑i=1

aixi voor a =

a1

a2

a3...

en x =

x1

x2

x3...

,

waarbij we de pijltjes boven a en x in ~a en ~x maar hebben weggelaten. Puntenof vectoren, we maken het onderscheid in de notatie tussen x als ~x en x steedsvaker alleen als het echt nodig is1.

De laatste uitdrukking definieert a ·x soms wel en soms niet, want zonderrestricties op a, x ∈ IR∞ kan het met

a · x =∞∑i=1

aixi =∑i∈IN

aixi

alle kanten op. En het wordt nog spannender als we de i ∈ IN in vervangendoor bijvoorbeeld t ∈ IR = (−∞,∞) of2 t ∈ [−π, π]. In zulke gevallen isook

∑aan vervanging toe. Overaftelbare3 sommen gaan niet werken en

sommeren moet hier dus wel integreren worden, wat anders? Met de notatie

1 Als we niet meer recht kunnen praten wat krom is en rechte pijltjes niet passen.2 Denk ook aan de poolcoordinaten in het platte vlak.3 Waarom niet?

328

Page 329: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

t → at = a(t) en t → xt = x(t) voor functies a : IR → IR en x : IR → IRwordt een voor de hand liggend inwendig produkt van de functies a en x nugedefinieerd met behulp van de formule

a · x =

∫ ∞−∞

a(t)x(t)dt,

waarin alle a(t) en x(t) waarden gelijkwaardig voorkomen maar, paradoxaalwellicht, individueel geen invloed hebben op de uitkomst van de integraal diea · x definieert. Ook met die uitkomst kan het, bijvoorbeeld voor continuefuncties, alle kanten op, net als met a · x voor a, x ∈ IR∞.

Voor 2π-periodieke continue functies heeft deze integraalformule geen be-tekenis maar de formule

a · x =

∫ π

−πa(t)x(t)dt

vaak wel, het standaard inwendig produkt waarmee we werken in het gevalvan 2π-periodieke functies a en x, (goed) gedefinieerd voor continue functiesals gewone Riemann integraal4.

Opgave 14.1. Voor n = 1, 2, 3, . . . zijn de 2π-periodieke functies cn en sn gedefi-nieerd door cn(t) = cos(nt) en sn(t) = sin(nt). Bereken nog eens cn · cm, cn · sm,sn · sm, voor m,n = 1, 2, 3, . . . .

Je ziet het niet meteen, maar al deze cosinussen en sinussen staan “loodrecht”op elkaar, en ze hebben ook allemaal dezelfde “lengte”, de wortel uit hetinprodukt van de functie met zichzelf.

Opgave 14.2. Er is nog een functie die loodrecht staat op al deze cosinussen ensinussen. Welke functie?

14.1 Standaardassenkruizen

Tja5, wat zijn dat? In het vlak waar we mee begonnen zijn wordt het assen-kruis gevormd door 2 lijnen: de x-as door de oorsprong O en het punt (1, 0)en de y-as door O en het punt (0, 1), of wellicht liever de x1-as en de x2-as.

4 En later via een subtiel proces voor nog veel meer functies.5 Een vraag voor de woensdagmiddag wellicht.

329

Page 330: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Een punt dat zich over zo’n as beweegt heeft een lange weg te gaan en kwamvan ver. De x-as wordt geparametriseerd door (x, y) = (t, 0), en de y-as door(x, y) = (0, t), met bijbehorende snelheidsvectoren6

~v1 =

(1

0

)en ~v2 =

(0

1

),

die samen de standaardbasis van IR2 als vectorruimte vormen.Evenzo bestaat in IR3 het standaardassenkruis uit 3 lijnen, de x- of x1-as,

de y- of x2-as, en de z- of x3-as, met bijbehorende vectoren7

~v1 =

100

, ~v2 =

010

, ~v3 =

001

,

die samen de standaardbasis van IR3 genoemd worden. Drie vectoren metlengte 1 die onderling loodrecht staan.

En, we zouden het bijna vergeten, standaard of niet, een basis vormen ze.Iedere vector ~v ∈ IR3 is vanzelfsprekend uniek te schrijven als

~v = v1

100

+ v2

010

+ v3

001

=

v1

v2

v3

.

Precies zoals in IR2 waar iedere ~v van de vorm

~v = v1

(10

)+ v2

(01

)=

(v1

v2

)is, met een unieke correspondentie

~v =

(v1

v2

)↔ (v1, v2) = v,

waarin links en rechts v1 en v2 hetzelfde zijn.De vectoren

~e1 =

(10

)en ~e2 =

(01

)hebben lengte 1 en staan onderling loodrecht. In termen van het standaardinwendig produkt:

~e1 · ~e1 = ~e2 · ~e2 = 1 en ~e1 · ~e2 = ~e2 · ~e1 = 0.

6 In de wiskundeles meestal richtingsvectoren genoemd.7 Snelheidsvectoren, richtingsvectoren, het zijn maar woorden.

330

Page 331: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Met de gebruikelijke rekenregels volgt nu dat

~v · ~e1 = (v1~e1 + v2~e2) · ~e1 = v1~e1 · ~e1 + v2~e2 · ~e1 = v1;

~v · ~e2 = (v1~e1 + v2~e2) · ~e2 = v1~e1 · ~e2 + v2~e2 · ~e2 = v2,

en

~v = (~v · ~e1)~e1 + (~v · ~e2)~e2 =2∑i=1

(~v · ~ei)~ei

voor vectoren ~v ∈ IR2. In iedere IRn met n positief en geheel gaat hethetzelfde,

~v =n∑i=1

(~v · ~ei)~ei,

en pas in IR∞ wordt het wat lastiger.

14.2 Symmetrische matrices

Net als in de twee-dimensionale context heeft iedere symmetrische n × nmatrix

A = (aij)i,j=1,...,n

(een basis van) eigenvectoren ~v1, . . . , ~vn ∈ IRn met

~vi · ~vj = δij =

1 als i = j

0 als i 6= j,

bij (reele) eigenwaardenλ1, . . . , λn,

die gemaakt worden door Opgave 13.23 herhaald toe te passen. Dit geeft inieder stap zowel een nieuwe λk als een nieuwe ~vk via

|λk| = max~v·~v≤1

~v·~v1=···=~v·~vk−1=0

|A~v · ~v|,

waarbij k = 1, . . . , n.Details van deze constructie komen aan de orde in de context van de

standaard aftelbaar oneindig-dimensionale Hilbertruimte die we in IR∞ ma-ken. Daarvoor komen we voor het eerst over abstracte Hilbertruimten8 Hte praten die we zo snel mogelijk gelijk9 praten aan het standaardvoorbeeld

8 Inprodukt ruimten waarin Cauchy rijtjes convergent zijn.9 Lees: isomorf.

331

Page 332: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

in IR∞, onder de aanname van separabiliteit van H: het bestaan van een rijx1, x2, x3, . . . in H die als limieten van zijn convergente deelrijen alle elemen-ten in H heeft.

Kortom, in termen van de dimensie van onze ruimten maken we in eenkeer de stap van n = 2 en concreet (IR2) naar n = ∞ en abstract (nietconcreet). Let wel, dat kan alleen voor ruimten met een inwendig produkt.

14.3 Reele Hilbertruimten

Een reele Hilbertruimte H is een vectorruimte over IR die naast de vectorop-telling en scalaire vemenigvuldiging ook een inwendig produkt

(x, y) ∈ H ×H → (x, y)H = x · y

heeft, met de standaardrekenregels, en de eigenschap dat alle Cauchyrijtjes(dat zijn rijtjes waarvoor

(xn − xm) · (xn − xm)→ 0

als m,n→∞) in H ook convergent zijn met limiet x ∈ H (i.e.

(xn − x) · (xn − x)→ 0

als n→∞).De norm wordt gegeven door |x|2H = (x, x)H = x · x en de onderlinge

afstand van bijvoorbeeld xn en xm is

dH(xn, xm) = |xn − xm|H =√

(xn − xm) · (xn − xm),

waarin dH : H × H → IR+ = [0,∞) de metriek is op H. De subscripts Hlaten we voortaan weg, tenzij dat verwarring geeft.

Opgave 14.3. Formuleer en bewijs de ongelijkheid van Cauchy-Schwarz10 (inclu-sief de karakterisatie van het geval van gelijkheid), bewijs de driehoeksongelijkheid, enformuleer en bewijs nog een keer Pythagoras en de parallellogramwet. Hint: overschrij-ven uit willekeurig Lineaire Algebra boek. Formuleer ook de axioma’s voor metrischeruimten en bewijs deze voor d.

10 De ongelijkheid in Opgave 13.9.

332

Page 333: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 14.4. Laat H een Hilbertruimte zijn, K ⊂ H een gesloten convexe verza-meling, en a ∈ H. Bewijs dat er een unieke p ∈ K is die de afstand d(a,K) van a totK realiseert middels

|p− a| = infx∈K|x− a| = d(a,K)

en laat zien dat (p − a) · (x − p) ≥ 0 voor alle x ∈ K. Hint: geef eerst de definitiesvan gesloten, convex en afstand, en gebruik daarna de parallellogramwet, net zoalsin Opgave 13.14. Bewijs ook dat de afbeelding PK : H → K gedefinieerd doorPK(a) = p de eigenschap heeft dat |PK(a)− PK(b)| ≤ |a− b| voor alle a, b ∈ H.

Opgave 14.5. Laat H een Hilbertruimte zijn, L ⊂ H een gesloten lineaire deel-ruimte. Bewijs dat PL : H → L lineair is en dat

M = N(PL) = x ∈ H : PL(x) = 0 = L⊥ = x ∈ H : x · y = 0 ∀ y ∈ L11,

de kern of nulruimte van PL, ook een gesloten lineaire deelruimte is met M∩L = 0.Laat zien dat M + L = H en concludeer dat L⊕M = H: iedere x ∈ H is uniek teschrijven als x = p+ q met p ∈ L en q ∈M .

De uitspraak over het bestaan van p in Opgave 14.4 is natuurlijk equiva-lent met de uitspraak over het bestaan van het minimum van

(x− a) · (x− a) = x · x− 2a · x+ a · a,

en daarmee dus equivalent met een uitspraak over minima op K van wat jeparabolische functies zou kunnen noemen:

Opgave 14.6. Laat H een Hilbertruimte zijn, K ⊂ H een gesloten convexe verza-meling. Dan neemt voor iedere b ∈ H de kwadratische uitdrukking12

|x|2 + b · x

op K in precies een punt een minimum13 aan.

11 x · y = 0 voor alle y in L wordt kort geschreven als: x · y = 0 ∀ y ∈ L.12 Het kwadratische stuk kan algemener, het lineaire stuk niet!13 K is i.h.a. niet begrensd, laat staan rijkompakt (iets met convergente deelrijen).

333

Page 334: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Let op de eerste voeTnoot in Opgave 14.6. Het standaardinprodukt inIR2 geeft via (

a

b

)·(x

y

)= ax+ cy =

(a b

)( xy

)︸ ︷︷ ︸

matrix notatie

een representatie van de lineaire functie(xy

)→ ax+ cy =

(a b

)( xy

)︸ ︷︷ ︸

matrix notatie

en omgekeerd is iedere lineaire14 functie van deze vorm. De correspondentie(a

b

)↔

(a b

)is evident bijectief en lineair. Links staat een 2-vector, rechts een 1 bij 2matrix waarmee een lineaire afbeelding van IR2 naar IR gemaakt wordt.

In een willekeurige Hilbertruimte is er a priori geen matrixnotatie voor hetmaken van lineaire afbeeldingen. Welke lineaire afbeeldingen hebben we opzo’n Hilbertruimte H als van H verder niets gegeven is, behalve dan dat heteen H is? Wel, in ieder geval is voor elke y ∈ H de afbeelding φy : H → IRgedefinieerd door15

x→ y · x = φy(x) = φyx =< φy, x > .

Kijk even goed, in de 1 na laatste notatie hebben we de haken weggelaten,zoals vaker bij lineaire afbeeldingen16, en in de laatste staan φy en x zo tezien gelijkwaardig tussen strange brackets17, waarbij net als in y · x de rollenvan de tegenspelers verwisseld kunnen worden. Dualiteit heet dat met eenmooi woord.

Voorlopig gebruiken we de notatie die het meest op de schoolnotatie lijkt.Een functie f van x, in dit geval φy, maak je expliciet18 via f(x), in dit gevalφy(x) = y · x. Dat lijkt expliciet maar is het natuurlijk niet echt als we nietzeggen wat H is. Expliciet of niet, uit de ongelijkheid van Cauchy-Schwarzvolgt nu dat

|φy(x)| = |y · x| ≤ |y||x|14 De constante functie is NIET lineair, tenzij de constante nul is.15 Meteen maar met drie notaties.16en bij cos, sin, tan, . . . .17 Tussen bra en ket, zoals fysici soms zeggen.18 Of niet, en dat veroorzaakt vaak veel verwarring.

334

Page 335: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

en dus ook, vanwege de lineairiteit , dat

|φy(x1)− φy(x2)| = |y · (x1 − x2)|| ≤ L|x1 − x2| met L = |y|.

Een reeelwaardige functie f op een vectorruimte met een norm, die vol-doet aan

|f(x1)− f(x2)| ≤ L|x1 − x2|voor alle x1 en x2 in die genormeerde vectorruimte, heet Lipschitz continu.Een mooi begrip, dat differentiaalrekening noch epsilons en delta’s nodigheeft.

Opgave 14.7. Als zo’n (niet per se lineaire) functie een L heeft dan heeft hij ookeen kleinste L. Bewijs dit. Hint: denk aan grootste ondergrenzen (infima).

Die kleinste L is dus voor alle Lipschitz continue functies op onze ge-normeerde ruimte (laten we die X noemen) gedefinieerd. Daar hoort eenzijstapje bij:

Opgave 14.8. Voor elke genormeerde ruimte X vormen de Lipschitz continue func-ties f : X → IR een vectorruimte Lip(X) met de vectorbewerkingen gedefinieerddoor

(f + g)(x) = f(x) + g(x) en (tf)(x) = tf(x).

Voor elke f is de kleinste L zoals boven per definitie een soort norm van f , die wenoteren met L = [f ]Lip. Waarom definieert

f → [f ]Lip

geen norm op Lip(X)? En waarom wel op

Lip0(X) = f ∈ Lip(X) : f(0) = 0?

Bewijs dat met deze norm elke Cauchyrij fn ∈ Lip0(X) convergent is. Hint: bewijsdit eerst voor X = IR en schrijf je bewijs nog een keer over voor X = X.

Klein probleempje is natuurlijk dat er misschien maar weinig van die alof niet lineaire Lipschitz functies op X zijn, als je verder niks van X weet.Maar op H is dat probleempje er niet. Elke y ∈ H geeft je een φy in Lip0(H)die nog lineair is ook, en je ziet meteen wat de kleinste L is: op zijn hoogst|y| en kleiner kan niet, vul maar x = y in. Dat betekent dat we met y → φyeen afbeelding

Φ := H → Lip0(H)

335

Page 336: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

hebben, en het beeld van Φ is bevat in H∗, de (genormeerde) ruimte vanLipschitz continue lineaire functies f : H → IR, en Φ is zelf weer lineair19:

Opgave 14.9. Verifieer dat Φ : H → H∗ voldoet aan

Φ(x1 + x2) = Φ(x1) + Φ(x2) en Φ(tx) = tΦ(x)

voor alle t ∈ IR en x, x1, x2 ∈ H, en dat [Φ(x)]Lip = |x|.

De vraag nu is of Φ surjectief is: is elke f ∈ H∗ van de vorm φy? Bekijkdaartoe20

Nf = x ∈ H : f(x) = 0.

Opgave 14.10. Bewijs dat Nf ⊂ H een gesloten lineaire deelruimte is.

In het bijzonder bestaat nu dankzij Opgave 14.5 de projectie

PNf : H → N,

ook weer een lineaire afbeelding, en in de volgende opgave gaat het om denulruimte van deze projectie op de nulruimte van f .

Opgave 14.11. Bewijs dat M = N(PNf ) een gesloten lineaire deelruimte is die

gegeven wordt door M = te : t ∈ IR waarin e ∈ N⊥f met |e| = 1. Laat zien dat feen veelvoud is van φe: f(x) = f(e)e · x.

Opgave 14.12. Leg uit waarom met het resultaat in Opgave 14.10 de afbeeldingΦ : H → H∗ een lineaire isometrie is.

Lineaire isometrien zijn de mooiste continue afbeeldingen die er bestaan.De inverse van Φ wordt de Riesz representatie van H∗ genoemd, en via dezeisometrie erft H∗ ook het inwendig produkt van H: de reele HilbertruimtenH en H∗ zijn als Hilbertruimten hetzelfde, al is het in concrete situaties nietaltijd even handig om hier de nadruk op te leggen.

19 Nu maar eens de axioma’s noemen en verifieren.20 We schrijven nu Nf i.p.v. N(f), t.b.v. het onderscheid tussen f en PL.

336

Page 337: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Het resultaat geldt zonder enige verdere restrictie op H en het is ook nietnodig om aan te nemen dat H separabel is. We noteren de inverse van Φ als

RH ,

met de ruimte H als subscript aan R = Φ−1 gehangen. Het domein van RH

is zo de deelruimteH∗ ( Lip0(H).

Opgave 14.13. Gebruik Opgave 14.4 om aan te tonen dat er plenty niet-lineairefuncties in Lip0(H) zijn.

14.4 De standaard Hilbertruimte

De wat informeel geintroduceerde ruimte IR∞ bestaat uit alle functies f, x, a :IN → IR, hoe je ze ook wil noemen21. We kunnen deze functies zien alskolomvectoren ~f met daarin de waarden van f , al protesteert LaTeχ daarbijzo te zien een beetje. Helemaal op dezelfde hoogte lukt typografisch niet,

f =

f(1)f(2)f(3)

...

=

f1

f2

f3...

= ~f,

en ook voor functies f, x, a : 1, 2, 3 → IR oogt

f =

f(1)f(2)f(3)

=

f1

f2

f3

= ~f

niet echt lekker.Wiskundig gezien praten we de facto over functies f : A→ IR, waarbij A

hier een discrete verzameling is, en de verzameling van deze functies wordtook wel genoteerd als IRA. Als je n ∈ IN gedefinieerd hebt als een wat rareverzameling, via22

1 = ∅, 2 = ∅, ∅, 3 = ∅, ∅, ∅, . . .21 Het zijn er meer dan 26.22 Ik schuif wat ik naief in Halmos las wellicht eentje op, boekje niet bij de hand.

337

Page 338: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

of zoiets, dan is de notatie voor IRA consistent23 met die voor IRn.Elke f ∈ IRA heeft als Pythagoras norm

|f | =√∑

a∈A

|f(a)|2,

hetgeen voor A = 1, 2, 3 overeenkomt met de Euclidische lengte√f 2

1 + f 22 + f 3

3

van de vector ~f hierboven.Het ligt voor de hand om IRA en IRB als dezelfde ruimte te zien als er

een bijectie bestaat tussen A en B. Voor eindige verzamelingen A is dePythagoras norm natuurlijk op heel IRA gedefinieerd, maar als A oneindigveel elementen bevat24 dan is dat niet meer het geval.

Opgave 14.14. Stel dat A overaftelbaar is en f ∈ IRA eindige Pythagorasnormheeft. Bewijs dat de verzameling

a ∈ A : f(a) 6= 0

aftelbaar is en ga na dat het in de somnotatie dan niet nodig is de volgorde vansommeren vast te leggen25.

In het licht van deze opgave beperken we de aandacht voor oneindige Atot aftelbare A en die zijn allemaal bijectief met IN. We kunnen de functie-waarden van elementen x, f, . . . ∈ IRIN dan op wat voor manier dan ook weer(niet allemaal) opschrijven, genummerd als f(n) of xn met n = 1, 2, . . ., inbijvoorbeeld een kolomvector of rijvector met puntjes.

Onze standaard aftelbaar oneindig-dimensionale Hilbertruimte is nu

l(2) = x = (x1, x2, . . . ) ∈ IRIN :∞∑n=1

x2n <∞,

spreek uit: (kleine) el twee. Er is ook een grote el twee , namelijk de verza-meling van kwadratisch integreerbare meetbare functies op een maatruimte,

23 Let wel, 0 = ∅ doet niet mee.24 We zeggen dan gemakshalve dat A oneindig is.25 Dit heet onvoorwaardelijke convergentie.

338

Page 339: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

bijvoorbeeld26 IR, voorzien van de gewone (Lebesque) lengtemaat27. Die eltwee wordt genoteerd met

L2(IR),

strict genomen geen functieruimte maar een ruimte van equivalentieklassen.We zeggen dat een (meetbare) functie f en een andere (meetbare) gunctieg equivalent zijn, notatie f ∼ g, als de verzameling waarop ze verschillen(uitwendige) maat NUL heeft, en met f bedoelen we stiekem [f ], de equiva-lentieklasse van alle g waarvoor g ∼ f .

De inwendige produkten zijn, respectievelijk,

x · y = (x, y)l(2) =∞∑n=1

xnyn en f · g = (f, g)L2(IR) =

∫ ∞∞

f(x)g(x)dx,

waarbij de integraalnotatie bij (niet ieders) voorkeur hetzelfde gekozen wordtals die van de Riemann integraal.

Opgave 14.15. Bewijs dat l(2) volledig is. Dat wil zeggen, laat zien dat Cauchyrijtjes in l(2) convergent zijn met limiet in l(2).

Als we IN zien als maatruimte voorzien van de telmaat dan wordt kleinel weer groot. En met recht, want iedere separabele Hilbertruimte H is metl(2) te identificeren28. Hoe gaat dat? Wel, neem een rijtje a1, a2, a2, . . . in Hdat als limietpunten alle elementen van H heeft. Zet

e1 =1

|a1|a1

als a1 6= 0 maar gooi a1 weg als a1 = 0. Hernummer in dat geval de rij enherhaal deze stap, net zolang29 tot je een a1 6= 0 hebt. Stel vervolgens

y2 = a2 − (a2, e1)e1 en e2 =1

|y2|y2

als y2 6= 0, maar gooi a2 weg als y2 = 0 en hernummer in dat geval weer derij. Herhaal deze stap, net zolang tot je een y2 6= 0 hebt en daarmee ook eene2. Stel vervolgens

y3 = a3 − (a3, e2)e2 − (a3, e1)e1 en e3 =1

|y3|y3,

26 Ander voorbeeld: IR modulo 2π, de facto de eenheidscirkel in IR2.27 Zie “Wiskunde in je vingers” van H&M voor snelle intro maattheorie.28 Indien gewenst.29 Nou ja, als er geen dubbelen in de rij voorkomen dan...

339

Page 340: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

als y3 6= 0, maar . . . , enzovoorts. Dit produceert een rij e1, e2, e3, . . . vanvectoren waarvoor

(ei, ej) = δij,

en deze vectoren spannen een lineaire deelruimte op in H.

Opgave 14.16. Bewijs dat

H = x =

∞∑n=1

xnen :

∞∑n=1

x2n <∞,

waarmee H dus met de standaard Hilbertruimte l(2) geidentificeerd kan worden.

14.5 Riesz of geen Riesz?

In alle Hilbertruimten is de Riesz representatiestelling van toepassing, en dusin het bijzonder ook in l(2).

Opgave 14.17. Geef een rechtstreeks bewijs voor de representatiestelling van Rieszvoor het geval dat H = l(2).

Onze standaard Hilbertruimte is H = l(2) = L2(IN) met op IN de telmaat,maar er zijn ook andere maten op IN. Ieder rijtje positieve getallen30

0 < λ1 ≤ λ2 ≤ λ2 ≤ · · ·

(hernummerd om het rijtje monotoon te maken) definieert een maat op INdoor aan het n-de element van IN maat λn toe te kennen. De bijbehorendeintegraal van het produkt van twee functies x, y : IN→ IR is dan

((x, y)) = (x, y)V =∞∑n=1

λnxnyn,

een inwendig produkt op een deelruimte V van onze standaard H = l(2), dieniet gesloten is in H in het geval dat λn →∞.

Opgave 14.18. Waarom niet? Laat zien dat V met ((·, ·)) een Hilbertruimte is, endat V = H dan en slechts dan als λn een begrensd monotoon rijtje positieve getallenis.

30 De letter λ wordt doorgaans gebruikt voor eigenwaarden.

340

Page 341: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Kortom V ⊂ H, en de norm op V wordt gegeven door

|x|V = ||x|| =

√√√√ ∞∑n=1

λnx2n,

waarmee||x||2 ≥ λ1|x|2

voor alle x ∈ V . Hierin is

|x| =

√√√√ ∞∑n=1

x2n

de gewone norm van x, een x die immers ook in H zit. De afbeelding31

i : x ∈ V → x ∈ H

is lineair en continu. Er geldt immers voor alle x ∈ V ⊂ H dat

||i(x)||︸ ︷︷ ︸x∈V

= |x|︸︷︷︸x∈H

≤ 1√λ1

||x||︸︷︷︸x∈V

,

en

||i|| = 1√λ1

is de norm van i: de kleinste constante C waarmee geldt dat

|i(x)| ≤ C||x||

voor alle x ∈ V . De notatie met i maakt onderscheid tussen x als x ∈ Ven x als x ∈ H. De afbeelding i : V → H stuurt x ∈ V naar zichzelf,maar dan opgevat als x ∈ H, en heeft daarom een paar vanzelfsprekendeeigenschappen.

Opgave 14.19. Ga na dat deze i injectief is en dat als i(V ) = V niet gelijk is aanH wel geldt dat i(V ) = V = H.

Als V = H dan zeggen we dat V dicht ligt in H. Dat is hier dus altijdhet geval, trivialerwijs ook als V = H. Met de Riesz representatiestelling(Opgave 14.12) is iedere continue lineaire functie F : H → IR van de vorm

F (x) = (f, x)

31 i is hier niet die wortel uit −1 maar de inbedding van V in H.

341

Page 342: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

met f = RH(F ), en uiteraard is F (x) = (f, x) ook gedefinieerd voor x ∈ V .De afbeelding

F i : x ∈ V i−→ x ∈ H F−→ (f, x) ∈ IR

is zo continu en lineair, en dus vanwege de Riesz representatiestelling, toe-gepast nu op V , te representeren met een u = RV (F i) ∈ V , waarvoor nugeldt dat

F (x) = (f, x) = ((u, x)) ∀x ∈ V.Met andere woorden, de afbeelding

V 3 x f∈H−−→ (f, x)H

is precies dezelfde afbeelding als

V 3 x u∈V−−→ (u, x)V

(maar anders gerepresenteerd).

Opgave 14.20. Neem aan dat 0 < λ1 ≤ λ2, . . . een onbegrensd rij is. Waarom isniet elke continue lineaire G : V → IR van de vorm F (x) = (f, x) met f ∈ H?

Het is voor een lineaire functie op V dan32 dus makkelijker om continute zijn met betrekking tot de norm op V dan met betrekking tot de norm opH: er zijn dus meer continue lineaire functies op V dan de functies

x ∈ V → (y, x)H ∈ IR.

Als we er voor kiezen om H∗ met H te identificeren via RH , dan is

V ( H = H∗ ( V ∗,

hetgeen dan niet meer spoort met een identificatie van V ∗ en V via RV . Hetis een van de twee (of geen van beide), maar niet allebei.

Hoe het ook zij, de afbeelding

B : f ∈ HR−1H−−→ F ∈ H∗ i∗−→ F i ∈ V ∗︸ ︷︷ ︸

i∗(F )=Fi

RV−−→ u ∈ V,

is lineair en continu, omdat de eerste en de derde schakel in deze keten allebeieen isometrie zijn, en de middelste schakel i∗, die de geadjungeerde van i heet,continu is.

32 Als λn →∞.

342

Page 343: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 14.21. Voor lineaire afbeeldingen tussen genormeerde ruimten is conti-nuiteit equivalent met wat begrensdheid wordt genoemd. Een lineaire afbeeldingT : X → Y heet begrensd als er een constante C is waarvoor geldt dat33

||Tx||Y ≤ C||x||X

voor alle x ∈ X. Bewijs dit, en ook dat de kleinste C waarvoor dit geldt bestaat.Die kleinste C is per definitie de norm ||T || van T , en komt voor lineaire afbeeldin-gen overeen met wat we eerder [ ]Lip genoemd hebben bij reelewaardige functies, zieOpgave 14.8.

In het bijzonder is een begrensde lineaire T niet begrensd op X maar wel op

BX = x ∈ X : ||x||X ≤ 1,

de gesloten eenheidsbol op X.

Opgave 14.22. Bewijs dat i∗ : H∗ → V ∗ lineair en continu (begrensd) is.

Interessant is dat als V en H Hilbertruimten zijn en i : V → H eeninjectieve continue lineaire afbeelding is met i(V ) ( i(V ) = H, het verhaalvaak precies hetzelfde is. Het is leerzaam om te kijken hoe de injectiviteitvan i en het dicht liggen van het beeld van i dan een rol spelen.

Opgave 14.23. Neem nu aan dat H en V Hilbertruimten zijn en dat i : V → Hlineair en begrensd is. Bewijs dat B : H → V gedefinieerd door f ∈ H → u = Bf ∈V en

(u, x)V = (f, i(x))H

voor alle x ∈ H goed gedefinieerd is als lineaire begrensde afbeelding

B = RV i∗ (RH)−1,

en laat zien dat||B|| = ||i∗|| = ||i||.

Hint: de eerste gelijkheid volgt omdat de eerste en de derde schakel in B isometrischzijn, het gaat dus om de tweede gelijkheid. Dat ||i∗|| ≤ ||i|| volgt rechstreeks uit dedefinities. Om ||i∗|| ≥ ||i|| te laten zien moet je de definitie van ||i|| gebruiken dooreen rij xn ∈ V te nemen met ||xn||V = 1 en ||i(xn)|| → ||i||, en bij die yn = i(xn)elementen Fn uit H∗ met ||Fn||H∗ = 1 and Fn(yn) = ||yn||H .

33 Met notatie T (x) = Tx.

343

Page 344: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 14.24. Bewijs ook dat B injectief is als de afsluiting i(V ) van i(V ) in Hgelijk is aan H, dus als i(V ) = H. Hint: het gaat dus om de tweede equivalentie inB injectief ⇐⇒ i∗ injectief ⇐⇒ i(V ) = H. De eerste is vanzelfsprekend om datde andere twee factoren in B isometrisch zijn.

Opgave 14.25. Neem alleen aan dat H en V Hilbertruimten zijn en dat i : V → Hlineair en begrensd is. Laat B : H → V gedefinieerd zijn via Opgave 14.23 doorf ∈ H → u = Bf ∈ V en

(u, x)V = (f, i(x))H .

Laat zien datN(i) = x ∈ V : i(x) = 0 = (B(H))⊥.

In het bijzonder ligt het beeld van B dicht in V precies dan als i injectief is.

Opgave 14.26. Neem aan dat i : V → H lineair en begrensd is. Bewijs dat

A0 = i B : H → H

symmetrisch is, i.e.(A0f1, f2)H = (f1, A0f2)H

voor alle f1, f2 ∈ H, en(A0f, f)H ≥ 0

voor alle f ∈ H. Welke conditie op i : V → H garandeert

(A0f, f)H > 0 voor f 6= 0 ∈ H?

Hint: voor het antwoord op de vraag neem x = u = Bf in de definitie van B inOpgave 14.23 en gebruik Opgave 14.24.

Opgave 14.27. Neem aan dat i : V → H lineair en begrensd is. Bewijs dat

A1 = B i : V → V

symmetrisch is, i.e.(A1u1, u2)V = (u1, A1u2)V

voor alle u1, u2 ∈ V , en(A1v, v)V ≥ 0

344

Page 345: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

voor alle v ∈ H. Welke conditie op i : V → H garandeert

(A1v, v)V > 0 voor v 6= 0 ∈ V ?

Hint: voor het antwoord op de vraag neem f = i(v) en u = Bf in Opgave 14.23.

Opgave 14.28. Laat zien dat

(A0f, f)H(f, f)H

=(Bf,Bf)H

(f, f)Hen

(A1v, v)V(v, v)V

=(i(v), i(v))H

(v, v)V

en concludeer dat beide quotienten dezelfde suprema hebben. Hint: de suprema vande rechterleden zijn normen.

14.6 Convergente deelrijen

In het concrete voorbeeld dat V ⊂ H = l(2) gedefinieerd is via een (onbe-grensde) rij

0 < λ1 ≤ λ2 ≤ · · ·kunnen we subscripts wel weglaten en zien we A zowel als A : V → V enA : H → H. Vanwege de aanname dat

λn →∞

heeft i : V → H nu een bijzonder eigenschap.

Opgave 14.29. Als x1, x2, x3, . . . een begrensde rij in V is dan heeft x1, x2, x3, . . .een convergente deelrij rij in H.

Met ander woorden, als |xn|V = ||xn|| begrensd is dan is er een x ∈ Hzodanig dat

|xnk − x| → 0

als k →∞, voor tenminste een rij indices

n1 < n2 < n3 < · · ·

Deze conclusie kan niet getrokken worden voor een rij die alleen begrensdis in de H-norm. Immers, de basisvectoren e1, e2, . . . staan onderling lood-recht en hebben lengte 1. Bijgevolg is (voor i 6= j)

|ei − ej|2 = (ei − ej, ei − ej) = (ei, ei) + (ej, ej) = 2

345

Page 346: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

en heeft de rij e1, e2, . . . geen enkele convergente deelrij. Wel is het zo datvoor elke y ∈ H geldt dat (y, ei)→ 0 = (y, 0). De rij e1, e2, . . . heet daaromzwak convergent met limiet 0 ∈ H.

Opgave 14.30. Laat x1, x2, . . . een begrensde rij zijn in de standaard HilbertruimteH = l(2). Dan heeft x1, x2, . . . wel een zwak convergente deelrij, i.e. er is een rijindices n1 < n2 < · · · en een a ∈ H zodanig dat

(y, xnk)→ (y, a)

als k →∞ voor elke y ∈ H. Notatie:

xnk a als k →∞.

Hint: in IR heeft iedere begrensde rij een convergente deelrij. Gebruik een diagonaal-argument om te laten zien dat er een rij indices n1 < n2 < · · · is waarvoor

aj = limk→∞

(ej , xnk)

als limiet in IR bestaat voor iedere j ∈ IN, en laat zien dat

a =∞∑j=1

ajej ∈ H

de zwakke limiet is van de rij xn1 , xn2 , . . . .

Opgave 14.31. Bewijs dat in iedere separabele Hilbertruimte elke begrensde rij eenzwak convergente deelrij heeft. Hint: gebruik een basis van H om H isometrisch metIRn of l(2) te maken en Opgave 14.30.

Opgave 14.32. Bewijs dat in iedere Hilbertruimte, separabel of niet, elke begrensderij een zwak convergente deelrij heeft. Hint: laat L de kleinste gesloten deelruimte vanH zijn die de hele rij bevat, schrijf H = L ⊕ L⊥ en gebruik het resultaat in Opgave14.31 voor L.

14.7 Positieve eigenwaarden van wat?

De naam van een stelling past niet altijd in een kopje. Voor welke positiefdefiniete symmetrische lineaire afbeeldingen A : H → H hebben we een uit-spraak over positieve eigenwaarden met eigenvectoren die een orthonormale

346

Page 347: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

basis vormen van H? De extra eigenschap die we nodig hebben is kompakt-heid, en dat begrip formuleren we eerst in termen van rijen. Een verzamelingK in een ruimte voorzien van een metriek heet rijkompakt als iedere rij inK door elementen uit de rij weg te laten34 convergent gemaakt kan wordenmet limiet in K.

In de vorige subsectie hebben we gezien dat de gesloten eenheidsbol

B ⊂ H = l(2)

niet rijkompakt is. Immers, de rij e1, e2, . . . heeft geen convergente deelrij.Terwijl de rij wel zwak convergent is met limiet 0. Maar onder de aannamedat de rij

0 < λ1 ≤ λ2 ≤ · · ·

de eigenschap heeft dat λn → ∞ liet Opgave 14.29 zien dat voor de doordeze rij gedefinieerde V in Opgave 14.18 geldt dat de lineaire afbeelding

i : V → H = l(2)

kompakt is in de volgende zin: als x1, x2, x3, . . . een begrensde rij is in V danheeft de rij i(x1), i(x2), i(x3), . . . een convergente deelrij in H.

Opgave 14.33. Neem aan dat i : V → H zoals in Opgave 14.23 kompakt is. Laatzien dat A0 = i B : H → H en A1 = B i : V → V ook kompakt zijn: iederebegrensde rij originelen wordt na weglaten van voldoende veel rijelementen afgebeeldop een convergente rij.

Elke lineaire, injectieve, begrensde35 en kompakte

i : V → H met i(V ) = H

definieert nu dus via Opgaven 14.23, 14.26 en 14.27 twee36 strict positiefdefiniete symmetrische kompakte begrensde lineaire afbeeldingen A0 : H →H en A1 : V → V , door respectievelijk de eerste en de laatste schakel in

Vi−→ H

(RH)−1

−−−−→ H∗i∗−→ V ∗

RV−−→ Vi−→ H

weg te laten.

34 Think of cheating experimentalists.35 Dit eisen is niet meer nodig, volgt uit kompaktheid i, ga na!36 Het past ook niet op 1 regel.

347

Page 348: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 14.34. Laat H een Hilbertruimte zijn en A : H → H lineair, kompakt,symmetrisch en positief strict definiet. Bewijs dat

µ1 = sup0 6=x∈H

(Ax, x)

(x, x)

als strict positief maximum bestaat, en dat iedere het quotient maximaliserende xeen eigenvector is van A bij deze (eigenwaarde) µ1 > 0. Hint: µ1 wordt benaderddoor (Axn, xn) met (xn, xn) = 1 waarbij de rij xn zwak convergent met limiet x kanworden gekozen, en, vanwege de kompaktheid van A, de rij Axn convergent met limiety.

Er is een eleganter bewijs van de stelling in Opgave 14.34 waarbij het begripzwakke convergentie niet wordt gebruikt. Als A : H → H een symmetrischecontinue lineaire afbeelding is, dan is |(Ax, x)| ≤ ||Ax|| ||x|| ≤ ||A|| ||x||2 enbestaan dus

M = sup06=x∈H

|(Ax, x)|(x, x)

, M+ = sup06=x∈H

(Ax, x)

(x, x), M= inf

06=x∈H

(Ax, x)

(x, x),

en M , het maximum van |M+| en |M−|, voldoet dus aan M ≤ ||A||. Via deparallelogramwettruc volgt ook de omgekeerde ongelijkheid. Voor x, y ∈ Hgeldt dat

(Ax, y) =1

4(A(x+y), x+y)−1

4(A(x−y), x−y) ≤ 1

4(M+||x+y||2−M−||x−y||2)

en dus dat

|A(x, y)| ≤ M

4(||x+ y||2 + ||x− y||2) =

M

2(||x||2 + ||y||2).

Opgave 14.35. Neem aan dat A : H → H lineair is en dat voor alle x, y ∈ H geldtdat

|(Ax, y)| ≤ M

2(||x||2 + ||y||2).

Bewijs dat dan ook voor alle x, y ∈ H geldt dat

|(Ax, y)| ≤M ||x|| ||y||,

en dat dus M = ||A||. Hint: pas voor a > 0 de ongelijkheid toe op xa en ay en

minimaliseer het rechterlid.

348

Page 349: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 14.36. Neem aan dat A : H → H een symmetrische continue lineaireafbeelding is en dat er een rij xn ∈ H is met ||xn|| = 1 en (Axn, xn) → ||A|| = Mwaarvoor de rij beelden Axn convergent is. Bewijs dat de limiet een eigenvector is bijeigenwaarde M . Hint: laat zien dat Axn −Mxn → 0.

Opgave 14.37. De spectraalstelling voor A : H → H kompakt, strict positiefdefiniet, symmetrisch en lineair: bewijs dat H een orthonormale basis heeft van eigen-vectoren

φ1, φ2, . . .

van A bij eigenwaarden (uniquely) identified as

µn = max(Ax, x) : x ∈ H, (x, x) = 1, (x, φj) = 0 voor 1 ≤ j < n,

voor n = 1, 2 . . . . Dit zijn ze! Hoe je er ook verder aankomt.

Opgave 14.38. Kun je een voorbeeld bedenken van de stelling in Opgave 14.37 meteen niet-separabele Hilbertruimte? Hint: zoja, heel knap? Zonee, heel goed! Waaromniet?

Opgave 14.39. Kun je een voorbeeld bedenken van de stelling in Opgave 14.37met een separabele Hilbertruimte? Hint: hoe zijn we hierboven eigenlijk begonnenmet λ’s?

Wellicht wat cryptisch, maar dat scherpt de geest. Het springende puntis dat we in IR∞ zijn begonnen op basis van de voor de hand liggende stan-daardbasis, die de prachtige eigenschap heeft dat

ei · ej = (ei, ej) = δij

en vervolgens een ander inprodukt hebben geıntroduceerd aan de hand vandezelfde standaardbasis en een rijtje λ’s. De twee operatorenA0 enA1 hebben(simultaan) precies de e-tjes van de standaardbasis als eigenvectoren bij watwe µ-tjes genoemd hebben.

Opgave 14.40. Voor de µ-tjes en de λ-tjes geldt

λnµn = 1,

en dat moet je wel even begrijpen nu!

349

Page 350: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Zijn er minder flauwe voorbeelden? Ja! Begin maar met een i : V → Hmet een concrete V ⊂ H met V = H die niet al van te voren in IR∞ lagen(maar uiteindelijk via hun coordinaten weer wel in IR∞ te leggen zijn als jede basis van eigenvectoren eenmaal hebt). Nodig is de restrictie tot V ⊂ Hzeker niet. In alle gevallen zijn er twee symmetrische afbeeldingen waarvanhet spectrum kan worden bepaald, A0 : H → H en A1 : V → V , of we nu deextra aannamen37 op i hebben gemaakt of niet. Net als tussen de normen (zieOpgave 14.28) is er een verband tussen de eigenwaarden en eigenvectoren.

Opgave 14.41. Als f een eigenvector is van A0 bij eigenwaarde λ wat is dan eeneigenvector van A1 bij dezelfde λ? Als u een eigenvector is van A1 bij eigenwaarde λwat is dan een eigenvector van A0 bij dezelfde λ? Hint: bekijk een langer stuk van deketen

Vi−→ H

(RH)−1

−−−−−→ H∗i∗−→ V ∗

RV−−→ Vi−→ H

(RH)−1

−−−−−→ H∗i∗−→ V ∗

RV−−→ Vi−→ H

(RH)−1

−−−−−→

en neem aan dat een f ∈ H of een u ∈ V op een λ-veelvoud van zichzelf terechtkomt na 4 stapjes in de keten. In beide gevallen zou de eigenvector die je vindt bij deandere A de nulvector kunnen zijn. Welke conditie op i voorkomt dat?

Bij het toepassen van Opgave 14.37 kunnen we dus kiezen voor A0 of A1.

14.8 The French Connection

Het tripelV ⊂ H = H∗ ⊂ V ∗

met V en H Hilbertruimten, en i : V → H kompakt en V = i(V ) dicht in His het standaardframework dat in de Franse school voor partiele differentiaal-vergelijkingen is ontwikkeld, zie bijvoorbeeld het originele franstalige boekjevan Brezis over functionaalanalyse. Een grote klasse van concrete eigenwaar-denproblemen38 reduceert in abstracto tot een en hetzelfde probleem.

De eerste toepassing is die waarin cosinussen sinussen verschijnen als ei-genfuncties van de oplossingsoperator voor het probleem

−u′′ = f,

waarin we voor f en u nu eerst 2π-periodieke functies nemen. In het volgendehoofdstuk beperken we ons daarbij aanvankelijk tot functies die gemiddeld

37 Injectiviteit van i en dichtheid van (het beeld van) i.38 Denk aan de frequenties van een trillend (muziek)instrument.

350

Page 351: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

nul zijn, en zijn

(f, g) =

∫ π

−πfg en ((u, v)) =

∫ π

−πu′v′

de twee inprodukten die de rol van (f, g) en overnemen ((u, v)) in de concretevoorbeelden hierboven, en zullen we die concrete voorbeelden weer terug zienkomen uit de abstractie.

351

Page 352: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

15 Lebesgue’s Differentiatie Stelling

Wat we nodig hebben is dat meetbare lokaal integreerbare functies f : IR→IR voor bijna alle x voldoen aan

f(x) = limε→0

1

∫ x+ε

x−εf(s) ds,

en die uitspraak bekijken we nu eerst voor meetbare functies f : IRN → IRwaarvoor ∫

IRN

|f | <∞.

Zulke functies vormen de ruimte L1(IRN), met norm

||f ||1 =

∫IRN

|f |.

Omdat ||f ||1 = 0 niet impliceert dat f(x) = 0 voor alle x ∈ IRN maar weldat de maat van

x ∈ IRN : f(x) 6= 0gelijk is aan nul, moeten we f ∈ L1(IRN) zien als een equivalentieklasse [f ]van integreerbare meetbare functies f : IRN → IR onder de relatie

f ∼ g als |x ∈ IRN : f(x) 6= g(x)| = 0.

We gebruiken hier |A| als notatie voor de maat van een meetbare verzamelingA ⊂ IRN.

Voor iedere f ∈ L1(IRN) en iedere bol

B(ξ, r) = x ∈ IRN : (x1 − ξ1)2 + · · ·+ (xn − ξn)2 < r2

bestaat

(Arf)(x) =1

|B(x, r)|

∫B(x,r)

f

onafhankelijk van de keuze van f ∈ [f ] en de verzameling

Nf = x ∈ IRN : limr↓0

(Arf)(x) bestaat niet

dus ook. Als de limiet wel bestaat dan ligt het voor de hand om de repre-sentant f ∈ [f ] zo te kiezen dat de limiet gelijk is aan f(x) voor alle x 6∈ Nf ,en dat voor alle zulke x, maar daarvoor moeten de x-waarden waarvoor delimiet wel bestaat maar

limr↓0

(Arf)(x) 6= f(x),

352

Page 353: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

wel een meetbare verzameling van maat 0 vormen.Een alternatieve manier is om f ∈ L1(IRN) als equivalentklasse van Cau-

chyrijen van continue functies fn die elk buiten een bol Bn identiek nul zijn.Van zo’n rij functies eisen we dan dat

||fn − fm|| =∫

IRN

|fn − fm| → 0

als m,n → ∞, waarbij de integralen de facto gewone Riemann integralenover bollen Bm,n zijn waarbuiten fn en fm nul zijn. Twee zulke Cauchyrijenheten equivalent als ||fn − gn||1 → 0 als n→∞, en

(Arf)(x) = limn→∞

1

|B(x, r)|

∫B(x,r)

fn

is weer ondubbelzinning gedefinieerd, en daarmee ook Nf .We bekijken nu hoe Arf(x) zich gedraagt als r → 0 en dat doen we eerst

voor een gegeven integreerbare meetbare functie f : IRN → IR met behulpvan een te kiezen functie g : IRN → IR die continu is en nul buiten een bol.We schrijven

Arf(x)− f(x) = Arf(x)− Arg(x) + Arg(x)− g(x)︸ ︷︷ ︸→0 als r↓0

+g(x)− f(x),

lim supr↓0

|Arf(x)− f(x)| ≤ lim supr↓0

|Arf(x)− Arg(x)|︸ ︷︷ ︸≤(H(f−g))(x)

+|g(x)− f(x)|, (15.1)

waarin we Hardy-Littlewood functie (van f − g) gebruiken, die voor iederef ∈ L1(IRN) wordt gedefinieerd als

(Hf)(x) = supr>0

(Ar|f |)(x) = supr>0

1

|B(x, r)|

∫B(x,r)

|f | ∈ [0,∞],

met andere woorden, (H(f−g))(x) is de grootst mogelijke gemiddelde waardevan |f(x) − g(x)| op een bollen gecentreerd in x. Voor elke ε > 0 geldt nudat

x ∈ IRN : lim supr↓0

|Arf(x)− f(x)| > 2ε ⊂

x ∈ IRN : H(f − g))(x) > ε ∪ x ∈ IRN : |f(x)− g(x)| > ε, (15.2)

353

Page 354: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

en dus dat (met verkorte notatie)

|lim supr↓0

|Arf(x)− f(x)| > 2ε| ≤ |H(f − g))(x) > ε|︸ ︷︷ ︸nog af te schatten

+1

ε||f − g||,

hetgeen we door g geschikt te kiezen willekeurig klein willen praten teneindete concluderen dat

∀ε > 0 : |lim supr↓0

|Arf(x)− f(x)| > 2ε| = 0. (15.3)

In dat geval is ook

|lim supr↓0

|Arf(x)− f(x)| > 0| = 0, (15.4)

met andere woorden, de verzamelingen van punten waarvoor

limr↓0

Arf(x) (15.5)

niet bestaat of niet samenvalt met f(x) heeft maat nul.Voor het afschatten van H(f−g))(x) merken we op dat (neem even g ≡ 0)

de verzamelingEε = x ∈ IRN : (Hf)(x) > ε

open is omdat

x ∈ Eε ⇐⇒ ∃r > 0 :

∫B(x,r)

|f |︸ ︷︷ ︸continu in r,x

> ε|B(x, r)|. (15.6)

De continuiteit volgt uit de gedomineerde convergentiestelling.Hoe groot kan Eε zijn? Iedere kompakte K ⊂ Eε wordt overdekt door

slechts eindig veel bolletjes zoals in (15.6), zeg

K ⊂ B1 ∪ · · · ∪Bm,

en als deze bolletje voor elke kompakte K ⊂ Eε disjunct gekozen kunnenworden dan volgt voor iedere kompakte K ⊂ Eε dat

ε|K| ≤ ε(|B1 + · · ·+ |Bm|) ≤∫B1

|f |+ · · ·+∫Bm

|f | =∫B1∪···∪Bm

|f | ≤∫

IRN

|f |,

en daarmee dat ε|Eε| ≤ ||f ||1.

354

Page 355: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Zo’n disjuncte keuze is in het algemeen natuurlijk niet mogelijk maar meteen extra factor geldt er wel zo’n schatting. Kies daartoe de grootste bol,zeg Bj1 . De bollen Bi waarvoor Bi ∩Bj1 6= ∅ liggen allemaal in 3Bj1 waarbij3Bj1 staat voor de bol met hetzelfde middelpunt als Bj1 maar met drie keerzo grote straal. Als er nog andere bollen zijn neem dan daarvan weer degrootste, zeg Bj2 . Die andere bollen hebben allemaal Bi ∩ Bj1 = ∅, en diewaarvoor Bi ∩ Bj2 6= ∅ liggen allemaal in 3Bj2 . Als er nog andere bollenzijn waarvoor Bi ∩ Bj1 = Bi ∩ Bj2 = ∅ neem dan daarvan weer de grootste,zeg Bj3 . Enzovoorts. Dit proces breekt af, mogelijk na de keuze van j1,mogelijk na de keuze van j2, of misschien pas na de keuze van jk. Als Bjk

met 1 ≤ k ≤ m de laatste gekozen grootste bol is, dan zijn1

Bj1 , . . . , Bjk

onderling disjunct en geldt

B1 ∪ · · · ∪Bm ⊂ 3Bj1 ∪ · · · ∪ 3Bjk ,

zodat

||f ||1 ≥∫B1∪···∪Bm

|f | ≥∫Bj1∪···∪Bjk

|f | =∫Bj1

|f |+ · · ·+∫Bjk

|f |

≥ ε(|Bj1|+ · · ·+ |Bjk |) = 3−Nε(|3Bj1|+ · · ·+ |3Bjk |)≥ 3−Nε|3Bj1 ∪ · · · ∪ 3Bjk | ≥ 3−Nε|B1 ∪ · · · ∪Bm| ≥ 3−Nε|K|

voor alle kompakte K ∈ Eε en dus volgt dat

ε|Eε| ≤ 3N||f ||1, (15.7)

hetgeen we gebruiken in (15.2) om te concluderen dat

|x ∈ IRN : lim supr↓0

|Arf(x)− f(x)| > 2ε| ≤ 1

ε(3N + 1)||f − g||1. (15.8)

Als elke f ∈ L1(IRN) willekeurig goed in 1-norm te benaderen is met continuefuncties g die nul zijn buiten een bol, volgt (15.4).

Per definitie van meetbaarheid en integreerbaarheid is iedere f ∈ L1(IRN)zowel de puntsgewijze limiet als limiet in 1-norm van een rij functies van devorm

K∑k=1

akχEk

1 De uitspraak die nu volgt bewijst Vitali’s covering lemma.

355

Page 356: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

waarin E1, . . . , EK onderling disjuncte meetbare verzamelingen zijn met ein-dige maat, en

χE(x) =

1 als x ∈ E0 als x 6∈ E,

de karakteristieke functie van E definieert. De maat van zo’n E wordt alsuitwendige maat gedefinieerd via karakteristieke functies van blokken die wemet blipfuncties kunnen benaderen in 1-norm. Bijgevolg kan in (15.8) hetrechterlid willekeurig klein gekozen worden.

Zo hebben we Lebesgue’s differentiatiestelling nu bewezen. Iedere lokaalintegreerbare meetbare functie heeft de eigenschap voor bijna elke x geldtdat

f(x) = limr↓0

Arf(x).

Ook zonder maat- en integratie theorie is zo’n uitspraak te formuleren enbewijzen, rechtstreeks vanuit de definitie van f ∈ L1(IRN) als equivalentklassevan Cauchyrijen van continue functies fn die elk buiten een bol Bn identieknul zijn. Van zo’n rij functies eisen we dan dat

||fn − fm|| =∫

IRN

|fn − fm| → 0

als m,n → ∞, waarbij de integralen de facto gewone Riemann integralenover bollen Bm,n zijn waarbuiten fn en fm nul zijn. Twee zulke Cauchyrijenheten equivalent als ||fn − gn||1 → 0 als n→∞, en

(Arf)(x) = limn→∞

1

|B(x, r)|

∫B(x,r)

fn

is weer ondubbelzinning gedefinieerd, en daarmee ook Nf , maar de puntge-wijze limiet

limn→∞

fn(x)

hoeft in het algemeen niet te bestaan. Maar wel geldt

|fn(x)−fm(x)| ≤ |fn(x)− Arfn(x)|︸ ︷︷ ︸→0 als r↓0

+ |Arfn(x)− Arfm(x)|︸ ︷︷ ︸≤H(fn−fm)(x)

+ |Arfm(x)− fm(x)|︸ ︷︷ ︸→0 als r↓0

,

en dus dat we, gegeven ε > 0 en η > 0,

|x ∈ IRN : |fn(x)− fm(x)| > ε| ≤ 1

ε3N||fn − fm|| ≤ η

kunnen forceren door m,n ≥ N te kiezen waarbij N afhangt van ηε3−N viade Cauchy-eigenschap van de rij fn.

356

Page 357: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Neem nu εk ↓ 0 en ηk ↓ 0 met

∞∑k=1

εk = ε,

∞∑k=1

ηk = η

en bijbehorende Nk zoals hierboven dan convergeert fNk uniform op het com-plement F van de vereniging

E = ∪∞k=1x ∈ IRN; |fNk+1(x)− fNk(x)| > εk,

en

|E| ≤∞∑k=1

ηk = η.

Noem η = δ1, E = E1, F = F1 en herhaal het argument met η = δ2 < δ1. Ditgeeft E2 met |E2| ≤ δ1 en een op F2 = Ec

2 uniform convergente verdere deelrij.Met δn ↓ 0 geeft dit Gn = F1 ∪ · · · ∪ Fn met Gc

n ⊂ En en dus |Gcn| ≤ δn → 0,

met steeds verdere deelrijen uniform convergent op Gn. De diagonaal rijconvergeert nu op het complement van de nulverzameling ∩∞n=1En.

357

Page 358: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

16 Functies op de cirkel

Als we afspreken dat twee getallen in IR eigenlijk hetzelfde zijn als ze eengeheel veelvoud van 2π verschillen dan maken IR en 2π de verzameling IR2π,een verzameling waarin op natuurlijke manier de optelling is gedefinieerd.Dat gaat net als in IZn, de verzameling die we krijgen uit de verzameling IZvan gehele getallen en een vast getal n ∈ IN, door af te spreken dat tweegehele getallen gelijk zijn als ze een geheel veelvoud van n verschillen. Zoalsvaak

IZn = 0, 1, . . . , n− 1

wordt geschreven, met 0 = n, kunnen we ook

IR2π = [0, 2π)

schrijven, maar we geven er de voorkeur om IR2π in de schrijfwijze te latencorresponderen met [−π, π), waarbij −π = π. Deze π is hier een positiefreeel getal, waarvoor we op enig moment de π die we van de cirkel kennenzullen nemen, maar dat hoeft nu nog even niet. Net als IZn is IR2π met devoor de hand liggende optelling een commutatieve groep1.

Functies f : IR → IR die 2π-periodiek zijn kunnen we ook opvatten alsfuncties f : IR2π → IR, en omgekeerd. De verzameling van continue 2π-periodieke functies noemen we

C(IR2π).

Ieder tweetal functies gedefinieerd op dezelfde verzameling, dus ook f en gin C(IR2π), kunnen we bij elkaar optellen2 middels

xf+g−−→ f(x) + g(x)

als definitie van f + g ∈ C(IR2π). Met

xtf−→ tf(x)

voor t ∈ IR en f ∈ C(IR2π) is ook de scalaire vermenigvuldiging gedefinieerden zo is C(IR2π) een vectorruimte3 over IR, waarop

f · g = (f, g) =

∫ π

−πf(x)g(x) dx

1 Google: Abelian group.2 Evenzo is natuurlijk ook fg gedefinieerd via x

fg−→ f(x)g(x).3 En met de vermenigvulding een algebra.

358

Page 359: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

een inwendig produkt4 definieert, maar C(IR2π) is met dit integraalinproduktgeen Hilbertruimte, zoals de volgende opgave laat zien.

Opgave 16.1. De zaagtandfunctie Z wordt gedefinieerd door

Z(x) =

π − x als x ∈ (0, π] ;

−x− π als x ∈ [−π, 0),

en door Z(0) = 0. Met deze keuze voor Z(0) behoort Z tot C0(IR2π), de ruimte5 vanfuncties f : IR2π → IR die continu zijn in iedere x ∈ IR2π, behalve eventueel in x = 0,maar waarvoor wel geldt dat

f(0) =1

2

(limx↓0

f(x) + limx↑0

f(x)

),

waarbij linker- en rechterlimiet dus allebei bestaan. Op C0(IR2π) is (f, g) → f · g ookeen inprodukt. Teken de grafieken van een rij functies Z1, Z2, . . . in C(IR2π) waarvoorgeldt dat (Zn − Z,Zn − Z)→ 0 als n→∞.

De rij Z1, Z2, . . . is convergent in C0(IR2π) met betrekking tot de inpro-duktnorm

f → |f | =√

(f, f) =

(∫ π

−π|f |2) 1

2

omdat |Zn−Z| → 0 als n→∞, en dus is de rij Z1, Z2, . . . ook een Cauchyrijin C(IR2π) met die inproduktnorm, die echter in C(IR2π) geen limiet heeft6.Om van C(IR2π) met de inproduktnorm een Hilbertruimte te maken, die wede naam

L2(IR2π)

willen geven, moeten we alle limieten van Cauchyrijtjes aan C(IR2π) toevoe-gen, maar hoe doe je dat?

16.1 Een Hilbert ruimte voor (periodieke) functies?

De abstracte constructie van een Hilbertruimte H uit C(IR2π) met zijn in-produkt is dat je een 2-Cauchyrijtje f1, f2, . . . , een rijtje waarvoor geldt dat

|fn − fm|2 → 0

4 Let op, met (f, g)·−→ f · g = (f, g) is de haakjesnotatie soms verwarrend.

5 De notatie C0 is alleen voor nu even.6 Waarom niet?

359

Page 360: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

als m,n→∞, ziet als een benadering van een functie f in de te construerenH. Dit is analoog aan de vertrouwde gewoonte om decimale of binaire ont-wikkelingen te zien als benaderingen van reele getalen, waarbij verschillendeontwikkelingen hetzelfde reele getal kunnen maken. Bij die reele getallendenk je doorgaans aan punten op een getallenlijn, al hoeft dat natuurlijkniet: als je het jezelf moeilijk wil maken kan de abstracte constructie van IRprima zonder.

De standaardvisualisatie van een functie is de grafiek van die functie, inhet geval f : IR→ IR een deelverzameling G van

IR2 = (x, y) : x, y ∈ IR

met de eigenschap dat

∀x ∈ IR ∃1 y ∈ IR : (x, y) ∈ G.

In deze notatie is ∀ short voor voor alle , en staat ∃1 voor er is precieseen7. Die ene y in de uitspraak wordt in deze context bij afspraak genoteerdals f(x), en daarmee is de formele definitie van een grafiek in IR2 de factoequivalent met de definitie van een functie van IR naar IR. Omdat IR2 alsvlak in ons hoofd past, en de grafiek G van f : IR → IR daar weer eendeelverzameling van is, zien we de grafiek G van f nu in het platte xy-vlakals de verzameling gegeven door y = f(x).

Het ligt voor de hand om de abstracte constructie van H uit C(IR2π)te zien als gebeurende in het platte vlak IR2, waarbij de grafiek G van eenfunctie f : IR2π → IR dus de eigenschap moet hebben dat

x1 − x2

2π∈ IZ =⇒ f(x1) = f(x2),

hetgeen overeenkomt met het oprolbaar8 zijn van het oneindige platte vlaktot een cylinder waarin de grafiek G keurig over zichzelf heen ligt.

Met of zonder voorstelling, twee verschillende 2-Cauchyrijtjes f1, f2, . . .en g1, g2, . . . in C(IR2π) moeten hetzelfde element uit de te maken H zijn alsgeldt dat

|fn − gn| → 0

voor n→∞. Opgave 16.1 laat bijvoorbeeld zien dat de zaagtandfunctie Z inde te maken H moet zitten, maar niet iedereen zal dezelfde rij Z1, Z2, . . . alsgrafieken getekend hebben. Het is goed om dat nog wat preciezer te bekijken.

7 ∃ staat voor er bestaat een.8Stel je de problemen bij het oprollen even voor....

360

Page 361: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 16.2. Maak Opgave 16.1 nog een keer maar anders. Teken de grafieken vaneen rij functies Zn ∈ C(IR2π) waarvoor geldt dat (Zn − Z, Zn − Z)→ 0 als n→∞.Kies de rij functies Z1, Z2, . . . nu zo dat voor alle n ∈ IN geldt dat Zn(0) = 1.

Opgave 16.3. Maak Opgave 16.2 maar nu met Zn(0) = 0.

Opgave 16.4. Maak Opgave 16.3 maar nu met Zn(0) = 2.

Opgave 16.5. Maak Opgave 16.3 maar nu met Zn(0) = n.

Opgave 16.6. Laat in Opgaven 16.2,16.3,16.4,16.5 hierboven zien dat |Zn− Zn| →0 als n→∞, waarbij Zn is als in Opgave 16.2.

Wat deze opgaven laten zien is dat functies in H geen gewone functieskunnen zijn. Abstract gezien zouden alle benaderende rijen dezelfde Z :IR2π → IR moeten maken, maar dat lijkt via de opgaven hierboven te leidentot de conclusie dat

0 = Z(0) = 1

en meer verwarring. Soortgelijke spelletjes kunnen we spelen met de nulfunc-tie

x0−→ 0

zelf.

Opgave 16.7. Maak een rij functies f1, f2, . . . in C(IR2π) waarvoor geldt datfn(0) = 1 en |fn| = |fn − 0| → 0.

Iedere rij echte functies fn die we gebruiken om een f in H te maken kanveranderd worden in een rij fn die in een gegeven punt gek gedrag vertoont,zoals convergeren naar een ‘verkeerde’ limiet, maar wel de eigenschap heeftdat |fn− fn| → 0. We moeten kennelijk af van het idee dat een functie in elkpunt gedefinieerd is. In sommige punten is dat wellicht een artefact, zoals inOpgave 16.7, maar bij functies als Z is er echt een keuze die gemaakt moet

361

Page 362: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

worden. Of niet, als we afspreken dat functies niet per se in elk punt vanhun definitiegebied gedefinieerd hoeven zijn. Let op, met Z zitten ook alleverschoven zaagtandfuncties Zp (met p ∈ IR)

xZp−→ Z(x− p)

in H, en daarmee ook een grote klasse van functies van de vorm

S =∞∑n=1

anZpn ,

waarbij p1, p2, . . . een willekeurige rij punten in IR mag zijn, en elke pn eenprobleempunt is voor wat betreft de definitie van S(pn).

Opgave 16.8. Neem aan dat H geconstrueerd is zoals hierboven beschreven. Neemaan dat p1, p2, . . . en a1, a2, . . . rijen in IR zijn, en dat

∞∑n=1

|an| <∞.

Waarom moet gelden dat S ∈ H? Hint: laat eerst zien dat S een begrensde functieis.

Kortom, behalve de mooie periodieke functies

xcn−→ cosnx

enx

sn−→ sinnx

(n ∈ IN), waarvan we ook sommen van de vorm

∞∑n=1

ancn +∞∑n=1

bnsn (16.1)

kunnen nemen, met coefficienten als in Opgave 16.8, moeten er in de Hdie we zoeken een heleboel lelijke functies zitten. Daarbij moeten evidentverschillende functies soms (of vaak) als element van H als dezelfde functiegezien worden. Waarom? Omdat twee Cauchyrijen f1, f2, . . . en f1, f2, . . .in C(IR2π) met de eigenschap dat fn − fn → 0 dezelfde f in H moetenmaken, en we in de voorbeelden gezien hebben dat bijvoorbeeld fn(0) enfn(0) verschillende of helemaal geen limieten kunnen hebben.

362

Page 363: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 16.9. Maak een Cauchyrij f1, f2, . . . die naar de nulfunctie 0 convergeertin de inproduktnorm maar waarvoor de rij f1(x), f2(x), . . . niet convergeert, welkex ∈ IR2π je ook kiest.

De vraag is dus niet alleen welke functie je kiest als de meest natuurlijkefunctie binnen een equivalentieklasse van functies die in H niet van elkaar teonderscheiden zijn, maar ook hoe je uberhaupt aan zo’n functie komt als fin H gedefinieerd is via een Cauchyrij f1, f2, . . . in C(IR2π).

16.2 Standaard Hilbertruimten voor ‘functies’

In wat volgt maken we enerzijds precies welke functies f op te vatten zijnals f ∈ H en anderzijds waarom we die functies nog wel als functies zien.Iedere f ∈ H moet daartoe voor bijna9 alle x ∈ IR2π een natuurlijke waardehebben, waarbij het gedrag van f in de buurt van elk zulk een x leidend moetzijn10. Voor de zaagtand Z leidt dit bij het gelijkwegen van wat Z(x) is voorx < 0 en x > 0 onherroepelijk tot Z(0) = 0 als de natuurlijke keuze voorZ(0), het gemiddelde van de linker- en rechterlimiet. Maar of zulke limietenvoor iedere f in de H die we maken altijd in genoeg punten bestaan is (zekera priori) niet zo duidelijk.

Hoe het ook zij, de waarde van f ∈ H in π = −π ∈ S doet er niet toe.Voor iedere a ∈ IR en iedere functie f : (a− π, a+ π) die we toe willen latenin H na periodieke uitbreiding van f tot IR→ IR is het niet belangrijk of enhoe f(a − π) en f(a + π) gedefinieerd zijn. In het bijzonder is de functie Zgedefinieerd

x ∈ (0, 2π)Z−→ π − x

na periodieke uitbreiding tot Z : IR → IR in H gelijk aan de Z uit Opgave16.1. Waar bij de functies cn en sn het periodiek uitbreiden vanzelf gaat, ishet bij functies als Z vervelend om de formules uberhaupt op te schrijven.

De functie Z heeft in ieder geheel veelvoud van 2π een sprong. De even-eens oneven blokfunctie blok ∈ H, gedefinieerd door

blok(x) =

1 als x ∈ (0, π) ;

−1 als x ∈ [−π, 0),

heeft in ieder geheel veelvoud van π een sprong. De even kartelrandfunctie

9 Wat bijna betekent is de hamvraag.10 Waarom eigenlijk? Wel, we zijn uitgegaan van continue functies.

363

Page 364: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Ka ∈ H daarentegen, gedefinieerd door

Ka(x) =

π2− x als x ∈ (0, π) ;

π2

+ x als x ∈ [−π, 0),

heeft geen sprongen als we de definitie van Ka uitbreiden met Ka(2πn) = π2

in de gehele veelvouden 2πn van 2π (n ∈ IZ). Al deze functies zijn instructiefals voorbeeld bij de vraag of ze te schrijven zijn als een oneindige som vande vorm (16.1). Met name de zaagtand is een bron van leerzaam vermaakzoals we zullen zien.

Opgave 16.10. Schets de grafieken van Z, blok,Ka, en ook van c1 = cos en s1 = sin.

Ga nog eens na dat de functies

cn√π,sn√π

(n ∈ IN),1√2π

een orthonormaal stelsel vormen, en dat H dus alle ‘functies’ f van de vorm

f = a01√2π

+∞∑n=1

ancn√π

+∞∑n=1

bnsn√π

(16.2)

zou moeten bevatten, meestal geschreven als

f =a0

2+∞∑n=1

(ancn + bnsn),

als de (net iets andere) rijtjes van coefficienten an en bn maar kwadratischsommeerbaar zijn.

De vraag of je zo alle f in H krijgt kan beginnen met de vraag of deoneven functies Z en blok te schrijven zijn als

∞∑n=1

bnsn,

en de even functie Ka als∞∑n=1

ancn.

364

Page 365: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

De sommen moeten hierbij convergent zijn in de 2-norm die hoort bij hetstandaard inproduct

f · g = (f, g) =

∫ π

−πf(x)g(x) dx.

Ons doel is te laten zien dat iedere f in H inderdaad van de vorm (16.2) met

∞∑n=0

a2n <∞,

∞∑n=1

b2n <∞,

en een karakterisatie van H als L2(IR2π) die los staat van de specifieke keuzedie we met (16.2) maken.

16.3 Fourierreeksen

De functie

f7(x) = sin x− sin 2x

2+

sin 3x

3− sin 4x

4+

sin 5x

5− sin 6x

6+

sin 7x

7

is periodiek met periode 2π. Op het interval (−π, π) ligt de grafiek van f7

vlakbij de grafiek van de oneven functie f(x) = 12x. Kennelijk is

x

2=∞∑k=1

(−1)k+1 sin kx

k, (16.3)

maar alleen voor −π < x < π.

Opgave 16.11. Er is een verband met machtreeksen: het rechterlid in (16.3) is hetimaginaire deel van

∞∑k=1

(−1)k+1

kζk, ζ = eix.

Bepaal de som van deze machtreeks voor |ζ| < 1. Hint: differentieer naar ζ, sommeeren primitiveer.

Opgave 16.12. Volgens de complexe versie van het criterium van Leibniz conver-geert de machtreeks in in Opgave 16.11 voor alle ζ met |ζ| = 1 behalve ζ = −1.Aangenomen dat de somfunctie die je in Opgave 16.11 hebt gevonden ook geldig isvoor alle ζ met |ζ| = 1 waar de reeks convergeert, verifieer (16.3). Op de complexeversie van het criterium van Leibniz en de aanname komen we nog terug in Sectie 5.2.

365

Page 366: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

De reeks in (16.3) heet een Fouriersinusreeks. Maken we van de “minnen”plussen dan vinden we dat de grafiek van de functie

h7(x) = sin x+sin 2x

2+

sin 3x

3+

sin 4x

4+

sin 5x

5+

sin 6x

6+

sin 7x

7

op het interval (0, 2π) vlakbij de grafiek van de functie f(x) = π−x2

ligt.

De functie

g7(x) = cos x− cos 2x

4+

cos 3x

9− cos 4x

16+

cos 5x

25− cos 6x

36+

cos 7x

49

heeft een grafiek op het interval (−π, π) vlakbij de grafiek van de even functie

g(x) =π2

12− x2

4

ligt. Kennelijk isx2

4=π2

12+∞∑k=1

(−1)kcos kx

k2.

Het rechterlid, inclusief de constante term, heet een Fouriercosinusreeks. In-vullen van x = 0 geeft

π2

12= 1− 1

4+

1

9− 1

16+

1

25− · · · .

We zullen zien dat bij even 2π-periodieke functies Fouriercosinusreeksen ho-ren, en bij oneven 2π-periodieke functies Fouriersinusreeksen. Omdat elkefunctie te splitsen is in een even en een oneven functie,

f(x) =f(x) + f(−x)

2+f(x)− f(−x)

2,

hoort zo bij een algemene 2π-periodieke functie de som van een Fouriercosi-nusreeks en een Fouriersinusreeks. Zo’n som heet een Fourierreeks. Schrijvenwe de cosinussen en sinussen uit in complexe e-machten,

cosx =eix + eix

2, sinx =

eix − eix

2i,

dan wordt een algemene Fourierreeks een reeks van de vorm

∞∑k=−∞

ckeikx =

a0

2+∞∑k=1

(ak cos kx+ bk sin kx) (16.4)

366

Page 367: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Uiteindelijk zullen we er voor kiezen om met de complexe vorm te werken,het linkerlid in (16.4) dus, een Laurentreeks in ζ = eix.

Uit de Cauchy integraal formules hebben we Laurentreeksen van de vorm

∞∑k=−∞

ckζk (16.5)

zien verschijnen voor complex differentieerbare functies f(ζ) op een annulus

ζ ∈ IC : R1 < |ζ| < R2,

waarbij het plusstuk∞∑k=0

ckζk

convergent is voor |ζ| < R2 en het minstuk

∞∑k=1

c−kζ−k

convergent is voor |ζ| > R1. Als R1 = 0 dan heeft f(ζ) in ζ = 0 een aldan niet ophefbare singulariteit. Omgekeerd, als we met een willekeurigeLaurentreeks van de vorm (16.5) beginnen dan zijn er bijbehorende R1 enR2 zodat het plusstuk convergeert naar een complex differentieerbare functieop ζ ∈ IC : |ζ| < R2 en het minstuk naar een complex differentieerbarefunctie op ζ ∈ IC : |ζ| > R1. A priori kunnen zowel R1 als R2 ook 0 of ∞zijn, en in het algemeen kan R1 groter of kleiner zijn dan R2. Laurentreeksendie verschijnen als Fourierreeksen van 2π-periodieke functies f(x) via ζ = eix

hebben meestal R1 = R2 = 1. In het vervolg zullen we zulke 2π-periodiekefuncties zien als functies f : (−π, π)→ IC.

Fourierreeksen gaan terug tot Daniel Bernouilli, die de golfvergelijking

∂2u

∂t2=∂2u

∂x2

voor bijvoorbeeld 0 < x < π en met randvoorwaarde u = 0 voor x = 0 enx = π, met Fouriersinusreeksen probeerde op te lossen. Later was Fourier deeerste die voor een gegeven functie f de coefficienten in integralen wist uit dedrukken, toen hij Fouriersinusreeksen gebruikte om de warmtevergelijking

∂u

∂t=∂2u

∂x2

367

Page 368: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

op te lossen.

Tegenwoordig zien we de functies

1

2, cosx, sinx, cos 2x, sin 2x, . . . ,

en. . . , e−3ix, e−2ix, e−ix, e0ix = 1, eix, ei2x, e3ix, . . .

als orthonormale bases in een (Hilbert)ruimte van functies, en de Fouriercoef-ficienten als coordinaten ten opzichte van deze basis. Voor een grote klassevan functies f : (−π, π) → IR zijn de Fouriercoefficienten ak, bk en ck alscoordinaten van f ten opzichte van deze bases gedefinieerd. De N-de partielesom van de Fourierreeks van f is

SNf(x) =

N∑k=−N

ckeikx =

a0

2+

N∑k=1

(ak cos kx+ bk sin kx), (16.6)

met Fouriercoefficienten

an =1

π

∫ π

−πf(x) cosnx dx, bn =

1

π

∫ π

−πf(x) sinnx dx, (16.7)

cn =1

∫ π

−πf(x)e−inx dx. (16.8)

Het volgende programma is bedoeld om vertrouwd te raken met Fourierreek-sen. Gebruik Maple/Mathematica voor de plotjes. De integralen kun je betermet de hand doen.

Opgave 16.13. Bereken∫ π−π cosnx cosmxdx en

∫ π−π cosnx sinmxdx voor gehele

m en n.

Opgave 16.14. Laat f : (0, π) → IR gegeven zijn door f(x) = 1 en kies een2π-periodieke uitbreiding f : IR → IR die even is (i.e. f(x) = f(−x)). Bereken alleFouriercoefficienten an en bn.

Opgave 16.15. Laat f : (0, π) → IR gegeven zijn door f(x) = 1 en kies een2π-periodieke uitbreiding f : IR→ IR die oneven is (i.e. f(x) = −f(−x)).

368

Page 369: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

1. Bereken alle Fouriercoefficienten an en bn.

2. Plot f en SNf (voor een aantal waarden van N) in een grafiek.

3. Onderzoek numeriek wat er gebeurt met de grootte en plaats van het maximumvan SNf als N→∞.

4. Vereenvoudig SNf in x = π2 . Vergelijk dit met f(π2 ). Van welke gewone reeks

is, aangenomen dat SNf(π2 ) naar f(π2 ) convergeert, nu de som te bepalen?

5. Idem voor x = π4 .

Opgave 16.16. Laat f : (0, π)→ IR gegeven zijn door f(x) = sinx. Kies een even2π-periodieke uitbreiding f : IR→ IR. Bereken alle Fouriercoefficienten an en bn.

1. Bereken alle Fouriercoefficienten an en bn.

2. Plot f en SNf (voor een aantal waarden van N) in een grafiek.

3. Vereenvoudig SNf in x = 0. Vergelijk dit met f(0). Van welke gewone reeksis, aangenomen dat SNf(0) naar f(0) convergeert, nu de som te bepalen?

4. Idem voor x = π2 .

5. Idem voor x = π4 .

Opgave 16.17. Laat f : (0, π) → IR gegeven zijn door f(x) = cosx en kies eenoneven 2π-periodieke uitbreiding f : IR→ IR.

1. Bereken alle Fouriercoefficienten an en bn en plot f en SNf (voor een aantalwaarden van N) in een grafiek.

2. Vergelijk het gedrag bij x = 0 voor N groot met dat in som 16.15.

3. Neem nu de oneven 2π-periodieke uitbreiding f(x) = 1−cosx (het verschil vande functie in som 16.15 en de functie in deze som). Onderzoek numeriek hetgedrag van SNf bij x = 0 voor N.

Opgave 16.18. Laat f : (0, π) → IR gegeven zijn door f(x) = π − x en kies eenoneven 2π-periodieke uitbreiding f : IR→ IR.

369

Page 370: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

1. Bereken alle Fouriercoefficienten an en bn en plot f en SNf (voor een aantalwaarden van N) in een grafiek.

2. Differentieer SNf(x) naar x en noem de afgeleide dN(x). Zijn er waarden vanx waarvoor dN(x) convergeert als N→∞?

Opgave 16.19. Laat f : (0, π) → IR gegeven zijn door f(x) = x(π − x) en kieseen oneven 2π-periodieke uitbreiding f : IR→ IR.

1. Bereken alle Fouriercoefficienten an en bn en plot f en SNf (voor een aantalwaarden van N) in een grafiek.

2. Vereenvoudig SNf in x = π2 . Vergelijk dit met f(π2 ). Van welke gewone reeks

is, aangenomen dat SNf(x) naar f(x) convergeert, nu de som te bepalen?

3. Differentieer SNf(x) naar x en noem de afgeleide gN(x). Laat zien dat gN(x)op IR uniform convergeert naar een limietfunctie.

4. Bepaal die limietfunctie numeriek.

5. Vergelijk gN(0) met zijn limietwaarde. Welke som van welke gewone reeks vindenwe nu?

16.4 Convergentie van Fourierreeksen

Bij de vraag of, en in welke zin, de Fourierreeks convergeert, en ook als limietf heeft, m.a.w. of

f(x) =∞∑

k=−∞

ckeikx =

a0

2+∞∑k=1

(ak cos kx+ bk sin kx),

speelt het begrip convolutie een belangrijke rol.

Opgave 16.20. Laat zien dat

SNf(x) =1

∫ π

−πDN(y)f(x− y)dy,

de convolutie van de functies Dn en f op (−π, π), waarbij

DN(x) =sin(N + 1

2)x

sin 12x

=

N∑k=−N

eikx. (16.9)

370

Page 371: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Maak plotjes van DN voor een aantal waarden van N.

De functie DN

heet de Dirichlet kern. Voor grote N concentreert dezefunctie zich bij 0 met een steeds smallere piek waarvan de oppervlakte naar2π gaat. Dat is de reden dat S

Nf(x) naar f(x) convergeert als f voldoende

netjes is. Omdat DN

voor grotere N steeds meer tekenwisselingen heeft is ditlastig om te bewijzen. Het gemiddelde van D0,..,D

N,

FN(x) =

1

N + 1(D0(x) + · · ·+D

N(x)) =

1

N + 1

sin2 (N+1)x2

sin2 x2

, (16.10)

is een veel mooiere functie. Geen tekenwisselingen, integraal 2π, en gepiektin 0.

Opgave 16.21. Leidt de laatste gelijkheid in (16.10) door

sinx

2+ · · ·+ sin

(N + 1)x

2

als imaginair deel van een eindige meetkundige reeks te schrijven. Verifieer ook dat∫ π

−πFN(x)dx = 2π,

en dat FN(x)→ 0 als N→∞ behalve in veelvouden van 2π. Preciezer:

0 < δ ≤ x ≤ π =⇒ 0 ≤ FN(x) ≤ 1

N + 1

1

sin2 δ2

.

Voor vaste δ is de bovengrens klein te maken door N groot te maken. Merk op datFN(x) even en 2π periodiek is. Maak plotjes van FN voor een aantal waarden van N.

Als een rij getallen an convergeert naar een limiet A, dan convergeren ookde gemiddelden

a1 + a2 + · · ·+ ann

naar A. De laatste limiet kan ook bestaan als de rij an zelf niet conver-geert. Als we de rij an gebruiken om een A te benaderen dan kunnen wedus net zo goed eerst naar de gemiddelden kijken. Dat is het idee achter deCesarosommen:

371

Page 372: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 16.22. Definieer

σNf =1

N + 1(S0f + S1f + · · ·+ SNf),

de Cesarosommen van f . Laat zien dat

σNf(x) =1

∫ π

−πFN(y)f(x− y)dy.

Opgave 16.23. Laat f een integreerbare (lees: begrensde stuksgewijs continue)2π-periodieke functie zijn. Laat zien dat dan

σNf(x)− f(x) =1

∫ π

−πFN(y) (f(x− y)− f(x)) dy

Opgave 16.24. Laat f een integreerbare 2π-periodieke functie zijn, met |f(x)| ≤Mvoor alle x, waarbij M ≥ 0 vast is. Neem aan dat voor x vast en |y| ≤ δ geldt dat|f(x− y)− f(x)| ≤ ε. Laat zien dat dan

|σNf(x)− f(x)| = 1

∫ π

−πFN(y)|f(x− y)− f(x)|dy ≤ ε+

2M

N + 1

1

sin2 δ2

.

Hint: splits de integraal in 3 integralen.

Opgave 16.25. Laat f een 2π-periodieke continue functie zijn. Dan is f uniformcontinu en begrensd. Waarom? Bewijs dat σNf uniform naar f convergeert alsN→∞.

Opgave 16.26. Laat f een 2π-periodieke begrensde stuksgewijs continue functiezijn met de eigenschap dat in elk punt de linker en de rechterlimiet bestaan. Bewijsdat voor elke x de rij σNf(x) convergeert als N→∞. Wat is de limiet? Hint: splitsde integraal in 4 integralen.

372

Page 373: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 16.27. Laat f : [−π, π] → IR 2 keer continu differentieerbaar zijn metf(±π) = f ′(±π) = f ′′(±π) = 0. Bewijs dat f in elk punt de som van zijn (uniformconvergente) Fourierreeks is. Hint: laat met partieel integreren en schatten zien datde Fouriercoefficienten an en bn sommeerbare rijen vormen.

Opgave 16.25 laat zien dat in de ruimte van continue functies 2π-periodiekefuncties voorzien van de maximumnorm

||f ||∞ = maxx∈myR

|f(x)|

geldt dat de Cesarosommen van f naar f convergeren: ||σNf − f ||∞ → 0 als

N → ∞. Maar hoe zit het met SNf zelf? Daartoe is een andere norm veel

geschikter. Bij lineaire algebra of topologie zijn ongetwijfeld verschillendenormen van 2-vectoren x =

(x1

x2

)behandeld, bijvoorbeeld

||x||∞ = max(x1, x2), ||x||1 = |x1|+ |x2|, ||x||2 = (|x1|2 + |x2|2)12 .

Als we in de laatste norm elke 2 door p vervangen (niet de subscript!) dankrijgen we de p-norm. De p-norm is een norm als p ≥ 1. Je kunt er meerederen zoals je dat gewend bent bij de absolute waarde. De normaxioma’szijn, voor vectoren x en y, en scalairen λ:

||x|| ≥ 0; ||x|| = 0⇔ x = 0; ||λx|| = |λ| ||x||; ||x+ y|| ≤ ||x||+ ||y||.

Alleen de 2-norm is een inprodukt norm. Met x · y = x1y1 + x2y2 geldt

||x||22 = x · x.

Om ook voor functies de 2-norm in te voeren maken we eerst een inprodukt.Hieronder zijn f en g steeds 2π-periodieke stuksgewijs continue functies f, g :IR→ IR. We doen dus alles eerst nog reeel. Met stuksgewijs continu bedoelenwe dat op elk begrensd interval er slechts eindig veel punten zijn waar defunctie niet continu is en dat in die punten linker- en rechterlimieten bestaan.De integraal

f · g =

∫ π

−πf(x)g(x)dx (16.11)

heet het inprodukt van de functies f en g. We zien f en g als vectoren.Voor elke x zou je dan f(x) en g(x) als coordinaten van f en g kunnen

373

Page 374: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

zien. Daar heb er dan wel heel veel van, voor elke x een van f en een vang. Overeenkomstige coordinaten vermenigvuldigen en sommeren gaat niet,maar integreren wel. Vandaar de inproduktnotatie. Omdat we alles nogreeel doen kunnen we nu gebruik maken van onze intuitie voor gewone reelevectorruimten en inprodukten daarop.

Als f · g = 0 dan zeggen we dat f en g loodrecht op elkaar staan. De 2-normvan f wordt gedefinieerd door

|f |2 =√f · f, (16.12)

zeg maar de lengte van f gezien als vector. Er geldt de volgende implicatie(Pythagoras)

f · g = 0 ⇒ |f + g|22

= |f |22

+ |g|22. (16.13)

Hieronder schrijven we

SNg(x) =

c0

2+

N∑k=1

(ck cos kx+ dk sin kx), (16.14)

dus f heeft reele Fouriercoefficienten ak en bk, en g heeft reele Fouriercoeffi-cienten ck en dk. Je kunt nu het volgende programma afwerken.

Opgave 16.28. De Cauchy-Schwartz ongelijkheid zegt dat |f · g| ≤ |f |2 |g|2 .

1. Bewijs deze ongelijkheid voor functies f en g met |f |2 = |g|2 = 1 door 0 ≤∫ π−π(f(x)− g(x))2dx = . . . uit te werken.

2. Bewijs de Cauchy-Schwartz ongelijkheid. Hint: pas onderdeel 1 toe op f(x)/|f |2en g(x)/|g|2 .

3. Bewijs de driehoeksongelijkheid voor de 2-norm

|f + g|2 ≤ |f |2 + |g|2 . (16.15)

Opgave 16.29. Laat zien dat

|SNf |22

= π

(1

2a2

0 +N∑k=1

(a2k + b2k)

)

374

Page 375: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 16.30. Laat zien dat

SNf · SNg = π

(1

2a0c0 +

N∑k=1

(akck + bkdk)

)

Opgave 16.31. Definieer RNf = f − SNf en, met

σNf =1

N + 1(S0f + S1f + · · ·SNf),

ook ρNf = f − σNf .

1. Laat zien dat RNf · SNf = 0.

2. Laat zien dat RNf · σNf = 0.

3. Laat zien dat|SNf |

22

+ |RNf |22

= |f |22,

zodat |SNf |2 ≤ |f |2 , en dat (Bessel’s ongelijkheid)

1

2a2

0 +N∑k=1

(a2k + b2k) ≤

1

π

∫ π

−πf(x)2dx. (16.16)

4. Laat zien dat|RNf |

22

+ |σNf − SNf |22

= |ρNf |22.

5. In Opgave 16.25 is bewezen dat als f continu en 2π-periodiek is dat dan σNf →f uniform op IR als N → ∞. Bewijs dat in dat geval ook |RNf |2 → 0 en datdus (gelijkheid van Parceval)

1

2a2

0 +∞∑k=1

(a2k + b2k) =

1

π

∫ π

−πf(x)2dx. (16.17)

Hint: gebruik onderdeel 4.

6. Laat zien datf · g = (SNf +RNf) · (SNg +RNg)

= SNf · SNg +RNf ·RNg.

375

Page 376: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

7. Bewijs dat als f en g continu en 2π-periodiek zijn, dat

1

2a0c0 +

∞∑k=1

(akck + bkdk) =1

π

∫ π

−πf(x)g(x)dx =

1

πf · g. (16.18)

Hint: gebruik onderdeel 6, som 16.30 en pas de Cauchy-Schwartz ongelijkheidtoe op RNf ·RNg.

Opgave 16.32. In deze som laten we zien dat de gelijkheid van Parceval (16.17)ook geldt voor 2π-periodieke stuksgewijs continue functies. Laat f : IR → IR zo’nfunctie zijn. Hint: laat zien dat er een rij 2π-periodieke continue functies fk : IR→ IRbestaat met

|fk − f |22 =

∫ π

−π(fk(x)− f(x))2dx→ 0

als k →∞. Als f discontinu is in x0, vervang f(x) dan op het interval (x0− 1k , x0 + 1

k )door een lineaire functie, zo dat de nieuwe functie fk continu is en lineair op (x0 −1k , x0 + 1

k ).

Opgave 16.33. Bewijs de gelijkheid van Parceval (16.17) voor f . Hint: de gelijkheidvan Parceval is equivalent met |RNf |2 → 0. Schrijf

RNf = f − fk + fk − SNfk + SNfk − SNf = (f − fk) +RNfk + SN(fk − f)

en gebruik de driehoeksongelijkheid (16.15) en som 3 voor SN(fk − f) om |RNf |2klein te krijgen. Kies hiertoe, gegeven een ε > 0, eerst een vaste k groot genoeg, enredeneer dan verder.

Opgave 16.34. (Het Gibbs verschijnsel) De Fouriersinusreeks van f(x) = π−x heeftbn = 2

n . De oneven 2π-periodieke uitbreiding van f heeft f(0+) = π en f(0−) = −π.De N-de Fouriersinussom is

SNf(x) =N∑n=1

2

nsinnx.

1. Laat zien dat

x+ SNf(x) =

∫ x

0DN(s)ds.

376

Page 377: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

2. De integraal in het rechterlid heeft extrema in de nulpunten van DN . Het eerstemaximum MN rechts van x = 0 is dus in

x = xN =π

N + 12

.

Laat zien dat

MN =

∫ π

N+ 12

0

sin((N + 12)s

sin 12s

ds =

∫ π

0

sin t

sin(12

tN+ 1

2

)

1

N + 12

dt

= 2

∫ π

0

sin t

t

t2N+1

sin( t2N+1)

dt.

3. Laat zien datt

2N+1

sin( t2N+1)

→ 1,

uniform op t ∈ [0, π].

4. Laat zien dat

MN → 2

∫ π

0

sin t

tdt

als N→∞.

5. De functie SNf(x) heeft in x = xN een negatieve afgeleide. Leg uit waaromook het eerste maximum van SNf(x) rechts van x = 0 naar

2

∫ π

0

sin t

tdt

convergeert als N→∞. Dat is groter dan π = f(0+) met een factor 1.178979744.

Opgave 16.35. De integraal∫∞

0sin tt dt is en wel uit te rekenen, met behulp van de

complexe functie eiz

z , zie Sectie 81 en 82 van Churchill & Brown.

16.5 Dat andere inprodukt met afgeleiden

De deelruimte V van H die de rol gaat spelen zoals in de eerdere voorbeeldenmet H = l(2) wordt gedefinieerd door het inprodukt

((f, g)) = (f ′, g′),

377

Page 378: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

hetgeen niet voor alle f en g in H gedefinieerd is, net zoals het inprodukt inOpgave 14.18 niet voor alle x en y in l(2) gedefinieerd is. Informeel wordt Vgegeven door

V = f ∈ H : f ′ ∈ L2(−π, π),waarbij met f ook f ′ steeds 2π-periodiek wordt uitgebreid tot een functiegedefinieerd op heel IR.

Dat uitbreiden is makkelijk, en komt in de opgaven hieronder eerst nogaan de orde, ook ter voorbereiding van wat een stuk lastiger is: wat betekenthet dat f ′ als meetbare en kwadratisch integreerbare functie bestaat?

Opgave 16.36. Ga na dat (ook) voor functies f in L2(−π, π) met f(−π) 6= f(π)er geen problemen zijn met de uitbreiding f naar een f ∈ H.

Opgave 16.37. Zijn er functies f in L2(−π, π) waarvoor aan f(0) geen betekenis11

kan worden gegeven?

Opgave 16.38. Er is maar een 2π-periodieke oneven12 functie Ka die voldoet aanKa(x) = 1 voor 0 < x < π. Schets de grafiek van Ka en maak een rij 2π-periodiekeoneven continue functies Ka1,Ka2 . . . waarvoor geldt dat |Kan−Ka|2 → 0 als n→∞.Hint: schets eerst de grafieken van Kan.

Opgave 16.39. Bewijs dat een oneven 2π-periodieke functie wordt vastgelegd doorzijn functiewaarden op het interval (0, π). Hint: gebruik de regels f(−x) = −f(x) enf(x) = f(x+ 2π). Wat is f(0)? En f(π)?

Leuke functies om over na te denken, maar zulke functies komen we niettegen als we een zinvolle definitie van de uitspraak dat f ′ bestaat in bijvoor-beeld L2(0, π) kunnen geven. Wel is het zo f ′ best zelf zo’n functie kan zijn.Bijvoorbeeld als je f definieert als

f(x) =

∫ x

0

S(s) ds,

11 Lees: een betekenisvolle waarde kan worden toegekend?12Ka(−x) = −Ka(x) voor alle x ∈ IR.

378

Page 379: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

met een begrensde S zoals eerder gemaakt in Opgave 16.8. Iedere primitievefunctie

F (x) =

∫ x

0

f(s) ds

van een f in H is natuurlijk in principe kandidaat om tot V te behoren.

Opgave 16.40. Verifieer dat zo’n F een begrensde (2π-periodieke) functie is alsf ∈ H, en dat het essentieel is dat in de definitie van H is opgenomen dat voor f ∈ Hmoet gelden dat13 ∫ π

−πf(x)dx = 0 !

De ruimte V krijgen we nu als bestaande uit de primitieve functies vanfuncties in H, waarbij de spreekwoordelijke constante wel goed gekozen moetworden.

Opgave 16.41. Als f ∈ H dan is F periodiek. Waarom? Ga na dat er voor elkef ∈ H precies een constante C is waarvoor x→ F (x)− C in H zit.

We weten nu dus wat V moet zijn. De ruimte

F ∈ L2loc(IR) : (∀x ∈ IR) F (x) = F (x+ 2π), f = F ′ ∈ L2

loc(IR)

is gelijk aanF ∈ L2

loc(IR) : f = F ′ ∈ Hde ruimte van alle primitieven F van functies f ∈ H, en V krijgen we doorvoor iedere primitieve F precies die constante te nemen waarmee de primi-tieve gemiddeld nul wordt. Dus

V = F ∈ L2loc(IR) : f = F ′ ∈ H,

∫ π

−πF (x) dx = 0

De kwadratisch integreerbare periodieke functies f : IR→ IR vormen eennul-dimensionale vectorruimte waarover nog wel het een en ander te vertellenis. Dat zullen we hier niet doen. Periodieke functies kunnen natuurlijk wellokaal kwadratisch integreerbaar zijn. We schrijven

L2loc(IR) = f : IR→ IR : f ∈ L2(I) voor elke begrensd interval I ⊂ IR,

13 0! = 1, maar hier roept het uitroepteken wel.

379

Page 380: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

maar de periodieke functies in L2loc(IR) vormen geen vectorruimte14. En

L2loc(IR) zelf is wel een vectorruimte maar geen genormeerde ruimte, althans

niet met een natuurlijke15 norm. Maar

H = f ∈ L2loc(IR) : (∀x ∈ IR) f(x) = f(x+ 2π);

∫ π

−πf(x)dx = 0

wel, de ruimte van 2π-periodieke kwadratisch integreerbare16 periodieke func-ties, met inprodukt

(f, g) =

∫ π

−πf(x)g(x) dx,

waarbij we de ruimte nu beperken tot functies die gemiddeld nul zijn.De constante functies zijn in deze H buitengesloten, omdat ze in het

verhaal dat gaat volgen een vervelend buitenbeentje zijn. Bijgevolg van dezekeuze zitten er in H ook geen positieve functies trouwens. Wel in H zittende functies cn en sn uit Opgave 13.22 en net als elke functie in H zijn dezedoor beperking tot het interval (−π, π) op te vatten als element van

H = f ∈ L2(−π, π) :

∫ π

−πf(x) dx = 0,

een ruimte die we voor gemak met H identificeren door iedere f ∈ H weeruit te breiden tot heel IR middels f(x) = f(x+ 2π) voor alle x.

16.6 Blipfuncties

Het formulevoorschrift

xblip−→

exp(− 1

x) for x > 0

0 for x ≤ 0,

definieert de functie blip : IR→ [0, 1) die met goed recht zowel oogverblindendmooi als gruwelijk lelijk genoemd17 mag worden.

Opgave 16.42. Schets de grafiek van blip en onderzoek het gedrag van blip′(x) alsx ↓ 0. En van blip′′(x). En van alle afgeleiden van blip. Concludeer dat alle afgeleidenvan blip als continue functies van IR naar IR bestaan!

14 Waarom niet?15 Bas, weet je nog, de discussie na je voordracht op de VU?16 D.w.z. f is meetbaar en

∫ π−π f(x)2dx <∞.

17 De naam blip heb ik gezien in een mooi boek, weet niet meer welk.

380

Page 381: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 16.43. Je kunt blip ook schalen. Definieer blipn door

blipn(x) = blip(nx) = exp(− 1

nx)

en bepaal limn→∞ blipn(x) voor elke x ∈ IR. De limietfunctie heet de Heaviside18

functie, hier genoteerd als He(x). Deze functie is niet continu in x = 0. De waardevan He(0) als limietwaarde van blipn(0) is 0, maar net zo vaak wordt He(0) = 1

2 ofHe(0) = 1 genomen. Of zelfs He(0) = [0, 1].

Opgave 16.44. De functies blip en He zitten niet in L2(IR). Waarom niet? MaarHe− blip wel. Waarom? En He− blipn ook. De affiene ruimte

He+ L2(IR) = f = He+ g : g ∈ L2(IR)

is voorzien van de 2-metriek

d(f, g) =

(∫ ∞−∞|f(x)− g(x)|2 dx

) 12

een volledige metrische ruimte19. Laat zien zien dat d(blipn, He)→ 0 als n→∞.

Opgave 16.45. Definieer de functies blokn door

blokni(x) = blipn(x)blipn(π − x)

en laat zien datlimn→∞

blokn(x) = χ(0,π)(x)

voor alle x ∈ IR. Waarom geldt dat blokn → χ(0,π) in 2-norm?

Opgave 16.46. Dezelfde vragen als in Opgave 16.45 maar nu voor blokn gedefinieerddoor

blokni(x) = blipn(x− 1

n)blipn(π − 1

n− x),

18 Google Heaviside.19 Wat is dat?

381

Page 382: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 16.46 laat zien dat χ(0,π), opgevat als

Opgave 16.47. Het is goed om op een rijtje te zetten hoe je zeker weet dat elkef ∈ L2(−π, π) te benaderen is met een rij functies f1, f2, . . . in

C∞c (−π, π),

de ruimte van van functies f : (−π, π) → IR die oneindig vaak differentieerbaar zijnen identiek nul zijn in de buurt van x = 0 en x = 2π. Benaderen betekent hier datfn → f in de 2-norm. Het speciale geval om eerst te begrijpen is

f(x) = χI(x) =

1 als x ∈ I

0; als x 6∈ I,

met I een interval.

16.7 Intermezzo: out of Hilbertspace

De 2-norm is een bijzonder geval van

f → |f |p =

(∫ π

−π|f(x)|p dx

) 1p

,

waarmee voor 1 ≤ p <∞ de p-norm op C[−π, π] wordt gedefinieerd, en

|f |∞ = maxx∈[−π,π]

|f(x)|,

de maximumnorm van f . Deze p-normen (1 ≤ p ≤ ∞) zijn te vergelijkenmet

|x|p =

(N∑j=1

|xj|p) 1

p

,

de p-norm van x = (x1, . . . , xn) ∈ IRN.

Opgave 16.48. Terug naar de overgeslagen calculussommetjes, bewijs (de ongelijk-heid van Holder)

|x · y| ≤ |x|p|y|qvoor 1 ≤ p, q ≤ ∞ die voldoen aan

1

p+

1

q= 1,

382

Page 383: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

en x = (x1, . . . , xn) en y = (y1, . . . , yn) in IRN. Hint: leg eerst uit waarom het geenbeperking is om aan te nemen dat |x|p = |y|q = 1.

Opgave 16.49. Bewijs dat x→ |x|p een norm is op IRN.

Opgave 16.50. Bewijs dat |x|p → |x|∞ als p→∞.

Opgave 16.51. Verzin en maak de analoge opgaven voor

f →(∫ π

−π|f(x)|p dx

) 1p

,

de p-norm op C[−π, π].

383

Page 384: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

17 Sobolev spaces

This is an overview of how we deal with the Sobolev spaces

W 1,p(U) = u ∈ Lp(U) :∂u

∂xi= uxi ∈ Lp(U), i = 1 . . . N,

in which U is an open connected subset of IRN, and in which the partialderivatives are taken in the distributional sense. I’m adapting the approachin Chapter 5 of Evans’ PDE book. Restricting the attention to first orderweak derivatives to begin with, I will turn Chapter 5 around and begin withthe main results for the space W 1,p

0 (U) that is defined as the closure of theC1c (U), the closure taken in W 1,p(U) with respect to the obvious norm, and

the main result being the (compact) embeddings in spaces of functions whichless regularity. This will involve only the additional assumption that U isbounded.

To extend the results for W 1,p0 (U) to W 1,p(U) we need a well behaved

extension operator that maps W 1,p(U) into W 1,p0 (U) with U only slightly

larger than U . This extension operator is first defined for u ∈ C1(U) andrequires the boundary ∂U to be bounded and C1 (locally the graph of a C1-function). Partitions of unity play a crucial role here, and they are are alsoused to establish that W 1,p(U) itself is the closure of C1(U) if ∂U is boundedand C1. The elements of the partition are suitably chosen ζi ∈ C∞c (IRN)which, when multiplied by u ∈ W 1,p(U), produce products ζiu ∈ W 1,p(U) towhich the Leibniz rule applies1.

A basic tool is mollifying nonsmooth functions by convolution with non-negative compactly supported smooth functions ηε which approximate theδ-function.

17.1 Sobolev spaces

For 1 ≤ p <∞ the Sobolev norm is defined by

|u|p1,p

= |u|pp

+ |ux1|pp + · · ·+ |uxN|pp, (17.1)

and it makes W 1,p(U) a Banach space. For p = ∞ one takes the maximumof the ∞-norms of u, ux1 , . . . , uxN

. Which functions are in W 1,p(U)? Well,certainly the functions in C1

c (U), the space of continuously differentiablefunctions with compact support in U . This space also acts as the space of testfunctions for verifying the definition of the weak first order partial derivatives

1 Evans’ stronger assumption ζ ∈ C∞c (U) forces us into some cumbersome details.

384

Page 385: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

of u ∈ W 1,p(U). Note that every u ∈ C1c (U) extends to a u ∈ C1

c (IRN) bysetting u equal to zero outside U .

The closure of C1c (U) in W 1,p(U) is a Banach space, denoted by

W 1,p0 (U),

a definition which makes sense only for 1 ≤ p <∞.

17.2 Estimates and embeddings for W 1,p0 (U)

Estimates derived for functions in C1c (U) carry over to functions in W 1,p

0 (U),and I derived two basic estimates to which this principle is applied. The first(Gagliardo-Nirenberg-Sobolev) estimate was

|u|q≤ Cp,N|∇u|p for

1

q=

1

p− 1

Nif 1 ≤ p < N, (17.2)

in which the norm of ∇u is evaluated via an integral over the whole of U ,and over the whole of IRN in the derivation, via repeated application of theone-dimensional estimate

|u|∞ ≤1

2|u|

1for u ∈ C1

c (IR),

first2 in the special case that p = 1, with a clever use of the Holder’s inequalitywith exponents satisfying

1

p1

+ · · ·+ 1

pn−1

= 1.

The general case in (17.2) followed from putting uγ for u and a follow yournose estimate invoking Holder’s inequality for the integral of γ|u|γ−1uxi ,which involved a particular choice of γ to get the exponents right. Theconstant Cp,N blows up as p → N (from below). For the p-norm of ∇u thep-norm of any norm of the vectors ∇u(x) can be used.

The second (Morrey) estimate3 is

|u(x1)− u(x2)| ≤ Cp,N|∇u|p |x1− x2|α for α = 1− N

pif p > N, (17.3)

the p-norm of ∇u defined via an integral over the intersection of the two ballscentered in x1 and x2 with radius |x1 − x2|. This estimate was derived fromthe inequality ∫

CR

|u− u(0)| ≤ RN

N

∫CR

|ur|rN−1

2 See Section 17.9.3 See Section 17.8.

385

Page 386: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

for cones described in polar coordinates as

CR = x = rω : 0 ≤ r ≤ R, ω ∈ A,with A a nice subset of the unit sphere, and ur denoting the radial derivative.The integral on the right hand side was estimated using a follow your noseestimate invoking Holder’s inequality, and (17.3) was proved estimating

|u(x1)− u(x2)| ≤ |u(x1)− u(x)|+ |u(x)− u(x2)|,and integrating over the intersection of the two cones C1 and C2 centeredin x1 and x2, chosen to have C1 ∪ C2 equal to the union of the two ballsmentioned earlier. Again the constant Cp,N blows up as p→ N (from above).

Opgave 17.1. Let 1 ≤ p, q < N. Prove that W 1,p0 (U) ⊂ Lq(U) for 1

q ≤1p −

1N if U

is bounded, and that in that case |∇u|p

defines an equivalent norm on W 1,p0 (U).

Opgave 17.2. Let p > N. Prove that W 1,p0 (U) ⊂ Cα(U) for α = 1− N

p , in which

Cα(U) = u ∈ C(U) : [u]α <∞ where [u]α = supx1 6=x2

|u(x1)− u(x2)||x1 − x2|α

,

the supremum taken over the whole of U .

Opgave 17.3. Show that for U bounded and α ∈ (0, 1], every u ∈ Cα(U) extendsto a continuous function on U , and that the space Cα(U) is a Banach space withnorm defined by ||u||α = |u|∞ + [u]α.

17.3 Compactness for W 1,p0 (U)

The Ascoli-Arzela theorem states for compact metric spaces X that a se-quence un in C(X), the space of IR-valued continuous functions on X withnorm

|u|∞ = maxx∈X|u(x)|,

has a convergent subsequence unk , provided the sequence is bounded in C(X)and has the property4 that

∀ε > 0 ∃δ > 0∀n ∈ IN∀x, y ∈ X : d(x, y) ≤ δ =⇒ |fn(x)− fn(y)| ≤ ε.

Here convergence means uniform convergence.

4 This is called the (uniform) equicontinuity of the sequence un.

386

Page 387: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 17.4. Let p > N, U bounded, α = 1− Np . Use the Ascoli-Arzela theorem to

prove that every bounded sequence un in W 1,p0 (U) has a subsequence that, considered

as a sequence in C(U), converges uniformly to a limit u, which is also in Cα0 (U), thesubspace consisting of functions u ∈ Cα(U) which vanish on ∂U . Verify that thissubspace has the seminorm [·]α as an equivalent norm.

In view of Exercise 17.4 the embedding

W 1,p0 (U)→ C(U)

is compact for p > N if U is bounded. Since C(U) ⊂ Lp(U), with the obviousbound on the norms, it then also holds that

W 1,p0 (U)→ Lp(U) is compact if U is bounded, (17.4)

and this holds for all p ≥ 1.

Stelling 17.5. The statement in (17.4) holds for all p ∈ [1,∞) if U is boun-ded. NB: the weaker statement that the embedding is bounded is characterisedby the Poincare inequality: |u|

p≤ CU,p|∇u|p .

For the proof consider a bounded sequence un ∈ W 1,p0 (U), choose vn ∈

C1c (U) and extend vn to vn ∈ C1

c (IRN), such that |un − vn|1,p → 0, andconsider mollified versions of vn defined by

vεn(x) = (ηε ∗ v)(x) =

∫IRN

ηε(x− y)vn(y) dy =

∫IRN

ηε(y)vn(x− y) dy

=

∫|y|≤ε

ηε(y)vn(x+ y) dy,

in which

ηε(y) =1

εNη(y

ε) with 0 ≤ η ∈ C∞c (B) radial,

∫B

η = 1,

where B is the open unit ball. Then split |un − um|p as

|un − um|p ≤ |un − vn|p + |vn − vεn|p + |vεn − vεm|p + |vεm − vm|p + |vm − um|p .

The first and fifth term converge to zero in view of |un − vn|1,p → 0, thesecond and fourth are controlled by, with v = vn and v = vm, the estimate∫

IRN

|vε(x)− v(x)|p dx ≤ εp∫

IRN

|∇v(x)|p dx, (17.5)

387

Page 388: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

and therefore bounded by Cε, with C depending only on the bound for thesequence |vn|1,p , and thus only on the original bound for the sequence un in

W 1,p0 (U), while for every ε > 0 fixed the third term converges to zero along

a subsequence in view of the Ascoli-Arzela theorem applied to the sequencevεn in C(V ), with V bounded and slight larger than U so as to have all vεnin C∞c (V ). We thus have that |un − um|p is asymptotically controlled by Cεalong that subsequence, along which |vεn − vεm|∞ → 0. A standard diagonalargument now produces a subsequence which is a Cauchy sequence in Lp(V ).The following exercises fill in the details and are all that’s needed to concludethe proof of Theorem 17.5.

Opgave 17.6. Show that∫IRN

|vε(x)− v(x)|p dx ≤∫

IRN

η(y)

∫IRN

|v(x+ εy)− v(x)|p dx dy. (17.6)

Hint: write the difference vε(x) − v(x) as a single y-integral over |y| ≤ ε, scale y tohave the integral over the unit ball, use

η(y) = η(y)1p′ η(y)

1p ,

and apply Holder’s inequality. Then use this estimate for the integral of |vε(x)−v(x)|pand change the order of integration to conclude.

Uitwerking. Recall that

ηε(x) =1

εNη(x

ε), η(x) = η(|x|) ≥ 0, η ∈ C∞c (B),

∫IRN

η = 1.

Since v ∈ Lp(IRN) and ηε(x) = ηε(−x) we have

vε(x) =

∫IRN

ηε(x−y)v(y) dy =

∫IRN

ηε(y)v(x−y) dy =

∫IRN

ηε(y)v(x+y) dy,

so

vε(x)− v(x) =

∫IRN

ηε(y)v(x+ y) dy− v(x) =

∫IRN

ηε(y) (v(x+ y)− v(x)) dy

=

∫IRN

η(y) (v(x+ εy)− v(x)) dy =

∫IRN

η(y)1p′ η(y)

1p (v(x+ εy)− v(x)) dy,

whence Holder’s inequality gives

|vε(x)− v(x)| ≤(∫

IRN

η(y) dy

) 1p′

︸ ︷︷ ︸=1

(∫IRN

η(y)|v(x+ εy)− v(x)|p dy) 1

p

,

388

Page 389: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

whence (17.6) follows as indicated. Note that for p = 1 the estimate isimmediate.

Opgave 17.7. Write the difference in the right hand side of (17.6) as an s-integralover the interval [0, 1], use Holder’s inequality and |y| ≤ 1 to arrive at an integral overs and x only, and obtain (17.5).

Uitwerking. In the proof we use the mean value theorem in integral form,see (4.9), and the (Holder) estimate

|∫ 1

0

f |p ≤ |∫ 1

0

|f |p (1 ≤ p <∞).

The x-integral in the right hand side of (17.6) is estimated for |y| ≤ ε as∫IRN

|v(x+ εy)− v(x)|p dx =

∫IRN

|[v(x+ tεy)]t=1

t=0|p dx

=

∫IRN

|∫ 1

0

∇v(x+ εty) · εy dt|p dx

≤ εp∫

IRN

(∫ 1

0

|∇v(x+ εty)| dt)p

dx ≤ εp∫

IRN

∫ 1

0

|∇v(x+ εty)|p dt dx

whence (17.6) gives∫IRN

|vε(x)− v(x)|p dx ≤∫

IRN

η(y)

∫IRN

|v(x+ εty)− v(x)|p dx dy ≤

≤∫

IRN

η(y) εp∫

IRN

∫ 1

0

|∇v(x+ εty)|p dt dx dy,

whence (17.5) follows by changing the order of integration from dt dx dy todx dt dy.

Opgave 17.8. Show that for fixed ε > 0 the sequence vεn has a convergent subse-quence in C(V ).

Uitwerking. We apply the A-A Theorem. The bounds

|vεn(x)| = |∫

IRN

ηε(x− y)vn(y) dy| ≤ |ηε|p′|vn|p

389

Page 390: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

and

|∇vεn(x)| = |∫

IRN

∇ηε(x− y)vn(y) dy| ≤ |∇ηε|p′|vn|p

imply that the conditions of the A-A Theorem are satisfied if vn is merely abounded sequence in Lp(U) extended by vn(x) = 0 for x 6∈ U , whence vn hasa convergent subsequence on the compact closure of an ε-neighbourhood ofU . Since vn is in fact bounded in W 1,p

0 (U) we are done (also for p = 1).

17.4 Statements for W 1,p(U) via extension

Given a bounded domain U we look for a slightly larger domain U such thatevery u ∈ W 1,p(U) extends to a u ∈ W 1,p

0 (U) in the sense that u(x) = u(x)for (almost) all x ∈ U . The extension map

u ∈ W 1,p(U)E−→ u ∈ W 1,p

0 (U)

should be linear and bounded. The extensions are first defined for u ∈ C1(U)and require U bounded and ∂U ∈ C1. I usually followed Evans’ approach inwhich the extensions are first defined locally for u and then glued togetherusing a partition of unity, but it came to me that it is in fact simpler to firstcut up u in smaller pieces ζiu and choose globally defined extensions of ζiurather than locally defined extensions of u. This requires a suitable set offunctions

ζ0 ∈ C∞c (O0), ζ1 ∈ C∞c (O1), . . . , ζn ∈ C∞c (On),

with 0 ≤ ζi ≤ 1 and

ζ0(x) + ζ1(x) + · · ·+ ζn(x) = 1 for all x ∈ U

with O0 ⊂ O0 ⊂ U and O1, . . . , On chosen so as to allow globally definedextensions u1, . . . , un of u1 = ζ1u, . . . , un = ζnu which define

uEi−→ ui

as a linear map with|ui|1,p ≤ Ci |u|1,p ,

allowing to define

u ∈ C1c (U)

E−→ C1c (U) by u→ ζ0u+ u1 + · · ·+ un.

In view of the Leibniz rule

(ζu)xj = ζuxj + ζxju

390

Page 391: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

it follows that|Eu|

1,p≤ C |u|

1,p,

with C some horrible constant depending on U and U via the norms of ζi inC1. The functions ζ1, . . . , ζn are chosen to allow a C1-coordinate transforma-tion similar to the ones used by Evans. It all looks a bit cleaner if the Oi aretaken, after a permutation of coordinates, in cylindrical form as Ci = Bi×Ii,with Bi an open ball, Ii a bounded interval, and

U ∩ Ci = x = (x1, . . . , xn−1, xn) ∈ C : xn > γi(x1, . . . , xn−1),

in which γi : Bi → Ii is C1, and the supports of the ζi are contained insmaller cylinders Ci = Bi× Ii ⊂⊂ Ci. The extensions of ζiu are then definedvia the transformations in Appendix C.1 and the higher order reflection inSection 5.4.

Finally

u ∈ C1(U)E−→ u ∈ C1

c (U),

as then defined with the desired W 1,p-estimates, has to be extended as a mapfrom W 1,p(U) to W 1,p

0 (U) using the density of C1(U) in W 1,p(U).

17.5 Density of smooth functions in W 1,p(U)

We need C1(U) to be dense in W 1,p(U), just like C1c (U) is, by definition,

dense in W 1,p0 (U). I will simplify Evans’ approach to achieve this. Note that

in Section 5.2 he uses (1) as motivation for the definition of weak derivatives.Both u and uxi have to be locally integrable for the identity to be varified withtestfunctions in C1

c (U) and the uniqueness of weak derivatives folllowed easilyin the subsequent lemma via (4). Section 5.2.3 then formulates the Leibnizrule for products of testfunctions and weakly differentiable functions, butinspection of the proof shows that

(uζ)xi = uxiζ + uζxi (17.7)

for ζ ∈ C1(U) and u ∈ W 1,1loc (U). In particular (17.7) holds for u ∈ W 1,p(U)

and ζ ∈ C1(U). So any statement that we want make about a function u ∈W 1,p(U) can be localised using partitions of unity as in Section 17.4 above,splitting u via ζ0, ζ1, . . . , ζn ∈ C1

c (IRN) ⊂ C∞c (IRN) with ζ0 + ζ1 + · · ·+ ζn ≡ 1on U , writing

u = u0 + u1 + · · ·+ un = ζ0u+ ζ1u+ · · ·+ ζnu,

in which we take ζ0 ∈ C1c (U) and ζi ∈ C1

c (Ci) with Ci as in Section 2 above.We now use mollifiers to approximate each of these by smooth functions.

391

Page 392: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 17.9. Mollifiers are special cases of integral operators of the form (Tf)(x) =∫K(x, y)f(y) dy in which both

∫|K(x, y)| dx and

∫|K(x, y)| dy are bounded by one

fixed constant C. Modify the argument of part 4 of the proof of Theorem 7 in Ap-pendix C.5 to show that |Tf |

p≤ C|f |

pholds for all f ∈ Lp. The estimate holds for

all p with 1 ≤ p ≤ ∞.

Uitwerking. Note that we replace ηε(x− y) by K(x, y). The assumptionthat both

∫|K(x, y)| dx and

∫|K(x, y)| dy are bounded by one fixed constant

C is satisfied by ηε(x− y) with C = 1. For 1 < p <∞ we have via Holder’sinequality that

|(Tf)(x)| ≤∫|K(x, y)| |f(y)| dy =

∫|K(x, y)|

1p′ |K(x, y)|

1p |f(y)| dy

≤(∫|K(x, y)| dy

) 1p′(∫|K(x, y)| |f(y)|p dy

) 1p

≤ C1p′

(∫|K(x, y)| |f(y)|p dy

) 1p

,

whence

|∫|Tf(x)|p dx ≤ C

pp′

∫∫|K(x, y)| |f(y)|p dy dx

= Cpp′

∫∫|K(x, y)| |f(y)|p dx dy ≤ C

pp′ C

∫|f(y)|p dy = Cp

∫|f(y)|p dy,

and the taking the pth root the estimate |Tf |p≤ C|f |

pfollows. The cases

p = 1 and p =∞ are easier and require only one of the C-bounds.

Opgave 17.10. The function u0 = ζ0u is in W 1,p(U) and vanishes outside thesupport of ζ0. With ηε defined as in Appendix C.5 show that uε0 = ηε ∗ u0 → u0 inW 1,p

0 (U) as ε→ 0. This statement holds only if 1 ≤ p <∞.

Uitwerking. In view of the Leibniz rule we have that u0 and its first orderweak derivatives are in Lp(IRN) and vanish outside the support of ζ0. Sincemollifying commutes with taking weak derivatives it suffices to show thatuε0 → u0 in Lp(IRN) because the argument can then be copied for the firstorder weak derivatives of uε0 and u0. The estimate in Exercise 17.9 impliesthat |uε0|p ≤ |u0|p . Now take a continuous function vδ with compact support

392

Page 393: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

in some open neighbourhood V of U that is δ-close to u0 in Lp(IRN) and letvεδ = ηε ∗ vδ. Then the same estimate applied to vδ − u0 implies that

|uε0 − u0|p ≤ |uε0 − vεδ|p︸ ︷︷ ︸

≤|u0−vδ|p≤δ

+|vεδ − vδ|p + |vδ − u0|p︸ ︷︷ ︸≤δ

≤ 2δ + |vεδ − vδ|p︸ ︷︷ ︸≤δ

≤ 3δ

since ε > 0 can be chosen to have |vεδ − vδ|p ≤ δ, in view of the uniformconvergence of vδ to vδ as ε → 0. The latter follows from5, dropping thesubscript δ,

|vε(x)− v(x)| = |∫

IRN

η(y) (v(x+ εy)− v(x)) dy| ≤

∫IRN

η(y) |v(x+ εy)− v(x)|︸ ︷︷ ︸≤δ

dy| ≤ δ

by using the δ, ε-definition of the uniform continuity of v on IRN.

For the u1, . . . , un we need some regularity of the boundary to get theapproximations in C1(U). In view of the C1-regularity of ∂U needed6 forthe extension operator in Section 2 above we assume ∂U ∈ C1, but uniformLipschitz continuity suffices, as I explained in the course.

Opgave 17.11. Assume that ζi ∈ C1c (Ci) is as in Section 2. Assume that the

function γi which describes ∂U ∩ Ci is Lipschitz continuous. Modify the argument inthe proof of Theorem 3 in Section 5.3.3 to show that the ε-mollified version of theλε-translate of ui = ζiu is in C1

c (U) and converges to ui in W 1,p(U) as ε→ 0.

We conclude that C1(U) is dense in W 1,p(U), provided of course that we canfind a partition of unity as above.

17.6 The extension and trace operators

We needed the boundedness of U and the C1-regularity of ∂U to define anextension operator

C1(U)E−→ C1

c (U)

5 As below Exercise (17.6).6 To define the extension for u ∈ C1(U) and to get the W 1,p-estimate.

393

Page 394: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

with the W 1,p(U)-norm bound of Eu controlled by the W 1,p(U)-norm of u.The domain U can be taken as close to U as desired by taking the cylindersCi small, and E extends to

W 1,p(U)E−→ W 1,p

0 (U)

via the density result in Section 17.5. The other important operator is thebounded linear trace operator

W 1,p(U)T−→ Lp(∂U)

in Section 5.4, which extends

u ∈ C1(U)→ u|∂U ∈ C1(∂U).

Evans defines it locally, first under the assumption that ∂U is flat and u ∈C1(U). The same splitting as in Section 17.5 can be used to first defineT (ζiu) instead, for u ∈ C1(U), so

u ∈ C1(U)→ ζiu = ui ∈ C1(U ∩ Ci)→ ui|∂U ∈ C1(∂U).

The local coordinate transformation flattening ∂U ∩ Ci is not even needed,as ui is defined for all xn ≥ γ(x1, . . . , xN−1) with (x1, . . . , xN−1) ∈ Bi andvanishes for xN large. Thus

Tui(x1, . . . , xN−1) = ui(x1, . . . , xN−1, γ(x1, . . . , xN−1)) = −∫ ∞γ

(ui)xN,

and the p-norm on Bi is estimated by the p-norm of ∇ui, the factor(1 + γ2

x1+ · · ·+ γ2

xN−1

) 12

being irrelevant for the estimate. The characterisation of the kernel of Tas in Theorem 2 of Section 5.4 is also done locally then, as Evans observesin (6), in which the flattening avoids cumbersome notation in the alreadytechnical proof that follows. Actually the proof is not so hard. It relies onthis estimate, formulated in IR2 without loss of generality for u ∈ C2

c (IR2):∫ ∞−∞|u(x, y)|p dx ≤ 2p

(∫ ∞−∞|u(x, 0)|p dx+ yp−1

∫ y

0

∫ ∞−∞|uy|p

). (17.8)

Opgave 17.12. Prove (17.8) and explain why it holds for u ∈ W 1,p(IR2+) with

compact support in IR× [0,∞).

394

Page 395: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Opgave 17.13. If such a u has Tu = 0, then the functions um defined by um(x, y) =(1 − ζ(my))u(x, y) with ζ ∈ C∞c ([0, 2)) and ζ ≡ 1 on [0, 1], ζ ′ ≤ 0 on [0, 2) arein W 1,p

0 (IR2+) and converge to u in W 1,p(IR2

+). Prove this and conclude that u ∈W 1,p

0 (IR2+). Hint: you have to use Exercise 17.8.

17.7 Additional exercises

1. Let u ∈ C2c (IRn). The norms below are the standard p-norms taken over

the whole space.(a) Take n = 2 and prove that |u(x1, x2)| ≤ 1

4

∫ ∫|ux1x2|.

(b) Take n = 3 and use (a) to derive an estimate of the form

|u|3 ≤ C maxi 6=j|uxixj |1

(c) Take n = 4 and use (a) to derive an estimate of the form

|u|2 ≤ C maxi 6=j|uxixj |1

(d) Generalise to arbitrary n > 2. Use scaling arguments to show that

|u|p ≤ Cn maxi 6=j|uxixj |1

can only hold for one particular p which depends on n.(e) Generalise to u ∈ C3

c (IRn) and 1-norms of the mixed third orderderivatives for n > 3.

2. Let U be a bounded domain in IR2 = (x, y) : x, y ∈ IR and ζ ∈ C1(IR2).(a) Prove that ζu ∈ W 1,p(U) if u ∈ W 1,p(U).(b) Introduce new coordinates ξ, η by

x = x0 + aξ + bη, y = y0 + cξ + dη,

with ad 6= bc, define V by (ξ, η) ∈ V ⇐⇒ (x, y) ∈ U ,and write v(ξ, η) = u(x, y). Show that

u ∈ W 1,p(U) ⇐⇒ v ∈ W 1,p(V )

and that this correspondence defines a linear homeomorphism betweenthe two Sobolev spaces.(c) Assume Φ : IR2 → IR2 is C1, injective on U , with invertible Jacobianmatrix in every (x, y) ∈ U .

395

Page 396: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Then u→ u Φ−1 = v defines a bijective map from C1(U)→ C1(V )where V = Φ(U). Show that

1

C|v|

W1,p(V )≤ |u|

W1,p(U)≤ C|v|

W1,p(V )

for some C > 1.(d) Explain why this map uniquely extends to a bijection from W 1,p(U)to W 1,p(V ) if ∂U ∈ C1.The intersection of W 1,p(U) and C(U) is a Banach space with norm e.g.|u|∞ + |ux|p + |uy|p .(f) Explain why this Banach space is the closure of C1(U) with respectto this norm.NB: These two results also hold if ∂U is Lipschitz in view of the improvedversion of Theorem 3 in 5.3.3.

17.8 Holder continuity via Morrey’s estimate

The fundamental estimate, for u a C1-function on IRn, requires p > n > 1.Evans derives the estimate

|u(x1)− u(x2)| ≤ C||Du||Lp(B(x1,2r)) r1−n

p , r = |x1 − x2|,

and mentions that this estimate can be improved, but the improved versionis not optimal yet. Follow the reasoning below to show that

|u(x1)−u(x2)| ≤ Cnp||Du||Lp(Wx1x2 ) |x1−x2|1−np , Wx1x2 = B(x1, r)∩B(x2, r), r = |x1−x2|.

1. The boundary of Wx1x2 is given by the union of

A1 = δB(x1, r) ∩B(x2, r) and A2 = B(x1, r) ∩ δB(x2, r).

Let

C1 = sx1+(1−s)z, 0 ≤ s ≤ 1, z ∈ A1 and C2 = sx2+(1−s)z, 0 ≤ s ≤ 1, z ∈ A2.

Show that∫z∈Ci|u(z)− u(xi)|dz ≤

rn

n

∫z∈Ci

|∇u(z)||z − xi|n−1

dz, (i = 1, 2).

Hint. Without loss of generality assume that xi = 0, u(0) = 0. Using polarcoordinates z = ρω, 0 ≤ ρ ≤ r |ω| = 1, define the cone Cr by 0 ≤ ρ ≤ r, ω ∈A. What you have to show is that

(first)

∫Cr

|u(z)|dz ≤ rn

n

∫Cr

|ur(z)||z|n−1

dz,

396

Page 397: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

in which ur is the radial derivative defined by

ur(x) =x

|x|· ∇u(x),

and A is an appropriate subset of the unit sphere. Which subset? Show that

|u(ρω)| ≤∫ ρ

0

|ur(sω)|ds,

integrate this inequality with respect to ω over A, change the order of inte-gration on the right hand side to obtain the integral of

|ur(x)||x|n−1

over the cone Cρ = x = sω : 0 ≤ s ≤ ρ, ω ∈ A. Multiply by ρn−1 andconclude. Then estimate the integral on the right hand side of (first) usingHolder’s inequality with p for ur.

2. Show that

|u(x1)−u(x2)| ≤ Cp,n||Du||Lp(W ) r1−n

p , r = |x1−x2|, W = B(x1, r)∩B(x2, r).

Hint. The inequalities in 1 give estimates for the averages of |u(z) − u(xi)|over the cones Ci. Integrate the inequality

|u(x1)− u(x2)| ≤ |u(x1)− u(z)|+ |u(z)− u(x2)|

over C1 ∩ C2 and estimate in terms of integrals of |Du|p = |∇u|p over C1 enC2 and finally W . Give a precise description of the constant Cp,n that youfind.

17.9 GNS-estimates

In the third hour I proved

|f(x)| ≤ 1

2

∫ ∞−∞|f ′(x)|dx

for f ∈ C1c (IR) and applied it to x → u(x, y) and y → u(x, y) to derive an

estimate for the 2-norm of u ∈ C1c (IR2) in terms of the 1-norms of ux and uy.

The result was∫∫IR2

|u|2 ≤ 1

4

∫∫IR2

|ux|∫∫

IR2

|uy| from which |u|2 ≤1

2maxi=1,2|uxi |1

397

Page 398: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

follows (I’m writing single bars with subscript p for the p-norm in Lp).The same trick with x→ u(x, y, z), y → u(x, y, z) and z → u(x, y, z) and

Holder’s inequality applied 3 times with exponents p1 = p2 = 12

applied tothe successive integrations with respect to x, y, z gives∫∫∫

IR3

|u|32 ≤

∫∫∫IR3

(1

2

∫x

|ux|)12 (

1

2

∫y

|uy|)12 (

1

2

∫z

|uz|)12

= (1

2)

32

∫z

∫y

∫x

(

∫x

|ux|)12 (

∫y

|uy|)12 (

∫z

|uz|)12

≤ (1

2)

32

∫z

∫y

(

∫x

|ux|)12 (

∫x

∫y

|uy|)12 (

∫x

∫z

|uz|)12

≤ (1

2)

32

∫z

(

∫y

∫x

|ux|)12 (

∫x

∫y

|uy|)12 (

∫y

∫x

∫z

|uz|)12

≤ (1

2)

32 (

∫z

∫y

∫x

|ux|)12 (

∫z

∫x

∫y

|uy|)12 (

∫y

∫x

∫z

|uz|)12

(in each integration one of the 3 factors does not depend on the integrationvariable), so

|u| 32

≤ 1

2|ux|

131|uy|

131|uz|

131≤ 1

2maxi=1,2,3

|uxi |1 ,

which generalises to

|u| nn−1≤ 1

2maxi=1,...,n

|uxi |1

for u ∈ C1c (IRn) via n integrations and Holder’s inequality with p1 = · · · =

pn = 1n−1

applied in every step (in each integration one of the n factors doesnot depend on the integration variable). Applied to uγ it follows via Holder’sinequality with

1

p+

1

p′= 1

that

|u|γγnn−1

= |uγ| nn−1≤ 1

2maxi=1,...,n

|γuγ−1uxi |1 ≤γ

2maxi=1,...,n

|uγ−1|p′|uxi|p =

γ

2|u|γ−1

(γ−1)pp−1

maxi=1,...,n

|uxi|p

in which γ can be chosen to have equal subscripts of |u| in the first and lastexpression in this chain.

For 1 ≤ p < n you should check that this gives

q =γn

n− 1=

(γ − 1)p

p− 1=

pn

n− p,

398

Page 399: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

which you may prefer to memorise as

1

q=

1

p− 1

n.

What’s the value of γ? Dividing by |u|γ−1q on both sides you get

|u|q ≤ Cnp maxi=1,...,n

|uxi |p

with an explicit constant Cnp. Check again that 1 ≤ p < n is the assumptionto make here.

At the end I also discussed how to obtain the estimate

|u| nn−2≤ 1

4maxi 6=j|uxixj |1

for u ∈ C2c (IRn) and similar estimates for u ∈ C3

c (IRn), u ∈ C4c (IRn),. . . . A

nice exercise.

399

Page 400: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

18 Evans’ Chapter 6 and Navier-Stokes

The two large exercises in Section 18.4 relate to the Navier-Stokes equations.You should compare Problem (N) in the first exercise to Exercise 6.6.4 inEvans. Exercises 3,4,5,6 in Section 6.6 are variants on the general theme inSection 6.2. Note that 4 requires Theorem 1 in Section 5.8.1. Make sureyou understand the proof. Each of these 4 exercises has B(u, v) symmetricand the solution operator S compact and symmetric with respect to boththe L2-inner product, and an inner product defined by B.

In the manuscript I posted earlier this week have a look at Section 6.6.1and Stelling 6.13 and thereafter for the eigenvalue formula’s. Viewing S asthe inverse of L the formula’s for the eigenvalues of L follow as in in Theorem2 of Section 6.5.1. Evaluate these eigenvalue formula’s for the problems inExercises 3,4,5,6.

18.1 Existence of weak solutions via Lax-Milgramm

To sum it up what we did consider first the equation

Lu = −(aijuxi)xj + cu = f with boundary condition u = 0 (18.9)

for u = u(x), x ∈ U , U a bounded domain in IRN , ∂U at least continuous,i.e. locally the graph of a continuous function.

Compared to (1) in Section 6.1, I drop the summation signs, use subscriptsfor the coefficients, and omit the first order terms. Existence of classicalsolutions, i.e. solutions u with u ∈ C2(U) to have equation (18.9) make sensein U , and u ∈ C(U) to have the homogeneous (Dirichlet) boundary conditionu = 0 have a meaning, requires conditions on the coefficients aij = aij(x)and c = c(x), and on the right hand side f .

18.1.1 Weak solutions

In the weak solution approach we multiply (18.9) by a v ∈ C1(U), integrateover U and use integration by parts to rewrite the terms with aij as

−∫U

(aijuxi)xj︸ ︷︷ ︸wxj

v = −∫∂U

νj aijuxi︸ ︷︷ ︸w

v +

∫U

aijuxi︸ ︷︷ ︸w

vxj , (18.10)

in which νj is the jth component of the outward normal on ∂U . This requires∂U to be piecewise C1, the coefficients aij ∈ C2(U), c ∈ C(U), the right

400

Page 401: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

hand side f ∈ C(U), and u ∈ C2(U). The boundary integral disappears ifv = 0 on ∂U , leading to the identity∫

U

aijuxivxi +

∫U

cuv︸ ︷︷ ︸B[u,v]

=

∫U

fv︸ ︷︷ ︸(f,v)

(18.11)

for all v ∈ C1(U) with v = 0 on ∂U .This identity that make sense for u ∈ C1(U), with u still required do

have u = 0 on ∂U . The assumptions of aij, c, f can of course be weakenednow. The weak solution approach works with weak solutions which havetheir first order derivatives in L2(U), the natural (Hilbert) space for u, v tolive is H1

0 (U) and u ∈ H10 (U) is called a weak solution if (18.11) holds for all

v ∈ H10 (U).

This formulation requires aij, c ∈ L∞(U) only, and f ∈ L2(U) then sufficesfor the right hand side of (18.11) to makes sense because H1

0 (U) ⊂ L2(U).Recall that we defined H1

0 (U) as the closure of C1c (U) in H1(U) = W 1,2(U).

The right hand side of (18.11) is equal to the inner product of f and v inL2(U) and it defines a linear functional

v ∈ H10 (U)

F−→∫U

fv = (f, v)L2(U) = F (v) = 〈F, v〉︸ ︷︷ ︸different notations

for same functional F

, (18.12)

the latter being the notation used in the Lax-Milgramm Theorem in Section6.2.1.

In (18.12) it is tempting to write f for F in 〈F, v〉, as it is really f thatacts on v, but not via the H1(U) inner product, as the H1(U) inner productis defined by the left hand side of (18.11) with aij = δij and c = 1, i.e.

(u, v)H1(U) =

∫U

uxivxi︸ ︷︷ ︸highest order

terms

+

∫U

uv =

∫U

∇u · ∇v +

∫U

uv, (18.13)

the bilinear form corresponding to the partial differential equation ∆u+u =f .

18.1.2 The Lax-Milgramm Theorem

The f in Theorem 1 in Section 6.2.1 is really the F in (18.12) if the theoremis applied to the bilinear form in (18.11) with H = H1

0 (U).If the bilinear form is bounded on H, i.e.

∀u, v ∈ H |B[u, v]| ≤ α||u|| |v||,

401

Page 402: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

them for each u ∈ H the map

v ∈ H Au−→ B[Au, v] = (Au)(v) = 〈Au, v〉︸ ︷︷ ︸different notations

for same functional Au

(18.14)

is linear and bounded, since

|〈Au, v〉| = |B[u, v]| ≤ α ||u|| |v||,implying that

||Au|| ≤ α ||u||for all u ∈ H. Thus A : H → H∗, where

H∗ = f : H → IR : f is linear and boundednormed by

||f || = sup06=v∈H

|〈f, v〉|||v||

,

is linear and bounded. This dual space H∗ of H can be identified with H viathe Riesz Representation Theorem and 〈f, v〉 = f · v = (f, v)H , consideringf ∈ H = H∗, but in the application to H = H1

0 (U) this is not the innerproduct in the right hand side to (18.11).

If the bilinear form is also coercive on H, i.e.

∀u ∈ H B[u, u] ≥ β ||u||2,then

β ||u||2 ≤ B[u, u] = 〈Au, u〉 ≤ ||Au|| ||u|| whence ||Au|| ≥ β ||u||for all u ∈ H and it follows that A is a bijection between H and A(H), asubspace of H∗, bounded in both directions. Thus A(H) is complete, andthereby a closed subspace of H∗ which7 coincides with H∗. The (linear)solution operator is then defined by

F ∈ H∗ S−→ u ∈ H defined by B[u, v] = 〈F, v〉 for all v ∈ H (18.15)

and has the property that

||u||H = ||SF ||H ≤1

β||F ||H∗

In the application to boundary value problems any right hand side of (18.9)that defines an F in the dual of the Sobolev space used is allowed. In the caseof H = H1

0 (U) this dual space is denoted by H−1(U) and may be viewed asthe space consisting of functions in L2 as well as their first order distributionalderivatives, see Section 5.9.1 in Evans.

7 Via the Riesz Representation or the Hahn-Banach Theorem and the reflexivity of H.

402

Page 403: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

18.1.3 Lax-Milgramm; boundedness condition

It is usually easy to show that the bilinear form derived from the boundaryvalue problem formulation via integration by parts is bounded, also for otherboundary conditions, such as the Neumann condition

νjaijuxi = 0 on ∂U, (18.16)

which is a special case of the Robin boundary condition

νjaijuxi + bu = 0 on ∂U, (18.17)

in which b = b(x) is assumed to bounded and integrable for instance. SeeExercises 6.6.4 and 6.6.5. The latter condition is called Newton’s cooling lawin the case that aij is a positive multiple of the identity matrix and u is thetemperature in a body U with heat exchange at the boundary8. In (18.10)this condition gives the additional term∫

∂U

buv

which should now be included in the left hand side of (18.11), and the naturalSobolev space to pose∫

U

aijuxivxi︸ ︷︷ ︸highest order terms

+

∫U

cuv +

∫∂U

buv =

∫U

fv︸ ︷︷ ︸(f,v)

(18.18)

in is now H1(U).In the case of the Neumann condition (18.16) this extra term is not there

and the only difference with the Dirichlet problem is the choice of the Sobo-lev space. Boundary conditions which are used in the integration by partsderivation of the weak formulation are sometimes called natural boundaryconditions. The Dirichlet boundary condition is not such a natural boundarycondition, it has to be forced on the solution by the choice of the smaller So-bolev space H1

0 (U).

18.1.4 Lax-Milgramm; coercivity

It is usually more delicate to show the coercivity of the bilinear form. Thebasic (ellipticity) assumption on the coefficients aij is (4) in Section 6.1.1 ofEvans. With v = u it bounds the highest order terms from below by the

8 This physical context forces the exchange coefficient to be positive.

403

Page 404: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

highest order terms in (18.13). In the case of H10 (U) the Poincare inequality∫

U

u2 ≤ CU

∫U

|∇u|2 (18.19)

helps. In particular the bilinear form

B[u, v] =

∫U

∇u · ∇v

used for solving

−∆u = f with boundary condition u = 0

is coercive on H10 (U) considered as a subspace of H1(U) with the norm de-

rived from (18.13).The Neumann problem for −∆u = f is very instructive. It requires a

condition on f for solvability, as well as the same condition on u to have aunique condition, choosing

H1(U) = u ∈ H1(U) :

∫U

u = 0

as the Sobolev space to be used in the weak formulation.You should compare the role of b in the Robin boundary condition to

that of c in the partial differential equation, as should be clear from (18.18).Coercivity requires some positivity. It’s easy to cook up exam questions onthis theme.

Also, the higher order problem for the bi-Laplacian in Exercise 6.6.3 isonly one of the problems of this type. It has two unnatural”boundary con-ditions, which are forced upon the solution by the choice of H2

0 (U). Canyou think of natural boundary conditions that lead to a formulation inH2(U), or a mix of natural and unnatural boundary conditions that requireH2(U) ∩H1

0 (U) as the space to be used? Note that for the coercivity of thebilinear form you need the regularity theory in Section 6.3.

18.1.5 The general case with first order terms

The treatment of the Dirichlet problem in Section 6.2.2 should be easy tofollow after the discussion above. The main issue is how to deal with theterms in B[u, v] that come from the first order derivatives in the Lu. I didnot discuss Section 6.2.3 with the adjoint operator and the Fredholm alter-native but read Theorem 4. It is proved via an application of the Fredholmalternative to the solution operator Sµ for the bilinear form

Bµ[u, v] = B[u, v] + γ

∫U

uv

404

Page 405: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

with γ chosen to make Bm coercive.

18.2 The selfadjoint case

The first order terms in L typically prevent the bilinear form from beingsymmetric. Without these first order terms the symmetry of aij makes thebilinear form symmetric. This symmetry is usually assumed, see the openingstatements in Section 6.5.1. In the case that B[u, v] is a symmetric boundedcoercive bilinear form, it defines an equivalent norm on the Sobolev space(used in in the weak formulation) via

||u|| =√B[u, u].

The solution operator

fS−→ u

then satisfies both

(Sf, g)L2(U) = (f, Sg)L2(U) and B(Su, v) = B(u, Sv)

as you should satisfy, and it is compact form L2(U) to L2(U) as well asfrom the Sobolev space to itself. The eigenvalue formula’s I discussed for thesolution operator using B[u, v] then lead to eigenvalue formula’s of which thefirst is stated in the remark following Theorem 2 in Section 6.5.1.

18.2.1 Second hand in homework set

I will restrict the second homework set to Exercises 6.6.3, 6.6.4, 6.6.5, 6.6.6in the second edition of Evans. In all exercises also write down the eigenvalueformula for the first eigenvalue when f is replaced by λu. I advise you toalso do the exercises in Section 18.4 below.

18.2.2 Maximum principles

You should have a look at Section 6.4. I did not have time to deal with themin this course. More on those principles in Chapters 5 and 10 in

http://www.few.vu.nl/~jhulshof/NOTES/ellpar.pdf

18.3 The Navier-Stokes equations

I usually spend a full afternoon on these equations, but as we lost one sessionthere will be no time for it this year. You can read about these equations inDutch on a very introductionary and informal level in

405

Page 406: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

http://www.math.vu.nl/~jhulshof/handoutNS.pdf

Consider the Navier-Stokes equations on a bounded domain Ω ⊂ IR2 fort ≥ 0 with smooth boundary ∂Ω, given initial data for the velocity

u =

(u1(t, x1, x2)

u2(t, x1, x2)

)at t = 0 and no-slip boundary conditions u = 0 on ∂Ω for all t ≥ 0. For theexercises below you may restrict your attention to the case that

Ω = (x1, x2) ∈ IR2 : x21+x2

2 < 1 with outer normal n =

(x1

x2

)in x ∈ ∂Ω.

The Navier-Stokes equations read (with kinematic viscosity equal to unity)

ut + (u · ∇)u+∇p = ∆u, ∇ · u = 0.

The second zero divergence equation has to be imposed on the initial datafor u at t = 0 as well. In view of the Laplacian in the equation and theboundary condition u = 0 on ∂Ω the natural spaces for solutions to live inas functions of t are

H10 (Ω)2 =

(u1

u2

): u1, u2 ∈ H1

0 (Ω) ⊂ (L2(Ω))2 = (u1

u2

): u1, u2 ∈ L2(Ω),

but the zero divergence equation imposes an a priori restriction as explainednext.

If u ∈ (L2(Ω))2 satisfies ∇ · u ∈ L2(Ω) then the normal component n · uof the velocity is well defined in L2(∂Ω) by a theorem similar to the tracetheorems in Evans, and the Gauss divergence formula∫

Ω

∇ · u =

∫∂Ω

n · u

holds true for such u. Solutions with finite kinetic energy

E(u) =1

2

∫Ω

(u21 + u2

2)

actually live in

H = u =

(u1

u2

): u1, u2 ∈ L2(Ω), ∇ · u = 0 on Ω, n · u = 0 on ∂Ω.

If also the first order spatial weak derivatives exist with

E(u) =

∫Ω

|Du|2 =

∫Ω

((∂u1

∂x1

)2 + (∂u1

∂x2

)2 + (∂u2

∂x1

)2 + (∂u2

∂x2

)2

)<∞,

then u ∈ H1(Ω)2 and it is possible to speak of u on ∂Ω as the trace of u andin particular of its tangential component n × u = n1u2 − n2u1 in the usualsense.

406

Page 407: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

18.4 Navier-Stokes related exercises

1. This exercise concerns the projection of

L2div(Ω) = w ∈ (L2(Ω))2 : ∇ · w ∈ L2(Ω)

on the space H above (the subscript div stands for divergence). Forw ∈ L2

div(Ω) let f = −∇ · w ∈ L2(Ω) and g = n · w ∈ L2(∂Ω), andconsider the Neumann problem

(N) −∆p = f in Ω with∂p

∂n= g on ∂Ω.

You may think of p in (N) as related to the pressure in the Navier-Stokes equations.

(a) What is the natural condition on arbitrary f ∈ L2(Ω) and g ∈L2(∂Ω) to have a solution of (N)? Hint: use the divergence the-orem, you may argue as if f , g and p are smooth. Does yourcondition hold for the particular choice of f and g above? If so,why? Explain why then the solution p is never unique and can bechosen to have

∫Ωp = 0.

(b) Explain why for f ∈ L2(Ω) and g ∈ L2(∂Ω) we say that p ∈ H1(Ω)is a weak solution of (N) if

(Nweak)

∫Ω

∇p · ∇φ =

∫Ω

fφ+

∫∂Ω

gφ for all φ ∈ H1(Ω).

Check that this can only hold if your condition in (a) is satisfied,in which case it suffices to show that that the identity in (Nweak)holds for every φ ∈ H1(Ω) = p ∈ H1(Ω) :

∫Ωp = 0.

(c) Let H1(Ω) be as in (b). Show that

((p, φ)) =

∫Ω

∇p · ∇φ

defines an inner product on H1(Ω) with an inner product normthat is equivalent on H1(Ω) to the full H1-norm defined by

(p, φ)H1(Ω)

=

∫Ω

pφ+

∫Ω

∇p · ∇φ, ||p||2H1(Ω)

= (p, p)H1(Ω)

,

(d) Explain why for every f ∈ L2(Ω) and every g ∈ L2(∂Ω) satisfyingyour condition in (a) there is a unique p ∈ H1(Ω) that satisfies(Nweak).

407

Page 408: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

(e) Recall that

H = u =

(u1

u2

): u1, u2 ∈ L2(Ω), ∇·u = 0 on Ω, n·u = 0 on ∂Ω.

Explain why every w ∈ L2div(Ω) can be written as w = ∇p + u

with u ∈ H and p ∈ H1(Ω), and that u is uniquely determined byw. This u is called the Leray projection of w.

2. In this exercise we consider smooth solutions of the Navier-Stokes equa-tions with zero slip boundary conditions as above (so you can forgetabout weak derivatives and all that now).

(a) Write u0 for the initial velocity field of a smooth solution u withpressure p: then u(x, 0) = u0(x) and u0 must satisfy ∇ · u0 = 0.We write u(t) for the function x → u(x, t). Integrate the innerproduct of

ut + (u · ∇)u+∇p−∆u

with u over Ω and derive that

d

dtE(u(t) + E(u(t)) = 0,

where E(u) and E(u) are as in the introduction above. In otherwords, show that

1

2

d

dt

∫Ω

|u|2 +

∫Ω

|Du|2 = 0.

Why does it follow that∫ T

0

∫Ω

|Du|2 ≤ 1

2

∫Ω

|u0|2 ?

Hint: write terms out in coordinates, e.g.

u · (u · ∇)u =2∑

j,k=1

ukuj∂uk∂xj

,

and use integration by parts (the boundary terms disappear, aswell as ∇ · u).

408

Page 409: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

(b) For smooth solutions u and v with pressures p and q respectivelylet w = u− v. Subtract the equations for u and v, take the innerproduct with w and integrate over Ω to derive that

1

2

d

dt

∫Ω

|w|2 +

∫Ω

|Dw|2 = −∫

Ω

w · (w · ∇)v ≤∫

Ω

|Dv||w|2.

Hint: (i) use integration by parts for the equality, the boundaryterms disappear, as well as ∇ · u, ∇ · v, ∇ · w, if they show up.Check that the terms coming from the nonlinear terms in theequations may be rewritten as a term giving the integral with wand v, and another integral with u and w which disappears; (ii)for the subsequent inequality use Ax·x ≤ |A||x|2 for 2×2 matricesA and 2-vectors x, with |A|2 = A2

11 + A212 + A2

21 + A222.

(c) Derive from (b) that

d

dt

∫Ω

|w|2 + 2

∫Ω

|Dw|2 ≤ 2(

∫Ω

|Dv|2)12 (

∫Ω

|w|4)12 .

(d) Insert the inequality∫Ω

|w|4 ≤∫

Ω

|w|2∫

Ω

|Dw|2

in (c) to derive that

d

dt

∫Ω

|w|2 ≤ 1

2

∫Ω

|Dv|2∫

Ω

|w|2.

Hint: in the right hand side you get a product which contains thefactor a =

∫Ω|Dw|2. Use the inequality 2ab ≤ a2 + b2 and observe

that a2 als appears on the left hand side.

(e) Derive from (d) and (a) with u replaced by v that∫Ω

|w(t)|2 ≤∫

Ω

|w0|2e14

∫Ω |v0|2 .

(f) Prove the inequality used in (d) for compactly supported smoothvectorfields on IR2 by first showing that∫ ∞

−∞

∫ ∞−∞

u(x1, x2)4 dx1dx2 ≤

(

∫ ∞−∞

∫ ∞−∞

u2) (

∫ ∞−∞

∫ ∞−∞

u2x1

)12 (

∫ ∞−∞

∫ ∞−∞

u2x2

)12

409

Page 410: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

for compactly supported smooth functions u. In short:

||u||44≤ ||u||2

2||ux1||2 ||ux2||2 .

Hint: write u(x1, x2)4 = u(x1, x2)2u(x1, x2)2 and show first that

u(x1, x2)2 ≤∫ ∞−∞

u(ξ, x2)ux1(ξ, x2)dξ

and likewise

u(x1, x2)2 ≤∫ ∞−∞

u(x1, η)ux2(x1, η)dη.

410

Page 411: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

19 Geostuff

I will use L for the Lagrangian and not F . We assume that L = L(t, u, p) is assmooth as we need. Chapter 1 of [J&J] concerned Euler-Lagrange equationsfor u = u(t) ∈ IRn. We saw how minimizing

I(u) =

∫ b

a

L(t, u(t), u(t)) dt (19.1)

for sufficiently smooth functions u : [a, b]→ IRn (with u(a) and u(b) prescri-bed) leads to the Euler-Lagrange system of differential equations:

d

dt

∂L

∂pi− ∂L

∂ui= 0 (i = 1, . . . , n) (19.2)

We also saw the Jacobi equations, obtained from (1.3.6) and the linearisedLagrangian

φ =∂2L

∂pi∂pjπiπj + 2

∂2L

∂ui∂pjπiηj +

∂2L

∂ui∂ujηiηj (19.3)

The Euler-Lagrange equations of (19.3) are the Jacobi equations

d

dt

∂φ

∂πi− ∂φ

∂ηi= 0 (i = 1, . . . , n) (19.4)

These Jacobi equations are the linearised Euler-Lagrange equations. Verifythis!

For Lagrangians independent of t we noticed a conservation law. Whenyou multiply (19.2) by pi(t) = ui(t) you get

0 = pi(t)d

dt

∂L

∂pi− ui(t) ∂L

∂ui=

d

dt

(pi∂L

∂pi

)−pi(t)∂L

∂pi− ui(t) ∂L

∂ui︸ ︷︷ ︸− dLdt

=d

dt

(pi∂L

∂pi− L

)

19.1 Submanifolds of IRd are Riemannian

Chapter 2 deals with the problem of finding the shortest connecting curvebetween two given points in an n-dimensional submanifold M of IRd withd > n. For this will need knowledge of the concept of covariant differentiation

411

Page 412: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

on M . The nonabstract introduction with submanifolds below provides amachinery that also works in the abstract setting of general Riemannianmanifolds.

Locally M is given by smooth parametrizations

x = f(u)

(coordinate charts) defined on open connected sets U ⊂ IRn with smoothtransitions between u and u on U ∩ U if f : U → M and f : U → M aretwo different coordinate patches. A (preferably finite1) collection with thisproperty that describes the whole of M is called an atlas for M .

Every such parametrization provides us with locally defined tangent vec-tor fields

x1 =∂x

∂u1, · · · , xn =

∂x

∂un,

since for every u ∈ U the vectors xi(u) are tangent to M in x(u) ∈ M . Theinner products

gij = gij(u) = xi · xjare locally defined scalar fields, the coefficients of the Riemannian metric onM inherited from the inner product in the ambient space IRd.

In terms of local coordinates u1, . . . , un tangent vector fields V on M aredescribed by

V = V ixi = V i(u)xi(u) = V 1(u)x1(u) + · · ·+ V n(u)xn(u), (19.5)

in which we use a summation convention for repeated lower and upper indices.Two such vectors fields have inner product

V ·W = V ixi ·W jxj = V iW jxi · xj = V iW jgij

Don’t forget the u-dependence which is usually dropped from the notationand pay attention to the double use of subscripts: as indices in gij and asderivatives in xi. The inner product of two tangent vector fields on M definesa scalar field2 on M . The map

(V,W )→ V ·W

is well defined, independent of the choice of coordinates, and multilinear overthe scalar fields3. In particular, if φ, ψ : M → IR are (smooth) functions,then

(φV ) · (ψW ) = φψ (V ·W )1This is related to the concept of compactness2A real valued function3Tensor property

412

Page 413: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

19.2 Covariant differentiation

If we differentiate a vector field V as given by (19.5) we get contributions fromu-dependence in V i(u) and from u-dependence in xi(u). The tangential partof the resulting derivative is what is by definition the covariant derivative.The partial derivative of (19.5) with respect to uj can be written as

∂V

∂uj=∂V i

∂ujxi + V ixij, xij =

∂xi∂uj

=∂2x

∂uj∂ui=

∂2x

∂ui∂uj= xji (19.1)

In the case that M = IRn = IRd with xi = ui, the tangent vectors xi are theunit base vectors ei so that xij = 0 and the covariant partial derivatives ofV are just the partial derivatives V . The same holds if x(u) in linear in u.In all other cases we decompose xij as

xij = Γlijxl + normal parts

and take the inner product with xk to get

Γijk := xij · xk = Γlijxl · xk = Γlijglk

Thus Γijk is obtained from Γlij using glk. Introducing gkl = glk by

glkgkm = δml ,

we also obtain Γmij from Γijk:

gmkΓijk = Γlijglkgkm = Γlijδ

ml = Γmij

The relation between both Γ-symbols is given by

Γijk = Γlijglk, Γmij = gmkΓijk

The metric coefficients are used to raise and lower the exponents4.Next we determine Γijk. Differentiating gij with respect to uk we get

gij,k =∂gij∂uk

=∂

∂uk(xi · xj) = xki · xj + xjk · xi = Γkij + Γjki

Note the two cyclic permutations kij and jki of ijk on the right. Using cyclicpermutation, we have the following three equivalent forms of the resultingstatement:

gij,k = Γkij + Γjki

4Just as with tensor coefficients, though the Γ’s are not tensor coefficients

413

Page 414: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

gjk,i = Γijk + Γkij

gki,j = Γjki + Γijk

Multiplying by −12, 1

2and 1

2and adding up we get

Γijk =1

2(gjk,i + gki,j − gij,k)

Using the symmetry gij = gji it follows that

Γijk =1

2(gjk,i + gik,j − gij,k) , Γmij =

1

2gmk (gjm,i + gim,j − gij,m) (19.2)

These formula’s define the Christoffel symbols Γkij = Γkji in terms of the metricand its first order derivatives and can be used to write (19.1) as

∂V

∂uj=∂V i

∂ujxi + V iΓlijxl + normal parts

The tangential part is thus

DujV := (∂V

∂uj)T =

(∂V l

∂uj+ V iΓlij

)xl, V = V ixi (19.3)

This is called the covariant derivative of V with respect to uj. Both V andDujV are tangent vector fields, with components

V i and (DujV )l =∂V l

∂uj+ V iΓlij

19.3 Tangent vectors as derivatives

Next we introduce the modern view point on tangent vectors. Since everytangent vector defines a directional derivative, it has become customary toidentify such first order differential operators with their direction vectors. Inshort, we think of

xi =∂x

∂uiand

∂ui

as essentially the same objects. To see how this works in a point x0 ∈M weuse integral curves starting at x0, that is, solutions of

γ(t) = X(γ(t)), γ(0) = x0 ∈M, (19.1)

414

Page 415: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

where X is a tangent vector field defined near x0. The differential equationin (19.1) is called the flow equation for X. Using coordinates u, with u = u0

corresponding to x0, the expressions in (19.1) evaluate as

γ(t) = x(u(t)), γ(t) =∂x

∂ui(u(t))ui(t) = ui(t)xi, X(γ(t)) = X i(u(t))xi,

so the system to be solved for u = u(t) to obtain the integral curves is

ui = X i(u), u(0) = u0. (19.2)

The solution u = u(t) exists locally and is unique. We have ui(0) = X i(u0)and X0 := X(x0) = γ(0) = ui(0)xi = X i(u0)xi. On scalar fields (functions)φ : M → IR, given in local coordinates as

φ = φ(u1, . . . , un),

the vector field X now acts through

d

dt|t=0φ(u(t)) =

∂φ

∂ui(u0)ui(0) = X i

0

∂φ

∂ui(u0)

at φ in u = u0, i.e. as the directional derivative

X i0

∂uicorresponding to the direction vector X i

0xi

in u = u0. The derivative only depends on the value of the vector field in x0.Since the point x0 = x(u0) was arbitrary we have

X = X i ∂

∂uicorresponding to the tangent field X = X ixi = X i ∂x

∂ui.

The two expressions above are merely different representations of the tangentvector field X (both in local coordinates):

The components

X i∂xk

∂ui

of the tangent field X multiply∂φ

∂xk

in the chain rule formula if φ is extended to a neighbourhood of M in IRd.As differential operator

X = X i ∂

∂ui

415

Page 416: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

X acts on scalar fields like φ = φ(u) and produces a scalar field Xφ, thederivative of φ in the direction of X. This directional derivative is denotedby

∇Xφ = Xφ, replacing the notation∂φ

∂X

in calculus texts. We already use the notation ∇X customary for covariantdifferentiation. For reasons that should be clear, covariant differentiation ofscalar fields is by definition the same as differentiation of scalar fields.

19.4 Commutators of tangent vector fields

If X and Y are scalar fields on M then the commutator of X and Y is definedas

[X, Y ] = XY − Y X

meaning that

∇[X,Y ]φ = [X, Y ]φ = X(Y φ)− Y (Xφ) = ∇X(∇Y φ)−∇Y (∇Xφ).

This commutator has a meaning by itself. If γ(t) is the solution of (19.1),then the linearised flow equation transports the vector Y (x0) along γ(t).Denoting the transported vector as ξ(t), we may differentiate the differenceof ξ(t) and Y (γ(t)) with respect to t and evaluate the derivative in t = 0.This defines

(LXY )(x0) = limt→0

ξ(t)− Y (γ(t))

t,

the Lie derivative of Y with respect to X in x0.In coordinates ξ(t) = ξi(t)xi with ξi(t) is a solution of the linearization

of (19.2) around u(t),

ξi = (∂X i

∂uj)︸ ︷︷ ︸

in (u(t)

ξj(t), ξj(0) = Y i(u0) (19.1)

Writingξ(t)− Y (γ(t)) = ξ(t)− Y (x0)− (Y (γ(t))− Y (x0))

you should verify that

(LXY )(x0) = (XY )(x0)− (Y X)(x0)

so that[X, Y ] = LXY (19.2)

416

Page 417: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Note that [X, Y ] is bilinear over de scalar fields. Verify that

[X, Y ]j = XkY jk − Y

kXjk

and that the Jacobi identity

[[X, Y ], Z] + [[Y, Z], X] + [[Z,X], Y ] = 0 (19.3)

holds.

19.5 Covariant differentiation of tangent vectors

Next we observe that

X = X i ∂

∂ui

naturally acts covariantly on tangent fields V , if we replace

∂uiby Duj ,

as defined in (19.3) through

DujV :=

(∂V l

∂uj+ V iΓlij

)xl for V = V ixi.

The result of this action is

Xj

(∂V l

∂uj+ V iΓlij

)xl

and is denoted as

∇XV = Xj

(∂V l

∂uj+ V iΓlij

)∂

∂ui(19.1)

in the modern notation for tangent vectors as differential operators.The map

V → ∇XV

is not linear over the scalar fields because

∇XφV = Xj

(∂φV l

∂uj+ φV iΓlij

)xl

= φXj

(∂V l

∂uj+ V iΓlij

)xl +Xj ∂φ

∂ujV l = φ∇XV + (∇Xφ)V.

417

Page 418: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

The latter term in this Leibniz rule destroys the tensor property of linearityover the scalar fields.

Convince yourself that in the non-abstract approach

∇XV = Xj

(∂V l

∂uj+ V iΓlij

)xl

is the tangential5 component of the derivative of V in the direction of X andverify that

∇X(V ·W ) = ∇XV ·W + V · ∇XW

if W is another tangent vector field on M .

19.6 Second fundamental form

The normal part of the derivative of V in the direction of X is denoted byII(X, V ), in which II is called the second fundamental form of M . Verify thatit is bilinear over the smooth fields on M . Since the normal part essentiallycomes from the mixed derivatives xij, the second fundamental form must besymmetric. Moreover, if N is a normal vector field on M and N,X, V areextended smoothly6 to the ambient space IRd then

∇X(N · Y ) = ∇XN · Y +N · ∇XY, (19.1)

in which ∇ is the (standard covariant) derivative in IRd. On M the left handside of (19.1) is zero, and the second term N · ∇XY on the right hand sideonly sees the normal part of ∇XY which is II(X, Y ). It follows that

∇XN · Y = −N · II(X, Y ) on M. (19.2)

This is called Weingarten’s relation. Note that in the codimension 1 cased = n+ 1 we can choose a unit normal field N and define

h(X, Y ) = N · II(X, Y ) = −∇XN · Y = hijXiY j (19.3)

19.7 Curvature

The equality

∇X∇YZ −∇Y∇XZ = ∇[X,Y ]Z +R(X, Y )Z (19.1)

5 to M6 This can be done, certainly locally, why?

418

Page 419: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

defines R(X, Y )Z for tangent vector fields X, Y, Z. You may verify thatR(X, Y )Z is multilinear in X, Y , Z over the scalar fields on M . In the caseM = IRn = IRd you will find that R(X, Y )Z ≡ 0. The standard way to writeR(X, Y )Z in local coordinates u is

(R(X, Y )Z)α = RαijkZ

iXjY k. (19.2)

So Z comes first7 and then X and Y . Using (19.1) and writing

Γαij,k =∂Γij∂uk

you should verify that8

Rαijk = ΓβikΓ

αβj − ΓβijΓ

αβk + Γαik,j − Γαij,k (19.3)

and the zero ijk and jk cyclic sums

Rαijk +Rα

kij +Rαjki = 0 = Rα

ijk +Rαikj (19.4)

If W is another tangent field then9

Rm(X, Y, Z,W ) = R(X, Y )Z ·W = RαijkZ

iXjY kgαlWl = RlijkW

lZiXjY k,(19.5)

which has the symmetries

Rm(X, Y, Z,W ) +Rm(Y, Z,X,W ) +Rm(Z,X, Y,W ) = 0,

Rm(X, Y, Z,W )+Rm(Y,X,Z,W ) = 0 = Rm(X, Y, Z,W )+Rm(X, Y,W,Z)

(the second one obtained from Rm(X, Y, Z, Z) = 0), implying

Rm(X, Y, Z,W ) = Rm(Z,W,X,Z)

In the 2-dimensional case n = 2 the only possible nonzero entries of Rijk are

R1212 = R2121 = −R1221 = −R2112

In the codimension 1 case

Rlijk = hikhlj − hijhlk7As if we would have prefered the notation ZR(X,Y )8note the order ijk in the minus terms and the j ↔ k relation with the plus terms9 lijk = dead body, as if we would have prefered the notation W · ZR(X,Y )

419

Page 420: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

consists of all the 2× 2 determinants you can get from the matrix hij. Notethat similarly

(W ·X)(Y · Z)− (W · Y )(X · Z) = (gikglj − gijglk)︸ ︷︷ ︸Glijk

W lZiXjY k, (19.6)

in which Glijk has the same symmetry properties as Rlijk (and depends onlyon G1212 if n = 2).

For submanifolds you can verify from the definitions that

Rm(X, Y, Z,W ) = II(X,W )II(Y, Z)− II(X,Z)II(Y,W ), (19.7)

which in the codimension 1 case (19.3) reduces to

Rm(X, Y, Z,W ) = h(W,X)h(Y, Z)− h(W,Y )h(X,Z),

soRm(X, Y, Z,W ) = (hikhlj − hijhlk)︸ ︷︷ ︸

Rlijk

W lZiXjY k, (19.8)

Gauss computed this expression for Rlijk from xijk = xikj, see Chapter 10in Schaum’s Differential Geometry book by Martin Lipschutz. The Gausscurvature of a surface in IRd is the scalar ratio between (19.7) and (19.6). InIR3 this is the scalar ratio between (19.8) and (19.6).

19.8 Geodesic curves

A smooth curve γ(t) ∈M may require several coordinate patches to describeit. For the moment we assume that it can be described by one coordinatepatch. If

γ : [a, b] 3 t→ u(t)→ x(u(t)) ∈M

is such a curve in M , then its velocity is given by

γ =∂x

∂u1u1 + · · ·+ ∂x

∂unun =

n∑i=1

ui∂x

∂ui=

n∑i=1

uixi.

Think of γ as a vector at the point x = γ(t) in M . For every t this vectoris tangent to M , and written as a linear combination of the tangent vectorsobtained from the parametrization:

x1 =∂x

∂u1, . . . , xn =

∂x

∂un.

420

Page 421: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Its length l is given by

l =

∫ b

a

|γ(t)| dt =

∫ b

a

√γ(t) · γ(t) dt =

∫ b

a

√xiui · xjuj dt

=

∫ b

a

√uiujgij(u) dt

We will work with another quantity, called the energy, which involves anL as in Chapter 1. Since I prefer to have u in L, my u’s are the γ’s in thebook. My γ(t) is what is c(t) in the book. The energy is defined by

E =1

2

∫ b

a

|γ(t)|2 dt =1

2

∫ b

a

γ(t) · γ(t) dt =1

2

∫ b

a

xiui · xjuj dt

=1

2

∫ b

a

uiujgij(u) dt =

∫ b

a

L(u(t), u(t)) dt,

in which

L = L(u, p) =1

2pipjgij(u). (19.1)

Playing with the estimate

∫ b

a

|γ(t)| dt =

∫ b

a

1 |γ(t)| dt ≤

√∫ b

a

12 dt

√∫ b

a

|γ(t)|2 dt

and reparametrization of γ to make |γ| constant you should easily concludethat minimizers of l are minimizers of E and vice versa if we keep [a, b] fixed.

The Euler-Lagrange equations for E involve the derivatives of gij andcome out as

ui + Γiαβuαuβ = 0 (19.2)

and are called the geodesic equations. Indeed,

Γiαβ =1

2gik (gαk,β + gβk,α − gαβ,k) ,

the symbols computed in (19.2). You should repeat this calculation withoutlooking at the notes above. What is the conservation law for this system?

421

Page 422: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

19.9 A special metric with radial symmetry

A nice example is a surface M which is described by a single set of coordinatesu ∈ IR2 with a metric

gij(u) = g(|u|)δij (19.3)

in which u → g(|u|) is smooth and positive10. You can write the geodesicequations as in the book (2.1.27). In a special case the example is related tostereographic projection through

u1 =x1

1− x3, u2 =

x2

1− x3,

which you may prefer as

u =x

1− z, v =

y

1− zwithout indices.

• Verify that large circles on x2 + y2 + z2 correspond to circles in theuv-plane. Hint: describe the large circles as z = ax + by and avoidgoniometric functions.

• The large circles not contained in this description are the vertical greatcircles which correspond to lines through the origin in the uv-plane.Assuming unit speed for both the vertical great circles and lines throughthe origin derive the formula for g(|u|).

We return to (19.3) with general g(|u|).

• Why are geodesics through the origin straight lines?

• Take a geodesic line parametrized by t such that t = 0 corresponds to(0, 0) and that the speed in (0, 0) is equal to 1. Use the conservationlaw to derive a first order equation for R(t) = |u(t)| and solve it.

• Examine how long it takes for the geodesic curve to reach infinity.What is the condition on g(|u|) to reach infinity in finite time? Thisshould involve some integral with g. Do the same in dimension n > 2?Is there a difference?

• Can you cook up an example for which the geodesic cannot cross |u| =1? Can you classify these examples?

• Incidentally, what is the Gauss curvature for metrics of the form (19.3)in IR2?

10 implying 0 = g′(0) = g′′′(0) = g′′′′′(0) = · · ·

422

Page 423: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

19.10 The Jacobi equations

Consider the Lagrangian (19.1).

• Show that the Jacobi equations (19.4) for (19.1) are

ηi + 2Γijkuj ηk + Γijk,lu

jukηl = 0 (19.4)

Both ui(t) and ηi(t) define vector fields along γ(t) = x(u(t)) in M ∈ IRd

tangent to M through

γ(t) = ui(t)xi(u(t)), η(t) = ηi(t)xi(u(t))

The Jacobi equations are much more transparent if we work with the tan-gential parts DtV of the time derivatives of such vector fields

V (γ(t)) = V i(t)xi(u(t))

• Derive that

DtV = (DtV )jxj with V j + V αΓjαβuβ

• Derive that the geodesic equation (19.2) may be written as

Dtγ = 0, γ = uixi

• Derive that (19.4) may be written as

(D2t η)i + uαRi

αβkηβuk = 0, i.e. D2

t η +R(η, γ)γ = 0

423

Page 424: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

20 Newton’s method the hard way

Some time ago I was asked to give a talk on the work of Nash. I apologise fordoing something else instead. On a family of theorems that bear his nameand proofs Nash never wrote. In these notes I describe how Newton’s methodcan be adapted in the case that the map

u→ u− f ′(u)−1f(u) (1)

is not defined as a map from a Banach space X to itself. The resultingtheorems are called HARD Implicit Function Theorems. My purpose here isto demystify the terminology and present a simple proof of convergence for amodification of Newton’s method in such a case. Observe that a direct proofof the Inverse Function Theorem for a continuously differentiable functionf amounts to solving the equation f(u) = v for u given small v under theassumption that f(0) = 0, using the map

u→ u+ f ′(0)−1(v − f(u)) (2)

which is contractive if f ′(0)−1 : X → X exists as a continuous linear map.The proof of the Implicit Function Theorem for solving equations like

f(u, v) = 0 in the form u = u(v) if f(0, 0) = 0 and the partial derivative of fwith respect to u is invertible in (u, v) = (0, 0) is similar. To show that (2)produces a local solution u = u(v) which is continuously differentiable theonly regularity on f that has to be assumed is that u→ f ′(u) is continuous,as only f ′(u) is needed in the calcutions and estimates. Newton’s method,which employs a suitable inverse of f ′(u) for all u in some (say the unit) ballB in X, relies an Taylor’s theorem with a quadratic remainder and thereforethe assumption that also u→ f ′′(u) be continuous is required.

20.1 Newton’s method: a convergence proof

I will modify the treatment in [KP]1 which begins with a somewhat alter-native treatment of Newton’s method in the standard case. So to warm upconsider an equation of the form f(u) = 0 in which f : B → X is a twice con-tinuously differentiable function defined on the open unit ball B in a Banachspace X, with first and second order derivative satisfying bounds

||f ′(u)|| ≤M1 and ||f ′′(u)|| ≤M2 ∀u ∈ B. (3)

The general case of Banach spaces is really not that different from the casein which X = IR, which you may think of in what follows below. Simplytake B = (−1, 1) and replace all norms by absolute values.

1 Krantz & Parks, The Implicit Function Theorem, Birkhauser 2003.

424

Page 425: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

What we need is that Taylor’s theorem with a second order remainder,

f(un) = f(un−1) + f ′(un−1)(un − un−1)︸ ︷︷ ︸linear aproximation

+Qf (un−1, un), (4)

in which

||Qf (un−1, un)|| ≤ M2

2||un − un−1||2, (5)

applies to a sequence of iterates un ∈ B. For the standard Newton methodone does not explicitly need the bound on f ′(u) in (3) which says that thelinear map f ′(u) : X → X satisfies

||f ′(u)v|| ≤M1||v|| ∀u ∈ B ∀u ∈ X, (6)

but a similar bound||L(u)|| ≤ C (7)

for maps L(u), that act as right inverses of f ′(u) in the sense that

f ′(un−1)L(un−1)f(un−1) = f(un−1), (8)

is essential. Writing

pn = ||un − un−1|| and qn = ||f(un)|| (9)

the Newton scheme

un = un−1 − L(un−1)f(un−1) (n ∈ IN), (10)

starting with u0 = 0, then defines un ∈ B as long as

p1 + p2 + · · ·+ pn < 1, (11)

and the inequalities

pn ≤ Cqn−1 and qn ≤1

2M2p

2n (12)

are immediate from (4,5,10). Note that (10) kills the linear approximationin (4). The inequalities in (12) are complemented by

q0 = ||f(0)|| and p1 ≤ Cq0 = C||f(0)||. (13)

425

Page 426: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

20.2 The optimal result

Clearly (12) and (13) combine as

pn ≤ µp2n with µ =

1

2MC and p1 ≤ C||f(0)||, (14)

and the condition to be stated is which P = P (µ) guarantees that the impli-cation

C||f(0)|| < P =⇒∞∑n=1

pn < 1 (15)

holds. The larger P the stronger the statement in the sense that larger||f(0)|| are allowed to obtain a solution u = u ∈ B of f(u) = 0 via (10)with u0 = 0. Note that with C||f(0)|| ≤ P the same conclusion will holdif only one of all the inequalites in the estimates below is strict, which willinevatibly be the case of course.

Obviously the smallest P we can get follows from replacing the threeinequalities in (14) and (15) by inequalities. This leads to

pn = µp2n−1 for n ∈ IN; p1 = P ;

∞∑n=1

pn = 1. (16)

Via ξn = pn and ξn = ξ2n−1 this is easily seen to be equivalent to

µ = G(µP ) with G(ξ) = ξ + ξ2 + ξ4 + ξ8 + ξ16 + · · · (17)

but this does not yield a simple formula for P = P (µ).

20.3 A suboptimal result

A rough estimate

G(ξ) < ξ + ξ2 + ξ3 + ξ4 + ξ5 + · · · = ξ

1− ξ(18)

leads to a simple but suboptimal formula:

P =1

1 + µor µ =

1

P− 1. (19)

426

Page 427: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

20.4 Alternative proof of convergence

The alternative approach to (12) and (13) in [KP] is not to solve the corres-ponding system with equalities but to derive an estimate of the form

pn ≤ e−γλn

(20)

via induction starting from

p1 ≤ C||f(0)|| < P = e−γλ, (21)

with choices of γ and λ that guarantee both

∞∑n=1

e−γλn ≤ 1 (22)

as well as that the induction step can be done via

pn−1 ≤ e−γλn−1

=⇒ pn ≤ µp2n−1 ≤ µe−2γλn−1 ≤ e−γλ

n︸ ︷︷ ︸should hold for all n≥1

,

which is the case if

lnµ ≤ γλn−1(2− λ) ∀n ≥ 1.

20.5 The optimal alternative result

For a given µ this is equivalent to

lnµ ≤ γλ(2− λ) and λ ≤ 2 (23)

if we make the obvious restriction that γ and λ be positive. Conditions (21)and (23) suggest α = γλ and λ as the more relevant parameter so we haveto pick α > 0 and 1 < λ ≤ 2 with

lnµ ≤ α(2− λ),∞∑n=0

e−αλn ≤ 1 and P = e−α maximal. (24)

For µ > 1 the inequalities define a region in the first quadrant of the λ, α-plane bounded by the two curves given by

lnµ = α(2− λ) and∞∑n=0

e−αλn

= 1, (25)

427

Page 428: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

which intersect in one point.This point defines the minimal value of α = − ln P via

1 =∞∑n=0

e−αλn

=∞∑n=0

P λn =∞∑n=0

P (2+ lnµln P

)n

if µ > 1. The curve defined by

1 =∞∑n=0

P (2+ lnµln P

)n and µ ≥ 1 (26)

hits the curve defined by (17) in µ = 1 and lies below (17) of course, butabove (19) in view of

µ =1

P− 1 =⇒

∞∑n=0

P (2+ lnµln P

)n =∞∑n=0

P (1+ln(1−P )

ln P)n <

∞∑n=0

P 1+nln(1−P )

ln P︸ ︷︷ ︸a geometric series

= 1.

For µ ≤ 0 the optimal choice of P via (24) is given by

∞∑n=0

P 2n .

20.6 A suboptimal alternative result

A more explicit formula is again obtained via a rough estimate

∞∑n=1

e−γλn ≤

∞∑n=1

e−γ(1+n(λ−1))

︸ ︷︷ ︸a geometric series

=e−γλ

1− e−γ(λ−1)=

e−α

1− eγe−α(27)

and replacing (24) by

lnµ ≤ α(2− λ), λ ≥ α

ln(eα − 1)and P = e−α maximal.

This leads to

µ = eα(2−λ) =1

P 2−λ =1

P2+ ln P

ln( 1P−1)

= Pln(P )−2 ln(1−P )

ln(1−P )−ln(P )

so that

1 ≤ µ =1

P2+ ln P

ln( 1P−1)

<1

P− 1 (28)

428

Page 429: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

defines another curve with

P ≤ 3−√

5

2,

which is below the three curves above, but to leading coincides with them inthe limit µ→∞ and P → 0.

20.7 A lousy alternative result

The even rougher estimate used in [KP] via

∞∑n=1

e−γλn ≤

∞∑n=1

e−nγ(λ−1)

is to be avoided as at some point below the treatment of ill-behaved Newton’smethods will show.

20.8 A much better suboptimal alternative result

Actually the first rough estimate above works better with α dan with γ, asI only noticed May 21. Directly in terms of γ and λ we have

∞∑n=1

e−γλn

=∞∑n=1

e−γλλn−1 ≤

∞∑n=1

e−γλ(1+(n−1)(λ−1)) =e−γλ

1− e−γλ(λ−1)≤ 1 (29)

if

2− λ ≤ ln(eγλ − 1)

γλ=

ln(eα − 1)

α,

so that we arrive at

lnµ ≤ α(2− λ), α(2− λ) ≤ ln(eα − 1) and P = e−α maximal. (30)

This is the optimal estimate using the Bernoulli type inequality

λn ≥ 1 + n(λ− 1). (31)

With equality in the final inequality in (29) we arrive at

lnµ ≤ ln(eα − 1) = ln(1

P− 1),

which for µ > 1 coincides with (19) and we can forget about the annoying(28) above. Note that factoring out another λ in the exponent in (29) willand cannot help to improve this result, which says that if µ > 1 the bound

||f(0)|| ≤ 1

C(µ+ 1)

429

Page 430: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

suffices.This bound may be compared with the bound in [KP], where all constants

are named M , for unclear reasons M > 2 is assumed, and the 12-coefficient

in the Taylor-remainder term is omitted. Since µ = 12CM our bounds looks

similar to their bound ||f(0)|| ≤ M−5. In the next section the comparisonwill be a true pain, as [KP] have a formulation in which again all constantsare called M with apparently M > 1, and the bound on some norm of f(0)(the wrong norm actually) involving M−307. Comparing to the lectures notesof Schwartz from 60 years ago this is hardly an improvement as Schwartz hadM−202 (also for the wrong norm).

21 Nash’ modification of Newton’s method

Now that we have seen several small variants of the method to obtain con-vergence for Newton’s method, we consider the problem of solving f(u) = 0in B ⊂ X in the case that f : B → Z and L(u) : Z → Y with X, Y andZ different Banach spaces that we assume to belong to a family of spacesdenoted by Ck, which we think of as function spaces. Here k denotes thenumber of possibly fractional derivatives that elements u ∈ Ck have. Thinkof k for X, l for Z and m for Y . The goal is to have conditions that guaranteethe existence of a solution to f(u) = 0 with k-norm smaller than 1, providedf(0) has a norm bounded by some power of M , where M is a universal boundfor all constants related to the derivatives of f .

Both [KP] and Schwartz require a very strong norm of f(0) to be bounded,but the treatment below will show that a bound on the l-norm suffices. Itshould be noted that [KP] more or less copied from Schwartz with someadditional details explained. Both formulate a statement for the case thatk > l, but give a not completely correct proof for the case that k = l >m (without mentioning the difference). The main additional assumptionis a natural affine bound for ||L(u)f(u)||m in terms of ||u||k, for m and ksufficiently large and k − m = k −m. The ratio

N =k − kk −m

(1)

measures the required higher regularity of the Newton map for the modifiedscheme described below to still do the job.

Below the norms u→ ||u||k on Ck are assumed to be monotone increasingin k and we assume that there are linear so-called smoothing operators S(t)parametrized by t ≥ 1 that satisfy

||S(t)u||k ≤ Kkltk−l||u||l and ||(I − S(t))u||l ≤

Kkl

tk−l||u||k (2)

430

Page 431: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

for all k > l in a sufficiently large range as needed in the particular imple-mentation of the modified Newton method presented next. Thus S(t) mapsC l to Ck, with an estimate for the ratio between the norms that grows worseas S(t) approaches the identity I for t→∞, when I is considered as the em-bedding I : Ck → C l. It is convenient to write the norms of S(t) and I−S(t)with subscripts indicating the norms used for u, S(t)u and (I−S(t))u. Thus(2) says that

||S(t)||kl ≤ Kkltk−l and ||(I − S(t))||lk ≤

Kkl

tk−l. (3)

Besides (3) we assume (now also) a bound M lk1 on ||f ′(u)||lk and, as before,

bounds M lk2 on ||f ′′(u)||lk and Cml on ||L(u)||ml for ||u||k ≤ 1.

21.1 The modified scheme

The idea of Nash was to modify Newton’s scheme into

un = un−1 − S(tn−1)L(un−1)f(un−1), (4)

with a suitable choice of tn → ∞ as n → ∞. In (4) the new factor Sn−1 =S(tn−1) maps L(un−1)f(un−1) back to (the strict subset of smooth functionsof) the original domain of f . This comes with a cost which is estimated usingthe norm of the smoothing operator Sn−1 in the chain

un−1 ∈ X = Ck f−→ Z = C l L(un−1)−−−−→ Y = Cm Sn−1−−−→ un ∈ X = Ck.

Before we do so let’s examine how (4) is modified when combined with (4).We have

f(un) = f(un−1) + f ′(un−1)(un − un−1)︸ ︷︷ ︸vanishes with (10)

+Qf (un−1, un)

= f ′(un−1)(I − Sn−1)L(un−1)f(un−1)︸ ︷︷ ︸because of (4)

+Qf (un−1, un),

so that, withpn = ||un − un−1||k and qn = ||f(un)||l,

the estimate

qn ≤M lk1 ||I − Sn−1||km||L(un−1)f(un−1)||m︸ ︷︷ ︸

new error like term

+1

2M lk

2 p2n (5)

holds.

431

Page 432: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

21.2 The new error term

The third factor in the error like term in (5) will have to be controled usingsome assumption on the map

u→ L(u)f(u)

which was not needed in the case of (10) and that should guarantee thatquadratic term in (5) will still allow us to establish a conclusion like (15).Clearly this is impossible if m ≤ k because we can only make ||I − Sn||kmsmall if k < m. Nash’ solution was to replace m by a (much) larger m andassume an otherwise natural affine estimate of the form

||L(u)f(u)||m ≤ Amk(1 + ||u||k) (6)

withk − m = k −m,

which requires an additional estimate for

rn = 1 + ||un||k (7)

to be used in combination with

qn ≤M lk1 ||I − Sn−1||km︸ ︷︷ ︸

controled by (3)

rn−1 +1

2M lk

2 p2n (8)

and the estimate for pn. Via (4) the latter now reads

pn ≤ ||Sn−1||kmCmlqn−1 (9)

because ||L(un−1)f(un−1)||m ≤ Cmlqn−1.The additional estimate needed for rn also follows from (4). In view of

||un − un−1||k ≤ ||Sn−1||km||L(un−1f(un−1)||m ≤ ||Sn−1||kmAmk(1 + ||un−1||k)

we have

1 ≤ rn ≤ 1 + Amk

n∑j=1

||Sj−1||kmrj−1. (10)

The “error”terms accumulate but can be kept under control as we shall seebelow.

The system of inequalities (9,8,10) and initial inequalities for q0, r0 = 1and r1 allows again estimates of the form (20), provided k − k = m − m

432

Page 433: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

is sufficiently large in terms of (1). The idea is to get the first term in (8)controled by the right hand side of

p2n ≤ e−2γλn

in the induction argument, so that the norm ||Sn||km in (9) can be chosennot to large so as still to have (20) with n if it already holds with n− 1. Todo so we need a control on ||Sn−1||km of the same form and this is establishedby setting

tn−1 = eβλn−1

(11)

with β > 0 to be chosen in terms of γ. Note that this gives λn in theexponents of the exponential bounds for Sn and I − Sn.

Here we choose to keep λ as a parameter in a range as large as possible, likewe did in the analysis of (10). Clearly we can only complete the argument ifwe also specify a bound on rn to be established in the course of the argument,and this bound has to be of the same form as the bound chosen for Sn. Thuswe look for a proof that

pn ≤ e−γλn

and rn ≤ eδλn

(12)

with δ > 0. We note that the proof presented in [KP] the choice δ = γ andλ = 3

2dates back to Schwartz’s lecture notes. As we shall see below this is

not quite the optimal choice.

21.3 The system of inequalities

With (11) we have the system of inequalities

pn ≤ Kkme(k−m)βλn−1

Cmlqn−1; (13)

qn ≤M lk1 K

kme(k−m)βλn−1

Amk rn−1︸︷︷︸≤eδλn−1

+1

2M lk

2 p2n︸︷︷︸

≤e−2γλn

; (14)

1 ≤ rn ≤ 1 + AmkKkm︸ ︷︷ ︸µ3

n∑j=1

e(k−m)βλj−1

rj−1︸︷︷︸≤eδλj−1

, (15)

and we aim for a proof of (12) via induction, using the underbraced estimatesin the three inequalities above as induction hypothesis. In (14) the estimateof the first term is controled by the estimate of the second term if

e(k−m)βλn−1

eδλn−1 ≤ e−2γλn ,

433

Page 434: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

requiring(m− k)β ≥ δ + 2γλ, (16)

which says that in the λ, β-plane we must be above a line that comes downas m is increased.

Combining the first two inequalities we arrive at

pn ≤ e(k−m)βλn−1

(µ1e(k−m)βλn−2

rn−2 + µ2p2n−1) rn ≤ 1 + µ3

n−1∑j=0

e(k−m)βλjrj,

(17)the constants µ123 given by

µ1 = KkmCml︸ ︷︷ ︸C

M lk1 KkmAmk︸ ︷︷ ︸

A

, µ2 =1

2KkmCml︸ ︷︷ ︸

C

M lk2 , µ3 = KkmAmk︸ ︷︷ ︸

A

. (18)

21.4 Estimating the increments

Under the assumption that (16) holds, the induction hypotheses for pn−1 andrn−2 produce the desired inequality for pn from (17) if

(µ1 + µ2)e(k−m)βλn−1

e−2γλn−1 ≤ e−γλn

.

Thus we must have

ln(µ1 + µ2) ≤ −(k −m)βλn−1 + 2γλn−1 − γλn

for all n ≥ 2. As in the case of the standard Newton scheme, this leads to

ln(µ1 + µ2) ≤ λ(γ(2− λ)− (k −m)β) with (k −m)β ≤ γ(2− λ), (19)

a sharp upper bound for β that we need to stay away from if we don’t wantto impose that µ1 + µ2 ≤ 1.

As sufficient condition for

∞∑n=1

pn < 1

we can use the optimal condition found using Bernoulli’s inequality, namely

λγ(2− λ) ≤ ln(eγλ − 1). (20)

434

Page 435: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

21.5 Estimating the error terms

For the inductive construction of the upper bound for rn we set

b = (k − m)β = (k −m)β > 0 (21)

and conclude from the inequality in (17) that (shifting the index)

rn ≤ 1 + µ3

n−1∑j=0

ebλj

rj ≤ 1 + µ3

n−1∑j=0

ebλj

eδλj

in view of the induction assumption for (all) smaller n. Thus we need theinequality

1 + µ3

n−1∑j=0

e(b+δ)λj ≤ eδλn

(22)

for all n ≥ 2. Recall that we start with r0 = 1 ≤ eδ and

1 ≤ r1 ≤ eδλ (and also p1 ≤ eγλ of course) (23)

via a smallness assumptions on q0 still to be discussed.Dividing by the right hand side, (22) is equivalent to

e−δλn

+ µ3(e(b+δ−δλ)λn−1

+ e−δλnn−2∑j=0

e(b+δ)λj) ≤ 1 (24)

in which we have separated the probably dominant term with j = n−1 fromthe sum. Neglecting the sum in (24) a sufficient (and in any case necessary)condition for the induction step to work for all n ≥ 2 would be that

lnµ3 + (b+ δ − δλ)λn−1 ≤ 0 with b ≤ δ(λ− 1), (25)

so that in particular we now need to impose two inequalities on b, namely

b < δ(λ− 1) and b < γ(2− λ), (26)

the latter being the (strict) inequality from (19).These two bounds severely restrict the bound in (16), which in terms of

b becomesm− kk −m

b ≥ δ + 2γλ, (27)

435

Page 436: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

and this does not really depend on how we turn the necessary condition (25)into a sufficient condition, which we do next, rewriting it as

e−δλn

+ µ3(e(b+δ−δλ)λn−1

+n−2∑j=0

e(b+δ−δλn−j)λj) ≤ 1.

In view of (26) and using Bernoulli’s inequality (31) the left hand side issmaller than

e−δλ2

+ µ3(e(b+δ−δλ)λ +n−2∑j=0

e(b+δ−δλ2)λj) <

e−δλ2

+ µ3(e(b+δ−δλ)λ +∞∑j=0

e(b+δ−δλ2)(1+j(λ−1))) <

e−δλ2

+ µ3(e(b+δ−δλ)λ +eb+δ−δλ

2

1− e(λ−1)(b+δ−δλ2)),

in which we used that b+ δ − δλ2 < b+ δ − δλ < 0. Thus we arrive at

e−δλ2

+ µ3e(b+δ−δλ)λ(1 +

e−(b+δ)(λ−1)

1− e(λ−1)(b+δ−δλ2)) ≤ 1 (28)

Note that the first term on the right hand side of (31) is essential here.Without this first term the numerator, which is the first term (j = 0) in thegeometric series, would be 1 and we be stuck, as there would be no way toget a statement without an a priori bound on µ3. We note that in [KP] theproof is without the 1 in (31) but an accidental mistake of computing theseries with j = 1 as the first term “allows” to conclude. Technically speakingthat proof is incorrect1.

The quickest way to finish is to estimate the sum of the geometric seriesby a fixed constant, rewriting it as

e−s

1− es−S=

eS

es(eS − es)

withs = (b+ δ)(λ− 1) ≤ δλ(λ− 1) = s0 < S = δλ2(λ− 1).

Provided2es0 ≤ eS or ln 2 ≤ δλ(λ− 1)2,

1 And it is not a proof of the theorem actually stated.

436

Page 437: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

this expression is monotone decreasing in s on [0, s0] and thus

e−(b+δ)(λ−1)

1− e(λ−1)(b+δ−δλ2)≤ 1

1− e−δ(λ−1)λ2 ≤ 2.

We conclude that

e−δλ2

+ 3µ3e(b+δ−δλ)λ ≤ 1 suffices if ln 2 ≤ δλ(λ− 1)2, (29)

and the first inequality in (29) certainly holds if it holds with the first expo-nential replaced by the larger second exponential. Thus we arrive at

ln(1 + 3µ3) ≤ λ(δ(λ− 1)− b) and ln 2 ≤ δλ(λ− 1)2 (30)

as the final condition needed.

21.6 Sufficient conditions for a convergence result

Summing up, with the condition on q0 still to be imposed we arrive at

λγ(2− λ) ≤ ln(eγλ − 1), (31)

ln 2 ≤ δλ(λ− 1)2, (32)

(m− k)β ≥ δ + 2γλ, (33)

(k −m)β < γ(2− λ) and (k − m)β < δ(λ− 1) (34)

as conditions on the parameters that we still have to choose.The first inequality, (31), is to have the sum of the increments, and the-

reby the solution, bounded by 1 in the l-norm. Of course it can be replacedby just asking that

∞∑n=1

e−γλn ≤ 1.

The second, (32), was a technical condition to bound the sum of the geometricseries in (28) by 2. The third, (33), allows to bound the error term in estimate(14) for qn by the bound on p2

n that has to be established. It involves thechoice of sufficiently large m and k with k − m = k −m.

437

Page 438: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

The last two conditions are strict inequalities that have be chosen suffi-ciently strict depending on the constants related to f , to allow for an induc-tive proof of the desired estimates (12) for pn and rn. Thus, given µ1, µ2, µ3,we need to choose 1 < λ < 2 and γ, β, δ > 0 such that

λ(γ(2− λ)− (m− k)β) ≥ ln(µ1 + µ2); (35)

λ(δ(λ− 1)− (m− k)β) ≥ ln(1 + 3µ3). (36)

After a simultaneous rescaling of γ, β, δ, this is always possible once the first5 conditions are satisfied. The inequalities in (34) being strict is essential forconvergence of Nash’ modified Newton scheme.

Of course we still have to formulate the necessary sufficient bound onq0 = ||f(0)||l, given the constants in (18) and the choice of parameters above.Recall that

µ1 + µ2 = KkmCml︸ ︷︷ ︸C

(M lk1 KkmAmk︸ ︷︷ ︸

A

+1

2M lk

2 ) = C(M1A+1

2M2)

andµ3 = KkmAmk = A,

with C,M1,M2, A, A constants related to f and the smoothing operators.From here on we drop the superscripts from the bounds M1 and M2 on thefirst and second derivative of f : Ck → C l.

21.7 Sufficient convergence condition on initial value

Finally we examine the initial inequalities we need. For p1 we need, sinceu0 = 0, that

p1 = ||u1||k = ||S0||km||L(0)||ml||f(0)||l ≤ e(k−m)βKkmCml︸ ︷︷ ︸C

||f(0)||l ≤ e−γλ,

while via

||u1||k ≤ ||S(0)||km||L(0)||ml||f(0)||l ≤ Kkme(k−m)βCml||f(0)||l ≤ eδλ

we need1 +KkmCml︸ ︷︷ ︸

C

e(k−m)β||f(0)||l ≤ eδλ

for r1. Thus

Cq0 ≤ e−(k−m)βe−γλ and Cq0 ≤ e−(k−m)β(eδλ − 1) (37)

438

Page 439: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

are sufficient conditions onq0 = ||f(0||l

to have a solution of f(u) = 0 with ||u||k < 1, once the parameters havebeen chosen according to Section 21.6 to make the induction steps work inthe proof of the desired estimates (12) for pn and rn.

21.8 The optimal choice of parameters

At this point we compare (35) and (36) to (23). The strict inequalities in(34) are really strict in the sense that the gaps have to be taken sufficientlylarge large given the explicit constants related to f and S(t). The other twoinequalities are not strict. Recalling that k −m = k − m, the coefficient

m− kk −m

=m−mk −m

− 1 =m−mk − m

− 1 =k − kk −m

− 1 = N − 1 (38)

has to be sufficiently large for the set of allowable b, as defined by (21), tobe nonempty. Note that in Nash’ strategy to get around the ill-posednessof Newton’s method, (1) is the natural definition of N as the ratio of therequired increase of smoothness by k− k to the loss of smoothness by m− kin u→ L(u)f(u) .

The minimal largeness condition on N is obtained by taking the righthand sides of the inequalities in (34) equal to one another, so as to maximizethe allowable upper bound for β. Thus we choose 1 < λ < 2 such that

γ(2− λ) = δ(λ− 1) whence λ =2γ + δ

γ + δ(39)

and (33,34) become

4γ2 + 3γδ + δ2

γ + δ≤ (N − 1)b < (N − 1)

γδ

γ + δ(40)

forb = (k −m)β = (k − m)β

in terms of γ, δ,N , subject to (31,32) which reduce to

e2γ+δγ+δ

δγ+δ + 1 ≤ eγ

2γ+δγ+δ and ln 2 ≤ δ

2γ + δ

γ + δ

γ + δ

)2

. (41)

In particular (40) requires

N >4γ

δ+ 4 +

δ

γ≥ 8, (42)

439

Page 440: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

the minimum 8 being realised by

δ = 2γ. (43)

The further choice of parameters depends on the constants which are asindicated in (18), at the end of Section 21.6 and in (37):

C = KkmCml; C = KkmCml; A = KkmAmk; A = KkmAmk; (44)

µ1 + µ2 = C(M1A+1

2M2); µ3 = A. (45)

We collect these constants in one single constant Θ as

Θ =3

4max(lnC + ln(M1A+

1

2M2), ln(1 + 3A)) (46)

and, depending on N , the remaining parameters γ, b have to be chosen tocontrol these constants via

Θ ≤ 2γ

3− b (47)

and

14γ

3≤ (N − 1)b <

3(N − 1), e

89 + 1 ≤ e

4γ3 , ln 2 ≤ 8γ

27, (48)

which is (40,41) with δ = 2γ. The last inequality now implies the one prece-ding it.

For the initial condition q0 we arrive via (39) at

Cq0 ≤ e−γ2γ+δγ+δ e−b and Cq0 ≤ (eδ

2γ+δγ+δ − 1)e−(k−m)β =

(eδ2γ+δγ+δ − 1)e−(k−m)βe−(m−m)β = (eδ

2γ+δγ+δ − 1)e−(N+1)b,

so that with δ = 2γ the conditions on q0 reduce to

Cq0 ≤ e−4γ3 e−b and Cq0 ≤ (e

8γ3 − 1)e−(N+1)b. (49)

Setting

ρ =2γ

3

we arrive at

Θ ≤ ρ− b, 7ρ ≤ (N − 1)b, ρ ≥ 9

4ln 2,

lnC + ln q0 ≤ −2ρ− b, ln C + ln q0 ≤ ln 80− (N + 1)b,

440

Page 441: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

as sufficient conditions. Note that we have used the lower bound for ρ torelax the bound on Cq0.

Choosing

N > 8 and ρ =N − 1

7b

and using the last lower bound for ρ we arrive at

b ≥ max(63

4

ln 2

N − 1,

N − 8) and q0 ≤ min(

1

Ce−

2N+57N

b,80

Ce−(N−1)b) (50)

as sufficient conditions, to be used as: given Θ choose N > 8 and b = (k−m)βsufficiently large to make the condition on q0 follow and thereby obtain asolution of f(u) = 0 with ||u||k < 1.

21.9 Continuity

Given the constants related to f and the smoothing operators we constructeda solution in the open unit k-ball, that is, with ||u||k < 1. We did notprove or state that the solution is unique, but it is well defined as the limitof an explicitly constructed sequence shown to be convergent if ||f(0)||k issufficiently small. The following issue relates to the continuity of the inversefunction of f , if it were to exist, since we should naturally also ask for acondition ||f(0)||k guaranteeing the constructed solution to have ||u||k ≤ ε.This only changes the condition on the sum of the increments and leads to

γλ(2− λ) ≤ ln(eγλ − 1

ε)

leading to

Θ ≤ 2γ

3− b, 14γ

3≤ (N − 1)b <

3(N − 1), e

89 +

1

ε≤ e

4γ3 , ln 2 ≤ 8γ

27,

in stead of (47,48). The conditions on γ rewrite as

γ ≥ max(3

4ln(

1

ε+ e

89 ), 2

278 ) ∼ ε−

34

as ε → 0. This forces a larger choice of b and thereby via (49) a smaller(exponentially small in terms of ε in fact) bound on q0 for the Nash schemeto converge within the ball of k-radius ε, as was to be expected of course.The fact that the limit u is a solution of f(u) = 0 is immediate from (14).

Note that for the standard Newton method the constructed solution off(u) = 0 will have ||u|| < ε if we take equalities in (30) and replace the −1by −1

ε. The upper bound P than has to be replaced by Pε = ε

1+µεand the

condition on q0 becomes q0 ≤ CPε.

441

Page 442: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

22 The Nash embedding theorem

The Schwartz’s lecture notes contain a nice but nonconstructive argumentto apply the above together with convexity arguments and the Hahn-BanachTheorem to prove that the n-dimensional torus with any nonstandard Rie-mannian metric embeds in some IRN . To be explained here. See Chapter 19.Requires a deeper discussion of the smoothing operators used in the proof ofTheroem 17.5 and the Fouriertransfrom.

442

Page 443: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

23 From Fourier series to integral

I slightly modify the presentation in 7.1 of Olver. Let f = f(x) be definedon the real line, smooth and f(x) = 0 for |x| ≥ l. Then the (uniformlyconvergent) Fourier series of f on the interval [−l, l] is obtained via scaling:

F (y) = f(x),x

l=y

π.

We have

f(x) = F (y) =∞∑

n=−∞

1

∫ π

−πF (η)e−inηdη einy

=1√2π

∞∑n=−∞

π

l

1√2π

∫ l

−lf(ξ)e−i

nπlξdξ︸ ︷︷ ︸

f(nπl

)=f(kn)

einπlx.

Setkn = n∆k, ∆k =

π

l,

and define

f(k) =1√2π

∫ ∞−∞

f(x)e−ikxdx,

then

f(x) =1√2π

∞∑n=−∞

f(kn)eiknx ∆k.

In other words, f(x) is equal to a uniformly convergent sum, which actuallyis a Riemann sum for

1√2π

∫ ∞−∞

f(k)eikxdk,

and likewise ∫ ∞−∞|f(x)|2dx =

∫ l

−l|f(x)|2dx =

∞∑n=−∞

|f(kn)|2 ∆k,

which is a Riemann sum for ∫ ∞−∞|f(k)|2dk.

Note that these identities remain valid if we increase l. In particular bothRiemann sums are independent of ∆k in the limit ∆k → 0.

443

Page 444: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Can we conclude that both f(x) and∫|f(x)|2 are also equal to the in-

tegrals themselves? The answer will be yes if f(k) is continuous and decayssufficiently fast as |k| → ∞, to make the tails of both integrals and Riemannsums small. Then we can restrict the convergence argument to integrals andRiemann sums on bounded k-intervals. Since

f(k) =1√2π

∫ ∞−∞

f(x)e−ikxdx =

1√2π

([f(x)

e−ikx

−ik

]∞−∞−∫ ∞−∞

f ′(x)e−ikx

−ikdx

)=f ′(k)

ik=f (m)(k)

(ik)m

and|f (m)(k)| ≤ 2l max

−l≤x≤l|f (m)(x)|,

we can conclude that indeed

f(x) =1√2π

∫ ∞−∞

f(k)eikxdk,

∫ ∞−∞|f(x)|2dx =

∫ ∞−∞|f(k)|2dk

for all f in C∞c , the class of smooth compactly supported functions.Denoting the class of measurable complex valued functions f with boun-

ded∫|f(x)|dx by L1 and the class with bounded

∫|f(x)|2dx by L2 we have

that C∞c is dense in L2, and that the map

F : C∞c → L1 ∩ L2 ∩ C∞ ⊂ L2, F(f) = f

uniquely extends to an isometry

F : L2 → L2.

Only if f ∈ L1 ∩ L2 we can write f(k) as an absolutely convergent integral.The inverse map is the same, up to a reflection in x, that is, for f = f(k),

(F−1)f(x) = f(−x).

More to be done here from a different perspective (Folland’ s Real Analysisbook).

444

Page 445: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

24 Airy scary

I did the calculations below while reading Chapter 8 in Peter Olver’s newPDE book with a little help of E.J. Hinch’s nice little Cambridge AppliedMath textbook on perturbation methods. Just goes to show how beautiful(also applied) complex analysis is.

The Airy function is defined by

Ai(ξ) =1

∫ ∞−∞

ei(ξx+x3

3)dx,

an integral barely convergent. The Airy function plays the same role in thetheory for ut + uxxx = 0 as the Gaussian e−

12x2

for ut = uxx. Both functionsdefine the spatial profile of the fundamental solution.

Replacing ξ ∈ IR by ζ ∈ IC the Airy function is a complex analyticfunction of

ζ = ξ + iη = ρeiψ.

Replacing also x ∈ IR byz = x+ iy ∈ IC

one may deform the “real” contour C defined by z = z(t) = t with −∞ <t < ∞ to another contour γζ that connects two points at infinity. This canbe done (without changing the outcome) as long as the integrals of

ei(ζz+z3

3) = eΦ(z;ζ)

over the connecting arcs |z| = R between C and the new contour γζ go tozero as R→∞.

To answer the question

Ai(ρ)eiψ ∼ ? as ρ→∞ (for ψ fixed),

one chooses the new contour to be one along which the absolute value ofthe integrand, eRe Φ(z;ζ), is peaked and has fast decay as |z| → ∞, and alongwhich Im Φ(z; ζ) = φζ is a ζ-dependent constant, so that

Ai(ζ) =1

∫γζ

ei(ζz+z3

3 )dz =1

∫γζ

eRe Φ(z;ζ)︸ ︷︷ ︸real,positive

dz eiφζ ,

in which the integrand is real, although dz = dx + idy will typically stillmake the integral complex. The factor eiφζ contains the “stationary phase”

445

Page 446: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

φζ . If Mζ is the maximum of Re Φ(z; ζ) along γζ , realised in some z = mζ ,one may also factor out eMζ and write

Ai(ζ) =eMζ+iφζ

∫γζ

e−f0(z;ζ)dz︸ ︷︷ ︸→ ? as |ζ|→∞

,

in which f0(z; ζ) ≥ 0 along γζ . Typically f0(z; ζ) has a unique global mini-mum zero along γζ and f0(z; ζ) → +∞ as |z| → ∞ along γψ. Note thoughthat the integrand is likely to be ill-behaved as ρ = |ζ| → ∞, also becausethe contour γζ may disappear in the limit. The resolution of this latter com-plication may be prepared by scaling x before going to complex variables andmaking the optimal choice of γζ .

Thus, returning to the definition of Ai(ζ) one writes Ai(ρeiψ) =

1

∫ ∞−∞

ei(ρeiψx+x3

3 )︸ ︷︷ ︸scalex=ρ

12 u

dx =ρ

12

∫ ∞−∞

eiρ32 (eiψu+u3

3)du =

ρ12

∫ ∞−∞

eρ32 Ψ(u)du,

in which you should now view u as u = Rew with w = u + iv ∈ IC. Theeffect of this scaling is that the level lines of Im Ψ(w) are independent of ρ.

One has

Ψ(w) = i(eiψw +w3

3) = f(u, v;ψ) + ig(u, v;ψ),

with

f(u, v;ψ) = −v cosψ − u sinψ + v(−u2 +v2

3)

and

g(u, v;ψ) = u cosψ − v sinψ + u(u2

3− v2).

These harmonic functions have mutually perpendicular level curves. It isconvenient to think of the level curves of the imaginary part g(u, v;ψ) asorbits of

u =du

dt= fu =

∂f

∂u= − sinψ − 2uv

v =dv

dt= fv =

∂f

∂v= − cosψ − u2 + v2,

a system of ordinary differential equations for u = u(t) and v = v(t). In fact,Cauchy-Riemann gives

df

dt= fuu+ fvv = f 2

u + f 2v > 0 ,

dg

dt= guu+ gvv = gufu + gvfv = 0.

446

Page 447: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Figuur 1: orbits for ψ = π24

Thus the only orbits of interest as possible contours are the stable manifoldsof saddle points, with the maximum of the real part f along the contouroccurring in the saddle point.

This is illustrated for small positive ψ by Figure 1 which pictures the pos-sibly relevant level curves of g(u, v; π

24). The red curve is the stable manifold

of

mψ = (uψ, vψ) = (− sinψ

2,+ cos

ψ

2)

and asymptotes to 3v2 = u2. In particular it has u ranging from −∞ to +∞,and may be written as the graph of a function v = ϕ(u;ψ). The other stablemanifold, that of

mψ+2π = (uψ+2π, vψ+2π) = (+ sinψ

2,− cos

ψ

2),

the green curve on the right, fails this condition and has a vertical asymptote.The other branch of this level curve is the green curve on the left which isnot a stable manifold of either two saddles. Neither of these two orbits is ofdirect use in relation to the Airy function, but this will change as ψ is takenlarger. Note that although Ai(ρeiψ) is 2π-periodic in ψ, the parametrisationof the saddle point mψ is only 4π-periodic.

Deforming the contour as explained above,

Ai(ρeiψ) =ρ

12

∫ ∞−∞

eρ32 (f(u,ϕ(u;ψ);ψ)(1 + iϕ′(u;ψ))du︸ ︷︷ ︸

I(ρ,ψ)

eρ32 (− 2i

3(4 cos2 ψ

2−1) sin ψ

2),

447

Page 448: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

in which the phase factor has been made precise. It remains to examine theintegral I(ρ, ψ) in the limit ρ→∞. Clearly the most important informationcomes from the (second order) Taylor expansion

f = f(u, ϕ(u;ψ);ψ) = Mψ − a2ψ(u− uψ)2 + · · ·

with minor contributions coming from the higher order terms and the expan-sion of ϕ′(u;ψ). Setting

u = uψ + p

one sees that to leading order the asymptotic expansion of the integral mustbe given by

I(ρ, ψ) ∼ eMψρ32

∫e−a

2ψρ

32 p2︸ ︷︷ ︸

scale s=aψρ34 p

dp ∼ eMψρ32

aψρ34

∫e−s

2

ds︸ ︷︷ ︸√π

+ · · · ,

so that

Ai(ρeiψ) =1

2ρ14√π

eMψρ32

aψeρ

32 (− 2i

3(4 cos2 ψ

2−1) sin ψ

2)(1 +O(ρ−

32 ))

as ρ → ∞. Notice the exponential decay combined with the increasinglyrapid oscillations because of the phase factor.

At first sight you might expect an O(ρ−34 ) error estimate but since the

exponential function in the integrand expands as

e−s2+b3

p3

ρ34

+b4p4

ρ64

+b5p5

ρ94

+···= e−s

2

(1 + (b3p3

ρ34

+ . . . ) +1

2(b3

p3

ρ34

+ . . . )2 + · · · )

the higher order terms in the expansion of Ai(ρeiψ) involve the integrals∫sne−s

2

ds (n = 3, 4, . . . )

of which the odd ones vanish. Therefore a contribution of the first b3-termappears only in combination with the first order term in the expansion ofϕ′ψ(uψ;ψ) (the second order term in the expansion of ϕψ(uψ;ψ)). It is anexercise to make the expansion more precise.

One has

Mψ = −2

3(4 cos2 ψ

2− 3) cos

ψ

2,

448

Page 449: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

and by direct but tedious calculation the stable manifold is given by

v = ϕψ(u) = ϕψ(−s+p) =−sc+ p

√1− 4

3sp+ 1

3p2

−s+ p(c = cos

ψ

2, s = sin

ψ

2).

You should recognise a discriminant under the square root, which for thelevel curve going through the saddle has the property that it is everywherepositive, except in the saddle point mψ. Expansion gives

ϕψ(−s+ p) = c+−1 + c

sp+

1

3

2c− 1

c+ 1p2 + . . . .

For ψ = 0 one has

v = ϕ0(u) = 1 +

√1 +

1

3u2 = 1 +

1

6u2 − 1

72u4 + · · ·

and

f(u, ϕ0(u)) = −2(1 +4

9u2)

√1 +

1

3u2 = −2

3− u2 − 5

36u4 + · · · ,

so that

a0 = 1, M0 = −2

3, A0 = 0,

and

Ai(ξ) ∼ e−23ξ

32

2√πξ

14

as ξ → +∞, give or take a mistake in the constants, without oscillations.Increasing ψ there are changes as ψ crosses π

3and 2π

3. For all 0 ≤ ψ < 2π

3

it still holds that

Ai(ρeiψ) =ρ

12

∫ ∞−∞

eρ32 (f(u,ϕ(u;ψ);ψ)(1 + iϕ′(u;ψ))du eρ

32 (− 2i

3(4 cos2 ψ

2−1) sin ψ

2).

Figure 2 shows the relevant orbits for ψ = 15π24

, with the same stable manifolddefining the contour, and the same asymptotics still valid, but with a differentsign for Mψ, as Figure 3 shows. The sign change occurs at π

3. Thus for

π3< ψ < 2π

3there is exponential growth of Ai(ρeiψ) as ρ → ∞, while the

nonzero phase factor accounts for increasingly rapid oscillations.At ψ = 2π

3, when the growth is maximal (and no oscillations, see Figure

8), the diagram (and the Maple automatic colour coding) changes. All orbitsin Figure 4 are in the stable or unstable manifolds of the saddle points.

449

Page 450: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Figuur 2: orbits for ψ = 15π24

The appropriate contour now consists of 3 orbits: the 2 orbits in the stablemanifold of m 2π

3(one of which is in the unstable manifold of m 8π

3), and one

orbit in the stable manifold of m 8π3

. Can you see which one? You shouldconvince yourself that M 8π

3only enters the asymptotics beyond any relevant

order.Only as ψ is increased to ψ = π both Mπ and M3π are on par: Mπ =

M3π = 0. The phases are then φπ = 23

and φ3π = −23, and the two stable

manifolds are given by

v =(u+ 1)

√u(u− 2)

u√

3(u < 0) , v =

(u− 1)√u(u+ 2)

u√

3(u > 0).

You can now compute the expansion using both contours, with u runningfrom −∞ to 0 for the first integral and from 0 to ∞ for the second. Notethe symmetry in Figure 7.

Observe that for 2π3< ψ ≤ π the contours are different. In Figures 5

you see the red curve turning blue after the turning point, and as it escapesto infinity along the negative v-axis it is joined by the green curve which isthe stable manifold of the other saddle point. As in the case that ψ = π,the appropriate contour consists in fact of two contours: the sum of theintegrals along both stable manifolds defines Ai(ρeiψ). For ψ < π the maincontribution comes from the contour on the left. Solving a cubic equationthis contour can be written as a graph u = ϕ(v), but the main contributioncan be computed as above, still writing v = ϕ(u) near the saddle point.

A similar program works for the solution of ut + 13uxxx = 0 that starts

450

Page 451: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Figuur 3: Mψ and Mψ+2π

Figuur 4: orbits for ψ = 16π24

= 2π3

451

Page 452: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Figuur 5: orbits for ψ = 17π24

Figuur 6: orbits for ψ = 23π24

452

Page 453: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Figuur 7: orbits (stable manifolds: blue curves) for ψ = 24π24

= π

Figuur 8: Amplitude Mψ (red) and phase φψ, changes at ψ = 0, π3, 2π

3, π.

453

Page 454: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

from a “wave packet”

u0(x) = e−x2

4a eik0x,

along lines x = ct+ ξ. One then has

u(t, ct+ ξ) =1√2π

∫ ∞−∞

eik(c+ 13k2)t+iξk−a(k−k0)2

dk =1√2π

∫ ∞−∞

etΦdk.

Replace k by z = x+ iy (not the same x of course) and write

Φ = Φ(z) = Φ(z; t) = Φ(z; t, ξ, k0, a) = f + ig

with

f = −ty(c+ x2 − 1

3y2) + a(−(x− k0)2 + y2)− ξy

and

g = tx(c+1

3x2 − y2)− 2a(x− k0)y + ξx.

Then as before on may rewrite

u(t, ct+ ξ) =1√2π

∫ ∞−∞

eΦ(x;t)dx =1√2π

∫γ

eΦ(z;t)dz

in which γ consists of orbits in stable manifolds of a suitable gradient flowof f , which is defined by

x =dx

dτ=

1

t

∂f

dx= −2xy − 2a

t(x− k0),

y =dy

dτ=

1

t

∂f

dy= −c− x2 + y2 +

2ay − ξt

.

Unlike in the analysis of the Airy function integral, there is now no needto scale x and y, because in the limit t → ∞ the diagram in the x, y-planeis well defined. For c = 1 it is the same as in Figure 7 and for c = −1 itcoincides with Figure 9 (with u, v replaced by x, y). Unlike the u, v-diagramthe x, y-diagram varies with the parameter under consideration, as the roleof ρ is now played by t. One computes the relevant unstable manifold(s)directly from solving g = φ, which is a quadratic equation in y, asking thatthe discriminant

D =4

3x2(x2 + 3c)t2 + 4x(ξx− φ)t+ 4a2(x− k0)2

of this equation is positive except in the saddle point, thus first determiningsimultaneously the saddle point and the phase φ by solving

D =dD

dx= 0.

454

Page 455: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Figuur 9: u, v-plane for ψ = 0, the vertical axis also consist of orbits

The phase φ then drops out of

xdD

dx−D = t2x4 + (a2 + ξt+ ct2)x2 − k2

0a2 = 0,

which determines the square of the positive solution x = xc > 0 uniquely interms of the parameters t, c, ξ, a, the y-coordinate y = yc. The phase φc andthe value Mc of f in the saddle point (xc, yc) are then given by

yc(t) =a(k0 − xc)

xct, φc(t) = −2tx3

c

3− 2a2k0(xc − k0)

xct,

and

Mc(t) = −a(xc − k0)2 − a3(xc + 2k0)(xc − k0)2

3x3ct

2.

For the values of y, φ,M in the other saddle point replace xc by −xc. Notethat xc = xc(t) and likewise for yc, φc,Mc (the other dependencies are alsosuppressed in the notation). Observe the different behaviours as t → ∞ forc < 0 and c > 0.

At this point I found it convenient to continue the calculations for thestable manifold with xc implicitly defined by the quartic xdD

dx− D and all

other quantities explicitly in terms of xc. With

x = xc + u, y = yc + v,

the real and imaginary parts of Φ rewrite as

f = Mc + Fc, F = Fc(t) = −t(2xcuv + v(u2 − v2

3))− ak0

xc(u2 − v2),

455

Page 456: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

g = φc +Gc, G = Gc(t) = t(xc(u2 − v2) + u(

u2

3− v2))− 2ak0uv

xc,

the latter defining the stable manifold as the graph v = ϕc(u) = ϕc(u; t)obtained from solving G = 0 for v, the discriminant having the desiredbehaviour: positive except for u = 0. For c > 0 this gives a globally definedfunction and deforming contours as before it follows that

u(t, ct+ ξ) =eMc(t)+iφc(t)

√2π

∫ ∞−∞

eFc(u,ϕc(u;t);t)(1 + iϕ′c(u; t))du.

Note that c has disappeared completely from the formula’s, except for thedependence through xc.

The integral depends only on the formula’s for Fc and Gc, ϕc being definedby solving G = 0, i.e.

(xc + u)tv2 +2ak0u

xcv − tu2(xc +

u

3) = 0

and simplifying the discriminant using the quartic for xc. This gives

v = ϕc(u) =u

xc(xc + u)

(−ak0

t+ xcR

),

in which

R =

√√√√√c+ 2x2c +

ξ

t+a2

t2︸ ︷︷ ︸positive

+4xcu

3+u2

3.

The derivative appears in the integral as

ϕ′c(u) = − ak0

t(xs + u)2+u(2xc + u)

3R(xc + u),

and the exponent in the integral rewrites as

Fc(u, ϕc(u; t); t) = −2

9

tRu2 (3xc + 2u)2

(xc + u)2 +2

3

ak0u2 (3xc + 2u)

(xc + u)2

−2

3

k02a2 (Rxct− ak0)u2 (3xc + u)

t2xc3 (xc + u)3

Clearly these formula’s suggest putting

u = xcs, k0 =b

a, t = bτ, ξ = bη

456

Page 457: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

This scaling of u makes each term separate as far the integration variableand t are concerned, except for the R-terms. One now has to distinguishbetween c < 0 (the case discussed by Olver) when u(t, ct+ ξ) appears as thesum of 2 integrals involving the stable manifolds of both saddles, and c > 0,when u(t, ct+ ξ) appears as one single integral.

With xc going to√−c if c < 0, both integrals can be handled as in the

Airy case, and the final expansion will depend on c. It may be handy to splitthe exponential in 3 separate exponentials before you proceed. From the c-dependence there should be a connection with the group velocity discussionby Olver, as we see below. On the other hand, when c > 0 (this case is notdiscussed by Olver) txc goes to a constant so xc → 0. Note that all 3 termsinvolve s2, but with different signs. This is really an instructive example forunderstanding the method!

Now to back to WHY we did this analysis observe that the prefactor inthe integral expression for

u(t, ct+ ξ)

containseMc

which behaves very differently for c < 0 and c > 0.For c > 0 it is the second term in the expression for Mc(t) above that

dominates and goes to infinity because txc goes to a constant, and this leadingorder term then goes to −∞ linearly in t. Modulo the details of the analysisof the integral it follows that u(t, ct+ ξ)→ 0 exponentially fast as t→∞.

On the other hand, if c < 0 then xc →√−c and Mc(t)→ −a(

√−c−k0)2

which is maximal and equal to zero for c = −k20. Thus only for this value of c

the solution is of order one along the line x = ct+ξ as t→∞, with the moreprecise asymptotics following from a more detailed analysis of the integral, asin the Airy functions case, with contributions from both saddle points, andcombining both phases and 2

3c

32 t appearing in the imaginary part. Olver’s

point in the section about dispersion relations is that this group velocity −cis 3 times larger as you would expect from looking at the single frequencysolution with a = 0, and he did so by one single calculation starting fromthe dispersion relation. Read again what he did after the exam, and payattention to the factor 1

3in the third order equation ut + 1

3uxxx = 0 that I

solved starting from a wave packet centered at k = k0 rather than from asingle wave with k = k0.

457

Page 458: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

1. This is an exercise about applying the Fourier transform to solve theequation ut + uxxx = 0 on the real line with initial data u(0, x) = δ(x),the Dirac δ-function, and to investigate the behaviour of the solutionfor x → −∞. The Fourier transform of a function f = f(x) and theinverse transform are defined by

f(k) =1√2π

∫ ∞−∞

f(x)e−ikxdx, f(x) =1√2π

∫ ∞−∞

f(k)eikxdk,

respectively whenever f and f are sufficiently nice. The improper in-tegrals are to be understood in the principal value sense∫ ∞

−∞= lim

R→∞

∫ R

−R

and are often easiest evaluated using complex integration over approp-riate contours.

(a) Explain why δ(k) = 1√2π

.

(b) Show using integration by parts that (f ′)(k) = ikf(k).

(c) Let u be a smooth solution of ut + uxxx = 0 which decays to zero

sufficiently fast as |x| → ∞ to have (u)t = (ut). Here u = u(t, k)denotes the Fourier transform of the function x→ u(x, t). Denotethe initial value of u by u0, that is, u0(x) = u(0, x). Show that

u(t, k) = u0(k)eik3t

(d) Show that the inversion formula formally applied to the case thatu0(k) = δ(k) = 1√

2πdefines a solution formula

u(t, x) =1

(3t)13

Ai(x

(3t)13

)

in which

Ai(ξ) =1

∫ ∞−∞

ei(ξx+x3

3)dx.

(e) Use the methods above to determine the asymptotic behaviour ofAi(ξ) for ξ → −∞.

458

Page 459: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

25 Hartman-Grobman stelling

In [HM] hebben we uitgebreid gekeken naar de Methode van Newton voor hetoplossen van vergelijkingen, met als eerste voorbeeld het snel benaderen vanalgebraısche getallen, bijvoorbeeld

√2, dat een vast punt is van de afbeelding

xF−→ F (x) =

1

2(x+

2

x),

een afbeelding die ongeveer 3000 jaar oud is, en later herontdekt is via

f(x) = x2 − 2 en F (x) = x− f ′(x)−1f(x) = x− f(x)

f ′(x).

De mooie eigenschappen van het discrete dynamisch systeem gedefinieerddoor

xn = F (xn−1) (n ∈ IN)

worden deels verklaard door het feit

F ′(x) =f(x)f ′′(x)

f ′(x)2

gelijk is aan 0 in nulpunten van f(x) en

F (x) = x ⇐⇒ f(x) = 0

voor elke x met f ′(x) 6= 0. Een curieus voorbeeldje in Hoofdstuk 6 van TheBeauty of Fractals van Peitgen en Richter is

f(x) =x

1− xen F (x) = x2,

en dat is er eentje uit een curieuze familie, bijvoorbeeld

f(x) =x

(1− x)17 (1 + x+ x2 + x3 + x4 + x5 + x6 + x7)

17

en F (x) = x8,

maar dat terzijde. De afbeeldingen

x→ x2 en x→ 1

2(x+

2

x)

hebben vaste punten waar hun afgeleide 0 is en het is niet moeilijk jezelf ervante overtuigen dat dit leidt tot snelle convergentie de rij xn naar evenwicht,als je begint met x0 in de buurt van een evenwicht.

459

Page 460: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Neem je zomaar een functie F om een dynamisch systeem te maken zoalshierboven, en is F (0) = 0, dan bepaalt de afgeleide F ′(0) in het algemeen ofx = 0 een (lokaal) stabiel of onstabiel evenwicht is, zoals het voorbeeld

x→ λx

met λ ∈ IR bij inspectie meteen laat zien. Een voor de hand liggende vraagis dan of de dynamische systemen gedefinieerd door

x→ F (x) en x→ F ′(0)x

niet eigenlijk hetzelfde zijn via een conjugatie:

xφ−→ x

F ↓ ↓ F ′(0)

F (x)φ−→ F ′(0)x

Dus is er een inverteerbare afbeelding φ waarmee

F ′(0)φ(x) = φ(F (x))

voor x in een zo groot mogelijke buurt van x = 0? Als we F (x) schrijven als

F (x) = λx+ a(x)

dan is de vraag dus of we gegeven λ ∈ IR en a : IR → IR met a′(0) = 0 defunctie φ : IR→ IR kunnen vinden zodanig dat

λφ(x) = φ(λx+ a(x))

in de buurt van x = 0, en dit kunnen we proberen op te lossen door middelvan

φn(x) =φn−1(λx+ a(x))

λbeginnend met φ0(x) = x.

Als we een a nemen met a′(0) = 0 en a(x) = 0 voor |x| buiten een intervalgedefinieerd door |x| ≤ η met η wellicht nog te kiezen, dan zien we dat deonbekende functie φ voor |x| ≥ η wel gegeven moet worden door φ(x) = x.Hoewel? Is het duidelijk dat gegeven λ ∈ IR uit

λφ(x) = φ(λx)

voor alle x ∈ IR volgt dat φ(x) = x voor alle x ∈ IR? Niet meteen dus. Maarφ(x) = x doet het wel.

460

Page 461: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Terzijde, als φ differentieerbaar is volgt (als λ 6= 0) dat

φ′(x) = φ′(λx)

voor alle x ∈ IR, en daarmee zijn heel veel φ′ waarden gelijk aan elkaar, tenzij|λ| = 1. Als φ′ continu is in 0 moet wel te bewijzen zijn dat φ′(x) = φ′(0)voor alle x. En φ′(0) = 1 ligt voor de hand als normaliserende voorwaarde.

Of we voor voor a(x) 6≡ 0 zo’n differentieerbare φ wel maken is echter zeerde vraag. In het iteratieproces helpt de λ in de noemer wellicht als |λ| > 1 is.Weer terzijde, het voorbeeld met a(x) = x2 laat zien dat zonder de aannamedat a(x) ≡ 0 voor |x| groot er weinig hoop is, want we krijgen

φ1(x) = x+x2

λ,

φ2(x) = x+

(1

λ+ 1

)x2 +

2x3

λ+x4

λ2,

φ3(x) = x+

(1

λ+ 1 + λ

)x2 +

(2

λ+ 2 + 2λ

)x3 +

(1

λ2+

1

λ+ 6 + λ

)x4

+

(6

λ+ 4

)x5 +

(2

λ2+

6

λ

)x6 +

4x7

λ2+x8

λ3,

φ4(x) = x+

(1

λ+ 1 + λ+ λ2

)x2 +

(2

λ+ 2 + 4λ+ 2λ2 + 2λ3

)x3

+

(1

λ2+

1

λ+ 7 + 7λ+ 6λ3 + λ4 + 7λ2

)x4 + · · ·+ x16

λ4,

enzovoorts.De Stelling van Hartman Grobman gaat in het simpelste geval om de

vraag of voor de afbeelding

(x, y)F−→ (ξ, η) = (λx+ a(x, y), µy + b(x, y))

het stelselλφ(x, y) = φ(λx+ a(x, y), µy + b(x, y))

µψ(x, y) = ψ(λx+ a(x, y), µy + b(x, y))

kunnen oplossen naar de functies φ, ψ onder de aanname dat

0 < |µ| < 1 < |λ|,

teneinde de afbeelding F te conjugeren met de afbeelding

(x, y)→ (ξ, η) = (λx, µy).

461

Page 462: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Dit zijn twee vergelijkingen, in de eerste is de onbekende de functie φ,in de tweede de functie ψ. Die voor φ lijkt op de vergelijking waarmee webegonnen en waarvoor de geschetste aanpak kans van slagen heeft als |λ| > 1.De aannamen op a(x, y) en b(x, y) zijn nu zoals die op a(x) hierboven, dus

ax(0, 0) = ay(0, 0) = bx(0, 0) = by(0, 0) = 0,

en a(x, y) en b(x, y) tenminste continu differentieerbaar. Met die conditie ishet stelsel

ξ = λx+ a(x, y)

η = µy + b(x, y)

in de buurt van (0, 0) op te lossen naar x, y in de vorm

x =1

λξ + α(ξ, η)

y =1

µη + β(ξ, η)

met α(ξ, η) en β(ξ, η) continu differentieerbaar in de buurt van (0, 0) en

αξ(0, 0) = αη(0, 0) = βξ(0, 0) = βη(0, 0) = 0.

De eerste vergelijking houden we zoals die was, de tweede schrijven we inξ, η. Beide vergelijkingen hebben dan dezelfde vorm:

φ(x, y) =1

λφ(λx+ a(x, y), µy + b(x, y))

ψ(ξ, η) = µψ(1

λξ + α(ξ, η),

1

µη + β(ξ, η))

Om deze vergelijkingen op te lossen moeten we dus eerst weten hoe we deeerdere vergelijking voor φ : IR→ IR oplossen.

Als |a(x)| ≤ ε|x| dan volgt

|φ1(x)− φ0(x)| = |1λ

(λx+ a(x))− x| = |a(x)

λ| ≤ ε

λ|x|,

en dan

|φ2(x)− φ1(x)| = |1λφ1(λx+ a(x))− 1

λφ0(λx+ a(x))|

≤ ε

|λ|2|λx+ a(x)| ≤ ε(|λ|+ ε)

|λ|2|x|,

462

Page 463: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

waarna

|φ3(x)− φ2(x)| = |1λφ2(λx+ a(x))− 1

λφ1(λx+ a(x))|

≤ ε(|λ|+ ε)

|λ|3|λx+ a(x)| ≤ ε(|λ|+ ε)2

|λ|3|x|.

Zo wordt duidelijk dat

|φn(x)− φn−1(x)| ≤ ε(λ+ ε)n−1

|λ|n|x|,

niet genoeg om de rij φn(x) convergent te krijgen, maar als ook geldt data(x) = 0 voor |x| ≥ η dan kunnen we met 0 < δ < 1 de schattingen aanpassenals

|φ1(x)− φ0(x)| ≤ ε

|λ|η1−δ|x|δ,

|φ2(x)− φ1(x)| ≤ ε

|λ|2η1−δ|λx+ a(x)|δ ≤ ε

|λ|2η1−δ(|λ|+ ε)|x|δ,

en dan wordt duidelijk dat

|φn(x)− φn−1(x)| ≤ εη1−δ (|λ|+ ε)δ(n−1)

|λ|n|x|δ.

Uniforme convergentie volgt als

(|λ|+ ε)δ < |λ|.

463

Page 464: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

26 Welke horizon?

Kijk eens naar dit filmpje:

https://www.youtube.com/watch?v=0l9hrFHNw3Q#t=133

De formule van Pythagoras wordt toegepast op een rechthoekige driehoekmet schuine zijde R + l, lange zijde R en korte zijde z. Ik heb van de r eenR gemaakt, omdat R GROOT is ten opzichte van z en l. En z is weer grootten opzichte van l. Dat schrijven we zo

R >> z >> l,

met dubbele>> symbolen (die vaak een minder precies omschreven betekenishebben dan de enkele symbolen, maar dat terzijde). Deze orde van groottebeschouwingen, die essentieel zijn voor de modelvorming en uitwerking blij-ven achterwege in het filmpje, net als de uitwerking zelf. De uiteindelijkevergelijking is

R2 + z2 = (R + l)2,

met de lengte z van de zichtlijn als de onbekende. De straal R van deaarde en de ooghoogte l van het poppetje zijn als gegeven of op te zoeken tebeschouwen.

Zoals gezegd, de uitwerking blijft achterwege. Wel wordt een samenvat-ting gegeven: eerst de straal R van de aarde opzoeken en dan wat algebraıschemanipulaties. Dat moet natuurlijk precies andersom, eerst de formule uit-werken en daarna de getallen invoeren als dat zin heeft of nodig is. Als werechts het kwadraat uitwerken dan krijgen we

R2 + z2 = R2 + 2Rl + l2,

en gaat het verder met eenvoudige letteralgebra. We strepen links en rechtsde gigantisch grote R2 weg en houden een formule over die niet direct inverband gebracht kan worden met een meetkundige figuur, maar daaromniet minder is:

z2 = 2Rl + l2.

Is verder rekenen nu nodig? Ik zou zeggen nauwelijks. Rechts staan tweetermen waarvan de eerste VEEL groter is dan de tweede, dus het kan nietanders dan dat bij benadering z de wortel uit 2Rl is. NU PAS is het momentdaar om getallen in te vullen. Uit mijn hoofd is R ongeveer (en meer dan)6 duizend kilometer en voor Jos is l ongeveer 2 meter. De dominante termrechts is dus ongeveer 2 keer 6 duizend kilometer keer 2 meter, en dat is 24

464

Page 465: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

miljoen meter kwadraat, waarbij het vast handig is om van die 24 maar 25te maken. Dan hebben 3 kwadraten op een rijtje in dit product en zien wedat z ongeveer 5 kilometer is. Nu, dat is te lopen.

In mijn tweeslagmodel kijken we nog even terug en wat preciezer. Dieeenheden zijn misschien wat verwarrend maar ook in de laatste vergelijkingzijn alle termen het product van twee lengten. De grootste daarvan is Ren die kun je op 1 zetten door als fysische eenheid van lengte de EU tenemen, de zogenaamde Earth Unit. Als je dat meteen al gedaan had danwas de vergelijking voor z dus z2 = 2l + l2 geweest, met z en l in EU . Eenbeetje gevaarlijke formule die makkelijk een eigen leven gaat leiden waarbijde eenheden vergeten worden. Zelf geef ik er in dit voorbeeld nu de voorkeuraan om pas te schalen bij het uitwerken van de vergelijking voor z, maar datis misschien een kwestie van smaak.

Omdat alles net zo positief als dit commentaar zelve kunnen we links enrechts de wortel nemen. Factorizerend komen we dan uit op

z =√

2Rl + l2 =√

2Rl

√1 +

l

2R.

De laatste stap is essentieel. Hier pas wordt echt duidelijk hoe volstrektverwaarloosbaar de dimensieloze tweede term onder de tweede wortel is. Alswe links en rechts door R delen zien we dat

z

R=

√2l

R

√1 +

l

2R,

een formule waarin zowel z als l met R geschaald zijn. Noemen we de ge-schaalde grootheden ζ en λ, dan is

ζ =√

√1 +

1

De vervolgvraag die betrekking op het (hoeveel) groter zijn van z bij groterel heeft weinig te maken met logisch redeneren en wiskundige denkactiviteitenmaar des te meer met het verontachtzaamde rekenen en de algebra van deformules. For all practical purposes is de tweede wortel niet te onderscheidenvan 1. Maken we l (en dus λ) vier keer zo klein dan zien we dat papa Josmaar twee keer zo ver kijkt als de dreumes die naast hem staat. Dat haddenwe natuurlijk al gezien aan de eerste benadering waarin z als ongeveer

√2Rl

tevoorschijn kwam.Hier ligt natuurlijk een leuk opstapje voor echte calculus met reeksont-

wikkelingen. Het belang bijvoorbeeld van het binomium van Newton

(1 + x)α = 1 + αx+α(α− 1)

2x2 +

α(α− 1)(α− 2)

3 · 2x3 + · · ·

465

Page 466: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

met α niet per se geheel en positief en |x| < 1. Voor α = 12

geeft afkappen natwee termen een methode om de wortel uit 1 plus een klein beetje de bepalendie ten behoeve van de benadering van

√2 al 2000 jaar B.C. werd gebruikt

getuige1 kleitablet YBC7289: de ontwikkeling

ζ = 212λ

12 + 2−

32λ

32 + · · ·

is met de hand goed te doen en laat bij invullen van getallen zien hoe kleinde fout is in de eerste benadering hierboven.

1 Zo leerde ik uit het boek van Eves over de geschiedenis van de wiskunde.

466

Page 467: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

27 Welke fundamenten?

Deze oude inleiding was bedoeld voor een breed publiek. De eerstejaarswiskunde student kan voor de lol lezen wat ik hier schrijf. Ik begin met deverzameling IR van de reele getallen en aftelbare sommen van die getallen.Als het onderstaande goed leesbaar is dan kun je rustig op weg met wat erverder komt in dit boek. Zo niet, dan zou het groene boekje met RonaldMeester1 je wat op weg kunnen helpen. In dat boekje, dat vanaf nu [HM]heet, kwamen we vanuit getallenrepresentaties als

1

3=

3

10+

3

100+

3

1000+

3

10000+

3

100000+ · · · =

∞∑n=1

3

10n= 3

∞∑n=1

1

10n

op natuurlijke wijze tot het inzicht dat ieder (reeel) getal van de vorm

k +∞∑n=1

dn10n

(1)

is. In (1) is k ∈ IZ, de verzameling van de gehele getallen. De decimalen zijn

dn ∈ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9

waarbij n de verzameling IN van de positieve2 gehele getallen doorloopt, ookwel de natuurlijke getallen genoemd.

De verschillende notaties hierboven voor het rationale getal dan wel debreuk 1

3kunnen tot enige controverse leiden. De breuk 1

3heeft immers net als

iedere andere breuk een teller en een noemer, in dit geval teller 1 en noemer3. Evenzo heeft de breuk 2

6teller 2 en noemer 6. De breuken 1

3en 2

6zijn

echter als rationale getallen gelijk aan elkaar. Mag je nu van het rationalegetal 1

3zeggen dat zijn teller 1 en zijn noemer 3 is? Van mij wel, maar daar

wordt soms anders over gedacht. Dus daarom hierbij de afspraak dat westilzwijgend het rationale getal altijd als breuk met een minimale noemer3 inIN schrijven als we het over teller en noemer van het rationale getal hebben.

Ook de naam “reeks” voor de uitdrukking met het somteken Σ leidt totcontroverses, alsmede het gebruik van het symbool∞ boven op dat somteken.Wat het eerste betreft zou ik liever zoveel mogelijk over aftelbare sommenwillen spreken, maar niet te vergeten dat de term “reeks” nu eenmaal dooriedereen gebruikt wordt in zinsdelen als “de som van de reeks”.

1 vuuniversitypress.com/15-voor-auteurs/overige-content/108-wiskunde-in-je-vingers2 NB, 0 is niet positief, IN = n ∈ IZ : n > 0, IR+ = x ∈ IR : x > 0.3 Ontbind teller en noemer in priemfactoren en streep gemeenschappelijke factoren weg.

467

Page 468: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Het gebruik van het symbool ∞ is wellicht te vermijden door

∑n∈IN

in plaats van∞∑n=1

te schrijven, maar dan is de volgorde waarin de termen in de som bij elkaarop worden geteld niet meer zo eenduidig specificeerd als in de meer gebrui-kelijke notatie. Die wordt namelijk doorgaans uitgesproken als de som vande termen in de reeks, waarbij n loopt vanaf het getal 1 tot (en niet tot enmet) oneindig4. In het derde hoofdstuk komen we hier nog op terug.

Tenslotte merken we op dat de schrijfwijze in (1) niet altijd uniek is omdatgetallen van de vorm

k +m∑n=1

dn10n

(2)

nu eenmaal twee representaties hebben, bijvoorbeeld

1 =9

10+

9

100+

9

1000+

9

10000+

9

100000+ · · · =

∞∑n=1

9

10n, (3)

wellicht het eerste voorbeeld van een zogenaamde meetkundige reeks datieder kind in het basisonderwijs hopelijk wel eens te zien krijgt.

Het simpelste voorbeeld van zo’n meetkundige reeks betreft de rij breuken

1

2,1

4,1

8,

1

16,

1

32,

1

64. . . ,

met in de noemers de getallen uit de eerste rij getallen die ik ooit van mijnvader leerde, toen ik een jaar of 22 was. Als we die rij beschrijven met

an =1

2n

met n de verzameling IN doorlopend, dan is de bijbehorende som gelijk aanhet getal 1. Nog altijd de mooiste som die er bestaat. Een eindeloze rijgetallen die optellen tot 1. Wat wil je nog meer?

27.1 Academisch speelkwartier: kolomcijferen

We kiezen nu voor een wat basaler perspectief dan gebruikelijk om meer in-zicht te krijgen in wat de reele getallen zijn. Deze inventariserende5 subsectie

4 Rekenen met ∞ doen wij hier niet.5 We gaan niet recht op een doel af nu.

468

Page 469: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

kan overgeslagen worden bij eerste lezing6, maar een opmerking van Jan Wie-gerinck zette me aan het denken, ook in relatie tot Opgave 1.7 in [HM]. Hoerekenen we met (eerste maar positieve) getallen in de vorm (1)? Een reken-vraag die we nu rekenend en redenerend willen beantwoorden zonder oververzamelingen van getallen te spreken.

Terzijde, helemaal consequent is de schrijfwijze in (1) niet. De k is dui-delijk anders dan de rest van de termen in deze aftelbare som7. Als we onsbeperken tot de positieve reele getallen, die we als verzameling8 gezien aan-duiden met IR+, dan is het eleganter om het “Romeinse” perspectief vaneenheden, tientallen, tienden, honderdtallen, hondersten, duizendtallen, dui-zendsten, etc alleen te combineren met de “Arabische” cijfers

0, 1, 2, 3, 4, 5, 6, 7, 8, 9.

Met

tien = 10, honderd = 10× 10 = 100, duizend = 10× 10× 10 = 1000,

enzovoorts, en op zijn kop

een tiende =1

10, een honderste =

1

100, een duizendste =

1

1000,

und so weiter, is het niet heel raar om bijvoorbeeld

8× 1000 + 7× 100 + 6× 10 + 5× 1 + 4× 1

10+ 3× 1

100+ 2× 1

1000

als corresponderend met een punt op een lijn van hier tot ginder te zien. Bijzo’n punt hoort een getal dat we noteren als

8765,4321 (4)

in onze decimale notatie van vandaag de dag, met ook (hier 5 keer) de gewoneeenheid 1, en een Nederlandse komma waarachter in dit geval vier cijfersstaan.

Over getallen als (4) hoeven verder geen misverstanden te bestaan. Linksvan de komma tellen de decimalen van rechts af de 1-tallen, 10-tallen, 10×10-tallen, 10× 10× 10-tallen, en rechts van de komma vanaf links de 1

10-tallen,

110

-tallen, 110× 1

10-tallen, 1

10× 1

10× 1

10-tallen, 1

10× 1

10× 1

10× 1

10-tallen. Aan

beide kanten van de komma breekt het af, maar rechts is dat niet nodig. In

6 En ook bij tweede lezing.7 Som van een eindeloze rij, zoals Marjolein Kool dat zo mooi noemt.8 Getallen in verzamelingen willen stoppen is een beetje een beroepsafwijking.

469

Page 470: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

principe kunnen we er nog een rij cijfers achter plaatsen, en een groter getalmaken, bijvoorbeeld

8765,432143214321 of 8765,43219999999999999999999999999,

getallen die allebei groter zijn dan 8765,4321 en kleiner dan 8765,43211.Omdat het in negen gelijke stukken verdelen van het lijnstuk tussen het

beginpunt van diezelfde lijn van hier tot ginder, en het punt waar

0× 1000 + 0× 100 + 0× 10 + 1× 1 + 0× 1

10+ 0× 1

100+ 0× 1

1000= 1

staat, negen lijnstukken geeft waarvan het eerste nog net niet loopt tot

0× 1000 + 0× 100 + 0× 10 + 1× 1 + 1× 1

10+ 1× 1

100+ 1× 1

1000= 0,1111,

zien we dat er geen reden is waarom elk punt op de lijn een afbrekendegetalrepresentatie zou moeten hebben. Wat heet, een negende correpondeertomherroepelijk met een representatie als in (4) waarbij er voor de kommaalleen maar 0-en staan, en achter de komma alleen maar 1-en, zonder dathet rechts afbreekt9.

Dat9× 0,111111111 . . . = 9× 0,1 gelijk is aan 1,

is een conclusie die we willen trekken als resultaat van de herhaalde optelling

0,1 + 0,1 + 0,1 + 0,1 + 0,1 + 0,1 + 0,1 + 0,1 + 0,1 = 0,9 = 1.

Op dat optellen komen we zo terug, en op 0,9 = 1 indirect ook. Bij een (metde nog te speciferen regels) decimaal geschreven getal 0,9 optellen verhoogthet gehele getal voor de komma met 1.

Verdelen we hetzelfde lijnstuk niet in negen maar in 99 gelijke stukken,dan zien we

0,01010101010101010101010101 . . . (5)

als getalrepresentatie voor een negenennegentigste verschijnen. De puntjesgeven hier aan dat de decimale ontwikkeling niet eindigt. Tegenwoordigschrijven we

1

9= 0,1,

1

99= 0,01,

1

999= 0,001,

met links steeds een rationaal getal en rechts de decimale representatie vandat getal, dat we met liefde ook een breuk mogen noemen, een breuk metteller 1 en en een noemer met alleen maar 9-ens.

9 En links eigenlijk ook niet, al schrijven we die nullen nooit op.

470

Page 471: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

We zien in (5) dat de 0 als cijfer erg handig is, de 0 die correspondeert metnul vingers op de twee gebalde vuisten van je handen waar je geen ruzie meewil krijgen. Het tellen zelf begint met 1, eindigt op de vingers bij tien = 10,en gaat daarna verder met 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24,25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45,46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66,67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87,88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106,107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122,123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138,139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154,155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170,171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186,187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202,203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218,219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234,235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250,251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266,267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282,283, 284, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298,299, 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313, 314,315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325, 326, 327, 328, 329, 330,331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346,347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362,363, 364, 365, 366, 367, 368, 369, 370, 371, 372, 373, 374, 375, 376, 377, 378,379, 380, 381, 382, 383, 384, 385, 386, 387, 388, 389, 390, 391, 392, 393, 394,395, 396, 397, 398, 399, en een kind kan al lerend voor het slapen gaan zienen begrijpen hoe dat zo altijd maar doorgaat als dromenland geen reddingbrengt. De eindeloze rij van de natuurlijke getallen, beginnend met 1, wordtzo ondubbelzinnig vastgelegd door de aftelling in het decimale stelsel.

Getallen uit die rij kunnen we optellen en vermenigvuldigen (in wezenherhaald optellen). Dat doen we cijferend met de getallen onder elkaar ge-zet, onhandig vanaf links of handig vanaf rechts per kolom. Die methodes10

werken ook voor het rekenen met de positieve kommagetallen die we krijgendoor voor de komma van het kommagetal het cijfer 0 of een natuurlijk getalte zetten, en achter de komma een natuurlijk getal opgevat als een rij cijfers,met voor dat getal al of niet nog een aantal nullen.

De natuurlijke getallen zelf zijn geen kommagetallen. Door getallen als123456789 gelijk te zien aan een nepkommagetal 123456789,0 is dat snel ver-

10 In het PO heeft de onhandige methode veelal de voorkeur gekregen.

471

Page 472: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

holpen, maar dit wordt in de natuurkunde11 terecht als een minder gelukkigeen te mijden conventie gezien. Afbrekende kommagetallen kunnen wellichtbeter vermeden worden, en de niet afbrekende kommagetallen zijn nu net dekommagetallen die we nog missen, en waar we zeker ook mee willen rekenenen cijferen. Dat cijferen moet dan wel vanaf links als je er even over nadenkt.

Tellen we bijvoorbeeld het getal dat gerepresenteerd wordt door (5) ach-tennegentig keer bij zichzelf op dan zien we dat 99 keer 1

99niet alleen gelijk

is aan 1 maar ook aan

0,9 = 0,99999999999999999999999999 . . . ,

en deze decimale representatie kan de meestal toch onbereikbare eenheid 1best vervangen, als we afspreken dat decimale representaties van positievereele getallen naar links altijd, maar naar rechts nooit doorlopen met alleenmaar 0-en. Een onhandige conventie wellicht, maar omdat het cijferen hiertoch alleen maar onhandig vanaf links kan niet eens zo gek eigenlijk.

Bovendien is elk natuurlijk getal nu op een natuurlijke manier ook eenecht kommagetal. Met 0,9, 1,9, 2,9, 3,9, 4,9, 5,9, 6,9, 7,9, 8,9, 9,9, 10,9,11,9, 12,9, 13,9, 14,9, 15,9, 16,9, 17,9, 18,9, 19,9, 20,9, 21,9, 22,9, 23,9, 24,9,25,9, 26,9, 27,9, 28,9, 29,9, 30,9, 31,9, 32,9, 33,9, 34,9, 35,9, 36,9, 37,9, 38,9,39,9, 40,9, 41,9, 42,9, komen we ook op weg in de rekenkunde. Ook al bekthet niet zo lekker, we gaan rekenen met deze niet afbrekende kommagetallenzoals ze ons gegeven worden.

11 Waar de laatste decimaal meestal met meetnauwkeurigheid te maken heeft.

472

Page 473: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

27.1.1 Optellen

De vraag is nu of we met alle ons gegeven kommagetallen kunnen rekenenzoals je zou verwachten, en of rekenen dan (zoals tegenwoordig in het basis-onderwijs) onhandig cijferen12 kan worden, zoals bijvoorbeeld in

0,99999990,9999999

—————– +

1,80000000,18000000,01800000,00180000,00018000,00001800,0000018

—————– +

1,9999998

Immers, met doorlopende negens gaat dit onhandig cijferen precies hetzelfdeen duurt nauwelijks langer dan hierboven:

0,99999 . . .0,99999 . . .

—————– +

1,80000 . . .0,18000 . . .0,01800 . . .0,00180 . . .0,00018 0..0,00001 8..

(6)

..................—————– +

1,99999 . . .

Gelukkig: 1 + 1 = 2!13 Weliswaar schendt de realistisch tussenstap hier welde regel dat we rechts geen doorlopende 0-en mogen hebben, de uitkomst

12 Onhandig cijferen wordt ook wel kolomrekenen genoemd.13 Lees: een en een is twee uitroepteken.

473

Page 474: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

van de som is duidelijk: de 8 combineert steeds met de 1 op de volgende rijtot een 9. De 18 op elke rij is de som van 9 en 9. Op de eerste rij betrefthet 0,9 + 0,9, op de tweede rij 0,09 + 0,09, op de derde rij 0,009 + 0,009,enzovoorts. Het is instructief14 om zo’n sommetje als hierboven met tweeandere doorlopende getallen met voor de komma alleen maar 0-en te doen.Dan vormen de twee cijfers op elke rij steeds een getal uit de rij

0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18,

en bij elk van deze getallen kan zowel van boven een getal uit de rij

0 = 00, 10, 20, 30, 40, 50, 60, 70, 80, 90

en daarna vanonder ook een getal uit de veel kortere rij 0, 1 worden opgeteld.Op zijn hoogst krijgen we dus 90 + 18 + 1 = 109.

Is de som groter dan 99 dan schuift er een 1 door naar links maar datoverhevelen blijft beperkt. Optellend per tweetal kolommen kan er een 1naar links doorschuiven en een 1 van rechts binnenkomen. Die 1 kan vande 109 een 110 maken, maar ook die geeft nog steeds op zijn hoogst een 1naar links door. Dat optellen van twee getallen onhandig cijferend per tweekolommen tegelijk vanaf links gaat dus altijd wel lukken.

Hoe zit het met drie getallen? We nemen weer de moeilijkste som vandat type, met de cijfers zo groot mogelijk, dus

0,99999 . . .0,99999 . . .0,99999 . . .

—————– +

2,70000 . . .0,27000 . . .0,02700 . . .0,00270 . . .0,00027 0..0,00002 7..

(7)

..................—————– +

2,99999 . . .

Gelukkig: 1 + 1 + 1 = 3. Opnieuw is het instructief om zo’n sommetje alshierboven met drie andere doorlopende getallen met voor de komma alleen

14 Wel doen!

474

Page 475: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

maar 0-en te doen. Dan vormen de twee cijfers op elke rij steeds een getaluit de rij

0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27,

en bij elk van deze getallen kan zowel een getal uit de rij

0 = 00, 10, 20, 30, 40, 50, 60, 70, 80, 90

en daarna ook een getal uit de veel kortere rij

0, 1, 2

worden opgeteld. Op zijn hoogst krijgen we nu 90 + 27 + 2 = 119. Hetoverhevelen naar links blijft weer beperkt. Met enig werk gaan we hier welinzien dat drie zulke nul komma nog minstens wat getallen altijd cijferendbij elkaar opgeteld kunnen worden en dat het niet uitmaakt15 of we er eersttwee samen nemen en in welke volgorde we de getallen optellen, en dat in desom voor de komma ook een 1 of een 2 kan komen te staan.

Willen we positieve getallen met ook voor de komma decimalen heb-ben staan in de getallen die we bij elkaar optellen, dan doen we die apart.Bijvoorbeeld

99, 9 + 88, 8 + 77, 7 = 99 + 88 + 77 + 0, 9 + 0, 8 + 0, 7,

waarbij99

88

77

— +

264

nu ook (juist wel handig) van rechts af per kolom uitgecijferd16 kan worden,en de som van de drie nul komma nog minstens wat getallen met de methodehierboven gelijk is aan 2,6. Alles bij elkaar vinden we zo dat

99, 9 + 88, 8 + 77, 7 = 264 + 2,6 = 266,6,

al had dat vast handiger gekund.

15 Lees: a+ b+ c = (a+ b) + c = c+ (a+ b) met alle gepermuteerde variaties.16 Ook kolomcijferen, maar wordt meestal mechanisch rekenen genoemd.

475

Page 476: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Is zo’n positief kommagetal p groter dan een ander positief kommagetala, hetgeen betekent dat, na mogelijk een aantal gelijke decimalen van p en a,er een eerste decimaal is van p die groter is dan de overeenkomstige decimaalvan a, dan kunnen we precies een (positieve) b vinden waarvoor geldt datp = a+ b. Het voorbeeldje

0,909090909090909090...

0,222222222222222222...

——————————– −

0,686868686868686868...

kan van linksaf kolomcijferend worden aangepakt. In eerste instantie is deeerste decimaal achter de komma dan gelijk aan 7 maar bij de volgendedecimaal moet er van links 1 geleend worden om 10 − 2 = 8 te krijgen,waarmee de 7 een 6 wordt. Al spelend zie je wel hoe het in het algemeengaat, en ook dat p > a gelijkwaardig is met p + w > a + w voor iederwillekeurig ander positief getal w.

Nog een optelvoorbeeldje om het af te leren:

0,12345 . . .0,99999 . . .

—————– +

1,00000 . . .0,11000 . . .0,01200 . . .0,00130 . . .0,00014 0..0,00001 5..

(8)

..................—————– +

1,12345 . . .

Bij een doorlopend kommagetal het getal 0,9 optellen laat uiteindelijk allecijfers achter de komma ongemoeid en telt een 1 op bij het getal voor dekomma. En zo hoort dat ook. Na wat oefenen lukt dat ook wel in een keeren is het wellicht verstandig om nu verder te gaan met Sectie 27.1.4.

476

Page 477: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

27.1.2 Vermenigvuldigen?

Kunnen we ook vermenigvuldigen? Dit gemene17 sommetje bijvoorbeeld?

0,999999 .....0,999999 .....

—————– ×

??????

In de vorige subsectie is het gelukt om de som van deze twee getallen kolom-cijferend vanaf links zondere hogere wiskunde uit te werken. Kan dat methet produkt ook? We laten ons niet afschrikken en schrijven het produktcijferend uit, waarbij we het cijferen symmetrisch houden in beide factoren,net zoals in (6) en (7) de uitwerking van de som symmetrisch in de bijdragenvan de aparte termen was.

0,999999 .....0,999999 .....

—————– ×

0,810000.....0,081000.....0,081000.....0,008100.....0,008100.....0,008100.....0,000810.....0,000810.....0,000810.....0,000810.....0,00008 10...0,00008 10...0,00008 10...0,00008 10...0,00008 10...

(9)

......................—————– ×

????????

17 Denk nog niet meteen aan 0,6× 0,6.

477

Page 478: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Dat ziet er een stuk ingewikkelder uit dan (6). Misschien is het wel geengoed idee het produkt van twee kommagetallen zo in een keer te willen doen.In deze doorlopende som zien we tussen de horizontale strepen de termenstaan die we krijgen als we het produkt van de eerste decimaal van de eerstefactor met de eerste decimaal van de tweede factor nemen (een term), vande eerste met de tweede en de tweede met de eerste (twee termen), van deeerste met de derde, de tweede met de tweede en de derde met de eerste (drietermen), enzovoorts. Gelukkig zien we links steeds meer nullen waardoor hetlijkt of het blokje 81 naar rechts opschuift.

Ieder zulk blokje is het produkt van twee decimalen op steeds twee andereposities, decimalen die we hier toevallig allemaal gelijk aan 9 genomen hebbenom de som18 zo moeilijk mogelijk te maken. Het is de positie van het blokjedat opschuift, en op het blokje staat steeds het produkt van twee cijfers. Dusdit zijn de blokjes die voor kunnen komen:

00, 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 12, 14, 15, 16, 18, 20, 24,

25, 27, 28, 30, 32, 35, 36, 40, 42, 45, 48, 49, 54, 56, 63, 64, 72, 81.

Met alle blokjes gelijk aan 81 gaat het in (9) om de som van de getallen inhet schema dat begint met

81

102

81

103

81

103

81

104

81

104

81

104

81

105

81

105

81

105

81

105(10)

81

106

81

106

81

106

81

106

81

106

81

107

81

107

81

107

81

107

81

107

81

107

en naar beneden breder en breder doorloopt. Let wel, de volgorde waarin wecijferend optellen in (9) komt overeen met per regel optellen in (10) en leidtin de somnotatie tot

81×∞∑n=1

n

10n+1(11)

18 Het betreft 1× 1 = 1, maar dat terzijde.

478

Page 479: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

als maximale uitkomst (vast wel gelijk19 aan 1) van een produkt van tweenul komma (minstens) nog wat getallen.

En met drie zulke getallen gaat het om maximaal

729

103

729

104

729

104

729

104

729

105

729

105

729

105

729

105

729

105

729

105(12)

729

106

729

106

729

106

729

106

729

106

729

106

729

106

729

106

729

106

729

106

enzovoorts, met 3, 6, 10, 15, 21, . . . termen op elke regel, en maximaal

729×∞∑n=1

n(n+ 1)

210n+2

als maximale20 uitkomst (vast wel gelijk aan 1) van een produkt van drie nulkomma (minstens) nog wat getallen.

Het wordt er niet eenvoudiger op. We kijken nog een keer naar (9) waar-mee we begonnen zijn. Het aantal niet-nullen is in de kolommen rechts vande komma achtereenvolgens 1, 3, 5, 7, 9, . . . , en

in kolom 1 2 3 4 5 6 7 8 . . .zien we 1 3 5 7 9 11 13 15 . . .

niet-nullen. Per kolom gaan we bij het optellen dus onvermijdelijk over de 9heen, en daarbij blijft het niet als we doorcijferen naar rechts, met een ruweschatting

in kolom 1 2 3 4 5 6 7 8 . . .maximaal 1× 9 3× 9 5× 9 7× 9 9 11× 9 13× 9 15× 9 . . .

voor de kolomsommen, hetgeen leidt tot de vraag of

9× (1

10+

3

102+

5

103+

7

103+

9

104+ · · · ) = 9×

∞∑n=1

2n− 1

10n

19 Equivalent met

∞∑n=1

n

10n=

10

81, wat zou

∞∑n=1

n2

10nzijn? Zie verder.

20 Het betreft immers 1× 1× 1 = 1.

479

Page 480: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

een decimaal ontwikkelbaar getal definieert waar elke eindige som van termenin (9) niet boven kan komen, een vraag vergelijkbaar met de minder ruwafgeleide vraag over (11). Maar het moge duidelijk zijn dat we opnieuwafdwalen van de basisschoolstof waar het hier toch om zou moeten gaan21.

Het cijferen geeft wellicht meer begrip. Onhandig kolomcijferend zien wein (9) kolomsommen

8, 17, 26, 35, 44, 53, 62, 71, 80, 89, 98, 107, 116, 125, 134, 143, 152, 161, 170, 179,

enzovoorts verschijnen. Cijferend optellen geeft dat met weglating van denul komma

8 7 6 5 4 3 2 1 0 91 2 3 4 5 6 7 8 8 9

1

8 7 6 5 4 3 2 1 0 90 1 2 3 4 5 6 7 7 81 1 1 1 1 1 1 1 1 1

en alles loopt niet alleen naar rechts maar ook naar beneden door.Opnieuw optellen per kolom geeft

9 9 9 9 9 9 9 9 8 91

9 9 9 9 9 9 9 9 8 81 1

Enzovoorts. Zo te zien krijgen we op iedere plek inderdaad uiteindelijk eennegen, maar alles loopt nog steeds (rechts) naar beneden door, al past hetniet meer op de pagina.

De vraag is hoe we uitgaande van dit voorbeeld zien dat er voor tweewillekeurige getallen zo altijd een decimale ontwikkeling van het produktontstaat, waarmee dan het produkt ondubbelzinnig vast ligt, en ook of er inhet geval van het “maximale” voorbeeld alleen maar negens uitkomen. Enook voor produkten van drie getallen natuurlijk, met dezelfde overwegingenals bij optellen22. Als we dat wiskundig precies willen maken hebben we nodigdat volgordes en eerst samen nemen niet uit moet maken bij het optellenin doorlopende schema’s beginnend als (12), als de breedte maar niet tesnel toeneemt. Dat idee verkennen we in de volgende subsectie, waarin weopnieuw afdwalen van het cijferen.

27.1.3 Andere aftelbare sommen?

Een analysevraag om te stellen lijkt: voor welke rijen a1, a2, a3, . . . gehelenietnegatieve getallen correspondeert een aftelbare maar niet eindige som

∞∑n=1

an10n

(13)

21 Voor een analysecursus zijn dit vragen om te onthouden!22 Lees: a× b× c = (a× b)× c = c× (a× b), weer met alle gepermuteerde variaties.

480

Page 481: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

ondubbelzinnig met een getal∞∑n=1

dn10n

waarin alle dn een cijfer zijn, i.e. 0, 1, 2, 3, 4, 5, 6, 7, 8 of 9? Het liefst beantwoordenwe die vraag zonder over andere uitdrukkingen dan die van de vorm (13) tepraten.

Een noodzakelijke voorwaarde is dat de eindige sommen

A1 =a1

10, A2 =

a1

10+

a2

102, A3 =

a1

10+

a2

102+

a3

103, . . . (14)

allemaal kleiner dan 1 = 0,9 zijn. Als 0,9 zo’n (strikte) bovengrens is dan iswellicht 0,89 dat ook. Of niet. Kies het minimale cijfer d1 waarvoor 0,d19zo’n bovengrens is. Kies vervolgens het minimale cijfer d2 waarvoor 0,d1d29een bovengrens is, enzovoorts. Dit proces definieert ondubbelzinnig een getal

0 = d1d2d3 · · · =∞∑n=1

dn10n

dat kleiner is dan alle bovengrenzen 0,d19, 0,d1d29, 0,d1d2d39, . . . , en voorde bijbehorende

D1 =d1

10, D2 =

d1

10+

d2

102, D3 =

d1

10+

d2

102+

d3

103, . . . ,

geldt dat

D1 +1

10, D2 +

1

102, D3 +

1

103, . . .

bovengrenzen zijn. We kunnen niet uitsluiten dat na verloop van tijd alle dnnul zijn, maar ze zijn zeker niet allemaal nul.

Kan het zo zijn dat de An-tjes niet boven de D1 uitkomen? Wel, in datgeval zijn alle An < D1 (want met An = D1 komt een volgende An boven D1),voor alle n = 1, 2, 3, . . . , en was d1 kennelijk niet minimaal gekozen om alleAn onder 0,d19 te hebben. Dus An komt wel boven D1 en blijft dan groterdan D1. Hetzelfde geldt met het zelfde argument voor D2, D3, etcetera.

Als n1 de eerste n is waarvoor An > D1, n2 de eerste n waarvoor An > D2,n3 de eerste n waarvoor An > D3, etcetera, dan is n2 minstens n1, n3 minstensn2, n4 minstens n3, enzovoorts. We concluderen dat voor iedere k geldt dat

Dk < An < Dk +1

10k(15)

voor alle n vanaf n = nk, en dat zou moeten betekenen dat

An → D = 0,d1d2d3d4 . . . , (16)

481

Page 482: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

een nog niet precies gemaakte uitspraak voor een rij breuken An, breukenmet noemers machten van 10 en An ≤ An+1, met strikte ongelijkheid voorniet per se alle maar wel willekeurig grote n.

Elke An heeft decimalen genummerd door j = 1, 2, 3, 4, . . . . De eerstedecimaal kan niet kleiner worden met toenemende n. Dat betekent dat vanafzekere n = m1 de eerste decimaal van An niet meer verandert en gelijk is aaneen vast cijfer α1. Daarna geldt hetzelfde voor de tweede decimaal die vanafzekere n = m2 (waarbij we m2 minstens gelijk aan m1 kunnen nemen) nietmeer verandert en gelijk is aan een vast cijfer α2, enzovoorts.

Deze eigenschap moet voor de niet-dalende rij A,A2, A3, . . . toch wel deenige zinvolle definitie van

An → 0,α1α2α3α4 . . .

zijn. Graag zouden23 we nu uit (15) concluderen dat

0,d1d2d3d4 · · · = 0,α1α2α3α4 . . . ,

waarbij we opmerken dat de ontwikkeling in het rechterlid bij constructie nietaf kan breken maar de ontwikkeling in het linkerlid wel. Het kan dus gebeurendat de eerste zoveel αn en dn hetzelfde zijn, daarna een keer αn + 1 = dn, envervolgens alle dn = 0 en alle αn = 9. Hoe het ook zij, de uitdrukking in (13)definieert dus ondubbelzinnig een nul komma minstens nog wat getal, mitswe weten dat alle eindige sommen in (14) kleiner zijn dan 0,9. Maar wie voor(10) en (12) meteen ziet dat dat inderdaad zo is mag het zeggen. We zijn erdus nog niet uit wat betreft produkten van positieve kommagetallen.

27.1.4 Een cijfer keer een kommagetal

Terug naar het cijferen. We houden ons nog even aan de afspraak dat posi-tieve kommagetallen de getallen zijn met een na de komma doorlopende rijcijfers waarin niet-nullen blijven voorkomen hoe ver je ook gaat in de deci-male ontwikkeling. Zo’n positief kommagetallen heeft voor de komma eennatuurlijke getal of een 0 staan. Het produkt van twee zulke getallen moetwel de som van vier bijdragen zijn: wat je krijgt van voor de komma keervoor de komma, van voor de komma keer achter de komma, van achter dekomma keer voor de komma, en van achter de komma keer achter de komma.

De laatste lijkt het moeilijkst. Als we die kunnen dan kunnen we daarnaook alle produkten van positieve kommagetallen door eerst de komma’s naarlinks te schuiven en in het antwoord de komma naar rechts te schuiven. Twee

23 Nog even nagaan dit dus.

482

Page 483: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

keer naar rechts eigenlijk, om beide verschuivingen naar links goed te maken.Helaas zijn we hierboven nog niet bevredigend uit produkten van zulke nulkomma nog wat getallen gekomen.

De eerste van de vier bijdragen is het makkelijkst, hoe het daarmee zitis basisschoolstof. De volgende twee bijdragen zijn wat lastiger. Met een1-cijferig natuurlijk getal 1, 2, 3, 4, 5, 6, 7, 8 of 9 is de moeilijkste 9 × 0,9.Net zo moeilijk is 0,9× 0,9:

0,999999 .....0,9

—————– ×

0,810000.....0,081000.....0,008100.....0,000810.....0,00008 10...

......................—————– ×

0,899999 .....

Daarna zijn produkten van cijfers met kommagetallen geen probleem meer.Met twee cijfers tegelijk in elke stap geeft een cijfers keer een blokje van tweemaximaal 9 × 99 = 891. Cijferend per blokjes van twee vanaf links schuifter dus steeds maximaal een 8 naar links door. Bij het eerste blokje komt diegewoon voor het blokje te staan. Van het tweede blokje schuift er maximaaleen 8 door naar links waarmee het blokje dat daar maximaal voor staat opzijn hoogst 91 + 9 = 99 wordt. Enzovoorts. Het is weer instructief om eenpaar voorbeeldjes te doen en in een keer het antwoord op te schrijven opbasis van de decimalen die je hebt in je voorbeeld.

27.1.5 Produkten van kommagetallen

Als het bovenstaande eenmaal in in een keer lukt als

0,999999 .....0,9

—————– ×

0,899999 .....

483

Page 484: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

dan kan daarna0,999999 .....0,999999 .....

—————– ×

0,899999 .....0,089999 .....0,008999 .....0,000899 .....0,000089 .....

(17)

......................

ook, en vervolgens kunnen we dan van boven af de kommagetallen term voorterm optellen met wat we kolomcijferend geleerd hebben in sommetjes als(8).

De eerste stap is0,899999 .....0,089999 .....

—————– +

0,899999 .....0,009999 .....0,080000 .....

(18)

—————– +

0,909999 .....0,080000 .....

—————– +

0,989999 .....

In (18) hebben we de tweede rij negens afgesplitst. Opgeteld bij het kom-magetal erboven verhogen die de 89 tot 90, en met de 8 eronder maken zevan de 89 een 98, waarbij de decimalen achter de 89 ongewijzigd blijven. Hetresultaat is de som van de eerste twee kommagetallen in (17), waarbij in ditvoorbeeld de 8 eentje opgeschoven is naar rechts.

Zo gaat dat verder. Nu we met (17) zijn gevorderd tot

484

Page 485: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

0,999999 .....0,999999 .....

—————– ×

0,989999 .....0,008999 .....0,000899 .....0,000089 .....

(19)

......................

zien we dat het patroon zich herhaalt in

0,989999 .....0,008999 .....

—————– +

0,998999 .....

met als resultaat de som van de eerste drie kommagetallen in (17). De 8 isweer eentje opgeschoven en dat gaat zo door. In de volgende stap zien we

0,999999 .....0,999999 .....

—————– ×

0,998999 .....0,000899 .....0,000089 .....

(20)

......................

met nu boven de drie nullen na de komma in (20) alleen het derde cijfer datnog zal veranderen bij verder cijferen. Zo vinden we al cijferend dat

0,9× 0,9 = 0,9,

hetgeen zoveel wil zeggen dat 1× 1 = 1.Is ieder tweetal kommagetallen zo cijferend met elkaar te vermenigvuldi-

gen? Merk op dat een staartstuk in de ontwikkeling van de tweede factorsteeds maximaal uit een rij negens bestaat en zo het cijfer in het antwoordop de positie waarna dat staartstuk begint maximaal met 1 verhoogt.

485

Page 486: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Om nog verder uit te werken dit alles, maar niet hier. Het idee is welduidelijk nu. Zonder hier nu meteen Turing aan te roepen is het aardig omdeze sectie te besluiten met de opmerking dat je in gedachten een machientjezou kunnen maken dat als input de doorlopende kommagetallen krijgt dieals het ware van de ene kant cijfer voor cijfer naar binnen schuiven, en danvervolgens aan de andere kant als output de som of produkt cijfer voor cijferals doorlopend kommagetal uitspuugt, en het machientje daarmee tot heteinde der tijden doorgaat.

27.2 Kleinste bovengrenzen

Net als de aftelbare som in (1) met k ≥ 0 is (3) een mooi voorbeeld van

∞∑n=0

an (21)

met an ≥ 0 voor alle n ∈ IN0 = IN ∪ 0. Als de partiele sommen

SN =N∑n=0

an

begrensd zijn dan is de kleinste bovengrens van de aftelbare vereniging

∪N∈IN0SN = S0, S1, S2, . . .

per definitie de som van de reeks in (21), notatie

S =∞∑n=0

an.

In het geval van (1) is SN ≤ k+1 voor alle N ∈ IN0 en kan deze uitspraakdus als tautologie gezien worden: het reele getal S is de limiet van zijndecimale ontwikkeling, een ontwikkeling waarin de decimalen dn uit de cijfers0 tot en met 9 gekozen worden.

Dat het uberhaupt mogelijk is dat er uit een som met oneindig veel termenals (21) een eindig getal kan komen is zo vanuit (1) vanzelfsprekend, ook aldacht ene Zeno daar destijds anders over. Mooie voorbeelden waarbij er uitde som geen eindig getal komt zijn

S =∞∑n=0

1 met SN = N, en S =∞∑n=0

1

n. (22)

486

Page 487: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Geen van deze twee definieert een S ∈ IR+.Waarom eigenlijk niet? Wel, de eerste S zou een kleinste bovengrens in

IR voor de verzameling IN zijn. Maar dan is S − 12

geen bovengrens voor IN.En dus is er een N ∈ IN met N > S − 1

2en volgt dat N + 1 > S + 1

2. Maar

N + 1 ∈ IN dus is S geen bovengrens voor IN, een tegenspraak24. Gelukkigmaar, want het zou wel heel gek zijn als IN wel begrensd is in IR. Komtmeteen te pas bij het tweede voorbeeld in (22), waarover we opmerken dat

1 +1

2+

1

3+

1

4︸ ︷︷ ︸> 1

2︸ ︷︷ ︸>1

+1

5+

1

6+

1

7+

1

8︸ ︷︷ ︸> 1

2

+1

9+

1

10+

1

11+

1

12+

1

13+

1

14+

1

15+

1

16︸ ︷︷ ︸> 1

2︸ ︷︷ ︸>1

,

enzovoorts, en zo komen de bijbehorende SN boven elke n ∈ IN. Ook nietbegrensd dus. Maar de som

1− 1

2+

1

3− 1

4+

1

5− · · ·

heeft wel een uitkomst25, althans indien opgevat als

∞∑n=1

(−1)n+1

n,

al zijn noch de positieve termen

1 +1

3+

1

5+

1

7+ · · · ,

noch de negatieve termen

−1

2− 1

4− 1

6− · · ·

op te tellen tot een eindige som. Sterker, gegeven een S ∈ IR kun je depositieve en negatieve termen verweven26 tot een rij an op zo’n manier dat

S = a1 + a2 + a3 + a4 + · · · ,

een goede reden om zoveel mogelijk alleen maar over reeksen zoals in Sectie27.3 te spreken.

24 Overtuigd?25 Ik meen ln 2.26 Kies positieve termen om boven S te komen, dan negatieve om onder S, dan . . .

487

Page 488: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

27.3 Absoluut convergente reeksen

Als we hadden leren rekenen met dn ∈ −5,−4,−3,−2,−1, 0, 1, 2, 3, 4 ende tafels tot en met vijf, dan was (1) een voorbeeld geweest van (21) zonderde a priori informatie dat an ≥ 0 maar wel met de eigenschap dat

∞∑n=0

|an| <∞, (23)

omdat

∞∑n=1

| dn10n| ≤

∞∑n=0

5

10n=

5

10+

5

100+

5

1000+

5

10000+

5

100000+ · · · = 5

9.

Ook nu geldt dat SN → S voor een unieke S ∈ IR, dus

S =∞∑n=0

an, (24)

en hernummeren van de som verandert niets aan die uitkomst. Reeksenvan de vorm (21) waarvoor (23) geldt heten absoluut convergent en zijnonvoorwaardelijk convergent: de volgorde van sommeren maakt niet uit voorde waarde S van de som en bovendien geldt dat

|S| = |∞∑n=0

an| ≤∞∑n=0

|an|. (25)

Wat betreft het bewijs van (24) gegeven (23), de invariantie onder her-nummeren en de aftelbare 3-hoeksongelijkheid (25): dat bewijs maakt ge-bruik van het feit dat in de reele getallen Cauchyrijen, dat zijn rijen waarvoorgeldt dat

xn − xm → 0 als m,n→∞,

een unieke limiet x hebben, een limiet x die bestaat als dan inderdaad hetenige reele getal waarvoor

xn → x als n→∞.

Zulke rijen heten convergent.Uit Hoofdstuk 10 van [HM] of Hoofdstuk 8 van het Basisboek Wiskunde is

de lezer wellicht al bekend met de wiskundige definitie van het begrip (limietvan een) convergente rij, waarin alleen 27 de “voor alle p > 0” nog door een

27 Didactisch aardig in het basisboek is het gebruik van grote P naast kleine p.

488

Page 489: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

“voor alle ε > 0” moet worden vervangen om tot het gebruikelijke jargonte komen, en later eventueel door ∀ε > 0. Wel is het in de analyse strakspraktischer om met

|xn − x| ≤ ε

te werken.Wat ook elegant en praktisch is in het Basisboek Wiskunde is de zorgvul-

dige manier waarop gesproken wordt over de rij waarvan het n-de elementgelijk is aan xn, en het aan de lezer wordt overgelaten zich daarbij te re-aliseren dat n de getallen 1, 2, 3, 4, . . . doorloopt, of een andere steeds metstap 1 oplopende rij gehele getallen. Wij zullen de notatie in het BasisboekWiskunde afkorten tot simpelweg de (door n genummerde) rij xn, vaak derij reele getallen xn. Evenzo spreken we over de rij rationale getallen qn ofde rij qn ∈ IQ. De laatste notatie wordt hieronder nog gebruikt.

De ε-definities van uitspraken als hierboven komen in deze cursus aan deorde op het moment dat dat nodig is. Want ze zijn nodig, bijvoorbeeld omprecies te maken dat sommen als (24) bestaan du moment dat je met eenM ∈ IR+ een schatting

N∑n=0

|an| ≤M

hebt voor alle partiele sommen tegelijk, en daaruit afleidt dat de door Ngenummerde rij SN een Cauchyrij is. We merken hierbij op dat het in zo-genaamde genormeerde ruimten dan om twee equivalente uitspraken gaat,uitspraken waarin noch de limiet x van de rij, noch de som S van de reekswaar het om gaat expliciet voorkomen:

absoluut convergente reeksen convergent ⇐⇒ Cauchyrijen convergent

Je kunt dus weten of x en S in IR bestaan zonder ze eerst te hebben bepaald.

27.4 Verzamelingen in de praktijk

Voor sommige wiskundigen van de meer zuivere inclinatie zijn de uitsprakenhierboven niet los te zien van een precieze maar voor de analyse zelf nietaltijd even verhelderende wiskundige constructie van de reele getallen. Maarinteressant zijn die constructies natuurlijk wel, en je moet ergens beginnenals je de wiskunde per se axiomatisch en wiskundig streng wil opzetten28,vanuit wat men de leer van verzamelingen noemt.

Deze verzamelingenleer is iets waarover Paul Halmos in zijn mooie boekjeNaive Set Theory 29 schreef: alle wiskundigen vinden dat je er wat van

28 Een vriendje van Einstein heeft helaas laten zien dat dat nooit bevredigend zal lukken.29 Vertaald ooit als Prisma pocket verkrijgbaar.

489

Page 490: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

gezien moet hebben, maar ze zijn het oneens over wat precies. Je kuntverzamelingenleer bijvoorbeeld bij het begin beginnen met het axioma datde lege verzameling30 bestaat.

Dat doen wij hier niet. Maar mocht je dat wel doen dan komen tochop enig moment ook de axioma’s voor de verzameling van de natuurlijkegetallen IN voorbij, natuurlijke getallen die iedereen die op zijn vingers heeftleren tellen allang kent. En tellen begint natuurlijk bij 131, al is het handigom de verzameling

IN0 = IN ∪ 0 = 0, 1, 2, 3, . . .

in te voeren, hier in een zuiver wiskundig gezien af te keuren maar wel zobegrijpelijke notatie met onfatsoenlijke stippeltjes, waarin we het hierbovenal gebruikte verenigingssymbool ∪ weer terugzien32.

Het is wel goed om een van die axioma’s voor IN te relateren aan dewiskundige praktijk van alledag. Want hoe bewijs je bijvoorbeeld dat vooriedere N ∈ IN = 1, 2, 3, . . . geldt dat de uitspraak

(PN) 12 + 22 + · · ·+N2 =N3

3+N2

2+N

6

waar is, zonder voor elke N ∈ IN apart de uitspraak (PN) te moeten contro-leren?

Binnen de zuivere wiskunde hoort daar een verhaal bij waarin voor alde puntjes hierboven eigenlijk geen plaats is. Dat verhaal eindigt met hetprincipe van volledige inductie33, dat er op neerkomt dat34 als je voor N = 1de uitspraak controleert, en je vervolgens laat zien dat de implicatie

(PN) =⇒ (PN+1) (26)

geldt voor alle N waarvoor je hem nodig hebt, namelijk om via herhaaldtoepassen van de inductiestap (26) tot

(P1) =⇒ (P2) =⇒ (P3) =⇒ (P4) =⇒ (P5) =⇒ (P6) =⇒ (P7) =⇒ · · ·

te komen, zover als je maar wil, de uitspraak inderdaad geldt voor alle N ∈IN. De implicatie (26) moet daartoe voor alle N ∈ IN worden aangetoondom beginnend met de juistheid voor N = 1 de keten hierboven zonder diestippeltjes in een keer af te maken.

30 In LaTeχ: ∅. Op het schoolbord liever 6o.31 Tellend is IN met nul een beetje flauwe kul, op 00 komen we nog terug.32 Gaat er dus eigenlijk om hoe je al die getallen zonder stippels tussen accolades vangt.33 Naamgeving volledig intimiderend, vriendelijker is: dominoprincipe.34 Nu komt een lange zin.

490

Page 491: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

Dit soort oefeningen kunnen elders gedaan worden. Zie bijvoorbeeld in[HM] Sectie 6.1 en voetnoot 16. Relevant uit die sectie voor deze cursuszijn bewijzen voor rekenpartijtjes als in (PN) hierboven, waarin niet alleenN maar ook 3 = p ∈ IN een parameter is, en de inductiestap van de vorm

(P1) ∧ (P2) ∧ · · · ∧ (PN) =⇒ (PN+1) (27)

is35. Zie verder ook Hoofdstuk IV [BE] .Wat we hier precies met (A) =⇒ (B) bedoelen moge duidelijk zijn:

als de uitspraak (A) waar is dan is ook de uitspraak (B) waar. Hetgeen inonze wiskundige redenaties equivalent is met: als uitspraak (B) niet waar isdan kan uitspraak (A) ook niet waar zijn. Deze logica kan geformaliseerdworden met waarheidstabellen vol nullen en enen opgeleukt met bijzonderfraaie algebra, maar wat dat betreft laten we hier liever de Boole de Boole36.

Du moment dat er over het bestaan van37 IN geen twijfel meer is, wordenin de verzamelingsleer, bijvoorbeeld zoals in Hoofdstuk V en VI van [BE], IZ,IQ en uiteindelijk IR wiskundig netjes geconstrueerd. De constructie van IR isin [BE] gebaseerd op de gedachte dat iedere manier om IQ in twee stukken teknippen overeen zou moeten komen met een reeel getal, waarbij de rationalegetallen dan wel met de schaar te maken krijgen en de overige getallen niet38.

Het is instructief om de constructies van IZ en IQ uit IN met elkaar tevergelijken zoals dat gebeurt in [BE]. Die van IZ is inderdaad tamelijk kunst-matig. Die van IQ is echter heel natuurlijk en gebaseerd op hoe je eigenlijkaltijd al met de rationale getallen rekende, namelijk als breuken. Breukenmet een teller en een noemer. Bijvoorbeeld

14

333=

42

999= 0.042

met een streep die aangeeft dat de decimale ontwikkeling van de breuk zichherhaalt. Anders dan gesuggereerd in de in

http://www.few.vu.nl/~jhulshof/TAL.pdf

besproken TAL-boekjes van het Freudenthal Instituut doe je echter het re-kenen met rationale getallen bij voorkeur niet met zulke decimale ontwikke-lingen, maar juist wel met de niet unieke representatie van rationale getallenals quotienten van gehele getallen, dus in de vorm

q =t

d35 De ∧ staat voor “en”, dat is logisch. Denken aan dominosteentjes is nu lastiger.36 https://www.youtube.com/watch?v=DOzqUyW7jog37 Eventueel via Peano’s axioma’s.38 Want ze bestaan op dat moment nog niet.

491

Page 492: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

met teller t en noemer d in IZ, de d niet gelijk aan 0, waarbij je moet afsprekendat

t1d1

=t2d2

als t1d2 = t2d1.

27.5 Equivalentierelaties

Wiskundigen noemen zo’n afspraak een equivalentierelatie. We komen nuin relatie tot IR meer over dit belangrijke begrip te spreken, ook voor wievan IR graag een inzichtelijke constructie wil zien. Een constructie waarvande details overigens niet thuis horen in of voorafgaand aan een eerste vakAnalyse. Ik meen dat ik zelf de constructie van IR voor het eerst zag bij eencollege over de integraal van Lebesgue van Jan van de Craats in het vierdesemester van wat toen de kandidaatsstudie wiskunde in Leiden was.

De onderliggende maattheorie voor dat vak over die andere integraal be-gint met de vraag wat de oppervlakte |A| is van een willekeurige deelverza-meling A van IR2, en komt onvermijdelijk tot twee constateringen. Vroegerof later zijn dat respectievelijk

(i) het komt voor dat A ⊂ B en |A| = |B|;(ii) het zou kunnen voorkomen dat A eindige oppervlakte |A| heeft maaropgeknipt kan worden in aftelbaar veel stukjes die allemaal dezelfde maatzouden moeten hebben39,

en daar moet je mee omgaan. Leuk is dat (ii) ons dan later40 weer terugvoertnaar het boekje van Halmos. In een vroeger stadium doet (i) ons echter alhet dringende verzoek om A en B in zekere41 zin als hetzelfde te zien, enbijvoorbeeld ook hetzelfde als een C met C ⊂ A en |C| = |A|, waarbij Cgeen deelverzameling van B hoeft te zijn of omgekeerd. Hoe formuleer je danrechtstreeks dat B en C equivalent zijn?

Anders van aard is het gebruik van equivalentierelaties bij een inzichte-lijke constructie van IR, waarbij je denkt aan reele getallen als denkbeeldigelimieten van Cauchyrijtjes rationale getallen, zoals bijvoorbeeld de hierbovenbesproken decimale ontwikkelingen, maar dan moet je wel een goede afspraakmaken over wat het betekent dat twee zulke Cauchijrijtjes hetzelfde reele ge-tal (zouden moeten) definieren. Denk bijvoorbeeld aan binaire benaderingenmet alleen maar nullen en enen, of aan benaderingen met kettingbreuken,allebei erg fraai of juist minder42 fraai, omdat ze afstand nemen van de vin-gers waarin onze wiskunde zit. Kortom, een belangrijke vraag is hoe je van

39 Waarom is dat een paradox?40 Maar niet hier.41 Lees: in maatheoretische zin.42 Over gebrek aan smaak valt niet te twisten.

492

Page 493: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

twee Cauchyrijen rationale getallen qn en rn zegt dat ze hetzelfde reele getaldefinieren43.

Als je er even over nadenkt is het logisch dat dit een definitie zou kunnenzijn:

qn ∼ rn ⇐⇒ qn − rn → 0 als n→∞Deze tweezijdige equivalentiepijl definieert een equivalentierelatie op de ver-zameling van alle rijen rationale getallen. We walsen nu wellicht even overwat belangrijke details heen, maar een equivalentierelatie is niets anders daneen relatie met formeel dezelfde eigenschappen als de gelijkheidsrelatie voorelementen van een willekeurige verzameling A. Voor alle a, b, c ∈ A geldt

a = a,

a = b =⇒ b = a,

a = b ∧ b = c =⇒ a = c

De relatie44 gedefinieerd door het = teken heet daarom reflexief, symmetrischen transitief, en ook ∼ is zo’n equivalentierelatie, op de verzameling van allerijen rationale getallen in dit geval. En die equivalentierelatie doet het!

Wat doet ∼ dan? De equivalentierelatie ∼ deelt de verzameling van allerijen rationale getallen in. Waarin? In equivalentieklassen natuurlijk. Iedererij rn ∈ IQ definieert een equivalentieklasse

[rn] = qn ∈ IQ : qn ∼ rn (28)

waar die rij zelf in zit, en een reeel getal is per definitie de equivalentieklassevan een Cauchyrij rn ∈ IQ.

So much for the construction of the real numbers en we zullen het ∼tekentje nu weer in laten leveren, omdat we dat symbool toch liever gebruikenals

xn ∼ yn ⇐⇒ xnyn→ 1 als n→∞

voor een andere en in de praktijk vaker gebruikte equivalentierelatie45 op deverzameling van alle reele rijen. Een voorbeeld is

n! ∼ (n

e)n√

2πn,

uitvoerig besproken46 in [HM].

43 In je hoofd of op de getallenlijn.44 Ook dat woord heeft een wiskundige definitie natuurlijk.45 Wel een goede vraag hierboven is: wat is de beste representant?46 Zie echter ook Sectie 5.8.

493

Page 494: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

27.6 Analyse in en van wat?

Of er nog andere verzamelingen zoals deze IR zijn is niet een standaardvraagom hier te stellen. Wel belangrijk voor een eerste vak over analyse is datde rationale getallen IQ, dat zijn de getallen die ontstaan als quotienten vangetallen in IZ en getallen in IN, de “Cauchy eigenschap” niet hebben. Dat is dereden waarom we de analyse in IR doen, het unieke geordende getallenlichaamwaarin (alle) Cauchyrijen en absoluut convergente reeksen convergent zijn.

In het Basisboek Wiskunde worden deze getallen besproken in Hoofdstuk24, en we gebruiken vrijwel dezelfde notaties, met de accolades ook. Leesook Hoofdstuk 25 nog even door, we nemen de daar gebruikte input-outputvoorstelling voor functies47 hier graag over als

xf−→ f(x) en Df

f−→ IR

met Df het domein van f . Het bereik en de grafiek48 van f zijn

Bf = f(x) : x ∈ Df en Gf = (x, y) : x ∈ Df , y = f(x).

Soms zullen we liever over functies f : IR → IR spreken die op een be-paalde deelverzameling van IR een bepaalde eigenschap hebben. Het domeinDf is dan de verzameling bestaande uit alle x ∈ IR waarvoor f(x) gedefini-eerd is. Is het domein van f niet heel IR, dan kun je natuurlijk altijd f(x)voor x-waarden buiten het domein een waarde geven die je toevallig goeduitkomt, nul bijvoorbeeld49.

In deze cursus behandelen we ondermeer de analyse die de calculus onder-bouwt voor functies f : I → IR met I ⊂ IR een interval. Vaak, met a, b ∈ IR,is I daarbij een gesloten begrensd interval

I = [a, b] = x ∈ IR : a ≤ x ≤ b,

of een open begrensd interval

I = (a, b) = x ∈ IR : a < x < b.

We beginnen met integraalrekening, eerst voor monotone functies, zonderover limieten te spreken, en daarna voor uniform continue functies f : [a, b]→IR, waarbij we voor het eerst het limietbegrip tegenkomen en nodig hebben.

Voor zulke functies wordt ∫ b

a

f(x) dx

494

Page 495: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

via benaderende sommen gedefinieerd in relatie tot wat de oppervlakte van Tekenplaatje!

het gebied ingesloten door x = a, x = b, y = 0 en y = f(x) in het x, y-vlakmoet zijn in het geval dat f een positieve functie is. Je zou kunnen zeggendat dit de eerste probleemstelling is in dit boek, geformuleerd in drie puntenals:

hoe definieer je de oppervlakte van niet meteen arbitraire verzamelingen;

en hoe reken je die vervolgens uit?

wat kun je vervolgens leren van de oplossing?

Dat laatste doe je dan wellicht zonder meteen een nieuw probleem te willenformuleren. Spelen met de verworven inzichten zonder een concreet doel opzich.

Bijvoorbeeld: met een variabele bovengrens in de integraal ontdekken wede opzet van de differentiaalrekening met behulp van lineaire benaderingen.Die werken we later uit voor machtreeksen

P (x) = α0 + α1x+ α2x2 + α3x

3 + · · · ,

waarmee we een grote klasse van standaardfuncties tot onze beschikking krij-gen, waarvoor “mag dat” vragen kort maar krachtig met “ja natuurlijk” tebeantwoorden zijn. Binnen die klasse is de analyse namelijk ondergeschiktaan de algebra, en zodra je die algebra goed begrijpt, voor x7 of zo, ben jewel klaar en daarmee dient een andere probleemstelling zich aan:

Hoe zit het met al die andere functies?

Als we buiten de klasse van machtreeksen treden verandert alles en moet ergewerkt worden. Dat werk halen we nu naar voren, waar we dat in [HM] zolang mogelijk uitstelden.

De middelwaardestelling blijkt het belangrijkste hulpmiddel om ogen-schijnlijk evidente uitspraken ook werkelijk te bewijzen. De uitspraak vandie stelling is dat differentiequotienten als

F (b)− F (a)

b− a,

de richtingcoefficient van

de lijn door (x, y) = (a, F (a) en (x, y) = (b, F (b))

47 Van het Latijnse fungor (deponens: een passieve vorm met actieve betekenis).48 Vaak slordig: de grafiek y = f(x) in het x, y-vlak.49 Zoals wel eens voorgesteld in relatie tot x→ 1

x en het rekenonderwijs.

495

Page 496: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

in het x, y-vlak, zelf doorgaans gelijk zijn aan de richtingscoefficient van deraaklijn aan de grafiek van F in een punt met x-waarde tussen a en b, lees:aan de met de differentiaalrekening gedefinieerde

afgeleide van F ′(x) van F (x) in een tussenpunt.

Is F ′(x) overal tussen a en b gelijk aan nul, dan is F (x) kennelijk constant, al-dus de NIET-TRIVIALE STELLING in [HM]. Die STELLING is niet zozeerde oplossing van een probleem, maar formuleert juist iets dat je zeker wil we-ten bij het oplossen van (bijvoorbeeld) differentiaalvergelijkingen. Het bewijsvan de STELLING maakt essentieel gebruik van een fundamentele stellingover het bestaan van convergente deelrijen, die, triviaal50 of niet, toch maareen apart hoofdstuk krijgt, waarin een wat minder bekende stelling die ikken via Han Peters wordt geformuleerd.

Vergelijkingen oplossen is een belangrijke tak van niet alleen maar re-creatieve sport51 in de wiskunde. In de context van vergelijkingen van devorm F (x, y) = 0, waarbij F een functie is van twee variabelen, introducerenwe daarom ook meteen maar het begrip impliciete functie, met als speciaalgeval het al behandelde begrip inverse functie. Het bewijs van de implicietefunctiestelling draaien we binnenste buiten in een aparte sectie, gevolgd doortwee secties waarin weer met verworven inzichten wordt gespeeld en een ba-sis wordt gelegd voor alles dat later komt. Na een zijstapje over de methodevan Newton wordt de basale theorie in Hoofdstuk 4 afgesloten met differen-tiaalrekening voor integralen met parameters, en partieel integreren en eenstelling over Taylorbenaderingen met polynomen.

Daarna nemen we in Hoofdstuk 5 de tijd voor voorbeelden en meer voor-beelden, en herhalen de rekenregels nog een keer in de kale context van func-ties van een variabele zonder er functies van x en y bij te halen, niet alleenvoor wie dat stuk in Hoofdstuk 4 heeft overgeslagen. We gaan uitvoerig in opde natuurlijke logaritme ln als inverse van de exponentiele functie exp en in-troduceren in die context ook zogenaamde asymptotische formules, waarvande formule van Stirling52 voor n! als n→∞ een mooi voorbeeld53 is.

In het tweede deel, dat begint met Hoofdstuk 6, kunnen we de meeste vande in het eerste deel geformuleerde definities, stellingen en bewijzen uit dedifferentiaalrekening voor functies van IR naar IR vrijwel letterlijk overnemen.Alleen de notaties hoeven nog te worden uitgepakt. We beginnen daartoe metIC, de verzameling van de complexe getallen, en een in ons Leidse wat vergetenmaar wel zo snel bewijs van de hoofdstelling van de algebra. Daarna komen

50 Denk ook aan valsspelen met meetwaarden.51 Geen sport zonder techniek.52 De voorbeeldformule met ∼ een paar pagina’s terug, uit te spreken als “twiddles”.53 En buitengewoon relevant voor probleemstellingen in de natuurkunde.

496

Page 497: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

functies van IC naar IC en afbeeldingen en functies met meerdere variabelen.Lineaire functies beschrijven we dan in matrixnotatie, en matrixrekeningbehandelen we daartoe zo kort door de bocht als hier mogelijk en voor hetuitpakken voldoende is.

De kettingregel is een belangrijk voorbeeld en we laten zien hoe die regelop verschillende manieren wordt gebruikt, ook in de door fysici gebruiktemanipulaties met afhankelijke en onafhankelijke grootheden bij het transfor-meren en oplossen van partiele differentiaalvergelijkingen. Integraalrekeningin het vlak wordt nog wat kort behandeld, zowel in rechthoekige als in deuitvoerig besproken poolcoordinaten.

Nieuw is daarna de opzet van complexe functietheorie met lijnintegra-len over alleen maar lijnstukjes en meteen de belangrijke hoofdstellingen,eerst zonder kromme poespas. Daarna bekijken we onderzoekend wat voorkromme krommen we na limietovergangen krijgen, en hoe we daarlangs kun-nen integreren. De aanpak is zo precies tegenovergesteld aan de die van Con-way, wiens fraaie opzet met equivalentieklassen van rectificeerbare krommenhier niet realiseerbaar is. Naast, voor of na de kromme aanpak, verkennen wede toepassingen van de hoofdstellingen bij het uitbreiden van de definitie vanf(z) met z ∈ IC naar f(A), eerst voor A : IR2 → IR2 een lineaire afbeeldinggegeven door een matrix, en daarna algemener, voor A van een (uiteinde-lijke complexe) Banachruimte X naar zichzelf. Een eerste kennismaking metBanachalgebra’s54 ligt hier voor de hand.

Gewone differentiaalvergelijkingen, al aan de orde geweest in de contextvan machtreeksen, motiveren het opnemen van Hoofdstuk 10, waarin we ookde calculus voor functies op en naar Banachruimten introduceren, met alsbelangrijkste voorbeeld X = C([a, b]), de ruimte van de continue IR-waardigefuncties op een interval [a, b], waarin we de bijbehorende integraalvergelijkin-gen formuleren en oplossen.

De impliciete functiestelling uit Hoofdstuk 4 kan dan weer worden over-geschreven. In Hoofdstuk 6 doen we dat al in een moeite door in combinatiede multiplicatorenmethode van Lagrange55 voor stationaire punten van ge-wone functies van meer variabelen onder randvoorwaarden. Essentieel hieris het inzicht dat de oplossingsverzameling van een stelsel van bijvoorbeeld 3vergelijkingen in IR5=2+3, lokaal te schrijven is als de grafiek van een functievan x ∈ IR2 naar y ∈ IR3, tenzij er te veel nullen in de relevante berekeningenvoorkomen.

De term onderdompeling wordt hier nog niet geintroduceerd56. De meer

54 Door mijn medestudenten destijds ook wel Bananachalgebra’s genoemd.55 De eerste stelling die ik ooit zelf aan anderen uitlegde, maar nu heel anders.56 Zie www.encyclo.nl/begrip/Submersie en www.encyclo.nl/begrip/Immersie.

497

Page 498: Basisboek Analyse - bet · PDF filefunctie f: [a;b] !IR een maximum en ... 3 I’m using search and replace to substitute 10 = nin our modern notation. ... verifying that in particular

abstracte formulering van de methode van Lagrange in Hoofdstuk 11 is opge-nomen for amusement. Ook wat pittiger is de behandeling van tweede ordeafgeleiden die we pas in abstracte setting in meer detail doen. Het hoofdresul-taat is het Lemma van Morse, Stelling 11.6, waarin met een coordinatentransformatieeen functie waarvan de tweede afgeleide continu is, in de buurt van een sta-tionair punt puur kwadratisch gemaakt wordt. Denk aan

F (x, y) = ax2 + bxy + cy2 + · · ·

en een transformatie die de puntjes wegwerkt als de discriminant niet gelijkis aan 0.

Zo’n transformatie is van de vorm(ξ

η

)= A(x, y)

(x

y

),

met A(x, y) een van x en y afhankelijke matrix met

A(0, 0) =

(1 0

0 1

),

die maakt datF (x, y) = aξ2 + bξη + cη2.

We laten zien hoe A = A(x, y) gevonden kan worden als oplossing van eenkwadratische matrixvergelijking voor A die met worteltrekken kan wordenopgelost.

We besluiten met Hoofdstuk 12, eigenlijk een appendix, waarin we hetgebruikelijke jargon met metrieken, omgevingen en open en gesloten verza-melingen samenvatten voor wie zich minder gelukkig voelt met informeleuitdrukkingen als in de buurt van, zoals ook Adams die gebruikt in zijn nuvrijwel overal gebruikte calculus boek, dat door de theoretisch hoofdstukkenin dit boek stevig wordt onderbouwd.

498