Das Internet Die unendlichen Weiten der Neuzeit. Viele Browser 22.05.2013 Ihr Name steht hier ;-)
Vorlesungsskript Analysis I und II · war es mit vielen mathematischen Konzepten, zum Beispiel dem...
Transcript of Vorlesungsskript Analysis I und II · war es mit vielen mathematischen Konzepten, zum Beispiel dem...
Vorlesungsskript Analysis I und II
Prof. Bernd Ammann
Wintersemester 2018/19
Sommersemester 2019
Universitat Regensburg
Datum der aktuellen Version: 26. Juli 2019
Großdruck
Inhaltsverzeichnis
Vorwort vii
Logischer Aufbau des ersten Kapitels ix
Warnungen ix
Kapitel 1. Elementare Logik und Grundlagen der Mathematik 1
1. Die Struktur des mathematischen Denkens 1
2. Aussagenlogik 8
3. Mengen 18
4. Quantoren 25
5. Potenzmenge und Mengensysteme 30
6. Paare und kartesische Produkte 32
7. Relationen, funktionale Relationen, Abbildungen 36
8. Familien 49
Literatur fur das bisherige Kapitel 52
Kapitel 2. Zahlen 53
1. Die naturlichen Zahlen 53
2. Etwas Kombinatorik 63
3. Die ganzen Zahlen 72
4. Die rationalen Zahlen 74
i
ii INHALTSVERZEICHNIS
5. Geordnete Korper 77
6. Die reellen Zahlen 84
6.1. Unzulanglichkeit von Q 85
6.2. Die Supremumseigenschaft 86
6.3. Axiome der reellen Zahlen 90
6.4. Dedekindsche Schnitte 94
7. Die komplexen Zahlen 112
Kapitel 3. Folgen und Reihen 121
1. Folgen 121
1.1. Konvergenz von Folgen 121
1.2. Monotone Folgen 129
1.3. Teilfolgen 131
1.4. Erweiterte reelle Zahlen und uneigentliche Konvergenz 132
1.5. Limes inferior und superior 137
1.6. Cauchy-Folgen 141
2. Reihen 144
2.1. Motivation von Reihen: Dezimal-Darstellung reeller Zahlen 144
2.2. Definition und elementare Eigenschaften 148
2.3. Konvergenzkriterien 151
2.4. Absolute Konvergenz 159
2.5. Alternierende Reihen 160
2.6. Umordnung von Reihen 163
3. Einige durch Reihen definierte Funktionen 171
3.1. Exponentialfunktion 171
INHALTSVERZEICHNIS iii
3.2. Sinus- und Kosinus-Funktion 175
3.3. Eulersche Zahl 179
3.4. Exponentialfunktion (Fortsetzung) 181
Kapitel 4. Stetigkeit und Grenzwerte von Funktionen 183
1. Stetigkeit 183
2. Zwischenwertsatz 188
3. Stetigkeit von exp, cos und sin und Definition von log 192
4. Die Kreizahl π und Periodizitat von cos und sin. 196
5. Metrische Raume und Grundbegriffe der Topologie 198
6. Grenzwerte von Funktionen 209
Kapitel 5. Differential-Rechnung fur Funktionen einer Veranderlichen 213
1. Definition und elementare Eigenschaften 213
2. Lokale Extrema 220
3. Mittelwertsatze 221
4. Hohere Ableitungen und Taylorscher Satz 223
Kapitel 6. Integral-Rechnung fur Funktionen einer Veranderlichen 231
1. Partitionen und Treppenfunktionen 231
2. Das Riemann-Integral 233
3. Monotone Funktionen sind Riemann-integrierbar 240
4. Stetige Funktionen sind Riemann-integrierbar 242
5. Hauptsatz der Differential- und Integralrechnung 243
6. Uneigentliche Riemann-Integrale 251
Kapitel 7. Stetigkeit und Differenzierbarkeit von Grenzwerten und Reihen 255
iv INHALTSVERZEICHNIS
1. Metrische Raume: Wiederholung und Cauchy-Folgen 255
2. Punktweise und gleichmaßige Konvergenz 258
3. Differentiation von Folgen und Reihen 265
4. Potenzreihen und analytische Funktionen 269
Kapitel 8. Topologie 273
1. Normierte Vektorraume 273
2. Kontraktionen und Banachscher Fixpunktsatz 283
3. Topologische Raume 286
3.1. Wiederholung: Eigenschaften eines metrischen Raums 286
3.2. Definition topologischer Raume 287
3.3. Konvergenz in topologischen Raumen 292
4. Zusammenhang und Wegzusammenhang 296
5. Folgenkompaktheit 299
6. Kompaktheit 303
Kapitel 9. Differential-Rechnung fur Funktionen in mehreren Veranderlichen 313
1. Vorbemerkungen 313
2. Differenzierbarkeit in mehreren Variablen 316
3. Hohere Ableitungen 334
3.1. Satz von Schwarz 334
3.2. Hohere Ableitungen als multi-lineare Abbildungen 340
3.3. Satz von Taylor 343
3.4. Einschub: Quadratische Formen 346
3.5. Lokale Extrema 351
4. Lokale Umkehrung differenzierbarer Abbildungen 354
INHALTSVERZEICHNIS v
5. Der Satz uber implizit definierte Funktionen 363
6. Untermannigfaltigkeiten 370
6.1. Definition und erste Beispiele 370
6.2. Der Satz vom regularen Wert 374
6.3. Der Immersionssatz 381
6.4. Einbettungen von Untermannigfaltigkeiten 384
6.5. Lokale Parametrisierungen von Untermannigfaltigkeiten 387
6.6. Der Tangentialraum 392
7. Extrema mit Nebenbedingungen 394
Kapitel 10. Gewohnliche Differentialgleichungen 399
1. Motivation 399
2. Definition und Reduktion auf autonome Gleichungen erster Ordnung 402
3. Flusslinien und Erhaltungsgroßen 407
4. Der Satz von Picard-Lindelof 411
5. Picard-Lindelof fur gewohnliche Differentialgleichungen hoherer Ordnung 428
6. Lineare gewohnliche Differentialgleichungen 429
7. Lineare gewohnliche Differentialgleichungen mit konstanten Koeffizienten 437
8. Differentialgleichungen mit getrennten Variablen 438
9. Mehr zum Fluss eines zeitabhangigen Vektorfelds 441
10. Einige Kommentare zum Langzeitverhalten von gew. Diffifferentialgleichungen445
11. Stabilitat und Verhalten in der Nahe von kritischen Punkten 448
Anhang A. Mehr Details zu den Grundlagen der Logik 453
1. Das Russellsche Paradoxon 453
2. Axiomatische Mengenlehre 455
vi INHALTSVERZEICHNIS
Anhang B. Die Peano-Axiome 461
1. Die Axiome und erste Konsequenzen 461
2. Vollstandige Induktion und rekursive Definition 466
3. Ordnung der naturlichen Zahlen 472
Anhang C. Konstruktion von R mit Hilfe von Cauchy-Folgen 477
1. Mehr zu Aquivalenzrelationen 477
2. Folgen, Konvergenz und Cauchy-Folgen 480
3. Existenz und Eindeutigkeit der reellen Zahlen 492
Anhang Z. Uberblick uber algebraische Strukturen 499
Anhang. Literaturverzeichnis 501
Anhang. Stichworte 503
Anhang. Symbole 513
VORWORT vii
Vorwort
Dies ist das Skript zu den Vorlesungen”Analysis I“ und
”Analysis II“, die ich im Win-
tersemester 2018/19 und Sommersemester 2019 an der Universitat Regensburg halte. Das
Skript sollte ungefahr das enthalten, was an der Tafel stand, und zusatzlich einige dazu
gegebene Erklarungen widerspiegeln. Anhange erganzen die Themen, sie wurden nicht
in der Vorlesung behandelt. Einige Beispiele und Erweiterungen, die aus Zeitgrunden
nicht in der Vorlesung behandelt wurden, sind so gedruckt, und sind naturlich gut fur die
Nachbereitung beziehungsweise Vertiefung geeignet. Falls Sie einen Tippfehler finden oder
sonstige Verbesserungsvorschlage haben, so senden Sie bitte eine Email an mich. Leider
enthalt das Skript bisher nur wenige Bilder und Zeichnungen.
Die aktuelle Version ist unter dem Link
http://www.mathematik.ur.de/ammann/lehre/2019s_analysis2/analysisi+II.pdf
verfugbar.
Die Homepage der Vorlesung ist
http://www.mathematik.ur.de/ammann/lehre/2010s_analysis2.
Regensburg, April 2019,
Bernd Ammann
WARNUNGEN ix
Logischer Aufbau des ersten Kapitels
Die Abschnitte des ersten Kapitels sind – aus Sichtweise des logischen Aufbaus – nicht
optimal angeordnet. Unter anderem werden Begriffe wie Mengen, Funktionen, kartesische
Produkte und ahnliches teilweise benutzt, bevor sie eingefuhrt werden. Dies erscheint ver-
tretbar, da ich davon ausgehe, dass jede(r) Horer(in) bereits eine gewisse Vorstellung von
manchen der Begriffen hat, und wenn nicht, dann wird es sich in einem zweiten Durchgang
klaren, was gemeint ist. Die in der Vorlesung und im Skript gewahlte Reihenfolge hat den
Vorteil, dass man bereits fruh in den Ubungen auf die wichtigen Punkte eingehen kann,
wie zum Beispiel die Themen Aussagenlogik und Quantoren.
Ich empfehle, mit einem gewissen zeitlichen Abstand dieses Kapitel noch einmal durch-
zuschauen, dann wird wahrscheinlich manches bisher unklare sich klaren.
Warnungen
Legen Sie das Skript nicht in eine Ecke mit dem ruhigen Gewissen, es ja spater lesen
und durcharbeiten zu konnen. Beginnen Sie sobald wie moglich, die Lucken zu schließen.
Schwierige Beweise durchschauen Sie am besten, wenn Sie sich uberlegen, was der Beweis
in konkreten Beispielen macht.
Bilder, Skizzen und Abschnitte die mit USW angedeutet werden, in der Vorlesung be-
handelt wurden, aber aus Zeitgrunden noch nicht getext wurden, sind selbstverstandlich
auch relevant fur mundliche und schriftliche Prufungen.
KAPITEL 1
Elementare Logik und Grundlagen der Mathematik
1. Die Struktur des mathematischen Denkens17.10.
Die naturlichen Zahlen werden seit Jahrtausenden intuitiv benutzt und untersucht. Sie
sind uns vertraut, ohne dass wir aber zunachst wissen, was sie charakterisiert. So ahnlich
war es mit vielen mathematischen Konzepten, zum Beispiel dem mathematischen Konzept
der unendlichen Summe. Man nutzte viele Konzepte lange in einer vagen Bedeutung, ohne
sich zu uberlegen, wie man sie definiert. Alle Personen stimmen wohl uberein, dass der
Wert der unendlichen Summe
1 +1
2+
1
4+
1
8+ · · ·
die Zahl 2 sein sollte. Und derartige unendliche Summen sind oft wichtig, zum Beispiel in
der Zinseszinsrechnung, bei physikalischen Problemen und vielem mehr. Deswegen wurden
Sie bereits im Mittelalter diskutiert. Leider fuhrte eine genauere Betrachtung zu wach-
senden Problemen. Es gab unter anderem viele Diskussionen, was denn der Wert der
unendlichen Summe
1 + (−1) + 1 + (−1) + . . .
sei, manche Gelehrte vertraten die Ansicht es sei 0: mit der Begundung
(1 + (−1)) + (1 + (−1)) + (1 + (−1)) + . . . = 0 + 0 + 0 + . . . = 0.
1
2 1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
Dies erscheint uberzeugend. Mit derselben Logik kann man aber auch begrunden, dass
man den Wert 1 erhalt:
1 + ((−1) + 1) + ((−1) + 1) + . . . = 1 + 0 + 0 + . . . = 1.
Derartige Probleme motivierten die Mathematiker, die Mathematik auf solide Grundlagen
zu stellen. Diese Bewegungen, die man Axiomatik nennen kann, begann im Bereich der
Geometrie bereits mit Euklid von Alexandria (ca. 300 v. Chr.) und Aristoteles (384–
322 v. Chr.). Wichtige Fortschritte in der Axiomatik der Geometrie und insgesamt der
Axiomatik wurden im 19. Jahrhundert vollbracht.
Das Ziel der Axiomatik ist es, die gesamte Mathematik aus wenigen Grundaussagen,
sogenannten Axiomen, herzuleiten.
Nehmen wir mal an, ich uberlege mir, ob ich uberhaupt existiere oder nicht. Mein Leben
und meine Person konnte ja auch nur das Ergebnis einer Simulation eines gigantischen
Großrechners sein. Was konnte ich tun, um diese Frage zu losen? Ich kann mir selbst
wehtun, ich empfinde Schmerz, also sollte ich existieren! Falsch, das konnte Teil der gi-
gantischen Simulation sein. Ich konnte einen Studenten in der hinteren Reihe fragen, ob
ich existiere, er sagt ja. Ist dadurch meine Existenz bewiesen? Nein, denn er konnte Teil
derselben Simulation sein. Sie sehen, ich kann meine eigene Existenz nicht zeigen, ohne
andere Grundannahmen zu machen. Dennoch ist es sehr sinnvoll anzunehmen, dass ich
existiere. Solche Probleme beschaftigen die Philosophen schon seit Jahrhunderten oder
besser Jahrtausenden.
Genauso wie aber unser elementares Denken Grundannahmen braucht, benotigt auch die
Mathematik bestimmte Grundannahmen, und diese Grundannahmen nennt man Axiome.
Im Prinzip sollte in der heutigen Mathematik alles auf den Axiomen der Mengenlehre
1. DIE STRUKTUR DES MATHEMATISCHEN DENKENS 3
aufbauen. Daraus konstruiert man sich dann alle Objekte des mathematischen Denkens:
Zahlen, Vektorraume, Matrizen, und vieles mehr. Oft versieht man Teilgebiete mit eigenen
Axiomen, wie zum Beispiel die Axiome der klassischen Geometrie.
Axiome sind nicht mehr weiter beweisbar, sie werden einfach als gegeben hingenommen,
als Grundannahmen unseres Denkens. Die Axiome erscheinen sinnvoll, entweder weil man
sie als evident, also offensichtlich ansieht, oder weil man sie als Kennzeichen der Theo-
rie ansieht. Aus diesen Axiomen werden dann Schlussfolgerungen gezogen, die ebenfalls
durch weitere Axiome geregelt sind. Durch erlaubte Kombinationen von bereits bekannten
wahren Aussagen erhalt man neue wahre Aussagen. Eine Sammlung von so aufeinander
aufbauenden wahren Aussagen, nennt man Beweis. Falls eine so erhaltene Aussage inter-
essant erscheint, nennt man sie Theorem, Lemma, Korollar, Proposition, Satz, Hilfssatz,
Folgerung oder ahnlich. Hierbei ist im allgemeinen ein Satz oder ein Theorem eine wichti-
ge Aussage, ein Lemma oder ein Hilfssatz eine Aussage, die nur als Zwischenschritt dient,
und eine Proposition hat eine Mittelstellung. Erhalt man eine Aussage nahezu unmittelbar
aus einem Theorem oder Satz, so nennt man dies eine Folgerung oder ein Korollar.
Damit die Aussagen nicht immer langer und langer werden, macht man Definitionen.
Hierbei gibt man mathematischen Objekten oder mathematischen Sachverhalten einen
Namen.
Die Mathematiker sind im Prinzip recht frei in der Wahl ihrer Definitionen. So konnte
man die folgende Definition machen: Ein Auto ist eine Menge, in der die Elemente 1, 2
und 3 enthalten sind. Ein Hund ist eine Menge, in der die Elemente 1 und 2 enthalten
sind. Man schließt daraus, dass jedes Auto einen Hund enthalt. Diese Definitionen sind
naturlich sehr irrefuhrend, aber prinzipiell erlaubt. Wir Mathematiker bemuhen uns die
4 1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
Dinge so zu benennen, dass sie moglichst etwas mit der”wirklichen Welt“ zu tun haben.
Um Koordinaten auf einer Kugel anzugeben, definiert man den Begriff einer”Karte“,
und ein”Atlas“ ist dann definiert als Menge von Karten, so dass alles uberdeckt wird.
Diese Begriffe sind dann zwar nicht genau das, was man damit umgangssprachlich meint,
aber auch nicht vollig ohne Zusammenhang. Die mathematischen Begriffe”Halm“ oder
”Garbe“ der Mathematik haben aber keinerlei Anwendungen in der Landwirtschaft. Die
”Knoten“ der Mathematik sind aber wiederum nahe an dem, was man alltagssprachlich
als Knoten bezeichnet.
Um den Unterschied zwischen Definitionen und Aussagen klar zu unterscheiden, nutzen
wir die folgende Notation: a = 1, 234 ist die Aussage”a ist gleich 1, 234“. Hingegen ist
a := 1, 234 eine Definition, a ist ab sofort eine kurze Schreibweise fur 1, 234.
Viele Definitionen werden von allen Mathematikern gleich gemacht, es herrscht Konsens.
Man ist sich aber nicht einig, ob die Definition der naturlichen Zahlen die Null einschließen
soll oder nicht. Fur unsere Vorlesung gilt: die naturlichen Zahlen sind
N = {0, 1, 2, . . .}.
Die Menge N>0 := {1, 2, 3, . . .} bezeichnen wir als naturliche Zahlen ohne Null. Dies ist
eine der ublichen Definitionen. Viele Mathematiker definieren hingegen die Menge der
naturlichen Zahlen als {1, 2 . . .}. Dass verschiedene Mathematiker die Definition verschie-
den wahlen, ist nicht weiter schlimm. Ob Null eine naturliche Zahl ist oder nicht, ist eben
Definitionssache. Man schaut sich die Definition des Autors an und weiß, was er meint.
In zentralistischen Landern wie Frankreich ist klar geregelt: Null ist eine naturliche Zahl.
In Deutschland besagt DIN 5473 ebenfalls, dass Null eine naturliche Zahl ist. Lehrer
in der Schule sollten sich an diese DIN-Norm halten. Außer man wohnt in Bayern. An
1. DIE STRUKTUR DES MATHEMATISCHEN DENKENS 5
bayerischen Schulen ist Null keine naturliche Zahl, und daran sollte man sich als Lehrer
auch halten, um die Schuler nicht zu verwirren.
Da die meisten Horer dieser Vorlesung ja gleichzeitig Lineare Algebra bei Denis-Charles
Cisinski horen, und er Franzose ist, ist bei uns Null eine naturliche Zahl. Die zukunfti-
gen bayerischen Lehrer mogen dies bitte verzeihen und freuen sich vielleicht uber diese
”Zusatzqualifikation“ fur andere Bundeslander.
Anders ist es bei der Zahl π. Dass der Wert dieser Zahl zwischen 3,1415 und 3,1416 liegt ist
eine Aussage und keine Definition. Deswegen ist es lacherlich, dass der US-Bundesstaat
Indiana 1897 den Wert von π auf 3, 2 gesetzlich festlegen wollte, um Berechnungen zu
vereinfachen und um es den Schulern einfacher zu machen.
Wenn wir nun aber hier in der Vorlesung alles rigoros mit der eigentlich notwendigen
mathematischen Strenge einfuhren wurden, so mussten wir dem Aufbau der Mathematik
folgen. Die Grundlagen hierbei bilden die Axiome der Logik und der Mengenlehre. Aus
ihnen werden viele Aussagen gezeigt, und man kann dann irgendwann die naturlichen
Zahlen, die ganzen Zahlen, die rationalen Zahlen und die reellen Zahlen einfuhren1 und
deren Eigenschaften studieren. Die reellen Zahlen erfullen auch wieder einige wichtige
Aussagen, die wir vorlaufig die Grundeigenschaften der reellen Zahlen nennen wollen. Aus
diesen Grundeigenschaften der reellen Zahlen kann man nun alle wichtigen Aussagen der
Analysis herleiten. Nahezu alles, was wir zusammen in den nachsten Semestern behandeln
werden, ergibt sich aus diesen Grundeigenschaften.
1mathematisch genauer gesagt: definieren
6 1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
Nun gibt es aber ganz verschiedene Moglichkeiten, die reellen Zahlen zu definieren: in der
Schule habe ich die Moglichkeit mit Intervall-Schachtelung kennengelernt, in der Vorle-
sung hier wollen wir Dedekindsche Schnitte behandeln, vor 5 Jahren in meiner Analysis I
habe ich sie mit Hilfe von Cauchy-Folgen definiert. Jeder Zugang hat seine Vorteile und
Nachteile in Bezug auf Anschaulichkeit und Verallgemeinerbarkeit. Wichtig ist hierbei:
egal, wie man es macht, es ergeben sich immer die selben Grundeigenschaften. Deswe-
gen ist es sinnvoll, die Grundeigenschaften der reellen Zahlen als die Axiome der reellen
Zahlen zu bezeichnen und dann alles aus diesen Axiomen der reellen Zahlen herzuleiten.
Genauso haben auch die naturliche Zahlen ihre Axiome, die sogenannten Peano-Axiome2.
Alle von Ihnen, die gleichzeitig die Lineare Algebra I besuchen, lernen dort die Axiome
eines Vektorraums kennen und leiten daraus dann alle Eigenschaften ab, die Sie uber
Vektorraume wissen sollten.3
In der Vorlesung konnen wir nun aber leider nicht alles streng axiomatisch einfuhren, da
dies viel zu lange dauern wurde und die meisten von Ihnen auch nicht die notige Geduld
dafur aufbringen wurden – vielleicht nicht einmal ich. Wir mussen also zu Anfang einen
Kompromiss zwischen der notigen Strenge und der angemessenen Kurze finden.
Der Plan ist deswegen, zunachst Begriffe wie Mengen, Abbildungen, logische Operationen
und viele ahnliche Begriffe nur intuitiv einzufuhren, also ohne die richtige mathematische
Strenge.
Im Anhang A im Skript gebe ich einen kleinen Einblick, wie man die Mengenlehre mathe-
matisch stringenter einfuhren kann. Die zugehorigen Abschnitte A.1 und A.2 werde ich in
2siehe Anhang B3Das Wort
”Sie“ ist bewusst groß geschrieben, da ich der Meinung bin, dass alle hier im Publikum
dies beherrschen sollten.
1. DIE STRUKTUR DES MATHEMATISCHEN DENKENS 7
der Vorlesung nicht behandeln, aber ich empfehle ihn allen interessierten Studierenden zur
Lekture. Wenn Sie die Mengenlehre noch besser axiomatisch verstehen wollen, so ist es
am besten, wenn Sie begleitend sich etwas selbst durcharbeiten, z.B. das Buch [17], aber
auch da werden letztendlich Fragen zuruckbleiben. Wenn Sie die Mengenlehre”richtig“
verstehen wollen, sollten Sie spater mit einer gewissen mathematischen Reife, also in zwei
oder drei Semester, die Logik nochmals systematisch studieren, z.B. an Hand der Bucher
[13] oder [20].
Nachdem das einfuhrende Kapitel beendet ist, wenden wir uns den Zahlen zu. Wir be-
schreiben grundlegende Eigenschaften der naturlichen, ganzen, rationalen, reellen und
komplexen Zahlen. Auch da werden wir in Teilen nicht streng mathematisch vorgehen.
Ich gehe zum Beispiel davon aus, dass Sie intuitiv wissen, was die naturlichen, ganzen und
rationalen Zahlen sind. Eigentlich ware es aber auch wichtig, zum Beispiel die naturlichen
Zahlen axiomatisch durch die Peano-Axiome (Anhang B) zu beschreiben. Es ist namlich
zunachst nicht so recht klar, was denn die Punkte in der Definition N = {0, 1, 2, . . .}
bedeuten soll. Dies soll in der Linearen Algebra I genauer behandelt werden.
Wir werden dann zu den reellen Zahlen kommen. Da diese fur die Analysis ganz zentral
sind, werden wir die Axiome diskutieren und von da an alles grundlich auf den Axiomen
der reellen Zahlen aufbauen: Folgen, Reihen, Differentiation, Integration und vieles mehr.
Wichtig ist auch, dass Sie sich bewusst werden, was Sie in den nachsten Wochen alles
lernen sollten. Den mathematischen Inhalt der Vorlesung sollten Sie durchdringen, damit
umgehen lernen und danach nie wieder vergessen. Viel wichtiger aber noch ist, dass die
meisten von Ihnen Ihre gewohnte Arbeitsweise umstellen mussen. Es geht dabei beim
weitem nicht nur darum, dass Sie von nun an in vieler Hinsicht fur Ihr Lernen und Ihre
8 1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
Lernmethoden selbst verantwortlich sind, sondern vor allem darum, dass Sie das oben
diskutierte rigorose Argumentieren lernen.
Sie mussen klar unterscheiden konnen zwischen Axiomen, Definitionen und Aussagen
(Satzen, Theoremen, Lemmata, Propositionen,...). Sie mussen lernen, Beweise zu verifi-
zieren. Und Sie mussen lernen, Ideen zu bekommen, wie Sie selbst Beweise fuhren, und
auch lernen, wie Sie dann diesen Beweis gut aufschreiben. Dies zu lernen, ist nur durch
eine intensive Ruckmeldung moglich, und das geht naturlich nicht in der großen Vorlesung
hier. Deswegen sind die Ubungen fur Sie ganz wichtig.
2. Aussagenlogik
Was ist eine Aussage?
Beispiele 2.1. Die folgenden Ausdrucke sind Aussagen
A1: 2 ∗ 3 = 6
A2: 2 + 2 = 1 + 3
A3: Die Zahl 27 hat 4 Teiler.
A4: Alle naturliche Zahlen haben eine Primfaktor-Zerlegung
A5: Am 13.9.2018 hatte die Donau in Regensburg Hochwasser
A6: Christian Lindner wurde im September 2018 zum Bundeskanzler gewahlt
Wir gehen davon aus, dass wir eine Sprache haben, die aus Zeichenketten besteht. Manche
Zeichenketten ergeben keinen Sinn, zum Beispiel”hejekl“ oder
”Hund Maus Loch“, wir
2. AUSSAGENLOGIK 9
nennen sie syntaktisch nicht sinnvoll. Wenn die Zeichenkette etwas aussagt, so nennen wir
sie syntaktisch sinnvoll. 4
Definition 2.2. Eine Aussage ist eine syntaktisch sinnvolle Zeichenkette, die entweder
wahr (w) oder falsch (f) ist.
Eine dritte Moglichkeit gibt es nicht (lateinisch:”tertium non datur“).
A1 bis A6 sind Aussagen, A1 bis A4 sind wahr, A5 und A6 sind falsch. Wenn eine Aussage
wahr ist, so sagen wir auch:”Die Aussage gilt.“
Bemerkung 2.3. Es gibt Wissenschaftsbereiche, in den das”tertium non datur“ nicht
gilt, in denen also neben”wahr“ und
”falsch“ weitere Moglichkeiten zugelassen werden.
Z.B. in der Quantenmechanik (Schrodingers Katze ist weder tot noch lebendig), Aussagen
in der Wahrscheinlichkeitstheorie (Es regnet morgen mit Wahrscheinlichkeit 0,3), Philo-
sophie, Teilgebiete der Logik. In unserer Vorlesung sind aber gemaß obiger Definition nur
Aussagen zulassig, die entweder wahr oder falsch sind.
Man kann Aussagen durch elementare logische Operationen verknupfen. Man kann diese
Operationen zum Beispiel durch Wahrheitstafeln definieren.
Definition 2.4 (Negation). Die Negation ¬ wird durch die folgende Wahrheitstafel de-
finiert
A ¬A
w f
f w
4Dies soll hier nicht genauer definiert und spezifiziert werden, da es fur unsere Zwecke unwichtig ist.
10 1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
LEMMA 2.5. Fur alle Aussagen A gilt ¬(¬A) = A
Beweis. Wir unterscheiden zwei Falle.
1. Fall: A ist wahr
A ist wahr =⇒ ¬A ist falsch =⇒ ¬(¬A) ist wahr
2. Fall: A = f
A ist falsch =⇒ ¬A ist wahr =⇒ ¬(¬A) ist falsch
Definition 2.6 (Aussagenlogische Verknupfungen). Die Und-Verknupfung ∧, die Oder-
Verknupfung ∨, die Entweder-Oder-Verknupfung Y, die Implikation (Wenn-Dann-Bezie-
hung) →, die umgekehrte Implikation (Dann-Wenn-Beziehung5) ← und die Aquivalenz
(Genau-Dann-Wenn-Beziehung) ↔ sind durch die folgende Wahrheitstafel definiert
A B A ∧B A ∨B A YB → ← ↔
w w w w f w w w
w f f w w f w f
f w f w w w f f
f f f f f w w w
Ist die Aussage A↔ B wahr, so sagen wir auch A und B sind aquivalent.
In zusammengesetzen Ausdrucken sind Negationen zuerst auszufuhren, ansonsten muss
man durch Klammern die Reihenfolge klaren sofern notig. Zum Beispiel gilt
¬A ∧B = (¬A) ∧B5Beispiel: (Die Straße wird nass.) ← (Es regnet.). In Worten: Die Straße wird (dann) nass, wenn es
regnet. Man kann logisch aquivalent auch sagen: Es regnet nur dann, wenn die Straße nass wird.
2. AUSSAGENLOGIK 11
und dies ist im allgemeinen nicht dasselbe wie ¬(A ∧ B). Man darf aber die Klammern
weglassen, wenn das Resultat nicht von der Reihenfolge abhangt, Beispiele spater. 19.10.
Bisher haben wir nun angenommenA,B seien feste Aussagen. Oft steht der Wahrheitswert
von einem Ausdruck noch gar nicht fest, z.B.
A: Am 1.2.2024 wird es ein Erbeben in Japan geben
Um auch solche Ausdrucke behandeln zu konnen, deren Wahrheitswert noch nicht festge-
legt ist, fuhren wir nun Aussageformen ein.
Definition 2.7 (Ausageform). Eine Aussageform ist eine eine syntaktisch sinnvolle Zei-
chenkette, die
• entweder eine Aussage ist, oder
• die von einer oder mehreren Variablen abhangt und die erst nach Einsetzen von
Werten in diese Variablen zu einer Aussage wird.
Hierbei muss man angeben, welche Werte fur die Variablen uberhaupt zugelassen sind.
Eine Aussageform A(x) in einer Variablen x besteht also aus der Angabe der zulassi-
gen Werte von x, die wir zu einer Menge M zusammenfassen, und einer Abbildung
A : M−→{w, f}, x 7→ A(x). Letztere Schreibweise bedeutet, dass jedem zulassigen Wert
von x ein Wert A(x) zugeordnet ist, der entweder wahr (w) oder falsch (f) ist.6 Hangt
6Der Pfeil −→ in der Abbildungsbeschreibung ist nicht zu verwechseln mit der Implikation →, des-
wegen wollen wir den ersteren zunachst langer und in roter Farbe schreiben. Spater wird immer klar sein,
welche Bedeutung der Pfeil nun hat und wir schreiben dann immer →. Wir setzen hier voraus, dass die
Begriffe”Menge“,
”Produkte von Mengen“ und
”Abbildung“ Ihnen bereits intuitiv vertraut sind, wenn
nicht dann sind die Erklarungen dieses Abschnitts erst in ungefahr zwei Wochen verstandlich.
12 1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
A(x1, x2, . . .) von mehreren Variablen hat, so sollte eine Wertemenge M1 fur x1, eine
Wertemenge M2 fur x2 etc. vorgeben werden. Aussageformen in 2 Variablen sind also
Abbildungen:
A : M1 ×M2−→{w, f}, (x1, x2) 7→ A(x1, x2).
Beispiele 2.8.
A1(x) : x > 0 Zulassig: x ∈ R
A2(X) : Das Auto X ist rot Zulassig: Alle Autos X der Welt
A3(B,C) : B ∨ C Zulassig: B und C sind Aussagen.
A4(B,C,D,E) : (B ∨ C)→ (¬D ∧ E) Zulassig: B, C, D und E sind Aussagen.
Sind wahr und falsch die zulassigen Werte der Variablen x, so nennt man x eine aussa-
genlogische Variable. Verknupft man ausagelogische Variablen durch die Negation ¬ oder
die logischen Verknupfungen ∧, ∨, Y, →, ← und ↔, so nennt man die somit erhaltene
Aussageform eine aussagenlogische Formel . Es ist hierbei erlaubt, mehrere logische Ver-
knupfungen oder Negationen anzuwenden. Insbesondere sind dann alle Variablen aussa-
genlogische Variablen. In den obigen Beispielen sind A3 und A4 aussagenlogische Formeln,
die anderen keine.
Fur aussagenlogische Formeln kann man viele Beziehungen herleiten, zum Beispiel folgen-
de:
PROPOSITION 2.9. Fur alle Belegungen von A, B und C mit Wahrheitswerten w und
f sind die folgenden Aussagen wahr:
(a) A ∨ ¬A (Tertium non datur)
2. AUSSAGENLOGIK 13
(b) ¬(A ∧ ¬A) (Widerspruchsfreiheit)
(c) A ∨ w
(d) ¬(A ∧ f)
(e) (A ∧ f) ↔ f
(f) (A ∨ f) ↔ A
(g) (A ∧ w) ↔ A
(h) (A ∨ w) ↔ w
(i) (A ∨B) ↔ (B ∨ A) (Kommutativitat von ∨)
(j) (A ∧B) ↔ (B ∧ A) (Kommutativitat von ∧)
(k) (A ∨ (B ∨ C)) ↔ ((A ∨B) ∨ C) (Assoziativitat von ∨)
(l) (A ∧ (B ∧ C)) ↔ ((A ∧B) ∧ C) (Assoziativitat von ∧)
(m) (A ∨B) ↔ ¬(¬A ∧ ¬B) (de Morgansche Regeln)
(n) (A ∧B) ↔ ¬(¬A ∨ ¬B) (de Morgansche Regeln)
(o) (A ∧ (B ∨ C)) ↔ ((A ∧B) ∨ (A ∧ C)) (Distributivgesetze)
(p) (A ∨ (B ∧ C)) ↔ ((A ∨B) ∧ (A ∨ C)) (Distributivgesetze)
(q) (A↔ w) ↔ A
(r) (A↔ f) ↔ ¬A
(s) (A→ B) ↔ (B ← A)
(t) (A→ B) ↔ (¬A ∨B) (Kontraposition)
(u) (A← B) ↔ (A ∨ ¬B)
(v) (A→ B) ↔ (¬B → ¬A)
(w) (A↔ B) ↔ ((¬A ∨B) ∧ (A ∨ ¬B))
(x) (A↔ B) ↔ ¬(A YB)
(y) (A ∧B) → A
14 1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
Diese Proposition wird teilweise in den Ubungsgruppen bewiesen, die verbleibenden konnen
Sie selbst mit ahnlichen Methoden leicht beweisen. Die obigen Aquivalenzen, d.h. die obi-
gen Aussagen in der Form D ↔ E, beweist man oft am besten, in dem man mit Hilfe einer
Wahrheitstabelle D und E fur alle Belegungen von A, B und C berechnet und dann ver-
gleicht. Nachdem man einige Aussagen gezeigt hat, kann man durch deren Kombination
weitere erhalten.
Aus (l) folgt zum Beispiel, dass A ∧ B ∧ C ein syntaktisch sinnvoller Ausdruck ist, da
das Ergebnis nicht von der Klammerung abhangt, und analog dazu ist naturlich auch
A ∨B ∨ C ein sinnvoller Ausdruck.
Definition 2.10. Wir nennen zwei Aussageformen aquivalent, wenn sie von denselben
Variablen abhangen, die Variablen dieselbe zulassigen Werte haben und wenn beide Aus-
sageformen fur alle Belegungen der Variablen mit Werten aquivalente Aussagen ergeben.
Somit sind also die Aussageformen D und E aquivalent genau dann, wenn D ↔ E fur
alle Belegungen der Variablen wahr ist.
Beispiel 2.11. Proposition 2.9 (i) besagt, dass A ∨B aquivalent zu B ∨ A ist.
Proposition 2.9 (x) besagt, dass A↔ B aquivalent zu ¬(A YB) ist.
LEMMA 2.12. Die aussagenlogischen Formeln E1(A,B,C) := A → (B → C) und
E2(A,B,C) := (A→ B)→ C sind nicht aquivalent. (Praziser gesagt: Es ist nicht richtig,
dass fur alle Wahlen von A, B und C die aus E1 und E2 erhaltenen Aussagen aquivalent
sind).
Deshalb ist also A → B → C kein syntaktisch sinnvoller Ausdruck, man muss hier
Klammern setzen.
2. AUSSAGENLOGIK 15
Beweis. Angenommen, die aussagenlogischen Formeln E1 und E2 waren fur alle A, B
und C aquivalent. Dann waren sie insbesondere aquivalent im Fall, dass A, B und C
falsch sind. In diesem Fall sind A→ B und B → C wahr und somit ist E1 wahr und E2
falsch. Somit haben wir einen Widerspruch zur obigen Annahme erhalten. Die Annahme
war also falsch. Also ist das Lemma bewiesen.
Der obige Beweis ist ein Widerspruchsbeweis. Um eine Aussage F zu zeigen, nimmt man
zunachst ¬F an und leitet daraus einen Widerspruch her.
Hierbei ist
F : Fur alle Wahlen von A, B und C sind die Aussagen E1(A,B,C) und E2(A,B,C)
aquivalent.
Ein anderer Typ von Widerspruchsbeweis ist noch haufiger. Man mochte eigentlich die
Aussage E → F zeigen. Man nimmt nun ¬F an und leitet daraus ¬E her. Man hat somit
¬F → ¬E gezeigt. Dies ist aber mit Proposition 2.9 (v) aquivalent zu E → F .
Bemerkung 2.13. Die Symbole ⇐⇒ und =⇒ nutzen wir ahnlich wie die Symbole ↔
und →, jedoch mit kleinen Unterschieden:
• Wenn wir aussagenlogische Variablen in einer aussagenlogischen Formel zusam-
menfugen, so wenden wir zuerst↔,→,←, ∧,. . . und dann erst⇐⇒ und =⇒ an.
Beispiel: Die Aussageform
3 + 4 = 7⇐⇒ A ∨ ¬A
ist als (3 + 4 = 7)⇐⇒ (A ∨ ¬A) zu lesen.
16 1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
• Wir lesen Implikationsketten wie zum Beispiel A =⇒ B =⇒ C als”(A impliziert
B) und (B impliziert C)“. Als Beispiel betrachte man den Beweis von Lem-
ma 2.5. Der Ausdruck A → B → C ist hingegen syntaktisch gar nicht sinnvoll,
da Klammern benotigt werden. Analog sind Aquivalenzketten zugelassen und zu
interpretieren, zum Beispiel:
¬(A ∨ ¬B) ∧ A ”(n)“⇐⇒ (¬A ∧B) ∧ A(l)⇐⇒ ¬A ∧ (B ∧ A)
(j)⇐⇒ ¬A ∧ (A ∧B)
(l)⇐⇒ (¬A ∧ A) ∧B
”(b)“⇐⇒ f ∧B
”(e)“⇐⇒ f
Bei jedem⇐⇒ findet eine Aquivalenzumformung statt, die direkt aus bereits be-
kannten Aussagen folgt. Der jeweilige Buchstabe uber einem der ⇐⇒-Pfeile gibt
an, welche Eigenschaft in Proposition 2.9 verwendet wurde. Die Anfuhrungszei-
chen in der ersten und den beiden letzten Zeilen deuten an, dass man leicht
modifizierte Versionen der zitierten Punkte hernehmen muss. Die Verwendung
des Zeichens ⇐⇒ ware naturlich auch ohne die Erklarungen daruber gestattet.
Die obige Umformungskette ist somit ein Beweis7 der Tatsache, dass die Aussa-
geform ¬(A ∨ ¬B) ∧ A fur alle Belegungen von A und B mit Wahrheitswerten
falsch ist.
7Die Worte”beweisen“ und
”zeigen“ haben in der Mathematik nahezu dieselbe Bedeutung.
2. AUSSAGENLOGIK 17
Eine ahnliche Verwendung wird im folgenden Beispiel verdeutlicht:
¬(A↔ B)⇐⇒ ¬A↔ B
⇐⇒ A↔ ¬B
⇐⇒ A YB
⇐⇒ ¬A Y ¬B
Die obigen Zeilen sind eine recht effektive Art und Weise auszudrucken, dass alle
obigen Ausdrucke paarweise aquivalent sind. Allerdings muss man hier”etwas
arbeiten“ um jeweils von der linken Seite von ⇐⇒ zur rechten zu kommen. Dies
geht in diesem Beispiel mit einer Wahrheitstafel sehr gut.
• Um Missverstandnisse zu vermeiden, verbieten wir es, Ausdrucke, die ⇐⇒ und
=⇒ enthalten, durch weitere aussagenlogische Verknupfungen zu verbinden. Das
heißt beispielsweise, dass wir A ⇐⇒ (B =⇒ C) als syntaktisch nicht sinnvoll
betrachten, also vergleichbar zu”jjkwdh“.
Beispiel: Proposition 2.9 (w) und (x) ergeben dann zusammen
A↔ B ⇐⇒ (¬A ∨B) ∧ (A ∨ ¬B)⇐⇒ ¬(A YB).
Bemerkung 2.14. Man konnte zunachst auch nur ¬ und ∧ durch eine Wahrheitstafel wie
oben definieren und alle danach anderen aussagenlogischen Verknufungen durch Formeln
aus Proposition 2.9, z.B. A ∨B := ¬(¬A ∧ ¬B) durch die de Morgansche Regel.
18 1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
3. Mengen
Beschreibung 3.1 (Georg Cantor, 1845–1918). Unter einer Menge verstehen wir jede
Zusammenfassung M von bestimmten wohlunterschiedenen Objekten unserer Anschau-
ung oder unseres Denkens (welche Elemente von M genannt werden) zu einem Ganzen.
Hier wird erklart, was eine Menge ist. Auch eine Definition erklart, was ein neuer Be-
griff bedeutet. Dennoch ist die obige Erklarung keine mathematische Definition, sondern
eine intuitive Erklarung. Wenn man in der Mathematik sauber definieren will, was eine
Menge ist, darf man nur Worte und Strukturen benutzen, die zuvor schon ein klare Be-
deutung haben. Es ist nun aber doch etwas unklar, was die Worte”Zusammenfassung“,
“bestimmten“, “wohlunterschieden“ bedeuten.
Die obige”Beschreibung“ sagt uns also lediglich, was wir uns unter einer Menge vorstellen
sollen. Das reicht uns aber fur das folgende, und eine genaue Definition ware zu aufwandig.
Eine Menge enthalt Elemente. Zwei Mengen sind genau dann gleich, wenn sie die gleichen
Elemente enthalten.
Schreibweisen:
M = {x, y, z} = {x, x, y, z} = {y, x, z} ist die Menge, deren Elemente x, y und z sind.
Man darf Elemente in den Klammern { } mehrfach aufzahlen, sie sind dann aber nur
einmal in der Menge. Ein Element kann in einer Menge sein, oder nicht darin sein, es
kann aber nicht mehrfach in M enthalten sein.
3. MENGEN 19
x ∈M ist die Kurzschreibweise fur”x ist ein Element von M“
x 6∈M ist die Kurzschreibweise fur”x ist kein Element von M“
x 6∈M ⇐⇒ ¬(x ∈M)
Beispiele 3.2.
(1) Vorstellung von M = {x, y, z}
xy
z
(2) Die Menge aller naturlichen Zahlen: N = {0, 1, 2, 3, . . . , }.
Ubliche Formulierung: Die Menge N der naturlichen Zahlen.
(3) Die Menge R der reellen Zahlen 8
(4) Die Menge R>0 der positiven reellen Zahlen. (Die Null ist weder positiv noch negativ).9
(5) Ist A(x) eine Aussageform in einer Variablen x, so bilden die zulassigen Werte von x
eine Menge, die Definitionsmenge der Aussageform. In Beispiele 2.8 ist die Definiti-
onsmenge von A2 die Menge aller Autos. Die Definitionsmenge von A1 ist R.
8Achtung: Was eine reelle Zahl ist, mussen wir eigentlich noch zuerst lernen!9Sehr verbreitet ist auch die Schreibweise R∗+ fur die positiven reellen Zahlen, und dann schreibt man
R+ := R∗+ ∪ {0} fur alle reellen Zahlen, die nicht negativ sind. In dieser Schreibweise soll + naturlich
positiv bedeuten. Deswegen ist auch die Schreibweise R+ verwirrend, denn wir haben 0 ∈ R+, obwohl 0
nicht positiv ist. Ein dritte Moglichkeit, die man gelegentlich sieht, ist R+ fur die positiven reellen Zahlen
zu benutzen, und dann definiert man R+0 := R+∪{0}. Um Verwirrung zu vermeiden, nutzen wir nur R>0
fur die Menge der positiven reellen Zahlen und R≥0, wenn die Null noch dazugenommen wird.
20 1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
Definition 3.3. Die Menge, die keine Elemente hat, heißt die leere Menge, und wird
notiert als ∅ oder {}.
!ACHTUNG!. ∅ 6= {∅} und 1 6= {1} 6= {{1}}.
Bei Aussagen und aussagenlogischen Formeln schreiben wir ab sofort :⇐⇒ fur”ist definiert
als“.
Definition 3.4 (Teilmenge).
(1) Die Menge N ist eine Teilmenge von M , genau dann wenn jedes Element von N auch
ein Element von M ist. Als Formel schreiben wir N ⊂M .
(2) Die Menge N ist eine echte Teilmenge von M , genau dann wenn N eine Teilmenge
M ist und von M verschieden ist. Wir schreiben hierfur N (M .
Beispiele 3.5.
(1) {1, 2} ⊂ {1, 2, 3} und {1, 2} ( {1, 2, 3}.
(2) Fur alle Mengen M gilt: ∅ ⊂M
(3) Fur alle Mengen M gilt: M ⊂M24.10.
Definition 3.6. Ist A eine auf M definierte Aussageform, so definieren wir
{x ∈M | A(x)}
als die Teilmenge aller Elemente x von M , fur die A(x) wahr ist.
Es gilt somit fur alle y ∈M :
y ∈ {x ∈M | A(x)} ⇐⇒ A(y)
3. MENGEN 21
Umgekehrt: Ist N eine Teilmenge von M , so ist
A(x) :=
w falls x ∈ N
f falls (x ∈M) ∧ (x 6∈ N)
eine auf M definierte Aussageform und es gilt dann
N = {x ∈M | A(x)}.
Beispiele 3.7.
(1) Seien A1 und A2 definiert wie in Beispiele 2.8, M2 sei die Menge aller Autos. Dann
gilt
{x ∈ R | A1(x)} = {x ∈ R | x > 0} = R>0
und
{x ∈M2 | A2(x)}
ist die Menge aller roten Autos.
(2) Die Menge der geraden naturlichen Zahlen ist
2N :={n ∈ N
∣∣ n2∈ N
}.
Sei k ∈ N>0. Die Menge der durch k teilbaren ganzen Zahlen ist
kZ :={n ∈ Z
∣∣ nk∈ Z
}.
Analog kN.
(3) Die Menge der Primzahlen ist
{n ∈ N | n besitzt genau zwei Teiler (in N)}.
22 1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
Wir fuhren somit noch eine weitere Art und Weise ein, Mengen zu beschreiben.
Definition 3.8. Sei M eine Menge und f(x) ein von x abhangiger Ausdruck10. Dann
bezeichne
{f(x) ‖x ∈M}
die Menge aller Objekte, die sich in der Form f(x) fur ein x ∈ M schreiben lassen.11
Analoges gilt auch wenn f mehrere Variablen besitzt, zum Beispiel
{f(x, y) ‖x ∈M, y ∈ N},
wenn f von den Variablen x ∈M und y ∈ N abhangt.
Wir konnen dann kZ auch einfuhren als
kZ := {kz ‖ z ∈ Z}.
Definition 3.9. Seien M und N Mengen. Wir definieren hieraus neue Mengen
(a) den Schnitt (oder die Schnittmenge) von M und N als
M ∩N := {x ∈M | x ∈ N} = {x ∈ N | x ∈M}.
Man kann auch sagen, M ∩N ist die Menge, so dass gilt:
x ∈M ∩N ⇐⇒ (x ∈M) ∧ (x ∈ N).
(b) die Vereinigung(smenge) von M und N als die Menge M ∪N , so dass
x ∈M ∪N :⇐⇒ (x ∈M) ∨ (x ∈ N).
10Die mathematisch prazisere Voraussetzung ware: f ist eine Funktion in einer Variablen x.
11In einigen Wochen vereinfachen wir diese Schreibweise zu {f(x) | x ∈M}.
3. MENGEN 23
(c) das Komplement von N in M als
M rN := {x ∈M | x 6∈ N}
oder dazu aquivalent
x ∈M rN ⇐⇒ (x ∈M) ∧ (x 6∈ N)
(d) die symmetrische Differenz von N in M als
M∆N := (M ∪N) r (M ∩N) = (M rN) ∪ (N rM)
oder dazu aquivalent
x ∈M∆N ⇐⇒ (x ∈M) Y (x ∈ N)
24 1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
Beispiel 3.10. Sei A := {1, 2, 3} und B := {3, 4, 5}. Dann ist A ∩ B = {3}, A ∪ B =
{1, 2, 3, 4, 5}, ArB = {1, 2} und , A∆B = {1, 2, 4, 5}
1
2
3
4
5
Abbildung 1: Zwei Mengen A := {1, 2, 3} und B := {3, 4, 5} zur Veranschaulichung von
A ∩B, A ∪B und A∆B.
Definition 3.11. Zwei Mengen M und N heißen disjunkt, falls M ∩N = ∅.
Es gelten viele zu Proposition 2.9 analoge Aussagen.
PROPOSITION 3.12. Seien P , Q und R Teilmengen von M . Dann gilt
(a) P ∪ (M r P ) = M
(b) P ∩ (M r P ) = ∅
(c) P ∪M = M
(d) P ∩ ∅ = ∅
(e) P ∩ ∅ = ∅
(f) P ∪ ∅ = P
(g) P ∩M = P
(h) P ∪M = M
(i) P ∪Q = Q ∪ P (Kommutativitat von ∪)
(j) P ∩Q = Q ∩ P (Kommutativitat von ∩)
(k) (P ∪ (Q ∪R)) = ((P ∪Q) ∪R) (Assoziativitat von ∪)
4. QUANTOREN 25
. . .
Jede Teilaussage dieser Proposition entspricht einer Teilaussage in Proposition 2.9 mit
demselben kleinen Buchstaben. Zum Beispiel ist Proposition 3.12 (a) eine direkte Folge-
rung aus Proposition 2.9 (a), Proposition 3.12 (b) eine Folgerung aus Proposition 2.9 (b),
etc.. Man beachte, dass die Bedeutungen von (d) und (e) in Proposition 2.9 fast diesseblen
sind und deswegen dieselben”Ubersetzungen“ in Proposition 3.12 haben. Analoges gilt
fur (c) und (h).
UBUNG 3.13. Ubersetzen Sie die restlichen Aussagen aus Proposition 2.9 (j) bis (p) in
Aussagen uber Mengen. Beweisen Sie all diese Aussagen.
4. Quantoren
Aussagen12 in der Art”Fur alle Elemente x ∈ M ist die Aussage A(x) wahr.“ und
”Es
gibt (mindestens) ein Element x ∈ M , fur das A(x) wahr ist.“ sind in der Mathematik
sehr haufig. Man schreibt kurz hierfur ∀x ∈ M : A(x) und ∃x ∈ M : A(x). Man nennt
∀ den Allquantor und ∃ den Existenzquantor. Als Beispiel betrachten wir die Definition
von Stetigkeit, ein zentraler Begriff der Analysis.
Definition 4.1. Eine Abbildung f : R−→R ist stetig in x0 ∈ R, genau dann wenn
∀ε ∈ R>0 : ∃δ ∈ R>0 : ∀x ∈ R : (|x− x0| < δ)→ (|f(x)− f(x0)| < ε)︸ ︷︷ ︸A(x,x0,f,δ,ε)
A(x, x0, f, δ, ε) ist eine Aussageform, die von funf Variablen abhangt. Wir geben die mogli-
chen Werte durch Mengen an: x ∈ R, x0 ∈ R, f ∈ Abb(R,R) (die Menge aller Abbildungen
12Naturlich erlauben wir hier auch aussagenlogische Formeln und Aussageformen
26 1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
R−→R), δ ∈ R>0 und ε ∈ R>0. Sobald wir am Ende des Abschnitts Abbildungen und
Produkte von Mengen eingefuhrt haben, kann man diese Aussageform auch als Abbildung
A : R× R× Abb(R,R)× R>0 × R>0−→{w, f}
betrachten.
Das folgende Regel ist intuitiv klar:
REGEL 4.2 (Negation von Quantoren). Fur jede auf M definierte Aussageform gilt:
¬∀x ∈M : A(x) ⇐⇒ ∃x ∈M : ¬A(x)(4.3)
Indem man A(x) durch ¬A(x) ersetzt und dann die gesamte Aquivalenz auf beiden Seiten
negiert, erhalt man
(4.4) ¬∃x ∈M : A(x) ⇐⇒ ∀x ∈M : ¬A(x)
Klammerregel.
Sei A(x, y) eine Aussage die von den Parametern x ∈ X und y ∈ Y , dann ist
∀/∃x ∈ X : ∀/∃y ∈ Y : A(x, y)
zu lesen als
∀/∃x ∈ X :(∀/∃y ∈ Y : A(x, y)
).
Es gilt offensichtlich
∀x ∈ X : ∀y ∈ Y : A(x, y) ⇐⇒ ∀y ∈ Y : ∀x ∈ X : A(x, y)
∃x ∈ X : ∃y ∈ Y : A(x, y) ⇐⇒ ∃y ∈ Y : ∃x ∈ X : A(x, y)
4. QUANTOREN 27
Man sagt kurz:”zwei af. (aufeinanderfolgende) Allquantoren vertauschen miteinander“,
oder man sagt”zwei af. Allquantoren kommutieren“. Analog kommutieren zwei af. Exis-
tenzquantoren.
!ACHTUNG!. Allquantoren kommutieren nicht mit Existenzquantoren!
Die eine Richtung ist immer wahr:
∀x ∈ X : ∃y ∈ Y : A(x, y) ⇐= ∃y ∈ Y : ∀x ∈ X : A(x, y)
Aus der rechten Seite ∃y ∈ Y : ∀x ∈ X : A(x, y) folgt die linke ∀x ∈ X : ∃y ∈ Y :
A(x, y). Die Aussagen unterscheiden sich aber sehr. Links darf die Wahl von y von x
abhangen, rechts darf sie es nicht. Man hat hier also weniger Flexibilitat in der Wahl von
y, da man eines finden muss, so dass A(x, y) fur alle x ∈ X richtig ist.
Die Umkehrung (d.h. die Richtung von links nach rechts) ist falsch, wie das folgende
Beispiel zeigt.
Beispiel 4.5. Die Aussage
(4.6) ∀x ∈ R : ∃y ∈ R : x > y
ist wahr. Denn fur ein gegebenes x ∈ R konnen wir die Zahl y := x − 1 hernehmen und
diese erfullt y < x. Deswegen ist fur alle x ∈ R die Aussage ∃y ∈ R x > y wahr, also auch
(4.6).
Die Aussage
(4.7) ∃y ∈ R : ∀x ∈ R : x > y
28 1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
ist falsch. Denn fur ein gegebenes y ∈ R gilt nicht fur alle x ∈ R die Ungleichung x > y.
Die Ungleichung gilt zum Beispiel nicht fur x := y. Also gibt es kein y ∈ R, so dass
∀x ∈ R : x > y wahr ist. Also ist (4.7) falsch.
SCHREIBWEISE 4.8. Quantoren fur eine Variable mussen stehen, bevor diese Variable
gebraucht werden darf. (Sonst gelten sie als nicht syntaktisch sinnvoll.) 13
Beispiel 4.9. Ausdrucke in der Art”Es gilt 2x = x + x fur alle x ∈ R“ erklaren wir ab
sofort und bis auf weiteres als syntaktisch nicht sinnvoll. Erlaubt sind nur Satze wie”Fur
alle x ∈ R gilt 2x = x+ x.“
Die Regel ist deswegen wichtig, damit nicht unklar bleibt, wie die folgende Aussage ver-
standen werden soll:
Fur alle x ∈ R gilt x > y fur ein y ∈ R.
Diesen Ausdruck konnte man als die wahre Aussage (4.6) oder als die falsche Aussage
(4.7) verstehen. Deswegen legen wir durch die obige Regel fest, dass Ausdrucke wie das
obige A syntaktisch nicht sinnvoll sind.
Frage 4.10. Ist die folgende Aussage A wahr?
A :⇐⇒ ∀x ∈ ∅ : x = x+ 1.
Das didaktische Problem hier ist: obwohl uns bisher intuitiv klar war, was ∀x ∈ M :
A(x) bedeutet, ist ∀x ∈ ∅ : A(x) nicht intuitiv klar. In studentischen Losungen der
Aufgabenblatter steht oft in so einem Fall:”Da die Aussage x = x + 1 fur kein einziges
13In spateren Semestern wird diese Regel nicht mehr immer befolgt, falls keine Missverstandnisse zu
erwarten sind.
4. QUANTOREN 29
Element in ∅ gilt, gilt sie naturlich auch nicht fur alle Elemente in ∅.“ Das ist ein weit
verbreiteter Fehler.
REGEL 4.11. In der Mathematik ist die Aussage
∀x ∈ ∅ : A(x)
fur alle Aussageformen A(x) immer wahr und die Aussage
∃x ∈ ∅ : A(x)
fur alle Aussageformen A(x) immer falsch.
Diese Regel ist letztendlich eine Definition, man konnte auch sagen eine Konvention. Es
erscheint auch intuitiv klar, dass ∃x ∈ M : A(x) nur dann wahr sein kann, wenn in M
uberhaupt irgendwelche Elemente existieren. Bei der anderen Regel konnte man Zweifel
haben. Aber: wenn wir hier aber eine andere Konvention wahlen wurden, hatten wir viele
Ausnahmen zu berucksichtigen. Zum Beispiel erscheint uns die folgende Aquivalenz fur
alle Mengen M intuitiv klar:
∀x ∈M : A(x) ⇐⇒ {x ∈M | ¬A(x)} = ∅.
Die rechte Seite ist fur M = ∅ offensichtlich wahr.
Außerdem, ergibt sich die erste Teil in Regel 4.11 auch aus dem zweiten Grund: ∃x ∈ ∅ :
¬A(x) ist falsch, also auch ¬∀x ∈ ∅ : A(x) falsch, also ∀x ∈ ∅ : A(x) wahr.
Notation 4.12. In vielen Buchern schreibt man auch oft ∃x : A(x). Dies bedeutet,
es existiert eine Menge, in der ein Element existiert, fur das A(x) wahr ist. Beispiel:
die Aussage ∃x : x ∈ M ist aquivalent zu M 6= ∅. Analog heißt ∀x : A(x), dass fur
30 1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
alle Mengen und alle Elemente darin die Aussage A(x) wahr ist.14 Analog hierzu: ist
A(x) eine auf allen Elementen von allen Mengen definierte Aussageform, so bezeichnet
{x | A(x)} die Menge aller Elemente, fur die A(x) wahr ist. Diese Bezeichnungen sind
vor allem in axiomatischen aufgebauten Logik-Buchern wie [13] ublich, sind im Zugang
unserer Vorlesung eine gefahrliche Fehlerquelle: zum Beispiel ist {x | A(x)} oft gar keine
Menge, siehe Anhang A Abschnitt 1. Wir wollen sie deswegen nicht verwenden.
5. Potenzmenge und Mengensysteme
Definition 5.1. Ist X eine Menge, so ist P(X) definiert als die Menge aller Teilmengen
von M . Man nennt P(X) die Potenzmenge von X.
x ∈ P(X) ⇐⇒ x ⊂ X
Beispiele 5.2.
(1) P({1, 2}) = {∅, {1}, {2}, {1, 2}}
(2) P(∅) = {∅} 6= ∅
Definition 5.3. Ein Mengensystem (uber einer Grundmenge X) ist eine Teilmenge von
P(X). Dies bedeutet, dass M genau dann ein Mengensystem ist, wenn alle Elemente von
M eine Teilmenge von X sind.
14Bei dieser”Notation“ handelt es sich eigentlich auch um eine Definition; es ist die Definition einer
Schreibweise. Wir verwenden hier den Begriff Notation, um anzudeuten, dass hier kein neuer Begriff
eingefuhrt wird, sondern eine neue Schreibweise.
5. POTENZMENGE UND MENGENSYSTEME 31
Wir definieren dann ⋃M := {x ∈ X | ∃m ∈M : x ∈ m}
und falls zusatzlich M 6= ∅ definieren wir
⋂M := {x ∈ X | ∀m ∈M : x ∈ m}.
Offensichtlich gilt⋃M ⊂ X und
⋂M ⊂ X.
Beispiele 5.4. Beliebige Grundmenge X, A ⊂ X, B ⊂ X
(1) Fur M := {A} gilt⋃M =
⋂M = A.
(2) Fur M := {A,B} gilt⋃M = A ∪B und
⋂M = A ∩B.
Mengensysteme uber der Grundmenge Z
(3) Fur M := {{1, 2, 3}, {3, 5, 7}, {1, 3, 5}} gilt⋃M = {1, 2, 3, 5, 7} und
⋂M = {3}.
(4) Sei
M := {kZ ‖ k ∈ Nr {0, 1}} = {2Z, 3Z, 4Z, . . .}.
Dann gilt⋃M = Z r {−1,+1} und
⋂M = {0}.
Falls X ⊂ Y , so ist jedes Mengensystem uber X auch ein Mengensystem uber Y und die
obigen Definitionen von⋃M und
⋂M hangen nicht von der verwendeten Grundmenge
ab. Wir lassen deswegen die Angabe der Grundmenge in Zukunft weg.⋂∅ ist nicht definiert worden, denn mit obiger Definition ware dann
⋂∅ = X, also von
der Wahl der Grundmenge abhangig. 26.10.
32 1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
6. Paare und kartesische Produkte
Es gilt {1, 2} = {2, 1}. Eine Menge mit genau zwei Elementen heißt ungeordnetes Paar.
In der Mathematik brauchen aber auch (geordnete) Paare15. Wir wollen an einem Beispiel
erklaren, wieso sie gebraucht werden, und uns dann um eine saubere Defintion kummern.
Rene Descartes (1596–1650):
Nach Wahl eines Ursprungs und einer Basis beschreibt man Punkte auf einer Geraden
durch eine reelle Zahl, Punkte in einer Ebene durch zwei reelle Zahlen und Punkte im
Raum durch drei reelle Zahlen.
x
y
−4
−4
−3
−3
−2
−2
−1−1
1
1
2
2
3
3
4
4
0
(3, 4)
{ Punkte in der Ebene } ∼= { geordnete Paare (x, y) von zwei reellen Zahlen x und y}∼= R× R ∼= R2
Paar := geordnetes Paar
15Ein Paar ist immer ein geordnetes Paar, es sei denn wir sagen explizit ‘”ungeordnet“ dazu.
6. PAARE UND KARTESISCHE PRODUKTE 33
”Definition“ 6.1. Sind M und N Mengen, so definieren wir
M ×N := {(m,n) ‖m ∈M, n ∈ N}
wobei (m,n) ein Paar aus m und n ist. Man nennt M × N das (kartesische) Produkt
von M und N .
Fur Paare gilt z.B. (3, 4) 6= (4, 3).
Das Wort”kartesisch“ kommt vom Namen
”Cartesius“ und dies ist die lateinische Version
von Descartes.
Das problematische an obiger”Definition“ ist, dass wir den Begriff
”Paar“ noch gar nicht
definiert haben.
Eine Moglichkeit, ware ein Axiom einzufuhren, das uns die Existenz von Paaren liefert.
AXIOM 6.2. Zu jedem m ∈ M und n ∈ N gibt es ein (m,n), genannt Paar, mit der
folgenden Eigenschaft: fur alle m, m ∈M und alle n, n ∈ N gilt
(m,n) = (m, n)⇐⇒ m = m und n = n.
Ein ahnliches Axiom wurde in der Linearen Algebra so ahnlich eingefuhrt (Axiom 1.1.6),
es erganzt die dort prasentierten anderen Axiome. Wenn man aber naiv argumentiert, wie
bei uns der Fall, oder die zumeist verwendeten Axiomen-Systeme ZFC oder NBG (siehe
Anhang A) nutzt, kann man eine Konstruktion machen, die genau solch eine Paarbildung
liefert. Sie macht aus dem obigen Definitions-Versuch (”Definition“ 6.1) eine richtige De-
finition.16 Das heißt, man kann Axiom 6.2 weglassen und durch diese Definition ersetzen.
16Wir konnen dann also die Anfuhrungsstriche weglassen.
34 1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
Definition 6.3 (Konstruktion von Paaren nach Kuratowski). Wir definieren das Paar
von m und n als
(m,n) := {{m}, {m,n}}.
Diese Definition ist unanschaulicher als sie zunachst aussieht, wie das folgende Beispiel
zeigt:
Beispiel 6.4. Fur M = N = N und m = n = 1 gilt (m,n) = {{1}}.
Aus diesem Grund wahlen manche Bucher andere Definitionen, die aber wieder andere
Probleme haben. Wichtig ist fur uns aber letztendlich gar nicht, was Produkte”wirklich
sind“, sondern dass die Eigenschaft in Axiom 6.2 erfullt ist.
LEMMA 6.5. Fur das von Kuratowski definierte Paar gilt:
(m,n) = (m, n) ⇐⇒ m = m und n = n.
Beweis. Die Richtung”⇐=“ ist offensichtlich.
Zu”=⇒“: Sei (m,n) = (m, n). Also gilt nach Definition
(6.6) {{m}, {m,n}} = {{m}, {m, n}}.
Wir wissen bereits, dass {{m}, {m,n}} ein oder zwei Elemente besitzt. Wir mussen zwei
Falle unterscheiden.
1. Fall: Die Menge {{m}, {m,n}} besitzt ein Element.
In diesem Fall ist dann {m} das einzige Element und somit {m} = {m,n} und deswegen
6. PAARE UND KARTESISCHE PRODUKTE 35
m = n. Wegen (6.6) hat auch {{m}, {m, n}} nur ein Element, also ergibt sich analog
m = n. Es gilt nun
{m} = {{m}, {m,n}} = {{m}, {m, n}} = {m}.
Es folgt m = n = m = n.
2. Fall: Die Menge {{m}, {m,n}} besitzt zwei Elemente.
Es gilt also {m} 6= {m,n} und somit m 6= n. Analog enthalt {{m}, {m, n}} die verschie-
denen Elemente {m} und {m, n}, und daraus folgt m 6= n. Da {m} und {m} genau ein
Element enthalten, und da {m,n} und {m, n} genau zwei Elemente enthalten, folgt aus
(6.6), dass {m} = {m} und somit m = m. Außerdem gilt dann {m,n} = {m, n}. Da diese
Menge außer m = m noch genau ein weiteres Element enthalt, gilt auch n = n.
Definition 6.7. Falls M1, M2, . . . , Mk Mengen sind, so definieren das k-fache kartesische
Produkt hiervon als
M1 ×M2 × · · · ×Mk := M1 × (M2 × (· · ·Mk−1 ×Mk)) · · · ).
Elemente hiervon nennen wir k-Tupel. Wir schreiben sie in der Form (x1, x2, . . . , xk),
wobei xi ∈Mi. Ein Paar ist also ein 2-Tupel. Ein 3-Tupel nennt man auch Tripel. 4-Tupel
sind Quadrupel, 5-Tupel sind Quintupel. Wir nutzen auch die Schreibweise
Mk = M ×M × · · · ×M︸ ︷︷ ︸k-mal
.
Beispiel: R3 = R× (R× R)
36 1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
7. Relationen, funktionale Relationen, Abbildungen
Definition 7.1. Eine Relation R auf der Grundmenge M ist eine Teilmenge von M×M .
Wir schreiben dann xRy fur die Aussage(form) (x, y) ∈ R.
Falls M ⊂ N , so ist jede Relation auf M auch eine Relation auf N . Oft ist die Grundmenge
ohne Bedeutung. Wichtig ist vor allem, dass ein solches Resservoir an moglichen Werten
uberhaupt existiert.
Beispiele 7.2.
(1) ∅ ist eine Relation auf jeder Menge.
(2) {∅, (1, 2)} ist keine Relation, da ∅ kein Paar ist.
(3) Ist M eine Menge, so ist δM := {(x, x) ‖x ∈M} eine Relation auf M . Man nennt sie
die Diagonale von M .
x
y
−4
−4
−3
−3
−2
−2
−1−1
1
1
2
2
3
3
4
4
0
Abbildung 2: Die Diagonale der Menge M = {−3,−2,−1, 0, 1, 2, 3}.
7. RELATIONEN, FUNKTIONALE RELATIONEN, ABBILDUNGEN 37
(4) ≤R:= {(x, y) ∈ R2 | x ≤ y} ist eine Relation auf R.
(5) Q := {(x, y) ∈ R2 | y = 3x2 + 2} ist eine Relation auf R.
(6) M = {1, 2, 3}. Wir definieren die Relationen R1 ⊂M×M und R2 ⊂M×M durch das
folgende Bild oder sagen R1 := {(1, 2), (1, 3), (2, 1), (3, 1)} und R2 := {(1, 2), (3, 2)}
•1
•2
•3
R1
•1
•2
•3
R2
Definition 7.3. Sei R eine Relation auf M . Die Relation heißt
(1) reflexiv auf M :⇐⇒ ∀x ∈M : xRx,
(2) symmetrisch :⇐⇒ ∀x ∈M : ∀y ∈M :︸ ︷︷ ︸∀x,y∈M :
(xRy → yRx),
(3) antisymmetrisch :⇐⇒ ∀x, y ∈M :((xRy ∧ yRx)→ x = y
),
(4) transitiv :⇐⇒ ∀x, y, z ∈M :((xRy ∧ yRz)→ xRz
),
(5) Aquivalenzrelation auf M , falls R reflexiv auf M , symmetrisch und transitiv ist.
(6) Ordnung(srelation) auf M oder partielle Ordnung(srelation) auf M , falls R reflexiv,
antisymmetrisch und transitiv ist.
(7) Erfullt eine Ordnungsrelation R auf M zusatzlich die Eigenschaft
∀x, y ∈M :(xRy ∨ yRx
)
38 1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
dann nennt man R eine totale Ordnung(srelation).17
Beispiele 7.4. Zu den Beispielen 7.2 (3), (4) und (6):
(3) δM ist reflexiv auf M , symmetrisch, und transitiv, also eine Aquivalenzrelation auf
M .
Es gilt
xδMy ⇐⇒ x = y ∧ x ∈M
(4) ≤R ist reflexiv auf R, antisymmetrisch und transitiv, also eine Ordnungsrelation auf
M . Diese Ordnung ist total.
(6) R1 ist nicht transitiv, denn 3R11 und 1R12 sind wahr, aber 3R12 ist falsch. R1 ist auch
nicht reflexiv. Also ist R1 auch weder Ordnungsrelation noch Aquivalenzrelation. R1
ist symmetrisch und nicht antisymmetrisch.
R2 ist transitiv, antisymmetrisch, nicht reflexiv, nicht symmetrisch.
Beispiele 7.5. Ist X eine Menge, so definieren wir
⊂X := {(A,B) ∈ P(X)2 | A ⊂ B}.
⊂X ist eine Ordnungsrelation auf P(X). Sie ist keine totale Ordnung, wenn X mindestens
2 Elemente besitzt. 18
17Manche Quellen nennen solche eine Relation eine lineare Ordnungsrelation. Andere Quellen wie-
derum bezeichnen unsere”Ordnungsrelationen“ als
”Halbordnungen“ und unsere
”totalen Ordnungen“
als”Ordnungen“.18Bei Ordnungsrelation werden immer zwei Objekte verglichen: Ist eine Zahl großer als eine andere?
Ist eine Menge in der anderen enthalten? Etc. Insofern sind ≤R und ⊂X ganz wichtige Beispiele. δM
ist auch antisymmetrisch, also auch eine Ordnungsrelation. Sobald M mindestens 2 Elemente besitzt,
7. RELATIONEN, FUNKTIONALE RELATIONEN, ABBILDUNGEN 39
Definition 7.6. Eine Relation F auf M nennen wir eine funktionale Relation, falls gilt:
∀x ∈M : ∀y ∈M : ∀z ∈M :(
(x, y) ∈ F ∧ (x, z) ∈ F)→ y = z.
Zu jedem x ∈ M gibt es also hochstens ein y ∈ M mit xFy. Wir sagen dann: x wird
durch F auf y abgebildet und schreiben x 7→ y oder y = F (x).
Beispiele 7.2 (1), (3) und (5) sind funktionale Relationen. Beispiel (4) ist keine funktionale
Relation. In Beispiel 7.2 (6) ist R2 funktional, aber R1 ist nicht funktional.
Beispiel 7.7. Es gelte nun xRy, falls im folgenden Bild ein Pfeil von x nach y fuhrt.
•1
•2
•3
•4
• 5
• 6
• 7• 8
• 9
Dann ist R eine funktionale Relation auf der Grundmenge {1, 2, 3, 4, 5, 6, 7, 8, 9}.
ist es keine totale Ordnungsrelation. Dennoch ist δM ein atypisches Beispiel, denn δM ist die einzige
symmetrische Ordnungsrelation auf M .
40 1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
Definition 7.8. Ist R eine Relation auf der Grundmenge M , so definieren wir19:
D(R) := {x ∈M | ∃y ∈M : xRy},
Definitionsbereich von R;
B(R) := {y ∈M | ∃x ∈M : xRy},
Bild der Relation R;
Beispiel 7.7. (fortgesetzt) Wir zeichnen links die Definitionsmenge D(R), rechts die
Grundmenge M . Die bisherigen Pfeile zeichnen wir so ein, dass sie in D(R) beginnen und
in M enden. Wir wahlen einen”Zielbereich“ Y aus mit B(R) ⊂ Y ⊂M .
D(R) M
Zielbereich•1
•2
•3
•4
• 5
• 6
• 7
• 1
• 2
• 8
• 9
• 3
• 4
Abbildung 3: Eine funktionale Relation R mit D(R) = {1, 2, 3, 4}, B(R) = {1, 5, 7},
Zielbereich {1, 2, 5, 6, 7} und Grundmenge M = {1, 2, 3, 4, 5, 6, 7, 8, 9}.
19Viele Bucher, z.B. [17] bezeichnen B(R) als Wertebereich oder Wertemenge. Es gibt aber auch
Bucher, die den Begriff Wertebereich im Sinne des unten definierten Zielbereichs definieren. Wir werden
aus diesem Grund die Begriffe”Wertebereich“ und
”Wertemenge“ vermeiden.
7. RELATIONEN, FUNKTIONALE RELATIONEN, ABBILDUNGEN 41
Definition 7.9. Eine Abbildung ist ein Tripel (f,X, Y ), bestehend aus Mengen X und Y
und einer funktionalen Relation f auf der Grundmenge X ∪ Y , wobei D(f) = X und
B(f) ⊂ Y . Zumeist schreibt man Abbildungen als f : X−→Y oder Xf−→ Y . Man
nennt X den Definitionsbereich der Abbildung f : X−→Y , man nennt Y den Zielbereich
der Abbildung und man nennt f den Graphen der Abbildung. Eine Abbildung von X
nach Y ist eine Abbildung mit Definitionsbereich X und Zielbereich Y . Die Menge aller
Abbildungen von X nach Y notieren wir als Abb(X, Y ) oder als Y X . Die Notation x 7→
y bedeutet, dass x auf y abgebildet wird, d.h. (x, y) ist ein Element der funktionalen
Relation.
Der Begriff”Funktion“ ist gleichbedeutend zum Begriff
”Abbildung“. Es gibt Situationen,
in denen man haufiger den Begriff”Abbildung“ nutzt, in anderen ist der Begriff
”Funktion“
gebrauchlicher. Zum Beispiel, wenn der Zielbereich die reellen Zahlen sind, so redet man
von (reell-wertigen) Funktionen.
31.10.
Beispiele 7.10.
(a) f := {(x, x2) ‖x ∈ [0, 5]} ⊂ [0, 5] × R ist eine funktionale Relation mit D(f) = [0, 5]
und B(f) = [0, 25]. Dann ist f : [0, 5]−→[−4, 40] eine Abbildung. Wir schreiben
derartige Abbildungen als
f : [0, 5] −→ [−4, 40]
x 7→ x2
Alternativ kann man die zweite Zeile auch durch f(x) = x2 oder f(x) := x2 ersetzen.
(b) Sei f wie oben. Die Abbildungen F1 := (f, [0, 5], [0, 25]) und F2 := (f, [0, 5], [−4, 40])
sind verschieden, obwohl dieselbe funktionale Relation f zu Grunde liegt.
42 1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
(c) Die Identitat idM von M ist die Abbildung (δM ,M,M), die wir (dem obigen Beispiel
folgend) auch als M−→M , x 7→ x schreiben konnen.
(d) Ist M eine Teilmenge von N , so nennen wir die Abbildung (δM ,M,N) die Inklusion
von M in N oder genauer Inklusion der Menge M in die Menge N . 20
Bemerkung 7.11. Aus Ihrer jetzigen Sicht ist der essentielle Unterschied zwischen einer
funktionalen Relation und einer Abbildung, dass im Begriff der Abbildung auch der Ziel-
bereich festgelegt ist, wahrend eine funktionale Relation keinen Zielbereich hat. 21 Spater
werden der Definitionsbereich und der Zielbereich zusatzliche Struktur tragen: z.B. ei-
ne Vektorraumstruktur, eine Gruppenstruktur oder eine Abstandsfunktion. Da wichtige
Eigenschaften von Abbildungen wie z.B. Linearitat und Stetigkeit von solcher Zusatz-
struktur abhangt, wird es dann hilfreich sein, dass auch der Definitionsbereich im Tripel
einer Abbildung enthalten ist.
Es gibt auch einige Teilbereiche der Mathematik und ihren Anwendungen, in denen man
D(f) = X durch D(f) ⊂ X ersetzt. Dies ist zum Beispiel bei den”dicht definierten
Operatoren”
der Funktionalanalysis und der Quantenmechanik der Fall, zum Beispiel der
Orts- und der Impuls-Operator der Quantenmechanik.
20wichtig ist hier die Konjugation von”die Menge“: Genitiv (bzw. von-Konstruktion), dann Akkusativ
21Vergleich zu anderen Lehrbuchern: Es herrscht Uneinigekeit in der Literatur, ob eine Abbildung
Information uber den Zielbereich tragt oder nicht. Das Lehrbuch [12] unterscheidet in diesem Zusam-
menhang zwischen”Funktionen“, die wie unsere
”funktionale Relationen“ definiert sind, und
”Funktionen
von X nach Y “, die im wesentlichen unseren”Abbildungen“ entsprechen. In [17] bedeuten die Begriffe
”funktionale Relation“,
”Funktion“ und
”Abbildung“ dasselbe, es bleibt aber dort unklar, ob die oben
definierten Abbildungen F1 und F2 in diesem Buch gleich oder verschieden sind. Wir werden in der
Vorlesung die obigen Definitionen nutzen und zulassen, um innerhalb unserer Analysis I Klarheit zu
schaffen.
7. RELATIONEN, FUNKTIONALE RELATIONEN, ABBILDUNGEN 43
Bemerkung 7.12. Zur Interpretation: Aquivalenz- und Ordnungs-Relationen auf der
einen Seite und funktionale Relationen sind zwar ahnlich definiert (als Relationen und
somit als Mengen, deren Elemente Paare sind). Dennoch interpretiert man sie anders:
Aquivalenz- und Ordnungsrelationen vergleichen zwei Objekte. Beispiel: die Relation ≤R,
gibt an, ob die links stehende Zahl kleiner oder gleich der rechts stehenden ist. Die Inter-
pretation von funktionalen Relationen ist dynamischer, x 7→ x2 ordnet x den Wert x2 zu,
so wie ein(e) Platzanweiser(in) im Theater jedem Zuschauer sagt, in welchem Stockwerk
er den Theatersaal betreten darf: im Parkett (0. Stockwerk) oder im k-ten Rang (k-tes
Stockwerk): jedem Zuschauer wird ein Stockwerk zugeordnet. Aus diesem Grund ist die
Schreibweise xRy fur Ordnungs- und Aquivalenzrelationen ublich, wohingegen die Schreib-
weise y = R(x) fur funktionale Relationen ublich ist. Beides ist defniert als (x, y) ∈ R.
Bemerkung 7.13. Sei A eine auf M definierte Aussageform und sei f : M−→N eine
Abbildung. Dann gilt
{f(x) ‖x ∈M} = {y ∈ N | ∃x ∈M : f(x) = y} = B(f).
Definition 7.14. Sei f : X−→Y eine Abbildung.
(1) Fur M ⊂ X definieren wir die Einschrankung oder Restriktion von f : X−→Y
auf M als die Abbildung (f |M ,M, Y ), wobei
f |M := {(x, y) ∈ X × Y | x ∈M ∧ y = f(x)} = {(x, f(x)) ‖x ∈M},
(2) Ist g : Y−→Z eine weitere Abbildung, so definieren wir die Verkettung oder die
Komposition von g : Y−→Z mit f : X−→Y als die Abbildung (g ◦ f,X, Z),
wobei
g ◦ f(x) := g(f(x)).
44 1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
Man liest g ◦ f als”g nach f“.
Definition 7.15.
(1) Eine funktionale Relation f bzw. eine Abbildung f : X−→Y heißt injektiv, falls gilt
∀x1, x2 ∈ X : (f(x1) = f(x2)→ x1 = x2).
Dies bedeutet, dass jedes Element in X unter f auf ein anderes Element in Y abge-
bildet wird.
(2) Eine Abbildung f : X−→Y heißt surjektiv, falls B(f) = Y .
(3) Eine Abbildung f : X−→Y heißt bijektiv, falls sie injektiv und surjektiv ist.
X = D(f)
Y••••
•••••
injektiv
X = D(f)
Y•••••
••••
surjektiv
X = D(f)
Y••••
••••
bijektiv
Abbildung 4: Schemtische Darstellungen von injektiv, surjektiv und bijektiv.
Wenn f eine funktionale Relation ist, so ist f : D(f)−→B(f) eine surjektive Abbildung.
Beispiele 7.16. (in der Vorlesung ubersprungen = grau)
(a) Die Abbildung R−→R, x 7→ x2 ist weder injektiv noch surjektiv.
(b) Die Abbildung R>0−→R, x 7→ x2 ist injektiv, aber nicht surjektiv.
(c) Die Abbildung R>0−→R>0, x 7→ x2 ist bijektiv.
7. RELATIONEN, FUNKTIONALE RELATIONEN, ABBILDUNGEN 45
Um das obige Beispiel der/s Platzanweisers/in nochmals weiter zu entwickeln: Wenn der
Platzanweiser nicht nur das Stockwerk zuordnet, sondern auch den konkreten Sitzplatz,
so ist zu hoffen, dass diese Abbildung injektiv ist, da sonst zwei Leute auf dem selben
Platz sitzen mussen. Der Kassenwart des Theaters hingegen hofft, dass die Abbildung von
der Menge der Zuschauer auf die Menge der Sitzplatze auch surjektiv ist, da dann das
Theater voll besetzt ist.
Definition 7.17. Ist R eine Relation und R ⊂M ×M , dann definieren wir
R−1 := {(y, x) ∈M ×M | xRy},
Man nennt R−1 die Umkehrung von R.
UBUNG 7.18.
(a) Sei f eine funktionale Relation. Dann ist f−1 genau dann eine funktionale Relation,
wenn f injektiv ist.
(b) Ist f : X−→Y eine Abbildung, so ist f−1 : Y−→X genau dann eine Abbildung, wenn
f : X−→Y bijektiv ist.
(c) Ist f : X−→Y eine bijektive Abbildung, so gilt f−1 ◦ f = δX und f ◦ f−1 = δY .
Man nennt dann f−1 : Y−→X die Umkehrabbildung von f : X−→Y .
UBUNG 7.19. Seien f : X−→Y und g : Y−→Z Abbildungen. Zeigen Sie:
(1) Ist g ◦ f : X−→Z surjektiv, dann ist auch g surjektiv.
(2) Ist g ◦ f : X−→Z injektiv, dann ist auch f injektiv.
46 1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
(3) Geben Sie ein Beispiel an, das zeigt, dass die Umkehrung der Aussage (1) nicht gilt.
Das heißt: finden Sie Abbildungen f : X−→Y und g : Y−→Z, so dass g : Y−→Z
surjektiv ist, aber nicht g ◦ f : X−→Z.
(4) Geben Sie ein Beispiel an, das zeigt, dass die Umkehrung der Aussage (2) nicht gilt.
UBUNG 7.20. Seien X und Y Mengen, X 6= ∅. Es gibt eine injektive Abbildung f :
X−→Y genau dann, wenn es eine surjektive Abbildung g : Y−→X gibt.22
Siehe: Aufgabe 3 auf Ubungsblatt 3
SATZ 7.21 (Schroder, Bernstein). Seien X und Y Mengen. Angenommen, es gibt eine
injektive Abbildung f : X−→Y und eine injektive Abbildung g : Y−→X, dann gibt es
auch eine bijektive Abbildung g : X−→Y .
Beweis: 2. Ubungsblatt der Linearen Algebra I
Definition 7.22. Seien X und Y Mengen. Wir sagen:
• X und Y sind gleich machtig, falls es eine bijektive Abbildung f : X−→Y gibt.
• Y ist machtiger als X, falls es eine injektive Abbildung f : X−→Y und es keine
bijektive Abbildung b : X−→Y gibt.
• X ist endlich, falls es eine naturliche Zahl n ∈ N gibt, so dass X und {m ∈ N |
0 < m ≤ n} gleich machtig sind. Wir schreiben dann #X = n und sagen X hat
n Elemente.
• X ist unendlich, falls X nicht endlich ist. Wir schreiben dann #X =∞.
• X ist abzahlbar, falls es eine injektive Abbildung X → N gibt.
22Leider habe ich in der Vorlesung die Bedingung X 6= ∅ vergessen!
7. RELATIONEN, FUNKTIONALE RELATIONEN, ABBILDUNGEN 47
• X ist uberabzahlbar, wenn X nicht abzahlbar ist. Dann ist X machtiger als N.
UBUNG 7.23. Sei M ein Mengensystem. Fur A,B ∈M definieren wir
A ∼ B :⇐⇒ A und B sind gleichmachtig.
Zeigen Sie, dass ∼ eine Aquivalenzrelation auf M ist.
Beispiele 7.24.
(1) #X = 0 ⇐⇒ X = ∅.
(2) Endliche Mengen sind abzahlbar (Offensichtlich).
(3) X ist abzahlbar unendlich ⇐⇒ X und N sind gleich machtig. (Ein Beweis benotigt
vollstandige Induktion, oder die Peano-Axiome oder irgend etwas, was die naturlichen
Zahlen charakterisiert.)
(4) Z und N sind gleich machtig, Q und N sind gleich machtig (Ubung: Beweisen Sie
dies!). Also sind Z und Q abzahlbar unendlich.
(5) R is machtiger als N (wird spater bewiesen!)
!ACHTUNG!. Gilt #X =∞ und #Y =∞, so folgt daraus nicht, dass X und Y gleich
machtig sind.
Ist f : X−→Y eine Abbildung und M ⊂ X, so definieren wir
f#(M) := {y ∈ Y | ∃x ∈M : y = f(x)} = {f(x) ‖x ∈M}.
Man nennt f#(M) das Bild von M unter f . Wir erhalten eine Abbildung
P(X) −→ P(Y )(7.25)
M 7→ f#(M)
48 1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
Analog definiert man fur N ⊂ Y :
f#(N) := {x ∈ X | f(x) ∈ N}.
Man nennt f#(N) das Urbild von N unter f . Wir erhalten eine Abbildung
P(Y ) −→ P(X)(7.26)
N 7→ f#(N)
Die funktionalen Relationen f# bzw. f# werden in der Literatur (und auch in der Li-
nearen Algebra I) oft mit f bzw. f−1 bezeichnet. Dies kann zu Missverstandnisse fuhren,
da f und f# verschiedene funktionale Relationen sind und da f−1 nur dann eine funk-
tionale Relation ist, wenn f injektiv ist. Wir nutzen deswegen in den nachsten Wochen
die Bezeichnungen f# und f# wie oben, um Missverstandnisse zu vermeiden. Spater (ab
Analysis II) schreiben wir auch einfach f und f−1.
UBUNG 7.27. Sei f : X−→Y eine Abbildung, A,B ⊂ X und M,N ⊂ Y . Zeigen Sie
(1) f#(A ∩ B) ⊂ f#(A) ∩ f#(B). Geben Sie ein Beispiel an, das zeigt, dass diese
Teilmenge manchmal eine echte Teilmenge ist.
(2) f#(A ∪B) = f#(A) ∪ f#(B).
(3) A ⊂ B → f#(A) ⊂ f#(B).
(4) f#(M ∩N) = f#(M) ∩ f#(N).
(5) f#(M ∪N) = f#(M) ∪ f#(N).
(6) M ⊂ N → f#(M) ⊂ f#(N).
(7) A ⊂ f#(f#(A)). Geben Sie ein Beispiel an, das zeigt, dass diese Teilmenge manch-
mal eine echte Teilmenge ist.
8. FAMILIEN 49
(8) f#(f#(M)) ⊂ M . Geben Sie ein Beispiel an, das zeigt, dass diese Teilmenge
manchmal eine echte Teilmenge ist.
(9) f#(M rN) = f#(M) r f#(N)
Die Aussagen (1) und (2) werden auf dem 3. Ubungsblatt dieser Vorlesung bewiesen. Die
Aussagen (7), (8) und (9) wurden auf dem 2. Ubungsblatt der Linearen Algebra gezeigt.
8. Familien
Definition 8.1. Seien I und M Mengen. Eine (I-indizierte) Familie von Elementen von
M ist dasselbe wie eine Abbildung von I nach M . Wenn man eine Abbildung f : I−→M
als Familie interpretiert, so schreiben wir sie als (f(i))i∈I oder als (f(i) | i ∈ M). Die
Menge aller I-indizierten Familien von Elementen von M ist also M I = Abb(I,M). Eine
Familie (f(i))i∈I heißt nicht-leer, falls I nicht die leere Menge ist. Die Menge I heißt
Indexmenge. Ist die Indexmenge I := N oder I := N>0, so nennt man die Elemente in
M I = Abb(I,M) oft auch M -wertige Folgen oder Folgen in M .
Beispiele 8.2. (a) Eine (reell-wertige) Folge ist definiert als N-indizierte Familie von re-
ellen Zahlen. Eine solche Folge ist also eine Abbildung N−→R, die wir als (ai)i∈N
schreiben. Alternativ darf man diese Folge auch in der Form (a0, a1, a2, a3, . . .) schrei-
ben.
(b) Sei M eine Menge. Ein k-Tupel (a1, a2, . . . , ak) ∈ Mk definiert dann die Familie
(aj)j∈{1,2,...,k}. Wir erhalten eine bijektive Abbildung F : Mk−→M{1,...,k}, (a1, a2, . . . , ak) 7→
(aj)j∈{1,2,...,k}. Die Elemente von Mk wurden ganz anders”definiert“ als die Elemente
von M{1,...,k}. Dennoch haben die Elemente von Mk und die von M{1,...,k} nahezu iden-
tische Eigenschaften: beide sind durch eine geordnete Liste mit k Elementen von M
50 1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
beschreibbar. Damit uns die Formalien nun nicht erdrucken, ist es nun sinnvoll so zu
tun, als ware (a1, a2, . . . , ak) dasselbe wie (aj)j∈{1,2,...,k}. Man sagt dazu (a1, a2, . . . , ak)
wird mit (aj)j∈{1,2,...,k} identifiziert. Dadurch identifizieren wir auch automatisch Mk
mit M{1,...,k}. Um zu unterstreichen, dass dieses Identifizieren von obigem F abhangt
sagen wir: wir identifizieren Mk mit M{1,...,k} vermoge F . Wer das Wort”vermoge“
nicht mag, kann auch”mit Hilfe von“ sagen. 23
(c) Die Basis eines Vektorraums ist eine Familie von Vektoren, die linear unabhangig sind
und den Vektorraum erzeugen.
Bemerkung 8.3. Wenn Sie eine ahnliche Aussage oder Definition wie das obige (b) in
der Schule gesehen haben, so stand dort wahrscheinlich nicht eine”Familie von Vektoren“,
sondern eine”Menge von Vektoren“. Dies ist aber aus mehreren Grunden problematisch,
z.B. erhalten wir mit dieser Mengendefinition, dass
B :=
1
0
,
0
1
,
1
0
eine Basis von R2 ist. Man beachte, dass B genau zwei Elemente enthalt, da zwischen
obigen Mengenklammern zweimal derselbe Vektor steht.
Die Aussage
”Seien v1 und v2 Vektoren in R2. Dann ist {v1, v2} eine Basis von R2 genau dann wenn
{v1, v2} linear unabhangig sind.“
23Es stellt sich hier unweigerlich die Frage, wieso wir nicht gleich Elemente in M×M als Abbildungen
von {1, 2}−→M definiert haben. Dies geht aber leider nicht, da wir zur Einfuhrung von Abbildungen
bereits wissen mussten, was ein Paar und was ein kartesisches Produkt ist.
8. FAMILIEN 51
ist falsch, denn im Fall v1 = v2 6= 0 ist {v1, v2} = {v1} und somit linear unabhangig. Aber
{v1} ist keine Basis von R2. Korrekt ist hingegen die Aussage:
”Seien v1 und v2 Vektoren in R2. Dann ist (vi)i∈{1,2} eine Basis von R2 genau dann wenn
(vi)i∈{1,2} linear unabhangig ist.“
Anschaulich gilt: Familien registrieren Mehrfachnennungen. Uber {1, 2 . . . , k} oder uber
N indizierte Mengen registrieren auch die Ordnung der Elemente.
Definition 8.4. Ist (Mi)i∈I eine Familie von Mengen, (d.h. jedes Mi ist eine Menge), so
definieren wir ⋃(Mi | i ∈ I) :=
⋃{Mi | i ∈ I} = {x | ∃i ∈ I : x ∈Mi}
und falls (Mi)i∈I nicht-leer ist⋂(Mi | i ∈ I) :=
⋂{Mi | i ∈ I} = {x | ∀i ∈ I : x ∈Mi}.
Wir schreiben auch⋃i∈IMi fur
⋃(Mi | i ∈ I) und
⋂i∈IMi fur
⋂(Mi | i ∈ I).
Kartesische Produkte von Mengenfamilien.
Wir haben bereits Mk mit M{1,...,k} identifiziert. Die Elemente von MN sind also eine Art
”unendliches kartesisches Produkt“. Solche Produkte sind seit Ende des 19. Jahrhunderts
in vielen Bereichen der Mathematik ganz wichtig. Dieser Begriff soll deswegen prazisiert
werden. Wir wollen auch gleich Produkte in der Form M1 ×M2 × . . . zulassen, d.h. die
Mi (genannt Faktoren) durfen verschieden sein.
Definition 8.5 (Kartesische Produkte von Mengenfamilien). Gegeben sei eine Familie
(Mi)i∈I von Mengen, d.h. gegeben sei eine Indexmenge I und fur jedes i ∈ I eine Menge
52 1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
Mi. Wir definieren zunachst M :=⋃i∈IMi. Das kartesische Produkt der Familie (Mi)i∈I
ist definiert als ∏i∈I
Mi :={
(mi)i∈I ∈M I | ∀i ∈ I : mi ∈Mi
}Beispiele 8.6.
∏i∈IM = M I
Analog zu Beispiele 8.2 (b) kann man∏
i∈{1,...,k}Mi mit M1 × · · · ×Mk identifizieren.
Ein Mi in der obigen Definition nennt man den i-ten Faktor oder die i-te Komponente.
Fur ein fixiertes i0 ∈ I nennt man die Abbildung∏i∈I
Mi −→ Mi0
(mi)i∈I 7→ mi0
die i0-te kanonische Projektion.
Literatur fur das bisherige Kapitel
Das Buch [12] ist eine recht ausfuhrliche und leicht lesbare Einfuhrung in die mengen-
theoretischen Grundlagen der Mathematik. Das Buch [17] ist deutlich kurzer und be-
schrankt sich mehr auf das wesentliche, aber fur manche Anfanger vielleicht etwas zu
dicht geschrieben. Es fokussiert sich auch mehr auf besonders interssante Aspekte. Die
wichtigsten Begriffe in Kurze finden sich auch im Buch von D. Grieser [18], das auf dem
Skript seiner Analysis-Vorlesung [19] aufbaut. Weitere Literatur ist das Buch von Halmos
in einer deutschen und englischen Fassung [20]. Einen deutlich tiefer gehenden Einstieg
in die Mengenlehre findet man in [13].
KAPITEL 2
Zahlen2.11.
Ab jetzt schreiben wir→ oder −→ fur Abbildungen, statt wie bisher das rote Symbol −→
zu verwenden. Wir schreiben {f(x) | x ∈M} statt {f(x) ‖x ∈M}. Die exakte Bedeutung
kann man aus dem Kontext heraus ablesen.
Der einleitende Teil der Vorlesung ist nun beendet und wir – Professoren, Mitarbeiter,
Tutoren und die Horer der Vorlesung – sollten uns bemuhen, ab jetzt deutlich rigo-
rosere Begrundungen zu geben. Wenn aus Zeitgrunden nicht alles bewiesen werden kann,
so mussen wir klar darstellen, wo genau wir kleinere Lucken lassen, und andeuten, wie
diese geschlossen werden konnen (Eigenes Nachdenken, Anhang, Literatur, Zentralubung,
Ubungsblatter, etc.).
1. Die naturlichen Zahlen
Die Axiome fur die naturlichen Zahlen bilden die Peano-Axiome, benannt nach dem ita-
lienischen Mathematiker Guiseppe Peano (1858–1932).
AXIOME 1.1 (”Axiome“ der naturlichen Zahlen (Peano-Axiome)). Die naturlichen Zah-
len bestehen aus
• einer Menge N,
• einem (ausgewahlten) Element in N, das wir 0 nennen,
53
54 2. ZAHLEN
• und einer Abbildung s : N −→ N, x 7→ s(x), genannt die Nachfolger-Abbildung.
Wir fordern, dass hierfur folgenden Eigenschaften, genannt die Peano-Axiome, erfullt sind:
(P1) 0 6∈ B(s) (das heißt: 0 ist nicht im Bild von s)
(P2) Die Abbildung s : N −→ N ist injektiv.
(P3) (Induktionsaxiom) Erfullt T ⊂ N die Bedingungen 0 ∈ T und s#(T ) ⊂ T , dann gilt
bereits T = N.
Alles, was Sie uber die naturlichen Zahlen kennen, kann man darauf aufbauen, zum Bei-
spiel Addition, Multiplikation und Exponieren von naturlichen Zahlen, die bekannten
Gesetze (zum Beispiel: Kommutativitat von Addition und Multiplikation, Assoziativitat
von Addition und Multiplikation, Distributivgesetz, Potenzgesetz) kann man daraus her-
leiten. Da dies in der Linearen Algebra I detailiert besprochen werden soll, werden wir
dies in der Analysis I nur erwahnen. Fur Details verweisen wir auch auf Anhang B, der
manche dieser Aspekte ausfuhrt.
Auf den naturlichen Zahlen N definiert man eine Relation ≤ auf N wie folgt: Fur alle
n,m ∈ N gelte:
n ≤ m⇐⇒ ∃k ∈ N : n+ k = m.
Dies ist eine totale Ordnungsrelation auf N, was auch ein paar hier nicht ausgefuhrte
Beweise erfordert, wenn man alles von Grund auf beweist. Ferner definiert man
n ≥ m :⇐⇒ m ≤ n
n < m :⇐⇒ n ≤ m ∧ ¬n = m
n > m :⇐⇒ m < n
1. DIE NATURLICHEN ZAHLEN 55
Aus den Peano-Axiomen leitet man zwei wichtige Satze her: den Satz uber vollstandige
Induktion und den Dedekindschen Rekursionssatz, beide werden in Anhang B bewiesen.
SATZ 1.2 (Dedekindscher Rekursionssatz). Sei M eine Menge, a ∈M und g : M×N −→
M eine Abbildung.1 Dann gibt es genau eine Abbildung f : N −→ M so dass f(0) = a
und
∀n ∈ N : f(n+ 1) = g(f(n), n).
Wenn man alles sauber aufbauen will, so sind zunachst die Summe +, das Produkt · und
das Exponieren durch den Rekursionssatz zu definieren, siehe Anhang B. Wir wollen diese
Operationen aber als gegeben voraussetzen.
Beispiel 1.3 (Definition der Fakultat). Wir setzen M := N, a = 1 und g(m,n) :=
(n+ 1) ·m. Dann nennt man die Abbildung f , die uns Satz 1.2 liefert, die Fakultat. Wir
schreiben n! statt f(n). Klammerkonvention: ! wird vor + und · ausgefuhrt. Somit ist
! : N→ N die einzige Funktion, die die Eigenschaften
0! = 1
∀n ∈ Nr {0} : n! = n · (n− 1)!
erfullt. Es gilt somit 1! = 1, 2! = 1 · 2, 3! = 1 · 2 · 3, . . . , n! = 1 · 2 · · · · · n.
Beispiel 1.4 (Summen- und Produktsymbole). Oft ist es wichtig, Ausdrucke der Form
a1 + . . .+ an
1Man schreibt hier und immer in vergleichbaren Situationen dann g(m,n) statt g((m,n)).
56 2. ZAHLEN
exakt zu beschreiben. Hierzu fuhren wir ein Symbol∑n
j=1 ein. Man definiert rekursiv
0∑j=1
aj := 0
und fur alle n ∈ Nn+1∑j=1
aj :=
(n∑j=1
aj
)+ an+1.
Dann ist2
n∑j=1
aj = a1 + . . .+ an.
Analog hierzu0∏j=1
aj := 1
und fur alle n ∈ Nn+1∏j=1
aj :=
(n∏j=1
aj
)· an+1.
Insbesondere gilt also n! =∏n
j=1 j.
Wir nutzen3 auch folgende Verallgemeinerung: Es seien k, n ∈ Z und es gelte k ≤ n + 1.
Dann definiert man
n∑j=k
aj :=n−k+1∑j=1
aj+k−1 = ak+ak+1 + . . .+an,
n∏j=k
aj :=n−k+1∏j=1
aj+k−1 = ak ·ak+1 · · · · ·an.
2Dies ist genau genommen keine Aussage, sondern die Definition des Ausdrucks a1 + . . . + an, der
bisher nicht so klar definiert war, da die Bedeutung der Punkte unklar blieb.
3Solange wir Z noch nicht eingefuhrt haben, sollte man k, n ∈ N annehmen.
1. DIE NATURLICHEN ZAHLEN 57
SATZ 1.5 (Vollstandige Induktion). Sei A( · ) eine auf N definierte Aussageform. Wir
setzen voraus, dass Induktionsanfang und Induktionsschritt erfullt sind:
Induktionsanfang: A(0) ist wahr.
Induktionsschritt: Fur alle n ∈ N gilt: (A(n) =⇒ A(n+ 1))).
Dann gilt fur alle n ∈ N die Aussage A(n).
Im Induktionsschritt nennt man A(n) die Induktionsvoraussetzung.
Beispiel 1.6. Wir wollen zeigen, dass fur alle n ∈ N die folgende Aussage wahr ist
A(n) :n∑j=1
j =1
2n (n+ 1).
Induktionsanfang n = 0
Fur n = 0 steht auf der linken Seite (l.S.) nach Definition∑n
j=1 j = 0.
Auf der rechten Seite (r.S.) haben wir 120 (0 + 1) = 0. Somit l.S. = r.S..
Deswegen ist A(0) wahr.
Induktionsschritt von n auf n+ 1
Nach Induktionsvorraussetzung gilt bereits die Aussage A(n), also
n∑j=1
j =1
2n (n+ 1).
Zu zeigen ist A(n+ 1), also die Aussage
n+1∑j=1
j =1
2(n+ 1)
((n+ 1) + 1
).
58 2. ZAHLEN
Wir berechnen die linke Seite:
n+1∑j=1
j =( n∑j=1
j)
+(n+1) =1
2n (n+1)+(n+1) =
n (n+ 1) + 2 (n+ 1)
2) =
1
2(n+2) (n+1).
Wir berechnen die rechte Seite:
1
2(n+ 1)
((n+ 1) + 1
)=
1
2(n+ 1) (n+ 2).
Also wieder l.S. = r.S..
Damit haben wir gezeigt, dass A(n+ 1) aus A(n) folgt.
Schlussfolgerung (wird normalerweise nicht mehr aufgeschrieben, da es bei jeder vollstandi-
gen Induktion immer dasselbe Argument ist)
Die Voraussetzungen von Satz 1.5 sind also erfullt, deswegen gilt fur alle n ∈ N die
Aussage A(n).
Beispiel 1.7 (Geometrische Summe). Sei q ∈ Nr{1} (oder q ∈ Rr{1} oder q ∈ Cr{1}
oder in irgendeinem unitaren Ring R, so dass (1− q)−1 existiert).
Wir wollen zeigen, dass fur alle n ∈ N die folgende Aussage wahr ist
A(n) :n∑j=0
qj =1− qn+1
1− q.
Wir multiplizieren auf beiden Seiten mit 1−q und erhalten daraus die zu A(n) aquivalente
Aussageform
A(n) : (1− q)n∑j=0
qj = 1− qn+1,
die wir durch Induktion uber n zeigen wollen.
Induktionsanfang n = 0
1. DIE NATURLICHEN ZAHLEN 59
Fur n = 0 rechnen wir
(1− q)0∑j=0
qj = (1− q)q0 = (1− q) 1 = 1− q1 = 1− q0+1.
Deswegen ist A(0) wahr.
Induktionsschritt von n auf n+ 1
Nach Induktionsvorraussetzung gilt bereits die Aussage A(n), also
(1− q)n∑j=0
qj = 1− qn+1.
Zu zeigen ist A(n+ 1), also die Aussage
(1− q)n+1∑j=0
qj = 1− q(n+1)+1.
Wir berechnen:
(1− q)n+1∑j=0
qj = (1− q)(( n∑
j=0
qj)
+ qn+1
)= (1− q)
( n∑j=0
qj)
︸ ︷︷ ︸=1−qn+1
+(1− q) qn+1
= 1− qn+1 + qn+1 − qn+2 = 1− qn+2.
Also haben wir A(n+ 1) gezeigt.
Auch die folgenden elementaren Gesetze der naturlichen Zahlen mussen bei einem logisch
vollstandigen Aufbau durch vollstandige Induktion gezeigt werden. Genau genommen,
lange bevor wir obige Beispiele diskutieren konnen. Aus Zeitgrunden werden wir dies
nicht ausfuhren, sondern ebenfalls wieder auf Anhang B des Skripts verweisen.
60 2. ZAHLEN
SATZ 1.8. (N,+, ·) erfullt die folgenden Eigenschaften:
(Aa) Addition ist assoziativ.
Fur alle x, y, z ∈ N gilt
(x+ y) + z = x+ (y + z).
(An) Addition hat neutrales Element.
Es gibt ein Element 0 ∈ N, so dass fur alle x ∈ N gilt
x+ 0 = 0 + x = x.
(Diese Null ist unsere bisherige!)
(Ak) Addition ist kommutativ.
Fur alle x, y ∈ N gilt
x+ y = y + x.
(Ma) Multiplikation ist assoziativ.
Fur alle x, y, z ∈ N gilt
(x · y) · z = x · (y · z).
(Mn) Multiplikation hat neutrales Element.
Es gibt ein Element 1 ∈ N, so dass fur alle x ∈ N gilt
x · 1 = 1 · x = x.
(Diese Eins ist unsere bisherige!)
(Mk) Multiplikation ist kommutativ.
Fur alle x, y ∈ N gilt
x · y = y · x.
1. DIE NATURLICHEN ZAHLEN 61
(AMd) Addition und Multiplikation erfullen das Distributivgesetz.
Fur alle x, y, z ∈ N gilt
x · (y + z) = x · y + x · z
(y + z) · x = y · x+ z · x
Eine weitere elementare Eigenschaft von N, die in der Linearen Algebra gezeigt wurde, ist
die Wohlordnung von N. Einen Beweis findet man in Anhang B, wo der Satz nochmals
als Proposition 3.3 wiederholt ist.
SATZ 1.9 (Wohlordnung von N). Jede nicht-leere Teilmenge T von N besitzt ein Mini-
mum.
Hierbei nennen wir y ein Minimum von T , falls y ∈ T und ∀x ∈ T : y ≤ x. Wenn eine
Menge mit Ordungsrelation ein Minimum besitzt, so ist dieses eindeutig; diese Eindeutig-
keit folgt direkt aus der Antisymmetrie. Falls ein Minimum y in M existiert, so schreiben
wir y = minM . Wir erhalten analog die Definition eines Maximums, wenn y ≤ x durch
y ≥ x ersetzen, und schreiben dann y = maxM .
SATZ 1.10. Ist M eine abzahlbar unendliche Menge, dann sind M und N gleich machtig.
Beweis. Da M abzahlbar ist, gibt es eine injektive Abbildung f : M → N. Wir definieren
Q := f#(M). Da f injektiv ist, ist die Abbildung
M −→ Q
x 7→ f(x)
62 2. ZAHLEN
bijektiv. Also sind M und Q gleich machtig. Zu zeigen bleibt, dass Q und N gleich machtig
sind.
Zeichnung mit Q in N und der Abbildung g, die das nachsthohere Element sucht.
Wir definieren fur k ∈ N:
Q>k := {x ∈ Q | x > k}.
Behauptung: ∀k ∈ N : Q>k 6= ∅.
Begrundung: Angenommen Q>k = ∅, dann ware Q ⊂ {1, 2, . . . , k}, also ware Q und somit
N endlich. Widerspruch.
Wir definieren g : Q −→ Q als
g(k) := das Minimum von Qk.
Die Funktion ist wohldefiniert wegen Satz 1.9. Aus der Definition von g ergibt sich insbe-
sondere g(k) > k.
Definiere rekursiv mit Hilfe des Dedekindschen Rekursionssatzes die Funktion h : N→ Q
durch
h(0) := das Minimum von Q,
∀n ∈ N : h(n+ 1) := g(h(n)).
Somit gilt h(n+1) > h(n), und deswegen zeigt man leicht (durch eine weitere vollstandige
Induktion), dass h : N → Q injektiv ist.4 Da die Inklusion Q → N injektiv ist, folgt aus
dem Satz 7.21 von Schroder-Bernstein, dass Q und N gleich machtig sind.
4Die Abbildung h : N→ Q ist sogar bijektiv, aber wir benotigen dies im folgenden nicht.
2. ETWAS KOMBINATORIK 63
2. Etwas Kombinatorik
Um den Umgang mit naturlichen Zahlen zu uben, zeigen wir einige Aussagen, die in der
Kombinatorik wichtig sind.
SATZ 2.1. Fur endliche Mengen N und Q gilt (#N) · (#Q) = #(N ×Q).
Beweis.
Sei also s := #N und t := #Q. Es gibt also bijektive Abbildung ϕ : N → {1, 2, . . . , s} 5
und ψ : N → {1, 2, . . . , t}. Dann ist die Abbildung
ϕ× ψ : N ×Q −→ {1, 2, . . . , s} × {1, 2, . . . , t}
(n, q) 7→ (ϕ(n), ψ(q))
bijektiv und man zeigt auch sofort, dass
p : {1, 2, . . . , s} × {1, 2, . . . , t} −→ {1, 2, . . . , ts}
(a, b) 7→ a+ s(b− 1)
bijektiv ist. Also
#(N ×Q) = #({1, 2, . . . , s} × {1, 2, . . . , t}) = #({1, 2, . . . , ts}) = ts.
7.11.
SATZ 2.2. Sei n ∈ N r {0}. Angenommen M hat k Elemente. Dann ist kn die Anzahl
der Elemente von Mn = M × · · · ×M︸ ︷︷ ︸n−mal
.
5Hier gilt immer: {1, 2, . . . , s} := {r ∈ N | 0 < r ≤ s}, insbesondere ist es die leere Menge, falls s = 0.
64 2. ZAHLEN
Der Beweis ist eine einfach Induktion, die nun jeder selbst durchfuhren konnen sollte.
Beweis. Wir zeigen den Satz durch vollstandige Induktion uber n ∈ Nr {0}:
A(n) : #(Mn) = (#M)n.
2. ETWAS KOMBINATORIK 65
Induktionsanfang n = 1
Offensichtlich wegen M1 = M und k1 = k.
Induktionsschritt von n auf n+ 1
#(Mn+1) = #(M ×Mn) = (#M) · (#(Mn)) = (#M) · (#M)n = (#M)n+1
Hierbei folgt das erste Gleichheitsszeichen direkt aus der Definition von Mn+1, das zweite
aus dem vorangehenden Satz, das dritte nach Induktionsvoraussetzung und das letzte aus
der Definition von Potenzen in N.
SATZ 2.3. Angenommen, eine Menge M hat n ∈ N Elemente, dann gibt es 2n Elemente
in P(M).
Auch dies beweist man durch Induktion uber n.
Beweis. Induktionsanfang n = 0
Die leere Menge ∅ ist die einzige Menge mit 0 Elementen. Sie hat einzige Teilmenge,
namlich ∅.
Induktionsschritt von n auf n+ 1
Nun sei #M = n+ 1 und sei x ∈M . Definiere M ′ := M r {x}.
Wir definieren F : P(M ′)× {0, 1} −→ P(M) durch (A, 0) 7→ A und (A, 1) 7→M r A.
66 2. ZAHLEN
Die Umkehr-Abbildung ist
G : P(M) −→ P(M ′)× {0, 1}
B 7→
(B, 0) falls x /∈ A
(M rB, 1) falls x ∈ A
Man uberpruft leicht, dass G die Umkehrfunktion von F ist. Also ist F bijektiv. Wir
erhalten nach Induktionsvoraussetzung
#P(M) = #(M ′ × {0, 1}) Satz 2.1= (#M ′)(#{0, 1}) = 2n · 2 = 2n+1.
Ahnlich zeigt man auch: sind M und N endliche Mengen, dann gilt
#(Abb(M,N)) = (#N)(#M),
oder in der anderen Schreibweise
#(NM) = (#N)(#M).
Definition 2.4. Eine Permutation einer Menge M ist eine bijektive Abbildung von M
nach M .
SATZ 2.5. Angenommen M hat n Elemente. Dann ist n! die Anzahl der Permutationen
von M .
Interpretation: n! ist die Anzahl der Moglichkeiten, n unterscheidbare Objekte anzuord-
nen.
Satz 2.5 ist ein Spezialfall von Satz 2.6, folgt also bereits aus Satz 2.6.
2. ETWAS KOMBINATORIK 67
SATZ 2.6. Seien M und N endliche Mengen mit #M ≥ #N . Dann ist die Anzahl der
injektiven Abbildungen von N nach M gleich
(#M)!
(#M −#N)!.
Interpretation: m!/(m−n)! = m · (m− 1) · . . . · (m−n+ 1) ist die Anzahl der Moglichkei-
ten, aus einer Menge von m unterscheidbaren Objekten n Objekte herauszunehmen und
anzuordnen.
Beweis. Wir zeigen durch Induktion uber n ∈ N fur festes k ∈ N .
A(n, k) :
Gilt #M = n+ k und #N = n, dann gibt es
(n+ k)!/k! viele injektive Abbildungen N −→M .
Induktionsanfang n = 0.
Also N = ∅. Dann ist ∅ : ∅ → M die einzige Abbildung von N nach M . Sie ist injektiv.
Andererseits gilt dann (n+ k)!/k! = k!/k! = 1.
Induktionsschritt von n auf n+ 1.
Sei #N = n+1 und #M = n+1+k. Wir wahlen ein a ∈ N . Es gibt n+k+1 Moglichkeiten,
dem Element a ein Element von M zuzuweisen. Sobald festgelegt ist, dass a auf ein b ∈M
abgebildet wird, kann noch eine injektive Abbildung von N r {a} auf M r {b} gewahlt
werden. Hierfur gibt es nach Induktionsvoraussetzung (n + k)!/k! Moglichkeiten. Somit
ist die Anzahl der injektiven Abbildungen von N nach M durch
(n+ k + 1) · (n+ k)!
k!=
(n+ k + 1) (n+ k)!
k!=
(n+ k + 1)!
k!
68 2. ZAHLEN
gegeben.
SATZ 2.7. Seien m, k ∈ N. Die Anzahl der k-elementigen Teilmengen von einer Menge
mit m Elementen, m ≥ k ist: mk
:=m!
k! (m− k)!.
Die oben definierte Zahl
mk
heißt Binomialkoeffizient.
Beweis. Sei N eine Teilmenge mit k Elementen von M , m = #M . Die Anzahl der bijekti-
ven Abbildungen {1, 2, . . . , k} −→ N ist k!. Jede solche bijektive Abbildung {1, 2, . . . , k} −→
N ergibt eine injektive Abbildung {1, 2, . . . , k} −→ M , und umgekehrt ergibt jede in-
jektive Abbildung f : {1, 2, . . . , k} −→ M , x 7→ f(x) eine bijektive Abbildung f :
{1, 2, . . . , k} −→ B(f), x 7→ f(x). Ist deswegen r die Anzahl der k-elementigen Teilmen-
gen von M , dann ist r · k! die Anzahl der injektive Abbildungen f : {1, 2, . . . , k} −→M .
Nach vorigem Satz also r · k! = m!/(m− k)! und daraus ergibt sich
r =
mk
.
Offensichtlich gilt
mk
=
m
m− k
.
2. ETWAS KOMBINATORIK 69
Wir setzen zudem
mk
:= 0 fur m, k ∈ Z, falls k < 0 oder k > m.
Sei M = {1, 2, . . . ,m}. Dann hat M wegen Satz 2.3 2m Teilmengen. Da es
mk
Teil-
mengen mit k Elementen gibt, folgt:
FOLGERUNG 2.8. Fur m ∈ N gilt
2m =m∑k=0
mk
.
SATZ 2.9. Es gelte m, k ∈ Z und m > 0. Dann gilt:
m− 1
k − 1
+
m− 1
k
=
mk
.
Beweis. In den Fallen m = k ∈ N r {0} und den Fallen k = 0, m ∈ N r {0} haben
wir
mk
= 1, ein Summand ist 0 und der andere 1. Die Behauptung ist trivialerweise
richtig, falls k < 0 oder k > m.
70 2. ZAHLEN
In den ubrigen Fallen rechnen wirm− 1
k − 1
+
m− 1
k
=(m− 1)!
(k − 1)! (m− 1− k + 1)!+
(m− 1)!
k! (m− 1− k)!
=k (m− 1)!
k (k − 1)! (m− k)!+
(m− k)(m− 1)!
k! (m− k) (m− 1− k)!
=(k +m− k) (m− 1)!
k! (m− k)!
=m!
k! (m− k)!
Pascalsches Dreieck
Bild eines Pascalschen Dreiecks
Alternativ auch hier zu sehen.
SATZ 2.10 (Binomische Formel). Seien x, y ∈ R oder in einem beliebigen kommutativen
Ring6 mit 1. Sei n ∈ N.
Dann gilt
(x+ y)n =n∑k=0
nk
xkyn−k.
Hierbei nutzen wir die Definition: x0 = y0 = (x+ y)0 = 1.
6Wenn Sie diesen Begriff des nachsten Abschnitts noch nicht kennen, ignorieren Sie bitte diesen Fall
und betrachten Sie zunachst den Fall x, y ∈ N oder x, y ∈ R.
2. ETWAS KOMBINATORIK 71
Beweis. Induktionsanfang n = 0
Auf beiden Seiten steht dann 1.
Induktionsschritt von n− 1 auf n fur n ∈ N>0
(x+ y)n = (x+ y) (x+ y)n−1
= (x+ y)
n−1∑k=0
n− 1
k
xkyn−k−1
=
n−1∑k=0
n− 1
k
xk+1yn−k−1 +n−1∑k=0
n− 1
k
xkyn−k
=n∑k=1
n− 1
k − 1
xkyn−k +n−1∑k=0
n− 1
k
xkyn−k
=n∑k=0
n− 1
k − 1
xkyn−k +n∑k=0
n− 1
k
xkyn−k
=n∑k=0
n− 1
k − 1
+
n− 1
k
xkyn−k
=n∑k=0
nk
xkyn−k.
Hierbei nutzen wir die Induktionsvoraussetzung in der zweiten Zeile, das Distributivgesetz
in der dritten, in der vierten Zeile wird im ersten Summand k durch k+1 ersetzt. Danach
72 2. ZAHLEN
nutzen wir n− 1
−1
=
n− 1
n
= 0,
dann wieder das Distributivgesetz und letztendlich Satz 2.9.
3. Die ganzen Zahlen
Der nachste Schritt ist nun, die Menge der uns bekannten Zahlen Schritt fur Schritt zu
erweitern:
N ⊂ Z ⊂ Q ⊂ R ⊂ C
Wir wollen diese Erweiterungen durch Eigenschaften charakterisieren.
Wir schreiben
Z := {. . . ,−2,−1, 0, 1, 2, . . .} ⊃ N
fur die ganzen Zahlen.7
Die Addition und die Multiplikation kann man zu Abbildungen
+ : Z× Z −→ Z, (a, b) 7→ a+ b
· : Z× Z −→ Z, (a, b) 7→ a · b
7Wir wollen wiederum Z nur durch charakterisierende Eigenschaften beschreiben, aber kein Modell
konstruieren, das diese Eigenschaften erfullt. Ein derartige Modell kann man zum Beispiel konstruieren
in dem man auf N × N die Aquivalenzrelation (m,n) ∼ (a, b) ⇐⇒ m + b = n + a einfuhrt; dann sind
die Element von Z die Aquivalenzklassen dieser Relation. Mit einer ahnlichen Konstruktion kann man
aus den ganzen Zahlen die rationalen Zahlen Q konstruieren. Diese beiden Konstruktion sollen in der
Linearen Algebra erklart werden.
3. DIE GANZEN ZAHLEN 73
erweitern, so dass die Eigenschaften (Aa), (Ak), (An), (Ma), (Mk), (Mn) und (AMd)
weiterhin gelten, wenn man dort N durch Z ersetzt. Außerdem gilt
(Ai) Addition hat inverse Elemente.
Zu jedem x ∈ Z gibt es ein y ∈ Z, so dass
x+ y = y + x = 0.
Man nennt y das Inverse von x bezuglich der Addition und schreibt normalerweise
−x anstelle von y.
Schreibweise
x− y := x+ (−y).
Hinzu kommt eine Eigenschaft, die anschaulich besagt, dass die ganzen Zahlen”die kleins-
te Erweiterung“ der naturlichen Zahlen sind, die diese Eigenschaften erfullt. Prazise aus-
gedruckt:
(MEZ) Minimale Erweiterung.
Ist T eine Teilmenge von Z mit N ⊂ T und gilt
∀x, y ∈ T : x+ y ∈ T
und
∀x ∈ T : −x ∈ T,
dann gilt bereits T = Z.
Auch die Ordnung ≤ setzt sich auf Z fort und die Eigenschaften (1)–(5) in Lemma 3.1in
Anhang B.3 gelten weiter.
74 2. ZAHLEN
Eine mit Addition und Mulitplikation versehene Menge, die die Eigenschaften (Aa), (Ak),
(An), (Ai), (Ma), und (AMd) erfullt, nennt man Ring. Gilt zusatzlich (Mn), so spricht
man von einem Ring mit Eins. Ein Ring, der zusatzlich (Mk) erfullt, nennt man einen
kommutativen Ring.
Somit ist (Z,+, ·) ein kommutativer Ring mit Eins. Ein Ring (R, +, ·), der die naturlichen
Zahlen enthalt 8 und (MEZ) erfullt, stimmt”im wesentlichen“ mit den ganzen Zahlen
uberein. Praziser: es gibt eine bijektive Abbildung b : Z −→ R mit
∀x, y ∈ Z : b(x+ y) = b(x)+b(y) und b(x · y) = b(x)·b(y).
Solche eine bijektive Abbildung, die Addition und Multiplikation erhalt, nennt man einen
(Ring)-Isomorphismus oder Isomorphismus von Ringen. Wir sagen: (R, +, ·) ist isomorph
(als Ring) zu (Z,+, ·) und schreiben (R, +, ·) ∼= (Z,+, ·).
Notation. Den Ring der ganzen Zahlen schreiben wir zumeist als Z an Stelle von
(Z,+, ·), da die Addition und die Multiplikation aus dem Kontext heraus klar sind.
4. Die rationalen Zahlen
Die rationalen Zahlen sind9
Q :={ zn
∣∣∣ z ∈ Z, n ∈ N>0
}.
8Gemeint ist hier: als Unterring enthalt, das heißt es wird gefordert, dass sich die bereits auf Z× Z
definiterten Operatoren + und · sich zu + und · fortsetzen.9An dieser Stelle musste eigentlich gesagt werden, wie z
n definiert ist. Dies wurde in der Linearen
Algebra diskutiert und wird deswegen hier nicht erklart.
4. DIE RATIONALEN ZAHLEN 75
Hierbei giltz
n=
y
m⇐⇒ zm = yn.
Die Addition und die Multiplikation setzen sich zu Abbildungen
+ : Q×Q −→ Q, (a, b) 7→ a+ b
· : Q×Q −→ Q, (a, b) 7→ a · b
fort, und die Eigenschaften (Aa), (Ak), (An), (Ai), (Ma), (Mk), (Mn) und (AMd) gelten
weiterhin fur (Q,+, ·). Außerdem gilt
(Mi) Multiplikation hat inverse Elemente.
Zu jedem x ∈ Qr {0} gibt es ein y ∈ Q, so dass
x · y = y · x = 1.
Man nennt y das Inverse von x bezuglich der Multiplikation und schreibt norma-
lerweise x−1 anstelle von y.9.11.
Anschaulich: Q ist die kleinste Erweiterung von N, die diese Eigenschaften hat.
Prazise Bedeutung:
(MEQ) Minimale Erweiterung.
Ist T eine Teilmenge von Q mit N ⊂ T und gilt
∀x, y ∈ T : x− y ∈ T
∀x ∈ T : ∀x ∈ T r {0} : x · y−1 ∈ T,
dann gilt bereits T = Q.
76 2. ZAHLEN
Auch die Ordnung setzt sich fort. Die Ordnung auf Q ist total.
Mit Addition und Multiplikation versehene Mengen mit mindestens 2 Elementen nennt
man Korper, falls die Eigenschaften (Aa), (Ak), (An), (Ai), (Ma), (Mk), (Mn), (Mi) und
(AMd) erfullt sind.
Also ist (Q,+, ·) ein Korper. Wie bei den ganzen Zahlen schreiben wir oft Q fur (Q,+, ·).
Jeder Korper, der die naturlichen Zahlen enthalt und (MEQ) erfullt, ist isomorph zum
Korper der rationalen Zahlen.
In jedem Korper K gilt 0 6= 1. Denn angenommen, wir hatten 0 = 1, so folgt fur alle
x ∈ K: x = 1 · x = 0 · x = 0. Also K = {0}. Dies widerspricht der Forderung, dass K
mindestens zwei Elemente hat.
UBUNG 4.1. Versehe F2 := {0, 1} mit der folgenden Addition und Multiplikation:
+ 0 1
0 0 1
1 1 0
· 0 1
0 0 0
1 0 1
Zeigen Sie, dass (F2,+, ·) ein Korper ist. Man nennt ihn den Korper mit 2 Elementen.
Ist (K, +, ·) ein Korper, und hat K genau zwei Elemente, dann ist (K, +, ·) isomorph zu
(F2,+, ·).
Die Ordnung auf Z setzt sich zu einer Ordnung auf Q wie folgt fort:
5. GEORDNETE KORPER 77
Wir definieren zunachst, wann eine Zahl großer oder gleich Null ist. Fur alle m ∈ Z und
alle n ∈ N>0 definiere
0 ≤ m
n:⇐⇒ 0 ≤ m · n
Dann definieren wir die Relation ≤ fur beliebige Zahlen a, b ∈ Q:
a ≤ b :⇐⇒ 0 ≤ b− a .
5. Geordnete Korper
Definition 5.1. Ein geordneter Korper ist ein Quadrupel (K,+, ·,≤), so dass die fol-
genden Eigenschaften erfullt sind:
(a) (K,+, ·) ist ein Korper,
(b) ≤ ist eine totale Ordnung auf K,
(c) ∀x, y, z ∈ K : (x ≤ y → x+ z ≤ y + z),
(d) ∀x, y, z ∈ K : ((x ≤ y ∧ 0 ≤ z)→ x · z ≤ y · z).
Beispiel 5.2. (Q,+, ·,≤) ist ein geordneter Korper.
Nicht-Beispiel: Sei (F2,+, ·) der Korper mit zwei Elementen aus Ubung 4.1. Dann gibt es
keine totale Ordnung ≤ auf F2, so dass (F2,+, ·,≤) ein geordneter Korper ist. Vergleiche
Ubungsblatt 4, Aufgabe 3.
Im Rest dieses Abschnitts sei (K,+, ·,≤) ein geordneter Korper.
78 2. ZAHLEN
Notation 5.3.
x < y :⇐⇒ x ≤ y ∧ x 6= y ⇐⇒ ¬(y ≤ x)
x ≥ y :⇐⇒ y ≤ x
x > y :⇐⇒ y < x
x ist positiv :⇐⇒ x > 0
x ist negativ :⇐⇒ x < 0
K≤a := {x ∈ K | x ≤ a}
K≥a, K<a, K>a analog.
UBUNG 5.4. Seien a, x, y, z ∈ K. Zeigen Sie, dass aus den Eigenschaften (a)–(d) der
obigen Definition folgt:
(a) a ist genau dann positiv, wenn −a negativ ist.
(b) 1 > 0
(c) Ist z > 0, dann auch z−1 > 0.
(d) Ist z < 0, dann gilt auch z−1 < 0 und dann gilt fur alle x, y ∈ K:
x ≤ y ↔ x · z ≥ y · z.
Beweis: Teile (a) und (b) sind Teil von Ubungsblatt 4, Aufgabe 2. Teile (c) und (d) sind
ahnlich zu zeigen.
Zu (c): Sei nun z > 0. Wir zeigen durch Widerspruch z−1 > 0. Wir nehmen hierzu an,
dass z−1 ≤ 0. Dann folgt mit Lemma 5.1 (d)
1 = z−1z ≤ 0,
5. GEORDNETE KORPER 79
was offensichtlich 1 > 0 widerspricht.
Zu (d): z < 0⇐⇒ z−1 < 0 ist nun offensichtlich und man zeigt (d) durch Multiplikation
mit −z bzw. −z−1 unter Verwendung von Lemma 5.1 (d).
Wir definieren rekursiv eine Abbildung iN : N −→ K, 0N 7→ 0K , iN(n+ 1) = iN(n) + 1.
LEMMA 5.5.
(a) iN erhalt Addition und Multiplikation, d.h. fur alle n,m ∈ N gilt:
iN(n+m) = iN(n) + iN(m) iN(n ·m) = iN(n) · iN(m)(5.6)
(b) ∀n ∈ N>0 : iN(n) > 0,
(c) iN : N −→ K ist injektiv,
Beweis.
(a) durch Induktion uber m ∈ N.
(b) und (c) sind Teil von Ubungsblatt 4, Aufgabe 2.
Sprechweise Wenn die Gleichungen (5.6) gelten, sagen wir: iN erhalt Addition und Multi-
plikation.
LEMMA 5.7. Sei (K,+, ·,≤) ein geordneter Korper. Dann gibt es eine injektive Abbil-
dung iQ : Q −→ K, die iN fortsetzt (das heißt: iQ|N = iN) und so dass iQ Addition und
Multiplikation erhalt. Außerdem erhalt iQ die Ordnung, das heißt es gilt fur a, b ∈ Q
a ≤ b⇐⇒ iQ(a) ≤ iQ(b).
80 2. ZAHLEN
Beweisskizze: Fur m ∈ N, n ∈ N>0 definieren wir
iQ
(mn
):=
iN(m)
iN(n)
iQ
(−mn
):= −iN(m)
iN(n)
iQ
(0
n
):= 0
Man muss nun zeigen, dass diese Definition Sinn ergibt. Wir durfen einer rationalen Zahl
nicht zwei verschiedene Werte zuweisen. Zu uberprufen ist hierzu
m
n=p
q=⇒ iN(m)
iN(n)=iN(p)
iN(q)
fur alle m,n, p, q ∈ N>0. Die entsprechenden Aussagen sind fur m ≤ 0, p ≤ 0 zu uber-
prufen. Man sagt dann, die Abbildung iQ ist wohldefiniert. Danach kann man die anderen
Eigenschaften leicht beweisen.
Wir identifizieren nun Q mit B(iQ) vermoge iQ, das heißt wir machen keinen Unterschied
mehr zwischen r ∈ Q und iQ(r) ∈ K.
Definition 5.8. Ein geordneter Korper (K,+, ·,≤) heißt archimedisch geordneter Korper,
10 falls
∀a ∈ K : ∃n ∈ N : a ≤ n.
Beispiele 5.9. (a) Q ist archimedisch: Man zeigt leicht fur m,n ∈ N>0: mn≤ m und
−mn≤ m und 0
n≤ 1.
10Man sagt manchmal auch: Der Korper erfullt das archimedische Axiom. Diese Sprechweise vermei-
den wir aber, da die archimedische Eigenschaft in dem von uns gewahlten Zugang kein Axiom ist.
5. GEORDNETE KORPER 81
(b) In Satz 6.6 werden wir zeigen, dass jeder geordnete Korper, der die Supremumseigen-
schaft erfullt, archimedisch ist. Insbesondere: Sobald wir wissen,”was R ist“, wissen
wir auch, dass R archimedisch geordnet ist.
(c) Sei dann K ein Korper mit Q ⊂ K ⊂ R mit der Addition, Multiplikation und Ordung
von R. Dann ist auch K ein archimedisch geordneter Korper. Zum Beispiel fur q ∈
Q>0:
K := Q[√q] := {a+ b
√q | a, b ∈ Q} .
(d) Der Korper der rationalen Funktionen mit rationalen Koeffizienten 11
K :=
{x 7→ p(x)
q(x)
∣∣∣ p und q sind Polynome mit rationalen Koeffizienten, q 6= 0
}.
Wir definieren Addition und Multiplikation wie bei den rationalen Zahlen:
p(x)
q(x)+p(x)
q(x):=
p(x)q(x) + p(x)q(x)
q(x) · q(x)
p(x)
q(x)· p(x)
q(x):=
p(x) · p(x)
q(x) · q(x).
Dann ist (K,+, ·) ein Korper. Ein Polynom p wie oben schreiben wir im Fall p 6= 0 als
p(x) = a0,p + a1,px+ a2,px2 . . .+ ak,px
k, k ∈ N0, ak,p 6= 0. Dann heißt deg(p) := k ∈ N0
11Was wird hier eigentlich mit x 7→ p(x)q(x) gemeint? Dies ist etwas subtil, es gibt verschiedene Moglich-
keiten. 1.) Man kann es als Abbildung von Qrq#({0}) nach Q auffassen, falls p und q keine gemeinsamen
Nullstellen haben. Bei dieser Interpretation muss man den Definitionsbereich bei Addition und Multipli-
kation in naheliegnder Art und Weise evtl. durch einzelne Punkte erganzen. 2.) Sobald wir die Korper R
und C kennen, konnte man es in ahnlicher Weise auch als Abbildung Rr q#({0}) −→ R oder als Abbil-
dung Cr q#({0}) −→ C auffassen, auch Kombinationen wie Qr q#({0}) −→ R waren denkbar. 3.) Die
mathematisch sinnvollste Interpretation des Ausdrucks ist aber eine andere (die formale Interpretation),
die ich leider derzeit noch nicht erklaren kann, und die Sie spater in der Linearen Algebra kennen lernen
werden. Da wir Koeffizienten in Q haben, ist es gar nicht so wichtig, wie wir den Ausdruck formal nun
verstehen wollen. Wenn die Koeffizienten in Q durch Koeffizienten in einem endlichen Korper (wie zum
Beispiel F2) ersetzt werden, ist dieser Unterschied aber ganz erheblich.
82 2. ZAHLEN
der Grad des Polynoms. Wir definieren nun
P :=
{p(x)
q(x)∈ K
∣∣∣ adeg(p),p · adeg(q),q > 0
}Weiter definieren fur r, s ∈ K:
r < s :⇐⇒ s− r ∈ P.
Zu zeigen, dass (K,+, ·,≤) ein geordneter Korper ist, ist einige Arbeit, aber nicht
sehr schwierig.
Angenommen, der Korper ware archimedisch geordnet. Dann gibt es ein n ∈ N
mit x ≤ n < n+ 1. Dann ware also x− (n+ 1) < 0. Dies ist aber ein Widerspruch zu
x− (n+ 1) = x−(n+1)1∈ P . Also ist dieser geordnete Korper nicht archimedisch.
Sei weiterhin (K,+, ·,≤) ein geordneter Korper.
Definition 5.10. Die Betragsfunktion | · | : K −→ K ist definiert durch
|a| := max{a,−a} =
a falls a > 0
−a falls a < 0
0 falls a = 0
Man nennt |a| auch den Absolutbetrag von a.
LEMMA 5.11.
(a) |a| ≥ 0; |a| = 0⇐⇒ a = 0;
(b) |−a| = |a|;
(c) |a · b| = |a| · |b|;∣∣ab
∣∣ = |a||b| falls b 6= 0;
(d) |a2| = |a|2 = a2 ≥ 0
5. GEORDNETE KORPER 83
(e) |a+ b| ≤ |a|+ |b|;
(f) |a1 + · · ·+ ak| ≤ |a1|+ · · ·+ |ak|;
(g) |a− b| ≥∣∣∣|a| − |b|∣∣∣
Beweis. (a)-(d) folgen direkt aus den Definitionen 5.1 und 5.10.
(e): ±a ≤ |a| und ±b ≤ |b| ergeben ±(a+ b) ≤ |a|+ |b|.
(f): durch Induktion.
(g): Wir setzen a := a− b. Dann gilt
| a+ b︸ ︷︷ ︸a
| ≤ |a|+ |b| = |a− b|+ |b|
Also
(5.12) |a− b| ≥ |a| − |b|
Durch Vertauschen von a und b erhalten wir
(5.13) |a− b| = |b− a| ≥ |b| − |a|.
Aus (5.12) und (5.13) erhalten wir das zu Beweisende.
SATZ 5.14. Seien n ∈ N>0; a1, . . . , an ∈ K≥0 gegeben. Dann gilt
a1 · a2 · . . . · an ≤(a1 + a2 + . . .+ an
n
)n.
Bemerkung 5.15. Wenn wir in K die n-te Wurzel ziehen konnen (in Q nicht erlaubt!),
bedeutet dies
n√a1 · a2 . . . an︸ ︷︷ ︸
geometrisches Mittel
≤ a1 + a2 + . . .+ ann︸ ︷︷ ︸
arithmetisches Mittel
.
84 2. ZAHLEN
Beweis des Satzes. Wir beweisen den Satz durch Induktion nach n.
Induktionsanfang: n = 1 ist offensichtlich richtig.
Induktionsschritt von n− 1 nach n fur n ≥ 2:
Seien a1, . . . , an ∈ K≥0 gegeben.
O.B.d.A. a1 = min{a1, . . . , an}, a2 = max{a1, . . . , an}.
M := a1+...+ann
. =⇒ a1 ≤M ≤ a2
Wir setzen d := a1 + a2 −M . Dann
Md− a1a2 = M ((a1 + a2)−M)− a1a2 = (a2 −M)(M − a1) ≥ 0
=⇒ a1 · a2 ≤Md(5.16)
Das arithmetische Mittel12 von d, a3, a4, . . . , an ist M , denn
d+ a3 + a4 + . . .+ an = a1 + a2 + . . .+ an −M = (n− 1)M.
Es folgt
a1a2 · · · an(5.16)
≤ M da3 · · · an︸ ︷︷ ︸≤Mn−1
nach Annahme
= Mn
6. Die reellen Zahlen
Da die reellen Zahlen R fur die Analysis eine zentrale Rolle spielen, wollen wir hier wieder
formal vollstandiger vorgehen.
12Im Fall n = 2 bedeutet ist also das arithmetische Mittel von d, a3, . . . , an als das artithmetische
Mittel von d zu lesen, das heißt es ist d. Es git dann auch M = d.
6. DIE REELLEN ZAHLEN 85
6.1. Unzulanglichkeit von Q. Wieso reichen uns die rationalen Zahlen nicht aus?
Problem 1 (Algebraisch):
Sei p eine Primzahl. Dann ist x2 = p in Q nicht losbar.
Angenommen es gabe eine Losung x = m/n, m ∈ Z, n ∈ N>0. O.B.d.A. m,n teilerfremd.
Wir erhalten m2
n2 = x2 = p, also m2 = pn2.
Es folgt p|m und daraus p2|m2 = pn2, was wiederum p|n impliziert. Also haben wir einen
Widerspruch zur Teilerfremdheit von m und n.
86 2. ZAHLEN
Problem 2 (Geometrisch):
Bild von einem Kreis
π =Umfang
Durchmesser= 3, 14159265... 6∈ Q
Wichtige geometrische Funktionen konnen in Q nicht beschrieben werden, zum
Bild: Quadrat mit Diagonale runtergedreht
Problem 3 (Physikalisch):
Bild mit Pendel
Ein Pendel bewegt sich auf einem Kreis. Dazu muss es Punkte passieren, die keine ratio-
nalen Koordinaten haben, zum Beispiel den Punkt
− cos(60◦)
sin(60◦)
, sin(60◦) =
√3
26∈ Q .
14.11
6.2. Die Supremumseigenschaft. In diesem Abschnitt werden wir eine Eigen-
schaft kennenlernen, die im Korper der rationalen Zahlen Q nicht gilt, aber im Korper
der reellen Zahlen R. Zunachst ein paar Vorbemerkungen.
Wiederholung: Sei ≤ eine partielle Ordnung auf einer Menge M . Sei x ∈ A ⊂M .
x = minA ⇐⇒ ∀y ∈ A : x ≤ y.
(Maximum analog mit ≥).
6. DIE REELLEN ZAHLEN 87
Gegeben sei eine totale Ordnung auf einer endlichen Menge A, dann besitzt A ein Maxi-
mum und ein Minimum.
Definition 6.1. Sei ≤ eine (partielle) Ordnung auf einer Menge M . Eine Teilmenge
A ⊂M heißt nach oben beschrankt in M (bzw. nach unten beschrankt in M), falls es ein
r ∈M gibt, so dass fur alle a ∈ A die Aussage a ≤ r (bzw. a ≥ r) gilt. Ein solches r heißt
obere Schranke (bzw. untere Schranke) von A. Wir sagen A ist beschrankt in M , wenn A
nach oben und unten beschrankt ist.
Besitzt die Menge
S(A,M) := {r ∈M | r ist obere Schranke von A}
ein Minimum, so nennen wir minS(A,M) das Supremum von A in M .
Besitzt die Menge
S(A,M) := {r ∈M | r ist untere Schranke von A}
ein Maximum, so nennen wir maxS(A,M) das Infimum von A in M .
Kurzschreibweise: supA und inf A
Beispiele 6.2. (a) M = Q, A = {2, 4, 8}. Dann ist r obere Schranke, gdw r ≥ 8. Und r
ist untere Schranke, gdw r ≤ 2. Wir haben maxA = supA = 8 und minA = inf A = 2.
(b) Falls A ein Maximum besitzt, so ist dieses Maximum auch das Supremum. Denn sei
a = maxA, dann folgt
S(A,M) = {r ∈M | r ≥ a} =: M≥a.
Also a = minS(A,M) = supA.
88 2. ZAHLEN
(c) M = Q, A = {x ∈ Q | 0 < x < 1} besitzt kein Minimum. Denn fur alle x ∈ A gilt:
x2∈ A und x
2< x. Ahnlich zeigt man, dass A kein Maximum besitzt.
S(A,M) = Q≥1 S(A,M) = Q≤0
supA = 1 und inf A = 0.
Bemerkungen 6.3.
(1) A ⊂ S(S(A,M),M) und A ⊂ S(S(A,M),M)
(2) Gilt x ∈ A ∩ S(A,M), dann gilt ∀a ∈ A : a ≤ x, somit x = maxA und wegen (1)
auch x = minS(A,M).
(3) Hat A ein Maximum x, dann ist x ∈ S(A,M).
(4) A hat ein Maximum ⇐⇒ A ∩ S(A,M) 6= ∅ ⇐⇒ #(A ∩ S(A,M)) = 1 ⇐⇒ supA
existiert und supA ∈ A.
Definition 6.4. Sei ≤ eine partielle Ordnung auf M . Wir sagen (M,≤) erfullt die Su-
premumseigenschaft (S) falls gilt
(S) Supremumseigenschaft
Sei A ⊂ M nicht-leer und nach oben beschrankt in M . Dann besitzt A ein
Supremum in M .
Beispiel 6.5. (Q,≤) erfullt die Supremumseigenschaft nicht: Die Menge
A := {x ∈ Q |x2 ≤ 2}
ist nach oben beschrankt.
S(A,Q) := {x ∈ Q |x > 0 und x2 ≥ 2}.
6. DIE REELLEN ZAHLEN 89
Da es keine rationale Zahl x mit x2 = 2 gibt, folgt
S(A,Q) := {x ∈ Q |x > 0 und x2 > 2}.
Zu gegebenem x ∈ S(A,Q) definieren wir nun
y := x− x2 − 2
2x,
und man zeigt leicht 0 < y < x. Weiter gilt
y2 = x2 − 2xx2 − 2
2x+
(x2 − 2
2x
)2
> x2 − (x2 − 2) = 2,
also auch y ∈ S(A,Q). Da es zu jedem Element in S(A,Q) ein kleineres in S(A,Q)
gibt, kann es in S(A,Q) kein Minimum geben. Also besitzt A kein Supremum in Q. Wir
werden spater sehen, dass es in R eine positive Losung von x2 = 2 gibt, aufgrund der
Supremumseigenschaft.
SATZ 6.6. Ist (K,+, ·,≤) ein geordneter Korper, der die Supremumseigenschaft erfullt,
dann ist er archimedisch.
Die Umkehrung gilt nicht: Beispiel K = Q.
Beweis. Angenommen (K,+, ·,≤) sei nicht archimedisch. Dann gibt es ein a ∈ K mit
∀n ∈ N : a > n.
Das heißt, N ist in K nach oben beschrankt. Wenn die Supremumseigenschaft erfullt ist,
gibt es also ein Supremum s von N in K. Fur ein beliebiges n gilt also s ≥ n + 1 also
s − 1 ≥ n. Also ist auch s − 1 ein obere Schranke von N. Dann ist aber s nicht das
Minimum aller oberen Schranken, was ein Widerspruch zur Wahl von s ist. Da wir einen
90 2. ZAHLEN
Widerspruch erhalten haben, muss die obige Annahme falsch gewesen sein. Wir haben
dadurch gezeigt, dass (K,+, ·,≤) archimedisch ist.
6.3. Axiome der reellen Zahlen. Im nachsten Abschnitt werden wir zwei Satze
zeigen:
SATZ 6.7 (”Existenz der reellen Zahlen“). Es gibt einen geordneten Korper, der die
Supremumseigenschaft erfullt.
SATZ 6.8 (”Eindeutigkeit der reellen Zahlen“). Seien (K,+, ·,≤) und (K, +, ·, ≤) zwei
geordnete Korper, die die Supremumseigenschaft erfullen, dann gibt es eine eindeutige
bijektive Abbildung F : K −→ K, die Addition, Multiplikation und Ordnung erhalt.
F erhalt die Addition: ∀x, y ∈ K : F (x+ y) = F (x)+F (y)
F erhalt die Multiplikation: ∀x, y ∈ K : F (x · y) = F (x)·F (y)
F erhalt die Ordnung: ∀x, y ∈ K : x ≤ y =⇒ F (x)≤F (y)
Man sagt dann oft: (K,+, ·,≤) und (K, +, ·, ≤) sind kanonisch isomorph und F nennt
man einen Isomorphismus (von geordneten Korpern). 13.
13Isomorph hat hier eine andere Bedeutung als bei den naturlichen Zahlen.”Isomorph“ kommt aus
dem Griechischen und heißt”von gleicher Gestalt“. Es gibt in der Mathematik viele Strukturen und zu
jeder eine eigene Definition von”isomorph“. Bei der Abbildung F oben im Text handelt es sich um einen
Isomorphismus von geordneten Korpern: dies ist eine bijektive Abbildung, die Addition, Multiplikation
und die Ordnung erhalt. Sobald es einen Isomorphismus von A nach B gibt, nennt man A und B isomorph.
Das Wort kanonisch ist nicht ganz so leicht zu erklaren. Es bedeutet hier, dass es einen Isomorphismus
gibt, der sich aus der Struktur bereits ergibt und nicht von zusatzlichen Wahlen abhangt. In der obigen
Proposition gilt F (0) = 0 und F (1) = 1 und hierdurch ist der Isomorphismus F bereits festgelegt. Er ist
also bereits durch die Struktur festgelegt und deswegen kanonisch.
6. DIE REELLEN ZAHLEN 91
Die Eigenschaften”geordneter Korper“ und “Supremumseigenschaft“ sind Eigenschaften,
die wir von den reellen Zahlen erwarten. Da sie nun also die reellen Zahlen bis auf Isomor-
phie festlegen ist es sinnvoll, diese beiden Eigenschaft als die”Axiome der reellen Zahlen
“ zu betrachten. Dies verpflichtet uns dazu, alles was wir fur die reellen Zahlen zeigen
wollen, aus diesen Axiomen heraus zu begrunden. Der große Vorteil dieses axiomatischen
Zugangs ist es, dass alle danach hergeleiteten Aussagen davon unabhangig sind, wie wir
ein Modell der reellen Zahlen im Beweis von Satz 6.7 konstruieren.
AXIOME 6.9 (Axiome der reellen Zahlen). Die reellen Zahlen bilden einen geordneten
Korper (R,+, ·,≤), der die Supremumseigenschaft erfullt.
Um beispielhaft zu zeigen, wie wir die Supremumseigenschaft nutzen konnen, betrachten
wir das folgende Lemma.
LEMMA 6.10. Sei a ∈ R, a ≥ 0, n ∈ N>0, so gibt es genau ein r ∈ R mit rn = a und
r ≥ 0.
Beweis. Die Aussage ist klar fur n = 1 und klar fur a = 0. Sei nun n ≥ 2 und a > 0.
Eindeutigkeit. Hierzu genugt es zu zeigen:
∀x, y ∈ R : 0 < x < y =⇒ xn < yn
Dies folgt aus der folgenden Umformung
yn − xn = (y − x)n−1∑i=0
yixn−i−1 > 0,
da∑n−1
i=0 yixn−i−1 als Summe positiver Zahlen positiv ist.
92 2. ZAHLEN
Existenz. Wir betrachten die Menge A := {x ∈ R | xn ≤ a}. Die Menge A ist nach oben
beschrankt: max{1, a} ist eine obere Schranke von A. Man zeigt leicht, dass
S(A,R) = {x ∈ R | 0 < x ∧ xn ≥ a}.
Da A nicht-leer ist, existiert s := supA = minS(A,R). Offensichtlich gilt s ≥ 0 und
sn ≥ a.
Wir nehmen nun an sn > a.
Behauptung: Es gibt ein δ ∈ R, 0 < δ < 1 mit
sn(1− nδ) ≥ a.(6.11)
Mit der Behauptung argumentieren wir wie folgt:
Die Bernoulli-Ungleichung liefert (s(1−δ))n ≥ sn(1−nδ), siehe Ubungsblatt 4, Aufgabe 1
c) mit x := −δ
Es gilt also s > s(1 − δ) ∈ S(A,R). Somit ist dann s kein Minimum von S(A,R). Wir
haben dann einen Widerspruch zur Annahme sn > a gefunden, und haben deswegen
sn = a, was die Existenz liefert.
Begrundung der Behauptung:
Man zeigt mit Standard-Umformungen, dass (6.11) aquivalent zu
δ ≤ 1
n
(1− a
sn
)ist. Die rechte Seite ist zwischen 0 und 1. Wenn wir als δ := 1
n
(1− a
sn
)wahlen, so gilt die
Behauptung.
6. DIE REELLEN ZAHLEN 93
Bemerkung. Fur b ∈ R, b > 0, dann konnen wir jetzt alle Potenzen der Form bt, mit
t ∈ Q bilden. Wir schreiben hierzu t = p/q mit p ∈ Z, q ∈ N. Wenn wir das vorangehende
Lemma fur a := bp und n := q anwenden, dann besagt dieses Lemma, dass es genau eine
Zahl r ∈ R>0 gibt, so dass rq = bp. Wir wurden nun gerne definieren at := r fur dieses r.
Damit dies eine sinnvolle Definition ist, muss man uberprufen, dass r unahangig davon
ist, wie wir t als Bruch schreiben. Dazu muss man die folgende Aussage uberprufen:14 Es
gelte t = p/q = p/q, p, p ∈ Z, q, q ∈ N. Wir wahlen r, r ∈ R>0 mit rq = bp und rq = bp.
Dann gilt r = r.
Man beachte, dass wir den Ausdruck bt fur eine positive reelle Zahl b und eine reelle,
nicht-rationale Zahl t noch nicht definieren konnen.
Man kann aus dem bisher Bekannten nun auch leicht zeigen, dass fur b, b ∈ R>0, t, t ∈ Q
gilt:
(bb)t = btbt bt+t = btbt
Fr 16.11.
Zur Konstruktion eines Modells der reellen Zahlen, das heißt zum Beweis von Satz 6.7,
gibt es verschiedene Methoden, zum Beispiel:
• Die Konstruktion als Dezimalzahlen. Hier muss man zum Beispiel darauf achten,
dass 1, 49 = 1, 5. Geht genauso im Binarsystem oder bezuglich anderer Basen.
• Die Konstruktion durch Intervallschachtelungen. Recht beliebt in Schulen, da an-
schaulich und unabhangig davon, ob man in der Basis 10 (=Dezimaldarstellung),
in der Basis 2 (=Binardarstellung) oder noch einer anderen Basis arbeitet. Siehe
zum Beispiel [22, Abschnitt 2.3].
14Diese Uberprufung sollten Sie inzwischen selbst tun konnen.
94 2. ZAHLEN
• Cauchy-Folgen. Dies fuhrt unter anderem zum Begriff der Vollstandigkeit, der
nicht nur in diesem Kontext wichtig ist, sondern auch zum Beispiel bei Hilbert-
und Banach-Raumen. Solche Raume sind z.B. wichtig, um partielle Differential-
gleichungen zu losen und um Quantenmechanik zu beschrieben.
• Dedekindsche Schnitte. Mathematisch elegant und intuitivere Definition als beim
Zugang uber Intervallschachtelung und Cauchy-Folgen. Wir werden diesem Zu-
gang folgen.
6.4. Dedekindsche Schnitte. Ideen von Richard Dedekind, 1872, Link zur Orgi-
nalarbeit
Definition 6.12. Sei K ein archimedisch geordneter Korper. Ein Dedekindscher Schnitt
in K ist eine Teilmenge α ⊂ K mit den folgenden Eigenschaften
(1) α 6= ∅, α 6= K,
(2) fur a ∈ α und x ∈ K<a gilt x ∈ α,
(3) α besitzt kein Maximum.
Man nennt Dedekindsche Schnitte auch Unterklassen. Das Komplement von α schreiben
wir als α′ := K r α und wird die zugehorige Oberklasse genannt.
Wir definieren
K := {α ∈ P(K) | α ist ein Dedekindscher Schnitt}.
Beispiel 6.13. Sei q ∈ K. Dann ist K<q eine Unterklasse.
(1) q − 1 ∈ K<q, also K<q 6= ∅. Und q + 1 6∈ K<q, also K<q 6= K.
6. DIE REELLEN ZAHLEN 95
(2) Sei a ∈ K<q und x ∈ K<a. Dann haben wir x < a und a < q, also auch x < q und
somit x ∈ K<q.
(3) Zu jedem a ∈ K<q ist a′ := (a+ q)/2 ein Element a′ ∈ K<q mit a′ > a.
Die Abbildung iK : K −→ K, q 7→ K<q ist injektiv. Denn ist p < q so ist p ∈ K<q und
p /∈ K<p.
Anschauliche Motivation fur diese Konstruktion. Wir nehmen mal an, dass wir
bereits Q ⊂ R mit den gewunschten Eigenschaften hatten, K = Q. Definiere Q wie oben.
Zu r ∈ R definieren wir die Unterklasse in Q
U(r) := {q ∈ Q | q < r}.
Bild mit einem Zahlenstrahl mit Ober- und Unterklasse
Wir erhalten eine Abbildung U : R −→ Q, r 7→ U(r). Man uberlegt sich leicht, dass
sup |Q : Q −→ R, α 7→ supα die Umkehrabbildung von U : R −→ Q ist. Somit ist U
bijektiv. Wir definieren nun Addition +, Multiplikation · und Ordnung ≤ auf Q so, dass
U diese Strukturen erhalt; und zwar so, dass wir die Existenz von R gar nicht nutzen. Zu
zeigen ist dann, dass (Q,+, ·,≤) ein geordneter Korper ist, der die Supremumseigenschaft
erfullt. Wir identifizieren wiederum Q mit B(iQ) ⊂ Q vermoge iQ.
Es stellen sich dann unter anderem die Fragen:
• Was passiert, wenn man die Konstruktion wiederholt zu Q , also K := Q?
• Was wissen wir uber K, fur andere archimedisch geordnete Korper K, zum Bei-
spiel K := Q[√
2]?
96 2. ZAHLEN
Es ist deswegen sinnvoll, im folgenden immer fur (K,+, ·,≤) einen beliebigen archimedisch
geordneten Korper zuzulassen, aber sich immer den Spezialfall K = Q vorzustellen.
Sei also von nun an (K,+, ·,≤) ein beliebiger archimedisch angeordneter Korper.
LEMMA 6.14. Fur jede Oberklasse α′ gilt:
(a) α′ = {x ∈ K | ∀a ∈ α : a < x}
(b) fur a′ ∈ α′ und x′ ∈ K>a′ gilt x′ ∈ α′.
Beweis. Zu (a): Sei x ∈ α′. Wenn fur (mindestens) ein a ∈ α die Ungleichung a < x nicht
gilt, dann haben wir den Widerspruch x ∈ α. Somit α′ ⊂ {x ∈ K | ∀a ∈ α : a < x}.
Sei x ∈ K mit ∀a ∈ α : a < x. Da x < x falsch ist, gilt x 6∈ α. Also α′ ⊃ {x ∈ K | ∀a ∈
α : a < x}.
Zu (b): Dies folgt nun aus der Transitivitat von <.
LEMMA 6.15. Erfullt (K,+, ·,≤) die Supremumseigenschaft, dann ist iK : K −→ K,
q 7→ K<q bijektiv.
Beweis. Ist α eine Unterklasse, dann ist jedes a′ ∈ α′ eine obere Schranke von α. Ist
b ∈ S(α,K), dann ist b nicht in α, denn sonst ware ja b ein Maximum von α, welches
nicht existiert. Somit b ∈ α′. Deswegen haben wir
α′ = S(α,K).
Erfullt (K,+, ·,≤) die Supremumseigenschaft, dann hat also jede Oberklasse ein Mini-
mum. Wenn wir q := supα = minα′ setzen, so ist dann α = K<q.
6. DIE REELLEN ZAHLEN 97
Beispiel 6.16. In einem geordneten Korper K ist
α := K<0 ∪ {x ∈ K | x2 < 2}.
eine Unterklasse. Wenn diese Menge ein Supremum s besitzt, so gilt s2 = 2.
Im FallK = Q gibt es kein solches s, das heißt α hat kein Supremum. Dann ist iK : K → K
nicht surjektiv.
Im Fall K = R hat α ein Supremum in R, das wir√
2 nennen.
Definition 6.17 (Addition). Zu Dedekindschen Schnitten α und β definieren wir ihre
Summe als
α + β := {a+ b | a ∈ α, b ∈ β}.
Dies ist wiederum ein Dedekindscher Schnitt, denn:
(1) Sei a ∈ α und b ∈ β, dann gilt a+ b ∈ α + β, also α + β 6= ∅.
Sei a′ ∈ α′ und b′ ∈ β′, dann gilt fur alle a ∈ α und b ∈ β zunachst a < a′ und b < b′
und deswegen auch a+ b < a′ + b′. Somit a′ + b′ /∈ α+ β, und dies ergibt α+ β 6= K.
(2) Sei x < a + b, a ∈ α, b ∈ β. Setze a0 := x − b < a, somit a0 ∈ α. Deswegen gilt
x = a0 + b ∈ α + β.
(3) Angenommen, es gabe ein Maximum in α+β, dann konnten wir es als a+b mit a ∈ α
und b ∈ β schreiben. Da a kein Maximum von α ist, gibt es ein a1 ∈ α mit a1 > a.
Wir erhalten den Widerspruch
a+ b < a1 + b ∈ α + β.
Wir erhalten also eine Abbildung + : K ×K → K.
98 2. ZAHLEN
PROPOSITION 6.18. (K,+) ist eine kommutative Gruppe, das heißt es gelten (Aa),
(Ak), (An), (Ai).
Beweis. Die Kommutativitat (Ak) ist offensichtlich.
Zu (Aa):
α + (β + γ) = α + {b+ c | b ∈ β, c ∈ γ} = {a+ b+ c | a ∈ α, b ∈ β, c ∈ γ}
und man erhalt ahnlich denselben Ausdruck fur (α + β) + γ.
Zu (An): Das neutrale Element ist K<0. Zu zeigen: α = α+K<0. Aus Definition 6.12 (2)
folgt direkt α + K<0 ⊂ α. Um α ⊂ α + K<0 zu zeigen, wahlen wir ein a ∈ α. Da a kein
Maximum von α ist, gibt es ein a1 ∈ α mit a1 > a. Dann ist b := a− a1 < 0 ein Element
von K<0. Somit a = a1 + b ∈ α +K<0.
Zu (Ai): Sei α ∈ K. Die zugehorige Oberklasse α′ kann ein Minimum besitzen oder nicht.
Falls α′ ein Minimum besitzt, dann definiere
β := {−a′ | a′ ∈ α′ r {minα′}},
falls α′ kein Minimum besitzt, so definiere
β := {−a′ | a′ ∈ α′}.
Da wir in dieser Definition das Minimum von α′ weggenommen haben, falls es existiert,
hat β kein Maximum, also (3). Aus Lemma 6.14 ergibt sich (2). Außerdem (1) β 6= ∅ und
β 6= K. Wir haben also β ∈ K.
Nun zeigen wir α + β = K<0, das heißt β ist das additive Inverse zu α.
6. DIE REELLEN ZAHLEN 99
Sei a ∈ α und b ∈ β, dann folgt −b ∈ α′ und deswegen −b > a. Dies ergibt a + b < 0, in
anderen Worten a+ b ∈ K<0. Also α + β ⊂ K<0.
Sei nun x ∈ K<0. Wir suchen a ∈ α und b ∈ β mit x = a+ b.
Ansatz: Zu einem festen a0 ∈ α wahle
a := a0 + (n− 1)|x|︸ ︷︷ ︸∈α
und b := −(a0 + n|x|︸ ︷︷ ︸∈α′
kein Min
)
fur n ∈ N>0. Damit dieser Ansatz erfolgreich ist, muss n das Minimum der Menge
M := {m ∈ N>0 | a0 +m|x| ∈ α′}
sein.
Durchfuhrung: Definiere also M wie oben. Als ersten Schritt zeigen wir M 6= ∅.
Wahle ein a′ ∈ α′.
a0 +m|x| ≥ a′ ↔ m ≥ a′ − a0
|x|
Da K archimedisch ist, gibt es ein m ∈ N>0, das die rechte Ungleichung und damit auch
die linke Ungleichung erfullt. Es folgt m ∈M , also M 6= ∅. Auf Grund der Wohlordnung
der naturlichen Zahlen (Satz 1.9) besitzt M ein Minimum. Sei n := minM . Definieren
wir a und b wie oben, folgt a ∈ α, −b ∈ α′, a + b = x. Wenn −b nicht ein/das Minimum
von α′ ist, so gilt b ∈ β, und wir haben das zu Zeigende gezeigt.
Wenn α′ ein Minimum besitzt und wenn −b = minα′, dann setze
a := a0 +(n− 1
2
)|x| = −b− 1
2|x| < −b = minα′ ,
100 2. ZAHLEN
und damit a ∈ α, und
b := −(a0 +
(n+
1
2
)|x|︸ ︷︷ ︸
∈α′kein Min
)= b− 1
2|x| ∈ β.
Dann gilt a+ b = −|x| = x.Mi 21.11.
Definition 6.19 (Ordnung). Wir definieren auf K eine Relation
α ≤ β :⇐⇒ α ⊂ β.
Da ⊂ eine Ordnungsrelation auf P(M) ist, ist die so definierte Relation ≤ eine Ordnungs-
relation auf K.
LEMMA 6.20. Die Ordnung ≤ auf K ist total.
Beweis. Zu zeigen ist: fur alle α, β ∈ K gilt α ⊂ β oder β ⊂ α.
Wenn α keine Teilmenge von β ist, dann konnen wir ein a ∈ α r β wahlen. Fur jedes
b ∈ β gilt dann b < a, denn sonst ware a ∈ β. Somit ist b ∈ α. Es folgt β ⊂ α.
Schreibe nun 0K := 0K . Wir schreiben |α| = α fur α ≥ 0K und |α| = −α fur α < 0K .
Zeichnung und Beispiel zur Motivation der Multiplikation
Definition 6.21 (Multiplikation). Seien α, β ∈ K.
(a) Falls α ≥ 0K und β ≥ 0K so definieren wir das Produkt von α und β als
α · β := {c ∈ K | c < 0 ∨ ∃a ∈ α : ∃b ∈ β : (a ≥ 0 ∧ b ≥ 0 ∧ c = a · b)}
= {a · b | a ∈ α≥0 ∧ b ∈ β≥0} ∪K<0 .
6. DIE REELLEN ZAHLEN 101
(b) In den anderen Fallen definieren wir
α · β := ±|α| · |β|,
wobei das Vorzeichnen genau dann + ist, wenn α < 0K und β < 0K .
LEMMA 6.22. α · β ∈ K.
Beweis. Die folgenden Argumente werden aus Zeitgrunden in der Vorlesung nicht aus-
gefuhrt.
(1) −1 ∈ α · β, also α · β 6= ∅.
Wahle a′ ∈ α′ und b′ ∈ β′. Fur alle a ∈ α und b ∈ β gilt a < a′ und b < b′, somit
ab < a′b′. Somit ist a′b′ /∈ α · β. Also α · β 6= K.
(2) Sei c = a · b mit a ∈ α und b ∈ β. Wir mussen zeigen, dass jedes d ∈ K<c in α ·β liegt.
dies ist klar, falls d < 0. Im Fall 0 ≤ d < c gilt
d = a︸︷︷︸∈α
· d
a︸︷︷︸∈β
,
da da< c
a∈ β. Somit d ∈ α · β.
(3) Sei a, b, c wie oben. Da α kein Maximum besitzt, gibt es ein a0 ∈ α, a0 > a. Dann ist
c0 := a0 · b ∈ α · β, c0 > c. Somit hat auch α · β kein Maximum.
PROPOSITION 6.23. (K,+, ·) ist ein Korper.
Beweisskizze. Leicht zu prufen sind (Ma), (Mk), (AMd) und die Tatsache, dass es min-
destens zwei Elemente gibt (iQ : Q −→ K ist injektiv).
102 2. ZAHLEN
Zu (Mn): Es ist einfach zu zeigen, dass 1K := K<1 ein neutrales Element fur die Multi-
plikation ist. (Beweis ahnlich wie fur das additive Inverse.)
Wir wollen zeigen, dass 1K := K<1 ein neutrales Element fur die Multiplikation ist, das
heißt fur alle Unterklassen α gilt α ·K<1 = α.
Fall 1: α > 0.
Es gilt dann:
α·K<1def={a·b | a ∈ α≥0∧b ∈ {x ∈ K | 0 ≤ x < 1}
}∪K<0 ⊂ {c ∈ K | ∃a ∈ α : 0 ≤ c < a}∪K<0 ⊂ α.
Um α ⊂ K<1 · α zu zeigen, nehmen wir ein a ∈ α≥0. Da a kein Maximum von α ist, gibt
es ein a1 ∈ α mit a1 > a. Setze b := a/a1, dann 0 ≤ b < 1. Somit gilt a = a1 · b ∈ α ·K<1.
Hieraus folgt α ⊂ K<1 · α aus der Definition der Multiplikation.
Fall 2: α = 0K . Fur alle β ∈ K
0K · β = (0K − 0K) · β = 0K · β − 0K · β = 0K .
Dies gilt insbesondere fur β = 1K .
Fall 3: α < 0.
α ·K<1def= −|α| ·K<1
Fall 1= −|α| = α.
Zu (Mi): Sei α ∈ K, α 6= 0K .
Fall 1: α > 0K .
Wenn minα′ nicht existiert, so definieren wir
β := K≤0 ∪ {b ∈ K>0 | b−1 ∈ α′} ,
6. DIE REELLEN ZAHLEN 103
und wenn es existiert, dann
β := K≤0 ∪ {b ∈ K>0 | b−1 ∈ α′ ∧ b 6= minα′} .
Es ist nicht schwer zu zeigen, dass β ∈ K. Mit ahnlichen Argumenten wie im Beweis von
(Ai) zeigt man α · β = 1K (etwas Arbeit!). Diese Argumente werden aus Zeitgrunden in
der Vorlesung nicht ausgefuhrt.
Zu β ∈ K:
(1) 0 ∈ β, also β 6= ∅.
Wahle a ∈ α, a > 0. Dann gilt a−1 /∈ β, denn fur alle a′ ∈ α′ gilt (a′)−1 < a−1.
(2) Ist b ∈ β und c ∈ K<b. Im Fall c ≤ 0 gilt c ∈ β. Im Fall 0 < c < b gilt c−1 > b−1 ∈ α′,
somit c ∈ β.
(3) Angenommen b ware ein Maximum von β. Im Fall b = 0 bekommt man leicht einen
Widerspruch, da β positive Elemente hat. Im Fall b > 0 ist dann b−1 ein Minumum
von α′. dies ist aber ausgeschlossen in der Definition von β.
Zu α · β = 1K :
Wir nehmen ein c ∈ α · β. O.B.d.A. c ≥ 0. Wir konnen also schreiben c = a · (a′)−1 mit
a ∈ α, a′ ∈ α′, a ≥ 0. Aus a′ > a folgt c < 1. Somit α · β ≤ 1K .
Sei nun c ∈ 1K , also c < 1. Wir wollen c ∈ α · β zeigen. Dies ist trivial, falls c ≤ 0.
Deswegen sei nun c > 0. Wahle ein festes a0 ∈ α mit a0 > 0. Wir zeigen, die Menge
M := {m ∈ N | a0 · c−m ∈ α}
104 2. ZAHLEN
ist endlich. Hierzu wahlen wir ein a′ ∈ α′ und rechnen mit der Bernoulli-Ungleichung
a0 · c−m = a0 ·(
1 +1− cc
)m≥ a0 ·
(1 +m · 1− c
c
)> a′
fur alle ausreichend großen m, da K archimedisch ist. Somit gibt es ein m0 ∈ N, so dass
fur alle m ≥ m0 gilt: a0 · c−m 6∈ α. Also hat M hochstens m0 Elemente und somit ein
Maximum.
Sei nun n := maxM . Setze a := a0 · c−n ∈ α und a′ := a0 · c−n−1 ∈ α′. Den Spezialfall,
dass (a′)−1 das Minimum von α′ ist, betrachten wir in einer Fussnote.15 Wir setzen b :=
(a′)−1 ∈ β, und erhalten c = a · b.
Fall 2: α < 0K
Bestimme ein β ∈ K mit |α| · β = 1. Ein multiplikatives Inverse von α ist dann −β.
SATZ 6.24. (K,+, ·,≤) ist ein archimedischer geordneter Korper. Die Abbildung
iK : K → K
a 7→ K<a
ist eine injektive Abbildung, die Addition, Multiplikation und Ordnung erhalt.
Beweis.
1.) Um zu zeigen, dass (K,+, ·,≤) ein geordneter Korper ist, gehen wir (a)–(d) in der
Definition 5.1 von geordneten Korpern durch.
Zu (a): (K,+, ·) ist ein Korper (Proposition 6.23).
15Man kann dann a0 ”etwas“ zu a1 vergroßern, so dass a := a1 · c−n ∈ α immer noch in α liegt, und
dann ist a′ := (a1 · c−n−1)−1 ist dann ein nicht-minimales Element von α′.
6. DIE REELLEN ZAHLEN 105
Zu (b): ≤ ist totale Ordnung auf K (Lemma 6.20).
Zu (c): Gilt α ⊂ β, dann haben wir
α + γ = {a+ c | a ∈ α, c ∈ γ} ⊂ {b+ c | b ∈ β, c ∈ γ} = β + γ.
Zu (d): Wir wollen zeigen
(α ≤ β ∧ 0K ≤ γ)→ α · γ ≤ β · γ .
Fall 1: γ ≥ 0K und 0K ≤ α ≤ β
α · γ = {a · c | a ∈ α≥0 ∧ c ∈ γ≥0} ∪K<0
⊂ {b · c | b ∈ β≥0 ∧ c ∈ γ≥0} ∪K<0
= β · γ
Fall 2: γ ≥ 0K und α < 0K ≤ β
Dann ist α · γ ≤ 0K ≤ β · γ.
Fall 3: γ ≥ 0K und α ≤ β < 0K
Dann gilt −β ≤ −α =⇒ −β · γ ≤ −α · γ =⇒ α · γ ≤ β · γ.
Somit ist (K,+, ·) ein geordneter Korper.
2.) Wir wissen bereits, dass iK : K −→ K injektiv ist, und es ist leicht zu prufen, dass
diese Abbildung Addition, Multiplikation und Ordnung erhalt.
3.) Nun zeigen wir, dass K archimedisch ist, das heißt: Fur jedes α ∈ K ist ein n ·1K ∈ N
zu finden mit α ≤ n.
Wahle ein a′ ∈ α′. Da K archimedisch ist, gibt es ein m ∈ N mit m ≥ a′. Wahle
nun 12∈ 1K . Dann gilt fur alle a ∈ α
2m · 1
2≥ a′ ≥ a.
106 2. ZAHLEN
Es folgt
2m · 1K ≥ α.
LEMMA 6.25. x ∈ α⇐⇒ iK(x) < α
Beweis.
iK(x) < α ⇐⇒ iK(x) ( α
⇐⇒ Es existiert ein y in αr iK(x)
⇐⇒ ∃y ∈ α : y ≥ x
⇐⇒ x ∈ α .
In der letzten Aquivalenz ist”⇒“ eine Konsequenz von Definition 6.12 (2) und
”⇐“ ergibt
sich mit y := x.
PROPOSITION 6.26. Sei (K0,+, ·,≤) ein archimedisch angeordneter Korper. Wir iden-
tifizieren Q mit seinem Bild in K0 vermoge der in Lemma 5.7 definierten Abbildung
iQ : Q −→ K0. Seien a, b ∈ K0, a < b. Dann gibt es ein q ∈ Q mit a < q < b.
Interpretation fur K0 := R: zwischen zwei verschiedenen reellen Zahlen liegt eine rationale
Zahl.
Beweis. Da K0 archimedisch ist, existieren n,m ∈ N mit n > 1b−a und m > −b. Setze
b := b+m+ 1 > 1 und a := a+m+ 1.
p := max {r ∈ N>0 | r < nb}︸ ︷︷ ︸endlich, 6=∅
.
6. DIE REELLEN ZAHLEN 107
Wegen b−a > 0 erhalten wir n(b− a) = n(b−a) > 1, also na < nb−1. Also na < p < nb.
Somit
a <p
n−m− 1︸ ︷︷ ︸∈Q
< b.
SATZ 6.27 (Satz von Dedekind). Sei K = A ∪ A′, A 6= ∅, A′ 6= ∅. Es gelte
∀a ∈ A : ∀a′ ∈ A′ : a < a′.
Dann existiert ein eindeutiges β ∈ K mit
∀a ∈ A : ∀a′ ∈ A′ : a ≤ β ≤ a′ .
Man nennt β die Trennungszahl.16
Vorstellung: Im obigen Satz ist A so etwas ahnliches wie eine Unterklasse. Wenn man
in Definition 6.12 K durch K ersetzen wurde, dann waren (1) und (2) erfullt, aber es
verbleibt unbestimmt, ob A ein Maximum hat. Man stellt sich somit am besten auch dies
als die Aufteilung von K in einem linken Teil A und einen rechten Teil A′ vor.
Zahlenstrahl, der K symbolisiert. In der Mitte β, links davon A, rechts davon A′.
16Im Satz von Dedekind kann man sich nun uber die gewahlte Bezeichnung wundern: Wieso schreibe
ich hier a ∈ A? Denn dieses a ist ja ein Element von K und damit eine Unterklasse, die bisher typi-
scherweise mit dem Buchstaben α bezeichnet wurden. Wenn wir aber letzterer Bezeichnungslogik folgen,
dann mussen wir die Elemente von A′ mit α′ bezeichnen. In der bisherigen Notation ist α′ immer die
Oberklasse zur Unterklasse α definiert. Um diese Verwechslungsgefahr zu vermeiden, schreibe ich a und
a′ in der Aussage des Satzes.
108 2. ZAHLEN
Beweis. Existenz:
Fall 1: A besitzt ein Maximum.
Dann ist maxA eine Trennungszahl.
Fall 2: A besitzt kein Maximum.
Setze
β := {b ∈ K | iK(b) ∈ A} .
β ist Dedekindscher Schnitt in K.
Denn
(1) Wahle17 ein α ∈ A und dann ein b ∈ α. Mit Lemma 6.25 folgt iK(b) < α. =⇒
iK(b) ∈ A =⇒ b ∈ β =⇒ β 6= ∅.
Wahle ein α ∈ A′ und dann ein b′ /∈ α. Mit Lemma 6.25 folgt iK(b′) ≥ α. =⇒
iK(b′) ∈ A′ =⇒ b′ /∈ β =⇒ β 6= K.
(2) Sei b ∈ β und x ∈ K<b =⇒ iK(x) = K<x < K<b = iK(b) ∈ A =⇒ iK(x) ∈ A =⇒
x ∈ β.
(3) Sei b ∈ β. Somit iK(b) ∈ A. Da A kein Maximum hat, existiert ein α ∈ A mit iK(b) <
α. Nach Proposition 6.26 mit K0 := K gibt es ein a ∈ Q ⊂ K mit iK(b) < iK(a) < α
und somit b < a. Aus iK(a) < α ∈ A folgt iK(a) ∈ A, also a ∈ β. Somit war das
beliebig vorgegebene b ∈ β kein Maximum.
Somit β ∈ K. Zu zeigen bleibt, dass β eine Trennungszahl ist.
17Im Beweis benotige ich nun Elemente von Elementen von A, deswegen wechsle ich zur alten Notation
a ∈ α ∈ A. Wir schreiben α fur Elemente von A′, um Verwechslungen zur Oberklasse α′ von α zu
vermeiden.
6. DIE REELLEN ZAHLEN 109
Zu jedem α ∈ A gibt es ein α1 ∈ A mit α < α1. Proposition 6.26 liefert ein b ∈ Q ⊂ K
mit α < iK(b) < α1. =⇒ iK(b) ∈ A =⇒ b ∈ β. Mit Lemma 6.25 sehen wir iK(b) < β und
somit α < β.
Angenommen es gabe ein α ∈ A′ mit α < β. Proposition 6.26 liefert ein p ∈ Q ⊂ K
mit α < iK(p) < β. Wegen Lemma 6.25 haben wir p ∈ β, also iK(p) ∈ A. Gleichzeitig
erhalten wir aus α < iK(p) auch iK(p) ∈ A′, also einen Widerspruch.
Eindeutigkeit:
Angenommen es gabe zwei Trennungszahlen β1, β2 mit β1 < β2. Setze βm := (β1 +
β2)/2 ∈ K. Wir haben β1 < βm und somit βm /∈ A. Wegen βm < β2 folgt βm /∈ A′. Dies
widerspricht A ∪ A′ = K. Fr 23.11.
SATZ 6.28. Ist K ein archimedisch geordneter Korper, dann ist K ein archimedisch
geordneter Korper, der die Supremumseigenschaft erfullt. Die Abbildung iK : K −→ K
ist ein Isomorphismus.
Daraus folgt dann direkt Satz 6.7.
Beweis. Sei B eine nicht-leere nach oben beschrankte Teilmene von K. Wenn B ein
Maximum besitzt, so ist dieses auch das Supremum und wir sind fertig. Andernfalls defi-
nieren wir A′ := S(B,K) und A := KrA′. Die Voraussetzungen in Satz 6.27 sind erfullt.
Deswegen gibt es eine Trennungszahl β zur Zerlegung K = A ∪ A′.
110 2. ZAHLEN
Dann haben wir β ∈ S(A,K) und damit18 auch β ∈ S(B,K) = A′. Wegen der Folgerung
in Satz 6.27 ist dann β das Minimum von A′ = S(B,K) und damit das Supremum von
B. Insbesondere: das Supremum existiert.
Also erfullt K die Supremumseigenschaft. Deswegen ist iK : K −→ K nach Lemma 6.15
ein Isomorphismus.
Wir wenden uns nun dem Beweis von Satz 6.8 zu.
Sei (K,+, ·,≤) ein geordneter Korper, der die Supremumseigenschaft erfullt. Nach Lem-
ma 5.7 gibt es eine injektive Abbildung iKQ : Q −→ K, die Addition, Multiplikation und
Ordnung erhalt. Wir identifizieren im folgenden Q mit dem Bild von iKQ vermoge iKQ . Also
Q ⊂ K und Q ⊂ Q.
Sei α ∈ Q, also α sei eine Unterklasse in Q. Dann liefert jedes a′ ∈ α′ eine obere Schranke
von α in K. Somit ist α eine nicht-leere, nach oben beschrankte Teilmenge von K. Somit
existiert supK α ∈ K, wobei supK das Supremum in K bezeichnet. Wir definieren eine
Abbildung
s : Q −→ K, α 7→ supK α .
LEMMA 6.29. Zu jedem x ∈ K ist U(x) := {a ∈ Q | a < x} eine Unterklasse in Q.
18Es gilt hier sogar S(A,K) = S(B,K): wir haben diese Tatsache aber weder gezeigt noch benutzt.
Wir nutzen hier lediglich C ⊂ D → S(D,K) ⊂ S(C,K).
6. DIE REELLEN ZAHLEN 111
Beweis. Der geordnete Korper K ist insbesondere archimedisch (Satz 6.6).
K archimedischdef⇐⇒ ∀a ∈ K : ∃n ∈ N : a ≤ n
⇐⇒ ∀a ∈ K : ∃n ∈ N : a < n
⇐⇒ ¬ (∃a ∈ K : ∀n ∈ N : n ≤ a)
⇐⇒ N unbeschrankt
Somit ist Z und damit auch Q nach oben und unten unbeschrankt.
Nun zeigen wir, dass U(x) eine Unterklasse in Q ist:
(1) Nutze die Unbeschranktheit von Q:
U(x) 6= ∅, da Q nach unten unbeschrankt in K.
U(x) 6= Q, da Q nach oben unbeschrankt in K.
(2) a ∈ U(x) und y < a dann haben wir y < a < x.
(3) Angenommen a ware ein Maximum von U(x). Also a < x. Nach Proposition 6.26 mit
K0 := K existiert ein q ∈ Q mit a < q < x. Also q ∈ U(x). Widerspruch!
LEMMA 6.30. Die Abbildung
U : K −→ Q, x 7→ U(x)
ist die Umkehrabbildung von s : Q −→ K.
Beweis. ∀a ∈ α : a < s(α) =⇒ α ⊂ U(s(α))
∀a′ ∈ α′ : a′ ∈ S(α,Q) ⊂ S(α,Q) =⇒ a′ ≥ s(α) =⇒ a′ /∈ U(s(α)).
Somit α = U(s(α)).
112 2. ZAHLEN
Sei x ∈ K, y := s(U(x)) = supK{q ∈ Q | q < x}. Es folgt y ≤ x. Angenommen y < x,
dann existiert nach Proposition 6.26 mit K0 := K ein q ∈ Q mit y < q < x, also q ∈ U(x).
Widerspruch!
Man kann zeigen, dass s Addition, Multiplikation und Ordnung bewahrt.19 Nach all diesen
Vorarbeiten ist der Beweis von Satz 6.8 ganz kurz.
Beweis von Satz 6.8. Sei nun (K, +, ·, ≤) ein weiterer geordneter Korper ist, der die
Supremumseigenschaft erfullt. Wir erhalten analog s : Q→ K. Dann erfullt F := s◦s−1 :
K −→ K die in Satz 6.8 geforderten Eigenschaften.
FOLGERUNG 6.31. Ist (K,+, ·,≤) ein archimedisch geordneter Korper, dann gibt es
eine injektive Abbildung f : K −→ R, die Addition, Multiplikation und Ordnung erhalt.
Interpretation: Jeder archimedisch geordnete Korper ist im wesentlich gleich (mathema-
tisch praziser: als geordneter Korper isomorph) zu einem Unterkorper von R. Ein Un-
terkorper ist eine Teilmenge von R, die selber ein Korper ist; auf der Teilmenge sollen
Addition, Multiplikation und Ordnung wie in R defniert sein.
Beweis. Schranke die bijektive Abbildung K −→ R auf K ein.
7. Die komplexen Zahlen
Motivation. x2 = −1 besitzt keine reelle Losung.
19Der Beweis ist wiederum nicht schwer, aber besteht aus einigen Teilbehauptungen, die sich direkt
aus der Definition von +, · und ≤ ergeben.
7. DIE KOMPLEXEN ZAHLEN 113
Idee: Erweitere die reelle Zahlengerade zu einer Ebene, der Gaußschen Zahlenebene. Die
Elemente dieser Ebene sind komplexe Zahlen.
Ein Modell fur die komplexen Zahlen.
Definition 7.1. Auf C := R2 definieren wir die folgenden Verknupfungen:
Addition: + : C× C −→ C
((x1, y1), (x2, y2)) 7→ (x1, y1) + (x2, y2) := (x1 + x2, y1 + y2)
Multiplikation: · : C× C −→ C
((x1, y1), (x2, y2)) 7→ (x1, y1) · (x2, y2) := (x1x2 − y1y2, x1y2 + x2y1)
Gaußsche Zahlenebene und Addition
Die Abbildung iR : R ↪→ C, a 7→ (a, 0) ist injektiv und erhalt Addition und Multiplikation.
Wir identifizieren a mit (a, 0). Wir schreiben i := (0, 1). Dann gilt fur x, y ∈ R:
x+ yi = (x, 0) + (y, 0) · (0, 1) = (x, 0) + (0, y) = (x, y).
Man nennt dann x den Realteil von z = x + yi und y den Imaginarteil, geschrieben
x = Re z und y = Im z.
C = {x+ yi | x, y ∈ R}.
Wir haben i2 = (0− 1) + (0 + 0)i = −1.
Komplexe Zahlen z = x+ yi, x, y ∈ R heißen
• imaginar, falls y = Im z 6= 0,
• rein imaginar, falls x = Re z = 0 und y = Im z 6= 0.
114 2. ZAHLEN
LEMMA 7.2. (C,+, ·) ist ein Korper.
Beweis. Assoziativitat und Kommutativitat von Addition und Multiplikation ist einfach
nachzurechnen: (Aa), (Ak), (Ma), (Mk). Ebenso das Distributivgesetz (AMd). Das neu-
trale Element der Addition (bzw. Multiplikation) ist 0 = 0 + 0i, (bzw. 1 = 1 + 0i), (An)
bzw. (Mn). Das additive Inverse von x+ yi ist (−x) + (−y)i, (Ai).
(Mi): Gegeben sei z := x + yi ∈ C r {0}. Es folgt dann x 6= 0 ∨ y 6= 0 und somit
x2 + y2 ∈ R>0.
Wir benotigen ein multiplikatives Inverses von z, also ein w ∈ C mit wz = 1. Wir zeigen:
Es gibt genau ein solches w ∈ C.20
Zur Eindeutigkeit:
Angenommen wz = 1 mit z = x+yi und w = a+bi. Multipliziere beide Seiten mit x− iy:
(x− yi) = (a+ bi)(x+ yi)(x− yi) = (a+ bi)(x2 + y2) = a(x2 + y2) + b(x2 + y2)i .
Hieraus folgt x = a(x2 + y2) und −y = b(x2 + y2), also
a =x
x2 + y2,(7.3)
b = − y
x2 + y2.(7.4)
Zur Existenz:
20man muss eigentlich hier gar nicht die Eindeutigkeit zeigen, die Existenz reicht aus. Wenn man sich
aber die Eindeutigkeit anschaut, bekommt man eine Idee, wie man die Existenz zeigen kann.
7. DIE KOMPLEXEN ZAHLEN 115
Wir definieren a und b wie in (7.3) und (7.4). Die Definition ergibt Sinn, da x2 + y2 > 0.
Man rechnet nach
(x+ yi) · (a+ bi) = 1 .
Fur x, y ∈ R definieren wir
x+ yi := x− yi.
Wir erhalten eine R-lineare bijektive Abbildung C −→ C, z 7→ z, die komplexe Konjuga-
tion genannt wird.
Die Abbildung
C −→ R, x+ yi 7→ |x+ yi| :=√x2 + y2 =
√(x+ yi)(x+ yi)
heißt die Betragsfunktion der komplexen Zahlen.
Eigenschaften: Seien z, z1, z2 ∈ C.
z1 ± z2 = z1 ± z2
z1 · z2 = z1 · z2
z1/z2 = z1/z2
|z1 + z2| ≤ |z1|+ |z2|
|z1z2| = |z1| · |z2|
Es gelten auch die anderen in Lemma 5.11 aufgezahlten Eigenschaften mit Ausnahme von
(d), den man wie folgt abandern muss
|a2| = |a|2 = aa ≥ 0.
116 2. ZAHLEN
Polarkoordinaten und Veranschaulichung der Multiplikation in C.
21
Bilder zur Polar-Darstellung
Schreibe z1, z2, z3 in Polar-Darstellung
zn = rn(cosϕn + (sinϕn)i), rn ∈ R>0, ϕn ∈ R.
rn := |zn|; ϕn = arg(zn), falls ϕn ∈ [0; 2π).
UBUNG 7.5 (Ubungsblatt 6 Aufgabe 4). z3 = z1 · z2 ist aquivalent zu
r3 = r1 · r2 undϕ3 − (ϕ2 + ϕ1)
2π∈ Z
Mi 28.11.
Definition 7.6. Sei d ∈ N und seien a0, a1, . . . , ad ∈ C. Eine Funktion der Form
C −→ C
z 7→ P (z) :=d∑
k=0
akzk = a0 + a1z
1 + a2z2 + · · ·+ adz
d
21Ein Kommentar, um die logische Stellung dieser Veranschaulichung zu klaren: um eine geometrische
Vorstellung zu entwickeln, wie man komplexe Zahlen multipliziert, wurde hier die Polar-Darstellung
eingefuhrt, obwohl wir eigentlich zum jetzigen Zeitpunkt noch gar nicht wissen, was sin und cos bedeuten.
Die Ubungsaufgabe (Ubungsblatt 6 Aufgabe 4), die mit dieser Veranschaulichung verbunden ist, nutzt
die Additionstheoreme fur Sinus und Cosinus, die wir ebenfalls noch nicht bewiesen haben, die aber
wahrscheinlich jeder schon in der Schule gesehen hat. Fur einen exakten und streng logischen Aufbau
ware diese Veranschaulichung und die oben genannte Aufgabe besser erst dann zu behandeln, wer wir
all dies eingefuhrt haben. Da es aber mindestens genauso wichtig ist, dass Sie moglichst bald eine gute
Vorstellung von den komplexen Zahlen entwickeln, ist es dennoch richtig hier und nicht spater diese
Veranschaulichung zu behandeln.
7. DIE KOMPLEXEN ZAHLEN 117
nennt man eine polynomiale Funktion22 uber C. Die Zahlen a0, . . . , ad nennt man die
Koeffizienten. Gilt ad 6= 0, so sagen wir P hat Grad d, deg(P ) = d. Die polynomiale
Funtion mit C −→ C, z 7→ 0 hat Grad −∞, deg(0) = −∞. Hierbei ist −∞ ein Symbol23
mit den Eigenschaften ∀n ∈ N : −∞ < n und ∀n ∈ N : −∞ + n := −∞. Gilt deg(P ) =
d ∈ N, so nennt ad den Leitkoeffizient.
Jede polynomiale Funktion P hat einen Grad deg(P ) ∈ {−∞, 0, 1, . . .}.
(P +Q)(z) := P (z) +Q(z), (P ·Q)(z) := P (z) ·Q(z), deg(P ·Q) = deg(P ) + deg(Q).
THEOREM 7.7 (Fundamentalsatz der Algebra). Sei P : C −→ C ein Polynom von Grad
d ≥ 1. Dann gibt es ein z ∈ C mit P (z) = 0.
Ein solches z nennt man eine Nullstelle von P .
Mindestens einen Beweis dieses Theorems lernen wir in der Analyis III kennen.
KOROLLAR 7.8. Zu jeder polynomialen Funktion P uber C von Grad d ≥ 1 gibt es
komplexe Zahlen b1, . . . , bd mit
∀z ∈ C : P (z) = ad(z − b1)(z − b2) · · · (z − bd).
Die Losungsmenge der komplexen Zahlen z, die P (z) = 0 erfullen, ist somit
{bj | j ∈ {1, . . . , d}}22Sie haben im Rahmen der Schulmathematik hierfur vielleicht das Wort
”Polynom“ statt
”polyno-
mialer Funtion“ benutzt, dies ist nun aber nicht mehr erlaubt, denn das Wort”Polynom“ hat in der
Mathematik eine etwas andere Bedeutung, siehe Lineare Algebra.23Man sollte sich nicht fragen, was −∞ ist. Es ist nur ein Symbol, das N erweitert zu {−∞}∪N, und
die Definition der Ordnung ≤ und der Addition + erweitern sich wie in diesen Eigenschaften beschrieben.
118 2. ZAHLEN
und hat deswegen hochstens d Elemente und mindestens 1 Element.
Beweis. Man zeigt zuerst die Zerlegung P (z) = an(z − b1)(z − b2) · · · (z − bd) durch
Induktion uber d.
Induktionsanfang.
Ist P eine polynomiale Funktion von Grad 1, dann gilt P (z) = a1z + a0 mit a1 6= 0.
Daraus ergibt sich
P (z) = a1
(z +
a0
a1
),
also die Aussage mit b1 = −a0/a1.
Induktionsschritt.
Sei d ≥ 2 gegeben, und eine polynomiale Funktion P von Grad d. Das Korollar gelte
fur d − 1. Nach dem Fundamentalsatz der Algebra gibt es eine Nullstelle bd von P . Wir
dividieren P (z) durch (z − bd):
P (z) = Q(z)(z − bd) +R(z),
wobei Q eine polynomiale Funktion von Grad d− 1 ist und R eine polynomiale Funktion
ist, die den Divisionsrest angibt. Nun gilt24 deg(R) < deg(z − bd) = 1, also deg(R) = 0
oder R = 0. Da offensichtlich R(bd) = 0, folgt R = 0. Die polynomialen Funktionen Q
und P haben denselben Leitkoeffizient, den wir a nennen. Wir wenden nun die Indukti-
onsvoraussetzung auf Q an und schreiben:
Q(z) = a(z − b1) · · · (z − bn−1),
24Beweis: Lineare Algebra oder Mathematische-Methoden-Vorlesung
7. DIE KOMPLEXEN ZAHLEN 119
woraus wir
P (z) = a(z − b1) · · · (z − bn)
erhalten.
Nun rechnet man leicht P (bj) fur alle j ∈ {1, . . . , n} nach. Umgekehrt, sieht man fur
z 6∈ {bj | j ∈ {1, . . . , n}} leicht, dass P (z) als Produkt von nicht-verschwindenden25
Faktoren ebenfalls nicht-verschwindet.
Ist w eine Nullstelle von P , dann nennt man
#{j ={
1, 2, . . . , d} | w = bj
}∈ N
die Multiplizitat der Nullstelle.
Bemerkung 7.9. Die Berechnung der Nullstellen ist im allgemeinen sehr schwierig. Fur
polynomiale Funktionen von Grad d ≤ 4 gibt es eine Losungsformel. In der Schule lernt
man die fur d = 2, die Formel fur d = 3 und d = 4 sind zunehmend komplizierter. Fur
Grad d ≥ 5 gibt es keine Losungsformel, genauer man kann aus den Koeffizienten ai, den
Grundrechenarten +,+, ·, / und Wurzelziehen keinen Ausdruck herleiten, der die Null-
stellen angibt. Und man kann zeigen, dass es solche einen Ausdruck gar nicht gibt. Diese
Aussagen werden in der Vorlesung”Algebra“ im Rahmen der Galois-Theorie behandelt.
Die Galois-Theorie ist nach Evariste Galois benannt, dessen Leben und fruher Tod eine
sehr erstaunlich ist, siehe Wikipedia.
25”nicht-verschwindend“ ist eine noblere Form fur
”ungleich 0“
KAPITEL 3
Folgen und Reihen
1. Folgen
1.1. Konvergenz von Folgen. Im folgenden sei K = Q, K = R oder K = C. 1 Es
gibt dann eine Betragsfunktion K → R, x 7→ |x|.
|x+ y| ≤ |x|+ |y|, |xy| ≤ |x| |y|
Definition 1.1. Eine (K-wertige) Folge ist eine Abbildung von N nach K.
Oft bezeichnet man auch auf N>k definierte Abbildungen als Folgen, z.B. N>0 → K.
Definition 1.2. Eine K-wertige Folge (aj)j∈N heißt beschrankt, wenn es ein s ∈ R gibt,
so dass
∀j ∈ N : |aj| ≤ s.
Ist K ⊂ R, dann ist (aj)j∈N beschrankt genau dann, wenn die Menge {aj | j ∈ N} nach
oben und unten beschrankt ist. Fur K ⊂ R nennen wir (aj)j∈N nach oben bzw.2 nach unten
beschrankt genau dann, wenn {aj | j ∈ N} nach oben bzw. nach unten beschrankt ist.
1Alles, was wir im folgenden zeigen werden, gilt auch fur jeden archimedisch geordneten Korper.
Da aber alle diese Korper zu einem Unterkorper von R isomorph sind, ist dies keine wirkliche
Verallgemeinerung.2Die Abkurzung
”bzw.“ steht fur
”beziehungsweise“ und dieses Wort besagt, dass diese Definition
nun in zwei Version gelesen werden kann. Zunachst mit den Worten”nach oben“ an beiden Stellen, aber
121
122 3. FOLGEN UND REIHEN
Die Begriffe obere Schranke, untere Schranke, Minimum, Maximum, Supremum, Infimum
definiert man fur Folgen analog, also z.B. a ∈ R ist obere Schranke von (aj)j∈N genau
dann, wenn es obere Schranke von {aj | j ∈ N} ist.
Beispiele 1.3.
(a) (2j)j∈N ist nach unten, aber nicht nach oben beschrankt.
(b) (3 + 4/j)j∈N>0 ist nach unten beschrankt durch 3 und nach oben beschrankt durch 7.
Definition 1.4 (Konvergenz von Folgen). EineK-wertige Folge (aj)j∈N konvergiert gegen
a ∈ K, falls gilt
∀ε ∈ R>0 : ∃j0 ∈ N : ∀j ∈ N : (j ≥ j0 =⇒ |aj − a| ≤ ε).
Man nennt a den Grenzwert oder Limes der Folge (aj)j∈N und schreibt a = limj→∞ aj
oder aj → a fur j → ∞. Wir sagen (aj)j∈N konvergiert (in K), falls es ein derartiges
a ∈ K gibt. Folgen, die gegen 0 konvergieren, nennt man Nullfolgen. Falls eine Folge nicht
konvergiert, so sagen wir dazu sie divergiert.
!ACHTUNG!. Wenn wir a = limj→∞ aj schreiben, so bedeutet dies immer:
• der Grenzwert existiert, und
• der Grenzert ist a.
Bemerkungen 1.5.
auch mit den Worten”nach unten“. Hierbei ist wichtig, dass im Haupt- und im Nebensatz denselben
Begriff nutzt.
1. FOLGEN 123
(a) Falls eine Folge einen Grenzwert besitzt, so ist dieser eindeutig bestimmt. Seien a und
a′ zwei Grenzwerte von (aj)j∈N. Zu einem gegebenen ε ∈ R>0 gilt also:
∃j0 ∈ N : ∀j ∈ N : (j ≥ j0 =⇒ |aj − a| ≤ ε).
∃j′0 ∈ N : ∀j ∈ N : (j ≥ j′0 =⇒ |aj − a′| ≤ ε).
Wahle nun so ein j0 und j′0. Dann gilt fur alle j ≥ max{j0, j′0}:
|a− a′| ≤ |a− aj|+ |aj − a′| ≤ ε+ ε = 2ε.
Dies gilt fur alle ε ∈ R>0. Angenommen wir haben a 6= a′, so gilt dies insbesondere fur
ε := |a − a′|/3 > 0. Also folgt 3ε ≤ 2ε und somit ergibt sich der Widerspruch ε ≤ 0.
Die Annahme a 6= a′ war also falsch, d.h. es gilt a = a′.
(b) Falls (aj)j∈N konvergiert, so ist (aj)j∈N beschrankt. Begrundung: sei a := limj→∞aj.
Wir wahlen zu ε := 1 ein passendes j0. Es gilt somit fur alle j ∈ N mit j ≥ j0:
|aj| ≤ |aj − a|+ |a| ≤ |a|+ 1.
Nun setzen wir
r := max{|a0|, |a1|, . . . , |aj0−1|, |a|+ 1}.
Dann gilt fur alle j ∈ N: |aj| ≤ r. Somit ist (aj)j∈N beschrankt.
124 3. FOLGEN UND REIHEN
(c) Zu jedem ε ∈ R>0 existiert ein n ∈ N>0 mit ε ≥ 1/n (siehe Ubungsblatt 5 Aufgabe
3). Deswegen gilt3
a = limj→∞
aj gdw ∀n ∈ N>0 : ∃j0 ∈ N : ∀j ∈ N : (j ≥ j0 =⇒ |aj − a| ≤1
n).
Beispiele 1.6.
(a) Eine Folge (aj)j∈N heißt konstant, falls a0 = a1 = a2 = . . .. Konstante Folgen sind
beschrankt und konvergieren. a0 = limj→∞ ai.
(b) (1j)j∈N>0 ist eine Nullfolge. (Nutze z.B. Bem. 1.5 (c) und setze j0 := n).
(c) Die Folge((−1)j
)j∈N hat 1 als obere und −1 als untere Schranke und ist somit be-
schrankt. Wir werden bald sehen, dass sie nicht konvergiert.
(d) Gilt |q| < 1, dann ist (qj)j∈N eine Nullfolge. (Hierbei ist q0 := 1.)
Um dies zu zeigen, bestimme mit dem folgenden Lemma zu gegebenem ε ∈ R>0 ein
n ∈ N mit |q|n < ε. Dann gilt fur alle j ∈ N, j ≥ n:
|qj| = |q|j = |q|j−n︸ ︷︷ ︸≤1
|q|j ≤ ε.
Wir haben also gezeigt:
∀ε ∈ R>0 : ∃n ∈ N : ∀j ∈ N :(j ≥ n =⇒ |qj − 0| ≤ ε
).
LEMMA 1.7. Sei r ∈ R>0 mit r < 1 und ε ∈ R>0. Dann gibt es ein n ∈ N mit rn < ε.
3Um die Gefahr von Verwechslungen zwischen dem Grenzwert-Pfeil (z.B. j →∞) und dem Pfeil fur
logische Implikation (z.B. (a∧ b)→ (c∨ d) klein z halten, benutzen wir ab nun oft =⇒ an Stellen, wo wir
bisher → benutzt hatten, z.B. in der folgenden Formel
1. FOLGEN 125
Beweis. Offensichtlich gilt
rn < ε⇐⇒(1
r
)n>
1
ε(1.8)
Auf Ubungsblatt 4 Aufgabe 1 c) haben wir fur x ∈ R≥−1 die Bernoulli-Ungleichung
gezeigt:
(1 + x)n ≥ 1 + nx .
Wende die Bernoulli fur x := (1/r)− 1 > 0 an und erhalte
(1.9)
(1
r
)n≥ 1 + nx .
Aufgrund der archimedischen Eigenschaft existiert ein n ∈ N mit
n >1
x
(1
ε− 1
).
und dies ist aquivalent zu
1 + nx >1
ε,
und mit (1.9) impliziert dies (1.8) und somit rn < ε. Fr 30.11.
PROPOSITION 1.10. Seien (aj)j∈N und (bj)j∈N konvergente Folgen. Dann gilt:
limj→∞
(aj + bj) = limj→∞
aj + limi→∞
bj(1)
limj→∞
(aj − bj) = limj→∞
aj − limi→∞
bj(2)
limj→∞
(aj · bj) = limj→∞
aj · limi→∞
bj(3)
126 3. FOLGEN UND REIHEN
Gilt zusatzlich: ∀i ∈ N : bj 6= 0, und ist (bj)i∈N keine Nullfolge, so gilt auch
(4) limj→∞
ajbj
=limj→∞
aj
limi→∞
bj.
Beweis von Proposition 1.10 (1).
(1): Angenommen a = limj∈N aj und b = limj∈N bj. Dies bedeutet, dass wir fur jedes
ε ∈ R>0 die folgenden Aussagen haben:
∃j0 ∈ N : ∀j ∈ N : (j ≥ j0 =⇒ |aj − a| ≤ ε)
∃k0 ∈ N : ∀j ∈ N : (j ≥ k0 =⇒ |bj − b| ≤ ε)
Wir wahlen nun solch ein j0 und solch ein k0. Dann gilt fur `0 := max{j0, k0}.
∀j ∈ N : (j ≥ `0 =⇒ |aj − a| ≤ ε ∧ |bj − b| ≤ ε).
Wir rechnen fur j ≥ `0:
|(aj + bj)− (a+ b)| = |(aj − a) + (bj − b)| ≤ |aj − a|+ |bj − b| ≤ ε+ ε = 2ε.
Also ergibt sich insgesamt
∀ε ∈ R>0 : ∃`0 ∈ N : ∀j ∈ N :(j ≥ `0 =⇒ |(aj + bj)− (a+ b)| ≤ 2ε.
)︸ ︷︷ ︸
A(2ε):=
Nach dem folgenden Lemma konnen wir in dieser Aussage 2ε durch ε zu ersetzen. Somit
ist
a+ b = limj→∞
(aj + bj)
und damit auch (1) gezeigt.
1. FOLGEN 127
LEMMA 1.11. Sei A( · ) eine auf R>0 definierte Aussageform, und q ∈ R>0. Dann gilt
∀ε ∈ R>0 : A(ε) ⇐⇒ ∀ε ∈ R>0 : A(qε)
Das Lemma gibt es vielen Variationen. Wichtiger als die Aussage des Lemmas ist es, zu
verstehen, wie man das Lemma (oder eine Variation davon!) kurz beweist.
Beweis des Lemmas.
”=⇒“: Es gelte
(1.12) ∀ε ∈ R>0 : A(ε).
Fur ein gegebenes ε > 0 wollen wir nun A(qε) zeigen. Wir wenden (1.12) fur ε := qε an,
und haben dann das gewunschte.
”⇐=“: Analog mit ε := q−1ε
Beweis von Proposition 1.10 (Fortsetzung).
(2): Der Beweis fur (aj − bj)j∈N ist vollig analog zur Summe.
(3): Sei wieder a := limj→∞ aj und b := limj→∞ bj. Fur das Produkt (aj · bj)j∈N muss man
etwas anders vorgehen. Zunachst nutzen wir die Tatsache, dass (aj)j∈N beschrankt ist.
Also gibt es ein r ∈ R mit
∀j ∈ N : |aj| ≤ r
Dann argumentieren wir wie bei der Summe, rechnen aber wie folgt:
|ajbj − ab| = |aj(bj − b) + (aj − a)b| ≤ |aj||bj − b|+ |aj − a||b| ≤ rε+ ε|b| = (r + |b|)ε.
Nun argumentiert man wie bei der Summe, wobei man das Lemma mit q := r+ |b| nutzt.
128 3. FOLGEN UND REIHEN
(4): Sei b := limj→∞ bj 6= 0. Wir zeigen, dass 1/bj gegen 1/b konvergiert. Die Aussage (4)
folgt dann mit (3).
Fur ε1 := |b|/2 gibt es ein j0 ∈ N, so dass fur alle j ∈ N≥j0 gilt |bj − b| ≤ ε1 = |b|/2. Nach
Lemma 5.11 (g) haben wir dann
|bj| ≥ |b| − |b− bj| ≥ |b| −|b|2
=|b|2.
Wir nutzen nun wieder die Definition des Grenzwerts: fur jedes ε ∈ R>0 haben wir
∃k0 ∈ N : ∀j ∈ N : (j ≥ k0 =⇒ |bj − b| ≤ ε)
Fur j ≥ `0 := max{j0, k0} rechnen wir
∣∣∣∣ 1
bj− 1
b
∣∣∣∣ =
∣∣∣∣b− bjbbj
∣∣∣∣ =|b− bj||b| |bj|
≤ ε
(|b|/2) |b|=
2
|b|2ε .
Wir haben also gezeigt
∀ε > 0 : ∃`0 ∈ N : ∀j ∈ N :(j ≥ `0 =⇒
∣∣∣∣ 1
bj− 1
b
∣∣∣∣ ≤ 2
|b|2ε).
Aus dem Lemma mit q := 2|b|2 folgt dann
1
b= lim
j→∞
1
bj.
1. FOLGEN 129
1.2. Monotone Folgen.
Definition 1.13. Seien (M,≤) und (N,≤) geordnete Mengen, f : M → N . Wir sagen
f ist
monoton wachsend :⇐⇒ ∀i, j ∈M :(i ≤ j =⇒ f(i) ≤f (j))
)⇐⇒ f erhalt die Ordnung
monoton fallend :⇐⇒ ∀i, j ∈M :(i ≤ j =⇒ f(i) ≥ f(j)
)⇐⇒ f ist ordnungsumkehrend
streng monoton wachsend :⇐⇒ ∀i, j ∈M :(i < j =⇒ f(i) < f(j)
)streng monoton fallend :⇐⇒ ∀i, j ∈M :
(i < j =⇒ f(i) > f(j)
)
monoton:⇐⇒ f ist monoton wachsend oder monoton fallend
streng monoton:⇐⇒ f ist streng monoton wachsend oder streng monoton fallend
⇐⇒ f ist monoton und injektiv
Beispiele 1.14.
(1) R −→ R, x 7→ x3 ist streng monoton wachsend,
(2) (n)n∈N und (1− 1n)n∈N>0 sind streng monoton wachsende Folgen.
(3) Fur r ∈ R ist
brc := max(S({r},R) ∩ Z
),
130 3. FOLGEN UND REIHEN
also die großte ganze Zahl ≤ r. Analog ist dre als die kleinste ganze Zahl ≥ r definiert.
Dann ist (bn2c)n∈N = (0, 0, 1, 1, 2, 2, 3, 3, . . .) monoton wachsend, aber nicht streng
monoton. Gleiches gilt fur (dn2e)n∈N = (0, 1, 1, 2, 2, 3, 3, . . .).
(4) Injektive monotone Funktionen sind streng monoton.
(5) Ist (M,≤) total geordnet, (N,≤) partiell geordnet und ist f : M −→ N streng
monoton, dann ist f : M −→ N injektiv. Denn seien x, y ∈ M . Es gilt x < y,
x = y oder x > y. Falls f streng monoton wachsend ist und falls x < y, dann folgt
f(x) < f(y), also f(x) 6= f(y). Die anderen Falle sind analog.
Nun betrachten wir reell-wertige Folgen, also M = N, N = R.
Monoton wachsende (bzw. fallende) Folgen (ai)i∈N haben a0 als Minimum (bzw. Maxi-
mum), sind also immer nach unten (bzw. oben) beschrankt.
PROPOSITION 1.15. Alle beschrankten monotonen R-wertige Folgen konvergieren (in
R).
Beweis. Sei (aj)j∈N eine beschrankte monotone Folge, o.B.d.A. monoton wachsend, aj ∈
R. Definieren A := {aj | j ∈ N}, a := supA. Zu jedem ε ∈ R>0 gibt es ein j0 ∈ N mit
aj0 > a− ε, denn sonst ware a− ε eine obere Schranke von A.
Also gilt fur alle j ∈ {j0, j0 + 1, . . .}: a− ε < aj0 ≤ aj ≤ a. Daraus ergibt sich |a− aj| ≤ ε.
Wir erhalten a = limj→∞ aj.
Beispiel 1.16. Sei
aj :=
j∑k=1
1
k2 + k5.
1. FOLGEN 131
Die Folge (aj)j∈N ist streng monoton. Spater werden wir sehen: (aj)j∈N ist beschrankt.
Somit konvergiert (aj)j∈N.
In Abschnitt 2 uber Reihen im aktuellen Kapitel werden wir viele ahnliche Beispiele sehen.
Beispiel 1.17. Wallissches Produkt und ein Algorithmus zur Wurzelberechnung, siehe
Zentralubung oder [22, Abschnitt 5.3 und 5.4].
1.3. Teilfolgen. Von nun an wieder K = Q, R oder C.
Definition 1.18. Ist f : N −→ N eine streng monotone wachsende Abbildung, dann
nennt man (af(k))k∈N eine Teilfolge von (aj)i∈N.
Beispiel 1.19. Die Folge (j)j∈N = (0, 1, 2, 3, . . .) hat unter anderem folgende Teilfolgen: 4
• sich selbst, das heißt (j)j∈N = (k)k∈N, also f(k) = k
• die Folge der ungeraden Zahlen (1, 3, 5, 7, . . .), also f(k) = 2k + 1
• die Folge der Primzahlen (2, 3, 5, 7, . . .).
LEMMA 1.20. Konvergiert (aj)j∈N gegen a, so konvergiert jede Teilfolge ebenfalls gegen
a.
Beweis. Sei (af(k))k∈N eine Teilfolge von (aj)j∈N, also f : N −→ N streng monoton.
Sei ε ∈ R>0 gegeben. Wir haben
∃j0 ∈ N : ∀j ∈ N≥j0 : |aj − a| ≤ ε.
4Diese Folge hat naturlich noch viel mehr Teilfolgen!
132 3. FOLGEN UND REIHEN
Wahle zu solch einem j0 ein k0 ∈ N mit f(k0) ≥ j0, zum Beispiel k0 := j0. Dann gilt fur
dieses k0
∀k ∈ N≥k0 : |af(k) − a| ≤ ε.
Insgesamt also
∀ε ∈ R>0 : ∃k0 ∈ N : ∀k ∈ N : (k ≥ k0 =⇒ |ak − a| ≤ ε).
Ingesamt also a = limk→∞ af(k).
Anwendung 1.21. Die Folge((−1)j
)j∈N aus Beispiele 1.6 (c) divergiert.
Beweis. Angenommen, die Folge((−1)j
)j∈N konvergiert gegen ein a ∈ K. Dann konver-
gieren auch die Teilfolgen((−1)2k
)k∈N = (1)k∈N und
((−1)2k+1
)k∈N = (−1)k∈N gegen a.
Da diese Teilfolgen konstant sind, erhalten wir den Widerspruch a = 1 und a = −1.Mi 5.12.
Sei K = Q, R oder C.
Definition 1.22. Sei (ai)i∈N eine K-wertige Folge, a ∈ K. Wir sagen a ist ein Haufungs-
punkt der Folge (ai)i∈N, falls eine Teilfolge existiert, die gegen a konvergiert.
Beispiele 1.23. Die Haufungspunkte der Folge((−1)n
)n∈N sind −1 und +1.
K = C. Die Haufungspunkte der Folge(in)n∈N = (1, i,−1,−i, . . .) sind −1, +1, −i und
+i.
1.4. Erweiterte reelle Zahlen und uneigentliche Konvergenz. In diesem Un-
terabschnitt ist immer K = R.
Nach unseren bisherigen Definition besitzen zum Beispiel die folgenden Teilmenge von R
weder Supremum noch Infimum: ∅, Z, Q, R, . . ..
1. FOLGEN 133
Notation 1.24. Wir definieren sup ∅ := −∞, inf ∅ := ∞. Und supM := ∞, falls M
nicht nach oben beschrankt. Und inf M := −∞, falls M nicht nach unten beschrankt.
Fortsetzung der Ordnung auf R := R ∪ {−∞,+∞}. ∞ = +∞.
∀x ∈ R : −∞ ≤ x ≤ ∞.
Man nennt R die erweiterten reellen Zahlen. Addition und Multiplikation sind hierauf
nicht definiert.
Intervalle5: Seien a, b ∈ R, a ≤ b
(a, b) := {x ∈ R | a < x < b} offenes Intervall
[a, b) := {x ∈ R | a ≤ x < b} halboffenes Intervall
(a, b] := {x ∈ R | a < x ≤ b} halboffenes Intervall
[a, b] := {x ∈ R | a ≤ x ≤ b} abgeschlossenes Intervall
Definition 1.25. Sei (an)n∈N eine reell-wertige Folge. Wir sagen
(an)n∈N konvergiert gegen unendlich
⇐⇒ ∀x ∈ R : ∃n0 ∈ N : ∀n ∈ N≥n0 : an ≥ x
Alternative Ausdrucksweisen:
an →∞ fur n→∞
(an)n∈N konvergiert gegen ±∞.
limj→∞ aj =∞
5An Stelle von (0, 1] schreibt man in Schulen oft ]0, 1]. Dies ist in der Mathematik in den Universitaten
weniger ublich, da eine Klammer ] am Ende eines einzuklammernden Ausdrucks stehen sollte. In den
meisten Buchern schreibt man deswegen (0, 1].
134 3. FOLGEN UND REIHEN
Wir sagen (an)n∈N konvergiert gegen −∞, wenn (−an)n∈N gegen +∞ konvergiert. Kon-
vergenz gegen ∞ oder −∞ nennt man uneigentliche Konvergenz.6 Wir sagen, dass ∞
(bzw. −∞) ein Haufungspunkt von (an)n∈N ist, falls eine Teilfolge gegen ∞ (bzw. −∞)
konvergiert.
Wir nutzen den Begriff”eigentlich konvergent“ inhaltlich aquivalent zu
”konvergiert“, das
Wort”eigentlich“ wird benutzt, wenn man nochmals unterstreichen will, dass es sich nicht
um”uneigentliche Konvergenz“ handelt.
Wir sagen eine Folge konvergiert in R, falls sie eigentlich oder uneigentlich konvergiert.
Beispiel 1.26. Sei k ∈ N>0. Dann gilt:
limn→N
nk =∞.
Wenn wir a = limn→∞ an schreiben, so bedeutet dies ab jetzt (fur K = R):
• der Grenzwert existiert im eigentlichen oder uneigentlichen Sinn,
• der Grenzwert ist a ∈ R.
!ACHTUNG!. Wenn wir ohne weitere Zusatze sagen:”die reell-wertige Folge konver-
giert“, dann ist hier immer die Konvergenz im eigentlichen Sinne gemeint, d.h. gegen eine
reelle Zahl. Uneigentlich konvergente Folgen sind somit immer divergent. 7
6In manchen Buchern, z.B. [14] wird der Begriff”uneigentliche Konvergenz“ durch
”bestimmte Di-
vergenz“ ersetzt.7Aber wir haben schon gesehen, dass es divergente Folgen gibt, die nicht uneigentlich konvergieren,
z.B. ((−1)n)n∈N.
1. FOLGEN 135
!ACHTUNG!. In der gesamten Analysis I und II gilt: Im Fall K = C gibt es keine
uneigentliche Konvergenz von Folgen. Wer diesen Begriff in der Klausur oder auf dem
Ubungsblatt fur K = C nutzt, macht einen Fehler.
LEMMA 1.27. Eine Folge ist genau dann nach oben (bzw. nach unten) beschrankt, wenn
∞ (bzw. −∞) kein Haufungspunkt ist.
Beweis. Sei (aj)j∈N eine Folge.
Angenommen∞ ist ein Haufungspunkt. Sei f : N→ N ist streng monoton wachsend und
limn→∞ af(n) =∞. Fur x ∈ R gilt dann
∃n0 ∈ N : ∀n ∈ N≥n0 : af(n) ≥ x.
Also ist x− 1 keine obere Schranke. Also (aj)j∈N unbeschrankt.
Sei (aj)j∈N nach oben unbeschrankt.
(1.28) ∀x ∈ R : ∃k ∈ N : ak > x
Definiere induktiv f : N→ N. Wahle f(0) := 0. Seien nun f(0), f(1), . . . , f(n) fur n ∈ N
definiert. Wende (1.28) fur x := max{af(0), af(1) . . . , af(n), n} an und erhalte ein k. Setze
f(n+ 1) := k. Dann konvergiert die Teilfolge (af(n))n∈∞ gegen ∞.
Also ist die Folge nach oben unbeschrankt genau dann, wenn ∞ Haufungspunkt ist.
136 3. FOLGEN UND REIHEN
(aj)j∈N nach unten beschrankt
⇐⇒(−aj)j∈N nach oben beschrankt
⇐⇒∞ kein Haufungspunkt von (−aj)j∈N
⇐⇒−∞ kein Haufungspunkt von (aj)j∈N
PROPOSITION 1.29. Jede monotone R-wertige Folge konvergiert eigentlich oder unei-
gentlich (in R).
Beweis. Ist die Folge beschrankt, so wissen wir bereits, dass sie eigentlich konvergiert.
Sei (aj)j∈N unbeschrankt und o.B.d.A. monoton wachsend. Dann ist die Folge also nach
oben unbeschrankt. Dies impliziert insbesondere
∀x ∈ R : ∃j0 ∈ N : aj0 > x.
Wegen der Monotonie gilt dann auch aj > x fur alle j ≥ j0. Wir erhalten also limj→∞ aj =
∞.
Wir definieren nun die Abbildung ϕ : [−1, 1] −→ R,
ϕ(x) =
1
1−x −1
1+xfur x ∈ (−1, 1)
∞ fur x = 1
−∞ fur x = −1
1. FOLGEN 137
Diese Abbildung ist streng monoton und bijektiv. Sei ψ := ϕ−1 : R −→ [−1, 1].
PROPOSITION 1.30. Sei (an)n∈N eine R-wertige Folge. Es gilt fur alle a ∈ R:
a = limn→∞
an ⇐⇒ ψ(a) = limn→∞
ψ(an)
a Haufungspunkt von (an)n∈N ⇐⇒ ψ(a) Haufungspunkt von (ψ(an))n∈N
Graphen der Funktion x 7→ ϕ(x) und ihrer Umkehrfunktion
In wenigen Wochen (Bemerkung 5.14 in Kapitel 4) werden wir starke Hilfsmittel haben,
um diese Proposition ganz einfach zu zeigen. Der Beweis wird deswegen hier ausgelassen.
1.5. Limes inferior und superior. In diesem Unterabschnitt ist wiederum immer
K = R.
Sei (aj)j∈N eine R-wertige Folge. Definiere fur k ∈ N
bk := inf{aj | j ∈ N≥k} ∈ [−∞,∞).
Es gilt bk ≤ bk+1, denn fur A ⊂ B ⊂ R gilt inf B ≤ inf A.
Somit ist (bk)k∈N eine monoton wachsende R-wertige Folge und limk→∞ bk existiert in R.
Im Fall ∀k ∈ N : bk = −∞ definiert man hierfur limk→∞ bk = −∞.
Definition 1.31. Sei (ai)i∈N eine R-wertige Folge.
(1) Wir definieren den Limes inferior als
lim infj→∞
aj := limk→∞
inf{aj | j ∈ N≥k} ∈ R.
138 3. FOLGEN UND REIHEN
(2) Der Limes superior ist
lim supj→∞
aj := − lim infj→∞
(−aj) = limk→∞
sup{aj | j ∈ N≥k} ∈ R.
Beispiel 1.32. lim infj→∞(−1)j = −1, lim supj→∞(−1)j = 1
lim infj→∞
aj ≤ lim supj→∞
aj
SATZ 1.33. Sei (ai)i∈N eine R-wertige Folge.
(1) lim infj→∞
aj ∈ R ist ein Haufungspunkt von (aj)j∈N.
(2) lim supj→∞
aj ∈ R ist ein Haufungspunkt von (aj)j∈N.
(3) Konvergiert (aj)j∈N in R, dann haben wir
lim infj→∞
aj = limj→∞
aj = lim supj→∞
aj
(4) Gilt b := lim infj→∞
aj = lim supj→∞
aj ∈ R, dann konvergiert (aj)j∈N gegen b.
(5) Ist (af(`))`∈N eine Teilfolge von (aj)j∈N, dann gilt
lim infj→∞
aj ≤ lim inf`→∞
af(`)
lim sup`→∞
af(`) ≤ lim supj→∞
aj
(6) Ist b ein Haufungspunkt der Folge (aj)i∈N gilt
lim infj→∞
aj ≤ b ≤ lim supj→∞
aj.
Beweis.
Zu (1): Wir definieren wieder bk := inf{aj | j ∈ N≥k}. Sei b := lim infj→∞ aj = limk→∞ bk.
Wir haben dann bk ≤ b.
1. FOLGEN 139
Wir betrachten zunachst den Fall b ∈ R. Wir geben eine rekursive Definition von f : N→
N an. Wir wahlen f(0) := 0. Zu gegebenem n ∈ N>0 nehmen wir nun an, dass f(n − 1)
definiert ist und wir wollen nun f(n) definieren. Wegen b = limk→∞ bk und bk ≤ b gibt
es ein k0 ∈ N, so dass fur alle k ∈ N≥k0 die Ungleichung b − 1n≤ bk ≤ b gilt. Wahle
k := max{k0, f(n− 1) + 1} nun fest.
Auf Grund der Definition von bk0 als Infimum gibt es ein ` ∈ N≥k mit bk ≤ a` ≤ bk + 1n.
Wir setzen f(n) := ` und erhalten somit
b− 1
n≤ bk ≤ af(n) ≤ bk +
1
n≤ b+
1
n.
Das heißt, das Kriterium in Bemerkung 1.5 (c) fur die Konvergenz b = limn→∞ af(n) ist
erfullt.
Die Falle lim infj→∞
aj = ∞ und/oder lim infj→∞
aj = −∞ gehen ahnlich und werden auf dem
Ubungsblatt 8 behandelt.
Zu (2): Wende (1) auf die Folge (−aj)j∈N an. Wir erhalten eine Teilfolge (−af(n))n∈N mit
limn→∞
(−af(n)) = lim infj→∞
(−aj) ∈ R.
Somit
limn→∞
af(n) = − lim infj→∞
(−aj) = lim supj→∞
aj ∈ R.
Zu (3): Wahle eine Teilfolge gemaß (1) die gegen lim infj→∞
aj konvergiert. Wegen Lemma 1.20
konvergiert sie auch gegen limj→∞
aj. Also lim infj→∞
aj = limj→∞
aj. Genauso zeigt man die die
andere Gleichung mit (2). Fr 7.12.
Zu (4): Wir haben
bj := inf{ak | k ≥ j} ≤ aj ≤ bj := sup{ak | k ≥ j}
140 3. FOLGEN UND REIHEN
(bj) ist monoton wachsend, (bj) monoton fallend, also beide konvergent in R.
b = limj→∞ bj = limj→∞ bj, also konvergiert nach Ubungsblatt 7, Aufgabe 3 b) (Sandwich-
Lemma) auch (aj) gegen diesen Grenzwert.
Zu (5): Wir haben
{aj | j ∈ N≥f(`)} ⊃ {af(m) | m ∈ N≥`}
und somit
bf(`) = inf{aj | j ∈ N≥f(`)} ≤ inf{af(m) | m ∈ N≥`} =: b`
Also
lim infj→∞
aj = limj→∞
bjTF= lim
`→∞bf(`)
(∗)≤ lim
`→∞b` = lim inf
`→∞af(`)
(bj) und (b`) sind monoton wachsende Folgen, also konvergieren sie in R
Zu TF: Ubergang zu Teilfolge, siehe Lemma 1.20
(∗): siehe Ubungsblatt 7, Aufgabe 3, a)
Zu (6): Folgt nun aus (3) und (5)
Aus Satz 1.33 folgt:
KOROLLAR 1.34. Jede reell-wertige Folge besitzt eine in R konvergente Teilfolge.
In anderen Worten: Jede reell-wertige Folge besitzt einen Haufungspunkt in R.
KOROLLAR 1.35 (Satz von Bolzano-Weierstraß). Jede beschrankte reell-wertige Folge
besitzt eine (in R) konvergente Teilfolge.
1. FOLGEN 141
In anderen Worten: Jede beschrankte reell-wertige Folge besitzt einen Haufungspunkt in
R.
Beweis. Auf Grund des Korollars 1.34 besitzt jede reell-werte Folge mindestens einen
Haufungspunkt in R. Wegen Lemma 1.27 sind −∞ und ∞ keine Haufungspunkte, wenn
die Folge beschrankt ist. Wir haben also einen Haufungspunkt in R.
SATZ 1.36 (Satz von Bolzano-Weierstraß in C). Jede beschrankte C-wertige Folge besitzt
eine (in C) konvergente Teilfolge.
Beweis. Sei (an)n∈N eine beschrankte Folge, an ∈ C. Dann sind auch (Re an)n∈N und
(Im an)n∈N beschrankt. Es gibt somit eine streng monotone Abbildung f1 : N −→ N, so
dass (Re af1(n))n∈N konvergiert. Da auch (Im af1(n))n∈N beschrankt ist, gibt es eine streng
monotone Abbildung f2 : N −→ N, so dass auch (Im af1◦f2(n))n∈N konvergiert. Wir folgern,
dass (af1◦f2(n))n∈N in C konvergiert.
1.6. Cauchy-Folgen. In diesem Unterabschnitt sei K = C oder sei K ein archime-
disch geordneter Korper (z.B. K = R oder K = Q).
Betragsfunktion | · | : K → R, x 7→ |x|.
Definition 1.37. Eine K-wertige Folge (aj)i∈N heißt K-wertige Cauchy-Folge, falls
∀ε ∈ R>0 : ∃j0 ∈ N : ∀j, k ∈ N≥j0 : |aj − ak| ≤ ε.
SATZ 1.38. Jede konvergente Folge ist eine Cauchy-Folge.
Beweis. Es gelte limj→∞ aj = a. Das heißt: fur alle ε ∈ R>0 gibt es ein j0 ∈ N, so dass
fur alle naturlichen Zahlen j ≥ j0 gilt: |aj − a| ≤ ε.
142 3. FOLGEN UND REIHEN
Fur solch ein ε und ein passendes j0 nehmen wir nun naturliche Zahlen j ≥ j0 und k ≥ j0
und rechnen nach:
|aj − ak| ≤ |aj − a|+ |a− ak| ≤ ε+ ε = 2ε.
Wir haben nun also gezeigt:
∀ε ∈ R>0 : ∃j0 ∈ N : ∀j, k ∈ N≥j0 : |aj − ak| ≤ 2ε.
Wegen Lemma 1.11 ist dies aquivalent zur definierenden Eigenschaft einer Cauchy-Folge.
LEMMA 1.39. Jede Cauchy-Folge ist beschrankt.
Beweis. Sei (aj)j∈N eine Cauchy-Folge. Wir wahlen zu ε := 1 ein passendes j0 wie in
Definition 1.37. Es gilt somit fur alle j ∈ N mit j ≥ j0:
|aj| ≤ |aj − aj0|+ |aj0| ≤ |aj0|+ 1.
Nun setzen wir
r := max{|a0|, |a1|, . . . , |aj0−1|, |aj0|+ 1}.
Dann gilt fur alle j ∈ N: |aj| ≤ r. Somit ist (aj)j∈N beschrankt.
Definition 1.40. Sei K = C oder ein archimedisch geordneter Korper. Wir nennen K
vollstandig, wenn jede K-wertige Cauchy-Folge in K konvergiert.
SATZ 1.41. Sei K = C oder sei K ein archimedisch geordneter Korper, in dem jede
beschrankte Folge einen Haufungspunkt besitzt. Dann ist K vollstandig. Insbesondere
sind R und C vollstandig.
1. FOLGEN 143
Beweis. Sei (aj)j∈N eine K-wertige Cauchy-Folge. Nach Lemma 1.39 ist die Folge be-
schrankt und besitzt deswegen aufgrund der Annahmen im Satz eine konvergente Teilfolge
(af(n))n∈N, der Limes dieser Teilfolge sei a ∈ K. Zu gegebenem ε ∈ R>0 bestimmen wir
nun ein n0 ∈ N, so dass
∀n ∈ N≥n0 : |af(n) − a| ≤ ε .
Wir bestimmen zudem ein j0 ∈ N, so dass
∀j, k ∈ N≥j0 : |aj − ak| ≤ ε.
Wir wahlen nun ein n ∈ N≥n0 mit f(n) ≥ j0. (Eine mogliche Wahl ist n := max{j0, n0},
denn dann gilt f(n) ≥ n ≥ j0.) Fur j ≥ j0 erhalten wir
|aj − a| ≤ |aj − af(n)|+ |af(n) − a| ≤ 2ε .
Mit Lemma 1.11 folgt a = limj→∞ aj.
Bemerkung 1.42. Man kann zeigen: Ist K ein vollstandiger archimedisch geordneter
Korper, so erfullt er die Supremums-Eigenschaft. Somit sind fur einen archimedisch ge-
ordneten Korper die folgenden Eigenschaften aquivalent:
(1) K erfullt die Supremums-Eigenschaft
(2) Jede beschrankte Folge besitzt einen Haufungspunkt (Bolzano-Weierstraß-Eigenschaft)
(3) K ist vollstandig
(4) K ist isomorph zu R
Beispiel 1.43. Wir konstruieren rekursiv eine Q-wertige Folge (vergleiche Zentralubung)
a0 := 2, an+1 =1
2
(an +
2
an
).
144 3. FOLGEN UND REIHEN
In R – das heißt, wenn wir sie als R-wertige Folge interpretieren – konvergiert diese Folge
gegen√
2 6∈ Q. Deswegen ist sie eine Cauchy-Folge in R und in Q.
Andererseits konvergiert sie nicht in Q, denn wenn sie in Q gegen a ∈ Q konvergieren
wurde, so hatte sie in R auch a 6=√
2 als Grenzwert, was nicht moglich ist. Deswegen
konvergiert diese Cauchy-Folge nicht in Q.
Cauchy-Folgen sind wichtig, denn man kann hiermit die Konvergenz von Folgen zeigen,
ohne den Grenzwert im voraus angeben zu mussen.
2. Reihen
2.1. Motivation von Reihen: Dezimal-Darstellung reeller Zahlen. Notatio-
nen.
Eine Dezimal-Darstellung einer positiven reellen Zahl x ist gegeben durch eine Zahl ` ∈ Z
und einer Abbildung
Z≥` → {0, 1, 2 . . . , 9}, n 7→ an.
Wir erhalten hieraus die reelle Zahl
x =∞∑n=`
10−n · an.
Nun sind mehrere Punkte ungeklart:
• Was ist solch eine unendliche Summe? (Siehe Abschnitt 2.2)
• Hat jede positive reelle Zahl eine Dezimal-Darstellung?
• Wenn ja, ist sie eindeutig?
2. REIHEN 145
Sobald dies geklart ist, kann man”schreiben“, falls ` ≤ 0:
x = a`a`+1 . . . a0, a1a2 . . .
bzw. falls ` > 0:
x = 0, 0 . . . , 0︸ ︷︷ ︸`−1 mal
a`a`+1 . . . . . .
Wir sagen:
(an)n∈Z≥` ist eine Dezimal-Darstellung von x .
Beispiele 2.1.
(1)
1
7= 0, 142857142857 . . . = 0, 142857
1
13= 0, 076923
1
17= 0, 0588235294117647
1
28= 0, 03571428
3, 14159265 . . .
(2) Die Dezimal-Darstellung ist periodisch, genau dann wenn die dadurch beschrie-
bene zugehorige reelle Zahl eine rationale Zahl ist.
Problem: Man kann im allgemeinen nicht alle Ziffern hinschreiben, da es ja unendlich viele
sind.
146 3. FOLGEN UND REIHEN
UBUNG 2.2. Gegeben sei die Dezimal-Darstellung (an)n∈Z einer positiven rationalen
Zahl pq, p, q ∈ N teilerfremd. Wir zerlegen
q = 2a5bqc11 · · · qcrr
wobei 2, 5q1, . . . , qr verschiedene Primzahlen sind, a, b, c1, . . . , cr ∈ N. Dann teilt die Pe-
riodenlange die Zahl∏r
j=1(qj − 1)qcj−1j . Die Zahl der Ziffern zwischen dem Komma und
dem Beginn der Periode ist max{a, b}.
Im Fall r = 1 kann man dies mit Schulwissens beweisen. Einen Beweis erhalt man (im
Fall r = 1) eigentlich schon, wenn man sich genau anschaut, wie man in der 4. Klasse
das Dividieren lernt. Fur einen systematischeren Beweis, der auch r > 1 abdeckt, sind
Kongruenzen hilfreich. Ein Web-Link hierzu ist auch
http://m.schuelerlexikon.de/mobile mathematik/Endliche und periodische Dezimalbrueche.htm
Im aktuellen Abschnitt wollen wir nun solche unendlichen Summen einfuhren. Man be-
nutzt aber das Wort”Reihe“ an Stelle des Wortes
”Unendliche Summe“.
Bemerkung 2.3. (a) Jede Dezimal-Darstellung”beschreibt“ eine reelle Zahl.
(b) Jede positive reelle Zahl besitzt eine Dezimal-Darstellung.
(c) Die Dezimal-Darstellung ist nicht eindeutig. Sind (an)n∈Z≥` , a` 6= 0, und (bn)n∈Z≥k ,
bk 6= 0, verschiedene Dezimal-Darstellungen derselben positiven Zahl, so hat mindes-
tens eine der beiden Darstellungen eine Periode 9.
2. REIHEN 147
Zu (a): Im nachsten Abschnitt wird klar werden, was hier mit”beschreibt“ gemeint ist,
namlich der Grenzwert einer konvergenten Reihe. Die Aussage wird auch im nachsten
Abschnitt gezeigt.
Zu (b) und (c): Dies sollte nach dem nachsten Abschnitt jeder als Ubungsaufgabe beweisen
konnen. Tipp zu (b): Zunachst mal uberlegt man sich zu einer gegebenen reellen Zahl x,
wie eine Dezimaldarstellung aussehen muss, wenn sie existiert. Danach uberlegt man sich,
dass diese Darstellung tatsachlich die gegebene Zahl x beschreibt. Man muss hier u.a. die
Supremums-Eigenschaft von R nutzen.
Beispiele 2.4.
(1) 0, 9 und 1, 0 sind Dezimal-Darstellungen von 1
(2) Jede positive reelle Zahle hat also eine eindeutige Periode-9-freie Dezimal-Darstellung.
In der Zentralubung wurde bereits das folgende gezeigt:
PROPOSITION 2.5. Es gibt keine surjektive Abbildung von N nach R.
Beweis. Angenommen es gibt eine surjektive Abbildung f : N −→ R.
Fur k ∈ N schreiben f(k) als Dezimalzahl
f(k) = ±ak`k . . . ak0, a
k1a
k2 . . .
O.B.d.A. konnen wir annehmen, dass j(k) keine Periode 9 hat. Wir definieren h : {0, 1, . . . , 9} −→
{0, 1, . . . , 9} durch
h(m) :=
1 fur m = 2
2 fur m 6= 2
148 3. FOLGEN UND REIHEN
Also h(m) 6∈ {m, 9, 0}. Fur k ∈ N setze nun bk := h(akk), und dann
x := 0, b1b2b3 . . .
Nun ist x 6= f(k), den die beiden reellen Zahlen haben in ihrer Periode-9-freien Darstellung
eine verschiedene Ziffer an der k-ten Stelle. Also gilt x 6∈ B(f) = f#(N). Somit ist f gar
nicht surjektiv, entgegen der Annahme.Mi 12.12.
2.2. Definition und elementare Eigenschaften. Ziel: Definiere∑∞
j=0 aj
Alle Folgen in diesem Abschnitt sind Folgen in K = R oder K = C. In anderen Worten
es sind R-wertige oder C-wertige Folgen. Der Fall Q-wertiger Folgen ist naturlich damit
auch abgedeckt, da Q ⊂ R, wir diskutieren aber nicht die Konvergenz in Q, sondern nur
die Konvergenz in R.
Beachte im folgenden: eine Folge (an)n∈N ist genau dann eine Nullfolge, wenn (|an|)n∈Neine Nullfolge ist.
Definition 2.6. Sei (aj)j∈N eine Folge in K. Wir definieren die n-te Teilsumme oder
Partialsumme als
sn :=n∑j=0
aj.
Die Folge (sn)n∈N nennt man dann (unendliche) Reihe mit den Summanden aj. Man
schreibt eine Reihe in der Form∞∑j=0
aj.
Falls die Folge der Partialsummen (sn)n∈N konvergiert, so sagen wir die Reihe konvergiert
und man definiert∞∑j=0
aj := limn→∞
sn.
2. REIHEN 149
Die Reihe divergiert, wenn die Folge der Partialsummen divergiert. Bei Folgen in R defi-
niert man analog die uneigentliche Konvergenz.
Wir erlauben auch, dass Reihen nicht bei 0, sondern bei einer beliebigen anderen ganzen
Zahl k0 beginnen und schreiben dann eben∑∞
j=k0aj.
!ACHTUNG!.∑∞
j=1 aj hat zwei Bedeutungen:
1.) die Folge der Partialsummen. Dann ist∑∞
j=0 aj ∈ Abb(N, K)
2.) der Limes dieser Folge (falls er existiert). Dann ist∑∞
j=0 aj ∈ K
Welche Bedeutung gemeint ist, wird immer aus dem Kontext heraus deutlich. Wenn man
sagt”die Reihe
∑∞j=1 aj konvergiert oder divergiert in K“, dann ist immer die Folge der
Partialsummen gemeint. Wenn man 5 =∑∞
j=1 aj schreibt, dann ist der Limes der Folge
der Partialsummen gemeint (und es ist dann implizit klar, dass wir fordern, dass dieser
dann existieren muss). Um diesen Unterschied deutlicher zu machen, schreiben wir in den
nachsten Zeilen aus didaktischen Grunden
1.) die Folge der Partialsummen immer in dieser Farbe
2.) den Limes dieser Folge immer in dieser Farbe
∞∑j=1
aj konvergent
⇐⇒ ∃s ∈ K : ∀ε ∈ R>0 : ∃n0 ∈ N : ∀n ∈ N≥n0 :∣∣∣( n∑j=1
aj)− s∣∣∣ ≤ ε
⇐⇒ ∀ε ∈ R>0 : ∃n0 ∈ N : ∀n ∈ N≥n0 : ∀m ∈ N≥n :∣∣∣ m∑j=n+1
aj
∣∣∣ ≤ ε (Cauchy-Kriterium)
150 3. FOLGEN UND REIHEN
8
Jede Folge kann realisiert werden als Folge von Partialsummen. Denn sei (sn)n∈N gegeben.
Definiere dann a0 := s0 und fur n ≥ 1: an = sn− sn−1. Dann ist sn die n-te Partialsumme
von (an)n∈N.
Beispiele 2.7.
(a) Konvergente geometrische Reihe:∑∞
r=0 zr = 1
1−z fur |z| < 1.
Denn wir rechnen:
(z0 + z1 + z2 + · · ·+ zn︸ ︷︷ ︸sn=
)(1− z) = 1− zn+1,
Nun ist (zn+1)n∈N eine Nullfolge, da (|z|n+1)n∈N ebenfalls eine Nullfolge ist.
(b) Divergente geometrische Reihe:∑∞
r=0 zr divergiert fur |z| ≥ 1: siehe unten (Prop. 2.8)
und beachte, dass (zr)r∈N keine Nullfolge ist.
(c) Die harmonische Reihe∑∞
r=11r
divergiert:
Dieser Teil ist noch nicht gesetzt.
(d)∑∞
r=11r2
konvergiert:
Dieser Teil ist noch nicht gesetzt.
PROPOSITION 2.8. Wenn∑∞
j=0 aj konvergiert, dann ist (aj)j∈N eine Nullfolge.
Beweis. Sei s =∑∞
j=0 aj. Dann gilt
an =n∑j=0
aj −n−1∑j=0
aj → s− s = 0 fur n→∞.
8Hier gilt die Konvention∑nj=n+1 aj = 0
2. REIHEN 151
Die Umkehrung dieser Aussage ist falsch: Die Reihe∑∞
r=11r
divergiert, aber (1r)r∈Nr{0} ist
Nullfolge.
EIGENSCHAFTEN 2.9.
(a) Wenn∑∞
j=0 aj und∑∞
j=0 bj konvergieren, dann gilt
∞∑j=0
(aj ± bj) =∞∑j=0
aj ±∞∑j=0
bj.
(b) In einer konvergenten Reihe durfen Klammern gesetzt werden (Ubergang zu einer
Teilfolge der Partialsummen). Man darf im allgemeinen Klammern nicht weglassen:
1− 1 + 1− 1 + 1 · · · divergiert, aber (1− 1) + (1− 1) + (1− 1) · · · konvergiert gegen
0 und 1 + (−1 + 1) + (−1 + 1) · · · konvergiert gegen 1.
(c) Es gelte fur alle r ∈ N: ar ∈ R≥0. Dann ist (sn)n∈N monoton wachsend. Also ist nach
Proposition 1.15∑∞
r=0 ar genau dann konvergent in K, wenn (sn)n∈N beschrankt ist.
2.3. Konvergenzkriterien.
Einige vereinfachende Notationen
Um in Zukunft uber Folgen und Reihen effizienter sprechen zu konnen, fuhren wir noch
einige Notationen ein.
Definition 2.10. Sei A( · ) eine auf N definierte Aussageform.
Fur fast alle j ∈ N gilt A(j)
:⇐⇒ Es gibt ein j0 ∈ N, so dass fur alle j ∈ N≥j0 : A(j)
⇐⇒ Die Menge {j ∈ N | ¬A(j)} ist endlich
152 3. FOLGEN UND REIHEN
Beispiel:
limj→∞
aj = a
⇐⇒ Fur alle ε ∈ R>0 gilt fur fast alle j ∈ N: |aj − a| ≤ ε
6⇐⇒ Fur fast alle j ∈ N gilt fur alle ε ∈ R>0: |aj − a| ≤ ε
Die Bedingung der letzten Zeile ist genau dann erfullt, wenn die Folge (aj)j∈N nach endlich
vielen potentiellen Ausnahmen konstant gleich a ist. Solche Folgen konvergieren zwar
gegen a, aber es gibt viel mehr Folgen, die gegen a konvergieren.
Notation:
Da wir immer wieder Ausdrucke der Art
∀j ∈ N≥j0 : A(j)
haben, schreiben wir hierfur kurz
∀j ∈ {j0, j0 + 1, . . .} : A(j).
PROPOSITION 2.11 (Majoranten-Kriterium). Sei (ar)r∈N eine Folge in R oder C und
(br)r∈N eine Folge in R≥0, so dass fur fast alle r ∈ N: |ar| ≤ br. Konvergiert∑∞
r=0 br, dann
auch∑∞
r=0 ar.
Man nennt in diesem Fall∑∞
r=0 br eine konvergente Majorante.
Beweis. Fur alle ε ∈ R>0 existiert n0 ∈ N so dass fur alle n ∈ {n0, n0 + 1, . . .}:
|an+1 + · · ·+ am| ≤ |an+1|+ · · ·+ |am| ≤ bn+1 + · · ·+ bm ≤ ε.
2. REIHEN 153
Das Majoranten-Kriterium liefert sofort: Divergiert∑∞
r=0 ar, so divergiert auch∑∞
r=0 br.
In diesem Fall gilt dann:∑∞
r=0 br = ∞ (uneigentliche Konvergenz), da die Folge der
Partialsummen (∑n
r=0 br)n∈N monoton wachsend ist.
Beispiele 2.12. (a)∑∞
r=11rk
konvergiert fur k ≥ 2, denn∑∞
r=11r2
ist eine konvergente
Majorante.
(b)∑∞
r=11√r
divergiert, denn es ist eine Majorante von∑∞
r=11r.
(c)∑∞
r=11r!
konvergiert, weil∑∞
r=21
(r−1)2=∑∞
k=11k2
eine konvergente Majorante von∑∞
r=21r!
ist.
LEMMA 2.13. Sei (bj)j∈N eine Folge in R.
(i) lim infj→∞ bj > 1 genau dann, wenn es ein q ∈ R , q > 1, gibt, so dass fur fast alle
j ∈ N: bj ≥ q.
(ii) lim supj→∞ bj < 1 genau dann, wenn es ein q ∈ R, q < 1 gibt, so dass fur fast alle
j ∈ N: bj ≤ q.
Beweis. Zu (i) =⇒:
cn := inf{bj | j ≥ n}.
cn monoton wachsend, c := limn→∞ cn = lim infj→∞ bj > 1.
q :=c+ 1
2.
Somit gilt fur fast alle n ∈ N: cn > q. Also fur fast alle j ∈ N: bj > q.
Hieraus folgt die Aussage”=⇒“ fur den Limes inferior. Fr 14.12.
Zu (i) ⇐=: Sei wieder
cn := inf{bj | j ≥ n}.
154 3. FOLGEN UND REIHEN
Gegeben sei q ∈ R>1, so dass fur fast alle j ∈ N gilt: bj ≥ q. In anderen Worten: es gibt
ein j0 ∈ N, so dass fur j ∈ N≥j0 : bj ≥ q. Somit
q ≤ cj0 ≤ lim infj→∞
bj.
Zu (ii): Die Aussagen fur den Limes superior zeigt man ganz analog.
Die Ausdrucke limn→∞ an, lim infn→∞ an und lim supn→∞ an ergeben immer noch Sinn,
wenn an gar nicht mehr fur alle n ∈ N, sondern nur noch fur fast alle n ∈ N definiert ist.
PROPOSITION 2.14 (Quotienten-Kriterium). Sei∑∞
j=0 aj eine Reihe in R oder in C, so
dass fur fast alle j ∈ N: aj 6= 0.
(a) Gilt lim supj→∞
∣∣∣aj+1
aj
∣∣∣ < 1 dann konvergiert∑∞
j=0 aj.
(b) Gilt lim infj→∞
∣∣∣aj+1
aj
∣∣∣ > 1, dann divergiert∑∞
j=0 aj.
Beweis. Zu (a): Lemma 2.13 liefert uns ein j0 ∈ N und q < 1, so dass gilt:
∀j ∈ N≥j0 : aj 6= 0 und ∀j ∈ N≥j0 :
∣∣∣∣aj+1
aj
∣∣∣∣ ≤ q.
Dann zeigt man durch Induktion fur n ∈ N≥j0 : |an| ≤ qn−j0|aj0|. Somit ist∑∞
n=0 qn−j0|aj0|
eine konvergente Majorante von∑∞
j=0 aj und deswegen ist∑∞
j=0 aj konvergent.
Zu (b): Man geht ahnlich vor wie oben und erhalt |an| ≥ qn−j0|aj0| fur q > 1. Daraus
folgt, dass (|an|)n∈N keine Nullfolge ist, damit auch nicht (an)n∈N und somit divergiert die
Reihe∑∞
n=0 an.
Beispiel 2.15. Sei t = pq∈ Q, p ∈ Z, q ∈ Nr {0}. Definiere fur r ∈ R≥0:
rt := ( q√r)p
2. REIHEN 155
Sei x ∈ C. 9 Betrachte die Reihe∑∞
n=0 an fur an = ntxn. Fur n ≥ 1:
an+1
an=
(n+ 1
n
)t· x
1 ≤(n+ 1
n
)t=
(q
√1 +
1
n
)p(∗)≤(
1 +1
n
)p→ 1
fur n → ∞, wobei wir in (∗) genutzt haben, dass fur s ≥ 1 gilt: 1 ≤ q√s ≤ s und somit
q√sp ≤ sp. Wir erhalten dann
limn→∞
∣∣∣∣an+1
an
∣∣∣∣ = |x| limn→∞
(n+ 1
n
)t= |x|
Also ist∑∞
n=0 ntxn konvergent fur |x| < 1; und
∑∞n=0 n
txn ist divergent fur |x| > 1.
PROPOSITION 2.16 (Wurzel-Kriterium). Sei (ar)r∈N eine Folge. 10
(a) Wenn lim supr→∞r√|ar| < 1, dann konvergiert
∑∞r=0 ar.
(b) Gilt fur unendlich viele r ∈ N: r√|ar| ≥ 1, dann ist
∑∞r=0 ar divergent.
(c) Wenn lim supr→∞r√|ar| > 1, dann ist
∑∞r=0 ar divergent.
Beweis. Zu (a): Unter Benutzung des Lemmas 2.13 gilt fur ein geeignetes q und fast alle
r ∈ Nr√|ar| ≤ q < 1.
Also |ar| ≤ qr. Also ist∑∞
r=0 qr eine konvergente Majorante von
∑∞r=0 ar.
9Wir beschranken uns hier auf rationale t, da wir rt noch nicht fur beliebige reelle t definiert haben.10In der folgenden Formel ist r
√|ar| < 1 fur r = 0 nicht definiert. Dies stort uns nicht, da die Folge
nur fur fast alle r ∈ N definiert zu sein braucht, damit wir den Limes superior definieren konnen.
156 3. FOLGEN UND REIHEN
Zu (b): r√|ar| ≥ 1 ⇐⇒ |ar| ≥ 1. Gilt dies fur unendlich viele r, dann ist (ar)r∈N keine
Nullfolge, also kann∑∞
r=0 ar nicht konvergent sein.
Zu (c): Im Fall lim supr→∞r√|ar| > 1 gibt es eine Teilfolge (af(n))n∈N so dass limn→∞
n√|af(n)| =
lim supr→∞r√|ar| > 1. Es gilt dann n
√|af(n)| > 1 fur fast alle n ∈ N. Also gibt es unendlich
viele r ∈ N mit |ar| > 1.
Beispiele 2.17. Eine Reihe der Form∑∞
r=0 arxr nennt man eine Potenzreihe in x.
(a) Sei x ∈ R≥0 und ar ≥ 0 11
∞∑r=0
arxr
lim supr→∞
r√arxr = x lim sup
r→∞r√ar, falls x 6= 0
lim supr→∞
r√arxr =∞ =⇒ ∀x ∈ R>0 :
∞∑r=0
arxr divergiert
0 < lim supr→∞
r√arxr <∞ =⇒ ∀x ∈
0,1
lim supr→∞
r√ar
:∞∑r=0
arxr konvergiert
∀x ∈
1
lim supr→∞
r√ar,∞
:∞∑r=0
arxr divergiert
lim supr→∞
r√arxr = 0 =⇒ ∀x ∈ R≥0 :
∞∑r=0
arxr konvergiert
Wir definieren
11Wdh: Fur x ∈ C definieren wir x ≥ 0 als: x ∈ R und x ≥ 0. Es ist hier im Text also implizit die
Information enthalten, dass x ∈ R und ar ∈ R.
2. REIHEN 157
ρ :=
1
lim supr→∞
r√ar
falls lim supr→∞
r√ar ∈ R>0
0 falls lim supr→∞
r√ar =∞
∞ falls lim supr→∞
r√ar = 0
∑∞r=0 arx
r konvergiert fur x < ρ und divergiert fur x > ρ.
ρ heißt Konvergenzradius der Potenzreihe.
x0 ρ
Konvergenz Divergenz
Abbildung 5:
(b) Sei nun x ∈ C und ai ∈ C. Wir definieren dann
ρ :=
1
lim supr→∞
r√|ar|
falls lim supr→∞
r√|ar| ∈ R>0
0 falls lim supr→∞
r√|ar| =∞
∞ falls lim supr→∞
r√|ar| = 0
Dann konvergiert∑∞
r=0 arxr im Fall |x| < ρ und divergiert im Fall |x| > ρ.
Die Begrundung kann man vollig analog zu Beispiel (a) fuhren, wenn man |x| an
Stelle von x und |ar| an Stelle von ar schreibt. Alternativ kann die Konvergenz auch
aus (a) mit dem Majoranten-Kriterium gezeigt werden.
(c) Fur |x| = ρ kann keine Aussage getroffen werden. Die Potenzreihen∑∞
r=0 rxr und∑∞
r=11r2xr besitzen beide Konvergenzradius 1, denn lim
r→∞r√r = 1 und lim
r→∞r√r−2 =
158 3. FOLGEN UND REIHEN
( limr→∞
r√r)−2 = 1. (Details hier12) Nun ist die Reihe
∑∞r=0 rx
r fur x ∈ C, |x| = 1
offensichtlich divergent. Wir haben gesehen, dass fur x = 1 die Reihe∑∞
r=11r2xr
konvergiert (Beispiel 2.7 (d)), und auf Grund des Majoranten-Kriteriums konvergiert
diese Reihe dann fur alle x ∈ C mit |x| = 1.
LEMMA 2.18. Sei ar ∈ Cr {0}. Dann gilt
lim supn→∞
n√|an| ≤ lim sup
n→∞
|an+1||an|
.
Beweis. Sei α := lim supn→∞|an+1||an| . Fixiere ein β > α. Es gilt also13 fur fast alle n ∈ N:
(2.19)|an+1||an|
≤ β.
Bestimme also ein n0 ∈ N, so dass fur alle n ∈ N≥n0 die Ungleichung (2.19) gilt.
|an| ≤ βn−n0 |an0|
n√|an| ≤ n
√βn︸ ︷︷ ︸
β=
n√β−n0|an0|︸ ︷︷ ︸→1
Wr haben genutzt, dass fur jedes s ∈ R>0 die Aussage limn→∞n√s = 1 gilt. 14 Daraus
folgt also
lim supn→∞
n√|an| ≤ β.
12Wir wollen zeigen, dass limr→∞
r√r = 1. Hierzu ist zu zeigen, dass xr := r
√r − 1 eine Nullfolge ist.
Man rechnet nun mit der binomischen Formel nach, dass (xr + 1)r︸ ︷︷ ︸r=
≥ r(r−1)2 x2r. Also 0 ≤ x2r ≤ 2/(r − 1).
13eine Moglichkeit, dies zu sehen, ist Lemma 2.13 (ii) fur bj =|aj+1|α|aj | anzuwenden.
14Beweis fur s > 1: s = ( n√s)n = ( n
√s − 1 + 1)n =
∑nj=0
nj
( n√s − 1)j1n−j ≥ n( n
√s − 1). Somit
1 ≤ n√s ≤ 1 + 1
n . Im Fall s < 1 wissen wir deswegen n√
1/s→ 1 und somit konvergiert n√s = 1
n√
1/sauch
gegen 1.
2. REIHEN 159
Da dies fur alle β > α gilt, folgt die Aussage.
Bemerkung 2.20. Die Konvergenzaussage im Wurzel-Kriterium (Prop. 2.16 (a)) ist also
starker als die Konvergenzaussage im Quotienten-Kriterium (Prop. 2.3 (a)), denn es zeigt
dieselbe Aussage mit einer schwacheren Voraussetzung.Mi 19.12.
2.4. Absolute Konvergenz.
Definition 2.21 (Absolute Konvergenz). Seien ar ∈ C. Wir sagen die Reihe∑∞
r=0 ar
konvergiert absolut, falls∑∞
r=0 |ar| konvergiert.
Das Majoranten-Kriterium fur br := |ar| impliziert also: Jede absolut konvergente Reihe
ist konvergent.
Majoranten-Kriterium, Quotienten-Kriterium und Wurzel-Kriterium liefern nicht nur die
Konvergenz einer Reihe, sondern sogar ihre absolute Konvergenz, siehe unten.15 Insbeson-
dere ist eine Potenzreihe∑∞
n=0 anxn absolut konvergent, wenn |x| kleiner als der Konver-
genzradius ist.
PROPOSITION 2.22 (Majoranten-Kriterium mit absoluter Konvergenz). Sei (ar)r∈N eine
Folge16 und (br)r∈N eine Folge in R≥0, so dass fur fast alle r ∈ N: |ar| ≤ br. Konvergiert∑∞r=0 br, dann ist
∑∞r=0 ar absolut konvergent.
PROPOSITION 2.23 (Quotienten-Kriterium mit absoluter Konvergenz). Sei∑∞
j=0 aj ei-
ne Reihe, so dass fur fast alle j ∈ N: aj 6= 0.
15Die Beweise sind wortwortlich gleich16Wenn wir nichts anderes hinschreiben, ist unter einer Folge immer eine Folge in C gemeint, und
eine Folge in R ist auch eine Folge in C.
160 3. FOLGEN UND REIHEN
(a) Gilt lim supj→∞
∣∣∣aj+1
aj
∣∣∣ < 1, dann konvergiert∑∞
j=0 aj absolut.
(b) wie zuvor.
PROPOSITION 2.24 (Wurzel-Kriterium mit absoluter Konvergenz). Sei (ar)r∈N eine
Folge.
(a) Wenn lim supr→∞r√|ar| < 1, dann konvergiert
∑∞r=0 ar absolut.
(b) und (c) wie zuvor.
2.5. Alternierende Reihen.
Definition 2.25. Eine alternierende Reihe ist eine Reihe in der Form
∞∑n=0
(−1)nan
oder17
∞∑n=0
(−1)n+1an,
wobei ∀n ∈ N : an ∈ R≥0.
PROPOSITION 2.26 (Regel von Leibniz). Sei (an)n∈N eine monoton fallende Nullfolge,
an ≥ 0. Dann konvergiert die Reihe
∞∑n=0
(−1)nan.
Beweis. Gegeben seien naturliche Zahlen m,n, n0 mit m ≥ n ≥ n0.
17Wir betrachten ab jetzt immer nur den ersten Fall, um die Notation einfach zu halten
2. REIHEN 161
Idee (noch nicht prazise):
Um das Cauchy-Kriterium anzuwenden, wollen wir
(−1)n+1an+1 + (−1)n+2an+2 + · · ·+ (−1)mam
kontrollieren.
Prazise Ausfuhrung der Idee:
an+1 + (−1)an+2 + · · ·+ (−1)m−n+1am
=
(an+1 − an+2)︸ ︷︷ ︸
≥0
+ · · ·+ (am−1 − am)︸ ︷︷ ︸≥0
≥ 0 falls m− n gerade
(an+1 − an+2)︸ ︷︷ ︸≥0
+ · · ·+ am︸︷︷︸≥0
≥ 0 falls m− n ungerade
an+1 + (−1)an+2 + · · ·+ (−1)m−n+1am
=
an+1 +
≤0︷ ︸︸ ︷((−1)an+2 + an+3) + · · ·+
≤0︷ ︸︸ ︷(−1)am
≤ an+1 falls m− n gerade
an+1 +
≤0︷ ︸︸ ︷((−1)an+2) + an+3) + · · ·+
≤0︷ ︸︸ ︷((−1)am−1 + am)
≤ an+1 falls m− n ungerade
Also
|m∑
k=n+1
(−1)kak| = |(−1)n+1an+1 + (−1)n+2an+2 + · · ·+ (−1)mam| ≤ |an+1|.
162 3. FOLGEN UND REIHEN
Da (an) eine Nullfolge ist, haben wir gezeigt:
∀ε ∈ R>0 : ∃n0 ∈ N : ∀n ∈ N≥n0 : ∀m ∈ N≥n : |m∑
k=n+1
(−1)kak| ≤ ε.
Beispiele 2.27.
(a) Die harmonische alternierende Reihe
∞∑n=1
(−1)n+1 1
n
konvergiert.
(b) Die Reihe∑∞
n=1(−1)nan mit
an :=
1n
fur n gerade
1n2 fur n ungerade
divergiert. Denn sei
α :=∞∑k=0
1
(2k + 1)2.
(Anschaulich ist α die unendliche Summe der an uber alle ungeraden n.)
Dann gilt
2r∑n=1
an ≥ (r∑
k=1
1
2r)− α
und dies konvergiert uneigentlich gegen ∞ fur r → ∞, da die harmonische Reihe
konvergiert.
2. REIHEN 163
2.6. Umordnung von Reihen.
Definition 2.28. Sei∑∞
n=0 an eine Reihe. Ein Umordnung dieser Reihe ist eine Reihe
der Form∑∞
n=0 af(n), wobei f : N −→ N eine Bijektion ist.
SATZ 2.29 (Umordnungssatz). Ist∑∞
n=0 an eine absolut konvergente Reihe in R oder C,
so ist jede Umordnung∑∞
n=0 af(n) dieser Reihe ebenfalls absolut konvergent und es gilt
∞∑n=0
an =∞∑n=0
af(n).
Beweis spater.
SATZ 2.30 (Riemannsche Umordnungssatz). Ist∑∞
n=0 an eine konvergente Reihe in R,
die nicht absolut konvergiert.
(1) Sei α ∈ R gegeben. Dann gibt es eine Umordnung dieser Reihe, die gegen α eigentlich
oder uneigentlich konvergiert.
(2) Es gibt eine Umordnung, die beschrankt und divergent ist.
Beispiel 2.31. Die Folge∑∞
n=1(−1)n 1n
ist konvergent, aber nicht absolut konvergent. Zu
jedem α ∈ R gibt es eine Umordnung von∑∞
n=1(−1)n 1n, die gegen α konvergiert.
Beweis von Satz 2.29. Sei∑∞
n=0 an absolut konvergent. Dies bedeutet nach dem Cauchy-
Kriterium: Zu jedem ε ∈ R>0 gibt es ein n0 ∈ N, so dass fur alle n, n ∈ N mit n0 ≤ n ≤ n
gilt18 :∑n
j=n+1 |aj| ≤ ε.
18Ja, die Betragsstriche sind hier um den richtigen Ausdruck, denn es handelt sich um absolute
Konvergenz!
164 3. FOLGEN UND REIHEN
Wir fixieren nun ε und ein passendes n0. Sei nun∑∞
n=0 af(n) eine Umordnung dieser Reihe.
Insbesondere sei f : N→ N als bijektiv vorausgesetzt. Wir setzen nun
m0 := max f#({0, 1, . . . , n0}) := max{f−1(0), f−1(1), . . . , f−1(n0)}.
Hier steht eine Zeichnung, die noch nicht gesetzt ist.
Dies bedeutet, fur alle ` > m0 gilt f(`) > n0. Somit gilt fur m, m ∈ N mit m0 ≤ m < m:
m∑`=m+1
|af(`)| ≤N∑
j=n0+1
|aj| ≤ ε
wobei N ∈ N eine “genugend große” naturliche Zahl ist, zum Beispiel
(2.32) N := max f#({m+ 1,m+ 2, . . . , m}) = max{f(m+ 1), f(m+ 2), . . . , f(m)} > n0
oder jede Zahl die mindestens so groß wie dieses Maximum ist. Dann ist also das Cauchy-
Kriterium fur die Reihe∑∞
n=0 |af(n)| erfullt, in anderen Worten∑∞
n=0 af(n) ist absolut
konvergent.
Wir wissen nun also, dass die Reihen (absolut) konvergieren, und wir studieren nun deren
Grenzwerte∑∞
n=0 an und∑∞
n=0 af(n). Wir wahlen zu ε ∈ R>0 passende Zahlen n0 und m0
wie oben. Außerdem definieren wir
N0 := max{f(0), f(1), . . . , f(m0)} = max f#({0, 1, . . . ,m0}) ≥ n0.
Fur alle n, n ∈ N mit n0 ≤ n ≤ n gilt
(2.33) |n∑j=0
aj −n∑j=0
aj| = |n∑
j=n+1
aj| ≤n∑
j=n+1
|aj| ≤ ε
2. REIHEN 165
und dies impliziert im Limes n→∞ fur n := N0(≥ n0)
|∞∑j=0
aj −N0∑j=0
aj| ≤ ε.
Wenn wir N wie in (2.32) definieren ergibt sich analog:
|m∑`=0
af(`) −m0∑`=0
af(`)| = |m∑
`=m0+1
af(`)| ≤N∑
j=n0+1
|aj| ≤ ε
und somit im Limes m→∞
|∞∑`=0
af(`) −m0∑`=0
af(`)| ≤ ε.
Außerdem
N∑j=0
aj −m0∑`=0
af(`) =∑j∈I
aj
wobei I := {0, 1, . . . , N} r f#({0, 1, . . . ,m0}).19 Nach Konstruktion von m0 sind I und
{0, 1, . . . , n0} disjunkt20. Es folgt mit (2.33)
|∑j∈I
aj| ≤∑j∈I
|aj| ≤N∑
j=n0+1
|aj| ≤ ε.
Dies ergibt∣∣∣∣∣∞∑j=0
aj −∞∑`=0
af(`)
∣∣∣∣∣ ≤∣∣∣∣∣∞∑j=0
aj −N∑j=0
aj
∣∣∣∣∣︸ ︷︷ ︸≤ε
+
∣∣∣∣∣N∑j=0
aj −m0∑`=0
af(`)
∣∣∣∣∣︸ ︷︷ ︸≤ε
+
∣∣∣∣∣m0∑`=0
af(`) −∞∑`=0
af(`)
∣∣∣∣∣︸ ︷︷ ︸≤ε
≤ 3ε
19An dieser Stelle gab es in der Vorlesung gegen Vorlesungsende eine Frage: es stimmt so wie es an
der Tafel stand und so wie hier im Skript.20Denn sei j ∈ I. Dann folgt j /∈ f#({0, 1, . . . ,m0}) und somit f−1(j) > m0 und mit der Definition
von m0 erhalten wir dann, j /∈ {0, 1, . . . , n0}.
166 3. FOLGEN UND REIHEN
Da diese Aussage fur alle ε ∈ R>0 gilt, sind die Grenzwerte gleich.Fr 21.12.
Beweis von Satz 2.30. Wir beweisen (1) im Fall α ∈ R. Die anderen Falle und Ausage
(2) beweist man ahnlich, wir geben hierfur aus Zeitgrunden aber keine Details.
Zu (1) fur α ∈ R: Sei∑∞
n=0 an eine konvergente Reihe, die nicht absolut konvergiert. Wir
definieren
I+ := {n ∈ N | an ≥ 0} und I− := {n ∈ N | an < 0}.
Die Mengen I+ oder I− sind unendlich. (Denn: Wenn eine endlich ware, dann ware die
Reihe absolut konvergent; Widerspruch.)
Somit existieren streng monoton wachsende Abbildungen f± : N → N, mit B(f±) = I±.
Wdh: B(f+) ist das Bild von f+.
Wir setzen nun bn := af+(n), cn := af−(n).∑∞n=0 bn ist die Teilreihe der nicht-negativen Glieder, und
∑∞n=0 cn die Teilreihe der nega-
tiven Glieder. Fur jede dieser Teilreihen gilt
beschrankt⇐⇒ konvergent⇐⇒ absolut konvergent.
Wenn genau eine dieser beiden Teilreihen nicht beschrankt ist, dann ist∑∞
n=0 an nicht
beschrankt, also nicht konvergent. Widerspruch.
Wenn beide Teilreihen beschrankt sind, dann ist∑∞
n=0 an absolut konvergent. Wider-
spruch.
Also sind beide Teilreihen unbeschrankt.
lim`→∞
∑n=0
bn =∞ lim`→∞
∑n=0
cn = −∞.
2. REIHEN 167
Nach Proposition 2.8 ist (an)n∈N eine Nullfolge, deswegen auch (bn)n∈N und (cn)n∈N, somit
auch deren Teilfolgen (brj)j∈N und (csj)j∈N. Ohne Beschrankung der Allgemeinheit konnen
wir annehmen, dass (cn)n∈N monoton wachsend ist. (Wenn nicht, dann konnen wir dies
durch Umordnen erreichen; jede R<0-wertige Nullfolge kann in eine monoton wachsen-
de umgeordnet werden.) Analog konnen wir annehmen, dass die Teilfolge der positiven
Summanden in (bn)n∈N monoton fallend ist.21
Bestimme nun zuerst das kleinste r1 ∈ N mit
b0 + b1 + b2 + · · ·+ br1 ≥ α.
Bestimme dann das kleinste s1 ∈ N mit
b0 + b1 + · · ·+ br1 + c0 + c1 + c2 · · ·+ cs1 < α.
Dann gilt b0 + b1 + · · ·+ br1 + c0 + c1 + c2 · · ·+ cs1−1 ≥ α. 22 Hieraus folgt |α− (b0 + b1 +
· · ·+ cs1)| ≤ |cs1|
Bestimme nun das kleinste r2 ∈ N>r1 mit
b0 + b1 + · · ·+ br1 + c0 + c1 · · ·+ cs1 + br1+1 + br1+2 + · · ·+ br2 ≥ α.
21Subtilitat: Wir konnen dies nicht fur die gesamte Folge erreichen: denn die Nullen machen Pro-
bleme. Da (bn)n∈N unbeschrankt ist, muss es unendlich viele positive bn geben. Jede monoton fallende
Nullfolge, die eine Null als Folgenglied hat, hat aber nur endlich viele positive Folgenglieder. Man lasst
also die Folgenglieder, die Null sind einfach an ihrer Position stehen. Diese Folgenglieder haben sowieso
auf die Partialsumme keine Wirkung. Didaktische Anmerkung: die Nullen sind also zum einen ziemlich
unerheblich fur das Verstandnis des Beweises, aber ein bisschen lastig fur die Ausformulierung, da sie
Spezialfalle erzeugen; deswegen habe ich die Diskussion in der Vorlesung nicht im Detail diskutiert.
22Im Fall s1 = 0 ist dies zu lesen als b0 + b1 + b2 + · · ·+ br1 ≥ α.
168 3. FOLGEN UND REIHEN
Wir erhalten |α − (b0 + b1 + · · · + br2)| ≤ br2 .23 Wir machen so weiter24 und erhalten
letztendlich eine Reihe
∞∑n=0
dn := b0 + b1 + · · ·+ br1 + c0 · · ·+ cs1 + br1+1 + · · ·+ br2 + cs1+1 + · · ·+ cs2 + · · · .
Fur j ∈ N und ` ≥ rj + sj + 1 gilt also
α + csj ≤∑n=0
dn ≤ α + bsj .
Deswegen gilt
α = limj→∞
(α + csj) = lim`→∞
∑n=0
dn︸ ︷︷ ︸∞∑n=0
dn
= limj→∞
(α + bsj).
Es gibt nun viele Variationen des Umordnungssatzes. Eine davon liegt der nun folgenden
Multiplikation von Reihen zu Grunde. Wenn man diese (verallgemeinerten) Umordnun-
gen systematischer verstehen will, sollte man sich mit summierbaren Familien und dem
Großen Umordnungssatz (z. B. [22, Abschnitt 6.3]) beschaftigen. Wir uberspringen aber
aus Zeitgrunden diesen Aspekt und konzentrieren uns auf die fur uns wichtige Multipli-
kation.
Multiplikation von Reihen.
23Insbesondere gilt dann br2 > 0.24Genau genommen werden nun alle rj und sj rekursiv definiert und alle Aussagen dann rekursiv
gezeigt
2. REIHEN 169
Definition 2.34. Seien∑∞
n=0 an und∑∞
n=0 bn Reihen in R oder in C. Wenn N→ N×N,
n 7→ (kn, `n) bijektiv ist, so nennen wir die Reihe∑∞
n=0 aknb`n eine Produktreihe von∑∞n=0 an und
∑∞n=0 bn.
Beispiele 2.35.
(a) Eine Anordnung nach Quadraten
(b) Eine Anordnung nach Diagonalen
SATZ 2.36 (Produktreihen). Sind∑∞
n=0 an und∑∞
n=0 bn absolut konvergent, so ist jede
Produktreihe von∑∞
n=0 an und∑∞
n=0 bn absolut konvergent und hat den Grenzwert(∞∑n=0
an
) (∞∑n=0
bn
).
Beweis.
1.) pn := aknb`n , rn := max{k0, k1, . . . , kn}, tn := max{`0, `1, . . . , `n} Dann gilt fur alle
n ∈ N
|p0|+ |p1|+ · · ·+ |pn| ≤
(rn∑j=0
|aj|
)(tn∑j=0
|bj|
)
≤
(∞∑j=0
|aj|
)(∞∑j=0
|bj|
)Somit sind die Partialsummen der Reihe
∑∞n=0 |pn| beschrankt, sie bilden also eine be-
schrankte monoton wachsende Folge, die somit konvergiert.
Wir haben somit gesehen, dass alle Produktreihen absolut konvergieren.
2.) Wir betrachten nun zunachst den Spezialfall, dass die Produktreihe nach Quadraten
geordnet ist.
170 3. FOLGEN UND REIHEN
Dann erhalten wir
p0 + p1 + · · ·+ pn2−1 =
(n−1∑j=0
aj
)︸ ︷︷ ︸→
∑∞j=0 aj
(n−1∑j=0
bj
)︸ ︷︷ ︸→
∑∞j=0 bj
.
Wir haben somit eine Teilfolge der Partialsummen, die gegen(∞∑n=0
an
) (∞∑n=0
bn
)konvergiert. Da die Folge der Partialsummen konvergiert, konvergiert sie ebenfalls gegen
diese Zahl. Die Aussage fur diese spezielle Anordnung ist somit gezeigt.
3.) Durch eine Umordnung im Sinne von Definition 2.28 kann man jede Produktreihe in ei-
ne nach Quadraten angeordnete Produktreihe umformen. Deswegen ist jede Produktreihe
absolut konvergent.
Aus der Anordnung nach Diagonalen ergibt sich durch Klammersetzen25 das folgende:
KOROLLAR 2.37 (Satz vom Cauchy-Produkt). Sind∑∞
n=0 an und∑∞
n=0 bn absolut kon-
vergent, und setzen wir
cn :=n∑k=0
akbn−k,
dann ist auch∑∞
n=0 cn absolut konvergent und
∞∑n=0
cn =
(∞∑n=0
an
) (∞∑n=0
bn
).
Anwendung auf Potenzreihen:
25dies ist erlaubt, vergleiche Eigenschaften 2.9 (b)
3. EINIGE DURCH REIHEN DEFINIERTE FUNKTIONEN 171
Seien∑∞
n=0 anzn und
∑∞n=0 bnz
n, Potenzreihen an, bn ∈ C mit Konvergenzradien ρa und
ρb. Sei z ∈ C gegeben mit |z| < min{ρa, ρb}. Wieder cn :=∑n
k=0 akbn−k. Dann ist |z| auch
kleiner als der Konvergenzradius von∑∞
n=0 cnxn, denn wenn
∑∞n=0 an|z|n und
∑∞n=0 bn|z|n
konvergieren, dann konvergiert nach dem Satz vom Cauchy-Produkt (Korollar 2.37) auch∑∞n=0 cn|z|n.
(a0 + a1z + a2z2 + · · · )(b0 + b1z + b2z
2 + · · · )
= (a0b0)︸ ︷︷ ︸c0
+ (a0b1 + a1b0)︸ ︷︷ ︸c1
z + (a0b2 + a1b1 + a2b0)︸ ︷︷ ︸c2
z2 + · · ·
Anschaulich: Man darf hier nach Potenzen in z ordnen. Alle Grenzwerte existieren und
es gilt Gleichheit.
3. Einige durch Reihen definierte Funktionen
Sei z ∈ C. Potenzreihen definieren mehrere wichtige Funktionen:
3.1. Exponentialfunktion.
exp z :=∞∑n=0
1
n!zn.
Diese Reihe nennt man die Exponentialreihe.
Wir bestimmen den Konvergenzradius: Wir wenden hierzu das Quotienten-Kriterium an
∣∣∣∣an+1zn+1
anzn
∣∣∣∣ =|z|n+ 1
172 3. FOLGEN UND REIHEN
lim supn→∞
∣∣∣∣an+1
an
∣∣∣∣ = limn→∞
|z|n+ 1
= 0 < 1
Die Exponentialreihe konvergiert also absolut fur alle z ∈ C. Wir sagen sie konvergiert
(absolut) auf C. 26 Der Konvergenzradius muss dann ρ =∞ sein, denn angenommen wir
hatten ρ < ∞, dann wurde die Reihe fur z := ρ + 1 divergieren, was einen Widerspruch
ergibt.
Wir erhalten eine Funktion27 exp : C −→ C, z 7→ exp(z), die komplexe Exponentialfunk-
tion.
Ist z ∈ R, so ist auch exp(z) ∈ R. Wir erhalten somit eine Funktion exp : R −→ R,
x 7→ expx, die reelle Exponentialfunktion. 28
PROPOSITION 3.1 (Funktionalgleichung der Exponentialfunktion). Fur alle x,w ∈ C
gilt
exp(z + w) = exp z · expw
26Das Wort absolut wird hier normalerweise weggelassen, denn fur jede Potenzreihe gilt: wenn sie in
allen Punkten z ∈ C konvergiert, so ist der Konvergenzradius ∞ und deswegen konvergiert sie in allen
z ∈ C sogar absolut.27Wie gesagt: wir nutzen den Begriff
”Funktion“ gleichbedeutend zum Begriff
”Abbildung“, allerdings
ist es ublich, dass Funktionen den Zielbereich R oder C haben.28Die Relation, die der reellen Exponentialfunktion unterliegt, erhalt man durch Restriktion der
Relation, die der komplexen Exponentialfunktion unterliegt. Es handelt sich also um zwei verschiedene
Relationen, die gemaß unseren Definitionen im ersten Kapitel auch verschiedene Symbole haben sollte.
Wir benutzen aber dennoch dasselbe Symbol exp, da dies so ublich ist und in der Praxis nur selten zu
Missverstandnissen fuhrt.
3. EINIGE DURCH REIHEN DEFINIERTE FUNKTIONEN 173
Beweis. Wir rechnen:
1
n!(z + w)n =
1
n!
n∑k=0
nk
zkwn−k =n∑k=0
1
k! (n− k)!zkwn−k =
n∑k=0
1
k!zk
1
(n− k)!wn−k
Wende den Satz vom Cauchy-Produkt an fur
an :=1
n!zn und bn :=
1
n!wn und cn :=
1
n!(z + w)n.
Mi 9.1.
Spezialfall: exp(0) :=∑∞
n=0 = 00 + 01 + 02 + . . . = 1
Man definiert immer 00 := 1.
Also exp 0 = 1.
Es folgt dann auch
1 = exp 0 = exp(z − z) = (exp z)(exp(−z)).
Also
exp(−z) =1
exp z.
Es gilt (Ubung) limn→∞(1 + z
n
)n= ez.
Klammer-”Regel“ fur exp und die demnachst definierten Funktionen sin und
cos.
Man lasst bei exp und anderen wichtigen Funktionen die sonst bei Funktionen ublichen
Klammern weg. Man schreibt also exp z und nicht exp(z). Nun stellt sich die Frage, ob
174 3. FOLGEN UND REIHEN
bei Ausdrucken in der Art exp ab und exp a + b zuerst exp ausgefuhrt wird oder zuerst
verknupft wird.
Ein Blick in die Literatur ergibt leider: das ist nicht ganz so klar geregelt, man nutzt hier
eine bunte Mischung spezieller Konventionen. Im allgemeinen reiht man – wenn keine
Klammern stehen – aber wie folgt, wobei die oben stehenden Operationen zuerst aus-
gefuhrt werden:
(1) Potenzen,
(2) Produkte, Vorzeichen, Quotienten29
(3) exp, sin, cos,
(4) Addition und Subtraktion
Oft wird jedoch (3) vor (2) oder hinter (4) ausgefuhrt. Also lieber großzugig Klammern
setzen!
exp it = exp(it)
cos 2a = cos(2a)
cos−α/2 = cos(−α/2)
exp a+ b = (exp a) + b meistens! Besser also Klammern setzen.
sin a sin b =? Nach den obigen Regeln hatten wir dann sin(a(sin b)). Das interpretiert aber
niemand so. Solch ein Ausdruck wird immer als (sin a)(sin b) interpretiert.
Besser treffend ware also
(1) Potenzen,
29Quotienten werden oft als Bruch geschrieben, dann ist die Reihenfolge zumeist klar
3. EINIGE DURCH REIHEN DEFINIERTE FUNKTIONEN 175
(2) Produkte mit kurzen Faktoren, Vorzeichen, Quotienten
(3) exp, sin, cos,
(4) Produkte mit langen Faktoren
(5) Addition
Nur: was ist lang und was ist kurz? Ab wann wird exp abcdefghijklm · · · lang?
Die Verwirrung wird noch schlimmer: Da man ja fur Funktionen f : M −→ M immer
definiert
f 2(x) := f(f(x))
wurde dann sin2 a als sin(sin(a)) zu lesen sein. Das macht aber auch niemand. Solch ein
Ausdruck wird immer als (sin a)2 interpretiert.
Um das Durcheinander zu beseitigen, wurde nur eine von der Kultusminister-Konferenz
eingesetzte Experten-Kommission helfen, die sich zuerst mit europaischen Instanzen zu-
sammenschließt und nach reiflicher, mehrjahriger Diskussion eine DIN-Norm erlasst.30
Das ware Burokratismus pur. Und selbst, wenn die DIN erlassen ware, ginge es dieser Re-
form vielleicht nicht anders als mit der letzten Rechtschreibreform: manche Bundeslander
wurden sie einfuhren, andere ablehnen. Etc. Oder es gibt sie und niemand kennt sie. 31
Und den meisten Mathematiker sind solche Diskussionen sowieso lastig.
Also: da leben wir lieber mit weniger Ordnungen und setzen ein paar Klammern mehr.
3.2. Sinus- und Kosinus-Funktion. Sei wieder i die komplexe Zahl mit i2 = −1.
30Gibt es vielleicht sogar?
31Vielleicht ist es sogar so?
176 3. FOLGEN UND REIHEN
Betrachte nun
exp iz =∞∑n=0
1
n!(iz)n =
∞∑n=0
n gerade
1
n!(iz)n +
∞∑n=0
n ungerade
1
n!(iz)n
32
Wir definieren den Kosinus
cos z :=∞∑n=0
n gerade
1
n!(iz)n =
∞∑k=0
1
(2k)!(iz)2k =
∞∑k=0
1
(2k)!(−1)kz2k = 1− 1
2z2 +
1
24z4 − · · ·
Was ist der Konvergenzradius dieser Reihe?
n gerade: | 1n!
(iz)n| ≤ 1n!|z|n
n ungerade: 0 ≤ 1n!|z|n
Nach dem Majoranten-Kriterium und der Konvergenz der Exponentialfunktion, konver-
giert die Kosinusreihe auf ganz C. Der Konvergenzradius ist also ∞.
Wir definieren den Sinus
sin z :=1
i
∞∑n=0
n ungerade
1
n!(iz)n =
1
i
∞∑k=0
1
(2k + 1)!(iz)2k+1
=∞∑k=0
1
(2k + 1)!(−1)kz2k+1 = z − 1
6z3 +
1
120z5 − · · ·
Der Konvergenzradius ist ebenfalls ∞.
32Hier handelt es sich rechts um zwei Reihen, wo eigentlich an den ungeraden bzw. geraden Stellen n
eine Null steht. Nullen in einer Reihen haben keinen Einfluss auf den Grenzwert einer Reihe, sie konnen
beliebig hinzugefugt oder gestrichen werden. Mit dieser Interpretation ist die letzte Gleichung eine Folge
von∑n=0(an + bn) =
∑n=0 an +
∑n=0 bn
3. EINIGE DURCH REIHEN DEFINIERTE FUNKTIONEN 177
exp iz = cos z + i sin z
cos(−z) = cos z
sin(−z) = − sin z
exp iz + exp(−iz)
2=
cos z + i sin z + cos z − i sin z
2= cos z
exp iz − exp(−iz)
2i= sin z
Ist x reell, dann sind auch cosx und sin x reell. Dann gilt also
cosx = Re exp ix sinx = Im exp ix.
Man uberlegt sich auch leicht, dass fur jede Reihe in C gilt
∞∑n=0
an =∞∑n=0
an, Re∞∑n=0
an =∞∑n=0
Re an, Im∞∑n=0
an =∞∑n=0
Im an .
Somit gilt fur x ∈ R:
| exp(ix)|2 = exp ix exp ix = exp ix exp(−ix) = (exp ix) (exp ix)−1 = 1
exp ix exp(−ix) = (cosx+ i sinx) · (cosx− i sinx) = (cos x)2 + (sinx)2
Also | exp(ix)|2 = cos2 x+ sin2 x = 1.
178 3. FOLGEN UND REIHEN
Hier nutzen wir die Schreibwweisen sin2 x := (sinx)2 und cos2 := (cosx)2.
PROPOSITION 3.2 (Additionstheoreme). Fur alle a, b ∈ C gilt
cos(a+ b) = cos a cos b− sin a sin b,
sin(a+ b) = sin a cos b+ cos a sin b.
Wir geben zunachst einen Beweis fur a, b ∈ R und dann einen fur a, b ∈ C. Der erste
Beweis ist also aus Sichtweise des logischen Aufbaus der Vorlesung unnotig. Allerdings
ist der erste Beweis viel besser zu merken und die Additionstheoreme sind vor allem fur
reelle a und b wichtig. Deswegen ist der erste fur unser Verstandnis der wichtigere.
Beweis fur reelle a und b.
cos(a+ b) = Re exp i(a+ b) = Re ((exp ia)(exp ib))
= Re((cos a+ i sin a)(cos b+ i sin b)
)= cos a cos b− sin a sin b
sin(a+ b) = Im exp i(a+ b) = Im ((exp ia)(exp ib))
= Im((cos a+ i sin a)(cos b+ i sin b)
)= cos a sin b+ sin a cos b
Beweis fur alle a und b.
cos(a+ b) =exp i(a+ b) + exp(−i(a+ b))
2=
exp ia exp ib+ exp(−ia) exp(−ib)2
cos a cos b =exp ia exp ib+ exp ia exp(−ib) + exp(−ia) exp ib+ exp(−ia) exp(−ib)
4
3. EINIGE DURCH REIHEN DEFINIERTE FUNKTIONEN 179
sin a sin b =exp ia exp ib− exp ia exp(−ib)− exp(−ia) exp ib+ exp(−ia) exp(−ib)
−4
Dies ergibt die Formel fur cos(a + b). Der Beweis der Formel fur sin(a + b) geht vollig
analog.
33
3.3. Eulersche Zahl. Die Eulersche Zahl ist
e := exp(1) =∞∑n=0
1
n!> 1 + 1 +
1
2+
1
6= 2, 6666 . . .
Numerisch34: e = 2, 718 281 828 459 045 235 360 287 471 352 662 497 757 247 . . .
Wdh: Fur t ∈ R>0, n ∈ N, m ∈ Nr {0} ist definiert:
tn: rekursiv
m√t: durch Lemma 6.10 in Kapitel 2.
tn/m := m√tn.
t−n/m := 1tn/m
:
33Wir hatten gerne naturlich noch ganz andere Eigenschaften: zum Beispiel, dass sin und cos die
ublichen geometrischen Eigenschaften haben, und dass sie periodisch sind, genauer dass cos(z+2π) = cos z
und sin(z+ 2π) = sin z. Das konnen wir aber noch nicht sagen, denn wir mussen ja erst mal π definieren.
Man definiert π/2 als die erste positive Nullstelle von sin, aber wir konnen leider noch gar nicht zeigen,
dass die oben definierte Funktion uberhaupt eine positive Nullstelle beseitzt.34Dieser Wert ist hier nicht vollstandig angegeben, kann auch nicht vollstandig als Dezimalzahl an-
gegeben werden. Wir wollen hier nicht begrunden, wieso dies die ersten Stellen der Eulerschen Zahl
sind. Wir werden diesen Naherungswert im folgenden nie benotigen. Der Naherungswert dient allein der
Anschauung und dem Vergleich zu anderer Literatur und anderen Konstanten!
180 3. FOLGEN UND REIHEN
LEMMA 3.3. Fur alle q ∈ Q gilt
eq = exp(q)
Beweis. Durch Induktion zeigt man zunachst fur alle n ∈ N und alle z ∈ C: exp(nz) =
(exp z)n. Angewendet auf z := 1 ergibt dies exp(n) = exp(n·1) = en > 0. Fur m ∈ Nr{0}
gilt dann
exp(n/m) :=∞∑j=0
1
j!
( nm
)j> 0.
Nun setzen wir z := n/m in exp(nz) = exp(z)n und erhalten
(expn/m)m = exp(mn/m) = en.
Somit ist x := exp(n/m) eine positive reelle Zahl, die xm = en erfullt. Also x = en/m.
Wir haben somit die Aussage fur alle q ∈ Q>0 gezeigt. Die Aussage ist trivial fur q = 0
und folgt direkt aus der Funktionalgleichung der Exponentialfunktion (Proposition 3.1)
fur q ∈ Q<0.
Definition 3.4. Fur z ∈ C definieren wir ez := exp(z).
Funktionalgleichung: ez+w = ez · ew
Bemerkung 3.5. Die Eulersche Zahl ist irrational. Sie ist sogar transzendent, d.h. ist
p(x) = adxd+ · · ·+a0x
0, p 6≡ 0, 35 eine polynomiale Funktion mit rationalen Koeffizienten,
dann gilt p(e) 6= 0. (Ohne Beweis)
35Fur eine Funktion f : M → R bedeutet f ≡ 0, dass fur alle x ∈ M gilt f(x) = 0. Oben gilt dann
also
p 6≡ 0 ⇐⇒ ¬(p ≡ 0) ⇐⇒ ¬(ad = ad−1 = · · · = a0 = 0)
.
3. EINIGE DURCH REIHEN DEFINIERTE FUNKTIONEN 181
3.4. Exponentialfunktion (Fortsetzung). In diesem Abschnitt studieren wir die
reelle Exponentialfunktion exp : R −→ R.
SATZ 3.6.
(a) ∀r ∈ R : exp r > 0, also exp#(R) ⊂ R>0.
(b) Die reelle Exponentialfunktion exp : R −→ R ist streng monoton wachsend.
(c) Sie wachst schneller als jede polynomiale Funktion im folgenden Sinn: Fur jede poly-
nomiale Funktion p(x) = adxd + · · ·+ a0x
0, gilt:
∀ε ∈ R>0 : ∃x0 ∈ R : ∀x ∈ R≥x0 :
∣∣∣∣ p(x)
exp(x)
∣∣∣∣ ≤ ε
Insbesondere: ist (ak)k∈N eine Folge, die uneigentlich gegen ∞ konvergiert, dann ist(p(ak)
exp(ak)
)k∈N
eine Nullfolge.
Beweis.
Zu (a): bereits gezeigt.
Zu (b): Es gelte x, y ∈ R, x < y.
exp y
expx= exp(y − x) = 1 +
∞∑n=1
1
n!(y − x)n︸ ︷︷ ︸
>0
> 1.
Zu (c): Sei ε ∈ R>0 gegeben. Wir setzen
x0 :=max{1! |a0|, 2! |a1|, . . . , (d+ 1)! |ad|}
ε> 0.
Somit haben wir fur ∀x ∈ R≥x0∣∣a`x`∣∣ ≤ ε
(`+ 1)!|x0| · |x`| ≤
ε
(`+ 1)!x`+1,
182 3. FOLGEN UND REIHEN
|p(x)| = |adxd + · · ·+ a0x0| ≤ ε
d+1∑n=1
1
n!xn < ε exp(x).
KOROLLAR 3.7. Konvergiert (ak)k∈N uneigentlich gegen∞, dann konvergiert exp(−ak)→
0 und exp(ak)→∞.
Frage 3.8. Ist exp(R) = R>0?
Es erscheint uns, dass die Antwort ja sein sollte, obwohl wir es noch nicht zeigen konnen.
Die Frage ist auch wichtig, weil wir gerne den (naturlichen) Logarithmus als Umkehr-
funktion der reellen Exponentialfunktion definieren wollen, und der Logarithmus sollte
auf allen positiven reellen Zahlen definiert sein.
Beispiel 3.9. Betrachte die Funktion f : R −→ R
f(x) :=
expx x ≤ 0
1 + exp x x > 0
Die Funktion f : R→ R aus Beispiel 3.9
Diese Funktion erfullt alle Eigenschaften in Satz 3.6 und Korollar 3.7. Aber f#(R) =
(0; 1] ∪ (2;∞) 6= R>0.
Anschaulich: Da exp : R −→ R keine”Sprunge macht“, sollte jeder Wert zwischen 0 und
∞ von der Funktion einmal angenommen werden.
Uns fehlt also ein wichtiges Hilfsmittel. Wir wollen deswegen im folgenden Kapitel klaren,
was es bedeutet, dass eine Funktion”keine Sprunge macht“. Dies fuhrt zum Begriff
”Ste-
tigkeit“.
KAPITEL 4
Stetigkeit und Grenzwerte von FunktionenFr 11.1.
1. Stetigkeit
Notationswiederholung f#(D) = {f(x) | x ∈ D}, siehe (7.25).
Im folgenden sei: D ⊂ C, x0 ∈ D, f : D −→ C.
Stellen Sie sich am besten zunachst den Speziallfall D ⊂ R vor und nehmen Sie zunachst
f#(D) ⊂ R an. Wenn Sie diesen Fall richtig verstanden haben, betrachten Sie den Fall
D ⊂ C. In spateren Semestern werden wir aber noch wesentlich allgemeinere Definitions-
bereiche D benotigen, zum Beispiel 4-dimensionale gekrummte Raumzeiten, unendlich-
dimensionale Vektorraume oder”topologische Raume“ und wir wollen die jetzt gemachten
Definitionen moglichst so wahlen, dass sich alles auf diesen allgemeineren Kontext verall-
gemeinert.
Frage 1.1. Sind Funktionen mit dem Grenzwert von Folgen vertraglich?
Es gelte an → x0. Folgt dann f(an)→ f(x0)?
183
184 4. STETIGKEIT UND GRENZWERTE VON FUNKTIONEN
Definition 1.2. Eine Funktion f : D −→ C heißt folgenstetig in x0, falls gilt: 1
Ist (an)n∈N eine beliebige Folge in D mit limn→∞
an = x0,
dann folgt limn→∞
f(an) = f(x0).
(1.3)
Eine Funktion f : D −→ C heißt folgenstetig, falls sie in allen x0 ∈ D folgenstetig ist.
Beispiele 1.4.
(a) Konstante Funktionen folgenstetig. Die Identitaten idR : R → R und idC : C → C
sind folgenstetig.
(b) Ist f : D → C folgenstetig in x0 und x0 ∈ D ⊂ D, dann ist auch f |D : D −→ C in x0
folgenstetig. 2
(c) Die Heaviside-Funktion Θ1 : R→ R
Θ1(x) :=
0 x ≤ 0
1 x > 0
ist nicht folgenstetig in 0. Denn die Folge (1/n)n∈Nr{0} konvergiert gegen 0, aber
Θ1(1/n) = 1 konvergiert nicht gegen Θ1(0) = 0.
Funktionsgraph der Heaviside-Funktion Θ1
1Damit es keine Missverstandnisse gibt, wie (1.3) zu verstehen ist, wollen wir noch eine logisch
prazisere Formulierung von (1.3) geben, in der der Allquantor deutlich wird. Es ist: Fur allle Folgen
(an)n∈N in D gilt:
limn→∞
an = x0 =⇒ limn→∞
f(an) = f(x0).
2Denn: Wenn man D verkleinert, muss man weniger Folgen uberprufen.
1. STETIGKEIT 185
Anderseits ist Θ1 in allen anderen x0 folgenstetig. Denn ist zum Beispiel x0 > 0, und
gilt an → x0, dann folgt fur fast alle n ∈ N: an > 0, also Θ1(an) = 1, und somit
Θ1(an)→ Θ1(x0) = 1. Der Fall x0 < 0 ist analog.
(d) Ist p : C −→ C, x 7→∑d
k=0 bkxk eine polynomiale Funktion, so ist p in jedem x0 ∈ R
folgenstetig. Es gelte limn→∞ an = x0. Dann
limn→∞
p(an) =d∑
k=0
limn→∞
bk(an)k =d∑
k=0
bk( limn→∞
an)k = p(x0).
Dies folgt direkt aus Proposition 1.10 in Kapitel 3.
(e) Realteil Re : C→ C, Imaginarteil Im : C→ C und Konjugation C→ C, z 7→ z sind
folgenstetig.
(f) Die Funktion f aus Beispiel 3.9 in Kapitel 3 ist in 0 nicht folgenstetig. Denn fur
an := 1n
gilt: f(an) > 2, f(0) = f(lim an) = 1; deswegen kann f(an) nicht gegen
f(lim an) konvergieren. 3
Definition 1.5.
(a) Eine Funktion f : D −→ C heißt stetig in x0, falls gilt:
(1.6) ∀ε ∈ R>0 : ∃δ ∈ R>0 : ∀x ∈ D : (|x− x0| < δ =⇒ |f(x)− f(x0)| < ε).
(b) f : D −→ C heißt stetig, wenn f in jedem x0 ∈ D stetig ist.
Bild zur Veranschaulichung der Stetigkeit
3Achtung: Diese Aussage ist – so wie sie steht – korrekt. Wir haben noch nicht gezeigt, dass f(an)
konvergiert, denn wir wissen noch nicht, ob die Exponentialfunktion stetig in 0 ist. Wir haben aber im
obigen Satz auch nicht behauptet, dass diese Folge konvergiert!
186 4. STETIGKEIT UND GRENZWERTE VON FUNKTIONEN
LEMMA 1.7. x0 ∈ D ⊂ C, f : D −→ C
f ist folgenstetig in x0 ⇐⇒ f ist stetig in x0.
In anderen Worten: (1.3) ⇐⇒ (1.6).
Beweis.
Zu”=⇒“: Sei f nicht stetig in x0. Dann gilt
∃ε ∈ R>0 : ∀δ ∈ R>0 : ∃x ∈ D : (|x− x0| < δ ∧ |f(x)− f(x0)| ≥ ε).
Wir fixieren solch ein ε ∈ R>0. Fur ein n ∈ N r {0} setzen wir δ := 1/n, und wahlen ein
an ∈ D mit
|an − x0| < 1/n und |f(an)− f(x0)| ≥ ε.
Dann konvergiert (an)n∈Nr{0} gegen x0, aber (f(an))n∈Nr{0} konvergiert nicht gegen f(x0).
Zu”⇐=“: Sei f stetig in x0, und (an) sei eine Folge in D, die gegen x0 konvergiert.
Zu zeigen ist: f(an)→ f(x0), d.h.: 4
(1.8) ∀ε ∈ R>0 : ∃n0 ∈ N : ∀n ∈ N≥n0 : |f(an)− f(x0)| < ε
Wir fixieren also ein ε ∈ R>0. Wir wahlen ein dazu passendes δ ∈ R>0 wie in (1.6), d.h.
es gilt:
(1.9) ∀x ∈ D : (|x− x0| < δ =⇒ |f(x)− f(x0)| < ε).
4Bisher hatten wir in der Definition von Konvergenz von Folgen ≤ ε. Es ist aber klar, dass man hier
auch < ε schreiben kann.
1. STETIGKEIT 187
Wegen an → x0 gibt es ein n0 ∈ N mit
(1.10) ∀n ∈ N≥n0 : |an − x0| < δ
Die Aussagen (1.9) und (1.10) zusammen ergeben
(1.11) ∀n ∈ N≥n0 : |f(an)− f(x0)| < ε
Insgesamt haben wir nun (1.8) verifiziert.
Sprachgebrauch: Wir nennen (1.3) das Folgen-Kriterium fur Stetigkeit und (1.6) das ε-δ-
Kriterium fur Stetigkeit.
LEMMA 1.12. Seien f, g : D −→ C in x0 stetige Funktionen, a, b ∈ C. Dann sind auch
die folgenden Funktionen D −→ C stetig in x0:
(a · f + b · g)(x) := a · f(x) + b · g(x)
(f · g)(x) := f(x) · g(x)
Gilt außerdem 0 6∈ g#(D), dann ist auch(f
g
)(x) :=
f(x)
g(x)
stetig in x0.
Aus Proposition 1.10 in Kapitel 3 folgt obiges Lemma mit dem Folgenkriterium fur Ste-
tigkeit.
LEMMA 1.13. Sei f : D −→ C stetig in x0 ∈ D und sei g : D −→ C stetig in y0 ∈ D. Es
gelte f(x0) = y0 und B(f) = f#(D) ⊂ D. Dann ist g ◦ f : D −→ C ebenfalls stetig in x0.
188 4. STETIGKEIT UND GRENZWERTE VON FUNKTIONEN
Beweis. Wir uberprufen das Folgenkriterium. Es gelte fur n → ∞: an → x0. Aus den
Voraussetzungen folgt zunachst f(an) → f(x0) = y0 und daraus dann g(f(an)) → g(y0),
also (g ◦ f)(an)→ (g ◦ f)(x0). Somit ist g ◦ f folgenstetig in x0.
Beispiel 1.14. Sei K = C oder K = R. Dann ist die Betragsfunktion
| · | : K → R, z 7→ |z|
stetig.
Begrundung: Wir zeigen die Stetigkeit in x0 ∈ K. Fur ε ∈ R>0 wahle δ := ε. Zu zeigen ist
|x− x0| < ε =⇒∣∣|x| − |x0|
∣∣ < ε.
Dies folgt direkt aus Lemma 5.11 (g) in Kapitel 2.
UBUNG 1.15 (Ubungsblatt 11, 2. Aufgabe). Sei D ⊂ C, x0 ∈ D und f : D → C eine
Funktion, und sei r ∈ R>0 fixiert. Wir definieren Br(x0) := {z ∈ C | |z − x0| < r}. Zeigen
Sie: f ist stetig in x0 genau dann, wenn f |D∩Br(x0) stetig in x0 ist.
Wir sagen hierzu: Stetigkeit ist eine lokale Eigenschaft.
2. Zwischenwertsatz
In diesem Abschnitt ist der Definitionsbereich D von f eine Teilmenge von R, f : D −→ R.
SATZ 2.1 (Zwischenwertsatz). Sei f : [a, b] −→ R eine stetige Funktion, und sei f(a) ≤
y ≤ f(b) oder f(a) ≥ y ≥ f(b). Dann gibt es ein c ∈ [a, b] mit f(c) = y.
Wir haben dann also
[f(a), f(b)] ⊂ f#([a, b]) oder [f(b), f(a)] ⊂ f#([a, b])
2. ZWISCHENWERTSATZ 189
Bild mit der obigen Funktion f
Beweis. O.B.d.A. f(a) ≤ y ≤ f(b).
Wir definieren rekursiv die Folgen (an) und (bn).
a0 := a, b0 := b.
Seien an−1 und bn−1 definiert. Setze
zn−1 :=an−1 + bn−1
2
Wir definieren dann an und bn wie folgt:
• Im Fall f(zn−1) ≤ y setzen wir an := zn−1 und bn := bn−1.
• Im Fall f(zn−1) > y setzen wir an := an−1 und bn := zn−1.
Die Folge (an) ist monoton wachsend und beschrankt. Also existiert c := limn→∞ an. Da
bn − an = (b− a)/2n → 0 haben wir auch c = limn→∞ bn. Mit der Folgenstetigkeit von f
in c sehen wir:
f(c) = limn→∞
f(an) ≤ y und f(c) = limn→∞
f(bn) ≥ y.Mi 16.1.
Beispiel 2.2. Die Funktion f : [−1, 2]→ R, f(x) = x2 ist stetig. Es gilt
[f(−1), f(2)] = [1, 4] ( [0, 4] = f#([−1, 2]).
Beispiel 2.3. Sei a ∈ R>0 und n ∈ N≥2. Betrachte die stetige Funktion f : R −→ R,
x 7→ xn − a. Es gilt f(0) = −a < 0 und
f(a+ 1) =
n∑j=0
nj
aj
− a ≥ (n− 1)a+ 1 > 0.
190 4. STETIGKEIT UND GRENZWERTE VON FUNKTIONEN
Also besitzt f eine Nullstelle im Intervall [0, a + 1]. Dies ist ein alternativer Beweis der
Existenz von n√a.
KOROLLAR 2.4. Sei I ⊂ R ein Intervall und f : I −→ R stetig. Dann ist f#(I) ebenfalls
ein Intervall.
Beachte: Intervalle konnen hier offen, halboffen oder abgeschlossen sein! Sie konnen be-
schrankt oder unbeschrankt sein!
Voruberlegung: Eine Teilmenge J von R ist genau dann ein Intervall, wenn gilt:
∀u, v ∈ J : u ≤ v =⇒ [u, v] ⊂ J
Beweis. Seien u, v ∈ f#(I). Wir schreiben u = f(a), v = f(b), a, b ∈ I. O.B.d.A. a ≤ b.
Nach dem Zwischenwertsatz gilt
[u, v] = [f(a), f(b)] ⊂ f#([a, b]) ⊂ f#(I).
Also ist f#(I) ein Intervall.
Beispiel 2.5. Die Funktion f : (−1, 2] → R, f(x) = x2 ist stetig. f#((−1, 2]) = [0, 4].
Die Bilder halboffener Intervalle konnen also abgeschlossen sein.
Beispiel 2.6. f : (−1, 1) −→ R x 7→ x2. Dann ist f#((−1, 1)) = B(f) = [0, 1). Wir haben
hier ein Intervall erhalten. Das Bild-Intervall ist nicht mehr offen, sondern nur noch halb-
offen. Ahnliche Beispiele zeigen: die Bilder offener Intervalle konnen abgeschlossen sein.
SATZ 2.7. Sei I ⊂ R ein Intervall, und f : I −→ R eine streng monotone, stetige
Funktion, J := f#(I). Dann ist f−1 : J −→ I wohldefiniert und stetig.
2. ZWISCHENWERTSATZ 191
Beweis. Da f : I −→ J eine bijektive Funktion ist, ist die Umkehrfunktion f−1 : J −→ I
wohldefiniert.
Graph einer stetigen streng monotonen Funktion f : I → J
Wir zeigen nun die Stetigkeit von f−1 in einem beliebigen y0 ∈ J . O.B.d.A. sei f streng
monoton wachsend.5 Zu zeigen ist:
∀ε ∈ R>0 : ∃δ ∈ R>0 : ∀y ∈ J : (|y − y0| < δ =⇒ |f−1(y)− f−1(y0)| < ε).
Setze x0 := f−1(y0).
1. Fall: inf J < y0 < sup J . Dies ist aquivalent zu inf I < x0 < sup I. In Worten anschau-
lich: y0 liegt nicht am Rand des Intervalls J .
Sei ε ∈ R>0 gegeben. Setze
ε := min{ε, (x0 − inf I)/2, (sup I − x0)/2} > 0
Dann inf I < x0 − ε < x0 < x0 + ε < sup I. Setze y± := f(x0 ± ε) und δ := min{(y+ −
y0), (y0 − y−)}. Also
y− ≤ y0 − δ < y0 < y0 + δ ≤ y+.
Da f−1 ebenfalls streng monoton wachsend ist, gilt fur alle y ∈ (y0 − δ, y0 + δ):6
x0 − ε ≤ x0 − ε = f−1(y−) ≤ f−1(y0 − δ)
≤ f−1(y) ≤ f−1(y0 + δ) ≤ f−1(y+) = x0 + ε ≤ x0 + ε .
5Dies bedeutet: Wir betrachten nur den Fall, dass f streng monoton wachsend ist. Der Fall, dass f
streng monoton fallend ist, folgt dann durch Vorzeichenwechsel.
6Das heißt: fur alle y ∈ J mit y0 − δ < y < y0 + δ
192 4. STETIGKEIT UND GRENZWERTE VON FUNKTIONEN
Also
|f−1(y)− f−1(y0)| = |f−1(y)− x0| ≤ ε.
2. Fall: inf J = y0 oder sup J = y0. Anschaulich: y0 ist am Rand des Intervalls J .
Geht ganz ahnlich. Man muss dabei nur eine der Seiten weglassen.
Beispiele 2.8. Die folgenden Funktionen sind streng monoton, stetig und surjektiv und
haben deswegen eine stetige Umkehrabbildung:
f : R −→ R, f(x) := x3 + x
f : R −→ R, f(x) = x2n+1, n ∈ N
f : R≥0 −→ R≥0, f(x) = xn, n ∈ Nr {0}
Also sind die Wurzelfunktionen n√
: R≥0 −→ R≥0 und 2n+1√
: R −→ R stetig.
3. Stetigkeit von exp, cos und sin und Definition von log
LEMMA 3.1. Sei∑∞
j=1 aj eine absolut konvergierende Reihe, aj ∈ C. Dann gilt∣∣∣ ∞∑j=1
aj
∣∣∣ ≤ ∞∑j=1
|aj|.
Beweis. ∣∣∣ ∞∑j=1
aj
∣∣∣ Bsp. 1.14= lim
n→∞
∣∣∣ n∑j=1
aj
∣∣∣Dreiecks-
Ungl.
≤ limn→∞
n∑j=1
∣∣aj∣∣ def=
∞∑j=1
∣∣aj∣∣
3. STETIGKEIT VON exp, cos UND sin UND DEFINITION VON log 193
SATZ 3.2. Die komplexe Exponentialfunktion exp : C→ C ist stetig.
Beweis. Wir zeigen zunachst die Stetigkeit in 0. Dazu rechnen wir fur x ∈ C mit |z| ≤ 12:
| exp z − exp 0| = | exp z − 1| =∣∣∣ ∞∑j=1
1
j!zj∣∣∣
Lem. 3.1
≤∞∑j=1
∣∣∣ 1
j!zj∣∣∣ ≤ ∞∑
j=1
∣∣∣zj∣∣∣ =∞∑j=1
|z| |z|j−1
≤ |z|∞∑k=0
|z|k ≤ |z|∞∑k=0
∣∣∣∣12∣∣∣∣k︸ ︷︷ ︸
=2
= 2 |z|.
Fur gegebenes ε ∈ R>0 setze nun δ := min{12, ε
2}. Dann gilt
|z − 0| < δ =⇒ | exp z − exp 0| < ε.
Also ist exp : C→ C in 0 stetig.
Ist f : C→ C in 0 stetig, dann auch af : z 7→ a · f(z) fur a ∈ C. Wir setzen f := exp und
a := exp z0. Somit ist
g : C→ C, z 7→ g(z) := (exp z0) · (exp z) = exp(z + z0)
stetig in 0. Da h : C → C, h(z) := z − z0 stetig ist, folgt mit Lemma 1.13 die Stetigkeit
von g ◦ h in z0. Offensichtlich exp = g ◦ h.
194 4. STETIGKEIT UND GRENZWERTE VON FUNKTIONEN
Es folgt daraus, dass auch die folgenden Funktionen C→ C stetig sind:
z 7→ exp(iz), z 7→ exp(−iz)
z 7→ cos z =exp iz + exp(−iz)
2
z 7→ sin z =exp iz − exp(−iz)
2i
Durch Einschrankung auf R folgt auch, dass exp : R → R, cos : R → R und sin :
R → R stetig sind. Aufgrund des Zwischenwertsatzes ist exp(R) ein Intervall. Wegen
limn→∞ expn =∞ und limn→∞ exp(−n) = 0 folgt exp#(R) = R>0.
KOROLLAR 3.3. Die reelle Exponentialfunktion exp : R −→ R>0 ist streng monoton,
stetig und bijektiv.
Definition 3.4. Die Umkehrfunktion von exp : R −→ R>0 nennt man den (naturlichen)7
Logarithmus log : R>0 −→ R.
Wegen Satz 2.7 des aktuellen Kapitels 4 ist der Logarithmus stetig. Die Funktionalglei-
chung der Exponentialfunktion, siehe Satz 3.1 in Kapitel 3 ubersetzt sich nun in die
Funktionalgleichung der Logarithmusfunktion:
∀r, s ∈ R>0 : log(rs) = log r + log s.
7In der Mathematik wird der naturliche Logarithmus fast immer mit log bezeichnet. In technischen
und vielen alltaglichen Bereichen wird der naturliche Logarithhmus mit dem Symbol ln bezeichnet und
das Symbol log wird dann – anders als in unserer Vorlesung – fur den Zehner-Logarithmus, also den
Logarithmus zur Basis 10 genutzt. Im Mathematik-Studium wird aber nur der naturliche Logarithmus
eine Rolle spielen. Deswegen wird der Zehner-Logarithmus hier weder definiert, noch mit einem Symbol
versehen.
3. STETIGKEIT VON exp, cos UND sin UND DEFINITION VON log 195
log 1 = 0, log e = 1
LEMMA 3.5. Sei r ∈ R>0 und z ∈ C. Es gilt
rz = exp(z log r)
in den folgenden Fallen.
(1) r = e und z ∈ C
(2) r ∈ R>0 und z ∈ Q
Fur alle anderen Kombination von r ∈ R>0 und z ∈ C wurde rz noch gar nicht definiert.8
Beweis.
(1) folgt direkt aus Definition 3.4 in Kapitel 3.
(2) Die Aussage ist klar fur z = 1. Dann folgt (2) ganz analog wie Lemma 3.3 in Kapitel 3.
Definition 3.6. Fur r ∈ R>0 und z ∈ C definiert man nun
rz := exp(z log r)
Auf Grund des obigen Lemmas verallgemeinert dies also bisherige Definitionen von rz in
den beiden obigen Fallen.
rz+w = rzrw (rs)z = rzsz
log rs = log exp(s log r) = s log r
8Wir haben auch schon (−1)3 und (1 + i)−2 definiert, aber es interessieren uns derzeit nur r ∈ R>0.
196 4. STETIGKEIT UND GRENZWERTE VON FUNKTIONEN
fur r, s ∈ R>0, z, w ∈ C. Es gilt auch
(rs)t = rst
fur r ∈ R>0 und s, t ∈ R.
4. Die Kreizahl π und Periodizitat von cos und sin.
cosx =∞∑n=0
(−1)n1
(2n)!x2n︸ ︷︷ ︸
an
Fur x ∈ (0, 2] und n ≥ 1 gilt an > 0 und
an+1
an=
x2
(2n+ 1)(2n+ 2)≤ 1.
Also
cosx = a0 − a1 + (a2 − a3)︸ ︷︷ ︸≥0
+ (a4 − a5)︸ ︷︷ ︸≥0
. . . ≥ a0 − a1 = 1− x2
2
cosx = a0 − a1 + a2 + (−a3 + a4)︸ ︷︷ ︸≤0
+ (−a5 + a6)︸ ︷︷ ︸≤0
. . . ≤ a0 − a1 + a2 = 1− x2
2+x4
24
Also fur x ∈ [0, 2]
1− x2
2≤ cosx ≤ 1− x2
2+ x4
24
Ganz ahnlich fur 0 ≤ x ≤ 4
x− x3
6≤ sinx ≤ x.
4. DIE KREIZAHL π UND PERIODIZITAT VON cos UND sin. 197
cos 0 = 1, cos 2 ≤ 1− 2 +2
3= −1
3< 0.
Aus dem Zwischenwertsatz folgt:
A := {x ∈ [0, 2] | cosx = 0} 6= ∅.
Setze α := inf A. Zu jedem n ∈ N wahle ein xn ∈ A mit xn ≤ α + 1n. Dann gilt xn → α
fur n→∞ und
cosα = cos( limn→∞
xn) = limn→∞
cosxn︸ ︷︷ ︸0
= 0.
π := 2α ∈ [0, 4].
Definition 4.1. Die Kreiszahl π ist definiert als das Doppelte der ersten positiven Null-
stelle der reellen Kosinusfunktion.
π = 3, 14159265...
Es folgt aus den bisher bewiesenen Eigenschaften in Abschnitt 3.2 in Kapitel 3 nun durch
einfache Rechnung:
• sin π/2 = 1, da sin π/2 ≥ π2
(1−
(π2
)2/6)> 0 und sin2 α + cos2 α = 1,
• sin(x+ (π/2)) = cos x, cos(x+ (π/2)) = − sinx, (Additionstheoreme)
• cos(2π + x) = − cos(π + x) = cos x, sin(2π + x) = − sin(π + x) = sinx,
• e2πi = cos 2π + i sin 2π = 1
198 4. STETIGKEIT UND GRENZWERTE VON FUNKTIONEN
Aus
cosx− cos y = cos
(x− y
2+x+ y
2
)− cos
(y − x
2+x+ y
2
)= cos
x− y2
cosx+ y
2− sin
x− y2
sinx+ y
2
− cosy − x
2cos
x+ y
2+ sin
y − x2
sinx+ y
2
= 2 siny − x
2sin
x+ y
2
folgt cosx > cos y fur 0 ≤ x < y ≤ 2.
−2 −1 1 2 3 4 5 6 7
−1
1
x
cos(x) und sin(x)
Abbildung 6: Die Graphen von cos und sinFr 18.1.
5. Metrische Raume und Grundbegriffe der Topologie
Der Begriff der”Stetigkeit“ gehort zum mathematischen Teilgebiet mit dem Namen
”To-
pologie“, so wie der Begriff”lineare Abbildungen“ zum Teilgebiet
”Lineare Algebra“
gehort. Im Laufe Ihres Studiums werden Sie immer wieder von stetigen Abbildungen
horen, und die topologischen Begriffe werden dann immer wichtiger.
Dies betrifft zum einen die Mathematiker unter Ihnen, und zwar sowohl diejenigen die sich
an Reiner Mathematik orientieren (Topologische Raume sind da fast schon omniprasent),
als auch diejenigen, die sich an Angewandter Mathematik orientieren (Beschreibung von
Flachen im Raum, Mannigfaltigkeiten, partielle Differentialgleichung, Modellierung von
5. METRISCHE RAUME UND GRUNDBEGRIFFE DER TOPOLOGIE 199
physikalischen Systemen). Und es trifft auch auf Physiker zu. Zum Beispiel benotigt eine
prazise Formulierung selbst einfacher quantenmechanischer Systeme wie dem Wasserstoff-
Atom solche topologischen Grundbegriffe (Energie-, Orts-, Impulsoperatoren sind”dicht
definierte“”unstetige“
”abgeschlossene“ Operatoren)9 und die zugrundeliegenden Raume
der klassischen Mechanik, der Allgemeinen Relativitatstheorie und der Elektrodynamik
sind Mannigfaltigkeiten und damit mit einer Topologie versehen. Naturlich trifft vieles
davon auch auf Computational Science und Nanoscience zu.
In diesem Abschnitt lernen wir nun einige Grundbegriffe der Topologie kennen: Stetigkeit
in einem etwas allgemeineren Sinn, offene Mengen, abgeschlossene Mengen, Haufungs-
punkte und Umgebungen. Diese Begriffe werden (in noch allgemeinerer Form) Ihnen
haufig im Studium begegnen. Wir wollen aber noch nicht das zentrale Objekt der To-
pologie, namlich”topologische Raume“ einfuhren, sondern uns zunachst auf metrische
Raume spezialisieren.
Definition 5.1. Ein metrischer Raum ist ein Paar (M,d), wobei M eine Menge ist und
d : M×M −→ R≥0 eine Abbildung ist mit folgenden Eigenschaften, die fur alle x, y, z ∈M
gelten sollen:
(a) d(x, y) = 0 ⇐⇒ x = y (Definitheit)
(b) d(x, y) = d(y, x) (Symmetrie)
(c) d(x, y) ≤ d(x, z) + d(z, y) (Dreiecks-Ungleichung)
Man nennt d eine Metrik auf M .
Beispiele 5.2.
9Es ist derzeit nicht wichtig, dass Sie diese Begriffe kennen, wichtig ist: es sind Begriffe der Topologie.
200 4. STETIGKEIT UND GRENZWERTE VON FUNKTIONEN
(1) Sei M ⊂ R oder M ⊂ C. Fur z, w ∈M definieren wir
d(z, w) := |z − w| =√
(Re (z − w))2 + (Im (z − w))2.
(2) Sei M ⊂ Rn. Zu x = (x1, x2, . . . , xn) ∈ M ⊂ Rn und y = (y1, y2, . . . , yn) ∈ M ⊂
Rn definieren wir den euklidischen Abstand als
deukl(x, y) := ‖x− y‖ =√
(x1 − y1)2 + (x2 − y2)2 + · · ·+ (xn − yn)2.
In beiden Beispielen sind (a) und (b) klar. Fur (1) wurde (c) schon diskutiert. Die Un-
gleichung (c) fur (2) wird in der Linearen Algebra I (und dem Kurs”Mathematische
Methoden“ fur Physiker) gezeigt.
Beispiel 5.3. Ist (M,d) ein metrischer Raum und N ⊂M . Dann ist (N, d|N×N) ebenfalls
ein metrischer Raum. Wir nennen dN×N die von (M,d) auf N induzierte Metrik.
Schreibweise: Sei f : M −→ M eine Abbildung und sind (M,d) und (M, d) metrische
Raume, dann schreiben wir hierfur oft f : (M,d) −→ (M, d).
Ist eine Abbildung f : (M,d) −→ (M, d) bijektiv und gilt fur alle x, y ∈ M : d(x, y) =
d(f(x), f(y)), dann nennt man die Abbildung eine Isometrie. Man sieht sofort, dass
(x, y) 7→ x + iy eine Isometrie von (R2, deukl) nach (C, d) ist, wobei d die Metrik im
obigen Beispiel ist. Da wir oft R2 mitC identifizieren, schreiben wir ebenfalls deukl fur
diese Metrik auf C.
Definition 5.4 (ε-δ-Kriterium fur Stetigkeit fur Abbildungen zwischen metrischen Raum-
en). f : (M,d) −→ (M, d) ist stetig in x0 ∈M , falls gilt:
(5.5) ∀ε ∈ R>0 : ∃δ ∈ R>0 : ∀x ∈M : (d(x, x0) < δ =⇒ d(f(x), f(x0)) < ε).
5. METRISCHE RAUME UND GRUNDBEGRIFFE DER TOPOLOGIE 201
f stetig ⇐⇒ f stetig in allen x0 ∈M .
Im Fall M ⊂ C, d(z, w) = |z−w| stimmt diese Definition offensichtlich mit Definition 1.5
uberein.
Definition 5.6. Sei (M,d) ein metrischer Raum, x ∈M , r ∈ R>0. Der (offene) Ball von
Radius r um x in (M,d) ist die Menge
Br(x) := {y ∈M | d(y, x) < r}.
Eine Teilmenge U ⊂M heißt Umgebungvon x in (M,d), falls es ein r ∈ R>0 gibt, so dass
Br(x) ⊂ U .
Definition 5.7. Eine Teilmenge O von M heißt offen in (M,d), wenn fur jeden Punkt
x ∈ O gilt, dass O eine Umgebung von x in (M,d) ist. Eine Teilmenge A von M heißt
abgeschlossen in (M,d), falls M r A offen ist.
Beispiele 5.8.
(a) Die leere Menge und M sind offen in (M,d). Diese beiden Mengen sind auch abge-
schlossen.
(b) O ⊂ R2 ∼= C
Bild einer offenen Menge O in R2, darin ein x und ein geeigneter Ball Br(x).
(c) Alle offenen Intervalle in R sind offen in (R, deukl). Alle abgeschlossenen Intervalle in
R sind abgeschlossen in (R, deukl).
(d) Die Menge (0, 1)× (0, 1) ist offen in (R2, deukl)
202 4. STETIGKEIT UND GRENZWERTE VON FUNKTIONEN
(e) Fur alle r ∈ R>0 und alle x ∈ M ist Br(x) eine offene Teilmenge von (M,d).
Begrundung: Sei y ∈ Br(x), ρ := d(x, y). Dann gilt Br−ρ(y) ⊂ Br(x) (Dreiecks-
Ungleichung).
Zeichnung von Br−ρ(y) ⊂ Br(x) in R2.
(f) Ist U Umgebung von x und U ⊂ V ⊂M , dann ist V ebenfalls Umgebung von x.
LEMMA 5.9. Sei x ∈ M und U ⊂ M . Dann ist U eine Umgebung von x, genau dann
wenn es ein O ⊂M gibt, das
• in (M,d) offen ist, und
• so dass x ∈ O ⊂ U .
Solch ein O ist also eine offene Umgebung von x.
Beweis.
”=⇒“: klar, da offene Balle offen sind.
”⇐=“: Wenn O offen ist und x ∈ O, dann ist O eine Umgebung von x. Aus O ⊂ U ergibt
sich, dass U Umgebung von x ist.
PROPOSITION 5.10.
(a) Sei x ∈M und seien U1 und U2 Umgebungen von x in (M,d). Dann ist auch U1 ∩ U2
eine Umgebung von x.
(b) Sind O1 und O2 offene Teilmengen von (M,d), so ist O1 ∩O2 offen.
(c) Sei (Oj)j∈I eine Familie offener Teilmengen von (M,d), dann ist auch⋃j∈I
Oj
5. METRISCHE RAUME UND GRUNDBEGRIFFE DER TOPOLOGIE 203
eine offene Teilmenge.
Beweis.
Zu (a): Da U1 und U2 Umgebungen von x sind, gibt es r1, r2 ∈ R>0 mit Br1(x) ⊂ U1 und
Br2(x) ⊂ U2. Fur r := min{r1, r2} gilt Br(x) ⊂ U1 ∩ U2.
Zu (b): Gegeben sei ein x ∈ O1 ∩ O2 ist. Da O1 und O2 offen sind, sind sie Umgebungen
von x. Aus (a) folgt, dass O1 ∩ O2 ebenfalls Umgebung von x ist. Da dies fur jedes
x ∈ O1 ∩O2 gilt, ist O1 ∩O2 offen.
Zu (c): Sei x ∈⋃j∈I Oj. Fixiere ein k ∈ I mit x ∈ Ok. Da Ok offen ist, ist Ok eine Um-
gebung von x in (M,d), und damit auch⋃j∈I Oj ⊃ Ok. Also ist
⋃j∈I Oj eine Umgebung
von jedem x ∈⋃j∈I Oj, also offen.
!ACHTUNG!.
• Fur n ∈ Nr {0} ist (−1/n, 1/n) offen in R, aber nicht offen in C.
• Proposition 5.10 besagt: endliche Durchschnitte offener Mengen sind offen und
beliebige (also auch unendliche!) Vereiningung offener Mengen sind auch wieder
offen. Allerdings ist ein unendlicher Durchschnitt offener Mengen im allgemeinen
nicht mehr offen:⋂n∈N(−1/n, 1/n) = {0} ist nicht offen!
•”Abgeschlossen“ ist nicht das Gegenteil zu
”offen“.
PROPOSITION 5.11 (Umgebungskriterium fur Stetigkeit). Gegeben sei eine Abbildung
f : (M,d) −→ (M, d) und ein x0 ∈M . Diese Abbildung ist stetig in x0 genau dann, wenn
gilt:
fur alle Umgebungen U von f(x0) in (M, d) gilt:
f#(U) ist eine Umgebung von x0 in (M,d).
204 4. STETIGKEIT UND GRENZWERTE VON FUNKTIONEN
Beweis. Die umrahmte Aussage ist eine Umformulierung des ε-δ-Kriteriums unter Nut-
zung des oben definierten Begriffs”Umgebung“.
Kurz kann man hierfur sagen: Urbilder von Umgebungen sind Umgebungen.
PROPOSITION 5.12. Eine Funktion f : (M,d) −→ (M, d) ist genau dann stetig, wenn
fur alle offenen Teilmengen O von (M, d) gilt: f#(O) ist offen in (M,d).
Kurz kann man hierfur sagen: Urbilder offener Mengen sind offen.
Beweis. Folgt direkt aus dem Umgebungskriterium fur Stetigkeit (Proposition 5.11).
Definition 5.13. Eine Folge (an)n∈N konvergiert in (M,d) gegen x0 ∈ M , falls fur jede
Umgebung U von x0 gilt:
∃n0 ∈ N : ∀n ∈ N≥n0 : an ∈ U.
Die ist aquivalent zu
∀ε ∈ R>0 : ∃n0 ∈ N : ∀n ∈ N :(n ≥ n0 =⇒ d(an, x0) < ε
),
und dies stimmt mit Definition 1.4 uberein, falls d(an, x0) = |an−x0|. Die Folge konvergiert
in (M,d), wenn es in M solch ein x0 gibt.
Diese Definition verallgemeinert die Konvergenz von Folgen in R und C. Man definiert
limn→∞ und die Folgenstetigkeit gleich wie zuvor. Folgenstetigkeit und Stetigkeit sind
wieder aquivalente Eigenschaften. Um dies zu beweisen, ersetze man im Beweis von Lem-
ma 1.7 |x− x0| < δ durch d(x, x0) < δ und so weiter.Mi 23.1.
5. METRISCHE RAUME UND GRUNDBEGRIFFE DER TOPOLOGIE 205
Bemerkung 5.14. R := R∪{−∞,∞}. In der Diskussion vor Proposition 1.30 in Kapitel 3
haben wir eine bijektive Abbildung ϕ : [−1, 1] −→ R definiert,
ϕ(x) =
1
1−x −1
1+xfur x ∈ (−1, 1)
∞ fur x = 1
−∞ fur x = −1
Graph der Funktion ϕ.
Wir versehen nun R mit der Metrik
dR(x, y) :=∣∣ϕ−1(x)− ϕ−1(y)
∣∣ .Dann ist (R, dR) ein metrischer Raum. Fur eine reell-wertige Folge (an)n∈N und ein a ∈ R
gilt
Fur im klassischen Sinn im Sinn metrischer Raume
a ∈ Rlimn→∞ an = a
im eigentlichen Sinn⇐⇒
limn→∞ an = a
im metrischen Raum (R, dR)
a = ±∞limn→∞ an = a
im uneigentlichen Sinn⇐⇒
limn→∞ an = a
im metrischen Raum (R, dR)
Proposition 1.30 aus Kapitel 3, folgt nun unmittelbar.
!ACHTUNG!. Wir wiederholen nochmals erlaubte und unerlaubte Sprechweisen klaren
an Hand des Beispiels an := n2.
Erlaubt: (an)n∈N konvergiert uneigentlich gegen ∞.
(an)n∈N konvergiert in (R, dR) gegen ∞.
Nicht erlaubt: (an)n∈N konvergiert.
206 4. STETIGKEIT UND GRENZWERTE VON FUNKTIONEN
Schreibweise: Wenn aus dem Kontext heraus klar ist, welche Metrik gemeint ist, dann
schreibt man oft einfach M statt (M,d). Teilmengen X ⊂M tragen die induzierte Metrik
d|X×X , wenn nichts anderes angegeben.
Definition 5.15. Sei X Teilmenge eines metrischen Raums (M,d). Wir nennen x0 ∈M
einen Haufungspunkt von X in (M,d), falls jede Umgebung von x0 unendlich viele Punkte
von X enthalt.
Beispiele 5.16.
(a) Endliche Mengen haben keine Haufungspunkte.
(b) Die Mengen N und Z haben keine Haufungspunkte in R und C.
(c) Die Menge aller Haufungspunkte von Q in C ist R.
(d) Seien a, b ∈ R, a < b. Die Menge aller Haufungspunkte von (a, b) in R (oder in C) ist
die Menge [a, b].
LEMMA 5.17. Sei X Teilmenge eines metrischen Raums (M,d), und sei y ∈M . Aqui-
valent sind dann die folgenden Aussagen:
(1) y ist Haufungspunkt von X
(2) Fur jede Umgebung U von y gilt U ∩X r {y} 6= ∅
(3) Es gibt eine Folge (an) in X r {y} mit limn→∞ an = y
(4) Es gibt eine Folge in X r {y}, so dass y Haufungspunkt
dieser Folge ist.
Beweis.
”(1)=⇒(2)“: klar.
5. METRISCHE RAUME UND GRUNDBEGRIFFE DER TOPOLOGIE 207
”(2)=⇒(3)“: B1/n(y) ∩X besitzt ein Element an 6= y. Dann d(an, y) ≤ 1/n→ 0.
”(3)=⇒(1)“: Sei (an)n∈N eine Folge wie in (2), und U eine Umgebung von y. Es gibt ein
n0 ∈ N, so dass ∀n ∈ N≥n0 : an ∈ U . Wenn P := {d(an, y) | n ∈ N≥n0} nur endlich
viele Elemente enthalt, dann ist inf{d(an, y) | n ∈ N} > 0. Widerspruch. Somit hat P
unendlich viele Elemente und deswegen auch U ∩X.
”(3)⇐⇒(4)“: siehe Definition 1.22 in Kapitel 3.
!ACHTUNG!. Die Definitionen von”Haufungspunkt einer Menge“ (siehe oben) und
”Haufungspunkt einer Folge“ (Definition 1.22 in Kapitel 3) sind zwar verwandt, aber doch
verschieden, wie das folgende Beispiel zeigt. Die reell-wertige Folge (an)n∈N mit an := 1
hat den Haufungspunkt 1, aber die Menge {an | n ∈ N} hat keine Haufungspunkte.
Bemerkung 5.18 (Aufgabe 4 auf Blatt 12). Eine Teilmenge eines metrischen Raumes
(M,d) ist abgeschlossen, genau dann wenn sie alle ihre Haufungspunkte enthalt.
Definition 5.19. Wir nennen einen metrischen Raum (M,d) folgenkompakt, wenn jede
Folge in M eine in (M,d) konvergente Teilfolge besitzt. Eine Teilmenge X ⊂ M nennt
man folgenkompakt, wenn (X, d|X×X) folgenkompakt ist.10.
LEMMA 5.20. Folgenkompakte Teilmengen eines metrischen Raumes sind abgeschlossen.
Beweis. Sei X eine folgenkompakte Teilmenge von (M,d) und y ein Haufungspunkt
von X. Dann gibt es eine Folge (an)n∈N in X mit limn→∞ an = y. Da X folgenkompakt
ist, gibt es eine Teilfolge (af(k))k∈N in X, f : N → N streng monoton wachsend, mit
z := limk→∞ af(k) ∈ X. Diese Teilfolge konvergiert auch in M , also haben wir y = z. Somit
enthalt X jeden Haufungspunkt und ist somit abgeschlossen (Bemerkung 5.18).
10Achtung: Der Grenzwert muss dann in X liegen!
208 4. STETIGKEIT UND GRENZWERTE VON FUNKTIONEN
Beispiel 5.21. Sei I ein Interval mit der von deukl induzierten Metrik. Dann ist I folgen-
kompakt genau dann, wenn I abgeschlossen und beschrankt ist. Denn:
• Ist I folgenkompakt, dann ist I abgeschlossen in (R, deukl) aufgrund des obigen
Lemmas.
• Ist I folgenkompakt, dann ist I beschrankt. Denn wenn I nicht nach oben (bzw.
unten) beschrankt ist, dann gibt es eine Folge, die uneigentlich gegen +∞ (bzw.
−∞) konvergiert. Diese Folge hat keine konvergente Teilfolge. 11
• Ist I beschrankt, dann besitzt jede Folge in I aufgrund des Satzes von Bolzano-
Weierstraß (Satz 1.35 in Kapitel 3) einen Haufungspunkt, also eine in R konver-
gente Teilfolge. Ist I zusatzlich abgeschlossen, dann ist der Grenzwert in I. Somit
ist I folgenkompakt.
SATZ 5.22. Seien (M,d) und (M, d) metrische Raume. Ist (M,d) folgenkompakt und
f : (M,d) → (M, d) stetig, dann ist B := f#(M) mit der Metrik d|B×B ebenfalls folgen-
kompakt.
Beweis. Sei (yn)n∈N eine Folge in f#(M). Wahle xn ∈ M mit f(xn) = yn und danach
eine konvergente Teilfolge (xh(k))k∈N, h : N→ N streng monoton wachsend. Dann gilt
limk→∞
yh(k) = limk→∞
f(xh(k)) = f(
limk→∞
xh(k)︸ ︷︷ ︸∈M
)∈ f#(M).
Also ist f#(M) folgenkompakt.
11Alternative Beweise: a) Ubungsblatt 13, Aufgabe 4. Zweiter Beweis: Ist (I, deukl) folgenkompakt,d
ann ist auch (I, dR|I×I) folgenkompakt. Also ist I abgeschlossen in R. Somit sind −∞ und +∞ keine
Haufungspunkte von I in (R, dR), was bedeutet, dass I beschrankt ist.
6. GRENZWERTE VON FUNKTIONEN 209
FOLGERUNG 5.23. Seien a, b ∈ R, a ≤ b und f : [a, b] → R stetig. Dann ist f#([a, b])
ein abgeschlossenes beschranktes Intervall. Es existieren also x1, x2 ∈ [a, b] mit
∀x ∈ [a, b] : f(x1) ≤ f(x) ≤ f(x2).
Die Folgerung folgt direkt aus dem obigen Beispiel und dem obigen Satz.
6. Grenzwerte von Funktionen
LEMMA 6.1. Seien (M,d) und (N, d) metrische Raume, D ⊂ M , und x0 ∈ M ein
Haufungspunkt von D. Zu jeder Abbildung f : D → N gibt es hochstens eine Abbildung
F : D ∪ {x0} → N , so dass
• F |Dr{x0} = f |Dr{x0}
• und so dass F stetig in x0 ist.
Definition 6.2. Wenn solch ein F existiert, so sagen wir der Grenzwert oder Limes
limx→x0
f(s)
existiert. Wir nennen F (x0) den Grenzwert oder Limes von f in x0 und schreiben
limx→x0
f(x) := F (x0).
Bemerkung 6.3. Es sind die Falle x0 ∈ D und x0 6∈ D zugelassen. Im Fall x0 ∈ D muss
nicht f(x0) = F (x0) gelten.
210 4. STETIGKEIT UND GRENZWERTE VON FUNKTIONEN
Beweis des Lemmas. Wahle eine Folge (an)n∈N in D r {x0} mit an → x0. Wenn ein F
wie oben existiert, dann gilt
F (x0) = F ( limn→∞
an) = limn→∞
F (an) = limn→∞
f(an).
Es gibt also hochstens einen passenden Wert fur F (x0). Auf Dr{x0} ist F sowieso schon
bestimmt. Also kann es hochstens eine solche Abbldung F geben.
Definition 6.4. Sei D ⊂ R, und sei x0 ∈ R ein Haufungspunkt von D ∩ [x0,∞). Dann
definiert man den rechtsseitigen Grenzwert/Limes als
limx↘x0
f(x) := limx→x0
(f |D∩[x0,∞)).
Wenn wir [x0,∞) durch (−∞, x0] ersetzen, erhalten wir die Definition des linksseitigen
Grenzwerts/Limes
limx↗x0
f(x).
Fur x0 ∈ D ⊂ R, x0 Haufungspunkt von D ∩ [x0,∞) und D ∩ (−∞, x0]:
f : D → R ist stetig in x0
⇐⇒ limx→x0
f(x) existiert und limx→x0
f(x) = f(x0)
⇐⇒ limx↘x0
f(x) und limx↗x0
f(x) existieren und limx↘x0
f(x) = limx↗x0
f(x) = f(x0)
Beispiel 6.5. Definiere f : R −→ R.
f(x) :=
1 fur x > 0
0 fur x = 0
−1 fur x < 0
limx→0 f(x) existiert nicht. Hingegen existieren limx↘0 f(x) = 1 und limx↗0 f(x) = −1.
6. GRENZWERTE VON FUNKTIONEN 211
Bemerkung 6.6. Wir versehen N ∪ {∞} mit der Metrik12
dinv(x, y) =
∣∣∣∣ 1
x+ 1− 1
y + 1
∣∣∣∣ ,wobei wir in diesem13 Zusammenhang 1
∞ := 0 setzen. Dieses dinv ist eine Metrik auf
N∪{∞}. Sei (an) eine Folge in (M,d), und sei f : N −→M die Abbildung mit f(n) = an.
Dann gilt
limn→∞
an = a im Sinne von Kap. 3 Abschnitt 1.1
⇐⇒ limn→∞
f(n) = a im Sinne des aktuellen Abschnitts
12Die folgende Metrik ist nur ein Beispiel einer Metrik, die verwendet werden kann. Die Einchranung
von dR auf (N∪{∞})× (N∪{∞}) ist zum Beispiel ebenfalls eine Metrik, fur die die folgenden Aussagen
richtig sind.13Wenn wir es brauchen, wird 1
∞ jedesmal neu definiert, denn man kann diese Definition nicht so
machen, dass alle ulichen Rechenregeln gelten. Man kommt dann immer wieder zu Fragen wie: 10 = ∞
oder 10 = −∞. Ist ∞−∞ = 0 oder ∞−∞ = 17?
”Beweis“ der letzten Aussage: ∞+ 17 =∞. Lose diese
Gleichung nach 17 auf. Beim Rechnen mit ∞ funktioniert eben alles mogliche nicht mehr richtig.
KAPITEL 5
Differential-Rechnung fur Funktionen einer Veranderlichen
1. Definition und elementare Eigenschaften
Ab sofort nutzen wir ε > 0 oft im Sinne von ε ∈ R>0, falls aus dem Kontext heraus klar ist,
dass ε eine reelle Zahl ist. Wir betrachten in den folgenden Abschnitten nur Funktionen
der Form f : D −→ R, D ⊂ R.
Definition 1.1. Sei D ⊂ R offen, x0 ∈ D.1 Eine Funktion f : D −→ R nennt man
differenzierbar in x0, wenn der Grenzwert
limx→x0
f(x)− f(x0)
x− x0
existiert. Wenn er existiert, so nennt man
f ′(x0) := limx→x0
f(x)− f(x0)
x− x0
die Ableitung von f an der Stelle x0. Die Funktion f ist differenzierbar, wenn sie in jedem
x0 ∈ D differenzierbar ist. Den Quotient
f(x)− f(x0)
x− x0
nennt man den Differenzenquotient.
1Damit diese Definition sinnvoll ist, reicht hier eigentlich bereits, dass D eine Umgebung von x0, oder
sogar nur, dass x0 ein Haufungspunkt von D ist.
213
214 5. DIFFERENTIAL-RECHNUNG FUR FUNKTIONEN EINER VERANDERLICHEN
Graph einer Funktion f mit einem Dreieck, das den Differenzenquotient andeutet.
Interpretation: Die Zahl f ′(x0) gibt an, wie stark der Graph der Funktion an der Stelle
(x0, f(x0)) ansteigt.
Alternative Bezeichnungen:
f ′(x0) =df
dx(x0) =
∂f
∂x(x0) = Df(x0)
f differenzierbar in x0 ⇐⇒ Die Ableitung von f existiert in x0
⇐⇒ f ′(x0) existiert
Beispiele 1.2.
(1) Konstante Funktionen R→ R, x 7→ a sind differenzierbar und f ′(x0) = 0 fur alle
x0 ∈ R.
(2) Die Identitat idR : R −→ R, x 7→ x ist differenzierbar und f ′(x0) = 1 fur alle
x0 ∈ R.
(3) Differenzierbarkeit ist eine lokale Eigenschaft: Ist U eine Umgebung von x0, ent-
halten in den Definitionsbereichen von f und f , und gilt f |U = f |U , dann ist
f differenzierbar in x0 genau dann, wenn f in x0 differenzierbar ist. Dann gilt
f ′(x0) = f ′(x0).
(4) Die Funktion f : Rr {0} → Rr {0}, x 7→ x−1 ist differenzierbar und es gilt
f ′(x0) = − 1
x20
.
1. DEFINITION UND ELEMENTARE EIGENSCHAFTEN 215
Denn:1x− 1
x0
x− x0
=x0 − x
xx0(x− x0)=−1
xx0
→ − 1
x20
fur x→ x0
Fr 25.1.
Umformungen:
f ′(x0) existiert
⇐⇒ ∀ε > 0 : ∃δ > 0 : ∀x ∈ D r {x0} :
(|x− x0| < δ =⇒
∣∣∣∣f(x)− f(x0)
x− x0
− f ′(x0)
∣∣∣∣ < ε
)⇐⇒ ∀ε > 0 : ∃δ > 0 : ∀x ∈ D :(
|x− x0| < δ =⇒ |f(x)− f(x0)− f ′(x0)(x− x0)| ≤ ε |x− x0|)
Interpretation:
Differenzierbarkeit =”gute“ Approximierbarkeit durch eine lineare Funktion
SATZ 1.3. Seien D und f wie oben. Ist f differenzierbar in x0, so ist f stetig in x0.
Die Umkehrung gilt nicht, siehe Ubungen.
Beweis. Definiere
g(x) :=f(x)− f(x0)
x− x0
fur x 6= x0
limx→x0
((x− x0)g(x)) = ( limx→x0
(x− x0))( limx→x0
g(x)) = 0 · f ′(x0) = 0
2
f(x) = f(x0) + (x− x0)g(x) fur x 6= x0
2Hier haben wir benutzt: sind g : D −→ R und h : D −→ R Funktionen, x0 ein Haufungspunkt von
D und existieren limx→x0g(x) und limx→x0
h(x), dann existiert auch limx→x0(g(x)h(x)) und es gilt
limx→x0
(g(x)h(x)) =
(limx→x0
g(x)
)(limx→x0
h(x)
).
216 5. DIFFERENTIAL-RECHNUNG FUR FUNKTIONEN EINER VERANDERLICHEN
Also
limx→x0
f(x) = f(x0) + 0 · f ′(x0) = f(x0).
Somit ist f stetig in x0.
REGELN 1.4. Im folgenden sei D offen in R, f, fj, g : D −→ R.
(1) Sind fj differenzierbar in x0, aj ∈ R fur j ∈ {1, 2, . . . , r}, dann gilt(r∑j=1
ajfj
)′(x0) =
r∑j=1
ajf′j(x0).
Solche Aussagen sind immer so zu verstehen, dass alle angegebenen Ableitungen
in x0 existieren und die obige Gleichung fur die so erhaltenen Zahlen gilt.
(2) Produktregel.
Sind f und g differenzierbar in x0, dann gilt
(f · g)′(x0) = f ′(x0)g(x0) + f(x0)g′(x0).
Die Existenz der Ableitung (f · g)′(x0) ist wieder eine implizite Teilaussage der
obigen Formelzeile.
Begrundung:
(f · g)(x)− (f · g)(x0)
x− x0
=f(x)(g(x)− g(x0))
x− x0
+(f(x)− f(x0))g(x0)
x− x0
→ f(x0)g′(x0) + f ′(x0)g(x0)
fur x→ x0.
Dies ist eine leichte Ubungsaufgabe. Analoges gilt fur Summen, Differenzen und, falls limx→x0h(x) 6= 0,
auch fur die Quotientenfuntion x 7→ g(x)/h(x) nach Einschrankung des Definitionsbereichs auf D ∩
h#(Rr {0}) = D r h#({0}).
1. DEFINITION UND ELEMENTARE EIGENSCHAFTEN 217
(3) Quotientenregel.
Sind f und g differenzierbar in x0, g(x0) 6= 0, dann gilt(f
g
)′(x0) =
f ′(x0)g(x0)− f(x0)g′(x0)
g(x0)2.
Die Existenz der Ableitung auf der linken Seite ist wieder eine implizite Teilaus-
sage der obigen Formelzeile.
Begrundung 1: Ahnlich wie oben, siehe [22].
Begrundung 2: Folgt unten aus Kettenregel
(4) Kettenregel.
Sei f : D −→ R, g : E −→ R mit f#(D) ⊂ E. Sei f in x0 ∈ D differenzierbar
und sei g in f(x0) differenzierbar. Dann gilt
(g ◦ f)′(x0) = g′(f(x0))f ′(x0).
Die Existenz der Ableitung auf der linken Seite ist wieder eine implizite Teilaus-
sage der obigen Formelzeile.
Begrundung: fur y0 := f(x0) Wir rechnen
(g ◦ f)(x)− (g ◦ f)(x0)
x− x0
=g(f(x))− g(y0)
f(x)− y0
· f(x)− f(x0)
x− x0
Aus
limy→y0
g(y)− g(y0)
y − y0
= g′(y0)
und Lemma 1.13 in Kapitel 4 folgt
limx→x0
g(f(x))− g(y0)
f(x)− y0
= g′(y0)
Wir erhalten
limx→x0
(g ◦ f)(x)− (g ◦ f)(x0)
x− x0
= g′(y0)f ′(x0)
218 5. DIFFERENTIAL-RECHNUNG FUR FUNKTIONEN EINER VERANDERLICHEN
Begrundung der Quotientenregel: Sei h(x) := 1/x. Dann(1
g
)′(x0) = (h ◦ g)′(x0) = − 1
g(x0)2g′(x0)
(f
g
)′(x0) = f ′(x0)
1
g(x0)+ f(x0)
(− 1
g(x0)2g′(x0)
)=f ′(x0)g(x0)− f(x0)g′(x0)
g(x0)2
Bemerkung 1.5. Sei D ⊂ R, f : D −→ R injektiv und stetig.
(1) Ist D ein Intervall, dann ist f streng monoton. Denn angenommen f ist nicht streng
monoton, dann gibt es a, b, c ∈ D mit a < b < c und (f(a) < f(b) > f(c) oder
f(a) > f(b) < f(c)). Dies ergibt mit dem Zwischenwertsatz einen Widerspruch zur
Injektivitat.
(2) Ist D offen, dann auch f#(D). Denn sei y ∈ f#(D), dann schreibe y = f(x). Wahle
a, b ∈ D so dass x ∈ (a, b) ⊂ [a, b] ⊂ D. Wegen (1) ist f |[a,b] streng monoton. O.B.d.A.
streng monoton wachsend (sonst ersetze x 7→ f(x) durch x 7→ f(−x)). Somit gilt
y ∈ (f(a), f(b)) ⊂ f#(D).
(3) Ist D offen und f differenzierbar in x0 ∈ D und f−1 differenzierbar in f(x0), dann
gilt
1 = id′D(x0) = (f−1)′(f(x0)) (f ′(x0)).
Also f ′(x0) 6= 0.
PROPOSITION 1.6 (Ableitung der Umkehrfunktion.). Sei D offen, f : D −→ R injektiv
und stetig, und sei f differenzierbar in x0 ∈ D, f ′(x0) 6= 0. Dann ist f−1 differenzierbar
in y0 := f(x0) und
(f−1)′(y0) =1
f ′(x0).
1. DEFINITION UND ELEMENTARE EIGENSCHAFTEN 219
Beweis. Wahle a, b ∈ D, so dass x0 ∈ (a, b) ⊂ D. Dann ist f |(a,b) streng monoton.
y = f(x), y0 = f(x0).
f−1(y)− f−1(y0)
y − y0
=x− x0
f(x)− f(x0)
y→y0−→ 1
f ′(x0),
denn mit y → y0 geht auch x → x0, da f−1 stetig ist (Satz 2.7 und Lemma 1.13 in
Kapitel 4).
Beispiel 1.7.
(1) Wir betrachten exp : R→ R.
exp′(x) = limh→0
exp(x+ h)− exp(x)
(x+ h)− x= lim
h→0
((expx)
exp(h)− exp(0)
h
)= (expx) lim
h→0
(exph)− 1
h= (expx) lim
h→0
( ∞∑n=1
1
n!hn−1
)(∗)= exp x.
Bei (∗) haben wir genutzt, dass wir wegen Lemma 3.1 in Kapitel 4 wissen, dass∣∣∣ ∞∑n=2
1
n!hn−1
∣∣∣ ≤ ∞∑n=2
∣∣ 1
n!hn−1
∣∣ ≤ ∞∑n=2
∣∣hn−1∣∣ =
|h|1− |h|
,
falls |h| < 1 und dies konvergiert gegen 0 fur h→ 0.
(2) Aus log = (exp)−1 folgt dann mit Proposition 1.6 fur x ∈ R>0
log′(x) =1
exp(log x)=
1
x.
Beispiel 1.8. Sei f : R>0 −→ R, f(x) = xa, a ∈ Q. Dann gilt
(1.9) f ′(x0) = axa−10 .
Dies zeigt man
220 5. DIFFERENTIAL-RECHNUNG FUR FUNKTIONEN EINER VERANDERLICHEN
• fur a ∈ N mit id′R(x0) = 1 und der Produktregel.
• fur a = 1/n, n ∈ N r {0} mit Umkehrfunktion. Sei f(x) = xa = n√x. Dann
f = g−1 mit g(x) = xn.
f ′(x0) =1
g′(f(x0))=
1
n( n√x0)n−1
= ax(1−n)/n0 = axa−1
0 .
• Dann fur a ∈ Q≥0 mit der Kettenregel xp/q = q√xp.
• Dann fur a ∈ Q<0 mit der Quotientenregel
Ein anderer Beweis gilt sogar fur alle a ∈ R:3
f(x) = xa = exp(a log x)
f ′(x) = exp′(a log x) · (a log′ x) = exp(a log x) · ax
= xa · ax
= axa−1 ,
und somit (1.9) fur alle a ∈ R.30.1.
2. Lokale Extrema
Definition 2.1. Sei (M,d) ein metrischer Raum, f : M −→ R, x0 ∈ M . Wir sagen f
hat ein lokales Maximum (bzw. lokales Minimum) in x0, falls es eine Umgebung U von x0
gibt, so dass
∀x ∈ U : f(x) ≤ f(x0) (bzw. f(x) ≥ f(x0)).
lokales Extremum in x0 :⇐⇒ lokales Maximum oder Minimum in x0
SATZ 2.2. Sei D ⊂ R offen, f : D −→ R, f differenzierbar in x0 ∈ D. Wenn f ein lokales
Extremum in x0 besitzt, so gilt f ′(x0) = 0.
3Er gilt sogar fur alle a ∈ C, wenn man obige Definitionen sinngemaß auf Funktionen f : D → C mit
D ⊂ R verallgemeinert.
3. MITTELWERTSATZE 221
Beweis. O.B.d.A. lokales Maximum in x0.
f(x)− f(x0)
x− x0
≤ 0 fur x > x0, x ∈ U
Somit f ′(x0) ≤ 0.
f(x)− f(x0)
x− x0
≥ 0 fur x < x0, x ∈ U
Somit f ′(x0) ≥ 0.
3. Mittelwertsatze
Wiederholung: (Folgerung 5.23 aus Kapitel 4)
Seien a, b ∈ R, a ≤ b, f : [a, b]→ R stetig. Dann nimmt f ein Maximum und ein Minimum
an, d.h. es gibt x1, x2 ∈ [a, b], so dass fur alle x ∈ [a, b]:
f(x1) ≤ f(x) ≤ f(x2).
SATZ 3.1 (Satz von Rolle, benannt nach Michel Rolle, 1652–1719). Sei a < b. Sei f :
[a, b] −→ R differenzierbar4 auf (a, b) und stetig auf [a, b] und f(a) = f(b). Dann existiert
ein c ∈ (a, b) mit f ′(c) = 0.
Zeichnung zu Satz von Rolle
Beweis. A := [a, b], wahle x1 und x2 wie oben.
1. Fall: x1 ∈ {a, b} und x2 ∈ {a, b}. Dann gilt
f(a) = f(b) = max f#([a, b]) = min f#([a, b])
4Differenzierbar auf A (bzw. stetig auf A) bedeutet differenzierbar (bzw. stetig) in allen x ∈ A.
222 5. DIFFERENTIAL-RECHNUNG FUR FUNKTIONEN EINER VERANDERLICHEN
Also f konstant, also f ′(x0) = 0 fur alle x0 ∈ (a, b).
2. Fall: x1 ∈ (a, b) oder x2 ∈ (a, b), o.B.d.A. x1 ∈ (a, b). Dann gilt f ′(x1) = 0 wegen
Satz 2.2.
SATZ 3.2 (1. Mittelwertsatz). Sei a < b. Sei f : [a, b] −→ R differenzierbar auf (a, b) und
stetig auf [a, b]. Dann existiert ein c ∈ (a, b) mit
f(b)− f(a) = (b− a)f ′(c).
Zeichnung zu 1. Mittelwertsatz
Beweis.
F (x) := f(x)− f(b)− f(a)
b− a(x− a)
F (a) = f(a) = F (b). Wende den Satz von Rolle an.
0 = F ′(c) = f ′(c)− f(b)− f(a)
b− a
SATZ 3.3 (2. Mittelwertsatz). Sei a < b. Seien f, g : [a, b] −→ R differenzierbar auf (a, b)
und stetig auf [a, b]. Ferner gelte fur alle x ∈ (a, b): g′(x) 6= 0. Dann existiert ein c ∈ (a, b)
mit
f(b)− f(a)
g(b)− g(a)=f ′(c)
g′(c).
Beweis. Der Satz von Rolle liefert: g(b) 6= g(a). Definiere
F (x) := f(x)− f(a)− f(b)− f(a)
g(b)− g(a)(g(x)− g(a)).
4. HOHERE ABLEITUNGEN UND TAYLORSCHER SATZ 223
Also F (a) = F (b) = 0. Nach dem Satz von Rolle gibt es ein c ∈ (a, b) mit
0 = F ′(c) = f ′(c)− f(b)− f(a)
g(b)− g(a)g′(c).
KOROLLAR 3.4. Sei f : (a, b) −→ R differenzierbar, so gilt:
f ′(x) > 0 fur alle x ∈ (a, b) =⇒ f ist streng monoton wachsend
f ′(x) < 0 fur alle x ∈ (a, b) =⇒ f ist streng monoton fallend
f ′(x) ≥ 0 fur alle x ∈ (a, b)⇐⇒ f ist monoton wachsend
f ′(x) ≤ 0 fur alle x ∈ (a, b)⇐⇒ f ist monoton fallend
f ′(x) = 0 fur alle x ∈ (a, b)⇐⇒ f ist konstant
Beweis. Die =⇒-Pfeile folgen direkt aus dem 1. Mittelwertsatz. Sei nun f monoton
wachsend, dann gilt f ′(x0) = limx→x0f(x)−f(x0)
x−x0 ≥ 0. Und analog folgt aus”monoton
fallend“ dann f ′(x0) ≤ 0. Der dritte ⇐⇒-Pfeil folgt aus den beiden ersten.
4. Hohere Ableitungen und Taylorscher Satz
Sei I ⊂ R ein offenes Intervall.
C0(I) := {f : I −→ R | f stetig}
Ist f auf I differenzierbar, so erhalten wir f ′ : I −→ R, x 7→ f ′(x).
Falls zusatzlich f ′ stetig ist, so nennen wir f stetig differenzierbar.
224 5. DIFFERENTIAL-RECHNUNG FUR FUNKTIONEN EINER VERANDERLICHEN
Ist f ′ differenzierbar, so nennt man f zweimal differenzierbar.. . . . Ist f ′ k-mal differen-
zierbar, so sagen wir: f ist (k + 1)-mal differenzierbar.
f (0) := f , f (1) := f ′, f (k+1) := (f ′)(k).
f nennt man (k+ 1)-mal differenzierbar in x0 ∈ I, wenn f k-mal differenzierbar auf einer
Umgebung von x0 ist und f (k) in x0 differenzierbar ist.
Fur k ∈ N nennt man
Ck(I) := {f : I −→ R | f ist k-mal differenzierbar und f (k) ∈ C0(I)}
die Menge der k-mal stetig differenzierbaren Funktionen.
C∞(I) :=⋂k∈NC
k(I), die Menge der unendlich oft differenzierbaren Funktionen, glatt =
unendlich oft differenzierbar.
SATZ 4.1. Sei f : (a, b) −→ R differenzierbar auf (a, b) und 2-mal differenzierbar in
x0 ∈ (a, b).
(1) Es gelte f ′(x0) = 0 und f ′′(x0) < 0. Dann besitzt f in x0 ein lokales Maximum.
(2) Es gelte f ′(x0) = 0 und f ′′(x0) > 0. Dann besitzt f in x0 ein lokales Minimum.
(3) Besitzt f in x0 ein lokales Maximum, so gilt f ′(x0) = 0 und f ′′(x0) ≤ 0.
(4) Besitzt f in x0 ein lokales Minimum, so gilt f ′(x0) = 0 und f ′′(x0) ≥ 0.
Beweis.
Zu (1): Die Funktion
g(x) :=
f ′(x)−f ′(x0)
x−x0 fur x 6= x0
f ′′(x0) fur x = x0
4. HOHERE ABLEITUNGEN UND TAYLORSCHER SATZ 225
ist stetig in x0. Aus f ′′(x0) < 0 folgt dann mit dem ε-δ-Kriterium: Zu ε := |f ′′(x0)|/2 gibt
es dann ein δ > 0, so dass fur alle x ∈ (x0 − δ, x0 + δ) gilt:
x ∈ (a, b) und
∣∣∣∣f ′(x)− f ′(x0)
x− x0
− f ′′(x0)
∣∣∣∣ < ε.
Daraus folgt
f ′(x)−=0︷ ︸︸ ︷
f ′(x0)
x− x0
< f ′′(x0) + ε =1
2f ′′(x0) < 0.
Also gilt f ′(x) < 0 fur x ∈ (x0, x0 + δ) und f ′(x) > 0 fur x ∈ (x0 − δ, x0). Dies impliziert,
zusammen mit Korollar 3.4 und der Stetigkeit von f in x0, dass f(x0) = max f#((x0 −
δ, x0 + δ)).
Zu (2): Analog.
Zu (3): Es folgt zunachst f ′(x0) = 0. Wenn f ′′(x0) > 0 ware, so hatte f in x0 ein
lokales Maximum und Minimum, ware also konstant auf einer Umgebung von x0. Somit
f ′′(x0) = 0. Widerspruch.
Zu (4): Analog.
SATZ 4.2 (Satz von Taylor). Sei f : (a, b) −→ R (n+1)-mal differenzierbar, x, x0 ∈ (a, b).
Definiere das Restglied Rx0n (x) durch
f(x) = f(x0) + (x− x0)f ′(x0) +(x− x0)2
2!f (2)(x0) + · · ·+ (x− x0)n
n!f (n)(x0) +Rx0
n (x)
=n∑j=0
(x− x0)j
j!f (j)(x0) +R x0
n (x)
Dann gilt:(1) lim
x→x0
Rx0n (x)
(x− x0)n+1existiert und ist gleich
f (n+1)(x0)
(n+ 1)!.
226 5. DIFFERENTIAL-RECHNUNG FUR FUNKTIONEN EINER VERANDERLICHEN
(2)Rx0n (x)
(x− x0)n+1=f (n+1)(x0 + ϑ(x− x0))
(n+ 1)!fur ein ϑ ∈ (0, 1).
Lagrangesche Restglieddarstellung
Bemerkung: Der Fall n = 0 ist der 1. Mittelwertsatz.
Beweis. Wir fixieren ein x0. Setze g(x) := Rx0n (x), x 6= x0. Man rechnet nach 0 = g(x0) =
g′(x0) = g(2)(x0) = · · · = g(n)(x0) und g(n+1)(x0) = f (n+1)(x0).
Rx0n (x)
(x− x0)n+1=
g(x)− g(x0)
(x− x0)n+1 − (x0 − x0)n+1
2.MWS=
g′(ξ1)
(n+ 1)(ξ1 − x0)n
=g′(ξ1)− g′(x0)
(n+ 1)(ξ1 − x0)n − (n+ 1)(x0 − x0)n
2.MWS=
g(2)(ξ2)
n(n+ 1) (ξ2 − x0)n−1
...
=g(n)(ξn)− g(n)(x0)
(n+ 1)! (ξn − x0)
2.MWS=
g(n+1)(ξn+1)
(n+ 1)!=f (n+1)(ξn+1)
(n+ 1)!
fur geeigenete ξj, mit x0 < ξn+1 < ξn < · · · < ξ1 < x oder x0 > ξn+1 > ξn > · · · > ξ1 > x.
Hieraus folgt Teil (2) des Satzes.
4. HOHERE ABLEITUNGEN UND TAYLORSCHER SATZ 227
In der zweitletzten Zeile der Umformung steht (bis auf den Faktor (n+ 1)!) der Differen-
zenquotient von g(n), der fur ξn → x0 gegen
1
(n+ 1)!g(n+1)(x0) =
1
(n+ 1)!f (n+1)(x0)
konvergiert.
Wegen |ξn − x0| ≤ |x− x0| haben wir dieselbe Aussage auch im Limes x→ x0. Somit
limx→x0
Rx0n (x)
(x− x0)n+1=
1
(n+ 1)!f (n+1)(x0)
Somit gilt auch (1).
Definition 4.3. Sei f : (a, b) −→ R n-mal differenzierbar, x0 ∈ (a, b). Dann nennt man
T x0n f (x) :=n∑j=0
f (j)(x0)
j!(x− x0)j
das Taylor-Polynom n-ten Grades von f mit Entwicklungspunkt x0. Ist f ∈ C∞((a, b)),
dann nennt man
T x0f (x) =∞∑j=0
f (j)(x0)
j!(x− x0)j
die Taylorreihe von f mit Entwicklungspunkt x0.
!ACHTUNG!. Die Konvergenz der Taylor-Reihe ist zunachst unklar. Und selbst wenn
sie konvergiert, ist unklar, ob sie mit der ursprunglichen Funktion ubereinstimmt. Man
kann zeigen: jede Potenzreihe (also auch jede Potenzreihe mit Konvergenzradius 0) ist die
Taylor-Reihe einer glatten Funktion, siehe https://www.semanticscholar.org/paper/
Peano’s-Unnoticed-Proof-of-Borel’s-Theorem-Besenyei/3f06a77700dfdfb470d1786fc9348b1865b286ca
fur einen Beweis.
228 5. DIFFERENTIAL-RECHNUNG FUR FUNKTIONEN EINER VERANDERLICHEN
In Analysis II und III werden wir sehen: Ist f durch eine konvergente Potenzreihe gegeben,
dann stimmt die Taylorreige T 0f mit Entwicklungspunkt 0 mit dieser Potenzreiheuberein.1.2.
Anwendung: Potenzreihendarstellung der Logarithmus-Funktion.
Entwicklungspunkt: x0 = 1
log′(x) = 1x, log(j)(x) = (−1)j−1 (j−1)!
xj
log(1) = 0, log(j)(1) = (−1)j−1(j − 1)!
T 1n log(x) =
log(1)
0!(x− 1)0︸ ︷︷ ︸0
+∑n
j=1(−1)j−1(j−1)!
j!(x− 1)j =
∑nj=1
(−1)j−1
j(x− 1)j
Fragen 4.4.
• Konvergiert die Potenzreihe T 1log (x) fur manche x 6= 1? In anderen Worten: ist
der Konvergenzradius der Reihe positiv?
• Falls ja: gilt im Konvergenzbereich log(x) = T 1log (x)?
Antwort: Ja fur x ∈ (0, 2).
Wir wollen die Aussage fur x ∈ [1, 2) zeigen. Fur x ∈ (0, 1) kann man die Ausage mit
einer anderen Version des Satzes von Taylor zeigen, der Cauchyschen Restglieddarstellung,
siehe [1, Kap. IV, Korollar 3.8 und Anwendungen].
Nach dem Satz von Taylor existiert ein ϑ ∈ (0, 1) mit
log x− T 1n log (x) = R1
n(x) =(x− 1)n+1
(n+ 1)!log(n+1)(1 + ϑ(x− 1))
= (−1)n(x− 1)n+1
(n+ 1)!
n!
(1 + ϑ(x− 1))n+1
4. HOHERE ABLEITUNGEN UND TAYLORSCHER SATZ 229
Also
| log x− T 1n log (x)| =
∣∣∣∣(x− 1)n+1
(n+ 1)!
n!
(1 + ϑ(x− 1))n+1
∣∣∣∣ ≤ 1
n+ 1
Somit T 1n log (x)
n→∞−→ log(x) fur x ∈ [1, 2).
PROPOSITION 4.5. Die Taylorreihe von log : R>0 → R mit Entwicklungspunkt 1 ist
T 1log (x) =∞∑j=1
(−1)j−1
j(x− 1)j.
Die Reihe konvergiert fur |x− 1| < 1, also fur insbesondere fur x ∈ (0, 2). Außerdem gilt
fur alle x ∈ (0, 2):
log x = T 1log (x).
Beweis. Dass die Reihe fur x ∈ [1, 2) gegen log x konvergiert, wurde oben gezeigt. Dass
die Reihe fur |x − 1| < 1 konvergiert, folgt (z.B.) aus dem Quotientenkriterium. Die
Aussage T 1log (x) = log(x) fur x ∈ (0, 1) zeigen wir aus Zeitgrunden nicht mehr, einen
Beweis findet man wieder in [1, Kap. IV, Korollar 3.8 und Anwendungen].
Ubrigens: In der Analysis III werden Sie Satze kennenlernen, die besagen: wenn log x =
T 1log (x) fur alle x ∈ [1, 2) gilt, dann auch fur alle x ∈ (0, 1).
KAPITEL 6
Integral-Rechnung fur Funktionen einer Veranderlichen
Ziel: Integration von Funktionen. Flacheninhalt unter dem Graphen einer Funktion.
Graph einer Funktion. Flacheninhalt darunter im Intervall [a, b] markiert.
1. Partitionen und Treppenfunktionen
Sei I eine Menge. (Partielle) Ordnung auf Abb(I,R) = RI 3 f, g:
f ≤ g :⇐⇒ ∀x ∈ I : f(x) ≤ g(x).
Definition 1.1. Eine Zerlegung oder Partition von I = [a, b], a, b ∈ R ist ein Tupel
(t0, t1, . . . , tk) ∈ Rk+1 mit a = t0 < t1 < · · · < tk = b. Wir schreiben Z = {t0 < t1 < · · · <
tk}. Man nennt Z1 = {s0 < s1 < · · · < s`} eine Verfeinerung von Z2 = {t0 < t1 < · · · <
tk}, wenn Z1 durch Hinzufugen von Punkten aus Z2 entsteht, in anderen Worten falls
{ti | i = 0, 1, . . . , k} ⊂ {si | i = 0, 1, . . . , `}.
Zu zwei Zerlegungen Z1 und Z2 von [a, b] gibt es Zerlegung Z3 die feiner als Z1 und feiner
als Z2 ist: vereinige hierzu die Mengen der Zerlegungspunkte und ordne sie.
Definition 1.2. Eine Funktion f : [a, b]→ R heißt Treppenfunktion, falls es eine Zerle-
gung Z = {t0 < t1 < · · · < tk} gibt, so dass f |(tj−1,tj) konstant ist fur alle j ∈ {1, 2, . . . , k}.
231
232 6. INTEGRAL-RECHNUNG FUR FUNKTIONEN EINER VERANDERLICHEN
Wir nennen dieses Z eine Zerlegung, die zu der Treppenfunktion passt. Jede Verfeinerung
einer passenden Zerlegung passt ebenfalls. Die Menge der Treppenfunktionen [a, b] → R
nennen wir T [a, b].
Treppenfunktionen sind beschrankt, da sie nur endlich viele Werte annehmen.
LEMMA 1.3. Sind f, f1, f2 ∈ T [a, b], λ1, λ2 ∈ R, dann folgt auch
(a) λ1f1 + λ2f2 ∈ T [a, b], d.h. T [a, b] ist ein Vektorraum.1
(b) f1f2 ∈ T [a, b], d.h. T [a, b] ist ein Ring bzw. eine Algebra.2
(c) max{f1, f2} ∈ T [a, b] und min{f1, f2} ∈ T [a, b] 3
(d) |f | = max{f,−f} ∈ T [a, b]
Beweis klar.
Definition 1.4. Fur eine Treppenfunktion f ∈ T [a, b] mit passender Zerlegung Z =
{t0 < t1 < · · · < tk} definieren wir das Integral∫ b
a
(Z) f(x) dx :=k∑j=1
(tj − tj−1) f
(tj−1 + tj
2
)∈ R.
Positive Treppenfunktion. Die Flache darunter ist bunt und ergibt das Integral
Wenn Z1 und Z2 zu einer Treppenfunktion f passen, so gilt∫ b
a
(Z1) f(x) dx =
∫ b
a
(Z2) f(x) dx.
1Hier wird wieder wie immer definiert (λ1f1 + λ2f2)(x) := λ1f1(x) + λ2f2(x).
2Hier wird wieder wie immer definiert (f1f2)(x) := f1(x)f2(x).3Hier wird wieder wie immer definiert max{f1, f2}(x) := max{f1(x), f2(x)} und min{f1, f2}(x) :=
min{f1(x), f2(x)}
2. DAS RIEMANN-INTEGRAL 233
Wir schreiben hierfur deswegen ab sofort einfach∫ b
a
f(x) dx.
PROPOSITION 1.5. Die Abbildung∫ ba
: T [a, b]→ R ist
(1) linear, d.h.
∀f1, f2 ∈ T [a, b] : ∀λ1, λ2 ∈ R :
∫ b
a
(λ1f1(x)+λ2f2(x)) dx = λ1
∫ b
a
f1(x) dx+λ2
∫ b
a
f2(x) dx
(2) monoton, d.h.
∀f1, f2 ∈ T [a, b] :(f1 ≤ f2 =⇒
∫ b
a
f1(x) dx ≤∫ b
a
f2(x) dx)
Beweis klar aus der Konstruktion des Integrals.
2. Das Riemann-Integral
f ∈ R[a,b] ist nach oben beschrankt ⇐⇒ ∃g ∈ T [a, b] : g ≥ f ⇐⇒ (T [a, b])≥f 6= ∅
f ∈ R[a,b] ist nach unten beschrankt ⇐⇒ ∃g ∈ T [a, b] : g ≤ f ⇐⇒ (T [a, b])≤f 6= ∅
Definition 2.1. Sei f : [a, b] → R eine beschrankte Funktion. Wir definieren das rie-
mannsche Oberintegral als∫ b
a
f(x) dx := inf
{∫ b
a
g(x) dx∣∣∣ g ∈ (T [a, b])≥f
}und das riemannsche Unterintegral als∫ b
a
f(x) dx := sup
{∫ b
a
g(x) dx∣∣∣ g ∈ (T [a, b])≤f
}
234 6. INTEGRAL-RECHNUNG FUR FUNKTIONEN EINER VERANDERLICHEN
Fur die beschrankte Funktion f gilt
−∞ <
∫ b
a
f(x) dx ≤∫ b
a
f(x) dx < ∞
Ist f ∈ T [a, b], so gilt ∫ b
a
f(x) dx =
∫ b
a
f(x) dx =
∫ b
a
f(x).
Definition 2.2. Man nennt f ∈ R[a,b] Riemann-integrierbar, falls f beschrankt ist und
falls ∫ b
a
f(x) dx =
∫ b
a
f(x) dx.
In diesem Fall nennt man ∫ b
a
f(x) dx :=
∫ b
a
f(x) dx
das Riemann-Integral von f .
R[a, b] := {f ∈ R[a,b] | f ist Riemann-integrierbar}
LEMMA 2.3 (Riemannsches Kriterium). Sei f ∈ R[a,b]. Dann gilt
f ∈ R[a, b] ⇐⇒ ∀ε ∈ R>0 : ∃gu, go ∈ T [a, b] : ( gu ≤ f ≤ go)∧(∫ b
a
go(x) dx−∫ b
a
gu(x) dx ≤ ε
).
Fur gu und go wie oben gilt dann wegen der Monotonie∫ b
a
gu(x) dx ≤∫ b
a
f(x) dx ≤∫ b
a
go(x) dx.
Eine stetige Funktion mit Treppenfunktionen gu darunter und go daruber.
2. DAS RIEMANN-INTEGRAL 235
Beweis.
”=⇒“: Auf Grund der Definition des Oberintegrals gibt es eine Treppenfunktion go ≥ f
mit∫ bago(x) dx ≤
∫ baf(x) dx + ε/2. Auf Grund der Definition des Unterintegrals gibt es
eine Treppenfunktion gu ≤ f mit∫ bagu(x) dx ≥
∫ baf(x) dx− ε/2. Da da Oberintegral von
f mit dem Unterintegral ubereinstimmt, gilt∫ b
a
go(x) dx−∫ b
a
gu(x) dx ≤ ε
”⇐=“: Gilt die rechte Seite, so haben wir fur jedes ε > 0:
0 ≤∫ b
a
f(x) dx−∫ b
a
f(x) dx ≤∫ b
a
go(x) dx−∫ b
a
gu(x) dx ≤ ε.
Daraus folgt die Riemann-Integrierbarkeit. Mi 6.2.
LEMMA 2.4. Sei a ≤ b. Sind f, f1, f2 ∈ R[a, b], λ1, λ2 ∈ R dann gilt:
(a) −f ∈ R[a, b] und ∫ b
a
(−f)(x) dx = −∫ b
a
f(x) dx .
(b) λ1f1 + λ2f2 ∈ R[a, b], d.h. R[a, b] ist ein Vektorraum. Die Abbildung∫ b
a
: R[a, b]→ R, f 7→∫ b
a
f(x) dx
ist linear.
(c) f1f2 ∈ R[a, b], d.h. R[a, b] ist ein Ring bzw. eine Algebra.
(d) max{f1, f2} ∈ R[a, b] und min{f1, f2} ∈ R[a, b]
(e) |f | = max{f,−f} ∈ R[a, b]
236 6. INTEGRAL-RECHNUNG FUR FUNKTIONEN EINER VERANDERLICHEN
Beweis.
(a): Aus
g ∈ (T [a, b])≤−f ⇐⇒ −g ∈ (T [a, b])≥f
folgt ∫ b
a
(−f)(x) dx = −∫ b
a
f(x) dx
und genauso ∫ b
a
(−f)(x) dx = −∫ b
a
f(x) dx .
(b):
Fall λ1 ≥ 0 und λ2 ≥ 0: Sei f1,u ∈ (T [a, b])≤f1 und f2,u ∈ (T [a, b])≤f2 , dann gilt wegen
Lemma 1.3 (a) λ1f1,u + λ2f2,u ∈ (T [a, b])≤λ1f1+λ2f2 . Es folgt∫ b
a
(λ1f1(x) + λ2f2)(x) dx ≥∫ b
a
(λ1f1,u + λ2f2,u)(x) dx
Prop. 1.5(1)= λ1
∫ b
a
f1,u(x) dx+ λ2
∫ b
a
f2,u(x) dx
und somit durch Bildung der Suprema∫ b
a
(λ1f1(x) + λ2f2)(x) dx ≥ λ1
∫ b
a
f1(x) dx+ λ2
∫ b
a
f2(x) dx.
Analog mit oberen Schranken:∫ b
a
(λ1f1(x) + λ2f2)(x) dx ≤ λ1
∫ b
a
f1(x) dx+ λ2
∫ b
a
f2(x) dx.
Der allgemeine Fall: folgt dann mit (a).
(d): Wir zeigen zunachst: Ist f ∈ R[a, b], dann auch f+ := max{f, 0}.
2. DAS RIEMANN-INTEGRAL 237
Sei also f ∈ R[a, b] und ε > 0 gegeben. Wir nehmen g, h ∈ T [a, b] mit g ≤ f ≤ h und∫ bah(x) dx−
∫ bag(x) dx ≤ ε. Wir setzen g+ := max{g, 0} ∈ T [a, b] und h+ := max{h, 0} ∈
T [a, b]. Dann gilt g+ ≤ f+ ≤ h+ und
h+(x)− g+(x) =
h(x)− g+(x) falls h(x) ≥ 0
0 falls h(x) < 0
≤ h(x)− g(x)
Also ∫ b
a
h+(x) dx−∫ b
a
g+(x) dx ≤∫ b
a
h(x) dx−∫ b
a
g(x) dx ≤ ε.
Also ist dann f+ ∈ R[a, b].
Wegen max{f1, f2} = f2 + max{f1 − f2, 0} und min{f1, f2} = f2 −max{f2 − f1, 0} folgt
dann (d).
(c):
Der Fall f1 ≥ 0 und f2 ≥ 0: Bestimme zu j ∈ {1, 2}: fj,u, fj,o ∈ T [a, b] mit
0 ≤ fj,u ≤ fj ≤ fj,o ≤ Cj := sup{fj(x) | x ∈ [a, b]}
und ∫ b
a
fj,o(x) dx−∫ b
a
fj,u(x) dx ≤ ε.
Aus Lemma 1.3 (b) folgt f1,uf2,u ∈ T [a, b] und f1,of2,o ∈ T [a, b]. Ferner gilt∫ b
a
f1,o(x)f2,o(x) dx−∫ b
a
f1,u(x)f2,u(x) dx
≤∫ b
a
f1,o(x)(f2,o(x)− f2,u(x)
)dx+
∫ b
a
(f1,o(x)− f1,u(x)
)f2,u(x) dx
≤ C2ε+ C1ε .
238 6. INTEGRAL-RECHNUNG FUR FUNKTIONEN EINER VERANDERLICHEN
Der allgemeine Fall folgt dann aus der Gleichung
f1f2 = max{f1, 0}max{f2, 0} −max{−f1, 0}max{f2, 0}
−max{f1, 0}max{−f2, 0}+ max{−f1, 0}max{−f2, 0}.
(e): folgt direkt aus (d).
LEMMA 2.5 (Monotonie). Seien, f1, f2 ∈ R[a, b]. Ist f1 ≤ f2, so haben wir∫ b
a
f1(x) dx ≤∫ b
a
f2(x) dx.
Beweis. 0 ∈ T [a, b], 0 ≤ f2 − f1. Es folgt
0 =
∫ b
a
0 dx(∗)≤∫ b
a
(f2 − f1)(x) dxLemma 2.4(b)
=
∫ b
a
f2(x) dx−∫ b
a
f1(x) dx .
Die Ungleichung (∗) gilt nach Definition des Unterintegrals: 4 es ist definiert als das
Supremum der Menge
A :={∫ b
a
g(x) dx∣∣ g ∈ (T [a, b])≤f
}3∫ b
a
0 dx = 0.
Notation: Fur f : D → R definiere ‖f‖∞ := sup{|f(x)|
∣∣x ∈ D} ∈ [0,∞].
4 An der Stelle (∗) kann man nicht mit der Monotonie des Integrals argumentieren. Denn die Mo-
notonie fur Treppenfunktion (Proposition 1.5 (2)) ist nicht anwendbar, da f im allgemeinen keine Trep-
penfunktion ist. Und die Monotonie fur Riemann-integrierbare Funktionen wollen wir ja hier erst zeigen.
Wenn wir sie verwenden wurden, so ware dies ein Zirkelschluss: Ein Beweis, in dem man die zu beweisende
Aussage bereits verwendet und der deswegen nicht zulassig ist.
2. DAS RIEMANN-INTEGRAL 239
PROPOSITION 2.6. Fur f ∈ R[a, b] gilt:∣∣∣∫ b
a
f(x) dx∣∣∣ ≤ ∫ b
a
|f(x)| dx ≤ ‖f‖∞(b− a)
Beweis. Wegen f = max{f, 0} −max{−f, 0} und |f | = max{f, 0}+ max{−f, 0} folgt∣∣∣∫ b
a
f(x) dx∣∣∣ ≤ ∣∣∣∫ b
a
max{f(x), 0} dx︸ ︷︷ ︸≥0
−∫ b
a
max{−f(x), 0} dx︸ ︷︷ ︸≥0
∣∣∣(∗)≤
∫ b
a
max{f(x), 0} dx+
∫ b
a
max{−f(x), 0} dx
=
∫ b
a
|f(x)| dx,
wobei wir an der Stelle (∗) die Dreiecks-Ungleichung |a− b| ≤ |a|+ |b| benutzt haben.
Wegen |f(x)| ≤ ‖f‖∞ folgt mit der Monotonie∫ b
a
|f(x)| dx ≤∫ b
a
‖f‖∞ dx ≤ ‖f‖∞(b− a).
LEMMA 2.7. Seien a, b, c ∈ R mit a < b < c, und f : [a, c]→ R. Dann gilt
f ∈ R[a, c] ⇐⇒ f |[a,b] ∈ R[a, b] und f |[b,c] ∈ R[b, c]
und wenn f Riemann-integrierbar ist, so gilt∫ c
a
f(x) dx =
∫ b
a
f |[a,b](x) dx+
∫ c
b
f |[b,c](x) dx.
Beweis. Man wahlt wieder geeignete Treppenfunktionen oberhalb und unterhalb von f
und setzt diese zusammen oder durchtrennt sie an der Stelle b.
240 6. INTEGRAL-RECHNUNG FUR FUNKTIONEN EINER VERANDERLICHEN
Notation 2.8. Die Integrationsvariable (bis jetzt immer x) kann durch jede andere noch
nicht vergebene Variable ersetzt werden:∫ b
a
f(x) dx =
∫ b
a
f(y) dy = · · · =∫ b
a
f(t) dt .
Aber bereits vergebene Variablen durfen nicht als Integrationsvariable benutzt werden,
zum Beispiel ist ∫ b
a
f(a) da
ist nicht erlaubt.
Gilt [a, b] ⊂ [c, d] und f ∈ R[c, d], dann schreiben wir∫ b
a
f(x) dx :=
∫ b
a
f |[a,b](x) dx.
Gilt a > b, und f ∈ R[b, a], so definieren wir∫ b
a
f(x) dx := −∫ a
b
f(x) dx.
Insbesondere gilt fur alle reelle Zahlen a, b, c ∈ [d, e] ⊂ R und fur alle f ∈ R[d, e]:∫ c
a
f(x) dx =
∫ b
a
f(x) dx+
∫ c
b
f(x) dx.
3. Monotone Funktionen sind Riemann-integrierbar
SATZ 3.1. Sei a, b ∈ R, a < b, und f : [a, b] → R eine monotone Funktion. Dann ist
f ∈ R[a, b].
Beweis. O.B.d.A. sei f monoton wachsend. Sei ε ∈ R>0 gegeben. Zu einer Zahl k ∈ N,
die wir noch geeignet wahlen werden, definieren wir:
tj := a+ jb− ak
.
3. MONOTONE FUNKTIONEN SIND RIEMANN-INTEGRIERBAR 241
Insbesondere ist {t0 < t1 < · · · < tk} eine Zerlegung von [a, b]. Wir definieren die Trep-
penfunktionen go, gu ∈ T [a, b], so dass fur alle j ∈ {1, 2, . . . k} und alle x ∈ [tj−1, tj)
gilt
go(x) = f(tj), gu(x) = f(tj−1);
und go(b) = gu(b) = f(b).
Bild einer monoton wachsenden Funktion f und von Treppenfunktionen gu, go wie oben.
Da f monoton wachsend ist gilt gu ≤ f ≤ go. Außerdem
∫ b
a
go(x) dx =k∑j=1
(tj − tj−1) go
(tj−1 + tj
2
)=
k∑j=1
b− ak
f(tj),
∫ b
a
gu(x) dx =k∑j=1
(tj − tj−1) gu
(tj−1 + tj
2
)=
k∑j=1
b− ak
f(tj−1).
Somit
∫ b
a
go(x) dx−∫ b
a
gu(x) dx =b− ak
(k∑j=1
f(tj)−k−1∑`=0
f(t`)
)=b− ak
(f(b)− f(a))
Wenn wir also bei der obigen Konstruktion der tj, die Zahl k ∈ N so groß wahlen, dass
k ≥ b− aε
(f(b)− f(a)),
dann gilt∫ bago(x) dx−
∫ bagu(x) dx ≤ ε. Mit dem riemannschen Kriterium Lemma 2.3 folgt
die Riemann-Integrierbarkeit.
242 6. INTEGRAL-RECHNUNG FUR FUNKTIONEN EINER VERANDERLICHEN
4. Stetige Funktionen sind Riemann-integrierbar
LEMMA 4.1. Sei f : [a, b]→ R stetig. Dann ist f auch gleichmaßig stetig, d.h.
(4.2) ∀ε ∈ R>0 : ∃δ ∈ R>0 : ∀x, y ∈ [a, b] :(|x− y| < δ =⇒ |f(x)− f(y)| < ε
).
Beweis. Angenommen f ist nicht gleichmaßig stetig. Es gibt dann ein ε > 0, so dass
(4.3) ∀δ ∈ R>0 : ∃x, y ∈ [a, b] :(|x− y| < δ
)∧(|f(x)− f(y)| ≥ ε
).
Zu jedem n ∈ N, und δ := δn := 1/n wahlen wir xn, yn ∈ [a, b] wie in (6.15). Auf Grund des
Satzes von Bolzano-Weierstraß (Korollar 1.35 in Kapitel 2) gibt es eine Teilfolge (xnk)k∈N,
so dass
limk→∞
xnk
existiert. Sei x := limk→∞ xnk ∈ [a, b]. Wegen |xnk−ynk | < 1/nk gilt auch x = limk→∞ ynk .
Da f stetig ist gilt dann auch
f(x) = limk→∞
f(xnk) = limk→∞
f(ynk),
also
limk→∞
(f(xnk)− f(ynk)) = 0.
Dies widerspricht jedoch der obigen Wahl von xnk und ynk , denn diese haben wir so
gewahlt, dass fur alle k ∈ N die Ungleichung |f(xnk)− f(ynk)| ≥ ε gilt.5
Wir haben gezeigt, dass die Annahme, f sei nicht gleichmaßig stetig, einen Widerspruch
impliziert. Also muss f gleichmaßig stetig sein.
5Und naturlich fur das feste oben gewahlte ε > 0!
5. HAUPTSATZ DER DIFFERENTIAL- UND INTEGRALRECHNUNG 243
SATZ 4.4. Sei f : [a, b]→ R stetig. Dann ist f Riemann-integrierbar. In anderen Worten:
C0([a, b]) ⊂ R[a, b].
Beweis. Zu einem gegebenen ε > 0 wahle δ > 0 wie in (4.2). Dann wahlen wir kε ∈ Nr{0}
so groß, dass (b− a)/kε < δ. Definiere ahnlich wie oben
tj := a+ jb− akε
.
Wir definieren die Treppenfunktionen go, gu ∈ T [a, b], so dass fur alle j ∈ {1, 2, . . . k} und
alle x ∈ [tj−1, tj) gilt
go(x) = sup{f(x) | x ∈ [tj−1, tj)}, gu(x) = inf{f(x) | x ∈ [tj−1, tj)}
und go(b) = gu(b) = f(b). Dann gilt 0 ≤ go(x)− gu(x) ≤ ε, und deswegen∫ b
a
go(x) dx−∫ b
a
gu(x) dx ≤ ε(b− a),
und offensichtlich gu ≤ f ≤ go. Mit Lemma 2.3 folgt die Riemann-Integrierbarkeit.
!ACHTUNG!. Wenn eine Funktion f : (a, b)→ R stetig ist, so kann man daraus nicht
schließen, dass f Riemann-integrierbar ist. Beispiel: Die Funktion f : (0, 1)→ R, x 7→ 1/x,
ist stetig, aber nicht beschrankt und somit auch nicht Riemann-intergierbar.
5. Hauptsatz der Differential- und Integralrechnung
SATZ 5.1 (Hauptsatz der Differential- und Integralrechnung, Teil I). Sei f ∈ R[a, b],
γ ∈ [a, b]. Definiere
F : [a, b] → R, F (x) :=
∫ x
γ
f(t) dt.
Dann gilt
244 6. INTEGRAL-RECHNUNG FUR FUNKTIONEN EINER VERANDERLICHEN
(1) F ist stetig auf [a, b].
(2) Ist f stetig in x0 ∈ (a, b), so ist F differenzierbar in x0, und F ′(x0) = f(x0).Fr 8.2.
Beweis.
(1) f ∈ R[a, b], also f beschrankt, somit
‖f‖∞(def)= sup
{|f(x)|
∣∣x ∈ [a, b]}<∞.
Sei x, x0 ∈ [a, b].∣∣∣F (x)− F (x0)∣∣∣ =
∣∣∣∣∫ x
x0
f(t) dt
∣∣∣∣ ≤ ∣∣∣∣∫ x
x0
|f(t)| dt∣∣∣∣ ≤ |x− x0| ‖f‖∞
Zu gegebenem ε > 0 wahlen wir nun δ := ε/‖f‖∞ > 0 und dann ist das ε-δ-Kriterium
fur Stetigkeit in x0 erfullt.
(2) ∣∣∣∣F (x)− F (x0)
x− x0
− f(x0)
∣∣∣∣ =
∣∣∣∣ 1
x− x0
∣∣∣∣ ∣∣∣∣∫ x
x0
(f(t)− f(x0)) dt
∣∣∣∣≤
∣∣∣∣ 1
x− x0
∣∣∣∣ ∣∣∣∣∫ x
x0
|(f(t)− f(x0))| dt∣∣∣∣
≤ sup{|f(t)− f(x0)|
∣∣∣ t ∈ [x, x0] bzw. t ∈ [x0, x]}
Wir fixieren nun ein ε > 0. Da f in x0 stetig gibt es zu diesem ε > 0 ein δ > 0, so
dass fur alle t ∈ [a, b] mit |t− x0| ≤ δ gilt:
|f(t)− f(x0)| ≤ ε,
insbesondere gilt fur x ∈ [a, b] ∩ [x0 − δ, x0 + δ]:∣∣∣∣F (x)− F (x0)
x− x0
− f(x0)
∣∣∣∣ ≤ sup{|f(t)− f(x0)|
∣∣∣ t ∈ [x, x0] bzw. t ∈ [x0, x]}≤ ε.
5. HAUPTSATZ DER DIFFERENTIAL- UND INTEGRALRECHNUNG 245
Daraus ergibt sich
limx→x0
(F (x)− F (x0)
x− x0
− f(x0)
)= 0
und somit die Behauptung im zweiten Teil.
Ist I 6= ∅ ein Intervall, so sei◦I := (inf I, sup I) das offene Intervall mit denselben Grenzen
wie I.
Bsp: I := [a, b],◦I = (a, b). Ist J ein offenes Intervall in R, dann
◦J = J .
Fur offene Teilmengen U definieren wir◦U := U .
Definition 5.2. Sei I ein Intervall oder eine offene Teilmenge von R, und f : I → R.
Wir sagen F : I → R ist eine Stammfunktion von f , wenn F stetig ist, F | ◦I
differenzierbar
ist und F ′(x) = f(x) fur alle x ∈◦I.
Beispiele 5.3.
(1) Der Hauptsatz der Diff.- und Int.-Rechnung I besagt, dass stetige Funktionen
f : [a, b]→ R immer eine Stammfunktion haben.
(2) Auch stetige Funktionen f : (c, d) → R besitzen immer eine Stammfunktion:
wahle γ ∈ (c, d), dann ist F (x) =∫ xγf(t) dt eine Stammfunktion.
(3) Ist U ⊂ R offen und f : U → R stetig, dann besitzt f ebenfalls eine Stammfunk-
tion. Denn ist U ⊂ R offen, dann gibt es eine Familie offener Intervalle (Uα)α∈A,
so dass U =⋃α∈A Uα, Uα ∩ Uβ = ∅ fur α 6= β6. Man konstruiert nun auf jedem
Uα die Stammfunktion wie in (2).
6Man sagt zu letzterer Eigenschaft: (Uα)α∈A ist eine Familie von paarweise disjunkten offenen
Intervallen
246 6. INTEGRAL-RECHNUNG FUR FUNKTIONEN EINER VERANDERLICHEN
(4) Es gibt Riemann-integrierbare Funktionen ohne Stammfunktion. Beispiel
f : [−1, 1]→ R, f(x) :=
−1 , falls x ≤ 0
1 , falls x > 0
f ∈ R[−1, 1], da f eine Treppenfunktion ist. Angenommen f hatte eine Stamm-
funktion F : [−1, 1]→ R. Dann gilt F ′(x) = 1 fur x > 0, somit gibt es eine c ∈ R,
so dass fur alle x ∈ (0, 1) gilt: F (x) = c+ x. Es gilt F ′(x) = −1 fur x ≤ 0, somit
gibt es ein d ∈ R mir F (x) = d − x fur d ≤ 0. Da F stetig ist, gilt c = d, also
F (x) = c + |x| fur alle x ∈ [−1, 1]. Diese Funktion ist nicht in 0 differenzierbar,
also ist F keine Stammfunktion.
(5) Es gibt nicht-Riemann-integrierbare Funktionen mit Stammfunktion. Wir defi-
nieren:
F : R→ R, F (x) :=
x2 sin
(1
x2
), falls x > 0
0, falls x ≤ 0.
Dann ist F differenzierbar auf ganz R und somit ist F |[−1,1] eine Stammfunktion
von f := F ′|[−1,1] : [−1, 1]→ R. Man rechnet nach fur j →∞:
xj := (2πj + π)−1/2 → 0
f(xj) = 21√
2πj + πsin (2πj + π)︸ ︷︷ ︸
=0
− 2√
2πj + π cos (2πj + π)︸ ︷︷ ︸=−1
→ ∞
Deswegen ist f nicht beschrankt und deswegen auch nicht Riemann-integrierbar.
5. HAUPTSATZ DER DIFFERENTIAL- UND INTEGRALRECHNUNG 247
SATZ 5.4 (Hauptsatz der Differential- und Integralrechnung, Teil II). Sei f : [a, b] → R
Riemann-integierbar, und F sei eine Stammfunktion von f . Dann gilt fur x, y ∈ [a, b]:
(5.5)
∫ x
y
f(t) dt = F (x)− F (y).
Beweis.
1. Fall: f ist stetig.
F0(x) :=∫ xyf(t) dt ist eine Stammfunktion von f , und deswegen F (x) = F0(x) + F (y).
Daraus folgt die Aussage.
2. Fall: allgemein
O.B.d.A. y < x. Sei go ∈ T [y, x], go ≥ f , und sei Z = {t0 < t1 < . . . < tk} eine zu go
passende Zerlegung von [y, x].
F (x)− F (y) =k∑j=1
(F (tj−1)− F (tj))
1.MWS=
k∑j=1
(tj − tj−1)F ′(ξj)
fur geeignete ξj ∈ (tj−1, tj). Wir rechnen weiter
F (x)− F (y) =k∑j=1
(tj − tj−1)f(ξj)
≤k∑j=1
(tj − tj−1)go(ξj)
=
∫ x
y
go(t) dt
248 6. INTEGRAL-RECHNUNG FUR FUNKTIONEN EINER VERANDERLICHEN
Da dies fur alle Treppenfunktionen oberhalb von f gilt, folgt durch Infimumsbildung:
F (x)− F (y) ≤∫ x
y
f(t) dt
Die Gleichung
F (x)− F (y) ≥∫ x
y
f(t) dt
zeigt man ganz analog. Da f Riemann-integrierbar ist, folgt die Aussage.
Beispiele 5.6.
(1) Eine Stammfunktion der Funktion f : R → R, x 7→∑n
k=0 akxk ist F : R 7→ R,
x 7→∑n
k=0akk+1
xk+1.
(2) Die Stammfunktion der Funktion
f : R→ R, x 7→ 1
x2 + 1
ist F = arctan : R→ (−π/2;π/2) ⊂ R, die Umkehr-Funktion des Tangens. Denn
mit
tan′(y) =1
cos2 y=
sin2 y + cos2 y
cos2 y= tan2 y + 1
und mit Proposition 1.6 in Kapitel 5 sieht man
arctan′(x) =1
tan2(arctan(x)) + 1=
1
x2 + 1.
(3) Es gibt viele Tabellen mit vielen Stammfunktionen, siehe zum Beispiel:
http://de.wikipedia.org/wiki/Tabelle_von_Ableitungs-_und_
Stammfunktionen
Notation 5.7.
F (x)∣∣∣bx=a
:= F (b)− F (a)
5. HAUPTSATZ DER DIFFERENTIAL- UND INTEGRALRECHNUNG 249
Dann schreibt sich (5.5) als ∫ b
a
f(x) dx = F (x)∣∣∣bx=a
.
C0([a, b]) :={f : [a, b]→ R | f stetig
}f ∈ C1([a, b]) ⇐⇒ f ∈ C0([a, b]), f |(a,b) differenzierbar und f ′ kann man zu einer stetigen
Funktionen f ′ : [a, b]→ R fortsetzen.7
SATZ 5.8 (Partielle Integration). Seien a, b ∈ R, a < b und f, g ∈ C1([a, b]). Dann∫ b
a
f ′(x)g(x) dx = f(x)g(x)∣∣∣bx=a−∫ b
a
f(x)g′(x) dx
Beweis. x 7→ f(x)g(x) ist Stammfunktion von x 7→ f ′(x)g(x) + f(x)g′(x).
Beispiel 5.9. Zu berechnen ist A :=∫ ba
cos3 x dx. Setze f(x) = sinx und g(x) = cos2 x.
Es folgt mit partieller Integration:
A =
∫ b
a
f ′(x)g(x) dx = sinx cos2 x∣∣∣bx=a−∫ b
a
(sinx)(−2) sinx cosx dx
Wenn wir nun sin2 x = 1− cos2 x nutzen, so ergibt sich
A = sinx cos2 x∣∣∣bx=a
+ 2
∫ b
a
cosx dx− 2A.
Also
A =1
3(sin b cos2 b− sin a cos2 a)− 2
3(sin b− sin a).
SATZ 5.10 (Integration durch Substitution). Seien a, b, c, d ∈ R, a < b und c < d.
Gegeben sei
7Wir bezeichnen diese Fortsetzung auch einfach mit f ′ und es gilt dann auch
f ′(a) = limx↘a
f(x)− f(a)
x− a, f ′(b) = lim
x↗b
f(x)− f(b)
x− b.
250 6. INTEGRAL-RECHNUNG FUR FUNKTIONEN EINER VERANDERLICHEN
• f ∈ C0([a, b]),
• ϕ ∈ C1([c, d]) mit ϕ#([c, d]) ⊂ [a, b]
Dann gilt ∫ ϕ(d)
ϕ(c)
f(s) ds =
∫ d
c
f(ϕ(t))ϕ′(t) dt.
Beweis. Die Integranden, d.h. die Funktionen f und t 7→ f(ϕ(t))ϕ′(t) =: f(t) sind
stetig, also Riemann-integrierbar und besitzen Stammfunktionen. Sei F : [a, b] → R eine
Stammfunktion von f , dann ist nach Kettenregel F ◦ ϕ : [c, d]→ R eine Stammfunktion
von f . ∫ ϕ(d)
ϕ(c)
f(s) ds = F (ϕ(d))− F (ϕ(c)) =
∫ d
c
f(ϕ(t))ϕ′(t) dt.
Merkregel: Die Leibnizsche Differentialschreibweise (= Verwendung von den”unendlich
kleinen“ Zahlen ds, dt) liefert eine gute Merkregel. 8
s = ϕ(t),
also auch f(ϕ(t)) = f(s). Schreibe
ϕ′(t) = limt→t
ϕ(t)− ϕ(t)
t− t= lim
t→t
s− st− t
=ds
dt
Man lost auf
ds = ϕ′(t) dt
und ersetzt die t-Integrationsgrenzen c und d durch die s-Integrationsgrenzen ϕ(c) und
ϕ(d). Und man hat die Subsitutionsformel.
8Sie ist nicht mathematisch prazise, denn es bleibt ja unklar, was eine unendlich kleine Zahl denn
sein soll. Sie ist aber sehr effizient als Merkregel.
6. UNEIGENTLICHE RIEMANN-INTEGRALE 251
Typische Anwendungen.
1.) ∫ b
a
tet2
dt =1
2
∫ b2
a2es ds =
1
2eb
2 − 1
2ea
2
Hier wurde f(s) = es und ϕ(t) = t2 genutzt.
2.) Sei 0 < a < b.∫ b
a
1
(et − 1)(et + 1)dt =
∫ b
a
1
et(et − 1)(et + 1)et dt =
∫ eb
ea
1
s(s− 1)(s+ 1)ds = siehe Zentralubung
Hier wurde f(s) = 1s(s−1)(s+1)
und ϕ(t) = et genutzt.
Wir machen einen Partialsummenansatz
1
s(s− 1)(s+ 1)=a
s+
b
s− 1+
c
s+ 1
und rechnen aus, dass dieser Ansatz fur a = 1 und b = c = −1/2 funktioniert. somit hat
f : Rr die Stammfunktion
log(s)− 1
2log(s− 1)− 1
2log(s+ 1)
und damit kann dieses Integral explizit berechnet werden.
6. Uneigentliche Riemann-Integrale
Wdh.: F : R −→ R, a ∈ R
a = limx→∞
F (x) ⇐⇒ ∀ε ∈ R>0 : ∃x0 ∈ R : ∀x ∈ R≥x0 : |F (x)− a| < ε
Analog fur F : [a,∞) −→ R und andere Definitionsbereiche.
252 6. INTEGRAL-RECHNUNG FUR FUNKTIONEN EINER VERANDERLICHEN
Definition 6.1 (Uneigentliches Riemann-Integral, oberes Ende). Sei a ∈ R, b ∈ R∪{∞},
a < b, f : [a, b) −→ R.
Wir sagen f ist (am oberen Ende) uneigentlich Riemann-integrierbar falls f |[a,β] ∈ R[a, β]
fur alle β ∈ (a, b) und falls
(6.2)
∫ b
a
f(x) dx := limβ↗b
∫ β
a
f(x) dx
existiert. Wir sagen dazu auch∫ baf(x) dx konvergiert. Wir sagen: das Integral konvergiert
absolut, falls∫ ba|f(x)| dx konvergiert.
Man beachte: die linke Seite von (6.2) ist eine Definition!
Spezialfall: Wenn b < ∞ und falls f = f[a,b) fur ein f ∈ R[a, b] ist, dann gilt wegen dem
Hauptsatz der Differential- und Integralrechnung9:∫ b
a
f(x) dx = limβ→b
∫ β
a
f(x) dx
In diesem Fall gilt also ∫ b
a
f(x) dx =
∫ b
a
f(x) dx.
Definition 6.3 (Uneigentliches Riemann-Integral, unteres Ende und an beiden Enden).
Sei a ∈ R ∪ {−∞}, b ∈ R, a < b, f : (a, b] −→ R.
Wir sagen f ist (am unteren Ende) uneigentlich Riemann-integrierbar falls f |(α,b] ∈ R[α, b]
fur alle α ∈ (a, b) und falls
(6.4)
∫ b
a
f(x) dx := limα↘a
∫ b
α
f(x) dx
existiert.
9Die folgende Zeile ist keine Definition, sondern eine Aussage!
6. UNEIGENTLICHE RIEMANN-INTEGRALE 253
Sei a ∈ R ∪ {−∞}, b ∈ R ∪ {∞}, a < b, f : (a, b) −→ R. Wir sagen f ist (an beiden
Enden) uneigentlich Riemann-integrierbar, falls fur ein γ ∈ (a, b) die Summe
(6.5)
∫ b
a
f(x) dx :=
∫ γ
a
f(x) dx+
∫ b
γ
f(x) dx
existiert.10
Beispiele 6.6.
(1)∫∞
1xa dx konvergiert genau dann, wenn a < −1. Denn
F (r) :=
∫ r
1
xa dx =
1
a+1(ra+1 − 1) fur a 6= −1
log r fur a = −1
Im Limes r →∞ gilt
F (r)→
∞ fur a ≥ −1
− 1a+1
fur a < −1
(2)∫ 1
0xa dx konvergiert genau dann, wenn a > −1.
ENDE DER VORLESUNG ANALYSIS I
10Hierzu mussen beide Integrale der rechten Seite von (6.5) konvergieren. Die Existenz und der Wert
von∫ baf(x) dx ist dann unabhangig von γ.
KAPITEL 7
Stetigkeit und Differenzierbarkeit von Grenzwerten und Reihen24.4.
Vereinfachte Notationen ab jetzt:
• Quantoren hinter Aussagen sind erlaubt, falls keine Missverstandnisse zu erwar-
ten sind.
• Wir schreiben im(f) fur B(f),
• f(A) fur f#(A),
• und f−1(A) fur f#(A).
• Wir schreiben oft ∀ε > 0 statt ∀ε ∈ R>0, analog ∃δ > 0, . . .
1. Metrische Raume: Wiederholung und Cauchy-Folgen
Ein metrischer Raum ist ein Paar (M,d), wobei die Metrik d : M × M −→ R≥0 die
folgenden Eigenschaften fur alle x, y, z ∈M erfullen moge
(a) d(x, y) = 0 ⇐⇒ x = y (Definitheit)
(b) d(x, y) = d(y, x) (Symmetrie)
(c) d(x, y) ≤ d(x, z) + d(z, y) (Dreiecks-Ungleichung)
r ∈ R≥0, x ∈M
offener Ball Br(x) := {y ∈M | d(x, y) < r}
255
256 7. STETIGK. UND DIFF’BARK. VON GRENZWERTEN UND REIHEN
abgeschlossener Ball Br(x) := {y ∈M | d(x, y) ≤ r}
Sei (xn)n∈N eine M -wertige Folge, a ∈M .
Konvergenz.
(xn)n∈N konvergiert gegen a
:⇐⇒ limn→∞
xn = a
:⇐⇒ limn→∞
d(xn, a) = 0
⇐⇒ ∀ε > 0 : ∃N ∈ N : ∀n ∈ N≥N : d(xn, a) < ε
⇐⇒ ∀ε > 0 : ∃N ∈ N : ∀n ∈ N≥N : xn ∈ Bε(a)
Cauchy-Folge.
(xn)n∈N ist eine Cauchy-Folge
⇐⇒ ∀ε > 0 : ∃N ∈ N : ∀n,m ∈ N≥N : d(xn, xm) < ε
SATZ 1.1. Jede konvergente Folge ist eine Cauchy-Folge.
Den Beweis erhalt man aus dem Beweis von Satz 1.38 aus Kapitel 3, indem man |x− y|
durch d(x, y) ersetzt.
Beweis. Es gelte limj→∞ aj = a. Das heißt: fur alle ε ∈ R>0 gibt es ein j0 ∈ N, so dass
fur alle naturlichen Zahlen j ≥ j0 gilt: d(aj, a) ≤ ε.
1. METRISCHE RAUME: WIEDERHOLUNG UND CAUCHY-FOLGEN 257
Fur solch ein ε und ein passendes j0 nehmen wir nun naturliche Zahlen j ≥ j0 und k ≥ j0
und rechnen nach:
d(aj, ak) ≤ d(aj, a) + d(a, ak) ≤ ε+ ε = 2ε.
Wir haben nun also gezeigt:
∀ε ∈ R>0 : ∃j0 ∈ N : ∀j, k ∈ N≥j0 : d(aj, ak) ≤ 2ε.
Wegen Lemma 1.11 aus Kapitel 3 ist dies aquivalent zur definierenden Eigenschaft einer
Cauchy-Folge.
Definition 1.2. Ein metrischer Raum (M,d) heißt vollstandig, wenn jede M -wertige
Cauchy-Folge in (M,d) konvergiert.
Ist (M,d) ein metrischer Raum und N eine Teilmenge. Dann ist d|N×N eine Metrik auf
N , die von (M,d) auf N induzierte Metrik, siehe Beispiel 5.3 in Kapitel 4.
UBUNG 1.3. Sei (M,d) ein metrischer Raum. Dann ist N ⊂ M abgeschlossen genau
dann, wenn fur alle N -wertigen Folgen, die in (M,d) konvergieren, der Grenzwert in N
liegt.
UBUNG 1.4. Sei N eine Teilmenge eines metrischen Raumes (M,d) und sei d die indu-
zierte Metrik auf N .
(a) Ist (N, d) vollstandig, so ist N abgeschlossen in M .
(b) Ist (M,d) vollstandig, so gilt
(N, d) vollstandig ⇐⇒ N abgeschlossen in M.
258 7. STETIGK. UND DIFF’BARK. VON GRENZWERTEN UND REIHEN
2. Punktweise und gleichmaßige Konvergenz
Im folgenden sei (Y, d) ein metrischer Raum
Die wichtigsten Beispiele, an die Sie im folgenden denken sollten, sind Y = R und Y = C
mit d(x, y) := |x−y|. Spater werden wir zum Beispiel fur Y auch Vektorraume (mit einer
Norm) oder noch andere Raume betrachten. Wir betrachten nun Funktionen D −→ Y .
Definition 2.1. Eine Folge von Funktionen besteht aus einer Menge D, einem metrischen
Raum (Y, d), und einer Folge (fn)n∈N, wobei wir fur jedes n ∈ N eine Funktion fn : D −→
Y haben.
Sei f : D −→ Y eine weitere Funktion. Wir sagen dann: (fn) konvergiert punktweise
gegen f : D −→ Y , falls fur alle x ∈ D gilt:
limn→∞
fn(x) = f(x).
Der Begriff der punktweisen Konvergenz erscheint ein naheliegender Begriff fur die Kon-
vergenz von solchen Funktionen.
Beispiel 2.2. Y := C. Gegeben sei eine Potenzreihe p(x) :=∑∞
j=0 ajxj mit Konvergenz-
radius ρ.
fn(x) :=n∑j=0
ajxj.
Dann konvergiert (fn : Bρ(0) −→ C)n∈N punktweise gegen p : Bρ(0) −→ C.
Da nun alle fn stetig sind, kann man hoffen, dass wir dadurch zeigen konnen, dass p :
Bρ(0) −→ C stetig ist. Hierbei tritt aber ein Problem auf, das am folgenden Beispiel
deutlich wird.
2. PUNKTWEISE UND GLEICHMASSIGE KONVERGENZ 259
Beispiel 2.3. D = [0, 1], Y := R, fn(x) := xn.
0.2 0.4 0.6 0.8 1
0.2
0.4
0.6
0.8
1f0
f1
f2f3 f4
x
fn(x)
Abbildung 7: Die Graphen der Funktionen fn
fn(x)→ f(x) :=
0 fur x < 1
1 fur x = 1
(fn) konvergiert punktweise gegen f : [0, 1] −→ R. Alle Funktionen fn : [0, 1] −→ R sind
stetig. Dennoch ist die Grenzfunktion f nicht stetig.
Losung des Problems: Gleichmaßige Konvergenz.
260 7. STETIGK. UND DIFF’BARK. VON GRENZWERTEN UND REIHEN
Wir machen aus Abb(D, Y ) = Y D einen metrischen Raum. Fur f, g ∈ Abb(D, Y ) defi-
nieren wir die Supremums-Distanz
dsup(f, g) := supx∈D
{d(f(x), g(x)
)}∈ [0,∞].
(Abb(D, Y ), dsup) erfullt (a) Definitheit, (b) Symmetrie, (c) Dreiecks-Ungleichung; aber
es ist keine Norm, da dsup(f, g) =∞ moglich ist. Wir setzen deswegen
dglm(f, g) := min{dsup(f, g), 289}.
Dann ist (Abb(D, Y ), dglm) ein metrischer Raum1.
Definition 2.4. Sei (fn : D −→ Y )n∈N eine Folge von Funktionen. Wir definieren
(fn) konvergiert gleichmaßig gegen f : D −→ Y
:⇐⇒ (fn) konvergiert gegen f im metrischen Raum (Abb(D, Y ), dglm)
⇐⇒ dglm(fn, f)→ 0 fur n→∞
⇐⇒ supx∈D
{d(f(x), g(x)
)}→ 0 fur n→∞
⇐⇒ ∀ε ∈ R>0 : ∃n0 ∈ N : ∀n ∈ N≥n0 : ∀x ∈ D : d(fn(x), f(x)) ≤ ε
Y⊂C⇐⇒ ∀ε ∈ R>0 : ∃n0 ∈ N : ∀n ∈ N≥n0 : ∀x ∈ D : |fn(x)− f(x)| ≤ ε
Logische Verknupfung
∃x ∈M : ∀y ∈ N : A(x, y) =⇒ ∀y ∈ N : ∃x ∈M : A(x, y)
1Man kann in dieser Konstruktion naturlich 289 durch jede andere positive reelle Zahl ersetzen.
2. PUNKTWEISE UND GLEICHMASSIGE KONVERGENZ 261
Somit:
∀ε ∈ R>0 : ∃n0 ∈ N : ∀n ∈ N≥n0 : ∀x ∈ D : d(fn(x), f(x)) ≤ ε
=⇒ ∀x ∈ D : ∀ε ∈ R>0 : ∃n0 ∈ N : ∀n ∈ N≥n0 : d(fn(x), f(x)) ≤ ε
Also:
Gleichmaßige Konvergenz =⇒ Punktweise Konvergenz
!ACHTUNG!. Die Umkehrung ist falsch. Punktweise Konvergenz impliziert nicht gleichmaßi-
ge. In Beispiel 2.3 konvergiert (fn) punktweise gegen f , aber nicht gleichmaßig.
Von nun an sei D ein metrischer Raum mit Metrik dD, zum Beispiel ein Intervall, eine
Teilmenge von Rn oder eine Teilmenge von Cn mit der induzierten Metrik.
SATZ 2.5. Sei (fn : D −→ Y )n∈N eine Folge von stetigen Funktionen, die gleichmaßig
gegen f : D −→ Y konvergiert. Dann ist auch f : D −→ Y stetig.
Beispiel 2.6 (Fortsetzung Beispiel 2.2). Sei wieder ρ der Konvergenzradius von p(x) =∑∞j=0 ajx
j, 0 < R < ρ. Definiere die Partialsummen
fn(x) :=n∑j=0
ajxj.
Dann gilt fur x ∈ BR(0):
|fn(x)− p(x)| =∣∣∣ ∞∑j=n+1
ajxj∣∣∣ ≤ ∞∑
j=n+1
|aj||x|j ≤∞∑
j=n+1
|aj|Rj → 0.
Wir haben Konvergenz gegen 0, da∑∞
j=0 ajRj absolut konvergiert. Also konvergiert (fn :
BR(0) −→ C)n∈N gleichmaßig gegen p : BR(0) −→ C. 2 Wir sehen also somit, dass
2Achtung: Fur viele Potenzreihen konvergiert f ′n : Bρ(0) → C nicht gleichmaßig. Erst nach Ein-
schrankung auf einen etwas kleineren Ball BR(0) erhalten wir gleichmaßige Konvergenz.
262 7. STETIGK. UND DIFF’BARK. VON GRENZWERTEN UND REIHEN
p|BR(0) : BR(0) −→ C stetig ist. Da dies fur alle R ∈ (0, ρ) gilt, sehen wir, dass p|Bρ(0) :
Bρ(0) −→ C ebenfalls stetig ist.26.4.
Beweis des Satzes. Damit unsere Notation einfach ist, beschranken wir uns auf den Fall
D ⊂ C, Y ⊂ C, dD(x, y) = |x − y|, d(x, y) = |x − y|. Den allgemeinen Fall beweist man
vollig analog.
Wir zeigen die Stetigkeit von f in x0. Sei ε ∈ R>0 gegeben. Wir wahlen hierzu ein N ∈ N,
so dass fur alle naturlichen Zahlen n ≥ N gilt:
dglm(f, fn) < ε :=ε
3
Da fN stetig in x0 stetig ist, gibt es ein δ ∈ R>0, so dass
|x− x0| < δ =⇒ |fN(x)− fN(x0)| < ε.
Wir schließen, dass fur x ∈ D mit |x− x0| < δ gilt:
|f(x)− f(x0)| ≤ |f(x)− fN(x)|+ |fN(x)− fN(x0)|+ |fN(x0)− f(x0)| < 3ε = ε.
Wir haben also die Stetigkeit von f in x0 gepruft. Da x0 ein beliebiges Element von D
ist, ist f stetig (auf ganz D).
Beweis des Satzes (volle Allgemeinheit). Wir zeigen die Stetigkeit von f in x0. Sei ε ∈ R>0
gegeben. Wir wahlen hierzu ein N ∈ N, so dass fur alle naturlichen Zahlen n ≥ N gilt:
dglm(f, fn) < ε :=ε
3
Da fN stetig in x0 stetig ist, gibt es ein δ ∈ R>0, so dass
dD(x, x0) < δ =⇒ d(fN(x), fN(x0)) < ε.
2. PUNKTWEISE UND GLEICHMASSIGE KONVERGENZ 263
Wir schließen, dass fur x ∈ D mit d(x, x0) < δ gilt:
d(f(x), f(x0)) ≤ d(f(x), fN(x)) + d(fN(x), fN(x0)) + d(fN(x0), f(x0)) < 3ε = ε.
Wir haben also die Stetigkeit von f in x0 gepruft. Da x0 ein beliebiges Element von D
ist, ist f stetig (auf ganz D).
LEMMA 2.7. Sei D eine Menge und (Y, d) ein vollstandiger metrischer Raum.3 Sei (fn :
D → Y )n∈N eine Folge von Funktionen. Dann sind die folgenden Aussagen aquivalent:
(1) (fn)n∈N konvergiert gleichmaßig (gegen eine Funktion D → R)
(2)
∀ε ∈ R>0 : ∃n0 ∈ N : ∀j, k ∈ N≥n0 : dglm(fj, fk) < ε
(3)
∀ε ∈ R>0 : ∃n0 ∈ N : ∀j, k ∈ N≥n0 : ∀x ∈ D : d(fj(x), fk(x)) < ε
Im Fall D = {x0} steht hier: (fn(x0)) konvergiert genau dann, wenn (fn(x0)) eine Cauchy-
Folge ist.
Offensichtlich ist:
(1) ⇐⇒ (fn)n∈N konvergiert in (Abb(D, Y ), dglm).
(2) ⇐⇒ (fn)n∈N ist Cauchy-Folge in (Abb(D, Y ), dglm).
Beweis.”(2)⇐⇒(3)“ folgt direkt aus der Definition von dglm.
”(1)=⇒(2)“: jede konvergente Folge ist eine Cauchy-Folge (Satz 1.1).
3Wichtig sind hier vor allem die Falle Y = R, X = C und Y = Rk mit der Standardmetrik.
264 7. STETIGK. UND DIFF’BARK. VON GRENZWERTEN UND REIHEN
”(3)=⇒(1)“: Wegen (3) ist (fn(x)) eine Cauchy-Folge, sei f(x) := limn→∞ fn(x), f : D →
R. Zu gegebenem ε > 0 wahle man ein n0 wie in (3). Fur j, k ∈ N≥n0 :
d(f(x), fj(x)) ≤ d(f(x), fk(x)) + d(fk(x), fj(x)) < d(f(x), fk(x))︸ ︷︷ ︸→0
+ε
fur k →∞. Somit d(f(x), fj(x)) ≤ ε.
Da dies fur alle x ∈ D gilt, haben wir
dglm(f, fj) ≤ ε.
Wir haben also gezeigt:
∀ε > 0 : ∃n0 ∈ N : ∀j ∈ N≥n0 : dglm(fj, f) ≤ ε
und dies ist (1).
KOROLLAR 2.8. Sei D eine nicht-leere Menge und (Y, d) ein metrischer Raum. Dann
ist (Abb(D, Y ), dglm) genau dann vollstandig, wenn (Y, d) vollstandig ist.
Beweis. Wegen Lemma 2.7 (2)=⇒(1) folgt aus der Vollstandigkeit von (Y, d) die Vollstandig-
keit von (Abb(D, Y ), dglm).
Umgekehrt kann jedes y ∈ Y als konstante Funktion y : D → Y , x 7→ y betrachtet wer-
den, die wir mit y bezeichnen. Wegen dglm(x, y) = d(x, y) bildet D → Abb(D, Y ), y 7→ y
Cauchy-Folgen auf Cauchy-Folgen ab. Grenzwerte konstanter Funktionen in (Abb(D, Y ), dglm)
sind wiederum konstant. Aus der Vollstandigkeit von (Abb(D, Y ), dglm) folgt dann auch
die Vollstandigkeit von (Y, d).
3. DIFFERENTIATION VON FOLGEN UND REIHEN 265
3. Differentiation von Folgen und Reihen
Sei fn : (a, b) −→ R eine Folge differenzierbarer Funktionen, die gleichmaßig gegen f :
(a, b) −→ R konvergiert.
Frage 3.1. Ist dann f ebenfalls differenzierbar?
Beispiele 3.2.
(1) fn(x) :=√x2 + 1
nkonvergiert gleichmaßig gegen f(x) = |x|.
Denn fur reelle Zahlen a, b ∈ R gilt
a2 + b2 ≤ |a|2 + |b|2 + 2|a| |b| = (|a|+ |b|)2
und somit
√a2 + b2 ≤ |a|+ |b|.
Wenden wir dies auf a := x und b := 1/√n an, so erhalten wir
|x| ≤ fn(x) ≤ |x|+ 1√n.
Also |fn(x) − f(x)| ≤ 1√n, d.h. dglm(fn, f) ≤ n−1/2. Nun sind alle Funktionen fn
differenzierbar (auf R), aber f ist in 0 nicht differenzierbar. Siehe auch [22, Abschnitt
9.5].
(2) Wir betrachten die Reihe
fn : R→ R, fn(x) :=n∑`=1
1
`2sin(`2x)
266 7. STETIGK. UND DIFF’BARK. VON GRENZWERTEN UND REIHEN
(fn : R→ R)n∈N konvergiert gleichmaßig, denn
|fj(x)− fk(x)| = |j∑
`=k+1
1
`2sin(`2x)| ≤
j∑`=k+1
1
`2≤
∞∑`=k+1
1
`2→ 0 fur j ≥ k, k →∞
Gliedweises Differenzieren liefert:
f ′n(x) =n∑`=1
cos(`2x)
Diese Reihe ist divergent, u.a. da fur viele x ∈ R, z.B. fur x = 1 die Folge (cos(`2x))`
keine Nullfolge ist.
THEOREM 3.3. Seien a, b, x0 ∈ R mit a < x0 < b. Sei fn : (a, b) −→ R eine Folge von
differenzierbaren Funktionen, so dass
(1) (fn(x0))n∈N konvergiert (Konvergenz in einem Punkt)
(2) (f ′n)n∈N konvergiert gleichmaßig
Dann gilt:
(i) fn : (a, b) −→ R konvergiert gleichmaßig gegen eine Funktion, die wir f : (a, b) −→ R
nennen.
(ii) f ist differenzierbar auf (a, b)
(iii) f ′n konvergiert gegen f ′
Beweis. Sei x1 ∈ (a, b) und j, k ∈ N.
I :=
[x0, x1] falls x1 ≥ x0,
[x1, x0] falls x1 < x0.
3. DIFFERENTIATION VON FOLGEN UND REIHEN 267
Wir wenden den 1. Mittelwertsatz auf die Funktion I → R, x 7→ fj(x) − fk(x) an: Es
existiert ein ξ ∈ I ⊂ (a, b), so dass
(fj(x0)− fk(x0))− (fj(x1)− fk(x1)) = (x0 − x1)(f ′j(ξ)− f ′k(ξ)).
Dies ergibt
|fj(x1)− fk(x1)| ≤ |x0 − x1| |f ′j(ξ)− f ′k(ξ)|+ |fj(x0)− fk(x0)|
Wir wahlen fur ein gegebenes ε > 0 die Zahl n0 so groß, dass fur alle j, k ∈ N≥n0 gilt:
|fj(x0)− fk(x0)| ≤ ε/2. Dies ist moglich, da (fn(x0))n∈N eine Cauchy-Folge ist, siehe (1).
Wir wahlen nun eine Zahl n1, so dass fur alle j, k ∈ N≥n1 und fur alle x ∈ (a, b) gilt:
|f ′j(x)− f ′k(x)| < ε
2(b− a).
Dies ist moglich, da f ′j gleichmaßig konvergiert, siehe (2).
Somit gilt fur n2 := max{n0, n1} fur alle j, k ∈ N≥n2 und alle x1 ∈ (a, b) die Ungleichung
|fj(x1)− fk(x1)| ≤ |x0 − x1| |f ′j(ξ)− f ′k(ξ)|︸ ︷︷ ︸< ε
2(b−a)
+ |fj(x0)− fk(x0)|︸ ︷︷ ︸<ε/2
<ε|b− a|2(b− a)
+ε
2= ε
Also dglm(fj, fk) ≤ ε, das heißt (fn)n∈N ist eine Cauchy-Folge in (Abb((a, b),R), dglm).
Da R vollstandig ist, ist nach Korollar 2.8 auch (Abb((a, b),R), dglm) vollstandig; es exis-
tiert also eine Funktion f : (a, b) → R, so dass (fn) gegen f gleichmaßig konvergiert. Es
folgt Aussage (i). Fr. 3.5.
Sei nun g(x) := limn→∞ f′n(x). Dieser Limes ist gleichmaßig nach Voraussetzung. Wahle
zu gegebenem ε > 0 ein n3 ∈ N, so dass fur j, k ∈ N≥n3 gilt: dglm(f ′j, f′k) < ε und
dglm(f ′j, g) < ε.
268 7. STETIGK. UND DIFF’BARK. VON GRENZWERTEN UND REIHEN
Fur solche j und k wenden wir ahnlich wie oben wieder den 1. Mittelwertsatz auf die
Funktion x 7→ fj(x)− fk(x) an.∣∣∣∣(fj(x)− fk(x))− (fj(x2)− fk(x2))
x− x2
∣∣∣∣ 1. MWS= |f ′j(ξ)− f ′k(ξ)| < ε
fur ein ξ zwischen x und 2. Im Grenzwert k →∞ erhalten wir
(3.4)
∣∣∣∣(fj(x)− f(x))− (fj(x2)− f(x2))
x− x2
∣∣∣∣ ≤ ε.
Diese Abschatzung gilt fur alle x ∈ (a, b), x 6= x2, j ≥ n3; und n3 hangt nicht von x ab,
sondern nur von ε. Manchmal schreibt man hierfur kurz n3 = n3(ε), um auszudrucken,
dass n3 nur von ε abhangt, auch wenn diese Formulierung leicht falsch verstanden werden
kann.
Da die Funktion fj in x2 differenzierbar ist, gibt es 4 zu oben gegebenem ε > 0 und
j ≥ n3(ε) ein δj > 0, so dass fur alle x ∈ (x2 − δj, x2 + δj) gilt:
(3.5)
∣∣∣∣fj(x)− fj(x2)
x− x2
− f ′j(x2)
∣∣∣∣ ≤ ε.
Aus (3.4), (3.5) und dglm(f ′j, g) ≤ ε folgt fur j ≥ n3(ε)
(3.6) ∀x ∈ (x2 − δj, x2 + δj) :
∣∣∣∣f(x)− f(x2)
x− x2
− g(x2)
∣∣∣∣ ≤ 3ε.
Wir haben gezeigt: Fur jedes ε > 0 haben wir ein j gefunden, und dann dazu ein δj > 0,
so dass (3.6) gilt. Dies ergibt
limx→x2
f(x)− f(x2)
x− x2
= g(x2)
und somit die Aussagen (ii) und (iii).
4Achtung: wir behaupten hier: fur jedes j gibt es solch ein δj . Man muss hier aber davon ausgehen,
dass dieses δj von j abhangen kann.
4. POTENZREIHEN UND ANALYTISCHE FUNKTIONEN 269
4. Potenzreihen und analytische Funktionen
SATZ 4.1.∑∞
j=0 ajxj, aj ∈ R eine Potenzreihe mit Konvergenzradius ρ > 0. Dann ist die
Funktion
f : (−ρ, ρ)→ R, x 7→∞∑j=0
ajxj
differenzierbar und
f ′(x) =∞∑j=1
jajxj−1.
Man kann also in dieser Situation die Ableitung in die unendliche Summe”hineinziehen“.
Obige Beispiele zeigen aber, dass dies eben nicht fur alle gleichmaßig konvergenten Reihen
von Funktionen gilt.
Beweis. Wahle ein R ∈ (0, ρ). Wir wollen Theorem 3.3 anwenden fur: fn : (−R,R)→ R,
fn(x) =∑n
j=0 ajxj, x0 = 0. Die Konvergenz in x0 = 0 ist klar. Hierzu uberprufen wir,
dass f ′n : (−R,R)→ R gleichmaßig konvergiert. 5
Wir rechnen
f ′n(x) =n∑j=0
jajxj−1
Fur festes x 6= 0 konvergiert f ′n(x) fur n → ∞ genau dann, wenn hn(x) :=∑n
j=0 jajxj
konvergiert. Wir berechnen den Konvergenzradius ρ′ der Potenzreihe∑∞
j=0 jajxj.
lim supj→∞
j
√j|aj| =
(limj→∞
j√j
)︸ ︷︷ ︸
=1
(lim supj→∞
j
√|aj|)
5Achtung: Fur viele Potenzreihen konvergiert f ′n : (−ρ, ρ) → R nicht gleichmaßig. Erst nach Ein-
schrankung auf ein etwas kleineres Intervall (−R,R) erhalten wir gleichmaßige Konvergenz. Siehe die
analoge Fussnote in Kapitel 4, Abschnitt 2.
270 7. STETIGK. UND DIFF’BARK. VON GRENZWERTEN UND REIHEN
Also ρ′ = ρ, das heißt der Konvergenzradius von∑∞
j=0 jajxj−1 ist ρ.
Wegen Beispiel 2.6 konvergiert die Potenzreihe∑∞
j=0 jajxj−1 auf (−R,R) gleichmaßig,
das heißt die Folge von Funktionen
gn : (−R,R)→ R, x 7→n∑j=0
jajxj−1.
konvergiert gleichmaßig gegen eine Funktion g : (−R,R)→ R.
Beispiele 4.2.
(1) exp : R→ R, x 7→∑∞
j=01j!xj ist differenzierbar und
exp′(x) =∞∑j=1
j
j!xj−1 =
∞∑j=1
(j − 1)!
x
j−1
= exp(x).
(2) sin : R→ R, x 7→∑∞
j=0(−1)j 1(2j+1)!
x2j+1 ist differenzierbar und
sin′(x) =∞∑j=0
1
(2j)!x2j = cos(x).
Analog
cos′(x) = − sin(x).
FOLGERUNG 4.3. Potenzreihen mit Konvergenzradius ρ > 0 sind auf dem Intervall
(−ρ, ρ) glatt, d.h. unendlich oft differenzierbar. Die Taylorreihe mit Entwicklungspunkt 0
von einer Potenzreihe ist wieder genau diese Potenzreihe.
T 0(∞∑j=0
ajxj)(x) =
∞∑j=0
ajxj.
4. POTENZREIHEN UND ANALYTISCHE FUNKTIONEN 271
FOLGERUNG 4.4. Seien f(x) =∑∞
n=0 anxn und g(x) =
∑∞n=0 bnx
n Potenzreihen mit
Konvergenzradien ρa > 0 und ρb > 0. Gibt es ein ε ∈ (0,min{ρa, ρb}] so dass
f(x) = g(x) fur alle x mit |x| < ε,
dann gilt an = bn fur alle n ∈ N.
Definition 4.5. Sei I ein offenes Intervall. Eine Funktion f : I → R heißt analytisch oder
reell-analytisch, falls es zu jedem x0 ∈ I ein ε > 0 und eine Potenzreihe p(x) =∑∞
j=0 ajxj
gibt, so dass gilt
• der Konvergenzradius ρ der Potenzreihe ist in (0,∞],
• f(x+ x0) = p(x) fur alle x ∈ R mit |x| < ρ und x+ x0 ∈ I.
Cω(I) := {f : I −→ R | f ist analytisch.}
Cω ⊂ C∞ ⊂ · · · ⊂ Ck+1 ⊂ Ck ⊂ · · · ⊂ C1 ⊂ C0.
LEMMA 4.6. Potenzreihen sind auf ihrem Konvergenzbereich analytisch.
Beweis. kommt noch (folgt aus dem Umordnungssatz)
SATZ 4.7 (Eindeutige Fortsetzbarkeit analytischer Funktionen). Sei I ein offenes Intervall
und sind f, g : I −→ R analytische Funktionen. In x0 ∈ I gelte eine der folgenden
Bedingungen:
272 7. STETIGK. UND DIFF’BARK. VON GRENZWERTEN UND REIHEN
(a) Fur alle n ∈ N gilt f (n)(x0) = g(n)(x0).
(b) Es gibt ein ε > 0 mit f |(x0−ε,x0+ε) = g|(x0−ε,x0+ε)
Dann haben wir sogar f = g.
Die Beweise des Lemmas und des Satzes wurden in der Vorlesung ausgelassen, da wir in
der Analysis III analoge Aussagen fur komplex-analytische Funktionen beweisen werden.
Beweis. Mit Folgerung 4.3 sehen wir, dass aus (a) die Voraussetzung (b) folgt. Sei I =
(a, b), a < b, a, b ∈ R. Wir definieren nun
t1 := sup{t ∈ [x0, b) | f = g auf [x0, t]}.
Aus dieser Definition folgt f = g auf [x0, t1). Angenommen t1 < b. Da f − g stetig ist, gilt
auch f(t1) = g(t1), also stimmen f und g auf [x0, t1] uberein. Hieraus ergibt sich fur alle
n ∈ N: f (n)(t1) = g(n)(t1). Da f und g analytisch sind, gibt es ein ε > 0, so dass f = g auf
[t1, t1 + ε). Dies ist ein Widerspruch zur Wahl von t1. Also t1 = b. Deswegen gilt f = g
auf [x0, b). Auf dem Intervall (a, x0] argumentiert man analog.
KAPITEL 8
Topologie
Als Literatur in diesem Kapitel emfehle ich das erste Kapitel von [34] (normierte Vek-
torraume und metrische Raume) und Kapitel VI von [9] (inklusive topologische Raume).
1. Normierte Vektorraume
Vorbemerkung zur Vektorraumen: Im Gegensatz zur Linearen Algebra ist es in der Ana-
lysis nicht ublich und zumeist auch nicht hilfreich, streng zwischen Zeilen- und Spalten-
vektoren zu unterscheiden.1
K = R oder K = C.
Definition 1.1. Sei V ein K-Vektorraum. Eine Norm auf V ist eine Abbildung ‖ · ‖ :
V → R, so dass fur alle x, y ∈ V , λ ∈ K gilt:
1Sobald man anfangt, Matrizen mit Vektoren zu multiplizieren, mussen wir naturlich sorgfaltiger
werden. Dies ist allerdings aus Sicht der Analysis nur ein kurzer Zwischenschritt auf dem Weg zu”Tenso-
ren“. Vektoren haben einen Index, Matrizen zwei und Tensoren beliebig viele. Die in der Linearen Algebra
erfolgreiche Notation mit Zeilen und Spalten versagt, sobald wir mindestens drei Indizes haben. Tensoren
werden in der Analysis benotigt, um den mehrdimensionalen Satz von Taylor zu erhalten. Spater sind
Tensorfelder ein wichtiges Hilfsmittel in der Analysis IV. Tensoren sind omniprasent in der Physik (All-
gemeine Relativitatstheorie, Materialwissenschaft, Elektrodynamik) und vielen anderen Anwendungen in
Chemie und Technik.
273
274 8. TOPOLOGIE
(a) Definitheit der Norm: ‖0‖ = 0 und fur x 6= 0 gilt ‖x‖ > 0,
(b) Homogenitat der Norm: ‖λx‖ = |λ| ‖x‖
(c) Dreiecksungleichung der Norm: ‖x+ y‖ ≤ ‖x‖+ ‖y‖
Man nennt dann (V, ‖ · ‖) einen normierten Vektorraum.
Beispiele 1.2.
(1) Sei 〈 · , · 〉 ein Skalarprodukt auf dem K-Vektorraum V , wie in der Linearen Al-
gebra II behandelt. Dann ist
x 7→ ‖x‖ :=√〈x, x〉
eine Norm auf V .
Ist 〈 · , · 〉 das Standardskalarprodukt auf Kn, so nennt man die zugehorige
Norm die Standardnorm auf Kn.
(2) Sei D eine Menge. Eine Funktion f : D −→ K heißt beschrankt , wenn
‖f‖∞ := supx∈D{|f(x)|}
endlich ist. Die Menge B(D,K) der beschrankten Funktionen von D nach K
bildet mit der ublichen punktweisen Addition und Multiplikation mit Skala-
ren einen K-Vektorraum. Dann ist ‖ · ‖∞ eine Norm auf B(D,K). Definitheit,
Homogenitat und Dreiecksungleichung sind leicht zu prufen. Man nennt diese
Norm die Supremumsnorm.Wir erhalten insbesondere eine weitere Norm auf
Kn = Abb({1, 2, . . . , n},K) = B({1, 2, . . . , n},K).
(3) Sei p ∈ [1,∞), n ∈ N. Fur z = (z1, . . . , zn) ∈ Kn definieren wir die p-Norm
‖z‖p :=
(n∑j=1
|zj|p)1/p
∈ R≥0.
1. NORMIERTE VEKTORRAUME 275
Dann ist ‖ · ‖2 die Standardnorm auf Kn aus Beispiel (1).
Es ist eine Norm fur alle p ∈ [1,∞): Definitheit und Homogenitat von ‖ · ‖pwerden in Ubungsblatt 3, Aufgabe 3 gezeigt.
Bild aller Punkte x ∈ R2 mit ‖x‖p = 1 fur p = 1, 54, 2, 5,∞.
Die Dreiecksungleichung ist klar fur p = 1.
Sei nun p > 1. Bestimme q ∈ (1,∞) mit 1p
+ 1q
= 1. Also q = p/(p− 1). Nach
Ubungsblatt 3, Aufgabe 3 gilt fur alle a = (a1, . . . , an), b = (b1, . . . , bn) ∈ Rn die
Holdersche Ungleichung
n∑j=1
|ajbj| ≤ ‖a‖p · ‖b‖q.
Wir setzen sj := |xj + yj|p−1 und s = (s1, . . . , sn). Wir wenden die Holdersche
Ungleichung zunachst auf a = x und b = s an und dann nochmals auf a = y und
b = s, und erhalten.
‖x+ y‖pp =n∑j=1
|xj + yj|p ≤n∑j=1
|xj| |sj|+n∑j=1
|yj| |sj| ≤ ‖x‖p‖s‖q + ‖y‖p‖s‖q
Man rechnet nun
‖s‖q =( n∑j=1
|sj|q)1/q
=( n∑j=1
|xj + yj|p)(1/p)·(p−1)
= ‖x+ y‖p−1p .
Insgesamt folgt
‖x+ y‖p ≤ ‖x‖p + ‖y‖p.
Diese Ungleichung nennt man die Minkowski-Ungleichung. Mi 8.5.
(4) Ist (V, ‖ · ‖) ein normierter Vektorraum und W ein Untervektorraum von V .
Dann ist ‖ · ‖∣∣W
: W → R ein Norm auf W , die wir die von ‖ · ‖ induzierte
Norm auf W nennen.
276 8. TOPOLOGIE
(5) Ist ‖ · ‖ eine Norm auf einem C-Vektorraum V . Dann ist V auch ein R-Vektorraum,
und ‖ · ‖ ist dann auch eine Norm auf V im Sinn von R-Vektorraumen.
Definition 1.3. Ist (V, ‖ · ‖) ein normierter Raum, so definiert
d(x, y) := ‖x− y‖
eine Metrik auf V . Man nennt sie die von ‖ · ‖ induzierte Metrik auf V . Dadurch sind die
topologischen Begriffe, also Begriffe wie”offen“,
”abgeschlossen“, konvergent“,
”Cauchy-
Folge“,”Haufungspunkte“ etc. definiert. Insbesondere: Eine V -wertige Folge (x(k))k∈N
konvergiert gegen a in (V, ‖ · ‖), falls ‖x(k) − a‖ → 0 fur k → ∞. Aus der Dreiecksun-
gleichung sieht man leicht: Konvergiert x(k) gegen a, so konvergiert ‖x(k)‖ gegen ‖a‖.2
Die Norm-Funktion
‖ · ‖ : V → R, x 7→ ‖x‖
ist also (folgen-)stetig.
Beispiel 1.4. Die von der Supremumsnorm ‖ · ‖∞ induzierte Metrik auf B(D,K) ist die
Supremums-Distanz dsup aus Kapitel 7.
Eine Folge (x(k))k∈N heißt beschrankt im normierten Raum (V, ‖ · ‖), falls es ein C ∈ R>0
gibt, so dass fur alle k ∈ N gilt: ‖x(k)‖ ≤ C.
LEMMA 1.5. Sei xj(k) ∈ K bzw. aj ∈ K die j-te Komponente von x(k) ∈ Kn bzw.
a ∈ Kn bezuglich der Standard-Basis. Dann gilt fur jede Norm auf V :
limk→∞
x(k) = a in (Kn, ‖ · ‖∞) ⇐⇒ ∀j ∈ {1, 2, . . . , n} : limk→∞
xj(k) = aj.
2Denn |‖x(k)‖ − ‖a‖| ≤ ‖x(k)− a‖ oder verwende Ubungsblatt 3 Aufgabe 4.
1. NORMIERTE VEKTORRAUME 277
Beweis.
limk→∞
x(k) = a in (Kn, ‖ · ‖∞
⇐⇒ ∀ε > 0 : ∃N ∈ N : ∀k ∈ N≥N : ‖x(k)− a‖∞ < ε
⇐⇒ ∀ε > 0 : ∃N ∈ N : ∀k ∈ N≥N : ∀j ∈ {1, . . . , n} : |xj(k)− a| < ε
(∗)⇐⇒ ∀j ∈ {1, . . . , n} : ∀ε > 0 : ∃N ∈ N : ∀k ∈ N≥N : |xj(k)− a| < ε
⇐⇒ ∀j ∈ {1, 2, . . . , n} : limk→∞
xj(k) = aj.
Fur die Umformung (∗) haben wir die Umformung
∃N ∈ N : A(j,N) : ∀j ∈ {1, . . . , n} : A(j,N) ⇐⇒ ∀j ∈ {1, . . . , n} : ∃N ∈ N : A(j,N)
benutzt, und wir mussen begrunden wieso wir die Quantoren vertauschen durfen. Die
Richtung”=⇒“ ist offensichtlich. Fur
”⇐=“ argumentieren wir wie folgt: auf der rechten
Seite erhalten wir fur jedes j ein potenziell j-abhangiges N = Nj. Da j aber nur endlich
viele Werte durchlauft, ist N := max{Nj | j ∈ {1, 2, . . . , n}} eine naturliche Zahl, so dass
die linke Seite fur N = N gilt.
LEMMA 1.6 (Bolzano-Weierstraß auf (Rn, ‖ · ‖∞)). Ist (x(k))k∈N eine beschrankte Folge
in (Rn, ‖ · ‖∞), dann besitzt diese Folge eine konvergente Teilfolge.
Der folgende Beweis wurde das Ergebnis auch fur alle anderen p-Normen liefern. Diese
Verallgemeinerung folgt aber bald ganz einfach.
Beweis. Schreibe x(k) = (x1(k), . . . , xn(k)). Es gilt |xj(k)| ≤ ‖x(k)‖∞. Somit ist (xj(k))k∈N
eine beschrankte R-wertige Folge. Nach dem Satz von Bolzano-Weierstraß (Korollar 1.35
in Kapitel 2) besitzt die Folge (x1(k))k∈N eine (in R) konvergente Teilfolge (x1(f1(k)))k∈N.
278 8. TOPOLOGIE
Weiter besitzt (x2(f1(k)))k∈N eine konvergente Teilfolge (x2(f1◦f2(k)))k∈N. Und so weiter.
Nachdem wir n-mal zu einer derartigen Teilfolge ubergegangen sind, konvergiert
(xj(f1 ◦ f2 ◦ · · · ◦ fn︸ ︷︷ ︸f :=
(k)))k∈N
fur alle j. Sei aj := limk→∞ xj(f(k)). Dann ‖a− x(f(k))‖∞ → 0 fur k →∞.
Definition 1.7. Zwei Normen ‖ · ‖ und ||| · ||| auf einem Vektorraum V nennt man aqui-
valent, falls es ein C ∈ R>0 gibt, so dass fur alle x ∈ V gilt:
‖x‖ ≤ C|||x||| und |||x||| ≤ C‖x‖.
SATZ 1.8. Alle Normen auf Rn sind aquivalent.
Beweis. Es reicht, den Satz zu zeigen fur ‖ · ‖ = ‖ · ‖∞ und eine weitere Norm ||| · |||. Sei
(e1, . . . , en) die Standardbasis von R.
|||x||| =∣∣∣∣∣∣∣∣∣ n∑
j=1
xjej
∣∣∣∣∣∣∣∣∣ ≤ n∑j=1
|xj||||ej||| ≤ ‖x‖∞ (|||e1|||+ . . .+ |||en|||)︸ ︷︷ ︸C1:=
.
Dies liefert nun die rechte der zu zeigenden Ungleichungen.
Angenommen, die Normen sind nicht aquivalent, d.h. es gibt kein C wie oben. Dann gibt es
eine Folge (x(k))k∈N in Rn mit ‖x(k)‖∞ > k|||x(k)|||. O.B.d.A. ‖x(k)‖∞ = 1 (sonst ersetze
x(k) durch x(k)/‖x(k)‖∞). Wir konnen auch annehmen, dass diese Folge konvergiert, da
wir gegebenenfalls zu einer in (Rn, ‖ · ‖∞) konvergenten Teilfolge ubergehen konnen (siehe
Lemma 1.6). Sei a der Grenzwert. Wegen |||x(k)− a||| ≤ C1‖x(k) − a‖∞ → 0 ist a auch
der Grenzwert bezuglich der ||| · |||-Norm. Es folgt ‖a‖∞ = limk→∞ ‖x(k)‖∞ = 1 und wegen
|||x(k)||| < 1k
auch |||a||| = limk→∞ |||x(k)||| = 0. Also a = 0, was ‖a‖∞ = 1 widerspricht.
1. NORMIERTE VEKTORRAUME 279
Der obige Satz gilt wegen Beispiele 1.2 (5) auch, wenn wir Rn durch Cn ersetzen.
Sind zwei Normen ‖ · ‖ und ||| · ||| aquivalent, so gilt
limk→∞‖x(k)− a‖ = 0 ⇐⇒ lim
k→∞|||x(k)− a||| = 0.
(x(k))k∈N beschrankt in (V, ‖ · ‖) ⇐⇒ (x(k))k∈N beschrankt in (V, ||| · |||).
Da jeder endlich-dimensionale K-Vektorraum (als Vektorraum) isomorph zu Kn fur ein
geeignetes n ∈ N ∪ {0} ist, folgt hieraus unmittelbar das folgende Korollar.
KOROLLAR 1.9. Fur einen endlich-dimensionalen K-Vektorraum V gilt:
(a) Alle Normen auf V sind zueinander aquivalent.
(b) Bezuglich einer beliebigen Basis sei xj(k) bzw. aj die j-te Komponente von x(k) bzw.
von a gilt:
limk→∞
x(k) = a ⇐⇒ ∀j ∈ {1, 2, . . . , dimV } : limk→∞
xj(k) = aj.
(c) Jede beschrankte V -wertige Folge besitzt eine konvergente Teilfolge. (Satz von Bolzano-
Weierstraß fur endlich-dimensionale Vektorraume).
Wir betrachten nun einige unendlich-dimensionale normierte Raume.
Beispiel 1.10. Fur p ∈ [1,∞) und x = (xj) ∈ Abb(N,K) definieren wir
‖x‖p :=( ∞∑j=0
|xj|p)1/p
.
Hierbei weisen wir der Reihe genau dann den Wert ∞ zu, wenn sie divergiert, das heißt
wenn sie unbestimmt gegen ∞ konvergiert. Wir setzen ∞1/p :=∞. Fur p =∞ definieren
280 8. TOPOLOGIE
wir ‖x‖∞ wie in Beispiele 1.2 (2). Man definiert nun
`p(K) := {x ∈ Abb(N,K) | ‖x‖p <∞}.
Dann ist ‖ · ‖p eine Norm auf `p(K): Die Homogenitat und Definitheit ist klar. Die
Dreiecks-Ungleichung ist klar fur p = ∞. Um die Dreiecks-Ungleichung fur p < ∞ zu
zeigen, definieren wir zu x ∈ Abb(N,K) den Vektor x(n) ∈ Abb(N,K), n ∈ N durch
x(n)j :=
xj fur j ≤ n,
0 fur j > n.
Fur x ∈ `p(K) gilt
‖x− x(n)‖pp =∞∑
j=n+1
|xj|p → 0 fur n→∞,
und somit gilt x(n) → x. Wir konnen x(n) als Vektor (x0, . . . , xn) ∈ K(n+1) betrachten und
dann die Dreiecks-Ungleichung von Beispiele 1.2 (3) anwenden:
‖x(n) + y(n)‖p ≤ ‖x(n)‖p + ‖y(n)‖p.
Im Limes n→∞ ergibt sich dann
‖x+ y‖p ≤ ‖x‖p + ‖y‖p.Fr 10.5.
UBUNG 1.11. Zeigen Sie, dass `p(R) fur alle p ∈ [1,∞] vollstandig ist.
Bemerkung 1.12. Auf unendlich-dimensionalen Vektorraumen gibt es nicht-aquivalente
Normen. Sei
Abbc(N,K) :={
(xj) ∈ Abb(N,K)∣∣∣#{j ∈ N | xj 6= 0} <∞
}.
1. NORMIERTE VEKTORRAUME 281
Dieser Vektorraum besitzt eine Basis (χj)j∈N, wobei
χj(k) =
1 falls j = k ,
0 falls j 6= k .
Dann gilt Abbc(N,K) ⊂ `p(K) fur alle p ∈ [1,∞], und wir erhalten eine induzierte p-Norm
auf Abbc(N,K) ⊂ `p(K). Fur p 6= p sind die Normen ‖ · ‖p und ‖ · ‖p nicht aquivalent.
Betrachten wir zum Beispiel die Folge(
1n
∑nj=0 χj
)n∈N
. Dann gilt
∥∥∥ 1
n
n−1∑j=0
χj
∥∥∥1
= 1,∥∥∥ 1
n
n−1∑j=0
χj
∥∥∥∞
=1
n.
Somit ist diese Folge eine Nullfolge in der Norm ‖ · ‖∞, aber keine Nullfolge in der Norm
‖ · ‖1.
Beispiel 1.13. Betrachte den Vektorraum V = C0([a, b],K), b > a, K = R oder K = C.
Wir definieren: f ∈ C0([a, b],K)
‖f‖1 :=
∫ b
a
|f(x)| dx, ‖f‖∞ := sup{|f(x)| | x ∈ [a, b]}.
Die Normen ‖ · ‖1 und ‖ · ‖∞ sind nicht aquivalent. Es gilt zwar ‖f‖1 ≤ (b− a)‖f‖∞. Es
gibt aber keine Konstante C ∈ R>0 mit
‖f‖∞ ≤ C‖f‖1.
Um dies zu zeigen, betrachte man fur n ≥ 1/(b− a) die Funktion
fn : [a, b]→ R, f(x) :=
1− n(x− a) falls a ≤ x ≤ a+ 1n
0 falls a+ 1n< x ≤ b
282 8. TOPOLOGIE
Es gilt ‖fn‖∞ = 1 und ‖fn‖1 = 1/(2n) → 0. Die Folge (fn)n∈N ist also eine Nullfolge in
(C0([a, b],K), ‖ · ‖1), aber nicht in (C0([a, b],K), ‖ · ‖∞). Die Folge (fn)n∈N besitzt keine
konvergente Teilfolge in ((C0([a, b],K), ‖ · ‖∞).
Definition 1.14. Einen normierten Vektorraum (V, ‖ · ‖) nennt man einen Banach-
raum oder einen vollstandigen normierten Vektorraum, falls die induzierte Metrik auf V
vollstandig ist. Einen euklidischen oder unitaren Vektorraum (V, 〈 · , · 〉) nennt man einen
Hilbertraum, wenn (V, x 7→ ‖x‖ :=√〈x, x〉) ein Banachraum ist.
Aus dem Satz von Bolzano-Weierstraß erhalten wir das folgende Korollar.
KOROLLAR 1.15. Alle endlich-dimensionalen normierten Vektorraume sind Banachraume.
Alle endlich-dimensionalen euklidischen oder unitaren Vektorraume sind Hilbertraume.
Hilbertraume und Banachraume (beliebiger Dimension) sind unter anderem von zentraler
Bedeutung
• in der Quantenmechanik. Hier ist insbesondere der Hilbertraum `2(C) mit dem
Skalarprodukt
〈(xj), (yj)〉 :=∞∑j=0
xjyj
ganz wichtig.3
3Beispiel: Angenommen ein quantenmechanisches Teilchen kann abzahlbar viele reine Zustande an-
nehmen, die wir mit den naturlichen Zahlen N. Zum Beispiel die moglichen Anregungszustande eines
Elektrons um einen Atomkern mit verschiedener Energie. Das Teilchen wird dann durch einen Vektor
ψ ∈ `2(C) mit ‖ψ‖2 = 1 beschrieben, und |ψk|2 ist die Wahrscheinlichkeit, dass eine Messung den k-ten
reinen Zustand ergibt. Der Raum `2(C) beschreibt aber auch noch viel kompliziertere Systeme. Solange
2. KONTRAKTIONEN UND BANACHSCHER FIXPUNKTSATZ 283
• in der konkreten Berechung von aufwandigen mathematischen Probleme mit Hilfe
des Computers (Numerik von partiellen Differentialgleichungen)
2. Kontraktionen und Banachscher Fixpunktsatz
Wiederholung:
Ein metrischer Raum ist ein Paar (X, d), wobei die Metrik d : X × X −→ R≥0 die
folgenden Eigenschaften fur alle x, y, z ∈ X erfullen moge
(a) d(x, y) = 0 ⇐⇒ x = y (Definitheit)
(b) d(x, y) = d(y, x) (Symmetrie)
(c) d(x, y) ≤ d(x, z) + d(z, y) (Dreiecks-Ungleichung)
limn→∞
xn = a ⇐⇒ limn→∞
d(xn, a) = 0
Beispiel 2.1. Ist (V, ‖ · ‖) ein normierter Vektorraum, so definiert d(x, y) := ‖x − y‖
eine Metrik auf V , die von ‖ · ‖ auf V induzierte Metrik.
Sei (X, d) ein metrischer Raum, Y ⊂ X, f : Y → X.
Definition 2.2. Man nennt x ∈ Y einen Fixpunkt von f , falls f(x) = x. Die Abbildung
f : Y → X wird Kontraktion genannt, falls es ein L ∈ [0, 1) gibt, so dass fur alle y, z ∈ Y
gilt:
d(f(y), f(z)) ≤ Ld(y, z).
man noch keine Quantenfeldtheorie betreibt sind alle Hilbert-Raume entweder isomorph zu Ck, k ∈ N
mit dem Standard-Skalarprodukt oder zu `2(C).
284 8. TOPOLOGIE
Beispiel 2.3. a ∈ (−1, 1), b ∈ R, X = Y = R. Dann ist f(x) = ax+ b eine Kontraktion
mit L = |a|.
Kontraktionen sind immer stetig.
Kontraktionen besitzen hochstens einen Fixpunkt. Denn sind x1 und x2 Fixpunkte, so gilt
d(x1, x2) ≤ Ld(x1, x2), also d(x1, x2) = 0.
Beispiel 2.4. X = Y = Rr{0}. Dann ist f(x) = x/2 eine Kontraktion ohne Fixpunkte.
SATZ 2.5 (Banachscher Fixpunktsatz). Sei X ein vollstandiger metrischer Raum, A ⊂
X eine abgeschlossene Teilmenge, und Y ⊂ X eine beliebige nicht-leere Teilmenge. Sei
f : Y → X eine Kontraktion mit f(Y ) ⊂ A ⊂ Y . Dann besitzt f genau einen Fixpunkt.
Beweis. Wahle ein x0 ∈ Y und definiere dann rekursiv
xn+1 = f(xn)
d(xn+1, xn) = d(f(xn), f(xn−1)) ≤ Ld(xn, xn−1)
Fur k ∈ N:
d(xn+k, xn) ≤k∑j=1
d(xn+j, xn+j−1) ≤ (L+ L2 · · ·+ Lk) d(xn, xn−1)
≤ Ld(xn, xn−1)
1− L≤ Ln d(x1, x0)
1− L.
Hieraus sieht man sofort, dass (xn)n∈N eine Cauchy-Folge ist. Da X vollstandig ist, ist sie
konvergent in X.
x := limn→∞
xn = limn→∞
f(xn−1)
2. KONTRAKTIONEN UND BANACHSCHER FIXPUNKTSATZ 285
Somit ist x Haufungspunkt der Menge f(Y ) und deswegen (nach Aufgabe 4 Ubungsblatt
12 der Analysis I) in A.
f(x) = f( limn→∞
xn) = limn→∞
f(xn) = limn→∞
xn+1 = x
Also ist x ein Fixpunkt, und nach obiger Bemerkung der einzige.
Beispiel 2.6. Betrachte die Funktion f : [1, 2] → R, f(x) = x + 12
cosx. Dann gilt
f ′(x) = 1− 12
sinx ≥ 1/2, also ist f streng monoton wachsend. Auf Grund der Ergebnisse
in Abschnitt 4 in Kapitel 4 gilt cos 1 ≥ 1/2, also f(1) ≥ 5/4, und cos 2 < 0, also f(2) < 2.
Es folgt f([1, 2]) ⊂ [5/4, 2]. Wegen sinx ≥ x− x3/6 gilt fur alle x ∈ [1, 2] die Ungleichung
sinx ≥ 2/3 und somit
f ′(x) ≤ 1− 1
2
2
3=
2
3.
Mit dem Mittelwertsatz ergibt sich daraus |f(x) − f(y)| ≤ (2/3)|x − y| fur x, y ∈ [1, 2],
d.h. f ist eine Kontraktion. Da [1, 2] vollstandig ist, konvergiert nach dem Banachschen
Fixpunktsatz (und desen Beweis) die rekursiv definierte Folge
x0 := 1, xn+1 := f(xn)
gegen den eindeutigen Fixpunkt a von f . Wegen π/2 ∈ [1, 2] folgt a = π/2 und wir
bekommen
|π/2− xn| ≤(
2
3
)n.
Hiermit konnte man ein Computer-Programm zur Berechnung von π schreiben. Es gibt
aber deutlich effizientere Verfahren zur Berechnung von π.
Mi 15.5.
286 8. TOPOLOGIE
3. Topologische Raume
3.1. Wiederholung: Eigenschaften eines metrischen Raums. Wir definieren
in einem metrischen Raum (M,d) fur O,U ⊂M , x ∈M , r > 0:
B(M,d)r (x) := Br(x) := {y ∈M | d(x, y) < r}
U ist Umgebung von x in (M,d) ⇐⇒ ∃r > 0 : Br(x) ⊂ U.
U ist offen in (M,d) ⇐⇒ U ist Umgebung von allen y ∈ U.
Wir haben gesehen (Proposition 5.10 in Kapitel 4):
(1) ∅ und M offen in (M,d).
(2) Sind U1 und U2 offene Teilmengen, dann ist auch U1 ∩ U2 offen.
(3) Sei (Uj)j∈I eine Familie offener Teilmengen von (M,d), dann ist auch⋃j∈I
Uj
eine offene Teilmenge.
In (c) ist wichtig, dass beliebige Indexmengen I erlaubt sind: auch abzahlbar unendliche
und uberabzahlbare.
Wir definieren
OM,d := {U ⊂M | U offen in (M,d)}
Wir nennen A ⊂M abgeschlossen, falls M r A offen ist.
Auf Grund der Dreicksungleichung ist Br(x) offen.
3. TOPOLOGISCHE RAUME 287
Beispiel 3.1. Die diskrete Metrik auf M :
ddisc(x, y) =
1 falls x 6= y
0 falls x = y.
Fur r = 1/2 und alle x ∈ M gilt Br(x) = {x}. Daraus folgt, dass jede Teilmenge von M
offen und abgeschlossen ist. Also OM,ddisc = P(M).
3.2. Definition topologischer Raume.
Definition 3.2. Sei X eine Menge und O ⊂ P(X). Man nennt O eine Topologie auf X,
falls gilt:
(1) ∅ ∈ O, X ∈ O,
(2) Aus U1 ∈ O und U2 ∈ O folgt U1 ∩ U2 ∈ O,
(3) Ist (Ui)i∈I eine Familie, Ui ∈ O, dann gilt auch⋃i∈I Ui ∈ O.
Ein topologischer Raum ist ein Paar (X,O), wobei O eine Topologie auf X ist. Man sagt:
U ist eine offene Menge in (X,O) genau dann, wenn U ∈ O. Wenn die Topologie auf X
aus dem Kontext heraus klar ist, schreibt man oft auch X fur (X,O).
Beispiele 3.3. (a) Ist (X, d) ein metrischer Raum, so ist OX,d eine Topologie auf X. Man
nennt sie die von d induzierte Topologie.
(b) O := P(X) ist eine Topologie auf X, die sogenannte diskrete Topologie. Sie wird von
der diskreten Metrik ddisc induziert.
(c) Die Klumpentopologie auf X ist definiert als OKlump := {∅, X}.
(d) Ist OX eine Topologie auf X. Sei Y ⊂ X. Dann ist
OY := {U ∩ Y | U ∈ OX}
288 8. TOPOLOGIE
eine Topologie auf Y , genannt die Spurtopologie auf Y oder einfach die auf Y indu-
zierte Topologie.
Bild von einer kompakten Teilmenge Y mit glattem Rand in R2, die mit einem
offenen Ball in R2 geschnitten wird und so eine offene Teilmenge von Y definiert.
Die Elemente von OY nennt oft auch in Y offene Mengen.
(e) Sind ‖ · ‖ und ||| · ||| aquivalente Normen auf dem Vektorraum V , so induzieren sie
dieselbe Topologie auf V . Denn angenommen es gilt fur alle x ∈ V
‖x‖ ≤ C|||x||| und |||x||| ≤ C‖x‖.
Dann folgt fur x ∈ V , r > 0:
B(V,‖ · ‖)r (x) ⊂ B
(V,||| · |||)Cr (x), B(V,||| · |||)
r (x) ⊂ B(V,‖ · ‖)Cr (x).
Also fur U ⊂ V :
U offen in (V, ‖ · ‖) ⇐⇒ U offen in (V, ||| · |||).
Umgekehrt gilt: Nicht-aquivalente Normen induzieren verschiedene Topologien.
(f) Die Metrik dglm definiert eine Topologie Oglm auf Abb(D,R)
(g) Auf dem Raum Abb(D,R) definieren wir die Produkttopologie wie folgt: Fur a, b ∈ R
und x ∈ D definiere
Uxa,b := {f ∈ Abb(D,R) | a < f(x) < b} ⊂ Abb(D,R).
3. TOPOLOGISCHE RAUME 289
Dann definiere
S := {Uxa,b | a < b und x ∈ D} ⊂ P(Abb(D,R)).
B := {U1 ∩ . . . ∩ Uk | k ∈ N>0 und U1, . . . , Uk ∈ S} ∪ {Abb(D,R)}
⊂ P(Abb(D,R)).
U ∈ Oprod :⇐⇒ ∀x ∈ U : ∃B ∈ B : x ∈ B ⊂ U
Oprod ist eine Topologie auf Abb(D,R): Die Eigenschaften (1)–(3) in Definition 3.2
sind leicht zu prufen. 4 Man kann mit etwas mehr Aufwand auch zeigen:
• Oprod ⊂ Oglm und falls D unendlich: Oprod ( Oglm
• Ist D uberabzahlbar unendlich, z.B. D = [0, 1], dann gibt es keine Metrik auf
Abb(D,R), die die Topologie Oprod induziert.
• Oprod ”beschreibt“ punktweise Konvergenz, wie wir bald sehen werden.
Bemerkung 3.4. Wieso sind topologische Raume wichtig?
• Es gibt wichtige topologische Raume, die nicht von irgendeiner Metrik induziert
werden. Ein Beispiel dafur ist (Abb([0, 1],R),Oprod). Es gibt keine Metrik, die
diese Topologie induziert, siehe hierzu auch Beispiel 3.17.
• Oft besitzt ein Raum M verschiedene Metriken, die dieselbe Topologie O indu-
zieren. Zum Beispiel fuhren alle Normen zur selben Topologie auf Rn. Wenn man
nun Definition und Satze erstellt, die nur die Topologie O nutzen, aber nicht die
Metrik, dann ist klar, dass die definierten Begriffe und Satze nicht von der Wahl
der passenden Metrik abhangen.
4Diese Produkttopologie ist ein Spezialfall einer allgemeineren Konstruktion, siehe [17, Kap. 10].
290 8. TOPOLOGIE
• Manche topologische Raume besitzen zwar eine Metrik, diese sieht aber ziemlich
unhandlich aussieht. Auf dem Vektorraum C∞(R,R) der glatten Funktionen wird
oft eine”naturliche“ Topologie definiert5. Die Topologie wird zwar von einer
geeigneten Metrik d induziert. Diese ist aber fur praktische Zwecke unhandlich.
Inbesondere gibt es keine Norm auf C∞(R,R), die diese Topologie induziert.
Es ist wichtig, dass Sie moglichst fruh mit topologischen Raumen umgehen, damit Ih-
nen automatisch bewusst ist, welche Definitionen topologischer Natur sind, und welche
Definitionen zusatzliche Struktur (Metriken, Normen, Vektorraume) benotigen.
Definition 3.5. U Umgebung von x :⇐⇒ Es existiert eine offene Menge W mit x ∈
W ⊂ U .
A ⊂ X heißt abgeschlossen in (X,O) :⇐⇒ X r A offen in (X,O).
Definition 3.6. Ist N eine Teilmenge eines topologischen Raumes (X,O), dann definie-
ren wir:
den Abschluss oder die abgeschlossene Hulle von N als
N :=⋂{A ⊂ X | N ⊂ A und A abgeschlossen in X} ,
das Innere von N oder den inneren Kern von N als
◦N :=
⋃{U ⊂ N | U offen in X} ,
5Wir wollen dies hier nicht tun, sondern nur anmerken, dass sie zum Beispiel wichtig ist, wenn man
die in der Physik oft benutzte”δ-Funktion“ mathematisch sauber verstehen will.
3. TOPOLOGISCHE RAUME 291
den Rand von N als
∂N := N r◦N.
LEMMA 3.7.
(a)◦N = X r (X rN), N = X r
◦︷ ︸︸ ︷(X rN)
(b) x ∈◦N ⇐⇒ N Umgebung von x
(c) x ∈ N ⇐⇒ fur alle Umgebungen U von x gilt: U ∩N 6= ∅
(d) x ∈ ∂N ⇐⇒ fur alle Umgebungen U von x gilt: U ∩N 6= ∅ und U ∩ (X rN) 6= ∅.
Beweis. Ubung.
Beispiel 3.8. N = [0, 1]× (0, 1) ⊂ R2, Standard-Norm.
◦N = (0, 1)× (0, 1)
N = [0, 1]× [0, 1]
∂N = ([0, 1]× {0, 1}) ∪ ({0, 1} × [0, 1])
Zeichnung von diesen Mengen
Definition 3.9. Eine Teilmenge N ⊂ X heißt dicht, falls N = X.
Beispiel 3.10. Q ist dicht in R (versehen mit Standard-Norm und der induzierten Topo-
logie).
Definition 3.11. Seien (X,OX) und (Y,OY ) topologische Raume, und f : X → Y eine
Abbildung, x0 ∈ X. Man nennt f stetig in x0, falls gilt:
Fur jede Umgebung U von f(x0) in Y ist f−1(U) eine Umgebung von x0.
292 8. TOPOLOGIE
(Kurz: Urbilder von Umgebungen sind Umgebungen.)
Man nennt f stetig, falls gilt:
Fur alle U ∈ OY gilt f−1(U) ∈ OX .
(Kurz: Urbilder offener Mengen sind offen.)
Man sieht leicht: f ist genau dann stetig, wenn es in allen x0 ∈ X stetig ist.
Diese Definition verallgemeinert alle bisherigen Definitionen von Stetigkeit.
3.3. Konvergenz in topologischen Raumen.
Definition 3.12. Ein topologischer Raum (X,O) wird Hausdorffraum genannt, falls die
Hausdorff-Eigenschaft gilt:
fur alle x, y ∈ X mit x 6= y gibt es offene Mengen Ux und Uy, so dass x ∈ Ux, y ∈ Uy und
Ux ∩ Uy = ∅.
•x
•y
Ux Uy
Abbildung 8: Hausdorff-Eigenschaft
6
LEMMA 3.13. Jeder metrische Raum ist ein Hausdorffraum.6Der Hausdorffraum ist nach Felix Hausdorff bennannt, ein Blick in die Biographie wird empfohlen,
http://de.wikipedia.org/wiki/Felix_Hausdorff.
3. TOPOLOGISCHE RAUME 293
Beweis. Seien x, y ∈ X, x 6= y. Zu r := d(x, y)/3 definiere die offenen Mengen
Ux := Br(x) Uy := Br(y).
Wegen der Dreiecksungleichung gilt Ux ∩ Uy = ∅.
Wiederholung (Definition 2.10 in Kapitel 3):
Sei A( · ) eine auf N definierte Aussageform.
Fur fast alle j ∈ N gilt A(j)
:⇐⇒ Es gibt ein j0 ∈ N, so dass fur alle j ∈ N≥j0 : A(j)
⇐⇒ Die Menge {j ∈ N | ¬A(j)} ist endlich
Definition 3.14. Sei (X,O) ein Hausdorffraum, (xi)i∈N eine Folge in X, a ∈ X.
a = limi→∞
xi ⇐⇒ Fur jede Umgebung U von a gilt xi ∈ U fur fast alle i ∈ N
⇐⇒ Zu jeder Umgebung U von a gibt es ein i0 ∈ N,
so dass fur alle i ≥ i0: xi ∈ U .
Grenzwerte in Hausdorffraumen sind eindeutig, falls sie existieren. Denn angenommen a
und b waren Grenzwert der Folge (xi)i∈N, a 6= b. Da X ein Hausdorffraum ist, gibt es
offene Mengen Ua und Ub mit a ∈ Ua, b ∈ Ub und Ua ∩Ub = ∅. Da Ua eine Umgebung von
a ist, gibt es ein i0 ∈ N, so dass fur i ≥ i0 gilt: xi ∈ Ua. Analog dazu gibt es ein j0 ∈ N,
so dass fur i ≥ j0 gilt: xi ∈ Ub. Dann gilt fur k ≥ max{i0, j0} sogar xk ∈ Ua ∩Ub = ∅, was
294 8. TOPOLOGIE
offensichtlich nicht moglich ist. Also war die Annahme falsch, dass es zwei verschiedene
Grenzwerte gibt. 7
Bemerkung 3.15. Nicht jede Topologie wird von einer Metrik induziert.
Beispiel 3.16. Sei OKlump := {∅, X} die Klumpentopologie auf X. Im Fall #X ≥ 2 ist
(X,OKlump) kein Hausdorffraum, also nicht von einer Metrik induziert. 8
Beispiel 3.17. Auf der Menge Abb([0, 1],R) gibt es eine Topologie (die sogenannte
Produkttopologie, siehe z. B. [17, Kap. 10] oder siehe Beispiele 3.3 (g)). Die Produkt-
Topologie erfullt die Hausdorff-Eigenschaft. Außerdem gilt: eine Folge genau dann kon-
vergiert, wenn sie punktweise konvergiert. Es gibt aber keine Metrik auf Abb([0, 1],R), fur
die eine Folge von Funktionen genau dann konvergiert, wenn sie punktweise konvergiert.
Man kann sogar die starkere Aussage9 zeigen: Es gibt auf C0([0, 1],R) keine Metrik d, so
dass eine Folge von stetigen Funktionen genau dann punktweise konververgiert, wenn sie
in (C0([0, 1],R), d) konvergiert: M. K. Fort, A note on pointwise convergence, Proc. AMS
2 (1951), 34–35.
7Man kann Konvergenz auch in topologischen Raumen betrachten, die nicht mehr hausdorffsch sind.
Dazu benotigt man die Theorie der”Filter“, das ist aber in Ihrer Situation doch recht aufwandig im
Vergleich zum Nutzen.8Man kann genau sagen, welche topologischen Raume von einer Metrik induziert werden und welche
nicht. Der Metrisierungssatz von Bing, Nagata und Smirnow gibt hierfur Kriterien, die hinreichend und
notwendig sind, siehe [29, Satz 10.14]. Die Formulierung und der Beweis dieses Satzes ist eine wichtige
kulturelle Leistung der Mathematik, aber gebraucht habe ich bisher den Satz leider noch nie. Wenn man
sich jedoch zu dem Satz durcharbeitet, lernt mal sehr viele nutzliche Hilfsmittel kennen.
9Begrunden Sie als Ubung, wieso diese Aussage starker ist!
3. TOPOLOGISCHE RAUME 295
Bemerkung 3.18. Ist X ein Hausdorffraum, x ∈ X. Dann ist {x} abgeschlossen. (Be-
grundung: Ist y ∈ X r {x}, so liefert die Hausdorff-Eigenschaft eine offene Umgebung Uy
von y, die in X r {x} enthalten ist. Also ist X r {x} offen.)
Definition 3.19. Seien (X,OX) und (Y,OY ) Hausdorffraume. Eine Abbildung ist fol-
genstetig, wenn fur alle Folgen (xj)j∈N in X und a ∈ X gilt:
Wenn a = limj→∞
xj, dann f(a) = limj→∞
f(xj)
LEMMA 3.20. Seien X und Y topologische Raume, f : X → Y .
(1) Ist f stetig, dann ist f auch folgenstetig.
(2) Ist dX bzw. dY eine Metrik aufX bzw. auf Y , die die Topologie aufX bzw. Y induziert.
Dann ist f genau dann stetig, wenn f folgenstetig ist.
Beweis.
Zu (1): Es gelte a = limj→∞ xj in X. sei U eine Umgebung von f(a) in Y . Da f stetig in
a ist, ist f−1(U) eine Umgebung von a. Somit gilt xj ∈ f−1(U) fur fast alle j ∈ N. Daraus
folgt fur diese j auch f(xj) ∈ U . Es folgt f(a) = limj→∞ f(xj).
Zu (2):”=⇒“ ist nun gezeigt. Den Beweis von
”⇐=“ erhalten wir aus dem Beweis von
Lemma 1.7”=⇒“ aus Kapitel 4, indem wir |x − x0| durch dX(x, x0) und |f(x) − f(x0)|
durch dY (f(x), f(x0)) ersetzen.10
10Solche Beweise, in denen Teile in alten Beweisen ersetzt werden, mag ich eigentlich nicht. Denn man
macht da ganz schnell Fehler. Um solche Verallgemeinerungen zu vermeiden, hatten wir aber noch fruher
metrische Raume einfuhren mussen. Und dies ist auch der Grund, wieso wir jetzt topologische Raume
behandeln: damit wir spater die kommenden Aussagen nicht noch einmal so ahnlich zeigen mussen.
296 8. TOPOLOGIE
!ACHTUNG!. Es gibt eine Abbildung f : X → Y , X und Y topologische Raume11, mit
den folgenden Eigenschaften
• f ist folgenstetig, d.h. fur xi, x ∈ X folgt aus x = limi→∞ xi auch f(x) =
limi→∞ f(xi).
• f ist nicht stetig
Da solche”exotischen“ Beispiele in der Vorlesung keine Rolle spielen werden, wird diese
Tatsache nur im Skript kurz erwahnt.
4. Zusammenhang und WegzusammenhangFr 17.5.
Schreibweise: X fur (X,OX), wenn klar ist, welche Topologie auf X zu wahlen ist. Beispiel:
Rn tragt (fast immer) die von der Standard-Norm induzierte Topologie.
Schreibweise: Disjunkte Vereinigung U•∪ V = X bedeutet U ∪ V = X und U ∩ V = ∅.
Definition 4.1. Ein topologischer Raum X heißt nicht zusammenhangend, wenn es
nicht-leere offene Mengen U, V ⊂ X mit U•∪ V = X gibt. Zusammenhangend := nicht
nicht zusammenhangend.
Ist A ⊂ X und ist OX eine Topologie auf X, dann definiert man auch :
A ist zusammenhangend :⇐⇒ (A,OA) ist zusammenhangend
Hierbei ist OA die auf A induzierte Topologie (Spurtopologie).
Beispiele 4.2.
11Dies geht naturlich nicht mit metrischen Raumen, wie oben gezeigt!
4. ZUSAMMENHANG UND WEGZUSAMMENHANG 297
(a) Die Menge {0, 1} ⊂ R ist nicht zusammenhangend.12 Denn {0} = B1/2(0) ∩ {0, 1} ist
offen in {0, 1}. Analog ist {1} offen in {0, 1}. Und
{0, 1} = {0}•∪ {1}.
(b) Mehrere Bilder, u.a. eines mit zwei disjunkten Ballen in R2.
Nicht zusammenhangend.
(c) Sei Q mit der Standardtopologie (d.h. mit der von d(x, y) = |x− y| induzierte Topo-
logie) versehen. Dann ist Q nicht zusammenhangend. Definiere U := (−∞,√
2) ∩ Q
und V := (√
2,∞) ∩Q. Die Mengen U und V sind offen in Q. 13 U•∪ V = X.
(d) eine Teilmenge A von R ist zusammenhangend, gdw A ein Intervall ist. (Ubungsblatt
5 Aufgabe 1)
PROPOSITION 4.3. Seien X und Y topologische Raume, f : X → Y stetig und X
zusammenhangend. Dann ist f(X) (mit der Spurtopologie von Y versehen) ebenfalls
zusammenhangend.
Beweis. Angenommen f(X) ist nicht zusammenhangend. Dann gibt es Mengen U und
V mit den folgenden Eigenschaften:
• U•∪ V = f(X),
• U offen in f(X), d.h. es gibt eine offene Teilmenge U von Y mit U = Y ∩ U
(siehe Definition der Spurtopologie),
12Wenn nichts anderes angegeben ist, hat R immer die Standard-Topologie und eine Teilmenge von
R die induzierte Topologie. In diesem Spezialfall ist die diskrete Topologie auf {0, 1}.13Sie sind nicht offen in R, aber offen in Q. Wer dies nicht versteht, muss nochmals genau die Definition
der Spurtopologie lesen.
298 8. TOPOLOGIE
• V offen in f(X), d.h. es gibt eine offene Teilmenge V von Y mit V = Y ∩ V
(siehe Definition der Spurtopologie).
• U 6= ∅ und V 6= ∅
Da f stetig ist, ist auch f−1(U) = f−1(U) offen, und offensichtlich gilt f−1(U) 6= ∅. Analog
fur f−1(V ). Außerdem haben wir X = f−1(U)•∪ f−1(V ).
Beispiel 4.4. Ist f : X → R stetig und X zusammenhangend. Dann ist f(X) ein Inter-
vall.
Wenn wir den Spezialfall betrachten, dass X = I ein Intervall ist, und Y = R, so erhalten
wir wieder die folgende Aussage, die wir als Korollar 2.4 in Kapitel 4 bereits bewiesen
haben
KOROLLAR 2.4 in Kap. 4. Sei I ⊂ R ein Intervall und f : I −→ R stetig. Dann ist
f(I) ebenfalls ein Intervall.
Aus diesem Korollar erhalt man auch den Zwischenwertsatz. Proposition 4.3 verallgemei-
nert also den Zwischenwertsatz.
Definition 4.5. Sei X ein topologischer Raum, x, y ∈ X. Ein Weg von x nach y in X
ist eine stetige Abbildung s : [0, 1]→ X mit s(0) = x und s(1) = y.
Ein topologischer Raum X ist wegzusammenhangend, wenn es zu allen Punkten x, y ∈ X
einen Weg von x nach y gibt.
PROPOSITION 4.6. Ist X wegzusammenhangend, so ist X auch zusammenhangend.
Beweis: Ubungsblatt 5.
5. FOLGENKOMPAKTHEIT 299
Beispiel 4.7. Eine Menge A ⊂ Rn heißt sternformig bezuglich x0 ∈ A, falls gilt: ist x ∈ A
und t ∈ [0, 1], dann haben wir auch (1− t)x0 + tx ∈ A.
Bild einer sternformigen Menge mit Zentrum x0 und einem Punkt x, sowie der
Verbindungsstrecke dieser Punkte
Sternformige Mengen sind wegzusammenhangend, also auch zusammenhangend.
Bemerkung 4.8. Wir betrachten die folgende Teilmenge von R2
M :=({0} × [−1, 1]
)∪ {(x, sin(π/x)) | x ∈ R>0}
und versehen M mit der von der Standardtopologie auf R2 induzierten Topologie.
Bild dieser Menge
Die Menge M ist zusammenhangend, aber nicht wegzusammenhangend.
UBUNG 4.9. Ist X wegzusammenhangend und f : X → Y stetig. Dann ist auch f(X)
wegzusammenhangend.
5. Folgenkompaktheit
Definition 5.1. Sei (X,OX) ein Hausdorffraum. Wir sagen, (X,OX) ist folgenkompakt,
wenn jede Folge in X eine (in (X,OX)) konvergente Teilfolge besitzt. Eine Teilmenge
A ⊂ X nennt man folgenkompakt, wenn (A,OA) folgenkompakt ist, wobei OA die Spur-
topologie auf A ist.
Diese Definition verallgemeinert die analoge Definition fur metrische Raume, siehe Defi-
nition 5.19 in Kapitel 4.
300 8. TOPOLOGIE
SATZ 5.2. Sei (V, ‖ · ‖) ein endlich-dimensionaler reeller oder komplexer Vektorraum.
Wir versehen V mit der von ‖ · ‖ induzierten Topologie. Eine Teilmenge A von V ist
genau dann folgenkompakt, wenn sie abgeschlossen und beschrankt ist.
Wdh: A beschrankt ⇐⇒ ∃C ∈ R≥0 : ∀x ∈ A : ‖x‖ ≤ C
Beispiele 5.3. Ein Intervall I ist genau dann folgenkompakt, wenn es abgeschlossen und
beschrankt ist, d.h. wenn es a, b ∈ R, a ≤ b gibt mit I = [a, b].
Die folgenden Teilmengen von V = Rn sind folgenkompakt:
Abgeschlossene Balle Br(x0) := {x ∈ V | ‖x− x0‖ ≤ r} bezuglich beliebiger Normen.
Quader [a1, b1]× [a2, b2]× · · · × [an, bn].
Ist (V, ‖ · ‖) ein normierter Vektorraum. Aus der Dreiecks-Ungleichung folgt∣∣∣‖x‖ − ‖y‖∣∣∣ ≤ ‖x− y‖und hieraus folgt die Stetigkeit der Norm V → R, x 7→ ‖x‖.
Beweis von Satz 5.2. O.B.d.A. V = Rn.
”=⇒“: Sei A folgenkompakt.
Dann ist A abgeschlossen nach Lemma 5.20 aus Kapitel 4 (Es besagt: Folgen-kompakte
Teilmengen A in einem metrischen Raum X sind in X abgeschlossen.)
Angenommen A ist nicht beschrankt. Dann gibt es eine Folge (ai) mit ‖ai‖ → ∞. Eine
Teilfolge (af(i)) konvergiert dann gegen y ∈ A. Es folgt
‖y‖ = limi→∞‖af(i)‖ =∞.
5. FOLGENKOMPAKTHEIT 301
Widerspruch.
”⇐=“: Ist A beschrankt, so ist jede A-wertige Folge (ai)i∈N beschrankt. Nach dem Satz
von Bolzano-Weierstraß (Lemma 1.6 bzw. Korollar 1.9) besitzt die Folge eine konvergente
Teilfolge (af(i))i∈N mit Grenzwert a. Wenn A zusatzlich abgeschlossen ist, so konvergiert
die Teilfolge in A gegen a. Somit ist A folgenkompakt.
SATZ 5.4 (Verallgemeinert Satz 5.22 in Kapitel 4). Seien X, Y Hausdorffraume und sei
f : X → Y folgenstetig14. Ist X folgenkompakt, dann ist auch B := im(f) (versehen mit
der Spurtopologie) folgenkompakt.
Der Beweis geht vollig gleich wie der Beweis von Satz 5.22 in Kapitel 4.
Beweis. Sei (an)n∈N eine Folge in B. Wahle bn ∈ X mit f(bn) = an. Wahle eine konver-
gente Teilfolge (bj(n)), b := limn→∞ bj(n). Da f stetig ist, haben wir
f(b) := limn→∞
f(bj(n))︸ ︷︷ ︸=aj(n)
.
Somit ist eine konvergente Teilfolge von (an)n∈N gefunden. Wir haben die Folgenkompakt-
heit von B uberpruft.
Beispiel 5.5. Ist f : [a, b] → R stetig, dann ist f([a, b]) ein folgenkompaktes Intervall,
d.h. f([a, b]) = [c, d] fur geeignete c, d ∈ R.
KOROLLAR 5.6. Ist X ein folgenkompakter Hausdorffraum und f : X −→ R (folgen-
)stetig. Dann nimmt f ein Maximum und ein Minimum an, d.h. es gibt x1, x2 ∈ X, so
14Die Proposition ist naturlich auch richtig, wenn wir”folgenstetig“ durch
”stetig“ ersetzen, denn
jede stetige Funktion ist folgenstetig.
302 8. TOPOLOGIE
dass fur alle x ∈ X:
f(x1) ≤ f(x) ≤ f(x2).
Schreibweise: max f := max f(X) = max{f(x) | x ∈ X}. min f analog.
Beweis. Schreibe das folgenkompakte Intervall im(f) als [a1, a2]. Wahle xi mit f(xi) =
ai.
Bemerkung 5.7. Folgenkompakte metrische Raume sind vollstandig. Denn besitzt eine
Cauchy-Folge eine Teilfolge, die gegen x0 konvergiert, so konvergiert die gesamte Cauchy-
Folge gegen x0.
Den Rest des Abschnitts wollen wir zunachst in der Vorlesung aus Zeitgrunden uber-
springen. Die Resultate werden spater im Beweis von”folgenkompakt =⇒ kompakt“ in
Theorem 6.7 nutzen.
LEMMA 5.8. Sei (X, d) ein folgenkompakter metrischer Raum, und ε > 0. Dann gibt es
k ∈ N und {x1, x2, . . . xk} ⊂ X, so dass
X = Bε(x1) ∪Bε(x2) ∪ · · · ∪Bε(xk).
Beweis. O.B.d.A. X 6= ∅. Wahle ein x1 ∈ X. Wahle nun weitere xi rekursiv: Falls x1,
x2,. . .xj gewahlt sind, so setze
Aj := X r (Bε(x1) ∪Bε(x2) ∪ · · · ∪Bε(xj)).
Im Fall Aj = ∅ ist die Behauptung gezeigt. Andernfalls wahle ein xj+1 ∈ Uj.
6. KOMPAKTHEIT 303
Wenn die Aussage des Lemmas nicht gilt, so erhalten wir eine Folge (xi)i∈N mit d(xi, xj) ≥
ε fur alle i 6= j. Solch eine Folge besitzt keine konvergente Teilfolge. Also ist X nicht
folgenkompakt.
FOLGERUNG 5.9. Ist X ein folgenkompakter metrischer Raum, so existiert eine Folge
(xj)j∈N, so dass {xj | j ∈ N} dicht ist. In anderen Worten: X besitzt eine abzahlbare
dichte Teilmenge.
Beweis. Zu n ∈ Nr {0} wahle kn ∈ N und xnj ∈ X, so dass
X =kn⋃j=1
B1/n(xnj ).
Wir nehmen nun die Folge
(xj)j∈N = (x11, . . . x
1k1, x2
1, . . . , x2k2, x3
1, . . .)
Sei nun ein beliebiges y ∈ X gegeben. Zu zeigen ist, dass y im Abschluss von A := {xj |
j ∈ N} liegt. Zu jedem n ∈ N wahle ein jn, so dass y ∈ B1/n(xnjn), also d(y, xjn) < 1/n.
Also ist (xjn)n∈N eine Folge in A, die gegen y konvergiert. Somit y ∈ A.
6. Kompaktheit
Wir fuhren nun eine andere Eigenschaft ein, die sich”Kompaktheit“ nennt, und werden
dann die erstaunliche und weitreichende Tatsache beweisen, dass metrische Raume genau
dann kompakt sind, wenn sie folgenkompakt sind.
Definition 6.1. Sei X ein topologischer Raum.
304 8. TOPOLOGIE
(1) Eine offene Uberdeckung von X ist eine Familie (Ui)i∈I von offenen Mengen15 mit
X =⋃i∈I Ui.
(2) Wir sagen X erfullt die Heine-Borel-Eigenschaft, falls gilt:
Zu jeder offenen Uberdeckung (Ui)i∈I von X gibt es ein k ∈ N und i1, i2, . . . , ik ∈ I
mit
X = Ui1 ∪ Ui2 ∪ · · · ∪ Uik .
16 Man nennt eine solche Uberdeckung eine endliche Teiluberdeckung.17
(3) Man nennt X kompakt, falls X ein Hausdorffraum ist und die Heine-Borel-Eigenschaft
erfullt.18
LEMMA 6.2. Wir versehen X mit der diskreten Topologie. Dann ist X kompakt, genau
dann wenn X endlich ist.
Beweis. Offensichtlich ist jede endliche Menge kompakt.
15Gemeint ist damit naturlich: alle Ui sind offen in X.16Man wundert sich vielleicht, wieso wir nicht k ∈ Nr{0} genommen haben. Dies liegt am Spezialfall
X = ∅, der (Ui)i∈∅ als offene Uberdeckung hat. Fur ihn wahlt man k = 0. Die leere Menge erfullt also
die Heine-Borel-Eigenschaft und ist kompakt.17Teiluberdeckung bedeutet hier nicht, dass der Raum nur zum Teil uberdeckt wird. Er wird ganz
uberdeckt. Die Aussage ist vielmehr: Man kann alle bis auf endlich viele der Ui’s weglassen und hat immer
noch eine Uberdeckung. Man uberdeckt mit einem endlichen Teil der offenen Mengen.18Achtung: Manche Mathematiker nennen einen topologischen Raum kompakt, sobald er die Heine-
Borel-Eigenschaft erfullt, ohne die Hausdorff-Eigenschaft einzuschließen. Wenn Sie ein Buch oder Skript
zu diesem Thema in die Hand nehmen, mussen Sie immer uberprufen, welche Definition nun benutzt
wird. Ahnlich wie in der Frage, ob 0 eine naturliche Zahl ist oder nicht, gibt es hier eben verschiedene
ubliche Konventionen.
6. KOMPAKTHEIT 305
Angenommen X ist kompakt und diskret (d.h. mit der diskreten Topologie versehen).
Fur x ∈ X ist Ux := {x} offen. Also ist (Ux)x∈X eine offene Uberdeckung von X. Da X
kompakt ist, gibt es eine endliche Menge J ⊂ X, so dass X =⋃x∈J Ux = J . Also ist
bereits X endlich.
PROPOSITION 6.3. Sei X ein kompakter topologischer Raum und sei A eine abgeschlos-
sene Teilmenge. Dann ist A ebenfalls kompakt.
Beweis. Sei (Ui)i∈I eine offene Uberdeckung von A. Da A die Spurtopologie von X tragt,
gibt es Mengen Ui, offen in X mit Ui = A ∩ Ui. Sei i0 6∈ I, J := I ∪ {i0}, Ui0 := X r A.
Dann ist (Ui)i∈J eine offene Uberdeckung von X. Da X kompakt ist, gibt es eine endliche
Menge K ⊂ J , so dass (Ui)i∈K bereits X uberdeckt. Dann uberdeckt (Ui)i∈Kr{i0} bereits
A.
UBUNG 6.4. () Zeigen Sie, dass Lemma 6.2 und Proposition 6.3 auch dann gelten, wenn
man”kompakt“ durch
”folgenkompakt“ ersetzt.
PROPOSITION 6.5. Sei X ein Hausdorffraum und A eine kompakte Teilmenge 19. Dann
ist A abgeschlossen.
Beweis. Wir zeigen, dass X r A offen ist. Sei y ∈ X r A. Zu jedem x ∈ A gibt es auf
Grund der Hausdorff-Eigenschaft disjunkte offene Mengen Ux und Uxy , so dass x ∈ Ux
und y ∈ Uxy . Achtung: Wie die Notation ja bereits andeutet, hangt Ux
y von x ab! Nun ist
(A ∩ Ux)x∈A eine offene Uberdeckung von A. Auf Grund der Kompaktheit von A gibt es
x1, . . . , xk ∈ A mit
A = (A ∩ Ux1) ∪ . . . ∪ (A ∩ Uxk)
19wie immer: bezuglich der Spur-Topologie
306 8. TOPOLOGIE
Wir setzen
Vy :=k⋂i=1
Uxiy offen in X.
Also ist X r A =⋃y∈XrA Vy ebenfalls offen.
PROPOSITION 6.6. Seien X, Y Hausdorffraume und sei f : X → Y stetig. Ist X kom-
pakt, dann ist auch das Bild im(f) = f(X) (versehen mit der Spurtopologie) kompakt.
Beweis. Sei (Ui)i∈I eine offene Uberdeckung von f(X), Ui offen in f(X). Dann ist(f−1(Ui)
)i∈I eine offene Uberdeckung von X. Wegen der Kompaktheit von X gibt es
eine endliche Menge J , so dass bereits(f−1(Ui)
)i∈J die Menge X uberdeckt. Wegen
f(f−1(Ui)) = Ui ∩ f(X) = Ui folgt, dass (Ui)i∈J bereits f(X) uberdeckt.
THEOREM 6.7. Sei X ein metrischer Raum. Dann ist X genau dann folgenkompakt,
wenn X kompakt ist.
Beweis des Theorems.
”kompakt =⇒ folgenkompakt“: Sei X kompakt. Sei (an)n∈N eine Folge in X.
1. Fall: A := {an | n ∈ N} besitzt keinen Haufungspunkt in X
Also ist A abgeschlossen, und somit kompakt. Außerdem ist die Topologie auf A diskret.
Wegen Lemma 6.2 ist dann A endlich. Nach dem Schubfach-Prinzip 20 gibt es also ein
20Das sogenannte Schubfach-Prinzip besagt anschaulich: wenn ich unendlich viele Kugeln in endlich
viele Schubladen einsortieren, dann habe ich einer Schublade (= Schubfach) unendlich viele Kugeln.
Mathematisch praziser: Ist eine Funktion g : N → A, gegeben mit A endlich, so gibt es ein a ∈ A mit
unendlichem g−1(a). Es sollte Ihnen inzwischen klar sein, wie man des Schubfach-Prinzips beweist.
6. KOMPAKTHEIT 307
a ∈ A, so dass I := {n ∈ N | an = a} unendlich ist. Dann ist (an)n∈I eine Teilfolge21 von
(an)n∈N, die konstant gleich a ist und somit gegen a konvergiert.
2. Fall: {an | n ∈ N} besitzt einen Haufungspunkt x0 in X
Es folgt mit Lemma 5.17 aus Kapitel 4 die Existenz einer konvergenten Teilfolge.
”folgenkompakt =⇒ kompakt“:
Sei X folgenkompakt. Gegeben sei eine offene Uberdeckung (Ui)i∈I von X.
Wir zeigen in einem ersten Schritt, dass es eine abzahlbare Menge J ⊂ I gibt, so dass
(Ui)i∈J eine (offene) Uberdeckung ist. 22. In einem zweiten Schritt zeigen wir dann, dass
es eine endliche Menge K ⊂ J gibt, so dass (Ui)i∈K eine (offene) Uberdeckung ist.
1. Schritt:
Sei D eine abzahlbare dichte Teilmenge von X, die es auf Grund von Folgerung 5.9 in X
gibt. Dann ist
B := {B1/n(p) | n ∈ N, p ∈ D}
eine abzahlbare Menge offener Mengen. Man sieht schnell, dass jede offene Menge in X
eine Vereinigung geeigneter Elemente von B ist. Sei nun
B′ := {U ∈ B | ∃i ∈ I : U ⊂ Ui}
und zu jedem U ∈ B′ wahlen wir solch ein i = f(U), also U ⊂ Ui(U), f : B′ → I. Sei
J := f(B′). Da B abzahlbar ist, ist es auch B′ und somit J .
21Wir schreiben hier Teilfolgen zum ersten Mal auf eine andere Art und Weise. Wenn man die ein-
deutige streng monoton wachsende Bijektion f : N→ I wahlt, so ist mit (an)n∈I die Teilfolge (af(n))n∈N
gemeint.
22Der erste Schritt wird in der Vorlesung ubersprungen
308 8. TOPOLOGIE
Wir mussen fur diesen Schritt noch zeigen, dass (Ui)i∈J uberdeckt. Sei also x ∈ X. Dann
gibt es i ∈ I mit x ∈ Ui. Wahle n ∈ N, so dass B2/n(x) ⊂ Ui. Wahle ein p ∈ D mit
d(p, x) < 1/(2n). Dann gilt x ∈ B1/n(p) ⊂ B2/n(x) ⊂ Ui und B1/n(p) ∈ B′. Also auch
x ∈ Uf(B1/n(p)).
2. Schritt:
Sei nun also (Ui)i∈J eine offene Uberdeckung mit J abzahlbar. O.B.d.A. J = N. Wir
nehmen an, dass Vn :=⋃ni=1 Ui eine echte Teilmenge von X ist23 fur alle n ∈ N. Wahle
xn ∈ X r Vn. Wahle eine konvergente Teilfolge (xf(n))n∈N der Folge (xn)n∈N. Es gibt nun
ein j ∈ N, so dass limn→∞ xf(n) ∈ Uj. Da Uj offen ist, liegt fur fast alle n ∈ N dann
xf(n) ∈ Uj. Unter anderem gibt es ein n ∈ N, f(n) ≥ j, mit xf(n) ∈ Uj, was offensichtlich
ein Widerspruch zur Konstruktion der xj ist.
Also gibt es ein Vn mit Vn = X.
Bemerkung 6.8. Es gibt Hausdorffraume, die kompakt, aber nicht folgenkompakt sind.
Es gibt auch Hausdorffraume, die folgenkompakt, aber nicht kompakt sind. Siehe im Buch
[32].
Mehr zum Thema folgenkompakte/kompakt inklusive schoner Bilder findet man hier:
http://simomaths.wordpress.com/2013/02/24/topology-sequentially-compact-spaces-and-compact-spaces
Beispiel 6.9. Fur eine Teilmenge A eines endlich-dimensionalen normierten Vektorraums
sind aquivalent:
(1) A ist beschrankt und abgeschlossen
(2) A ist kompakt
23Erinnerung:”A echte Teilmenge von X“ bedeutet: A ⊂ X und A 6= X.
6. KOMPAKTHEIT 309
(3) A ist folgenkompaktMi 22.5.
Definition 6.10. Seien X und Y topologische Raume. Eine Abbildung f : X → Y nennt
man Homoomorphismus, falls gilt:
• f ist stetig
• f ist bijektiv
• f−1 : Y → X ist stetig
In anderen Worten: f ist eine Bijektion mit der Eigenschaft
U offen in X ⇐⇒ f(U) offen in Y.
Existiert ein Homoomorphismus von X nach Y , so nennt man X und Y homoomorph.
Homoomorphie ist eine Aquivalenzrelation auf der Klasse 24 aller topologischer Raume.
SATZ 6.11. Ist X ein kompakter topologischer Raum, Y ein Hausdorffraum und f : X →
Y bijektiv und stetig, dann ist f ein Homoomorphismus.
Beweis. Aufgabe 1 auf Ubungsblatt 6.
Definition 6.12. Sind (M,dM) und (N, dN) metrische Raume. Eine Abbildung f : M →
N heißt gleichmaßig stetig, falls
(6.13) ∀ε ∈ R>0 : ∃δ ∈ R>0 : ∀x, y ∈M :(dM(x, y) < δ =⇒ dN(f(x), f(y)) < ε
).
24Die Gesamtheit aller topologischer Raume ist so groß, dass es keine Menge mehr ist, sondern eine
Klasse. Siehe den Anfang der Analysis I.
310 8. TOPOLOGIE
LEMMA 6.14. Sind (M,dM) und (N, dN) metrische Raume, und f : M → N stetig. Ist
M kompakt, so ist f gleichmaßig stetig.
Insbesondere folgt hieraus das noch nicht bewiesene Lemma 4.1 in Kapitel 6.
Beweis. Angenommen f ist nicht gleichmaßig stetig. Es gibt dann ein ε > 0, so dass
(6.15) ∀δ ∈ R>0 : ∃x, y ∈M : dM(x, y) < δ ∧ dN(f(x), f(y)) ≥ ε.
Zu jedem n ∈ N r {0} und δ := δn := 1/n wahlen wir xn, yn ∈ M wie in (6.15). Da M
kompakt und somit folgenkompakt ist, gibt es eine Teilfolge (xnk)k∈N, so dass
x := limk→∞
xnk
in M existiert. Wegen d(xnk , ynk) < 1/nk gilt auch x = limk→∞ ynk . Da f (folgen-)stetig
ist gilt dann auch
f(x) = limk→∞
f(xnk) = limk→∞
f(ynk),
also
limk→∞
dN(f(xnk), f(ynk)
)= 0.
Dies widerspricht jedoch der obigen Wahl von xnk und ynk , denn diese haben wir so
gewahlt, dass fur alle k ∈ N die Ungleichung dN(f(xnk), f(ynk)
)≥ ε gilt.25
Wir haben gezeigt, dass die Annahme, f sei nicht gleichmaßig stetig, einen Widerspruch
impliziert. Also muss f gleichmaßig stetig sein.
Sei (X, d) ein metrischer Raum und ∅ 6= Y ⊂ X. Definiere fur x ∈ X
d(x, Y ) := inf{d(x, y) | y ∈ Y }
25Und naturlich fur das feste oben gewahlte ε > 0!
6. KOMPAKTHEIT 311
Dann gilt
d(x, Y ) = 0 ⇐⇒ x ∈ Y ,
d(x,X r U) ≥ r ⇐⇒ Br(x) ⊂ U.
UBUNG 6.16 (Aufgabe 4 (ii) (a) auf Ubungsblatt 3). Die Funktion X → R, x 7→ d(x, Y )
ist stetig.
Beweis. (Losung der Aufgabe)
d(x1, y) ≤ d(x1, x2) + d(x2, y)
Nehme das Infimum uber y ∈ Y :
d(x1, Y ) ≤ d(x1, x2) + d(x2, Y )
und analoges gilt, wenn wir x1 und x2 vertauschen. Es folgt
|d(x1, Y )− d(x2, Y )| ≤ d(x1, x2).
Daraus folgt, dass x 7→ d(x, Y ), X → R stetig ist.
PROPOSITION 6.17. Sei (X, d) ein kompakter metrischer Raum und (Ui)i∈I eine offene
Uberdeckung. Dann gibt es ein ε > 0 mit der folgenden Eigenschaft: Zu jedem x ∈ X gibt
es ein i ∈ I mit Bε(x) ⊂ Ui.
Solch ein ε nennt man eine Lebesguesche Zahl. Fr 24.5.
Eine kompakte Teilmenge in R2 mit Uberdeckung und darin ε-Balle.
312 8. TOPOLOGIE
Beweis. Da X kompakt ist, gibt es eine endliche Teiluberdeckung (Ui)i∈J , also J ⊂ I
endlich. O.B.d.A. J = {1, 2, . . . , k}. Die Funktion
f : X → R, x 7→ 1
k
k∑i=1
d(x,X r Ui)
ist stetig. Gilt x ∈ Ui, so ist d(x,X r Ui) > 0. Da jedes x ∈ X in U1 ∪ . . . ∪ Uk enthalten
ist, gilt f(x) > 0. Da X kompakt ist, nimmt f sein Minimum in einem Punkt x0 ∈ X an.
Setze
ε := min f = f(x0) > 0.
Aus f(x) ≥ ε folgt, dass es mindestens ein i ∈ {1, 2, . . . , k} gibt mit d(x,XrUi) ≥ ε, also
Bε(x) ⊂ Ui.
KAPITEL 9
Differential-Rechnung fur Funktionen in mehreren
Veranderlichen
1. Vorbemerkungen
Die Worte”Veranderliche“ und
”Variable“ haben im folgenden dieselbe Bedeutung.
In diesem Kapitel versehen wir Rn mit irgendeiner Norm ‖ · ‖. Die davon induzierte
Topologie ist die Standard-Topologie, denn alle Normen auf Rn sind aquivalent.
Standard-Basis von Rn: (e1, e2, . . . , en).
L(Rn,Rk) :={
Lineare Abbildungen von Rn nach Rk} ∼= {k × n-Matrizen} =: Rk×n
Bei Prof. Cisinski wurde Mk×n(K) an Stelle von Kk×n verwendet.
313
314 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
Abweichend von unserer bisherigen Schreibweise, ubernehmen wir von nun an die in der
Linearen Algebra ubliche Konvention, dass Elemente von Rn als Spaltenvektoren geschrie-
ben werden. Wir schreiben auch
x = (x1, x2, . . . , xn)T =
x1
x2
...
xn
∈ Rn
LEMMA 1.1. Ist A : Rn → Rk eine lineare Abbildung, dann ist A stetig.
Beweis. Schreibe x = (x1, . . . , xn)T =∑n
j=1 xjej ∈ Rn und
Ax =k∑i=1
n∑j=1
aijxjei.
Da alle Normen auf Rn und Rk aquivalent sind, reicht es, die Behauptung fur die Supre-
mumsnorm zu zeigen.
‖Ax‖∞ ≤
(max
i∈{1,2...,k}
n∑j=1
|aij|
)︸ ︷︷ ︸
C:=
‖x‖∞ ≤ C‖x‖∞.
Zu gegebenem ε > 0 setze δ := ε/C. Dann gilt
d∞(x, y) = ‖x− y‖∞ < δ =⇒ d∞(Ax,Ay) = ‖Ax− Ay‖∞ = ‖A(x− y)‖∞ < ε.
KOROLLAR 1.2. Sind V und W endlich-dimensionale normierte Vektorraume, und A :
V → W linear, dann ist A stetig.
1. VORBEMERKUNGEN 315
Bemerkung 1.3. Sei V ein Vektorraum mit Basis (bn | n ∈ N), den wir mit der zugehori-
gen Supremumsnorm
‖∑n=0
xnbn‖∞ := maxn∈{0,...,`}
|xn|
versehen. Dann gibt es genau eine lineare Abbildung A : V → R mit A(bn) = n. Diese
Abbildung ist nicht stetig. Denn setzen wir an := 1√nbn ∈ V , dann ist (an)n∈Nr{0} eine
Nullfolge in (V, ‖ · ‖∞), aber f(an) =√n→∞ fur n→∞.
Bemerkung 1.4. Das meiste, was wir in diesem Kapitel machen, gilt ebenso (zumeist
mit denselben Beweisen), wenn man
• Rn, Rk und ahnliche Raume durch beliebige (auch unendlich-dimensionale) Ba-
nachraume1 ersetzt und
• lineare Abbildungen (und endliche Matrizen) durch stetige lineare Abbildungen
ersetzt.
Fur Details verweisen wir auf das Buch [2]. Der mathematische Mehraufwand ist gering.
In der Vorlesung schranken wir uns auf Raume Rn, Rk,. . . ein, damit klar ist, dass dies
zunachst die wichtigen Beispiele sind, die Sie moglichst grundlich verstehen mussen. Es
folgt dann auch unmittelbar2, dass alle von uns bewiesenen Aussagen dann auch in endlich-
dimensionalen normierten Vektorraumen V gelten, indem wir eine Basis von V wahlen
und dann mit Rn identifizieren.
1also vollstandige normierte Vektorraume
2Das heißt hier: ohne nochmals in die Beweise schauen zu mussen.
316 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
2. Differenzierbarkeit in mehreren Variablen
Definition 2.1. Sei U ⊂ Rn offen, p ∈ U . Wir sagen, f : U → Rk ist total differenzierbar
in p oder differenzierbar in p, falls es eine lineare Abbildung A : Rn → Rk gibt mit
(2.2) limh→0
f(p+ h)− f(p)− Ah‖h‖
= 0.
Wir sagen, f ist differenzierbar auf W ⊂ U , wenn f in allen p ∈ W differenzierbar ist.
Und f ist differenzierbar, wenn f auf U differenzierbar ist.
3
PROPOSITION 2.3. Sei f , U , p wie oben. Dann gibt es hochstens ein A ∈ Rk×n, fur das
(2.2) gilt.
Falls f differenzierbar in p ist, dann nennt man das obige (eindeutig bestimmte) A die
(totale) Ableitung oder das (totale) Differential von f in p und schreibt sie als Dpf := A
und f ′(p) := A.
PROPOSITION 2.4. Ist f differenzierbar in p, dann ist f stetig in p.
3So wie die Definitionen bisher gewahlt sind, ist das Wortchen”total“ ein erlaubtes Vorwortchen, hat
aber keine inhaltliche Bedeutung. Spater werden wir auch den Begriff”partiell differenzierbar“ kennen
lernen. Man benutzt dann das Vorwortchen “total“ um nochmals zu betonen, dass hier nicht”partiell
differenzierbar“ gemeint ist. Aber selbst dann ist die Bedeutung von”differenzierbar“ und
”total diffe-
renzierbar“ die gleiche.
2. DIFFERENZIERBARKEIT IN MEHREREN VARIABLEN 317
Beweis der beiden vorangehenden Propositionen. (2.2) ist aquivalent zu der Aussage: Es
gibt eine in p stetige Funktion r : U → Rk mit r(p) = 0 und
f(p+ h) = f(p) + Ah+ r(p+ h)‖h‖ fur alle h ∈ Rn mit p+ h ∈ U.
Wir schreiben x fur p + h. Die Funktionen U 3 x 7→ f(p) ∈ Rk, x 7→ A(x − p) und
x 7→ r(x)‖x − p‖ sind stetig in p und somit auch x 7→ f(x). Also ist Proposition 2.4
gezeigt.
Wir zeigen nun Proposition 2.3. Angenommen (2.2) gilt fur A := A1 ∈ Rk×n und A :=
A2 ∈ Rk×n. O.B.d.A. sei U ⊃ Bε(p0). Bestimme4 nun zugehorige ri zu Ai. Es gilt fur
x = p+ h ∈ U :
A1h+ r1(p+ h)‖h‖ = A2h+ r2(p+ h)‖h‖
Wenn wir nun fur t ∈ [0, 1] die Variable h durch th ersetzen, ergibt sich
t(A1−A2)(h) = (A1−A2)(th) = (r2(p+th)−r1(p+th)) ‖th‖ = (r2(p+th)−r1(p+th)) t‖h‖.
Wir dividieren durch t und bekommen:
(A1 − A2)h = (r2(p+ th)− r1(p+ th))︸ ︷︷ ︸→0
‖h‖ → 0
fur t → 0. Da dies fur alle h ∈ Bε(0) gilt, gilt es insbesondere fur h := ε2e`, also (A1 −
A2)(e`) = 0. Es folgt A1 = A2.
Beispiel 2.5. Die Funktion f : R2 → R, (x1, x2)T 7→ x1x2 ist differenzierbar in jedem
Punkt p = (p1, p2)T . Denn, wenn wir A := (p2, p1) setzen5, so gilt fur x = (x1, x2)T und
4Achtung: in der Vorlesung habe ich die Funktionen ri etwas anders definiert. Das andert aber wenig
an der Beweisstruktur.
5kein Tippfehler bei A: es ist ein Zeilenvektor!
318 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
h = (h1, h2)T
f(p+ h)− f(p)− Ah = (p1 + h1)(p2 + h2)− p1p2 − (p2h1 + p1h2) = h1h2 = r(p+ h)‖h‖,
wobei wir fur h ∈ R2 r {0} definieren
r(p+ h) :=h1h2
‖h‖
und r(p) = 0. Es gilt im Fall ‖ · ‖ = ‖ · ‖∞:∣∣∣∣ h1h2
‖h‖∞
∣∣∣∣ ≤ ∣∣∣∣‖h‖∞‖h‖∞‖h‖∞
∣∣∣∣ ≤ ‖h‖∞,das heißt in diesem Fall haben wir limh→0 r(p+h) = 0 = r(p). Wegen der Aquivalenz aller
Normen auf gilt diese Aussage auch fur beliebige Normen ‖ · ‖. Also ist f differenzierbar
in p und f ′(p) = (p2, p1).
Bemerkung 2.6. Differenzierbarkeit ist eine lokale Eigenschaft. D.h. ist U offen in Rn,
p ∈ U und stimmen die Funktionen g, f : U → Rk auf einer Umgebung von p uberein,
dann gilt:
(a) f ist genau dann in p differenzierbar, wenn g in p differenzierbar ist.
(b) Wenn f in p differenzierbar ist, dann gilt f ′(p) = g′(p).
Bemerkung 2.7. Schreibe f : U → Rk in Komponenten f(x) = (f1(x), f2(x), . . . , fk(x))T
mit fi : U → R. Sei p ∈ U . Es gilt wegen Korollar 1.9 (b) in Kapitel 8
f ist stetig in p ⇐⇒ f1, f2,. . . und fk sind stetig in p
2. DIFFERENZIERBARKEIT IN MEHREREN VARIABLEN 319
limh→0
f(p+ h) =
limh→0
f1(p+ h)
limh→0
f2(p+ h)
...
limh→0
fk(p+ h)
Diese Zeile ist so zu lesen: wenn eine der beiden Seiten existiert, dann auch die andere
und dann sind die Werte gleich.
f ist differenzierbar in p ⇐⇒ f1, f2,. . . und fk sind differenzierbar in p
f ′(p) =
f ′1(p)
f ′2(p)...
f ′k(p)
∈ Rk×n
Also: f ′i(p) ∈ R1×n ist eine Zeile der Matrix f ′(p).
Bemerkung 2.8. Sind V und W Vektorraume, dimV = n, dimW = k, U offen in V ,
f : U → W . Die Wahl von Basen liefert Isomorphismen ϕ : Rn → V und ψ : Rk → W .
Wir sagen: f ist differenzierbar in p ∈ U gdw f := ψ−1 ◦f ◦ϕ ist differenzierbar in ϕ−1(p).
Diese Definition ist unabhangig von der Wahl der Basen. Man erhalt ein
f ′(p) ∈ L(V,W )
das ebenfalls unabhangig von der Basis definiert ist, und
ψ−1 ◦ f ′(p) ◦ ϕ = f ′(ϕ−1(p)).
320 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
Bemerkung 2.9. Ist f : U → Rk differenzierbar, so erhalten wir eine Abbildung f ′ : U →
L(Rn,Rk) ∼= Rk×n ∼= Rkn. Ist f ′ wieder differenzierbar (also f zweimal differenzierbar),
so erhalten wir
f ′′ : U → L(Rn,L(Rn,Rk)) ∼= L(Rn,Rkn) ∼= Rn2k
Ist f r-mal differenzierbar, dann
f (r) : U → Rnrk
Wie berechnet man die Koeffizienten von f ′(p)?
Definition 2.10. Sei U offen in Rn, f : U → Rk, p ∈ U ,
(1) Zu v ∈ Rn r {0} wahle ε > 0 so klein, dass fp,v : (−ε, ε) → Rk, fp,v(t) := f(p + tv)
wohldefiniert ist. Wir sagen: f ist differenzierbar in p in Richtung v, falls fp,v in 0
differenzierbar ist. Wir nennen dann
∂p,vf := f ′p,v(0)
die Richtungsableitung von f an der Stelle p in Richtung v.
(2) Wir sagen f ist in p partiell differenzierbar falls f in Richtung ei differenzierbar ist
fur alle i ∈ {1, 2, . . . , n}. Schreibweise p = (p1, . . . , pn). Man nennt
∂f
∂xi(p) := f ′p,ei(0) =
d
dt|t=0
(t 7→ f(p1, p2, . . . , pi−1, pi + t, pi+1, . . . , pn)
)die i-te partielle Ableitung von f an der Stelle p.
Mi 29.5.
2. DIFFERENZIERBARKEIT IN MEHREREN VARIABLEN 321
LEMMA 2.11. f , U , n, k, p wie oben. Ist f (total) differenzierbar in p, dann ist f in p
in jede Richtung differenzierbar. Fur alle v ∈ Rn gilt dann
∂p,v = f ′(p) · v.
Beweis. Gegeben sei ein v ∈ Rnr {0}. Wahle ε > 0 so klein, dass fur alle t ∈ (−ε, ε) gilt:
tv ∈ U . Mit t→ 0 gilt dann auch tv → 0. Es gelte
limh→0
f(p+ h)− f(p)− Ah‖h‖
= 0
fur A = f ′(p) ∈ L(Rn,Rk). Dann gilt auch
0 = limt→0
f(p+ tv)− f(p)− A(tv)
‖tv‖=
1
‖v‖limt→0
f(p+ tv)− f(p)− A(tv)
|t|
und somit
0 =
(limt→0
f(p+ tv)− f(p)
t− Av
).
Also existiert die Richtungsableitung und nimmt den folgenden Wert an:
∂p,vf = f ′p,v(0) = limt→0
f(p+ tv)− f(p)
t= Av
KOROLLAR 2.12. Ist f in p differenzierbar, dann ist die Ableitung in p:
f ′(p) =(∂f∂x1
(p) ∂f∂x2
(p) . . . ∂f∂xn
(p))∈ Rk×n
Also ist ∂f∂xi
(p) die i-te Spalte der Matrix f ′(p).
Bemerkung 2.13. Es gilt also fur U , p, n, k, f wie oben:
f diffbar in p =⇒ f diffbar in jede Richtung in p =⇒ f partiell diffbar in p.
322 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
Aber man kann durch Beispiele zeigen, dass die Umkehrungen nicht gelten:
f diffbar in p 6⇐= f diffbar in jede Richtung in p 6⇐= f partiell diffbar in p.
Beispiel 2.14 (Ausfuhrlich diskutiert in der Zentralubung am 28.5., in der Vorlesung nur
kurz).
f : R2 → R, f(x, y) :=
2xyx2+y2
falls (x, y) 6= 0
0 falls x = y = 0
f ist in 0 partiell differenzierbar und
∂f
∂x(0) = 0,
∂f
∂y(0) = 0.
Aber fur v := 1√2(1, 1)T ist t 7→ f(tv) nicht einmal stetig in 0. Denn f(tv) = 1 fur t 6= 0
und f(0) = 0. Also ist f in 0 nicht in Richtung v differenzierbar. Dadurch ist f auch nicht
total differenzierbar in 0.
f ist also partiell differenzierbar in 0. Nach einem Basiswechsel ist f aber nicht mehr
partiell differenzierbar.
Achsenkreuz, beschriftet x und y mit Hohenlinien der Funktion f .
Es gibt Funktionen f : R2 → R, die in 0 in alle Richtungen differenzierbar sind mit
∀v ∈ R2 : ∂p,vf = 0, die aber dennoch nicht in 0 stetig sind. Sie sind also auch in 0 nicht
total differenzierbar.
PROPOSITION 2.15. f , U , n, k, p wie oben. Aquivalent sind:
(1) f auf U partiell differenzierbar und alle partiellen Ableitungen
∂f
∂xi: U → Rk, i ∈ {1, 2, . . . , n}
2. DIFFERENZIERBARKEIT IN MEHREREN VARIABLEN 323
sind stetig.
(2) f auf U total differenzierbar und
f ′ : U → L(Rn,Rk) ∼= Rk×n
ist stetig
Ist (1) bzw. (2) erfullt, so sagen wir f ist stetig differenzierbar.
Sei U offen in Rn.
C1(U,Rk) := {f : U → Rk | f ist stetig differenzierbar}.
Cr+1(U,Rk) := {f ∈ C1(U,Rk) | f ′ ∈ Cr(U,L(Rn,Rk)) = Cr(U,Rk×n)}
Elemente in Cr(U,Rk) nennt man r-mal stetig differenzierbar.
Beweis der Proposition.”(2) =⇒ (1)“ folgt direkt aus dem oben gesagten.
”(1) =⇒ (2)“:
Zu zeigen ist die Differenzierbarkeit in einem beliebigen p ∈ U . Die Stetigkeit der Ab-
leitung ergibt sich dann direkt aus der Stetigkeit der partiellen Ableitungen. Sobald wir
wissen, dass f differenzierbar ist, erhalten wir aus den partiellen Ableitungen die totale
Ableitung
(2.16) A :=(∂f∂x1
(p) ∂f∂x2
(p) . . . ∂f∂xn
(p))∈ Rk×n .
Da man die Differenzierbarkeit komponentenweise uberprufen kann, konnen wir ohne
Beschrankung der Allgemeinheit annehmen, dass k = 1.
324 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
Zu ε > 0 wahle ein δ > 0, so dass fur alle η ∈ Rn mit ‖η‖∞ < δ gilt:
p+ η ∈ U und fur i ∈ {1, 2, . . . , n} gilt
∣∣∣∣ ∂f∂xi (p+ η)− ∂f
∂xi(p)
∣∣∣∣ < ε
n.
Zu h = (h1, . . . , hn)T ∈ Rn mit ‖h‖∞ < δ setze
q(0) := p = (p1, . . . , pn)T
q(1) := (p1 + h1, p2, . . . , pn)T ,
......
q(`) := (p1 + h1, . . . , p` + h`, p`+1, . . . , pn)T
......
q(n) := p+ h = (p1 + h1, . . . , pn + hn)T
Wir fixieren nun alle Variablen außer der i-ten Koordinate und wenden dann den 1.
Mittelwertsatz der Analysis I auf die Funktion t 7→ f(q(i−1) + tei), definiert fur t ∈ [0, hi]
bzw. t ∈ [hi, 0] an. Wir erhalten
f(q(i))− f(q(i−1))1. MWS
= hi∂f
∂xi(p1 + h1, . . . , pi−1 + hi−1, pi + ϑihi, pi+1, . . . , pn)︸ ︷︷ ︸
=:ξ(i)
fur ein geeignetes ϑi ∈ [0, 1]. Mit ‖ξ(i) − p‖∞ < δ, folgt∣∣∣∣f(q(i))− f(q(i−1))− hi∂f
∂xi(p)
∣∣∣∣ ≤ |hi| εnEs ergibt sich fur die in (2.16) definierte Matrix A
|f(p+ h)− f(p)− Ah| ≤n∑i=1
∣∣∣∣f(q(i))− f(q(i−1))− hi∂f
∂xi(p)
∣∣∣∣ ≤ ε ‖h‖∞.
2. DIFFERENZIERBARKEIT IN MEHREREN VARIABLEN 325
Wir haben das ε-δ-Kriterium fur den Grenzwert
limh→0
f(p+ h)− f(p)− Ah‖h‖∞
= 0
uberpruft, und dies besagt, dass f in p differenzierbar mit Ableitung A ist. 6
PROPOSITION 2.17 (Summenregel). Seien U , n, k, p, wie oben. Seien f, g : U → Rk,
a, b ∈ R, v ∈ Rnr{0}. Sind f und g in p differenzierbar (bzw. in Richtung v differenzierbar,
bzw. partiell differenzierbar), dann ist af + bg : U → Rk ebenfalls in p differenzierbar
(bzw. in Richtung v differenzierbar, bzw. partiell differenzierbar). Es gilt dann
(af + bg)′(p) = af ′(p) + bg′(p)
bzw.
∂p,v(af + g) = a∂p,vf + b∂p,vg
bzw.∂(af + bg)
∂xi(p) = a
∂f
∂xi(p) + b
∂g
∂xi(p).
Beweis. Offensichtlich.
Bemerkung 2.18. Sei f = (f1, . . . , fk)T : U → Rk in p ∈ U partiell differenzierbar. Wenn
wir f ′(p) als Matrix in Rk×n (und nicht als lineare Abbildung in L(Rn,Rk)) ansehen, dann
gilt
f ′(p) =
(∂fi∂xj
(p)
)i∈{1,2,...,k}j∈{1,2,...,n}
.
6Ist Ihnen klar, wieso es hilfreich war, uns auf den Fall k = 1 einzuschranken? Der Grund ist, dass
wir den 1. Mittelwertsatz nutzen, den wir nur fur Funktionen I → R, I ein Intervall, bewiesen haben;
also fur k = 1. Wir werden eine Verallgemeinerung des Mittelwertsatz auf Funktionen f : U → R, U offen
in Rn zwar bald kennenlernen, eine Verallgemeinerung auf Funktionen nach Rk, k > 1 ist jedoch nicht
moglich, siehe Beispiel 2.24.
326 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
Man nennt diese Matrix oft auch die Jacobi-Matrix von f in p. Da wir auf Rn und Rk die
Standardbasen verwenden und lineare Abbildungen mit Matrizen identifizieren Rk×n =
L(Rk,Rn), ist die Jacobi-Matrix dasselbe wie die Ableitung. Sobald man aber Rk und
Rn durch beliebige Vektorraume V und W ersetzt, so ist die Ableitung f ′(p) ∈ L(V,W )
unabhangig von der gewahlten Basis definiert. Die Jacobi-Matrix ist dann die Matrix-
Darstellung von f ′(p) bezuglich zu wahlender Basen.
SATZ 2.19 (Kettenregel). Sei U offen in Rn, V offen in Rm, f : U → Rm, g : V → Rr,
f(U) ⊂ V . Ist f differenzierbar in p und g differenzierbar in q := f(p), dann ist g ◦ f
differenzierbar in p und
(g ◦ f)′(p) = g′(q) · f ′(p).
Man kann g′(q) · f ′(p) als Verkettung der linearen Abbildungen f ′(p) ∈ L(Rn,Rm) und
g′(q) ∈ L(Rm,Rr) ansehen, 7 oder f ′(p) und g′(q) als Matrizen betrachten (also als Jacobi-
Matrizen!) und dann gilt f ′(p) ∈ Rm×n, g′(q) ∈ Rr×m, g′(q) · f ′(p) ∈ Rr×n.
!ACHTUNG!. Es gilt nicht g′(q) · f ′(p) = f ′(p) · g′(q). Die rechte Seite ist fur r 6= n gar
nicht definiert, und auch im Fall n = r gilt hier im allgemeinen keine Gleichheit.
Beweis der Kettenregel. (Bewiesen am Fr. 31.5.)
f(p+ h) = f(p) + f ′(p) · h+ ‖h‖ε(h), limh→0
ε(h) = 0
g(q + k) = g(q) + g′(q) · k + ‖k‖δ(k), limk→0
δ(k) = 0
7Bei dieser Interpretation ware es eigentlich sauberer g′(q)◦f ′(p) an Stelle von g′(q)·f ′(p) zu schreiben.
Da wir aber sowieso lineare Abbildungen mit Matrizen identifizieren, ist es auch sinnvoll die Verkettung
linearer Abbildungen mit Matrizen-Multiplikation zu identifizieren.
2. DIFFERENZIERBARKEIT IN MEHREREN VARIABLEN 327
Fur h→ 0 geht auch k := f(p+ h)− f(p) gegen Null.
g(f(p+ h)) = g(f(p)) + g′(f(p))( =k︷ ︸︸ ︷f ′(p) · h+ ‖h‖ε(h)
)+ ‖k‖δ(k)
= g(q) + g′(q) · f ′(p) · h+ ‖h‖(g′(q)ε(h) +
‖k‖δ(k)
‖h‖
)Die Funktion h 7→ γ(h) := g′(q) · ε(h) ist die Verkettung der in 0 stetigen Funktion ε
mit der linearen (und somit stetigen) Funktion k 7→ g′(q) · k. Also ist γ stetig in 0 und
γ(0) = 0.
Mit h → 0 gilt auch δ(k) → 0. Wir zeigen, dass es eine Konstante C > 0 gibt, so dass
‖k‖/‖h‖ ≤ C fur alle h in einer Umgebung von 0 gilt. Sobald dies gezeigt ist, folgt
limh→0
‖k‖δ(k)
‖h‖= 0,
wobei man k als Funktion in h betrachten sollte. Und hieraus ergibt sich dann die Aussage
des Satzes (Kettenregel).
Es reicht,‖k‖/‖h‖ ≤ C fur die Supremums-Norm auf Rn, Rm und Rm×n zu zeigen, da auf
jedem dieser Vektorraume alle Normen aquivalent sind.
Fur A ∈ Rm×n und h ∈ R gilt
‖Ah‖∞ ≤ n‖A‖∞‖h‖∞
Also
‖k‖∞‖h‖∞
=‖f ′(p) · h+ ‖h‖∞ε(h)‖∞
‖h‖∞
≤ n‖f ′(p)‖∞ ‖h‖∞ + ‖h‖∞ ‖ε(h)‖∞‖h‖∞
≤ n‖f ′(p)‖∞ + ‖ε(h)‖∞
328 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
Da ε(h) → 0 fur h → 0 gilt, ist ‖ε(h)‖∞ auf einer ausreichend kleinen Umgebung von 0
beschrankt.
KOROLLAR 2.20 (Produktregel). Sei U offen in Rn, f, g : U → R. Sind f und g
differenzierbar in p ∈ U , dann auch f · g : U → R, x 7→ f(x) · g(x), und es gilt
(f · g)′(p) = g(p)f ′(p) + f(p)g′(p)
Beweis. Betrachte
F : U → R2, F (x) :=
f(x)
g(x)
.
Nach Voraussetzung ist F differenzierbar in p.
F ′(p) =
f ′(p)g′(p)
∈ R2×n.
Die Abbildung ϕ : R2 → R, (x1, x2)T 7→ ϕ(x) = x1x2 ist (uberall) differenzierbar und es
gilt ϕ′(x1, x2) = (x2, x1) ∈ R1×2, siehe Beispiel 2.5 oder berechne es uber die partiellen
Ableitungen.
f · g = ϕ ◦ F
Also ist nach Kettenregel f · g in p differenzierbar und es gilt
(f · g)′(p) = ϕ′(F (p)) · F ′(p) = (g(p), f(p)) ·
f ′(p)g′(p)
= g(p)f ′(p) + f(p)g′(p).
Fr 31.5.
Ubersicht: Wichtige Beispiele und Methoden, um Differenzierbarkeit zu zei-
gen.
2. DIFFERENZIERBARKEIT IN MEHREREN VARIABLEN 329
• Sei f : Rn → Rk von der Form f(x) = Ax + b, A ∈ Rk×n, b ∈ Rk. Dann ist f
uberall differenzierbar und es gilt f ′(x) = A uberall, denn
f(x+ h)− f(x)− Ah‖h‖
=0
‖h‖.
Also ist f ′ : Rn → Rk×n konstant und deswegen f ′′(x) = 0 ∈ L(Rn,L(Rn,Rk)).
• Ist f : U → Rk (k-mal) differenzierbar und V ⊂ U offen, dann ist auch f |V(k-mal) differenzierbar. Dasselbe fur k-mal stetig differenzierbar.
• Ist f : U → Rk ist auf U partiell differenzierbar und die partiellen Ableitungen
sind stetig, dann ist f : U → Rk stetig differenzierbar8 (Proposition 2.15).
• Summen-, Produkt-, Quotienten-, Kettenregel.
• Polynome in mehreren Variablen sind glatt (= beliebig oft differenzierbar), z.B.
R3 → R, (x, y, z)T 7→ x3 + x2y4 + 3xyz.
• Ebenso Funktionen wie
f : Rn → R, f(x) = ei〈ξ,x〉, ξ ∈ Rn;
f : Rn → R, f(x) = ‖x‖22 =
n∑j=1
x2j ;
f : Rn → R, f(x) = x1 · arctan(1 + ‖x‖2
2 − cos ‖x‖2
).
(Es wurde insbesondere verwendet, dass g : R→ R, g(s) :=∑∞
j=0(−1)j
(2j)!sj glatt ist
und g(t2) = cos(t) fur t ∈ R erfullt. Obige Aussage sind richtig fur die Standard-
Norm ‖ · ‖2, aber nicht fur alle Normen: die Funktionen Rn 3 x 7→ ‖x‖2∞ und
Rn 3 x 7→ ‖x‖21 sind zum Beispiel nicht differenzierbar.)
ENDE DER UBERSICHT
8Also insbesondere differenzierbar!
330 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
KOROLLAR 2.21 (Quotientenregel). Sei U offen in Rn, f : U → R, g : U → R r {0}.
Sind f und g differenzierbar in p ∈ U , dann auch f/g : U → R, x 7→ f(x)/g(x), und es
gilt (f
g
)′(p) =
g(p)f ′(p)− f(p)g′(p)
g(p)2.
Beweis. Ahnlich wie die Produktregel, aber mit ϕ : R× (Rr {0})→ R, (y, z) 7→ y/z.
ϕ′(y, z) = (1/z,−y/z2)(f
g
)′(p) = ϕ′(F (p)) · F ′(p) = (1/g(p),−f(p)/g(p)2)
f ′(p)g′(p)
=g(p)f ′(p)− f(p)g′(p)
g(p)2.
Bemerkungen 2.22.
(1) Produktregel, Quotientenregel, Summenregel richtig fur Richtungsableitungen, insbe-
sondere fur partielle Ableitungen
(2) Die Kettenregel gilt nicht mehr fur alle partiell differenzierbare Funktionen. Ein Bei-
spiel wird in der Zentralubung diskutiert. Man9 betrachte die differenzierbare Funktion
h : R2 → R2, h(x, y) =
x+ y
x− y
=
1 1
1 −1
·xy
, h′(x, y) =
1 1
1 −1
und die Funktion f : R2 → R aus Beispiel 2.14. Dann ist f in 0 partiell differenzierbar
und es gilt∂f
∂x(0) =
∂f
∂y(0) = 0
9In Beispielen wie diesem benutzen wir ab jetzt die Notation h(x, y) als alternative, kurzere Schreib-
weise fur h
xy
= h((x y)T
)
2. DIFFERENZIERBARKEIT IN MEHREREN VARIABLEN 331
Aber
(f ◦ h)(x, y) =2(x+ y)(x− y)
(x+ y)2 + (x− y)2=
(x2 − y2)
x2 + y2,
also
∂(f ◦ h)
∂x(0) = 1,
∂(f ◦ h)
∂x(0) = −1.
(0, 0) ·
1 1
1 −1
= (0, 0) 6= (1,−1)
Wenn die Kettenregel gultig ware, so wurde sie besagen, dass die linke und die rechte
Seite gleich sind. Also ist dies ein Gegenbeispiel.
Mittelwertsatz.
Der Mittelwertsatz fur Funktionen Rn ⊃ U → R ergibt sich direkt aus dem der Analysis
I.
PROPOSITION 2.23 (Mittelwertsatz). Sei U offen in Rn, p, q ∈ U mit
[p, q] := {p+ t(q − p) | t ∈ [0, 1]} ⊂ U.
Die Funktion f : U → R sei stetig auf [p, q] und differenzierbar auf
{p+ t(q − p) | t ∈ (0, 1)}.
Dann gibt es ein ϑ ∈ (0, 1) mit
f(q) = f(p) + f ′(p+ ϑ(q − p)) · (q − p).
332 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
Beweis. ϕ : [0, 1]→ Rn, t 7→ p+ t(q − p).
f ◦ϕ stetig auf [0, 1] und differenzierbar auf (0, 1). Aus dem ersten Mittelwertsatz (Satz 3.2
aus Kapitel 5) folgt die Existenz eines ϑ ∈ (0, 1) mit
f(q)−f(p) = (f◦ϕ)(1)−(f◦ϕ)(0)1. MWS
= (f◦ϕ)′(ϑ) = f ′(ϕ(ϑ))·ϕ′(ϑ) = f ′(p+ϑ(q−p))·(q−p).
!ACHTUNG!. Man kann hier nicht ohne weiteres die Zielmenge R durch Rk ersetzen.
Wenn wir f = (f1, . . . , fk)T schreiben, kann man zwar den Mittelwert-Satz fur jedes fi
anwenden, und wir erhalten jedesmal ein ϑi ∈ [0, 1] mit
fi(q) = fi(p) + f ′i(p+ ϑi(q − p)) · (q − p).
Man findet aber kein ϑ ∈ [0, 1] mit
f(q) = f(p) + f ′(p+ ϑ(q − p)) · (q − p).
Beispiel 2.24. f : R → R2, f(t) = (cos t, sin t)T , p = 0, q = 2π. Dann gilt f(p) = f(q),
aber f ′(t) = (− sin t, cos t)T 6= 0 ∈ R2. Es kann also kein solches ϑ geben.
Definition 2.25. Sei X ein topologischer Raum und Y eine Menge. Eine Funktion f :
X → Y heißt lokalkonstant, wenn jedes x ∈ X eine Umgebung U in X besitzt, so dass
f |U konstant ist.
Konstante Funktionen sind lokal konstant. Ist X diskret (zum Beispiel X = {1, 2, 3} ⊂ R),
dann ist jede Funktion f : X → Y lokal konstant.
Ist f : X → Y lokal konstant und A ⊂ X, dann ist f |A lokal konstant.
2. DIFFERENZIERBARKEIT IN MEHREREN VARIABLEN 333
LEMMA 2.26. Ist f : A → Y lokal konstant und ist A zusammenhangend, dann ist f
konstant.
Beweis. Sei a ∈ A gegeben. Dann folgt aus der lokalen Konstantheit, dass U1 := {x ∈
A | f(x) = f(a)} offen in A ist und dass U2 := {x ∈ A | f(x) 6= f(a)} offen ist. Aus
A = U1
•∪ U2, U1 6= ∅ und A zusammenhangend folgt U2 = ∅.
Aus dem Mittelwertsatz ergibt sich das folgende Korollar:
KOROLLAR 2.27. Sei f : U → R wie oben. Dann gilt
f ′(x) = 0 fur alle x ∈ U ⇐⇒ f ist lokal konstant.
Beweis.
”⇐=“ ist klar.
”=⇒“: Zu p ∈ U wahle ε > 0 mit Bε(p) ⊂ U . Fur jedes q ∈ Bε(p) gibt es ein ϑ ∈ [0, 1] mit
f(q) = f(p) + f ′(p+ ϑ(q − p)) · (q − p) = f(p) + 0.
Also ist f |Bε(p) konstant.
Definition 2.28. Eine Teilmenge G ⊂ Rn nennt man Gebiet, wenn G nicht-leer, offen
und zusammenhangend ist.
KOROLLAR 2.29. Sei f : U → R wie oben, und U ein Gebiet.
f ′(x) = 0 fur alle x ∈ U ⇐⇒ f ist konstant.
334 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
3. Hohere Ableitungen
3.1. Satz von Schwarz. Sei U offen in Rn, f : U → Rk.
Die i-te partielle Ableitung ist
∂f
∂xi: U → Rk.
Man nennt es auch die partielle Ableitung nach xi.
Wenn wir diese Ableitung nun nach xj partiell ableiten, erhalten wir
∂2f
∂xj∂xi:=
∂
∂xj
(∂f
∂xi
): U → Rk
Beispiel: f(x1, x2) = x21x2, ∂f
∂x1(x1, x2) = 2x1x2, ∂2f
∂x2∂x1(x1, x2) = 2x1.
Zu i1, i2, . . . , i` ∈ {1, 2, . . . , n} definieren wir rekursiv:
∂`f
∂xi1∂xi2 · · · ∂xi`:=
∂
∂xi1
(∂`−1f
∂xi2 · · · ∂xi`
): U → Rk.
Die Anzahl der partiellen Ableitungen von der Ordnung ` ist n`. Sind alle diese Ableitun-
gen verschieden?
Wir betrachten nun den Spezialfall k = 1 und ` = 2.
Definition 3.1. Wenn f : U → R auf U differenzierbar ist und (f ′)T : U → Rn = Rn×1
in p ∈ U differenzierbar ist, dann nennt(∂2f
∂xj∂xi(p)
)i,j
=((f ′)T
)′(p)
die Hesse-Matrix von f in p.
3. HOHERE ABLEITUNGEN 335
Die zugehorige bilineare Abbildung ist die Hesse-Abbildung
Hesspf : Rn × Rn → R,
x1
...
xn
,
y1
...
yn
7→
n∑i,j=1
xi∂2f
∂xj∂xi(p) yj
Die Hesse-Matrix ist die Matrix-Darstellung der Hesse-Abbildung.
Schreibweise fur Hesse-Matrix: f ′′(p) :=((f ′)T
)′(p) ∈ Rn×n.
Wir zeigen nun folgenden Satz:
SATZ 3.2 (Satz von Schwarz). Sei f : U → Rk, U offen in Rn, p ∈ U , ` ≥ 2. Ist f
(` − 1)-mal differenzierbar auf U und `-mal differenzierbar im Punkt p, dann sind die
`-ten partiellen Ableitungen in p unabhangig von der Reihenfolge der Ableitungen.
10
Zum Beispiel: Ist f zweimal differenzierbar auf U , dann gilt
∂2f
∂xj∂xi(x1, . . . , xn) =
∂2f
∂xi∂xj(x1, . . . , xn)
das heißt f ′′(p) ist eine symmetrische Matrix.
Dies bedeutet, wir brauchen danach gar nicht mehr darauf zu achten, welcher Index von
∂2f∂xi∂xj
die Zeile und welcher die Spalte angibt.
Im Beweis dieses Satzes von Schwarz ist es aber naturlich sehr wichtig, welche Rolle
Zeilen und Spalten haben: f ′(p) ∈ R1×n ist ein Zeilen-Vektor, f ′(p)T ∈ Rn×1 ist ein
10Nach Hermann Amandus Schwarz (1843-1921) siehe http://de.wikipedia.org/wiki/Hermann_
Amandus_Schwarz
336 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
Spalten-Vektor, und die Hesse-Matrix ist
((f ′)T
)′(p) =
(∂2f
∂xj∂xi(p)
)i,j
.
Mi 5.6.
Beweis. O.B.d.A. ` = 2.11 O.B.d.A. k = 1 (komponentenweise Argumentation). O.B.d.A.
‖ · ‖ = ‖ · ‖2. Sei ε > 0 gegeben und zunachst fixiert. Wahle ρ > 0 so, dass
B3ρ(p) = {x ∈ Rn | ‖x− p‖2 < 3ρ} ⊂ U.
Wahle u, v ∈ Rn mit 0 < ‖u‖2 = ‖v‖2 ≤ ρ. Definiere
g : [0, 1]→ R, g(t) := f(p+ tu+ v)− f(p+ tu).
Wir rechnen fur eine reelle Zahl ϑ ∈ (0, 1). Sie darf zunachst beliebig sein, und spater mit
dem 1. Mittelwertsatz so gewahlt, dass g(1)− g(0) = g′(ϑ).
g′(ϑ) =(f ′(p+ ϑu+ v)− f ′(p+ ϑu)
)u
=(f ′(p+ ϑu+ v)− f ′(p)− (f ′(p+ ϑu)− f ′(p))
)u
Da f ′′(p) existiert, wissen wir, dass
‖(f ′)T
(p+ ϑu+ v)−(f ′)T
(p)− f ′′(p) · (ϑu+ v)︸ ︷︷ ︸a:=
‖ ≤ ε ‖ϑu+ v‖ ≤ ε (‖u‖+ ‖v‖),
11Wenn wir zwei Ableitungen vertauschen konnen, dann konnen wir alle Ableitungen miteinander
sukzessive vertauschen.
3. HOHERE ABLEITUNGEN 337
gilt, falls ρ > 0 genugend klein gewahlt wurde. 12 Und analog erhalten wir fur genugend
kleines ρ > 0:
‖(f ′)T
(p+ ϑu)−(f ′)T
(p)− f ′′(p) · (ϑu)︸ ︷︷ ︸b:=
‖ ≤ ε ‖ϑu‖ ≤ ε (‖u‖+ ‖v‖).
Dies ergibt13
g′(ϑ) =(g′(ϑ)
)T= uT
((f ′)T
(p+ ϑu+ v)−(f ′)T
(p)−((f ′)T (p+ ϑu)− (f ′)T (p)
))= uT
(a− b+ f ′′(p) · v
)Wir erhalten unter Benutzung der Cauchy-Schwarz-Ungleichung14
∀x, y ∈ Rn : xTy = 〈x, y〉 ≤ ‖x‖2‖y‖2
|g′(ϑ)− uTf ′′(p)v| = |uT (a− b)| ≤ ‖u‖ · 2ε (‖u‖+ ‖v‖) ≤ 2ε (‖u‖+ ‖v‖)2.
Mit dem 1. Mittelwertsatz konnen wir nun ϑ ∈ (0, 1) so wahlen, dass
g′(ϑ)1. MWS
= g(1)− g(0) = f(p+ u+ v)− f(p+ u)− f(p+ v) + f(p).
12Genaue Logik: zu obigem ε > 0 gibt es ein ρ1 ∈ (0, ρ] , so dass die Aussage fur 0 < ‖u‖2 = ‖v‖2 ≤ ρ1gilt. Im nachsten Schritt erhalten wir dann ein ρ2 ∈ (0, ρ1] mit analogen Eigenschaften.
13Identifiziere R ∼= R1 ∼= R1×1
14Dies ist wieder Hermann Amandus Schwarz, allerdings ist es fraglich, ob hier der Name Schwarz
so angebracht ist. Schwarz wurde 1843 geboren, obwohl der Satz von Cauchy-Schwarz in Rn bereits
1821 von Cauchy veroffentlicht wurde. Die Integral-Version stammt von Buniakovsky (1859), siehe http:
//jeff560.tripod.com/c.html. Dennoch sollte man die Ungleichung die Cauchy-Schwarz-Ungleichung
nennen, denn nur mit diesem seit ca. 1930 ublichen Namen weiß man, welche Ungleichung gemeint ist.
338 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
Somit
|f(p+ u+ v)− f(p+ u)− f(p+ v) + f(p)− uTf ′′(p)v| = |uT (a− b)| ≤ 2ε (‖u‖+ ‖v‖)2.
Der Ausdruck f(p+u+ v)− f(p+u)− f(p+ v) + f(p) andert sich nicht, wenn wir u und
v vertauschen.
Also
|uTf ′′(p)v − vTf ′′(p)u| ≤ 4ε(‖u‖+ ‖v‖)2.
Wir setzen u := λei, v = λej, λ > 0 genugend klein.∣∣∣∣λ2 ∂2f
∂xj∂xi(p)− λ2 ∂2f
∂xi∂xj(p)
∣∣∣∣ ≤ 4ελ2(1 + 1)2.
∣∣∣∣ ∂2f
∂xj∂xi(p)− ∂2f
∂xi∂xj(p)
∣∣∣∣ ≤ 16ε.
Da wir ε > 0 zu Beginn des Beweises beliebig klein15 wahlen konnten16, ergibt sich
∂2f
∂xj∂xi(p) =
∂2f
∂xi∂xj(p).
17
15Hier bedeutet”beliebig klein“
”beliebig nahe an 0“
16und dann eben auch ρ, λ etc klein, aber positiv wahlen17Kommentar zu den Quellen: verschiedene Beweise in der Literatur benutzen etwas andere Voraus-
setzungen. Die obige Version kenne ich von einem Vorlesungsskript Prof. Helmut Klingen, Freiburg, WS
1988/89. In Konigsberger [23] benotigt man andere Voraussetzungen an Stelle der `-fachen Differenzier-
barkeit in p, namlich (im Fall ` = 2), dass eine der ∂2f∂xj∂xi
fur ein festes i und j stetig in p sein soll. Es
folgt dann ebenfalls die obige Gleichheit. Die Konigsbergerschen Voraussetzungen sind weder schwacher
noch starker als unsere. Viele Bucher nehmen 2-mal stetig differenzierbar an, und erhalten dann eine
Aussage, die echt schwacher als unsere obige und als die Konigsbergersche ist.
3. HOHERE ABLEITUNGEN 339
Beispiel 3.3 (Zentralubung). Sei f : R2 → R,
(x, y) 7→
xy x2−y2x2+y2
falls (x, y) 6= (0, 0),
0 falls (x, y) = (0, 0).
Man rechnet nach, dass f zweimal partiell differenzierbar ist. Aber es gilt
∂2f
∂y ∂x(0, 0) = −1,
∂2f
∂x ∂y(0, 0) = 1
Schreibweise
Oft verwendet man x, y, z an Stelle von x1, x2, x3. Dann
∂f
∂x,∂f
∂y,∂f
∂z.
18
18Bei physikalischen Anwendungen ist oft die Reihenfolge der Variablen unklar, und bestimmte Buch-
staben bedeuten immer bestimmte Großen. Eine gewisse Menge Gas soll bei einer Temperatur T und
einem Volumen V den Druck p haben. Dann ist p eine Funktion in T und V , also p : R2>0 → R>0,
(T, V ) 7→ p(T, V ) oder (V, T ) 7→ p(V, T ). Welches von beiden, weiß man eben nicht so recht, und ist
aber irrelevant. Jedenfalls ist in beiden Fallen klar, was mit ∂p/∂V gemeint ist. Hier ist die eingefuhrte
Notation sehr effektiv und ungefahrlich. Gefahrlich wird es aber in der Physik, wenn wir nun den Blick-
winkel wechseln und sagen, der Druck des Gases hangt von dem Volumen V und der im Gas enthaltenen
Enthalpie H ab, (V,H) 7→ p(V,H). Dann erhalt ∂p/∂V eine andere Bedeutung, denn nun ist damit die
infinitesimale Anderung des Drucks bei Volumenanderung und konstanter Enthalpie gemeint, wohingegen
zuvor damit die infinitesimale Anderung des Drucks bei Volumenanderung und konstanter Temperatur
gemeint war. Dieser Sachverhalt hat mich in der Thermodynamik damals als Student etwas verwirrt.
340 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
3.2. Hohere Ableitungen als multi-lineare Abbildungen. In diesem Abschnitt
sei wieder U offen in Rn. Sei V ein reeller Vektorraum. Alles was wir bisher fur Funktionen
g : U → Rk mit beliebigem k ∈ N definiert und gezeigt haben, konnen wir auch –
mit leichten redaktionellen Modifikationen – fur Funktionen g : U → V definieren und
zeigen19. Ist g : U → V differenzierbar, so erhalten wir die Ableitung g′ : U → L(Rn, V ).
Ein Vorteil dieser Sichtweise ist dann, dass die Differenzierbarkeit und die Ableitung von
g unabhangig von der verwendeten Basis von V definiert sind.
Diese Sichtweise erlaubt uns auch, eine (mindestens) `-mal differenzierbare Funktion f :
U → R `-mal zu differenzieren. Im Fall ` = 2 ist f ′ : U → L(Rn,R) ∼= Rn×1. Wir wenden
dies auf g = f ′ und V = L(Rn,R) an und erhalten g′ = f ′′ : U → L(Rn,L(Rn,R)). Die
Transposition oder aquivalent dazu die Matrix-Darstellung in der Standard-Basis liefert
wie in der Linearen Algebra ublich einen Isomorphismus L(Rn,R)∼=−→ Rn, v 7→ vT . Dies
ergibt
L(Rn,L(Rn,R)) ∼= L(Rn,Rn) ∼= Rn×n ∼= Rn2
.
Wenn wir dies iterativ fur hohere Ableitungen durchfuhren, dann ist es ab der dritten Ab-
leitung nicht mehr moglich und sinnvoll, den Formalismus der Linearen Algebra, der streng
zwischen Zeilen- und Spaltenvektoren unterscheidet, einzuhalten. Die `-te Ableitung hat
` Indizes und fur das ubliche Matrizen-Kalkul brauchten wir dann ein `-dimensionales
Blatt Papier um die Matrix zu notieren. Eine mathematisch konzeptionelle Sichtweise
zur Beschreibung dieser multilinearen Abbildungen ist mit Hilfe von Tensoren (Lineare
Algebra II), ein Begriff, den wir hier nur andeuten wollen. In konkreten Berechnungen
arbeitet man oft am einfachsten mit iterierten partiellen Ableitungen.
19Eine Ausnahme ist hier naturlich der Mittelwertsatz, da das Ziel 1-dimensional sein muss.
3. HOHERE ABLEITUNGEN 341
Sei p ∈ U .
f(p) ∈ R, (0, 0)-Tensor=Skalar
f ′(p) =
(∂f
∂xi(p)
)i=1,...,n
∈ L(Rn,R) ∼= R1×n ∼= Rn, (0, 1)-Tensor=(Zeilen-)Vektor
f ′ : U → Rn
f ′′(p) ∈ L(Rn,L(Rn,R))
L(Rn,L(Rn,R)) ∼= {bilineare Abb. Rn × Rn → R} ∼= Rn×n ∼= Rn2
, (0, 2)-Tensor=Matrix
f ′′ : U → Rn×n
f ′′(p) =
(∂2f
∂xi ∂xj(p)
)i,j∈{1,...,n}
342 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
f ′′′(p) ∈ L(Rn,L(Rn,L(Rn,R)))
L(Rn,L(Rn,L(Rn,R))) ∼= {trilineare Abb. Rn × Rn × Rn → R} ∼= Rn×n×n (0, 3)-Tensor
f ′′′ : U → Rn×n×n
f ′′′(p) =
(∂3f
∂xi ∂xj ∂xk(p)
)i,j,k∈{1,...,n}
...
f (`)(p) : Rn × · · · × Rn︸ ︷︷ ︸`-mal
→ R, `-linear, (0, `)-Tensor
f (`) :=(f (`−1)
)′`-linear
f (`) = f : U → {`-lineare Abb. Rn × · · · × Rn︸ ︷︷ ︸`-mal
→ R}
f (`)(p) =
(∂`f
∂xi1 ∂xi2 · · · ∂xi`
)i1,...,i`∈{1,...,n}
(p)
Der Satz von Schwarz besagt, dass all diese multi-linearen Abbildung in allen Eintragen
symmetrisch sind.20 Wir haben dies bereits benutzt und die Reihenfolge der Indizes ge-
tauscht.
Beispiel 3.4. Sei U offen in Rn, seien p = (p1, . . . , pn)T ∈ U , q = (q1, . . . , qn)T ∈ Rn,
f : U → R sei `-mal differenzierbar. Es gilt c(p + tq) ∈ U fur t ∈ (−ε, ε) fur ein kleines
ε > 0. Sei g(t) := f(c(t)) fur t ∈ (−ε, ε), d.h. g = fp,q in der Notation von Definition 2.10.
20Das heißt, man darf die Eintrage in der Reihenfolge tauschen, also zum Beispiel
f (k)(p)(h1, h2, . . . , hk) = f (k)(p)f(h2, h1, h3, . . . , hk) = f (k)(p)f(hk, hk−1, . . . , h1)
3. HOHERE ABLEITUNGEN 343
c(0) = p, c′(t) = q, c(`)(t) = 0 fur ` ≥ 2.
g′(t) = f ′(c(t))c′(t) =n∑
i1=1
∂f
∂xi1(c(t)) qi1
g′′(t) = c′(t)Tf ′′(c(t))c′(t) + f ′(c(t)) c′′(t)︸︷︷︸=0
= Hessc(t)f(c′(t), c′(t)
)=
n∑i1,i2=1
∂2f
∂xi1∂xi2(c(t)) qi1qi2
g′′′(t) =(
trilineare Abb. zu f ′′′(c(t)))(c′(t), c′(t), c′(t)
)=
n∑i1,i2,i3=1
∂3f
∂xi1∂xi2∂xi3(c(t)) qi1qi2qi3
...
g(`)(t) =(`-lineare Abb. zu f (`)(c(t))
)(c′(t), . . . , c′(t)︸ ︷︷ ︸
`-mal
)=
n∑i1,...,i`=1
∂`f
∂xi1∂xi2 · · · ∂xi`(c(t)) qi1 · · · qi`
3.3. Satz von Taylor.
SATZ 3.5 (Taylor). Sei U offen in Rn und f : U → R. Seien p = (p1, . . . , pn)T , x =
(x1, . . . , xn)T ∈ U mit [p, x] ⊂ U . Die Funktion f sei `-mal differenzierbar auf U und
(`+ 1)-mal differenzierbar auf
{p+ t(x− p) | t ∈ (0, 1)}.
Wir definieren das Restglied Rp` (x) so, dass gilt:
f(x) = f(p) +n∑i=1
∂f
∂xi(p) · (xi − pi) +
1
2!
n∑i1,i2=1
∂2f
∂xi1 ∂xi2(p) · (xi1 − pi1) · (xi2 − pi2)
+ · · ·+ 1
`!
n∑i1,i2,...,i`=1
∂`f
∂xi1 ∂xi2 · · · ∂xi`(p) · (xi1 − pi1) · (xi2 − pi2) · · · (xi` − pi`)
+Rp` (x)
344 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
Dann gibt es ein ϑ ∈ (0, 1) mit
Rp` (x)
=1
(`+ 1)!
n∑i1,i2,...,i`+1=1
(∂`+1f
∂xi1 ∂xi2 · · · ∂xi`+1
(p+ ϑ(x− p))
)· (xi1 − pi1) · · · (xi`+1
− pi`+1)
Die blauen Klammern geben exemplarisch an, wie man derartige Ausdrucke verstehen
muss, diese Klammern werden aber normalerweise nicht gesetzt.
Beweis. Anwendung des Satzes von Taylor aus Analysis I auf die Funktion
g(t) := f(p+ t(x− p))
ergibt:
(3.6) g(t) =∑j=0
tj
j!g(j)(0) + r0
` (t)
mit
r0` (t) =
t`+1
(`+ 1)!g(`+1)(ϑt)
fur ein ϑ ∈ (0, 1). Nun setzen wir t = 1 in (3.6), wenden Beispiel 3.4 fur obiges p und
q = x− p an und erhalten mit Rp` (x) := r0
` (1) die Behauptung.
3. HOHERE ABLEITUNGEN 345
Notation 3.7 (Multi-Indizes). Sei α = (α1, . . . , αn) ∈ Nn, h = (h1, . . . , hn) ∈ Rn, p ∈ U ,
f : U → R. Dann definieren wir
α! := α1!α2! · · ·αn!
|α| := α1 + · · ·+ αn
hα := hα11 · · ·hαnn
Dαf |p :=∂|α|f
∂xα(p) :=
∂α1+···+αnf
∂x1 · · · ∂x1︸ ︷︷ ︸α1-mal
· · · ∂xn · · · ∂xn︸ ︷︷ ︸αn-mal
(p)
Die Bezeichnung ∂|α|f∂xα
(p) wird ofter verwendet, u.a. in der Physik. Die Bezeichnung Dαf |perscheint mir zweckmaßiger und effektiver.
Fr. 7.6.
Wenn wir nun den Satz von Schwarz benutzen, gleiche Terme in der obigen Taylorschen
Formel zusammenfassen, und elementare Formeln der Kombinatorik nutzen21 (siehe Zen-
tralubung am 18.6.), dann erhalten wir den folgenden Satz.
FOLGERUNG 3.8 (Satz von Taylor in Multi-Index-Notation). Sei U , p, x, f wie oben.
Wir definieren das Restglied Rp` (x) so, dass gilt:
f(x) =∑α∈Nn|α|≤`
1
α!Dαf |p(x− p)α +Rp
` (x) .
Dann gibt es ein ϑ ∈ (0, 1) mit
Rp` (x) =
∑α∈Nn|α|=`+1
1
α!Dαf |p+ϑ(x−p)(x− p)α .
21um abzuzahlen bzw. zu berechnen, wie oft jeder Term vorkommt
346 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
3.4. Einschub: Quadratische Formen. Um den Term 2. Ordnung in der Taylor-
Entwicklung genauer zu verstehen, betrachten wir quadratische Formen.
Definition 3.9. Sei K ein Korper mit 2 6= 0, z.B. K ∈ {Q,R,C}. Sei V ein K-
Vektorraum. Eine quadratische Form ist eine Abbildung Q : V → K in der Form
Q(x) = b(x, x)
fur eine K-bilineare Abbildung b : V × V → K.
Bemerkungen 3.10.
(1) Die Bilinearform b in obiger Definition kann symmetrisch gewahlt werden. Denn fur
eine beliebige bilineare Abbildung b : V × V → K schreiben wir
b±(x, y) :=b(x, y)± b(y, x)
2.
Also b(x, y) = b+(x, y) + b−(x, y). Nun ist b+ ist symmetrisch: b+(x, y) = b+(y, x).
Und b− ist antisymmetrisch b−(x, y) = −b−(y, x). Wegen b−(x, x) = −b−(x, x) = 0
gilt b(x, x) = b+(x, x).
(2) Fur Q(x) = b(x, x) gilt
Q(x+ y)−Q(x− y) = b(x+ y, x+ y)− b(x− y, x− y) = 2b(x, y) + 2b(y, x) = 4b+(x, y).
Der symmetrische Anteil von b ist also durch Q eindeutig festgelegt.
3. HOHERE ABLEITUNGEN 347
Definition 3.11. Sei K = R. Eine quadratische Form Q auf V heißt
positiv definit :⇐⇒ ∀x ∈ V r {0} : Q(x) > 0
negativ definit :⇐⇒ ∀x ∈ V r {0} : Q(x) < 0
positiv semi-definit :⇐⇒ ∀x ∈ V : Q(x) ≥ 0
negativ semi-definit :⇐⇒ ∀x ∈ V : Q(x) ≤ 0
indefinit :⇐⇒ Q ist weder positiv semi-definit noch negativ semi-definit
⇐⇒ Es existieren x+, x− ∈ V mit Q(x+) > 0 und Q(x−) < 0.
Nun22 sei V = Rn. Jede quadratische Matrix A ∈ Rn×n definiert eine quadratische Form
QA(x) = xTAx.
Umgekehrt kann man zu einer gegebenen quadratischen AbbildungQ : Rn → R definieren:
aij :=Q(ei + ej)−Q(ei − ej)
4, AQ := (aij)ij ∈ Rn×n
Wir erhalten eine Bijektion
{Quadratische Formen auf Rn} → {A ∈ Rn×n | AT = A}
Q 7→ AQ
QA ←[ A
22Man kann ahnlich vorgehen fur beliebige endlich-dimensionale relle Vektorraume V , in dem man
zuerst eine basis von V wahlt, die uns dann erlaubt, V mit Rn zu identifizieren. Es stellt sich dann
naturlich die Frage, wie sich die definierten Objekte transformieren, wenn wir die Basis wechseln. Dies
sollte im Rahmen der Linearen Algebra diskutiert werden.
348 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
Wir nennen eine quadratische Matrix A positiv definit (bzw. positiv semi-definit, negativ
(semi-) definit, indefinit), falls A symmetrisch ist und QA die gleichnamige Eigenschaft
hat.
Alle symmetrische Matrizen sind diagonalisierbar (siehe Korollar 1.8.5 der Linearen Al-
gebra II von Prof. Cisinski). Man sieht dann leicht, dass fur symmetrische Matrizen gilt:
A ist positiv (bzw. negativ) definit :⇐⇒ alle Eigenwerte von A sind positiv (bzw. negativ)
A ist positiv (bzw. negativ) semi-definit :⇐⇒ alle Eigenwerte sind nicht-negativ (bzw. nicht-positiv)
A ist indefinit :⇐⇒ A hat positive und negative Eigenwerte
Beispiele 3.12.
Elliptisches Paraboloid E Hyperbolisches Paraboloid H
Die Bilder sind von der Webseite http://de.wikipedia.org/wiki/Paraboloid gezichnet von Lars Rohwedder (RokerHRO)
- german wikipedia, Gemeinfrei, Paraboloid https://commons.wikimedia.org/w/index.php?curid=213587, Hyperbolid er-
zeugt mit Povray 3.6, https://commons.wikimedia.org/w/index.php?curid=23859326
3. HOHERE ABLEITUNGEN 349
Die Menge E der Punkte mit z = x2 + y2 ist der Graph der Funktion f1(x, y) = x2 + y2.
Die Funktion f1 ist die quadratische Form zum euklidischen Skalarprodukt auf R2. Sie ist
positiv definit. Die zugehorige symmetrische Matrix ist die Matrix1 0
0 1
.
Graphen von positiv definiten quadratischen Formen nennt elliptisches Paraboloid.
Die Menge H der Punkte mit z = x2 − y2 ist der Graph der Funktion f2(x, y) = x2 − y2.
Die Funktion f2 ist die quadratische Form zur bilinearen Abbildung b : R2 × R2 → R,
b((x, y)T , (x, y)T ) = xx− yy. Sie ist indefinit. Die zugehorige symmetrische Matrix ist1 0
0 −1
.
Graphen von indefiniten quadratischen Formen nennt hyperbolisches Paraboloid.
Wir versehen nun Rn×n mit einer beliebigen Norm ‖ · ‖, und erhalten so eine Topologie
auf Rn×n, die unabhangig von der Norm ist.
LEMMA 3.13. Sei A ∈ Rn×n eine quadratische Matrix, so dass QA positiv definit (bzw.
negativ definit, bzw. indefinit) ist. Dann gibt es eine Umgebung U von A in Rn×n, so dass
fur alle B ∈ U auch QB positiv definit (bzw. negativ definit, bzw. indefinit) ist.
Ersetzt man definit durch semi-definit, so ist das Lemma nicht mehr gultig!
Im indefiniten Fall zeigen wir sogar etwas mehr:
ZUSATZ 3.14. Gilt QA(x+) > 0 und QA(x−) < 0, dann gibt es eine Umgebung U von A
in Rn×n, so dass fur alle B ∈ U gilt: QB(x+) > 0 und QB(x−) < 0.
350 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
23
Beweis. Angenommen es gebe ein x ∈ Rnr{0} mit xTAx > 0. Indem wir x durch x/‖x‖2
ersetzen, konnen wir annehmen, dass
x ∈ Sn−1 := {x ∈ Rn | ‖x‖2 = 1}
Da die Abbildung F : Sn−1 × Rn×n → R, (y,B) 7→ yTBy stetig ist, gibt es zu jedem x
wie oben ein ε(x) > 0, so dass:
(3.15) ∀y ∈ Sn−1 : ∀B ∈ Rn×n : ‖x− y‖2 < ε(x) ∧ ‖B − A‖ < ε(x) =⇒ F (y,B) > 0.
Die Zahl ε(x) hangt naturlich von x ab!
Eine analoge Konstruktion geht auch im Fall QA(x, x) < 0.
1. Fall: Ist nun QA indefinit, dann existieren x+, x− ∈ Sn−1 mit QA(x+) > 0 und QA(x−) <
0. Dann gilt fur ‖B − A‖ < min{ε(x+), ε(x−)}: QB(x+) > 0 und QB(x−) < 0.
2. Fall: Ist QA positiv definit, dann wahle zu jedem x ∈ Sn−1 ein ε(x) > 0 wie in (3.15).
Dann ist (Bε(x)(x) ∩ Sn−1)x∈Sn−1 eine offene Uberdeckung von Sn−1. Da Sn−1 kompakt
ist, kann man zu dieser Uberdeckung eine Lebesguesche Zahl ε > 0 wahlen (die nun nicht
mehr von x abhangt!). Dies bedeutet, dass es zu jedem y ∈ Sn−1 ein x ∈ Sn−1 gibt mit
23Dagegen ist die folgende Aussage falsch: Ist QA indefinit, dann gibt es eine Umgebung U von A
in Rn×n, so dass gilt
∀B ∈ U : ∀x ∈ Rn : (QA(x) > 0 =⇒ QB(x) > 0).
Wie so oft ist hier die Reihenfolge der Quantoren zu beachten! Wahr ist: fur alle x mit QA(x) > 0, gibt
es eine Umgebung U so dass . . . . Falsch ist hingegen: Es gibt ein U so dass fur alle x mit QA(x) > 0 gilt,
. . . . In anderen Worten: das U kann nicht unabhangig von x gewahlt werden.
3. HOHERE ABLEITUNGEN 351
Bε(y) ∩ Sn−1 ⊂ Bε(x)(x) ∩ Sn−1. Es gilt24 dann
∀B ∈ Rn×n : ∀y ∈ Sn−1 : ‖B − A‖ < ε =⇒ F (y,B) = QB(y) > 0.
Also ist fur solche B die quadratische Form QB positiv definit.
3. Fall: negativ analog. Folgt durch Vorzeichenwechel aus dem 2. Fall.
3.5. Lokale Extrema.
Wiederholung.
Sei (M,d) ein metrischer Raum, f : M → R, p ∈M . Wir sagen f hat ein lokales Maximum
(bzw. lokales Minimum) in p, falls es eine Umgebung U von p gibt, so dass
∀x ∈ U : f(x) ≤ f(p) (bzw. f(x) ≥ f(p)).
lokales Extremum in p :⇐⇒ lokales Maximum oder Minimum in p
Wir sagen f hat ein lokales striktes Maximum (bzw. lokales striktes Minimum) in p, falls
es eine Umgebung U von p gibt, so dass
∀x ∈ U r {p} : f(x) < f(p) (bzw. f(x) > f(p)).
LEMMA 3.16. Sei U ⊂ Rn offen, f : U → R. Die Funktion f habe ein lokales Minimum
in p ∈ U .
(1) Wenn die Richtungsableitung ∂p,vf existiert, so gilt ∂p,vf = 0.
(2) Wenn f in p differenzierbar ist, so gilt f ′(p) = 0.
24Wir schließen auch hieraus, dass alle zu y so gewahlten x die Ungleichung ε ≤ ε(x) erfullen. Achtung:
Wir haben aber nicht behauptet ∀x ∈ Sn−1 : ε ≤ ε(x). Man konnte dies durch geschicktere Konstruktion
von ε(x) erreichen, aber wir haben keine Kontrolle, ob es mit dme oben gewahlten funktioniert.
352 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
(3) Wenn f auf einer Umgebung von p differenzierbar ist und in p zweimal differenzierbar
ist, so ist f ′′(p) = Hesspf positiv semi-definit.
Bei lokalen Maxima in p gilt alles analog, wenn wir positiv semi-definit durch negativ
semi-definit ersetzen.
Beweis. Wenn f ein lokales Minimum in p hat, dann hat fp,v, fp,v(t) := f(p + tv) ein
lokales Minimum in 0. Es folgt ∂p,vf = f ′p,v(0) = 0, falls es existiert. Es folgt f ′(p) = 0
falls es existiert. Weiter gilt (falls f ′′(p) existiert):
vTf ′′(p)v = Hesspf(v, v) = f ′′p,v(0) ≥ 0.
Lokales Maximum analog.
Definition 3.17. Man nennt p einen kritischen Punkt oder einen stationaren Punkt von
f , falls f ′(p) = 0.
Also
lokales Extremum in p =⇒ p kritischer Punkt
SATZ 3.18. Sei U offen in Rn, f ∈ C2(U,R) (d.h. f : U → R ist zweimal stetig differen-
zierbar). Sei p ein kritischer Punkt von f .
(1) Ist f ′′(p) positiv definit, dann hat f ein lokales striktes Minimum in p.
(2) Ist f ′′(p) negativ definit, dann hat f ein lokales striktes Maximum in p.
(3) Ist f ′′(p) indefinit, dann hat f weder ein lokales Maximum noch ein lokales Minimum
in p.
!ACHTUNG!. Keine derartige Aussage moglich, falls f ′′(p) semi-definit ist.Mi 12.6.
3. HOHERE ABLEITUNGEN 353
Beweis. Ist f ′′(p) positiv definit (bzw. negativ definit), so gibt es wegen Lemma 3.13
und der Stetigkeit von U → Rn×n, x 7→ f ′′(x) eine Umgebung V von p in U , so dass
f ′′(q) ebenfalls positiv definit (bzw. negativ definit) fur alle q ∈ V ist. Wir wenden die
Taylorformel fur ` = 1 an:
f(p+ h) = f(p) +1
2
n∑i,j=1
∂2f
∂xi ∂xj(p+ ϑh)hihj = f(p) +
1
2hTf ′′(p+ ϑh)h,
falls [p, p + h] ⊂ V , h 6= 0. Also ist f(p + h) > f(p) (bzw. f(p + h) < f(p)) fur alle
p+ h ∈ V r {p}.
Der indefinite Fall ist ahnlich. Wir wahlen h+, h− ∈ Rn mit hT+f′′(p)h+ > 0 und hT−f
′′(p)h− <
0. Nach Zusatz 3.14 gibt es eine Umgebung V um p in U , so dass hT+f′′(q)h+ > 0 und
hT−f′′(q)h− < 0 fur alle q ∈ U . Es folgt dann fur genugend kleines λ > 0:
f(p+ λh+) > f(p) f(p+ λh−) < f(p).
Beispiel 3.19. f : R2 → R, f(x, y) = x3 − 4x− xy + 12y2.
f ′(x, y) = (3x2 − 4 − y,−x + y). Die kritische Punkte sind also p1 := (−1,−1) und
p2 := (4/3, 4/3).
Wir rechnen weiter
f ′′(x, y) =
6x −1
−1 1
.
Es ist also f ′′(p1) indefinit: dies ist ein Sattelpunkt. Und f ′′(p2) ist positiv definit: dies ist
ein lokales striktes Minimum.
354 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
4. Lokale Umkehrung differenzierbarer Abbildungen
Frage:
Sei ∅ 6= U ⊂ Rn offen, f : U → Rk stetig, sei V := f(U) offen in Rk. Wann besitzt f eine
(stetige) Umkehrfunktion g : V → U?
Teil-Antwort:
Fall: n 6= k. Dann hat keine Funktion f wie oben eine Umkehrfuntion! Beweis nicht ganz
einfach (In der Vorlesung Topologie I)25.
Ab jetzt n = k.
Wenn U = Rn und wenn f eine lineare Abbildung ist, sagen wir f(x) = Ax, A ∈ Rn×n,
dann wurde diese Frage intensiv in der Linearen Algebra diskutiert:
f besitzt eine Umkehrfunktion
⇐⇒ f besitzt eine lineare Umkehrfunktion
⇐⇒ f ist injektiv
⇐⇒ f ist surjektiv
⇐⇒ detf 6= 0
⇐⇒ A ist eine invertierbare Matrix
Hierbei detf = detA.
25Und man muss hier sehr genau aufpassen, wie man argumentiert. Man konnte zum Beispiel ver-
muten, dass f nicht surjektiv ist, falls n > k. Dies ist aber nicht richtig. Es gibt zum Beispiel stetige
surjektive Abbildungen R→ Rn fur alle n ∈ N>0. Diese Funktionen sind aber nicht injektiv.
4. LOKALE UMKEHRUNG DIFFERENZIERBARER ABBILDUNGEN 355
Ahnlich gilt fur A ∈ Rn×n, p ∈ Rn und f : Rn → Rn, f(x) := Ax+ p:
f invertierbar⇐⇒ A invertierbar
und gegebenenfalls f−1(y) = A−1(y − p).
Notation fur die Einheitsmatrix:
11n =
1 0 0 . . . 0
0 1 0 . . . 0
0 0 1 0...
.... . .
...
0 0 0 . . . 1
∈ Rn×n
GL(n,R) := {A ∈ Rn×n | detA 6= 0}.
Ab jetzt sei f differenzierbar (aber wir nehmen nicht mehr an, dass f linear sein muss).
LEMMA 4.1. Sei U offen in Rn und f : U → Rn differenzierbar in x ∈ U . Sei V := f(U)
offen in Rn und g : V → Rn differenzierbar in f(x) mit g ◦ f = idU . Dann gilt:
g′(y) · f ′(x) = 11n, wobei y = f(x)
Insbesondere ist dann f ′(x) eine invertierbare Matrix.
Beweis. Kettenregel.
Aus Kapitel 5 wissen wir (Proposition 1.6 und einige verbundene Aussagen):
PROPOSITION. Sei (a, b) ein Intervall, f : (a, b) → R differenzierbar, mit f ′(x) 6= 0
fur alle x ∈ (a, b). Dann ist f injektiv und f((a, b)) ist auch ein offenes Intervall. Die
356 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
Umkehrfunktion
g := f−1 : f((a, b))→ (a, b)
existiert, ist differenzierbar und es gilt fur alle x ∈ (a, b)
g′(y) =(f ′(x)
)−1
, wobei y = f(x)
Ein ahnlicher Satz ist nicht nur fur n = 1, sondern fur alle n ∈ N richtig, der lokale
Umkehrsatz.
Definition 4.2. Sei U offen in Rn, p ∈ U und f : U → Rn. Wir sagen f ist bei p lokal
umkehrbar, falls es eine offene Umgebung V von p in U und eine offene Umgebung W
von f(p) in Rn gibt, so dass f |V : V → W bijektiv ist.
SATZ 4.3 (Lokaler Umkehrsatz). Sei U offen in Rn, p ∈ U . Sei f ∈ C`(U,Rn), ` ≥ 1. Ist
det(f ′(p)) 6= 0, dann gibt es offene Umgebung V von p in U und eine offene Umgebung
W von f(p) in Rn, so dass gilt
(1) f |V : V → W bijektiv. Somit ist f lokal umkehrbar bei p.
(2) (f |V )−1 : W → V ⊂ Rn ist `-mal stetig differenzierbar. 26
(3)[(f |V )−1]′ (y) = (f ′(x))−1, fur alle x ∈ V , wobei y = f(x)
Der Satz weicht an einigen wichtigen Stellen von der obigen Proposition ab. Zum einen
muss man naturlich”f ′(x) 6= 0“ durch
”f ′(x) invertierbar“ ersetzen. Es gibt aber einige
weitere wichtige Unterschiede
• Keine globale Aussage fur Umkehrung, nur eine lokale Aussage.
26In anderen Worten (f |V )−1 ∈ C`(W,Rn).
4. LOKALE UMKEHRUNG DIFFERENZIERBARER ABBILDUNGEN 357
• Wir benotigen stetige Differenzierbarkeit.
Beispiele 4.4.
(1) Ist f affin-linear, sagen wir f(x) = Ax+p, mit A ∈ Rn×n, p ∈ Rn. Dann ist f ′(p) = A.
Falls A ∈ GL(n,R), dann kann man V = W = Rn wahlen, f−1 siehe oben.
(2) Wir betrachten die komplexe Exponentialfunktion exp : C→ C mit Hilfe von C ∼= R2
als Funktion f : R2 → R2,
f(x, y) =
Re exp(x+ iy)
Im exp(x+ iy)
=
ex cos y
ex sin y
f ′(x, y) =
ex cos y −ex sin y
ex sin y ex cos y
= ex
cos y − sin y
sin y cos y
detf ′(x, y) = e2x · 1 6= 0.
Der Definitionsbereich R2 von f ist zusammenhangend, f ′(p) ist invertierbar fur alle
p ∈ D(f), aber dennoch ist f nicht injektiv. Deswegen: nur lokale Umkehrung moglich.
Beweis.
O.B.d.A. p = 0, f(p) = 0, f ′(p) = 11n.
Wenn f dies nicht erfullt, dann definiere
g(x) = f(x+ p)− f(p)
und
f(x) = g′(0)−1g(x).
358 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
Dann haben wir f(0) = 0 und f ′(0) = 11n. Und wenn wir den lokalen Umkehrsatz fur f
in 0 zeigen, dann folgt hieraus unmittelbar der lokale Umkehrsatz fur f in p.
Zu (1); Teil (i): Bestimmung von V und W .
Im folgenden sei ‖ · ‖ immer die Supremumsnorm auf Rn und auf Rn×n, d.h.
∥∥∥∥∥∥∥∥∥∥∥∥
a1
a2
...
an
∥∥∥∥∥∥∥∥∥∥∥∥= max{|a1|, . . . , |an|},
∥∥(aij)i,j∈{1,...,n}∥∥ = max{|a11|, |a12|, . . . , |a1n|, |a21|, . . . , |ann|}.
Also ‖Ax‖ ≤ n‖A‖ ‖x‖ fur x ∈ Rn, A ∈ Rn×n.
Definiere ϕ(x) = x− f(x), also ϕ′(0) = 0.
Bestimme r > 0 so, dass27
(a) B2r(0) = {x ∈ Rn | ‖x‖ < 2r} ⊂ U
(b) ‖ϕ′(x)‖ < 12n
fur alle x ∈ B2r(0)
(b) ist moglich, da ϕ stetig differenzierbar ist28.
27Eine kleine Bemerkung zu den hier verwendeten”Ballen“ Br(p). Es sind Balle nicht – wie zu-
meist ublich – bezuglich der Standardnorm, sondern bezuglich der Supremumsnorm. Deswegen ist BR(p)
eigentlich ein achsenparalleler Wurfel mit Seitenlange 2R und mit Schwerpunkt p.
28und da Urbilder offener Mengen unter stetigen Abbildungen wieder offen sind
4. LOKALE UMKEHRUNG DIFFERENZIERBARER ABBILDUNGEN 359
Fur x, y ∈ Br(0) = {x ∈ Rn | ‖x‖ ≤ r}, wenden wir nun den Mittelwertsatz auf die j-te
Komponente ϕj von ϕ an29 und erhalten fur ein ϑ ∈ (0, 1):
|ϕj(y)−ϕj(x)| = |ϕ′j(x+ ϑ(y − x)︸ ︷︷ ︸z:=
)·(y−x)| ≤ ‖ϕ′(z)·(y−x)‖ ≤ n‖ϕ′(z)‖ ‖y−x‖ ≤ n
2n‖y−x‖.
Daraus ergibt sich dann
(4.5) ‖ϕ(y)− ϕ(x)‖ ≤ 1
2‖y − x‖.
Setze nun W := Br/2(0) und V := Br(0) ∩ f−1(W ). Letzteres ist eine offene Umgebung
von 0. Wir haben
f(V ) ⊂ f(f−1(W )) ⊂ WFr 14.6.
Zu (1); Teil (ii): f |V : V → W ist bijektiv.
f |V injektiv: Seien x, y ∈ V mit f(x) = f(y). Dann gilt x− ϕ(x) = y − ϕ(y), also
‖y − x‖ = ‖ϕ(y)− ϕ(x)‖(4.5)
≤ 1
2‖y − x‖
Also y = x.
f |V surjektiv: Gegeben sei w ∈ W . Wir definieren
ψw : Br(0)→ Rn, x 7→ w + ϕ(x).
Die Abbildung ist eine Kontraktion, denn
‖ψw(y)− ψw(x)‖ = ‖ϕ(y)− ϕ(x)‖(4.5)
≤ 1
2‖y − x‖.
29Also ϕj : U → R, ϕ(x) = (ϕ1(x), . . . , ϕn(x))T
360 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
Es gilt ψw(Br(0)) ⊂ Br(0), denn aus (4.5) folgt:
‖ψw(x)‖ ≤ ‖w‖︸︷︷︸<r/2
+ ‖ϕ(x)−=0︷︸︸︷ϕ(0) ‖︸ ︷︷ ︸
≤r/2
< r.
Da Br(0) vollstandig ist, gibt es nach dem Banachschen Fixpunktsatz30 ein z ∈ Br(0) mit
ψw(z) = z und man sieht dann z ∈ Br(0).31 Es gilt also
z = ψw(z) = w + ϕ(z) = w + z − f(z),
also f(z) = w. Daraus folgt dann auch z ∈ f−1(W ), d.h. z ∈ V .
Zu (2); Teil (i): (f |V )−1 : W → V ⊂ Rn ist differenzierbar auf W .
Uberprufe Differenzierbarkeit in w ∈ W , w = f(p). Zu h mit p+ h ∈ V wahle ein k mit
f(p+ h) = w + k.
Wir konnen hier aber auch h als Funktion in k betrachten, da f |V bijektiv.
k = f(p+ h)− f(p) = f ′(p) · h+ ε(h)‖h‖, limh→0
ε(h) = 0
Wir multiplizieren diese vektorielle Gleichung mit (f ′(p))−1, falls es existiert.
(f ′(p))−1k = h+ ‖h‖(f ′(p))−1ε(h)
= (p+ h)− p+ ‖h‖(f ′(p))−1ε(h)
= f−1(w + k)− f−1(w)− ‖k‖δ(k)
30angewendet auf f := ψw und Y := X := Br(0)
31Denn es ist ja im Bild von ψw.
4. LOKALE UMKEHRUNG DIFFERENZIERBARER ABBILDUNGEN 361
wobei wir definieren
δ(k) = −‖h‖‖k‖
(f ′(p))−1ε(h) .
Die Behauptung folgt also, sobald wir limk→0 δ(k) = 0 gezeigt haben.
Wir rechnen:
ϕ(p+ h)− ϕ(p) = p+ h− f(p+ h)− p+ f(p) = h− k
Also
‖h‖ ≤ ‖ϕ(p+ h)− ϕ(p)‖+ ‖k‖(4.5)
≤ 1
2‖h‖+ ‖k‖.
Es folgt ‖h‖ ≤ 2‖k‖ und somit
limk→0
δ(k) = 0.
Wir haben gezeigt: ist f ′(p) invertierbar, dann ist (f |V )−1 differenzierbar in w = f(p) und
es gilt dann((f |V )−1)′ (w) =
(f ′(p)
)−1.
Die Umgebung V wurde so gewahlt, dass ‖ϕ′(p)‖ < 12n
fur alle p ∈ V . Aus ϕ(x) = x−f(x)
folgt ϕ′(p) = 11n − f ′(p), somit
‖f ′(p) · x‖ ≥ ‖x‖ − ‖ϕ′(p) · x‖ ≥ ‖x‖ − n‖ϕ′(p)‖ ‖x‖ ≥ ‖x‖ − n
2n‖x‖ ≥ 1
2‖x‖.
Also ist f ′(p) eine invertierbare Matrix. Somit ist (f |V )−1 differenzierbar auf W ; und es
gilt (3). Zu (3).
Diese Formel folgt nun direkt aus den Uberlegungen unter (2), Teil (i).
Zu (2); Teil (ii): `-fache stetige Differenzierbarkeit.
362 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
Auf Grund von (3) bildet die Komposition
W(f |V )−1
−→ Vf ′−→ GL(n,R)
inv−→ GL(n,R)
w ∈ W auf[(f |V )−1]′ (w) ab. Da die Inversen-Abbildung
inv : GL(n,R)→ GL(n,R), A 7→ A−1
glatt ist,32 folgt durch Induktion aus der `-fachen stetigen Differenzierbarkeit von f auch
die `-fache stetige Differenzierbarkeit von (f |V )−1.
Beispiel 4.6. f : R2 → R2, f(x, y) :=(
12x2 + y, xy
)T.
f ′(x, y) :=
x 1
y x
, detf ′(x, y) = x2 − y .
Also ist f bei allen Punkten (x, y) mit x2 6= y lokal umkehrbar. In den Punkten der
Form (x, x2) macht der lokale Umkehrsatz keine Aussage, ob eine lokale Umkehrfunktion
existiert. Wenn dort aber in (x, x2) eine lokale Umkehrfunktion existiert, so ist sie nach
Lemma 4.1 in f(x, x2) nicht differenzierbar.
Es gibt also sehr oft lokale Umkehrfunktionen. In den meisten Fallen kann man diese lokale
Umkehrfunktion aber nicht explizit (d.h. als Formelausdruck) angeben. Man kennt dann
die Existenz der Umkehrfunktion, ohne sie als Formelausdruck hinschreiben zu konnen.
Definition 4.7. Sind U und V offene Mengen in Rn, ` ∈ N≥1. Man nennt f : U → V
einen C`-Diffeomorphismus (von U auf V ), falls f : U → V bijektiv ist und sowohl f als
32Die Formel fur A−1, die Sie aus der Linearen Algebra inzwischen kennen sollten, hat Eintrage, die
rationale Funktionen in den Koeffizienten von A sind. Die Nenner dieser rationalen Funktionen sind nicht
Null, da die Matrix invertierbar ist.
5. DER SATZ UBER IMPLIZIT DEFINIERTE FUNKTIONEN 363
auch f−1 `-mal stetig differenzierbar sind. In der Analysis II und III verwenden wir das
Wort Diffeomorphismus im Sinne von C1-Diffeomorphismus.
Der lokale Umkehrsatz liefert:
LEMMA 4.8. Sei U offen in Rn und f : U → Rn eine Funktion, V := f(U). Dann ist f
genau dann ein Diffeomorphismus von U auf V , wenn
• f ∈ C1(U,Rn),
• detf ′(x) 6= 0 fur alle x ∈ U ,
• f injektiv ist.
5. Der Satz uber implizit definierte Funktionen
Motivation: Gegeben sei eine Funktion F : R2 → R. Wir wollen alle Losungen von
F (x, y) = 0
bestimmen. Am liebsten ware es uns, wenn wir eine Losungsfunktion hatten, d.h. eine
differenzierbare Funktion f : (a, b) → R, so dass F (x, f(x)) = 0 und so dass alle oder
moglichst viele Losungen von der Form (x, f(x)) sind.
Beispiele 5.1.
(1) F (x, y) := y − x3 + x2 − 1 = 0. Dann ist f(x) = x3 − x2 + 1 solch eine Losungs-
funktion.
Bild der zugehorigen Losungsmenge
364 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
∂F
∂y= 1 6= 0 in allen Losungen (x, y)
(2) F (x, y) := y2−x2−1 = 0. Dann benotigen wir zwei Funktionen, um die Losungen
zu beschreiben
f+(x) =√x2 + 1, f−(x) = −
√x2 + 1, f± : R→ R.
Bild der Graphen von f+ und f−.
∂F
∂y= 2y 6= 0 in allen Losungen (x, y)
(3) F (x, y) = x− y2 = 0.
Bild der zugehorigen Losungsmenge
Eine Beschreibung der Losungen in der Form (x, f(x)) ist schwierig, da wir
zum einen zwei Funktionen benotigen (x 7→√x und x 7→ −
√x) und da die
Wurzelfunktion in 0 nicht differenzierbar ist. 33
∂F
∂y= 2y 6= 0 in allen Losungen außer in (0, 0)
Problemlos moglich, wenn wir x und y vertauschen. Sei g : R→ R, g(y) = y2.
Die Losungsmenge von x− y2 = 0 ist
{(g(y), y) | y ∈ R}.∂F
∂x= 1 6= 0 in allen Losungen
(4) F (x, y) = x− y3 = 0.
33Da die Quadratwurzelfunktion auf [0,∞) definiert ist, haben wir streng genommen gar nicht defi-
niert, was”differenzierbar in 0“ bedeutet, denn wir benotigen eigentlich dazu, dass die Funktion auf einer
Umgebung der 0 definiert ist. Definition 1.1 in Kapitel 5 ist aber auch sinnvoll, wenn wir nur fordern dass
der Punkt x0 ein Haufungspunkt der Definitionsmenge ist. Mit dieser Definition ist die Wurzelfunktion
nicht differenzierbar in 0.
5. DER SATZ UBER IMPLIZIT DEFINIERTE FUNKTIONEN 365
Bild der zugehorigen Losungsmenge
Eine Beschreibung der Losungen in der Form (x, f(x)) ist moglich durch die
Kubikwurzel x 7→ 3√x, aber sie ist in 0 nicht differenzierbar.
∂F
∂y= 3y2 6= 0 in allen Losungen außer in (0, 0)
Die Differenzierbarkeit ist aber wiederum gegeben, wenn wir zunachst x und
y vertauschen. Sei g : R→ R, g(y) = y3. Die Losungsmenge von x− y3 = 0 ist
{(g(y), y) | y ∈ R}.
∂F
∂x= 1 6= 0 in allen Losungen
(5) F (x, y) = x2 − y2 = 0. Zwei Losungsfunktionen f±(x) = ±x, die sich schneiden
Bild der zugehorigen Losungsmenge
∂F
∂y= −2y 6= 0 in allen Losungen außer in (0, 0)
(6) F (x, y) = x3 − y2 = 0.
Bild der zugehorigen Losungsmenge {( 3√y2, y)T | y ∈ R}
∂F
∂y= −2y 6= 0 in allen Losungen außer in (0, 0)
(7) F (y, x) = x2 + y2 = 0. Losungsmenge {(0, 0)}. Nur ein Punkt!
∂F
∂y(0, 0) = 0
Vermutung: Es geht gut, wenn ∂F∂y
(x, y) 6= 0 fur alle Losungen (x, y). Der Satz uber
implizite Funktionen macht genau solch eine Aussage.
366 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
Notation.
34 Von nun an sei U 6= ∅ offen in Rn+m und F : U → Rm stetig differenzierbar. Punkte in
Rn+m schreiben wir zumeist als (x, y) mit x = (x1, . . . , xn)T ∈ Rn, y = (y1, . . . , ym)T ∈ Rm,
F (x, y) = (F1(x, y), . . . , Fm(x, y)).
∂F
∂x(x, y) :=
(∂Fi∂xj
(x, y)
)i=1,...,mj=1,...,n
∈ Rm×n
∂F
∂y(x, y) :=
(∂Fi∂yj
(x, y)
)i=1,...,mj=1,...,m
∈ Rm×m
Ziel: Finde Funktionen
y1 = y1(x1, . . . , xn)
y2 = y2(x1, . . . , xn)
......
ym = ym(x1, . . . , xn)
so dass (x, y(x)) Losungen von F (x, y) = 0.
SATZ 5.2 (Satz uber implizite Funktionen). Sei ∅ 6= U ⊂ Rn+m offen, und F : U → Rm
stetig differenzierbar. In einem Punkt (x, y) ∈ U soll F (x, y) = 0 und det∂F∂y
(x, y) 6= 0
gelten. Dann gibt es
• eine offene Umgebung V von x in Rn,
• eine offene Umgebung W von y in Rm,
• eine Funktion f : V → W
34Die Indizes k, n und M wechseln etwas ihre Rollen im Vergleich zu den vorherigen Kapiteln
5. DER SATZ UBER IMPLIZIT DEFINIERTE FUNKTIONEN 367
mit den folgenden Eigenschaften
(a) V ×W ⊂ U
(b) {(x, y) ∈ V ×W | F (x, y) = 0} = {(x, f(x)) | x ∈ V }
(c) f ist stetig differenzierbar und es gilt
f ′(x) = −(∂F
∂y(x, f(x))
)−1∂F
∂x(x, f(x))
19.6.
Veranschaulichung des Satzes uber implizite Funktionen
Bemerkung 5.3. Zu gegebenem F , U , x und y liefert der Satz: f , V , W . Diese sind
nicht eindeutig, z.B. kann man V verkleinern und dann f einschranken. Erfullen f , V , W
ebenfalls den Satz und setzen wir Z := V ∩ V ∩ f−1(W ∩ W ), dann gilt f |Z = f |Z .
Bemerkung 5.4. Sei U ⊂ Rm offen und f : U → Rm stetig differenzierbar. Wenn wir
den Satz uber implizite Funktionen auf F : Rm×U → Rm, F (x, y) := x− f(y) anwenden
(n = m), so erhalten wir den lokalen Umkehrsatz.
Bemerkung 5.5. Zu gegebenem F , U , x und y liefert der Satz: f , V , W . Diese sind
nicht eindeutig, z.B. kann man V verkleinern und dann f einschranken. Erfullen f , V , W
ebenfalls den Satz und setzen wir Z := V ∩ V ∩ f−1(W ∩ W ), dann gilt f |Z = f |Z .
Bemerkung 5.6. Sei U ⊂ Rm offen und f : U → Rm stetig differenzierbar. Wenn wir
den Satz uber implizite Funktionen auf F : Rm×U → Rm, F (x, y) := x− f(y) anwenden
(n = m), so erhalten wir den lokalen Umkehrsatz.
Definition 5.7. Die Funktion f nennt man eine durch F (x, y) = 0 implizit definierte
Funktion.
368 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
Bemerkung 5.8. Aussage (b) besteht eigentlich aus zwei Teilen. Zum einen besagt die
Aussage, dass (x, f(x)) eine Losung ist, also F (x, f(x)) = 0 fur alle x ∈ V . Zum anderen
sind lokal (d.h. heißt hier in V ×W ) alle Losungen von dieser Form.
Bemerkung 5.9. Oft kann man implizite Funktionen nicht explizit angeben.”Expli-
zit angeben“ heißt hier durch einen Formelausdruck, der sich aus Standard-Operationen
zusammensetzt.
ZUSATZ 5.10 (zum Satz5.2 uber implizite Funktionen). Sei ` ≥ 1. Ist F `-mal stetig
differenzierbar, so ist f ebenfalls `-mal stetig differenzierbar.
Beispiel 5.11. Wir betrachten die Funktion
F : Rn+1 → R, F (z) := 〈z, z〉 − 1.
F ∈ C∞(Rn+1,R). Dann ist die Losungsmenge die n-dimensionale Sphare
Sn := {z ∈ Rn+1 | F (z) = 0} = {z ∈ Rn+1 | ‖z‖2 = 1}.
Wir schreiben z = (x, y) mit x ∈ Rn und y ∈ R. Nun ist (∂F/∂y)(x, y) = 2y und dies ist
fur y 6= 0 nicht Null. Zu jedem (x, y) ∈ Sn mit y 6= 0 kann man den Satz uber implizite
Funktionen anwenden.
Wir beschranken uns auf den Fall y > 0. Dann sind mogliche Wahlen:
V := B1(0,Rn) := {x ∈ Rn | ‖x‖ < 1}, W := (0,∞), f(x) :=√
1− ‖x‖22
Eine andere Wahl ware, falls ‖x‖ < 1− δ:
V := B1−δ(0,Rn), W := (0,∞), f(x) :=√
1− ‖x‖22
Eine weitere mogliche Wahl ist: V := B1(0,Rn), W :=(
0, 10011000
), f(x) :=
√1− ‖x‖2
2
5. DER SATZ UBER IMPLIZIT DEFINIERTE FUNKTIONEN 369
Nicht erlaubt sind:
V := B1(0,Rn), W := (0, 1), (W zu klein)
V := B1(0,Rn), W := R, (W zu groß)
Zeichnung des Standardkreises mit den oben erklarten Mengen.
Beweis des Satzes5.2 uber implizite Funktionen und des Zusatzes. Sei F wie im Satz gege-
ben. Wir definieren: G : U → Rn+m, G(x, y) :=
x
F (x, y)
. Wir haben G ∈ C`(U,Rm+n)
und
G′(x, y) =
11n 0
∗ ∂F∂y
(x, y)
Also
det G′(x, y) = (det11n)︸ ︷︷ ︸=1
·(
det∂F
∂y(x, y)
)6= 0 .
Wende den lokalen Umkehrsatz auf G im Punkt p := (x, y) an. Es gibt dann eine offene
Umgebung V von p in U und eine offene Umgebung W von G(p) in Rn+m, so dass
G|V : V → W bijektiv ist und so dass (G|V )−1 ∈ C`(W,Rn+m). Offensichtlich hat (G|V )−1
die Form
(G|V )−1(x, y) :=
x
ψ(x, y)
fur ein ψ ∈ C`(W,Rm). Durch Differenzieren von idV = (G|V )−1 ◦GV erhalten wir
(5.12)
11n+m =[(G|V )−1
]′(x, F (x, y)) ◦G′(x, y) =
11n 0
∗ ∂ψ∂y
(x, F (x, y))
11n 0
∗ ∂F∂y
(x, y)
.
370 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
Ausmultiplizieren und Vergleichen des rechten unteren Blocks auf beiden Seiten ergibt
11m =
(∂ψ
∂y(x, F (x, y))
)(∂F
∂y(x, y)
).
O.B.d.A. konnen wir annehmen,35 dass V die Gestalt V = V0 ×W hat mit V0 offen in
Rn und W offen in Rm. Die Abbildung ψ bildet W in W ab, und ψ(x, 0) = (x, y)T . Auf
Grund der Stetigkeit von ψ finden wir eine offene Umgebung V von x mit V ⊂ V0 und
V × {0} ⊂ W . Dann ist f : V → W , f(x) := ψ(x, 0) eine wohldefinierte C`-Abbildung
und F (x, f(x)) = 0. Wir haben somit (a),”⊃“ in (b) und f ∈ C`.
Ist (x, y) ∈ V ×W mit F (x, y) = 0, dann istG(x, y) = (x, 0)T , also (G|V )−1(x, 0) = (x, y)T .
Dies impliziert f(x) = y. Wir erhalten”⊂“ in (b).
Wenn wir die Stern-Eintrage in (5.12) berucksichtigen, sieht man
0 =∂ψ
∂x(x, F (x, y)) +
∂ψ
∂y(x, F (x, y))
∂F
∂x(x, y),
also
f ′(x) =∂ψ
∂x(x, 0) = −∂ψ
∂y(x, 0)
∂F
∂x(x, f(x)) = −
(∂F
∂y(x, f(x))
)−1∂F
∂x(x, f(x)).
6. Untermannigfaltigkeiten
6.1. Definition und erste Beispiele.
Definition 6.1. Sei ` ≥ 1, k ≥ n. Sei M eine Teilmenge von Rk. Wir nennen M eine
n-dimensionale Untermannigfaltigkeit von Rk mit Regularitat C`, falls es zu jedem p ∈M35Wenn dies nicht der Fall ist, ersetzen wir einfach V durch eine kleinere offene Umgebung von p, die
die gewunschte Produktgestalt hat, und W ist dann entsprechend zu verkleinern.
6. UNTERMANNIGFALTIGKEITEN 371
offene Mengen U, V ⊂ Rk und einen C`-Diffeomorphismus ϕ : U → V gibt, so dass p ∈ U
und ϕ(U ∩M) = V ∩ (Rn×{0}). Solch ein ϕ nennt man eine Untermannigfaltigkeitskarte
von M .
Anschaulich: der Diffeomorphismus ϕ verbiegt U ∩M in eine offene Teilmenge von Rn ×
{0} ⊂ Rk.
Ein Bild, das eine Untermannigfaltigkeitskarte graphisch darstellt mit
Untermannigfaltigkeitskarte
Untermannigfaltigkeit mit Regularitat C` := C`-Untermannigfaltigkeit
In der Analysis II und III nutzen wir den Begriff”Untermannigfaltigkeit“ (ohne weitere
Angabe der Regularitat) immer im Sinne von”C1-Untermannigfaltigkeit“.
Spezielle Dimensionen.
In manchen Dimensionen haben Untermannigfaltigkeiten spezielle Namen:36
2-dimensionale Untermannigfaltigkeiten von Rk =: Flachen in Rk
(k − 1)-dimensionale Untermannigfaltigkeiten von Rk =: Hyperflachen in Rk
Beispiele 6.2.
(1) Sei M ⊂ Rk ein n-dimensionaler Untervektorraum (mit n ≤ k). Wahle eine Ba-
sis (v1, . . . , vn) von M . Wie in der Linearen Algebra I gezeigt, existieren Vektoren
vn+1, . . . , vk in Rk, so dass (v1, . . . , vn, vn+1, . . . , vk) eine Basis von Rk ist. Betrachte
die lineare Abbildung ϕ : Rk → Rk, vi 7→ ei, wobei ei der i-te kanonische Basisvektor
36Der Fall n = 1 is hier leider etwas kompliziert: zusammenhangende 1-dimensionale Untermannig-
faltigkeit =: regulare eingebettete Kurve
372 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
ist. Dann ist ϕ ein linearer Isomorphismus, insbesondere ein C∞-Diffeomorphismus
mit
ϕ(M) = ϕ(Span{v1, . . . , vn})
= Span{e1, . . . , en}
= Rk ∩ (Rn × {0}).
Also ist M eine n-dimensionale Untermannigfaltigkeit der Regularitat C∞ von Rk.
(2) Ist W offen in Rn, f ∈ C`(W,Rm). Dann ist der Graph von f
Graphf := {(x, f(x)) | x ∈ W}
eine n-dimensionale Untermannigfaltigkeit von Rn+m mit Regularitat C`. Denn
ϕ : W × Rm︸ ︷︷ ︸U :=
→ W × Rm︸ ︷︷ ︸V :=
, (x, y) 7→ (x, y − f(x))
ist eine `-mal stetig differenzierbare Abbildung mit `-mal stetig differenzierbarer Um-
kehrabbildung
ϕ−1 : W × Rm → W × Rm, (x, y) 7→ (x, y + f(x)) .
U ∩Graphf = Graphf = {(x, f(x) | x ∈ W} ϕ→ W × {0} = V ∩ (Rn × {0})
(x, f(x)) 7→ (x, 0)
Ein Bild, das die Abbildung ϕ darstellt
(3) Ist W offen in Rn, f−, f+ ∈ C`(W,Rm) mit f− < f+. Dann ist Graphf− ∪ Graphf+
eine n-dimensionale Untermannigfaltigkeit von Rn+m. Definiere zum Beispiel
ϕ− : {(x, y) | x ∈ W ∧ y < f+(x)}︸ ︷︷ ︸U :=
→ {(x, y) | x ∈ W ∧ y < f+(x)− f−(x)}︸ ︷︷ ︸V :=
, (x, y) 7→ (x, y−f−(x))
6. UNTERMANNIGFALTIGKEITEN 373
ϕ+ : {(x, y) | x ∈ W ∧ f−(x) < y}︸ ︷︷ ︸U :=
→ {(x, y) | x ∈ W ∧ −f+(x) + f−(x) < y}︸ ︷︷ ︸V :=
, (x, y) 7→ (x, y−f+(x))
Ein Bild, das die Abbildungen ϕ+ und ϕ− darstelltFr. 21.6.
(4) M ist 0-dimensionale Untermannigfaltigkeit von Rk⇐⇒M ist eine diskrete Teilmenge
von Rk :⇐⇒ Die Spurtopologie auf M ist die diskrete Topologie
Zum Beispiel ist {1/n | n ∈ N>0} eine 0-dimensionale Untermannigfaltigkeit von R.
(5) M ist k-dimensionale Untermannigfaltigkeit von Rk ⇐⇒ M ist eine offene Teilmenge
von Rk
(6) Ist M ⊂ Rk eine n-dimensionale Untermannigfaltigkeit der Regularitat C`, so ist auch
jede offene Teilmenge M ′ von M eine n-dimensionale C`-Untermannigfaltigkeit von
Rk. Denn zu gegebenem p ∈ M ′ wahle eine Untermannigfaltigkeitskarte ϕ : U → V
mit p ∈ U . Da M ′ offen in M ist, gibt es eine in Rk offene Teilmenge U ′ mit M ′ =
M ∩ U ′. Dann ist ϕ|U∩U ′ : U ∩ U ′ → ϕ(U ∩ U ′) eine Untermannigfaltigkeitskarte von
M ′ mit p ∈ U ∩ U ′.
(7) Es folgt hieraus, dass die Untermannigfaltigkeits-Eigenschaft lokal ist, das heißt: Eine
Teilmenge M ⊂ Rk ist genau dann eine n-dimensionale C`-Untermannigfaltigkeit,
wenn jeder Punkt p ∈ M eine offene Umgebung U besitzt, so dass U ∩M eine n-
dimensionale C`-Untermannigfaltigkeit ist.
Untermannigfaltigkeiten sind insbesondere fur Anwendungen in der Physik und anderen
Naturwissenschaften, aber auch zum Beispiel fur (nicht-lineare) Optimierungsprobleme in
der Betriebswirtschaftslehre sehr wichtig.
Untervektorraume von Rk kann man auf verschiedene Arten beschreiben, zum Beispiel
374 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
(1) durch Gleichungen, z.B. V := {(x1, . . . , xk) ∈ Rk | x1 + 2x2 = 0}
(2) als Graph, das heißt V := Graphf einer linearen Funktion f : Rn → Rk−n
(3) V := Bild(f) fur eine lineare Abbildung f : Rm → Rk
(4) durch Parametrisierung, z.B. definiere zu v1, v2 ∈ Rk:
V := {tv1 + sv2 | t, s ∈ R}.
(5) Durch eine lineare Untermannigfaltigkeitskarte wie in Beispiel 6.2 (1).
Jede dieser Beschreibungen verallgemeinert sich zu einer Beschreibung von Untermannig-
faltigkeiten:
(1) Abschnitt 6.2: lokal als Urbild eines regularen Werts,
(2) Abschnitt 6.2: lokal als Graph, das heißt lokal als Graphf einer C`-Funktion f : U →
Rk−n, U offen in R
(3) Abschnitt 6.3: lokal als Bild einer Immersion,
(4) Abschnitt 6.5: durch eine lokale Parametrisierung
(5) durch eine Untermannigfaltigkeitskarte wie in Definition 6.1
Hierbei ist (5) fur theoretische Uberlegungen sehr hilfreich ist, aber oft wenig geschickt fur
konkrete Rechnungen. Moderne Programme, die gekrummte Flachen modellieren mussen,
z.B. Raytracer wie povray nutzen verschiedene dieser Methoden, um Flachen zu beschrei-
ben. Sie haben zumeist Hilfsmittel, um von einer Form in die andere umrechnen zu konnen.
6.2. Der Satz vom regularen Wert. Ein wichtiges Kriterium, um zu zeigen, dass
eine Teilmenge von Rk eine Untermannigfaltigkeit ist, ist der Satz vom regularen Wert.
6. UNTERMANNIGFALTIGKEITEN 375
Definition 6.3. Sei U offen in Rk, F : U → Rm `-mal stetig differenzierbar, ` ≥ 1. Wir
sagen z ∈ Rm ist ein regularer Wert von F , falls gilt
(6.4) ∀p ∈ F−1({z}) : F ′(p) hat Rang m.
Ist z kein regularer Wert, so nennt man z einen singularen Wert.
!ACHTUNG!. Im Fall z /∈ F (U) ist z ein regularer Wert! Denn der Allquantor geht uber
die leere Menge, die Aussage (6.4) ist also wahr. Wenn z ein regularer Wert von F , so
impliziert dies nicht, dass z ein Wert von F ist.
Beispiele 6.5. (1) Ist F : Rn → Rk eine lineare Funktion. Dann gilt:
F ist surjektiv
⇐⇒ 0 ist ein regularer Wert
⇐⇒ Alle z ∈ Rk sind regulare Werte
(2) Wir betrachten (ahnlich wie in Beispiel 5.11) die Funktion
F : Rn+1 → R, F (x) := 〈x, x〉.
F ′(x) = 2xT .
Dann ist 0 kein regularer Wert, aber jedes z ∈ R r {0} ist ein regularer Wert. Fur
z < 0 ist F−1({z}) = ∅ und dann ist z ein regularer Wert, siehe die obige Achtung-
Bemerkung. Fur z > 0 gilt ‖F ′(x)‖2 = 2√z falls F (x) = z. In diesem Fall hat also
F ′(x) Rang 1.
Sn := F−1({1}) = {x ∈ Rn+1 | ‖x‖2 = 1}.
376 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
Definition 6.6. Sei
Sk :={
Permutationen︸ ︷︷ ︸=Bijektionen
{1, 2, . . . , k} → {1, 2, . . . , k}}
Zu σ ∈ Sk sei Lσ die lineare Abbildung Rk → Rk mit ej 7→ eσ(j).
SATZ 6.7 (Satz vom regularen Wert). Sei M eine Teilmenge von Rk, ` ≥ 1. Aquivalent
sind:
(1) M ist n-dimensionale Untermannigfaltigkeit von Rk mit Regularitat C`
(2) Zu jedem p ∈ M existiert eine offene Umgebung U in Rk und eine Funktion F ∈
C`(U,Rk−n), so dass 0 regularer Wert von F ist und F−1({0}) = U ∩M .
(3) Zu jedem p ∈ M existiert eine offene Umgebung U in Rk und eine Funktion F ∈
C`(U,Rk−n), ein z ∈ Rk−n, so dass z regularer Wert von F ist und F−1({z}) = U ∩M .
(4) Lokal ist M nach Permutation der Komponenten von Rk der Graph einer Funktion,
genauer: zu jedem p ∈ M existiert ein σ ∈ Sk, eine offene Teilmenge V von Rn, eine
offene Teilmenge W von Rk−n und eine C`-Funktion f : V → W , so dass
(V ×W ) ∩ Lσ(M) = Graph(f).
Beispiele 6.8.
(1) Sn ist eine Untermannigfaltigkeit von Rn+1 mit Regularitat C∞, da 1 ein regularer
Wert der Funktion F aus dem letzten Beispiel ist.
(2) Sei wieder W offen in Rn, f ∈ C`(W,Rm), Graphf := {(x, f(x)) | x ∈ W}. Dann ist
F : W × Rm︸ ︷︷ ︸U :=
→ Rm, (x, y) 7→ y − f(x)
6. UNTERMANNIGFALTIGKEITEN 377
ist eine `-mal stetig differenzierbare Abbildung. Wir rechnen
F ′(x, y) = (−f ′(x) 11m)
und deswegen ist jedes z ∈ Rm ein regularer Wert von F , insbesondere ist 0 regularer
Wert. Dies liefert einen neuen Beweis, dass Graphf eine C`-Untermannigfaltigkeit von
Rn+m ist.
Bemerkung 6.9. In den obigen Beispielen ist die Untermannigfaltigkeit eine Teilmenge
von U . Es gibt aber auch n-dimensionale C∞-Untermannigfaltigkeiten M ⊂ Rk, fur die
es kein F ∈ C1(U,Rk−n) wie oben mit M ⊂ U gibt. Ein Beispiel hierfur ist das Mobius-
Band , das wir spater naher betrachten wollen. Um solche Untermannigfaltigkeiten als
Nullstellen regularer Werte darzustellen, benotigt man mehrere offene Mengen U ⊂ Rk
und Abbildungen F : U → Rk−n wie oben.
Bemerkung 6.10. (Wiederholung aus der Linearen Algebra) Sei A ∈ Rm×k und m ≤ k,
z.B. obiges F ′(x). Dann gilt
A hat Rang m
⇐⇒ A hat maximalen Rang
⇐⇒ Die Abbildung Rk → Rm, x 7→ Ax ist surjektiv
⇐⇒ Die Abbildung Rm → Rk, x 7→ ATx ist injektiv
⇐⇒ Nach Umordnen der Spalten von A, bilden die letzten m Spalten eine invertierbare Matrix
Beispiel 6.11.
A :=
1 2 4
3 1 2
378 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
Die letzten beiden Spalten sind linear abhangig. Nach Vertauschen der ersten und dritten
Spalte haben wir 4 2 1
2 1 3
.
Wegen
det
2 1
1 3
= 5 6= 0
sehen wir, dass A Rang 2 besitzt.
Beweis von Satz 6.7.
”(1) =⇒ (2)“: Zu p ∈ M sei eine Untermannigfaltigkeitskarte ϕ gegeben. Sei π : Rk →
Rk−n die Projektion auf die letzten k−n Komponenten. Dann ist F := π ◦ϕ : U → Rk−n
eine C`-Abbildung. Weiter ist 0 ist ein regularer Wert, denn F ′(p) = π′(ϕ(p))ϕ′(p), der
Rang von π′(ϕ(p)) ist k−n, und da ϕ′(p) invertierbar ist, bleibt der Rang einer (k−n)×k-
Matrix unverandert, wenn wir sie von rechts mit ϕ′(p) multiplizieren. Außerdem gilt
F−1({0}) = ϕ−1(V ∩ (Rn × {0})) = U ∩M .
”(2) =⇒ (3)“: Offensichtlich.
”(3) =⇒ (4)“: Zu p ∈ M sei eine offene Umgebung U in Rk gegeben, eine Abbildung
F ∈ C`(U,Rk−n) und ein z ∈ Rk−n, so dass z regularer Wert ist und F−1({z}) = U ∩M .
Insbesondere F (p) = z, also hat F ′(p) Rang m := k−n. Nach Umordnen der Komponen-
ten von Rk, konnen wir annehmen, dass die hintersten m Spaltenvektoren in F ′(p) ∈ Rm×k
eine invertierbare Matrix bilden. Somit sind die Voraussetzung erfullt, um den Satz 5.2
uber implizite Funktionen im Punkt (x, y) := p und mit F (x, y) := F (x, y) − z statt F
anzuwenden. Die damit erhaltenen V , W und f erfullen (4).
6. UNTERMANNIGFALTIGKEITEN 379
”(4) =⇒ (1)“: Folgt direkt aus Beispiele 6.2 (2)
”Graphen sind Untermannigfaltigkeiten“
und (7)”Die Untermannigfaltigkeits-Eigenschaft ist lokal“.
Beispiel 6.12 (Torus). Fur ein R ∈ (0, 1) betrachten wir
TR :=
{(x, y, z) ∈ R3 |
(√x2 + y2 − 1
)2
+ z2 = R2
}⊂ R3.
Abbildung 9: Eine Zentralprojektion von TR fur R ≈ 0, 2.
Quelle: Wikipedia https://commons.wikimedia.org/wiki/File:Torus.svg
GNU Free Documentation License, Version 1.2
UBUNG 6.13. Zeigen Sie, dass TR eine zwei-dimensionale Untermannigfaltigkeit von R3
ist.
Losung (von Nicolas Ginoux): Die Teilmenge TR ist ein sogenannter Drehtorus im R3:
er entsteht durch Drehung eines Kreises in der x-z-Ebene mit Mittelpunkt (x, z) = (1, 0)
und mit Radius R um die z-Achse.
Sei
U :={
(x, y, z) ∈ R3 | (x, y) 6= (0, 0) und (‖(x, y)‖2 = 1 =⇒ z 6= 0)}
= R3 r{R · e3 ∪ (S1×{0})
}⊂ R3
380 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
und F : U → R, (x, y, z) 7→(√
x2 + y2 − 1)2
+ z2 −R2. Die Teilmenge U ist offen im R3
mit TR ⊂ U : wegen 0 < R < 1 hat die Gleichung 1 + z2 = R2 keine (reelle) Losung und
damit gilt (x, y) 6= (0, 0) fur alle (x, y) ∈ TR; außerdem gilt, im Fall (x, y, z) ∈ TR mit
‖(x, y)‖2 = 1, die Gleichung z2 = R2, insbesondere z 6= 0.
Nun ist TR = F−1({0}). Um zu beweisen, dass TR eine zwei-dimensionale Untermannig-
faltigkeit von R3 ist, reicht es daher, zu beweisen, dass 0 ein regularer Wert der Funktion
F ist.
Da (x, y) 7→√x2 + y2 auf R2 r {(0, 0)} unendlich oft differenzierbar ist, ist die Funktion
F : U → R als Verknupfung unendlich oft differenzierbarer Abbildungen unendlich oft
differenzierbar. Fur alle (x, y, z) ∈ U ist die Matrix von F ′(x, y, z) in den kanonischen
Basen gegeben durch
2
(x(√x2+y2−1)√x2+y2
y(√x2+y2−1)√x2+y2
z
).
Gilt√x2 + y2 = 1, so verschwinden die beiden ersten Komponenten von F ′(x, y, z); ist
nun (x, y, z) ∈ U , so gilt dann z 6= 0 und damit ist F ′(x, y, z) 6= 0. Gilt√x2 + y2 6= 1,
so konnen wegen (x, y) 6= (0, 0) nicht beide erste und zweite Komponenten von F ′(x, y, z)
verschwinden, d.h., es gilt auch in diesem Fall F ′(x, y, z) 6= 0. Insgesamt haben wir be-
wiesen, dass fur jedes (x, y, z) ∈ U die Abbildung F ′(x, y, z) nicht verschwindet und ist
damit – weil F ′(x, y, z) seine Werte im 1-dimensionalen Vektorraum R hat – surjektiv.
Daraus folgt, dass 0 ein regularer Wert der Funktion F ist. Dies liefert das Ergebnis.
Bemerkung 6.14. Man zeigt leicht, dass
TR := {TR(α, β) | α, β ∈ R} ,
6. UNTERMANNIGFALTIGKEITEN 381
wobei TR : R× R→ R3,
TR(α, β) :=
(1 +R cosα) cos β
(1 +R cosα) sin β
R sinα
.
Mi 26.6.
6.3. Der Immersionssatz.
Definition 6.15. Sei W eine offene Teilmenge von Rn und Ψ : W → Rk. Man nennt Ψ
eine Immersion , wenn Ψ stetig differenzierbar ist und wenn fur alle p ∈ W die Matrix
f ′(p) Rang n hat (d.h. die zu f ′(p) gehorende lineare Abbildung Rn → Rk, x 7→ f ′(p) · x
ist injektiv). Man nennt Ψ eine C`-Immersion37, wenn zusatzlich f ∈ C`, ` ≥ 1.
Insbesondere ist dann k ≥ n, falls W 6= ∅. Die Eigenschaften”Ψ ist injektiv“ und
”Ψ ist
eine Immersion“ sind unabhangig voneinander.
Beispiele 6.16.
(1) Die Abbildung Ψ : R→ R2, Ψ(t) := (cos t, sin t)T erfullt Ψ′(t) := (− sin t, cos t)T 6= 0.
Also ist Ψ eine Immersion, aber nicht injektiv.
(2) Ψ : R → R, Ψ(t) := t3 ist ein Homoomorphismus, also insbesondere injektiv, aber
keine Immersion, denn Ψ′(0) = 0.
(3) Die in Beispiel 6.14 definierte Funktion TR : R2 → R3 ist fur R ∈ (0, 1) eine C∞-
Immersion (Beweis: kleinere Rechnung!).
SATZ 6.17 (Immersionssatz). Sei W eine offene Teilmenge von Rn und Ψ : W → Rk
eine C`-Immersion, ` ≥ 1. Dann gibt es zu jedem p ∈ W eine offene Umgebung U ⊂ W ,
37Also: C1-Immersion=Immersion
382 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
so dass Ψ(U) eine n-dimensionale C`-Untermannigfaltigkeit von Rk ist und so dass Ψ|U :
U → Ψ(U) ein Homoomorphismus ist.
Beweis des Immersionssatzes. Sei Ψ: W −→ Rk eine Immersion und p ∈ W . Da Ψ′(x0)
Rang n hat, sind die Vektoren ∂Ψ∂x1
(p), . . . , ∂Ψ∂xn
(p) linear unabhangig in Rk. Deswegen
existieren k − n Vektoren vn+1, . . . , vk in Rk so, dass(∂Ψ∂x1
(p), . . . , ∂Ψ∂xn
(p), vn+1, . . . , vk
)eine Basis von Rk ist. Betrachte nun die Abbildung
Φ : W × Rk−n −→ Rk, (x, α) 7−→ Ψ(x) +k∑
j=n+1
αjvj,
wobei x ∈ W und α = (αn+1, . . . , αk) ∈ Rk−n. Offensichtlich ist Φ ∈ C`. Wir rechnen:
Φ′(p, 0) =
(∂Ψ
∂x1
(p)∂Ψ
∂x2
(p) · · · ∂Ψ
∂xn(p) vn+1 · · · vk
).
Die Spalten bilden – wie oben konstruiert – eine Basis, d.h. Φ′(p, 0) ist eine invertierbare
Matrix.
Nach dem lokalen Umkehrsatz existieren eine offene Umgebung V1 von (p, 0) in W ×Rk−n
und eine offene Umgebung V2 von Φ(p, 0) = Ψ(p) in Rk, so dass ΦV1 : V1 −→ V2 ein
C`-Diffeomorphismus ist.
Durch Verkleinern von V1 und V2 konnen wir erreichen, dass V1 von der Form V1 = U×U ′
ist (mit p ∈ U ⊂ W , 0 ∈ U ′).
Dann ist ϕ := (Φ|U×U ′)−1 : V2 → U × U ′ eine Untermannigfaltigkeitskarte von Ψ(U) =
Φ(U × {0}). Da Φ|U×U ′ : U × U ′ → V2 ein Homoomorphismus ist, ist auch Ψ|U =
(Φ|U×U ′)∣∣U×{0} : U × {0} ∼= U → Ψ(U) ein Homoomorphismus.
6. UNTERMANNIGFALTIGKEITEN 383
Zeichnung von Ψ(W ) als Kurve in R2 und von Φ(U × U ′) = V2 mit ϕ Abbildungspfeil
auf U × U ′.
ZUSATZ 6.18. Die Voraussetzungen seien wie im vorangehenden Satz. Außerdem nehmen
wir an, Ψ : W → Ψ(W ) sei ein Homoomorphismus. Sei V ⊂ Rr eine offene Teilmenge und
h : V → Rk eine C`-Abbildung mit h(V ) ⊂ Ψ(W ). Dann ist Ψ−1 ◦ h : V → W ebenfalls
in C`.
Zeichnung zur Veranschaulichung des Zusatzes
Beweis. Wir zeigen die stetige Differenzierbarkeit auf einer Umgebung eines beliebigen
Punkts x ∈ V . Wir definieren ϕ wieder wie im Beweis des Satzes auf einer kleinen offenen
Umgebung V2 von h(x) = Ψ(p), U eine offene Umgebung von p wie oben. Wir setzen
V0 := h−1(V2), dies ist eine offene Umgebung von x. Es gilt fur y ∈ V0:
ϕ ◦ h(y) = Ψ−1 ◦ h .
Die linke Seite ist `-mal stetig differenzierbar als Funktion in y also auch die rechte, was
zu zeigen war.
Beispiele 6.19. Es gibt injektive Immersionen Ψ : W → Rk, so dass Ψ : W → Ψ(W )
eine unstetige Umkehrabbildung besitzt:
(1) Die Abbildung Ψ : (0, 2π)→ R2, Ψ(t) := (sin t, sin(2t))T erfullt Ψ′(t) := (cos t, 2 cos(2t))T .
Aus cos t = 0 folgt t = π(k + 12) fur k ∈ Z, also t ∈ {π/2, 3π/2}. Dann aber gilt
cos(2t) 6= 0. Es folgt Ψ′(t) 6= 0 fur alle t ∈ (0, 2π), das heißt Ψ ist eine Immersion.
Man sieht auch leicht, dass Ψ injektiv ist. Allerdings ist Ψ kein Homoomorphismus
384 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
von (0, 2π) auf Ψ((0, 2π)). Denn fur eine Folge von ti ∈ (0, 2π) mit limi→∞ ti = 0
gilt pi := Ψ(ti) → 0 = (0, 0) = Ψ(π) ∈ R2. Somit gilt pi → 0 ∈ R2, aber
Ψ−1(pi) = ti 6→ π = Ψ−1(0). Somit ist Ψ−1 nicht (folgen-)stetig.
Bild von Ψ((0, 2π))
(2) Sei wieder TR wie in Beispiel 6.14 definiert. Zu einer Zahl ρ ∈ R definieren wir
Ψρ : R→ R3, Ψρ(t) := TR(2πρt, 2πt).
Fall 1: ρ = p/q ∈ Q, seien p,q ∈ Z teilerfremd. Dann ist Ψρ periodisch: Ψρ(t+q) =
Ψρ(t). Ψ(R) ist eine geschlossene Kurve38, die sich in einem Durchlauf p-
mal um die”Seele“ S1 × {0} ⊂ R3 des Torus windet und q-mal um die
z-Achse. Man nennt Ψ(R) einen (p, q)-Torus-Knoten. 39
Fall 2: ρ ∈ R r Q. Dann ist Ψρ eine injektive Immersion. Ihr Bild Ψρ(R) liegt
dicht in TR, aber Ψρ ist kein Hooomorphismus auf sein Bild. Denn sind
1, ρ in τ rational linear unabhangige reelle Zahlen, dann ist jedes x ∈ TRHaufungspunkt der Folge ak := ψ(kτ). Eine Teilfolge konvergiert dann
gegen ein x ∈ Ψ(R). Deswegen ist Ψ−1 nicht folgenstetig.
6.4. Einbettungen von Untermannigfaltigkeiten. In diesem Abschnitt sei πx :
Rk → Rn die Projektion auf die ersten nKomponenten und πy : Rk → Rk−n die Projektion
auf die letzten k − n Komponenten.
38genauer: es ist eine zusammenhangende kompakte 1-dimensionale Untermannigfaltigkeit von R3
39Torusknoten sind derzeit ein beliebtes Kinderspielzeug und sind unter dem Namen”Flow ring“ im
Handel erhaltlich und auch auf Video-Plattformen findet man alles mogliche.
6. UNTERMANNIGFALTIGKEITEN 385
LEMMA 6.20. Sei M eine n-dimensionale40 Untermannigfaltigkeit von Rk mit einer Un-
termannigfaltigkeitskarte ϕ : U → V , p ∈ U ∩M , und sei Ψ : W → Rk eine injektive
Immersion mit Ψ(W ) ⊂ M und p ∈ Ψ(W ). Sei Tp ⊂ Rk das Bild von Ψ′(Ψ−1(p)). Dann
gilt ϕ′(p) · Tp = Rn × {0}.
Das Lemma gilt in leicht veranderter Form, wenn Ψ nicht mehr injektiv ist, sondern
nur noch eine Immersion. Wir wollen dies aber nicht naher betrachten, da man jede
Immersion durch Einschrankung auf eine genugend kleine Umgebung eines gegebenen
Punktes injektiv machen kann (Immersionsatz).
Zeichnung zu obigem Satz
Beweis. Setze W0 := Ψ−1(U) ⊂ W und x0 := Ψ−1(p). Man pruft leicht, dass πy◦ϕ◦Ψ|W0 :
W0 → Rk−n alles auf 0 abbildet. Nach Kettenregel ist dann
0 = π′y(ϕ(p))︸ ︷︷ ︸= (0 11k−n)
· ϕ′(p) ·Ψ′(x0) ,
das heißt, das Bild der Matrix A := ϕ′(p) ·Ψ′(x0) liegt in Rn × {0}, und da Ψ′(x0) Rang
n besitzt und ϕ′(p) invertierbar ist, wissen wir, dass das Bild von A gleich Rn × {0} ist.
Da das Bild von A gleich ϕ′(p) · Tp ist, folgt die Behauptung. Fr 28.6.
SATZ 6.21. Sei Ψ : W → Rk eine injektive C`-Immersion, ` ≥ 1. Dann ist Ψ(W ) eine C`-
Untermannigfaltigkeit von Rk genau dann, wenn Ψ : W → Ψ(W ) ein Homoomorphismus
ist.
40Das Wort”n-dimensional“ habe ich wahrscheinlch in der Vorlesung leider vergessen, ist aber sehr
wichtig.
386 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
Zeichnung zu diesem Satz
Beweis. Setze M := Ψ(W ).
”⇐= “: Wir wollen zeigen, dass M eine C`-Untermannigfaltigkeit von Rk ist. Sei dazu
p ∈ M und p = Ψ(x0), x0 ∈ W . Nach dem Immersionssatz 6.17 gibt es eine offene
Umgebung W ′ von x0 in W , so dass M ′ := Ψ(W ′) eine C`-Untermannigfaltigkeit von
Rk ist. Da Ψ : W → Ψ(W ) ein Homoomorphismus ist und da W ′ offen in W ist, ist
M ′ = Ψ(W ′) eine offene Teilmenge von M = Ψ(W ), d.h. es existiert eine in Rn offene
Menge U1 mit M ′ = U1 ∩M .
Sei ϕ2 : U2 → V2 eine Untermannigfaltigkeitskarte von M ′ mit p ∈ U2. Setze U :=
U1 ∩U2 3 p, V := ϕ2(U) und ϕ := ϕ2
∣∣U
. Dann sind U und V offen in Rk, und ϕ : U → V
ist ein C`-Diffeomorphismus, fur den gilt:
ϕ(U ∩M) = ϕ2(U ∩M ′) = V ∩ ϕ2(M ′) = V ∩ V2︸ ︷︷ ︸=V
∩(Rn × {0}).
Also ist ϕ : U → V eine Untermannigfaltigkeitskarte von M mit p ∈ U .
”=⇒ “: Wir zeigen, dass Ψ−1 : M → W folgenstetig ist. Sei hierzu eine Folge (pi)i∈N in M
gegeben mit limi→∞ pi = p ∈M . Da nach VoraussetzungM eine C`-Untermannigfaltigkeit
ist, konnen wir eine Untermannigfaltigkeitskarte ϕ : U → V mit p ∈ U wahlen. Es liegen
fast alle pi in U∩M und deswegen sind fast alle qi := πx◦ϕ(pi) ∈ π(V ) ⊂ Rn wohldefiniert
und konvergieren gegen q := πx ◦ ϕ(p) ∈ Rn. Insbesondere ϕ(pi) = (qi, 0).
Setze wieder W0 := Ψ−1(U) ⊂ W und x0 := Ψ−1(p). Wie im vorangehenden Lemma
gezeigt, ist das Bild von ϕ′(p)Ψ′(x0) gleich Rn × {0}.
6. UNTERMANNIGFALTIGKEITEN 387
Somit ist
(πx ◦ ϕ ◦Ψ|W0)′(x0) = π′y(ϕ(p))︸ ︷︷ ︸
= (11n 0)
· ϕ′(p) ·Ψ′(x0)
eine invertierbare Matrix in Rn×n. Also ist nach dem lokalen Umkehrsatz ρ := πx◦ϕ◦Ψ|W0
lokal um x0 umkehrbar und xi := ρ−1(qi) → x0 := ρ−1(q). Wegen Ψ(xi) ∈ M haben wir
ϕ ◦ Ψ(xi) = (qi, 0) und aus der Injektivitat von ϕ folgt Ψ(xi) = pi, also Ψ−1(pi) =
xi → x0 = Ψ−1(p). Wir haben also die Folgenstetigkeit und somit die Stetigkeit von
Ψ−1 : M → W gezeigt.
Beispiel 6.22 (Fortsetzung von Beispiel 6.19 (1)). Sei wieder Ψ : (0, 2π) → R2, Ψ(t) :=
(sin t, sin(2t))T . Diese Abbildung ist eine injektive C∞-Immersion, aber kein Homoomor-
phismus von (0, 2π) auf Ψ((0, 2π)
): das haben wir oben bereits alles gezeigt. Das Bild
M := Ψ((0, 2π)
)ist keine Untermannigfaltigkeit, da es keine Untermannigfaltigkeitskarte
von M gibt, die 0 = Ψ(π) ∈ R2 enthalt. Die Nicht-Existenz einer Untermannigfaltig-
keitskarte kann man auch elementar beweisen, bequemer geht es aber mit dem obigen
Satz.
Nochmals dieselbe Zeichnung vom Bild von Ψ.
Definition 6.23. Eine injektive Immersion, die ein Homoomorxphismus auf ihr Bild ist,
nennt man eine Einbettung einer Untermannigfaltigkeit.
6.5. Lokale Parametrisierungen von Untermannigfaltigkeiten.
Definition 6.24. SeiM ⊂ Rk eine Teilmenge. Eine n-dimensionale lokale C`-Parametrisierung
von M ist eine C`-Immersion Ψ : W → Rk mit den folgenden Eigenschaften:
388 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
(a) W ⊂ Rn ist offen,
(b) Ψ(W ) ist offen in M , das heißt Ψ(W ) = U ∩M fur eine offene Teilmenge U von Rk,
(c) Ψ : W → Ψ(W ) ist ein Homoomorphismus.
LEMMA 6.25. Ist Ψ : W → Rk eine lokale C`-Parametrisierung von M ⊂ Rk wie in
obiger Definition und W0 eine offene Teilmenge von W . Dann ist auch Ψ|W0 : W0 → Rk
ebenfalls eine lokale C`-Parametrisierung von M .
Beweis. Wahle zu Ψ ein U wie in (b).
Offensichtlich ist Ψ := Ψ|W0 eine C`-Immersion, die (a) und (c) mit Ψ statt Ψ erfullt.
Zu (b) fur Ψ: Da Ψ : W → Ψ(W ) ein Homoomorphismus ist, ist Ψ(W0) offen in Ψ(W ).41
Es gibt also eine offene Teilmenge U von Rk mit Ψ(W0) = Ψ(W ) ∩ U . Es folgt Ψ(W0) =
(U ∩ U)︸ ︷︷ ︸offen in Rk
∩M .
PROPOSITION 6.26. Sei M ⊂ Rk eine Teilmenge. Dann sind aquivalent:
(a) M ist eine n-dimensionale C`-Untermannigfaltigkeit.
(b) Fur alle p ∈ M existiert eine n-dimensionale lokale C`-Parametrisierung von M der
Regularitat C`, deren Bild p enthalt.
41In der Notation fur Bilder und Urbilder, die wir in der Analysis I benutzt haben, wird dies etwas
klarer: es gilt Ψ#(W0) = (Ψ−1)#(W0) und diese Menge ist als Urbild der offenen Menge W0 bezuglich
der stetigen Abbildung Ψ−1 : Ψ(W )→W wieder offen.
6. UNTERMANNIGFALTIGKEITEN 389
Beweis.
”(a) =⇒ (b)“ Sei p ∈ M beliebig. Sei ϕ : U → V eine Untermannigfaltigkeitskarte von
M mit p ∈ U . Definiere W := V ∩ (Rn × {0}) und Ψ := (ϕ−1)|W : W → Rk. Dann ist
W offen in Rn, Ψ ist C` (da ϕ−1 ∈ C`) mit Ψ′(x) = (ϕ−1)′(x)|Rn×{0} injektiv ∀x ∈ W ,
es gilt Ψ(W ) = ϕ−1(W ) = U ∩ M und Ψ : W → Ψ(W ) ist die Einschrankung eines
Homoomorphismus, ist also selbst ein Homoomorphismus.
”(b) =⇒ (a)“ Sei p ∈ M beliebig. Sei Ψ: W → Rk eine lokale C`-Parametrisierung von
M mit p = Ψ(x0) ∈ Ψ(W ). Nach dem Immersionssatz 6.17 gibt es eine offene Umgebung
W0 von x0, so dass Ψ(W0) 3 p eine Untermannigfaltigkeit ist.
Da Ψ−1 : Ψ(M)→M stetig ist, ist Ψ(W0) offen in Ψ(W ) und damit wegen (b) von Defini-
tion 6.24 offen in M . Es gibt also eine in Rk offene Menge U 3 p mit Ψ(W0) = U ∩M . Wir
haben also zu jedem p ∈M eine in Rk offene Umgebung U gefunden, so dass U ∩M eine
Untermannigfaltigkeit von Rk ist. Da die Untermannigfaltigkeitseigenschaft eine lokale
Eigenschaft ist (Beispiele 6.2 (7)), folgt daraus, dass M eine C`-Untermannigfaltigkeit
ist.
Beispiele 6.27.
(1) Sei U ⊂ Rn offen und f ∈ C`(U,Rm). Betrachte
Graphf := Mf := {(x, f(x)) |x ∈ U} ⊂ Rn × Rm = Rn+m.
Dann ist die Abbildung Ψ : U −→ Rn+m, x 7−→ (x, f(x))T eine n-dimensionale
globale C`-Parametrisierung von Mf : die Abbildung Ψ ist C`, es gilt Ψ′(x) =(
11nf ′(x)
),
∀x ∈ U , wobei 11n die n×n Einheitsmatrix bezeichnet – insbesondere gilt rg(Ψ′(x)) =
390 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
n – und Ψ(U) = Mf , wobei Ψ: U −→ Mf ein Homoomorphismus ist mit Umkehrab-
bildung Mf −→ U , (x, f(x)) 7−→ x (Projektion auf die n ersten Koordinaten).
(2) Sei M := Sn ⊂ Rn+1. Sei U := {x ∈ Rn : ‖x‖2 < 1} ⊂ Rn. Definiere Ψ+ : U −→ Rn+1,
x 7−→ (x,√
1− ‖x‖22)T sowie Ψ− : U −→ Rn+1, Ψ−(x) := (x,−
√1− ‖x‖2
2)T . Dann
sind Ψ+ und Ψ− n-dimensionale lokale C∞-Parametrisierungen von Sn. Es gilt
Ψ+(U) = Sn ∩(Rn × (0,∞)
)=
x1
x2
...
xn+1
∈ Sn∣∣∣ xn+1 > 0
.
Uberdeckung von S1 ⊂ R2 durch die Bilder von 4 Parametrisierungen
Wir vertauschen nun die Komponenten von Rn+1 so, dass die `-te Komponente zur
letzten Komponente wird. Wir erhalten dann zu jedem ` = 1, . . . , n, zwei weitere
lokale Parametrisierungen Ψ`±, setze Ψn+1
± := Ψ±. Es gilt
Ψ`±(U) =
x1
x2
...
xn+1
∈ Sn∣∣∣ ± x` > 0
,
und somit
Sn = Ψ1+(U) ∪Ψ2
+(U) ∪ · · · ∪Ψn+1+ (U) ∪Ψ1
−(U) ∪Ψ2−(U) ∪ · · · ∪Ψn+1
− (U).
Die Sphare wird also von den Bildern von 2(n+ 1) lokalen Parametrisierungen uber-
deckt.
6. UNTERMANNIGFALTIGKEITEN 391
(3) Seien a, b ∈ R und R ∈ (0, 1). Sei TR der Torus und TR definiert wie in Beispiel 6.14.
Dann ist die Abbildung
(a, a+ 2π)× (b, b+ 2π)→ R3, (α, β) 7→ TR(α, β)
eine lokale C∞-Parametrisierung von TR.
Bemerkung 6.28. Sei i : Rn → Rk die Abbildung x 7→ (x, 0). Ist ϕ : U → V eine
C`-Untermannigfaltigkeitskarte von M , so ist Ψ := ϕ−1 ◦ i : W → Rk, W := i−1(V ) ∼=
V ∩ (Rn × {0}) eine lokale C`-Parametrisierung: Die C`-Eigenschaft und die Offenheit
von W ist klar, ebenso Ψ(W ) = V ∩M und somit die Offenheit von Ψ(W ) in M . Da
i eine Immersion ist und ϕ ein Diffeomorphismus ist, ist auch Ψ eine Immersion. Die
Umkehrabbildung von Ψ : W → Ψ(W ) ist πx◦ϕ|V ∩M und diese Abbildung ist offensichtlich
stetig.
Umgekehrt kann man zu jeder lokalen Parametrisierung Ψ eine Untermannigfaltigkeits-
karte ϕ finden, so dass man Ψ wie oben aus ϕ erhalt (ohne Beweis). Die lokale Existenz
von solch einem ϕ haben wir im Beweis des Immersionssatzes 6.17 gezeigt, dort haben wir
Ψ zu einer Funktion Φ fortgesetzt, die eine lokale Umkehrfunktion ϕ besitzt. Man kann
mit großerem Aufwand solch ein ϕ : U → V konstruieren, so dass Ψ(M) ⊂ U .
Bild zu dieser Bemerkung
Bemerkung 6.29. Man kann sich nun naturlich fragen: sind die Eigenschaften (b) und
(c) in Definition 6.24 wirklich notwendig? Wir haben im letzten Abschnitt gesehen, dass
wir (c) benotigen, damit das Bild eine Untermannigfaltigkeit ist. Wenn (c) nicht erfullt
ist, haben wir Gegenbeispiele. Bedingung (b) ist ebenfalls notwendig. Die Menge M :=
392 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
[0, 1]×Rn ist keine Untermannigfaltigkeit von Rn+1.42 Wir definieren nun zu jedem (x, y) ∈
[0, 1] × Rn ist Ψx : Rn → Rn+1, Ψx(t) = (x, t) eine injektive Immersion, die (a) und (c),
aber nicht (b) erfullt. Offensichtlich ist (x, y) im Bild von Ψx.
6.6. Der Tangentialraum.
Definition 6.30. Sei M ⊂ Rk eine n-dimensionale Untermannigfaltigkeit und p ∈M ein
Punkt. Der Tangentialraum an M im Punkt p ist
TpM := {v ∈ Rk | ∃ ε > 0 und c : (−ε, ε) −→ Rk ist C1-Kurve mit c((−ε, ε)) ⊂M,
c(0) = p und c′(0) = v} ⊂ Rk.
PROPOSITION 6.31. Sei M ⊂ Rk eine Untermannigfaltigkeit und p ∈M ein Punkt.
(a) Sei Ψ: W −→ Rk eine n-dimensionale lokale C1-Parametrisierung von M um p. Sei
x0 := Ψ−1(p) ∈ W . Dann gilt
TpM = Bild(Ψ′(x0)
).
(b) Sei ϕ : U −→ V eine Untermannigfaltigkeitskarte von M um p. Dann gilt
TpM = ϕ′(p)−1 · (Rn × {0}) .
(c) Sei U ⊂ Rk offene Umgebung von p und F : U −→ Rk−n C` mit 0 als regularem Wert
und F−1({0}) = U ∩M . Dann gilt
TpM = ker(F ′(p)).
42Begrundung: Es ist keine (n + 1)-dimensionale Untermannigfaltigkeit, da es nicht offen in Rn+1
ist. Es ist keine 0-dimensionale Untermannigfaltigkeit, da es keine diskrete Teilmenge ist. Somit ist die
Aussage im Fall n = 0 gezeigt. Fur n > 0 kann man auch alle anderen Dimensionen ausschließen (etwas
Arbeit!). Fur unser Beispiel reicht es aber, den Fall n = 0 zu betrachten.
6. UNTERMANNIGFALTIGKEITEN 393
Insbesondere ist TpM ein n-dimensionaler Untervektorraum von Rk.
Beweis. Zu (a): Sei v ∈ TpM . Dann existiert c : (−ε, ε) −→ Rk C1 (fur ein ε > 0) mit
c((−ε, ε)) ⊂ M , c(0) = p und c′(0) = v. Nach moglicher Verkleinerung von ε konnen wir
annehmen, dass c((−ε, ε)) ⊂ Ψ(W ) gilt. Dann ist c := Ψ−1 ◦ c : (−ε, ε) −→ Rn stetig
differenzierbar wegen Zusatz 6.18.
v = c′(0) = (Ψ ◦ c)′(0) = Ψ′( c(0)︸︷︷︸x0
) · c′(0) ,
also v ∈ Bild(Ψ′(x0)
)und damit TpM ⊂ Bild
(Ψ′(x0)
).
Umgekehrt sei v ∈ Bild(Ψ′(x0)), sagen wir v = Ψ′(x0) · w mit w ∈ Rn. Wir definieren
dann c(t) := x0 + tw. Fur ein kleines ε > 0 gilt c((−ε, ε)
)⊂ W . Fur |t| < ε gilt c(t) :=
Ψ(c(t))∈ Ψ(W ) ⊂M . Die Kurve c ist in C1 und c(0) = p, c′(0) = Ψ′
(x0
)· w = v. Somit
ist v ∈ TpM . Insgesamt also Bild(Ψ′(x0)
)⊂ TpM .
Zu (b): Sei wieder i : Rn → Rk die Inklusions-Abbildung x 7→ (x, 0). Nach Bemerkung 6.28
ist Ψ := ϕ−1 ◦ i eine lokale Parametrisierung. Sei ϕ(p) = (x0, 0), x0 ∈ Rn. Also haben wir
TpM(a)= Ψ′(x0) · Rn = (ϕ−1)′(i(x0)︸︷︷︸
=ϕ(p)
) · i′(x0) · Rn︸ ︷︷ ︸=Rn×{0}
=(ϕ′(p)
)−1
·(Rn × {0}
).
Ein alternativer Beweis von (b) wird durch Lemma 6.20 geliefert.
Zu (c): Sei Ψ : W → Rk eine lokale Parametrisierung mit p ∈ Ψ(W ), W0 := Ψ−1(U),
p = Ψ(x0). Also ist F ◦Ψ|W0 konstant 0, also 0 = F ′(p) ·Ψ(x0). Somit haben wir TpM =
Bild(Ψ′(x0)
)⊂ ker(F ′(p)). Da F ′(p) Rang k − n hat, besagt der Rangsatz, dass n =
dim ker(F ′(p)) = dim Bild(Ψ′(x0)
). Es folgt TpM = ker(F ′(p)).
394 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
Beispiele 6.32.
(1) Sei M eine nichtleere offene Teilmenge von Rk. Dann ist M eine k-dimensionale
C∞-Untermannigfaltigkeit von Rk: wahle U = V = M und ϕ := IdM als Unter-
mannigfaltigkeitskarte. Aus Proposition 6.31 folgt, ∀p ∈M :
TpM = Rk.
(2) Sei M := Mf wie in den Beispielen 6.5. Dann ist Ψ: U −→ Rk, x 7−→ (x, f(x))T
eine globale C1-Parametrisierung von Mf nach den Beispielen 6.27. Nach Propo-
sition 6.31 gilt dann, fur p = (p, f(p))T ∈Mf :
TpM = Ψ′(p)(Rn) = {(v, f ′(p) · v)T | v ∈ Rn}
= Graph(f ′(p))
(= Mf ′(p)).
(3) Sei M := Sn ⊂ Rn+1. Sei F : Rn+1 −→ R, x 7−→ ‖x‖22 − 1. Dann ist 0 ∈ R
regularer Wert von F mit F−1({0}) = Sn. Aus Proposition 6.31 folgt, fur jedes
p ∈ Sn: TpM = ker(F ′(p)), mit F ′(p) = 2pT , d.h.,
TpM = {v ∈ Rn+1 | pTv = 0}
= {v ∈ Rn+1 | 〈p, v〉 = 0}
= p⊥ (= Orthogonales Komplement von p).
Mi 3.7.
7. Extrema mit Nebenbedingungen
Definition 7.1. Sei M ⊂ Rk eine n-dimensionale Untermannigfaltigkeit von Rk und
U ⊂ Rk eine offene Teilmenge von Rk mit M ⊂ U . Sei f : U −→ R eine Funktion.
7. EXTREMA MIT NEBENBEDINGUNGEN 395
(a) Ist f differenzierbar in p ∈M ⊂ U , so heißt p stationarer (oder kritischer) Punkt
von f|M : M −→ R, wenn f ′(p)|TpM = 0 gilt.43
(b) Ein Punkt p ∈ M heißt lokales Maximum (bzw. Minimum) von f |M : M −→ R,
wenn eine offene Umgebung V von p in M so existiert, dass f(p) ≥ f(q) (bzw.
f(p) ≤ f(q)) fur alle q ∈ V gilt.
(c) Ein Punkt p ∈M heißt lokales Extremum von f|M : M −→ R, wenn p ein lokales
Minimum oder ein lokales Maximum von f |M ist.
Wie findet man lokale Extrema? Wir fuhren zwei Moglichkeiten auf:
• Wahle eine Parametrisierung Ψ : W → Rk der Untermannigfaltigkeit. Wir wissen
bereits, wie man lokale Extrema von f ◦ Ψ : W → R findet. Und x ist lokales
Extremum von f ◦ Ψ genau dann, wenn Ψ(x) lokales Extremum von f |M ist.
Insbesondere folgt fur p = Ψ(x) aus der Kettenregel
x ist station. Punkt von f ◦Ψ ⇐⇒ f ′(p) ·Ψ′(x) = 0 ⇐⇒ f ′(p)|TpM = 0.
Diese Methode sollten Sie nun also durch Kombination bereits behandelter Tech-
niken beherrschen.
• Durch Lagrange-Multiplikatoren: siehe unten.
PROPOSITION 7.2. Sei M ⊂ Rk eine n-dimensionale Untermannigfaltigkeit, U ⊂ Rk
eine offene Umgebung vonM und f : U −→ R differenzierbar. Ist p ∈M lokales Extremum
von f|M , so ist p ein stationarer Punkt von f|M .
Beweis. Sei v ∈ TpM . Dann existieren ε > 0 und eine C1-Abbildung c : (−ε, ε) −→ Rk
mit c((−ε, ε)) ⊂ M , c(0) = p und c′(0) = v. Die Abbildung f ◦ c : (−ε, ε) −→ R ist dann
43Mit f ′(p)|TpMist hier die lineare Abildung Rk ⊂ TpM 3 x 7→ f ′(p) · x ∈ R gemeint.
396 9. DIFFERENTIAL-RECHNUNG IN MEHREREN VERANDERLICHEN
C1 mit f ◦ c(0) = f(p). Da p ein lokales Extremum von f|M ist, ist 0 ∈ (−ε, ε) ebenfalls
ein lokales Extremum von f ◦ c. Daraus folgt (f ◦ c)′(0) = 0, d.h., mit der Kettenregel,
f ′(p) · v = 0. Damit bekommen wir f ′(p)|TpM = 0, was zu beweisen war.
SATZ 7.3 (Satz uber Lagrange-Multiplikatoren). Sei M ⊂ Rk eine n-dimensionale Unter-
mannigfaltigkeit, U ⊂ Rk eine offene Umgebung von M und f : U −→ R differenzierbar.
Sei p ∈M ein stationarer Punkt (z.B. ein lokales Extremum) von f|M und F : V −→ Rk−n
eine in einer offenen Umgebung V von p in Rk definierte C1-Abbildung mit 0 ∈ Rk−n als
regularem Wert und F−1({0}) = V ∩M . Schreibe F (x) = (F1(x), . . . , Fk−n(x)) ∀x ∈ V .
Dann gibt es eindeutige reelle Zahlen λ1, . . . , λk−n mit
f ′(p) =k−n∑j=1
λjF′j(p).
Diese Zahlen λ1, . . . , λk−n heißen Lagrange-Multiplikatoren von f unter den Nebenbedin-
gungen F1, . . . , Fk−n an der Stelle p.
ZUSATZ 7.4. Umgekehrt gilt: existieren solche Lagrange-Multiplikatoren, dann ist p ein
stationarer Punkt von f |M .
Die Lagrange-Multiplikatoren sind nach dem Mathematiker und Physiker Joseph-Luis
Lagrange benannt, der insbesondere die Lagrangesche Formulierung der klassischen Me-
chanik in der Physk vorangetrieben hat. Es ist aber auch ein wichtiges Hifsmittel zum
Beispiel in den Wirtschaftswissenschaften, wenn man eine Optimierung unter gegebenen
nicht-linearen Zwangsbedingungen durchfuhren will.
Beweis des Korollars. Nach Voraussetzung gilt f ′(p)|TpM = 0 (im Fall, wo p ∈ M ein
lokales Extremum von f|M ist, folgt dies aus Proposition 7.2). Nach Proposition 6.31 gilt
7. EXTREMA MIT NEBENBEDINGUNGEN 397
aber
TpM = ker(F ′(p)) mitF ′(p) =
F ′1(p)
...
F ′k−n(p)
=
k−n⋂j=1
ker(F ′j(p)).
Mit
ker(F ′j(p)) = {v ∈ Rk |F ′j(p) · v = 0} = {v ∈ Rk | 〈F ′j(p)T , v〉 = 0}
= (F ′j(p)T )⊥
folgt TpM =k−n⋂j=1
(F ′j(p)T )⊥ = Span{F ′1(p)T , . . . , F ′k−n(p)T}⊥ (siehe LA II). Die Bedingung
f ′(p)|TpM = 0 ist zu 〈f ′(p)T , v〉 = 0 ∀v ∈ TpM aquivalent, d.h. zu f ′(p)T ∈ (TpM)⊥ ⊂ Rk.
Insgesamt folgt
(7.5) f ′(p)T ∈ (Span{F ′1(p)T , . . . , F ′k−n(p)T}⊥)⊥ = Span{F ′1(p)T , . . . , F ′k−n(p)T},
d.h., ∃λ1, . . . , λk−n ∈ R mit f ′(p)T =k−n∑j=1
λjF′j(p)
T , d.h., f ′(p) =k−n∑j=1
λjF′j(p). Da F ′j(p), . . . , F
′k−n(p)
linear unabhangig sind, sind λ1, . . . , λk−n eindeutig mit dieser Eigenschaft.
Der Zusatz folgt, indem wir die obigen Argmente umkehren: Wenn Lagrange-Multiplikatoren
existieren, dann gilt (7.5) und somit f ′(p)T ∈ (TpM)⊥. Dann verschwindet v 7→ f ′(p) · v
auf TpM .
KAPITEL 10
Gewohnliche Differentialgleichungen
Literatur zu diesem Kapitel.
• [15], Kapitel 2 (gut zu lesen)
• [7], Kapitel 14 (Rolle des Banachschen Fixpunktsatzes klarer)
• [11] (umfassender, tiefer gehend)
• [23]Mehr zu Stabilitat
• [35]noch mehr zu Stabilitat, deutlich ausfuhrlicher und umfassender als [23], sehr
gut lesbar.
• [27]
• [4]
1. Motivation
Wir motivieren an Hand eines ebenen Pendels aus der Physik. Es gibt auch viele Systeme
in anderen Wissenschaften (Chemie, Biologie, Medizin, Wirtschaftswissenschaften,...), die
durch gewohnliche Differentialgleichungen modelliert werden.
Bild eines Pendels mit eingezeichneten Kraften, siehe Vorlesung.
ϕ : R→ R
399
400 10. GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
(1.1) ϕ′′(t) = −g`
sin(ϕ(t))
wobei g = 9, 81N/kg die Gravitationskonstante, ` die Pendellange und ϕ der Auslen-
kungswinkel ist.
Wichtige physikalische Fragen:
• Beschreibt dieses Modell die physikalische Situation? (Problematisch: Reibung,
Drehenergie des Korpers, Masse des Stabes, Storeinflusse, ...)
• Wie genau sind die Ausgangswerte ϕ(0), ϕ′(0) und die Parameter g, `,...?
Dies ist nicht das Thema der Vorlesung!
Wichtige mathematische Fragen:
• Gibt es Funktionen ϕ : R→ R, die (1.1) losen? (Wenn nicht, dann ist dies sicher
kein gutes Modell!) Wir werden sehen: es gibt Losungen!
• Wenn ja, wieviele Losungen gibt es? Wir werden sehen: zu gegebenem ϕ(0) und
ϕ′(0) gibt es genau eine Losungsfunktion. Die Gleichung (1.1) hat also einen
zwei-dimensionalen Losungsraum.1
• Gibt es Losungen ϕ : (a, b) → R, die sich nicht zu Losungen auf ganz R fort-
setzen lassen? Wir werden sehen:”Nein“ fur diese Gleichung, aber bei vielen
physikalischen Systemen”Ja“.
1Den Begriff”zwei-dimensional“ haben wir hier noch gar nicht sauber definiert. Der Losungsraum ist
eine zwei-dimensionale Untermannigfaltigkeit des unendlich-dimensionalen Vektorraums C∞(R,R). Die
obige Aussage interpretieren Sie am besten so, dass der Losungsraum durch die beiden Anfangswert ϕ(0)
und ϕ′(0) parametrisiert wird.
1. MOTIVATION 401
• Sind alle Losungen periodisch? Man kann zeigen: viele, aber nicht alle. 2
• Kann man die Losungen explizit angeben? Antwort: Es geht noch mit großem
Aufwand. Man braucht”elliptische Integrale“, siehe http://en.wikipedia.org/
wiki/Pendulum_(mathematics). Bei komplizierteren physikalischen Systemen
nahezu unmoglich.
• Wie lang ist die Periodenlange von periodischen Losungen? Antwort: Als Potenz-
reihe angebbar. Bei komplizierteren Gleichungen nicht explizit berechenbar.
• Hangt sie von der maximalen Auslenkung ab? Antwort: Die Periodenlange wird
langer, wenn die maximale Auslenkung langer wird.
• Erhaltungsgroßen? Antwort: Energieerhaltung, Drehimpulserhaltung (beim raum-
lichen Pendel),. . .
Ziel: Moglichst großes systematisches Verstandnis solcher Gleichungen. Beschreibung des
qualitativen Verhaltens, falls die Losungen nicht explizit zu finden sind.
Oft hilfreich: Linearisierte Gleichung. Ersetze nicht-lineare Terme durch das Taylorpoly-
nom ersten Grades. Im Pendel-Beispiel: ersetze
sinϕ =∞∑j=0
(−1)j
(2j + 1)!ϕ2j+1 = 0 + ϕ+ 0 · ϕ2 − 1
6ϕ3 + · · ·
2Alle Losungen, deren Gesamtenergie unterhalb von E0 := mg` liegt, konnen keine Uberschlage
(=loopings) machen, sie sind periodisch. Losungen ϕ mit Gesamt-Energie großer als E0 sind im Sinne
von Funktionen ϕ : R → R nicht periodisch. Die zugehorige raumliche Bewegungskurve R → R3, t 7→
(` sinϕ(t), 0,−` cosϕ(t))T ist aber periodisch. Ist die Gesamtenergie gleich E0, dann ist weder ϕ noch
die zugehorige raumliche Bewegungskurve periodisch. Dann gilt limt→±∞ ϕ(t) = ±π und die raumliche
Bewegungskurve konvergiert in beide Richtungen gegen (0, 0,−`)T .
402 10. GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
durch ϕ. Wir erhalten
ϕ′′(t) = −g`ϕ(t)
Viel leichter zu losen:
ϕ(t) = a cos
(√g
`t
)+ b sin
(√g
`t
)Beschreiben die Losungen der vereinfachten Gleichung auch hinreichend gut die Losungen
der ursprunglichen Gleichung?
2. Definition und Reduktion auf autonome Gleichungen erster Ordnung
Definition 2.1. Seien m,n, k ∈ N. Gegeben sei
U ⊂ R× (Rn)k+1 = R× Rn × · · · × Rn︸ ︷︷ ︸k+1-mal
und eine Funktion F : U → Rm. Wir sagen ϕ : (a, b) → Rn, a, b ∈ R, a < b eine Losung
der durch F gegebenen gewohnlichen Differentialgleichung, falls gilt:
(1) ϕ ist k-mal differenzierbar
(2) (t, ϕ(t), ϕ′(t), . . . , ϕ(k)(t)) ∈ U fur alle t ∈ (a, b)
(3) Fur alle t ∈ (a, b) gilt
(2.2) F (t, ϕ(t), ϕ′(t), . . . , ϕ(k)(t)) = 0.
Man nennt (a, b) das Losungsintervall der Losung. Eine Gleichung der Form (2.2) nennt
man eine gewohnliche Differentialgleichung von Ordnung ≤ k.3 Wir nennen F die de-
finierende Funktion der gewohnlichen Differentialgleichung. Wir sagen, die gewohnliche
3Man sagt, die Ordnung ist gleich k, falls F tatsachlich von ϕ(k) abhangt.
2. DEFINITION UND REDUKTION AUF AUTONOME GLEICHUNGEN ERSTER ORDNUNG 403
Differentialgleichung ist autonom, falls die definierende Gleichung nicht von t abhangt.
Wir schreiben dann oft
F (ϕ(t), ϕ′(t), . . . , ϕ(k)(t)) = 0,
d.h. F : U → Rm, U ⊂ (Rn)k+1.
Beispiele 2.3.
(1) Pendel: m = n = 1, k = 2, U = R4,
F (t, ϕ0, ϕ1, ϕ2) = ϕ2 +g
`sinϕ0
(2) Linearisiertes Pendel: wie oben aber
F (t, ϕ0, ϕ1, ϕ2) = ϕ2 +g
`ϕ0
(3) m = n = k = 1, U = R3. Sei a ∈ R
F (t, ϕ0, ϕ1) = ϕ1 − aϕ0
Wir erhalten die Differentialgleichung
ϕ′(t) = aϕ(t).
Dann ist ϕ(t) = eat eine Losung.
(4) Sei g : (a, b)→ R. Wir definieren
F (t, ϕ0, ϕ1) = ϕ1 − g(t).
Dann ist G eine Losung von
F (t, G(t), G′(t)) = 0,
genau dann, wenn G eine Stammfunktion zu g ist.
404 10. GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
(5) Sei f : R2 → R. Fur
F (t, ϕ0, ϕ1) = ϕ1 − f(t, ϕ0).
haben wir die Differentialgleichung
(2.4) ϕ′(t) = f(t, ϕ(t)).
Die ersten drei Beispiele sind autonom, die letzten beiden nicht.
Bemerkungen 2.5. Wichtig sind auch Differentialgleichungen, in denen Funktionen in
mehreren Veranderlichen gesucht werden, so dass die definierende Funktion von partiellen
Ableitungen in mehreren Veranderlichen abhangt. Solche Differentialgleichungen nennt
man partielle Differentialgleichung. Genauer gesagt: eine partielle Differentialgleichung
ist eine Differentialgleichung, die keine gewohnliche Differentialgleichung ist.
Zum Beispiel sei V offen in R` und ϕ : V → Rn. Wir definieren den Laplace-Operator
∆ : C2(V,Rn)→ C0(V,Rn)
∆ϕ :=∑i=1
∂2
∂x2`
ϕ
Dann ist ∆ϕ = 0 eine partielle Differentialgleichung, die in vielen Bereichen der Anwen-
dungen (Physik, Chemie, Biologie, Finanzmathematik,. . . ) sehr wichtig ist.
Wir behandeln in dieser Vorlesung nur gewohnliche Differentialgleichungen. Die Losungs-
theorie partieller Differentialgleichungen wird in fortgeschritteneren Vorlesungen behan-
delt.
Bemerkung 2.6.
(1) Man kann jede gewohnliche Differentialgleichung von k-ter Ordnung in eine Diffe-
rentialgleichung erster Ordnung uberfuhren. Hierzu definieren wir fur ϕ : (a, b)→
2. DEFINITION UND REDUKTION AUF AUTONOME GLEICHUNGEN ERSTER ORDNUNG 405
Rn die Funktionen ψi(t) := ϕ(i)(t) und fassen diese Funktionen zu Ψ : (a, b) →
(Rn)k als Ψ(t) := (ψ0(t), ψ1(t), . . . , ψk−1(t)) zusammen. Wir haben genau dann
eine Losung von Gleichung (2.2), falls wir eine Losung von
0 = F (t, ψ0(t), ψ1(t), . . . , ψk−1(t), ψ′k−1(t))
0 = ψ′0(t)− ψ1(t)
... =...
0 = ψ′k−2(t)− ψk−1(t)
haben. Wir konnen nun die gesamte rechte Seite in der Form F (t,Ψ(t),Ψ′(t))
schreiben, wobei F : U → Rm × (Rn)k−1 fur eine geeignete Teilmenge U von
R× (Rn)k × (Rn)k.
F (t,Ψ(t),Ψ′(t)) =
F (t, ψ0(t), ψ1(t), . . . , ψk−1(t), ψ′k−1(t))
ψ′0(t)− ψ1(t)...
ψ′k−2(t)− ψk−1(t)
∈ Rm+(k−1)n.
Wir haben eine gewohnliche Differentialgleichung von k-ter Ordnung fur ϕ :
(a, b)→ Rn durch eine gewohnliche Differentialgleichung erster Ordnung fur Ψ :
(a, b)→ Rnk ausgedruckt.
Im Beispiel des Pendels fuhren wir also eine Funktion ρ : (a, b)→ R ein,4 die
ϕ′ reprasentieren soll, und losen das System
0 = ρ′(t) +g
`sinϕ(t)
0 = ϕ′(t)− ρ(t)
4Also ψ0(t) = ϕ(t), ψ1(t) = ρ(t) in der Notation von oben.
406 10. GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
Wir definieren dann
F (t,
ϕρ
,
ϕρ
) =
ρ+ g`
sinϕ
ϕ− ρ
∈ R2.
Die dadurch definierte gewohnliche Differentialgleichung ist
0 = F (t,
ϕ(t)
ρ(t)
,
ϕ(t)
ρ′(t)
) =
ρ′(t) + g`
sinϕ(t)
ϕ′(t)− ρ(t)
∈ R2.
Dies ist eine autonome gewohnliche Differentialgleichung erster Ordnung.
(2) Man kann jede gewohnliche Differentialgleichung in eine autonome Differential-
gleichung uberfuhren. Hierzu fuhren wir eine neue Funktion τ(t), die τ ′(t) = 1 und
τ(t0) = t0 erfullt. Es gilt dann also τ(t) = t. Wir setzen nun Ψ(t) := (τ(t), ϕ(t)),
Ψ : (a, b)→ Rn+1 setzen und dann die definierenden Funktion F : U → Rm durch
eine weitere Komponente τ ′(t) = 1 zu einer Funktion F : U → Rm+1 erganzen.5
Wir betrachten dazu Beispiel 2.3 (5). Wir uberfuhren die bisherige gewohnli-
che Differentialgleichung fur ϕ(t) in eine fur Ψ(t) = (τ(t), ϕ(t)). Dazu definieren
wir
F
τ0
u0
,
τ1
u1
=
τ1 − 1
u1 − f(τ0, u0).
Diese Funktion definiert die autonome gewohnliche Differentialgleichung
(2.7)
τ′(t) = 1
u′(t) = f(τ(t), u(t))
Ist u eine Losung von (2.4), dann istΨ(t) := (t, u(t)) eine Losung von (2.7). Ist
umgekehrt Ψ(t) = (τ(t), u(t)) eine Losung von (2.7). Dann folgt τ(t) = t+ t0 fur
5Der Definitionsbereich von F andert sich nicht, aber die Interpretation der t-Variable.
3. FLUSSLINIEN UND ERHALTUNGSGROSSEN 407
eine Konstante t0 ∈ R. Wir setzen dann u(t) := u(t− t0). Dann gilt
u′(t) = u′(t− t0) = f(t, u(t− t0)) = f(t, u(t)).
Also ist u eine Losung von (2.4).
Fr 5.7.
3. Flusslinien und Erhaltungsgroßen
Wir haben diskutiert:
• Jede gewohnliche Differentialgleichung kann auf eine Differentialgleichung erster
Ordnung reduziert werden
• Jede gewohnliche Differentialgleichung kann auf eine autonome Differentialglei-
chung (der gleichen Ordnung) reduziert werden
Viele (gewohnliche)6 Differentialgleichungen haben keine Losung oder konnen nur schwer
gelost werden. Zum Beispiel hat
(ϕ(t)2 + (ϕ′(t)− 1)2 = 0
keine Losung ϕ : (a, b)→ R.
In guten Situationen hingegen kann man Differentialgleichungen erster Ordnung nach
ϕ′(t) auflosen, und dann sind die Gleichungen besser zu behandeln:
ϕ′(t) = f(t, ϕ(t))
6Wir lassen das Wort”gewohnlich“ nun oft weg, da alle Differentialgleichungen in der Vorlesung
gewohlich sind.
408 10. GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
oder
ϕ′(t) = f(ϕ).
Man nennt dies eine explizite gewohnliche Differentialgleichung.
Definition 3.1. Sei U offen in Rn. Ein (glattes) Vektorfeld ist eine (glatte) Abbildung
f : U → Rn.
Vorstellung: Im Punkt x beginnt der Pfeil, der durch f(x) beschrieben wird.
Bild eines Vektorfelds, symbolisiert duruch viele Pfeile in R2.
Definition 3.2. Eine Flusslinie oder Integralkurve des Vektorfeldes f : U → Rn ist eine
Losung von
ϕ′(t) = f(ϕ(t)).
autonome explizite gew. Diff’glng auf U = Vektorfeld auf U .
Definition 3.3. Eine Erhaltungsgroße oder ein erstes Integral zum Vektorfeld f ist eine
Funktion E : U → R, so dass t 7→ E(ϕ(t)) entlang jeder Flusslinie von f konstant ist.
Schreibweise: schreibe auch ddth fur die Ableitung von h nach t.
Beispiel 3.4 (Pendel). Wir betrachten die Gleichung
(3.5) ϕ′′(t) = − sinϕ(t).
3. FLUSSLINIEN UND ERHALTUNGSGROSSEN 409
Wir formen in eine Differentialgleichung erster Ordnung um, indem wir ρ(t) = ϕ′(t) setzen,
Ψ(t) = (ϕ(t), ρ(t))T ∈ R2.
ϕ(t)
ρ(t)
′ = ρ(t)
− sinϕ(t)
Losung sind Flusslinien von f(ϕ, ρ) = (ρ,− sinϕ)T . Ist Ψ(t) = (ϕ(t), ρ(t))T eine Flusslinie
von f , so ist ϕ(t) eine Losung von (3.5).
Multipliziere (3.5) mit ϕ′(t),
1
2
d
dt((ϕ′(t))2) = ϕ′(t)ϕ′′(t) = −ϕ′(t) sin(ϕ(t)) =
d
dt(cosϕ(t))
Wir definieren E : R2 → R, E(ϕ, ρ) = 12ρ2 − cosϕ. Dann ist
d
dt(E((ϕ(t), ρ(t))T )) =
1
2
((ϕ′(t))2 − cosϕ(t)
)′= 0.
Also ist E eine Erhaltungsgroße.
Die Hohenlinien der Funktion (ϕ, ρ) 7→ E(ϕ, ρ). Zusammenhangskomponenten einer
Hohenlinie (ohne stationare Punkte) bilden die Orbits, das heißt die Kurven, entlang
derer sich die Losung bewegt. Siehe”Phase diagram“ auf der Webseite
http://physique.unice.fr/sem6/2011-2012/PagesWeb/PT/Pendule/En/study1_
simple.html
UBUNG 3.6 (Nutzt den Satz von Picard-Lindelof, siehe unten). Sei f : U → Rn ein
stetig differenzierbares Vektorfeld. Sei E : U → R differenzierbar. Dann ist E genau dann
410 10. GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
eine Erhaltungsgroße von f , wenn 7
f(x) ∈ kerE ′(x)
fur alle x ∈ U .
Losung: Zentralubung
Beweis. Es gelte f(x) ∈ kerE ′(x) fur alle x ∈ U . Sei ϕ : (a, b) → U eine Flusslinie von
f , dann gilt
(E ◦ ϕ)′(t) = E ′(ϕ(t)) · ϕ′(t) = E ′(ϕ(t)) · f(ϕ(t)) = 0.
Also ist E eine Erhaltungsgroße.
Umgekehrt sei E eine Erhaltungsgroße. Da f stetig differenzierbar ist, ist f Orts-Lipschitz-
stetig. Zu jedem x0 ∈ U existiert also nach dem Satz von Picard-Lindelof ein ε > 0 und
eine Flusslinie ϕ : (−ε, ε)→ U von f mit ϕ(0) = x0. Da E ◦ ϕ konstant ist, rechnen wird
0 = (E ◦ ϕ)′(0) = E ′(ϕ(0)) · ϕ′(0) = E ′(x0) · f(x0).
Somit gilt f(x0) ∈ kerE ′(x0) fur alle x0 ∈ U .
UBUNG 3.7 (Nutzt den Satz von Picard-Lindelof, siehe unten). Sei M eine Unterman-
nigfaltigkeit von Rn, M ⊂ U , U offen in Rn und sei M abgeschlossen in Rn. Sei f : U → Rn
ein Lipschitz-stetiges Vektorfeld. Ist f tangential an M (d.h. es gelte f(p) ∈ TpM fur alle
p ∈M) und ist c : (a, b)→ Rn eine Integralkurve von f mit a < t0 < b und c(t0) ∈M , so
ist c(t) ∈M fur alle t ∈ (a, b).
7Hier wird E′(x) als lineare Abbildung Rn → R betrachtet. Wenn wir E′(x) als Zeilenvektor betrach-
ten, heißt die analoge Aussage (E′(x))T ⊥ f(x) oder aquivalent E′(x) · f(x) = 0.
4. DER SATZ VON PICARD-LINDELOF 411
Losung: Zentralubung
Bemerkung 3.8. Im allgemeinen ist es sehr schwer, eine oder mehrere Erhaltungsgroßen
zu erhalten. In der Lagrange-Mechanik der klassischen Physik liefert das Noethersche
Theorem zu jeder Symmetrie eines mechanischen Systems eine Erhaltungsgroße. Typische
Erhaltungsgroßen in der Physik sind Energie, Komponenten des Impulsvektors, Kompo-
nenten des Drehimplusvektors, etc..
Wenn Erhaltungsgroßen E1, . . . , E` existieren, dann bilden diese eine erhaltene Abbildung
E = (E1, . . . , E`) : U → R`. Jede Flussline ϕ : I → U mit E(ϕ(t0)) = E0, t0 ∈ I erfullt
dann also ϕ(I) ⊂ E−1({E0}). Ist E0 ein regularer Wert von E, dann bewegt sich die Fluss-
linie entlang der (n − `)-dimensionalen Untermannigfaltigkeit M := E−1({E0}). Durch
Verwendung einer lokalen Parametrisierung Ψ : W → M kann man die durch f gegebe-
ne gewohnliche Differentialgleichung in eine autonome gewohnliche Differentialgleichung
erster Ordnung auf W umwandeln.8 Somit haben wir die Losung der Differentialgleichung
lokal auf die Losung einer anderen Differentialgleichung reduziert, die oft einfacher zu
losen ist, da die Dimension n− ` kleiner ist.
4. Der Satz von Picard-Lindelof
Im folgenden Abschnitt besteht die Gefahr, Intervalle (a, b) ⊂ R mit dem Paar (a; b) ∈ R2
zu verwechseln. Wir schreiben deswegen weiterhin (a, b) fur das Paar und (a; b) fur das
Intervall.
Ab jetzt: Sei U offen in R× Rn, f : U → Rn.
8Genauer: Man definiert ein Vektorfeld f : W → Rn−` so, dass Ψ′(p)f(p) = f(Ψ(p)) fur alle p ∈ W .
Dannist ϕ : I →W eine Flusslinie von f , wenn ϕ := Ψ ◦ ϕ eine Flusslinie von f ist.
412 10. GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
Elemente in R× Rn 3 (t, x), t ∈ R Zeit, x ∈ Rn Ort.
Definition 4.1. Sei f wie oben. Wir sagen f ist Orts-Lipschitz-stetig, falls es ein L ∈ R
gibt, so dass fur alle (t, x), (t, y) ∈ U gilt:
‖f(t, x)− f(t, y)‖ ≤ L‖x− y‖.
Wir sagen auch f ist Orts-Lipschitz-stetig mit Lipschitz-Konstante L.
Wir sagen f ist lokal Orts-Lipschitz-stetig, falls jedes (t, x) ∈ U eine offene Umgebung V
in U besitzt, so dass f |V Orts-Lipschitz-stetig ist.
9
Beispiele 4.2.
(1) Sei f : U → Rn Lipschitz-stetig, das heißt, es gebe ein L ∈ R, so dass fur alle
(t, x), (s, y) ∈ U :
‖f(t, x)− f(s, x)‖ ≤ L√|t− s|2 + ‖x− y‖2.
Dann ist f Orts-Lipschitz-stetig. Insbesondere ist jede lineare Funktion (Orts-
)Lipschitz-stetig.
(2) f : R × R → R, f(t, x) = 3√t ist Orts-Lipschitz-stetig und stetig, aber nicht
Lipschitz-stetig.
(3) Lipschitz-stetige Funktionen sind stetig, aber es gibt nicht-stetige Orts-Lipschitz-
stetige Funktionen
9Die Eigenschaften Orts-Lipschitz-stetig und lokal Orts-Lipschitz-stetig sind unabhangig von der
gewahlten Norm auf Rn. Die moglichen Konstanten L hangen aber von der Wahl der Norm ab.
4. DER SATZ VON PICARD-LINDELOF 413
(4) Schreibe (t, x) = (t, x1, . . . , xn). Angenommen die partiellen Ableitungen
∂
∂x1
f, . . . ,∂
∂xnf : U → Rn
existieren und sind stetig (als Funktionen U → Rn). Sei Bε(t0, x0) ∈ U . Wir
definieren
C := maxi=1,...,n
max(s,y)∈Bε(t0,x0)
∥∥∥∥ ∂
∂xif(s, y)
∥∥∥∥∞<∞.
Das hintere Maximum wird angenommen (und ist deswegen endlich), daBε(t0, x0)
kompakt ist. Schreibe f(t, x) = (f1(t, x), . . . , fn(t, x)). Dann gilt nach dem Mit-
telwertsatz
fj(s, y)− fj(s, z) =n∑i=1
(yi − zi)∂fj∂xi
(s, wj)
fur ein wj auf der Strecke von y nach z. Also
|fj(s, y)− fj(s, z)| ≤ ‖y − z‖∞nC,
falls (s, y), (s, z) ∈ Bε(t0, x0). Bezuglich der Norm ‖ · ‖∞ ist f |Bε(t0,x0) also Orts-
Lipschitz-stetig. Es folgt, dass f lokal Orts-Lipschitz-stetig ist.
SATZ 4.3 (Satz von Picard-Lindelof). Seien U ⊂ R × Rn offen, f : U → Rn lokal 10
Orts-Lipschitz-stetig und stetig. Sei (t0, x0) ∈ U . Dann gibt es ein ε0 ∈ R>0, so dass es fur
jedes ε ∈ (0; ε0] genau eine stetig differenzierbare Abbildung ϕ : (t0 − ε; t0 + ε)→ Rn gibt
mit:
• ϕ(t0) = x0 (Anfangswert)
• fur alle t ∈ (t0 − ε; t0 + ε) gelte (t, ϕ(t)) ∈ U
10Die Aussage ist naturlich auch noch immer richtig, wenn wir das Wort”lokal“ weglassen.
414 10. GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
• und fur alle t ∈ (t0 − ε; t0 + ε) gelte
(4.4) ϕ′(t) = f(t, ϕ(t)).
Beweis. Im folgenden sei
B∞δ (x0) := {x ∈ Rn | ‖x− x0‖∞ < δ}.
Wir wahlen δ > 0, so dass V := (t0−δ; t0+δ)×B∞δ (x0) ⊂ V := [t0−δ; t+δ]×B∞δ (x0) ⊂ U .
Wenn wir δ > 0 genugend klein wahlen, dann ist f |V Orts-Lipschitz-stetig, und sei L ∈ R
hierzu eine Lipschitz-Konstante. Da f stetig ist, ist f beschrankt auf der kompakten
Menge V .
ε ∈ (0; δ) wird spater festgelegt.
Notation: I = (t0 − ε; t0 + ε),
Sei E := Cb(I,Rn) der Vektorraum der beschrankten stetigen Funktionen von I nach Rn.
Fur ϕ ∈ E definiere11
|||ϕ|||∞ := supt∈I‖ϕ(t)‖∞
ϕi → ϕ in (E, ||| · |||∞)(def)⇐⇒ ϕi konvergiert gleichmaßig gegen ϕ
LEMMA 4.5. (E, ||| · |||∞) ist ein Banachraum, d.h. jede Cauchy-Folge in E konvergiert.
11Um die Norm auf Rn und die auf E genauer zu unterscheiden, schreiben wir fur letztere im Skript
||| · |||∞.
4. DER SATZ VON PICARD-LINDELOF 415
Beweis des Lemmas. Wir wenden Korollar 2.8 aus Kapitel 7 an, wobei (Y, d) der me-
trische Raum zum normierten Raum (Rn, ‖ · ‖∞) ist und D = I. Wir erhalten, dass
(Abb(I,Rn), dglm) vollstandig ist. Wir haben E = {ϕ ∈ Abb(I,Rn) | ϕ ist beschrankt und stetig}.
Wegen Satz 2.5 aus Kapitel 7 ist ein gleichmaßiger Grenzwert stetiger Funktionen wie-
derum stetig. Da auch Beschrankheit unter gleichmaßigen Limites erhalten bleibt, ist
E abgeschlossen in Abb(I,Rn). Somit ist E vollstandig bzgl. dglm. Hieraus folgt, dass
(E, ||| · |||∞) vollstandig ist.
Sei ϕ0 konstant x0, d.h. ϕ0(t) = x0 ∀t ∈ I. Wir definieren die folgende Teilmenge von E:
Eδ,ε := {ϕ ∈ E | ∀t ∈ (t0 − ε; t0 + ε) : ‖ϕ(t)− x0‖∞ ≤ δ} = {ϕ ∈ E | |||ϕ− ϕ0|||∞ ≤ δ}.
Man sieht leicht, dass Eδ,ε eine abgeschlossene Teilmenge von (E, ||| · |||∞) ist. Insbesondere
ist Eδ,ε mit der von ||| · |||∞ induzierten Metrik ein vollstandiger metrischer Raum.
Wir definieren12
A : Eδ,ε → E, A(ϕ)(t) = x0 +
∫ t
t0
f(τ, ϕ(τ)) dτ.
Die Beschranktheit von A(ϕ) folgt aus der Beschranktheit von f |V .
LEMMA 4.6 (Umformulierung der Gew. Dgl. in ein Fixpunktproblem eines Integralope-
rators). Es gilt A(ϕ) = ϕ genau dann, wenn ϕ eine stetig differenzierbare Losung von
(4.4) ist mit ϕ(t0) = x0.
Beweis des Lemmas. Es gelte A(ϕ) = ϕ. Dann gilt (inklusive Existenz der Ableitung!)
ϕ′(t) =d
dt
∫ t
t0
f(τ, ϕ(τ)) dτ = f(t, ϕ(t)).
12Im folgenden ist immer A(ϕ)(t) als(A(ϕ)
)(t) zu lesen
416 10. GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
Aus dieser Formel folgt auch die stetige Differenzierbarkeit von ϕ.
Umgekehrt: ist ϕ eine stetig differenzierbare Losung von (4.4) mit ϕ(t0) = x0, dann ist
A(ϕ)(t) = x0 +
∫ t
t0
f(τ, ϕ(τ)) dτ = x0 +
∫ t
t0
ϕ′(τ) dτ = ϕ(t).
bis hier: Fr
5.7.
ab hier: Mi
17.7.
Im folgenden seien die Lipschitz-Konstanten immer bezuglich der Norm ‖ · ‖∞ definiert.
LEMMA 4.7. Sei f |V Orts-Lipschitz-stetig mit Lipschitz-Konstante L. Dann ist die Ab-
bildung A : Eδ,ε → E Lipschitz-stetig mit Konstante εL.
Beweis des Lemmas. Seien ϕ, ψ ∈ Eδ,ε.
A(ϕ)(t)− A(ψ)(t) =
∫ t
t0
(f(τ, ϕ(τ)
)− f
(τ, ψ(τ)
))dτ
∥∥∥A(ϕ)(t)− A(ψ)(t)∥∥∥∞≤
∫ t
t0
∥∥f(τ, ϕ(τ))− f
(τ, ψ(τ)
)∥∥∞ dτ
≤∣∣∣∣∫ t
t0
L∥∥ϕ(τ)− ψ(τ)
∥∥∞ dτ
∣∣∣∣≤ εL sup
τ∈I‖ϕ(τ)− ψ(τ)‖∞
Also
|||A(ϕ)− A(ψ)|||∞ ≤ εL|||ϕ− ψ|||∞.
LEMMA 4.8. Sei C := max{‖f(t, x)‖∞ | (t, x) ∈ V }. Wenn wir
(4.9) ε ≤ ε0 := min{ δ
2(C + δL),δ
2
}
4. DER SATZ VON PICARD-LINDELOF 417
wahlen, dann gilt A(Eδ,ε) ⊂ Eδ/2,ε.
Beweis.
|||A(ϕ0)− ϕ0|||∞ ≤ supt∈I‖A(ϕ0)(t)− x0‖∞
= supt∈I
∥∥∥∥x0 +
∫ t
t0
f(τ, x0) dτ − x0
∥∥∥∥∞
= supt∈I
∣∣∣∣∫ t
t0
‖f(τ, x0)‖∞ dτ∣∣∣∣
≤ supt∈I|t− t0|C = εC.
Also gilt fur beliebiges ϕ ∈ Eδ,ε:
|||A(ϕ)− ϕ0|||∞ ≤ |||A(ϕ)− A(ϕ0)|||∞ + |||A(ϕ0)− ϕ0|||∞
≤ εL|||ϕ− ϕ0|||∞ + εC
≤ εLδ + εC ≤ δ
2,
falls ε ≤ ε0 ≤ δ/2 wie oben gewahlt wird. Es folgt A(Eδ,ε) ⊂ Eδ/2,ε.
Aus (4.9) folgt auch εL < 1/2. Das heißt, dann ist A : Eδ,ε → Eδ,ε eine Kontraktion. Es
gilt ϕ0 ∈ Eδ,ε 6= ∅. Nach dem Banachschen Fixpunktsatz (Satz 2.5 in Kapitel 8) besitzt
also A einen eindeutigen Fixpunkt in Eδ,ε. Den Fixpunkt nennen13 wir ϕε. Insbesondere
haben wir nun den Existenzteil des Theorems gezeigt.
13Wir schreiben ϕε um klar zu machen, dass wir noch nichts daruber wissen, ob es von ε abhangt.
Achtung: wir haben auch noch nicht geklart, ob die Losung von δ abhangt. Und selbst bei L konnen
wir verschiedene Konstanten wahlen, und die wahlbaren Konstanten hangen auch wieder von der Wahl
von δ ab. Kurzum: ϕε konnte noch von vielen Wahlen abhangen, und wir werden nun sehen, dass es dies
eigentlich gar nicht tut.
418 10. GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
Ist nun 0 < ε < ε, dann ist
ϕ := (ϕε)|(t0−ε;t0+ε) ∈ Eδ,ε
eine Losung von (4.4) mit ϕ(t0) = x0 und deswegen gilt ϕε = ϕ.
Das Theorem (=der Satz von Picard-Lindelof) ist nun bewiesen, sobald wir das folgende
Lemma haben. Dann ist namlich auch die im Theorem behauptete Eindeutigkeit gezeigt.
LEMMA 4.10. Sei ρ ∈ (0; ε0] und ψ : (t0 − ρ; t0 + ρ) → Rn eine Losung von (4.4) mit
ψ(t0) = x0, (t, ψ(t)) ∈ U ∀t. Dann gilt ψ ∈ Eδ,ρ.
Aus dem Lemma folgt namlich, dass ψ ein und damit der einzige Fixpunkt von A|Eδ,ρ ist.
Beweis. Wir zeigen, dass fur alle t ∈ (t0 − ρ; t0 + ρ) gilt:
‖ψ(t)− x0‖∞ < δ.
Angenommen diese Ungleichung gilt nicht fur alle solchen t. Dann ist
T :={s ∈ [0, ρ)
∣∣∣ ‖ψ(t0 + s)− x0‖∞ = δ oder ‖ψ(t0 − s)− x0‖∞ = δ}
eine nicht-leere abgeschlossene14 Teilmenge von [0, ρ).
Setze ρ := minT , und wir haben 0 < ρ < ρ ≤ ε0. Wir erhalten ‖ψ(t) − x0‖∞ < δ fur
t ∈ (t0 − ρ; t0 + ρ) und somit ψ|(t0−ρ;t0+ρ) ∈ Eδ,ρ, also insbesondere
(4.11) ψ(t) = ϕε0(t) ∀t ∈ (t0 − ρ; t0 + ρ)
14Da s 7→ ‖ψ(t0 + s)− x0‖∞ stetig ist und {δ} abgeschlossen in R.
4. DER SATZ VON PICARD-LINDELOF 419
Auf Grund der Stetigkeit von ψ und ϕε0 folgt die Gultigkeit von (4.11) fur t ∈ [t0−ρ; t0+ρ].
Es folgt der Widerspruch
δρ∈T= ‖ψ(t0 ± ρ)− x0‖∞ = ‖ϕε0(t0 ± ρ)− x0‖∞ ≤
δ
2.
Aus Lemma 4.10 folgt dann auch: Losungen von (4.4) mit dem selben Anfangswert stim-
men auf dem Durchschnitt ihrer Definitionsbereiche uberein.15
Der Beweis des Theorems liefert noch mehr
• Ein numerisches16 Berechnungsverfahren fur die Losung. Definiere rekursiv: ϕ0(t) =
x0, ϕk+1 := A(ϕk). Dann konvergiert ϕk gegen die Losung. (Ohne Beweis!)
• Information daruber wie ϕ(t) vom Anfangswert x0 abhangt, siehe folgender Zu-
satz 4.13.
Beispiele 4.12.
(a) Ist f : U → Rn stetig differenzierbar, dann ergibt der Satz von Picard-Lindelof zu
jedem Anfangswert ϕ(t0) = x0 eine Losung ϕ : I → Rn von ϕ′(t) = f(ϕ(t)). Wir
werden sehen: es gibt ein maximales Intervall, auf dem die Funktion ϕ definiert werden
kann.
15Die oben konstruierte Zahl ε0 hangt von der Wahl von δ ab. Die Losung ϕ ist aber im folgenden
Sinn von δ unabhangig: Sind Losungen zu zwei verschiedenen Wahlen von δ gegeben, so stimmen diese
Losungen auf einer Umgebung von t0 uberein.16
”Numerisch“ bedeutet: man bekommt keine explizite Formel fur die Losung heraus, dafur aber ein
Verfahren, das in ein Computer-Programm umsetzbar ist und das dann beliebig genaue Naherungslosun-
gen liefert.
420 10. GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
(b) n = 1, f(t, x) = 3√t ist Orts-Lipschitz-stetig. Also erfullt ϕ′(t) = 3
√t, ϕ(t) ∈ R
die Voraussetzungen des Satzes von Picard-Lindelof. Man kann explizit die Losung
bestimmen:
ϕ(t) =3
4t4/3.
(c) n = 1, f(t, x) = 3√x ist nicht Orts-Lipschitz-stetig. Picard-Lindelof ist nicht anwend-
bar. Dennoch gibt es Losungen. Falls ϕ(t) 6= 0:
ϕ′(t) = 3√ϕ(t)
⇐⇒ ϕ′(t)3√ϕ(t)
= 1
⇐⇒ d
dt
3
2(ϕ(t))2/3 = 1
⇐⇒ ∃c ∈ R :3
2(ϕ(t))2/3 = t+ c
⇐⇒ ∃c ∈ R : ϕ(t) = (2
3(t+ c))3/2.
Dies liefert Losungen auf (−c,∞). Nun ist
ϕ(t) =
(23(t+ c))3/2 t > −c
0 t ≤ −c
stetig differenzierbar. Zum Anfangswert ϕ(0) = 0 gibt es viele Losungen (zu jedem
c ≥ 0 eine). Weitere Losungen
ϕ(t) =
−(23(t+ c))3/2 t > −c
0 t ≤ −c.
Existenz, aber keine Eindeutigkeit!
4. DER SATZ VON PICARD-LINDELOF 421
In der Aussage des Satzes 4.3 von Picard-Lindelof lasst sich nicht ablesen, wie ε0 von
x0 abhangt. Wenn man den Beweis des Satzes von Picard-Lindelof genau betrachtet, so
erhalt man aber folgendes:
ZUSATZ 4.13 (zum Satz von Picard-Lindelof). Es sollen die Voraussetzungen von Satz 4.3
von Picard-Lindelof gelten. Jeder Punkt (t0, x0) besitzt dann eine Umgebung W und ein
ε0 > 0, so dass fur jedes (t1, x1) ∈ W der Satz von Picard-Lindelof eine eindeutige Losung
ϕ : (t1 − ε0; t1 + ε0)→ Rn mit Anfangswert ϕ(t1) = x1 liefert.
Beweis des Zusatzes (skizziert). Sei wieder f : U → Rn, (t0, y0) ∈ U wie oben. Hierzu sei
δ, ε wie im Beweis des Satzes 4.3 von Picard-Lindelof konstruiert gewahlt. Sei (t1, x1) ∈
U mit ‖(t1, x1) − (t0, x0)‖∞ ≤ δ/4. Wenn man den Beweis des Satzes 4.3 von Picard-
Lindelof genau anschaut, so sieht man, dass die Differentialgleichung auch eine Losung
ϕt1,y1 : (t1 − ε0; t1 + ε0) → Rn mit ϕt1,x1(t1) = x1 besitzt. Der Zusatz ist also richtig fur
W := B∞δ/4((t0, x0)
)⊂ U .
Dasselbe ε0 kann also zu allen Startwerten in W gewahlt werden. Man beachte aber, dass
wir weder hier noch im Satz von Picard-Lindelof gefordert haben, dass ε0 in irgendeinem
Sinne maximal gewahlt wird. Diese Abhangigkeit von den Anfangswerten wird spater in
Satz 4.20) wieder aufgegriffen. Ende Mi
17.7.
Fr 19.7.Wdh. Picard-Lindelof.
Sei U offen in R×Rn, f : U → Rn Orts-Lipschitz-stetig und stetig. Zu jedem (t0, x0) gibt
es
• ε > 0 und
422 10. GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
• Eine eindeutige C1-Funktion ϕt0,x0 : (t0 − ε; t0 + ε) → Rn, so dass fur alle t ∈
(t0 − ε; t0 + ε) gilt:
(t, ϕt0,x0(t)) ∈ U und ϕ′t0,x0(t) = f(t, ϕt0,x0(t))
Ab jetzt: Losung = Losung von ϕ′(t) = f(t, ϕ(t)).
SATZ 4.14 (Satz von Picard-Lindelof auf maximalen Intervallen). Seien U , f , t0 und x0
wie im Satz von Picard-Lindelof. Setze
tmax := sup{t > t0 | Es existiert ε > 0 und eine Losung ϕ : (t0 − ε; t)→ Rn
von (4.4) mit Anfangswert x0} ∈ (t0;∞]
tmin := inf{t < t0 | Es existiert ε > 0 und eine Losung ϕ : (t; t0 + ε)→ Rn
von (4.4) mit Anfangswert x0} ∈ [−∞; t0).
(1) Dann existiert auch eine Losung ϕmax : (tmin; tmax)→ Rn mit Anfangswert ϕmax(t0) =
x0. Man nennt (tmin; tmax) das maximale Losungs-Intervall.
(2) Jede Losung ϕ : I → Rn mit demselben Anfangswert erfullt I ⊂ (tmin; tmax) und
ϕ = ϕmax|I .
Beweis. 1. Schritt: Sind ϕ : I → Rn und ϕ : I → Rn mit ϕ(t0) = ϕ(t0) = x0; I, I offene
Intervalle. Wir zeigen, dass ϕ und ϕ auf I ∩ I ubereinstimmen.
Wir definieren
T := {t ∈ I ∩ I | ϕ(t) = ϕ(t)}.
Da h : t 7→ ϕ(t)− ϕ(t) stetig ist und da {0} abgeschlossen in R, ist T = h−1({0}) ebenfalls
abgeschlossen in I ∩ I. Wegen t0 ∈ T wissen wir T 6= ∅. Wir zeigen nun, dass T offen in
I ∩ I ist. Da I ∩ I zusammenhangend ist, folgt dann T = I ∩ I und somit der erste Schritt.
4. DER SATZ VON PICARD-LINDELOF 423
Sei also t1 ∈ T . Wahle ε1 > 0 so, dass (t1−ε1; t1+ε1) ⊂ I∩I. Nach dem Satz 4.3 von Picard-
Lindelof gibt es ein ε ∈ (0; ε1], so dass es genau eine Losung ϕ : J := (t1 − ε; t1 + ε)→ Rn
mit Anfangswert ϕ(t1) = ϕ(t1) gibt. Also
ϕ ≡ ϕ|J ≡ ϕ|J .
Somit J ⊂ T . Wir haben gesehen, dass T offen ist. Der erste Schritt ist somit beendet.
2. Schritt: Wir wollen nun die Losung ϕmax : (tmin; tmax) → Rn mit Anfangswert
ϕmax(t0) = x0 definieren.
Zu t ∈ (tmin; tmax) wahlen wir eine Losung ϕ : I → Rn, I offenes Intervall, t0, t ∈ I
mit ϕ(t0) = x0. Dann setzen wir ϕmax(t) = ϕ(t). Der erste Schritt garantiert, dass die
Definition von ϕmax(t) nicht davon abhangt, wie wir I und ϕ gewahlt haben. Und fur
derartige ϕ gilt dann
ϕmax|I = ϕ.
Insbesondere ist nun ϕmax auf (tmin; tmax) wohldefiniert und eine stetig differenzierbare
Losung.
PROPOSITION 4.15. Seien U , f , (t0, x0) wie im Satz von Picard-Lindelof. Sei ϕ eine
Losung mit ϕ(t0) = x0 mit maximalem Losungs-Intervall (tmin; tmax).
Gilt tmax <∞, dann gibt es kein x∞ mit (tmax, x∞) ∈ U und
x∞ = limt→tmax
ϕ(t).
Analog fur tmin > −∞.
424 10. GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
In anderen Worten: Wenn der Grenzwert existiert, dann ist er nicht in U .17
Beweis. Wir betrachten nur die Aussage um tmax.
Angenommen solch ein x∞ existiert. Es existiert nun ein ε > 0 und eine Umgebung V
von (tmax, x∞) in R × Rn, so dass fur alle (s, y) ∈ V gilt: es gibt eine Losung ϕs,y :
(s− ε; s+ ε)→ Rn mit ϕs,y(s) = y.
Es existiert nun ein δ > 0 so dass fur alle t ∈ (tmax − δ; tmax): (t, ϕ(t)) ∈ V . Wahle nun
ein t1 mit tmax − ε/2 < t1 < tmax, tmax − δ < t1.
Wir erhalten nun eine Losung
ϕ(t) :=
ϕ(t) fur tmin < t ≤ t1
ϕt1,ϕ(t1)(t) fur t ≥ t1
Ein passendes Bild
die auf dem Intervall [tmin; t1 +ε) definiert ist, aber t1 +ε > tmax. Dies ist ein Widerspruch.
Bemerkung. Unter den Voraussetzung von Proposition 4.15 erhalten wir mit genau den
gleichen Argumenten wie im obigen Beweis sogar eine etwas starkere Aussage:
Gilt tmax <∞, dann gibt es keine Folge ti ↗ tmax, so dass
x∞ = limi→∞
ϕ(ti)
17Es gibt ein Beispiele fur alle denkbaren Falle: tmax < ∞ und Grenzwert existiert außerhalb U .
tmax < ∞ und Grenzwert existiert nicht. Im Falle tmax = ∞ kann man keine Aussage machen. Ein
uneigentlicher Grenzwert kann nicht existieren, außerhalb von U existieren oder in U existieren. Analog
fur tmin.
4. DER SATZ VON PICARD-LINDELOF 425
existiert und (tmax, x∞) ∈ U . Insbesondere folgt hieraus: Im Fall tmax < ∞, gilt fur
t0 ∈ (tmin; tmax)
U ∩ {(t, ϕ(t)) | t0 ≤ t < tmax}
ist nicht kompakt.
Bemerkung 4.16 (Unter Nutzung des nachsten Abschnitts, der in der Vorlesung zeitlich
zu vor behandelt wurde.). Ist f stetig differenzierbar, und ϕ eine Losung von ϕ′(t) =
f(t, ϕ(t)). Dann erhalten wir aus der Kettenregel ϕ ∈ C2 und
ϕ′′(t) =∂
∂tf(t, ϕ(t)) +
∂
∂xf(t, ϕ(t)) · ϕ′(t) .
Dies kann man bis zur k-ten Ableitung iterieren, falls f ∈ Ck. Wenn man nun die so
erhaltene gewohnliche Differentialgleichung k-ter Ordnung studiert, erhalt man wichtige
Aussagen uber die Ableitungen von ϕ. Insbesondere: ist f ∈ Ck, dann ist ϕ ∈ Ck+1.
Frage 4.17. Hangt die Losung stetig von t0 und x0 ab?
LEMMA 4.18 (Gronwall). Sei I ein Intervall, C,L ∈ R≥0, g : I → R stetig, a ∈ I und es
gelte fur alle t ∈ I
g(t) ≤
C + L∫ tag(τ) dτ falls t ≥ a
C + L∫ atg(τ) dτ , falls t ≤ a .
Dann gilt fur alle t ∈ I:
g(t) ≤ eL |t−a|C .
Beweis. Wir betrachten zunachst t ≥ a. Sei ψ(t) := C+L∫ tag(τ) dτ , das heißt g(t) ≤ ψ(t)
fur t ∈ I mit t ≥ a. Nach dem Hauptsatz der Differenial- und Integralrechnung ist ψ diffbar
426 10. GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
mit ψ′(t) = Lg(t) ≤ Lψ(t). Wir rechnen
d
dt
(ψ(t) e−L(t−a)
)= ψ′(t)︸︷︷︸
≤Lψ(t)
e−L(t−a) − Lψ(t)) e−L(t−a) ≤ 0 .
Durch Integration uber das Intervall [a, t] folgt
ψ(t) e−L(t−a) ≤ ψ(a) e−L(a−a) = C ,
und somit die Behauptung.
Der Fall t ≤ a folgt, in dem wir den bereits beweisenen Fall auf g(τ) := g(2a − τ)
anwenden.
PROPOSITION 4.19 (Losungsabschatzung). Sei U ⊂ R × Rn offen und f : U → Rn
Orts-Lipschitz-stetig mit Lipschitz-Konstante L und stetig. Sei I ein Intervall und a ∈ I.
Seien ϕ1, ϕ2 : I → Rn Losungen von
ϕ′(t) = f(t, ϕ(t)) .
(Also insbesondere seien beide differenzierbar und fur alle t ∈ I gelte (t, ϕ1(t)) ∈ U und
(t, ϕ2(t)) ∈ U .) Dann gilt fur alle t ∈ I:
‖ϕ1(t)− ϕ2(t)‖∞ ≤ eL |t−a| ‖ϕ1(a)− ϕ2(a)‖∞ .
Beweis. Mit Lemma 4.6 erhalten wir
ϕ1(t)− ϕ2(t) = ϕ1(a)− ϕ2(a) +
∫ t
a
(f(τ, ϕ1(τ))− f(τ, ϕ2(τ)))︸ ︷︷ ︸≤L‖ϕ1(τ)−ϕ2(τ)‖
dτ .
Hieraus erhalten wir daraus
‖ϕ1(t)− ϕ2(t)‖∞ ≤ ‖ϕ1(a)− ϕ2(a)‖∞ + L∣∣∣∫ t
a
‖ϕ1(τ)− ϕ2(τ)‖∞ dτ∣∣∣ .
4. DER SATZ VON PICARD-LINDELOF 427
Wir wenden das Lemma von Gronwall fur g(t) := ‖ϕ1(t) − ϕ2(t)‖∞ und C := ‖ϕ1(a) −
ϕ2(a)‖∞ an und erhalten die Aussage.
SATZ 4.20 (Stetige Abhangigkeit von den Anfangsbedinungen). Es sollen die Vorausset-
zungen und Definitionen aus dem Satz 4.3 von Picard-Lindelof und dem Zusatz 4.13 gelten.
Das heißt: Seien U ⊂ R×Rn offen, f : U → Rn lokal Orts-Lipschitz-stetig und stetig. Sei
(t0, x0) ∈ U . Es sei eine offene Umgebung W von (t0, x0) in U und ein ε0 > 0 gegeben, so
dass es zu jedem Anfangswert (t1, x1) ∈ W eine Losung ϕt1,x1 : (t0− ε0; t0 + ε0)→ Rn von
ϕ′(t) = f(t, ϕ(t))
gibt.18 Dann hangt ϕt1,x1(t) auch stetig von t1 und x1 ab. Genauer: die Funktion
Φ : (t0 − ε0; t0 + ε0)×W → Rn, (t, t1, x1) 7→ ϕt1,x1(t) = ϕt0,x1(t− t1 + t0)
ist stetig.
Beweis. Man sieht die Folgenstetigkeit der Funktion Φ ganz einfach aus der vorangehen-
den Proposition.
Skizze eines alternativen Beweises.19 (Details siehe z.B. [11, Chap. 1, Sec. 5])
Man nutzt Zusatz 4.13 um ein gemeinsames Definitionsintervall fur alle (t1, x1) nahe
(t0, x0) zu finden. Man definiert iterativ fur |t − t1| < ε/2 (fur das ε aus Beweis des
18Dieselbe Aussage gilt zunachst fur ϕt1,x1: (t1 − ε0; t1 + ε0) → Rn und daraus folgt obige Aussage
nach Verkleinerung von ε0 und W .19Der alternative Beweis erfordert im Beweis des Satzes von Picard-Lindelof etwas hoheren Abstrak-
tionsaufwand (Gleichmaßigkeit in weiteren Variablen, ist aber letztendlich effektiver gefuhrt. Der oben
aufgefuhrte ist anschaulicher, sobald man Picard-Lindelof als bewiesen akzeptiert.
428 10. GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
Satzes 4.3 von Picard-Lindelof):
Φ0(t, t1, x1) := x1, Φj+1(t, t1, x1) := x1 +
∫ t
t1
f(τ,Φj(τ, t1, x1)) dτ.
Man zeigt iterativ, dass Φj stetig ist fur alle j und zeigt dann, dass Φj lokal gleichmaßig
gegen Φ konvergiert. Die Stetigkeit ist nun fur |t− t1| < ε/2 gezeigt. Um es fur alle t, t1 zu
zeigen wahlt man Zahlen t(0), . . . , t(L) mit t(0) = t1, t(L) = t und |t(i)− t(i− 1)| < ε/2.
Die Stetigkeit von Φ folgt dann aus der Verkettung von stetigen Funktionen wie folgt
Φ(t, t1, y) = Φ(t(L), t(L− 1),Φ(t(L− 1), t(L− 2),Φ(. . . ,Φ(t(1), t(0), x1) . . .).
5. Picard-Lindelof fur gewohnliche Differentialgleichungen hoherer Ordnung
Wir schreiben wieder (a, b) fur das Intervall.
Aus dem Satz von Picard-Lindelof ergibt sich unmittelbar durch Nutzen der Reduktion
auf Systeme erster Ordnung (Bemerkung 2.6 (1)):
SATZ 5.1. Gegeben sei eine explizite Differentialgleichung k-ter Ordnung
ϕ(k)(t) = f(t, ϕ(t), . . . , ϕk−1(t))
f : U → Rn stetig und lokal Orts-Lipschitz-stetig20, U ⊂ R×(Rn)k offen. Sei (t0, ϕ0, ϕ1, . . . , ϕk−1) ∈
U , dann gibt es ein ε0 ∈ R>0, so dass es fur jedes ε ∈ (0, ε0] genau eine genau eine Losung
ϕ : (t0 − ε, t0 + ε)→ Rn mit ϕ(t0) = ϕ0, ϕ′(t0) = ϕ1, . . . und ϕ(k−1)(t0) = ϕk−1.
20Das heißt: Lipschitz-stetig in allen Komponenten (außer der t-Komponente), und die Lipschitz-
Konstante kann stetig in t gewahlt werden.
6. LINEARE GEWOHNLICHE DIFFERENTIALGLEICHUNGEN 429
Wenn wir mit maximalen Intervallen arbeiten und Satz 4.14 anwenden, dann erhalten wir
diese Version:
SATZ 5.2. Gegeben sei eine explizite Differentialgleichung k-ter Ordnung
ϕ(k)(t) = f(t, ϕ(t), . . . , ϕk−1(t))
f : U → Rn stetig und lokal Orts-Lipschitz-stetig21, U ⊂ R×(Rn)k offen. Sei (t0, ϕ0, ϕ1, . . . , ϕk−1) ∈
U , dann gibt es genau eine auf einem maximalen Intervall definiert Losung ϕ mit ϕ(t0) =
ϕ0, ϕ′(t0) = ϕ1, . . . und ϕ(k−1)(t0) = ϕk−1. Jede auf einem beliebigen Intervall definierte
Losung erhalt man Restriktion aus der obigen.
6. Lineare gewohnliche Differentialgleichungen
Definition 6.1. Sei I ein offenes Intervall, n ∈ N. Gegeben seien stetige Abbildungen
A0, A1, . . . , Ak−1 : I → Rn×n
und b : I → Rn. Eine Gleichung der Form
(6.2) ϕ(k)(t) = Ak−1(t)ϕ(k−1)(t) + . . . A1(t)ϕ′(t) + A0(t)ϕ(t) + b(t)
nennt man eine explizite lineare gewohnliche Differentialgleichung k-ter Ordnung; und
eine Losung ist ein ϕ ∈ Ck(J,Rn), J ein offenes Intervall in I, so dass (6.2) fur alle t ∈ J
gilt. Man nennt (6.2) homogen, falls b ≡ 0, sonst ist es inhomogen.
21Das heißt: Lipschitz-stetig in allen Komponenten (außer der t-Komponente), und die Lipschitz-
Konstante kann stetig in t gewahlt werden.
430 10. GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
Reduktion auf Ordnung 1 (Wiederholung/Spezialfall)
Schreiben wir Φ(t) =
ϕ(t)
ϕ′(t)...
ϕ(k−1)(t))
∈ Rnk.
Ist ϕ eine Losung von (6.2), so erfullt das oben definierte Φ die Gleichung
(6.3) Φ′(t) =
0 11n 0 · · · 0
0 0 11n · · · 0...
......
0 0 0 · · · 11n
A0(t) A1(t) A2(t) · · · Ak−1(t)
Φ(t) +
0
0...
0
b(t)
.
Umgekehrt: ist Φ eine Losung von (6.3), dann bilden die ersten n-Komponenten von Φ
eine Losung von (6.2). Es reicht also, sich auf Gleichungen erster Ordnung einzuschranken.
Ab jetzt k = 1, d.h.
(6.4) ϕ′(t) = A(t)ϕ(t) + b(t) kurz: ϕ′ = Aϕ+ b
Das Wort”Losung“ benutzen wir in diesem Abschnitt immer im Sinn
”stetig differenzier-
bare Losung“.
Zusatzlich zu den obigen Voraussetzungen seien von nun an A und b stetig.
SATZ 6.5. Sei J 6= ∅ ein offenes Teil-Intervall von I. Eine Losung ϕ : J → Rn lasst sich
zu einer auf I definierten Losung fortsetzen.
Beweis spater.
6. LINEARE GEWOHNLICHE DIFFERENTIALGLEICHUNGEN 431
Eine Moglichkeit, diesen Satz zu zeigen, ist, geeignete Abschatzungen zu machen und dann
Proposition 4.15 zu verwenden. Siehe zum Beispiel [23], Abschnitt 4.3 und die Vorarbeiten
zuvor.
Wir wollen einen anderen Weg beschreiten und werden sehen, dass wir bald den Satz
ohne Rechenaufwand zeigen konnen. Unser Weg hat auch den Vorteil, dass wir dann
nicht Zusatz 4.13 nutzen, dessen Beweis nur skizziert wurde.
Da wir in den folgenden Zeilen den Satz noch nicht nutzen konnen, mussen wir alle nun
folgenden Aussagen so formulieren, dass wir keine Probleme erhalten, falls eine Losung
nicht auf ganz I definierbar sein sollte. Sobald dann aber Satz 6.5 gezeigt ist, konnen wir
davon ausgehen, dass dann alle Losungen zu Losungen I → Rn erweitert werden konnen.
Die zu (6.4) gehorende homogene Differentialgeleichung ist:
(6.6) ϕ′(t) = A(t)ϕ(t)
LEMMA 6.7. Sei J ein offenes Teil-Intervall von I.
(1) Sei ϕ eine auf J definierte Losungen der inhomogenen Gleichung (6.4). Dann gilt
ϕ ist eine auf J definierte Losung der homogenen Gleichung (6.6)
⇐⇒ ϕ+ ϕ ist eine auf J definierte Losung der inhomogenen Gleichung (6.4)
(2) Die auf J definierten Losungen von (6.6) bilden einen Untervektorraum von C1(J,Rn).
Wir nennen ihn LJ .
Beweis. Nachrechnen.
432 10. GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
LEMMA 6.8. Zu jedem t0 ∈ I gibt es ein ε > 0, so dass gilt: zu jedem v ∈ Rn existiert
genau eine auf (t0 − ε, t0 + ε) definierte Losung ϕ von (6.4) mit ϕ(t0) = v.
Beweis. Die Funktion f(t, y) := A(t)y + b(t) ist Orts-Lipschitz-stetig. Nach dem Satz 4.3
von Picard-Lindelof gibt es Zahlen ε > 0, ε1 > 0,. . . , εn > 0 und folgende Losungen:
• Eine C1-Funktion ϕ : (t0 − ε, t0 + ε)→ Rn mit ϕ′ = Aϕ+ b, ϕ(t0) = 0.
• Fur i ∈ {1, . . . , n}: C1-Funktionen ϕi : (t0 − εi, t0 + εi) → Rn mit ϕ′i = Aϕi,
ϕi(t0) = ei.
Setze nun ε := min{ε, ε1, . . . , εn} > 0.
Zu jedem v = (v1, . . . , vn)T ∈ Rn ist
ϕ := ϕ+n∑i=1
viϕi
eine auf (t0 − ε, t0 + ε) definierte Losung von
ϕ′ = Aϕ+ b, ϕ(t0) = v.
nach der Eindeutigkeitsaussage im Satz 4.3 von Picard-Lindelof ist dies die einzige Losung.
Insbesondere ist die Auswertungsabbildung
ιt0 : L(t0−ε,t0+ε) → Rn, ϕ 7→ ϕ(t0)
ein Isomorphismus (von Vektorraumen) und
dimL(t0−ε,t0+ε) = n.
6. LINEARE GEWOHNLICHE DIFFERENTIALGLEICHUNGEN 433
Sind J1, J2 Intervalle mit ∅ 6= J1 ⊂ J2 ⊂ I, dann ist wegen der Eindeutigkeitsaussage
im Satz 4.3 von Picard-Lindelof (bzw. der daraus gefolgerten Aussage Satz 4.14 (2)) die
Restriktionsabbildung
LJ2 → LJ1 , ϕ 7→ ϕ|J1
injektiv.22 Also
(6.9) dimLJ2 ≤ dimLJ1 ≤ n.
Beweis von Satz 6.5. Sei ϕ : (t1, t2)→ Rn eine Losung von (6.4), (t1, t2) ⊂ I.
Im Fall t2 ∈ I, werden wir zeigen, dass sich die Losung auf ein großeres offenes Intervall
fortsetzt, das t2 enthalt. Analoges gilt fur t1 ∈ I. Wenn also (t1, t2) das maximale Losungs-
Intervall ist, so muss (t1, t2) = I gelten.
Sei also t2 ∈ I. Bestimme ε > 0 und ϕ wie im Beweis des letzten Lemmas fur t0 := t2.
Dann ist
ϕ|(t2−ε,t2) − ϕ|(t2−ε,t2) ∈ L(t2−ε,t2).
Wegen den obigen Uberlegungen (6.9) gilt
n = dimL(t2−ε,t2+ε) ≤ dimL(t2−ε,t2) ≤ n.
Also gilt uberall”=“ und die Restriktion L(t2−ε,t2+ε) → L(t2−ε,t2) ist surjektiv. Es gibt also
ein ψ ∈ L(t2−ε,t2+ε), mit
ψ|(t2−ε,t2) = ϕ|(t2−ε,t2) − ϕ|(t2−ε,t2).
22Sobald der Satz gezeigt ist, steht hier uberall”=“.
434 10. GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
Somit ist
ϕ(t) :=
ϕ(t) t ∈ (t1, t2)
ϕ(t) + ψ(t) t ∈ [t2, t2 + ε)
eine stetig differenzierbare Losung von ϕ′ = Aϕ+ b, die auf (t1, t2 + ε) definiert ist. Nach
den Ausfuhrungen zu Beginn des Beweises folgt daraus der Satz.
FOLGERUNG 6.10.
{Auf I definierte Losungen von ϕ′ = Aϕ+ b} → Rn, ϕ 7→ ϕ(t0)
ist bijektiv und dimLI = n.
FOLGERUNG 6.11. Gegeben seien ϕ1, . . . , ϕn ∈ LI , t0 ∈ I. Dann gilt
(ϕ1, . . . , ϕn) ist Basis von LI ⇐⇒ det(ϕ1(t0), . . . , ϕn(t0)) 6= 0.
Diese Determinante nennt man Wronski-Determinante. Sie ist hilfreich, um zu prufen, ob
man schon alle Losungen der homogenen DGl gefunden hat.
Falls es eine Basis ist, so nennt man Φ = (ϕ1, . . . , ϕn) : I → Rn×n eine Fundamentallosung
von ϕ′ = Aϕ.Losungs-Strategie zur Losung von (6.4)
1.) Bestimme die Menge aller Losungen der homogenen DGl.
2.) Dann finde eine Losung der inhomogenen DGl.
Mit Hilfe von Lemma 6.7 erhalten wir dann alle Losungen
der inhomogenen DGl.
Wie erhalt man alle Losungen der homogenen DGl?
n = 1: 23 Losungen von ϕ′ = Aϕ verschwinden entweder nie oder uberall (EindeutigkeitFr 12.7.
6. LINEARE GEWOHNLICHE DIFFERENTIALGLEICHUNGEN 435
in Picard-Lindelof), o.B.d.A. sei ϕ(t) 6= 0 ∀t.
ϕ′ = Aϕ ⇐⇒ ϕ′
ϕ= A
⇐⇒ d
dtlog |ϕ(t)| = A(t)
ϕ(t) = C exp
(∫ t
t0
A(τ) dτ
).
Alle Losungen sind von dieser Form mit C ∈ R.
n > 1: im allgemeinen haufig schwer losbar.
Spezialfall: A konstant. O.B.d.A. I = R.
Dann ist die Menge der Losungen ϕ′ = Aϕ
{t 7→ ϕ(t) = exp(At)ϕ0 | ϕ0 ∈ Rn}
Hierbei ist
exp(At) :=∞∑j=0
1
j!Ajtj ∈ Rn×n.
Diese Reihe konvergiert absolut: wir rechnen ‖AB‖∞ ≤ n‖A‖∞‖B‖∞, ‖Aj‖∞ ≤ nj−1‖A‖j∞∥∥∥∥ 1
j!Ajtj
∥∥∥∥∞≤ 1
j!nj−1‖A‖j∞|t|j := aj
ajaj−1
=n
j‖A‖∞|t| → 0.
d
dtexp(tA) = A exp(tA) = exp(tA)A .
23Dies ist ein Spezialfall der Methode “getrennte Variable”, siehe Abschnitt 8.
436 10. GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
exp(0 · A) = exp(0n) = 11n .
Φ(t) := exp(At) ist eine Fundamentallosung.
Wir werden dies im nachsten Abschnitt nochmals betrachten.
Wie erhalt man eine Losung der inhomogenen DGl?
PROPOSITION 6.12 (Variation der Konstanten). A ∈ C0(I,Rn×n), b ∈ C0(I,Rn), t0 ∈
I. Sei Φ : I → Rn×n eine Fundamentallosung von ϕ′(t) = A(t)ϕ(t). Dann ist
t 7→ Φ(t)
∫ t
t0
Φ(τ)−1b(τ) dτ
eine Losung von ϕ′(t) = A(t)ϕ(t) + b(t).
Beweis.
d
dt
(Φ(t)
∫ t
t0
Φ(τ)−1b(τ) dτ
)= Φ′(t)
∫ t
t0
Φ(τ)−1b(τ) dτ + Φ(t)Φ(t)−1b(t)
= A(t)Φ(t)
∫ t
t0
Φ(τ)−1b(τ) dτ + b(t)
= A(t)
(Φ(t)
∫ t
t0
Φ(τ)−1b(τ) dτ
)+ b(t)
7. LINEARE GEWOHNLICHE DIFFERENTIALGLEICHUNGEN MIT KONSTANTEN KOEFFIZIENTEN437
7. Lineare gewohnliche Differentialgleichungen mit konstanten Koeffizienten
!ACHTUNG!. Dieser Abschnitt ist noch nicht in latex aufgeschrieben und es ist unklar,
ob und gegebenenfalls wann dies getan wird. Bitte benutzen Sie Ihre Vorlesungsmitschrift
der Vorlesung vom 12.7..
Beispiele 7.1.
(1) Phasenportrait von ϕ′(t) =
−2 0
0 −1
ϕ(t).
Losungen: ϕ(t) =
e−2t 0
0 e−t
ϕ0, ϕ0 ∈ R2.
Ein passendes Bild
(2) Phasenportrait von ϕ′(t) =
1 0
0 1
ϕ(t).
Losungen: ϕ(t) =
et 0
0 et
ϕ0, ϕ0 ∈ R2.
Ein passendes Bild
(3) Phasenportrait von ϕ′(t) =
−2 0
0 1
ϕ(t).
Losungen: ϕ(t) =
e−2t 0
0 et
ϕ0, ϕ0 ∈ R2.
Ein passendes Bild
(4) Phasenportrait von ϕ′(t) =
0 1
−1 0
ϕ(t).
438 10. GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
Losungen: ϕ(t) =
cos t sin t
− sin t cos t
ϕ0, ϕ0 ∈ R2.
Ein passendes Bild
(5) Phasenportrait von ϕ′(t) =
0 1
0 0
ϕ(t).
Losungen: ϕ(t) =
1 t
0 1
ϕ0, ϕ0 ∈ R2.
Ein passendes Bild
8. Differentialgleichungen mit getrennten VariablenMi 24.7.
Definition 8.1. Gegeben seien offene Intervalle I und J , und g : I → R und h : J → R
stetig. Eine Differentialgleichung der Form
ϕ′(t) = g(t)h(ϕ(t))
nennt man eine gewohnliche Differentialgleichung mit getrennten Variablen24. Kurzschreib-
weise
(8.2) ϕ′ = g(t)h(ϕ).
Der Satz 4.3 von Picard-Lindelof ist nicht anwendbar, da
f(t, x) = g(t)h(x)
im allgemeinen25 nicht Orts-Lipschitz-stetig ist.
24oder auch”mit getrennten Veranderlichen“, da eine Variable dasselbe wie eine Veranderliche ist.
25”im allgemeinen“ heißt hier: es gibt Funktionen g und h, so dass dies nicht erfullt ist. Beispiel
g(t) = 1, h(x) = 3√x.
8. DIFFERENTIALGLEICHUNGEN MIT GETRENNTEN VARIABLEN 439
Schmutzige Rechnung (streng mathematisch nicht gerechtfertigt, aber in der Praxis oft
erfolgreich)
dϕ
dt= g(t)h(ϕ)
⇐⇒ dϕ
h(ϕ)= g(t) dt
⇐⇒∫
dϕ
h(ϕ)= c+
∫g(t) dt
Ist nun H eine Stammfunktion von 1/h und G eine Stammfunktion von g, dann sollte es
eine Konstante c ∈ R geben mit
H(ϕ(t)) = c+G(t),
also ϕ(t) = H−1(c+G(t)).
Bestimme nun c so, dass Anfangsdaten erfullt sind.
Jetzt eine exakte Herleitung:
SATZ 8.3 (Trennung der Variablen). Gegeben sei eine gewohnliche Differentialgleichung
mit getrennten Variablen wie in Definition 8.1, h(x) 6= 0 auf J . Sei t0 ∈ I, x0 ∈ J . Die
Stammfunktion von t 7→ g(t) sei G : I → R und die von x 7→ 1/h(x) sei H : J → R. Dann
gibt es bis auf Restriktion genau eine stetig differenzierbare Losung von
ϕ′(t) = g(t)h(ϕ(t)
)ϕ(t0) = x0,
440 10. GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
die auf einer offenen Umgebung von t0 definiert ist, namlich
(8.4) ϕ(t) = H−1(G(t) +H(x0)−G(t0)).
Beweis. Offensichtlich ist t 7→ 1/h(x) stetig. Also existiert H, ist stetig differenzierbar
und monoton. Wir wenden Proposition 1.6 aus Kapitel 5 auf die Funktion H : J → R an
und erhalten wegen H ′(t) = 1/h(t) 6= 0:
• K := H(J) ist ein offenes Intervall,
• H−1 : K → J existiert,
• H−1 ist differenzierbar mit (H−1)′(s) = 1/(1/h(H−1(s))) = h(H−1(s)).
Also auch H−1 ∈ C1(K). Wegen G ∈ C1(I,R) ist die in Gleichung (8.4) definierte Funk-
tion ϕ auf der offenen Menge
{t ∈ I | G(t) +H(x0)−G(t0) ∈ K} 3 t0
in C1. Man rechnet leicht nach, dass ϕ eine Losung von (8.2) mit ϕ(t0) = x0 ist.
Nehmen wir, dass ϕ eine Losung von (8.2) mit ϕ(t0) = x0 ist. Dann gilt
g(t) =ϕ′(t)
h(ϕ(t))=
d
dt(H(ϕ(t)) ,
also ist G(t)−H(ϕ(t)) eine Konstante, namlich G(t0)−H(x0). Und dies ergibt (8.4).
Beispiel 8.5. g : R → R, g(t) = 1. h : R r {0} → R, h(x) = −x2 6= 0. Die Differential-
gleichung
ϕ′(t) = −ϕ(t)2
9. MEHR ZUM FLUSS EINES ZEITABHANGIGEN VEKTORFELDS 441
besitzt unter anderem die Losung ϕ ≡ 0. Jede andere Losung wird nie Null (Eindeutigkeit
in Picard-Lindelof). Im Fall ϕ 6≡ 0 konnen wir umformulieren in
− ϕ′(t)
ϕ(t)2= 1
⇐⇒ d
dt
1
ϕ(t)= 1
⇐⇒ 1
ϕ(t)= t+ c
⇐⇒ ϕ(t) =1
t+ c
Beim Anfangswert ϕ(0) = α < 0 bekommen wir c = 1/α und das maximale Losungs-
Intervall ist (−∞, 1/|α|). Die Losung hort also bei 1/|α| auf zu existieren. Wir haben
gesehen, dass dieses Phanomen bei den linearen Gleichungen nie auftreten kann.
Beispiel 8.6. ϕ′(t) = A(t)ϕ(t). NICHT GETIPPT...
Beispiel 8.7. ϕ′(t) = π(12t3 + 1
4t)(4 + ϕ(t)2). NICHT GETIPPT...
9. Mehr zum Fluss eines zeitabhangigen Vektorfelds
Sei wieder U ⊂ R× Rn eine offene Teilmenge und f : U → Rn Orts-Lipschitz-stetig und
stetig.
Wir definieren jetzt
D ⊂ R× R× Rn
durch (t, s, y) ∈ D ⇐⇒ (s, y) ∈ U und es existiert eine Losung ϕs,y : I → Rn von
(9.1) ϕ′(t) = f(t, ϕ(t))
442 10. GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
mit ϕs,y(s) = y und t ∈ I.26 Es folgt aus Zusatz 4.13:
{(t, t, y) | (t, y) ∈ U} ⊂◦D
Wir sehen spater, dass D offen in R× R× Rn ist, also◦D = D.
Wir definieren nun den Fluss Φ von f wie folgt:
Φ : D → Rn, Φ(t, s, y) := ϕs,y(t).
Dann gilt offensichtlich
Φ(t, t, y) = y.
LEMMA 9.2.
(t, s, y) ∈ D ⇐⇒ (s, t,Φ(t, s, y)) ∈ D
und
Φ(s, t,Φ(t, s, y)) = y.
Beweis. Nach Definition von Φ gilt Φ(t, s, y) = ϕs,y(t). Daraus folgt
ϕs,y ≡ ϕt,Φ(t,s,y).
Wir erhalten dann an der Stelle s
y = ϕs,y(s) = ϕt,Φ(t,s,y)(s) = Φ(s, t,Φ(t, s, y)).
So ahnlich zeigt man
Φ(r, t,Φ(t, s, y)) = Φ(r, s, y),
26In anderen Worten t liegt im zugehorigen maximalen Definitionsbereich.
9. MEHR ZUM FLUSS EINES ZEITABHANGIGEN VEKTORFELDS 443
falls alle Ausdrucke wohldefiniert sind.
Begrundung:
Φ(r, s, y) = ϕs, y(r) = ϕt,Φ(t,s,y)(r) = Φ(r, t,Φ(t, s, y)) .
LEMMA 9.3. D ist offen.
Beweisskizze. 27 Sei (t, s, y) ∈ D. Wir wollen eine offene Umgebung von (t, s, y) konstru-
ieren, die in D enthalten ist. O.B.d.A. t ≥ s. Wahle zu jedem τ ∈ [s; t] ein ε(τ) > 0 mit
Bε(τ)((τ, τ,Φ(τ, s, y)) ⊂ D. Dies liefert eine offene Uberdeckung ((τ − ε(τ); τ + ε(τ))τ∈[s;t]
von [s; t]. Wahle mit Proposition 6.17 aus Kapitel 8 zu dieser Uberdeckung eine Lebes-
guesche Zahl ε > 0, und ein m ∈ N, m > 1/ε. Wir definieren
ti := s+i
m(t− s).
Wir schreiben ϕ1(s, y) := Φ(t1, s, y)
ϕi(y) := Φ(ti, ti−1, y) 2 ≤ i ≤ m− 1
ϕm(t, y) := Φ(t, tm−1, y)
Wir konnen nun schreiben:
Φ(t, s, y) = Φ(t, tm−1,Φ(tm−1, tm−2,Φ(. . .Φ(t1, s, y)
= ϕm(t, ϕm−1(ϕm−2(. . . ϕ2(ϕ1(s, y)) . . .)))
27Diese Beweisskizze wurde in der Vorlesung aus Zeitgrunden ubersprungen.
444 10. GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
Wir betrachten beide Seiten der Gleichung als Funktion in t, s und y, also (t, s, y) 7→ Rn.
Dies ist eine”Verkettung“ von stetigen Funktionen, wobei die Funktionen nicht uber-
all definiert sind. Ist (t, s, y) im Definitionsbereich der Verkettung, dann auch in D. Im
folgenden sei D(h) der Definitionsbereich einer Funktion h. Der Definitionsbereich der
Verkettung (s, y) 7→ ϕ2(ϕ1(s, y)) ist
D(ϕ1) ∩(ϕ1
)−1(D(ϕ2)
),
also der Schnitt zweier offener Menge und somit wieder offen. Man zeigt dann induktiv,
dass der Definitionsbereich der Verkettung
(s, y) 7→ ϕm−1(ϕm−2(. . . ϕ2(ϕ1(s, y)) . . .)))
die Menge
V := D(ϕ1)∩ (ϕ1)−1(D(ϕ2)
)∩ (ϕ2 ◦ϕ1)−1
(D(ϕ3)
)∩· · · (ϕm−2 ◦ · · · ◦ϕ2 ◦ϕ1)−1
(D(ϕm−1)
),
ist; und diese Menge ist als Schnitt offener Mengen ebenfalls offen. Der Definitionsbereich
der Verkettung
(t, s, y) 7→ ϕm(t, ϕm−1(ϕm−2(. . . ϕ2(ϕ1(s, y)) . . .)))
ist dann
(R× V ) ∩(idR × (ϕm−1 ◦ · · · ◦ ϕ2 ◦ ϕ1)
)−1D(ϕm),
also auch offen.
PROPOSITION 9.4. Der Fluss Φ : D → Rn ist stetig.
Beweisskizze. Wegen Satz 4.20 wissen wir bereits, zu jedem (τ, y) ∈ U gibt es eine Umge-
bung W von (τ, y) in U und ein ε0 > 0, so dass Φ auf (τ − ε0; τ + ε0)×W stetig ist. Man
10. EINIGE KOMMENTARE ZUM LANGZEITVERHALTEN VON GEW. DIFFIFFERENTIALGLEICHUNGEN445
beachten ε0 = ε0(τ, ε) hangt von τ und ε ab. Zu der Uberdeckung(
(τ − ε0; τ + ε0))τ∈[t;s]
von [t; s] wahle eine Lebesguesche Zahl ε > 0, dann m > 1/ε. Der restliche Beweis geht
ahnlich, wie der Beweis der Offenheit von D: wir schreiben lokal Φ als Verkettung vieler
Abbildungen, bei denen wir bereits die Stetigkeit wissen.
ZUSATZ 9.5. Ist f ∈ Ck(U,Rn), dann ist auch Φ ∈ Ck(D,Rn).
Anschaulich: ist f ∈ Ck, dann ist die Losung ϕt0,x0(t) ist nicht nur Ck in t sondern auch
Ck in t0 und x0.28
Beweis. Dies zeigt man induktiv uber k, indem man ahnlich wie in Bemerkung 4.16
argumentiert.
KOROLLAR 9.6. Autonomer Fall: Sei U offen in Rn, f : U → Rn, ϕ′(t) = f(ϕ(t)) und
Φ : D → Rn der zugehorige Fluss. Wir sagen f ist ein vollstandiges Vektorfeld, falls
D = R × R × U . Dann ist Φ(t, s, y) = Φ(t + c, s + c, y) und Φ(t, s, · ) : U → U ist ein
Homoomorphismus. (Denn Φ(s, t, · ) : U → U ist die (stetige) Umkehrfunktion.)
Leicht zu prufen.
10. Einige Kommentare zum Langzeitverhalten von gew.
DiffifferentialgleichungenFr. 26.7.
Wir haben mit dem Satz von Picard-Lindelof gesehen, dass wir fur kurze Zeiten Existenz
und Eindeutigkeit von Losungen von gewohnlichen Differentialgleichungen mit gegebenen
28Aber die Formulierung im Zusatz ist noch etwas starker!
446 10. GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
Anfangswerten haben, vorausgesetzt, dass die Differentialgleichung in expliziter Form ist
und die Gleichung stetig differenzierbar von den niedrigeren Ableitungen und der Zeit t
abhangen. Gleiches gilt dann naturlich auch fur die zugehorigen Flusse.
Man interessiert sich nun aber auch fur das langfristige Verhalten der Losungen und der
zugehorigen Flusse. Wir haben bereits in Proposition 4.15 einige Ergebnisse zur Frage
erhalten, wie lange Losungen existieren. Wir betrachten nun den Fall, dass Losungen
ϕ fur alle zukunftigen bzw. alle vergangenen Zeiten existieren, d.h. tmax = +∞ oder
tmin = −∞. Wir betrachten der Einfachheit halber nur den autonomen, das heißt nicht
explizit zeitabhangigen Fall.
Falls dann ϕ(t) fur t → ±∞ gegen ein x±∞ konvergiert, und dieses29 im Definitionsbe-
reich der gewohnlichen Differentialgleichung liegt, so ist existiert eine konstante Losung
ϕ±(t) := x±∞. Dieser Fall wird im Rahmen der Stabilitatstheorie untersucht, uber die wir
im folgenden Abschnitt einen kleinen Uberblick geben wollen.
Es kann aber auch vorkommen, dass ϕ periodisch ist, das heißt, es gibt ein kleinstes L > 0,
die Periode, mit ϕ(L + t) = ϕ(t) fur alle t. Man fragt sich dann, ob Losung in der Nahe
ebenfalls periodisch sind. Andere Verhalten sind ebenfalls moglich, z.B. “quasiperiodi-
sches Verhalten” oder “ergodisches Verhalten”, wobei man fur letzteres manchmal auch
das aufreißerischer klingende Wort “chaotisches Verhalten” nutzt. Die mathematischen
Gebiete, die sich damit beschafitgen nennen sich dann je nach Ausrichtung “dynamische
Systeme”, “Chaos-Theorie”, “Ergodentheorie”, . . . .
29Bei Differentialgleichungen ϕ(k)(t) = f(ϕ(t), . . . , ϕ(k−1)(t) der Ordnung k muss man hier naturlich
uberprufen, ob (x±∞, 0, . . . , 0) = lim(ϕ(t), ϕ′(t), . . . ϕ(k−1)(t)) im Definitionsbereich der Funktion f liegt.
10. EINIGE KOMMENTARE ZUM LANGZEITVERHALTEN VON GEW. DIFFIFFERENTIALGLEICHUNGEN447
Eine reiche Quelle wichtiger und interessanter gewohnlicher Differentialgleichungen ist die
klassische Physik, hier insbesondere die Hamiltonsche Mechanik, die letztendlich auch die
Himmelsmechanik umfasst. Wir wollen mal ein Beispiel geben, um anzudeuten, welche
Art von Resultaten hier erwartet werden konnen.
Wenn man zum Beispiel das langfristige Verhalten unseres Sonnensystems betrachtet und
die Entstehung des Lebens, die ja letztendlich einen uber astronomische Zeitraume hinweg
relativ konstanten Abstand zur Sonne benotigt, so erscheint es unabdingbar zu fordern,
dass sich alle Planeten nahezu periodisch um die Sonne bewegen. Dieses Verhalten kann
auch relativ leicht mathematisch hergeleitet werden, wenn nur ein Planet um die Son-
ne kreisen wurde (Zwei-Korper-Problem). Es ist auch einfach zu zeigen, wenn man zwei
Naherungen annimmt: zum einen nimmt man an, dass die Sonne auf grund der großen
Masse sich nicht mehr bewegt und und zum anderen, dass sich die Planeten gegenseitig
nicht anziehen. Wenn man diese Naherungen annimmt, dann hat man viele Erhaltungs-
großen, so dass man schließlich die Bewegung sehr gut beschreiben kann; man hat ein
sogenanntes vollstandig integrables dynamisches System. Die Losungen solcher Systeme
sind immer quasiperiodisch (sie sind nur dann periodisch, wenn die Verhaltnisse der Um-
laufzeiten der Planeten rationale Zahlen sind, sonst sind sie eben fast periodisch, was mit
quasiperdidisch bezeichnet wird).
Diese beiden Naherungen sind aber leider in astronomischen Zeitskalen nicht mehr ange-
bracht. Es handelt sich also um eine Storung eines vollstandig integrablen Systems. Der
Satz von Kolgomorow, Arnold und Moser aus den Jahren 1954-1963 besagt, dass fast
alle Losungen von derartigen Storungen von vollstandig integrablen Systemen ebenfalls
quasiperiodisch sind, vorausgesetzt, die Storungen sind nicht zu groß. Siehe zum Beispiel
unter diesem Link fur weitere Informationen:
448 10. GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
https://de.wikipedia.org/wiki/Kolmogorow-Arnold-Moser-Theorem.
All diese Satze werden wir aber leider im Rahmen des Analysis-Zyklus aus Zeitgrunden
nicht weiter behandeln konnen.
11. Stabilitat und Verhalten in der Nahe von kritischen Punkten
In diesem Abschnitt wollen wir auf einige Beweise verzichten. In der Darstellung halten
wir uns eng an [23], Abschnitt 4.5 und an [35], Kapitel VII. In diesen beiden Buchern
findet man auch die fehlenden Beweise.
Im ganzen Abschnitt sei U eine offene Teilmenge von Rn und v : U → Rn ein stetig
differenzierbares Vektorfeld.
Definition 11.1. x0 ∈ U heißt kritischer Punkt von v, falls v(x0) = 0. Einen kritischen
Punkt x0 nennen wir stabil, falls fur jede Umgebung V ⊂ U von x0 eine offene Umgebung
W ⊂ V von x0 gibt, so dass jede Integralkurve ϕ von v mit ϕ(0) ∈ W auf [0,∞) definiert
werden kann, und so dass ϕ([0,∞)) ⊂ V . Ein kritischer Punkt x0 wird Attraktor genannt,
falls er stabil ist und falls das obige W so gewahlt werden kann, dass fur alle Integralkurven
ϕ von v mit ϕ(0) ∈ W gilt limt→∞ ϕ(t) = x0.
30
Beispiele 11.2. Wir setzen die Beispiele 7.1 fort.
30Man beachte, dass die hier verwendete Definition nicht ganz mit der in [23] verwendeten uber-
einstimmt. Wir haben Stabilitat in die Definition des Attraktors hineingenommen, und sind damit in
Ubereinstimmung mit dem Großteil der fortgeschrittenen Literatur in diesem Gebiet. Der unten zitierte
Beweis des Satzes von Poincare-Ljapunow in [23] zeigt aber sogar unsere (starkere) Version des Attraktors.
11. STABILITAT UND VERHALTEN IN DER NAHE VON KRITISCHEN PUNKTEN 449
(1) In diesem Beispiel ist 0 ein Attraktor zum Vektorfeld
v : x 7→
−2 0
0 −1
x
0 ist kein stabiler Punkt zum Vektorfeld −v.
(2) In diesem Beispiel ist 0 kein stabiler Punkt zum Vektorfeld
v : x 7→
1 0
0 1
x
0 ist Attraktor zum Vektorfeld −v.
(3) In diesem Beispiel ist 0 kein stabiler Punkt zum Vektorfeld
v : x 7→
−2 0
0 1
x
0 ist auch kein stabiler Punkt zum Vektorfeld −v.
(4) In diesem Beispiel ist 0 stabiler Punkt zum Vektorfeld
v : x 7→
0 1
−1 0
x
0 ist auch stabiler Punkt zum Vektorfeld −v. Aber weder Attraktor zu v noch At-
traktor zu −v.
(5) In diesem Beispiel ist 0 weder stabiler Punkt zum Vektorfeld
v : x 7→
0 1
0 0
x
noch ein stabiler Punkt zum Vektorfeld −v.
450 10. GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
Allgemein gilt fur v(x) := Ax: 0 ist Attraktor, genau dann, wenn jeder Eigenwert von A
einen negativen Realteil hat. 31
Beispiel 11.3. (aus [23])
Sei v : R→ R, v(x) = −xk, k ∈ Nr {0}. Der einzige kritische Punkt ist 0. Mit Trennung
der Variablen sieht man, dass ϕ′ = v(ϕ) fur ϕ 6= 0 aquivalent zu
d
dt
1
(k − 1)ϕ(t)k−1= 1
ist, falls k > 1. Fur k = 1 ahnlich mit Logarithmus. Mit Standard-Umformungen erhalt
man mit Anfangswert ϕ(0) = x1
ϕ(t) =
x1e−t k = 1
x1k−1√
1+(k−1)xk−11 t)
k > 1
Fur x1 > 0 oder k ungerade, existiert die Losung fur alle t ∈ [0,∞) und sie konvergiert
gegen 0. Fur k gerade und x1 < 0 existiert die Losung nur endlich lange. Deswegen ist 0
ein Attraktor, falls k ungerade, und 0 ist nicht einmal stabil, falls k gerade ist.
Ein passendes Bild
Definition 11.4. Die Linearisierung von v in x0 ∈ U ist die Abbildung Dx0v : Rn → Rn,
x 7→ v′(x0)x.
Idee der folgenden Resultate: die Flusslinien (= Integralkurven) des Vektorfelds v sehen
”ahnlich“ aus wie wie Flusslinien der Linearisierung. Das Phasenportrait in einer kleinen
31Hier ware eigentlich ein Beweis notig, zu dem wir keine Zeit mehr haben: Falls A diagonalisierbar
ist, dann ist jede Losung eine Linearkombination von Losungen der Form etλ0ϕ0, mit Aϕ=λ0ϕ0. Wenn
A nicht diagonalisierbar ist, ist die Argumentation ahnlich.
11. STABILITAT UND VERHALTEN IN DER NAHE VON KRITISCHEN PUNKTEN 451
Umgebung des kritischen Punkt ist eine”verbogene“ Version des Phasenportraits der
Linearisierung.
THEOREM 11.5 (Poincare-Ljapunow). Sei x0 ein kritischer Punkt von des C1-Vektorfelds
v : U → Rn. Fur jeden komplexen Eigenwert λ der Matrix v′(x0) gelte Re λ < 0. Dann
ist x0 ein Attraktor.
Beweis. Siehe [23], Abschnitt 4.5.
Definition 11.6. Eine Ljapunow-Funktion zum C1-Vektorfeld v : U → Rn und zum
kritischen Punkt x0 ist eine C1-Funktion L : U → R, so dass 32
• L(x0) = 0
• L(x) > 0, falls x ∈ U r {x0}
• Fur alle x ∈ U gilt: ∂x,v(x)L ≤ 0. Oder es gilt fur alle x ∈ U : ∂x,v(x)L ≥ 0
Beispiel: Ist E eine Erhaltungsgroße, die in x0 ein absolutes Minimum hat, so ist E−E(x0)
eine Ljapunow-Funktion.
Konsequenz: Ist ϕ eine Flusslinie von v, dann gilt
d
dtL(ϕ(t)) = L′(ϕ(t))ϕ′(t) = ∂ϕ(t),v(ϕ(t))L ≤ 0 bzw. ≥ 0
THEOREM 11.7 (Ljapunow). Sei v, x0 und L wie oben.
(a) Falls ∀x ∈ U : ∂x,v(x)L ≤ 0, dann ist x0 ein stabiler Punkt.
(b) Falls ∀x ∈ U r {x0} : ∂x,v(x)L < 0, dann ist x0 ein Attraktor
(c) Falls ∀x ∈ U r {x0} : ∂x,v(x)L > 0, dann ist x0 kein stabiler Punkt.
32Im folgenden ist ∂x,vf wieder die Richtungsableitung von f im Punkt x in Richtung v.
452 10. GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
Beweis. Siehe [23], Abschnitt 4.5.
Beispiel 11.8. Die Lienardsche Gleichung, siehe [23], Ende Abschnitt 4.5.
THEOREM 11.9 (Linearisierungssatz von Grobman und Hartman, 1959–1960). Sei x0
ein kritischer Punkt eines stetig differenzierbaren Vektorfelds v : U → Rn. Wir nehmen
an, dass fur jeden Eigenwert λ von v′(x0) gilt: Reλ 6= 0. Sei Dx0v : Rn → Rn die
Linearisierung von v in x0. Dann gibt es eine offene Umgebung V von x0 in U , eine offene
Umgebung W von 0 und einen Homoomorphismus h : V → W , h(x0) = 0, so dass gilt
ϕ : (a, b)→ V ist Flusslinie zu v
⇐⇒ h ◦ ϕ : (a, b)→ W ist Flusslinie zu Dx0v
Der Homoomorphismus h bildet Flusslinien auf Flusslinien ab. Die Flusslinien der Linea-
risierung sind die Abbildungen t 7→ eAtϕ0 mit ϕ0 ∈ Rn, A := v′(x0).
Wir bekommen also
ϕ(t) = h−1(eAth(ϕ(0)))
vorausgesetzt wir sind”nahe genug“ bei x0.
Wenn man das Theorem von Grobman und Hartman liest, so stellt sich die Frage, ob
man nicht das Wort”Homoomorphismus“ durch
”Ck-Diffeomorphismus“ ersetzen kann,
sobald v genugend oft differenzierbar ist.
Man kann zeigen (siehe Abschnitt 2.9 von [28] fur mehr Details):
• Ist v ∈ C2, so gibt es einen C1-Diffeomorphismus h mit den obigen Eigenschaften.
• Es gibt Vektorfelder v ∈ C∞, fur die es keinen C2-Diffeomorphismus h mit den
obigen Eigenschaften gibt
ANHANG A
Mehr Details zu den Grundlagen der Logik
1. Das Russellsche Paradoxon
(Auch Russellsche Antinomie genannt. Vorlaufer sind die Cantorsche Antinomie und das
Burali-Forti-Paradoxon, siehe Wikipedia.)
Am Anfang der Vorlesung haben wir gesagt, dass unser Ziel ist, eine axiomatisch aufge-
baute Mathematik zu erhalten. Diesem Anspruch sind wir bisher nicht gerecht geworden.
Immer wieder wurde die Intuition genutzt, um Objekte zu definieren, anstatt wirklich
saubere mathematische Definitionen hinzuschreiben. Das Vorgehen war bis weit ins 19.
Jahrhundert ganz ahnlich. Das intuitive Verwenden des Mengenbegriffs fuhrte dann aber
zu dem Russellschen Paradoxon.
Frage 1.1. Gibt es die Menge aller Mengen?
Stand der Mathematik gegen Ende des 19. Jahrhunderts: Nach Cantors Beschreibung
(Beschreibung 3.1) sollte es die MengeM aller Mengen geben. Das Elementzeichen ∈ ist
dann eine auf E×M definierte Aussageform, wobei E die Menge aller Elemente irgendeiner
Menge bezeichne, also E =⋃M.
453
454 A. MEHR DETAILS ZU DEN GRUNDLAGEN DER LOGIK
E ×M −→ {w, f}
(x,M) 7→ x ∈M
Russell bildete nun daraus
N := {x ∈M | x 6∈ x}.
Gilt nun N ∈ N ? Fur alle Mengen x gilt
x ∈ N ⇐⇒ x 6∈ x
und wenn wir x := N setzen, so erhalten wir
N ∈ N ⇐⇒ N 6∈ N .
Aussagen in der Form A↔ ¬A sind aber immer falsch, also haben wir einen Widerspruch
erhalten.
Um die Mengenlehre und somit die Mathematik sauber auf Axiomen aufzubauen, mussen
wir also viel genauer als bisher vorgehen und intuitive Argumente durch formal korrekte
Beweise ersetzen.
Wie lost man dieses Paradoxon auf: Nicht jede”Zusammenfassung von bestimmten wohl-
unterschiedenen Objekten“ ist eine Menge. Die Axiome sollen regeln, wann solche eine
Zusammenfassung eine Menge ist. Insbesondere ist die”Zusammenfassung“ M aller Men-
gen selbst keine Menge, sondern etwas großeres, das wir Klasse nennen wollen. Analog
sind auch N und E keine Mengen, sondern Klassen.
2. AXIOMATISCHE MENGENLEHRE 455
2. Axiomatische Mengenlehre
Wir wollen nun skizzieren, wie man die Mengenlehre sauber auf Axiomen aufbauen kann.
Man nimmt hierzu mehrere Axiomen an, all diese Axiome zusammen nennt man dann
ein Axiomen-System. Historisch sind hier wichtige Fortschritte zu Ende zu 19. Jahrhun-
derts und zu Beginn des 20. Jahrhunderts gemacht worden. Nun haben verschiedene
Mathematiker verschiedene Axiomensysteme entwickelt und benutzt. Das wohl bekann-
teste Axiomensystem heißt ZFC nach den Mathematikern Zermelo und Fraenkel und C
fur”Axiom of Choice“ (= Auswahlaxiom). Wir stellen ein anderes vor (NBG), das sehr
ahnliche Eigenschaften hat. Man kann zeigen, dass man mit ZFC und NBG dieselben
Satze uber Mengen herleiten kann. Die Axiome von ZFC machen oft rein mengentheore-
tische Argumente einfacher, wahrend die Axiome von NBG fur das praktische Arbeiten
oft besser geeignet sind.
Grundlegende Ideen:
• Man will gar nicht mehr erklaren, was eine Menge ist, sondern fordert axiomati-
sche Eigenschaften fur Mengen.
• Man nimmt an, dass auch alle Elemente von Mengen ebenfalls Mengen sind. In
anderen Worten: jede Menge ist ein Mengensystem uber einer geeigneten Menge.
In der Notation des letzten Abschnitts gilt also nun M = E . Die Zusammenfas-
sung aller Regensburger Autos ist dann keine Menge. Der Satz”Es existiert kein
Auto“ ist also in einer streng axiomatisch aufgebauten Vorlesung uber Logik und
Mengenlehre eine wahre Aussage, denn ein Auto ist ja keine Menge von Mengen.
• Trotz dieser Einschrankungen kann man immer noch naturliche, ganze, rationale
und reelle Zahlen und vieles mehr als Mengen definieren. Die Zahl π ist also eine
456 A. MEHR DETAILS ZU DEN GRUNDLAGEN DER LOGIK
Menge, deren Elemente wieder Mengen sind, deren Elemente wieder Mengen sind,
. . . . Siehe dazu auch die Peano-Axiome in Abschnitt B in Kapitel”Zahlen“.
Die Axiome ubernehme ich aus [17], siehe auch [25]. Zum Vergleich zu ZFC verweise ich
auf [13].
AXIOME 2.1 (Axiome der Mengenlehre nach von Neumann, Bernays, Godel (NBG)).
• Es gibt zwei Sorten von Objekten, Mengen und Klassen. Außerdem gibt es noch
die Beziehung ∈, die besagt, wann eine Klasse das Element einer anderen Klasse
ist.
• Jede Menge ist eine Klasse.
• Alle Elemente von Klassen sind Mengen.
• Extensionalitat. Zwei Klassen sind genau dann gleich, wenn sie dieselben Ele-
mente enthalten.
• Komprehension. Ist C eine auf allen Mengen definierte Aussagenform, die nach
strikt festgelegten Regeln aufgebaut ist, die wir hier der Kurze halber nicht ge-
nauer diskutieren.1 Dann ist{x ist eine Menge
∣∣ C(x)}
eine Klasse.
• Die leere Klasse ∅ := {x ist eine Menge | x 6= x} ist eine Menge.
• Aussonderungsmengenaxiom. Jede Teilklasse einer Menge ist eine Menge.
Benutzt wurde hierbei die folgende Definition: Eine Klasse A ist eine Teilklasse
einer Klasse B, wenn jedes Element von A ein Element von B ist.
1Siehe hierzu [17] und [13]. Gemeint ist eine Aussagenform 1. Stufe, in der nicht uber Klassenvariable
quantifiziert wird.
2. AXIOMATISCHE MENGENLEHRE 457
• Paarmengenaxiom. Sind A und B Mengen, so ist auch {A,B} eine Menge.
• Vereinigungsaxiom. Ist A eine Menge, so ist auch⋃A :=
{x∣∣ ∃y ∈ A : x ∈ y
}eine Menge, die Vereinigungsmenge von A.
• Potenzmengenaxiom. Ist A eine Menge, so ist auch P(A) := {x | x ⊂ A} eine
Menge, die Potenzmenge von A.
• Fundierungsaxiom. Ist A 6= ∅, so gibt es ein x ∈ A mit x ∩ A = ∅.
• Ersetzungsaxiom.Sind X und Y Klassen und ist F eine funktionale”Relations-
klasse“2 mit D(F ) = X und B(F ) ⊂ Y . Ist die Teilklasse A ⊂ X eine Menge, so
ist auch B(F |A) eine Menge.
• Unendlichkeitsaxiom. Es gibt eine induktive Menge; eine Menge A heißt induktiv,
wenn ∅ ∈ A und wenn fur alle x ∈ A auch x ∪ {x} ∈ A ist.
• Auswahlaxiom. Sei I eine nicht-leere Menge und (Mi)i∈I eine Familie von nicht-
leeren Mengen. Dann ist∏
i∈IMi nicht die leere Menge.
Bemerkungen 2.2.
(a) Besonders interessant ist das Auswahlaxiom. Es folgt bereits aus den Axiomen zuvor,
dass∏
i∈IMi eine Menge ist. Falls I endlich ist, so gilt offensichtlich∏
i∈IMi 6= ∅. Fur
unendliche Indexmengen kann man aber∏
i∈IMi 6= ∅ im allgemeinen nicht aus den
anderen Axiomen herleiten. Wenn man es annimmt,”weiß“ man zwar, dass
∏i∈IMi
mindestens ein Element besitzt, es kann aber vorkommen, dass kein einziges Element
von∏
i∈IMi angegeben werden kann.
2Unter einer Relationsklasse verstehen wir eine Klasse, deren Elemente Paare sind. Man kann dann
die ublichen Begriffe einer Relation definieren, z.B.”funktional“, Definitionsbereich, Bild, etc.
458 A. MEHR DETAILS ZU DEN GRUNDLAGEN DER LOGIK
Es ist nun ganz lehrreich, zu untersuchen, welche Aussagen der Mathematik nur unter
Hinzunahme des Auswahlaxioms gezeigt werden konnen, und fur welche Aussagen, das
Auswahlaxiom notig ist. Angenommen wir hatten nur die Axiome bis zum Unendlich-
keitsaxiom. Dann kann man zeigen, dass das Auswahlaxiom aquivalent zur Aussage
”Jeder Vektorraum besitzt eine Basis“ ist.
Wenn wir das Auswahlaxiom annehmen, dann gibt es einen Vektorraum, der zwar
eine Basis besitzt, aber zugleich kann keine Basis angegeben werden.
Das Auswahlaxiom ist auch aquivalent zur Aussage:”Sind X und Y Mengen, dann
gibt es eine injektive Abbildung f : X −→ Y oder es gibt eine injektive Abbildung
f : Y −→ X“.
(b) Man kann aus den Axiomen der Mengenlehre nicht folgern, dass die Mengenlehre wi-
derspruchsfrei ist! (Zweiter Godelscher Unvollstandigkeitssatz). Die Mathematik be-
ruht auf der Annahme, dass die Axiome der Mengenlehre widerspruchsfrei sind.
(c) Es gibt Aussagen, von denen gezeigt werden kann, dass weder diese Aussage noch
die Negation dieser Aussage beweisbar ist. Die Cantorsche Kontinuumshypothese ist
solch eine Aussage:
”Sei M eine Menge, so dass es keine injektive Abbildung M −→ N gibt.
Dann gibt es eine injektive Abbildung R −→M .“
Solche Aussagen gibt es in jedem hinreichend großen logischen System (Erster Godel-
scher Unvollstandigkeitssatz).
Bemerkung 2.3. Das Auswahlaxiom ist”unabhangig“ von den anderen Axiomen der
Mengenlehre. Aufgrund der Nicht-Konstruktivitat und etwas ungewohnlicher Konsequen-
zen wird im Normalfall explizit angegeben, wenn ein Beweis das Auswahlaxiom verwendet.
2. AXIOMATISCHE MENGENLEHRE 459
Aus den obigen Axiomen kann man nun Schritt fur Schritt die ganze Mathematik heraus
herleiten.
ANHANG B
Die Peano-Axiome
1. Die Axiome und erste Konsequenzen
Die naturlichen Zahlen wurden von Dedekind (1888) und Peano (1889) axiomatisiert.
Siehe [17, Kapitel 3 und 4], [20], oder [13, Kapitel V] fur mehr Details.
AXIOME 1.1 (”Axiome“ der naturlichen Zahlen (Peano-Axiome)). Gegeben sei
• eine Menge N ,
• ein (ausgewahltes) Element in N , das wir 0 nennen,
• eine Abbildung s : N −→ N , x 7→ s(x), genannt die Nachfolger-Abbildung.
Wir sagen, dass (N, 0, s) die Peano-Axiome erfullt, falls gilt:
(P1) 0 6∈ B(s)
(P2) Die Abbildung s : N −→ N ist injektiv.
(P3) (Induktionsaxiom) Erfullt T ⊂ N die Bedingungen 0 ∈ T und s#(T ) ⊂ T , dann gilt
bereits T = N .
Wenn (N, 0, s) die Peano-Axiome erfullt, sagt man (N, 0, s) ist ein Modell der naturlichen
Zahlen.
461
462 B. DIE PEANO-AXIOME
PROPOSITION 1.2. Es gibt eine Menge N ein Element 0 ∈ N und eine Nachfolger-
Abbildung s : N −→ N , so dass (N, 0, s) die Peano-Axiome erfullt.
Beweis folgt unten.
PROPOSITION 1.3. Wenn (N , 0, s) und (N , 0, s) die Peano-Axiome erfullen, dann gibt
es eine bijektive Abbildung F : N −→ N , so dass F (0) = 0 und F ◦ s = s ◦ F .
Man sagt dann oft: (N , 0, s) und (N , 0, s) sind kanonisch isomorph.
Beweis spater.
Die letzte Gleichung schreibt man am besten als Diagramm, ein sogenanntes kommutatives
Diagramm
N N
N N
F
Fs s
Alles, was man ublicherweise mit naturlichen Zahlen macht (Addition, Multiplikation,
Teilbarkeit, Primzahlen, etc.) beruht letztendlich auf dem Tripel (N, 0, s) und den Peano-
Axiomen. Deswegen besagt Prop. 1.3, dass alle Eigenschaften von (N, 0, s) die man aus
den Peano-Axiomen herleiten kann, entweder in allen Modellen gelten oder in keinem.
Beispiele: In jedem Modell gibt es unendlich viele Primzahlen, n ist eine Zahl mit 4
Teilern in (N , 0, s) genau dann wenn F (n) eine Zahl mit 4 Teilern in (N , 0, s) ist. Es kann
uns also egal sein, welches Modell die naturlichen Zahlen beschreibt, wichtig sind allein
die Peano-Axiome.
1. DIE AXIOME UND ERSTE KONSEQUENZEN 463
Bemerkung 1.4. Sind die Peano-Axiome weitere Axiome? Oder eine Definition? Oder
Aussagen?
Es gibt hier zwei verschiedene Sichtweisen. Je nach Anwendung und Dozent wird die eine
oder andere bevorzugt.
(a) Die mengentheoretische Sichtweise: Die Peano-Axiome sind eine Definition.
Proposition 1.2 besagt: Es gibt mindestens ein Tripel (N, 0, s), das die Peano-Axiome
erfullt.
Und: Erfullen (N , 0, s) und (N , 0, s) die Peano-Axiome, so sind (N , 0, s) und (N , 0, s)
”im wesentlichen gleich“ (Proposition 1.3).
(b) Die axiomatische Sichtweise: wir wollen im mathematischen Teilgebiet”Theorie der
naturlichen Zahlen“ annehmen, dass es eine Menge N , ein 0 ∈ N und eine Nachfolger-
Abbildung gibt und nehmen die Peano-Axiome als Axiome dieses Teilgebiets.
Proposition 1.2 besagt dann, dass es ein mengentheoretisches Modell gibt, das die
Axiome erfullt. Wie dieses Modell aber aussieht, ist fur unsere weiteren Uberlegungen
irrelevant, da wir nur die Axiome fur weitere Schritte nutzen.
Beweis von Proposition 1.2. Wiederholung: eine Menge A heißt induktiv, wenn ∅ ∈ A
und wenn fur alle x ∈ A auch x ∪ {x} ∈ A ist.
Nach dem Unendlichkeitsaxiom gibt es eine induktive Menge A. Wir setzen 0 := ∅. Wir
definieren nun die Nachfolger-Abbildung
s : A −→ A, x 7→ x ∪ {x}.
Das Tripel (A, 0, s) erfullt offensichtlich (P1).
464 B. DIE PEANO-AXIOME
Fur (P2) muss etwas gearbeitet werden, wir beweisen die Injektivitat von s : A −→ A
mit einem Widerspruchsbeweis.
Angenommen die Abbildung sei nicht injektiv. Dies bedeutet:
(1.5) ∃x, y ∈ A : x 6= y ∧ s(x) = s(y)
Es folgt x ∪ {x} = y ∪ {y} und hieraus folgen wiederum die Aussagen
(1.6) x ∈ y ∨ x ∈ {y}
und
(1.7) y ∈ x ∨ y ∈ {x}.
Nun ist aber x ∈ {y} gleichbedeutend mit x = y und dies haben wir oben ausgeschlossen.
Somit erhalten wir aus (1.6) dann x ∈ y, und analog erhalten wir y ∈ x aus (1.7).
Wir definieren nun B := {x, y}. Wegen B 6= ∅ ergibt das Fundierungsaxiom die Existenz
eines b ∈ B mit b∩B = ∅. Im Fall b = x erhalten wir x∩ {x, y} ⊃ {y} also b∩B 6= ∅. Im
Fall b = y zeigen wir b ∩ B 6= ∅ analog. Wir haben einen Widerspruch erhalten, da wir
gleichzeitig b∩B 6= ∅ und b∩B = ∅ erhalten haben. Also war eine Annahme (1.5) falsch.
Wir haben mit einem Widerspruchsbeweis die Injektivitat von s gezeigt.
Es verbleibt aber unklar, ob (A, 0, s) auch (P3) erfullt.
Wir setzen nun
N :=⋂{B ∈ P(A) | B ist induktiv}.
Der Schnitt dieser induktiven Mengen ist wieder induktiv. Das Tripel (N, 0, s|N) erfullt
offensichtlich (P1) und (P2). Erfullt T die Voraussetzungen in (P3), so ist T induktiv und
es gilt T ∈ P(N) ⊂ P(A). Also folgt N ⊂ T , somit T = N . Wir erhalten (P3).
1. DIE AXIOME UND ERSTE KONSEQUENZEN 465
Beispiel 1.8. Die Konstruktion liefert dann 0 = ∅, 1 = s(0) = {∅}, 2 = s(1) = {∅, {∅}},
3 = s(2) = {∅, {∅}, {∅, {∅}}}.
PROPOSITION 1.9. Jede naturliche Zahl ungleich 0 ist der Nachfolger genau einer
naturlichen Zahl.
Beweis (Direkter Beweis). Wir wissen bereits, dass jede naturliche Zahl der Nachfolger
hochstens einer naturlichen Zahl ist. Zu zeigen bleibt also, dass jede naturlichen Zahl n
ungleich 0 Nachfolger einer naturlichen Zahl ist. Wir definieren:
U := {n ∈ N |n ist Nachfolger einer naturlichen Zahl}
und dann
T := U ∪ {0}.
Die Menge T erfullt die Eigenschaften im Peano-Axiom (P3): 0 ist in T , und wenn n in
T enthalten ist, dann ist n eine naturliche Zahl, und somit ist s(n) eine naturliche Zahl,
die Nachfolger einer naturlichen Zahl ist. Somit ist s(n) in T . Axiom 3 besagt also, dass
T gleich N ist. Daraus folgt U = N oder U = N r {0}. Also ist jede Zahl ungleich 0
Nachfolger einer naturlichen Zahl. Man kann den Beweis auch anders fuhren, als
sogenannten Widerspruchsbeweis.
Beweis (Widerspruchsbeweis). Wir nehmen an, die Aussage des Lemmas ist falsch,
und wollen daraus einen Widerspruch herleiten. Wenn die Aussage des Lem-
mas falsch ist, dann konnen wir annehmen: Es gebe eine naturliche Zahl n ungleich
0, die nicht Nachfolger einer naturlichen Zahl ist. Wir definieren T := Nr{n}. Die Menge
T enthalt 0, da n 6= 0. Ist t ∈ T , so ist t auch eine naturliche Zahl und somit ist auch der
Nachfolger s(t) eine naturliche Zahl. Da n kein Nachfolger einer naturlichen Zahl ist, folgt
466 B. DIE PEANO-AXIOME
s(t) 6= n und somit s(t) ∈ T . Die Menge T erfullt also die Eigenschaften in Peano-Axiom
(P3) und somit gilt T = N . Zusammen mit n ∈ N und n 6∈ T ergibt sich ein Wider-
spruch. Da die Existenz einer Zahl n mit den obigen Eigenschaften zu einem
Widerpruch fuhren wurde, wissen wir, dass es ein solches Gegenbeispiel nicht
gibt, und die Aussage des Lemmas ist somit bewiesen.
2. Vollstandige Induktion und rekursive Definition
In diesem Abschnitt nehmen wir an, dass (N, 0, s) die Peano-Axiome erfullt. Die Addition
+ ist noch nicht definiert! Wir schreiben 1 fur s(0), 2 fur s(1) etc.. Die Notation n+ 1 ist
im Sinne von s(n) zu lesen.
SATZ 2.1 (Vollstandige Induktion). Sei A( · ) eine auf N definierte Aussageform. Wir
setzen voraus, dass Induktionsanfang und Induktionsschritt erfullt sind:
Induktionsanfang: A(0) ist wahr.
Induktionsschritt: Fur alle n ∈ N gilt: (A(n) =⇒ A(n+ 1))).
Dann gilt fur alle n ∈ N die Aussage A(n).
Im Induktionsschritt nennt man A(n) die Induktionsvoraussetzung.
Beweis. Sei
T := {n ∈ N | A(n)}.
Auf Grund des Induktionsanfangs ist 0 in T . Der Induktionsschritt besagt: wenn n ∈ T ,
dann ist auch n+1 in T . Die Menge T erfullt also die Eigenschaften in Peano-Axiom (P3)
und somit gilt T = N .
Viele Variation hiervon, z.B.
2. VOLLSTANDIGE INDUKTION UND REKURSIVE DEFINITION 467
SATZ 2.2 (Vollstandige Induktion, Starke Version). Sei A(n) eine auf N definierte Aus-
sage. Wir setzen voraus, dass Induktionssanfang und der modifizierte Induktionsschritt
erfullt sind:
Induktionsanfang: A(0) ist wahr.
Modifizierter Induktionsschritt: Fur alle n ∈ N gilt: Aus A(0) ∧ A(1) ∧ . . . ∧ A(n) folgt
A(n+ 1)).
Dann gilt fur alle n ∈ N die Aussage A(n).
Beweis. Ubungsblatt 4, Aufgabe 4
SATZ 2.3 (Dedekindscher Rekursionssatz). Sei M eine Menge, a ∈M und g : M×N −→
M eine Abbildung. Dann gibt es genau eine Abbildung f : N −→ M so dass f(0) = a
und
∀n ∈ N : f(s(n)) = g(f(n), n).
Naturlich kann man hier auch wieder n+ 1 statt s(n) schreiben.
Wenn eine Abbildung auf diese Art und Weise definiert wird, nennen wir dies eine rekursive
Definition.
Beweis. Wir beweisen zunachst durch vollstandige Induktion die folgende Aussage A(n),
n ∈ N :
Es gibt eine eindeutige1 Abbildung fn : {0, 1, 2, . . . , n} −→M mit den Eigenschaften2
fn(0) = m und ∀i ∈ {0, 1, 2, . . . , n− 1} : fn(i+ 1) = g(fn(i), i).
1”eindeutig“ bedeutet: es gibt so eine Funktion, und dies ist die einzige Funktion, die das erfullt!
2Man muss sich an dieser Stelle eigentlich Gedanken machen, was hier mit {0, 1, 2 . . . , n} gemeint ist.
Es ist die Menge Kn mit den Eigenschaften
468 B. DIE PEANO-AXIOME
Induktionsanfang: n = 0. Die Abbildung f0 : {0} −→ M , 0 7→ m ist solch eine
Abbildung. Und es ist offensichtlich die einzige.
Induktionsschritt:
Induktionsvoraussetzung: A(n)
Also wir haben eine Abbildung fn wie oben.
Wir definieren dann
fn+1(i) :=
fn(i) falls i ∈ {0, 1, 2, . . . , n},
g(fn(n), n) falls i = n+ 1.
Diese Abbildung erfullt die in A(n + 1) genannte Eigenschaft und man sieht leicht, dass
es die einzige ist.
Wir setzen nun: f(n) := fn(n). Die so definierte Abbildung f : N −→ M erfullt die
Eigenschaften des Satzes.
Wir konnen nun Proposition 1.3 zeigen.
Beweis von Prop. 1.3. Wir definieren rekursiv F (1) = 1 und fur n ∈ N : F (s(n)) =
s(F (n)). Dies ergibt eine Abbildung F : N −→ N . Analog definiert man eine G : N −→ N
durch G(1) = 1 und G(s(n)) = s(G(n)). Man zeigt nun durch Induktion G◦F = ∆N und
F ◦ G = ∆N , d.h. G : N −→ N ist die Umkehrfunktion von F : N −→ N und somit ist
(1) 0 ∈ Kn,
(2) s#(Kn r {n}) ⊂ Kn,
(3) Ist T eine Menge mit 0 ∈ T und s#(T r {n}) ⊂ T , dann gilt Kn ⊂ T .
Dann ist zu zeigen dass s(n) 6∈ Kn und Kn+1 = Kn ∪ {s(n)}. Man sieht also, dass Kn genau das ist, was
wir uns unter {0, 1, 2, . . . , n} vorstellen.
2. VOLLSTANDIGE INDUKTION UND REKURSIVE DEFINITION 469
F : N −→ N bijektiv. Die ubrigen Eigenschaften dieser Abbildung folgen direkt aus der
Definition von F .
Aus Proposition 1.3 folgt: alles was wir fur aus den Peano-Axiomen heraus fur (N, s, 0)
zeigen, gilt auch fur (N ′, s′, 0′). Es ist also unerheblich, welches Modell wir nutzen. Wir
nehmen nun eines her und schreiben ab sofort N an Stelle von N , n 7→ n + 1 an Stelle
von s und weiterhin 0. Wir nennen N die Menge der naturlichen Zahlen.
Beispiele 2.4.
(1) Addition: Sei M = N, g(m,n) := s(m), a ∈ N. Wir erhalten eine Abbildung
αa : N −→ N mit αa(0) = a und mit ∀n ∈ N : αa(s(n)) = s(aa(n)). Wir
schreiben a + n := αa(n). Fur n = 1 stimmt dies mit der bisherigen Definition
von a+ 1 uberein.
(2) Multiplikation: Sei M = N, i ∈ N, g : N×N −→ N, (m,n) 7→ m+ i. Wir erhalten
eine Abbildung µi : N −→ N mit µi(0) = 0 und mit ∀n ∈ N : µi(s(n)) = µi(n)+i.
Wir schreiben i ·m := µi(m).
(3) Potenzieren: Sei M = N, i ∈ N, g : N × N −→ N, (m,n) 7→ m · i. Wir erhalten
eine Abbildung pi : N −→ N mit pi(0) = 1 und mit ∀n ∈ N : pi(s(n)) = pi(n) · i.
Wir schreiben im := pi(m).
(4) Fakultat: Sei M = N, g : N × N −→ N, (m,n) 7→ (n + 1) · m. Wir definieren
dadurch die Abbildung ! : N −→ N durch 0! := 1 und (m + 1)! := m! · (m + 1).
Also n! = 1 · 2 · · · · · n.
SATZ 2.5. (N,+, ·) erfullt die folgenden Eigenschaften:
470 B. DIE PEANO-AXIOME
(Aa) Addition ist assoziativ.
Fur alle x, y, z ∈ N gilt
(x+ y) + z = x+ (y + z).
(An) Addition hat neutrales Element.
Es gibt ein Element 0 ∈ N, so dass fur alle x ∈ N gilt
x+ 0 = 0 + x = x.
(Ak) Addition ist kommutativ.
Fur alle x, y ∈ N gilt
x+ y = y + x.
(Ma) Multiplikation ist assoziativ.
Fur alle x, y, z ∈ N gilt
(x · y) · z = x · (y · z).
(Mn) Multiplikation hat neutrales Element.
Es gibt ein Element 1 ∈ N, so dass fur alle x ∈ N gilt
x · 1 = 1 · x = x.
(Mk) Multiplikation ist kommutativ.
Fur alle x, y ∈ N gilt
x · y = y · x.
(AMd) Addition und Multiplikation erfullen das Distributivgesetz.
Fur alle x, y, z ∈ N gilt
x · (y + z) = x · y + x · z
2. VOLLSTANDIGE INDUKTION UND REKURSIVE DEFINITION 471
(y + z) · x = y · x+ z · x
Den Beweis kann man mit vollstandiger Induktion durchfuhren, die wir im nachsten Ab-
schnitt kennenlernen werden. Es ist eine gute Ubung, einmal die Kommutativitat der
Addition durch vollstandige Induktion oder direkt aus den Peano-Axiomen herzuleiten.
Dies ist etwas muhsam, aber prinzipiell moglich.
Offensichtlich ist 0 die einzige Zahl, die an Stelle von 0 die obige Eigenschaft erfullt. Wir
nennen 0 = 0 das neutrale Element der Addition. Analoges gilt fur 1 und 1, und man
nennt 1 = 1 das neutrale Element der Multiplikation.
LEMMA 2.6 (Kurzungsregel). Seien n,m, k ∈ N mit n + k = m + k. Dann gilt auch
m = n.
In anderen Worten
∀n,m, k ∈ N : n+ k = m+ k =⇒ m = n.
Der Beweis folgt durch Induktion nach k (wird nicht im Detail ausgefuhrt).
LEMMA 2.7. Jede von 0 verschiedene naturliche Zahl ist Nachfolger einer naturlichen
Zahl.
Beweis. Angenommen k ∈ N, k 6= 0 und k 6∈ s#(N). Definiere T := N r {k}. Dann gilt
0 ∈ T und s#(T ) ⊂ T und somit erhalten wir den Widerspruch T = N.
LEMMA 2.8. Sind n,m ∈ N. Es gelte n+m = 0. Dann gilt n = m = 0.
472 B. DIE PEANO-AXIOME
Beweis. (Widerspruchsbeweis) Wir nehmen an, dass n 6= 0 oder m 6= 0. Da der Fall
m 6= 0 ganz analog zum Fall n 6= 0, genugt es den Fall n 6= 0 zu betrachten. 3 Dann gibt
es eine Zahl k ∈ N mit n = s(k). Es folgt 0 = s(k) + m = s(k + m), was der Tatsache
widerspricht, dass 0 kein Nachfolger einer naturlichen Zahl ist.
Hier gabe es noch viel hinzuzufugen. Deswegen wird der Anhang evtl. hier noch erweitert.
3. Ordnung der naturlichen Zahlen
Wir definieren nun eine Relation:
≤:= {(n,m) ∈ N× N | ∃k ∈ N : m = n+ k}.
LEMMA 3.1. Diese Relation ≤ ist eine totale Ordnung auf N. Es gilt:
(1) Reflexivitat auf N: Fur alle m in N ist m ≤ m wahr.
(2) Antisymmetrie: Fur alle n und m in N gilt
n ≤ m ∧m ≤ n =⇒ n = m.
(3) Transitivitat: Fur alle n, m und k in N gilt:
n ≤ m ∧m ≤ k =⇒ n ≤ k.
(4) Totalitat: Fur alle n und m in N gilt
n ≤ m ∨m ≤ n
3Da Satze in dieser Art oft vorkommen, sagt man”Ohne Beschrankung der Allgemeinheit (OBdA)
gilt n 6= 0.“
3. ORDNUNG DER NATURLICHEN ZAHLEN 473
(5) Fur alle n ∈ N gilt n ≤ n+ 1.
Beweis. Aussagen (1), (3) und (5) sind offensichtlich.
Zu (2) (Antisymmetrie): Es gelte n ≤ m und m ≤ n. Dann gibt es k1, k2 ∈ N mit
m = n+ k1 und n = m+ k2. Daraus folgt
n = m+ k2 = n+ k1 + k2.
Mit der Kurzungsregel (Lemma 2.6) folgt k1 + k2 = 0 und mit Lemma 2.8 ergibt sich
k1 = k2 = 0. Also n = m.
Zu (4) (Totalitat): Zu n ∈ N definieren wir
Tn := {m ∈ N | m ≤ n ∨ n ≤ m}.
Man zeigt mit etwas Aufwand 0 ∈ Tn und s#(Tn) ⊂ Tn. Mit (P3) folgt Tn = N, also die
Behauptung.
Definition 3.2. Sei R eine (partielle) Ordnungsrelation auf M . Ein Minimum (bezie-
hungsweise Maximum) ist ein Element m ∈ M , so dass fur alle n ∈ M gilt: mRn (bzw.
nRm).
Bemerkung. Wegen der Antisymmetrie gibt es hochstens ein Minimum.
Beispiele: Das offene Intervall ]0, 1[ in R hat kein Minimum bezuglich ≤.
Die Menge M := {{a}, {b}, {a, b}} tragt die Ordnungsrelation ⊂. Es existiert kein Mini-
mum in M .
PROPOSITION 3.3 (Wohlordnung von N). Sei A eine nichtleere Teilmenge von N, dann
besitzt A ein Minimum.
474 B. DIE PEANO-AXIOME
Beweis. Wir nehmen an, A besaße kein Minimum. Definiere
T := {n ∈ N | ∀k ∈ A : k > n}
= {n ∈ N | ∀k ∈ N : (k ≤ n =⇒ k 6∈ A)}
= {n ∈ N | ¬(∃k ∈ N : (k ≤ n ∧ k ∈ A))}.
Offensichtlich gilt 0 ∈ T : denn wenn 0 /∈ T ware, dann gabe es ein k ∈ N mit k ≤ 0 und
k ∈ A, also 0 ∈ A; und dann ware 0 ein Minimum von A.
Wir zeigen nun
(3.4) (n ∈ T ) =⇒ (n+ 1 ∈ T ).
Daraus folgt dann mit (P3) die Aussage T = N, also A = ∅.
Um (3.4) zu zeigen, nehmen wir an, es gebe ein n ∈ T mit n+ 1 6∈ T . Daraus folgt dann
n + 1 ∈ A, und aus n ∈ T folgt mit der Totalitat dann, dass n + 1 ein Minimum von A
ist. Dies ist ein Widerspruch zur obigen Annahme.
4
4Alternativer Beweis: Wir nehmen an, A besitze kein Minimum. Zu zeigen ist, dass A die leere Menge
ist. Wir zeigen induktiv die Aussage
P (n) :⇐⇒ {0, 1, 2, . . . , n} ∩A = ∅,
woraus die Aussage folgt.
Induktionsanfang: Angenommen 0 ware in A. Dann ist 0 das Minimum. Da es aber kein Minimum in A
gibt, folgt 0 6∈ A, also P (0).
Induktionsschritt: Es gelte P (n). Falls n + 1 ∈ A, so ist n + 1 ein Minimum von A. Da es aber kein
Minimum gibt, gilt n+ 1 6∈ A, und somit P (n+ 1).
3. ORDNUNG DER NATURLICHEN ZAHLEN 475
Bemerkung 3.5. Sei R eine totale Ordnung auf einer Menge M . Wir sagen, R ist eine
Wohlordnung oder (M,R) ist eine wohlgeordnete Menge, wenn jede nicht-leere Teilmenge
A ein Minimum besitzt. Die letzte Proposition besagt also, dass (N,≤) wohlgeordnet ist.
Hingegen ist (R,≤) nicht wohlgeordnet. Man kann aber zeigen:
Zu jeder Menge M gibt es eine Wohlordnung auf M .
Diese Aussage ist zum Auswahlaxiom aquivalent, wenn wir die ubrigen Axiome der Men-
genlehre annehmen.
ANHANG C
Konstruktion von R mit Hilfe von Cauchy-Folgen
In diesem Anhang stellen wir eine alternative Moglichkeit dar, ein Modell fur die reellen
Zahlen zu konstruieren, namlich mit Hilfe von Cauchy-Folgen. Wenn man die Einfuhrung
von Cauchy-Folgen in diesem Anhang mit der Einfuhrung im Hauptteil in Abschnitt 1.6
vergleicht, so sieht man, dass wir in diesem Anhang einige Eingeschaften explizit prufen
mussen, die im Hauptteil aus den im Abschnitt 6 behandelten Aussagen folgen. In Ab-
schnitt 1.6 setzen wir voraus, dass wir bereits wissen, was R ist und dass jeder archimedisch
geordnete Korper Teilkorper von R ist. Auch die Definition einer Cauchy-Folge muss leicht
angepasst werden. 1
1. Mehr zu Aquivalenzrelationen
Wir besprechen hier Aquivalenzrelationen noch etwas detailierter als zuvor. Derartige
Sachverhalte wurden bereits in der Linearen Algebra I im Detail behandelt. Wir wieder-
holen sie in der Zentralubung am 26.11.2013, u.a. um sicherzustellen, dass auch diejenigen
folgen konnen, die die Lineare Algebra I nicht horen.
1Dieser Teil wurde von meinem fruheren Skript der Vorlesung im Wintersemester 2013/14 ubernom-
men. Leider konnen kleinere ubernahmebedingten Druckfehler nicht ganz ausgeschlossen werden. Auch
werden manche Themen der Hauptvorlesung hier potentiell verdoppelt.
477
478 C. KONSTRUKTION VON R MIT HILFE VON CAUCHY-FOLGEN
UBUNG 1.1. Seit f : M −→ N eine Abbildung. Wir definieren
Rf := {(x, y) ∈M ×M | f(x) = f(y)}.
Zeigen Sie, R ist eine Aquivalenzrelation.
Sei R eine Aquivalenzrelation auf M .
Fur x ∈M definieren wir die Aquivalenzklasse von x als
[x] := {y ∈M | xRy}.
Man sagt auch x ist ein Reprasentant von [x] oder x reprasentiert [x].
UBUNG 1.2. Zeigen Sie, dass fur alle x, y ∈M gilt:
(a)
y ∈ [x]⇐⇒ [x] = [y]
(b)
[x] = [y] Y [x] ∩ [y] = ∅.
UBUNG 1.3. Sei Rf wie oben definiert. Bestimmen Sie die Aquivalenzklassen.
Ist R eine Aquivalenzrelation auf M , so definieren wir den Quotient von M nach R als
M/R := {[x] | x ∈M}.
Die Abbildung [ · ] : M →M/R, x 7→ [x] nennt man die kanonische Projektion.
1. MEHR ZU AQUIVALENZRELATIONEN 479
UBUNG 1.4. Sei eine Abbildung F : M −→ X gegeben und R eine Aquivalenzrelation
auf M . Zeigen Sie, es gibt genau dann eine Abbildung F : M/R −→ X, so dass F ◦[ · ] = F ,
falls fur alle x, y ∈M gilt
xRy =⇒ F (x) = F (y).
Die Abbildung F : M/R −→ X ist daraus eindeutig bestimmt.
M X
M/R
F
[ · ]F
Gilt sogar
xRy ⇐⇒ F (x) = F (y),
dann wissen wir noch zusatzlich, dass F injektiv ist.
Beispiel: Sei f : M −→ N , Rf wie oben. Dann gibt es eine eindeutige Abbildung f :
M/Rf −→ N , so dass
M N
M/Rf
f
[ · ]f
kommutiert. Außerdem ist f injektiv. Wir erhalten eine bijektive Abbildung f : M/Rf −→
B(f).
480 C. KONSTRUKTION VON R MIT HILFE VON CAUCHY-FOLGEN
2. Folgen, Konvergenz und Cauchy-Folgen
Wenn wir die reellen Zahl uber Cauchy-Folgen konstruieren wollen, so benotigen wir
Begriffe wie Konvergenz, Cauchyfolgen und ahnliche fur beliebige archimedisch geordnete
Korper. Wir durfen ja insbesondere nicht nutzen, dass jeder solche Korper ein Unterkorper
von R ist. Deswegen mussen wir in großen Teilen unsere Einfuhrung in Folgen und Reihen
nochmals in etwas großerer Allgemeinheit wiederholen.
Wir schreiben im folgenden zumeist K fur einen geordneten Korper (K,+, ·,≤). Und
|a| ∈ K≥0 sei (wie immer) der Betrag von a ∈ K.
Definition 2.1. Eine K-wertige Folge (ai)i∈N heißt beschrankt2 ,
:⇐⇒ {ai | i ∈ N} ist (nach oben und unten) beschrankt in K
⇐⇒ ∃r1, r2 ∈ K : ∀i ∈ N : r1 ≤ ai ≤ r2
⇐⇒ ∃r ∈ K : ∀i ∈ N : |ai| ≤ r
⇐⇒ {|ai| | i ∈ N} ist beschrankt in K
Bemerkung 2.2. Falls K archimedisch ist, so gilt auch:
(ai)i∈N ist beschrankt in K ⇐⇒ ∃n ∈ N : ∀i ∈ N : |ai| ≤ n.
Die Implikation ⇐= ist klar, und =⇒ folgt direkt aus der archimedischen Eigenschaft
2Wenn man hier ganz exakt sein will, sollte man hier besser”beschrankt in K“ oder
”K-beschrankt“
sagen, denn ob eine Folge beschrankt ist, hangt von K ab. Beispiel: Die Folge (i)i∈N ist unbeschrankt
in Q, aber beschrankt im Korper der rationalen Funktionen mit rationalen Koeffizienten. Sind aber K1
und K2 archimedische geordnete Korper, so sieht man mit der unten stehenden Bemerkung, dass K1-
Beschranktheit und K2-Beschranktheit die gleiche Bedeutung haben.
2. FOLGEN, KONVERGENZ UND CAUCHY-FOLGEN 481
Definition 2.3 (Konvergenz von Folgen). Eine K-wertige Folge (ai)i∈N konvergiert 3
gegen a ∈ K, falls gilt
∀ε ∈ K>0 : ∃i0 ∈ N : ∀i ∈ N : (i ≥ i0 =⇒ |ai − a| ≤ ε).
Man nennt a den Grenzwert der Folge (ai)i∈N und schreibt a = limi→∞ ai oder ai → a
fur i→∞. Wir sagen (ai)i∈N konvergiert, falls es ein derartiges a ∈ K gibt. Folgen, die
gegen 0 konvergieren, nennt man Nullfolgen. Falls eine Folge nicht konvergiert, so sagen
wir dazu sie divergiert.
!ACHTUNG!. Wenn wir a = limi→∞ ai schreiben, so bedeutet dies immer:
• der Grenzwert existiert, und
• der Grenzert ist a.
Bemerkungen 2.4.
(a) Falls eine Folge einen Grenzwert besitzt, so ist dieser eindeutig bestimmt. Seien a und
a′ zwei Grenzwerte von (ai)i∈N. Zu einem gegebenen ε ∈ K>0 gilt also:
∃i0 ∈ N : ∀i ∈ N : (i ≥ i0 =⇒ |ai − a| ≤ ε).
∃i′0 ∈ N : ∀i ∈ N : (i ≥ i′0 =⇒ |ai − a′| ≤ ε).
3Wenn man hier ganz exakt sein will, sollte man hier besser”K-konvergiert“ sagen, denn ob eine
Folge konvergiert, hangt von K ab. Beispiel: Die Folge (1/i)i∈N Q-konvergiert in Q gegen 0, aber nicht
im Korper der rationalen Funktionen mit rationalen Koeffizienten. Sind aber K1 und K2 archimedische
geordnete Korper, so sieht man mit einer der unten stehenden Bemerkungen, dass K1-Konvergenz und
K2-Konvergenz die gleiche Bedeutung haben.
482 C. KONSTRUKTION VON R MIT HILFE VON CAUCHY-FOLGEN
Wahle nun so ein i0 und i′0. Dann gilt fur alle i ≥ max{i0, i′0}:
|a− a′| ≤ |a− ai|+ |ai − a′| ≤ ε+ ε = 2ε.
Dies gilt fur alle ε ∈ K>0. Angenommen wir haben a 6= a′, so gilt dies insbesondere
fur ε := |a − a′|/3 > 0. Also folgt 3ε ≤ 2ε und somit ergibt sich der Widerspruch
ε ≤ 0. Die Annahme a 6= a′ war also falsch, d.h. es gilt a = a′.
(b) Falls (ai)i∈N konvergiert, so ist (ai)i∈N beschrankt. Um dies zu zeigen, wahlen wir zu
ε := 1 ein passendes i0. Es gilt somit fur alle i ∈ N mit i ≥ i0:
|ai| ≤ |ai − a|+ |a| ≤ |a|+ 1.
Nun setzen wir
r := max{|a1|, |a2|, . . . , |ai0−1|, |a|+ 1}.
Dann gilt fur alle i ∈ N: |ai| ≤ r. Somit ist (ai)i∈N beschrankt.
(c) Ist K archimedisch, so gilt
a = limi→∞
ai ⇐⇒ ∀n ∈ N : ∃i0 ∈ N : ∀i ∈ N : (i ≥ i0 =⇒ |ai − a| ≤1
n).
Die Implikation =⇒ ist klar, und ⇐= folgt aus Lemma 2.5.
LEMMA 2.5. Ist K archimedisch, dann gibt es fur alle ε ∈ K>0 ein n ∈ N mit ε ≥ (1/n).
Beweis. Zu 1/ε ∈ K gibt es ein n ∈ N mit 1/ε ≤ n, und dies ist aquivalent zu ε ≥
(1/n).
Beispiele 2.6. (a) Eine Folge (ai)i∈N heißt konstant, falls a1 = a2 = a3 = . . .. Konstante
Folgen sind beschrankt und konvergieren. a1 = limi→∞ ai.
(b) Sei K = Q. Dann ist (1i)i∈N eine Nullfolge. (Nutze z.B. Bem. 2.4 (c) und setze i0 := n).
2. FOLGEN, KONVERGENZ UND CAUCHY-FOLGEN 483
(c) Die Folge((−1)i
)i∈N hat 1 als obere und −1 als untere Schranke und ist somit be-
schrankt. Wir werden bald sehen, dass sie nicht konvergiert.
Definition 2.7. Sei (ai)i∈N eine Folge von Elementen ai ∈ M . Sei f : N → N eine
Abbildung mit der Eigenschaft
∀i, j ∈ N : i < j =⇒ f(i) < f(j)
(Man sagt zu dieser Eigenschaft: f ist streng monoton wachsend.) Dann nennt man
(af(k))k∈N eine Teilfolge von (ai)i∈N.
Beispiel 2.8. Die Folge (i)i∈N hat folgende Teilfolgen:4
• sich selbst,
• die Folge der ungeraden Zahlen (1, 3, 5, 7, . . .),
• die Folge der Primzahlen (2, 3, 5, 7, . . .).
Konvergiert (ai)i∈N gegen a, so konvergiert jede Teilfolge ebenfalls gegen a.
LEMMA 2.9. Die Folge((−1)i
)i∈N aus Beispiele 2.6 (c) divergiert.
Beweis. Angenommen, die Folge((−1)i
)i∈N konvergiert gegen ein a ∈ K. Dann konver-
gieren auch die Teilfolgen((−1)2k
)k∈N = (1)k∈N und
((−1)2k+1
)k∈N = (−1)k∈N gegen a.
Da diese Teilfolgen konstant sind, erhalten wir a = 1 und a = −1, was in K nicht moglich
ist, denn es gilt ja −1 < 0 < 1.
4Diese Folge hat naturlich noch viel mehr Teilfolgen. U.a. gibt es sogar Teilfolgen, die man gar nicht
beschreiben kann. Wieso es nicht beschreibbare Teilfolgen gibt, kann erst spater erklart werden.
484 C. KONSTRUKTION VON R MIT HILFE VON CAUCHY-FOLGEN
UBUNG 2.10. Seien (ai)i∈N und (bi)i∈N konvergente Folgen. Dann gilt:
limi→∞
(ai + bi) = limi→∞
ai + limi→∞
bi
limi→∞
(ai − bi) = limi→∞
ai − limi→∞
bi
limi→∞
(ai · bi) = limi→∞
ai · limi→∞
bi
Gilt zusatzlich: ∀i ∈ N : bi 6= 0, und ist (bi)i∈N keine Nullfolge, so gilt auch
limi→∞
aibi
=limi→∞
ai
limi→∞
bi.
Die Beweise sind ahnlich wie in der folgenden Proposition.
Definition 2.11. Eine K-wertige Folge (ai)i∈N heißt Cauchy-Folge,5 falls
∀ε ∈ K>0 : ∃i0 ∈ N : ∀i, j ∈ N : (i ≥ i0 ∧ j ≥ i0) =⇒ |ai − aj| ≤ ε.
PROPOSITION 2.12.
(1) Jede konvergente Folge ist eine Cauchy-Folge.
(2) Jede Cauchy-Folge ist beschrankt.
(3) Seien (ai)i∈N und (bi)i∈N Cauchy-Folgen. Dann sind (ai + bi)i∈N, (ai − bi)i∈N und
(ai · bi)i∈N ebenfalls Cauchy-Folgen.
(4) Zusatzlich zu den Voraussetzungen in (3) gelte ∀i ∈ N : bi 6= 0, und die Folge (bi)i∈N
sei keine Nullfolge. Dann ist auch(aibi
)i∈N
eine Cauchy-Folge.
5Genau genommen musste man hier wieder sagen: eine K-Cauchy-Folge, da die Definition zuachst
von K abhangt. Die Bedeutung ist dann aber fur alle archimedischen Korper dieselbe.
2. FOLGEN, KONVERGENZ UND CAUCHY-FOLGEN 485
Um die Proposition zu zeigen, nutzen wir ein Lemma.
LEMMA 2.13. Sei A( · ) eine auf K>0 definierte Aussageform, und q ∈ K>0. Dann gilt
∀ε ∈ K>0 : A(ε) ⇐⇒ ∀ε ∈ K>0 : A(qε)
Das Lemma gibt es vielen Variationen. Wichtiger als die Aussage des Lemmas ist es, zu
verstehen, wie man das Lemma (oder eine Variation davon!) kurz beweist.
Beweis des Lemmas.
”=⇒“: Es gelte
(2.14) ∀ε ∈ K>0 : A(ε).
Fur ein gegebenes ε > 0 wollen wir nun A(qε) zeigen. Wir wenden (2.14) fur ε := qε an,
und haben dann das gewunschte.
”⇐=“: Analog mit ε := q−1ε
Beweis der Proposition.
(1): Es gelte limi→∞ ai = a. Das heißt: fur alle ε ∈ K>0 gibt es ein i0 ∈ N, so dass fur alle
naturlichen Zahlen i ≥ i0 gilt: |ai − a| ≤ ε.
Fur solch ein ε und ein passendes i0 nehmen wir nun naturliche Zahlen i ≥ i0 und j ≥ i0
und rechnen nach:
|ai − aj| ≤ |ai − a|+ |a− aj| ≤ ε+ ε = 2ε.
Wir haben nun also gezeigt:
∀ε ∈ K>0 : A(2ε),
486 C. KONSTRUKTION VON R MIT HILFE VON CAUCHY-FOLGEN
wobei A(·) die folgende auf K>0 definierte Aussageform ist
A(ε) :⇐⇒ ∃i0 ∈ N : ∀i, j ∈ N : (i ≥ i0 ∧ j ≥ i0) =⇒ |ai − aj| ≤ ε
Nach dem obigen Lemma ist dies aquivalent zu
∀ε ∈ K>0 : A(ε)
und dies ist gerade die Definition einer Cauchy-Folge.
(2): Ahnlich wie Bemerkung 2.4 (b).
(3): Angenommen (ai)i∈N und (bi)i∈N seien Cauchy-Folgen. Dies bedeutet, dass wir fur
jedes ε ∈ K>0 die folgenden Aussagen haben:
∃i0 ∈ N : ∀i, j ∈ N : (i ≥ i0 ∧ j ≥ i0) =⇒ |ai − aj| ≤ ε
∃j0 ∈ N : ∀i, j ∈ N : (i ≥ j0 ∧ j ≥ i0) =⇒ |bi − bj| ≤ ε
Wir wahlen nun solch ein i0 und solch ein j0. Wir setzen k0 := max{i0, j0}. Dann gilt fur
dieses k0:
∀i, j ∈ N : (i ≥ k0 ∧ j ≥ k0) =⇒ |ai − aj| ≤ ε ∧ |bi − bj| ≤ ε.
Wir rechnen fur i, j ≥ k0:
|(ai + bi)− (aj + bj)| = |(ai − aj) + (bi − bj)| ≤ |ai − aj|+ |bi − bj| ≤ ε+ ε = 2ε.
Also ergibt sich insgesamt
∀ε ∈ K>0 : ∃k0 ∈ N : ∀i, j ∈ N : (i ≥ k0 ∧ j ≥ k0) =⇒ |(ai + bi)− (aj + bj)| ≤ 2ε.
Nach dem obigen Lemma konnen wir auch hier 2ε durch ε ersetzen. Dann steht hier gerade
die Definition, dass (ai + bi)i∈N eine Cauchy-Folge ist.
2. FOLGEN, KONVERGENZ UND CAUCHY-FOLGEN 487
Der Beweis fur (ai − bi)i∈N ist vollig analog.
Fur das Produkt (ai · bi)i∈N muss man etwas anders vorgehen. Zunachst nutzen wir die
Tatsache, dass (ai)i∈N und (bi)i∈N beschrankt sind. Also gibt es ein r ∈ K mit
∀i ∈ N : |ai| ≤ r ∧ |bi| ≤ r
Dann argumentieren wir wie bei der Summe, rechnen dann aber:
|aibi − ajbj| = |ai(bi − bj) + (ai − aj)bj| ≤ |ai||bi − bj|+ |ai − aj||bj| ≤ rε+ εr = 2rε.
Nun argumentiert man wie bei der Summe, wobei man das Lemma mit q := 2r nutzt.
(4): Es reicht zu zeigen: Sei (bi)i∈N eine Folge wie oben, dann ist ( 1bi
)i∈N ebenfalls eine
Cauchy-Folge. Die eigentliche Aussage folgt dann mit (3).
Wir zeigen zunachst durch Widerspruch, dass ( 1bi
)i∈N beschrankt ist. Angenommen ( 1bi
)i∈N
sei nicht beschrankt, dann gilt
∀r ∈ K : ∃n ∈ N :
∣∣∣∣ 1
bn
∣∣∣∣ > r.
Dies impliziert
∀r ∈ K>0 : ∃n ∈ N : |bn| <1
r
und dies ergibt
(2.15) ∀δ ∈ K>0 : ∃n ∈ N : |bn| < δ,
wobei die folgende Variation des obigen Lemmas benutzt wurde
∀r ∈ K>0 : A(1/r) ⇐⇒ ∀δ ∈ K>0 : A(δ).
488 C. KONSTRUKTION VON R MIT HILFE VON CAUCHY-FOLGEN
Die Folge (bi)i∈N ist eine Cauchy-Folge. Zu einem gegebenen ε ∈ K>0 gibt es also ein
i0 ∈ N, so dass gilt
(2.16) ∀i, j ∈ N : i ≥ i0 ∧ j ≥ i0 =⇒ |bi − bj| ≤ ε
Wir wahlen nun zu diesem i0:
δ :=min{ε, |b1|, |b2|, . . . , |bi0|}
2.
Mit (2.15) erhalten wir ein n ∈ N mit |bn| < δ. Auf Grund der Definition von δ gilt n > i0.
Mit (2.16) folgt:
∀j ∈ N : j ≥ i0 =⇒ |bn − bj| ≤ ε
und mit der Rechnung
|bj| ≤ |bj − bn|+ |bn| ≤ ε+ε
2≤ 2ε
folgt
∀ε ∈ K>0 : ∃i0 ∈ N : ∀j ∈ N : j ≥ i0 =⇒ |bj − 0| ≤ 2ε.
Dies ergibt unter Nutzung des Lemmas fur q = 2, dass (bj)j∈N eine Nullfolge ist. Dies ist
ein Widerspruch zur Annahme. Also haben wir die Beschranktheit gezeigt, d.h.
∃r ∈ K : ∀n ∈ N :
∣∣∣∣ 1
bn
∣∣∣∣ ≤ r.
Nun sei wiederum ε > 0 und i0 wie oben. Wir rechnen dann∣∣∣∣ 1
bi− 1
bj
∣∣∣∣ ≤ ∣∣∣∣bj − bibibj
∣∣∣∣ ≤ |bj − bi||bi||bj|≤ r2ε
Unter Nutzung des Lemmas fur q = r2 erhalten wir, dass ( 1bi
)i∈N eine Cauchy-Folge ist.
Definition 2.17. Wir sagen K ist vollstandig, falls jede K-wertige Cauchy-Folge in K
konvergiert.
2. FOLGEN, KONVERGENZ UND CAUCHY-FOLGEN 489
Definition 2.18. Sei A( · ) eine auf N definierte Aussageform.
Fur fast alle i ∈ N gilt A(i)
:⇐⇒ Es gibt ein i0 ∈ N, so dass fur alle i ∈ N: i ≥ i0 =⇒ A(i)
⇐⇒ Die Menge {i ∈ N | ¬A(i)} ist endlich
Beispiel: limi→∞ ai = a ⇐⇒ Fur alle ε ∈ K>0 gilt fur fast alle i ∈ N: |ai − a| ≤ ε 6⇐⇒
Fur fast alle i ∈ N gilt fur alle ε ∈ K>0: |ai − a| ≤ ε
Notation: Da wir immer wieder Ausdrucke der Art
∀i ∈ N : i ≥ i0 =⇒ A(i)
haben, schreiben wir hierfur kurz
∀i ∈ {i0, i0 + 1, . . .} : A(i).
LEMMA 2.19. Besitzt eine Cauchy-Folge eine konvergente Teilfolge, so ist die Cauchy-
Folge bereits konvergent.
Beweis. Sei nun (ai)i∈N eine Cauchy-Folge, sei f : N −→ N eine streng monotone wach-
sende Abbildung, und sei (af(n))n∈N eine konvergente Teilfolge mit Grenzwert a.
Es gilt fur ein zunachst fixiertes ε ∈ K>0:
(2.20) ∃i0 ∈ N : ∀i, j ∈ {i0, i0 + 1, . . .} : |ai − aj| ≤ ε.
und
(2.21) ∃n0 ∈ N : ∀n ∈ {n0, n0 + 1, . . .} : |af(n) − a| ≤ ε.
490 C. KONSTRUKTION VON R MIT HILFE VON CAUCHY-FOLGEN
Fur solche i0 und n0 setzen wir k0 := max{i0, f(n0)}. Da f streng monoton wachsend ist,
konnen wir ein n ∈ {n0, n0 + 1, . . .} wahlen mit f(n) ≥ k0. 6 Wir wahlen dann j := f(n)
und haben somit fur alle i ∈ {i0, i0 + 1, . . .} erhalten:
|ai − a| ≤ |ai − af(n)|+ |af(n) − a| ≤ ε+ ε ≤ 2ε.
Wir haben also insgesamt gezeigt:
∀ε ∈ K>0 : ∃i0 ∈ N : ∀i ∈ {i0, i0 + 1, . . .} : |ai − a| ≤ 2ε.
Und wenn wir Lemma 2.13 verwenden mit q = 2, erhalten wir limi→∞ ai = a.
SATZ 2.22. Sei K ein geordneter Korper. Dann sind aquivalent:
(1) K erfullt die Supremumseigenschaft
(2) K ist archimedisch und vollstandig
Beweis.”(1) =⇒ (2)“: Angenommen K erfulle die Supremumseigenschaft. Wir haben
bereits gesehen, dass dann K archimedisch ist.
Sei nun (ai)i∈N eine Cauchy-Folge. Wir definieren
M := {x ∈ K | Fur fast alle i ∈ N gilt: x ≤ ai},
= {x ∈ K | ∃i0 ∈ N : ∀i ∈ {i0, i0 + 1, . . .} : x ≤ ai}.
Jede Cauchy-Folge ist beschrankt. Es gibt also r1, r2 mit ∀i ∈ N : r1 ≤ ai ≤ r2. Dann gilt
r1 ∈M und r2 ist eine obere Schranke von M . Da M nicht-leer und nach oben beschrankt
ist, existiert a := supM ∈ K.
6Man zeigt dazu zunachst f(a + b) ≥ f(a) + b. Dann sieht man, dass es fur n := n0 + (k0 − f(n0))
erfullt ist.
2. FOLGEN, KONVERGENZ UND CAUCHY-FOLGEN 491
Wir wollen zeigen: limi→∞ ai = a.
Sei ε ∈ K>0. Dann ist a+ ε 6∈M , denn sonst ware a keine obere Schranke von M . Also
(2.23) ∀i0 ∈ N : ∃i ∈ {i0, i0 + 1, . . .} : a+ ε > ai.
Andererseits gilt: x′ ≤ x ∈ M =⇒ x′ ∈ M . Ware a − ε 6∈ M wahr, dann ware auch
a− ε eine obere Schranke, also a nicht das Supremum. Somit wissen wir a− ε ∈M . Wir
erhalten
(2.24) ∃k0 ∈ N : ∀k ∈ {k0, k0 + 1, . . .} : a− ε ≤ ak.
Sei nun j0 ∈ N gegeben. Wir wahlen ein k0 wie in (2.24). Wende (2.23) mit i0 :=
max{k0, j0} an. Dann existiert ein i ∈ {i0, i0 + 1, . . .} mit a + ε > ai und a − ε ≤ ai,
also mit |ai − a| ≤ ε. Wir haben gezeigt
(2.25) ∀ε ∈ K>0 : ∀j0 ∈ N : ∃i ∈ {j0, j0 + 1, . . .} : |ai − a| ≤ ε.
Wir definieren nun f : N −→ N rekursiv. Wahle f(1) := 1. Ist f(n) gewahlt, so wenden
wir (2.25) mit ε := 1/(n + 1) und j0 := f(n) + 1 an. Fur das so erhaltene i setzen wir
f(n + 1) := i. Dann ist (af(n))n∈N eine Teilfolge und |af(n) − a| ≤ 1/n. Daraus folgt
a = limn→∞ af(n). Da (ai)i∈N eine Cauchy-Folge mit einer konvergenten Teilfolge ist, folgt
mit Lemma 2.19 dann limi→∞ ai = a.
”(2) =⇒ (1)“: Angenommen K ist archimedisch und vollstandig. Sei ∅ 6= M ⊂ K, r ∈ K,
∀x ∈M : x ≤ r. Fur jedes q ∈ N finden wir ein p ∈ N mit qr ≤ p. Die Menge
Aq := {p ∈ Z | pq
ist obere Schranke von M}
ist somit nicht-leer. Zu einem x ∈ M bestimme nun s ∈ Z mit s ≤ qx < s + 1 (analog
zu Aufgabe 4a) auf Ubungsblatt 6). Dieses s ist untere Schranke von Aq ⊂ Z. Jede nach
492 C. KONSTRUKTION VON R MIT HILFE VON CAUCHY-FOLGEN
unten beschrankte nicht-leere Teilmenge von Z hat ein Minimum. 7 Somit existiert
pq := minAq ∈ Z.
Dann ist also aq := pqq∈ Q eine obere Schranke von M , wohingegen pq−1
qkeine obere
Schranke von M ist, d.h. es gibt ein xq ∈M mit aq− (1/q) < xq. Es folgt fur alle q, i ∈ N:
aq − (1/q) ≤ ai und dies wiederum besagt |aq − ai| ≤ max{1/q, 1/i}. Deswegen ist (ai)i∈N
eine Cauchy-Folge, die auf Grund der Annahme gegen ein a ∈ K konvergiert. Man sieht
leicht, dass der Grenzwert von oberen Schranken wieder eine obere Schranke ist. Ebenso
sind alle ai− (1/i) keine obere Schranke, und da K archimedisch ist, gibt es keine kleinere
obere Schranke von M . Mit anderen Worten: a ist die kleinste obere Schranke von M ,
also a = supM .
3. Existenz und Eindeutigkeit der reellen Zahlen
Wir wollen nun zeigen, dass es mindestens ein Modell der reellen Zahlen gibt (Existenzaus-
sage), und dass je zwei Modelle (kanonisch) isomorph sind (Eindeutigkeitsaussage). Im
Gegensatz zu Abschnitt 6.4 in Kapitel 2 wollen wir dies nicht mit Dedekindschen Schnit-
ten, sondern mit Cauchy-Folgen durchfuhren. Wie so oft in der Mathematik ist es am
besten mit der Eindeutigkeitsaussage anzufangen, denn der Beweis der Eindeutigkeit lie-
fert entscheidende Ideen fur den Beweis der Existenz. Die verwendete Technik heißt Ver-
vollstandigung und ist in leicht veranderter Form fur viele Anwendungen der Mathematik
(partielle Differentialgleichungen, Quantenmechanik, Allgemeine Relativitatstheorie,. . . )
sehr wichtig.
7Denn ist A solche eine Teilmenge und s eine unter Schranke dann ist {p − s | p ∈ A} ⊂ N und hat
deswegen nach Proposition 3.3 in Anhang 3 ein Minimum. Dann aber auch A.
3. EXISTENZ UND EINDEUTIGKEIT DER REELLEN ZAHLEN 493
Sei CF die Menge aller Q-wertigen Cauchy-Folgen.
Angenommen (K,+, ·,≤) sei ein Modell der reellen Zahlen, d.h. (K,+, ·,≤) ist ein geord-
neter Korper mit Supremumseigenschaft. Wir betrachten wieder die injektive Abbildung
iQ : Q −→ K, die Addition, Multiplikation und die Ordnung erhalt, siehe Lemma 5.7 in
Kapitel 2. Fur (ai)i∈N ∈ CF ist dann (iQ(ai))i∈N eine Cauchy-Folge in K. Da K die Supre-
mumseigenschaft hat, existiert f((ai)i∈N) := limi→∞ iQ(ai). Wir erhalten eine Abbildung
f : CF −→ K.
Nun definieren wir eine Addition und Multiplikation auf CF :
+ : CF × CF → CF (ai)i∈N + (bi)i∈N := (ai + bi)i∈N
· : CF × CF → CF (ai)i∈N · (bi)i∈N := (ai · bi)i∈N
Man sieht leicht, dass (CF,+, ·) ein kommutativer Ring mit Eins ist. Hierbei ist (0)i∈N
das neutrale Element der Addition und (1)i∈N das neutrale Element der Multiplikation.
Es ist aber kein Korper, denn die Cauchy-Folge (0, 1, 1, 1, . . .) besitzt kein multiplikatives
Inverses. Außerdem besagt Ubung 2.10, dass f Addition und Multiplikation erhalt.
Die Abbildung f ist nicht injektiv. Es gilt:
f((ai)i∈N) = f((bi)i∈N) ⇐⇒ (ai − bi)i∈N ist eine Nullfolge.
Definition 3.1. Fur (ai)i∈N, (bi)i∈N ∈ CF definieren wir die Relation ∼⊂ CF × CF
durch
(ai)i∈N ∼ (bi)i∈N ⇐⇒ (ai − bi)i∈N ist eine Nullfolge.
494 C. KONSTRUKTION VON R MIT HILFE VON CAUCHY-FOLGEN
Auf R := CF/ ∼ definieren wir Addition und Multiplikation wie folgt:
+ : R× R→ R [(ai)i∈N] + [(bi)i∈N] := [(ai + bi)i∈N]
· : R× R→ R [(ai)i∈N] · [(bi)i∈N] := [(ai · bi)i∈N]
Die Ordnung definieren wir wie folgt:
[(ai)i∈N] > [(bi)i∈N] :⇐⇒ ∃ε ∈ Q>0 : fur fast alle i ∈ N gilt ai ≥ bi + ε.
Man kann sich uberlegen, dass hierdurch eine totale Ordnung auf R definiert wird.
PROPOSITION 3.2. Die Addition und Multiplikation auf R sind wohldefiniert 8 und
(R,+, ·,≤) ist ein geordneter Korper. Die Abbildung [ · ] : CF −→ R, (aj)j∈N 7→ [(aj)j∈N]
bewahrt die Addition, die Multiplikation und sendet die Eins von CF auf die Eins von
R. (Man nennt dies einen Homomorphismus von Ringen mit Eins.)
Beweisskizze. Der Beweis ist nun einfach, nur die Existenz eines multiplikativen Inversen
ist etwas trickreich. Das Null-Element ist [(0)i∈N] =: 0.
Sei [(bi)i∈N] 6= 0. Dann ist (bi)i∈N keine Nullfolge. Das heißt:
∃ε ∈ Q>0 : ∀i0 ∈ N : ∃i ∈ {i0, i0 + 1, . . .} : |bi| ≥ ε
Wir 9 zeigen zunachst, dass {i ∈ N | bi = 0} endlich ist. 10
8”Wohldefiniert“ bedeutet hier: die Definition hangt nur von der Aquivalenzklasse ab und nicht von
der Wahl des Reprasentanten. Da wir ja eine Abbildung definieren wollen, die einer Aquivalenzklasse
etwas zurodnet, ist diese Eigenschaft das, was wir zeigen mussen, um zu sehen, dass diese Definitionen
von + und · sinnvolle Definitionen sind.
9Beweis ab hier etwas anders als in der Vorlesung auf Grund einer Nachfrage
10Die leere Menge ist auch endlich, ist also hier nicht ausgeschlossen.
3. EXISTENZ UND EINDEUTIGKEIT DER REELLEN ZAHLEN 495
Angenommen {i ∈ N | bi = 0} ware unendlich groß, dann gibt es eine injektive Funktion
f : N −→ N mit ∀n ∈ N : bf(n) = 0. Dies bedeutet, dass (bi)i∈N eine Cauchy-Folge mit
einer konvergenten Teilfolge ist. Wenn wir nun Lemma 2.19 anwenden, folgt daraus, dass
(bi)i∈N eine Nullfolge ist. Das heißt wir erhalten den Widerspruch [(bi)i∈N] = 0. Wir haben
somit gesehen, dass {i ∈ N | bi = 0} endlich ist.
Nun definieren wir
bi :=
bi falls bi 6= 0
1 falls bi = 0
Fur fast alle i ∈ N gilt bi = bi, und somit bekommen wir auch [(bi)i∈N] = [(bi)i∈N]. Auf die
Folge (bi)i∈N konnen wir nun Proposition 2.12 (4) anwenden. Wir sehen, dass
ci :=1
bi=
(bi)−1 falls bi 6= 0
1 falls bi = 0
eine Cauchy-Folge ist.
Es gilt dann fur fast alle i ∈ N: ci · bi = 1, und deswegen gilt
[(ci)i∈N] · [(bi)i∈N] = [(ci)i∈N] · [(bi)i∈N] = [(1)i∈N].
Man beachte: die obige Definition, die obige Proposition und der Beweis benotigen die
Existenz eines Modells nicht.
496 C. KONSTRUKTION VON R MIT HILFE VON CAUCHY-FOLGEN
Beweis der Eindeutigkeit bis auf Isomorphie. Nehmen wir also wieder wie oben an, dass
ein Modell (K,+, ·,≤) existiert. Dann gibt es genau eine Abbildung F : R −→ K, so dass
das folgende Diagramm kommutiert11
CF K
R
f
[ · ]F
Alle Abbildungen hier erhalten Addition und Multiplikation und bilden die Eins auf die
Eins ab. Außerdem ist F injektiv und erhalt die Ordnung. Da R archimedisch geordnet
ist, erhalten wir aus WS 2013/14 Aufgabe 4d) von Ubungsblatt 6, dass f : CF −→ K
und somit F : R −→ K surjektiv ist. Also ist F : CF −→ K ein Isomorphismus von
geordneten Korpern und Satz 6.8 aus Kapitel 2 folgt im Fall K = R. Wenn nun (K,+, · ≤)
und (K, +, ·, ≤) zwei Modelle der reellen Zahlen sind, so erhalten wir Isomorphismen
F : R −→ K und F : R −→ K. Dann ist auch F ◦ F−1 : K −→ K ein Isomorphismus
und Satz 6.8 aus Kapitel 2 ist fur alle K gezeigt.
Wie bereits in Lemma 5.7 aus Kapitel 2 gesehen, gibt es nun eine injektive Abbildung
iQ : Q −→ R, die Addition, Multiplikation und die Ordnung erhalt. Es gilt hier iQ(a) =
[(a)i∈N], d.h. die rationalen Zahlen werden von konstanten Cauchy-Folgen reprasentiert.
Beweis Existenz. Wir zeigen, dass (R,+, ·,≤) archimedisch und vollstandig ist. Dann
haben wir also ein Modell, d.h. Satz 6.7 aus Kapitel 2 ist gezeigt.
11”kommutiert“ bedeutet hier F ◦ [ · ] = f .
3. EXISTENZ UND EINDEUTIGKEIT DER REELLEN ZAHLEN 497
Zur archimedischen Eigenschaft: Sei ein Element x ∈ R gegeben. Zu zeigen ist: es gibt ein
n ∈ N mit x ≤ iN(n). Es gibt nun eine Q-wertige Cauchy-Folge (ai)i∈N mit x = [(ai)i∈N].
Die Cauchy-Folge ist beschrankt, d.h. es gibt ein r ∈ Q mit ∀i ∈ N : |ai| ≤ r. Da Q
archimedisch ist, gibt es ein n ∈ N mit r ≤ n. Man zeigt dann leicht, dass
x = [(ai)i∈N] ≤ [(n)i∈N] = iN(n).
Zur Vollstandigkeit: Sei (xi)i∈N eine R-wertige Cauchy-Folge. Falls es ai ∈ Q gibt mit
xi = iQ(ai) = (ai)n∈N,12 dann (ai)i∈N ∈ CF und es gilt dann
limi∈N
xi = [(ai)i∈N].
Der allgemeine Fall ist ein bisschen aufwandiger und soll nur skizziert werden. Wir schrei-
ben
xi = [(ai,n)n∈N].
Man nutzt nun die Tatsache, dass sowohl (xi)i∈N eine Cauchy-Folge in R ist als auch dass
fur alle i ∈ N die Folge (ai,n)n∈N eine Cauchy-Folge in Q ist, und konstruiert damit eine
streng monoton wachsende Abbildung f : N −→ N,13 so dass wiederum (ai,f(i))i∈N eine
Cauchy-Folge ist. Man nennt solch eine Folge eine Diagonalfolge. Außerdem kann man
nun
limi∈N
xi = [(ai,f(i))i∈N]
zeigen.
Ab jetzt identifizieren wir Q mit seinem Bild in R vermoge iQ.
12Hier ist kein Druckfehler. Gemeint ist die konstante Folge, die konstant ai ist.
13Hier steckt etwas Konstruktionsarbeit, die wir (momentan) uberspringen.
ANHANG Z
Uberblick uber algebraische Strukturen
(Aa) Addition ist assoziativ.
Fur alle x, y, z ∈ X gilt
(x+ y) + z = x+ (y + z).
(An) Addition hat neutrales Element.
Es gibt ein Element 0 ∈ X, so dass fur alle x ∈ X gilt
x+ 0 = 0 + x = x.
Man nennt 0 das neutrale Element der Addition.
(Ai) Addition hat inverse Elemente.
Zu jedem x ∈ X gibt es ein y ∈ X, so dass
x+ y = y + x = 0.
Man nennt y das Inverse von x bezuglich der Addition und schreibt normalerweise
−x anstelle von y.
(Ak) Addition ist kommutativ.
Fur alle x, y ∈ X gilt
x+ y = y + x.
499
500 Z. UBERBLICK UBER ALGEBRAISCHE STRUKTUREN
(Ma) Multiplikation ist assoziativ.
Fur alle x, y, z ∈ X gilt
(x · y) · z = x · (y · z).
(Mn) Multiplikation hat neutrales Element.
Es gibt ein Element 1 ∈ X, so dass fur alle x ∈ X gilt
x · 1 = 1 · x = x.
Man nennt 1 das neutrale Element der Multiplikation.
(Mi) Multiplikation hat inverse Elemente.
Zu jedem x ∈ X r {0} gibt es ein y ∈ X, so dass
x · y = y · x = 1.
Man nennt y das Inverse von x bezuglich der Multiplikation und schreibt norma-
lerweise x−1 anstelle von y.
(Mk) Multiplikation ist kommutativ.
Fur alle x, y ∈ X gilt
x · y = y · x.
(AMd) Addition und Multiplikation erfullen das Distributionsgesetz.
Fur alle x, y, z ∈ X gilt
x · (y + z) = x · y + x · z
(y + z) · x = y · x+ z · x
Literaturverzeichnis
[1] H. Amann, J. Escher, Analysis I, Birkhauser
[2] H. Amann, J. Escher, Analysis II, Birkhauser
[3] H. Amann, J. Escher, Analysis III, Birkhauser
[4] H. Amann, Gewohnliche Differentialgleichungen, de Gruyter
[5] G. Aumann, O. Haupt, Einfuhrung in die reelle Analysis, de Gruyter
[6] M. Barner, F. Flohr, Analysis I, de Gruyter
[7] M. Barner, F. Flohr, Analysis II, de Gruyter
[8] C. Blatter, Analysis 1, Springer
[9] T. Brocker, Analysis I, Spektrum
[10] T. Brocker, Analysis II, BI Wissenschaftsverlag
[11] E. A. Coddington, N. Levinson, Theory of ordinary differential equations, McGraw Hill
[12] O. Deiser, Einfuhrung in die Mengenlehre, Springer
[13] H.D. Ebbinghaus, Einfuhrung in die Mengenlehre, BI Wissenschaftsverlag
[14] O. Forster, Analysis 1, Vieweg Studium
[15] O. Forster, Analysis 2, Vieweg Studium
[16] O. Forster, Analysis 3, Vieweg Studium
[17] U. Friedrichsdorf, A. Prestel, Mengenlehre fur den Mathematiker, Vieweg Studium
[18] D. Grieser, Analysis I, Spriger Studium Mathematik
[19] D. Grieser, Vorlesungsskript Analysis I, Universitat Oldenburg
[20] P. R. Halmos, Naive Mengenlehre, Vandenhoeck und Ruprecht
[21] S. Hildebrandt, Analysis I, Springer
[22] K. Konigsberger, Analysis 1, Springer
501
502 LITERATURVERZEICHNIS
[23] K. Konigsberger, Analysis 2, Springer
[24] S. Lang, Real and functional analysis, Springer
[25] C. Loh, Vorlesungsskript Analysis I, Universitat Regensburg
[26] C. Loh, Vorlesungsskript Analysis II, Universitat Regensburg
[27] A. Peyerimhoff, Gewohnliche Differentialgleichungen I und II, Akademische Verlagsgesellschaft Wies-
baden
[28] L. Perko, Differential equations and dynamical systems, Third edition, Springer
[29] B. v. Querenburg, Mengentheoretische Topologie, Springer
[30] W. Rudin, Analysis, Oldenbourg
[31] W. Rudin, Reelle und komplexe Analysis, Oldenbourg
[32] L. A. Steen, J. A. Seebach, Counterexamples in Topology
[33] W. Walter, Analysis 1, Springer
[34] W. Walter, Analysis 2, Springer
[35] W. Walter, Gewohnliche Differentialgleichungen, Springer
Stichworte
C1-Diffeomorphismus, 363
C`-Diffeomorphismus, 362
C`-Immersion, 381
n-dimensionale Sphare, 368
p-Norm, 274
Aquivalenzklasse, 478
Aquivalenzrelation, 37
aquivalent, 10, 14
aquivalente Normen, 278
uberabzahlbar, 47
Abbildung, 40
abgeschlossen, 201
abgeschlossene Hulle, 290
Ableitung, 213, 316
der Umkehrfunktion, 218
Abschluss, 290
Absolutbetrag, 82
absolute Konvergenz, 159
abzahlbar, 46
Addition, 469
von Dedekindschen Schnitten, 97
Allquantor, 25
alternierende Reihe, 160
analytisch, 271
Anfangswert, 413
antisymmetrisch, 37
archimedisch geordneter Korper, 80
archimedisches Axiom, 80
Attraktor, 448
auf Y induzierte Topologie, 288
Aussage, 8
Aussageform, 11
aussagenlogische Formel, 12
aussagenlogische Verknupfung, 10
Aussonderungsmengenaxiom, 456
Auswahlaxiom, 457
autonom, 403
Axiom
archimedisches, 80
Axiome der Mengenlehre, 456
Axiome der reellen Zahlen, 6
Ball , 201
503
504 STICHWORTE
Banachraum, 282
beschrankt, 87, 121, 480
beschrankt im normierten Raum, 276
beschrankte Funktion, 274
Betragsfunktion, 82
der komplexen Zahlen, 115
bijektiv, 44
Bild, 47
Bild der Relation, 40
Binomialkoeffizient, 68
Bolzano-Weierstraß
Satz von, 140, 279
Cauchy-Folge, 141, 484
Cauchy-Produkt, 170
Dedekindscher Schnitt, 94
Definitheit der Norm, 274
Definitionsbereich, 40
Definitionsmenge, 19
Dezimal-Darstellung, 144
dicht, 291
Diffeomorphismus, 363
Differential, 316
Differentialgleichung
autonome, 403
explizite gewohnliche, 408
gewohnliche, 402
homogen, 429
inhomogen, 429
lineare, 429
partielle, 404
Differenz
symmetrische, 23
Differenzenquotient, 213
differenzierbar, 213, 316
disjunkt, 24
diskrete Topologie, 287
Divergenz
von Folgen, 122, 481
Dreiecksungleichung der Norm, 274
Einbettung, 387
Einschrankung, 43
elliptisches Paraboloid, 349
endlich, 46
endliche Teiluberdeckung, 304
Entwicklungspunkt, 227
Erhaltungsgroße, 408
Ersetzungsaxiom., 457
erstes Integral, 408
erweiterten reellen Zahlen, 133
euklidischen Abstand, 200
Eulersche Zahl, 179
Existenzquantor, 25
explizite gewohnliche Differentialgleichung, 408
explizite lineare gewohnliche
Differentialgleichung, 429
STICHWORTE 505
Exponentialfunktion, 172
Exponentialreihe, 171
Extensionalitat, 456
Extremum
lokales, 220, 395
Fakultat, 469
Familie, 49
fast alle, 151, 489
Flache, 371
Fluss, 442
Flusslinie, 408
Folge
M -wertige, 49
in M , 49
von Funktionen, 258
Folgen, 121
beschrankte, 121
monotone, 130
folgenkompakt, 207, 299
folgenstetig, 184, 295
Formel
aussagenlogische, 12
Fundamentalsatz der Algebra, 117
Fundierungsaxiom, 457
Funktion
beschrankte, 274
reell-wertige, 41
Funktionalgleichung
der Exponentialfunktion, 172
der Logarithmusfunktion, 194
Godelscher Unvollstandigkeitssatz, erster, 458
Godelscher Unvollstandigkeitssatz, zweiter, 458
ganze Zahlen, 72
Gaußschen Zahlenebene, 113
Gebiet, 333
geometrische Reihe, 150
geordneter Korper, 77
gewohnliche Differentialgleichung, 402
autonome, 403
explizite, 408
lineare, 429
gewohnliche Differentialgleichung mit
getrennten Variablen, 438
gleich machtig, 46
gleichmaßig stetig, 309
gleichmaßig stetig auf [a, b], 242
Grad, 117
Grad des Polynoms, 82
Graph, 41
Grenzwert, 122
Grenzwert der Folge, 481
Grenzwert von Funktionen, 209
Haufungspunkt der Folge, 132
Haufungspunkt einer Menge, 206
harmonische alternierende Reihe, 162
506 STICHWORTE
harmonische Reihe, 150
Hauptsatz der Differential- und
Integralrechnung
Teil I, 243
Teil II, 246
Hausdorff-Eigenschaft, 292
Hausdorffraum, 292
Heine-Borel-Eigenschaft, 304
Hesse-Abbildung, 335
Hesse-Matrix, 334
Hilbertraum, 282
homoomorph, 309
Homoomorphismus, 309
homogen, 429
Homogenitat der Norm, 274
Homomorphismus von Ringen mit Eins, 494
hyperbolisches Paraboloid, 349
Hyperflache, 371
Identitat, 42
imaginar, 113
Imaginarteil, 113
Immersion, 381
implizit definierte, 367
indefinit, 347
Induktionsanfang, 57, 466
Induktionsaxiom, 54, 461
Induktionsschritt, 57, 466
Induktionsvoraussetzung, 57, 466
induktiv, 457, 463
induzierte Metrik, 200, 276
auf Teilmenge, 200, 257
von Norm, 276
induzierte Norm
auf Unterraum, 275
induzierte Topologie
von Teilmenge, 288
Infimum, 87
inhomogen, 429
injektiv, 44
Inklusion, 42
Innere, 290
inneren Kern, 290
Integralkurve, 408
Integration
durch Substitution, 249
partielle, 249
Intervalle, 133
Isometrie, 200
isomorph (als Ring), 74
Isomorphismus von Ringen, 74
Jacobi-Matrix, 326
k-mal stetig differenzierbar, 224
Korper, 76
archimedisch geordneter, 80
der komplexen Zahlen, 112
STICHWORTE 507
der rationalen Zahlen, 74
der reellen Zahlen, 84
geordneter, 77
Korper der rationalen Funktionen, 81
kanonische Projektion, 478
Klassen, 456
Klumpentopologie, 287
Koeffizienten, 117
kommutativer Ring, 74
kompakt, 304
Komplement, 23
komplexe Exponentialfunktion, 172
komplexe Konjugation, 115
komplexe Zahlen, 113
Komponente, 52
Komposition, 43
Komprehension, 456
Kontraktion, 283
Konvergenz
uneigentliche, 134
von Folgen, 122
Konvergenzradius, 157
konvergiert, 204
absolut, 159, 252
gegen ∞, 133
gegen unendlich, 133
gleichmaßig, 260
in R, 134
punktweise, 258
Kosinus, 176
Kreiszahl π, 197
kritischen Punkt, 352
kritischer Punkt, 395, 448
Losung, 402
Losungsintervall, 402
Lagrange-Multiplikatoren, 396
Lagrangesche Restglieddarstellung, 226
Lebesguesche Zahl, 311
leere Menge, 20
Leibniz-Regel, 160
Leitkoeffizient, 117
Limes, 122
Limes inferior, 137
Limes superior, 138
Linearisierung, 450
linksseitige Grenzwert oder Limes, 210
Lipschitz-Konstante, 412
Ljapunow-Funktion, 451
Logarithmus, 194
lokal Orts-Lipschitz-stetig, 412
lokal umkehrbar, 356
lokale C`-Parametrisierung, 387
lokales Extremum, 220, 351, 395
lokales Maximum, 220, 351, 395
lokales Maximum oder Minimum, 351
lokales Minimum, 220, 351, 395
508 STICHWORTE
lokales striktes Maximum, 351
lokales striktes Minimum, 351
lokalkonstant, 332
machtiger, 46
Majorante, 152
Majoranten-Kriterium, 152
maximale Losungs-Intervall, 422
Maximum, 61, 473
lokales, 351, 395
lokales striktes, 351
Menge, 18
der ganzen Zahlen, 72
der komplexen Zahlen, 112
der naturlichen Zahlen, 54, 469
der rationalen Zahlen, 74
der reellen Zahlen, 84
leere, 20
Mengensystem, 30
Metrik, 199
metrischer Raum, 199, 255, 283
Minimum, 61, 473
lokales, 351, 395
lokales striktes, 351
Minkowski-Ungleichung, 275
Mittel
arithmetisches, 83
geometrisches, 83
Mittelwertsatz
erster, 222
zweiter, 222
Modell der naturlichen Zahlen, 461
Multiplikation, 469
von Dedekindschen Schnitten, 100
Multiplizitat der Nullstelle, 119
nach oben beschrankt, 87
nach unten beschrankt, 87
Nachfolger-Abbildung, 54, 461
Naturliche Zahlen, 4
Negation, 9
negativ definit, 347
negativ semi-definit, 347
nicht zusammenhangend, 296
normierten Vektorraum, 274
Nullfolgen, 122, 481
Nullstelle, 117
obere Schranke, 87
Oberintegral, 233
Oberklasse, 94
offen, 201
offene Uberdeckung, 304
offene Menge in (X,O), 287
Ordnung, 37
partielle, 37
totale, 38
Ordnungsrelation, 37
STICHWORTE 509
Orts-Lipschitz-stetig, 412
Paar, (geordnetes), 32
Paarmengenaxiom, 457
Paraboloid
elliptisches, 349
hyperbolisches, 349
Parametrisierung
lokale ∼ einer Untermannigfaltigkeit, 387
Partialsumme, 148
partiell differenzierbar, 320
partielle Ableitung, 320
partielle Differentialgleichung, 404
Partielle Integration, 249
partielle Ordnung, 37
Partition, 231
Peano-Axiome, 53, 461
Permutation, 66
polynomiale Funktion, 117
positiv definit, 347
positiv semi-definit, 347
Potenzieren, 469
Potenzmenge, 30
Potenzmengenaxiom, 457
Potenzreihe, 156
Produkt
von Dedekindschen Schnitten, 100
Produkt, (kartesisches), 32
Produkt, (kartesisches,) von Mengenfamilien, 51
Produktregel, 216
Produktreihe, 169
Produktreihensatz, 169
Produkttopologie, 288
Produktzeichen, 55
Punkt
kritischer, 395
stationarer, 395
Quadrupel, 35
Quintupel, 35
Quotienten-Kriterium, 154
Quotientenregel, 217
Rand, 291
rationale Zahlen, 74
Realteil, 113
rechtsseitige Grenzwert oder Limes, 210
reell-analytisch, 271
reelle Exponentialfunktion, 172
Reelle Zahlen, 84
reflexiv, 37
Regel
von Leibniz, 160
regularer Wert, 375
Reihe, 148
alternierende, 160
rein imaginar, 113
rekursive Definition, 467
510 STICHWORTE
Relation, 36
Relation, funktionale, 39
Reprasentant, 478
reprasentiert, 478
Restglied, 225
Restriktion, 43
Richtungsableitung, 320
Riemann-Integral, 234
Riemann-integrierbar, 234
Riemannscher Umordnungssatz, 163
Riemannsches Kriterium, 234
Ring, 74
der ganzen Zahlen, 72
kommutativer, 74
Ring mit Eins, 74
Russellsche Paradoxon, 453
Satz
uber 1. Ableitung in Extrema, 220
uber 2. Ableitung in Extrema, 224
vom Cauchy-Produkt, 170
von Blozano-
Weierstraß, 141
von Bolzano-
Weierstraß fur endl.-dim. Vektorraume, 279
von Dedekind, 107
von Rolle, 221
von Schroder-Bernstein, 46
von Taylor, 225
Satz von Taylor, 343
Schnitt, 22
Schnittmenge, 22
singularen Wert, 375
Sinus, 176
Spurtopologie, 288
stabil, 448
Stammfunktion, 245
stationaren Punkt, 352
stationarer Punkt, 395
sternformig bezuglich x0 ∈ A, 299
stetig, 185, 200, 292
stetig differenzierbar, 223, 323
stetig in x0, 291
streng monoton wachsend, 483
Substitution, 249
Summe
von Dedekindschen Schnitten, 97
Summenzeichen, 55
Supremum, 87
Supremums-Distanz, 260
Supremumseigenschaft, 88
Supremumsnorm, 274
surjektiv, 44
symmetrisch, 37
Tangentialraum, 392
Taylor-Polynom, 227
Taylorreihe, 227
STICHWORTE 511
Teiluberdeckung
endliche, 304
Teilfolge, 131, 483
Teilmenge, 20
echte, 20
Teilsumme, 148
tertium non datur, 9
Topologie, 287
topologischer Raum, 287
total differenzierbar, 316
totale Ordnung, 38
transitiv, 37
Trennungszahl, 107
Treppenfunktion, 231
Tripel, 35
Umgebung, 201
Umkehrabbildung, 45
Umkehrung, 45
Umordnung, 163
uneigentliche Konvergenz, 134
Uneigentliches Riemann-Integral, 251
unendlich, 46
Unendlichkeitsaxiom, 457
untere Schranke, 87
Unterintegral, 233
Unterklassen, 94
Untermannigfaltigkeit, 370
Untermannigfaltigkeitskarte, 371
Urbild, 48
Vektorfeld, 408
Vereinigung, 22
Vereinigungsaxiom, 457
Verkettung, 43
Verknupfung
aussagenlogische, 10
Vervollstandigung, 492
vollstandig, 142, 257, 488
Vollstandige Induktion, 57, 466
vollstandiges Vektorfeld, 445
Wahrheitstafel, 9
wegzusammenhangend, 298
wohldefiniert, 80
wohlgeordnete Menge, 475
Wohlordnung, 475
Wohlordnung von N, 61
Wronski-Determinante, 434
Wurzel-Kriterium, 155
Zerlegung, 231
Zielbereich, 41
Symbole
(e1, . . . , en), Standardbasis von Rn, 278
:=, 4
B(D,K), beschrankte Funktionen, 274
C0((a, b)), 224
C∞((a, b)), 224
Ck((a, b)), 224
Lσ, 376
Sk, 376
∩, ∪, r, ∆, 23
◦, 44
deg(P ), 117
dglm, 260
dsup, 260
∅, 20
∃,∀, 25
exp, 172
⇐⇒, =⇒, 15
inf, Infimum, 87
limi→∞ ai, 481
limj→∞ aj , 122
limx→x0, Grenzwert von Funktionen, 209
lim inf, Limes inferior, 137
lim sup, Limes superior, 137
N, 4
N>0, 4
Q, 74
R, 19, 84
R>0, 19
Z, 72
P(M), 30
max, Maximum, 61
min, Minimum, 61
¬, 9∏nj=1, 55
dre, 129
brc, 129
⊂, (, 20∑nj=1, 55
sup, Supremum, 87
×, 32
∧, ∨, Y, →, ←, ↔, 10
{}, 20
ai → a, 481
aj → a, 122
513
514 SYMBOLE
f ′, Ableitung von f , 213
f#(N), Urbild von N unter f , 48
f (k), k-te Ableitung, 224
f#(M), Bild von M unter f , 47
p-Norm, 274