多変数関数の微分:第8 -...
Transcript of 多変数関数の微分:第8 -...
2012年度全学自由研究ゼミナール
多変数関数の微分:第8回6月 5日 清野和彦
6.5 極値判定についての補足
6.5.1 ヘッセ行列
前節で説明した極値判定法は「2次近似式を平方完成する」というのが基本的なアイディアでした。この考え方は 3変数以上にもそのまま適用可能ですが、変数を三つ以上持つ 2次式を平方完成するというのはかなり煩雑な作業です。そもそも、ここに言う平方完成では「ある変数に着目して
平方完成し、残った部分を別な変数に着目して平方完成し、それでも残った部分をさらに別の変数
に着目して平方完成し、、、」というように、本来対等であるはずの変数の間に順序を付けることに
なってしまいます。そのような「変数の間の差別」のない、すべての変数を対等に扱うようなもっ
とシステマティックな形に前節の判定法を整理することはできないものでしょうか?できます。それはヘッセ行列とその固有値というものを使う方法です。ただし、これを説明する
には冬学期の数学 IIの内容をどうしても使うことになります。だから、まだ学んでいない内容を
使って説明されても平気だという人以外は、気にせずに飛ばして次の節へ進んで下さい。
C2 級関数 f(x, y) と点 (a, b) に対し、ヘッセ行列と呼ばれる 2次正方行列を
Hf (a, b) =
[fxx(a, b) fxy(a, b)fxy(a, b) fyy(a, b)
]
によって定義します。ヘッセ行列を使うと、2次近似の 2次の部分を
12[x y
]Hf (a, b)
[x
y
]
というように行列の積を使って表すことができます。「2次近似を使った極値判定法」とは、このようにして表される 2次関数のグラフの形を分類することでしたので、それを行列から得られる情報で述べることができれば、3変数以上の関数へ判定法を拡張することができるのではないかと考えるわけです。
我々の調べたい状況を整理すると、
2次正方行列
H =
[A B
B C
](41)
が与えられたときに、2次式
Ax2 + 2Bxy + Cy2 =[x y
]H
[x
y
](42)
のグラフの形を調べる。特に (0, 0) が極小や極大になるのはいつか?
第 8 回 2
となります20。行列 H の特徴は (1, 2) 成分と (2, 1) 成分が等しいことです。一般に、任意の i, j
に対して aij = aji を満たす行列のことを対称行列と言います。転置しても元と変わらない行列、
つまり、対角成分のところを軸にパタッと折り返したとき、対応する右上の成分と左下の成分が等
しい行列のことです。以下では、行列 H についての固有値や固有ベクトルを利用して 2次式(42)をなるべく見易い形に変形することを考えましょう。
H の固有値を知るために、H の特性方程式
λ2 − (A+ C)λ+AC −B2 = 0
について考えましょう。これの判別式は
(A+ C)2 − 4(AC −B2) = A2 + 2AC + C2 − 4AC + 4B2 = (A− C)2 + 4B2 ≥ 0
ですので、H は必ず(実)固有値を持ちます。それを λ, µとしましょう(λ = µかも知れません。)
u =
[u1
u2
]が λ に属する固有値なら Hu = λu ですので、
[u1 u2
]H
[u1
u2
]=
[u1 u2
]λ
[u1
u2
]= λ(u2
1 + u22) = λ∥u∥2
となります。固有ベクトルは 0でない定数倍を施しても固有ベクトルのままですので、u として∥u∥ = 1 のものを選ぶことにしましょう。とりあえず µ = λ とすると、µ に属する固有ベクトル v は u と平行ではありません。つまり
u, v は R2 の基底になります。u と同様に v も ∥v∥ = 1 となるものを選びましょう。
[v1 v2
]H
[v1
v2
]= µ
です。
正方行列 M に対してその転置行列を tM と書くことにすると、tH = H ですので
λ(u1v1 + u2v2) = λ[v1 v2
] [u1
u2
]=
[v1 v2
]H
[u1
u2
]
=[u1 u2
]tH
[v1
v2
]=
[u1 u2
]H
[v1
v2
]
= µ[u1 u2
] [v1
v2
]= µ(u1v1 + u2v2)
となります。今 λ = µ と仮定しているので、これが成り立つことは u1v1 + u2v2 = 0 と同値です。これは u と v の内積が 0ということですので、u と v は直交しています。
以上のことから、u と v を横に並べた行列を P とする、すなわち
P =
[u1 v1
u2 v2
]
20前節までの記号に合わせて行列の成分を大文字の A, B, C で表します。「行列の区分け」と混乱しないようにご注意下さい。
第 8 回 3
とすると、
tPHP =
[u1 u2
v1 v2
][H
[u1
u2
]H
[v1
v2
] ]=
[u1 u2
v1 v2
][λu1 µv1
λu2 µv2
]
=
[λ(u2
1 + u22) µ(u1v1 + u2v2)
λ(u1v1 + u2v2) µ(v21 + v2
2)
]=
[λ 00 µ
]
となります。そこで、R2 の座標を、 [x
y
]= P
[X
Y
]
によって (x, y) から (X,Y ) に取り替えてみましょう。すると、2次式(42)は
Ax2 + 2Bxy + C2xy = (x, y)H
[x
y
]= (X,Y )P tHP (X,Y )
= (X,Y )P−1HP (X,Y ) = (X,Y )
[λ 00 µ
][X
Y
]= λX2 + µY 2
というように、平方完成したときとほぼ同じ形の式に変換されます。実は、λ = µ の場合にも同様
のことが成り立って、上の変形が可能です。(詳しくは数学 IIで学びます。)以上より、次が示せました。
ヘッセ行列の固有値を使った判定法� �f(x, y) を C2 級の 2変数関数とし、(a, b) をその停留点の一つとする。このとき
1. ヘッセ行列 Hf (a, b) の固有値がどちらも正なら、f(x, y) は (a, b) で極小。2. Hf (a, b) の固有値がどちらも負なら、f(x, y) は (a, b) で極大。3. Hf (a, b) の固有値が正と負なら、(a, b) は f(x, y) の鞍点。
が成り立つ。� �3変数以上の場合でも全く同様の判定法が成り立ちます。つまり、n変数の C2級関数 f(x1, x2, . . . , xn)に対し、2回微分を成分とする n 次正方行列
fx1x1(a1, . . . , an) fx1x2(a1, . . . , an) · · · fx1xn(a1, . . . , an)fx1x2(a1, . . . , an) fx2x2(a1, . . . , an) · · · fx2xn(a1, . . . , an)
......
. . ....
fx1xn(a1, . . . , an) fx2xn(a1, . . . , an) · · · fxnxn(a1, . . . , an)
を (a1, . . . , an) におけるヘッセ行列と定義すると、上で説明した固有値と 2次式の議論がすべて適用でき、結論として
(a1, . . . , an) が停留点のとき、ヘッセ行列の固有値がすべて正なら (a1, . . . , an) で極小、すべて負なら (a1, . . . , an) で極大、正と負が混ざっているなら (a1, . . . , an) では極大でも極小でもない21、固有値に 0があるなら判定不能
213 変数以上の場合にも「鞍点」と呼ぶかどうかは人によります
第 8 回 4
が得られるというわけです。
なお、2変数の場合、平方完成による判定法とヘッセ行列の固有値の正負による判定法が同じものであることは、次のように分かります。2次正方行列(41)の固有値とは、特性方程式
λ2 − (A+ C)λ+AC −B2 = 0
の解のことでした。二つの解を λ µ とすると、解と係数の関係により、
λ, µとも正⇐⇒ A+ C = λ+ µ > 0かつ AC −B2 = λµ > 0
⇐⇒ A > 0かつ AC −B2 > 0
および、
λ, µとも負⇐⇒ A+ C = λ+ µ < 0かつ AC −B2 = λµ > 0
⇐⇒ A < 0かつ AC −B2 > 0
および、
λと µが異符号⇐⇒ AC −B2 = λµ < 0
となって二つの判定法が全く同じものであることが分かります。AC −B2 という「判別式もどき」
はヘッセ行列の行列式だったのです。(ヘッセ行列の行列式のことをヘッシアンといいます。)
6.5.2 「常識」による判定
これまで議論してきた判定法は、停留点 (a, b) で fxx(a, b)fyy(a, b) − (fxy(a, b))2 = 0 となっている場合には極大極小を判定できませんでした。言葉を換えて言えば、この判定法は極大や極小で
あるための一つの十分条件に過ぎないわけです。しかし、極大と極小は 2次近似どころか関数の連続性さえ使わずに定義された概念です。だから、判定法に頼らなくても「常識的な判断」で判定の
つくこともあり得ます。(鞍点だけは 2次近似を使って定義されたもの22ですので、2次近似を使わずに判定することはできません。)例えば、グラフの形を想像してみるだけで極大極小が判定出
来てしまうこともあります。
例 5. 関数
f(x, y) = xy(x+ y − 1)
の停留点の極大極小を、2階偏微分を使わずに考察してみましょう。停留点を求めるために偏導関数を計算します。すると、
∂f
∂x(x, y) = y(2x+ y − 1)
∂f
∂y(x, y) = x(x+ 2y − 1)
となります。よって、停留点は
(0, 0) (0, 1) (1, 0)(
13,13
)の 4点です。
第 8 回 5
� �
負
正
負
正
正負 負
x
y
1
1
0
x+ y = 1
図 32: 例 5の関数の値の正負。� �ところで、f(x, y) は三つの 1次関数 x, y, x+ y− 1 を掛けたものですので、f(x, y) = 0 となるのは三つの直線 x = 0, y = 0, x+ y = 1 の上だけであり、f(x, y) の値の正負は図 32のようになります。
この図から (0, 0), (1, 0), (0, 1) が極大でも極小でもないことがわかってしまいます。なぜなら、f(0, 0) = f(1, 0) = f(0, 1) = 0 なのに、それらの点のいくらでも近くに f の値が正になる点も負
になる点もあるからです。
また、第 1象限にある三角形の中に少なくとも一つ極小点があることもわかります。一方、その中にある停留点は ( 1
3 ,13 ) だけであることを既に知っています。よって、( 1
3 ,13 ) は極小点でなけれ
ばなりません。
このように 2階微分を計算しなくても 2変数関数なら図から状況を見て取ることができる場合があります。 ■
多変数関数になっても最も重要なことは「極大点」や「極小点」とはどういうものかという、い
わば常識に基づいた判断なのです。決してテクニックに溺れることのないように気を付けてくださ
い。ここで学んだ極値判定法にしても、それを間違いなく憶えることより、それでなぜ極値かどう
かが判定できたことになるのかという理屈を、極大や極小の常識的な意味と照らし合わせて納得す
ることの方がはるかに重要だと思います。
問題 34. 関数
f(x, y) = xy(x2 + y2 − 1)
の停留点をすべて求め、そこが極大点か極小点かを
(1) 判定法で (2) 例 5のような方法で調べよ。 ♪
最後に、多変数ならではの注意を一つして第 6章を閉じることにしましょう。例えば
(a, b) が極小であるとは f(x, y) の定義域を (a, b) を通るどの直線に制限しても (a, b)で極小であることだろう
というように 1変数関数に帰着してしまいたくなるかも知れませんが、これは間違っています。つまり、f(x, y) が (a, b) で極小とは、
222 次近似を使わずに鞍点を定義する流儀もいくつかあります。それらの定義は 2 次近似を使った定義と少しずれます。ここでは詳しくは扱いませんが、数学 I の講義や参考書で鞍点を学ぶときには注意してください。
第 8 回 6
z = f(x, y) のグラフが (a, b) のところで一番下がっている
ことですが、そのことと、
z 軸に平行で (a, b) を通る任意の平面でグラフを切ったとき、断面にあらわれる曲線が(a, b) のところで一番下がっている
ことが同じことだという考えは間違いなのです。極小ならこうなっているのは確かに正しいですが、
これが成り立つからといって極小になっているとは限りません。具体例を問題にしておきます。
問題 35. 関数 f を
f(x, y) = (y − x2)(y − 2x2)
とする。
(1) 原点を通る任意の直線に定義域を制限したとき、原点は極小点であることを示せ。つまり、同
時には 0でない二つの任意の実数 u, v をとり、
φ(t) = f(ut, vt)
によって φ(t) を定義すると、t = 0 で φ は極小になることを示せ。
(2) (0, 0) は f の極小点ではないことを証明せよ。 ♪
7 合成関数とその微分公式
この章では、多変数関数における合成関数の微分公式を扱います。既に学んだように、三種類の
微分のどれであっても実際に計算するのは偏微分ですので、この公式は「偏微分を計算するため
の公式」です。1変数関数では、合成関数の微分公式のほかに積の微分や商の微分というものもあり、それらを使わなければ多くの関数は微分できませんでした。しかし、多変数関数ではそんなも
のなしで計算できることはここまでで経験してもらったとおりです。それでは、なぜいまさら合成
関数の微分公式だけ特別に学ばなければならならないのでしょうか。以降、合成関数の微分公式だ
けを特別扱いする理由を説明し、合成関数の概念を復習しつつ微分公式を紹介し、そのあと公式を
証明します。そして最後に、公式のもっと進んだ取り扱い方や意味を説明します。
7.1 合成関数の微分だけ特別扱いするのはなぜか
高校で 1変数関数の微分を勉強したとき、まず微分や導関数を定義し、次に多項式や三角関数などのよく出会う関数の導関数を具体的に求め、最後に積、商、合成関数、逆関数の微分法を調べ
ました。これらの「公式」が手に入ったことによって、具体的に微分できる関数がいくつかあると
き、それらを足し引きしてできる関数はもちろん、掛けたり割ったり合成したり逆関数を作ったり
しても微分できることになりました。簡単に言えば、「式一本」で書ける関数は何でも微分できる
ようになったわけです。このように、積や合成関数の微分公式があると、微分できる関数の世界が
一気に広がります。
事情は多変数でも同じであるはずです。我々は、ここまでで多変数関数の微分を十分吟味して定
義したので、次にすべきことは、基本的な多変数関数の偏導関数を求めることと、積や合成関数の
微分公式を得ることでしょう。
第 8 回 7
ところが、そんな「技術」を特別用意したわけでもないのに、これまでに既にたくさんの具体的
な多変数関数を微分してきました。それができた理由は、偏微分が注目した変数以外は定数と見な
すことによる 1変数関数としての微分であることです。基本的な多変数関数(つまり、式で書ける多変数関数)は式で書ける 1変数関数をいくつかそれぞれ別の変数を持つ関数として用意し、それらを足したり引いたり掛けたり割ったり合成したりしてできるものなので、基本的な多変数関数が
具体的に与えられたら、それを偏微分することは 1変数関数の微分の知識の範囲内で完全にできてしまうわけです。
例えば、f(x, y) = xy sinx cos y とすると、x で偏微分するときは y cos y は定数扱い、y で偏微分するときは x sinx は定数扱いなので、
∂f
∂x(x, y) = y cos y
d
dx(x sinx) = y cos y(sinx+ x cosx)
∂f
∂y(x, y) = x sinx
d
dy(y cos y) = x sinx(cos y − y sin y)
というように 1変数関数の積の微分法で計算できてしまうことは、既に何度も経験してもらいました。商の微分も全く同様でした。また、例えば sin z に z = x2y3 を合成した関数 g(x, y) = sinx2y3
を考えても、やはり x で偏微分するときは y3 は定数扱い(つまり x2 の単なる係数)、y で偏微
分するときは x2 は定数扱い(つまり y3 の単なる係数)なので、
∂g
∂x(x, y) = 2xy3 cosx2y3 ∂g
∂y(x, y) = 3x2y2 cosx2y3
と計算できました。なお、多変数関数には逆関数は存在しないので23、「多変数関数そのものにつ
いての逆関数の微分法」というものは存在しません。(多変数で逆関数に当たる概念は第 8章で少し説明する予定です。)
多変数関数の微分には偏微分以外にも方向微分や 1次近似(全微分可能ということ)があるではないかと思うかも知れません。しかし、基本的な多変数関数はすべて C1 級(偏導関数が連続関数
である関数)なので、これらの微分の概念はすべて同じものの別な姿だと思えます。だから、偏微
分さえ分かればよいので、結局 1変数関数の微分の範囲内に収まってしまいます。しかし、上の偏微分の計算には 1変数関数のときとはちょっとだけ違っている面があります。1変数関数のときには、基本的な関数の導関数を求めるのとは別に積、商、合成関数の微分法を「公
式」として用意したのでした。だから、例えば大学で初めて出会った逆三角関数のようなもので
も、高校のときに用意しておいた公式だけで微分を計算することができた(or る)わけです。ところが、上でお見せした偏微分の計算は、偏微分しようとする関数の中に現れている 1変数関数が導関数を既に知っている関数だったからできたように見えます。つまり、多変数関数の偏微分その
ものに対する「公式」にはなっていないわけです。具体的な関数の姿を使わない理論として偏微分
の間の関係を考えるには、いわば「抽象的な」公式を求めておかなければなりません。
とは言え、積や商の微分公式は実はほとんど 1変数のときのままです。実際、例えば f(x, y) とg(x, y) の y に定数 b を代入してできる x の 1変数関数を φ(x) = f(x, b), ψ(x) = g(x, b) と書くことにすれば、f と g の積 fg の (a, b) における x による偏微分は、偏微分の定義から
∂(fg)∂x
(a, b) =d(φψ)dx
(a) =dφ
dx(x)ψ(a) + φ(a)
dψ
dx(a)
=∂f
∂x(a, b)g(a, b) + f(a, b)
∂g
∂x(a, b)
23z = f(x, y)の逆関数とは、(x, y) = (g1(z), g2(z))であって f(g1(z), g2(z)) = z と g1(f(x, y)) = x, g2(f(x, y)) = yを満たすものということになりますが、(x, y) = (g1(z), g2(z)) というのは z をパラメタとするパラメタ曲線ですので、f(x, y) の定義域(平面内で広がりを持つ部分)全体を値域とすることはできません。よって、多変数関数には逆関数は存在しません。
第 8 回 8
となります。(二つ目の等号で 1変数関数の積の微分法を使っています。)x での偏微分を下付添え字で fx, gx などと表し、「どこでの偏微分か」を表す (a, b) を省略して書けば、1変数関数の積の微分法の式にもっと似た形の
(fg)x = fxg + fgx
で表すことができます。商の微分も全く同様で、1/f の (a, b) における x による偏微分は、上と
同様に φ(x) = f(x, b) と書くことにすると、
∂
∂x
(1f
)(a, b) =
d
dx
(1φ
)(a) = − 1
(φ(a))2dφ
dx(a) = − 1
(f(a, b))2∂f
∂x(a, b)
となります。(二つ目の等号で 1変数関数の商の微分法を使っています。)つまり、(1f
)x
= −fx
f2
というように 1変数関数のときと全く同じ式になっているわけです。というわけで、合成関数の微分公式を求めることだけが残るわけです。もちろん、これも積や商
のように簡単に求まり、しかも求められたらそれで終わり、というようなものならそれだけのため
の章を立てたりはしません。合成関数の微分を特別扱いする理由は
1. 1変数関数の場合より合成関数の概念そのものが捉えにくい。
2. 証明が難しく、何をしているのかわかりにくい。
3. 合成関数の微分公式をよく見ることで、多変数写像の微分のあるべき姿が見えて
くる。
といったことです。
7.2 合成関数の微分公式
まず、合成関数の微分公式を証明抜きで紹介します。多変数の合成関数には多くの変数と多くの
関数が出てくるので、記号の使い方もここで決めてしまいましょう。読んでいて記号で混乱したら
ここに戻ってみて下さい。
1変数関数が二つ、例えば f(x) と g(x) があったとき、もしも g(x) の値域が f(x) の定義域に含まれているなら、g(x) を f(x) の x のところに入れることができます。ただ、このように書く
と x が二重の意味を持ってしまう(g の独立変数としての意味と、g の従属変数としての意味)の
で、紛れがないように文字を決めましょう。普通「y = g(x) を f(y) に代入する」というように記号を決めると思いますが、このあと 2変数関数を考えるときに文字が足りなくなってしまうので、次のように 1変数のときからギリシャ文字を使わせてもらうことにします。あとで 2変数関数を考えるときに変数は 2つ一組で必要になります。よく使う組は (x, y), (u, v),
(s, t) などでしょう。このゼミでは (u, v) の組はベクトルの成分として使ってきたので、(s, t) を使うことにしましょう。変数が一つしかないときは普通 s より t を使うと思いますが、2変数になったときの混乱を避けるために、1変数のときは s を使うことにします。x に対応するギリシャ文字
は ξ、y に対応するギリシャ文字は η なので、x に代入される関数を ξ(s) や ξ(s, t)、y に代入される関数を η(s) や η(s, t) としましょう。ξ や η という文字になじみの薄い人も多いと思います
が、是非ここで慣れてください。
第 8 回 9
7.2.1 1変数関数に 1変数関数を入れた場合
1変数関数 f(x) に 1変数関数 ξ(s) を合成するということは、イメージ的には図 33のようになります。これは「s に f(ξ(s)) を対応させる」という歴とした関数ですので、関数らしい記号を決� �
ξ fs ξ(s) f(ξ(s))
図 33: 「1変数関数を二つ合成する」ということのイメージ。� �めておくのがよいでしょう。「f(ξ(s)) でよいのでは?」と思うかも知れませんが、f(ξ(s)) という記号には「関数そのものを表す部分」がないのが問題です。関数 f(x) は (x) を省いて f と書く
ことができる、つまり f が関数そのものを表しているように、f(x) に x = ξ(s) を代入してできる関数にも、このようにして定義された関数だということが一目で分かるような「関数そのものを
表す記号」を決めたいわけです。f(ξ(s)) がダメな理由は大きな括弧があるからなので、それを省いてやったらどうか、と思うかも知れませんが、そうすると fξ(s) となって積と紛らわしくなってしまいます。そこで、f と ξ の間に「積ではなくて合成だよ」ということを表す印を入れてやれ
ばよいのではないかと思えてくるでしょう。積は「·」で表すことが多いので、もう少し偉そうに「◦」にするのが一般的です。つまり、
関数 f ◦ ξ を
f ◦ ξ(s) = f(ξ(s))
によって定義する
というわけです (図 34)。 関数の名前は普通は f とか φ などのような一文字で表すことが多いの� �
ξ fs f(ξ(s))
f ◦ ξ
図 34: 出力口と入力口を貼り付けて全体を大きな箱に入れる。� �で違和感があるかも知れませんが、例えば sin の三文字で一つの関数の名前であるように f ◦ ξ の「三文字」で一つの関数の名前なのだ、もっといえば f ◦ ξ で「一文字」なのだと思って下さい。
f の独立変数と ξ の独立変数を別な文字で表したように、物理などの具体的な状況を考えると
きには f の独立変数と ξ の独立変数は別な意味を持つ量を考えることが多いと思います。このよ
第 8 回 10
うな場合には、定義域(を含む R)や値域(を含む R)をはっきり書き表す「写像の記法」を使うと状況がよりはっきりするでしょう。
f ◦ ξ : Rξ−−−−→ R
f−−−−→ R
となります。この記法やイメージ図 33と f ◦ ξ や f(ξ(s)) という記号では f と ξ の順序が逆に
なっていることに注意してください。
この場合の合成関数の微分公式は高校のときに学んだとおり、
d(f ◦ ξ)ds
(s) =df
dx(ξ(s))
dξ
ds(s) すなわち (f ◦ ξ)′(s) = f ′(ξ(s))ξ′(s)
です。変数 s を省いて「関数そのもの」の等式として書くと
d(f ◦ ξ)ds
=(df
dx◦ ξ
)· dξds
すなわち (f ◦ ξ)′ = (f ′ ◦ ξ) · ξ′
となります24。
注意. 上の書き表し方はかなり丁寧というかくどい書き方です。ξ(s) を x と書いてしまって、
d(f ◦ ξ)
ds(s) =
df
dx(x)
dξ
ds(s) あるいは (f ◦ ξ)′(s) = f ′(x)ξ′(s)
とすることが多いと思います。さらに、s と x が x = ξ(s) で結びついていることは分かり切っていると考えて省いてしまい、
d(f ◦ ξ)
ds=
df
dx
dξ
dsあるいは (f ◦ ξ)′ = f ′ · ξ′
と書くことの方が多いかも知れません。右側の書き方では、f は x の関数なのだから f ′ は x での微分、ξ はs の関数なのだから ξ′ は s による微分しかあり得ないので誤解の余地はないわけです。そのことを逆手に取ると、左側の書き方ではどの変数による微分かをはっきり書いているのだから、f ◦ ξ のことを f と書いてしまっても誤解は起こりえないとも言えます。つまり f そのものは x でしか微分できないのだから、df/dsと書くことによって f と ξ の合成関数を微分していることまで表せていると考えるわけです。さらに 関数 ξは x に代入されるわけですから、ξ と書かずに x と書いてしまってもこれまた誤解の余地はないはずです。文字の節約のためにも x に代入される関数を x(s) と書く方が普通でしょう。というわけで、
df
ds=
df
dx
dx
ds
という、物理の本などでよく見かける書き方が得られるわけです。この書き方は、df や dx をただの数だと思って普通に分数の掛け算をすると両辺が一致するので印象に残
りやすいのですが、これから見るように、多変数関数の合成関数の微分公式ではそうはなっていないので、かえって間違いの元になる可能性もあります。便利な記憶法にはあまり頼らず、公式の成り立つ理由(証明のポイント)を理解するのがよいと思います。★
問題 36. φ(s) = sin(es) を微分せよ。 ♪
7.2.2 1変数関数に 2変数関数を入れた場合
次に 2変数関数を合成することを考えたいのですが、「入れ物」の方の関数 f と中に入る方の関
数 ξ(と η)の両方を一遍に 2変数関数にすると混乱しやすいと思うので、徐々に変数の数を増やして行きましょう。
24· は掛け算です。(s) がある場合のように · なしでももちろんよいのですが、私の目にはわかりにくいように見えるので (s) なしの方では付けることにしました。
第 8 回 11
まず f(x) に x = ξ(s, t) を合成することを考えます。この場合は 1変数関数に 1変数関数を合成する場合と大差ありません。実際、記号は
f ◦ ξ(s, t) = f(ξ(s, t))
というように全く同じで済むし、イメージ図も図 35を真ん中でくっつけて図 36になるだけで、1変数関数に 1変数関数を合成するときとの違いは、一番左側のインプット口が二つあるということだけです。� �
ξ f
s
ξ(s, t) f(ξ(s, t))t
図 35: 2変数関数の出力を 1変数関数に入力する。� �� �
ξ f
s
f(ξ(s, t))
f ◦ ξ
t
図 36: 出力口と入力口を貼り付けて全体を大きな箱に入れる。� �写像の記法では、二つの変数 s, t を平面上の点の座標のように考えて
f ◦ ξ : R2 ξ−−−−→ Rf−−−−→ R
と書きます。
この場合の合成関数の微分法は次のようになります。
∂(f ◦ ξ)∂s
(s, t) =df
dx(ξ(s, t))
∂ξ
∂s(s, t)
∂(f ◦ ξ)∂t
(s, t) =df
dx(ξ(s, t))
∂ξ
∂t(s, t)
すなわち
(f ◦ ξ)s(s, t) = f ′(ξ(s, t))ξs(s, t) (f ◦ ξ)t(s, t) = f ′(ξ(s, t))ξt(s, t)
です。関数そのものの等式として書くなら、
∂(f ◦ ξ)∂s
=(df
dx◦ ξ
)· ∂ξ∂s
∂(f ◦ ξ)∂t
=(df
dx◦ ξ
)· ∂ξ∂t
第 8 回 12
すなわち
(f ◦ ξ)s = (f ′ ◦ ξ) · ξs (f ◦ ξ)t = (f ′ ◦ ξ) · ξt
となります。ただし、x = ξ(s, t) によって x と s, t が結びついていることは分かり切っていると考えて、
∂(f ◦ ξ)∂s
(s, t) =df
dx(x)
∂ξ
∂s(s, t)
∂(f ◦ ξ)∂t
(s, t) =df
dx(x)
∂ξ
∂t(s, t)
あるいは
(f ◦ ξ)s(s, t) = f ′(x)ξs(s, t) (f ◦ ξ)t(s, t) = f ′(x)ξt(s, t)
と書くことが多いと思います。さらに省略して
∂(f ◦ ξ)∂s
=df
dx· ∂ξ∂s
∂(f ◦ ξ)∂t
=df
dx· ∂ξ∂t
あるいは
(f ◦ ξ)s = f ′ · ξs (f ◦ ξ)t = f ′ · ξt
と書いてしまうことも多いと思います。すべて 1変数関数同士の合成関数の場合と同じです。慣れないうちは面倒でも省略の少ない書き方をすることをお勧めします。なお、f は 1変数関数なので、その微分には df/dx や f ′ など 1変数関数の微分の記号を使っていることに注意してください。合成関数が 2変数なので s による偏微分と t による偏微分の二つあって 1変数関数同士のときより複雑に見えるかも知れませんが、一つ一つを見れば 1変数関数同士のときの公式とほとんど同じであることがわかるでしょう。その理由は偏微分の定義を思い出してみればすぐわかるので、1変数関数の合成関数の微分公式を認めることにしてここで証明をしてしまってもよいくらいなのですが、話が前後するのを避けるために、証明はすべて次節以降にまわすことにします。イメージ図 37だけ書いておきます。� �
ξ fs
ξ fs
=b b
図 37: 合成してから t = b を代入するのと、t = b を代入してから合成することは同じ操作。� �注意. 1変数関数同士のときの注意の最後に書いた記法を使ってみましょう。つまり、f ◦ ξ のことも f と書いてしまい、ξ のことは x と書いてしまうわけです。すると、例えば s での偏微分は
∂f
∂s=
df
dx
∂x
∂s
となります。これは d と ∂ の違いを無視すれば普通の分数の間の等式になっています。★
問題 37. φ(s, t) = sin(s2t) とする。(1) この節で紹介した公式を使わずに、1変数関数の合成関数の微分公式の範囲内で二つの偏導関数を計算せよ。(つまり、このゼミでこれまでやってきたように偏微分せよ。)
(2) φ(s, t) を f(x) = sinx に ξ(s, t) = s2t を合成した合成関数と見ることによりこの節で紹介し
た公式を使って二つの偏導関数を計算し、(1)で計算したものと一致していることを確認せよ。♪
第 8 回 13
7.2.3 2変数関数に 1変数関数を 2つ入れた場合
f が 2変数関数 f(x, y) で、これに二つの 1変数関数 ξ(s), η(s) を合成する場合を考えましょう。この場合は今までとは違って少し複雑になります。イメージ図 38を見て下さい。� �
s コピー機 s
s
ξ
η η(s)
ξ(s)
f f(ξ(s), η(s))
図 38: 2変数関数に 1変数関数を二つ合成するには「コピー機」が必要。� �注意. ここで、中に入れる関数を ξ(s), η(t) というように別な独立変数を持つ 1 変数関数にしてはいけません。「関数を合成する」ということの意味は、
元の独立変数(たち)を別な独立変数(たち)の従属変数と見なす
ということなので、f(ξ(s), η(t)) という関数は
元の独立変数 x, y を新しい独立変数 s, t の従属変数と見なす
ということになってしまいます。つまり、この場合 ξ(s) という関数は s の 1変数関数ではなく、s と t を変数に持つ 2変数関数だがたまたま t には依存していない、と考えなくてはならないということになるわけです。だから、f(ξ(s), η(t)) という合成関数はこのあとで紹介する「2変数関数に 2変数関数を合成する」という場合に入ることになります。★
さて、これまでと同じようにイメージ図 38の出力口と入力口を貼り付けて一つの関数を作ってみましょう。すると、図 39のようになります。 これまでは大きな箱(つまり新しい関数)の中に� �
s コピー機 ξ
η
f f(ξ(s), η(s))
図 39: 大きな箱の中にコピー機まで入ってしまっているところが今までと違う。� �は古い関数たちが入っているだけでしたが、この場合は「コピー機」まで中に入ってしまっている
ところが違います。これまでの 2つの場合には、新しい独立変数 s(や t)の従属変数は x ただ一
第 8 回 14
つだったのに、この場合には s の従属変数が x と y の二つあるところが大きな違いを生むのです。
そのことが原因で ◦ を使った合成関数の「名付け」もうまくいきません。上手く名前を付けるには、関数(すなわち行き先が R)をはみ出して、ξ と η を合わせて一つの写像(今の場合は行き
先が R2)と見なさなければならないのです。
しかし、その見方は前節で「合成関数の微分を特別扱いする意味」を三つ挙げたうちの最後のも
のに深く関連しており、合成関数というものを見る視点を変えなければ理解できないので、あとで
改めて説明することにし、この節では合成関数の微分公式を紹介するだけにします。
さて、f ◦ ξ のような記号がないので、
φ(s) = f(ξ(s), η(s))
というように別の記号で表すことにします。(φ は f に当たるギリシャ文字です25。)すると、
dφ
ds(s) =
∂f
∂x(ξ(s), η(s))
dξ
ds(s) +
∂f
∂y(ξ(s), η(s))
dη
ds(s)
すなわち、
φ′(s) = fx(ξ(s), η(s))ξ′(s) + fy(ξ(s), η(s))η′(s)
となります。ξ と η は 1変数関数なので dξ/ds や ξ′ という 1変数関数の微分の記号を使うことは前の場合と同じです。
既に指摘したように、この場合は(写像という概念を使わず関数の範疇に留まるなら)◦ を使った合成関数の書き方ができないので、ここから (s) を取り除いて関数そのものの間の等式を作ることはできませんが、x = ξ(s), y = η(s) はわかっているものとしてしてしまえば、
dφ
ds=∂f
∂x
dξ
ds+∂f
∂y
dη
ds
あるいは
φ′ = fx · ξ′ + fy · η′
と書き表すことはできます。
この場合には、合成関数の中にコピー機が入っていること、つまり x も y も s に依存している
ことから、s で微分するだけなのに x による偏微分の項と y に偏微分の項の両方が出てきてしま
うというところが重要です。
f が x だけの関数だった場合の 1変数関数の合成関数の微分公式と f が y だけの関数
だった場合の 1変数関数の合成関数の微分公式の両方が足されてしまう
と見れば自然に見えてくるのではないでしょうか。
注意. このタイプの合成は力学でよく出会います。平面の各点 (x, y) にある「量」(たとえば「高さ」)f(x, y)が与えられている一方、その平面上を時刻 t に (ξ(t), η(t)) という場所にいるように運動している粒子があったとき、時刻 t に粒子の居場所に対応する「量」(たとえば「高さ」)を対応させることで関数 φ(t) ができるわけです。例によって物理では φ という新しい文字を避けて f と書き、ξ と η のことも x, y と書いてしまうので、
df
dt=
∂f
∂x
dx
dt+
∂f
∂y
dy
dt
25正確には physics や photograph の ‘ph’ に当たるのだと思います。
第 8 回 15
となります。これでも誤解の余地はないというわけです。さらに、時刻による微分は上付きの点で表すことが多いので、
f =∂f
∂xx +
∂f
∂yy
と書いたりします。「高さ」の例では、x, y, f はそれぞれ粒子の速度の x 軸方向成分、y 軸方向成分、高さ方向成分を表しています。★
問題 38. φ(s) = es sin s とする。(1) s の 1変数関数として普通に微分せよ。(2) φ(s) を f(x, y) = xy に ξ(s) = es と η(s) = sin s を合成した合成関数と見ることによりこの節で紹介した公式を使って導関数を計算し、(1)で計算したものと一致していることを確認せよ。♪
7.2.4 2変数関数に 2変数関数を 2つ入れた場合
「1変数関数に 1変数関数を入れた場合」と「1変数関数に 2変数関数を入れた場合」で実質的な違いがなかったのと同じ理由で、「2変数関数に 1変数関数を 2つ入れた場合」と今から述べる「2変数関数に 2変数関数を 2つ入れた場合」にも実質的な違いはありません。新しい変数が一つ増えたのでもう一つコピー機が必要になり、合成関数の中にはコピー機が 2台入っていることになりますが、例えば s という変数で偏微分する場合には、s の通るコピー機はそのうちの 1台だけなので「2変数関数に 1変数関数を 2つ入れた場合」と同じになるわけです。イメージ図は図 40と図 41です。� �
s コピー機 s
s
ξ
η
η(s, t)
ξ(s, t)
f f(ξ(s, t), η(s, t))
t コピー機 t
t
図 40: コピー機が 2台必要。� �「2変数関数に 1変数関数を 2つ入れた場合」と同様、(写像を使わず関数の範疇だけで考えるなら)f と ξ と η と ◦ という記号で合成関数を表すことはできないので、φ を使って
φ(s, t) = f(ξ(s, t), η(s, t))
第 8 回 16
� �s コピー機
ξ
η
f f(ξ(s, t), η(s, t))
t コピー機
図 41: コピー機が 2台入っているが、それぞれの変数の通るコピー機は 1台だけ。� �と表すことにします。すると、
∂φ
∂s(s, t) =
∂f
∂x(ξ(s, t), η(s, t))
∂ξ
∂s(s, t) +
∂f
∂y(ξ(s, t), η(s, t))
∂η
∂s(s, t)
∂φ
∂t(s, t) =
∂f
∂x(ξ(s, t), η(s, t))
∂ξ
∂t(s, t) +
∂f
∂y(ξ(s, t), η(s, t))
∂η
∂t(s, t)
すなわち、
φs(s, t) = fx(ξ(s, t), η(s, t))ξs(s, t) + fy(ξ(s, t), η(s, t))ηs(s, t)
φt(s, t) = fx(ξ(s, t), η(s, t))ξt(s, t) + fy(ξ(s, t), η(s, t))ηt(s, t)
となります。x = ξ(s), y = η(s) はわかっているものとしてして省略した書き方をすると、
∂φ
∂s=∂f
∂x
∂ξ
∂s+∂f
∂y
∂η
∂s
∂φ
∂t=∂f
∂x
∂ξ
∂t+∂f
∂y
∂η
∂t
あるいは
φs = fx · ξs + fy · ηs
φt = fx · ξt + fy · ηt
となります。
ゴチャゴチャしてわかりにくく見えるかも知れません。しかし、考えてみれば偏微分というのは
微分しない変数のことは定数と考えるのですから、s で偏微分する場合 t は定数扱いなので公式の
中に t による偏微分は出てくるはずがありません。一方、「2変数関数に 1変数関数を 2つ入れる
第 8 回 17
場合」と同様、s という変数は x と y の両方を通じて f にかかわっているのですから、s での偏
微分には x による偏微分と y による偏微分の両方が入っていなければおかしいということになり
ます。そう思ってから公式を見直すと、特にゴチャゴチャしているようには見えなくなるのではな
いかと思います。
注意. このような f と s, t との関わり方を考えると、次のような方法で公式を書き下せば間違いにくいのではないかと思います。
s で偏微分する場合で考えてみましょう。まず一つ目の方法として、
1変数関数の合成関数の微分公式を繰り返す
と考えてみます。まず f が x だけの関数であるかのように考えて
∂f
∂x
∂ξ
∂s
と 1変数関数の微分公式で d を ∂ に変えたものを書きます。次に、f を y だけの関数であるかのように考えて、このとなりに
∂f
∂y
∂η
∂s
を書きます。そして最後に真ん中に + を書いて
∂f
∂x
∂ξ
∂s+
∂f
∂y
∂η
∂s
とするわけです。もう一つの方法として、
f のすべての変数が s に依存しているのだから、f の偏微分はすべて出てくる
という方に着目してみましょう。この場合にはまず f の偏微分を
∂f
∂x
∂f
∂y
というように間をあけて並べて書いてしまいます。そして、x による偏微分には x に入っている関数 ξ を偏微分したい変数 s で偏微分したものを掛け、y による偏微分には y に入っている関数 η を s で偏微分したものを掛けて足し合わせるわけです。
∂f
∂x
∂ξ
∂s+
∂f
∂y
∂η
∂s
となります。まだ証明していないのだから納得はできないかも知れませんが、証明の前にこのように何度も書き下してみ
て何が起きているのか自分なりの手応えを掴んでおくことが大切だと思い、少ししつこく書いてみました。★
問題 39. φ(s, t) =(sin(st)
)(cos(s2 + t2)
)とする。
(1) この節で紹介した公式を使わずに、1変数関数の合成関数の微分公式の範囲内で二つの偏導関数を計算せよ。(つまり、このゼミでこれまでやってきたように偏微分せよ。)
(2) φ(s, t) を f(x, y) = (sinx)(cos y) に ξ(s, t) = st と η(s, t) = s2 + t2 を合成した合成関数と見
ることによりこの節で紹介した公式を使って二つの偏導関数を計算し、(1)で計算したものと一致していることを確認せよ。 ♪
第 8 回 18
7.2.5 一般の場合
このゼミでは原則として 2変数の場合しか扱いませんが、ここまでの 4つの場合でどのように公式が変化したかをよく見てもらえれば、f が m 変数関数で、そこに m 個の n 変数関数を入れた
場合の微分公式も正しく予想できるだろうと思うので、ここに答を書いておきましょう。
f(x1, x2, . . . , xm)に xi = ξi(s1, s2, . . . , sn)を入れてできる s1, s2, . . . , sn の関数を φとします。
φ(s1, s2, . . . , sn) = f(ξ1(s1, s2, . . . , sn), ξ2(s1, s2, . . . , sn), . . . , ξn(s1, . . . , sn))
ということです。この関数 φ の si による偏微分は次のようになります。ただし、長くなるので
「どこでの微分か」を省いた書き方で書きます。
∂φ
∂si=
∂f
∂x1
∂ξ1∂si
+∂f
∂x2
∂ξ2∂si
+ · · · + ∂f
∂xm
∂ξm∂si
=m∑
j=1
∂f
∂xj
∂ξj∂si
(43)
です。思った通りでしたか?
7.3 注意:「連鎖律」という用語について
合成関数の微分公式のことを「連鎖律」と呼ぶことが多いのですが、実は、教科書によって(つ
まり人によって)この言葉で指している公式が違っているのです。
連鎖律は英語で言うと chain rule となります。(そのまんまです。)「連鎖」とか「chain」という言葉の意味するところは「連鎖反応」などと同じだと思います。とすると、上で紹介した微分公
式(43)を連鎖律と呼ぶ人の心は、
s で偏微分しただけなのに、f のすべての変数が s とつながっているために、f のす
べての偏微分が出てきてしまう
というところに「連鎖」の気持ちを感じているのだと思います。だから、このように連鎖律という
言葉を使う人は 1変数関数の合成関数の微分公式のことは連鎖律とは呼ばないようです。一方、1変数関数の微分公式
(f ◦ ξ)′ = (f ′ ◦ ξ) · ξ′
は
全体を微分することが一つ一つの関数の微分を引き起こしている
と見ることができます。二つの関数の合成だとわかりにくいですが、例えば、
(f4 ◦ f3 ◦ f2 ◦ f1)′ = (f ′4 ◦ f3 ◦ f2 ◦ f1) · (f ′3 ◦ f2 ◦ f1) · (f ′2 ◦ f1) · f ′1
と関数を増やして書いてみると、いかにも「連鎖反応」が起きているように見えないでしょうか?(省略した書き方で、
(f4 ◦ f3 ◦ f2 ◦ f1)′ = f ′4 · f ′3 · f ′2 · f ′1
とした方が、「連鎖」っぽく見えるという人もいるかもしれません。)これは 1変数関数の場合だけの公式ですが、写像の概念を使うと、この公式は多変数でもそのまま成り立つことが結論できるの
第 8 回 19
です。この形まで話を整理してはじめて「連鎖律」と呼ぶのだと考える人もいます。その場合は 1変数関数の合成関数の微分公式も連鎖律と呼ぶことになるでしょう。
おそらく前者の使い方の方が普通だと思いますが、後者の使い方をする人も結構いますし、そう
いう教科書もかなりあります。そういうわけなので、混乱を避けるためにこのプリントでは連鎖律
という言葉は使わないことにしました。
第 8 回 20
解答
問題 34の解答
f(x, y) を偏微分すると、
∂f
∂x(x, y) = y(3x2 + y2 − 1)
∂f
∂y(x, y) = x(x2 + 3y2 − 1) (44)
となります。よって、fx(x, y) = 0 を満たす点は
y = 0 または 3x2 + y2 = 1
を満たすもの、fy(x, y) = 0 を満たす点は
x = 0 または x2 + 3y2 = 1
を満たすものです。この二条件を同時に満たす (x, y) は
(0, 0), (1, 0), (−1, 0), (0, 1), (0,−1),(
12,12
),
(12,−1
2
),
(−1
2,12
),
(−1
2,−1
2
)の 9点です。
(1) それぞれの点における 2階偏微分の値を計算するために、式(44)をもう一度偏微分して 2階偏導関数を求めましょう。
∂2f
∂x2(x, y) = 6xy
∂2f
∂y∂x(x, y) = 3x2 + 3y2 − 1
∂2f
∂y2(x, y) = 6xy
となります。
まず、(0, 0) について考えましょう。
∂2f
∂x2(0, 0) = 0
∂2f
∂y∂x(0, 0) = −1
∂2f
∂y2(0, 0) = 0
ですので、
fxxfyy − (fxy)2 = −1 < 0
です。よって (0, 0) は鞍点であって、極大点でも極小点でもありません。次に (a, b) = (±1, 0), (0,±1) の 4点について考えましょう。どの点においても
∂2f
∂x2(a, b) = 0
∂2f
∂y∂x(a, b) = 2
∂2f
∂y2(a, b) = 0
ですので、
fxxfyy − (fxy)2 = −4 < 0
です。よって、この 4点はすべて鞍点であって、極大点でも極小点でもありません。次に (a, b) = ( 1
2 ,12 ), (− 1
2 ,−12 ) について。どちらにおいても
∂2f
∂x2(a, b) =
32
∂2f
∂y∂x(a, b) =
12
∂2f
∂y2(a, b) =
32
第 8 回 21
ですので、
fxxfyy − (fxy)2 =94− 1
4= 2 > 0 かつ fxx > 0
です。よって、この 2点ではどちらも極小点です。最後に (a, b) = (1
2 ,−12 ), (−1
2 ,12 ) について。どちらにおいても
∂2g
∂x2(a, b) = −3
2∂2g
∂y∂x(a, b) =
12
∂2g
∂y2(a, b) = −3
2
ですので、
fxxfyy − (fxy)2 =94− 1
4= 2 > 0 かつ fxx < 0
です。よって、この 2点ではどちらも極大点です。
(2) f(x, y) は二つの 1次関数 x, y と 2次関数 x2 + y2 − 1 の積ですので、f(x, y) = 0 となるのはx 軸、y 軸、単位円周上のみです。そして、f(x, y) の値の正負の状況が図 42のようになっていることがわかります。 この図から、まず (0, 0), (±1, 0), (0,±1) の 5点が極大でも極小でもないこと� �
正負
負正
x
y
0
負
負
正
正
図 42: 問題 34の関数の値の正負。� �がわかります。また、単位円の内部の第 1象限と第 3象限の部分にはそれぞれ少なくとも一つずつ極小点があり、第 2象限と第 4象限の部分にはそれぞれ少なくとも一つずつ極大点があることもわかります。一方、その四つの領域にはそれぞれ一つずつしか停留点のないことが既にわかっていま
す。よって、( 12 ,
12 ) と (−1
2 ,−12 ) が極小点で、(− 1
2 ,12 ) と ( 1
2 ,−12 ) が極大点です。 □
問題 35の解答
(1) f(x, y) に x = ut, y = vt を代入すると、
φ(t) = f(ut, vt) = (vt− u2t2)(vt− 2u2t2) = t2(v − u2t)(v − 2u2t)
となります。
第 8 回 22
v = 0 のとき、t が十分小さい範囲で v − ut と v − 2ut はどちらも v と同符号です。よって、t
がその範囲内で t = 0 のところでは φ(t) > 0 となります。一方 φ(0) = 0 です。このことは t = 0で φ(t) が極小であることを意味しています。v = 0 のときは φ(t) = 2u4t4 となるので、やはり t = 0 で φ(t) は極小です。
(2) f(x, y) は二つの 2次関数 y − x2 と y − 2x2 の積ですので、二つの放物線 y = x2, y = 2x2 上
でのみ 0となり、x2 < y < 2x2 の範囲では値が負、y < x2 と 2x2 < y の範囲では値が正です。
ということは点 (0, 0) のいくらでも近いところに f の値が正となる点も負となる点も存在します。
よって、点 (0, 0) は極大点でも極小点でもありません。(図 43を参照してください。) □� �
O
y
x
図 43: f(x, y) の正負。y = x2 と y = 2x2 の上では 0。斜線部で負。それ以外のところでは正。f(x, y) は (0, 0) で極小ではないが、(0, 0) を通る任意の直線上では極小になってしまっている。� �なお、(0, 0) は f の停留点ではあります。しかし、極大点でも極小点でもないだけではなく、鞍
点でもありません。つまり、fxxfyy − (fxy)2 = 0 となってしまっています。確認してみてください。
問題 36の解答
φ(s) は f(x) = sinx に ξ(s) = es を合成した関数ですので、
φ′(s) = f ′(ξ(s)) · ξ′(s) = cos(es) · es = es cos(es)
となります。 □
問題 37の解答
(1) s での偏微分は t を定数と見て s だけを変数とする 1変数関数として微分することでした。よって、1変数関数の合成関数の微分公式により、
∂φ
∂s(s, t) = cos(s2t) · 2st = 2st cos(s2t)
第 8 回 23
となります。同様に、s を定数と見て t の関数として微分することで、
∂φ
∂t(s, t) = cos(s2t) · s2 = s2 cos(s2t)
となります。
(2) φ(s, t) = f ◦ ξ(s, t), f(x) = sinx, ξ(s, t) = s2t ですので、
∂φ
∂s(s, t) =
df
dx(ξ(s, t)) · ∂ξ
∂s(s, t) = cos(s2t) · 2st = 2st cos(s2t)
および、
∂φ
∂t(s, t) =
df
dx(ξ(s, t)) · ∂ξ
∂t(s, t) = cos(s2t) · s2 = s2 cos(s2t)
となります。このように、「1変数関数に 2変数関数を合成した場合」は計算結果のみならず計算過程まで (1)と全く同じになります。 □
問題 38の解答
(1) 積の微分法により、
φ′(s) = (es)′ sin s+ es(sin s)′ = es sin s+ es cos s = es(sin s+ cos s)
となります。
(2) φ(s) = f(ξ(s), η(s)), f(x, y) = xy, ξ(s) = es, η(s) = sin s ですので、
dφ
ds(s) =
∂f
∂x(ξ(s), η(s))
dξ
ds(s) +
∂f
∂y(ξ(s), η(s))
dη
ds(s)
= η(s)(es)′ + ξ(s)(sin s)′ = (sin s) · es + es · cos s = es(sin s+ cos s)
となり、(1)の結果と一致します。これも計算過程の対応は見やすいでしょう。 □
問題 39の解答
(1) t を定数と見なして s の 1変数関数として微分すると、1変数関数の積の微分公式と合成関数の微分公式により、
∂φ
∂s(s, t) =
((cos(st)
)t) (
cos(s2 + t2))
+(sin(st)
) ((− sin(s2 + t2)
)(2s)
)= t
(cos(st)
)(cos(s2 + t2)
)− 2s
(sin(st)
)(sin(s2 + t2)
)となります。同様に、s を定数と見なして t の 1変数関数として微分すると、
∂φ
∂t(s, t) =
((cos(st)
)s) (
cos(s2 + t2))
+(sin(st)
) ((− sin(s2 + t2)
)(2t)
)= s
(cos(st)
)(cos(s2 + t2)
)− 2t
(sin(st)
)(sin(s2 + t2)
)となります。
第 8 回 24
(2) s による偏微分についての合成関数の微分公式により、
∂φ
∂s(s, t) =
∂f
∂x(ξ(s, t), η(s, t))
∂ξ
∂s(s, t) +
∂f
∂y(ξ(s, t), η(s, t))
∂η
∂s(s, t)
=(cos(st)
)(cos(s2 + t2)
)t+
(sin(st)
)(− sin(s2 + t2)
)(2s)
= t(cos(st)
)(cos(s2 + t2)
)− 2s
(sin(st)
)(sin(s2 + t2)
)となります。同様に、t による偏微分についての合成関数の微分公式により、
∂φ
∂t(s, t) =
∂f
∂x(ξ(s, t), η(s, t))
∂ξ
∂t(s, t) +
∂f
∂y(ξ(s, t), η(s, t))
∂η
∂t(s, t)
=(cos(st)
)(cos(s2 + t2)
)s+
(sin(st)
)(− sin(s2 + t2)
)(2t)
= s(cos(st)
)(cos(s2 + t2)
)− 2t
(sin(st)
)(sin(s2 + t2)
)となります。これらは (1)の計算結果と一致しています。 □
「違う計算なのに答が同じになって不思議」と感じたでしょうか、それとも「少し順番が違うだ
けで結局同じ計算をしているのだから一致して当然」と感じたでしょうか。もしも不思議と感じた
なら、(1)の計算の途中と (2)の計算の途中をよく見比べて対応関係を見つけようとしてみて下さい。(1)で個別的に行った計算が実は (2)のように式の具体的な形によらない手順になっているのだというこが、合成関数の微分公式の言っていることなのです。