算数 - Benesse|ベネッセグループ...小数のかけ算 約分と通分 分数のたし算とひき算 分数のかけ算とわり算(1) 数と計算総合(2) ...
lecture.ecc.u-tokyo.ac.jp - 多変数関数の微分:第2nkiyono/kiyono/13_6...第2 回 3...
Transcript of lecture.ecc.u-tokyo.ac.jp - 多変数関数の微分:第2nkiyono/kiyono/13_6...第2 回 3...
2013年度全学体験ゼミナール
多変数関数の微分:第2回4月 16日 清野和彦
数理科学研究科棟 5階 524号室 (03-5465-7040)[email protected]
http://lecture.ecc.u-tokyo.ac.jp/~nkiyono/index.html
1.2.2 2次関数のグラフ
次に 2次関数、すなわち x と y の 2次式で表される関数の場合を考えましょう。2変数の 2次式は
f(x, y) = ax2 + 2bxy + cy2 + px+ qy + r
という式で a, b, c のうち少なくとも一つは 0でないもののことです。(xy の係数が b ではなく 2bとなっているのは後の式変形を見易くするためです。)
グラフの大体の形を知るためには 1 次式の部分はあってもなくても変わりません。なぜなら、z = f(x, y) のグラフは z = ax2 + 2bxy + cy2 のグラフに z = px+ qy + r のグラフを足したもの
(各 (x, y) において二つのグラフの高さを足したもの)ですが、前節でみたように z = px+ qy+ r
のグラフは平面なので、それを足しても「全体が斜めになる」ような変化が起きるだけでグラフの
大体の形は変わらないからです。
もう少し正確に説明しましょう。1変数の場合、例えば y = x2 + x2 + 1
2 のグラフは y = x2 のグ
ラフに y = x2 + 1
2 のグラフの高さを足したものですが、全体として下に凸の放物線であることに
変わりありませんでした(図 6)。このことは、
x2 +x
2+
12
=(x+
14
)2
+716
と平方完成してみればはっきりします。 これと同じようなことが 2変数でも起きるわけです。実� �
O
y
x O
y
x O
y
x
+ =
y = x2 y =x
2+
12
y = x2 +x
2+
12
図 6: 放物線と直線を足しても放物線のまま。� �際、ac− b2 ̸= 0 なら、
ax2 + 2bxy + cy2 + px+ qy + r = a(x− x0)2 + 2b(x− x0)(y − y0) + c(y − y0)2 + r′
第 2 回 2
となる定数 x0, y0, r′ が存在します。右辺を展開してみればわかるように、(x0, y0) が連立 1次方程式
p = −2ax0 − 2by0 q = −2bx0 − 2cy0
の解(ac− b2 ̸= 0 としたので存在します)で、その上で
r′ = r − ax02 − 2bx0y0 − cy0
2
とすればよいからです2。
これで、ac− b2 ̸= 0 である 2次関数のグラフの大体の形を知るには
f(x, y) = ax2 + 2bxy + cy2
という 2次の項しかない場合だけ考えればよいことがわかりました。ac− b2 = 0 の場合には 1次式の部分が残ってしまうかも知れませんが、今は 2変数関数に慣れたいだけで 2次関数を詳しく調べることが目的ではないので、ac− b2 = 0 の場合も含めて 2次の項しかない場合で考えていきましょう。
以下、z = f(x, y) のグラフの大体の形を知るために f(x, y) を式変形して行きますが、式変形の詳細が重要なのではありません。1変数の 2次式のときと同じような式変形をしているだけだということと、最終的に簡単になった式の表わす関数のグラフをどのようにして視覚化しているかとい
うことに注意して読んでください。
a, b, c のうち少なくとも一つは 0でないのですから、とりあえず a ̸= 0 としてみましょう。すると、
f(x, y) = a
((x+
b
ay
)2
+ac− b2
a2y2
)と変形できます。ここで、二つの 1変数関数のグラフ y = x2 と y = 2x2 が「開き具合」こそ違う
けれどもどちらも下に凸の放物線であったことを思い出してください。このように、全体に正実数
を掛けてもグラフの大体の形は変わりません。だから、今考えている z = f(x, y) のグラフも、aが正なら
z =(x+
b
ay
)2
+ac− b2
a2y2
のグラフと同じ形、a が負なら
z = −(x+
b
ay
)2
− ac− b2
a2y2
のグラフと同じ形です。
しかし、これでもまだ式がゴチャゴチャしていてグラフの形を思い浮かべることは難しいでしょ
う。そこで、座標変換をしましょう3。つまり、x と y の適当な 1次式二つを新しい変数 X, Y と書いてしまおうというわけです。上の二つの式を見ると、まず
X = x+b
ay
2ただし、ここでは x0, y0, r′ の値を計算するのはやめておきます。「グラフの大体の形を調べる」という話の筋が見えにくくなると思うからです。興味のある方は自分で計算してみてください。
3座標変換なんていう言葉を聞くと胃が痛くなる人もいるかも知れません。しかし、ここでは細かいことを追求したいのではなく大体のことを知りたいがためにやっているのですから、z = f(x, y) のグラフを xy 平面に平行に回したり伸ばしたり縮めたりして見やすくしているのだな、くらいに思っていただければ結構です。
第 2 回 3
と置きたくなるでしょう。すると、もう一つの変数 Y は、ac− b2 の正のときと負のときで、それ
ぞれ
Y =
√ac− b2
a2y または Y =
√b2 − ac
a2y
と置くのがよさそうです。ac− b2 = 0 のときは Y = y のままにしておくことにします。
このように新しい変数 X と Y を導入した上で、あり得る場合を分類すると、
• a > 0, ac− b2 > 0 のときは z = X2 + Y 2
• a > 0, ac− b2 = 0 のときは z = X2
• a > 0, ac− b2 < 0 のときは z = X2 − Y 2
• a < 0, ac− b2 > 0 のときは z = −X2 − Y 2
• a < 0, ac− b2 = 0 のときは z = −X2
• a < 0, ac− b2 < 0 のときは z = −X2 + Y 2
となります。以上は、a ̸= 0 の場合で考えましたが、a = 0 でも c ̸= 0 なら x と y の役割を取り
替えて全く同じ式変形ができます。また、a = c = 0 のときは b ̸= 0 なのですから、
2bxy =b
2((x+ y)2 − (x− y)2
)と式変形して X = x + y, Y = x − y と置けば、b の正負に従って z = X2 − Y 2 の場合か
z = −X2 + Y 2 の場合になります。よって、グラフの大体の形を調べるだけなら a ̸= 0 の場合の議論だけですべての場合が尽くされていることになります。
さて、式がここまで簡単になればグラフの大体の形を思い浮かべられそうです。
はじめに z = X2 の場合を考えてみましょう。右辺の関数に Y が現れていないのですから、1変数関数としてのグラフ、つまり下に凸の放物線を Y 軸に沿って滑らせたものです。切り口が下
に凸の放物線になるように紙を曲げたものを思い浮かべてもらえればよいでしょう。z = −X2 の
場合は、z = X2 のグラフの上下をひっくり返したもの、つまり上に凸の放物線をずらーっと並べ
た感じのものです。(図 7。)この二つは ac− b2 = 0 なので、最初の式変形で 1次の項を消せてい� �z = X2 z = −X2
図 7: 放物線をずらーっと並べた曲面。� �
第 2 回 4
ないかも知れないのでした。その場合、新しい変数 X と Y に変換しても 1次の項は消えていず、
z = X2 +AX +BY + C または z = −X2 +AX +BY + C
となっています。しかし、これらは「定数項が Y の 1次式になっている X の 2次式」ですので、そのグラフは図 7のグラフを傾けたようなものになっているに過ぎません。つまり、zX 平面上のz = X2 + AX + C または z = −X2 + AX + C というグラフを頂点が X = −A
2 または X = A2
という平面に乗ったまま Y 切片が Y z 平面上 z = BY +C という直線になるように滑らせたとき
にできる曲面です。
以上は実質的には 1変数関数のグラフでした。ここから先は本格的に 2変数関数のグラフの話です。まず z = X2 + Y 2 の場合を考えてみましょう。これのグラフと XY 平面に平行な平面との交
わりは (x, y) = (0, 0) を中心とした円になります。実際、XY 平面に平行な平面とは z = k とい
う定数関数のグラフなので、この二つの交わりは
X2 + Y 2 = k
という半径√k の円です。よって、z = X2 + Y 2 は 1変数関数のグラフを z 軸を中心に回転した
ものになります。その 1変数関数のグラフは Xz 平面との交わりに出てくる曲線です。Xz 平面と
は Y = 0 のことですから、結局、z = X2 + Y 2 のグラフは下に凸の放物線 z = X2 を z 軸の回り
に回転してできる曲面になります。同様に、z = −X2 − Y 2 は上に凸の放物線を回転してできる
曲面です。(図 8)。 (これは X,Y という便宜上おいた変数での考察です。元々の変数 x, y につ� �z = X2 + Y 2 z = −X2 − Y 2
図 8: 回転放物面。� �いては普通は回転体にはなりません。xy 平面との交わりは円ではなく楕円になります。ご注意下
さい。)
最後に z = X2 − Y 2 と z = −X2 + Y 2 を考えましょう。この二つは X と Y を取り替えると
一致しますから、グラフの形としては同じものです。そこで、z = X2 − Y 2 の方で考えることに
します。上と同様にまず XY 平面と平行な平面との交わりを考えてみましょう。それは
X2 − Y 2 = k
第 2 回 5
� �
O
Y
X
z = 0
z = 2
z = 3
z = 1
z = −3z = −2 z = −1
図 9: z = X2 − Y 2 の「等高線」。� �という曲線ですので、双曲線です。ただし、k が正のときは X 軸が双曲線の軸であり、k が負の
ときは Y 軸が双曲線の軸、k = 0 のときは Y = ±X という二直線です。(図 9。) これだけで大体の形が思い浮かぶ人もいるかも知れませんが、慣れないとなかなか難しいので、別な見方もして
みましょう。XY 平面に平行な平面ではなく、Xz 平面に平行な平面、すなわち Y = k で切って
みます。すると、z = X2 − k2 という下に凸の放物線が出てきます。この放物線の頂点は X = 0の点ですので、k を動かしたときの頂点の軌跡は z = −k2 という Y z 平面内の上に凸な放物線で
す。つまり、Xz 平面内の z = X2 という放物線を Y z 平面内の z = −Y 2 という上に凸の放物線
に頂点を乗せたまま滑らしたときにできる曲面が z = X2 − Y 2 のグラフだというわけです。思い
浮かべられましたか?(図 10です。)� �z = X2 − Y 2
図 10: z = X2 − Y 2 の概形。山と山の間の峠とか、馬の鞍などを思い浮かべてください。� �問題 4. 次の関数のグラフは上のどの形か。
(1) x2 + 4xy + 5y2 + 2x+ 3y + 1 (2) x2 + 6xy + 5y2 + 2x+ 3y + 1
第 2 回 6
1.2.3 一般の場合
一般の関数 f(x, y) が式で具体的に与えられたとき、z = f(x, y) のグラフの概形を(これから学ぶ微分などのテクニックを使わずに)調べるには、前節でやったように等高線、すなわち z =一定という平面での切り口の曲線を調べたり、y =一定や x =一定という平面での切り口の曲線を調べたりすることが有効な場合があります。また、f(x, y) が 1変数関数 g(t) に t =
√x2 + y2 を
代入した式になっている場合、z = f(x, y) のグラフは z = g(x) のグラフの x ≥ 0 の部分を z 軸
を中心に回転したものになっています。例えば前節の z = X2 + Y 2 は t2 に t =√X2 + Y 2 を代
入したものですので放物線を回転したものになっている、ということだったわけです。もちろん、
このような方法では簡単な関数しか様子を調べられません。
だからこそこれから多変数関数の微分を学ぼうとしているわけです。実は、微分を通じて一般の
関数を 1次関数や 2次関数で近似しようというのがこれから学ぶ「多変数関数の微分」の中心思想
なのです。そういう背景があるので、2変数関数の例として 1次関数と 2次関数を説明しました。微分を使うと、1次関数や 2次関数という特別な関数を通じてもっと一般の関数の様子が調べられるようになるのです。
さらに変数の数が増えて 3変数以上になると、グラフは 4次元以上の空間の部分になってしまって、1次関数や 2次関数でさえ上のような理解はできません。しかし、2変数で直観的にイメージしたことを理屈で厳密に証明しておけば、その理屈を道具として直観の働かない 4次元以上の図形の形について正しい考察を行うことができるようになります。これが数学を学ぶ上での一つの醍醐
味といえるでしょう。このゼミでは直観の働く範囲の話しかしませんが、余裕ができたら、是非こ
のゼミでの話を 3変数、4変数、一般の n 変数に拡張するとどうなるのか考えてみて下さい。
2 1変数関数の微分の復習
次節で定義するように、多変数関数の微分の主役である偏微分は、1変数関数の微分の「安直な」拡張であり、特に、計算は完全に 1変数関数の微分として実行されるものです。そこで、まず 1変数関数の微分の定義と計算の実際について復習しておきましょう。
2.1 1変数関数の微分の定義
復習ですから、いきなり定義から入りましょう。
a を関数 f(x) の定義域内の一つの実数とします。
limx→a
f(x) − f(a)x− a
(3)
が収束するとき、
f(x) は x = a で微分可能である
と言い、その極限値を
f(x) の x = a における微分( 微分の値、微分係数、微係数、導値など)
と呼び、
f ′(a)df
dx(a)
d
dxf(x)
∣∣∣∣x=a
第 2 回 7
などの記号で表します。
f(x) が定義域内のすべての a において微分可能なとき、単に「f(x) は微分可能である」と言います。そして、このとき a に f ′(a) を対応させることによって f(x) と同じ定義域を持つ新しい関数を作ることができます。その関数のことを導関数と呼び、微分の記号を流用して
f ′(x),df
dx(x),
d
dxf(x)
などと書きます。
皆さんがこれまでに慣れ親しんできた計算方法からすると、上の説明は話の順序が逆のように
見えるかも知れません。つまり、「x = a における微分の値を計算するには、まず導関数を計算し、
その後 x に a を代入する」のではないかと。例えば、f(x) = x2 とすると、f ′(x) = 2x と計算してから f(3) = 2 · 3 = 6 とするのが普通であって、
f ′(3) = limx→3
f(x) − f(3)x− 3
= limx→3
x2 − 32
x− 3= lim
x→3
(x− 3)(x+ 3)x− 3
= limx→3
(x+ 3) = 3 + 3 = 6
などとは計算しない、というわけです。しかし、そもそも x2 の導関数が 2x であるという「公式」は、上の計算が x のすべての値について成り立つこと、つまり、x = 3 に限らず任意の実数 a に
ついて、
f ′(a) = limx→a
f(x) − f(a)x− a
= limx→a
x2 − a2
x− a= lim
x→a
(x− a)(x+ a)x− a
= limx→a
(x+ a) = a+ a = 2a
という a によらない共通の計算ができることから、(x2)′ = 2x を「公式」にした結果です。そし
て、今まで出会ってきた計算はこのような公式を何度か使うことでできるものばかりだったので、
「微分するといういうことは公式を使って導関数を計算すること」という「微分とは何であるか」
ということを隠しがちな理解の仕方になってしまったのでしょう。
もちろん、どう思っていようと得られる計算結果は同じです。それなのに殊更にこんな注意をす
る理由は、多変数関数の微分においては導関数(に当たるもの)はあまり活躍せず、もっぱら注目
したところでの微分の値が主役となるからです。
問題 5. 1変数関数
f(x) =
{x2 x < 0
x3 x ≥ 0
の導関数を求めよ。
2.2 微分の意味
微分は何故式 (3)という極限で定義されるのかということも思い出しておきましょう。極限で定義されているのですから、まず、極限を取る前の式が何を意味するのかを考えてみま
す。分子 f(x) − f(a) は
f(a) から見た f(x) の「増分」
であり、分母の x− a は
第 2 回 8
a から見た x の「増分」
と見ることができます。(「増分」とカッコを付けたのは、「減っている場合には負の数とする」と
約束をしていることを表したつもりです。)ということは、問題の式は従属変数の f(a) からの増分を独立変数の a からの増分で割っているわけですから、いわゆる「平均の変化率」、つまり、
独立変数が a から x まで増えたときの従属変数の増え方を独立変数が 1増えた場合に換算した値
です。これは、グラフでいうと
点 (a, f(a)) と点 (x, f(x)) を通る直線の傾き
ということもできます(図 11)。� �
O
y
x
f(x)
f(a)
a x a+ 1
x− a1
f(x) − f(a)
f(x) − f(a)x− a
y = f(x)
図 11: 平均の変化率。� �このように理解した上で x→ a の極限を取ることを考えると、その極限値は「瞬間の変化率」、
つまり、
x = a における従属変数の「瞬間的変化」を独立変数が 1増えた場合に換算した値、
図形的にはもっとわかりやすく
y = f(x) のグラフの点 (a, f(a)) における接線の傾き
となる、と考えて良いでしょう(図 12)。
2.3 具体的な 1変数関数の微分
次節で定義する偏微分というものは、1変数関数の微分を利用して定義されるものなので、偏微分の値は 1変数関数の微分の計算法によって計算されます。そこで、具体的に式で書かれた 1変数関
第 2 回 9
� �
O
y
xa x a+ 1
f(x) − f(a)x− a
f ′(a)
図 12: 「瞬間」の変化率。� �数の微分(導関数)の計算と、二つの関数の積や商や合成の微分(導関数)を計算する公式を復習
しておきましょう。
まず、定数関数 f(x) = c の微分は任意の x = a について 0です。なぜならば、極限を取る前から常に
f(x) − f(a)x− a
=c− c
x− a= 0
だからです。よって、定数関数の導関数は常に値が 0の定数関数です。
注意. 逆に、導関数が 0になる関数は定数関数しかありません。このことの証明には平均値の定理を使います。平均値の定理の復習はここではしません。★
次に、 n が自然数のとき xn の微分は任意の x = a について nan−1 となります。なぜなら、
xn − an = (x− a)(xn−1 + xn−2a+ · · · + xan−2 + an−1)
なので、
limx→a
xn − an
x− a= lim
x→a(xn−1 + xn−2a+ · · · + xan−2 + an−1)
= an−1 + an−2a+ · · · + aan−2 + an−1 = nan−1
となるからです。よって、xn の導関数は nxn−1 です。
「微分する」という操作は定数倍や足し算という操作と入れ替えられますので、上の二つによっ
てすべての多項式の導関数を計算できます。
(a0 + a1x+ a2x2 + · · · + anx
n)′ = a0(1)′ + a1(x)′ + a2(x2)′ + · · · + an(xn)′
= a1 + 2a2x+ 3a3x2 + · · · + nanx
n−1
です。
第 2 回 10
これ以外に知っておかなければならないのは、三角関数と指数関数の微分(というか導関数)で
す。それぞれの導関数を列挙すると、
d
dxsinx = cosx
d
dxcosx = − sinx
d
dxex = ex
となります。
注意. これらの公式の証明はここではしません。★
tanx と log x の微分がありませんが、それらについては、次に挙げる公式を使うことで計算できます。
まず一つ目の公式は、ライブニッツ・ルールと呼ばれる積の微分法(f(x)g(x)
)′ = f ′(x)g(x) + f(x)g′(x)
です。微分の定義式の分子を
f(x)g(x) − f(a)g(a) = f(x)g(x) − f(a)g(x) + f(a)g(x) − f(a)g(a)
= (f(x) − f(a))g(x) + f(a)(g(x) − g(a))
と水増しすることによって、
limx→a
f(x)g(x) − f(a)g(a)x− a
= limx→a
f(x) − f(a)x− a
g(x) + limx→a
f(a)g(x) − g(a)x− a
= f ′(a)g(a) + f(a)g′(a)
と証明できます。
積の次は商の微分法 (1
f(x)
)′
= − f ′(x)(f(x))2
です。これは何の工夫もなく定義式に入れることで、
limx→a
1f(x) −
1f(a)
x− a= lim
x→a
f(a) − f(x)x− a
1f(x)f(a)
= −f ′(a) 1f(a)f(a)
と証明できてしまいます。
tanx の導関数は、tanx =sinxcosx
ですので、積の微分法と商の微分法を使うと、
(tanx)′ =(
sinx1
cosx
)′
= (sinx)′1
cosx+ sinx
(1
cosx
)′
= cosx1
cosx+ sinx
(− (cosx)′
cos2 x
)= 1 + sinx
(−− sinx
cos2 x
)= 1 +
sin2 x
cos2 x= 1 + tan2 x
と計算できます。これは1
cos2 xと等しくなっています。
tan′ x = 1 + tan2 x =cos2 xcos2 x
+sin2 x
cos2 x=
1cos2 x
です。
第 2 回 11
最後に、もっともよく使う公式である合成関数の微分法
(f(g(x))′ = f ′(g(x))g′(x)
があります。これの証明は「合成関数の微分」の節で説明します。
特に g(x) が f(x) の逆関数の場合、つまり、f(g(x)) = x がすべての x について成り立つ場合
に合成関数の微分法を適用することで逆関数の微分法
g′(x) =1
f ′(g(x))
が得られます。
これを使うと log xの導関数を計算できます。なぜなら log xは ex の逆関数、すなわち elog x = x
が成り立ち、(ex)′ = ex ですので、
(log x)′ =1
elog x=
1x
と計算できるからです。これは x > 0 の場合の計算ですが、x < 0 の場合もこの結果と合成関数の微分法を使うことで、
(log(−x))′ =1−x
(−x)′ =1−x
(−1) =1x
となります。よって x の正負に拘わらず、
(log |x|)′ =1x
が成り立ちます。
この結果と合成関数の微分法を合わせると、r が自然数でない場合にも
(xr)′ = rxr−1
という全く同じ公式の成り立つことがわかります。(x > 0 です。)
xr = er log x
なので、
(xr)′ = (er log x)′ = er log x(r log x)′ = xr r
x= rxr−1
となるからです。
問題 6. 次の関数の導関数を求めよ。
f(x) = ex sinx g(x) =x2
x3 + 2x+ 1h(x) = log(cosx)
3 偏微分
n 個の独立変数 x1, x2, . . . , xn を持つ関数 f があったとき、独立変数の変化に伴って f がどう変
わるかを考えるときの安直だがもっとも基本的な考え方は、
一つの変数だけを本当に変数と考え、残りの n− 1 個の変数は定数と見なす
第 2 回 12
という考え方です。このように考えたときに自然に出てくる「多変数関数の微分」が下に定義する
偏微分です。
なお、ここまでと同様に以下すべて n = 2 の場合で説明します。図形的なイメージを持つのはn = 2 の場合が限界ですが、理屈をしっかりと詰めておけば、それを頼りに n ≥ 3 以上でも正しい議論を展開することができるようになりますので、イメージと理屈と両方大切にして欲しいと思
います。
3.1 偏微分の定義
微分を考えたい点が (a, b) のとき、f(x, y) に y = b を代入することによって出来上がる x のみを
変数とする 1変数関数φ(x) := f(x, b)
の4 x = a における微分 φ′(a) が
f(x, y) の (a, b) における x による偏微分(偏微分の値、偏微分係数)
であり、x = a を代入することによって出来上がる y のみを変数とする 1変数関数
ψ(y) := f(a, y)
の y = b における微分 ψ′(b) が
f(x, y) の (a, b) における y による偏微分(偏微分の値、偏微分係数)
です。ただし、「正式に」定義をする場合には、φ(x) などのそのときしか使わない文字をなるべく使わないで済まそうとするので、次のようになります。� �定義 1. f を二つの変数 (x, y) の関数とする。(x, y) = (a, b) において f が x によって偏微
分可能であるとは、極限
limx→a
f(x, b) − f(a, b)x− a
が存在することである。このとき、その極限値を f の (a, b) における偏微分(偏微分の値、偏微分係数)と言い、記号で
∂f
∂x(a, b) とか fx(a, b) とか ∂xf(a, b)
などと書く。(a, b) における f の y による偏微分も同様に
∂f
∂y(a, b) = lim
y→b
f(a, y) − f(a, b)y − b
によって定義する。� �注意. 偏微分の記号
∂f
∂xの(日本語での)読み方は人によってまちまちです。
ディー エフ ディー エックス4φ(x) := f(x, b) とは「φ(x) を f(x, b) によって定義する」という意味です。コロンのついた等号「:=」や「=:」は、
「コロンのついている側をついていない側によって定義する」という意味の記号です。
第 2 回 13
というように 1変数関数の微分と同じ読み方をする人も結構います。これでも文脈から誤解はあまり起こらないものです。偏微分であることをはっきりさせたい人の多くは
ラウンド ディー エフ ラウンド ディー エックス
と発音していると思います。∂ が d を「丸く」書いた文字だからです。偏微分であることをはっきりさせたいがこの読み方は長すぎる、と感じる人の中には
ラウンド エフ ラウンド エックス
と肝腎の「ディー」の方を省略してしまう人もいます。(私は結構これです。)また、
デル エフ デル エックス
と発音する人も結構いるようです。MS-IME でも「でる」と打って変換すると「∂」が出ます。しかし、デルという呼び方は何がしかの誤解に基づく日本だけの呼び方のようですので、使わない方がよいと思います。★
f(x, y) の定義域内のあらゆる点で x で偏微分可能なとき、点 (a, b) における x による偏微分の
値 fx(a, b) を (a, b) に対応させることで偏導関数という 2変数関数が出来上がることも 1変数関数のときと同じです。この場合、偏微分した点を (a, b) でなく変数らしく (x, y) で書いてしまうことも 1変数関数のときと同じです。結局、偏微分とは
偏微分しない変数を定数だと思いこんで 1変数関数の微分をすること
に過ぎないわけです。だから、具体的に与えられた多変数関数の偏微分や偏導関数を計算するに
は、1変数関数の微分の計算しか必要ありません。例えば f(x, y) = x2y3 なら、x による偏導関数
は fx(x, y) = 2xy3 という 2変数関数、y による偏導関数は fy(x, y) = 3x2y2 という 2変数関数になります。
注意. 「x による偏微分は y を定数だと思っての微分だから、x による偏導関数は x だけを変数とする 1変数関数だ」と誤解してしまうことがあるようです。「y を定数だと思っての微分」というのは、あくまでもfx(a, b) の定義や計算のために思うのであって、各 (a, b) についてそのように思うことで fx(a, b) が出そろったら、その値を (a, b) に対応させることで、f(x, y) と同じ定義域を定義域とする 2変数関数 fx(x, y) が出来上がるわけです。★
注意. 時刻 t と直線上の位置 x に対して与えられる量 f(t, x) と直線上の点の運動 x(t) があったとき、点の運動に伴って変わる f の値を分析したい場合に考える関数は、f(t, x) の x に x(t) を代入した t のみによる1変数関数です。そこでいちいち φ(t) = f
(t, x(t)
)と記号を変えれば誤解は起きないのですが、記号が増え
たり f との関連が見えなくなったりするのを嫌って、f(t, x(t)
)と書いたままで議論することがよくありま
す。しかも x が t に依っていることが前提になっているので、x(t) のことを t を省略して x とだけ書いてしまうことがしばしばです。このような状況のとき、
df
dt(t, x)
という記号で φ′(t) のことを指すことが多いので、t と x に何の関係もない 2変数関数としての t による偏微分は、
∂f
∂t(t, x)
と「丸いディー」を使って書きます。これが偏微分と 1変数関数の微分の記号が違う理由です、多分。★
問題 7. 2変数関数 f(x, y) をf(x, y) = sin
(x3y2
)とする。二つの偏導関数
∂f
∂x(x, y),
∂f
∂y(x, y) を計算せよ。
第 2 回 14
3.2 偏微分の意味
偏微分は実質的に 1変数関数の微分なのですから、1変数関数の微分が持っているのと同様の意味を持つはずです。この節ではそのことについて考えて行きましょう。
まず、1変数関数の微分が「瞬間の変化率」として定義されたことを思い出しましょう。y = f(x)の x = a における微分の値 f ′(a) とは
従属変数 y の x = a の「瞬間」における変化を独立変数 x が 1増えた場合の変化に換算した値
でした。(もちろん、これは「標語」に過ぎません。正確な定義には極限を使うしかないことは前
節で説明しました。)このことと偏微分の定義から、2変数関数 z = f(x, y) と (x, y) = (a, b) に対して、
(x, y) = (a, b) における x による偏微分の値∂f
∂x(a, b)
とは、
(x, y) = (a, b) の「瞬間」において二つの独立変数のうち x だけを変化させた場合の従
属変数 z の変化を x が 1増えた場合の変化に換算した値
ということになります。また、この説明で x と y の役割を取り替えたものが∂f
∂y(a, b) の意味です。
ということは、どちらの偏微分の値も x と y を同時に変化させたときの f(x, y) の変化の具合は捉えていないということになってしまいます。しかし、2つの変数を持つ関数を考える以上、2つの変数を同時に変化させたときの関数の振る舞いを知ることができなければ、2変数関数の変化を調べられたとは言えないでしょう。それなら、偏微分というものはあまりにも安直すぎて 2変数関数の微分としてはあまり意味を持たないものなのでしょうか? 実は、ある自然な制限を満たす 2
変数関数については、2つの偏微分の値だけで x と y を同時に変化させたときの関数の値の変化
を知ることができます。このことは、このゼミで学ぶ最初の主目標であって、これからいくつかの
節を使ってゆっくりと学んで行きます。
しかし、その方向に話を進める前に、偏微分をそのような進んだ視点から解釈しなくても自然に
意味を持ってくるような例を見ておきましょう。
例 1. 気体を容器に閉じこめて十分長い時間放置すると平衡状態と呼ばれる「全体としては時間が
経っても変化しない状態」に達します5。このときエントロピーやエネルギーのような状態量とい
われる量は温度 T と体積 V の二つの量だけで決まります6。つまり、エネルギーを例に取ると、
温度の値 T と体積の値 V の可能なすべての組み合わせについて、その温度と体積を持つ平衡状態
におけるエネルギー U が、f(x, y) に x = T と y = V を代入した値に一致する、すなわち
U = f(T, V )
の成り立つ 2変数関数 f(x, y) が存在する、ということです。このとき、容器が固いものでできていて気体の体積が一定値 V0 に固定されていたとすると、温度が T0 の状態に少しずつ少しずつ熱を
加えて温度が上がって行くとき7のエネルギーの変化率は、(T0, V0) における x による偏微分の値
∂f
∂x(T0, V0)
5もちろん経験則です。6温度と圧力、あるいは圧力と体積の組み合わせでも決まります。ただし、液体と気体が混在していたりすると、それだ
けの情報では決まらないこともあります。正確なことは熱力学の授業や本で学んでください。7「常に平衡状態であるようにしながら熱を加えて行く」という理想化された変化を考えるということです。このような
変化を「準静的な変化」といいます。詳しくは熱力学の講義や本で学んでください。
第 2 回 15
になります。このように、熱力学では「ある物理量を一定に保ったまま別の物理量を変化させる」
という考察を頻繁にするので、2変数関数とその偏微分たちが大いに活躍するのです。
注意. 上の例では、とても神経質に
関数の変数は物理的な意味を持たないただの実数(の入る場所)であり、関数 f(x, y) を上手く選ぶと、x のところに温度をある単位(例えばケルヴィン)で測ったときの値を入れ、y のところに体積をある単位(例えばリットル)で測ったときの値を入れたとき、関数 f の値がエネルギーをある単位(例えばジュール)で測ったときの値に一致する。
というように書きました。いつでもこのように書けば概念の混乱は起きないのですが、その代わり、例えば「x での偏微分は温度 T
を変化させたときの変化率」というように、文字 x と文字 T の間の関係をいつも覚えていなければならない、つまり、登場する文字が多いことによる面倒が起きてしまいます。そこで、普通は
温度 T と体積 V を独立変数とする 2変数関数 f で、U = f(T, V ) の成り立つものがある。
というように、温度 T や体積 V を直接独立変数と考えてしまいます。(たとえば、力学でも時刻 t を直接独立変数と考えました。それと同様です。)この場合、体積を V0 に保ったまま T を変化させたときの T = T0
におけるエネルギーの変化率は∂f
∂T(T0, V0)
と書かれることになります。これでもエネルギーの名前 U と関数の名前 f が違うので、f が U を表しているということを覚えておか
なければなりません。これも面倒だというわけで、多くの場合 f のことを U と名付けてしまいます。つまり、エネルギーという物理量と、それを T と V で表す関数という別の概念に同じ名前 U を付けてしまうのです。式で書くと U = U(T, V ) となります。このように「物理量」と「それを表す関数」に同じ名前を付けるというのが熱力学(というか物理のほとんどの分野)では当たり前になっています。慣れれば混乱しなくなるのでしょうが、学び始めたばかりの頃は混乱して当たり前です。何が何を表しているのかわからなくなってしまう原因の多くはこの「同姓同名問題」だと思うので、そのような混乱に陥ってしまったときには、上の例 1を参考にして「概念ごとに別の名前を付ける」ということをしてみるとよいと思います。★
例 2. 針金を一本用意します。太さを無視すれば、針金は数直線(の一部分)と見なせるので、針
金の各点を実数で指定することができます。(例えば片方の端を 0とし、そこからの長さ (cm)で指定します。)この針金のいろいろな部分を火で炙ったり氷で冷やしたりして温度が一様でないよ
うにしてから熱が針金の外に逃げて行かない環境に放置します。すると、時間が経つにつれて熱い
ところは冷え冷たいところは温まってきて全体が同じ温度に近づいて行きます。この変化の様子を
偏微分を使って表すことができます。針金の各点 x の各時刻 t における温度は f(x, t) という 2変数関数を作ります。� �
x位置
温度
t時刻
図 13: 時間がたつにつれて針金全体の温度が一様になって行く。� �さて、偏導関数も 2変数関数なので、その偏導関数を考えることができます。この「偏導関数の偏導関数」のことを元の関数の 2階偏導関数と呼びます。今必要なのは f(x, t) の x による偏導関
第 2 回 16
数の x による偏導関数で、1変数関数のときと同様の記号
∂2f
∂x2(x, t) :=
∂
∂x
(∂f
∂x
)(x, t)
によって表します。この 2階偏導関数は t を定数とみなした x の 1変数関数の 2階微分のことです。実は、針金の温度 f(x, t) の時刻 t に関する変化 ∂f
∂t (x, t) は、
∂f
∂t(x, t) = C
∂2f
∂x2(x, t)
という関係を満たすことが知られています。(C は針金の材料や考えている単位系などで決まる定
数です。この等式のことを熱伝導方程式と言います。)両方の変数を同時に変化させたときの情報
なしで温度変化が決定されてしまうのです。
問題 8. t > 0 で定義された 2変数関数
f(x, t) =1√te−
x2t
は、熱伝導方程式∂2f
∂x2(x, t) = 4
∂f
∂t(x, t)
を満たすことを実際に計算して確かめよ。(図 13はこの関数の 1 ≤ t ≤ 5 の部分のグラフです。)
例 3. 上の例と同様に針金を用意します。ただし、今度はピアノやギターの弦のようなものを想像
してください。弦の端をしっかり固定し、途中をつまんで弦と垂直な方向に引っ張ります。その手
を離すと弦は振動します。時間がたつにつれてどのように振動するかを 2階偏導関数の間の等式によって表すことができます。(ただし、弦が伸びても張力が変わらないなどの単純化した状況で考
えます。)この場合の 2変数関数 g(x, t) は弦の点 x の時刻 t における元の位置からの垂直方向の
ずれです。 このとき、� �振幅
x位置
t
時刻
図 14: 弦の振動。� �∂2g
∂t2(x, t) = c2
∂2g
∂x2(x, t) (4)
という等式が成り立つことが知られています。(c はやはり弦の材料や単位系などで決まる定数で
す。この等式は波動方程式と呼ばれます。)この場合も、二つの変数を同時に変化させたときの情
報は使っていません。
問題 9. c を定数とする。2変数関数
f(x, t) = sin(x+ ct) + sin(x− ct)
は波動方程式 (4)を満たすことを計算によって確かめよ。(図 14はこの関数のグラフの一部です。)
第 2 回 17
さて、話を「偏微分の意味」に戻しましょう。ここまでは「変化率」という何を意味するのか今
ひとつはっきりしない言葉を手がかりに偏微分が何を意味するか考えてきました。しかし、前節で
も述べたように、1変数関数の微分の値は図形的にはグラフの接線の傾きを意味し、皆さんも微分といえばこのイメージを思い浮かべることと思います。この視点から偏微分は何を意味するのか考
えてみましょう。
偏微分は片方の変数を定数だと思って 1変数関数として微分することでした。正確には、fx(a, b)とは
φ(x) = f(x, b) によって定義される x の 1変数関数 φ の x = a における微分の値
でした。ということは、fx(a, b) は φ(x) のグラフの点 (a, φ(a)) における接線の傾きを意味することになります。
ここで、φ(x) のグラフとは何であるかを、φ(x) という関数をあらわに使わずに f(x, y) のままで考えてみましょう。f(x, y) そのものをイメージするために、xyz 空間において z = f(x, y) のグラフを思い浮かべて下さい。そのグラフにおいて z = φ(x) のグラフはどこに現れてくるのでしょうか。φ(x) は f(x, b) によって定義されました。だから z = φ(x) のグラフは z = f(x, y) のグラフのうち、y = b を満たす点の全体です。y = b を満たす点は xyz 空間の中で
y = b であって x と z は何でもよい
という部分、すなわち、もしも b = 0 なら xz 平面であり、b が 0でないときには xz 平面と平行
で y 切片 (y 軸との交わり)が b であるような平面のことです。つまり、φ(x) のグラフとは
z = f(x, y) のグラフを(a, b, f(a, b)
)を通り xz 平面に平行な平面で切った切り口に現
れる曲線
であり、だから、fx(a, b) すなわち φ′(a) とは� �
x
z
a
b
平面 y = b
z = φ(x) の接線
z = φ(x) = f(x, b)
図 15: 「切り口曲線」とその接線。� �その「切り口曲線」の
(a, b, f(a, b)
)における接線の傾き
のことだということになります(図 15)。全く同様に、fy(a, b) とは
第 2 回 18
z = f(x, y) のグラフを(a, b, f(a, b)
)を通り yz 平面に平行な平面で切った切り口に現
れる曲線の(a, b, f(a, b)
)における傾き
のことです。
以上をもう少し簡潔にまとめると次のようになるでしょう。
fx(a, b) の図形的な意味は、z = f(a, b) のグラフの点 (a, b, f(a, b)) における x 軸(と
平行な)方向の傾きであり、fy(a, b) は同じ点における y 軸(と平行な)方向の傾きで
ある。
これが偏微分の値の図形的な意味です(図 16)。� �
x
z
a
b
平面 y = b
傾き fx(a, b)
平面 x = a傾き fy(a, b)
図 16: x 軸方向の傾きと y 軸方向の傾き。� �
第 2 回 19
解答
問題 4の解答
1次式の部分はだいたいの形には影響せず 2次式の部分だけ考えればよいことは説明しました。以下、x2 の係数を a、xy の係数を 2b、y2 の係数を c とします。
(1)
a = 1, b = 2, c = 5 です。よって a = 1 > 0 かつ ac − b2 = 1 · 5 − 22 = 5 − 4 = 1 > 0 ですので、z = X2 + Y 2 の形です。
(2)
a = 1, b = 3, c = 5です。ac−b2 = 1 ·5−32 = 5−9 = −4 < 0ですので、こちらは z = X2−Y 2
の形です。 □
問題 5の解答
「導関数を求めよ」という問題ですが、そもそも導関数が存在するかどうか、つまりすべての x
について微分可能かどうかは明らかではありません。そのことも含めて考えましょう。
x < 0 では f(x) は x2 という微分可能であることが分かっている関数と一致しているわけです
から微分可能であり、導関数も同じで、
f ′(x) = 2x x < 0
となります。
同様に、x > 0 では f(x) は x3 と一致しているので微分可能で、導関数は
f ′(x) = 3x2 x > 0
となります。
問題は x = 0 で微分可能かどうかです。ここでは f(x) の定義式が「切れて」いるので、x ̸= 0でのようには計算できません。微分の定義を直接使って計算しなければならないのです。x = 0 における微分の定義式は
limx→0
f(x) − f(0)x− 0
です。(まだこの極限が存在するかどうか分からないので f ′(0) とは書きませんでした。)この極限を計算するのですが、f(x) の定義が x の正負で別の式になっているので、x→ 0 の極限を負の方から 0に近づく極限 x→ −0 と正の方から 0に近づく極限 x→ +0 に分けて計算しましょう。その二つの値が一致したら微分可能でその極限値が f ′(0) になるわけです。
limx→−0
f(x) − f(0)x− 0
= limx→−0
x2
x= lim
x→−0x = 0
および、
limx→+0
f(x) − f(0)x− 0
= limx→+0
x3
x= lim
x→+0x2 = 0
第 2 回 20
となって一致しました。よって f ′(0) = 0 です。以上より、
f ′(x) =
{2x x < 0
3x2 x ≥ 0
となります。 □
もちろん、x ≤ 0 で f(x) = x2 なので x → −0 による極限は x2 の x = 0 における微分の値であり、x ≥ 0 では f(x) = x3 なので x → +0 による極限は x3 の x = 0 における微分の値になるだけの話ですが、定義式が切れているところでは、定義に戻って考えてみる必要があるということ
は心に留めておいてください。
問題 6の解答
積の微分法により、
f ′(x) = (ex)′ sinx+ ex(sinx)′ = ex sinx+ ex cosx = ex(sinx+ cosx)
となります。
商の微分法により、
g′(x) =(x2)′(x3 + 2x+ 1) − x2(x3 + 2x+ 1)′
(x3 + 2x+ 1)2=
2x4 + 4x2 + 2x− 3x4 − 2x2
(x3 + 2x+ 1)2
=−x4 + 2x2 + 2x(x3 + 2x+ 1)2
となります。
合成関数の微分法により、
h′(x) = log′(cosx) × (cosx)′ =1
cosx(− sinx) = − tanx
となります。 □
問題 7の解答
まず x での偏導関数を計算しましょう。y を定数だと思いこんで x の 1変数関数としていつものように微分すればよいだけです。問題の関数は三角関数と多項式の合成ですので、偏微分の定義
式を直接使うことなく、具体的な 1変数関数の導関数の公式を使っていきなり偏導関数を計算することができます。
y を定数扱いして g(x) = x3y2 と 1 変数関数のように書くことにすると、f(x, y) は sin z にz = g(x) を代入した合成関数ですので、合成関数の微分法を使って計算できます。
sin′ z = cos z g′(x) =(x3)′y2 = 3x2y2
ですので、合成関数の微分法により
∂f
∂x(x, y) =
(sin′ g(x)
)g′(x) =
(cos(x3y2
))3x2y2 = 3x2y2 cos
(x3y2
)
第 2 回 21
となります。(最後の等号は、式を見やすくするために掛け算の順番を入れ替えただけです。)
同様に x を定数扱いして h(y) = x3y2 と y の 1変数関数のように書くと、f(x, y) は sin z にz = h(y) を代入した合成関数です。よって、
∂f
∂y(x, y) =
(sin′ h(y)
)h′(y) =
(cos(x3y2
))x32y = 2x3y cos
(x3y2
)となります。 □
問題 8の解答
1変数関数の合成関数の微分法により、f(x, t) の x による偏導関数が
∂f
∂x(x, t) = − 2x
t√te−
x2t
と求まります。1変数関数の積の微分法と合成関数の微分法を使ってこの関数を x で偏微分するこ
とにより、
∂2f
∂x2(x, t) =
∂
∂x
(− 2xt√te−
x2t
)= − 2
t√te−
x2t − 2x
t√t
−2xte−
x2t =
4x2 − 2tt2√te−
x2t
となります。一方、やはり 1変数関数の積の微分法と合成関数の微分法を使って f(x, t) の t によ
る偏導関数を求めると、
∂f
∂t(x, t) = − 1
2t√te−
x2t +
1√t
x2
t2e−
x2t =
2x2 − t
2t2√te−
x2t
となります。よって、確かに
∂2f
∂x2(x, t) =
4x2 − 2tt2√te−
x2t = 4
2x2 − t
2t2√te−
x2t = 4
∂f
∂t(x, t)
となっています。 □
問題 9の解答
x で偏微分すると、∂f
∂x(x, t) = cos(x+ ct) + cos(x− ct)
となり、さらにこれを x で偏微分すると、
∂2f
∂x2(x, t) =
∂
∂x
(∂f
∂x
)(x, t) = − sin(x+ ct) − sin(x− ct) = −f(x, t)
となります。一方、f(x, t) を t で偏微分すると、
∂f
∂t(x, t) = c cos(x+ ct) − c cos(x− ct)
となり、さらにこれを t で偏微分すると、
∂2f
∂t2(x, t) =
∂
∂t
(∂f
∂t
)(x, t) = −c2 sin(x+ ct) − c2 sin(x− ct) = −c2f(x, t)
となります。よって、
∂2f
∂t2(x, t) = −c2f(x, t) = c2(−f(x, t)) = c2
∂2f
∂x2(x, t)
となり、確かに波動方程式 (4)を満たします。 □