Лекции по линейной...

61
Лекции по линейной алгебре 2-ой семестр С.М. Скрябин

Transcript of Лекции по линейной...

Page 1: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

Лекции по линейной алгебре

2-ой семестр

С.М. Скрябин

Page 2: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

Часть 1. Общие свойства линейных отображений

Перечислим ряд используемых обозначений:K — поле, над которым рассматриваются векторные пространства.Mm;n(K) — пространство матриц размера m× n с компонентами из K.Mn(K) = Mn;n(K) — пространство квадратных матриц порядка n.Kn = K × : : :×K — декартово произведение n экземпляров поля K.

Можно интерпретировать Kn либо как пространство матриц-строк M1;n(K),либо как пространство матриц-столбцов Mn;1(K). Отметим, что требуется раз-личать строки и столбцы в тех случаях, когда используется умножение матриц.

Напомним, что dimKn = n, а dimMn;n(K) = mn. Поле K является вектор-ным пространством над самим собой размерности 1.

Символ 0 может обозначать либо число 0, либо нулевой элемент поляK, либонулевой вектор в некотором векторном пространстве, либо нулевое векторноепространство (векторное пространство, состоящее ровно из одного элемента).В каждом случае точный смысл должен усматриваться из контекста.

Пусть V и W — два векторных пространства над полем K.

Определение. Отображение f : V → W называется линейным или, более

точно, K-линейным, если

1) f(x+ y) = f(x) + f(y) для всех x; y ∈ V и

2) f(�x) = �f(x) для всех � ∈ K, x ∈ V .

Линейное отображение V → V называется линейным оператором в про-

странстве V или линейным преобразованием пространства V .

Условия 1) и 2) равносильны одному тождествуf(�x+ �y) = �f(x) + �f(y) для всех �; � ∈ K и x; y ∈ V :Полезно отметить также равенства f(0) = 0, f(−x) = −f(x), которые получа-ются подстановкой � = 0;−1 в условие 2).

Обозначим через L (V;W ) (или HomK(V;W ) ) множество всех линейных отоб-ражений V → W . Множество L (V; V ) всех линейных операторов в простран-стве V будет обозначаться более кратко как L (V ).

Пусть f; g ∈ L (V;W ) и � ∈ K. Определим f + g и �f как отображения из Vв W , заданные по правилам

2

Page 3: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

(f + g)(x) = f(x) + g(x); (�f)(x) = �f(x)для x ∈ V . Эти отображения линейны, поскольку

(f + g)(�x + �y) = f(�x + �y) + g(�x+ �y)= �f(x) + �f(y) + �g(x) + �g(y)= � ·

(f(x) + g(x)) + � ·(f(y) + g(y))

= � · (f + g)(x) + � · (f + g)(y);(�f)(�x + �y) = � · f(�x+ �y)

= � ·(�f(x) + �f(y))

= ��f(x) + ��f(y)= � · (�f)(x) + � · (�f)(y)

для всех �; � ∈ K и x; y ∈ V . Таким образом, f + g и �f принадлежат множе-ству L (V;W ). Тем самым на этом множестве определены операция сложения

L (V;W ) × L (V;W ) → L (V;W )

и операция умножения на скалярыK × L (V;W ) → L (V;W ):Теорема 1.1. Множество L (V;W ), наделённое операциями сложения и умно-

жения на скаляры, является векторным пространством над полем K.

⊲ Требуется проверить выполнение аксиом векторного пространства. В ка-честве примера рассмотрим аксиому ассоциативности сложения ВП2, котораязаписывается так:

(f + g) + h = f + (g + h) для всех f; g; h ∈ L (V;W ):В левой и правой частях этого равенства стоят отображения из V в W . Дваотображения равны тогда и только тогда, когда совпадают их значения накаждом элементе x ∈ V . Вычислим эти значения, пользуясь определением сло-жения в L (V;W ):

(

(f + g) + h)(x) = (f + g)(x) + h(x) =(f(x) + g(x)) + h(x);

(f + (g + h))(x) = f(x) + (g + h)(x) = f(x) +(g(x) + h(x)):

Обратим внимание, что f(x), g(x) и h(x) — это векторы из пространства W .Так как W является векторным пространством, то аксиома ассоциативностисложения выполняется в W . Поэтому

3

Page 4: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

(f(x) + g(x)) + h(x) = f(x) +(g(x) + h(x)) для всех x ∈ V;

и требуемое равенство (f + g) + h = f + (g + h) доказано. Проверка другихаксиом векторного пространства совершенно аналогична. �

Отметим, что нулевым вектором пространства L (V;W ), существование ко-торого требуется аксиомой ВП3, является отображение � : V → W , заданноепо правилу �(x) = 0 для всех x ∈ V:Легко видеть, что это отображение действительно линейно. Если f ∈ L (V;W ),то f + � = f , поскольку

(f + �)(x) = f(x) + �(x) = f(x) + 0 = f(x) для всех x ∈ V:Предположим, что U — ещё одно векторное пространство над тем же самым

полем K. Суперпозиция fg (записываемая более точно как f ◦ g) двух отобра-жений f : V → W и g : U → V — это отображение из U в V , задаваемое поправилу

(fg)(x) = f(g(x)) для x ∈ U:Если f и g линейны, то отображение fg : U →W также линейно, поскольку

(fg)(�x+ �y) = f(g(�x+ �y)) = f(�g(x) + �g(y)) = �f(g(x)) + �f(g(y))для всех �; � ∈ K и x; y ∈ U . Другими словами, fg ∈ L (U;W ) всякий раз,когда f ∈ L (V;W ), а g ∈ L (U; V ).

Если f : V → W — биективное отображение, то определено обратное отобра-жение f−1 : W → V . Для двух векторов v ∈ V и w ∈ W равенство f−1(w) = vвыполнено в точности тогда, когда f(v) = w. Проверим, что из линейности fследует линейность f−1. Возьмём �1; �2 ∈ K и w1; w2 ∈ W . Полагаяv1 = f−1(w1) и v2 = f−1(w2);имеем w1 = f(v1) и w2 = f(v2). Тогда�1w1 + �2w2 = f(�1v1 + �2v2)в силу линейности f . Последнее равенство означает, чтоf−1(�1w1 + �2w2) = �1v1 + �2v2 = �1f−1(w1) + �2f−1(w2):Так как �1; �2 ∈ K и w1; w2 ∈ W были произвольны, то тем самым линейностьf−1 доказана. Итак, f−1 ∈ L (W;V ) всякий раз, когда f — биективное отобра-жение из L (V;W ).

4

Page 5: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

Теорема 1.2. Пусть заданы базис v1; : : : ; vn пространства V и произвольный

набор из n векторов w1; : : : ; wn ∈W . Существует единственное f ∈ L (V;W ),такое, что f(vi) = wi для всех i = 1; : : : ; n.⊲ Каждый вектор x ∈ V единственным способом записывается в виде ли-

нейной комбинации x =n∑i=1

xivi с коэффициентами xi ∈ K (напомним, чтоx1; : : : ; xn называются координатами вектора x в базисе v1; : : : ; vn). Определимотображение f : V →W , полагаяf(x) =

n∑i=1

xiwi:Проверим, что f линейно. Пусть x; y ∈ V , а �; � ∈ K. Обозначим через x1; : : : ; xnкоординаты вектора x, а через y1; : : : ; yn — координаты вектора y в заданномбазисе. Тогда �x+ �y = � n

∑i=1

xivi + � n∑i=1

yivi =n∑i=1

(�xi + �yi)vi;а следовательноf(�x+ �y) =

n∑i=1

(�xi + �yi)wi = � n∑i=1

xiwi + � n∑i=1

yiwi = �f(x) + �f(y):Итак, f ∈ L (V;W ). Рассмотрим некоторый вектор vj заданного базиса в V .

Его j-ая координата равна 1, а все другие равны 0. Поэтому f(vj) =n∑i=1

Æijwi =wj , так что f удовлетворяет требуемому условию.Если g : V → W — ещё одно линейное отображение, причём g(vi) = wi для

всех i, то g(x) = g( n∑i=1

xivi) =n∑i=1

xig(vi) =n∑i=1

xiwi = f(x)для всех x ∈ V , т.е. g = f . �

Теорема 1.3. Пусть v1; : : : ; vn — некоторый базис векторного пространстваV . Линейное отображение f : V →W биективно тогда и только тогда, когдаf(v1); : : : ; f(vn) образуют базис векторного пространства W .

⊲ Обозначим wi = f(vi) для i = 1; : : : ; n.1) Предположим, что f биективно, и докажем, что w1; : : : ; wn — базис W .

Для этого нужно проверить, что каждый вектор z ∈ W единственным спосо-

бом записывается в виде z =n∑i=1

�iwi с коэффициентами �i ∈ K. Так какn∑i=1

�iwi = f(

n∑i=1

�ivi);то равенство z =

n∑i=1

�iwi равносильно тому, что

5

Page 6: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

n∑i=1

�ivi = f−1(z);где f−1 : W → V — обратное отображение, т.е. �1; : : : ; �n — координаты векто-ра f−1(z) в базисе v1; : : : ; vn.

2) Теперь предположим, что w1; : : : ; wn — базис W , и докажем биективностьf . Каждый вектор z ∈W единственным способом записывается в видеz =n∑i=1

ziwi; zi ∈ K:Аналогично, каждый x ∈ V записывается в виде x =

n∑i=1

xivi, xi ∈ K. Так какf(x) =n∑i=1

xiwi;то равенство f(x) = z выполняется в точности тогда, когда xi = zi для каждогоi = 1; : : : ; n. Отсюда следует, что каждый вектор z ∈ W имеет единственныйпрообраз x ∈ V при отображении f . �

Определение. Изоморфизмом векторных пространств называется любое би-

ективное линейное отображение V →W . Говорят, что векторные простран-

ства V и W изоморфны (записывается V ∼= W ), если существует хотя бы

один изоморфизм V →W .

Пример. Отображение h : V → Kn, которое сопоставляет каждому векто-ру x ∈ V упорядоченный набор (x1; : : : ; xn) ∈ Kn координат этого вектора вфиксированном базисе v1; : : : ; vn пространства V является изоморфизмом век-торных пространств. Обратное отображение h−1 : Kn → V задаётся по правилуh−1(�1; : : : ; �n) =

n∑i=1

�ivi для �1; : : : ; �n ∈ K.

Следствие. Конечномерные векторные пространства V и W изоморфны то-

гда и только тогда, когда dimV = dimW .

⊲ Если V ∼= W , то существует биективное линейное отображение f : V →W .Тогда f(v1); : : : ; f(vn) образуют базис в W , а значит dimW = n. Обратно, еслиdimW = n, то, выбирая произвольный базис w1; : : : ; wn в W и применяя тео-рему 1.2, построим линейное отображение f : V →W , переводящее vi в wi длявсех i = 1; : : : ; n. По теореме 1.3 f биективно, т.е. f — изоморфизм. �

Предположим, что V и W — конечномерные векторные пространства надполем K, в которых выбраны базисы v1; : : : ; vn и w1; : : : ; wm, соответственно.Пусть f ∈ L (V;W ). Применяя f к v1; : : : ; vn, получаем n векторовf(v1); : : : ; f(vn) ∈W;

6

Page 7: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

каждый из которых единственным способом записывается в виде линейной ком-бинации векторов w1; : : : ; wm. Пусть aij ∈ K — коэффициенты, появляющиесяв разложениях f(vj) =

m∑i=1

aijwi при j = 1; : : : ; n:Определение. Матрицей линейного отображения f в базисах v1; : : : ; vn иw1; : : : ; wm называется следующая матрица размера m× n:Mf =

a11 a12 : : : a1na21 a22 : : : a2n...

.... . .

...am1 am2 : : : amn

:Коэффициенты в разложении вектора f(vj) заносятся в j-ый столбец матри-

цы Mf . Нужно обратить внимание на то, что матрица Mf зависит не толькоот f , но также от того, какие базисы в V и W были выбраны.

Если W = V , то можно выбрать два базиса пространства V одинаковыми,т.е. взять wi = vi для всех i = 1; : : : ; n. В этом случае матрицаMf для f ∈ L (V )называется матрицей линейного оператора f в базисе v1; : : : ; vn. Эта матрицаявляется квадратной порядка n, т.е. Mf ∈Mn(K).

Знание матрицы Mf позволяет найти явное выражение для линейного отоб-ражения f : V →W в координатной форме.

Теорема 1.4. Предположим, что y = f(x), где x ∈ V — произвольный век-

тор. Тогда координаты x1; : : : ; xn вектора x в базисе v1; : : : ; vn и координатыy1; : : : ; ym вектора y в базисе w1; : : : ; wm связаны матричным соотношением

y1...ym

= Mf · x1

...xn

:⊲ Пусть Mf =

(aij). По условию y =m∑i=1

yiwi, x =n∑j=1

xjvj . Далее,f(x) =n∑j=1

xjf(vj) =n∑j=1

xj( m∑i=1

aijwi) =m∑i=1

(

n∑j=1

xjaij)wi:Приравнивая коэффициенты при wi в равенстве y = f(x), получаемyi =

n∑j=1

aijxj для всех i = 1; : : : ;m:Этот набор равенств сводится к требуемому матричному равенству. �

7

Page 8: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

Примеры. 1) Тождественный оператор IdV : V → V задаётся соответствиемv 7→ v для всех v ∈ V . Матрица этого оператора в любом базисе пространстваV есть единичная матрица E.2) Если f = � · IdV , то f(v) = �v для всех v ∈ V , т.е. f есть оператор скаляр-

ного умножения на �. Имеем Mf = �E.3) Предположим, что V = Kn и W = Km — пространства столбцов длиныn и m соответственно. По любой матрице A =

(aij) ∈ Mm;n(K) определимлинейное отображение 'A : Kn → Km при помощи матричного умножения:'A(x) = Ax для x ∈ Kn. Выберем в Kn стандартный базисe1 =

10...0

; e2 =

01...0

; :::; en =

10...0

:и, аналогично, в Km стандартный базис e′1; e′2; : : : ; e′m. Произведение Aej равноj-ому столбцу матрицы A. Следовательно,'A(ej) = Aej =

m∑i=1

aije′i:Можно сделать вывод, что матрица отображения 'A в стандартных базисахпространств Kn и Km совпадает с A.

Теорема 1.5. При выбранных и зафиксированных базисах в V и W соответ-

ствие f 7→Mf задаёт изоморфизм векторных пространств� : L (V;W ) →Mm;n(K); где m = dimW , n = dimV :⊲ Нужно проверить, что отображение � линейно и биективно. По определе-нию �(f) = Mf . Пусть f; g ∈ L (V;W ), а �; � ∈ K. Если Mf =

(aij) и Mg =(bij)

— матрицы из Mm;n(K), соответствующие f и g, тоf(vj) =m∑i=1

aijwi; g(vj) =m∑i=1

bijwiдля всех j = 1; : : : ; n. Вспоминая определение операций сложения и умноженияна скаляры в пространстве L (V;W ), находим

(�f + �g)(vj) = �f(vj) + �g(vj) = � m∑i=1

aijwi + � m∑i=1

bijwi =m∑i=1

(�aij + �bij)wi:Из этих разложений следует, что матрица линейного отображения �f + �g в i-ой строке и j-ом столбце содержит элемент �aij +�bij для каждого i = 1; : : : ;mи j = 1; : : : ; n. Другими словами,

8

Page 9: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

M�f+�g =(�aij + �bij) = � ·

(aij) + � ·(bij) = �Mf + �Mg :

Это означает, что �(�f + �g) = ��(f) + ��(g), т.е. � линейно.Пусть теперь C =

( ij) — произвольная матрица из Mm;n(K). По этой мат-рице определим векторы w′

1; : : : ; w′n ∈W , полагаяw′j =m∑i=1

ijwi:Если f ∈ L (V;W ), то равенство Mf = C выполняется в точности тогда, когдаf(vj) = w′j для всех j = 1; : : : ; n:В силу теоремы 1.2 такое f существует и единственно. Итак, для каждой мат-рицы C ∈ Mm;n(K) существует единственное f , для которого �(f) = C. Темсамым биективность � также проверена. �

Теорема 1.5 устанавливает взаимно однозначное соответствие между линей-ными отображениями f : V → W и матрицами размера m× n с компонентамииз K. Отметим ещё раз, что линейность отображения � в теореме 1.5 означает,что для всех f; g ∈ L (V;W ) и � ∈ K выполняются равенстваMf+g = Mf +Mg; M�f = �Mf :Следствие. dim L (V;W ) = (dimV )(dimW ).

⊲ Так как L (V;W ) ∼= Mm;n(K), то dim L (V;W ) = dimMm;n(K) = mn. �

Предположим, что заданы три векторных пространства U; V;W и выбраныбазисы u1; : : : ; uk в U , v1; : : : ; vn в V , w1; : : : ; wm в W .

Теорема 1.6. 1) Если f ∈ L (V;W ), а g ∈ L (U; V ), то Mfg = MfMg.2) Линейное отображение f : V → W биективно тогда и только тогда,

когда Mf — обратимая квадратная матрица. При этом Mf−1 = M−1f .

В этой теореме матрицы линейных операторов вычисляются в соответству-ющих базисах:Mf — в базисах v1; : : : ; vn и w1; : : : ; wm;Mg — в базисах u1; : : : ; uk и v1; : : : ; vn;Mfg — в базисах u1; : : : ; uk и w1; : : : ; wm;Mf−1 — в базисах w1; : : : ; wm и v1; : : : ; vn при m = n:Эти матрицы имеют размеры m× n, n× k, m× k и n× n соответственно.

9

Page 10: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

⊲ 1) Пусть Mf =(aij), Mg =

(bjl). Это означает, что выполняются равенстваf(vj) =m∑i=1

aijwi при j = 1; : : : ; n;g(ul) =n∑j=1

bjlvj при l = 1; : : : ; k:Как известно, суперпозиция fg является линейным отображением из U в W .Для того чтобы найти его матрицу, нужно применить fg к базисным векторампространства U . На первом этапе можно воспользоваться разложениями век-торов g(ul) по базису v1; : : : ; vn в пространстве V :

(fg)(ul) = f(g(ul)) = f(

n∑j=1

bjlvj) =n∑j=1

bjlf(vj)Теперь, подставляя выражение f(vj) в виде линейной комбинации w1; : : : ; wm,получаем

(fg)(ul) =n∑j=1

bjl( m∑i=1

aijwi) =m∑i=1

n∑j=1

bjlaijwi =m∑i=1

(

n∑j=1

aijbjl)wi:Появляющийся здесь коэффициент

n∑j=1

aijbjl даёт (i; l)-компоненту матрицыMfg. Вспоминая, как перемножаются две матрицы, делаем вывод, что про-изведение MfMg имеет те же самые компоненты. Поэтому Mfg = MfMg.

2a) Предположим, что f биективно. В этом случае V ∼= W , а тогда dimW =dimV , т.е. m = n. В первой лекции было проверено, что обратное отображениеf−1 : W → V линейно. Поскольку f−1f = IdV , то из утверждения 1) теоремывыводим, что Mf−1Mf = Mf−1f = MIdV = E:Это равенство показывает, что Mf−1 является обратной матрицей к Mf .

2b) Предположим, что Mf — обратимая квадратная матрица. В частности,m = n. По теореме 1.5 соответствие h 7→ Mh устанавливает биекцию междуL (W;V ) и Mn(K). Поэтому существует единственное линейное отображениеh : W → V с матрицей Mh = M−1f . Рассмотрим суперпозиции hf : V → V иfh : W →W . В силу пункта 1) имеемMhf = MhMf = E; Mfh = MfMh = E:Используя снова биективность соответствий между линейными отображениямии матрицами соответствующих размеров, заключаем, что hf = IdV и, анало-гично, fh = IdW . Таким образом, h = f−1. Из обратимости f следует, что fбиективно. �

10

Page 11: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

Пусть v1; : : : ; vn и v′1; : : : ; v′n — два базиса векторного пространства V . Запи-шем разложения векторов второго базиса по первому базису:v′j =

n∑i=1

pijvi; j = 1; : : : ; n;где pij ∈ K. Матрица P =

(pij) называется матрицей перехода от базисаv1; : : : ; vn к базису v′1; : : : ; v′n. Таким образом, эта матрица состоит из координатвекторов v′1; : : : ; v′n в базисе v1; : : : ; vn. Координаты вектора v′j записываются вj-ый столбец матрицы P . Как известно из 1-го семестра, матрица перехода об-ратима, т.е. существует обратная матрица P−1 ∈ Mn(K) (в действительностиP−1 есть матрица перехода от второго базиса к первому).

Теорема 1.7. Пусть A есть матрица линейного оператора f : V → V в ба-

зисе v1; : : : ; vn, а A′ — матрица этого оператора в базисе v′1; : : : ; v′n. ТогдаA′ = P−1AP;где P есть матрица перехода от первого базиса ко второму.

⊲ Обозначим через aij компоненты матрицы A, а через a′ij компоненты мат-рицы A′, где 1 ≤ i; j ≤ n. Тогдаf(vj) =

n∑i=1

aijvi; f(v′j) =n∑i=1

a′ijv′iдля всех j = 1; : : : ; n. Для каждого g ∈ L (V ) условимся обозначать через Mgматрицу оператора g в базисе v1; : : : ; vn. В частности, Mf = A. По теореме 1.2существует единственный линейный оператор h : V → V , такой, что h(vi) = v′iдля всех i = 1; : : : ; n. Посколькуh(vj) = v′j =

n∑i=1

pijviдля всех j, то Mh = P . Рассмотрим линейный оператор h−1fh ∈ L (V ). Потеореме 1.6, применённой в ситуации, когда U = V = W и три базиса (ui), (vi),(wi) пространства V выбраны одинаковыми, имеемMh−1fh = Mh−1MfMh = M−1h MfMh = P−1AP:С другой стороны, можно непосредственно вычислить действие h−1fh на век-торы v1; : : : ; vn. Равенство h(vi) = v′i означает, что h−1(v′i) = vi. С учётом этогополучаем

11

Page 12: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

(h−1fh)(vj) = h−1(f(h(vj) )

)

= h−1( f(v′j) )

= h−1(

n∑i=1

a′ijv′i )=

n∑i=1

a′ijh−1(v′i) =n∑i=1

a′ijviдля всех j. Отсюда следует, что Mh−1fh = A′. Сравнение двух выражений дляматрицы оператора h−1fh даёт P−1AP = A′. �

Приведём альтернативное доказательство теоремы 1.7. Оно более прямо, од-нако и более вычислительно.

⊲ Выразим левую и правую части равенства f(v′j) =n∑i=1

a′ijv′i в виде линейной

комбинации векторов v1; : : : ; vn:f(v′j) = f(n∑k=1

pkjvk) =n∑k=1

pkjf(vk) =n∑k=1

pkj( n∑i=1

aikvi) =n∑i=1

(

n∑k=1

aikpkj)vi;n∑i=1

a′ijv′i =n∑k=1

a′kjv′k =n∑k=1

a′kj( n∑i=1

pikvi) =n∑i=1

(

n∑k=1

pika′kj)vi:Таким образом, n

∑i=1

(

n∑k=1

aikpkj)vi =n∑i=1

(

n∑k=1

pika′kj)vi:Приравнивая коэффициенты при vi, получаемn

∑k=1

aikpkj =n∑k=1

pika′kj :Эти равенства выполняются для всех 1 ≤ i; j ≤ n. В левой части равенств сто-ят (i; j)-компоненты произведения AP , а в правой части — (i; j)-компонентыпроизведения PA′. В результате приходим к матричному равенству AP = PA′.Умножая слева на P−1, получаем P−1AP = A′. �

Определение. Две матрицы A;A′ ∈ Mn(K) называются подобными, если

можно найти обратимую матрицу P ∈Mn(K), для которой A′ = P−1AP .

Следствие. Матрицы заданного линейного оператора f : V → V в любых

двух базисах векторного пространства V подобны.

Определение. Ядром линейного отображения f : V → W называется мно-

жество

Ker f = {v ∈ V | f(v) = 0};а образом — множество

12

Page 13: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

Im f = {w ∈ W | ∃x ∈ V ( w = f(x) )

} = {f(v) | v ∈ V }:Если v1; v2 ∈ Ker f , то из равенств f(v1) = 0, f(v2) = 0 следует, чтоf(�1v1 + �2v2) = �1f(v1) + �2f(v2) = 0;

т.е. �1v1 + �2v2 ∈ Ker f , для любых �1; �2 ∈ K. Это доказывает, что Ker f яв-ляется векторным подпространством в V .

Если w1; w2 ∈ Im f , то можно записать w1 = f(v1), w2 = f(v2) для некоторыхv1; v2 ∈ V . Тогда�1w1 + �2w2 = �1f(v1) + �2f(v2) = f(�1v1 + �2v2) ∈ Im fдля любых �1; �2 ∈ K. Поэтому Im f — векторное подпространство в W .

Теорема 1.8. Пусть f : V →W — некоторое линейное отображение.

1) f инъективно тогда и только тогда, когда Ker f = 0.

2) f сюръективно тогда и только тогда, когда Im f = W .

3) f биективно тогда и только тогда, когда Ker f = 0 и Im f = W .

4) Если dimV = dimW < ∞, то сюръективность, инъективность и биек-

тивность f равносильны.

⊲ 1) Если f инъективно и v ∈ Ker f , то из равенств f(v) = 0 = f(0) следует,что v = 0. Таким образом, инъективность f влечёт равенство Ker f = 0.

Предположим теперь, что Ker f = 0. Если v1; v2 ∈ V — два вектора, длякоторых f(v1) = f(v2), то v1 − v2 ∈ Ker f , посколькуf(v1 − v2) = f(v1) − f(v2) = 0:Но тогда v1 − v2 = 0, т.е. v1 = v2. Это доказывает, что f инъективно.

Утверждение 2) сводится к определению сюръективного отображения, а 3)следует из 1) и 2), так как биективность f означает в точности, что f сюръек-тивно и инъективно одновременно.

Пусть dimV = dimW = n. Для доказательства 4) нужно воспользоватьсяформулой

dim Ker f + dim Im f = dimV;которая будет доказана в следующей теореме. Из этой формулы следует, чтоdim Ker f = 0 тогда и только тогда, когда dim Im f = n. Заметим, что каж-дое ненулевое векторное пространство имеет положительную размерность, акаждое подпространство в W , не совпадающее со всем W , имеет размерностьстрого меньше n. Поэтому

dim Ker f = 0 ⇔ Ker f = 0 ⇔ f инъективно;в то время как

dim Im f = n ⇔ Im f = W ⇔ f сюръективно: �

13

Page 14: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

Теорема 1.9. Предположим, что векторные пространства V; W конечномер-

ны и f ∈ L (V;W ). Тогда

dim Ker f + dim Im f = dimV:⊲ Пусть k = dim Ker f , n = dimV . Так как Ker f — векторное подпростран-ство в V , то k ≤ n. Выберем произвольным образом базис v1; : : : ; vk в Ker fи дополним его до базиса v1; : : : ; vn всего пространства V . Покажем, что век-торы f(vk+1); : : : ; f(vn) образуют базис в Im f . Отсюда будет следовать, чтоdim Im f = n− k, и проверка требуемого равенства будет завершена.

Так как v1; : : : ; vk ∈ Ker f , то f(vi) = 0 для всех i = 1; : : : ; k. Если x ∈ V —

произвольный вектор, то, записывая его в виде x =n∑i=1

�ivi с коэффициентами�i ∈ K, получим f(x) =n∑i=1

�if(vi) =n∑i=k+1

�if(vi):Таким образом, каждый вектор из Im f записывается в виде линейной комбина-ции векторов f(vk+1); : : : ; f(vn), т.е. перечисленные векторы порождают Im f .

Проверим, что эти векторы также линейно независимы. Предположим, чтоn−k∑j=1

�jf(vk+j) = 0 для некоторых �1; : : : ; �n−k ∈ K:Тогда

n−k∑j=1

�jvk+j ∈ Ker f . Поскольку Ker f порождается векторами v1; : : : ; vk,то можно записать n−k

∑j=1

�jvk+j =k∑i=1

�iviдля подходящих �1; : : : ; �k. В силу линейной независимости векторов v1; : : : ; vnвсе коэффициенты в выписанном равенстве должны быть равны 0. В частно-сти, �j = 0 для всех j. Тем самым проверка завершена. �

Определение. Рангом линейного отображения f : V →W называется число

rank f = dim Im f:Теорема 1.10. Пусть f ∈ L (V;W ). При любом выборе базисов в простран-

ствах V и W выполняется равенство

dim Im f = rankMf ;т.е. ранг линейного отображения f равен рангу матрицы Mf .

14

Page 15: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

⊲ Обозначим через aij , где 1 ≤ i; j ≤ n, компоненты матрицы Mf , вычислен-ной в базисе v1; : : : ; vn пространства V и базисе w1; : : : ; wm пространства W .Зададим изоморфизм векторных пространств h : W → Km по правилуh( m∑i=1

�iwi) =

�1...�m

; где �i ∈ K;т.е. h сопоставляет каждому вектору из W упорядоченный набор координатэтого вектора в базисе w1; : : : ; wm. Как известно, Im f является векторным под-пространством в W . Положим U = Im f и рассмотрим множествоh(U) = {h(u) | u ∈ U};которое совпадает с образом линейного отображения h|U : U → Km, полученно-го ограничением h на U . В частности, h(U) — векторное подпространство в Km.Поскольку h отображает U на h(U) биективно, то h|U даёт изоморфизм век-торных пространств U → h(U). Можно сделать вывод, что dimU = dimh(U).

Теперь вычислим h(U) в явном виде. Если u ∈ U , тоu = f(n∑j=1

�jvj) =n∑j=1

�jf(vj) для некоторых �1; : : : ; �n ∈ K;а тогда h(u) =

n∑j=1

�j h(f(vj)):Отсюда следует, что векторное подпространство h(U) в Km порождается век-

торами h(f(v1)); : : : ; h(f(vn)). Используя равенство f(vj) =m∑i=1

aijwi и опреде-

ление h, находим h(f(vj)) = h( m∑i=1

aijwi) =

a1j...amj

:

Обозначая через A(1); : : : ; A(n) столбцы матрицы Mf , можно переписать преды-дущее равенство в виде h(f(vj)) = A(j). Таким образом,h(U) = 〈A(1); : : : ; A(n)〉:Как известно из 1-го семестра, ранг произвольной матрицы из Mm;n(K) равенразмерности векторного подпространства в Km, порождённого столбцами этойматрицы. В частности, rankMf = dimh(U) = dimU . �

В 1-ом семестре изучались способы вычисления ранга матрицы. Таким обра-зом, по матрице Mf можно вычислить размерность Im f , а с использованиемтеоремы 1.9 также и размерность Ker f . Применяя теорему 1.8, это позволяетвыяснить, будет ли f инъективным или сюръективным.

15

Page 16: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

Часть 2. Приведение линейных операторов

Вспомним, что линейным оператором в векторном пространстве V мы усло-вились называть любое линейное отображение V → V . В дальнейшем все век-торные пространства будут предполагаться конечномерными. Линейные опе-раторы будут обозначаться рукописными буквами A , B, C и т.д. Результатприменения линейного оператора A : V → V к вектору x ∈ V будет сокращён-но обозначаться как A x, т.е. будут опускаться скобки вокруг аргумента x.

Как ранее было выяснено, множество L (V ) всех линейных операторов в век-торном пространстве V само является векторным пространством относительноопераций сложения и умножения на скаляры. Кроме того в L (V ) определенаоперация умножения L (V ) × L (V ) → L (V ), задаваемая суперпозицией опе-раторов. В явном виде перечисленные три операции задаются формулами

(A + B)x = A x+ Bx; (�A )x = � · A x; (A B)x = A (Bx);где A ;B ∈ L (V ), � ∈ K, x ∈ V .

Как следует из известных свойств суперпозиции отображений, умножениев L (V ) ассоциативно и обладает единичным элементом, в качестве котороговыступает тождественный оператор E = IdV . Таким образом, для A ;B;C ∈L (V ) выполняются тождества

(A B)C = A (BC ); A E = E A = A :Кроме того, имеют место законы дистрибутивности

A (B + C ) = A B + A C ; (A + B)C = A C + BC :Для проверки этих равенств нужно применить операторы в левых и правыхчастях к каждому элементу x ∈ V . Например,

(

A (B + C ))x = A

(

(B + C )x) = A (Bx+ C x) = A (Bx) + A (Cx)даёт тот же результат, что и

(A B + A C )x = (A B)x + (A C )x = A (Bx) + A (C x);в силу определения произведения и суммы двух операторов и в силу линейно-сти оператора A .

Поскольку L (V ) образует коммутативную группу относительно операциисложения, то выписанные выше тождества показывают, что L (V ) удовлетво-ряет всем аксиомам кольца с 1. Умножение на скаляры и умножение в L (V )подчиняются тождествам

(�A )B = �(A B) = A (�B);которые проверяются аналогично.

16

Page 17: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

Определение. Алгеброй над полем K (более точно, ассоциативной алгеброй)называется множество R, наделённое операциями сложения R × R → R,

умножения на скаляры K × R → R и умножения R × R → R, которые удо-

влетворяют следующим условиям:

1) относительно первых двух операций R является векторным простран-

ством над полем K,

2) относительно первой и третьей операций R является кольцом,

3) (�a)b = �(ab) = a(�b) для всех � ∈ K и a; b ∈ R.

Подытоживая предшествующее обсуждение, можно сказать, что L (V ) явля-ется алгеброй над полем K. В качестве другого примера можно привести ал-гебру Mn(K) квадратных матриц порядка n. Кольцо многочленов K[t1; : : : ; tn]от n независимых переменных t1; : : : ; tn c коэффициентами из K также явля-ется алгеброй над полем K. В частности, мы будем иметь дело с алгеброй K[t]многочленов от одной переменной t.Определение. Пусть A ∈ L (V ). Для каждого многочлена f =

m∑i=0

iti с ко-

эффициентами i ∈ K определим линейный операторf(A ) =m∑i=0

iA i ∈ L (V );который получается формальной подстановкой линейного оператора A в мно-

гочлен f вместо переменной t. При этом считается, что A 0 = E .

Таким образом, в подробной записи,f(A ) = 0E + 1A + : : :+ mAm:

Непосредственная проверка, которая достаточно очевидна и поэтому не изла-гается, показывает, что для f; g ∈ K[t] и � ∈ K выполняются равенства

(f + g)(A ) = f(A ) + g(A ); (�f)(A ) = � · f(A ); (fg)(A ) = f(A )g(A ):Поскольку умножение в кольце K[t] коммутативно, то линейные операторыf(A ) и g(A ) перестановочны, т.е.f(A )g(A ) = g(A )f(A ):

Аналогичным образом определяется многочлен f(A) от матрицы A ∈Mn(K).Из правил вычисления матриц линейных операторов следует, что в любом за-фиксированном базисе пространства V выполняется равенствоMf(A ) = f(MA ):

В дальнейшем важную роль будут играть многочлены f , для которых f(A )совпадает с нулевым оператором O. Вспомним, что нулевой оператор задаётсяпо правилу x 7→ 0 для всех x ∈ V .

17

Page 18: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

Определение. Минимальным многочленом линейного оператора A : V → Vназывается ненулевой многочлен �A ∈ K[t] наименьшей степени, для кото-

рого �A (A ) = O и старший коэффициент равен 1.

Теорема 2.1. 1) Для заданного линейного оператора A : V → V его мини-

мальный многочлен �A существует и определён однозначно.

2) Степень многочлена �A равна наибольшему целому числу d > 0, такому,

что линейные операторы E ;A ; : : : ;A d−1 линейно независимы над полем K.

3) Каждый многочлен f ∈ K[t], для которого f(A ) = O, делится на �A в

кольце K[t].⊲ Векторное пространство L (V ) конечномерно; на самом деле

dim L (V ) = (dimV )2 <∞:Поэтому бесконечная последовательность линейных операторов E ;A ;A 2; : : :не может быть линейно независимой. Следовательно выполняется соотношениелинейной зависимости 0E + 1A + : : :+ mA

m = O

для подходящих коэффициентов 0; 1; : : : ; m ∈ K, не все из которых равны0. Но такое соотношение означает в точности, что f(A ) = O, где в качестве fвзят многочлен f =

m∑i=0

iti ∈ K[t]. При этом f 6= 0 в силу наложенного условия

на коэффициенты i. Другими словами, множество всех ненулевых многочле-нов f ∈ K[t], для которых f(A ) = O, непусто. В этом множестве можно вы-брать многочлен наименьшей степени и, умножая его на подходящий скаляр,добиться того, чтобы старший коэффициент был равен 1. Это доказывает су-ществование минимального многочлена �A .

Пусть d = deg �A . Равенство �A (A ) = O даёт нетривиальное соотноше-ние линейной зависимости между операторами E ;A ; : : : ;A d. В то же времяE ;A ; : : : ;A d−1 не могут быть линейно зависимыми, так как в противном слу-чае нашёлся бы многочлен f ∈ K[t] степени меньше d, для которого f(A ) = O.

Предположим теперь, что f ∈ K[t] — произвольный многочлен с условиемf(A ) = O. Разделим f на �A с остатком. Это даёт равенство f = q�A + r, гдеq; r ∈ K[t], причём deg r < deg�A (возможно r = 0). Подставляя A вместо t,получаем f(A ) = q(A )�A (A ) + r(A ):Так как f(A ) = O и �A (A ) = O, то отсюда выводится равенство r(A ) = O,которое невозможно при r 6= 0 ввиду условия минимальности степени много-члена �A . Поэтому r = 0. Это означает, что f = q�A , т.е. f делится на �A безостатка.

Если deg f = deg�A , то из сравнения старших членов в равенстве f = q�A

можно сделать вывод, что deg q = 0, т.е. q ∈ K. Тогда старший коэффициентмногочлена f равен q. Этот коэффициент равен 1 только тогда, когда q = 1,т.е. f = �A . Поэтому минимальный многочлен единствен. �

18

Page 19: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

Определение. Пусть A ∈ L (V ). Векторное подпространство U ⊆ V назы-

вается инвариантным относительно A , если A (U) ⊆ U , т.е. A x ∈ U для

всех x ∈ U .

Очевидно, что нулевое подпространство и всё векторное пространство V ин-вариантны относительно любого линейного оператора V → V . Примерами под-пространств, инвариантных относительно линейного оператора A являютсяего ядро KerA и образ Im A . Сумма и пересечение некоторого семейства ин-вариантных подпространств являются инвариантными подпространствами.

Теорема 2.2. Пусть v1; : : : ; vn — базис векторного пространства V , такой,

что векторы v1; : : : ; vm, где m ≤ n, образуют базис подпространства U ⊆ V .

Для того чтобы U было инвариантным относительно линейного оператора

A : V → V , необходимо и достаточно, чтобы матрица оператора A в базисеv1; : : : ; vn имела блочный вид A =

(A1 B0 A2

) ;где A1; B;A2 — блоки размеров m×m, m× (n−m), (n−m)× (n−m) соответ-

ственно, а в левом нижнем углу содержится нулевой блок размера (n−m)×m.

Если U инвариантно относительно A , то A1 будет матрицей линейного опе-

ратора A |U : U → U в базисе v1; : : : ; vm.

⊲ Обозначим через aij , 1 ≤ i; j ≤ n, компоненты матрицы A. Тогда

A vj =n∑i=1

aijvi при j = 1; : : : ; n:Если j ≤ m, то vj ∈ U , и из инвариантности подпространства U следует, чтоA vj ∈ U . Однако каждый вектор из U записывается в виде линейной комби-нации векторов v1; : : : ; vm. Поэтому условие A vj ∈ U равносильно тому, чтоaij = 0 для всех i > m.

Таким образом, инвариантность подпространства U влечёт равенстваaij = 0 для всех i = m+ 1; : : : ; n и j = 1; : : : ;m: (∗)

Совокупность этих равенств означает в точности, что матрица A содержит ну-левой блок размера (n − m) × m в левом нижнем углу. При j = 1; : : : ;m вразложении по базису вектора A vj все векторы vm+1; : : : ; vn входят с нулевы-ми коэффициентами, так что

A vj =m∑i=1

aijvi:Отсюда вытекает утверждение о матрице оператора A |U .

19

Page 20: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

Обратно, предположим, что равенства (∗) выполнены. Тогда A vj ∈ U для

всех j = 1; : : : ;m. Если x — произвольный вектор из U , то x =m∑j=1

�jvj для

некоторых �1; : : : ; �m ∈ K. Тогда

A x =m∑j=1

�jA vj ∈ U:Это доказывает, что A (U) ⊆ U , т.е. U инвариантно относительно A . �

Определение. Характеристическим многочленом матрицы A ∈ Mn(K) на-

зывается многочлен �A ∈ K[t], определяемый по формуле�A(t) = det(A− tE) =

a11 − t a12 · · · a1na21 a22 − t · · · a2n...

.... . .

...an1 an2 · · · ann − t ∣∣∣∣∣∣∣∣ :Полное разложение определителя матрицы tE −A имеет вид

det(A− tE) =∑�∈Sn "� n

∏i=1

(ai;�(i) − tÆi;�(i));где Sn — это группа перестановок множества {1; : : : ; n}, а "� обозначает знакперестановки �. Из этой формулы видно, что �A(t) действительно являетсямногочленом от переменной t степени n. В случае, когда � — неединичная пе-рестановка, соответствующее � слагаемое в сумме является произведением nкомпонент матрицы A − tE, по крайней мере две их которых находятся внеглавной диагонали и поэтому не содержат t. В такое произведение t входит встепени не выше n − 2. Следовательно, tn и tn−1 появляются только в одномслагаемом, которое соответствует единичной перестановке � и даётся произве-

дениемn∏i=1

(aii− t). Таким образом, коэффициент при tn в многочлене �A равен

(−1)n, а коэффициент при tn−1 равен (−1)n−1 trA, где

trA =n∑i=1

aii — это след матрицы A:Свободный член многочлена �A находится подстановкой t = 0:�A(0) = detA:

Иногда в определении характеристического многочлена используется мат-рица tE − A вместо матрицы A − tE. Это не приводит к принципиальнымразличиям, поскольку det(tE −A) = (−1)n det(A− tE).

20

Page 21: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

Теорема 2.3. Характеристические многочлены двух подобных матриц совпа-

дают.

⊲ Предположим, что две матрицы A;A′ ∈Mn(K) подобны. Тогда существуеттакая обратимая матрица P ∈Mn(K), что A′ = P−1AP . ПосколькуA′ − tE = P−1AP − tP−1P = P−1(A− tE)P;то �A′(t) = det(A′ − tE) = det(P )−1 det(A− tE) det(P ) = �A(t):

Определение. Характеристический многочлен, след и определитель линей-

ного оператора A : V → V определяются по формулам�A = �A; tr A = trA; detA = detA;где A — это матрица оператора A в произвольном базисе векторного про-

странства V .

Поскольку матрицы линейного оператора A : V → V в любых двух базисахпространства V подобны, то в силу теоремы 2.3 характеристический многочлен�A не зависит от выбора базиса, в котором вычисляется матрица оператора A .В частности, величины trA и detA, которые с точностью до множителя сов-падают с двумя коэффициентами многочлена �A, также не зависят от выборабазиса.

Определения. Ненулевой вектор x ∈ V называется собственным векторомлинейного оператора A : V → V , если одномерное подпространство 〈x〉, на-

тянутое на x, инвариантно относительно A .

Элемент � ∈ K называется собственным значением оператора A , если су-

ществует ненулевой вектор y ∈ V , для которого A y = �y.Множество всех собственных значений линейного оператора A : V → V

называется спектром оператора A и обозначается Spec A .

Если x — собственный вектор оператора A , то A x ∈ 〈x〉, т.е. A x = �x длянекоторого � ∈ K. При этом � определяется по x однозначно в силу того, чтоx 6= 0. Поэтому каждый собственный вектор x отвечает некоторому собствен-ному значению �.

Для � ∈ K определим V � = {y ∈ V | A y = �y}:Заметим, что равенство A y = �y может быть переписано в виде (A −�E )y = 0.Поэтому V � = Ker(A − �E ):В частности, V � есть векторное подпространство в V . При этом V � 6= 0 тогдаи только тогда, когда � ∈ Spec A . Ненулевые векторы из V � — это в точностисобственные векторы оператора A , отвечающие собственному значению �.

21

Page 22: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

Определение. V � называется подпространством собственных векторов ли-

нейного оператора A , отвечающих собственному значению �.Теорема 2.4. Для заданного � ∈ K следующие утверждения эквивалентны:

1) � есть собственное значение линейного оператора A : V → V ,

2) � есть корень характеристического многочлена �A ,

3) � есть корень минимального многочлена �A .

Другими словами, � ∈ Spec A ⇔ �A (�) = 0 ⇔ �A (�) = 0.

⊲ 1) ⇔ 2). Необходимое и достаточное условие для того, чтобы � было соб-ственным значением, состоит в том, что Ker(A − �E ) 6= 0. Пусть A — мат-рица оператора A в некотором базисе v1; : : : ; vn векторного пространства V ,а x1; : : : ; xn — координаты вектора x ∈ V в том же самом базисе. Матрицалинейного оператора A − �E в базисе v1; : : : ; vn равна A − �E. Вспоминая,как вычисляются координаты вектора (A − �E )x, можно сделать вывод, что(A − �E )x = 0 тогда и только тогда, когда

(A− �E) ·

x1...xn

=

0...0

:Поэтому ненулевой вектор x ∈ V , удовлетворяющий условию (A − �E )x = 0,существует тогда и только тогда, когда однородная система линейных уравне-ний n

∑j=1

(aij − �Æij)xj = 0; i = 1; : : : ; n;с неизвестными x1; : : : ; xn ∈ K и матрицей коэффициентов A − �E имеетнетривиальное решение. Необходимое и достаточное условие существованиянетривиального решения состоит в том, что матрица A − �E вырождена, т.е.det(A− �E) = 0. Остаётся заметить, что

det(A− �E) = �A(�) = �A (�):1) ⇒ 3). Если � ∈ Spec A , то существует ненулевой вектор x ∈ V с условием

A x = �x. Тогда A ix = �ix для всех i = 0; 1; : : : , и для каждого многочленаf =m∑i=0

iti с коэффициентами i ∈ K получаемf(A )x =m∑i=0

iA ix =m∑i=0

i�ix = f(�)x:В частности, �A (A )x = �A (�)x. Но равенство �A (A ) = O даёт �A (�)x = 0,откуда �A (�) = 0 в силу того, что x 6= 0.

3) ⇒ 1). Предположим, что � ∈ K — произвольный корень многочлена �A .Тогда �A делится на t−� в кольце K[t], т.е. �A (t) = (t−�)g(t) для некоторого

22

Page 23: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

g ∈ K[t]. Подставляя оператор A вместо t в это равенство, получаем

O = �A (A ) = (A − �E )g(A ):Следовательно, (A − �E )g(A )y = 0, т.е.g(A )y ∈ Ker(A − �E ) = V �;для любого y ∈ V . Однако g(A ) 6= O в силу условия минимальности много-члена �A . Поэтому можно подобрать y ∈ V , для которого g(A )y 6= 0. Этодоказывает, что V � 6= 0, т.е. � ∈ Spec A . �

Из теоремы 2.4 вытекает, что Spec A совпадает с множеством корней харак-теристического многочлена �A , а также с множеством корней минимальногомногочлена �A .

Теорема 2.5. 1) Spec A содержит не более n элементов, где n = dimV .

2) Для � ∈ K линейный оператор A −�E биективен тогда и только тогда,

когда � =∈ Spec A . В частности, A биективен тогда и только тогда, когда

0 =∈ Spec A .

3) Если K = C и V 6= 0, то Spec A 6= ∅.

⊲ 1) Для каждого � ∈ Spec A характеристический многочлен �A должен де-литься на t−�, так как �A (�) = 0 по теореме 2.4. Если �1; : : : ; �r ∈ K — попарно

различные элементы, лежащие в Spec A , то �A будет делиться наr∏i=1

(t − �i).Поскольку deg�A = n, то сравнение степеней влечёт r ≤ n.

2) По теореме 1.8 биективность оператора A − �E равносильна его инъек-тивности, что, в свою очередь, сводится к условию Ker(A − �E ) = 0. Так какKer(A − �E ) = V �, то равенство Ker(A − �E ) = 0 выполняется в точноститогда, когда � =∈ Spec A .

3) Если V 6= 0, то n > 0 и, следовательно, deg �A > 0. В предположении, чтоK = C, многочлен �A будет иметь хотя бы один корень � ∈ K, а по теореме2.4 � ∈ Spec A для каждого такого корня. Поэтому Spec A 6= ∅. �

Следствие. Если K = C и V 6= 0, то каждый линейный оператор A : V → Vимеет хотя бы один собственный вектор.

Предположим, что U1; : : : ; Uk — векторные подпространства в V . Вспомним,

что суммаk∑i=1

Ui — это векторное подпространство в V , состоящее из всех векто-

ров x ∈ V , представимых в виде x =k∑i=1

ui, где ui ∈ Ui для каждого i = 1; : : : ; k.Сумма

k∑i=1

Ui называется прямой, если представление каждого вектора из этого

23

Page 24: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

подпространства в указанном выше виде единственно, т.е. равенствоu1 + : : :+ uk = u′1 + : : :+ u′k; где ui; u′i ∈ Ui;выполняется только тогда, когда ui = u′i для всех i. Проверить, будет ли суммавекторных подпространств прямой можно следующим образом:

суммаk∑i=1

Ui прямая ⇔ Uj ⋂ ∑i6=j Ui = 0 для каждого j = 1; : : : ; k:Иногда бывает удобно производить проверку индуктивно:

суммаk∑i=1

Ui прямая ⇔ суммаk−1∑i=1

Ui прямая и Uk ⋂ ∑i6=kUi = 0:Прямая сумма

k∑i=1

Ui обозначаетсяk⊕i=1

Ui или, более подробно, U1 ⊕ : : : ⊕ Uk.Известно, что

dimk

⊕i=1

Ui =k∑i=1

dimUi:Выбрав для каждого i в подпространстве Ui некоторый базис ui1; : : : ; uini , мож-

но построить базис прямой суммыk

⊕i=1

Ui, объединяя базисы подпространств.

Другими словами, базисом векторного пространстваk

⊕i=1

Ui будет множество

векторов{uij | 1 ≤ i ≤ k; 1 ≤ j ≤ ni}:

Теорема 2.6. Предположим, что V = U1 ⊕ : : :⊕Uk, где U1; : : : ; Uk — вектор-

ные подпространства в V , инвариантные относительно линейного оператора

A : V → V . Обозначим nl = dimUl для l = 1; : : : ; k. Пусть v1; : : : ; vn — базис

векторного пространства V , первые n1 векторов которого образуют базис U1,

следующие n2 векторов — базис U2, и т.д.

Матрица оператора A в этом базисе имеет блочно-диагональный видA =

A1 0 · · · 00 A2 · · · 0...

.... . .

...

0 0 · · · Ak

;где Al — матрица линейного оператора A |Ul : Ul → Ul в базисе пространстваUl, состоящем из соответствующей части векторов v1; : : : ; vn. Характери-

стический многочлен и спектр оператора A вычисляются по формулам�A =k∏l=1

�A |Ul ; Spec A =k⋃l=1

Spec A |Ul :⊲ Всё множество индексов � = {1; : : : ; n} распадается в дизъюнктное объ-

единение � =n∐l=1

�l, где подмножество �l ⊆ � характеризуется тем условием,

24

Page 25: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

что множество векторов {vi | i ∈ �l} образует базис подпространства Ul. Поусловию�1 = {1; : : : ; n1}; �2 = {n1 + 1; : : : ; n1 + n2}; : : : ; �l = {n− nl + 1; : : : ; n}:

Компоненты aij , 1 ≤ i; j ≤ n, матрицы A находятся из разложений

A vj =n∑i=1

aijvi; j = 1; : : : ; n:Если j ∈ �l, то vj ∈ Ul, а так как подпространство Ul инвариантно относитель-но A , то A vj ∈ Ul, откуда следует, что aij = 0 при i =∈ �l. Компоненты aij синдексами i; j ∈ �l образуют квадратную матрицу порядка nl, совпадающую сматрицей оператора A |Ul . Тем самым требуемый вид матрицы A установлен.Поскольку A− tE =

A1 − tE 0 · · · 00 A2 − tE · · · 0...

.... . .

...0 0 · · · Ak − tE

;то �A (t) = det(A− tE) =

k∏l=1

det(Al − tE) =k∏l=1

�A |Ul (t):Отсюда следует, что элемент � ∈ K является корнем многочлена �A тогда итолько тогда, когда � — корень хотя бы одного из многочленов �A |Ul при l =1; : : : ; k. Но по теореме 2.4 Spec A совпадает с множеством корней многочлена�A . Аналогично, Spec A |Ul — это множество корней многочлена �A |Ul . В итоге

заключаем, что Spec A =k⋃l=1

Spec A |Ul . �

Пусть задан линейный оператор A : V → V . По � ∈ K определим множествоV (�) = {x ∈ V | существует i > 0 с условием (A − �E )ix = 0}:Теорема 2.7. 1) V (�) = Ker (A − �E )n, где n = dim V .

2) V (�) есть подпространство в V , инвариантное относительно A .

3) V � ⊆ V (�).4) V (�) 6= 0 тогда и только тогда, когда � ∈ Spec A .

⊲ Определение V (�) может быть переформулировано в видеV (�) =∞⋃i=0

Fi;где мы полагаем

25

Page 26: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

Fi = {x ∈ V | (A − �E )ix = 0} = Ker (A − �E )i для i = 0; 1; 2; : : : :Каждое Fi является векторным подпространством в V . Заметим, что Fi ⊆ Fi+1,поскольку из равенства (A − �E )ix = 0 следует, что

(A − �E )i+1x = (A − �E )(A − �E )ix = (A − �E ) 0 = 0:Таким образом, подпространства Fi образуют неубывающую цепочкуF0 ⊆ F1 ⊆ F2 ⊆ : : : :Для всех i имеем dimFi ≤ dimFi+1. Если бы выполнялись строгие неравен-ства dimFi < dimFi+1 для всех i = 0; : : : ; n, то, рассуждая по индукции, мыполучили бы, что dimFj ≥ j для всех j = 0; : : : ; n + 1. Однако при j = n + 1указанное неравенство невозможно, поскольку dimFj ≤ n для всех j в силутого, что каждое Fj — векторное подпространство в V .

Итак, должен существовать индекс k ≤ n, для которого dimFk = dimFk+1.Тогда Fk = Fk+1 в силу того, что Fk ⊆ Fk+1.

Покажем, что Fi = Fi+1 для всех i > k. Для этого остаётся проверить вклю-чение Fi+1 ⊆ Fi. Предположим, что y ∈ Fi+1. Поскольку

(A − �E )i+1 = (A − �E )k+1(A − �E )i−k;то из равенства (A − �E )i+1y = 0 следует, что (A − �E )i−ky ∈ Fk+1. Так какFk+1 = Fk, то (A − �E )i−ky ∈ Fk, а это даёт

(A − �E )iy = (A − �E )k(A − �E )i−ky = 0:Следовательно, y ∈ Fi. Это завершает проверку ввиду произвольности y.

Можно сделать вывод, что Fi = Fk для всех i ≥ k. В частности, Fn = Fk.Теперь получаем V (�) =

∞⋃i=0

Fi =∞⋃i=k Fi = Fk = Fn:

Тем самым утверждение 1) доказано.

Если x ∈ Fn, то (A − �E )nx = 0, откуда

(A − �E )nA x = A (A − �E )nx = 0;т.е. A x = 0. Это означает, что векторное подпространство Fn инвариантно от-носительно A , так что утверждение 2) также доказано.

Поскольку V � = Ker (A − �E ) = F1 и F1 ⊆ V (�), то утверждение 3) очевид-но.

26

Page 27: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

Как известно, � ∈ Spec A тогда и только тогда, когда V � 6= 0. Для до-казательства утверждения 4) проверим, что неравенства V � 6= 0 и V (�) 6= 0равносильны. Второе неравенство следует из первого в силу 3). Обратно, пред-положим, что V (�) 6= 0. Тогда найдётся ненулевой вектор x ∈ V , такой, что

(A − �E )ix = 0 для некоторого i > 0:Выберем наименьшее i с этим свойством. Тогда (A − �E )i−1x 6= 0, но

(A − �E )i−1x ∈ Ker (A − �E ) = V �;откуда V � 6= 0. �

Определение. При � ∈ Spec A подпространство V (�) называется корневымподпространством линейного оператора A , отвечающим собственному значе-

нию �.Лемма 1. Пусть � ∈ K и f ∈ K[t]. Если f(�) 6= 0, то f(A )|V (�) является

биективным линейным оператором V (�) → V (�).⊲ Так как многочлен f(t)− f(�) обращается в нуль при t = �, то он разлага-ется в произведение g(t)(t − �), где g — некоторый многочлен из кольца K[t].Поэтому f(A ) − f(�)E = g(A )(A − �E ). Возводя в степень, получим

(f(A ) − f(�)E )n= g(A )n(A − �E )n;

где n = dimV . По теореме 2.6 (A −�E )n обращается в нуль на подпространствеV (�). Тогда то же самое верно и для оператора(f(A ) − f(�)E )n

. ОбозначаяB = f(A )|V (�), получим

(

B − f(�)E ′)n

= O′;

где E ′ и O ′ — это соответственно тождественный и нулевой операторы в про-странстве V (�). По теореме 2.1 минимальный многочлен �B оператора B яв-ляется делителем многочлена

(t − f(�))n. Но это возможно только в случае,

когда �B(t) =(t− f(�))r для некоторого целого r > 0. Отсюда следует, что�B(0) =

(

−f(�))r 6= 0:Поэтому 0 =∈ Spec B, и биективность B вытекает из теоремы 2.5. �

Лемма 2. Предположим, что �1; : : : ; �p ∈ K попарно различны. Тогда суммаp∑i=1

V (�i) является прямой.

⊲ Проверим, что V (�p)⋂

p−1∑i=1

V (�i) = 0. Для этого рассмотрим многочленf(t) =p−1∏i=1

(t− �i)n; где n = dim V :27

Page 28: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

Линейный оператор f(A ) =p−1∏i=1

(A −�iE )n обращается в нуль на подпростран-

стве V (�i) для каждого i = 1; : : : ; p− 1, так как это свойство выполняется длясомножителя (A − �iE )n по теореме 2.6. В силу линейности f(A ) обращаетсяв нуль и на сумме всех этих подпространств. Отсюда следует, чтоf(A )x = 0 для любого вектора x ∈ V (�p)⋂

p−1∑i=1

V (�i):Однако линейный оператор f(A )|V (�p) в пространстве V (�p) биективен по лем-ме 1, поскольку f(�p) 6= 0. Поэтому равенство f(A )x = 0 для x ∈ V (�p) влечётx = 0. Тем самым требуемая проверка завершена.

Поскольку �1; : : : ; �p равноправны, тоV (�j)⋂ ∑i 6=j V (�i) = 0 для всех j = 1; : : : ; p;а это является необходимым и достаточным условием для того, чтобы суммаp∑i=1

V (�i) была прямой. �

Теорема 2.8. Предположим, что минимальный многочлен линейного опера-

тора A : V → V разлагается в кольце K[t] в произведение многочленов сте-

пени 1 : �A (t) =p∏i=1

(t− �i)mi ; где �1; : : : ; �p ∈ K:(это условие всегда выполняется в случае, когда K = C). Тогда V =

p⊕i=1

V (�i).⊲ В лемме 2 уже установлено, что сумма корневых подпространств является

прямой. Поэтому остаётся обосновать равенствоp∑i=1

V (�i) = V .

Проведём индукцию по p. При p = 1 имеем �A (t) = (t − �1)m1 . Равенство�A (A ) = O означает, что (A − �1E )m1x = 0 для всех x ∈ V , а следовательноV (�1) = V .

Далее будем считать, что p > 1. Положим U = Ker g(A ), гдеg(t) =p−1∏i=1

(t− �i)mi :Поскольку (t− �p)mpg(t) = �A (t), то для любого x ∈ V имеем

(A − �pE )mpg(A )x = �A (A )x = 0;откуда следует, что g(A )x ∈ V (�p). Заметим, что g(�p) 6= 0. Применяя лемму1, заключаем, что линейный оператор g(A )|V (�p) в пространстве V (�p) биекти-вен. В частности, g(A ) отображает V (�p) на всё V (�p). Поэтому по заданномувектору x всегда можно подобрать такой вектор y ∈ V (�p), что

28

Page 29: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

g(A )y = g(A )x:Переписывая это равенство в виде g(A )(x− y) = 0, убеждаемся, что x− y ∈ U .Следовательно, x = (x − y) + y ∈ U + V (�p). Поскольку вектор x ∈ V былпроизволен, это доказывает равенствоV = U + V (�p):

Если u ∈ U , то A u ∈ U . Действительно из равенства g(A )u = 0 следует,что g(A )A u = A g(A )u = 0. Таким образом, векторное подпространство Uинвариантно относительно A . Это позволяет рассмотреть линейный операторA |U : U → U .

Поскольку g(A |U ) — нулевой оператор, то по теореме 2.1 многочлен g делит-ся на минимальный многочлен �A |U оператора A |U . Следовательно,�A |U =

p−1∏i=1

(t− �i)m′iдля некоторых целых неотрицательных чиселm′i ≤ mi. Таким образом, в разло-жении многочлена �A |U появляются только p−1 различных множителей t−�i.При выполнении шага индукции можно считать известным, что

p−1∑i=1

U(�i) = U ,где U(�i) = {u ∈ U | (A − �iE )ku = 0 для подходящего k}— корневое подпространство оператора A |U , отвечающее �i. Как следует изопределений, U(�i) ⊆ V (�i) для всех i = 1; : : : ; p− 1. ПоэтомуV = U + V (�p) =

p−1∑i=1

U(�i) + V (�p) ⊆ p∑i=1

V (�i):Поскольку обратное включение очевидно, то требуемое равенство доказано. �

Определение. Линейный оператор A : V → V называется диагонализиру-емым, если матрица этого оператора в некотором базисе пространства Vявляется диагональной

�′1 0 · · · 00 �′2 · · · 0...

.... . .

...

0 0 · · · �′n

Если v1; : : : ; vn — базис пространства V , в котором матрица оператора A

имеет указанный вид, тоA vj = �′jvj ;

т.е. vj — собственный вектор, а �′j — собственное значение оператора A , длякаждого j = 1; : : : ; n. Таким образом, оператор A диагонализируем тогда итолько тогда, когда векторное пространство V имеет базис, состоящий из соб-ственных векторов оператора A .

29

Page 30: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

Теорема 2.9. Пусть A : V → V — линейный оператор со спектром

Spec A = {�1; : : : ; �p}:Обозначим n = dimV и ki = dimV �i для каждого i = 1; : : : ; p. Тогда следую-

щие утверждения эквивалентны:

1) A диагонализируем,

2) V =p

⊕i=1

V �i ,3)

p∑i=1

ki = n,4) �A (t) =

p∏i=1

(�i − t)ki .⊲ 1) ⇔ 2) Каждый собственный вектор оператора A принадлежит одномуиз пространств V �1 ; : : : ; V �p . Поэтому базис векторного пространства V , состо-ящий из собственных векторов оператора A , можно найти в том и только втом случае, когда p

∑i=1

V �i = V:Заметим, что сумма

p∑i=1

V �i является прямой, поскольку V �i ⊆ V (�i) для каж-

дого i, а суммаp∑i=1

V (�i) прямая, как это было доказано ранее.

2) ⇔ 3) Поскольку суммаp∑i=1

V �i прямая, то dimp∑i=1

V �i =p∑i=1

ki. Каждое

векторное подпространство пространства V , не совпадающее со всем V , имеетразмерность строго меньше n. Поэтомуp

∑i=1

V �i = V ⇔ dimp∑i=1

V �i = n ⇔p∑i=1

ki = n:2) ⇒ 4) Так как все подпространства V �i инвариантны относительно A , то

по теореме 2.6 �A (t) =p∏i=1

�A |V �i (t):Но A x = �ix для всех x ∈ V �i . Следовательно, A |V �i совпадает с операторомскалярного умножения �iE в векторном пространстве V �i размерности ki. Ха-рактеристический многочлен такого оператора легко вычисляется:�A |V �i (t) = det

�i − t 0 · · · 00 �i − t · · · 0...

.... . .

...0 0 · · · �i − t = (�i − t)ki :

30

Page 31: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

4) ⇒ 3) Из определения характеристического многочлена следует, что сте-

пень �A равна n. С другой стороны, формула �A (t) =p∏i=1

(�i − t)ki даёт

deg�A =p∑i=1

ki:Таким образом,

p∑i=1

ki = n. �

Следствие. Если �A (t) =n∏i=1

(�i − t), где �1; : : : ; �n лежат в K и попарно

различны, то A диагонализируем.

⊲ Имеем Spec A = {�1; : : : ; �n}. Положим ki = dimV �i . Так как V �i 6= 0, тоki ≥ 1 для каждого i. Следовательно,

dimn∑i=1

V �i =n∑i=1

ki ≥ n:Так как

n∑i=1

V �i является векторным подпространством n-мерного векторного

подпространства V , оно должно совпадать с V . В частности,n∑i=1

ki = n. �

Определение. Линейные операторы, характеристический многочлен кото-

рых не имеет кратных корней называются операторами с простым спектром.

Определение. Линейный оператор A : V → V называется нильпотентным,

если существует такое целое число m > 0, что A m = O. Наименьшее m с

этим свойством называется индексом нильпотентности оператора A .

Определение. Векторное подпространство U ⊆ V называется циклическиминвариантным подпространством оператора A : V → V , если U инвариантно

относительно A и существуют вектор u ∈ U и целое число k > 0, такие,

что U = 〈u;A u; : : : ;A k−1u〉:Пример. Предположим, что v ∈ V — такой вектор, что A

kv = 0. ТогдаC(v) = 〈v;A v; : : : ;A k−1v〉— циклическое инвариантное подпространство оператора A . Инвариантность

вытекает из того, что любой вектор x ∈ C(v) записывается в виде x =k−1∑i=0

�iA ivс коэффициентами �i ∈ K, и при этом

A x =k−1∑i=0

�iA i+1v =k−1∑j=1

�j−1Ajv + �k−1A

kv ∈ C(v):31

Page 32: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

Лемма. Предположим, что для A ∈ L (V ) и v ∈ V выполнены условия

Am = O; A

m−1v 6= 0:Тогда найдётся такое векторное подпространство U ⊆ V инвариантное от-

носительно A , что V = U ⊕ C(v), гдеC(v) = 〈v;A v; : : : ;A m−1v〉— циклическое инвариантное подпространство.

⊲ Выберем в качествеU подпространство наибольшей размерности среди всехвекторных подпространств в V , которые инвариантны относительно A и име-ют нулевое пересечение с подпространством C(v) (множество таких подпро-странств непусто, так как нулевое подпространство удовлетворяет требуемымусловиям). Из того, что U ∩ C(v) = 0 следует, что сумма U + C(v) прямая.Остаётся только проверить, что U + C(v) = V .

Будем рассуждать от противного. Предположим, что U+C(v) 6= V . Выберемпроизвольно вектор x ∈ V , не лежащий в подпространстве U+C(v), и рассмот-рим последовательность векторов x, A x, A 2x; : : : в пространстве V . Заметим,что A mx = 0 ∈ U + C(v). Поэтому найдётся такое i, 0 < i ≤ m, что

Aix ∈ U + C(v); но A

i−1x =∈ U + C(v):Положив y = A i−1x, будем иметьy =∈ U + C(v); A y = A

ix ∈ U + C(v):Второе равенство позволяет записать

A y = u+m−1∑j=0

�jA jv; где u ∈ U , �j ∈ K:Применяя к левой и правой частям равенства оператор A m−1, получим

Amy = A

m−1u+m−1∑j=0

�jA m−1+jv:Поскольку A m = O, то A my = 0 и A m−1+jv = 0 для всех j > 0. Поэтомупоследнее равенство преобразуется к виду

−Am−1u = �0A

m−1v:Заметим, что A m−1u ∈ U ввиду инвариантности подпространства U относи-тельно оператора A , в то время как A

m−1v ∈ C(v). Тогда условие U ∩C(v) = 0даёт �0A

m−1v = 0. Следовательно, �0 = 0, поскольку A m−1v 6= 0.

32

Page 33: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

Вектор z = y − m−1∑j=1

�jA j−1v обладает тем свойством, что

A z = A y − m−1∑j=1

�jA jv = u+ �0v = u ∈ U:При этом z =∈ U + C(v), поскольку из включения z ∈ U + C(v) следовало бы,что y = z +

m−1∑j=1

�jA j−1v ∈ U + C(v):Рассмотрим векторное подпространство U ′ = U + 〈z〉. Каждый вектор из U ′

записывается в виде t + z, где t ∈ U , а ∈ K. Поскольку A t ∈ U в силуинвариантности U , а также A z ∈ U , то

A (t+ z) = A t+ A z ∈ U ⊆ U ′:Это доказывает, что U ′ инвариантно относительно A .

Проверим, что U ′ ∩ C(v) = 0. Предположим, что w ∈ U ′ ∩ C(v). Запишемw = t+ z для подходящих t ∈ U и ∈ K. Тогда z = −t+ w ∈ U + C(v);но это возможно только при = 0. Тогда w = t, откуда w ∈ U ∩ C(v) = 0, т.е.w = 0.

Таким образом, U ′ удовлетворяет всем условиям, накладываемым на подпро-странства при выборе U . Так как z ∈ U ′, но z =∈ U , то U ′ содержит U строго.Поэтому dimU < dimU ′. В итоге приходим к противоречию с тем, что U имеетмаксимальную возможную размерность. �

Теорема 2.10. Пусть задан нильпотентный линейный оператор A в вектор-

ном пространстве V . Тогда V представляется в виде прямой суммы цикли-

ческих инвариантных подпространств этого оператора.

⊲ Проводим индукцию по размерности V . Если V = 0, то доказывать нечего.Будем считать, что V 6= 0. Пусть m — индекс нильпотентности оператора A .Тогда найдётся такой вектор v ∈ V , что A m−1v 6= 0. В силу предшествующейлеммы V = U ⊕C(v), где U — некоторое подпространство, инвариантное отно-сительно A . Так как

dimV = dimU + dimC(v)и C(v) 6= 0, то dimU < dimV . Рассмотрим линейный оператор A |U : U → U .Условие A m = O влечёт (A |U )m = O|U , т.е. оператор A |U нильпотентен. Попредположению индукции можно считать известным, что существует разложе-ние U = C(v1) ⊕ : : :⊕ C(vr)пространства U в прямую сумму циклических инвариантных подпространствоператора A |U . Каждое слагаемое C(vi) будет также циклическим инвариант-ным подпространством оператора A . В итоге получаем требуемое разложениеV = U ⊕ C(v) = C(v1) ⊕ : : :⊕ C(vr) ⊕ C(v): �

33

Page 34: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

Определения. Жордановой клеткой порядка k называется k × k-матрица

вида Jk(�) =

� 1 0 · · · 0 00 � 1 · · · 0 00 0 � · · · 0 0...

......

. . ....

...

0 0 0 · · · � 10 0 0 · · · 0 �

Говорят, что матрица A является жордановой, если A допускает разбиение

на блоки таким образом, что на главной диагонали стоят жордановы клет-

ки, а вне диагонали — нулевые блоки:A =

Jk1(�1) 0 · · · 00 Jk2(�2) · · · 0...

.... . .

...

0 0 · · · Jks(�s)

Лемма. Пусть U — ненулевое циклическое инвариантное подпространство

нильпотентного линейного оператора B : V → V . Тогда U имеет базис, в ко-

тором матрица оператора B|U есть жорданова клетка Jk(0) для некоторогоk > 0.

⊲ Согласно определению циклических инвариантных подпространств найдёт-ся такой вектор u ∈ U , что U = 〈u;Bu; : : : ;Bk−1u〉для некоторого k. В силу нильпотентности B можно выбрать k так, что Bku =0, а Bk−1u 6= 0. Проверим, что тогда векторы u;Bu; : : : ;Bk−1u образуют ба-зис пространства U . Остаётся убедиться только в линейной независимости этихвекторов. Предположим, что k−1

∑i=0

�iBiu = 0

для некоторых коэффициентов �0; : : : ; �k−1 ∈ K, не все из которых равны 0.Пусть l — наименьший индекс, для которого �l 6= 0. Применяя оператор Bk−1−lполучим

Bk−1−l(k−1

∑i=0

�iBiu) =k−1∑i=0

�iBk−1−l+iu = �lBk−1u 6= 0;34

Page 35: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

поскольку �i = 0 для всех i < l, в то время как k − 1 − l + i ≥ k и, следова-тельно, Bk−1−l+iu = 0 для всех i > l. Но это противоречит предшествующемуравенству, так как Bk−1−l0 = 0.

Полагая ei = Bk−iu для i = 1; : : : ; k, имеем

Be1 = Bku = 0; Bei = B

k−i+1u = ei−1 при i = 2; : : : ; k:Следовательно, матрица оператора B в базисе e1; : : : ; ek совпадает с Jk(0). �

Теорема 2.11. Предположим, что минимальный многочлен линейного опе-

ратора A : V → V разлагается в кольце K[t] в произведение многочленов

степени 1 : �A (t) =p∏i=1

(t− �i)mi ; где �1; : : : ; �p ∈ K:(это условие всегда выполняется в случае, когда K = C). Тогда существует

базис векторного пространства V , в котором матрица оператора A являет-

ся жордановой (такой базис называется жордановым для оператора A ).

⊲ Достаточно найти разложение V =s

⊕i=1

Ui в прямую сумму подпространствUi, каждое из которых инвариантно относительно A и имеет базис, в которомматрица оператора A |Ui является жордановой клеткой Jki(�′i). Объединяя ба-зисы подпространств и применяя теорему 2.6, получим тогда базис всего про-странства V , в котором матрица оператора A имеет жорданов вид

Jk1(�′1) 0 · · · 00 Jk2(�′2) · · · 0...

.... . .

...0 0 · · · Jks(�′s)

:Начнём с разложения V =

p⊕i=1

V (�i), даваемого теоремой 2.8. Для каждогоi = 1; : : : ; p рассмотрим линейный оператор Bi = (A − �iE )|V (�i). По теореме2.7 (A −�iE )nx = 0 для всех x ∈ V (�i), где n = dimV . Это означает, что Bni =O, т.е. оператор Bi нильпотентен. Теорема 2.10 утверждает, что существуетразложение V (�i) =

si⊕j=1

Uij ;где каждое Uij — циклическое инвариантное подпространство оператора Bi.В силу предшествующей леммы существует базис пространства Uij , в которомматрица оператора Bi|Uij есть жорданова клетка Jkij (0). Для каждого x ∈ Uijимеем Bix = A x − �ix. Так как Bix ∈ Uij ввиду инвариантности Uij относи-тельно Bi, то

35

Page 36: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

A x = Bix+ �ix ∈ Uij :Это доказывает, что Uij инвариантно также относительно A . Равенство

A |Uij = Bi|Uij + �iE |Uijпозволяет вычислить матрицу оператора A |Uij в указанном выше базисе про-странства Uij : MA |Uij = Jkij (0) + �′iE = Jkij (�′i):В итоге получаем желаемое разложениеV =

p⊕i=1

V (�i) =p

⊕i=1

(

si⊕j=1

Uij) = U11 ⊕ · · · ⊕ U1s1 ⊕ · · · ⊕ Up1 ⊕ · · · ⊕ Upsp :Определение. Жордановой нормальной формой матрицы A ∈ Mn(K) назы-

вается любая жорданова матрица, подобная матрице A.

Следствие. Любая матрица A ∈ Mn(C) имеет жорданову нормальную фор-

му.

Теорема 2.12. Предположим, что матрица A линейного оператора A : V → Vв некотором базисе e1; : : : ; en пространства V является жордановой. Тогда

для каждого натурального числа k и каждого � ∈ K число диагональных бло-

ков матрицы A, равных жордановой клетке Jk(�), даётся формулойN(k; �) = rk−1(�) − 2rk(�) + rk+1(�);где rl(�) = rank (A − �E )l = dim Im (A − �E )l

при l ≥ 0 (в частности, r0(�) = n). Таким образом, величина N(k; �) не зави-

сит от выбора жорданова базиса.

⊲ Рассмотрим сначала простейший случай, когда A = Jn(�) для некоторого� ∈ K, т.е. A является жордановой клеткой. Проверим, чтоrk−1(�) − 2rk(�) + rk+1(�) =

{

1; если k = n и � = �;

0; если k 6= n или � 6= �.

В базисе e1; : : : ; en линейный оператор A − �E имеет матрицуMA−�E = A− �E = Jn(�− �):Если � 6= �, то det Jn(�− �) = (�− �)n 6= 0. Это означает, что матрица опера-тора A − �E невырождена. Тогда этот оператор и все его степени биективны,

36

Page 37: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

так что Im (A − �E )l = V и rl(�) = n для всех l. В итоге получаемrk−1(�) − 2rk(�) + rk+1(�) = n− 2n+ n = 0:Предположим далее, что � = �. Тогда оператор A −�E действует на векторы

базиса следующим образом:

(A − �E )e1 = 0; (A − �E )ei = ei−1 при i > 1:Отсюда видно, что Im (A − �E ) = 〈e1; : : : ; en−1〉. Рассуждая по индукции, за-ключаем, что

Im (A − �E )l = (A − �E )(

Im (A − �E )l−1)

= 〈e1; : : : ; en−l〉для всех l = 1; : : : ; n− 1. Наконец, Im (A − �E )n = (A − �E )

(

〈e1〉) = 0, откудаследует, что (A − �E )l = O для всех l ≥ n. Получаемrl(�) = n− l при l < n и rl(�) = 0 при l ≥ n:Отметим, что первое равенство остаётся верным и при l = n. Подстановка ввыражение rk−1(�) − 2rk(�) + rk+1(�) даёт значение

(n− k + 1) − 2(n− k) + (n− k − 1) = 0, если k < n;1 − 2 · 0 + 0 = 1, если k = n;0 − 2 · 0 + 0 = 0, если k > n:

Перейдём теперь к рассмотрению общего случая, когдаA =

Jk1(�′1) 0 · · · 00 Jk2(�′2) · · · 0...

.... . .

...0 0 · · · Jks(�′s)

:Разбиение матрицы на блоки соответствует прямому разложению V =

s⊕i=1

Ui.Для того чтобы дать точное описание подпространства Ui, обозначимq1 = 0; qi =

i−1∑j=1

kj при i > 1:Тогда qi + 1; : : : ; qi + ki — это в точности номера строк и столбцов, в которыхрасположен i-ый диагональный блок матрицы A. Следовательно, Ui — вектор-ное подпространство с базисом eqi+1; : : : ; eqi+ki . Заметим, что Ui инвариантно

37

Page 38: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

относительно A , а матрица оператора A |Ui совпадает с жордановой клеткойJki(�′i). Воспользуемся теперь равенством

Im (A − �E )l =s

⊕i=1

Im (A − �E )l|Ui ;которое вытекает из приводимой после окончания доказательства леммы. Срав-нение размерностей даёт

dim Im (A − �E )l =s

∑i=1

dim Im (A − �E )l|Ui :Обозначив rl(�; Ui) = rank (A − �E )l|Ui , приходим к равенствуrl(�) =

s∑i=1

rl(�; Ui):Поскольку (A − �E )l|Ui = (A |Ui − �E |Ui)l, то величины rl(�; Ui) определяютсяслучаем, рассмотренным в начале доказательства, применительно к линейномуоператору A |Ui , действующему в пространстве Ui размерности ki. В частности,rk−1(�; Ui) − 2rk(�; Ui) + rk+1(�; Ui) =

{

1; если k = ki и � = �′i;0; если k 6= ki или � 6= �′i.

Таким образом,rk−1(�) − 2rk(�) + rk+1(�) =s

∑i=1

(rk−1(�; Ui) − 2rk(�; Ui) + rk+1(�; Ui))равно количеству индексов i ∈ {1; : : : ; s}, для которых k = ki и � = �′i, а это иесть в точности величина N(�; k). �

Лемма. Если V =s

⊕i=1

Ui, причём все подпространства Ui инвариантны от-

носительно линейного оператора B : V → V , то

Im B =s

⊕i=1

Im B|Ui :⊲ Каждый вектор x ∈ V записывается в виде x =

s∑i=1

xi, где xi ∈ Ui, и тогда

Bx =s

∑i=1

Bxi. Поэтому

Im B = {Bx | x ∈ V } ⊆s

∑i=1

Im B|Ui ;но обратное включение также выполнено, поскольку B(Ui) ⊆ Im B для всехi. Кроме того, сумма

s∑i=1

Im B|Ui прямая, так как Im B|Ui ⊆ Ui для всех i, а

суммаs

∑i=1

Ui прямая. �

Следствие. Жорданова нормальная форма заданной матрицы определена од-

нозначно с точностью до перестановки диагональных блоков.

38

Page 39: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

Теорема Гамильтона-Кэли над полем комплексных чисел

Теорема Гамильтона-Кэли утверждает, что �A (A ) = O для любого линей-ного оператора A : V → V . Это равенство легко выводится из разложенияпространства V в прямую сумму корневых подпространств. В случае произ-вольного поля данное разложение не всегда имеет место. По этой причине до-казательство теоремы Гамильтона-Кэли в общем случае требует другого под-хода.

Теорема 2.13. Предположим, что K = C. Пусть A : V → V — линейный

оператор со спектром Spec A = {�1; : : : ; �p}. Тогда:

1) �A (t) =p∏i=1

(�i − t)ni , где ni = dimV (�i).2) Равенство �A (A ) = O выполняется.

3) Многочлен �A делится на минимальный многочлен �A .

⊲ Пусть v1; : : : ; vn — базис векторного пространства V , в котором матрицаоператора A имеет жорданов видA =

Jk1(�′1) 0 · · · 00 Jk2(�′2) · · · 0...

.... . .

...0 0 · · · Jks(�′s)

:Тогда A− tE =

Jk1(�′1) − tEk1 0 · · · 00 Jk2(�′2) − tEk2 · · · 0...

.... . .

...0 0 · · · Jks(�′s) − tEks

;где через Ekj обозначена единичная матрица порядка kj . Диагональные блоки— это верхнетреугольные матрицыJkj (�′j) − tEkj =

�′j − t 1 · · · 0 00 �′j − t · · · 0 0...

.... . .

......

0 0 · · · �′j − t 10 0 · · · 0 �′j − t

:Вычислим характеристический многочлен:�A (t) = det(A− tE) =

s∏j=1

det(Jkj (�′j) − tEkj ) =

s∏j=1

(�′j − t)kj :39

Page 40: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

Отсюда видно, что корнями многочлена �A являются числа �′1; : : : ; �′s. По тео-реме 2.3 спектр оператора A состоит в точности из корней многочлена �A .Поэтому �′j ∈ Spec A для каждого j.

По теореме 2.8 V =p

⊕i=1

V (�i). В случае, когда p = 1, имеем V = V (�1).

В частности, n1 = dimV . Как известно, степень многочлена �A равна n1, астарший коэффициент равен (−1)n1 . Так как �1 — единственный корень этогомногочлена, то �A (t) = (�1 − t)n1 :Согласно теореме 2.7 V (�1) = Ker (�1E −A )n1 , т.е. (�1E −A )n1x = 0 для всехx ∈ V (�1). Поскольку V (�1) = V , это означает, что

(�1E − A )n1 = O:Рассмотрим теперь общий случай, когда p произвольно. Обозначим через Ai

ограничение оператора A на инвариантное подпространство V (�i). Из теоре-мы 2.6 вытекает, что �A (t) =

p∏i=1

�Ai(t):Применяя уже рассмотренный случай к оператору Ai : V (�i) → V (�i), находим�Ai(t) = (�i − t)ni , что даёт требуемую формулу для �A . Следовательно,�A (A ) =

p∏i=1

(�E − A )ni :Для оператора Ai выполняется соотношение (�E −Ai)ni = O, как вытекает изуже рассмотренного случая. Поскольку (�E − Ai)ni совпадает с ограничениемоператора (�E − A )ni на подпространство V (�i), то (�E − A )nix = 0 и�A (A )x =

(∏j 6=i (�E − A )nj)(�E − A )nix = 0

для всех x ∈ V (�i). Каждый вектор w ∈ V записывается в виде w =p∑i=1

wi, гдеwi ∈ V (�i), откуда �A (A )w =p∑i=1

�A (A )wi = 0:Это доказывает равенство �A (A ) = O в общем случае. Делимость �A на �A

вытекает теперь из теоремы 2.1. �

Следствие 1. Для каждого � ∈ Spec A кратность � как корня характе-

ристического многочлена �A равна размерности корневого подпространстваV (�).Следствие 2. �A(A) = 0 для любой матрицы A ∈Mn(C).

40

Page 41: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

Теорема Гамильтона-Кэли над произвольным полем

В доказательстве этой важной теоремы будут использованы известные свой-ства определителей. Напомним, что формула для разложения определителяквадратной матрицы B =

(bij) ∈Mn(K) по строке с номером i имеет вид

detB =n∑j=1

dijbij ;где dij обозначает алгебраическое дополнение (i; j)-компоненты bij матрицы B.Выполняются также соотношенияn

∑j=1

dijbkj = 0 при k 6= i(сумма

n∑j=1

dijbkj представляет собой разложение по i-ой строке определителя

матрицы, полученной из B заменой её i-ой строки на k-ую строку; посколькув новой матрице имеются две одинаковые строки, её определитель равен 0).

Выписанные выше равенства остаются верными в случае, когда компонентыматрицы B не лежат в K, а являются многочленами от одной переменной t. Вчастности, можно взять B = A − tE, где A =

(aij) — произвольная матрицаиз Mn(K). Эта матрица имеет компоненты bij(t) = aij − Æijt, а её определительравен характеристическому многочлену �A(t) матрицы A. Алгебраические до-полнения dij(t) компонент матрицы A− tE также являются некоторыми мно-гочленами с коэффициентами из K, явный вид которых нам не важен. Такимобразом получаются соотношенияn

∑j=1

dij(t)(aij − Æij t) = �A(t); n∑j=1

dij(t)(akj − Ækjt) = 0 при k 6= i:Заметив, чтоn

∑j=1

dij(t)(akj − Ækjt) =n∑j=1

akjdij(t) − n∑j=1

Ækjdij(t)t =n∑j=1

akjdij(t) − dik(t)tдля всех k = 1; : : : ; n, получаемn

∑j=1

aijdij(t) − dii(t)t = �A(t); n∑j=1

akjdij(t) − dik(t)t = 0 при k 6= i:Теперь предположим, что A — матрица линейного оператора A : V → V внекотором базисе v1; : : : ; vn пространства V . Тогда предыдущие равенства мно-гочленов в кольце K[t] дают после замены t на A равенства операторов

(1)n∑j=1

aijdij(A ) − dii(A )A = �A (A );(2)

n∑j=1

akjdij(A ) − dik(A )A = 0 при k 6= i:41

Page 42: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

Теорема. Для любого линейного оператора A : V → V выполняется соот-

ношение �A (A ) = O, где �A (t) — характеристический многочлен оператора

A .

⊲ Вспомним, что компоненты aij матрицы оператора A находятся из соотно-

шений A vj =n∑k=1

akjvk при j = 1; : : : ; n. Применим к левым и правым частям

предыдущих равенств линейный оператор dij(A ) для какого-то индекса i ипросуммируем по всем j. Получим

(3)n∑j=1

dij(A )A vj =n∑j=1

dij(A )(

n∑k=1

akjvk) =n∑k=1

(

n∑j=1

akjdij(A )vk):Однако, n

∑j=1

akjdij(A )vk = dii(A )A vi + �A (A )vi при k = i,n∑j=1

akjdij(A )vk = dik(A )A vk при k 6= iв силу равенств (1) и (2). Подстановка этих выражений в правую часть фор-мулы (3) даёт n

∑j=1

dij(A )A vj =n∑k=1

dik(A )A vk + �A (A )vi:Поскольку сумма по j и сумма по k в последнем равенстве содержат одина-ковые члены, эти две суммы сокращаются, и равенство преобразуется к виду�A (A )vi = 0. Таким образом, линейный оператор �A (A ) аннулирует все век-торы базиса v1; : : : ; vn, но отсюда следует, что �A (A ) — тождественно нулевойоператор. �

Следствие. �A(A) = 0 для любой матрицы A ∈Mn(K).

Теорема 2.14. Пусть A ∈ L (V ), где V — ненулевое векторное пространство

над полем R. Тогда в V существует подпространство, которое инвариантно

относительно A и имеет размерность 1 или 2.

⊲ Как известно, каждый многочлен из кольца R[t] есть произведение непри-водимых многочленов, а каждый неприводимый многочлен имеет степень 1 или2. Выберем неприводимый многочлен g ∈ R[t], который входит в разложениеминимального многочлена �A оператора A на множители. Без ограниченияобщности можно считать, что старший коэффициент многочлена g равен 1.

Если deg g = 1, то g(t) = t− � для некоторого � ∈ R. Так как �A делится наg, то �A (�) = 0, и по теореме 2.4 � ∈ Spec A . В этом случае существует хотя

42

Page 43: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

бы один собственный вектор x ∈ V оператора A , и тогда одномерное подпро-странство 〈x〉 инвариантно относительно A .

Рассмотрим оставшийся случай, когда deg g = 2. Запишемg(t) = t2 − �t− �; где �; � ∈ R:Пусть h ∈ R[t] — частное от деления �A на g. Поскольку �A (A ) = O, то изравенства �A = gh следует, что g(A )h(A ) = O. При этом h(A ) 6= O, так какdeg h < deg �A . Выберем произвольно вектор x ∈ V , не лежащий в ядре линей-ного оператора h(A ) и положим y = h(A )x. Тогда y 6= 0, ноg(A )y = g(A )h(A )x = O x = 0:Поскольку g(A ) = A 2 − �A − �E , то предыдущее равенство переписываетсяв виде

A2y = �A y + �y:

Рассмотрим линейную оболочку U = 〈y;A y〉 векторов y и A y. Если u — про-извольный вектор из U , то u = �y + �A y с подходящими коэффициентами�; � ∈ R. Тогда

A u = �A y + �A 2y = �A y + �(�A y + �y) = ��y + (� + ��)A y ∈ U:Это доказывает, что векторное подпространство U инвариантно относительнооператора A . Вектор A y не может быть пропорционален y. Действительно, изравенства A y = �y, где � ∈ R, вытекает, чтоg(�)y = (�2 − ��− �)y = A

2y − �A y − �y = 0:Пользуясь тем, что y 6= 0, получим g(�) = 0, но это невозможно ввиду непри-водимости многочлена g. Итак, векторы y и A y линейно независимы. Это до-казывает, что dimU = 2. �

43

Page 44: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

Часть 3. Линейные операторы в евклидовых

и унитарных пространствах

В этой части курса будут рассмотрены свойства линейных операторов специ-ального типа, действующих в евклидовом или унитарном (эрмитовом) вектор-ном пространстве V . Соответственно K = R в случае евклидова пространстваи K = C в случае унитарного пространства. Вспомним, что на V задано ска-лярное произведение (· ; ·), представляющее собой отображение V × V → K сосвойствами:

1) (y; x) = (x; y) для всех x; y ∈ V ,

2) (�x+ �y; z) = �(x; z) + �(y; z) для всех �; � ∈ K и x; y; z ∈ V ,

3) (x; x) > 0 для всех ненулевых векторов x ∈ V .

Эти аксиомы охватывают как случай унитарного пространства, так и случайевклидова пространства, поскольку a = a для всех a ∈ R. Аксиома 2) утвер-ждает, что скалярное произведение на V является линейной функцией от пер-вого аргумента. В евклидовом пространстве скалярное произведение зависитлинейно также от второго аргумента. В унитарном пространстве соответству-ющее тождество имеет вид

2′) (x; �y + �z) = �(x; y) + �(x; z).Нам потребуется понятие двойственного (сопряжённого) пространства, ко-

торое может быть определено для векторного пространства над произвольнымполем K. Это понятие важно и само по себе.

Определение. Векторное пространство V ∗ = L (V;K) называется двой-

ственным к векторному пространству V .

Линейные отображения V → K принято называть линейными функциями.Таким образом, элементами векторного пространства V ∗ являются линейныефункции на векторном пространстве V . В силу следствия к теореме 1.5

dimV ∗ = dim V(в предположении о конечномерности векторного пространства V ).

Теорема 3.1. Если e1; : : : ; en — произвольный базис векторного пространстваV , то существует однозначно определённый базис e1; : : : ; en двойственного

векторного пространства V ∗, такой, чтоei(ej) = Æij для всех i; j:44

Page 45: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

Базис e1; : : : ; en называется двойственным базису e1; : : : ; en.⊲ По теореме 1.2 для любого набора из n элементов �1; : : : ; �n ∈ K существу-ет единственная линейная функция f : V → K, такая, что f(ej) = �j для всехj = 1; : : : ; n. В частности, для каждого i = 1; : : : ; n линейная функция ei ∈ V ∗

однозначно определена соотношениями ei(ej) = Æij . Нужно только проверить,что e1; : : : ; en образуют базис векторного пространства V ∗, т.е. что каждая ли-нейная функция f ∈ V ∗ единственным способом записывается в виде линейнойкомбинации f =

n∑i=1

�iei; где �1; : : : ; �n ∈ K:Заметим, что

(

n∑i=1

�iei)(ej) =n∑i=1

�iei(ej) =n∑i=1

�iÆij = �j :Поэтому равенство f =

n∑i=1

�iei выполняется в точности тогда, когда f(ej) = �jдля всех j = 1; : : : ; n, т.е. требуемые коэффициенты �1; : : : ; �n существуют иопределены по f однозначно. �

Теорема 3.2. Предположим, что V — либо евклидово, либо унитарное век-

торное пространство. Тогда для каждого вектора z ∈ V определена линейная

функция z : V → K по правилу z(x) = (x; z); x ∈ V:Соответствие z 7→ z задаёт биекцию � : V → V ∗. Отображение � линейно

в евклидовом случае и полулинейно в унитарном случае (т.е. �(�y + �z) =��(y) + ��(z) для всех �; � ∈ K и y; z ∈ V ).

⊲ Линейность z означает, что выполняется тождество z(�x+ �y) = � z(x) + � z(y) для всех �; � ∈ K и x; y ∈ V ;которое сводится к линейности скалярного произведения по первому аргумен-ту. Итак, z ∈ V ∗ для каждого z ∈ V . Поэтому отображение � корректноопределено, �(z) = z. Линейность (соотв. полулинейность) � означает, что �y+�z = � y + � z для всех �; � ∈ K и y; z ∈ V :Для проверки этого тождества вычислим значения функций в его левой и пра-вой частях на векторе x ∈ V : �y+�z(x) = (x; �y + �z) = �(x; y) + �(x; z);

(� y + � z)(x) = � y(x) + � z(x) = �(x; y) + �(x; z):45

Page 46: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

Поскольку �y+�z(x) = (� y +� z)(x) для всех x ∈ V , то требуемое равенствовыполнено.

Пусть e1; : : : ; en — ортонормированный базис векторного пространства V , аe1; : : : ; en — двойственный ему базис векторного пространства V ∗. Поскольку ei(ej) = (ej ; ei) = Æij = ei(ej) для всех i; jи две линейные функции равны, когда совпадают их значения на базисе, то ei = ei для всех i. Отсюда следует, что�(

n∑i=1

�iei) =n∑i=1

�i�(ei) =n∑i=1

�i ei =n∑i=1

�ieiдля любых �1; : : : ; �n ∈ K. Каждая линейная функция f ∈ V ∗ единственным

способом записывается в виде линейной комбинации f =m∑i=1

�iei. Из предыду-

щей формулы вытекает, что существует единственный вектор v ∈ V , такой, что�(v) = f , а именно это вектор v =n∑i=1

�iei. Это доказывает биективность �. �

Следствие. Если векторы a; b ∈ V таковы, что (x; a) = (x; b) для всех x ∈ V ,

то a = b.⊲ Поскольку a(x) = b(x) для всех x ∈ V , то a = b. Это равенство пере-писывается в виде �(a) = �(b), и инъективность � : V → V ∗ влечёт a = b. �

Для каждой матрицы A ∈ Mn(C) будем обозначать через AT транспониро-ванную матрицу, а через A — матрицу, полученную применением комплексногосопряжения ко всем компонентам матрицы A.

Теорема 3.3. Для каждого линейного оператора A : V → V существует

единственный линейный оператор A ∗ : V → V такой, что

(A x; y) = (x;A ∗y) для всех x; y ∈ V :Если A — матрица оператора A в ортонормированном базисе e1; : : : ; en, то

матрица оператора A ∗ в этом же базисе равна AT в евклидовом случае и AT

в унитарном случае.

⊲ Рассмотрим выражение (A x; y) как функцию от x, считая y временно фик-сированным. Используя обозначения из теоремы 3.2, имеем

(A x; y) = y(A x) = ( y ◦ A )(x):Так как оба отображения y и A линейны, то их суперпозиция

46

Page 47: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

V A−−→ V y

−−→ Kтакже линейна. Итак, y ◦A ∈ V ∗. По теореме 3.2 для каждого вектора y ∈ Vсуществует единственный вектор y′ ∈ V , зависящий от y, такой, что y ◦ A = �(y′) = y′ :Это равенство означает, что ( y ◦ A )(x) = y′(x), т.е.

(A x; y) = (x; y′); для всех x ∈ V :Определим отображение A

∗ : V → V , полагая A∗y = y′ для каждого y ∈ V .

Тогда равенство (A x; y) = (x;A ∗y) выполнено для всех x; y ∈ V . Нужно про-верить, что отображение A ∗ линейно, т.е. что

A∗(�y + �z) = �A ∗y + �A

∗z для всех �; � ∈ K и y; z ∈ V :Заметим, что

(x; A∗(�y + �z)) = (A x; �y + �z) = �(A x; y) + �(A x; z) и

(x; �A ∗y + �A∗z) = �(x;A ∗y) + �(x;A ∗z) = �(A x; y) + �(A x; z):

Таким образом,(x; A

∗(�y + �z)) =(x; �A ∗y + �A

∗z)для всех x ∈ V , и требуемое равенство получается применением следствия ктеореме 3.2, в котором нужно взятьa = A

∗(�y + �z); b = �A ∗y + �A∗z;

зафиксировав �; �; y; z.Если тождество

(A x; y) = (x;By); x; y ∈ V;выполнено для какого-то отображения B : V → V , то By = y′ для каждоговектора y ∈ V ввиду единственности вектора y′, удовлетворяющего равенствам(A x; y) = (x; y′) для всех x ∈ V . Поэтому B = A ∗, что доказывает единствен-ность A ∗.

Пусть A = (aij), и пусть A∗ = (a∗ij) — матрица сопряжённого оператора A ∗

в базисе e1; : : : ; en. Тогда

A ej =n∑i=1

aijei; A ∗ej =n∑i=1

a∗ijei:В силу тождества, связывающего операторы A и A ∗, выполняются равенства

47

Page 48: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

(A ei; ej) = (ei;A ∗ej) для всех i; j:Ортонормированность базиса означает, что (ei; ej) = Æij . Поэтому

(A ei; ej) =(

n∑k=1

akiek; ej) =n∑k=1

aki(ek; ej) =n∑k=1

akiÆkj = aji;(ei;A ∗ej) =

(ei; n∑k=1

a∗kjek) =n∑k=1

a∗kj(ei; ek) =n∑k=1

a∗kjÆik = a∗ij :Сравнение двух выражений даёт aji = a∗ij , откуда a∗ij = aji для всех i; j. В

результате получается требуемое равенство A∗ = AT. �

Определение. Линейный оператор A ∗ называется сопряжённым к линейно-

му оператору A .

Теорема 3.4. Если A ;B ∈ L (V ), а �; � ∈ K, то

(�A + �B)∗ = �A ∗ + �B∗; (A B)∗ = B

∗A

∗; A∗∗ = A :

⊲ Эти формулы получаются из условия единственности в определении сопря-жённого оператора с учётом того, что выполняются тождества

(

(�A + �B)x; y) = (�A x+ �Bx; y)= �(A x; y) + �(Bx; y)= �(x;A ∗y) + �(x;B∗y)= (x; �A

∗y + �B∗y)

=(x; (�A

∗ + �B∗)y);

(

(A B)x; y) =(

A (Bx); y) = (Bx; A∗y) =

(x; B∗(A ∗y)) =

(x; (B∗A

∗)y);(A ∗x; y) = (y;A ∗x) = (A y; x) = (x;A y) для x; y ∈ V : �

Определение. Линейный оператор A в евклидовом или унитарном простран-

стве V называется самосопряжённым, если A ∗ = A .

Из определения сопряжённого оператора A ∗ вытекает, что линейный опе-ратор A : V → V самосопряжён тогда и только тогда, когда выполняетсятождество

(A x; y) = (x;A y); x; y ∈ V:Равенство A ∗ = A выполняется тогда и только тогда, когда линейные опе-

раторы A и A ∗ имеют одинаковые матрицы в выбранном базисе e1; : : : ; enпространства V . В случае, когда базис ортонормирован, связь между матрица-ми двух операторов даётся теоремой 3.3.

48

Page 49: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

Определение. Матрица A ∈ Mn(C) называется эрмитовой, если AT= A.

Матрица A ∈Mn(K) называется симметричной, если AT = A.

Таким образом, оператор A самосопряжён тогда и только тогда, когда егоматрица в ортонормированном базисе эрмитова. Условие эрмитовости для ве-щественной матрицы A ∈ Mn(R) равносильно условию симметричности. Вчастности, линейный оператор в евклидовом пространстве самосопряжён тогдаи только тогда, когда его матрица в ортонормированном базисе симметрична.

Лемма 1. Если линейный оператор A : V → V самосопряжён и V 6= 0, то A

имеет хотя бы один собственный вектор.

⊲ Любой линейный оператор в комплексном векторном пространстве всегдаимеет собственный вектор. В частности, утверждение леммы верно в случае,когда V унитарно. Остаётся рассмотреть случай, когда V евклидово и K = R.По теореме 2.14 существует векторное подпространствоU ⊆ V , которое инвари-антно относительно A и имеет размерность 1 или 2. Если dimU = 1, то U = 〈x〉,где x — собственный вектор оператора A . Предположим, что dimU = 2. ПустьA =

( a b d)

— матрица оператора A |U в некотором ортонормированном базисе u1; u2 про-странства U . Поскольку равенство (A x; y) = (x;A y) выполняется для всех век-торов x; y ∈ V , то это равенство выполняется, в частности, для всех векторовx; y ∈ U . Поэтому линейный оператор A |U самосопряжён. Но тогда AT = A,т.е. = b. Вычислим характеристический многочлен оператора A |U :�A |U (t) = �A(t) = det

( a− t bb d− t) = t2 − (a+ d)t+ (ad− b2):Так как этот многочлен имеет неотрицательный дискриминантD = (a+ d)2 − 4(ad− b2) = a2 − 2ad+ d2 + 4b2 = (a− d)2 + 4b2 ≥ 0;то его корни вещественны. Пусть � ∈ R — один из корней. Тогда � ∈ Spec A |U ,и поэтому найдётся вектор 0 6= u ∈ U , такой, что A u = �u. Это и есть соб-ственный вектор оператора A . �

Лемма 2. Если векторное подпространство U ⊆ V инвариантно относитель-

но самосопряжённого линейного оператора A : V → V , то его ортогональное

дополнение U⊥ также инвариантно относительно A .

⊲ Вспомним, чтоU⊥ = {x ∈ V | (x; u) = 0 для всех u ∈ U}:49

Page 50: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

Пусть x ∈ U⊥. Так как A u ∈ U для любого вектора u ∈ U , то

(A x; u) = (x;A u) = 0:Следовательно, A x ∈ U⊥. �

Теорема 3.5. Пусть задан самосопряжённый линейный оператор A : V → V .

1) Все собственные значения оператора A вещественны, т.е. Spec A ⊆ R.

2) Для каждой пары собственных значений �; �′ ∈ Spec A , � 6= �′, соот-

ветствующие подпространства собственных векторов V � и V �′

взаимно ор-

тогональны.

3) Существует ортонормированный базис векторного пространства V , со-

стоящий из собственных векторов оператора A . В таком базисе матрица

оператора A диагональна и вещественна.

⊲ 1) Пусть � ∈ Spec A . Тогда найдётся такой вектор x ∈ V , что x 6= 0 иA x = �x. Так как A самосопряжён, то (A v; w) = (v;A w) для всех v; w ∈ V .Подставляя v = w = x, получим

(�x; x) = (A x; x) = (x;A x) = (x; �x):Это равенство преобразуется к виду �(x; x) = �(x; x). Таким образом,

(�− �)(x; x) = 0:Поскольку (x; x) > 0, то � = �, т.е. � ∈ R.

2) Пусть x ∈ V � и y ∈ V �′

. Тогда A x = �x, A y = �′y. Как уже доказано в1), �; �′ ∈ R. Следовательно,

(A x; y) = (�x; y) = �(x; y); (x;A y) = (x; �′y) = �′(x; y):Равенство (A x; y) = (x;A y) даёт (�−�′)(x; y) = 0, откуда (x; y) = 0, поскольку� 6= �′.

3) Пусть Spec A = {�1; : : : ; �p}. Как известно, суммаp∑i=1

V �i прямая. Рас-

смотрим векторное подпространствоU =p

⊕i=1

V �i :Так как каждое подпространство V �i инвариантно относительно A , то U , атакже, по лемме 2, U⊥ инвариантны относительно A . Из 1-го семестра извест-но, что V = U ⊕ U⊥:

50

Page 51: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

Линейный оператор A |U⊥ самосопряжён. Если U⊥ 6= 0, то по лемме 1 суще-ствует собственный вектор z ∈ U⊥ этого оператора. Вектор z будет такжесобственным для оператора A . Поэтому z должен лежать в одном из подпро-странств V �1 ; : : : ; V �p . Следовательно, z ∈ U . Но это невозможно, посколькуz 6= 0, а U ∩ U⊥ = 0.

Полученное противоречие доказывает, что U⊥ = 0. Можно сделать вывод,что V = U , т.е. V =

p⊕i=1

V �i :В силу 2) подпространства V �1 ; : : : ; V �p попарно взаимно ортогональны. Выбе-рем в каждом из этих подпространств ортонормированный базис. Объединяявсе эти базисы, получим ортонормированный базис всего пространства V , при-чём все базисные векторы являются собственными для оператора A . �

Предположим, что V — евклидово пространство. По каждому линейномуоператору A : V → V можно определить отображение fA : V × V → R, пола-гая fA (x; y) = (A x; y); x; y ∈ V:Если �; � ∈ R, а x; y; z ∈ V , тоfA (�x + �y; z) =

(

A (�x+ �y); z) = (�A x+ �A y; z) = �(A x; z) + �(A y; z)= �fA (x; z) + �fA (y; z)fA (x; �y + �z) = (A x; �y + �z) = �(A x; y) + �(A x; z) = �fA (x; y) + �fA (x; z):

Эти тождества означают, что fA является билинейной формой на векторномпространстве V . Заметим, чтоfA (y; x) = (A y; x) = (x;A y):Вспомним, что билинейная форма f : V × V → R называется симметричной,если f(y; x) = f(x; y) для всех x; y ∈ V . Симметричность билинейной формыfA равносильна тому, что (x;A y) = (A x; y) для всех x; y ∈ V , но данное тож-дество означает в точности, что линейный оператор A самосопряжён.

В 1-ом семестре рассматривалось соответствие между билинейными и квад-ратичными формами. В частности, билинейная форма fA определяет квадра-тичную форму qA : V → R по правилуqA (x) = fA (x; x) = (A x; x); x ∈ V:Лемма. Отображение A 7→ fA задаёт биективное соответствие между са-

мосопряжёнными линейными операторами на евклидовом пространстве V и

симметричными билинейными формами на V .

51

Page 52: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

Отображение A 7→ qA задаёт биективное соответствие между самосо-

пряжёнными линейными операторами и квадратичными формами.

В ортонормированном базисе e1; : : : ; en матрица самосопряжённого опера-

тора A совпадает с матрицей билинейной формы fA и с матрицей квадра-

тичной формы qA .

⊲ Пусть A = (aij) — матрица самосопряжённого оператора A в ортонорми-рованном базисе e1; : : : ; en. Используя равенства

A ej =n∑k=1

akjek; j = 1; : : : ; n;находимfA (ei; ej) = (A ei; ej) = (ei;A ej) =

n∑k=1

akj(ei; ek) =n∑k=1

akjÆik = aij :Матрица билинейной формы fA по определению имеет fA (ei; ej) в качествесвоей (i; j)-компоненты. Таким образом, эта матрица совпадает с матрицей A,а квадратичная форма qA имеет ту же самую матрицу в базисе e1; : : : ; en, чтои билинейная форма fA .

Каждый линейный оператор, каждая билинейная форма и каждая квадра-тичная форма на V однозначно определяется своей матрицей в выбранном ба-зисе e1; : : : ; en. При этом матрицами самосопряжённых линейных операторов,матрицами симметричных билинейных форм и матрицами квадратичная формявляются в точности симметричные матрицы из Mn(R).

Отсюда следует, что для каждой квадратичной формы q : V → R существуетединственный самосопряжённый линейный оператор A : V → V , для которогоq = qA . А именно, A — это тот оператор, матрица которого в базисе e1; : : : ; enсовпадает с матрицей квадратичной формы q. Аналогичное утверждение имеетместо и для симметричных билинейных форм. �

Теорема 3.6. Для любой квадратичной формы q на евклидовом пространствеV существует ортонормированный базис e1; : : : ; en пространства V , в кото-

ром q имеет диагональный вид q(x) = �1x21 + : : :+ �nx2n;

где x1; : : : ; xn — координаты вектора x в базисе e1; : : : ; en.⊲ В силу предыдущей леммы существует самосопряжённый линейный опера-тор A : V → V , для которого q = qA . Тогдаq(x) = (A x; x) для всех x ∈ V :По теореме 3.5 оператор A диагонализируем в некотором ортонормированномбазисе e1; : : : ; en пространства V . Каждый вектор ei из этого базиса являетсясобственным для оператора A . Следовательно, A ei = �iei для некоторого соб-

ственного значения �i ∈ R. Для произвольного вектора x =n∑i=1

xiei имеем

52

Page 53: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

A x =n∑i=1

xiA ei =n∑i=1

�ixiei;что даётq(x) = (A x; x) = (

n∑i=1

�ixiei; n∑j=1

xjej) =n∑i=1

n∑j=1

�ixixj(ei; ej)=

n∑i=1

n∑j=1

�ixixjÆij =n∑i=1

�ix2i : �

Пусть по-прежнему V — некоторое евклидово или унитарное пространство.

Определение. Линейный оператор A : V → V называется ортогональным в

случае евклидова пространства и унитарным в случае унитарного простран-

ства, если A обратим и A ∗ = A −1.

Теорема 3.7. Для линейного оператора A : V → V следующие утверждения

эквивалентны:

1) A ортогонален (унитарен),

2) (A x;A y) = (x; y) для всех x; y ∈ V ,

3) (A x;A x) = (x; x) для всех x ∈ V ,

4) для каждого ортонормированного базиса v1; : : : ; vn пространства V век-

торы A v1; : : : ;A vn образуют ортонормированный базис пространства V .

5) существует ортонормированный базис e1; : : : ; en пространства V , та-

кой, что векторы A e1; : : : ;A en также образуют ортонормированный базис

пространства V .

⊲ 1)⇒2) Условие A ∗ = A −1 означает, что

(A x; y) = (x;A −1y) для всех x; y ∈ V :Заменяя в этом тождестве вектор y на вектор A y, приходим к требуемомутождеству (A x;A y) = (x; y).

2)⇒1) Если u ∈ KerA , то A u = 0, и тогда

(u; y) = (A u;A y) = (0; y) = 0 для всех y ∈ V :Отсюда следует, что u = 0. Таким образом, KerA = 0. По теореме 1.8 операторA биективен. Следовательно, существует обратное отображение A −1 : V → V ,которое, как известно, является линейным. Заменяя в тождестве

(A x;A y) = (x; y); x; y ∈ V;вектор y на вектор A

−1y, получаем тождество (A x; y) = (x;A −1y), котороевлечёт равенство A ∗ = A −1.

53

Page 54: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

2)⇒3) Подстановка y = x.3)⇒2) В силу 3) для любых x; y ∈ V и � ∈ K выполнено равенство

(

A (x+ �y); A (x + �y)) = (x+ �y; x+ �y):Используя линейность оператора A и полуторалинейность скалярного произ-ведения, можно преобразовать это равенство к виду

(A x;A x) + �(A y;A x) + �(A x;A y) + ��(A y;A y) =

= (x; x) + �(y; x) + �(x; y) + ��(y; y):Поскольку (A x;A x) = (x; x) и (A y;A y) = (y; y), получаем�(A y;A x) + �(A x;A y) = �(y; x) + �(x; y): (∗)

При � = 1 это даёт

(A y;A x) + (A x;A y) = (y; x) + (x; y):В случае евклидова пространства (A y;A x) = (A x;A y) и (y; x) = (x; y), чтосразу приводит к требуемому тождеству (A x;A y) = (x; y).

Предположим, что V унитарно. Тогда в (∗) можно взять � = i, мнимая еди-ница. Так как � = −i, то после сокращения на i получаем

(A y;A x) − (A x;A y) = (y; x) − (x; y):Вычитая это равенство из предшествующего, полученного из (∗) при � = 1,также приходим к тождеству (A x;A y) = (x; y).

2)⇒4) Так как (vi; vj) = Æij , то из 2) выводим

(A vi;A vj) = (vi; vj) = Æij для всех i; j:Таким образом, система векторов A v1; : : : ;A vn ортонормирована. Еслиn

∑i=1

�i A vi = 0 для какого-либо набора коэффициентов �1; : : : ; �n ∈ K;то �j =

(

n∑i=1

�iA vi; A vj) = 0 для всех j = 1; : : : ; n:Таким образом, векторы A v1; : : : ;A vn линейно независимы. Так как их числоn равно размерности векторного пространства V , они образуют базис V .

4)⇒5) очевидно.

5)⇒2) Пусть x1; : : : ; xn — координаты вектора x ∈ V , а y1; : : : ; yn — коорди-наты вектора y ∈ V в базисе e1; : : : ; en. Тогда

54

Page 55: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

x =n∑i=1

xiei; y =n∑i=1

yiei; (x; y) =n∑i=1

xiyi:Ортонормированность системы векторов A e1; : : : ;A en означает, что

(A ei;A ej) = Æij для 1 ≤ i; j ≤ n:Так как A x =

n∑i=1

xiA ei, A y =n∑i=1

yiA ei, то

(A x;A y) =n∑i=1

n∑j=1

xiyj(A ei;A ej) =n∑i=1

n∑j=1

xiyjÆij =n∑i=1

xiyi = (x; y):Требуемое тождество доказано. �

Геометрический смысл ортогональных операторов.

В евклидовом пространстве V для каждого вектора x ∈ V определена егодлина ‖x‖ =

(x; x). Очевидно, что равенство (A x;A x) = (x; x) равносильноравенству ‖A x‖ = ‖x‖. Поэтому линейный оператор A : V → V ортогоналентогда и только тогда, когда ‖A x‖ = ‖x‖ для всех x ∈ V , т.е. A сохраняетдлины векторов.

Для каждой пары ненулевых векторов x; y ∈ V определён угол между ними.Этот угол ' находится из формулы

cos' =(x; y)

‖x‖ · ‖y‖ ;которая определяет ' однозначно в диапазоне 0 ≤ ' ≤ �. Если линейный опе-ратор A ортогонален, то

(A x;A y)‖A x‖ · ‖A y‖ =

(x; y)‖x‖ · ‖y‖ ;

т.е. A сохраняет углы между векторами.

Лемма. Если векторное подпространство U ⊆ V инвариантно относитель-

но ортогонального или унитарного линейного оператора A : V → V , то его

ортогональное дополнение U⊥ также инвариантно относительно A .

⊲ Так как оператор A биективен, то A |U отображает U биективно на об-раз A (U). При этом A (U) является векторным подпространством в V ввидулинейности отображения A |U . Другими словами, A |U есть изоморфизм век-торного пространства U на векторное пространство A (U). Отсюда следует, что

dim A (U) = dimU:55

Page 56: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

Однако A (U) ⊆ U в силу инвариантности U относительно A . С учётом ра-венства размерностей это возможно только в случае, когда A (U) = U . Такимобразом, для любого вектора u ∈ U найдётся такой вектор u′ ∈ U , что A u′ = u,и тогда A −1u = u′ ∈ U . Это доказывает, что U инвариантно также относитель-но обратного оператора A

−1.Если x ∈ U⊥, то

(A x; u) = (x;A ∗u) = (x;A −1u) = 0

для всех u ∈ U . Следовательно, A x ∈ U⊥ для всех x ∈ U⊥, и инвариантностьU⊥ относительно A доказана. �

Теорема 3.8. Пусть V — унитарное векторное пространство и A : V → V— унитарный линейный оператор.

1) |�| = 1 для каждого � ∈ Spec A .

2) Для каждой пары собственных значений �; �′ ∈ Spec A , � 6= �′, соот-

ветствующие подпространства собственных векторов V � и V �′

взаимно ор-

тогональны.

3) Существует ортонормированный базис векторного пространства V , со-

стоящий из собственных векторов оператора A .

⊲ 1) Выберем произвольно собственный вектор x ∈ V �. Так как A x = �x, торавенство (A x;A x) = (x; x), выполняющееся в силу унитарности оператора,переписывается в виде (�x; �x) = (x; x), и далее в виде��(x; x) = (x; x):Так как x 6= 0, то (x; x) 6= 0, и предыдущее равенство влечёт |�|2 = �� = 1,откуда |�| = 1.

2) Пусть x ∈ V � и y ∈ V �′

. Тогда A x = �x и A y = �′y. В силу унитарностиоператора A выполняется равенство (A x;A y) = (x; y), которое переписывает-ся в виде (�x; �′y) = (x; y), и далее в виде��′(x; y) = (x; y):Так как |�| = 1, то �−1 = �. Из условия � 6= �′ получаем �−1 6= �′. Поэтому��′ 6= 1, но тогда должно выполняться равенство (x; y) = 0.

3) Для обоснования этого утверждения нужно повторить рассуждения, ис-пользованные при доказательстве теоремы 3.5. �

Лемма. Предположим, что V — евклидово пространство размерности 2, в

котором выбран ортонормированный базис e1; e2, а A : V → V — это орто-

гональный линейный оператор. Если detA > 0, то A является оператором

56

Page 57: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

поворота, матрица которого в базисе e1; e2 имеет видR' =

(

cos' − sin'sin' cos' )

при некотором ' ∈ R:Если же detA < 0, то A диагонализируем, причём Spec A = {1;−1}.

⊲ Пусть матрица оператора A в базисе e1; e2 естьA =

( a b d) :Тогда A e1 = ae1 + e2 и A e2 = be1 + de2. По теореме 3.7 векторы A e1, A e2образуют ортонормированный базис пространства V . Запишем соотношения(A ei;A ej) = Æij в явном виде:a2 + 2 = 1; ab+ d = 0; b2 + d2 = 1:Таким образом, точки (a; ) и (b; d) евклидовой плоскости R

2 лежат на окруж-ности радиуса 1. Можно найти такие '; '′ ∈ R, чтоa = cos'; = sin'; b = cos'′; d = sin'′:Величины '; '′ определены однозначно с точностью до сдвига на 2�k, где k —целое число. Имеемab+ d = cos' cos'′ + sin' sin'′ = cos('′ − '):Условие ортогональности ab+ d = 0 влечёт'′ − ' = ±

�2

+ 2�k при некотором k ∈ Z:Заменяя '′ на '′ − 2�k, можно считать, что k = 0. Если '′ = '+ �=2, тоb = − sin'; d = cos' и A = R':Заметим, что detA = detA = cos2 '+ sin2 ' = 1 > 0.

Остаётся рассмотреть случай, когда '′ = '− �=2. Здесьb = sin'; d = − cos' и A =

(

cos' sin'sin' − cos') :

В этом случае det A = − cos2 '− sin2 ' = −1 < 0. Векторы

57

Page 58: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

x =(

cos'2

) e1 +(

sin'2

) e2; y =(

sin'2

) e1 − (

cos'2

) e2удовлетворяют равенствам A x = x, A y = −y. Действительно, в координатнойформе первое равенство сводится к матричному соотношению

(

cos' sin'sin' − cos') (

cos'=2sin'=2 )

=

(

cos'=2sin'=2 ) ;

которое выполняется в силу известных формул тригонометрии

cos' cos'=2 + sin' sin'=2 = cos('− '=2) = cos'=2;sin' cos'=2 − cos' sin'=2 = sin('− '=2) = sin'=2:

Второе равенство проверяется аналогично. Итак, x и y являются собственны-ми векторами оператора A . Векторы x и y образуют базис пространства V , в

котором матрица оператора A есть

(

1 00 −1

)

. �

Обозначим через R' : V → V линейный оператор, матрица которого в вы-бранном ортонормированном базисе e1; e2 равна R'. Если ' = 2�k, где k ∈ Z,то R' = E, откуда следует, что R' = E . Если ' = � + 2�k, где k ∈ Z, тоR' = −E и R' = −E . В любом другом случае оператор R' не имеет собствен-ных векторов. Непосредственно проверяется формула

R'R = R'+ = R R' для любых '; ∈ R:Замечание. В другом ортонормированном базисе e′1; e′2 пространства V мат-

рица A′ оператора R' вычисляется по формуле A′ = P−1R'P , где P — этоматрица перехода от базиса e1; e2 к базису e′1; e′2. Существует единственныйлинейный оператор P : V → V , который переводит e1 в e′1, а e2 в e′2. По тео-реме 3.7 P ортогонален. Матрица оператора P в базисе e1; e2 равна P . ЕслиdetP > 0, то P = R� для некоторого � ∈ R в силу предыдущей леммы. В этомслучае A′ = R', так как матрицы R' и R� коммутируют. Если же detP < 0, томатрица перехода от базиса e1;−e2 к базису e′1; e′2 имеет уже положительныйопределитель. Как легко видеть, матрица оператора R' в базисе e1;−e2 равнаR−', но тогда и A′ = R−' в силу вышесказанного.

Таким образом, либо A′ = R', либо A′ = R−' в зависимости от того, оди-наково ориентированы базисы e1; e2 и e′1; e′2 или нет. В общем случае говорят,что два базиса некоторого вещественного векторного пространства одинаково

ориентированы, если матрица перехода P от одного базиса к другому удовле-творяет условию detP > 0. Считать ли заданный оператор поворота поворотомна угол ', или же поворотом на угол −', зависит от выбора ориентации. Крометого, замена ' на '+ 2�k, где k ∈ Z, не изменяет оператор поворота.

58

Page 59: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

Теорема 3.9. Для любого ортогонального линейного оператора A в евкли-

довом пространстве V существует ортонормированный базис пространстваV , в котором матрица оператора A имеет блочно-диагональный вид

R'1· · · 0 0 0

.... . .

......

...

0 · · · R'm 0 00 · · · 0 Ek 00 · · · 0 0 −El

где '1; : : : ; 'm =∈ �Z, а Ek, El — это единичные матрицы порядка k и l соот-

ветственно.

⊲ Если V содержит некоторое инвариантное подпространство U оператораA , то его ортогональное дополнение U⊥ также инвариантно относительно A

по лемме, предшествующей теореме 3.8. Кроме того, как известно из 1-го се-местра, V = U ⊕U⊥. Ограничения оператора A на U и на U⊥ также являютсяортогональными операторами. Проводя индукцию по размерности простран-ства V , убеждаемся в существовании разложенияV =

s⊕i=1

Ui;где каждое Ui — минимальное ненулевое инвариантное подпространство опе-ратора A , так что Ui 6= 0 и никакое ненулевое инвариантное подпространствооператора A не содержится в Ui строго. Но по теореме 2.14 линейный опе-ратор A |Ui обладает инвариантным подпространством размерности 1 или 2.Такое подпространство должно тогда совпадать со всем Ui. Отсюда следует,что dimUi = 1 или 2 для каждого i. Перенумеровывая подпространства, мож-но считать, что dimUi = 2 при i = 1; : : : ;m, где m ≤ s, и dimUi = 1 при i > m.

Если dimUi = 2, то ортогональный оператор A |Ui не имеет собственныхвекторов, так как каждый собственный вектор x давал бы одномерное инвари-антное подпространство 〈x〉, строго содержащееся в Ui. По предыдущей леммеэто возможно только тогда, когда det A |Ui > 0 и A |Ui есть оператор поворота.Матрица этого оператора в ортонормированном базисе пространства Ui равнаR'i при некотором 'i ∈ R. Поскольку оператор A |Ui не имеет собственныхвекторов, то 'i =∈ �Z.

Если dimUi = 1, то Ui = 〈x〉, где x — собственный вектор оператора A |Ui .Тогда A x = �x для некоторого � ∈ Spec A . Следовательно,

(A x;A x) = (�x; �x) = �2(x; x):Но (A x;A x) = (x; x) ввиду ортогональности оператора A . Так как (x; x) 6= 0,отсюда следует, что �2 = 1, т.е. � = 1 или � = −1. Матрица оператора A |Uiимеет порядок 1 и равна (�).

59

Page 60: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

Перенумеруем ещё раз подпространства Ui с номерами i = m + 1; : : : ; s так,чтобы те из них, которые порождаются собственными векторами, отвечающимисобственному значению 1, имели меньшие номера. Для завершения доказатель-ства остаётся применить теорему 2.6. �

Следствие 1. Если A — ортогональный линейный оператор, то detA = ±1.

Следствие 2. Если V — евклидово пространство размерности 3, то для за-

данного ортогонального линейного оператора A : V → V с определителем

detA = 1 существует ортонормированный базис V , в котором матрица опе-

ратора A имеет вид

cos' − sin' 0sin' cos' 0

0 0 1

(такой оператор называется оператором поворота на угол ' вокруг прямой,порождённой третьим базисным вектором).

Ортогональная и унитарная группы

Пусть временно V — векторное пространство размерности n над произволь-ным полем K. Обратимые линейные операторы V → V образуют группу отно-сительно умножения операторов. Эта группа обозначается GL(V ) и называетсяполной линейной группой. Единичным элементом этой группы является тож-дественный оператор E , а обратным элементом для оператора A ∈ GL(V ) —обратный оператор A

−1.Отображение � : L (V ) → Mn(K), которое сопоставляет линейному опера-

тору его матрицу в зафиксированном базисе пространства V , биективно потеореме 1.5. Линейный оператор A ∈ L (V ) обратим тогда и только тогда, ко-гда обратима соответствующая матрица �(A ). Поэтому � отображает группуGL(V ) биективно на группу GLn(K) обратимых матриц из Mn(K). Известнотакже, что �(A B) = �(A )�(B) для всех A ;B ∈ L (V ). Отсюда следует, чтоограничение � на GL(V ) задаёт изоморфизм групп

GL(V ) ∼= GLn(K):Определение. Матрица A ∈ Mn(R) называется ортогональной, еслиAAT = E, т.е. AT = A−1. Матрица A ∈Mn(C) называется унитарной,

если AAT= E, т.е. AT

= A−1.

Теорема 3.10. Множество O(V ) всех ортогональных линейных операторов в

евклидовом пространстве V есть подгруппа группы GL(V ). Множество O(n)всех ортогональных матриц порядка n есть подгруппа группы GLn(R). Со-

поставление линейному оператору его матрицы в зафиксированном ортонор-

мированном базисе пространства V задаёт изоморфизм групп

O(V ) ∼= O(n); где n = dimV :60

Page 61: Лекции по линейной алгебреold.kpfu.ru/f5/k2/b_files/linalg!64.pdfпрообраз x ∈ V при отображении f. Определение.Изоморфизмом

⊲ Для тождественного оператора E : V → V имеем E ∗ = E , поскольку равен-ство (E x; y) = (x; E y) очевидным образом выполняется для всех x; y ∈ V . Таккак E = E −1, то оператор E ортогонален, т.е. E ∈ O(V ). Пусть A ;B ∈ O(V ).Тогда A ∗ = A −1 и B∗ = B−1. Применяя теорему 3.4, получаем

(A B)∗ = B∗A

∗ = B−1

A−1 = (A B)−1:

Следовательно, линейный оператор A B ортогонален, т.е. A B ∈ O(V ). Далее,из равенства E = A A −1 следует, что

E = E∗ = (A A

−1)∗ = (A −1)∗A ∗ = (A −1)∗A −1:Таким образом, (A −1)∗ = (A −1)−1 = A , т.е. A

−1 ∈ O(V ). Это завершает про-верку того, что O(V ) есть подгруппа в GL(V ).

Рассмотрим биекцию � : L (V ) → Mn(R), определяемую выбранным орто-нормированным базисом пространства V . Для произвольного линейного опера-тора A ∈ L (V ) равенство A A ∗ = E выполняется тогда и только тогда, когда�(A )�(A ∗) = E:Но �(A ∗) = �(A )T по теореме 3.3. Таким образом, оператор A ортогоналентогда и только тогда, когда ортогональна соответствующая ему матрица �(A ).Поэтому � отображает O(V ) биективно на O(n). Рассмотрим ограничение�′ : O(V ) → O(n) ⊆ GLn(R)

отображения �. Поскольку �′(A B) = �′(A )�′(B) для всех A ;B ∈ O(V ), то�′ является гомоморфизмом группы O(V ) в группу GLn(R). Следовательно,образ �′, который совпадает с O(n), является подгруппой группы GLn(R), и �′

является изоморфизмом группы O(V ) на группу O(n). �

Совершенно аналогично доказывается

Теорема 3.11. Множество U(V ) всех унитарных линейных операторов в

унитарном пространстве V есть подгруппа группы GL(V ). Множество U(n)всех унитарных матриц порядка n есть подгруппа группы GLn(C). Сопостав-

ление линейному оператору его матрицы в зафиксированном ортонормиро-

ванном базисе пространства V задаёт изоморфизм групп

U(V ) ∼= U(n); где n = dimV :Определение. Группы O(V ) и O(n) называются ортогональными группами.

Группы U(V ) и U(n) называются унитарными группами.

61