forked from CheKaa/Algebra-Actual-MIT-2017
-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathmain.tex
2144 lines (1562 loc) · 209 KB
/
main.tex
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
691
692
693
694
695
696
697
698
699
700
701
702
703
704
705
706
707
708
709
710
711
712
713
714
715
716
717
718
719
720
721
722
723
724
725
726
727
728
729
730
731
732
733
734
735
736
737
738
739
740
741
742
743
744
745
746
747
748
749
750
751
752
753
754
755
756
757
758
759
760
761
762
763
764
765
766
767
768
769
770
771
772
773
774
775
776
777
778
779
780
781
782
783
784
785
786
787
788
789
790
791
792
793
794
795
796
797
798
799
800
801
802
803
804
805
806
807
808
809
810
811
812
813
814
815
816
817
818
819
820
821
822
823
824
825
826
827
828
829
830
831
832
833
834
835
836
837
838
839
840
841
842
843
844
845
846
847
848
849
850
851
852
853
854
855
856
857
858
859
860
861
862
863
864
865
866
867
868
869
870
871
872
873
874
875
876
877
878
879
880
881
882
883
884
885
886
887
888
889
890
891
892
893
894
895
896
897
898
899
900
901
902
903
904
905
906
907
908
909
910
911
912
913
914
915
916
917
918
919
920
921
922
923
924
925
926
927
928
929
930
931
932
933
934
935
936
937
938
939
940
941
942
943
944
945
946
947
948
949
950
951
952
953
954
955
956
957
958
959
960
961
962
963
964
965
966
967
968
969
970
971
972
973
974
975
976
977
978
979
980
981
982
983
984
985
986
987
988
989
990
991
992
993
994
995
996
997
998
999
1000
\documentclass[10pt,a4paper,oneside]{book} % тест4
\usepackage[a4paper,includeheadfoot,top=10mm,bottom=10mm,left=10mm,right=10mm]{geometry}
\usepackage[utf8]{inputenc}
\usepackage[russian]{babel}
\usepackage{amsmath,amsthm,amssymb,amscd,array}
\usepackage{latexsym}
\usepackage{multicol} % нумерация в нескольких колонках
\usepackage{graphicx}
%\usepackage{pdfsync}
\usepackage{pgf}
\usepackage{tikz}
\usepackage{tikz-cd}
\usetikzlibrary{arrows,backgrounds,patterns,matrix,shapes,fit,calc,shadows,plotmarks}
\usepackage{hyperref} % гиперссылки
\usepackage{cmap} % Поддержка поиска русских слов в PDF (pdflatex)
\usepackage{indentfirst}% Красная строка в первом абзаце
\usepackage{misccorr}
\usepackage{arydshln} % штрихованные линии в массивах
\usepackage{mathtools} % выравнивание в матрицах
\usepackage{ccaption}
\usepackage{fancyhdr}
\usepackage{comment}
\usepackage{xcolor}
\hypersetup{
colorlinks,
linkcolor={blue!50!black},
citecolor={blue!50!black},
urlcolor={red!80!black}
}
% цвета для ссылок
\newtheorem{upr}{Упражнение}
\newtheorem{predl}{Предложение}
\newtheorem{komment}{Комментарий}
\newtheorem{conj}{Гипотеза}
\newtheorem{notation}{Обозначение}
\theoremstyle{definition}
\newtheorem{kit}{Кит}
\newtheorem*{rem}{Замечание}
\newtheorem{zad}{Задача}
\newtheorem*{defn}{Определение}
\newtheorem*{fact}{Факт}
\newtheorem{thm}{Теорема}
\newtheorem*{thmm}{Теорема}
\newtheorem{lem}{Лемма}
\newtheorem{cor}{Следствие}
\renewcommand{\proofname}{Доказательство}
\renewcommand{\mod}{\,\operatorname{mod}\,}
\newcommand{\mf}[1]{\mathfrak{#1}}
\newcommand{\mcal}[1]{\mathcal{#1}}
\newcommand{\mb}[1]{\mathbb{#1}}
\newcommand{\mc}[1]{\mathcal{#1}}
\newcommand{\tbf}[1]{\textbf{#1}}
\newcommand{\ovl}{\overline}
\newcommand{\Spec}{\operatorname{Spec}}
\newcommand{\K}{\operatorname{K_0}}
\newcommand{\witt}{\operatorname{W}}
\newcommand{\gw}{\operatorname{GW}}
\newcommand{\coh}{\operatorname{H}}
\newcommand{\dist}{\operatorname{dist}}
\newcommand{\cl}{\operatorname{Cl}}
\newcommand{\Vol}{\operatorname{Vol}}
\newcommand\tgg{\mathop{\rm tg}\nolimits}
\newcommand\ccup{\mathop{\cup}}
\newcommand{\id}{\operatorname{Id}}
\newcommand{\lcm}{\operatorname{lcm}}
\newcommand{\chr}{\operatorname{char}}
\newcommand{\rank}{\operatorname{rank}}
\DeclareMathOperator{\Coker}{Coker}
\DeclareMathOperator{\Ker}{Ker}
\newcommand{\im}{\operatorname{Im}}
\renewcommand{\Im}{\operatorname{Im}}
\newcommand{\Tr}{\operatorname{Tr}}
\newcommand{\re}{\operatorname{Re}}
\newcommand{\tr}{\operatorname{Tr}}
\newcommand{\ord}{\operatorname{ord}}
\newcommand{\Stab}{\operatorname{Stab}}
\newcommand{\orb}{\operatorname{\mathcal O}}
\newcommand{\Fix}{\operatorname{Fix}}
\newcommand{\Hom}{\operatorname{Hom}}
\newcommand{\End}{\operatorname{End}}
\newcommand{\Aut}{\operatorname{Aut}}
\newcommand{\Inn}{\operatorname{Inn}}
\newcommand{\Out}{\operatorname{Out}}
\newcommand{\GL}{\operatorname{GL}}
\newcommand{\SL}{\operatorname{SL}}
\newcommand{\SO}{\operatorname{SO}}
\newcommand{\Sym}{\operatorname{Sym}}
\newcommand{\Adj}{\operatorname{Adj}}
\newcommand{\di}{\mathop{\,\scalebox{0.85}{\raisebox{-1.2pt}[0.5\height]{\vdots}}\,}}
\newcommand{\ndi}{\mathop{\not\scalebox{0.85}{\raisebox{-1.2pt}[0.5\height]{\vdots}}\,}}
\newcommand{\nequiv}{\not \equiv}
\newcommand{\Nod}{\operatorname{\text{НОД}}}
\newcommand{\Nok}{\operatorname{\text{НОК}}}
\newcommand{\sgn}{\operatorname{sgn}}
\def\llq{\textquotedblleft}
\def\rrq{\textquotedblright}
\def\exm{\noindent {\bf Примеры:}}
\def\Cb{\ovl{C}}
\def\ffi{\varphi}
\def\pa{\partial}
\def\V{\bf V}
\def\La{\Lambda}
\def\eps{\varepsilon}
\def\del{\delta}
\def\Del{\Delta}
\def\A{\EuScript{A}}
\def\lan{\left\langle }
\def\ran{\right\rangle}
\def\bar{\begin{array}}
\def\ear{\end{array}}
\def\beq{\begin{equation}}
\def\eeq{\end{equation}}
\def\thrm{\begin{thm}}
\def\ethrm{\end{thm}}
\def\dfn{\begin{defn}}
\def\edfn{\end{defn}}
\def\lm{\begin{lem}}
\def\elm{\end{lem}}
\def\zd{\begin{zad}}
\def\ezd{\end{zad}}
\def\prdl{\begin{predl}}
\def\eprdl{\end{predl}}
\def\crl{\begin{cor}}
\def\ecrl{\end{cor}}
\def\rm{\begin{rem}}
\def\erm{\end{rem}}
\def\fct{\begin{fact}}
\def\efct{\end{fact}}
\def\enm{\begin{enumerate}}
\def\eenm{\end{enumerate}}
\def\pmat{\begin{pmatrix}}
\def\epmat{\end{pmatrix}}
\frenchspacing
\righthyphenmin=2
%\usepackage{floatflt}
\captiondelim{. }
\begin{document}
\title{Актуальный конспект по алгебре, 2 семестр, весна 2018}
\date{}
\author{}
\maketitle
\tableofcontents
\setcounter{chapter}{1}
\chapter{Теория колец: кое-что о многочленах и рядах}
\section{Комплексные числа}
\rm Гомоморфизм из поля всегда инъективен. Следовательно, если есть гомоморфизм из поля $K\to L$, то не умаляя общности (и если этот гомоморфизм нельзя перепутать с каким-нибудь другим гомоморфизмом $K\to L$), то можно считать, что $K\subseteq L$.
\erm
\dfn Если $K\subseteq L$, то будем говорить, что $L$ есть расширение поля $K$, а $K$ -- подполе поля $L$.
\edfn
Покажем, что расширений полей достаточно много.
\thrm[У любого многочлена в каком-то расширении есть все корни] Пусть $f(x)\in K[x]$. Тогда существует расширение $L$ поля $K$, такое, что в $L$ многочлен $f$ раскладывается на линейные множители.
\ethrm
\proof Индукция по степени $f(x)$. Разложим $f(x)$ на неприводимые множители. Рассмотрим один из этих множителей $p(x)$. Тогда в поле $L=K[x]/p(x)$ у $p(x)$ и, следовательно, у $f(x)$ есть корень $\lambda$. Поделим $g(x)=\frac{f(x)}{x-\lambda}$ в $L[x]$. Получился многочлен меньшей степени, но в $L[x]$. Это нам подходит. Существует $L'$ раcширение $L$, где $g(x)$ и, следовательно у $f(x)=g(x)(x-\lambda)$ раскладывается на линейные множители.
\endproof
Наше следующее рассмотрение будет примером того, как указанная выше конструкция работает и даёт нетривиальные примеры расширений полей.
\dfn[Комплексные числа] Поле $\mb R[x]/(x^2 + 1)$ называется полем комплексных чисел. Будем обозначать это расширение полей как $\mb C$.
\edfn
Разберёмся, как устроено умножение в $\mb C$. Прежде всего вспомним, что любой элемент представляется однозначно как класс многочлена вида $a+bx$. Складываются такие представители, как мы помним, покомпонентно. Посмотрим, что происходит при произведении. Рассмотрим два элемента $a+bx$ и $c+dx$. Тогда
$$(a+bx)(c+dx)=ac+(ad+bc)x+bdx^2\equiv ac-bd + (ad+bc)x \mod x^2+1.$$
Так как наша конструкция очень специальная то введём обозначение $i$ для класса элемента $x$. Элемент $i$ по самому определению $\mb C$ удовлетворяет соотношению $i^2=-1$. Благодаря нашему соглашению любой элемент $z$ в $\mb C$ однозначно записывается в виде суммы $z=a+bi$, где $a,b\in \mb R$. Такая форма записи для комплексного числа будет для нас стандартной. В такой форме видно, что любому комплексному числу соответствует точка на плоскости с координатами $(a,b)$. Число $a$ называется вещественной частью числа $z$ и обозначается $a=\re z$, число $b$ --- мнимой частью и обозначается $\im z$. Если говорить на языке пар, то произведению пар $(a,b)$ и $(c,d)$ соответствует пара $(ac-bd,ad+bc)$.
\dfn[Комплексное сопряжение] У поля $\mb C$ есть автоморфизм, который задан правилом $z=a+bi \to a-bi=\ovl{z}$. Такой автоморфизм называется комплексным сопряжением.
\edfn
\rm Это действительно автоморфизм. Более того это единственный нетривиальный автоморфизм, который оставляет на месте подполе $\mb R$.
\proof По определению поле $\mb C = \mb R[x]/x^2+1$. Тогда любой гомоморфизм $\mb C \to \mb C$ задается гомоморфизмом $\mb R[x]\to \mb C$. Поэтому нам стоит посмотреть на все гомоморфизмы из $\mb R[x]\to \mb C$ и понять, какие из них пропускаются через фактор по $x^2+1$. Нас интересуют только гомоморфизмы сохраняющие вещественные числа на месте. Они задаются образом элемента $x$. Для того, чтобы гомоморфизм переводящий $x \to \lambda$ пропускался через фактор необходимо, чтобы $\lambda^2+1=0$. Но $\mb C$ -- поле и у квадратного уравнения два корня -- $\pm i$. Если мы $x$ отображаем в $i=\ovl{x}$, то получаем тождественное. Иначе $x\to -i$ и тогда элемент $a+bi$ переходит в $a-bi$.
\endproof
\erm
\dfn[Модуль комплексного числа] Рассмотрим комплексное число $z=a+bi\in \mb C$. Тогда модулем комплексного числа $z$ назовём выражение
$$|z|=\sqrt{a^2+b^2}=\sqrt{z\ovl{z}}.$$
\edfn
\lm[Формула для обратного] Пусть $z\in \mb C$, $z\neq 0$. Тогда
$$ z^{-1} =\frac{\ovl{z}}{|z|^2}= \frac{a}{a^2+b^2}-i\frac{b}{a^2+b^2}.$$
\elm
Однако наряду со стандартной формой записи есть и другой способ представления комплексного числа.
\dfn[Тригонометрическая форма записи] Рассмотрим ненулевое комплексное число $z= a+bi\in\mb C$. Поделим число $z$ на его модуль. Число
$\frac{z}{|z|}$ лежит на окружности $|z| = 1$. Точки такой окружности имеют вид $\cos\varphi +i\sin\varphi$ для единственного $0 \leq \varphi < 2\pi$. Обозначим выражение $\cos\varphi+i\sin\varphi$ за $e^{i\varphi}$. Тогда $z=|z|e^{i\varphi}$.
Такая запись называется тригонометрической записью комплексного числа. Угол $\varphi$ обозначают $\arg z$ и называют
аргументом комплексного числа.
\edfn
Почему $e^{i\varphi}$ естественно определить как $\cos\varphi+i\sin \varphi$ ? Основная мотивация для этого есть тождество для рядов (пока мы не говорим про сходимость, то для формальных степенных рядов).
$$\exp(ix) = \sum_{n=0}^{\infty} \frac{(ix)^n}{n!}=\sum_{n=0}^{\infty} \frac{(-1)^n x^{2n}}{2n!} + i\sum_{n=0}^{\infty} \frac{(-1)^n x^{2n+1}}{(2n+1)!}= \cos(x) + i\sin(x).$$
Возможность подставлять в ряды различные значения вместо формальной переменной вы будете долго обсуждать в рамках курса математического анализа. В частности во все указанные ряды можно будет подставить любое комплексное число. Так же, если для рядов было выполнено некоторое тождество, то оно будет верно и для функций, которые они задают.
Нас на текущий момент гораздо больше интересует то обстоятельство, что экспонента сумму переводит в произведение. Так как никаких особенных средств матанализа у нас в распоряжении нет, то постараемся показать это свойство в нашем конкретном случае руками, а заодно посмотреть геометрически, что же происходит.
Вопрос: что происходит при домножении на комплексное число $\cos \varphi + i \sin \varphi$? Для понимания ответа необходимо небольшое знание геометрии.
\dfn[Расстояние] Расстоянием между комплексными числами $z_1$ и $z_2$ положим равным $|z_1-z_2 |$.
\edfn
\rm Это просто обычное расстояние на плоскости.
\erm
Отображение плоскости, сохраняющее расстояние называется движением или изометрией плоскости. Множество всех изометрий плоскости образует группу относительно композиции. Верен следующий:
\begin{fact} Поворот вокруг точки на некоторый угол есть изометрия плоскости. Изометрия плоскости, имеющая ровно
одну неподвижную точку является поворотом вокруг этой точки.
\end{fact}
\thrm[Геометрическая интерпретация] Пусть $z\in \mb C$ число по модулю равное единице. Тогда $\mb C \to \mb C$ отображение заданное правилом $ x\to zx$ является поворотом вокруг точки 0 на угол $\arg z$.
\ethrm
\proof Пусть $z\neq 1$ (случай $z=1$ соответствует тождественному отображению). Проверим, что домножение на $z$ имеет ровно одну неподвижную точку 0. Действительно, пусть $z_1z=z_1$. Тогда, если $z_1\neq 0$, то получаем $z=1$. Очевидно, домножение на $z$ сохраняет расстояние $$|zz_1-zz_2|=|z(z_1-z_2)|=|z||(z_1-z_2)|=|(z_1-z_2)|.$$
Получается, что домножение на $|z|$ есть поворот. Как узнать угол? Для этого достаточно посмотреть, куда переходит какая-нибудь точка. Например 1. Единица переходит в $z$, то есть точку под углом $\arg z$ к исходной.
\endproof
\crl Пусть $z_1, z_2\in \mb C$ и $z_1,z_2\neq 0$. Тогда $\arg z_1z_2 = \arg z_1 + \arg z_2$ , $|z_1z_2| = |z_1 ||z_2 |$.
\ecrl
\crl[Формула Муавра] Пусть $z\in \mb C$ имеет тригонометрическую запись $z=re^{i\varphi}$. Тогда
$$z^{n}=r^{n}(\cos \varphi +i\sin \varphi )^{n}=r^{n}(\cos n\varphi +i\sin n\varphi ).$$
Эту формулу можно воспринимать, как выражение для косинусов и синусов кратного угла.
\ecrl
То, что тригонометрическая запись числа существует и ведёт себя предсказуемым образом при произведении, позволяет позволяет нам более или менее явно построить решения для уравнений некоторого специального вида.
\thrm[Извлечение корней] Пусть $z\in \mb C$, $z=re^{i\varphi}$, $r>0$ . Тогда у уравнения $x^n=z$ есть ровно $n$ различных
решений в $\mb C$, которые задаются формулой
$$ x_k =\sqrt[n]{r} e^{i\frac{\varphi + 2\pi k}{n}} ,\,\, k\in \ovl{0,n-1}.$$
\ethrm
\proof
Прямой проверкой можно установить, что указанные $x_k$ являются корнями. Необходимо доказать, что они различные. Рассмотрим частное $x_k$ и $x_l$. Это $e^{i\frac{ 2\pi k- 2\pi l}{n}}$. Так как $\frac{k-l}{n}$ не есть целое число, то их отношение не равно единице.
\endproof
\rm Числа вида $e^{i\frac{2\pi k}{n}}$ являются корнями степени $n$ из единицы.
\erm
\dfn Пусть $K$ -- поле. Тогда $\xi\in K$ -- корень степени $n$ из единицы называется первообразным корнем степени $n$ если его порядок в $\mb K^*$ ровно $n$
\edfn
\rm Элементы $e^{i\frac{2\pi k}{n}}$, где $(k,n)=1$ являются первообразными корнями из единицы в $\mb C$.
\erm
Иногда в жизни бывает необходимо посчитать какую-то странную сумму. Часто это невозможно сделать, но иногда компактный ответ можно найти. Приведём пример, как комплексные числа могут помочь в подсчёте сумм.
Рассмотрим сумму $1+ \cos x + \cos 2x + \dots + \cos nx$, где $x > 1$. Вопрос состоит в том, чему она равна в зависимости от $n$. Основной трюк здесь --- заменить непонятные вещественные числа, на их улучшенную комплексную версию. Например, $$\cos x = \frac{e^{ix}+e^{-ix}}{2}, \sin x = \frac{e^{ix}-e^{-ix}}{2i}.$$
В данном случае, проще заметить, что $\cos x=\re e^{ix}$. Тогда
$$1 + \cos x+ \dots + \cos nx = \re(1+ e^{ix} + \dots + e^{inx}) = \re \frac{e^{i(n+1)x}-1}{e^{ix}-1}$$
Теперь необходимо привести выражение к виду, не содержащему комплексных чисел.
$$\re \frac{e^{i(n+1)x}-1}{e^{ix}-1} = \re e^{i\tfrac{n+1}{2}x}\cdot e^{-i\tfrac{x}{2}}\frac{\sin \tfrac{n+1}{2}x}{\sin\tfrac{x}{2}}= \frac{\cos \tfrac{nx}{2} \sin \tfrac{n+1}{2}x}{\sin\tfrac{x}{2}}$$
При решении задачи очень часто бывает, что сам факт существования того, о чём идёт речь вообще говоря является не очевидным. Например, далеко не каждая функция имеет на отрезке минимум и следовательно задача поиска минимального значения функции может быть просто не корректна. Поэтому важно заранее знать, что предмет исследования есть. Мы уже поняли, чтобы у каждого многочлена в каком-то поле есть корень. Можно немного поднапрячься и понять, что в некотором поле у многочлена есть все корни (то есть число корней с учётом кратности равно степени многочлена). Однако можно спросить, а бывает ли так, что есть поле, такое что каждый многочлен с коэффициентами из этого поля имеет корень?
Ответ — да, такое поле есть. Первый и основной такой пример --- это поле комплексных чисел.
\dfn[Алгебраическая замкнутость] Поле $K$ называется алгебраически замкнутым, если у любого многочлена $f(x)\in K[x]$, отличного от константы, есть корень в $K$.
\edfn
\thrm[Основная теорема алгебры] Поле $\mb C$ алгебраически замкнуто.
\ethrm
\lm Пусть $f(x)\in \mb R[x]$ имеет комплексный корень $\lambda \notin \mb R$, тогда $f(x)\di(x-\lambda)(x-\ovl{\lambda})$.
\proof Если $\lambda \notin \mb R$, то $\ovl{\lambda}$ тоже корень $p$. Тогда $p(x)\di(x-\lambda)(x-\ovl{\lambda})$ в $\mb C[x]$. Осталось заметить, что последний многочлен вещественный. Заметим, что так как вычисление остатка от деления $p$ на $(x-\lambda)(x-\ovl{\lambda})$ не зависит от того, над $\mb R$ или над $\mb C$ его считать, то имеет место делимость над $\mb R$.
\endproof
\elm
\crl Любой неприводимый многочлен над $\mb R$ либо линеен, либо является многочленом второй степени с отрицательным дискриминантом.
\proof Рассмотрим неприводимый над $\mb R$ многочлен $p(x)$. У него есть комплексный корень $\lambda$. Если $\lambda \in \mb R$, то $p(x)\di (x-\lambda)$ и по неприводимости $p=x-\lambda$. Если $\lambda \notin \mb C$, то $p(x)\di (x-\lambda)(x-\ovl{\lambda})$ в $\mb R[x]$. Этот многочлен не имеет вещественных корней и, следовательно, имеет отрицательный дискриминант. Обратно, любой линейный многочлен и квадратичный многочлен с отрицательным дискриминантом неприводимы над $\mb R$.
\endproof
\ecrl
\dfn[Алгебраическое замыкание] Пусть $K$ --- поле. Тогда $L$ --- расширение $K$ называется алгебраическим замыканием $K$, если \\
1) $L$ алгебраически замкнуто.\\
2) Для любого $ \lambda \in L$ существует $0\neq p(x)\in K[x]$, что $p(\lambda)=0$.
\edfn
\thrm У любого поля есть алгебраическое замыкание и оно единственно с точностью до изоморфизма.
\ethrm
\proof[Мы не будем доказывать теорему] Отмечу только, что процесс построения алгебраического замыкания более-менее нагляден. А именно надо взять все неприводимые многочлены в $K[x]$, и шаг за шагом увеличивать расширение, добавляя всё новые корни. Завершив этот процесс можно обнаружить, что добавились новые многочлены, которых раньше не было. Значит надо повторить процедуру ещё раз. И ещё раз ... В общем счётное число раз.
Формализовать такое рассуждение можно с помощью аксиомы выбора.
\endproof
\zd Классифицируйте, чему может быть изоморфно $\mb R[x]/(x^2 + bx +c)$ в зависимости от $b,c$.
\ezd
\section{Дополнение: доказательство основной теоремы алгебры}
\begin{thmm}[Основная теорема алгебры] Поле $\mb C$ алгебраически замкнуто.
\proof Пусть $f$ — многочлен степени $n\geq 1$ в $\mb C[x]$. Будем считать, что старший коэффициент $f$ равен единице. Пусть у этого многочлена нет корней. Рассмотрим функцию $|f|\colon \mb C \to \mb R$. Эта функция непрерывна и не принимает значения 0. Так как $f$ --- многочлен степени $n$, то на бесконечности $|f|$ растёт. Разберёмся точнее. Пусть
$c = |f(z_0)| > 0$ в некоторой точке $z_0$. Я утверждаю, что вне некоторого круга радиуса $R$ с центом в 0 функция
$|f|$ принимает значения строго больше чем $c$. Действительно возьмём $R= M \max(2,c)$, где $M$ --- сумма модулей всех коэффициентов многочлена $f$. Двойка здесь играет роль числа строго большего единицы.
Тогда для поиска инфимума $|f|$ достаточно ограничиться кругом радиуса $R$. Но круг радиуса $R$ --- компактное множество и непрерывная функция $|f|$ достигает на нём минимальное значение в точке $x_0$. Пусть $a_0 =f(x_0)$ Разложим
$f$ по степеням $(x-x_0)$. Тогда имеем
$$f(x) = a_0 + a_k (x-x_0)^k + \dots + a_n(x -x_0 )^n.$$
Здесь $a_k$ --- первый ненулевой коэффициент после $a_0$. Такой есть потому что иначе $f$ --- это константа. Теперь наша
задача понять, что мы можем немного сдвинуться от точки $x_0$ , так, чтобы значение $|f|$ уменьшилось. В районе точки
$x_0$ самое большое слагаемое в разложении $f$ это $a_0 + a_k (x-x_0)^k$ и оно практически полностью определяет поведение $f$.
У этого многочлена есть корень. Обозначим его за $y_0$. Будем двигаться из $x_0$ в направлении $y_0$ и смотреть, что происходит.
Рассмотрим $x_{\eps} = x_0 + \eps(y_0 -x_0 ), \,\eps < 1$. Тогда $x_{\eps} -x_0 = \eps(y_0 -x_0 )$. Тогда
$$|f(x_{\eps})| = |(1 - \eps^k)a_0 + \eps^{k+1} a_{k+1} (y_0 -x_0)^{k+1} + \dots+ \eps^n(y_0-x_0 )^n | \leq (1- \eps^k )|f(x_0)| + \eps^{k+1}N,$$
где $N$ — это некоторая константа не зависящая от $\eps$. Например, можно взять $N = \sum_{i=k+1}^n |a_i||y_0 -x_0 |^i$. Для достаточно
маленьких $\eps$ выражение $ -\eps^k |f(x_0)| + \eps^{k+1}N$ отрицательно. Тогда для всех достаточно маленьких $\eps>0$ выполнено неравенство $|f(x_{\eps})| < |f(x_0)|$.
Противоречие с минимальностью $|f(x_0)|$. \endproof
\end{thmm}
\section{Производная}
Со школы вам наверняка известно, что кратность корня многочлена ловится с помощью производной. Попробуем в абстрактном
контексте ввести понятие производной многочлена. Для удобства и по причине наличия общих свойств проделаем все выкладки для степенных рядов затем сосредоточившись на применениях к многочленам.
Прежде чем говорить про производную в нашем контексте, вспомним, что многие вычисления производной основаны на умении вычислять производную композиции. Если для многочленов мы знаем, что такое композиция, то для формальных степенных рядов мы этого ещё не определяли.
\dfn Пусть $f(x)=a_0+ a_1x\dots\in K[[x]]$ и $g(x)= b_1x+b_2x^2+\dots \in xK[[x]]$. Тогда определим
$$f(g)_n= \sum_{k=0}^n a_k\sum_{j_1+\dots+j_k=n} b_{j_1}\dots b_{j_k}.$$
\edfn
Эта формула получилась, если формально подставить $g$ в $f$. От неё мало проку, кроме факта её существования и того, что если $f(x)$ многочлен, то она совпадает с формулой подстановки, которая, конечно определена. Воспользуемся этим и докажем
\lm Пусть $g\in xK[[x]]$. Тогда отображение $f \to f(g(x))$ является гомоморфизмом колец $K[[x]]\to K[[x]]$.
\elm
\proof Пусть $f_1, f_2 \in K[[x]]$. Хотим показать, что $(f_1f_2)(g)=f_1(g)f_2(g)$. Для этого необходимо проверить равенство коэффициентов в правой и левой части. Проверим для $n$-ого. Пусть $f(x)= a_0+a_1x+\dots+a_nx^n+a_{n+1}x^{n+1}+\dots$. Тогда обозначим многочлен
$$f_{\leq n}(x)=a_0+\dots+a_nx^n.$$
Тогда заметим, что $n$-ый коэффициент $f_1f_2$ равен $n$-ому коэффициенту $f_{1,\leq n}f_{2,\leq n}$. Так же заметим, что $n$-ый коэффициент в $f(g)$ равен $n$-ому в $f_{\leq n}(g)$. Это означает, что теперь необходимо проверить равенство $n$-ых коэффициентов у $(f_{1,\leq n}f_{2,\leq n})(g)$ и $f_{1,\leq n}(g)f_{2,\leq n}(g)$, но эти два ряда просто равны, потому что подстановка в многочлен --- гомоморфизм. \endproof
\dfn[Формальная производная] Пусть $R$ --- кольцо. Рассмотрим кольцо формальных степенных рядов $R[[x]]$. Формальной производной назовём отображение
$\frac{d}{dx}\colon R[[x]]\to R[[x]]$, заданное по правилу
$$\frac{d}{dx}(a_0+a_1x+a_2x^2+\dots+a_nx^n+\dots) = a_1+2a_2x+3a_3x^2+\dots+na_nx^{n-1}+\dots.$$
Применение производной к ряду $f$ будем так же обозначать как $f'$.
\edfn
Производная обладает обычными свойствами
\lm[Тождество Лейбница и прочее] Пусть $R$ --- кольцо. Тогда отображение взятия производной обладает свойствами:\\
1) Для любых $f,g\in R[[x]]$ выполнено $(f+g)' = f'+g'$.\\
2) Для любых $f\in R[[x]]$ и $a\in R$ справедливо $(af)' = af'$.\\
3) Для любого $a\in R$ верно $a'= 0$.\\
4) Для любых $f,g\in R[[x]]$ имеет место $(fg)' = f'g+fg'$.\\
5) Для любых $f\in R[[x]]$ и $n\in \mb N$ верно $ (f^n)' = nf'f^{n-1}$.\\
6) Для любых $f\in R[[x]]$, $g\in xR[[x]]$ верно $f(g(x))' = g'(x)f'(g(x))$.\\
7) Для любого $f\in R[[x]]^*$ верно $(f^{-1})'=-\frac{f'}{f^2}$.
\elm
\proof Свойства 1),2),3) очевидны. Теперь будем доказывать оставшиеся свойства следующим образом: докажем их для многочленов, а потом покажем, что так как равенство для рядов достаточно проверять покоэффициентно, то ряд можно заменить на свой начальный кусок, который является многочленом.\\
Итак докажем 4). Пусть $f$ и $g$ --- многочлены. Заметим, что правая и левая часть линейны по $f$ и $g$. Таким образом достаточно доказать только для степеней. Распишем $(x^{n+m})'=(n+m)x^{n+m-1}=nx^{n-1}x^{m}+mx^{m-1}x^n=(x^n)'x^m+(x^{m})'x^n$.
Теперь заметим, что если $f$ и $g$ ряды, то коэффициенты при $x^n$ справа и слева не зависят от коэффициентов при степенях больше $n+1$ в $f$ и $g$. \\
5) Докажем индукцией по $n$. $(f^n)'=(f\cdot f^{n-1})'=f'f^{n-1}+f(n-1)f'f^{n-2}=nf'f^{n-1}$.\\
6) Прежде всего коэффициент $n$-ой степени справа и слева не меняется если $f$ заменить на $f_{\leq n+1}$. Заменим. Теперь заметим, что обе части линейны по $f$ и поэтому можно проверять только для $f=x^n$. Это пункт 5).\\
7) Рассмотрим тождество $ff^{-1}=1$ и продифференцируем его. Перенеся одно слагаемое направо получим $(f^{-1})'f=-f'f^{-1}$. Осталось поделить на $f$.
\endproof
Итак, оставим в памяти, что производная определена для любых рядов и перекинемся на многочлены. Кажется сейчас у нас появится первое утверждение, которое зависит от характеристики кольца.
\thrm Если многочлен $f(x) \in K[x]$ делится на $p(x)^l$ то $f'(x) \di p(x)^{l-1}$. Более того, если $p(x)$ неприводим, $\chr K > \deg f$ или $\chr K=0$,а $l$ -- наибольшая степень, что $f(x) \di p(x)$, то $f'(x)\ndi p(x)^{l}$.
\proof Пусть $f(x)=p(x)^lg(x)$. Тогда $$f'(x)=lp(x)^{l-1}p'(x)g(x)+p(x)^lg'(x)=p(x)^{l-1}(lp'(x)g(x)+p(x)g'(x)) \di p(x)^{l-1}.$$
Пусть теперь $g(x)$ и $p(x)$ взаимно просты, $p(x)$ неприводим, а $\chr K > \deg f$ или $\chr K=0$. Наша задача доказать, что последний сомножитель взаимнопрост с $p(x)$ в указанных условиях. Вопрос сводится к взаимной простоте $lp'(x)$ и $p(x)$. Заметим, что если $lp'(x)$ не 0, то он действительно взаимнопрост с $p(x)$ так как $p(x)$ неприводим. Понятно, что в условиях теоремы $l\neq 0$. Следовательно надо рассмотреть ситуацию, когда $p'(x)=0$.
\lm Пусть $\chr K=p$, $f(x)\in K[x]$. Тогда $f'(x)=0$ в том и только том случае, когда $f(x)=h(x^p)$.
\elm
\proof
Заметим, что коэффициенты $f'(x)$ имеют вид $c_{i-1}=ia_{i}$. Следовательно, $a_{i}$ может не равняться нулю только тогда, когда $i\di p$. Тогда возьмём $h(x)=\sum_{i=0}^{\deg f/p} a_{ip}x^i$.
\endproof
Таким образом, если предположить, что $p'(x)=0$, то степень $p(x)=h(x^q)$, где $q=\chr K$, должна быть заведомо больше характеристики, что мы исключили по условию. Видно, что в формулировке теоремы можно ещё много уточнить. Сделайте это сами.
\endproof
\ethrm
\noindent {\bf Пример:} Вот пример многочлена, у которого проблемы с кратностью корня у производной: $x^{p}$ в $\mb Z/p$.
Обсудим ещё одно важное свойство производной. Для этого нам потребуется доказать некоторую лемму.
\lm[О разложении по основанию] Пусть $p$ -- многочлен из $K[x]$, $\alpha\in \mb N$, а $h$ многочлен c $\deg h< \alpha \deg p$. Тогда существуют единственный $h_0, \dots, h_{\alpha-1} \in K[x]$, что $\deg h_i< \deg p $ и
$$h=\sum_{i=0}^{\alpha-1} h_i p^i.$$
\elm
\proof Индукция по $\alpha$. $\alpha=1$ --- тогда $h=h_0$. Теперь $\alpha>1$. Пусть $h=qp+h_0$. $q$ раскладывается как $\sum_{i=1}^{\alpha-2} q_i p^i$. Ясно, что получили разложение. С другой стороны, очевидно, что в любом разложении $h_0$ это остаток от деления, а $\sum_{i=1}^{\alpha-1} h_ip^{i-1}$ --- это неполное частное. По индукции мы знаем, что разложение неполного частного по основанию единственно.
\endproof
Рассмотрим простейший неприводимый многочлен $x-a \in K(x)$. Тогда многочлены в формуле из предыдущей теоремы есть просто элементы поля $K$. Вопрос состоит в том, как найти эти коэффициенты в разложении по степеням $x-a$?
\thrm[Формула Тейлора для многочленов]
Пусть $h$ элемент $K(x)$, $\chr K =0$, и $\deg h=n$. Тогда имеет место формула
$$h(x)= h(a)+h'(a)(x-a)+\frac{h''(a)}{2}(x-a)^2+
\dots + \frac{h^{(n)}(a)}{n!}(x-a)^n.$$
\proof По предыдущей теореме у нас есть разложение
$$h(x)=a_0+a_1(x-a)+\dots+a_n(x-a)^n.$$
Возьмём $k$-ую производную от обеих частей равенства. Получим
$$ h^{(k)}(x)=k!a_k+(k+1)!a_{k+1}(x-a)+\dots+\frac{n!}{k!}a_n(x-a)^{n-k}.$$
Осталось подставить $x=a$.
\endproof
\ethrm
\section{Интерполяция}
Довольно часто требуется решить следующую задачу: пусть $K$ --- некоторое поле. Пусть дан набор различных точек
$x_1,\dots, x_n \in K$ и дан набор значений $a_1,\dots,a_n\in K$. Требуется построить многочлен $f\in K[x]$, такой что $f(x_i)=a_i$.
Прежде всего заметим, что у нас есть некоторая свобода выбора. А именно, рассмотрим многочлен $\phi(x)=(x-x_1)\dots(x-x_n)$. Тогда можно к любому решению интерполяционной задачи прибавить кратное многочлена $\phi(x)$ и снова получить решение интерполяционной задачи. Таким образом можно любое решение заменить на остаток от деления на многочлен $\phi(x)$. В частности, если есть какое-то решение, то есть решение степени строго меньше $n$.
\dfn[Задача интерполяции] Пусть дан набор различных точек $x_1,\dots,x_n\in K$ и дан набор значений
$a_1,\dots, a_n\in K$. Требуется построить многочлен $f\in K[x]$, такой что $f(x_i)=a_i$ и $\deg f < n$.
\edfn
\thrm Задача интерполяции разрешима и притом единственным образом. Более того её решение может быть найдено по формуле
$$f(x)=\sum_{i=1}^n a_i\frac{\prod_{j\neq i}(x-x_j)}{\prod_{j\neq i } (x_i-x_j)}=\sum_{i=1}^n \frac{a_i\phi(x)}{\phi'(x_i)(x-x_i)},$$
где $\phi(x)=(x-x_1)\dots(x-x_n)$.
\ethrm
\proof Заметим, что $\phi'(x_i)=\prod_{j\neq i}(x_i-x_j)$. Теперь очевидно, что указанная формула даёт решение нужной степени. Единственность очевидна из теоремы о многочленах, совпадающих в достаточном числе точек.
\endproof
Последняя формула называется интерполяционной формулой Лагранжа. Так же есть способ Ньютона для решения интерполяционной задачи.
Он позволяет добавлять точки постепенно.
Рассмотрим более общий вариант интерполяционной задачи. А именно попробуем решить задачу следующего вида.
Пусть задан набор точек $x_1,\dots, x_n$ и для каждой точки $x_i$ задан набор чисел $a_{i,0}, a_{i,1},\dots , a_{i,k_i}$ . Интерполяционная задача состоит в следующем: найти $f$ такой, что $j$-тая производная $f^{(j)}(x_i)=a_{i,j}$. Заметим, что решение можно свободно поменять на кратное многочлена
$$\phi(x)=\prod_{i=1}^n (x-x_i)^{k_i} ,$$
следовательно, степень решения $f$ можно ограничить $\deg f < \sum_{i=1}^n k_i$. Такая задача интерполяции называется задачей интерполяции по Эрмиту.
\thrm Пусть $K$ --- поле характеристики 0 (или достаточно большой положительной характеристики). Решение задачи интерполяции по Эрмиту существует и единственно среди многочленов степени меньше $\sum_{i=1}^n k_i$.
\ethrm
\proof Сведём задачу к китайской теореме об остатках. А именно пусть $f(x)$ многочлен. Тогда значения его производных в точке $x_i$ равны $a_{i,j}$ $j\in \ovl{0,k_i-1}$ тогда и только тогда, когда
$$f(x)\equiv a_{i,0}+a_{i,1}(x-x_i)+a_{i,2}\tfrac{(x-x_i)^2}{2!}+\dots+ a_{i,k_i}\tfrac{(x-x_i)^{k_i-1}}{(k_i-1)!}\,\, (\mod (x-x_i)^{k_i}).$$
Идеалы $(x-x_i)^{k_i}$ взаимно простые.
\endproof
\rm Вообще для задачи интерполяции по Эрмиту тоже есть формула, но она не сильно хороша (см. Кострикин, Сборник задач по алгебре, стр 93, задача 30.14 ).\erm
Давайте представим себе, что мы хотим перемножить два многочлена. Если действовать по определению, то понадобится $O(n^2)$ операций сложения и умножения. С другой стороны, мы знаем, что оба многочлена и их произведение однозначно определяются своими значениями в точках $x_1,\dots, x_n$ для достаточно большого $n$. Однако перемножить значения гораздо проще! Таким образом, если мы научимся быстро конвертировать многочлен в набор значений в $x_1,\dots, x_n$ и обратно (то есть решать интерполяционную задачу), то мы сможем быстро перемножать многочлены. При этом у нас есть свобода выбора $x_1,\dots, x_n$.
При произвольном выборе точек $x_i$ сложность задач интерполяции и подстановки $n$ точек есть $O(n^2)$. Однако, оказывается, что в определённых случаях можно подобрать такие $x_i$, что и задача интерполяции и задача о подстановке точек будет иметь сложность $O(n\log n)$.
\dfn Элемент $\omega \in R$ называется первообразным корнем степени $n$ из единицы, если $\omega$ -- корень степени $n$ из $1$-цы и $1-\omega^i$ не делитель нуля при $i\nequiv 0(\mod n)$.
\edfn
Рассмотрим упорядоченную $n$-ку $x=(a_0,\dots,a_{n-1})\in R^n$. Рассмотрим следующий набор $F(x)=(b_0,\dots,b_{n-1})\in R^n$
$$b_i=\sum_{j=0}^{n-1} a_j \omega^{ij}.$$
Отображение $x \to F(x)$ из $ R^n \to R^n$ называется дискретным преобразованием Фурье. Где находится связь между этим преобразованием и задачей интерполяции? Давайте посмотрим на строку $(a_0,\dots,a_{n-1})$ как на коэффициенты многочлена $f$ из $R[x]$. Тогда элемент $b_i=f(\omega^i)$.
Оказывается, что обратное отображение обычно есть и имеет очень простой вид:
\lm Пусть $n\in \mb N$ некоторое натуральное число, а $R$ --- кольцо, такое что $n\in R^*$. Тогда $F^{-1}(b)_i=\frac{1}{n}\sum_{j=0}^{n-1} b_j \omega^{-ij}$
\elm
\proof Достаточно доказать, что $F^{-1}(F(a))=a$. Подставим.
$$F^{-1}(F(a))_i=\frac{1}{n}\sum_{j=0}^{n-1} \sum_{k=0}^{n-1} a_k \omega^{jk} \omega^{-ij}=\sum_{k=0}^{n-1} a_k \cdot \frac{1}{n}\sum_{j=0}^{n-1} \omega^{j(k-i)}.$$
Заметим, что при $k=i$ коэффициент будет равен $\frac{1}{n}\sum_{j=0}^{n-1} \omega^{0}=1$. Вспомним, что по условию если $k-i\neq 0$, то $1-\omega^{k-i}$ не делитель нуля. Тогда заметим, что
$$\sum_{j=0}^{n-1}\omega^{j(k-i)}=\omega^{k-i}\sum_{j=0}^{n-1} \omega^{(j-1)(k-i)}=\omega^{k-i}\sum_{s=0}^{n-1} \omega^{s(k-i)}=\omega^{k-i}\sum_{j=0}^{n-1} \omega^{j(k-i)}.$$
Так как $1-\omega^{k-i}$ не делитель нуля,то $\sum_{j=0}^{n-1}\omega^{j(k-i)}=0$.
\endproof
Перейдём теперь к алгоритму быстрого вычисления значений в указанных корнях из 1-цы. Этот алгоритм называется быстрым преобразованием Фурье.
\thrm Пусть $n=2^k$ и $\omega \in R$ первообразный корень степени $n$ из 1-цы. Тогда дискретное преобразование Фурье можно провести за $O(n\log n)$ операций.
\ethrm
\proof Для начала сделаем замечание: в описанных выше условиях $\omega^{\frac{n}{2}}=-1$. Действительно $0=\omega^n-1=(\omega^{\frac{n}{2}}-1)(\omega^{\frac{n}{2}}+1)$. Осталось заметить, что по условию $(\omega^{\frac{n}{2}}-1)$ не делитель нуля.
Теперь приведём алгоритм дискретного преобразования Фурье. Вспомним, что если дан многочлен $f(x)$, то посчитать его значение в точке $a$ это тоже самое, что посчитать остаток от деления $f$ на $x-a$. Нам нужно посчитать остатки от деления на $x-\omega^i$ по всем $0\leq i\leq n-1$. Заметим, что так как $\omega^{\frac{n}{2}}=-1$, то
$$x^{2^k}-1=(x^{2^{k-1}}-1)(x^{2^{k-1}}+1)=(x^{2^{k-1}}-\omega^0)(x^{2^{k-1}}-\omega^{2^{k-1}}).$$
Более общо $x^{2^i}-\omega^{2j}=(x^{2^{i-1}}-\omega^j)(x^{2^{i-1}}-\omega^{j+\frac{n}{2}})$. В частности, применив указанное соображение $k$ раз получаем
$$\prod_{i=1}^n(x-\omega^i)=x^n-1.$$
Таким образом, видно, что можно последовательно делить с остатком многочлен $f$ на многочлены $x^{2^{k-i}}-\omega^{j2^{k-i}}$, $0\leq j < 2^i$. То есть на шаге $i$ необходимо будет поделить многочлены степени $2^{i+1}$ на $2^{i}$ многочленов специального вида. Чтобы понять, что это можно легко сделать докажем лемму.
\lm Пусть многочлен $f(x)=\sum_{i=0}^{n-1} a_ix^i$. Тогда остаток от деления многочлена $f(x)$ на $x^{\frac{n}{2}}-c$ находится по формуле
$$r(x)=\sum_{i=0}^{\frac{n}{2}-1}(a_i+ca_{i+\frac{n}{2}})x^{i}. $$
В частности для вычисления указанного остатка необходимо $\frac{n}{2}$ умножений и $\frac{n}{2}$ сложений
\elm
\proof Очевидно верна формула
$$f(x)=(x^{\frac{n}{2}}-c)\sum_{i=0}^{\frac{n}{2}} a_{\frac{n}{2}+i}x^i+r(x).$$
\endproof
Итого в нашем случае необходимо
$$n+2\frac{n}{2}+4\frac{n}{4}+\dots+2^k\frac{n}{2^k}=nk$$
умножений и сложений в кольце $R$.
\endproof
\section{Локализация, поле частных и разложение на простейшие дроби}
Наша задача под конец этого раздела понять, как свести некоторые вопросы про общие кольца к вопросам о полях. Однако по пути мы захватим конструкцию, в некотором смысле противоположенную факторизации, которая позволяет <<упростить>> кольцо.
Все мы довольно хорошо знакомы с рациональными числами. Целые числа вкладываются в рациональные. Поэтому
многие вопросы про целые числа можно свести к рациональным. Например, допустим мы знаем, что многочлен
степени $n$ над $\mb Q$ имеет не более чем $n$ корней. Тогда мы автоматически знаем это и для целочисленных многочленов.
Достаточно просто проинтерпретировать их как многочлены с рациональными коэффициентами, а потом сказать, что
если в $\mb Q$ мало корней, то в $\mb Z$ и подавно.
Рациональные числа отличаются от целых тем, что необратимые элементы $\mb Z$ уже обратимы в $\mb Q$. Попробуем понять, можно
ли насильно обратить некоторое множество элементов. Представим себе, что мы насильно обратили два элемента $f$ и
$g$. Тогда мы так же обратили их произведение $fg$. Для простоты рассмотрим ситуацию над областью целостности, хотя разумный ответ есть и в общем случае. Далее в этом разделе $R$ --- область целостности.
\dfn[Мультипликативная система] Пусть $R$ --- область целостности. Мультипликативной системой в $R$ называется
подмоноид $U$ в моноиде $(R\setminus\{0\},\cdot)$.
\edfn
\exm\\
1) Пусть $f\in R$. Тогда множество $\{1,f,f^2,f^3,\dots\}$ очевидно является мультипликативной системой.\\
2) Пусть $R$ --- область целостности. Тогда $R\setminus \{0\}$ является мультипликативной системой.\\
3) Более общо. Пусть дан простой идеал $p$. Тогда $U=R\setminus p$ есть мультипликативная система.\\
Дадим теперь следующее определение
\dfn[Локализация] Пусть $U$ --- мультипликативная система в $R$. Определим кольцо $R[U^{-1}]$ как
фактор множества дробей (формально --- пар)
$$ R[U^{-1}]=\{ \tfrac{a}{u}\,|\, a\in R, \, u\in U\}/\sim$$
профакторизованное по отношению эквивалентности $\sim$, заданного правилом
$$ \tfrac{a}{u}\sim \tfrac{b}{v}, \text{ если } av=bu.$$
Операции сложения и умножения введём подобно рациональным числам:
$$ \tfrac{a}{u}+\tfrac{b}{v}=\tfrac{av+bu}{uv} \text{ и } \tfrac{a}{u}\cdot\tfrac{b}{v}=\tfrac{ab}{uv}.$$
\edfn
\thrm[Конструкция работает] Пусть $U$ --- мультипликативная система в $R$. Тогда все операции на множестве $R[U^{-1}]$ корректно определены и вместе с ними $R[U^{-1}]$ становится кольцом.
\ethrm
\proof
Прежде всего необходимо проверить, что указанное отношение действительно есть отношение эквивалентности. Проверим транзитивность. Пусть $av=bu$ и $bw=cv$. Тогда $avbw=cvbu$. Сократим на $vb$.
Теперь перейдём к корректности операций. Рассмотрим сумму. Пусть $\tfrac{a}{u}\sim \tfrac{a'}{u'}$, а $\tfrac{b}{v}=\tfrac{b'}{v'}$. Тогда сумма
$$\tfrac{a'v'+b'u'}{u'v'}\sim \tfrac{uva'v'+uvb'u'}{uvu'v'}= \tfrac{au'vv'+bv'u'u}{uvu'v'}\sim \tfrac{av+bu}{uv}.$$
Произведение --- ещё проще.
Докажем ассоциативность сложения. Пусть даны дроби $\tfrac{a}{u}$, $\tfrac{b}{v}$, $\tfrac{c}{w}$. Приведём их к общему знаменателю. Тогда ассоциативность следует из ассоциативности для кольца $R$. Остальные свойства --- так же.
\endproof
\thrm[Область целостности вкладывается в свою локализацию] Пусть $U$ мультипликативная система в области целостности $R$. Отображение $i\colon R\to R[U^{-1}]$ заданное по правилу $a\to \tfrac{a}{1}$ является инъективным гомоморфизмом колец.
\ethrm
\proof Исходя из формул для локализации видно, что это гомоморфизм. Докажем инъективность. Пусть дробь $\tfrac{a}{1}\sim \tfrac{0}{r}$. Тогда $ra=0$. Так как $r\neq 0$, то $a=0$. чтд.
\endproof
%\rm Если $R$ область целостности $U\subseteq R\setminus \{0\}$, то в определении отношения эквивалентности условие $\exists s\in U sav=abu$ можно заменить просто на $av=bu$.
%\erm
%\lm[Область целостности вкладывается в свою локализацию] Пусть $R$ --- область целостности, $U$ ---
%мультипликативная система в $R$, которая не содержит $0$. Тогда $i\colon R \to R[U^{-1}]$ является мономорфизмом.
%\elm
%\lm[Описание идеалов] Пусть $U$ --- мультипликативная система в $R$. Тогда имеет место взаимно-однозначное
%соответствие
%$$\{I \leq R\, | \,\forall u\in U, \text{ $u$ не является делителем нуля в } R/I\} \cong \{I \leq R[U^{-1}]\}.$$
%\elm
\thrm[Универсальное свойство] Пусть $R,S$ кольца и $U$ --- мультипликативная система в $R$. Тогда для любого гомоморфизма $\psi \colon R\to S$, такого что $\forall u\in U \,\,\psi(u)$ обратим, существует единственный гомоморфизм $\phi\colon R[U^{-1} ] \to S$ такой, что треугольник коммутативен:
\begin{center}
\begin{tikzpicture}
\node (A) at (0, 0) {$R$};
\node (B) at (2.5, 0) {$S$};
\node (C) at (0, -1) {$R[U^{-1}]$};
\path[->,font=\scriptsize,>=angle 60]
(A) edge node[above]{$\psi$} (B)
(A) edge node[right]{$i$} (C);
\path[dashed,->,font=\scriptsize,>=angle 60]
(C) edge node[below]{$\exists !\, \phi$} (B);
\end{tikzpicture}
\end{center}
\ethrm
\proof
Как всегда начнём с единственности. Вместо дроби $\tfrac{a}{1}$ буду писать просто $a$. Рассмотрим дробь $\tfrac{a}{u}=au^{-1}$. Тогда $\phi(au^{-1})=\phi(a)\phi(u)^{-1}=\psi(a)\psi(u)^{-1}$. Значит вариантов нет.
Теперь надо показать, что отображение, заданное правилом
$$\phi(\tfrac{a}{u})=\psi(a)\psi(u)^{-1}$$
корректно задано и является гомоморфизмом. Проверка прямолинейна.
\endproof
\dfn[Поле частных] Пусть $R$ --- область целостности. Возьмём $U=R\setminus \{0\}$. Тогда кольцо $R[U^{-1}]$ является полем. Обозначим это поле $Q(R)$. Будем называть его полем частных $R$.
\edfn
Например $\mb Q$ --- поле частных $\mb Z$.
\lm Пусть $U$ --- мультипликативная система в области целостности $R$. Тогда $R[U^{-1}]$ вкладывается в $Q(R)$.
\elm
\proof
Из $R[U^{-1}]\to Q(R)$ есть единственный гомоморфизм по универсальному свойству. Пусть он переводит дробь $\frac{f}{g}$ в $0$. Тогда он переводит $f\in R$ в ноль. Тогда $f=0$ по теореме о вложении. Получили инъективность.
\endproof
\dfn[Локализация в простом идеале] Пусть $R$ --- область целостности, $p$ --- простой идеал. Определим кольцо $R_p= R[U^{-1}]$, где $U=R\setminus p$.
\edfn
Например, множество всех рациональных чисел, знаменатель которых не делится на $p$, обозначается $\mb Z_{(p)}$ --- является локализацией кольца $\mb Z$ в идеале $(p)$. Из кольца $\mb Z_{(p)}$ всегда есть отображение в $\mb Z/p$ по универсальному свойству. Как это может пригодиться?
Рассмотрим задачу: дана сумма $1+\frac{1}{2}+\dots+\frac{1}{p-1}$, где $p>2$ простое. Покажите, что числитель этой дроби делится на $p$. Заметим, что указанная сумма есть элемент $\mb Z_{(p)}$ . Отправим эту сумму в $\mb Z/p$. Тогда это будет сумма всех обратных элементов, то есть просто сумма всех элементов кроме 0. Она равна $\frac{p(p-1)}{2}$, то есть $0$ в $\mb Z/p$. Но тогда числитель исходной дроби переходит в ноль, то есть делится на $p$.
Конструкция поля частных бывает полезна в теоретических построениях. Например, когда мы применяем приём <<замены коэффициентов>>.
\thrm У многочлена $f$ в области целостности не более чем $\deg f$ различных корней с учётом кратности. \ethrm
\proof Пусть корни $f$ в $R$ это $x_0,\dots,x_k$ и их кратности это $\alpha_0,\dots,\alpha_k$. Вложим кольцо $R[x]$ в $Q(R)[x]$. Очевидно, что если $f\di (x-x_i)^{\alpha_i}$ над $R$, то $f\di (x-x_i)^{\alpha_i}$ над $Q(R)$. Но тогда $f\di \prod (x-x_i)^{\alpha_i}$ в $Q(R)[x]$. Тогда $ \sum \alpha_i \leq \deg f $, а степень очевидно не меняется.
\endproof
\dfn[Поле рациональных функций] Пусть $K$ --- поле. Тогда $Q(K[x])$ называется полем рациональных функций. Обозначается оно как $K(x)$.
\edfn
\dfn Пусть $R$ область целостности и $0\neq f\in R$. Пусть $U=\{1,f,f^2,\dots\}$. Тогда $R[U^{-1}]$ обозначается $R[f^{-1}]$ и
называется локализацией $R$ по элементу $f$.
\edfn
\dfn[Многочлены Лорана] Пусть $K$ --- поле. Тогда $K[x][x^{-1}]$ называется кольцом многочленов Лорана. Обозначается как $K[x,x^{-1}]$.
\edfn
\dfn[Ряды Лорана] Пусть $K$ --- поле. Тогда $Q(K[[x]])=K[[x]][x^{-1}]$ называется полем рядов Лорана. Обозначается как $K((x))$.
\edfn
\rm Поле $K(x)$ естественным образом вкладывается в $K((x))$ по универсальному свойству.
\erm
Поговорим о специальных свойствах поля $K(x)$. Это поле в целом напоминает поле рациональных чисел, так как является полем частных евклидового кольца.
\lm Пусть $\frac{f}{g} \in K[x]$. Тогда существуют единственные с точностью до константы многочлены $h,r$, что $\Nod(h,r)=1$ и $\frac{f}{g}=\frac{h}{r}$. Такие дроби называются несократимыми.
\elm
\proof Возьмём какие-то $f,g$ и рассмотрим $d=\Nod(f,g)$. Тогда $h=\frac{f}{d}$, а $r=\frac{g}{d}$ подходят. Пусть есть две пары $h,r$ и $h',r'$ подходящие по условию. Тогда $hr'=h'r$. Так как $h$ и $r$ взаимно просты выполнено $h\di h'$. Симметрично $h'\di h$. Тогда $h=ch'$, где $c\in K$. Тогда $r=cr'$.
\endproof
\dfn Дробь $\frac{f}{g} \in K(x)$ называется правильной, если $\deg f< \deg g$.
\edfn
\lm Любая дробь $\frac{h}{g}\neq 0$ единственным образом представляется в виде суммы многочлена $f(x)\in K[x]$ и правильной дроби $\frac{h_1}{g_1}$, где $\frac{h_1}{g_1}$ несократимая дробь и старший коэффициент $g_1$ равен 1. При этом, если $\frac{h}{g}$ несократима, то можно считать, что $g_1=cg$ для некоторого $c\in K$
\proof Покажем существование. Сделаем дробь $\frac{h}{g}$ несократимой и старший коэффициент $g$ равным 1 поделив верх и низ на старший коэффициент. Поделим с остатком $h(x)=q(x)g(x)+h_1(x)$, где $\deg h_1(x)<\deg g(x)$. Тогда
$$\frac{h(x)}{g(x)} =\frac{q(x)g(x)+h_1(x)}{g(x)} =q(x)+\frac{h_1(x)}{g(x)}.$$
Покажем единственность. Пусть
$$f_1(x)+\frac{h_1}{g_1}=f_2(x)+\frac{h_2}{g_2}.$$
Имеем равенство многочленов.
$$(f_1(x)-f_2(x))g_1(x)g_2(x)=g_1(x)h_2(x)-h_1(x)g_2(x).$$
Если $f_1\neq f_2$, то степень многочленов справа строго меньше степени многочлена слева. Таким образом $f_1=f_2$, а $\frac{h_1}{g_1}=\frac{h_2}{g_2}$. По единственности несократимой записи $h_1=h_2$ и $g_1=g_2$.
\endproof
\elm
\rm Сумма двух правильных дробей -- снова правильная дробь.
\erm
\dfn[Простейшие дроби] Пусть $K$ --- поле, $p\in K[x]$ --- неприводимый многочлен со страшим коэффициентом единица. Тогда дробь
$$\frac{f(x)}{p(x)^{k}} \text{ называется простейшей, если $f \neq 0$ и $\deg f < \deg p$}. $$
\edfn
\thrm[О разложении на простейшие] Пусть $K$ --- поле. Тогда для любой несократимой дроби $0
\neq \frac{f}{g} \in K(x)$ существуют единственные многочлен $h\in K[x]$, неприводимые многочлены $p_1, \dots, p_n$ со старшим коэффициентом 1, натуральные числа $\alpha_1,\dots, \alpha_n$ и многочлены $h_{ij}$, где $i\in \ovl{1,n}$, и $j\in \ovl{0,\alpha_i}$, что дроби
$$ \frac{r_{ij}}{p_i^{j}} \text{ --- простейшие и } \frac{f}{g}=h+\sum_{i,j} \frac{r_{ij}}{p_i^{j}}.$$
При этом, если $r_{i\alpha_i}$ не ноль и старший коэффициент $g$ равен 1, то $g=\prod p_i^{\alpha_i}$.
\ethrm
\proof Докажем существование разложения. Если $g(x)=p(x)^{\alpha}$, то разложение можно получить следующим способом -- надо представить дробь $\frac{f(x)}{g(x)}= h(x)+\frac{r(x)}{g(x)}$ в виде многочлена и правильной дроби, а затем разложить по основанию $p(x)$ числитель $r(x)=\sum_{j=1}^{\alpha} r_{j}p(x)^{\alpha-j} $, где $\deg r_i < \deg p(x)$. Теперь получаем, что
$$\frac{f(x)}{g(x)}= h(x)+\sum \frac{r_j(x)}{p^j(x)}$$
Это отличная база для индукции по степени многочлена в знаменателе (или по числу различных неприводимых делителей знаменателя). Допустим, что многочлен $g(x)$ раскладывается на взаимно простые множители $g=g_1g_2$, где $\Nod(g_1,g_2)=1$. Представим $a(x)g_1+b(x)g_2=1$. Тогда, конечно, $f(x)=f(x)a(x)g_1+f(x)b(x)g_2$. Подставляя в дробь, получим
$$\frac{f(x)}{g(x)}= \frac{f(x)a(x)}{g_2(x)}+\frac{f(x)b(x)}{g_1(x)}.$$
Знаменатели явно уменьшились в степени.\\
Покажем единственность. Возьмём $g$ таким, что его старший коэффициент равен 1. Итак пусть
$$\frac{f}{g}=h+\sum_{i,j} \frac{r_{ij}}{p_i^{j}},$$
где $r_{i\alpha_i}$ не ноль (можно так считать, выкинув нулевые слагаемые с большей степенью $p_i$ в знаменателе).
Прежде всего заметим, что $$\sum_{i,j} \frac{r_{ij}}{p_i^{j}}$$
правильная дробь. Тогда $h$ определяется однозначно из единственности представления дроби в виде суммы многочлена и правильной дроби. Заменяя $f$ на $f-gh$ можем считать, что дробь $\frac{f}{g}$ правильная. Теперь покажем, что $g=\prod p_i^{\alpha_i}$. Введём обозначение $$r_i= \sum r_{ij} p_i^{\alpha_i-j}.$$
Приведя правильную дробь справа ($h$ больше нет) к общему знаменателю получим дробь $$\frac{\sum_{i} r_{i}\prod_{k\neq i} p_k^{\alpha_{k}}}{\prod p_i^{\alpha_{i}}}.$$
Покажем, что эта дробь несократима. Выберем некоторый элемент $p_l$ и покажем, что числитель не делится на $p_l$. Слагаемые вида $$r_{i} \prod_{k\neq i} p_k^{\alpha_{k}}$$ делятся на $p_l$, если $l \neq i$. С другой стороны, $r_l$ не делится на $p_l$, так как $r_{l\alpha_l}$ не делится (потому что он не ноль и степени меньше $\deg p_l$). Тогда и вся сумма не делится на $p_l$.
Теперь $\prod p_i^{\alpha_i}=g$ из единственности несократимой записи дроби, а $$f=\sum_{i} r_{i}\prod_{k\neq i} p_k^{\alpha_{k}}.$$
Тогда
$$f\equiv r_{i}\prod_{k\neq i} p_k^{\alpha_{k}} \mod p_i^{\alpha_i},$$
откуда, пользуясь обратимостью $\prod_{k\neq i} p_k^{\alpha_{k}} $ по модулю $p_i^{\alpha_i}$, получаем
$$r_i \equiv f \left(\prod_{k\neq i} p_k^{\alpha_k}\right)^{-1} \!\! \!\! \!\! \mod p_i^{\alpha_i}.$$ Из этого соотношения $r_i$ определяется однозначно, так как его степень меньше $\deg p_i^{\alpha_i}$. Чтобы восстановить $r_{ij}$ надо $r_i$ разложить по основанию $p_i$. Такое разложение единственно по лемме.
\endproof
\zd Какой аналог у последней теоремы в рациональных числах?
\ezd
Рассмотрим теперь конкретные поля $\mb C$. Так как поле $\mb C$ алгебраически замкнуто, то все неприводимые многочлены над $\mb C$ имеют степень 1. Это заметно упрощает жизнь, так как в числителе простейшей дроби могут стоять только константы.
Самый стандартный способ нахождения разложения на простейшие --- метод неопределённых коэффициентов. Приведём пример нахождения некоторого разложения, которое использует конструкцию интерполяции.
Рассмотрим рациональную функцию $\frac{1}{x^{n}-1}$. Я хочу найти её разложение на простейшие над $\mb C$. Корни многочлена $x^{n}-1$ нам известны --- это $x_l=e^{\tfrac{2i \pi l}{n}}$, $l\in \ovl{0,n-1}$, они без кратностей. Многочлен $g(x)=1$ восстанавливается по своим значениям в точках $e^{\tfrac{2i \pi l}{n}}$ по формуле Лагранжа
$$1=\sum_{l=0}^{n-1} \frac{ \prod_{i\neq l} (x-x_i)}{nx_l^{n-1}}.$$
Тогда
$$\frac{1}{x^{n}-1}=\frac{\sum_{l=0}^{n-1} \frac{ x_l\cdot \prod_{i\neq l} (x-x_i)}{n}}{x^{n}-1}= \sum_{l=0}^{n-1} \frac{x_l}{n(x-x_l)}.$$
\section{Степенные ряды как производящие функции}
\dfn[Линейное рекуррентное соотношение] Будем говорить, что последовательность $x_n$ удовлетворяет линейному рекуррентному соотношению $k$-го порядка, если существуют числа $a_0,\dots,a_{k}$, что $a_k,a_0\neq 0$ и
$$a_k x_{n+k}+a_{k-1}x_{n+k-1}+\dots+a_0x_n=0$$
\edfn
\rm Вообще говоря, ничто не мешает считать, что начальные коэффициенты $a_0,\dots,a_s=0$. Просто это означает, что до номера $k+s$ последовательность может быть любой, а после $k+s$ начинает удовлетворять соотношению с коэффициентами $a_{s+1},\dots,a_k$.
\erm
\dfn[Производящая функция] Пусть дана последовательность $a_n$, $n\geq 0$. Производящей функцией для последовательности $a_n$ назовём формальный степенной ряд $f(x)=\sum_{i=0}^{\infty} a_ix^i$.
\edfn
\thrm Ряд из $K[[x]]$ является рядом некоторой правильной дроби $\frac{f(x)}{g(x)}$, тогда и только тогда, когда его коэффициенты удовлетворяют линейному рекуррентному соотношению. Более того, порядок наименьшего линейного рекуррентного соотношения, которому удовлетворяют коэффициенты, равен степени знаменателя в несократимой дроби.
\ethrm
\proof
Заметим, что, ряд Лорана несократимой дроби $\frac{f}{g}$ лежит в $K[[x]]$ тогда и только тогда, когда $g(x)\ndi x$. Если $g(x)\ndi x$, то $g(x)$ обратима в $K[[x]]$, откуда и вся дробь лежит в $K[[x]]$. Обратно, если $g \di x$, и $\frac{f}{g}$ лежит в $K[[x]]$, то $f\ndi x$ и тогда $f$ обратимо в $K[[x]]$ откуда $g(x)^{-1} \in K[[x]]$, что не возможно, потому что свободный член $g$ равен 0.
Пусть $q(x)$ есть ряд правильной несократимой дроби $\frac{f(x)}{g(x)}$. Тогда $q(x)$ удовлетворяет соотношению $g(x)q(x)=f(x)$. Мы уже один раз выписывали соотношение на коэффициенты $g(x)$, когда $f(x)$ был равен 1. Поступим аналогично. Пусть $g(x)=b_nx^n+\dots +b_0$, $f(x)=a_mx^m+\dots +a_0$, а $q(x)=c_0+c_1x+\dots$. Тогда имеем уравнения на коэффициенты $q(x)$
$$ \sum_{j=0}^{n} b_j c_{i-j} =a_i .$$
Выражение справа равно 0 при $i>m$. Выражение слева при $i\geq n$ всегда имеет $n$ слагаемых. Функция $g(x)$ не может делиться на $x$ так как иначе мы не получили бы элемент из $K[[x]]$ или дробь была бы сократима. Тогда $b_0\neq 0$. Таким образом, при $i\geq n$ получаем рекуррентное соотношение на $c_j$
$$ b_0 c_{j+n}+b_1 c_{j+n-1}+\dots + b_n c_j=0.$$
Обратно, пусть $c_j$ удовлетворяют рекуррентному соотношению
$$ b_0 c_{j+n}+b_1 c_{j+n-1}+\dots + b_n c_j=0, \text{ где } b_0,b_n \neq 0.$$
Тогда возьмём в качестве $g(x)= b_n x^n+\dots+b_0$. Как теперь найти $f(x)$? Вспомним условие на коэффициенты и положим
$$a_i= \sum_{j=0}^{n} b_{j} c_{i-j}, \text{ где } i\in \ovl{0,n}.$$
Это и есть коэффициенты $f(x)$. Допустим дробь $\frac{f}{g}$ сократима. Тогда по уже доказанному она удовлетворяет соотношению меньшего $\deg g$ порядка.
\endproof
Рассмотрим простейший пример. Какая рациональная функция соответствует последовательности удовлетворяющей соотношению $z_{n+1}=\lambda z_n$, $z_0=1$? Эта последовательность имеет вид $z_n=\lambda^n$. Ей соответствует ряд $$1+ \lambda x+\dots + \lambda^nx^n+\dots .$$
Это ряд для функции
$$\frac{1}{1-\lambda x}.$$
Значит функции
$$\frac{1}{x-\lambda}=\frac{-1}{\lambda}\frac{1}{1-\frac{x}{\lambda}}$$
соответствует последовательность $z_n=-{\frac{1}{\lambda}^{n+1}}$, то есть некоторая геометрическая прогрессия.
А что соответствует ${\frac{1}{(1-\lambda x)^k}}$, где $k\geq 2$? Вспомним про производную. Заметим, что $$\frac{d^{k-1}}{dx^{k-1}}\frac{1}{1-\lambda x}=\frac{\lambda^{k-1} (k-1)!}{(1-\lambda x)^k}.$$
Переписывая получаем
$$\frac{1}{(1-\lambda x)^k}= \frac{1}{\lambda^{k-1} (k-1)!}\frac{d^{k-1}}{dx^{k-1}}\frac{1}{1-\lambda x}= \sum_{n=0}^{\infty} C_{n+k-1}^{k-1} \lambda^{n}x^{n}.$$
\crl Пусть последовательность комплексных чисел $z_n$ удовлетворяет соотношению $a_k z_{n+k}+a_{k-1}z_{n+k-1}+\dots+a_0z_n=0$. Пусть многочлен $p(x)=a_k x^k+\dots +a_0$ имеет корни $\lambda_1$ кратности $k_1$, $\ldots$, $\lambda_l$ кратности $k_l$. Тогда последовательность $z_n$ имеет вид
$$ p_1(n)\lambda_1^n+\dots+p_l(n)\lambda_l^n,$$
где $p_i$ многочлен степени не выше $k_i$.
\proof
Рассмотрим многочлен $g(x)=a_0x^k+\dots+a_k$. Заметим, что $$g(x)=x^k p\left(\frac{1}{x}\right)= x^k\prod\left(\frac{1}{x}-\lambda_i\right)^{k_i}= \prod (1-\lambda_ix)^{k_i}.$$
Последовательность $z_n$ имеет производящую функцию вида
$$\frac{h(x)}{g(x)}.$$
Разложим её на простейшие над $\mb C$. Получим
$$\frac{h(x)}{g(x)}=\sum_{i=1}^l \sum_{0\leq j < k_i} \frac{b_{ij}}{(1-\lambda_ix)^j}.$$
Каждое слагаемое является производящей функцией для последовательности вида $p_{ij}(n)\lambda_i^n$, $\deg p_i < k_i$. Осталось просуммировать при одинаковом $i$.
\endproof
\ecrl
\dfn Многочлен $a_kx^k+\dots +a_0$ называется характеристическим многочленом линейной рекуррентной последовательности.
\edfn
Рассмотрим пример: пусть $f_n$ --- последовательность чисел Фибоначчи. Она удовлетворяет рекуррентному соотношению $f_{n+2}-f_{n+1}-f_n=0.$ Такой последовательности соответствует многочлен $g(x)=-x^2-x+1$ и $f(x)=x$. Рассмотрим дробь $F(x)=\frac{x}{-x^2-x+1}$ и разложим её в сумму простейших. Корни знаменателя это $\lambda_1=\frac{-1+\sqrt{5}}{2}$ и $\lambda_2=\frac{-1-\sqrt{5}}{2}$. Получим
$$F(x)= -\left(\frac{\lambda_1}{\sqrt{5}(x-\lambda_1)}-\frac{\lambda_2}{\sqrt{5}(x-\lambda_2)}\right).$$
Представим каждое слагаемое в виде ряда и получим формулу
$$f_n= \frac{1}{\sqrt{5}}(\ffi^{n-1}-\ovl{\ffi}^{n-1}),$$
где $\ffi=\frac{1+\sqrt{5}}{2}$, а $\ovl{\ffi}=\frac{1-\sqrt{5}}{2}$
Пусть последовательность $a_{n+2}=4a_{n+1}-4a_n$ начинается с $a_1=2$, $a_0=0$. Найдём общую формулу. Рассмотрим дробь $$A(x)=\frac{2x}{4x^2-4x+1}=\frac{2x}{(2x-1)^2}.$$
Как найти разложение в ряд? Заметим, что $$\frac{2}{(2x-1)^2}= \frac{d}{dx}\frac{-1}{2x-1}.$$
Вспомним, как считается производная для рядов. Тогда
$$A(x)=\sum_{n=0} (n+1) 2^{n+1} x^{n+1}=\sum_{n=0} n2^nx^n.$$
Заметим, что если $z_n$ --- комплексная последовательность, удовлетворяющая линейному рекуррентному соотношению, то её производящая функция $f(x)=\frac{h(x)}{g(x)}$ имеет конечный набор комплексных точек, в которых она не определена. Более того, мы даже знаем эти комплексные точки --- это корни $g(x)$, то есть обратные к корням характеристического многочлена. Общая философия, которая за этим стоит такая --- поведение последовательности определяется <<особыми точками>> её производящей функции, то есть точками на комплексной плоскости, куда эта функция не может быть продолжена, например, её полюсами.
\chapter{Линейная алгебра}
\setcounter{zad}{0}
\setcounter{lem}{0}
\setcounter{thm}{0}
%\setcounter{defn}{0}
\setcounter{cor}{0}
\section{Системы линейных уравнений и метод Гаусса}
\dfn Пусть $R$ -- кольцо. Тогда системой $m$ линейных уравнений от $n$ неизвестных называется набор условий
$$\begin{cases}
a_{11}x_1+\dots + a_{1n}x_n=b_1\\
\vdots \\
a_{m1}x_1+\dots+a_{mn}x_n=b_m
\end{cases},$$
где $a_{ij}, b_i \in R$.
\edfn
Совершенно понятно, что система линейных уравнений определяется однозначно числами $a_{ij}$ и $b_i$. Эти числа удобно организовывать в матрицы.
\dfn Матрица размера $m\times n$ над кольцом $R$ -- это набор чисел проиндексированных двумя индексами $a_{ij}$ $i\in \ovl{1,m}$, $j\in \ovl{1,n}$. Множество всех матриц размера $m\times n$ над кольцом $R$ обозначается как $M_{m\times n}(R)$. Обычно матрицы я буду обозначать заглавными буквами, например $A$. Тот факт, что матрица $A$ имеет размер $m\times n$ будем записывать как $A\in M_{m\times n}(R)$.
\edfn
\dfn Матрица системы линейных уравнений называется матрица $A\in M_{m\times n}$, заполненная коэффициентами этой системы -- то есть числами $a_{ij}$. Матрица размера $m\times (n+1)$ содержащая дополнительно столбец $b_1,\dots, b_m$ называется расширенной матрицей системы. Мы будем отчёркивать столбец $b$, чтобы выделить его особую роль и будем обозначать расширенную матрицу системы как $(A|b)$.
\edfn
\dfn Пусть $A$ -- матрица $M_{m\times n}(K)$ составленная из элементов $a_{ij}$, а $x \in K^n$ -- столбец с компонентами $x_j$. Определим произведение матрицы $A$ на столбец $x$, как элемент $Ax \in K^m$, заданный по правилу
$$(Ax)_i=\sum_{j=1}^n a_{ij}x_j.$$
\edfn
Таким образом матрица $A \in M_{m\times n}(K)$ задаёт отображение $K^n \to K^m$. А систему уравнений с матрицей $A$ и столбцом $b$ можно переписать как
$$Ax=b.$$
От каждой системы нас прежде всего интересует множество её решений. Поэтому логично ввести определение:
\dfn Две системы линейных уравнений называются эквивалентными, если множества их решений совпадают.
\edfn
Как для данной системы линейных уравнений можно построить эквивалентную? Прежде всего заметим, что если есть два уравнения, то по ним можно построить много новых, а именно, пусть имеют $\lambda$ и $\mu$ из $R$. Тогда сложив два уравнения с коэффициентами $\lambda$ и $\mu$ получаем третье
$$\begin{cases}
a_1x_1+\dots+a_nx_n=c\\
b_1x_1+\dots+b_nx_n=d
\end{cases} \Rightarrow (\lambda a_1+\mu b_1)x_1+ \dots +(\lambda a_n+ \mu b_n)x_n= \lambda c+\mu d.$$
Понятно, что если набор $(x_1,\dots,x_n)$ -- решение первых двух, то и нового тоже.
Получать новые уравнения мы научились, остался вопрос про эквивалентные системы. Введём определение элементарных преобразований.
\dfn Пусть дана система уравнений
$$\begin{cases}
a_{11}x_1+\dots + a_{1n}x_n=b_1\\
\vdots \\
a_{m1}x_1+\dots+a_{mn}x_n=b_m
\end{cases},$$
Элементарным преобразованием первого типа над этой системой линейных уравнений называется следующая операция. Рассмотрим уравнения с номерами $i$ и $j$, где $i\neq j$ и элемент $\lambda \in K$. Тогда прибавим $i$-ое уравнение к $j$-ому с коэффициентом $\lambda$ и поместим результат на место $j$-го уравнения.
\edfn
\rm Очевидно, что решение новой системы содержит решения старой. Однако верно и наоборот, так как старая система получается из новой аналогичным прибавлением $i$-ого уравнения к $j$-ому, но с коэффициентом $-\lambda$.
\erm
\dfn Элементарным преобразованием второго типа называется преобразование меняющее местами $i$-ое и $j$-ое уравнения местами. Элементарным преобразованием третьего типа называется преобразование, домножающие $i$-ое уравнение на коэффициент $\lambda \in R^*$.
\edfn
\rm Элементарное преобразование третьего типа приводит к эквивалентной системе так как есть обратное преобразование -- домножение на $\lambda^{-1}$. Для преобразования второго типа эквивалентность тривиальна.
\erm
Нам будет удобно вместо системы линейных уравнений работать с её упрощённой записью -- матрицей этой системы. Поэтому логично перевести понятия элементарных преобразований на язык матриц.
\dfn Элементарным преобразованием строк первого типа над матрицей $A$ называется прибавление к $j$-ой строчке матрицы $A$ её $i$ строки с некоторым коэффициентом $\lambda$. Элементарным преобразованием второго типа называется перестановка $i$-ой и $j$-ой строк в матрице $A$. Преобразованием третьего типа называется домножение $i$-ой строчки на обратимый элемент $\lambda \in R^*$.
\edfn
Нас в основном пока будет интересовать случай $R=K$ -- поле. Обсудим метод Гаусса решения систем линейных уравнений. Он заключается в том, чтобы с помощью элементарных преобразований перевести систему уравнений к эквивалентной системе, так, чтобы вид последней был как можно более простым. Сформулируем это.
\dfn Будем говорить, что матрица $A$ имеет ступенчатый вид, если каждая новая строчка начинается с большего количества нулей, чем предыдущая. Говоря строго, для $i$-ой строки номер столбца в котором стоит первый ненулевой элемент строки строго больше, чем аналогичный номер у $i-1$ строки, если только строка не целиком состоит из нулей.
\edfn
Утверждение, которое стоит за методом Гаусса можно сформулировать следующим образом:
\thrm Любую матрицу над полем $K$ можно перевести элементарными преобразованиями к ступенчатому виду. Более того, можно считать, что для каждой строки первый её ненулевой элемент равен 1 и в столбце над ним стоят нули.
\ethrm
Предъявим индукционный алгоритм для получения ступенчатого вида:\\
{\bf Случай 1:} Элемент $a_{11}\neq 0$. Тогда прибавим ко всем остальным строкам первую с коэффициентами $-\frac{a_{i1}}{a_{11}}$. Получится матрица у которой в перво столбце стоят нули, кроме первой позиции. Вычеркнем первый столбик и первую строчку и продолжим по индукции.\\
{\bf Случай 2:} Элемент $a_{11}=0$, но в $i$-ой строчке стоит ненулевой элемент. Поменяем строку с номером $i$ с первой строкой и продолжим, как в случае 1.\\
{\bf Случай 3:} Весь первый столбец нулевой. Тогда вычеркнем первый столбец и продолжим по индукции.
Указанные преобразования очевидно приводят матрицу к ступенчатому виду. Способ добиться нулей над первыми не нулевыми элементами называется обратным ходом метода Гаусса.
Прежде всего заработаем единицы в первых ненулевых элементах строк $a_i$ поделив на $a_i^{-1}$.
Затем посмотрим на последнюю ненулевую строку -- скажем строку $k$, первый столбец с ненулевым элементом в которой имеет номер $j_k$, и прибавим её ко всем строкам выше с коэффициентом $-a_{lj_k}$ для $l$-ой строки. После чего перейдём к следующей строке.\\
\noindent {\bf Метод Гаусса}
Приступим к решению системы линейных уравнений. Приведём расширенную матрицу системы к ступенчатому виду. Рассмотрим последнюю ненулевую строчку. Если её ненулевой элемент находится в самом последнем отчёркнутом столбце, то решений нет, потому, что эта строчка соответствует уравнению $0x_1+\dots+0x_n=b_1\neq 0$, которое, как ни крути, решений не имеет.
Если же такого не происходит, то разделим переменные на два класса -- те, в чьём столбце есть первый ненулевой элемент какой-то строки и те, в чьём столбце такого элемента нет -- обозначим последние за $x_{i_1},\dots,x_{i_n}$. Тогда выбрав любые значения для $x_{i_1},\dots,x_{i_n}$ из оставшихся уравнений мы однозначно восстановим значения всех остальных переменных. Более того, значения остальных переменных представляются в виде значений многочленов первой степени от $x_{i_1},\dots,x_{i_n}$. Так выглядит стандартное описание всех решений линейного уравнения, которое выдаёт метод Гаусса.
\rm Метод Гаусса подразумевает работу со строчками в определённой порядке, в частности, перестановка строк делается только в экстренных случаях. Но, в принципе, никто не запрещает для удобства переставлять строчки и прибавлять их друг к другу в произвольном порядке -- лишь бы вид системы в конце позволял проанализировать множество решений.
\erm
\exm\\
Допустим мы хотим наладить некоторую поисковую систему. Что это значит? Поисковая система индексирует страницы в сети и, то какая страница на какую ссылается. Иными словами, поисковая система видит ориентированный граф $G$, вершины которого -- это страницы в сети, а рёбра проводятся, если один сайт ссылается на другой.
Что же дожна сделать поисковая система? Ей неплохо было назначить каждому сайту его важность. То есть необходима функция из множества вершин графа в вещественные числа $W\colon G \to \mb R$. Важность сайта зависит от того, насколько много на него ссылаются. Это приводит к следующей системе уравнений:
$$w_i=\sum_{j\to i} \frac{1}{d_j^{out}}w_j,$$
где $d_j^{out}$ исходящая степень вершины $j$.
Приведу другой пример, в котором систему линейных уравнений можно увидеть не сразу. Точнее, рассмотрим набор целых чисел $a=-5250$, $b=-140$, $c=-1050$, $d=-1470$. Вопрос: можно ли найти такие $k_1,k_2,k_3,k_4$ не все чётные, что
$a^{k_1}b^{k_2}c^{k_3}d^{k_4}$ есть квадрат целого числа? Вообще-то это довольно сложная задача. Но числа которые я здесь взял немного специальные. Я знаю их разложение на множители:
$$a=2\cdot 3\cdot 5^3\cdot 7, \,\,b=-2^2\cdot 5\cdot 7, \,\, c=-2\cdot 3\cdot 5^2 \cdot 7,\,\, d=-2\cdot 3\cdot 5\cdot 7^2.$$
Целое число является квадратом, тогда и только тогда, когда оно положительно и любое простое входит в него в чётной степени. Получаем, что $a^{k_1}b^{k_2}c^{k_3}d^{k_4}$ есть квадрат, тогда и только тогда, когда
$$\begin{cases} k_2+k_3+k_4=0 \mod 2,\\
k_1+2k_2+k_3+k_4=0 \mod 2,\\
k_1+k_3+k_4=0 \mod 2,\\
3k_1+k_2+2k_3+k_4=0 \mod 2,\\
k_1+k_2+k_3+2k_4=0 \mod 2,\\
\end{cases}.$$
Похоже, что это система уравнений над $\mb Z/2$. Сразу видно, что на $k_i$ можно смотреть по модулю 2. Составим матрицу системы.
$$A=\pmat 0&0&1&1\\
1&0&1&1\\ 1&0&1&1 \\
1&1&0 &1 \\
1&1&1&0 \epmat.$$
Начнём применять элементарные преобразования. Замечу, что столбец $b$ нулевой и его можно опустить.
$$\pmat
0&0&1&1\\
1&0&1&1\\
1&0&1&1 \\
1&1&0&1 \\
1&1&1&0 \epmat \stackrel{\substack{(3)+(2), (4)+(2),\\ (5)+(2), (2) \to (1),\\ (2) \to (4), (3) \to (5)}}{\sim}
\pmat
1&0&1&1\\
0&1&0&1\\
0&1&1&0 \\
0&0&1&1\\
0&0&0&0 \epmat \stackrel{\substack{(3)+(2), (4)+(3)}}{\sim} \pmat
1&0&1&1\\
0&1&0&1\\
0&0&1&1 \\
0&0&0&0\\
0&0&0&0 \epmat
\stackrel{\substack{(1)+(3)}}{\sim} \pmat
1&0&0&0\\
0&1&0&1\\
0&0&1&1 \\
0&0&0&0\\
0&0&0&0 \epmat
.$$
Ответ да можно. Возьмём $k_4=1$, тогда $k_2,k_3=1$, $k_1=0$.
Подобная задача возникает при поиске разложения числа $n$ на множители. Точнее, нетривиальное решение сравнения $x^2=y^2(\mod n)$ (то есть $x\neq \pm y (\mod n)$) даёт разложение числа $n$. Для получения такого разложения можно взять набор не очень больших простых $b_1,\dots,b_k$ и считать $x \to x^2$ для случайного $x$. Если $k$ большое, то с высокой вероятностью $z=x^2 (\mod n)$ есть произведение $b_1^{\alpha_1}\dots b_k^{\alpha_k}$. Оставим только такие $z_i$. Подберём $d=\prod z_i^{\eps_i}$, чтобы $d=y^2$ в $\mb Z$. Тогда $y^2=d=\prod {x_i^{\eps_i}}^2 (\mod n)$. Вопрос, почему это эффективный алгоритм относится к разделу аналитической теории чисел и пока вне нашей досягаемости.
Казалось бы, мы научились решать произвольную систему линейных уравнений -- что же ещё можно спросить? Я поставлю несколько вопросов, на которые отвечу в дальнейшем. Вот первый и основной из них:\\
1) Предположим, что две системы эквивалентны, например, потому что получились одна из другой перестановкой строк. Верно ли, что ответ для общего решения ответ в методе Гаусса будет содержать одинаковое число независимых параметров? А что будет, если одна система из другой получается заменой переменных?\\
2) В методе Гаусса видно, что решающую роль играет матрица системы. Вопрос: как по матрице системы определить, для каких $b$ система будет разрешима?\\
3) Мы интуитивно догадываемся, что обычно решение системы из $n$ уравнений и $m$ неизвестных описывается $m-n$ параметрами (если это число не отрицательно, конечно). Однако это не всегда так. Вопрос -- найти критерии, когда это выполнено, а когда нет. Это очень полезно, например, в задаче про поисковик. Ведь в этой задаче $n$ уравнений на $n$ неизвестных, но она, очевидно, имеет нулевое решение. Хочется верить, что оно не единственное.
\section{Векторные пространства}
Наша задача понять, какие ситуации приводят к линейным уравнениям.
\dfn[Векторное пространство]
Векторным пространством над полем $K$ называется множество $V$ вместе с отображениями $+\colon V\times V \to V$ и $\cdot \colon K \times V \to V$, удовлетворяющее свойствам:\\
1) $V, +$ является абелевой группой\\
2) $\forall v \in V$ верно, что $1\cdot v=v$\\
3) $\forall v \in V$, $\forall \lambda, \mu \in K$ верно, что $(\lambda+\mu)\cdot v= \lambda\cdot v + \mu \cdot v$.\\
4) $\forall u,v \in V$, $\forall \lambda \in K$ верно, что $\lambda\cdot(u+v)= \lambda\cdot u + \lambda \cdot v$.\\
5) $\forall v \in V$ $\forall \lambda, \mu \in K$ верно, что $(\lambda\mu)\cdot v= \lambda\cdot(\mu \cdot v)$.
\edfn
\dfn Пусть $R$ -- кольцо. Тогда модулем (левым) над $R$ называется множество $M$ вместе с отображениями $+\colon M\times M \to M$ и $\cdot \colon R \times M \to M$, удовлетворяющее свойствам 1)-5) из определения векторного пространства
\edfn
Я немного подожду с примерами модулей над кольцами, чтобы стало понятно, насколько теория с модулями сложнее, чем теория над полем, а пока лишь приведу примеры векторных пространств.
\exm\\
0) Само поле $K$ вместе со сложением и умножением.\\
1) Пространство столбцов $K^n$. Умножение и сложение покомпонентное.\\
2) Обобщая. Пространство матриц $M_{m\times n}(K)$.\\
3) Пусть $X$ -- множество. Рассмотрим множество всех функций из $K$ в $X$ , то есть $K^X$. Это векторное пространство над полем $K$ с поточечным сложением и умножением.\\
4) Рассмотрим множество непрерывных вещественнозначных функций на отрезке $[0,1]$. Это векторное пространство над $\mb R$.\\
5) Рассмотрим множество последовательностей над полем $K$, удовлетворяющих заданному линейному рекуррентному соотношению $a_k x_{n+k}+\dots+a_0x_n=0$. Это векторное пространство над $K$.\\
6) Рассмотрим множества всех многочленов $K[x_1,\dots,x_n]$, всех рациональных функций $K(x_1,\dots, x_n)$, рядов $K[[x_1,\dots,x_n]]$. Это векторные пространства относительно естественного сложения и умножения на элементы $K$.\\
7) Пусть $A$ -- абелева группа, такая, что любой ей элемент имеет порядок $p$, для фиксированного простого числа $p$. Тогда на $A$ существует и единственна структура векторного пространства над $\mb Z/p$.\\
8) Пусть $L$ -- расширение поля $K$. Тогда $L$ является векторным пространством над $K$. В частности $\mb C$ вектроное пространство над $\mb R$ и над $\mb Q$. Аналогично $\mb R$ -- векторное пространство над $\mb Q$.\\
9) Рассмотрим фактор $K[x_1,\dots,x_n]/I$ -- это векторное пространство над полем $K$.\\