-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathsearch.xml
6289 lines (6288 loc) · 562 KB
/
search.xml
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
691
692
693
694
695
696
697
698
699
700
701
702
703
704
705
706
707
708
709
710
711
712
713
714
715
716
717
718
719
720
721
722
723
724
725
726
727
728
729
730
731
732
733
734
735
736
737
738
739
740
741
742
743
744
745
746
747
748
749
750
751
752
753
754
755
756
757
758
759
760
761
762
763
764
765
766
767
768
769
770
771
772
773
774
775
776
777
778
779
780
781
782
783
784
785
786
787
788
789
790
791
792
793
794
795
796
797
798
799
800
801
802
803
804
805
806
807
808
809
810
811
812
813
814
815
816
817
818
819
820
821
822
823
824
825
826
827
828
829
830
831
832
833
834
835
836
837
838
839
840
841
842
843
844
845
846
847
848
849
850
851
852
853
854
855
856
857
858
859
860
861
862
863
864
865
866
867
868
869
870
871
872
873
874
875
876
877
878
879
880
881
882
883
884
885
886
887
888
889
890
891
892
893
894
895
896
897
898
899
900
901
902
903
904
905
906
907
908
909
910
911
912
913
914
915
916
917
918
919
920
921
922
923
924
925
926
927
928
929
930
931
932
933
934
935
936
937
938
939
940
941
942
943
944
945
946
947
948
949
950
951
952
953
954
955
956
957
958
959
960
961
962
963
964
965
966
967
968
969
970
971
972
973
974
975
976
977
978
979
980
981
982
983
984
985
986
987
988
989
990
991
992
993
994
995
996
997
998
999
1000
<?xml version="1.0" encoding="utf-8"?>
<search>
<entry>
<title>2020年初的几部电影</title>
<url>/2020/01/29/2020%E5%B9%B4%E5%88%9D%E7%9A%84%E5%87%A0%E9%83%A8%E7%94%B5%E5%BD%B1/</url>
<content><![CDATA[<h3 id="教宗的承继-8-5-10"><a href="#教宗的承继-8-5-10" class="headerlink" title="教宗的承继 8.5/10"></a>教宗的承继 8.5/10</h3><p>源自真实的故事,讲述了2013年罗马教皇权力更迭背后的故事。剧情简介可以参看豆瓣</p>
<blockquote>
<p>主教贝尔格利奥对教会的发展方向感到十分失望,因此向教皇本笃申请在 2012 年退休。然而,面对丑闻和自我怀疑,善于内省的教皇本笃召见对他最严厉的批判者和未来的继任者来到罗马,在梵蒂冈的围墙之内,展开了一场传统与进步、罪恶与宽恕之间的斗争,这两位截然不同的人直面各自的过去,以图寻找共同点,以及为全世界十亿信徒开创未来。</p>
</blockquote>
<p>影片基于两位教皇的观点展开演绎,本笃十六世象征着保守,本片中也处处表现出保守和传统,比如强调宗教的意义,提出对传统的恢复;而方济各一世则代表着自由主义,他批评教会和教宗,在底层的人群中受到欢迎。以方济各向本笃申请退休为契机,两人在梵蒂冈相会。借着这两位教皇对于教会发展方向的深入探讨,影片试图表达自己在其中的观点。</p>
<p>来自南美洲的导演费尔南多无疑是阿根廷人方济各的支持者,在片中方济各表现出近乎完美的形象:进步现代、关注经济、关心民众、抨击教会弊端,而本笃十六世只能在方济各的各种问题的责问下无力地表示</p>
<blockquote>
<p>I don’t agree with anything you just said。</p>
</blockquote>
<p>在片中,为了展现出全面的自由主义的胜利,本笃表示”听不到上帝的声音了“,因而要退位;而那个不时出现打断剧情的提醒他步行的医疗仪器也似乎为了反衬他的保守。但是,我们可以看到,片中着重讲述了方济各的过去,但是对本笃的过去却没有多少笔墨。影片关注了方济各指出的教会内部腐败的问题、经济问题、贫民问题,但也没能回答本笃关注的同性恋、宗教意义的问题。我们很难说对于一个教宗而言,哪一个问题更加重要。</p>
<p>当然,作为一部电影而言,无疑是成功的。两位教皇用拉丁语/西班牙语/英语轮番探讨宗教的意义显得很decent。看到两位爷爷一起吃披萨、看足球,甚至一起跳探戈、讨论beatles,就是一件很有趣的事情了。(虽然说我是不信的……但方济各一直以来的形象确实能支撑起这样的剧情。</p>
<p>最后我还是觉得方济各就是宗教界的戈尔巴乔夫。</p>
<a id="more"></a>
<h3 id="囧妈-6-0-10"><a href="#囧妈-6-0-10" class="headerlink" title="囧妈 6.0/10"></a>囧妈 6.0/10</h3><p>囧妈大火无疑是占了大年初一抖音免费观看的热度。(虽然我觉得确实是很有意义的一种尝试,但还是要说,徐峥聪明在于商人而非导演</p>
<p>囧妈的剧本完成度比较差(就算是小成本电影),相比于它的几部前作也大大不如。影片分两线,一条是主角和母亲的感情线,另一条是主角和妻子的感情/商业竞争线。前一条线是主线,后一条线就显得无关紧要,感觉有强行附会的嫌疑。</p>
<p>在妻子感情线里,把主角母亲想控制主角的心情等同于主角想控制主角妻子的心情,这是完全不同的感情啊,毕竟主角和妻子从没有表现出“爱情”,而看得出主角母亲溢出屏幕的母爱。影片塑造了一个近乎完美的妻子:性格独立、工作能力强、孝敬主角母亲,而主角一直不肯离婚,乃至在妻子的事业不断制造麻烦的唯一理由就是一句轻描淡写的”还爱着“,这是何等的扭曲啊。</p>
<p>主线里母亲为了圆梦莫斯科大剧院表演,坐火车去莫斯科(这里我就不吐槽身为负责人怎么这么随便了),主角由于意外决定陪母亲去。明显由于母子这个主题没有很好的素材,影片成了很多段与主题无关的独立故事的合集。俄罗斯娜塔莎突然出现,和主角一路缠绵,然后飘然下车;母亲下车后遭遇熊出没,得到猎人解救(典型的机械降神);赶不上火车,然后乘着热气球感到剧院……整个故事充满着机械降神的情节,而缺乏整体的连贯性。</p>
<p>最后说一下这部影片的优点,第一肯定是特殊时期娱乐大众,第二是母亲这个主题表现得有点做作,不过可以接受,第三是贾冰这个列车员可以(他在春晚的小品也可以)。</p>
<h3 id="1917-8-0-10"><a href="#1917-8-0-10" class="headerlink" title="1917 8.0/10"></a>1917 8.0/10</h3><p>传闻中的一镜到底(虽然是伪一镜,但都是长镜头的组合</p>
<p>整体的故事性偏弱,情节没有太突出的地方</p>
<blockquote>
<p>1917年,第一次世界大战进入最激烈之际,两个年仅16岁的英国士兵接到的命令,需立即赶往死亡前线,向那里的将军传达一个“立刻停止进攻”讯息。 时间只有八小时,武器弹药有限,无人知晓前方敌况:死亡寂静之地、布满尸体的铁丝网、突入其来的敌军、随时毙命的危险境况…… </p>
</blockquote>
<p>一镜到底确实有很好的代入感,看得出导演和演员在拍摄中应该付出了比寻常多几倍的努力。抛开外在形式上的创新,这部电影也有感人之处。</p>
<p>下士Schofield片头到片尾都是靠在树下休息,但可以想到,经历了这么多他的心境一定不一样了;将军说的一段话(今天撤退,明天又要进攻,反反复复的命令更加折磨)虽然不深刻,但是直击人心。另外教堂那一段的光影效果值得关注一下。</p>
<h3 id="利刃出鞘-8-5-10"><a href="#利刃出鞘-8-5-10" class="headerlink" title="利刃出鞘 8.5/10"></a>利刃出鞘 8.5/10</h3><p>原以为是一部本格推理,但是和我想的不太一样。整个推理没什么大的漏洞,硬要说就是警察太菜了,不仅第一时间的证据找不到,还让人炸了证据中心……</p>
<p>电影开头对每个人有一段问询,每个人都说了一些假话,侦探007(丹尼尔·克雷格)轻易地推理出了每个人隐瞒了什么秘密。然后….影片直接告诉了我们整个作案过程,之后就是最后的大反转。<strong>这是一部悬疑喜剧,而非烧脑的推理剧。</strong></p>
<p>值得一提的是,片中藏了很多小彩蛋,还有政治隐喻。比如</p>
<blockquote>
<p>贵为美国白人的众卿家内讧一无所获,仰望着从巴基斯坦人手里买来的生父老宅; 身为巴西移民的本宫站在老宅阳台,端起“My House My Rules My Coffee”杯具轻呷,俯视着一切。 哈哈哈哈……吐!</p>
</blockquote>
<p>就是<em>粉刺</em>川普大帝的移民政策。还有那个用装饰画挡住的窗,也暗指了偷渡。</p>
<h3 id="别告诉她-7-5-10"><a href="#别告诉她-7-5-10" class="headerlink" title="别告诉她 7.5/10"></a>别告诉她 7.5/10</h3><p>偶然看见的电影,故事并不复杂</p>
<blockquote>
<p>影片讲述一个华人家庭的奶奶被诊断罹癌,但家人选择隐瞒奶奶,假借一场婚礼的名义让所有家人回家见奶奶最后一面,但在纽约长大的碧莉(奥卡菲娜饰演)认为知道自己病况是奶奶的人权,因此在华人家庭中上演一场中西文化冲突,一部寻根家庭喜剧。</p>
</blockquote>
<p>整体上探讨了中西文化,但是影片却意外地西方。相比之下,我猜导演更了解西方(或者为了面向西方社会),所以对于西方的个人主义和bili所主张的知情权有较为深刻的认识,而对中国的人情只有一句“生命是集体的”来概括。整体比较轻松,观影体验还行。</p>
<h3 id="哪吒之魔童降世7-5-10"><a href="#哪吒之魔童降世7-5-10" class="headerlink" title="哪吒之魔童降世7.5/10"></a>哪吒之魔童降世7.5/10</h3><p>去年以来名声很大的一部动画电影</p>
<blockquote>
<p>天地灵气孕育出一颗能量巨大的混元珠,元始天尊将混元珠提炼成灵珠和魔丸,灵珠投胎为人,助周伐纣时可堪大用;而魔丸则会诞出魔王,为祸人间。元始天尊启动了天劫咒语,3年后天雷将会降临,摧毁魔丸。太乙受命将灵珠托生于陈塘关李靖家的儿子哪吒身上。然而阴差阳错,灵珠和魔丸竟然被掉包。本应是灵珠英雄的哪吒却成了混世大魔王。调皮捣蛋顽劣不堪的哪吒却徒有一颗做英雄的心。然而面对众人对魔丸的误解和即将来临的天雷的降临,哪吒是否命中注定会立地成魔?他将何去何从?</p>
</blockquote>
<p>动画效果感觉比不上玄机娘娘(反正都是“国产动漫最高水平“啦)</p>
<p>细细看完,却发现设定上有问题。哪吒生性顽劣因为魔丸附身(考虑到哪吒对关心爱护他的父母师父也这么残暴),那么灵丸附身的小龙就不会因为龙族水淹陈塘关了。</p>
<p>更重要的是,仔细一想这部电影三观并不是那么正。哪吒魔丸附身,被村民视为妖怪,之后再李靖等人的感化之下,想要反抗命运。但是那句高燃台词“我命由我不由天”却是对小龙喊出的;而在天尊引天雷的时候,哪吒却束手就擒。细想之下,是魔丸还是灵丸本是天尊所定,那些村民不过是无知的愚民罢了,而真正应该反抗的命运应该是天尊(或者其化身天雷)。影片消解了这层对天的反抗,就退化成了纨绔子弟哪吒作威作福多年终于良心发现的故事了。</p>
<h3 id="爱尔兰人-9-5-10"><a href="#爱尔兰人-9-5-10" class="headerlink" title="爱尔兰人 9.5/10"></a>爱尔兰人 9.5/10</h3><p>爱尔兰人没能得奥斯卡奖很可惜(虽然因为《教父》在前,这也是必然的</p>
<blockquote>
<p> 《爱尔兰人》为马丁·斯科塞斯执导的传奇巨制,罗伯特·德尼罗、阿尔·帕西诺和乔·佩西主演。通过二战老兵弗兰克·希兰的视角,讲述了战后美国有组织犯罪的故事。弗兰克·希兰是一名骗子和杀手,曾经在 20 世纪最恶名昭彰的人物身边工作。该电影跨越数十年,记录了美国历史上最大的悬案之一,即传奇工会领袖吉米·霍法失踪案,以宏大的故事之旅,展现有组织犯罪的隐秘通道:其内部运作、仇敌以及与主流政治的瓜葛。</p>
</blockquote>
<p>电影属于半纪实的性质,讲述了黑帮的往事。电影中的很多事情都是历史上的悬案,很难说黑帮的这些人物到底在里面参与了多少。整部电影很明显带着《教父》的风格(从整体的布景、到人物的谈吐甚至是四个小时的片长),讲述故事的方式也有《阿甘正传》的味道(意外参与了当时的重大事件的感觉),以主角黑帮杀手Frank Sheeran的视角展开意识流的叙事。</p>
<p>整部片中没有什么伟光正的人物,气氛都比较压抑。三个老戏骨扮演着三个黑道的重要人物,互相飙戏确实精彩(虽然都不是什么好人</p>
<p>Frank作为黑帮杀手,冷酷无情而且计划周密,是个心狠手辣的人物。他因为工会的起诉搭上了黑帮的船,而后一步步成长为令人闻风丧胆的“爱尔兰人”。影片从Frank的自传改编,选取了一些看起来比较可信的片段(虽然也很大一部分不可考证,依旧被认为悬案)。Frank对于生死的思考是超越常人的(当然不是说这种理解是正确的),他对黑帮的一切都感到坦然,因而保持着绝对的冷静,到最后一刻问及Hoffa的死时第一反应还是找律师。可以说,电影塑造的Frank的形象,诠释了一个近乎完美的黑帮杀手。</p>
<p>Russell是黑帮大佬,提携Frank的恩人。地位很高,但是身形很小,说话很轻柔。片中表现的性格还是比较单一的(当然演技没的说</p>
<p>Jimmy Hoffa是历史上的传奇人物,创立了美国分布最广的工会,鼎盛时有两百三十万会员,而最后又神秘失踪,称为一桩悬案。剧里的Hoffa也表现出了对工会的热爱和重视,他在重新夺回工会的时候揭露黑帮和工会的内幕交易也并非只是为了竞选,相比之下他可能不是那么“黑帮”,所以最后Hoffa一定会和黑帮分道扬镳。</p>
<p>最后Frank杀Hoffa这段是全剧的高潮,整个刺杀行动策划的看着随意,实则周密。比如对一切一无所知的大侄子运送Frank和Hoffa,降低了Hoffa的警惕心;Frank必须亲手杀了Hoffa,一方面为了让Hoffa彻底放心,另一方面也为了表明立场。刺杀过程中也有死鱼的暗喻这样的表现手法,Frank一瞬间的犹豫……在Hoffa被刺杀之后的四十分钟倒显得比较平淡,这些辉煌一时的黑帮大佬也都渐渐老去(情节虽然缓和,镜头也放的很慢,但就是有一种深深的悲凉?</p>
<p>最后片中两句著名的黑话(看了影评才懂…当时就这么划过去了</p>
<blockquote>
<p>Jimmy Hoffa:”I heard you paint houses“</p>
<p>Frank Sheeran:”I do my own carpentry work, too.” </p>
</blockquote>
]]></content>
<categories>
<category>喵后记</category>
</categories>
<tags>
<tag>琉璃猫</tag>
</tags>
</entry>
<entry>
<title>凸优化问题</title>
<url>/2020/02/14/ConvexOptimization/</url>
<content><![CDATA[<p>凸优化问题具有如下形式</p>
<script type="math/tex; mode=display">
min\:f_0(x)</script><script type="math/tex; mode=display">
subject\:to\:f_i(x)\leq b_i\:, \:i=1,...,m</script><p>其中 $f_i$ 是凸函数</p>
<h3 id="凸集"><a href="#凸集" class="headerlink" title="凸集"></a>凸集</h3><p>C的<strong>仿射包</strong>为C中的点的所有仿射组合,即为<strong>affC</strong></p>
<p>定义集合C的<strong>仿射维数</strong>为其<strong>仿射包</strong>的维数。</p>
<p>定义集合C的<strong>相对内部</strong>为<strong>affC</strong>里C的内部,记为<strong>relintC</strong></p>
<script type="math/tex; mode=display">
relint\:C=\{x\in C|B(x, r)\cap aff\: C\subseteq C \: for \:some\: r \}</script><p><strong>凸集</strong>定义为对$x_1\:,\:x_2\in C\:,\:0\leq\theta\leq 1$</p>
<script type="math/tex; mode=display">
\theta x_1+(1-\theta)x_2\in C</script><a id="more"></a>
<p><strong>锥</strong>定义为<strong>非负齐次</strong>集合,对$x_1\:,\:x_2\in C\:,\:0\leq\theta_1\:,\:theta_2$</p>
<script type="math/tex; mode=display">
\theta_1 x_1+\theta_2 x_2\in C</script><p>集合C的<strong>锥包</strong>是C中元素的所有锥组合,也是包含C的<strong>最小凸锥</strong>。</p>
<p>凸集的例子</p>
<ul>
<li><p>空集、单点、直线、全空间</p>
</li>
<li><p>任意子空间都是<strong>凸锥</strong></p>
</li>
<li><p>超平面定义的半空间</p>
</li>
<li><p>Euclid球和椭球</p>
</li>
<li><p>范数球和范数锥</p>
</li>
<li><p>多面体和单纯形</p>
<p><u>如何表示多面体:凸包描述和不等式解集,n很大时两种描述规模相差极大。</u></p>
</li>
<li><p>半正定锥(半正定矩阵的元素在n(n+1)/2的向量空间里)</p>
</li>
</ul>
<p>保凸运算</p>
<ul>
<li><p>交集</p>
</li>
<li><p><strong>仿射</strong>函数</p>
</li>
<li><p>透视函数:$P:R^{n+1}\to R^n\:,\: P(z,t)=z/t \:,\: t>0$</p>
</li>
<li><p>线性分式:</p>
<script type="math/tex; mode=display">
f(x)=(Ax+b)/(c^T x+d)\:,\:dom\: f = \{x|c^T x+d>0\}</script><p><u>凸集在透视函数或线性分式下的原相也是凸的。</u></p>
</li>
</ul>
<p><strong>正常锥</strong>K是满足下列条件的锥</p>
<ul>
<li>凸集</li>
<li>闭集</li>
<li><strong>实</strong>的:有非空内部</li>
<li><strong>尖</strong>的:不包含直线的</li>
</ul>
<p><strong>正常锥</strong>K可以用来定义<strong>广义不等式</strong> ,即偏序关系</p>
<script type="math/tex; mode=display">
x\preceq_K \: y \Leftrightarrow y - x \in K</script><p>($K=R^+$时这个偏序关系就是通常意义上的不等式)</p>
<p>广义不等式定义的偏序关系$\preceq_K$具有加法保序性、传递性、自反性、反对称性等等。</p>
<p>但是它不具有<strong>线性序</strong>,即并非任意两点都可比。如果对每个$y\in S$,都有$x\preceq_K \: y$,那么我们称x为S的<strong>最小元</strong>,类似可定义<strong>最大元</strong>。最小元符号定义为</p>
<script type="math/tex; mode=display">
S \subseteq x +K</script><p>如果$y\in S$,而且$y\preceq_K \: x$可以推得$y=x$,那么我们称x为S的<strong>极小元</strong>,类似可定义<strong>极大元</strong>。极小(极大)元不一定唯一。极小元符号定义为 </p>
<script type="math/tex; mode=display">
(x-K)\cap S=\{x\}</script><p><strong>超平面分离定理</strong>:两个不相交的凸集C、D可以用一个超平面分离,即存在a,b</p>
<script type="math/tex; mode=display">
a^Tx+b\leq 0 \:for \:x\in C</script><script type="math/tex; mode=display">
a^Tx+b\geq 0 \:for \:x\in D</script><p><strong>严格分离</strong>是更强的条件(上式为严格不等号时),不相交的凸集也不一定能被严格分离。</p>
<p>超平面分离定理逆定理<strong>不成立</strong>,但是加上条件的如下结论:任何两个凸集C、D,如果其中至少有一个是<strong>开集</strong>,那么当且仅当存在分离超平面时,它们不相交。</p>
<p><strong>支撑超平面</strong>是指对C<strong>边界(bd C)</strong>上一点$x_0$,如果对</p>
<script type="math/tex; mode=display">
a\neq0\:,\:\forall x\in C\:,\:a^Tx\leq a^Tx_0</script><p>那么称$\{x|a^Tx=a^Tx_0\}$为C在$x_0$处的支撑超平面。一个基本结论<strong>支撑超平面定理</strong>:对任意凸集C和任意$x_0\in bd\:C$,存在支撑超平面。一个<strong>不完全的逆定理</strong>:具有非空内部的闭集,若其边界每个点都存在支撑超平面,那么他是凸的。(证明大概是从内点出发找到不满足凸集要求的点?</p>
<p>对一个锥K,集合</p>
<script type="math/tex; mode=display">
K^*=\{y|x^Ty\geq 0\:,\forall x\in K\}</script><p>称为K的<strong>对偶锥</strong>。几何上看,$y\in K^*$当且仅当-y是K在原点的一个支撑超平面的法线。</p>
<p>对偶锥的例子:</p>
<ul>
<li>子空间的对偶锥是其正交补</li>
<li>非负象限、半正定锥自对偶</li>
<li>范数锥的对偶由<strong>对偶范数</strong>定义</li>
</ul>
<p>一些性质:</p>
<ul>
<li>$K^*$总是闭+凸的</li>
<li>K有非空内部,则$K^*$是尖的</li>
<li>K的闭包是尖的,则$K^*$有非空内部</li>
<li>$K^{**}$是K的凸包的闭包</li>
<li>由上述性质可知当K是正常锥时$K^{**}=K$</li>
</ul>
<p><strong>广义不等式的对偶的性质</strong>:$x\preceq_K\:y$ 当且仅当对任意$\lambda\succeq_{K^<em>}0$有$\lambda^Tx\leq \lambda^Ty$。由于$K^{*</em>}=K$,显然对K的对偶也成立。</p>
<p><strong>线性严格广义不等式的择一定理</strong>:考虑严格广义不等式</p>
<script type="math/tex; mode=display">
Ax\prec_K\:b</script><p>,假设它不可行,即仿射集合$\{b-Ax\}$和int K不相交,那么存在一个分离超平面,因此存在$\lambda$和$\mu$使得对任意x,$\lambda^T(b-Ax)\leq\mu$,以及对任意$y\in K$,$\lambda^Ty\geq\mu$。第一个条件表明$A^T\lambda=0$以及$\lambda^Tb\leq\mu$;第二个条件表明$\lambda\in K^{*}$以及$\mu\leq 0$。所以,即存在$\lambda$,</p>
<script type="math/tex; mode=display">
\lambda\succeq_{K^*}0\:,\:A^T\lambda=0\:,\:\lambda^Tb\leq0</script><p>由此两个不等式构成一对择一,仅有一个可行。</p>
<p><strong>最小元的充要条件</strong>:对所有$\lambda\succ_{K^*}0$,x是极小化$\lambda^Tz$的唯一最优解。</p>
<p><strong>极小元的充要条件</strong>:如果有$\lambda\succ_{K^*}0$,x是极小化$\lambda^Tz$。(如果S不是凸集,则必要性不一定成立)</p>
<h3 id="凸函数"><a href="#凸函数" class="headerlink" title="凸函数"></a>凸函数</h3><p>定义f为<strong>凸函数</strong>如果dom f是凸集且对任意$x,y\in dom\: f$和任意$0\leq\theta\leq 1$有</p>
<script type="math/tex; mode=display">
f(\theta x+(1-\theta)y)\leq\theta f(x)+(1-\theta)f(y)</script><p><strong>严格凸</strong>即上式在$x\neq y$且$0<\theta <1$时严格成立。<strong>凹函数</strong>类似定义。</p>
<p><strong>扩展值延伸</strong>:可以通过定义凸函数在定义域外的值为$\infty$来将这个凸函数延伸到全空间。</p>
<p>假设f<strong>可微</strong>,则f是凸函数的充要条件是dom f是凸集且对于任意$x,y\in dom\:f$,</p>
<script type="math/tex; mode=display">
f(y)\geq f(x)+\nabla f(x)^T(y-x)</script><p>假设f<strong>二阶可微</strong>,则f是凸函数的充要条件是dom f是凸集且对于任意$x\in dom\:f$,</p>
<script type="math/tex; mode=display">
\nabla^2f(x)\succeq 0</script><p>凸函数的例子:</p>
<ul>
<li>线性函数、仿射函数</li>
<li>指数、幂函数、对数、负熵</li>
<li>范数、最大值</li>
<li>指数和的对数</li>
</ul>
<p>凹函数的例子</p>
<ul>
<li>线性函数、仿射函数</li>
<li>几何平均、对数-行列式</li>
</ul>
<p><strong>$\alpha$-下水平集</strong>定义为</p>
<script type="math/tex; mode=display">
C_\alpha=\{x\in dom\:f\:|\:f(x)\leq \alpha\}</script><p>显然凸函数的下水平集仍然是凸集,反之不然。</p>
<p><strong>上境图</strong>定义为</p>
<script type="math/tex; mode=display">
epi\:f=\{(x,t)|x\in dom\:f\:,\:f(x)\leq t\}</script><p>一个函数是凸函数当且仅当它的上境图是凸集。一个函数是凹函数当且仅当它的<strong>亚图</strong>是凸集。</p>
<p><strong>Jensen不等式</strong>:如果f是凸函数,则</p>
<script type="math/tex; mode=display">
f(\theta x+(1-\theta)y)\leq\theta f(x)+(1-\theta)f(y)</script><p>可以推广到多点、无穷项和、积分、期望等。</p>
<p><strong>保凸运算</strong>是保持函数凸性的运算</p>
<ul>
<li>非负加权求和</li>
<li>复合仿射映射</li>
<li>逐点最大(或上确界):本质上是上境图的交集</li>
<li>一族仿射函数的逐点上确界</li>
</ul>
<p><strong>复合函数</strong>$f(x)=h(g(X))$的一些性质</p>
<ul>
<li>标量复合:h凸(凹)且单调,g凸或凹,则f是凸(凹),如果不再假设h、g可微,或者$dom\:g=R^n$,则要求h的扩展值延伸$\tilde{h}$单调。</li>
<li>矢量复合:和标量复合相似,但要求h的每个维度分量上单调</li>
</ul>
<p>特殊形式的<strong>最小化</strong>也可以得到凸函数,假设$f(x,y)$是凸函数,集合C是非空凸集,则</p>
<script type="math/tex; mode=display">
g(x)=inf_{y\in C}f(x,y)</script><p>若$g(x)>-\infty$,则g关于x是凸函数。</p>
<p>定义f的<strong>透视函数</strong>$g(x,t)=tf(x/t)$,透视运算是保凸运算。</p>
<p>f的<strong>共轭函数</strong>定义为</p>
<script type="math/tex; mode=display">
f^*(y)=sup_{x\in dom\:f}(y^Tx-f(x))</script><p>显然$f^*$是凸函数。</p>
<p>共轭函数的例子:</p>
<ul>
<li>仿射函数$f(x)=ax+b$,$f^*$定义域为单点集{a},值为-b。</li>
<li>负对数函数$f(x)=-log(x)$,$f^*(y)=-log(-y)-1$定义域为{y|y<0}</li>
<li>指数函数$f(x)=e^x$,$f^*(y)=y\cdot log(y)-y$定义域为{y|y>0}</li>
<li>严格凸的二次函数$f(x)=\frac12 x^TQx$,$f^*(y)=\frac12 y^TQ^{-1}y$</li>
<li>对数-行列式$f(X)=log(det(X^{-1}))$,$f*(Y)=log(det(-Y^{-1}))-n$</li>
<li>示性函数的共轭函数$f^*(y)=sup_{x\in S}y^Tx$,是集合S的支撑函数</li>
</ul>
<p><strong>Fenchel不等式</strong>:有定义可知$f(x)+f*(y)\geq x^Ty$</p>
<p>共轭的共轭:如果f是凸函数且是闭的,$f^{**}=f$</p>
<p><strong>可微</strong>函数f的共轭函数也称为函数f的<strong>Legendre变换</strong>。此时$y=\nabla f(x^*)$</p>
<p>复合仿射的共轭函数:f(Ax+b)的共轭函数为$f*(A^{-T}y)-b^TA^{-T}y$</p>
<p><strong>拟凸函数</strong>定义为满足<strong>定义域和所有下水平集都是凸集</strong>的函数。<strong>拟凹函数</strong>函数类似定义,如果一个函数拟凸且拟凹,则称为<strong>拟线性函数</strong>。</p>
<p>一些例子</p>
<ul>
<li>对数函数、上取整函数(都是拟线性函数)</li>
<li>线性分式函数(也是拟线性)</li>
</ul>
<p>拟凸函数的Jensen不等式:</p>
<script type="math/tex; mode=display">
f(\theta x+(1-\theta)y)\leq max\{f(x),f(y)\}</script><p>在R上函数f拟凸当且仅当一下条件至少一个成立:</p>
<ul>
<li>f单调</li>
<li>存在一点c,在其左边f非增,在其右边f非减</li>
</ul>
<p>可微拟凸函数的充要条件:</p>
<ul>
<li>一阶条件:$f(y)\leq f(x) \Rightarrow \nabla f(x)^T(y-x)\leq 0$</li>
<li>二阶条件:$y^T\nabla f(x)=0\Rightarrow y^T\nabla^2 f(x)y \geq 0$</li>
</ul>
<p>保拟凸运算</p>
<ul>
<li>非负加权最大(可以扩展到逐点上确界)</li>
<li>拟凸函数和一个非减函数、仿射函数或线性分式函数复合</li>
<li>最小化也是保拟凸的</li>
</ul>
<p>拟凸函数可以通过<strong>一族凸函数</strong>进行表示。这些凸函数满足</p>
<script type="math/tex; mode=display">
f(x)\leq t \Leftrightarrow\phi_t(x)\leq0</script><p><strong>对数-凹函数</strong>和<strong>对数-凸函数</strong>定义为log(f)为凸函数和凹函数。非负凸(凹)函数是对数-凸(凹)函数;对数-凸(凹)函数是拟凸(凹)函数。</p>
<p><strong>二次可微</strong>函数f是对数-凸函数当且仅当</p>
<script type="math/tex; mode=display">
f(x)\nabla^2f(x)\succeq\nabla f(x)\nabla f(x)^T</script><p>对数-凸(凹)性对加法、乘法、积分、<strong>卷积</strong>封闭。</p>
<p>非负函数p的Laplace变换$P(z)=\int p(x)e^{-z^T x}dx$,是对数-凸函数。$M(z)=P(-z)$是矩生成函数,$log(M(z))$是累积量生成函数。</p>
<p><strong>广义不等式的单调性</strong>:$x\preceq_K y\Rightarrow f(x)\leq f(y)$,称函数<strong>K-非减</strong>。当上式严格成立时,称函数<strong>K-增</strong>。类似定义<strong>K-非增</strong>和<strong>K-减</strong>。</p>
<p>可微函数f,定义域是凸集,它是<strong>K-非减</strong>的,当且仅当$\nabla f(x)\succeq_{K*}0$。严格情形下反过来不一定正确。</p>
<p><strong>广义不等式的凸性</strong>:f是<strong>K-凸</strong>的,如果对于任意x,y,以及$0\leq\theta\leq 1,</p>
<script type="math/tex; mode=display">
f(\theta x+(1-\theta)y)\preceq_K \theta f(x)+(1-\theta)f(y)</script><p>当$x\neq y$和$0<\theta<1$时上式严格成立,则称其为<strong>严格K-凸</strong>的。</p>
<p>一些例子</p>
<ul>
<li>当K为$R^N_+$时,即在每个分量上凸</li>
<li>当K为正定矩阵时,称为<strong>矩阵凸性</strong>。等价定义就是对任意z,$z^Tf(x)z$凸。例如$f(X)=XX^T$</li>
</ul>
<p>对偶刻画:f是K-凸的当且仅当对任意$w\succeq_{K^*}0$,$w^Tf$是凸的。</p>
<p><strong>可微的K-凸函数</strong>:充要条件</p>
<script type="math/tex; mode=display">
f(y)\succeq_K f(x)+Df(x)(y-x)</script><p>函数复合保留凸性的结论都可以推广到K-凸的情形。</p>
<h3 id="凸优化问题"><a href="#凸优化问题" class="headerlink" title="凸优化问题"></a>凸优化问题</h3><p>一般<strong>标准形式问题</strong></p>
<script type="math/tex; mode=display">
min\:f_0(x)</script><script type="math/tex; mode=display">
subject\:to\:f_i(x)\leq 0\:,\:i=1,...,m \\
h_i(x)=0\:,\:i=1,...,p</script><p><strong>最优值</strong>$p^*=inf\:f_0(x)$。如果$x^*$可行且$f_0(x^*)=p^*$,称$x^*$为<strong>最优点</strong>。最优点的集合称为<strong>最优集</strong>。最优集是空集,则称最优值<strong>不可得(不可达)</strong>。满足$f_0(x)\leq p^* + \epsilon$的可行解x称为<strong>$\epsilon-$次优</strong>。所有$\epsilon-$次优的集合称为<strong>$\epsilon-$次优集</strong>。</p>
<p>称可行解x为<strong>局部最优</strong>,如果存在$R>0$,使得在$||z-x||_2\leq R$的条件下x是最优解。</p>
<p>等价问题:</p>
<ul>
<li>数乘</li>
<li>一一映射的变量代换</li>
<li>目标(约束)函数的单调变换</li>
<li>松弛变量替换不等式约束</li>
<li>显式/隐式约束替换</li>
<li>优化独立的部分变量</li>
<li>上境图形式</li>
</ul>
<p><strong>凸优化问题</strong>是形如</p>
<script type="math/tex; mode=display">
min\:f_0(x)\\
subject\:to\:f_i(x)\leq 0\:,\:i=1,...,m \\
a_i^Tx=b_i\:,\:i=1,...,p</script><p>相比一般标准形式,要求目标函数和约束函数是<strong>凸函数</strong>,等式约束必须是<strong>仿射</strong>的。显然它的<strong>可行集</strong>和<strong>最优集</strong>是凸的。所以,<strong>局部最优解就是全局最优解</strong>。($f_0$是拟凸函数的时候,称为<strong>拟凸优化</strong>)</p>
<p>可微函数$f_0$的最优性准则:$\forall y\:,\:\nabla f_0(x)^T(y-x)\geq 0$,相当于定义了可行集的一个支撑超平面。(拟凸问题中,这是个充分不必要条件)</p>
<p><strong>解决拟凸优化的一般方法</strong>是把$f_0$表示成一族凸函数,然后解决可行性问题。</p>
<p><strong>线性规划(LP)</strong>问题是</p>
<script type="math/tex; mode=display">
min\:c^Tx+d\\
subject\:to\:Gx\preceq h\\
Ax=b</script><p><strong>标准形式线性规划</strong>是</p>
<script type="math/tex; mode=display">
min\:c^Tx+d\\
subject\:to\:Ax=b\\
x\succeq0</script><p>可以通过引入松弛变量、把$x$分解为$x^+$和$x^-$把线性规划转换为标准形式。</p>
<p><strong>线性分式规划</strong>问题是</p>
<script type="math/tex; mode=display">
min\:f_0(x)=\frac{c^Tx+d}{e^Tx+f}\:,\:dom\:f_0=\{x|e^Tx+f>0\}\\
subject\:to\:Gx\preceq h\\
Ax=b</script><p>作变量替换$y=\frac{x}{e^Tx+f}$和$z=\frac{1}{e^Tx+f}$,可以转换为等价的线性规划。</p>
<p>线性分式规划的一个推广是<strong>广义线性分式规划</strong>,目标函数是r个线性分式的最大值,这是个拟凸优化。</p>
<p><strong>二次优化问题(QP)</strong>是</p>
<script type="math/tex; mode=display">
min\:(1/2)x^TPx+q^Tx+R\\
subject\:to\:Gx\preceq h\\
Ax=b</script><p>如果约束也是二次的,称为<strong>二次约束二次规划(QCQP)</strong>。</p>
<p><strong>二阶锥规划(SOCP)</strong>是</p>
<script type="math/tex; mode=display">
min\:f^Tx\\
subject\:to\:||A_ix+b_i||_2\leq c^T_ix+di\:,\:i=1,...,m\\
Fx=g</script><p>当$c_i=0$时,SOCP退化为QCQP。</p>
<p><strong>鲁棒线性规划</strong>:约束条件的系数为一个给定的椭球。</p>
<p><strong>随机约束下的线性规划</strong>:要求约束成立的概率</p>
<p><strong>几何规划(GP)</strong>是</p>
<script type="math/tex; mode=display">
min\:f_0(x)\\
subject\:to\:f_i(x)\leq 1\:,\:i=1,...,m \\
h_i(x)=1\:,\:i=1,...,p</script><p>其中$f_i$是<strong>正项式</strong>,$h_i$是<strong>单项式</strong>。通过$y_i=log(x_i)$的换元可以简单的转换为凸优化问题。</p>
<p><strong>广义不等式意义下的凸优化问题</strong>:</p>
<script type="math/tex; mode=display">
min\:f_0(x)\\
subject\:to\:f_i(x)\preceq_{K_i} 0\:,\:i=1,...,m \\
a_i^Tx=b_i\:,\:i=1,...,p</script><p>其中$f_i$是$K_i-$凸的。可行集和最优集也是凸的,任何局部最优都是全局最优。</p>
<p>广义不等式凸优化问题中,最简单的是<strong>锥规划</strong>:</p>
<script type="math/tex; mode=display">
min\:c^Tx\\
subject\:to\:Fx+g\preceq_K 0\\
Ax=b</script><p>当K为半正定矩阵锥时,相应锥问题称为<strong>半定规划(SDP)</strong>,这时不等式是<strong>线性矩阵不等式(LMI)</strong>。</p>
<script type="math/tex; mode=display">
\sum x_iF_i+G\preceq 0</script><p><strong>标准形式的SDP</strong>:</p>
<script type="math/tex; mode=display">
min\:tr(CX)\\
subject\:to\:tr(A_iX)=b_i\\
X\succeq0</script><p>注意tr(CX)是S上一般实值线性函数的形式。</p>
<p><strong>广义向量优化问题</strong>记为</p>
<script type="math/tex; mode=display">
min(关于K)\:f_0(x)\\
subject\:to\:f_i(x)\leq 1\:,\:i=1,...,m \\
h_i(x)=1\:,\:i=1,...,p</script><p>如果$f_0$是$K-$凸的,称为<strong>凸向量优化问题</strong>。</p>
<p>点$x^*$是<strong>最优</strong>的当且仅当<strong>可达目标值集合</strong>$O\subseteq f_0(x^*)+K$</p>
<p>点$x^*$是<strong>Pareto最优</strong>当且仅当$O\cap (f_0(x^*)-K)=\{f_0(x^*)\}$,可以证明Pareto最优值集合$P\subseteq O\cap bd\:O$。</p>
<p><strong>标量化</strong>是寻找Pareto最优的标准技术。选择任意$\lambda\succ_{K^*}0$,最优化$\lambda^Tf_0(x)$的最优解是Pareto最优的。</p>
<p><strong>多准则优化</strong>:当向量优化函数关于锥$K=R^q_+$时,称为多准则优化。多准则问题的Pareto最优值集合称为<strong>最优权衡曲面</strong>。我们通过加权来标量化多准则问题。</p>
<h3 id="对偶"><a href="#对偶" class="headerlink" title="对偶"></a>对偶</h3><p>考察标准形式优化问题</p>
<script type="math/tex; mode=display">
min\:f_0(x)\\
subject\:to\:f_i(x)\leq 0\\
h_i(x)=0</script><p><strong>Lagrange函数</strong>定义为</p>
<script type="math/tex; mode=display">
L(x,\lambda,\nu)=f_0(x)+\sum\lambda_if_i(x)+\sum\nu_ih_i(x)</script><p><strong>Lagrange对偶函数</strong>定义为Lagrange函数关于x取得的最小值</p>
<script type="math/tex; mode=display">
g(\lambda,\nu)=inf_xL(x,\lambda,\nu)</script><p>这是原问题$f_0(x)$的下界,即$\forall\lambda\succeq 0\:,\:g(\lambda,\nu)\leq p^*$。</p>
<p><strong>Lagrange对偶函数和共轭函数紧密相关:</strong>比如下面的优化问题</p>
<script type="math/tex; mode=display">
min\:f_0(x)\:subject\:to\:Ax\preceq b\:,\:Cx=d</script><script type="math/tex; mode=display">
g(\lambda,\nu)=-b^T\lambda-d^T\nu-f_0^*(-A^T\lambda-C^T\nu)</script><p><strong>Lagrange对偶问题</strong>表述为</p>
<script type="math/tex; mode=display">
max\:g(\lambda,\nu)\\
subject\:to\:\lambda\succeq 0</script><p>对偶问题的差值称之为<strong>最优对偶间隙</strong>=$p^*-d^*$。</p>
<p>如果$d^*=p^*$成立,那么<strong>强对偶性</strong>成立。一般情况下,强对偶性不成立,<strong>凸优化问题</strong>中强对偶性成立的条件称为<strong>约束准则</strong>。</p>
<p>一个简单的约束准则是<strong>Slater条件</strong>:存在一点$x\in relint\:D$,<strong>严格可行</strong>,即</p>
<script type="math/tex; mode=display">
f_i(x)<0\:,\:i=1,...,m,\:Ax=b</script><p>这个条件可以进一步改进为<strong>仿射条件不需要严格成立,其他条件严格成立</strong>。因而对于线性规划问题,根据Slater条件弱化形式,只要原问题可行,强对偶性都成立。</p>
<p>由此推论:<strong>矩阵对策的混合策略</strong>满足强对偶条件,所以知道对方策略并不影响博弈的策略。</p>
<h4 id="对偶问题的几何解释"><a href="#对偶问题的几何解释" class="headerlink" title="对偶问题的几何解释"></a>对偶问题的几何解释</h4><p>定义集合</p>
<script type="math/tex; mode=display">
G=\{(f_1(x),...,f_m(x),h_1(x),...,h_p(x),f_0(x)\}</script><p>很容易定义优化问题最优解</p>
<script type="math/tex; mode=display">
p^*=inf\{t|(u,v,t)\in G,u\preceq 0,v=0\}</script><p>对偶函数</p>
<script type="math/tex; mode=display">
g(\lambda,\nu)=inf\{(\lambda,\nu,1)^T(u,v,t)|(u,v,t)\in G\}</script><p>如果下确界有限,则不等式</p>
<script type="math/tex; mode=display">
(\lambda,\nu,1)^T(u,v,t)\geq g(\lambda,\nu)</script><p>定义了集合G的一个支撑超平面。假设有$\lambda\succeq 0$,那么$p^*\geq g(\lambda,\nu)$,即弱对偶性成立。</p>
<p>如果以G的上境图A来描述</p>
<script type="math/tex; mode=display">
A=\{(u,v,t)|\exists x\in D,f_i(x)\leq u_i,h_i(x)=v_i,f_0(x)\leq t\}</script><p>那么最优值</p>
<script type="math/tex; mode=display">
p^*=inf\{t|(0,0,t)\in A\}</script><p>同上也是定义了A的支撑超平面。特别的,因为$(0,0,p^*)\in bd\:A$,若对偶性成立。</p>
<p>在几何意义下,<strong>Slater条件意味着分离超平面必非竖直</strong>,强对偶成立。证明如下:先如上定义集合A,另一个凸集</p>
<script type="math/tex; mode=display">
B=\{(0,0,s)|s<p^*\}</script><p>可以找到超平面分离AB,因而$g(\lambda,\nu)\geq p^*$,然后通过说明对偶问题能达到最优,说明强对偶成立。</p>
<h4 id="鞍点解释"><a href="#鞍点解释" class="headerlink" title="鞍点解释"></a>鞍点解释</h4><p>弱对偶性可以描述为</p>
<script type="math/tex; mode=display">
sup_{\lambda\succeq 0}inf_x L(x,\lambda)\leq inf_x sup_{\lambda\succeq 0}L(x,\lambda)</script><p>强对偶性即为上式取等。</p>
<p>我们称一对$\hat{w}$,$\hat{z}$是<strong>鞍点</strong>如果</p>
<script type="math/tex; mode=display">
f(\hat{w},z)\leq f(\hat{w},\hat{z})\leq f(w,\hat{z})</script><p>上式意味着<strong>极大极小性质</strong>成立。</p>
<h4 id="最优性条件"><a href="#最优性条件" class="headerlink" title="最优性条件"></a>最优性条件</h4><p>如果找到对偶可行解$(\lambda,\nu)$那么就对原问题的最优值建立了一个下界。定义差值</p>
<script type="math/tex; mode=display">
f_0(x)-g(\lambda,\nu)</script><p>是<strong>对偶间隙</strong>。这可以用在优化算法中给出<strong>非启发式停止准则</strong>。</p>
<p>如果强对偶性成立,且$x^*,\lambda^*,\nu^*$取到最优,那么</p>
<script type="math/tex; mode=display">
\lambda_i^*f_i(x^*)=0</script><p>称为<strong>互补松弛性</strong>。</p>
<p>非凸问题的<strong>KKT条件</strong>:</p>
<script type="math/tex; mode=display">
\nabla f_0(x^*)+\sum \lambda_i^*\nabla f_i(x^*)+\sum v_i^* \nabla h_i(x^*)=0\\
f_i(x^*)\leq 0\\
h_i(x^*)=0\\
\lambda_i^*\geq 0\\
\lambda_i^* f_i(x^*)=0</script><p>KKT条件是任何一对原问题最优解和对偶问题最优解必须满足的条件。当原问题是<strong>凸优化问题</strong>时,满足KKT条件的点也是原、对偶问题的最优解。</p>
<h4 id="扰动问题"><a href="#扰动问题" class="headerlink" title="扰动问题"></a>扰动问题</h4><script type="math/tex; mode=display">
min\:f_0(x)\\
subject\:to\:f_i(x)\leq u_i\\
h_i(x)=v_i</script><p>定义最优解为$p^*(u,v)$。假设原问题强对偶性成立并且最优值可以达到,那么</p>
<script type="math/tex; mode=display">
p^*(u,v)\geq p^*(0,0)-\lambda^{*T}u-\nu^{*T}v</script><h4 id="择一定理"><a href="#择一定理" class="headerlink" title="择一定理"></a>择一定理</h4><p>严格不等式系统的可行性</p>
<script type="math/tex; mode=display">
f_i(x)<0,\:h_i(x)=0</script><p>和</p>
<script type="math/tex; mode=display">
\lambda\succeq 0,\:g(\lambda,\nu)\geq0</script><p>是<strong>弱择一</strong>的。当原不等式系统是凸的,那么则是<strong>强择一</strong>的。</p>
<p>推导Farkas引理:考虑线性规划</p>
<script type="math/tex; mode=display">
min\:c^Tx\\
subject\:to\:Ax\preceq 0</script><p>和对偶问题</p>
<script type="math/tex; mode=display">
max\:0\\
subject\:to\:A^Ty+c=0,\:y\succeq 0</script><p>显然强对偶成立。可以证明<strong>Farkas引理</strong>:</p>
<script type="math/tex; mode=display">
Ax\preceq 0,\:c^Tx<0</script><p>和</p>
<script type="math/tex; mode=display">
A^Ty+c=0,\:y\succeq0</script><p>是一对强择一系统。</p>
<p><u>Lagrange对偶对广义不等式同样成立,对偶条件和KKT条件中$\lambda$的约束从$\geq 0$改为$\succeq_{K^*}0$。</u></p>
<p><a href="/2020/02/21/ConvexOptimization2/">下一篇:凸优化问题(算法与应用)</a></p>
]]></content>
<categories>
<category>猫爪记</category>
<category>Mathematics</category>
</categories>
<tags>
<tag>琉璃猫</tag>
</tags>
</entry>
<entry>
<title>凸优化问题-应用和算法</title>
<url>/2020/02/21/ConvexOptimization2/</url>
<content><![CDATA[<p><a href="/2020/02/14/ConvexOptimization/">上一篇:凸优化问题</a></p>
<h3 id="一些应用"><a href="#一些应用" class="headerlink" title="一些应用"></a>一些应用</h3><h4 id="逼近和拟合"><a href="#逼近和拟合" class="headerlink" title="逼近和拟合"></a>逼近和拟合</h4><p>范数逼近</p>
<script type="math/tex; mode=display">
min\:||Ax-b||</script><p>罚函数逼近($l_p$-范数的一个有用的推广)</p>
<script type="math/tex; mode=display">
min\:\sum\phi(r_i)\\
subject\:to\:r=Ax-b</script><p>对<strong>野值</strong>不敏感的函数称为<strong>鲁棒</strong>的。当限定为凸的罚函数时,最不敏感的就是线性增长函数。例子就是绝对值函数和<strong>Huber罚函数</strong>。</p>
<p>基本问题</p>
<script type="math/tex; mode=display">
min\:||x||\\
subject\:to\:Ax=b</script><p>这是个凸优化问题。</p>
<a id="more"></a>
<p>正则化逼近:</p>
<script type="math/tex; mode=display">
min\:||Ax-b||+\gamma||x||</script><p><strong>Tikhonov正则化</strong>:</p>
<script type="math/tex; mode=display">
min\:||Ax-b||_2^2+\delta||x||_2^2</script><p>有解析解</p>
<script type="math/tex; mode=display">
x=(A^TA+\delta I)^{-1}A^Tb</script><p>重构、光滑、去噪声:</p>
<script type="math/tex; mode=display">
min\:(||x-x_{cor}||_2,\phi(x))</script><p><strong>函数拟合与插值</strong>:</p>
<p>考虑一族函数,通过</p>
<script type="math/tex; mode=display">
f(u)=\sum_{i=1}^nx_nf_n(u)</script><p>将x与映射$f:R^M\to R$联系起来。</p>
<p>另外还有插值<strong>条件约束</strong>,或者插值的不等式约束。以及对f的凸约束,比如Lipschitz约束。</p>
<p><strong>基筛选</strong>中寻找较少数目的基函数,使得能够在card(x)很小的情况下进行拟合。称为<strong>稀疏描述</strong>。</p>
<h4 id="统计估计"><a href="#统计估计" class="headerlink" title="统计估计"></a>统计估计</h4><p>最大似然问题可以表述如下</p>
<script type="math/tex; mode=display">
max\:l(x)=log(p_x(y))\\
subject\:to\:x\in C</script><p>Chebyshev界:我们希望给$prob(X\in C)$定界,假设$f(z)\geq 1_C(z)$,那么可以求解凸优化问题</p>
<script type="math/tex; mode=display">
min\:x_o+\sum a_ix_i\\
subject\:to\:f(z)=\sum x_if_i(z)\geq1\:\forall z\in C\\
f(z)=\sum x_if_i(z)\geq0\:\forall z\notin C</script><p>Chernoff界:定义为$prob(X\geq u)\leq inf_{\lambda\geq 0}Ee^{\lambda(X-u)}$同样得到</p>
<script type="math/tex; mode=display">
log(prob(X\in C))\leq\mu+logEe^{\lambda^Tx}</script><p>(这里略过数章…)</p>
<h3 id="无约束优化算法"><a href="#无约束优化算法" class="headerlink" title="无约束优化算法"></a>无约束优化算法</h3><script type="math/tex; mode=display">
min\:f(x)</script><p>其中$f$二次可微凸函数。那么最优点应该满足一阶导数为0,我们需要通过迭代求解。首先需要一个适当的初始点$x_0$,且$f(x_0)$下水平集必须是闭集。(下水平集的形状影响收敛速度)</p>
<p>我们假设目标函数是<strong>强凸</strong>的,即存在m>0,满足$\nabla^2 f(x)\succeq mI$。(好处是梯度足够小的点都可以计算得到近似最优解。)</p>
<p>通用下降方法:确定下降方向;选择步长;修改x。</p>
<p>利用负梯度作为搜索方向是一种自然的选择,称为<strong>梯度下降法</strong>。</p>
<p>我们假设强凸,因此存在$mI\preceq \nabla^2f(x)\preceq MI$,那么可以得到上界</p>
<script type="math/tex; mode=display">
f(t)\leq f(x)-t||\nabla f(x)||_2^2+\frac{Mt^2}{2}||\nabla f(x)||_2^2</script><p>采用<strong>精确直线搜索</strong>的话,右边的最小值为$f(x)-(1/2M)||\nabla f(x)||_2^2$,所以</p>
<script type="math/tex; mode=display">
f(x^+)-p^*\leq (1-m/M)(f(x)-p^*)</script><p>因此是<strong>线性收敛</strong>的。事实上,即使是<strong>回溯直线搜索</strong>,满足$0\leq t\leq 1/M$,也可以达到<strong>线性收敛</strong>。</p>
<p><strong>最速下降方法</strong>是通过定义<strong>规范化的最速下降方向</strong>,即找到</p>
<script type="math/tex; mode=display">
\Delta x_{nsd}=argmin\{\nabla f(x)^Tv|||v||=1\}</script><p>上面范数取Euclid范数时即为梯度下降,采用二次范数$||·||_P$时,$\Delta x_{nsd}=-(\nabla f(x)^TP^{-1}\nabla f(x))^{-1/2}P^{-1}\nabla f(x)$。</p>
<p><strong>Newton方法</strong>:$\Delta x_{nt}=-\nabla^2 f(x)^{-1}\nabla f(x)$,这其实等价于Hessian矩阵定义的二次范数下的最速下降方法</p>
<p>可以表明,Newton方法的迭代过程分为两个阶段,第一阶段称为<strong>阻尼Newton阶段</strong>,步长t<1,线性收敛速度,第二阶段为<strong>纯Newton阶段</strong>,步长t=1,二次收敛速度。</p>
<p><strong>自和谐函数</strong>的Newton方法分析不依赖未知常数(强凸性常数、李普西茨常数),且具有仿射不变性。</p>
<p>定义凸函数$f:R\to R$满足对所有x</p>
<script type="math/tex; mode=display">
|f'''(x)|\leq 2f''(x)^{3/2}</script><p>就是<strong>自和谐</strong>的。常数2可以被任何常数k替代。这个条件可以写成</p>
<script type="math/tex; mode=display">
|\frac{d}{dt}(f''(t)^{-1/2})|\leq1</script><p>由此得到$f’’(t)$的上下界</p>
<script type="math/tex; mode=display">
\frac{f''(0)}{(1+tf''(0)^{1/2})^2}\leq f''(t)\leq \frac{f''(0)}{(1-tf''(0)^{1/2})^2}</script><p>由此可以得到次优性的界。</p>
<p><strong>共轭梯度法</strong>:每次下降要求梯度在共轭空间里</p>
<p>定义$\alpha,\beta$Q-共轭为$\alpha^TQ\beta = 0$</p>
<p>每次计算</p>
<script type="math/tex; mode=display">
g^{k+1}=\nabla f(x^{k+1})\\
d^{k+1}=-g^{k+1}+\beta_kd^k=-g^{k+1}+\frac{(g^{k+1})^TQd^k}{(d^k)^TQd^k}d^k\\
x^{k+2}=x^{k+1}+\alpha_{k+1}d^{k+1}=x^{k+1}-\frac{(g^{k+1})^Td^{k+1}}{(d^{k+1})^TQd^{k+1}}d^{k+1}</script><p>对二次式$f(x)=\frac12 x^TQx-b^Tx$进行优化时可以证明$d^i$是Q-共轭的,因而</p>
<script type="math/tex; mode=display">
(g^{k+1})^Td^i=0</script><p>根据这个式子,</p>
<script type="math/tex; mode=display">
\beta_k=\frac{(g^{k+1})^Tg^{k+1}}{(g^k)^Tg^k}</script><p>$\alpha_k$可以通过线性搜索得到。以此避免计算Hessian矩阵。</p>
<p><strong>Quasi-Newton</strong></p>
<p>用$H^K$来拟合$F(X^k)^{-1}$</p>
<script type="math/tex; mode=display">
d^k=-H_kg^k\\
\alpha_k=\arg\min_\alpha f(x^k+\alpha d^k)\\
x^{k+1}=x^k+\alpha_k d^k</script><p>对$H_k$的更新有三种</p>
<ul>
<li>Rank One Correction</li>
<li>Davidon-Fletcher-Powell(DFP)</li>
<li>Broyden-Fletcher-Goldfarb-Shanno(BFGS)</li>
</ul>
<h3 id="等式约束优化"><a href="#等式约束优化" class="headerlink" title="等式约束优化"></a>等式约束优化</h3><script type="math/tex; mode=display">
\min f(x)\\s.t. Ax=b</script><p>考虑二阶Taylor近似</p>
<script type="math/tex; mode=display">
\min f(x+v)=f(x)+\nabla f(x)^Tv+(1/2)v^T\nabla^2f(x)v\\
s.t.A(x+v)=b</script><p><strong>Newton方向</strong>$\Delta x_{nt}$由以下方程确定</p>
<script type="math/tex; mode=display">
\begin{pmatrix}\nabla^2f(x)&A^T\\A&0\end{pmatrix}\begin{pmatrix}\Delta x_{nt}\\w\end{pmatrix}=\begin{pmatrix}-\nabla f(x)\\0\end{pmatrix}</script><p>对于<strong>不可行初始点</strong>的newton方向,</p>
<script type="math/tex; mode=display">
\begin{pmatrix}\nabla^2f(x)&A^T\\A&0\end{pmatrix}\begin{pmatrix}\Delta x_{nt}\\w\end{pmatrix}=\begin{pmatrix}-\nabla f(x)\\b-Ax\end{pmatrix}</script><h3 id="线性规划问题的解法"><a href="#线性规划问题的解法" class="headerlink" title="线性规划问题的解法"></a>线性规划问题的解法</h3><p><strong>Primal单纯形法</strong></p>
<p>对于线性规划</p>
<script type="math/tex; mode=display">
min\:c^Tx\\
s.t.\:Ax=b\\
x\geq 0</script><p>和对偶问题</p>
<script type="math/tex; mode=display">
max\:b^Ty\\
s.t.\:A^Ty+s=c\\
s\geq 0</script><p>得到KKT条件</p>
<script type="math/tex; mode=display">
Ax=b,x\geq 0\\
A^Ty+s=c,s\geq 0\\
x_is_i=0</script><p>Primal单纯形法得到</p>
<script type="math/tex; mode=display">
x_B=B^{-1}b\geq 0,x_N=0\\
y=B^{-T}c_B\\
s_B=c_B-B^Ty=0,s_N=c_N-N^Ty??0</script><p>(B是一个基,N是自由基)然后判断$s_N$和0的大小关系,决定是否停止迭代。如果$s_j\geq 0$那么x是最优解,否则可以找到q,$s_q<0$。那么就找到$p\in B$移出基。</p>
<p>令$u=B^{-1}A_q$,那么$x_B^+=x_B-ux_q^+$。如果$u\leq 0$则原问题无界;否则找到$u_k>0$,就可以找到$x_q^+$和$p$满足$ x_B^+\geq 0$和$x_p^+=0,确定</p>
<script type="math/tex; mode=display">
p=argmin\frac{x_B(i)}{u_i}</script><p><u>单纯形法工业级应用还需要解决很多问题,比如快速求逆、防止循环迭代等等。</u></p>
<p><strong>对偶单纯形法</strong></p>
<script type="math/tex; mode=display">
x_B=B^{-1}b??0,x_N=0\\
y=B^{-T}c_B\\
s_B=c_B-B^Ty=0,s_N=c_N-N^Ty\geq 0</script><p> 如果$x_B\geq 0$,则达到最优,否则找到$q\in B$使得$x_q<0$退出基,选择r加入基,$s_r^+=0$。然后进行更新:</p>
<script type="math/tex; mode=display">
s_B^+=s_b+ae_q\\
y^+=y+av(e_q=-B^Tv)</script><p><u>对偶单纯形法和单纯形法有时候速度差距很大。</u></p>
<p><strong>内点法</strong></p>
<p>$(x,y,s)$为当前估计,$(\Delta x,\Delta y,\Delta s)$是搜索方向,定义$\mu=\sum x_is_i/n$。所以要找到</p>
<script type="math/tex; mode=display">
A(x+\Delta x)=b\\
A^T(y+\Delta y)+s+\Delta s=c\\
(x_i+\Delta x_i)(s_i+\Delta s_i)=\sigma_\mu</script><p>舍弃二阶小量得到</p>
<script type="math/tex; mode=display">
A\Delta x=r_p:=b-Ax\\
A^T\Delta y+\Delta s=r_d:=c-A^Ty-s\\
x_i\Delta s_i+\Delta x_is_i=(r_c)_i:=\sigma_\mu-x_is_i</script><p>写成矩阵形式如下,令$L_x=Diag(x)$,$L_s=Diag(s)$</p>
<script type="math/tex; mode=display">
\begin{pmatrix}A&0&0\\
0&A^T&I\\
L_s&0&L_x\end{pmatrix}
\begin{pmatrix}\Delta x\\
\Delta y\\
\Delta s\end{pmatrix}
=
\begin{pmatrix}r_p\\
r_d\\
r_c
\end{pmatrix}</script><p>如果A满秩,$AL_s^{-1}L_xA^T$是对称正定的,可以解得到</p>
<script type="math/tex; mode=display">
\Delta y=(AL_s^{-1}L_xA^T)^{-1}(r_p+AL_s^{-1}(L_xr_d-r_c))\\
\Delta s = r_d-A^T\Delta y\\
\Delta x = -L_s^{-1}(L_x\Delta s-r_c)</script><p>然后进行步长搜索,保证$(x^{k+1},s^{k+1})>0$。</p>
<p><u>步长搜索用Central Path,具体定义如下:</u> $C=\{(x_\tau,y_\tau,s_\tau|\tau>0\}$满足</p>
<script type="math/tex; mode=display">
Ax_\tau=b,x_\tau>0\\
A^Ty_\tau+s_\tau=c,s_\tau>0\\
(x_\tau)_i(s_\tau)_i=\tau</script><p>Central Path neighborhoods是对$\theta,\gamma\in[0,1)$:</p>
<script type="math/tex; mode=display">
N_2(\theta)=\{(x,y,s)|||L_xL_se-\mu e||_2\leq\theta\mu\}\\
N_{-\infty}(\gamma)=\{(x,y,s)|x_is_i\geq\gamma\mu\}</script><p>一般而言$\theta=0.5$,$\gamma=10^{-3}$。</p>
<p>Path-Following:设定步长$\alpha_k$为最大的满足$(x^{k+1},y^{k+1},s^{k+1})\in N_{-\infty}(\gamma)$的值。那么$|\Delta x\cdot\Delta s|\leq 2^{-3/2}(1+1/\gamma)n\mu$,更新</p>
<script type="math/tex; mode=display">
\mu_{k+1}\leq(1-\delta/n)\mu_k,\delta=2^{3/2}\gamma\frac{1-\gamma}{1+\gamma}\sigma(1-\sigma)</script><p>那么如果$(x^0,y^0,s^0)\in N_{-\infty}(\gamma)$,存在$K=O(nln(1/\epsilon))$使得$\mu_k\leq\epsilon\mu_0$</p>
<p><u>内点法是很少见的多项式时间算法</u></p>
]]></content>
<categories>
<category>猫爪记</category>
<category>Mathematics</category>
</categories>
<tags>
<tag>琉璃猫</tag>
</tags>
</entry>
<entry>
<title>国民党党员、党章与组织制定</title>
<url>/2020/03/05/KMT-History/</url>
<content><![CDATA[<h1 id="国民党的改组"><a href="#国民党的改组" class="headerlink" title="国民党的改组"></a>国民党的改组</h1><p>国民党改组效仿苏共的组织制度,特别是注重发展群众。国民党基本照抄了苏共党章纪律,而中共的纪律更加严格。</p>
<p>国民党改组之后修改的党章改用通俗的白话文,虽然孙文本人对此不太认同,但是默认了以之在基层发展党员。</p>
<p>国民党党员的组成成分在广东一地以工农为主,而纵观全国,则大多是青年知识分子,特别是中小知识分子。他们热切的想要参与政治,也有想要谋个工作的含义。吸引力远超共产党,青年视共产党为洪水猛兽。</p>
<p>1923年前后国民党改组前党员20万,国内仅5万,群众基础薄弱。26年统计党员达到54.4万,且其中82%为国内党员,27年初党员人数应在百万以上。</p>
<p>但是国民党组织结构松散,在四一二清党之后,蒋、胡都认识到了这一点。国民党重视上层,忽视基层,就连广州亦是如此。基层经费不足,只能任由豪绅包办,或者豪绅直接伪装加入国民党把持党部。国民党来者不拒,导致党员滥化。一些人利用党籍作为升职工具或者争夺地方权力。这远非孙文所愿。</p>
<a id="more"></a>
<h1 id="国共合作"><a href="#国共合作" class="headerlink" title="国共合作"></a>国共合作</h1><p>关于“容共”,共产党明确是“合作”关系(强调自身独立性),而过国民党方面只是孙中山表明“容共”立场,认为中共是国际组织,与国民党不矛盾,打消党内顽固派的顾虑。</p>
<p>24年8月国民党中央全会上,瞿秋白与鲍罗廷与会,会议设立国民党下属国际联络委员会,协调两党问题,导致上海中共中央震怒。25年秋冬间,瞿秋白首次提出“联共”的说法,26年3月出现在中共中央正式文件中,在此前后国民党正式承认合作关系。26年5月二中全会设立5+3人的两党联席会议,国民党承认联共,这是蒋、鲍妥协的结果。</p>
<p>实际上,在青年中共产主义还是很有吸引力的,乃至孙中山要声称三民主义就是社会主义。</p>
<p>中共对于两党合作的态度是居高临下的“扶持”“诱导”“掖进”。</p>
<p>中共这时期的《向导》面向底层,但因为底层文化程度且不是免费的,实则面向了非底层。</p>
<p>即使如此,中共保持了其独立性,而国民党反而缺失机关刊物。国民党在宣传方面自愧不如,就连北伐时期的“三大政策”“国民革命”也源自中共。除此之外,中共提出的“打倒帝国主义”“打倒军阀”也深入民心。甚至在中共的影响下,国民党青年也相信宁左勿右,以右派为耻。四一二之后,蒋介石就明令禁止使用这些中共的怪词语。</p>
<p>虽然国共的骨干都是中小知识分子,但国民党向上层,共产党向下层。</p>
<p>26年1月国民党二大召开前后,国共实力已经逆转,特别是共产党对国民党地方组织控制更深入。</p>
<p>1924年5月中共中央执委会扩大会议之后,中共逐渐改变策略,开始注意在国民党内部发展组织力量,此事也引起国民党高层注意。对此陈独秀并不否认,还表示“在国民党内成立一个左派,只算是进步,不是破坏”。26年国民党二大以决议的形式限制国民党员转党。25年1月中共四大决定除了工作需要,共产党员不应当加入国民党。事实上,此前中共党员仅有950人,而在26年4月之后一年增加了4.5万。26年5月,蒋介石要求共产党提供党员名单,但中共没有提交。国共两党主客易位在两党合作末期已成为共识,这一事件的根源在孙中山想要创立列宁主义的严密政党而又能包容另一列宁主义政党时就已经注定。</p>
<h1 id="四一二"><a href="#四一二" class="headerlink" title="四一二"></a>四一二</h1><p>四一二对国共两党都是重大打击。中共六大统计,27年4月至28年上半年清党杀害31万人,其中共产党员2万余人,中共党员从5.7万减少到1万余人。清党前国民党党员总数在100万以上,29年10月统计总数降至65万(考虑新加入的投机分子等,实际清洗、脱党可能不止35万)。</p>
<p>关于清党到底逮捕、杀害了多少人,分歧很大,大约在10万人以上。但可以肯定的是,被捕被杀的人数远超中共党员人数。</p>
<p>“逆淘汰”——左派青年被清洗,下层工农阶级脱党 </p>
<p>“组织瘫痪”——国民党地方党务原多由共党包办,原共党控制的省市党部职位成为权力斗争的目标。而基层组织遭到土豪劣绅侵夺。</p>
<p>清党之后,党务人才奇缺,地方上听任豪绅和投机分子侵夺资源,上层只能依赖武力来弥补党力虚脱。</p>
<h1 id="执政党"><a href="#执政党" class="headerlink" title="执政党"></a>执政党</h1><p>27年国民党执掌全国政权以后,与工农民众割裂开来。28年2月撤销农、工、商、青年、妇女五部,对民众运动加以限制。</p>
<p>原来上层国民党-中层共产党-下层民众的结构打破后,民众团体成为国民党的装饰物。比如农会,主要成分从佃农转为“有农地者”以及“习农业者”等。究其原因主要是对民众运动的恐惧、认为民众运动是共党产物。</p>
<p>清党之后,国民党分为两派,对待民众运动的态度截然不同,分别为胡汉民为首的元老派,汪精卫陈公博为首的改组派,蒋先生立于其间。</p>
<p>实则在孙中山的思想里,人分先知先觉和后知后觉的,他并不赞同国民党以工农为基础。改组派提出国民党应以工农为基础,蒋先生则认为所有被压迫的人都是(全民都被帝国主义压迫),但是造成了“两不讨好”的局面,比如《工厂法》在劳资双方都有意见。国民党成为执政党之后抛弃了工农联盟,却也没能赢得资本阶级的支持。</p>
<p>事实上,国民党与资本家阶级一直存在着矛盾。1932-1933期间,由三友实业的劳资纠纷,转变为上海整个劳资两大阵营的正面冲突,上海绝大多数工会都卷入其中。这其中也有资方与国民党中央的较量,引起南京党部28年以来首次对资本家阶级大张挞伐的“卅电”,但政治强权依旧未能把资方压服。资方在法律上完全失败,1932年上海地方法院驳回上诉,1933年1月最高法院再次驳回。但资方仍旧拖延不履行判决,上海当局也显得软弱,最后1933年12月在杜月笙调停下以资方支付解雇金、工人放弃复工告终。</p>
<p>可以看到,一则国民党的统治力比较有限,二则国民党太想讨好所有的人民了,最后反而都不能讨好。</p>
<h1 id="党治"><a href="#党治" class="headerlink" title="党治"></a>党治</h1><p>国民党清党之后,党力实则弱化,而党统在派系斗争中 濒于破裂。法理上的“以党治国”演变为“以军治国”。</p>
<p>在孙中山设想中,训政只维持6年,然后进入宪政。1929年6月国民党三届二中全会也如此决议。但到了1935年并未结束训政。</p>
<p><strong>中政会:</strong>国民党自上而下设立了党政互动的双轨统治机构,党治的重点放在中央一级,孙中山1924年7月效仿俄共中央政治局设立中政会就是此意。</p>
<p>国民党改组后的最高权力机关是中央执行委员会。鉴于40余人的中执会难以对复杂多变的局势作出反应,孙中山提出党政军分离,先后设立政治委员会、军事委员会,这两个委员会名义上式中执会的下属机构。孙中山在世时,三个组织都听命于他,实际是党魁独裁制。中政会同时受总理和中执会节制,孙去世之后,中政会地位明显提高。26年国民党推选汪精卫、胡汉民、蒋介石为中政会委员,27年3月鉴于中政会有受蒋介石挟持的嫌疑,对中政会职权进行了限制。国民党实施训政之后,28年10月决议中政会集立法、决策、人事大权于一体。</p>
<p>后来中政会人数从十数人开始逐渐膨胀,30年代中政会有多达200余人,中政会逐渐变得没有实权。中政会衰落之后,中常会(中执会常委会)就更无足轻重。</p>
<p><strong>兼任:</strong>除了中政会之外,另一条党治通道是中央领导人兼任政军要职来控制政府和军队。主席、委员、五院院长、各部部长都是中央委员兼任。1936年统计,13名最显赫的党政要人兼任了165个职位,蒋介石本人兼任24个。</p>
<p>国民党中央党政军角色高度重叠,实则“法无定规,权从人转”,比如国家主席一职在林森和蒋介石出任前后的变化。国民党法理上最高的中央委员会也日趋没落。</p>
<p>中常会中执会的衰落本质是党权被侵蚀,主要是军权。胡汉民曾试图以党权抗争军权,宁汉之争便是如此。大体上27-31是两权相争,之后则是军权扼制党权。军政党的顺序从中央贯穿到地方。</p>
<p><strong>重军轻党:</strong>蒋介石推崇军人,以及军队的组织纪律,主张政治军事化、党务军事化,甚至社会军事化。政治上设立“行政督察专员”推进剿共,社会上推行保甲制度和新生活运动。KMT执政后,军人党员迅速膨胀(从1929年30w到1937年101万),而普通党员增长缓慢。</p>
<p><strong>双轨制:</strong>国民党推行中央实行党治领导行政,而地方上是党政双轨,行政领导党治。只在地方实力派控制的地区才有党政高度重合的现象。蒋介石等认为地方党治干预行政是“党乱”,胡汉民指出地方党组织是<strong>辅助</strong>政府行政,沟通政府和人民的。这也导致了地方上党治权威的降低,称为地方政府的附庸。</p>
<p><strong>党政冲突</strong>:地方党政冲突是KMT两大顽疾之一,一些地方甚至从文斗升级为武斗。党务人员薪俸较低,在30年代之后党部失势,地方党权低落,制约了KMT党治在基层的运作。</p>
<p><strong>以党治国:</strong>孙中山主张“党义治国”而非“党员治国”,但其后国民党并没很好遵循这一点。但1926年蒋介石建立南京政府前后,就谈到以党治国是根据党的主义指定政治方案,交给政府去实行,而不是直接施政。党籍并不是入仕的必要条件,中央政府机关中国民党党员的比例在1929年为36%,1933年降至22%,1939年又升到45%<em>(此处还需考虑后加入党的?)</em>。这一比例远远称不上独裁。南京上海的政府机关公务员中党员仅占10%-17%。27年以后KMT形式上执掌政权,但并不具备高度党治的实力。29年仅27万党员,37年也不过52万。29年南京政府控制8%国土和20%人口,到37年控制25%地区和66%人口,但是政权组织职能局限于上层和城市,党治实际控制有限。</p>
<p>政府在党外主要吸纳两部分人,一是北洋旧官僚(国民党内元老派包括蒋先生认为年轻党员“幼稚”,因而不让地方党部干预行政,当时有“南京政府,北京内阁”之说),二是专家知识分子。</p>
<h1 id="派系"><a href="#派系" class="headerlink" title="派系"></a>派系</h1><p>北伐时期胡汉民提出“党外无党,党内无派”,这一理念使得派系政治朝两个方面发展,一是争夺党的正统,二是派系斗争隐蔽化。</p>
<p><strong>1925~1931年继承权之争和“党统”之争</strong>:</p>
<p>27年“四一二”之前四次分裂</p>
<ul>
<li>25年8月廖仲恺被刺,胡汉民和汪精卫分裂</li>
<li>25年11月西山会议派另立中央</li>
<li>26年3月中山舰,蒋汪分裂</li>
<li>27年“四一二”宁汉分裂</li>
</ul>
<p>之后各派在“反共”问题上取得一致,但派系斗争激化。党内左右两派依然存在,蒋介石力图以武力树立正统地位,引发左右两派和地方军事集团的不满。</p>
<p>1931年2月“汤山事件”结束了蒋胡合作的局面。</p>
<p>右派(西山会议派)结构松散,28年之后实际失势;左派(改组派)声威虽猛,只有28-30年两年组织生命。</p>
<p><strong>1932~1937年次生派系斗争</strong>:</p>
<p>外部:“福建事变”和“两广事变”</p>
<p>内部:CC系、力行系和政学系</p>
<p>政学系是少数高层的松散组织。</p>
<p>CC系(“Center Club”)一方面控制党机器而使党派系化,一方面又有独立组织系统。33年-49年间KMT基本由CC系掌控。二陈一直否认CC系的存在,但是1933年初二陈在蒋授意下组织过“青白团”,顶层为“青白团”,中层为“中国国民党忠实党员同盟会”,下层是众多活动集社(上海“干社”,平津“诚社”,江苏“励进社”等)和外围团体(中国文化建设协会等)。强调蒋为唯一领袖的绝对集权制。“忠实党员同盟会”主要寄附各级党组织,活动对内秘密,对外以KMT招牌进行。只有纵向关系,下层甚至不知道上层组织的存在。</p>
<p>力行系是“派系党化”的“党中之党”,力图建立新的党组织改造KMT。32年“力行社”在蒋介石的亲自主持下成立,一度成为国家最高决策机构,32年下半年开始逐渐成为一个纯粹的决策执行组织。有三层组织,顶层为“三民主义力行社”约300人,第二层为“革命军人同志会”(人数不明)和“革命青年同志会”约3万人,第三层为“中华复兴社”约10-50万。战前力行社规模与KMT相当,两部分成员并非是重叠的。力行社也被外界误传为“蓝衣社”,常被视作一个新党。</p>
<p>CC系和力行社都强调蒋的绝对权威,采取集权主义体质和秘密组织系统,鼓吹法西斯主义,附设有庞大的特务机关。两者均在1938年3月KMT全国代表大会后宣布取消。</p>
<p>CC系和力行社关系日趋紧张,1934年蒋做出大致分工,CC系致力于党,力行社致力于军,但是两派之间的斗争一直持续,1938年后以党团队里的形式延续。</p>
<p><strong>1938~1949年拥蒋派系斗争</strong>:</p>
<p>党团之争、CC系和政学系</p>
<h1 id="党员"><a href="#党员" class="headerlink" title="党员"></a>党员</h1><p>KMT普通党员增长缓慢</p>
<p>党员与人口比例更低</p>
<div class="table-container">
<table>
<thead>
<tr>
<th>政党</th>
<th>党员/人口</th>
</tr>
</thead>
<tbody>
<tr>
<td>KMT(1935)(包括61%军队)</td>
<td>1:300</td>
</tr>
<tr>
<td>苏共(1931)</td>
<td>1:65</td>
</tr>
<tr>
<td>中共(1958)</td>
<td>1:52</td>
</tr>
<tr>
<td>意大利法西斯(1934)</td>
<td>1:25</td>
</tr>
</tbody>
</table>
</div>
<p>1935年,KMT统治中心的江浙党员仅占16.8%,而与南京分庭抗礼的两广党员有1/3,另有1/4名义上奉KMT为正朔的省区党员。所以KMT是组织基础十分脆弱的执政党。</p>
<p>党员增长缓慢,一是党组织涣散,二是民众疏离。</p>
<p>农村无党,基层脆弱,战前KMT组织未能深入县以下。省党部以下组织多数不健全,地方党务有名无实,或完全停顿。</p>
<p>边缘省区如东北省组织活动被张学良抑制,山西阎锡山借学生运动抵制党部,山东韩复榘类似。两广长期分立,自成一系。</p>
<p>战前KMT党员除军人外,主要集中于知识界和政界。KMT执政后,青年学生人数下降,政界党员增加,农工党员比例下降。</p>
<p>KMT党的形象在北伐后两三年间急转直下。众多支持者如胡适、蒋廷黻也在30年后逐渐转变看法。另一方面,蒋介石也公开和私下对KMT进行批评。</p>
<p>“党部机关衙门化、党部委员官僚化、普通党员特殊化”</p>
<h1 id="抗战"><a href="#抗战" class="headerlink" title="抗战"></a>抗战</h1><p>三民主义青年团正式成立于1938年3月底。“党外造党”试图吸引对KMT反感的青年一代,同时想统合党内各派。</p>
<p>蒋对三青团团员以新生力量相期许,将KMT推到尴尬的境地。同时考虑CC系独掌KMT党机器,蒋属意力行社成员承担组建任务。这导致派系争斗,延续为党团之争。</p>
<p>党团双轨制,但三青团组织关系上与KMT日趋疏远,行为和工作上和KMT日趋接近。党团势成水火之时,蒋才强调KMT对三青团的领导地位,但党团斗争持续加剧,直到1947年党团矛盾激化危及KMT时,蒋才下决心把三青团并入KMT。</p>
<p>KMT中央党政一体化,地方上则要求党政互相监督,因而造成地方党政矛盾。战时格局没有改变,但省党部委员多由省主席兼任,省主席又由战区军事首领担任,省级实现了党政军一体化。地方上形成新式军阀,“以军统党”,“以政统党”,地方党部进一步萎缩。地方党部不得干涉地方政府,但协助和监督;地方政府往往加以抵制,党部显得软弱无能,沦为军政附庸。</p>
<p>抗战成立国防最高委员会,蒋以KMT总裁身份兼任委员长,独揽党政军一切大权。</p>
<p>抗战初期,KMT军事溃退,长江下游地区基层组织几乎解体,战前52万普通党员到1939年只余下28万。1939年开始,KMT采取政策大量吸收新党员,抗战胜利时达到264万,军队党员423万。三青团同期124w,中共121w。</p>
<p>KMT的组织扩张和渗透程度也大为强化。1938年要求县设置党部,1939年“新县制”要求乡镇设区党部,保设区分布,甲设党小组,并且恢复了大革命时期的“党团”制度。45年全国至少1/3乡镇和保建立了区党部和区分部。</p>
<p>党员分布中地域向西南转移。职业中政府机关公务员比例急剧上升,但官员不加甄别强制入党也导致旧权力成为党内官僚。党组织对党员质量不问,党员信仰不顾,党籍管理混乱,一味追求数量扩张,大多数党员游离于党组织之外。</p>
<h1 id="战后"><a href="#战后" class="headerlink" title="战后"></a>战后</h1><p>CC系长期把持党政,引起其他派系不满。六大中,以CC系为一方,以三青团、黄埔系、朱家华系、新桂系等为另一方分化为两大阵营,两大阵营相当。新中委中CC系凭借蒋的偏袒再次获得绝对优势,站总数1/4以上。</p>
<p>蒋空前扩增中委名额,意图缓解各派系矛盾,但不仅没能弥合纷争,反而流失党心。“六大”前后,人心涣散。</p>
<p><strong>1944~1947”党政革新运动“</strong>:虽然没有多少具体成果,但也有重要意义。革新集团是一个跨派系的松散结合,最早由一批CC分子聚会清谈,最初矛头指向孔、翁等政学系成员。1944年KMT五届十二中全会,他们形成初步同盟,痛愤KMT无能,甚至对蒋的领导方式不满。蒋虽然也对KMT失望,但无疑接受革新分子的要求,一方面也可能是考虑到三青团造成的困扰。这条战线也有黄埔/三青团参与,因为他们都有强烈的政治诉求且在反共问题上高度一致,这里更像是代际之争。政学系主导了国共谈判,革新分子趁机攻击政学系牺牲党的利益,蒋虽对他们感到不满,但还是勉强同意了中常委任命。1946年革新派在重庆中央党部举行了公开的党政革新座谈会,在党内党外公开革新目标,革新运动扩大为一场波及全党的政治运动。</p>
<p>在革新分子看来,KMT腐败的根源是北伐军事胜利,政治失败,失去了革命性。革新分子认为党和党员脱节、和民众疏离、政权旁落官僚等等。“国民党理论家”叶青归纳党务缺点:1、组织散漫,2、党员腐化,3、工作松懈,4、派别分歧。因而要求党内民主。</p>
<p>革新分子对KMT猛烈批评,一致认为是成败兴亡的关头。在他们看来三民主义仍是最好的主义,KMT只要唤起革命精神就能获得新生。革新运动除了几场清议和刊物外,并无多少实际成果。1946年10月KMT中央形式上发动一次流于形式的党员总清查。但是革新运动批判北伐后的失策、攻击政学系,后遭到蒋的严厉训斥解散。</p>
<h1 id="总结"><a href="#总结" class="headerlink" title="总结"></a>总结</h1><p>弱势独裁党的必然命运</p>
<p>KMT控制只到政治表层,而没有深入社会内部</p>
<p>一党专政+三民主义导致有集权的委员会又有分权的独立机关</p>
<p>党员对派系的忠诚超过了对党的忠诚</p>
<p>军>政>党</p>
<p>特务组织猖狂与其党机器无能有关</p>
]]></content>
<categories>
<category>喵后记</category>
</categories>
<tags>
<tag>琉璃猫</tag>
</tags>
</entry>
<entry>
<title>复杂性问题</title>
<url>/2020/03/20/complexity/</url>
<content><![CDATA[<p>P/NP</p>
<h3 id="PCP-History"><a href="#PCP-History" class="headerlink" title="PCP History"></a>PCP History</h3><p>PCP Theorem begins at MIT in the early 1980s: <em>The Knowledge Complexity of Interactive Proof Systems(Goldwasser, Micali, Rackoff)</em>,文中给出如下定义:</p>
<p>定义 1:<strong>IP(Interactive Proofs)</strong>定义为一个验证者(verifier)和全能的证明者(prover)进行多项式轮交互,正确的论述一定通过 (“completeness”),错误的论述会有至少1/2的概率不通过 (“soundness”) </p>
<p>独立于上述工作的<em>Arthur-Merlin Games: A Randomized Proof System, and a Hierarchy of Complexity Classes(Babai, Moran)</em>,定义如下:</p>
<p>定义 2:<strong>AM[k]</strong>是k轮的交互过程。</p>
<p>Babai证明了(定理 1)对任何常数k,AM[k]=AM[2],因此AM[2]也被写作AM。AM[poly]和IP很相似,区别在于coin是否public,Goldwasser和Sipser很快证明了他们等价。</p>
<a id="more"></a>
<p>定义 3:Graph Non-Isomorphism是给定两个图的邻接表,判断他们是否同构</p>
<p>定理 2: Graph Non-Isomorphism是IP问题。(证明:随机重命名图,然后给prover判断是哪个)</p>
<p>定义 4:<strong>MIP</strong>是和多个独立Prover的交互问题。(Ben-Or, Goldwasser, Kilian, Wigderson, 1988)(他们还证明了多个Prover和两个Prover等价)</p>
<p>定理 3:$P^{井P}\subseteq IP$(Lund, Fortnow, Karloff, Nisan, 1990)</p>
<p>定理 4:IP=PSPACE(Shamir, 1990)</p>
<p>定理 5:MIP=NEXP(Babai, Fortnow, Lund, 1990)</p>
<p>人们试图给Verifier加限制,比如空间限制,Condon证明了NP是Verifier有对数空间和单向读权限的IP,另一个限制是时间,但是B-F-L-S证明了Prover用特定语言来写证明就可以在多项式时间内证明所有NP。最有趣的是同时限制Verifier的随机数数量和Proof的大小,其定义如下</p>
<p>定义 5:$PCP[r(n),q(n)]$是PCP系统,使用$O(r(n))$字节的Randomness,$O(q(n))$字节的Proof,并且completeness 1,soundness 1/2。</p>
<p>在这个定义下,$MIP=NEXP$的结果等价于$NEXP\subseteq PCP[poly, poly]$。B-F-L-S关于时间的限制的结论等价于$NP\subseteq PCP[polylog, polylog]$。</p>
<p>定理 6:$NP\subseteq PCP(f(n), f(n))$,其中$f(n)=log(n)log(log(n))$,进一步,MAX-CLIQUE无法近似除非$NP\subseteq DTIME(n^{log(log(n))})$(FGLSS,FOCS,1991)</p>
<p>看上去$NP\subseteq PCP[log(n),log(n)]$是必然的,最终在1992年得到证明,query的数量约$10^6$</p>
<p>定理 7: $NP\subseteq PCP[log(n), log(n)]$,实际上$NP\subseteq PCP[log(n), log(n)^{.5+\epsilon}]$(Arora,Safra,1992)</p>
<p>定理 8(<strong>PCP定理</strong>):$NP\subseteq PCP[log(n), 1]$(Arora-Lund-Motwani-Sudan-Szegedy,1992)</p>
<h3 id="算子代数"><a href="#算子代数" class="headerlink" title="算子代数"></a>算子代数</h3><p><strong>Connes‘ embeddings conjecture(CEC)</strong>是算子代数最有名的开放问题之一,猜测任意有限冯诺依曼代数可以被有限维矩阵代数接近。</p>
<p>CEC有很多等价形式,其中之一是<strong>Tsirelson’s Problem</strong>,这个问题从Einstein-Podolsky-Rosen的问题出发,定义希尔伯特空间H,一个Projection valued measure(PVM)定义为H上投影的有限集合$\{P_1,…,P_m\}$满足$\sum P_i=Id$。对于有限指标集$X,Y,A,B$,Tsirelson考虑凸子集$Q_{ABXY}^C$(commuting)和$Q_{ABXY}^S$(spatial),定义如下</p>
<script type="math/tex; mode=display">
Q_{ABXY}^C=\{(<\phi,A_a^xB_b^y\phi>)_{a,b,x,y}:\phi\in H,\\
\{A_a^x\}_{a\in A},\{B_b^y\}_{b\in B}PVM,[A_a^x,B_b^y]=0\}</script><script type="math/tex; mode=display">
Q_{ABXY}^S=\{(<\phi,A_a^x\otimes B_b^y\phi>)_{a,b,x,y}:\phi\in H_A\otimes H_B,\\
\{A_a^x\}_{a\in A},\{B_b^y\}_{b\in B}PVM\:on\:H_A,H_B,\:resp.\}</script><p>Tsirelson起初声称两者相等,但很快他把两者是否相等重新设定为开放问题。约25年后Slofstra证明了两者不等,但$\bar{Q_{ABXY}^S}=Q_{ABXY}^C$是否成立依旧开放。Ozawa证明了这个问题和CEC等价,这样将这个问题从量子力学领域转移到算子代数领域。</p>
<p>Tsirelson的问题的提出源自量子力学的<strong>entanglement</strong>现象。在E-P-R之后30年,Bell提出<strong>Bell实验</strong>,假设两个物理系统从任意状态初始,假设两个系统可以分别被有限集合$A^x,x\in X$和$B^y,y\in Y$度量,假设通过度量产生$(a,b)\in A\times B$,定义<strong>correlation set</strong>为包含所有$p_{abxy}$的凸集$K_{ABXY}\subseteq [0,1]^{A\times B\times X\times Y}$。Bell实验需要联合可测性,冯诺依曼证明这等价于$A^x\in O_A$和$B^y\in O_B$可交换。谱分解为$A^x=\sum_a\lambda_aA_a^x$和$B^y=\sum_b\mu_bB_b^y$,然后可以定义观测到$(a,b)$的概率,可以证明这是well-defined分布族,也即上文定义的$Q_{ABXY}^C$。Bell实验可以表示为<strong>nonlocal game</strong>。</p>
<p><strong>从IP到MIP</strong>(上文PCP已详述)Babai证明了$NEXP\subseteq MIP$,进而有PCP定理。</p>
<p>一个nonlocal game有一个Verifier和两个Prover(这里也是Player),每次Verifier从$X\times Y$中选择一对问题$(x,y)$,然后分别发送给两个Prover,得到$a\in A$和$b\in B$两个答案,然后评价$V(a,b|x,y)\in \{0,1\}$。如果V=1,那么认为Prover获胜,否则他们失败。Verifier的问题分布$\pi$已知,V公开,Player可以有预先设定的策略。Player的两个策略函数$f_A:X\times \Omega\to A$,$f_B:Y\times\Omega\to B$,在经典意义下</p>
<script type="math/tex; mode=display">
\omega(G)=\sup_{f_A,f_B}\sum_{x,y}\pi(x.y)\sum_{a,b}V(a,b|x,y)\times\int_\Omega1_{f_A(x,\omega)=a}1_{f_B(y,\omega)=b}d\omega</script><p>Spatial value</p>
<script type="math/tex; mode=display">
\omega^S(G)=\sup_{A^x,b^y}\sum_{x,y}\pi(x,y)\sum_{a,b}V(a,b|x,y)\times<\phi,(A_a^x\otimes B_b^y)\phi></script><p>Commuting value</p>
<script type="math/tex; mode=display">
\omega^C(G)=\sup_{A^x,b^y}\sum_{x,y}\pi(x,y)\sum_{a,b}V(a,b|x,y)\times<\phi,A_a^xB_b^y\phi></script><p>$\omega(G)\leq \omega^S(G)\leq\omega^C(G)$,上文Tsirelson问题等价于$\omega^S(G)=\omega^C(G)$</p>
<p>我们首先证明$\omega(G)<\omega^S(G)$,以Magic Square(MS)为例,游戏规则如下</p>
<p><img src="ms.png" alt=""></p>
<p>可以得到classical value $\omega(MS)=17/18<1$,而spatial value $\omega^S(MS)=1$</p>
<p>一系列复杂性理论提出了技术来抵抗Prover对entanglement的利用。现在我们知道任何证明系统都可以使得entanglement不再有用,并得出结论$NEXP=MIP\subseteq MIP^*$。前一半等号的证明由Babai等给出。Natarajan和Wright证明了MIP<em>严格大于NEXP,并且$NEEXP\subseteq MIP^\</em>$。</p>
<p>From below,$O(|X|log|A|+|Y|log|B|)$在多项式时间内,所以$MIP\subseteq NEXP$。在entanglement的情况下,对固定维数d,可以找到一连串有限网络$N_1\subseteq … \subseteq N_k\subseteq …$,$N_k$的大小为$k^{O(d^2)}$,那么对d维的任意策略,有$N_k$中的策略和其误差在$1/k$。令$\omega_{\leq n}^S$表示$d,k\leq n$时$N_k$在d维下的最高准确率。那么$\{\omega_{\leq n}^S\}$是个有界非减数列,并收敛到Spatial Value $\omega^S(G)$。这里Commuting value并没有有限维逼近。</p>
<p>From above,有一种”dual approach”,最简单的方法就是用一个系数$\alpha_{abxy}$代替$<\phi,A_a^xB_b^y\phi>$,然后考虑其最大值,当然这回极大的高估,所以可以通过引入限制来修正,比如对任意x,y,系数对a,b求和为1,又如增加层次性限制,引入了形如$<\phi,(A_{a_1}^{x_1}B_{b_1}^{y_1}A_{a_2}^{x_2}…B_{b_k}^{y_k})\phi>$,然后考虑在所有乘积长度小于等于n的约束下的最大值,得到非降数列$\{\omega_{\leq n}^C\}$,它收敛到$\omega^C(G)$。</p>
<p>如果$\bar{Q^S}=Q^C$,现在考虑MIP<em>中的问题L,这意味着有方法可以将问题的实例转换为$G=\{\pi(x,y)V(a,b|x,y)\}$,如果是正例,$\omega^S(G)$接近1,否则会小很多。执行G的算法,可以发现任何L的成员可以被可停机的算法决定,这就是说明$MIP\</em>$是<strong>decidable</strong>。Slofstra证明了如果没有2/3-1/3 promise,那么$\omega^S(G)=1$是<strong>undecidable</strong>,这样就没有<strong>finite gap $\delta$</strong>使得下界达到$1-\delta$。</p>
<p><strong>2020年1月已经证明了$MIP^*=RE$</strong></p>
]]></content>
<categories>
<category>猫爪记</category>
<category>Computer-Science</category>
</categories>
<tags>
<tag>琉璃猫</tag>
</tags>
</entry>
<entry>
<title>随机过程论</title>
<url>/2020/02/18/StochasticProcess/</url>
<content><![CDATA[<h1 id="条件期望"><a href="#条件期望" class="headerlink" title="条件期望"></a>条件期望</h1><p>给定概率空间$(\Omega,F,P)$,随机变量X,定义随机变量$Y=E(X|F)$如果它满足</p>
<ul>
<li>$Y\in F$</li>
<li>for all $A\in F$,$\int_A XdP = \int_A YdP$</li>
</ul>
<p>显然Y可积且唯一</p>
<p><strong>Radon-Nikodym定理</strong>:测度$\nu <<\mu$,那么存在函数$f\in F$,对所有$A\in F$,</p>
<script type="math/tex; mode=display">
\int_A fd\mu=\nu(A)</script><p>先假设$X\geq 0$然后显然$\nu(A)=\int_A XdP$是测度,所以易证条件期望存在。</p>
<a id="more"></a>
<p>几个例子(小污猫说“这几个例子很重要”)</p>
<ul>
<li><p>$X\in F$,那么$E(X|F)=X$</p>
</li>
<li><p>$X$与$F$独立,则$E(X|F)=EX$</p>
</li>
<li><p>$F=\sigma(\Omega_1,\Omega_2,…)$,则$E(X|F)=\frac{E(X;\Omega_i)}{P(\Omega_i)}\:on\:\Omega_i$。所以初等概率论里的条件期望是其一个特例。</p>
</li>
<li><p>$X$,$Y$有联合概率密度$f(x,y)$,则</p>
<script type="math/tex; mode=display">
E(g(X)|Y)=h(Y)=\frac{\int g(x)f(X,y)dx}{\int f(X,y)dx}</script></li>
<li><p>$X$,$Y$独立,$E(\phi(X,Y)|X)=E(\phi(x,Y))$</p>
</li>
</ul>
<p>性质:</p>
<ul>
<li>$E(aX+Y|F)=aE(X|F)+E(Y|F)$</li>
<li>$X\leq Y\Rightarrow E(X|F)\leq E(Y|F)$</li>
<li>$X_n\geq 0$,$X_n\uparrow X$,$EX<\infty$,那么$E(X_n|F)\uparrow E(X|F)$(Levi单调收敛定理)</li>
<li>$X_n\geq 0$,$E(lim_{n\to\infty}X_n|F)\leq lim_{n\to\infty}E(X_n|F)$(Fatou引理,由lim xn=lim inf xk)</li>
<li>$|X_n|<Y<\infty$,$lim_{n\to\infty}X_n=X$,那么$lim_{n\to\infty}E(X_n|F)=E(X|F)$(Lebesgue控制收敛定理)</li>
<li>如果$\phi$凸,则$\phi(E(X|F))\leq E(\phi(X)|F)$(Jensen不等式,直线显然,然后利用直线包络)</li>
<li>$F\subset G$,且$E(X|G)\in F$,那么$E(X|F)=E(X|G)$</li>
<li>$F\subset G$,那么$E(E(X|F)|G)=E(E(X|G)|F)=E(X|F)$(条件期望平滑性)</li>
</ul>
<p>如果$X\in F$且$E|X|\:,\:E|XY|<\infty$,那么$E(XY|F)=XE(Y|F)$。(典型four-step的证明)</p>
<h2 id="正则条件概率:"><a href="#正则条件概率:" class="headerlink" title="正则条件概率:"></a>正则条件概率:</h2><p>可测映射$X\::\:(\Omega,F)\rightarrow (S,S)$(随机变量)。for X given G,<strong>正则条件分布</strong>$\mu\::\:\Omega\times S\rightarrow [0,1]$满足</p>
<ul>
<li>对每个A,$\omega\rightarrow\mu(\omega,A)$是$P(X\in A|G)$的一个版本</li>
<li>对a.e. $\omega$,$A\rightarrow\mu(\omega,A)$是一个$(S,S)$上的测度。</li>
</ul>
<p>如果$S=\Omega$,X是恒等映射,$\mu$是<strong>正则条件概率</strong>。(此时$\mu(A)=PX^{-1}(A)=P(X\in A)$)</p>
<p>正则条件分布可以<strong>同时计算X的所有函数的条件期望</strong>。</p>
<p>由$E(f(x))=\int_R f(x)dPX^{-1}$可得</p>
<p>定理:$\mu(\omega,A)$是<strong>正则条件分布</strong>,$f:(S,S)\rightarrow (R,R)$,且$E|f(X)|<\infty$,那么f关于测度$\mu(\omega,·)$的积分存在,且</p>
<script type="math/tex; mode=display">
E(f(x)|F)(\omega)=\int \mu(\omega,dx)f(x)\:a.s.</script><p>正则条件分布并不总是存在。但是当$(S,S)$ <strong>is nice</strong>的时候,它总是存在。(定义:<strong>好的可测空间是指标准Borel空间</strong>,即存在从$S\to R$的一一可测映射。若S是<strong>Polish空间(完备+可分)的Borel子集</strong>,S是S上Borel $\sigma$域,那么是一个好的可测空间)</p>
<p>证明:设$\phi:S\to R$是一一可测映射。则$\phi(X):(\Omega,F)\to(R,R)$,那么,$\forall A\in S$</p>
<script type="math/tex; mode=display">
P(X\in A|G)=P(\phi(X)\in\phi(A)|G)\\
=P(Y\in\phi(A)|G)=P(Y\in B|G)\\
(B=\phi(A)\in R)</script><p>然后构造$Y=\phi(x)$关于G的正则条件分布函数$P(Y\leq y|G)$:取除掉一个零测集以外的集合$\Omega_0$使得任意$\omega\in\Omega_0$</p>
<script type="math/tex; mode=display">
G(q,\omega)=P(Y\leq q|G)(\omega)</script><p>然后$F(x,\omega)=inf\{G(q,\omega),q>x\}$。所以$F(x,\omega)$是$P(\phi(X)\leq x|G)$的一个版本。然后得到度量$\nu(\omega,·)$</p>
<script type="math/tex; mode=display">
\nu(w,(-\infty,x])=F(x,\omega)</script><p>然后得到$\mu(\omega,A)=\nu(\omega,\phi(A))$</p>
<p>定理:X,Y在<strong>nice space</strong> (S,S)中取值,$G=\sigma(Y)$,那么存在$\mu\::\:S\times S\rightarrow [0,1]$,</p>
<ul>
<li>对每个A,$\mu(Y(\omega),A)$是$P(X\in A|G)$</li>
<li>对a.e. $\omega$,$A\rightarrow\mu(Y(\omega),A)$是$(S,S)$上的测度</li>
</ul>
<h1 id="鞅过程Martingales"><a href="#鞅过程Martingales" class="headerlink" title="鞅过程Martingales"></a>鞅过程Martingales</h1><p>$F_n$是一个递增的$\sigma$-域序列,如果序列$X_n$满足</p>
<ul>
<li>$E|X_n|<\infty$</li>
<li>$Xn\in F_n$</li>
<li>$E(X_{n+1}|F_n)=x_n$</li>
</ul>
<p>则称$X_n$为<strong>鞅过程</strong>。</p>
<p>如果第三个条件改为$E(X_{n+1}|F_n)\geq(\leq) X_n$,则称为<strong>下鞅(上鞅)</strong></p>
<p>最常见的是线性鞅:$S_n=S_0+\sum_{k=1}^n e_k$,$E(e)=0$。如果$E(e)\leq(\geq)0$,则为上鞅(下鞅)。</p>
<p>定理:鞅过程满足$E(X_n|F_m)=X_m$,$m<n$</p>
<p>定理:凸函数$\phi$,那么$\phi(X_n)$下鞅。即$E(\phi(X_{n+1})|F_n)\geq \phi(E(X_{n+1}|F_n))=\phi(X_n)$。如果$X_n$下鞅,$\phi$增也有此结论。</p>
<p>定义$H_n$为<strong>可预测序列</strong>,即$H_n\in F_{n-1}$。定理:$X_n$上鞅,那么如果$H_n\geq 0$有界,则$(H\cdot X)_n$也是上鞅。显然对下鞅和鞅也有类似结论。</p>
<p>定理:若N是停时,$X_n$上鞅,则$X_{N\wedge n}$也是上鞅。</p>
<h2 id="鞅收敛定理"><a href="#鞅收敛定理" class="headerlink" title="鞅收敛定理"></a>鞅收敛定理</h2><p>$\lim_{n\to\infty}X_n(\omega)$不存在$\Leftrightarrow\lim_{n\to\infty}inf\:X_n(\omega)<\lim_{n\to\infty}sup\:X_n(\omega)$,也等价于存在有理数a,b:</p>
<script type="math/tex; mode=display">
\lim_{n\to\infty}inf\:X_n(\omega)<a<b<\lim_{n\to\infty}sup\:X_n(\omega)</script><p>定义$N_{2k-1}$为第k次下穿a的停时,$N_{2k}$是第k次上穿b的停时。定义$U_n=\{sup\:k|N_{2k}<n\}$为上穿[a,b]的次数。而</p>
<script type="math/tex; mode=display">
\{\lim_{n\to\infty}inf\:X_n(\omega)<a<b<\lim_{n\to\infty}sup\:X_n(\omega)\}\subset \{\lim_{n\to\infty}U_n(\omega)=+\infty\}</script><p>定义$H_m=1_{\bigcup\{N_{2k-1}\leq m\leq N_{2k}\}}$,$W_n=\sum_{m-1}^nH_m(X_m-X_{m-1})$,</p>
<p>(<strong>下鞅上穿不等式</strong>)若$X_n$下鞅,则对a<b,$(b-a)EU_n\leq E(X_n-a)^+-E(X_0-a)^+$(证明:定义$Y_n=a+(X_n-a)^+$,则也是下鞅且上穿次数与$X_n$相等。那么$W_n=\sum_{m=1}^nH_m(Y_m-Y_{m-1})$\geq (b-a)U_n$。又令$K_m=1-H_m$,$V_n=\sum_{m=1}^nK_m(Y_m-Y_{m-1})$。那么$W_n+V_n=Y_n-Y_0$,且$V_n$下鞅,$EV_N\geq EV_0=0 $。所以</p>
<script type="math/tex; mode=display">
E(Y_n-Y_0)=EW_n+EV_n\geq EW_n\geq(b-a)EU_n</script><p> 即得证)</p>
<p>利用上穿不等式,得到</p>
<p>(<strong>下鞅基本收敛定理</strong>) 如果下鞅$X_n$满足$sup\:EX_n^+<\infty$,则$X_n\to X$a.s.,且$E|X|<+\infty$。(证明:$(X_n-a)^+$是下鞅,根据上穿不等式$EU_n\leq E(X_n-a)^+/(b-a)$有界,而根据$U_n$单调上升必有极限$U$,因此</p>
<script type="math/tex; mode=display">
P(\lim_{n\to\infty}inf\:X_n<a<b<\lim_{n\to\infty}sup\:X_n)=0</script><p>所以$X_n$极限a.s.存在。又由于$EX_n\geq EX_0$,$EX_n^-=EX_n^+-EX_n\leq sup\:EX_n^+-EX_0<+\infty$然后由Fatou引理易得$E|X|<+\infty$。)</p>
<p> 定理:若$X_n$非负上鞅,则$\lim X_n=X$a.s.,且$EX\leq EX_0$。(证明:$-X_n$下鞅有界,a.s.收敛到极限X。)</p>
<p><strong>注意:L1收敛并不成立。</strong>一个简单的反例就是$S_0=1$,$P(e_i=-1)=P(e_i=1)=1/2$,N为$S_n=0$的停时,$X_n=S_{n\wedge N}$是鞅。但是由上面的定理可知$X\to 0$a.s.,与$EX_n=1$矛盾。</p>
<h2 id="四个例子"><a href="#四个例子" class="headerlink" title="四个例子"></a>四个例子</h2><h3 id="有界增长"><a href="#有界增长" class="headerlink" title="有界增长"></a>有界增长</h3><p>$X_n$为鞅过程,且$|X_{n+1}-X_n|\leq M<\infty$,那么要么$lim\:X_n$存在且有限,要么$X_n$在正负无穷之间摇摆。(停时$N=inf\{X_n\leq k\}$,那么$x_{n\wedge N}+k+M$a.s.收敛)</p>
<p>(Doob分解)下鞅$X_n$可以写成$X_n=M_n+A_n$。其中$M_n$是鞅过程,$A_n$是可预测序列。(令$A_n-A_{n-1}=E(X_n|F_{n-1})-X_{n-1}$)</p>
<p>(第二Borel-Cantelli引理)$A_n\in F_n$,那么</p>
<script type="math/tex; mode=display">
\{A_n\:i.o.\}=\{\sum_{n=1}^\infty P(A_n|F_{n-1})=\infty\}</script><p>(第二B-C引理是第一引理的推广,去掉了独立性要求)</p>
<p>证明:由Doob分解可得$M_n=\sum_{m=1}^n 1_{A_m}-P(A_m|F_{m-1})$是有界增长的鞅过程。</p>
<h3 id="Polya’s-Urn-Scheme"><a href="#Polya’s-Urn-Scheme" class="headerlink" title="Polya’s Urn Scheme"></a>Polya’s Urn Scheme</h3><p>坛子模型:坛子里有r个红球、g个绿球,每次取出一个并放进与之同色的c+1个球。n次抽取后绿球比例$X_n$是鞅。</p>
<p>如果r=g=c=1,可得$P(X_n=\frac{k}{n+2})=\frac{1}{n+1}$。</p>
<p>实际上,$X_\infty$有参数为$g/c$和$r/c$的beta分布:</p>
<script type="math/tex; mode=display">
\frac{\Gamma((g+r)/c)}{\Gamma(g/c)\Gamma(r/c)}x^{(g/c)-1}(1-x)^{(r/c)-1}</script><h3 id="R-N微分"><a href="#R-N微分" class="headerlink" title="R-N微分"></a>R-N微分</h3><p>有限测度$\mu$,$\nu$,上升的$\sigma-$域$F_n$,定义$\mu_n=\mu|F_n$,$\nu_n=\nu|F_n$。</p>
<p>定理:若$\mu_n<<\nu_n$,定义$X_n=\frac{d\mu_n}{d\nu_n}$,令$X=\lim_{n\to\infty}sup\:X_n$,则</p>
<script type="math/tex; mode=display">
\mu(A)=\int_AXd\nu+\mu(A\cap\{X=+\infty\})</script><p>证明:根据定义,$A\in F_n$,则$\mu(A)=\int_AX_nd\nu$。$X_n$是非负鞅,所以$X_n\to X$a.s.。又令$\rho=(\mu+\nu)/2$,$\rho_n=\rho|F_n$,$Y_n=\frac{d\mu_n}{d\rho_n}$,$Z_n=\frac{d\nu_n}{d\rho_n}$。显然$Y_n$和%Z_n$都是非负鞅,且$Y_n+Z_n=2$a.s.。所以有$Y_n\to Y$,$Z_n\to Z$。记$Y=\frac{d\mu}{d\rho}$,$Z=\frac{d\nu}{d\rho}$。那么对$A\in F_n$,则由有界收敛</p>
<script type="math/tex; mode=display">
\mu(A)=\mu_n(A)=\int_AY_nd\rho\to\int_AYd\rho</script><p>$X_n=Y_n/Z_n$a.s.,而$Y+Z=2$a.s.,且$\rho(Y=0,Z=0)=0$。所以$X=Y/Z$,$\rho-$a.s.。</p>
<p>令$W=\frac{1}{Z}1_{\{Z>0\}}$所以$1=WZ+1_{\{Z=0\}}$。所以可得</p>
<script type="math/tex; mode=display">
\mu(A)=\int_AYd\rho=\int_AYWZd\rho+\int_AY1_{\{Z=0\}}d\rho</script><p>马上得证(第二部分由$\{Z=0\}=\{X=\infty\}$得到)。</p>
<p>由此推出<strong>Kakutani关于无穷乘积测度的二分法</strong>:$\mu$,$\nu$都是$(R^N,R^N)$上的概率测度,$e_n$独立,令$F_n(x)=\mu(e_n\leq x)$,$G_n(x)=\nu(e_n\leq x)$。</p>
<p>$\lambda_{F_n}<<\lambda_{G_n}$,令$q_n=\frac{d\lambda_{F_n}}{d\lambda_{G_n}}$。令$F_n=\sigma(e_m,m\leq n)$,$X_n=\frac{d\mu_n}{d\nu_n}=\prod q_n$。根据上面的定理,$X_n\to X$ $\nu-$a.s.,所以根据Kolmogorov 0-1律,$\nu(X=0)\in\{0,1\}$。因而$\mu<<\nu$或者两者正交。</p>
<p><strong>定理:$\mu\sim\nu$或者两者正交,根据$\prod\int\sqrt{q_m}dG_m$>0或=0进行判断</strong></p>
<p>证明:先证无穷乘积是有定义的。</p>
<p>如果$\prod\int\sqrt{q_m}dG_m=0$,那么$\int X_n^{1/2}d\nu\to 0$。而$\int X^{1/2}d\nu\leq\lim inf\:\int X_n^{1/2}d\nu =0$。所以$\nu(X=0)=1$,$\mu$和$\nu$相互独立。</p>
<p>反之,令$Y_n=X_n^{1/2}$,则$E(X_n)=E(Y_n^2)=1$。下证$Y_n$L2-基本列:$E(Y_{n+k}-Y_n)^2=2(1-\prod_{n+1}^{n+k} \int \sqrt{q_m}dG_m\to 0$。$E|X_{n+k}-X_n|\leq 2(E(Y_{n+k}-Y_n)^2)^{1/2}\to 0$,故而$X_n$是L1-基本列,$X_n\to X$。所以对$A\in F_n$</p>
<script type="math/tex; mode=display">
\mu(A)=\mu_n(A)=\int_AX_nd\nu_n=\int_AX_nd\nu\to\int_AXd\nu</script><p>有$\pi-\lambda$方法,A可以扩展到$R^N$,故而$\mu<<\nu$。</p>
<p>$EX=\lim EX_n=1$,所以$\nu(X=0)<1$,故而$\nu(X=0)=0$,$\nu(X>0)=1$,$\mu\sim\nu$。</p>
<h3 id="分支过程"><a href="#分支过程" class="headerlink" title="分支过程"></a>分支过程</h3><p>$e_n$独立非负,定义$Z_n$,满足$Z_0=1$以及</p>
<script type="math/tex; mode=display">
Z_{n+1}=\left\{\begin{array}.e_1^{n+1}+...+e_{Z_n}^{n+1}\:if\:Z_n>0\\0\:otherwise\end{array} \right.</script><p>也叫做Galtom-Watson过程,描述繁衍过程。</p>
<p><em>引理:令$\mu=E(e_i^n)$,则$\{Z_n/\mu^n\}$是鞅过程 。</em></p>
<p>定理:若$\mu<1$,则对所有足够大的n,$Z_n=0$。因此$Z_n/\mu^n\to^{a.s.}0$</p>
<p>(由$E(Z_n/\mu^n)=E(Z_0)=1$得$E(Z_n)=\mu^n\to 0$可得)</p>
<p>定理:若$\mu=1$且$P(e_i^m=1)<1$,那么对所有足够大的n,$Z_n=0$。</p>
<p>(证明从$P(Z_n=k,n\geq N)=0$入手)</p>
<p>定理:若$\mu>1$,$P(Z_n>0,\forall n)>0$</p>
<p>定理:(Kesten-Stigum)</p>
<script type="math/tex; mode=display">
P(W=\lim \frac{Z_n}{\mu^n}>0)>0\Leftrightarrow\sum P_kkln(k)<+\infty</script><h2 id="Doob不等式-以及LP收敛"><a href="#Doob不等式-以及LP收敛" class="headerlink" title="Doob不等式(以及LP收敛)"></a>Doob不等式(以及LP收敛)</h2><p>定理:设$X_n$下鞅,N有界停时,$P(N\leq k)=1$,那么$EX_0\leq EX_N\leq EX_k$。</p>
<p>证明:$X_n$和$X_{N\wedge n}$下鞅,$Y_n=X_n-X_{N\wedge n}$下鞅,$EY_0\leq EY_k$得到$EX_N\leq EX_k$。</p>
<p>(反例:当N不是有界的时候,不一定成立,考虑SRW,$S_0=1$,停时N为0的首达时,此时$ES_N=0$。)</p>
<p><strong>(Doob不等式)</strong>$X_m$下鞅,令$\bar{X_n}=\max_{0\leq m\leq n}X_m^+$,$A=\{\bar{X_n}\geq\lambda\}$,那么</p>
<script type="math/tex; mode=display">
\lambda P(A)\leq EX_n1_A\leq EX_n^+</script><p>证明:令$N=\inf\{m\geq 0, X_m\geq\lambda\}\wedge n$,在A上$X_N\geq\lambda$,所以$X_N1_A\geq \lambda 1_A$,$\lambda P(A)\leq EX_N1_A$,根据$A^C$上$N=n$,$EX_N1_A\leq EX_n1_A$。右边不等号显然。</p>
<p><strong>(LP不等式)</strong>下鞅$X_n$,p>1,那么</p>
<script type="math/tex; mode=display">
E(\bar{X_n})^p\leq(\frac{p}{p-1})^pE(X_n^+)^p</script><p>特别的,若$Y_n$是鞅过程,$Y_n^*=\max|Y_m|$,那么</p>
<script type="math/tex; mode=display">
E(Y_n^*)^p\leq (\frac{p}{p-1})^pE|Y_n|^p</script><p>证明:$E(X_n^+)^p=+\infty$则显然成立。下设$E(X_n+)^p<+\infty$,考虑$\bar{X_n}\wedge M$,所以</p>
<script type="math/tex; mode=display">
E(\bar{X_n}\wedge M)^p=\int_0^\infty p\lambda^{p-1}P(\bar{X_n}\wedge M\geq\lambda)d\lambda\\
\leq\int_0^\infty p\lambda^{p-1}(\lambda^{-1}EX_n^+1_{\{\bar{X_n}\wedge M\}\geq\lambda})d\lambda\\
=\int X_n^+\int_0^{\bar{X_n}\wedge M}p\lambda^{p-2}d\lambda dp\\
=\frac{p}{p-1}\int X_n^+(\bar{X_n}\wedge M)^{p-1}dp\\
\leq\frac{p}{p-1}(E(X_n^+)^p)^{1/p}(E(\bar{X_n}\wedge M)^p)^{(p-1)/p}</script><p>移项并令$M\to+\infty$由单调收敛定理可得证。</p>
<p><strong>(LP收敛定理)</strong>若$X_n$鞅,满足$sup\:E|X_n|^p<+\infty$,$p>1$,那么</p>
<script type="math/tex; mode=display">
X_n\to^{a.s.}X,\:X_n\to^{LP}X</script><p><strong>(鞅增量正交性)</strong>若$X_n$鞅,$EX_n^2<\infty$,若$Y\in F_m$,$EY^2<\infty$,那么$E(X_n-X_m)Y=0$。</p>
<p><strong>(条件方差公式)</strong>若$X_n$鞅,$EX_n^2<\infty$,则$E((X_n-X_m)^2|F_m)=E(X_n^2|F_m)-X_m^2$。</p>
<h3 id="平方可积鞅"><a href="#平方可积鞅" class="headerlink" title="平方可积鞅"></a>平方可积鞅</h3><p>$X_n$鞅,$X_0=0$,且$EX_n^2<+\infty$,$X_n^2$下鞅,因而可以Doob分解为$X_n=M_n+A_n$,$M_n$鞅,而$A_n$非降。定义$A_\infty=\lim_{n\to\infty}A_n$。</p>
<script type="math/tex; mode=display">
A_n=\sum_{m=1}^nE((X_m-X_{m-1})^2|F_{m-1})</script><p>定理:$E\sup_{n\geq 0}|X_n|^2\leq 4 EA_\infty$(由LP不等式和单调收敛定理即得)</p>
<p>定理:在$\{A_\infty<\infty\}上$\lim_{n\to\infty}X_n$a.s.存在有限。</p>
<p>证明:取停时$N=\inf\{n\geq 0,\:A_{n+1}>a^2\}$,所以$X_{N\wedge n}$鞅。根据LP收敛定律,$X_{N\wedge n}$极限存在有限。所以在$\{A_\infty\leq a^2\}上$N=+\infty$,然后取并可得。</p>
<p>定理:设$f:[0,+\infty)\to [1,+\infty)$非降且$\int_0^\infty \frac{1}{f^2(t)}dt<+\infty$,则在$\{A_\infty=\infty\}$上$\frac{X_n}{f(A_n)}\to^{a.s.}0$</p>
<p>证明:$H_n=\frac{1}{f(A_m)}$可料有界,则$Y_n=\sum_{m=1}^nH_m(X_m-X_{m-1})$鞅。分解$Y_n^2=N_n+B_n$,可证$B_\infty<+\infty$,$Y_n\to^{a.s.}T_\infty$有限,由Kronecker引理得证。</p>
<p>定理(第二Borel-Cantelli定理):$P_n=P(B_n|F_{n-1})$,那么在$\{\sum_{n=1}^\infty P_n=\infty\}$上</p>
<script type="math/tex; mode=display">
\frac{\sum_{m=1}^n1_{B_m}}{\sum_{m=1}^nP_m}\to^{a.s.}1</script><p>证明:定义$X_n=\sum_{m=1}^n1_{B_m}-\sum_{m=1}^nP_m$,定义$f(t)=t\vee 1$,由上可得。</p>
<h3 id="一致可积L1收敛"><a href="#一致可积L1收敛" class="headerlink" title="一致可积L1收敛"></a>一致可积L1收敛</h3><p>一致可积$\{X_i,\:i\in I\}$满足</p>
<script type="math/tex; mode=display">
\lim_{M\to\infty}\sup E|X_i|1_{|X_i|>M}=0</script><p>(一致)绝对连续$\{X_i,\:i\in I\}$满足</p>
<script type="math/tex; mode=display">
\lim_{p(A)\to 0}\sup E|X_i|1_A=0</script><p><u>一致可积当且仅当绝对连续+L1有界</u></p>
<p>定理:$X\in L1(\Omega,F_0,P)$,那么$\{E(X|F),\:F是子\sigma-域\}$一致可积</p>
<p>定理:若$X_n\to^P X$则下列叙述等价</p>
<ul>
<li>$\{X_n\}$一致可积</li>
<li>$X_n\to{L1}X$</li>
<li>$E|X_n|\to E|X|<+\infty$</li>
</ul>
<p>证明:$(1)\Rightarrow (2)$:构造辅助函数$\phi_M(x)=trunc(x, -M, M)$。$(2)\Rightarrow (3)$:显然。$(3)\Rightarrow (1)$:构造辅助函数</p>
<script type="math/tex; mode=display">
\phi_M(x)=\left\{\begin{align}&x,&x\in[0,M-1]\\&-(M-1)(x-M),&x\in[M-1,M]\\&0,&x\in[M,+\infty)\end{align} \right.</script><p>定理:设$p\in (0,+\infty)$,$\{X_n\}\subset LP(\Omega, F, p)$,随机变量$X_n\to^P X$那么下列叙述等价</p>
<ul>
<li>$\{|X_n|^p\}一致可积</li>
<li>$X\in LP$,$X_n\to^{LP}X$</li>
<li>$X\in LP$,$E|X_n|^p\to E|X|^p$</li>
</ul>
<p>定理:对下鞅$\{X_n\}$,下列叙述等价</p>
<ul>
<li>$\{X_n\}$一致可积</li>
<li>$X_n\to ^{a.s.}X$,且$X_n\to^{L1}X$</li>
<li>$X_n\to^{L1}X$</li>
</ul>
<p>引理:$X_n\to^{L1}X$,那么$\forall A$,$EX_n1_A\to EX1_A$</p>
<p>引理:若鞅$\{X_n\}$满足$X_n\to^{L1}X$,那么$X_n=E(X|F_n)$</p>
<p>定理:对鞅$\{X_n\}$,下列叙述等价</p>
<ul>
<li>$\{X_n\}$一致可积</li>
<li>$X_n\to ^{a.s.}X$,且$X_n\to^{L1}X$</li>
<li>$X_n\to^{L1}X$</li>
<li>存在可积随机变量X,$X_n=E(X|F_n)$</li>
</ul>
<p>定理:若$\sigma$域流$F_n\uparrow F_\infty$,$F_\infty=\sigma(\bigcup F_n)$,随机变量X满足$E|X|<+\infty$,那么$E(X|F_n)\to^{a.s.,L1} E(X|F_\infty)$。</p>
<p>证明:定义$Y_n=E(X|F_n)$是鞅过程。通过典型方法可得$EX1_A=EY_\infty 1_A$,因而$Y_n\to Y_\infty$。</p>
<p>定理(Levy 0-1律):若$F_n\uparrow F_\infty$,$A\in F_\infty$,那么$E(1_A|F_n)\to^{a.s.}1_A(n\to\infty)$</p>
<p>特例:独立随机变量$X_n$,$A\in\tau(尾\sigma 代数)$,则$E(1_A|F_n)=E1_A=P(A)$。($\tau=\bigcap_{n\geq 1}\sigma(X_{n+1},…)$)此时即为Kolmogorov 0-1律。</p>
<p>定理(条件期望控制收敛):$Y_n\to^{a.s.}Y$,$|Y_n|\leq Z$,$EZ<+\infty$,$F_n\uparrow F$,那么$E(Y_n|F_n)\to^{a.s.}E(Y|F_\infty)$</p>
<p>证明:</p>
<script type="math/tex; mode=display">
|E(Y_n|F_n)-E(Y|F_\infty)|\leq |E(Y_n|F_n)-E(Y|F_n)|+|E(Y|F_n)-E(Y|F_\infty)|</script><p>后一部分易证。为证明前一部分,令$W_N=\sup\{|Y_n-Y_m|,n,m\geq N\}$单调收敛可证。</p>
<h2 id="倒向鞅"><a href="#倒向鞅" class="headerlink" title="倒向鞅"></a>倒向鞅</h2><p>鞅$\{X_n:n\leq 0\}$称为倒向鞅,定义$F_{-\infty}=\bigcap F_n$</p>