24
24
25
25
7
26
26
00:00:13,640 --> 00:00:15,000
27
- 然后就不能再干了
27
+ 然后就不能再肝了
28
28
29
29
8
30
30
00:00:16,080 --> 00:00:18,640
31
- 虽然B站上面有些同学叫我干弟
31
+ 虽然B站上面有些同学叫我肝帝
32
32
33
33
9
34
34
00:00:18,720 --> 00:00:21,280
35
- 但实际上还是干不动了
35
+ 但实际上还是肝不动了
36
36
37
37
10
38
38
00:00:21,480 --> 00:00:23,200
84
84
85
85
22
86
86
00:00:55,800 --> 00:00:57,400
87
- 我们足快的打开来去看一下
87
+ 我们逐块打开来去看一下
88
88
89
89
23
90
90
00:00:57,400 --> 00:00:59,600
200
200
201
201
51
202
202
00:02:03,680 --> 00:02:06,440
203
- 包括MobileNet, EfficientNet, ServerNet, SquishNet
203
+ 包括MobileNet, EfficientNet, ServerNet, SqueezeNet
204
204
205
205
52
206
206
00:02:06,440 --> 00:02:08,840
216
216
217
217
55
218
218
00:02:13,320 --> 00:02:16,320
219
- 接着因为最近全苏莫特别的火
219
+ 接着因为最近Transformer特别的火
220
220
221
221
56
222
222
00:02:16,320 --> 00:02:20,280
223
- 而全苏莫的小型化的研究也是非常的热门
223
+ 而Transformer的小型化的研究也是非常的热门
224
224
225
225
57
226
226
00:02:20,280 --> 00:02:23,200
227
227
至少在这两年来说特别的热门
228
228
229
229
58
230
230
00:02:23,240 --> 00:02:25,440
231
- 所以我们会讲全苏莫小型化的
231
+ 所以我们会讲Transformer小型化的
232
232
233
233
59
234
234
00:02:25,440 --> 00:02:27,400
264
264
265
265
67
266
266
00:02:38,880 --> 00:02:42,000
267
- 其实跟系统相关的性也不太大
267
+ 其实跟系统相关性也不太大
268
268
269
269
68
270
270
00:02:42,000 --> 00:02:43,960
308
308
309
309
78
310
310
00:03:04,800 --> 00:03:06,960
311
- 接着我们去看看模型的剪辞
311
+ 接着我们去看看模型的剪枝
312
312
313
313
79
314
314
00:03:06,960 --> 00:03:08,400
320
320
321
321
81
322
322
00:03:10,880 --> 00:03:13,200
323
- 在端测是非常的热门
323
+ 在端侧是非常的热门
324
324
325
325
82
326
326
00:03:13,200 --> 00:03:14,880
332
332
333
333
84
334
334
00:03:18,320 --> 00:03:20,600
335
- 我们正式的进入到推力引擎的
335
+ 我们正式的进入到推理引擎的
336
336
337
337
85
338
338
00:03:20,600 --> 00:03:22,560
396
396
397
397
100
398
398
00:03:47,440 --> 00:03:48,280
399
- 是怎幺实现的
399
+ 是怎么实现的
400
400
401
401
101
402
402
00:03:48,280 --> 00:03:50,280
403
- 一些底层的one time的优化
403
+ 一些底层的runtime的优化
404
404
405
405
102
406
406
00:03:50,480 --> 00:03:52,520
548
548
549
549
138
550
550
00:04:59,480 --> 00:05:01,160
551
- 他就谈个对话机器人出来
551
+ 他就弹个对话机器人出来
552
552
553
553
139
554
554
00:05:01,160 --> 00:05:04,000
592
592
593
593
149
594
594
00:05:22,600 --> 00:05:24,280
595
- 而最新的chart gpt
595
+ 而最新的chatgpt
596
596
597
597
150
598
598
00:05:24,440 --> 00:05:25,960
688
688
689
689
173
690
690
00:06:12,200 --> 00:06:15,160
691
- 这个是我在自于量子位的一篇报道
691
+ 这个是我摘自于量子位的一篇报道
692
692
693
693
174
694
694
00:06:15,160 --> 00:06:16,240
@@ -828,7 +828,7 @@ API的接口
828
828
829
829
208
830
830
00:07:12,480 --> 00:07:14,600
831
- 我们怎幺利用多样性的一个加速器
831
+ 我们怎么利用多样性的一个加速器
832
832
833
833
209
834
834
00:07:14,600 --> 00:07:15,840
@@ -856,7 +856,7 @@ SoC加速的资源
856
856
857
857
215
858
858
00:07:23,480 --> 00:07:24,920
859
- 怎幺去做一些溶灾
859
+ 怎幺去做一些容灾
860
860
861
861
216
862
862
00:07:24,920 --> 00:07:26,080
@@ -876,7 +876,7 @@ SoC加速的资源
876
876
877
877
220
878
878
00:07:31,240 --> 00:07:33,000
879
- 这个时候怎幺做AB text
879
+ 这个时候怎幺做AB test
880
880
881
881
221
882
882
00:07:33,920 --> 00:07:35,320
@@ -896,7 +896,7 @@ SoC加速的资源
896
896
897
897
225
898
898
00:07:42,720 --> 00:07:43,840
899
- 如果我们简单的附用
899
+ 如果我们简单的复用
900
900
901
901
226
902
902
00:07:43,840 --> 00:07:45,040
0 commit comments