Fig from Bioinformatics Curriculum Guidelines: Toward a Definition of Core Competencies, 2014, Plos Compbio
目的: 在原来的 GCCS2019 基础上对组内培养方案更具体的完善,大概会包括如何达到 GCCS2019 中的要求中的basic,advanced skills。
Ps. 对于一开始进组开始 intern 的同学建议全部掌握 Basic skills 且最好掌握部分 Advanced skills,basic skills 是能开始工作的基础,Advanced skills 是能做出原创性工作的前提。
这部分是能够开展工作的基础,至少需要了解的部分。
对于 Linux 需要掌握一些最基础的基本操作,以及关于服务器的一些基本的常识。
- Linux basic 和 linux shortenned 都是基本的 Linux 知识,建议快速的看一遍,然后上手试一试,北大未名有免费的学生账号,可以申请
Basic 的 Python ,只需要掌握基本的语法,以及常见的 package 比如 numpy, pandas 的基础用法即可。
- Basic Python 中文版本 [link]
- Python 100 days 已经是很完整的 Python 的资料了,包括的内容非常多,basic 的话不需要全部掌握。
- Think python,另外也有中文版,自行搜索就能找到。
- Python 进阶 看起来很快,发现basic的不太够之后去看的 original English version
- R for beginners 适合初学者入门。
- Markdown/Rmarkdown Markdown 感觉是轻量级 LaTeX,最主要的就是也能支持数学公式。推荐 typora!来写 Markdown。
- LaTeX LaTeX 基础的话推荐 Basic latex 看完这个,LaTeX 的基本的使用不成问题!如果想要尝试的话可以推荐使用 Overleaf,上面有很多的 template 可以直接用。
- 高等数学
- 线性代数
- 概率论与数理统计
Advanced skill 是在 Basic skill 的基础上的进阶,包括机器学习,统计学习,深度学习,贝叶斯理论,概率图模型,同学们按照自己的兴趣挑选学习即可。
ps. 如何做出有价值的,其他人没想到的工作呢 1.你比人家聪明,2.你比人家知道的多。相比第一条,第二条是更容易实现的
使用机器学习/统计学习方法挖掘组学数据其实就是生物信息做的事情,所以machine learning某种程度上也是 basic skill! 这部分资料其实非常多,Google 随便搜索一下就能找到很多,下面简单的罗列一下我知道的,或者我看过觉得不错的的资料。
- Mooc
- Coursera 上 Andrew Ng 的 Machine learning,深入浅出相当不错,建议快速刷完。machine learning ,另外国内网易云上,bilibili上都有搬运的资料。
- machine-learning-notes 只要是里面有视频的部分讲的都非常清楚(Variational Inference, MC等)!而且中文格外亲切。
- Book
- Pattern recognition and machine learning(PRML)
统计学习和机器学习其实没什么区别吧.
- 李航的统计学习,短小精悍!建议专心读几天,一口气读完。
- Statistical Rethinking: A Bayesian Course Using R and Stan这其中包括 slides, videos, homework(solution)。
- Introduction to Statistical Learning with R 这本比较简单,也有中文翻译版本,也是某种意义上李程老师的基因组数据分析所用的教材。
- The Element of Statistical Learning 这本书比 ISL 更难,有更多的数学,而且中文版感觉翻译的不是很好,另外也是林伟老师的统计学习的教材.
- Coursera 上面的 Deep Learning, Andrew Ng 讲的还是非常好的,另外 bilibili 上也有搬运的。另外网易云上应该也有。
- 李沐的动手学深度学习,框架使用的是MXNET,所以可能这部分借鉴意义不大,但是本身来说写的还是不错的,比那本非常有名的 deep learning 更适合学习。Pytorch version 毕竟Pytorch 还是比 MXNET 要更流行一些,建议直接看pytorch 版)
- Solution of Deep-Learning-Coursera
- Awesome - Most Cited Deep Learning Papers Deep learning 中经典的论文
贝叶斯学派和频率学派的本质区别就是认为 parameter 没有确定的值,有的是分布。
- Bayesian Data Analysis 这本书内容比较多,是席瑞斌老师的贝叶斯的参考书。
- Awesome Bayes 里面包括非常多的关于贝叶斯的资源
- Think 系列 中的 Think Bayes
- Single Cell Analysis
- Others
- awesome multi omics
- A great repo about ChIP-seq-analysis by Ming Tang
-
Computational Biology Courses
- MIT Deep Learning in Genomics 最新的MOOC!,B站上也有搬运,强推,非常广,虽然我觉得这个deep learning 改成 machine learning比较好。
- MIT Computational Biology: Genomes, Networks, Evolution, Health Homepage, Lecture Manolis Kellis 19年的课,其实感觉和上面的2020fall的比较像,可以互补着看。
- MIT Foundations of computational and systems biology
- stanford Computational Biology in Four Dimensions Computational biology 的一些topic。
-
Courses at Peking University
- 北京大学基因组学、生物信息学课程 by 李程老师
- 基因组生物学技术
- 贝叶斯理论与算法
- 深度学习:算法与应用
- 生物信息中的数学模型与方法
- 基因组学数据分析
- 生物数学物理
- 统计学习
- 生物数学建模
- 生物信息学方法
- 生物统计
- selection of books/urls for bioinformatics/data science curriculum by Ming Tang
- Bioinformatics Curriculum Guidelines: Toward a Definition of Core Competencies
- A New Online Computational Biology Curriculum
- Awesome Bioinformatics
- Awesome-Bio-ML-PKU
- 屠鑫明
- 陈子玉
- 曹智杰
- 丁阳