Skip to content

gao-lab/Guideline-for-Computational-Biology-and-Bioinformatics

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

54 Commits
 
 
 
 

Repository files navigation

Guideline-for-Computational-Biology-and-Bioinformatics

avatar Fig from Bioinformatics Curriculum Guidelines: Toward a Definition of Core Competencies, 2014, Plos Compbio

目的: 在原来的 GCCS2019 基础上对组内培养方案更具体的完善,大概会包括如何达到 GCCS2019 中的要求中的basic,advanced skills。

Ps. 对于一开始进组开始 intern 的同学建议全部掌握 Basic skills 且最好掌握部分 Advanced skills,basic skills 是能开始工作的基础,Advanced skills 是能做出原创性工作的前提。

Table of contents

Basic Skills

这部分是能够开展工作的基础,至少需要了解的部分。

Linux Foundation

对于 Linux 需要掌握一些最基础的基本操作,以及关于服务器的一些基本的常识。

  • Linux basiclinux shortenned 都是基本的 Linux 知识,建议快速的看一遍,然后上手试一试,北大未名有免费的学生账号,可以申请

Python

Basic 的 Python ,只需要掌握基本的语法,以及常见的 package 比如 numpy, pandas 的基础用法即可。

R

Writing

  • Markdown/Rmarkdown Markdown 感觉是轻量级 LaTeX,最主要的就是也能支持数学公式。推荐 typora!来写 Markdown。
  • LaTeX LaTeX 基础的话推荐 Basic latex 看完这个,LaTeX 的基本的使用不成问题!如果想要尝试的话可以推荐使用 Overleaf,上面有很多的 template 可以直接用。

Basic Math

  • 高等数学
  • 线性代数
  • 概率论与数理统计

Advanced skill

Advanced skill 是在 Basic skill 的基础上的进阶,包括机器学习,统计学习,深度学习,贝叶斯理论,概率图模型,同学们按照自己的兴趣挑选学习即可。

ps. 如何做出有价值的,其他人没想到的工作呢 1.你比人家聪明,2.你比人家知道的多。相比第一条,第二条是更容易实现的

Machine Learning

使用机器学习/统计学习方法挖掘组学数据其实就是生物信息做的事情,所以machine learning某种程度上也是 basic skill! 这部分资料其实非常多,Google 随便搜索一下就能找到很多,下面简单的罗列一下我知道的,或者我看过觉得不错的的资料。

  • Mooc
    • Coursera 上 Andrew Ng 的 Machine learning,深入浅出相当不错,建议快速刷完。machine learning ,另外国内网易云上,bilibili上都有搬运的资料。
    • machine-learning-notes 只要是里面有视频的部分讲的都非常清楚(Variational Inference, MC等)!而且中文格外亲切。
  • Book
    • Pattern recognition and machine learning(PRML)

Statistical Learning

统计学习和机器学习其实没什么区别吧.

Deep Learning

Bayes

贝叶斯学派和频率学派的本质区别就是认为 parameter 没有确定的值,有的是分布。

Reinforce Learning

Bioinformatics Analysis

Some Courses

Related links

People