Adam Learning (bigdatagenomics)
1.背景介绍:
Adam是一个在Spark基础上,结合Avro、Parquet实现的基因数据处理的系统。
Adam属于AMPlab实验室开发的项目,属于伯克利分析栈(Berkeley Data Analytics Stack,BDAS)的In-house Apps层,名为Cancer Genomics;
Adam主要提供基本的基因数据处理的数据格式以及与各种传统的单机存储格式的转换函数,统计函数等。
参考:
https://amplab.cs.berkeley.edu/software/
https://github.com/bigdatagenomics/adam
2.项目介绍
AdamLearning主要是自己学习Adam系统时的学习文档和代码,主要用于个人记录,大家也可以参考,目前Adam文档比较少,需要阅读源码。源码分析部分没怎么放上来,需要等毕业后再共享。
3.文档:
Adam学习1至25:http://blog.csdn.net/bob601450868/article/category/6120566
基因数据处理1至52:http://blog.csdn.net/bob601450868/article/category/6128626
基因数据处理文档已经更新到110篇以上,后面部分需要等2017年7月再共享。