本笔记采用滚动更新方式,每天坚持写一点,长期坚持下来,能够对微生物基因组数据分析有个比较充分的认识。将来可能还会进一步加入转录组甚至蛋白组数据分析的内容。
PS:新的一年,要不断虚心学习。 PPS:春节马上就要到了,祝大家羊年大吉。
本笔记主要是介绍微生物,特别是病原细菌的高通量测序数据分析。目前的发展来看,个人认为小型台式测序仪很快在各个科研院所以及事业单位普及,比如像 Miseq 和 Nextseq 500 这样的测序仪。以后对于数据分析的工具也会越来越多,越来越方便。本笔记的目的也是为了能通过学习,帮助笔者比较全面的掌握微生物基因组(加上转录组,未来也许还有蛋白质组学)数据分析的原理,操作以及细节,同时希望也能帮助一些希望能从高通量数据中挖掘更多信息的从事病原细菌的研究人员。
本笔记使用开源工具 gitbook 创作,文中图片用开源图形图像处理软件 GIMP 编辑处理,介绍的工具也几乎均为开源软件。如果阅读者有一定 Linux 基础,对工具的安装和操作理解起来会更为方便一些。笔记中的许多内容都是来源于网络上的资料,部分来源可能有误或记忆不全,如果原作者发现没有内容链接,或者链接错误,请发电子邮件通知我修改。同时希望 Open Source 思想能对科研工作和科研工作者有所帮助。
本笔记代码托管在 Github, 所有内容可以从 这里 获得。笔者接触 NGS 时间不长,内容中肯定会有许多错误之处,希望能有NGS领域的专家帮助指正。对于有能力提交issue的读者,欢迎大家多多提交 issues,帮助完善笔记内容。一个人的眼界毕竟有限,测序技术也在快速发展,欢迎大家原创或者收集更好的内容也能加入到本笔记中。
- 在GitHub上fork本书作为自己的仓库,如
indexofire/bac-ngs-book
,然后git clone
到本地,并设置用户信息。
$ git clone [email protected]:your_github_username/bac-ngs-book.git
$ cd bac-ngs-book
$ git config user.name "your github username"
$ git config user.email [email protected]
- 修改内容后提交,并
git push
到之前fork
的仓库。
$ git commit -am "Fix issue #1: change typo: helo to hello"
$ git push
-
在GitHub网站上提交
pull request
。 -
定期使用项目仓库内容更新自己仓库内容。
$ git remote add upstream https://github.com/indexofire/bac-ngs-book.git
$ git fetch upstream
$ git checkout master
$ git merge upstream/master
$ git push origin master
- 更新部分内容结构
- 添加orthomcl内容
- 更新了galaxy安装和配置
- 修改了一些错误
- 修正一些错误
- 修改了书中的一些内容结构
- 修正一些错误
- 更新了 docker in AWS 内容
- 更新了 Phylogenomics 内容
- 更新了 Visulization 内容
- 修改章节结构
- 添加 local blast 说明
- 添加Amazon EC2教程
- 增加拼装报告部分内容
- 增加fastq文件修饰内容
- 修正一些错误
- 增加了一些资源内容
- 添加网上资源,名词解释等内容
- 添加笔记封面
- 创建本书
- 添加单基因组数据下载,QC,组装等内容