Advertisement

r语言与bioconductor生物信息学应用_R语言轻松实现生物信息分析——Bioconductor简介...

阅读量:
0857840def2d22012c002da4261b7573.png

什么是生物信息学

随着生命科学飞速发展,科研工作者已经开始利用应用数学、信息学、统计学和计算机科学等方法,来研究生物学领域的问题。这就形成了一门新兴的学科—生物信息学。

研究的主要内容是(Genomics)和蛋白质组学(Proteomics)两个方面,具体来说就是从和序列出发,分析序列中表达的结构功能的生物信息。
3a5ec7ad8d1de74e42df41b2517b7e48.png

R语言

R语言是当前主流的分析软件之一,具有强大的数据处理和分析功能,并且它是免费和开源的,对许多想要发高分SCI的小伙伴来说,这款软件是非常适合的。

对于生物信息学,R语言可以做大量的分析,包括:基本的序列分析、分子进化和比较基因组学;蛋白质结构比对和预测;计算机辅助药物设计等等。

生物信息学已经成为了R语言的一个非常重要的应用领域,近年来,R语言的迅猛发展很大程度上得益于生物信息学的推动。
b8244b89a9d43ec45d0b01723ccc24a4.png

Bioconductor

Bioconductor是建立在R语言环境上的,用于生物信息数据的注释、处理、分析及可视化工具包的总集,由一系列R扩展包组成。它也是免费和开源的。

Bioconductor当前最主要应用在基因芯片和下一一代测序数据分析两个领域,而且在其他领域的应用也逐渐展开。

主要特点

Bioconductor有一个非常大的优点就是用户可以方便地查看或修改现有算法或数据模块,并且根据新的需求可以不断地更新已有的扩展包或开发新包。

除了上面地优点以外,它还有其他很多优点:

(1)分布式开发模式

Bioconductor依赖R包测试系统的测试机制来对每一个包进行测试以确定其稳定性与健壮性。每一个开发者都要对其开发的包中的所有函数进行记录,并且提供示例代码、脚本或命令用于代码测试。开发者在每次提交新包或者升级旧包之前都必须保证所提交的代码可以正常运行。有时升级包会影响依赖它或者导入它的相关包的运行,所以在提交升级之前,必须保证升级的部分不会影响其他包的正常运行。开发团队的成员们可以通过论坛、电子邮件、电话和会议等交流思想、更新知识或协调合作。

(2)外部资源再利用

这里的外部资源主要是指用其他编程语言编写的程序。

第一,Bioconductor开发的一个基本原则就是尽量直接使用或者稍加改编整合已有的算法或程序,特别是一-些标准工具和成熟算法,而不是重写。这样大大减少了使用未经测试的新代码的风险,而且提高了效率。

第二,由于生物信息学是一个复杂的领域,往往需要使用多种程序和工具来完成一个任务,所以Bioconductor提供了多种整合其他代码或程序的手段。

(3)动态的生物学注释

这里的注释特指元数据(Metadata), 在Bioconductor 的-些文档中,元数据与数据的注释这两个概念经常混用。Bioconductor 项目开发了一些软件协助研究人员使用和分析元数据。为了保证元数据及时更新,以便用户可以得到最新的元数据,Bioconductor 将元数据写入R包。这些R包都是采用种半自动更新的方法创建,并通过一些基于reposTools包开发的工具发布或更新。元数据有版本管理,用户可以决定何时更新需要的数据,还可以方便地获取旧版本的数据。

(4)实验的可重复性

Bioconductor非常强调研究的可重复性,这是生物信息学,乃至科学发现的基础。Biocondoctor扩展包及文档的统一标准为同时发布数据和代码等信息提供最优秀的平台,完全可以满足生物信息学研究的可重复性要求。

(5)教育培训资源丰富

R/Bioconductor作为一种新的程序设计语言,需要生物学计算机和统计学等多方面的背景知识,因此教育培训用户成为了一个重要的环节。每年都会有大量的培训资料公布在Bioconductor的官网或其他网站上,主要提供两个方面的资源:课程资料和说明文档。一些Bioconductor的开发者会亲自主讲一些课程,并且依据反馈不断改进课程资料。课程资料主要是为了介绍如何使用扩展包,是公开免费的,不过对发表有限制。Bioconductor 除了发表传统的说明文档(如使用手册),更依赖于网上可动态更新的在线文档。

(6)响应用户需求

Bioconductor在建立初始就启动了相应的邮件列表(bioconductor@ stat.math.ethz.ch),并可查询以往的邮件,帮助遇到相同问题的用户快速地解决问题,错误报告为开发者避免或者修正错误提供了参考。另一方面,响应用户需求还需要图形化用户界面(Graphical User Interface,GUI)。
bddf966ae174deb8b6b74942326a1822.png

全部评论 (0)

还没有任何评论哟~