Advertisement

生物信息学python脚本_Python生物信息学数据管理

阅读量:

内容简介

该书籍旨在为生物学家提供解决方案,在"编程技巧"这一形式下系统阐述多种组织、分析及结果呈现策略,在每一章后附有专为生物研究者设计的编程练习题,既可用于教学也可作为自学材料.该书共分为六个部分:首先介绍Python基础入门讲解,深入解析其核心组件,随后探讨高级编程概念,接着着重于数据可视化技术的应用,同时包含Biopython这一生物信息学专用库的基本知识,最后归纳总结出20个实用技巧,其应用领域涵盖从蛋白质二级结构预测到多序列比对等复杂课题.此外,书末附录详细列出了各类生物信息学资源的重要信息.

教材特色

该书为生物学领域的程序员提供了一本高质量的学习指南。
得益于近年来对高通量技术(如DNA microarrays和DNA/RNA sequencing)的进步,
生物科学领域产生的数据规模不断扩大,
因此,
对生物数据分析的需求日益增加,
而掌握编程方法的应用已成为常规手段。
其中,
Python凭借其强大的功能优势
以及优雅简洁的语言特点
成为提高编程能力的理想选择。
作为核心内容介绍Python的数据管理方法,
本书不仅涵盖内容广泛
而且相互之间关联不大
特别适合希望自主选择学习路径的读者。

本书详细阐述了Python在数据管理和数据可视化方面的应用。具体而言,在数据分析方面涉及到了对数据记录的解析、过滤以及排序处理;而在图形展示方面则利用Python接口R实现了相关功能。此外,书中详细介绍了模块化编程的方法,并指导读者开发基础功能。通过创建类来组织程序流程……整个开发过程始终遵循着Python编码规范并采用易于理解和提升的方式进行。

对于面临计算挑战的生物学家和从业者而言,本书既适合作为Python入门者的教材,又可帮助中级Python学习者掌握新技巧,在实际编码中灵活运用。书中精心设计了大量实例以解决生物学问题,并采用"编程技法"这一独特形式介绍尽可能多的组织、分析与表现结果的方法论。每一章后均附有专为生物研究者设计的编程练习题,既便于教学又适合自学过程。全书共分为六大部分:全面介绍Python语言基础;详细讲解语言各成分的具体用法;深入探讨高级编程技巧;系统展示数据可视化方法;全面介绍生物信息学领域的核心工具Biopython;最后归纳总结了20个实用编程捷径与技巧。这些"编程秘笈"涵盖了从蛋白质二级结构预测到复杂蛋白质三维结构分析等广泛课题。此外,在附录部分提供了大量生物信息学常用资源信息,并简要介绍了必要的UNIX操作知识。

前言

过去许多年里,在计算机领域唯有程序设计人员才能真正掌握其精髓。如今,则已成为其他领域专家如生物学研究者不可或缺的一项技能。无需将编程视为必修课程, 但必须将它与其他技术手段如统计学或机器学习等结合使用, 才能发挥真正的作用。然而, 许多读者可能会觉得这项工作既乏味又抽象难懂, 因此望而却步。如果读者对此感到不适应, 那么这本书或许是他们所需要的参考资料。

本书旨在针对希望掌握数据分析技能并学习基本编程知识的生命科学工作者编写。其目标在于帮助缺乏编程基础的生物科学工作者利用Python工具独立完成生物数据的分析工作。

在引言部分中涵盖全书内容的整体介绍以及程序设计入门的基础知识,并最终是对Python程序设计语言的学习概述。

我们希望这本编程书是专为生物学领域的专业人士设计的著作,在帮助相关领域的专业人士更快捷地进行数据处理和分析的同时,请您能够尽快掌握其中的知识以便更好地开展研究工作

译者序

随着生命科学研究领域的需求与测序技术的进步

自从事生物信息工作以来,在编程语言的学习过程中最初是以 Perl 和 C 为主打基础的,在 2007 年起逐渐转向 Python 的学习与应用中。起初因 Python 缩进语法规则不适应而不太习惯于使用这一语言,在接触过程中很快就为其易读性和开放性所折服,并将其定位于自己工作中最重要的脚本语言之一至今未动。回国后发现国内大多数生物信息工作者仍然以 Perl 作为主要的工作语言这一现象让我萌生了为 Python 在该领域推广提供帮助的想法,在此书出版之际有幸得到马岚老师的支持与推荐得以与陈一情、李少娟两位学者共同完成这项翻译工作

如书中所述,在学习编程方面与烹饪艺术相似:从基础步骤开始逐步掌握其中精髓并非高深莫测。对于具备过逻辑训练的生物研究者而言...

Python语言系统性地引导学习者逐步掌握专业技能。在现有编程语言中,Python以其独特的语法结构吸引了大量开发者;通过模块化设计和面向对象技术的支持,学习者能够轻松地将简单的脚本编写成能够管理复杂项目的代码。熟悉其他编程范式的学员往往只需少量培训即可熟练阅读和编写其代码;养成编写注释清晰、逻辑严谨程序的良好习惯,则会终身受益。凭借其丰富且易扩展的标准库以及众多第三方工具包的支持,Python已经成为目前应用最广泛的通用编程语言之一。

该书以特别适合初学编程者的风格编写而成。它以生物数据管理和分析实践为起点,并循序渐进地讲解了编程的基本知识体系;尤其是针对初学者常遇到的各种问题如错误处理与程序调试等进行了深入透彻的阐述;在内容编排上对生物信息学中常见的数据整理与绘图分析给予了较多篇幅;同时系统介绍了大量Python第三方工具库的应用实例充分展现了Python语言作为"胶水语言"的特点;全书各章篇幅适中每章内容紧扣主题有助于读者更好地理解和掌握相关知识点;此外每章后附有难度适中的练习题既帮助学生巩固所学内容又为教师备课提供了便利条件;书后附录中的实用技巧也为希望将理论应用于实际研究工作的读者提供了很好的参考资源。

衷心感谢我的博士导师陈润生院士在忙碌的工作日里为本书作序!我也感恩陈一情教授与李绍娟女士以及其他所有参与工作的同学的努力与付出。其中陈一情教授负责完成了全书第一至十五章的翻译工作而李绍娟女士则承担了第十六至十八章的内容最后由我完成剩余章节并认真校订了整本译稿。特别要致谢的是蛋白质结构翻译部分得到了李大伟博士的重要建议在此表示诚挚的谢意。此外倍感荣幸的是能够得到出版社马岚编辑的支持这一成就得以顺利完成

希望这本书能对有志于生物信息的同道有所帮助。

目录

第一部分入门第1章Python shell

第2章第一个Python程序

第二部分数 据 管 理第3章分析数据列

第4章解析数据记录

第5章搜索数据

第6章过滤数据

第7章管理表数据

第8章数据排序

第9章模式匹配和文本挖掘

第三部分 模块化编程第10章 将程序划分为函数

第11章用类化繁为简

第12章调试

第13章使用外部模块: R语言的Python调用接口

第14章构建程序流程

第15章编写良好的程序

第四部分数据可视化第16章创建科学图表

第17章使用PyMOL创建分子图像

第18章处理图像

第五部分Biopython第19章使用序列数据

第20章从网络资源中检索数据

第21章使用三维结构数据

第六部分:编程秘笈1;PyCOgen图书馆中的第2个编程秘笈探讨反向互补序列及其随机化处理方法

编程秘笈3: 用概率创建随机序列

编程秘笈4: 用Biopython解析多序列联配

编程秘笈5: 从多序列联配中计算共有序列

编程秘笈6: 计算系统发生树的节点间的距离

编程秘笈7: 核苷酸序列的密码子频率

编程秘笈8: 解析Vienna格式的RNA二级结构

编程秘笈9: 解析BLAST的XML输出

编程秘笈10: 解析SBML文件

编程秘笈11: 运行BLAST

编程秘笈12: 访问、 下载和读取网页

编程秘笈13: 解析HTML文件

编程秘笈14: 将PDB文件分割成PDB链文件

编程秘笈15: 在PDB结构上找到两个最靠近的Cα原子

编程秘笈16: 提取两个PDB链间的界面

编程秘笈17: 用Modeller建立同源模型

编程秘笈18: 用ModeRNA分析RNA三维同源模型

编程秘笈19: 从三级结构计算RNA碱基配对

编程秘笈20: 结构重叠的真实实例: 丝氨酸蛋白酶催化三分子

附录附录A命令概览附录BPython资源

附录C记录样板

附录D处理目录和用UNIX编程

丛书名:生命科学与信息技术丛书

著 者:(意)Allegra Via (阿莱格拉 维亚) 等

作 译 者:卢宏超等

策划编辑:马岚

出版时间:2017-01

版 次:01-01

I S B N :9787121303821

定价:¥69.00

全部评论 (0)

还没有任何评论哟~