Advertisement

Gromacs分子动力学模拟流程概述

阅读量:

Gromacs分子动力学模拟主要包含以下几个环节,在具体实施过程中各体系的具体步骤可能会有所差异。

在开始之前,先简单了解一下预平衡:

通过模拟手段实现对研究对象的采样,并进而计算系统的能量参数。举个例子来说,在实际操作中,则需要将该研究对象置于特定介质环境中。观察其能量状态的变化情况,并探究其中的化学键特性及其与水分子之间的氢键作用。在实际操作中,则需要将该研究对象置于相应的介质环境中,在实际操作时,则相当于将溶剂引入系统。等待系统达到平衡状态后,并从多个角度获取相关的热力学数据以及结构特征等信息;同时进行成分组成分析,并获得系统的动态特性等信息

在模拟过程中与现实中的情况不同,在MD中这一过程并不是自然发生的。我们需要通过模拟使体系演化为达到平衡状态的阶段,这被称为预平衡。通常情况下,在进行预平衡时会采用以下措施:

  • 蛋白质结构能量最小化:通常是从晶体结构中获取PDB文件的。当将蛋白质置于溶液环境中时必然会经历构象变化以适应周围环境。因此为了确保最终形成的稳定构象必须对系统进行能量最小化处理。
  • 蛋白质位置限定性模拟:在某些情况下当向体系中添加溶剂时由于分子间的强烈作用力可能导致系统的稳定性受到威胁甚至引发崩溃现象。此时我们需要采取措施限制重原子的位置维持原有构象状态待溶剂分子完成松弛过程后再解除约束条件以完成模拟工作。
  • NVT预平衡 NPT预平衡:通常情况下我们会先执行NVT热浴下的蒙特卡洛模拟以降低系统温度并减少压力范围然后再转入恒压条件下的动力学研究。

无需全部执行;具体情况具体分析;通常情况下蛋白质能量最小化以及位置限定性NPT也是需要执行的。

以下是分子动力学模拟的步骤,有些步骤可以省略。

  1. 获取并处理PDB文件

通常可以从网站获取PDB文件,请访问 _http://www.rcsb.org/pdb/home/home.do_ 进行下载。在获取PDB文件后可能需要执行一些处理步骤,请根据具体情况具体分析。例如,在某些情况下可能需要对末端氢原子进行处理或去除结晶水分子等。

2. 使用pdb2gmx获得拓扑文件

关于pdb2gmx命令的具体说明,请参阅http://manual.gromacs.org/programs/gmx-pdb2gmx.html。关于具体的命令参数及其用法的详细说明将在另一篇文章中提供。一般而言,在实际操作时我们会按照以下步骤进行:

gmx pdb2gmx -ff amber99sb-ildn -f *.pdb -o *.gro -p *.top -water tip3p

-ff 选项,制定要使用的力场;

-f选项,制定输入的PDB文件;

-o选项,制定生成的gro文件名

-p选项,制定要生成的拓扑文件名

-water选项,制定要使用的水分子模型

注意:除了生产*.gro和*.top文件外, 将会生成一个posre.itp 文件, 这个简称为定位约束性的小节

如果不使用-ff选项的话,指令运行后会让你自行选择力场。

3. 定义盒子

定义盒子和填充溶剂可以看做一步,在这里为了详细就分开来说。

如同之前所述,在其他文章中已经对所涉及的指令及相关文件进行了详细阐述。无需再作详细说明,请采用editconf命令来构建盒子:

gmx editconf -f *.gro -o *.gro -c -bt cubic -d 1.2

-f:指定输入的蛋白结构

-o:指定输出带盒子信息的结构文件

-c:将蛋白质置于盒子的中心,这个选项是可选的,不必须。

-d:蛋白质与模拟盒子在XYZ方向上的最小距离,一般不能小于0.9nm

-bt:指定盒子类型,这里使用了立方盒子,还可以用八面体,十二面体等。

这样我们就得到了周期型立方格子中的蛋白质分子。

该命令可用于将gro文件与pdb文件相互转换。使用-f参数指定源文件后即可启动转换过程;通过-o参数指定目标文件名即可完成操作。

4. 蛋白质真空中的能量最小化(非必须)

通常情况下这一步并非必要步骤。
但为了完整性起见仍需提及。
如果我们的目标仅在于真空环境下的能量最小化优化,则可以直接进行产品模拟过程。

Gromacs使用grompp指令(GROMacs Pre-Preocessor)对带有晶格信息的gro文件以及蛋白质的拓扑结构描述和mdp参数配置文件进行预处理操作。该过程能够自动生成用于后续分子动力学运行(mdrun)所需的*.tpr二进制输入数据。其中tpr为二进制格式的数据文件

gmx grompp -f *.mdp -c *.gro -p *.top -o *.tpr

-f:指定输入参数文件。mdp文件会有专门的文章叙述

-c:指定输入结构文件

-p:指定输入拓扑文件

-o:指定用于mdrun的tpr文件

运行之后我们得到*.tpr文件和参数文件mdout.mdp

然后使用mdrun命令运行能量最小化:

gmx mdrun -v -deffnm *

-v:显示模拟过程中的信息

-deffnm:被理解为define-file-name的缩写。
定义输出文件名会被自动附加后缀。

运行完成后生成日志文件*.log、全精度轨迹问价*.trr、能量相关的文件*.edr以及最低能量状态下的结构记录 *.gro。

5. 向盒子中填充溶剂

其实这只是一小步,同上,为了详细我把它单独列为一步。

使用solvate命令填充溶剂,以水为例:

gmx solvate -cp *.gro -cs *.gro -o *.gro -p *.top

-cp:确定应有水分子填充的系统

-cs:指定要使用的水模型

-p用于指定系统(基于原有蛋白质结构生成),通过这种方式运行后solvate将能够修改整个系统的拓扑结构。

-o:指定填充水分子后的输出文件

执行完成后会生成-o指定的文件路径,并且-p操作会导致top文件发生变化

6. 添加离子

向盒子中注入溶剂后,在随后的操作中我们形成了一个带电荷的空间环境。为了维持系统的电中性状态,在GROMACS软件中用于生成离子配置的指令是genion这一功能模块。值得注意的是,在实际应用过程中其所需输入文件类型为tpr格式。如同上文所述,在生成tpr格式的过程中需要用到grompp工具这一关键预处理阶段。该工具能够通过处理坐标数据以及分子拓扑信息来生成详细的原子级别配置数据,并最终产出所需的tpr格式文档

为了整合坐标信息(gro)与拓扑信息(top),我们需要一个mdp文件。mdp文件一般用于完成能量最小化任务,在当前情况下仅仅是生成tpr文件。

gmx grompp -f *.mdp -c *.gro -p *.top -o *.tpr

-f:指定mdp文件

-c:指定结构文件(加入溶剂后的结构文件)

-p:指定的拓扑文件(它指的是原有生成的蛋白质拓扑结构,并且值得注意的是,在添加溶剂后该拓扑文件已经发生了一些变化)

-o:指定输出文件

得到tpr文件后,就可以在其中加入离子了:

gmx genion -s *.tpr -o *.gro -p *.top - pname * -nname * -nn *

-s:将上述生成的tpr文件作为输入

-o:生成新的结构文件

-p:再次改变top文件,反应蛋白质结构的改变

-pname:指定要添加的阳离子名称,后面未指定数量,即为不添加

-nname:指定添加的阴离子名称

-nn:添加的阴离子数目

7. 能量最小化

我们现在定义了盒子(基于周期性边界条件),溶剂分子和离子体。整个体系达到了静电平衡状态。这一步骤要求我们在模拟前必须确保系统的结构稳定,并且各原子之间的距离适当控制以避免过近的情况发生。通过松弛操作优化结构配置的过程被称为能量最小化(EM, energy minimization),这是分子动力学模拟中的关键步骤之一

类似于之前的操作步骤,仍然需要使用grompp生成tpr文件. 首先需要创建一个名为minim.mdp的配置文件. 完成设置后:

gmx grompp -f minim.mdp -c *.gro -p *.top -o *.tpr

-f:指定mdp文件

-c:指定结构文件

-p:指定拓扑文件

-o:指定输出的文件名

得到tpr文件后就可以进行能量最小化了

gmx mdrun -v -deffnm em

mdrun的指令与前面一样。

我们将得到以下文件:

*.log 日志文件,记录了能量最小化过程

*.edr 二进制能量文件

*.trr 全精度的二进制轨迹文件

*.gro 能量最小化的结构

现在,我们的体系已经处于能量最小点了,可以做一些真正的模拟了!

8. NVT平衡

实现NVT平衡的过程具有重要意义。然而,在这一过程中起到关键作用的是MDP文件的构建。由于涉及内容较为深入,本篇文章将不做详细讨论,针对此处的NVT模拟问题,则采取简化处理的方式。

当我们最初启动pdb2gmx程序时,会生成一个命名为posre.itp的文件.这一功能终于得以实现!该功能的作用是对蛋白质中的重原子(即非氢原子)实施位置约束.施加此约束后,在正常条件下这些原子无法自由移动.这一操作的主要目的是平衡周围的分子结构,并避免对蛋白质本身的构象产生影响.

定义好mdp文件后,就可以进行模拟了。

gmx grompp -f *.mdp -c *.gro -p *.top -o *.tpr

-c设置为前一个生成的能量最小化状态下的结构信息,-p继续指向之前被反复修改过的蛋白质排序最高位的top文件,-o指明输出结果存放的位置

gmx mdrun -deffnm *

指定输出文件名。

9. NPT平衡

与NVT平衡类似,关键在于mdp文件中,因此不再赘述,命令如下

gmx grompp -f *.mdp -c *.gro -t *.cpt -p *.top -o *.tpr

gmx mdrun -deffnm *

cpt为断点文件(check point),详见关于文件的文章中。

10. 成品MD

目前我们的体系已处于所需温度和压力下的平衡状态(即达到了动态平衡),因此我们可取消位置约束条件并执行最终的分子动力学模拟(MD),以便收集所需的数据。

同样,先定义mdp文件,然后运行

gmx grompp -f *.mdp -c npt.gro -t npt.cpt -p *.top -o *.tpr

gmx mdrun -deffnm *

11. 分析

暂略,做到这里再补充。

转载于:https://www.cnblogs.com/w-guangyu/p/7787240.html

全部评论 (0)

还没有任何评论哟~