书城自然科学分子模拟力场方法与应用
8392100000004

第4章 前言(4)

力场参数化的第一步就是选取一些数据,利用这些数据指导参数化的过程以及评定力场参数的优劣。一些重要的结构单元和分子的几何结构以及相应的构象都应该包含在这些数据中。一旦选择了力场能量的表达形式以及确定了参数化过程中所需要的实验或从头计算数据,有两种基本的方法可以用来获得合理的参数。一种就是“反复试验”方法,不断地调整参数以便更好地重复实验或从头算结果。在这种方法中同时调节大量参数是很困难的,所以一般是分阶段地调节。记住一点是很重要的:在所有的自由度中都存在着一定的耦合,因而参数的调节一定不能是孤立地进行。对于自由度较小(harddegreesoffreedom)的势能项参数(键长的伸缩振动和键角的弯曲振动)可以和其它自由度分开调节。事实上,键长和键角的参数都是从实验上获得并且可以没有任何改变而在很多力场中转移使用。对于自由度较大(softdegreesoffreedom)的势能项参数(非键相互作用以及二面角扭曲作用),由于彼此之间相互耦合很大,参数的确定过程就非常困难。一种实用的方法就是先建立一套vanderWaals参数,然后再利用静电势能函数拟合得到适当的静电参数,最后通过扭曲势垒确定扭曲势能函数来描述不同构象的相对能量。

另外一种拟合参数的方法是由Lifson等人[19]发展的,利用最小二乘法确定力场参数。他们首先也是选定一组实验或是量子力学从头算数据,如平衡构象和振动频率等,作为力场模型参数模拟计算的依据。最小二乘法优化力场参数的最好应用是由Hagler,Huler和Lifson等人进行的[40,41],他们工作的最重要一点是没有明确描述氢键相互作用的表达式,而是利用适当的静电相互作用和vdw相互作用的结合给出氢键相互作用。Hagler领导的实验组在1988年发展了一种基于abinitio量子力学的分子力场[42],该力场的计算并不仅仅针对小分子的平衡几何构型,同时也计算偏离平衡几何构型的构象。对每一个几何结构计算能量以及能量的一阶和二阶微商,提供了大量丰富的拟合数据。Hagler等人的研究工作给出了许多力场参数微商的新算法,并且提出了许多发展力场表达形式的新假设。

对于任何一个分子力场来说,参数在不同分子间的可转移性是至关重要的,没有了这一特性,上面所讨论的力场参数化过程也就无从谈起。当进行一个分子力学程序失败时,首先要考虑的就是在已有的参数中是否包含了所要计算的分子类型。发展一个新的力场方法的关键问题就是在复杂的能量表达形式和巨大的参数个数之间寻找一个“折中”的处理方法。原则上说,不同的原子类型之间的相互作用都应该利用不同的参数,但这样需要的参数个数将是巨大的。因而,新力场方法应该尽可能在不同的情况下都利用相同的参数,尤其是对非键相互作用。这一点不但可以减少参数的数目,而且还充分体现了力场参数的可转移性。比如,碳原子有sp3、sp2、sp等杂化类型,在目前的力场模型中计算这几种类型碳原子的vdw相互作用时都是利用同一套参数。

分子力场方法研究的体系和范围非常广泛,但是也有针对性。一些力场的建立是为了研究一个原子或分子在不同条件下的性质。比如Rodger,Stone和Tidesley发展的氯模型[43]能够计算固态、液态和气态氯的各种性质。该模型是一个各向异性的点模型,两个分子之间任意两点间的相互作用不仅仅依赖于这两点之间的距离(类似于各向同性中的Lennard-Jones),而且依赖于点向量的取向。其中包含偶极-偶极、偶极-四极、四极-四极的静电相互作用,vdw相互作用是利用Buckingham型的方程来模拟。一些力场的建立是用来模拟一定的分子类型,比如AMBER力场就是用来计算核酸和蛋白质分子,还有一些力场包含了较大范围的分子或原子类型,甚至能够模拟整个周期表的原子。毫无疑问,“专门(specialized)”描述一定类型原子或分子的力场计算结果的要好于那些能够模拟所有原子类型的“普遍(general)”的力场模型。

1.4常见的力场

1.4.1第一代力场

MM形式力场该力场为美国乔治亚大学Allinger教授等人所发展的,依其发展的先后顺序分别称为MM2、MM3、MM4、MM+等[7,17,27~28,44~48]。MM力场将一些常见的原子进行了详细的划分,如将碳原子分为sp3、sp2、羰基碳、环丙烷碳、碳自由基、碳阳离子等类型。这些不同类型的碳有不同的力场参数。应用此力场能够计算有机化合物、自由基和离子等化合物的性质,如精确的几何构型、构型能、热力学性质、振动光谱和晶体能量等。其力场的一般形式为:

Unb、Ub、U、U和Uel分别表示非键vdw作用、键长的伸缩振动、键角的弯曲振动、二面角扭转、非共面振动和库仑相互作用势能,Ucross为耦合作用势能项。如与同一原子键连的两个键,其耦合作用的表达式为:

此外,键伸缩与二面角扭转势能项的耦合作用为:

在MM形式的力场中仔细地考虑了许多耦合作用项,其结果往往优于其它形式的力场。相对的,其力场形式较为复杂,比较不易程序化,计算较费时间。

AMBER力场

AMBER力场[22,24-25,49]是Weiner等人在1984年发展的,通过拟合与蛋白质和核酸具有类似的结构单元的有机小分子的实验数据来拟合其相应力场参数,该力场的大部分的参数都来源于实验结果。AMBER力场主要适用于蛋白质、核酸、酶等生物分子,同时也应用在聚合物和小分子中,Homans(1990)等人又将力场扩展到低聚糖。力场模型简单,又称对角元力场(谐共振模型),计算相对省时,但是也限制了应用范围。应用此力场通常可得到合理的气态分子几何构型、构型能、振动频率和溶剂化自由能(SolvationFreeEnergy)等性质。此力场的标准形式为:

其中,b、、为键长,键角和二面角,第四项为vdw作用项,第五项为静电作用项,第六项为描述氢键的相互作用项。

CHARMM力场

CHARMM力场[26,50~51](ChemistryatHarvardMacromolecularMechanics)是由哈佛大学发展的,力场参数除来自于实验结果外,还利用了大量的量子化学数据。此力场可应用于研究多分子体系,包括小的有机分子、溶液、聚合物、生化分子等。

几乎除了有机金属外,通常都可得到与实验值接近的结构、作用能、构型能、转动能垒、振动频率、自由能以及许多与时间有关的物理量。该力场也是典型的对角元力场,模型简单。CHARMM力场的形式为:

bondangletorsionoutpelecvdwconstriantUUUUUUUU(1-39)其中,前四项为分子内作用项,第五和第六项为分子间作用项,最后一项为特殊作用项。各项的具体表达式为:

CHARMM力场计算氢键相互作用能的表达形式为:

其中,sw称为开关函数(switchedfunction),下标“on”和“off”为开始计算和终止计算此函数的氢键键长或与氢键有关的键角值。

CVFF力场

CVFF力场[52]是由DauberOsguthope等人所发展的,其全名为一致性力场(ConsistentValenceForceField)。该力场通过气态和晶体小分子获取参数。此力场最初以生化分子为主,力场参数主要适用于计算氨基酸、水以及各种官能团。经过不断的改进,目前的CVFF力场能够计算各种多肽、蛋白质和大量的有机分子。CVFF力场的特点是能够准确计算体系的结构和结合能,并且可以提供合理的构象能与振动频率。该力场现已应用到材料科学,可以计算和模拟硅铝酸盐和硅磷酸盐。CVFF力场的具体形式为:

CVFF力场加入了非正常二面角扭转势能项,键伸缩项采用了Morse势能函数。

1.4.2第二代力场

第二代力场的形式比上述经典力场更加复杂,采用了不同的耦合势能函数,需要大量的力场参数。其设计的目的是为了能够准确地给出分子的各种性质,如结构、光谱、热力学和晶体特性等。其力场参数的拟合除了利用大量的实验数据外,还参照精确的量子化学计算结果,尤其适用于有机分子,或不含过渡金属元素的分子体系。第二代力场因参数的不同分为CFF91、CFF95、PCFF,COMPASS与MMFF93等。其中,前三种称为一致性力场,其形式为:

所有的交叉项都展开到三级,vanderWaals相互作用项采用了9次方排斥项。

CFF91(ConsistentForceField)力场[53~56]适用于研究各种碳氢化合物、蛋白质、蛋白质-配体的交互作用。也可研究小分子的气态结构、振动频率、构象能、扭转能垒和晶体结构等。CFF91的力场含有H、Na、Ca、C、Si、N、P、O、S、F、Cl、Br、I、Ar等原子的参数。PCFF力场由CFF91力场衍生而出,适用于聚合物和有机物。主要可应用于聚碳酸酯类(polycarbonates)、三聚氰氨树脂(melamineresins)、多糖类(polysaccharides)、碳水化合物、脂肪类、核酸、有机物以及约20种无机物。

除了CFF91力场的参数外,PCFF含有He、Ne、Kr、Xe等惰性气体原子以及Li、K、Cr、Mo、W、Fe、Ni、Pd、Pt、Cu、Ag、Au、Al、Sn、P等金属原子的力场参数。

CFF95力场也衍生于CFF91力场,是特殊针对如多糖类、聚碳酸酯类等生化分子与有机聚合物所设计的,较适用于生命科学的应用。此力场含有卤素原子及Li、Na、K、Rb、Cs、Mg、Ca、Fe、Cu、Zn等金属原子的参数。COMPASS(Condensed-phaseOptimizedMolecularPotentialsforAtomisticSimulationStudies)力场[57]是在PCFF力场的基础上发展起来的,是第一个完全根据从头计算结果进行参数化,并通过对凝聚态性质的计算来进一步优化。所以,该力场可以准确地计算和模拟很多类型分子的气态和凝聚态结构、构象、振动光谱,以及热力学性质。MMFF93(TheMerckmolecularforcefield)力场[59~63]为美国Merck公司针对有机药物设计所发展的。此力场以大量的量子化学计算结果为依据,采用MM2和MM3力场的形式,主要应用于计算固态或液态的小型有机分子体系,能够得到很准确的几何结构、振动频率以及各种热力学性质。其力场的形式为:

1.4.3第三代力场——涵盖周期表元素的力场

前述的力场由于最初的设计都是针对有机或生化分子,故仅能涵盖周期表中的部分元素,其力场参数主要通过拟合实验或量子化学计算数据得到。为使力场能广泛地适用于整个周期表元素,从而发展了从原子角度为出发点的力场。这些新一代的力场,其原子的参数来自实验或理论数据,具有真实的物理意义。以原子为根据的力场包括ESFF[64](Extensiblesystematicforcefield),UFF[65](UniversalForceField)和Dreiding力场[66]等。ESFF力场可用于预测气态与凝聚态的有机分子、无机分子和有机金属分子体系的结构,不能用以计算构象能或准确的振动频率。其力场包涵周期表中由氢至氡的原子。Dreiding力场可计算分子聚集体的结构及各项性质,但其力场参数也没有涵盖周期表中所有的元素。UFF力场可适用于周期表所有的元素,即适用于任何分子与原子系统。以UFF力场计算的分子结构优于Dreiding力场得到的结果,但计算与分子间相互作用有关的性质,则有较大的偏差。该类力场的参数并不像一、二代力场从实验和从头计算数据拟合得到,而是通过一些经验公式和相关物理量(如电负性、硬度、原子半径等)直接导出,从而使参数化更加简单,其参数也具有可转移性。

ESFF力场考虑了各种不同的环状化合物,并将环状化合物其中心原子的杂化模式(sp、sp2、sp3)等纳入键角弯曲项,其力场的形式为:

上式的第一项为键长伸缩项,第二项为键角弯曲项,第三项为二面角的扭转项,第四项为非共面振动项,第五项为非键远程相互作用项,最后为静电作用项。ESFF力场最重要的一点是引用了合理的方法,推导了分子中原子所带的部分电荷(partialcharge),各原子电荷量的总和必需与分子所带的电荷量相等。静电作用能为:

式中,第一项为原子能量对电荷的泰勒展开式,为原子的电负性(electronegativity),为原子的硬度(hardness)。将上式的能量对原子的电荷最小化,可得到每个原子所带的部分电荷:

其中,为拉格朗日因子(Lagrangianmultiplier),原子的电负性和硬度随分子所处的环境而不同。ESFF力场应用精确的量子力学密度泛函(densityfunctiontheory,DFT)计算方法得到原子的电负性和硬度等参数,开创了密度泛函理论与分子力场相结合的先河。