蛋白质-配体复合物是经常通过分子动力学研究的一类问题,这往往需要对小分子配体计算RESP电荷,经常有人问我应该取小分子的什么构象来计算、用不用先优化,我在这里统一说一下我的看法。
原理上,最理想的算这种情况的配体的RESP电荷的做法是:对真实的复合物动力学轨迹每隔一定帧数提取一次小分子结构算RESP电荷(直接算单点任务得到波函数文件就够了),然后对所有帧取平均。这样得到的RESP电荷可以对动力学过程中配体与外环境的作用有均衡的描述,而且哪个构象出现概率越大,哪个构象对计算的RESP电荷起到的权重越大、被照顾得越充分。但是这么做不仅麻烦、耗时高,而且由于原本并不知道配体的原子电荷,动力学也没法跑。一个折中做法是先用比如ADCH、AM1-BCC这样对分子表面静电势重现性还不错的原子电荷作为配体的“初猜”电荷去跑复合物的动力学,然后计算各帧平均的配体的RESP电荷,再用新的配体的原子电荷跑复合物的动力学...反复如此,最后配体的原子电荷就能确定下来。但显然这么做太折腾、太费时了,而且由于一些随机性因素,还未必最后能收敛。
如果你的蛋白-配体复合物是X光衍射测的,而且解析度较高,那么可以直接把配体抠出来,只对氢的位置用量子化学优化(为什么要这么做看《实验测定分子结构的方法以及将实验结构用于量子化学计算需要注意的问题》http://sobereva.com/569),然后算RESP电荷。这么做的合理性在于实验测的复合物中配体的构象是比较理想的结合状态,实际跑动力学的时候这种构象也应当是主导性的构象(假设模拟合理的话)。
如果你的蛋白-配体复合物结构是分子对接得到的,那么这个结构里配体的构象的合理性极其有限,甚至可能有明显不合理之处,显然不适合直接拿这样的构象算RESP电荷(哪怕是对氢原子做优化后)。我的一般建议是:先以对接得到的结构为初猜结构做个常规的配体分子的几何优化,然后计算RESP电荷,之后跑复合物的动力学。如果发现动力学过程中配体与蛋白质结合的主要构象与之前优化出来的配体构象相差不大,那么原子电荷就不用重新算;如果相差很显著,说明之前算的RESP电荷可能对于描述蛋白-配体相互作用不够理想,此时对动力学轨迹做个簇分析得到最有代表性的复合物构象,在动力学程序里对复合物做个力场级别的能量极小化,然后把配体抠出来直接算RESP电荷(不再经过量子化学优化),将之作为正式的复合物模拟用的配体的原子电荷即可。