NAMD学~习入门教学教材(一~).doc
《NAMD学~习入门教学教材(一~).doc》由会员分享,可在线阅读,更多相关《NAMD学~习入门教学教材(一~).doc(35页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、-_1. 分子动力学模拟概论 1.1 分子动力学模拟的发展1.2 分子动力学模拟的基本原理1.3 分子动力学模拟相关软件2. 分子动力学入门2.1 基本设置2.2 生成蛋白质结构文件(PSF)2.3 蛋白质的溶质化2.4 球状水体中泛素(Ubiquitin)的分子动力学模拟2.5 立方水体中泛素(Ubiquitin)的分子动力学模拟2.6 简单的结果分析3. 分析方法3.1 平衡态分子动力学模拟分析3.1.1 每个残基的 RMSD 值3.1.2 麦克斯韦-波尔兹曼(Maxwell-Boltzmann )能量分布3.1.3 能量分析3.1.4 温度分布3.1.5 比热分析3.2 非平衡态分子动力
2、学模拟分析3.2.1 热扩散3.2.2 温度回音4 人工操纵的分子动力学模拟(SMD)4.1 除去水分子4.2 恒速拉伸4.3 恒力拉伸4.4 结果分析预定目录预定目录-_1. 分子动力学模拟概论分子动力学模拟(Molecular Dynamics Simulation)是指利用计算机软件,根据牛顿力学的基本原理,模拟大分子的相互作用和运动变化的研究方法。生命科学的研究往往离不开各种仪器,试管和活的有机体,通过实验手段研究生命现象背后的规律。那么,为什么我们要将生命大分子抽象成二进制数据,由计算机软件模拟其行为呢?首先,从理论基础上讲,我们能够使用计算机模拟生物大分子的行为。生物体系非常复杂,
3、但生物大分子如蛋白质,脂肪,多糖等也是许多原子由化学键连接起来形成的,所有原子的运动规律都符合量子力学方程,在较大尺度上也近似符合牛顿力学方程,它的行为是要受物理学基本规律支配的。因此我们可以将利用纯数学的手段,近似模拟生物大分子的行为.其次,从研究需要上讲,我们不仅希望从宏观上研究生命大分子溶液体系的行为,还想直接研究单个生物大分子在原子尺度上的行为,而这是目前的实验仪器难以达到的。比如,我们希望直接研究蛋白质从伸展的肽链折叠成球形的具体过程,使用仪器手段只能收集到间接的数据,但使用软件模拟则可以形象直观的模拟出整个折叠过程,可以具体求算每个键能、键角的变化,研究某几个氨基酸残基之间的相互作
4、用,以及对蛋白质折叠的意义。总之,目前的生物学研究需要我们利用计算机模拟生物大分子的行为,以弥补实验手段的限制,希望能自下而上地阐明生物大分子结构和功能的关系。最后,从实际意义上讲,分子动力学模拟可以用来指导实验,提供思路和理论依据;分子动力学模拟所得结果的正确性也需要回到实验验证。这样,我们可以将分子动力学模拟和实验研究结合成一个整体,从而能够全面地,深入地研究生命现象的本质规律。1.1 分子动力学模拟的发展*暂缺相关文献1.2 分子动力学模拟的基本原理*暂缺相关文献1.3 分子动力学模拟相关软件随着分子动力学模拟技术的飞速发展,逐步形成了一些商品化的软件。应用于生物大分子领域的商品化分子模
5、拟软件主要有 Insight以及 Sybyl,分子模拟是其中的一个重要的模块。Insight中分子动力学模块使用的是由美国哈佛大学 Martin Karplus 研究小组等开发的 CHARMM(Chemistry at Harvard Macromolecular Mechanics) ,同时它本身也是一个商品化的软件。而 Amber(Assisted Model Building with Energy Refinement)则是另一个非常有名分子动力学模拟软件,它是由美国 UCSF 的 Kollman 教授的课题组开发的,-_商业化程度和易用性要好于 CHARMM,当前版本 9.0。以上两
6、个研究小组都为其软件开发了相应的力场,并且现在已经成为分子动力学模拟的经典力场。此外免费和部分免费的软件有 NAMD,Gromos,Gromacs,DL_POLY,Tinker 等。在上述软件中,我们选择 NAMD 作为本章的示范软件。NAMD 是由美国伊利诺斯大学理论与计算生物物理研究组开发的一套分子动力学模拟软件,适用于计算生物大分子,并行计算效率非常高,可以使用 Amber,CHARMM,X-PLOR,GROMACS,OPLS 等多种力场,而且可以兼容 Amber,CHARMM 的文件格式。NAMD 支持几乎所有操作系统,而且免费获取,开放源代码。如配合分子可视化、结果分析软件 VMD
7、以及格点计算软件 BioCoRE 则可使用更多、更强大的功能,进行更大规模的计算,可以说集众多优势于一身。不仅如此,利用 NAMD 还可以进行极具特色的 IMD(Interactive Molecular Dynamics,交互式分子动力学模拟)和 SMD(Steered Molecular Dynamics,可控式分子动力学模拟) 。在本教程中,我们将首先讲解使用 NAMD 进行分子动力学模拟的基本流程,然后讲解经典的结果分析方法,最后我们将简单介绍 SMD 的基本思想和过程。2. NAMD 分子动力学入门2.1 软件基本设置NAMD 的最新版本是 2.6 版,可以从 http:/www.k
8、s.uiuc.edu/Research/namd/ 免费得到(需要进行免费注册) 。此外,我们还需要 VMD 作为分子可视化和辅助分析软件,可以从 http:/www.ks.uiuc.edu/Research/vmd/ 免费得到,最新版本是 VMD1.85 。NAMD 安装方法:事实上 NAMD 是不需要安装的。请新建文件夹 namd-tutorial, 在该目录中新建文件夹 NAMD,下载完成 NAMD2.6 软件包后,将压缩文件解压到文件夹 NAMD 中,就可以使用。 下文中为了叙述方便,我们将默认读者的 NAMD 主程序位于./namd-tutorial/NAMD 目录中(安装 VMD
9、程序时可以安装到任意目录,不影响教程操作) 。-_此外,本教程还需要一系列教程文件。所需文件均可以从 http:/www.ks.uiuc.edu/Training/Tutorials/ 下载(图)下载完成教程所用文件后,请把所有内容解压到 namd-tutorial 目录下,此后的部分我们将默认教程所用文件位于./namd-tutorial 目录中。完成上述准备之后,请打开 Windows 资源管理器,namd-tutorial 目录的结构应该如下:(如果目录形式不一致,请务必进行调整)-_该文件夹中有我们进行动力学模拟所需的所有文件。最后,还需要交代的是,NAMD 不同于我们所熟悉的大多数
10、Windows 软件:它不具有图形界面。打个比方说,我们平常使用 Word,Excel,Photoshop 等有图形界面的软件,好像是面对面聊天;而现在使用不具有图形界面的 NAMD 就像是书信往来:动力学模拟的所有参数设定都需要用户通过一个文本文件通知 NAMD,NAMD 进行处理计算,然后再通过许多输出文件输出结果。不借助其他软件,用户无法直接看到 NAMD 的工作状态。由于进行动力学模拟的准备和结果的可视化分析,必不可少的软件是 VMD,下面的讲解中也将大量用到 VMD。我们假定读者已经对 VMD 的基本操作有一定的了解。VMD 的入门教程可参见本章附录。下面,我们将使用 NAMD 进行
11、简单的分子动力学模拟,并进行初步的分析。我们将要进行动力学模拟的分子是一个 76 个氨基酸的小肽:泛素。知识连接:泛素知识连接:泛素“死亡之吻死亡之吻”泛素是一个由 76 个氨基酸组成的高度保守的多肽链, 因其广泛分布于各类细胞而得名。泛素共价地结合于底物蛋白质的赖氨酸残基,被泛素标记的蛋白质将被特异性地识别,并在蛋白酶体中迅速降解。泛素因此得名“死亡之吻” 。因为被其标记的蛋白都摆脱不了被降解的厄运。随着研究的进一步深入,蛋白质降解过程中泛素的枢纽作用越来越得到重视。蛋白质降解异常与许多疾病(恶性肿瘤,神经退行性疾患等)的发生密切相关。而泛素在蛋白质降解中的作用机制如能被阐明,将对解释多种疾
12、病的发生机制和有重要意义。Hershko、Ciechanover、Rose 三名杰出科学家在泛素标记的蛋白质降解方面做出了突出贡献,他们荣获 2004 年度诺贝尔化学奖。使用 NAMD 进行分子动力学模拟之前,我们需要为 NAMD 准备好各种必须的数据文件,以供 NAMD 使用。这些文件包括:蛋白质分子的蛋白质分子的 PDBPDB 文件。文件。该文件负责储存蛋白质中所有原子的坐标。在后续课程中我们还会了解到,PDB 文件还可以储存原子运动的速度等信息。蛋白质分子的蛋白质分子的 PSFPSF 文件。文件。该文件负责储存蛋白质的结构信息。注意 PDB 文件只记录原子的空间位置,并不储存蛋白质中原子
13、之间的成键情况。成键情况由 PSF 文件负责记录。力场参数文件力场参数文件(force(force fieldfield file)file)。力场参数文件是分子动力学模拟的核心,文件中的数学方程决定了原子在力场中的受力如何计算。常用的四种力场是 CHAEMM, X-PLOR, AMBER 和 GROMACS。NAMD 可以使用以上任何一种力场进行分子动力学模-_拟。配置文件(配置文件(configurationconfiguration filefile)配置文件的目的是告知 NAMD 分子动力学模拟的各种参数,比如 PDB 文件和 PSF 文件的储存位置,结果应当储存在哪里,体系的温度等等
14、上述四种文件中,PDB 文件通常是从蛋白质结构数据库(Protein Data Bank)中获得。力场参数文件也可以从网上下载, 而 PSF 文件和用户配置文件是用户根据具体要求自己生成的。下面我们将首先制作蛋白质结构文件(PSF) 。2.2 生成蛋白质结构文件(PSF)1、单击 开始菜单程序 VMD,打开 VMD 窗口2、在 VMD 主窗口中,单击 File New Molecule 打开 Molecule File Browser对话框;单击 Browse按钮,在弹出的文件浏览中找到 namd-tutorial/1-1-build 文件夹,在此文件夹中选择 1UBQ.pdb,单击 Load
15、 按钮载入 1UBQ.pdb。提示:关于文件后缀名提示:关于文件后缀名如果浏览文件时看不到“.psf” “.pdb”等后缀名,可以在“我的电脑”中选择“工具”“文件夹选项” ,在“查看”选项卡中取消“隐藏已知文件类型的扩展名” 。强烈推荐读者取消这一项,因为这还涉及到下文中的许多操作。载入之后在图形窗口(VMD 1.8.5.OpenGL Display)中应当可以看到下图(图):可以看到,所有的氧原子用红色表示,碳原子以天蓝色表示(碳原子所连的键也是天蓝色,所以整个蛋白骨架为天蓝色) ,硫原子以黄色表示。注意到没有出现氢原子,这是因为此结构是由 X 射线晶体衍射得来的,而 X 射线衍射一般得不
16、到氢原子的精确位置。-_注意:蛋白周围的红点实际上是水分子,由于没有氢,所以仅显示出一个一个的氧原子。我们只需要蛋白质分子的结构,因此下面我们将首先除去 pdb 文件中带有的水分子。4、单击 Extension TK Console 菜单项,弹出 VMD Tk Console 窗口。首先用cd 命令改变当前目录到 namd-tutorial /1-1-build 下。然后输入下列命令:setset ubqubq atomselectatomselect toptop proteinprotein$ubq$ubq writepdbwritepdb ubqp.pdbubqp.pdb(每输入一行命令
17、后按回车键,下同。另外,尤其要注意空格的有无和空格的位置,否则空格位置不对可能造成命令执行错误)提示:提示:VMDVMD TKTK ConsoleConsole(VMDVMD 控制台)中改变当前目录的方法控制台)中改变当前目录的方法 在 Windows 命令行模式中和 VMD TK Console 中都是用 cd 命令改换当前目录的。但是注意二者的使用方法不同。这里简单说明 VMD TK Console 中改变当前目录的方法,Windows 命令行改变目录的方法将在后面说明。在 VMD TKConsole 中,改变目录的命令十分简单。无论是改变到哪一个目录,只需要输入:cd 目标目录比如本例中
18、,假设需要改变目录到 E:/namd-tutorial/1-1-build ,无论当前目录是什么,只需要在 VMD TKConsole 中输入以下命令即可:cd e:/namd-tutorial/1-1build输入以上命令之后,VMD 已经在 1-1-build 目录下生成了文件 ubqp.pdb。这一 PDB文件仅包含泛素蛋白,不含水分子。5、在 VMD 主窗口中单击 1UBQ.pdb,选择 MoleculeDelete Molecule 菜单项删除当前分子。6、下面我们将生成泛素蛋白的 psf 文件。注意:VMD 组件中实际上提供了一个全自动的 psf 文件生成器(选择 Extensio
19、nsModelingAutomatic PSF Builder 菜单项)。但我们将人工制作所需要的 psf 文件,以让读者明白制作的详细流程。制作时,需要使-_用 VMD 提供的 psfgen 软件包。7、首先,打开写字板,输入以下内容:package require psfgentopology top all27_prot_lipid.inppdbalias residue HIS HSEpdbalias atom ILE CD1 CDsegment U pdb ubqp.pdb coordpdb ubqp.pdb Uguesscoordwritepdb ubq.pdbwritepsf u
20、bq.psf8、输入完成之后,保存文件。注意文件保存在1-1-build目录中,文件名为ubq.pgn,文件类型选择文本文档。然后退出写字板。这样我们便制作了pgn文件,这一文件可以被psfgen软件包所识别,并处理成我们想要的psf文件。我们需要在VMD中使用该文件调用psfgen数据包下面我们详细介绍一下刚刚输入的每一行命令的意义:package require psfgen:通知VMD我们将要调用psfgen数据包topology top all27_prot_lipid.inp:载入拓扑文件 top_all27_prot_lipid.inppdbalias residue HIS HS
21、E:改变组氨酸残基名,使得残基名称能够和拓扑文件中的一致。在pdb文件中组氨酸残基名是HIS,而在拓扑文件中组氨酸残基名为 HSE, HSD, HSP 三种。分别对应组氨酸的三个不同的带电荷形式。pdbalias atom ILE CD1 CD:改变异亮氨酸中的原子名。pdb文件中异亮氨酸碳的名称为CD1,而拓扑文件中原子名应该为CD。segment U pdb ubqp.pdb:生成一个集合(segment)U,包含ubqp.pdb中的所有原子。coordpdb ubqp.pdb U:从ubqp.pdb中读取坐标,比较各个原子的名称是否对应,然后旧的集合名被改换成新的名称“U”。guessc
22、oord:根据拓扑文件推测缺少的原子(氢原子)的空间位置。-_writepdb ubq.pdb:生成新的pdb文件,包含所有原子的坐标,包括刚刚推测出的氢原子。writepsf ubq.psf:生成psf文件,该文件包含蛋白结构的全部信息。知识链接:组氨酸的三种离子模式知识链接:组氨酸的三种离子模式知识链接:知识链接:PDBPDB文件中原子的命名方式文件中原子的命名方式9、如果刚刚关闭了VMD,则重新打开,改变目录至1-1-build。然后输入以下命令:source ubq.pgn这样我们就成功得到了含有氢原子的psf文件。同时,可以看到VMD TKConsole中显示出系统返回的信息。信息显
23、示我们的系统中有1231个原子,631个原子的坐标是推测的(图)。现在在你的1-1-build文件夹下应当有ubq.pdb和ubq.psf两个文件。到此为止,我们已经成功制作了下一步分子动力学模拟所需的psf文件。2.2 蛋白质的溶质化显然在真实情况下,蛋白质不是在真空中存在下面。所以我们需要把蛋白质放入一-_个水环境中,以更真实的模拟生物体内的环境。我们可以使用两种水体环境进行动力学模拟:球状水体(water sphere) 。水体包围蛋白质,四周则是真空,动力学模拟时没有周期性边界条件(periodic boundary condition)立方水体(water box)。立方水体是正六面
24、体形状的水体(不一定是正立方体) 。使用立方水体需要我们设定周期性边界条件。2.2.1 生成球状水体(water sphere)我们将使用一个脚本文件建立球状水体。脚本文件在 1-1-build 目录下,文件名是wat_sphere.tclwat_sphere.tcl。1、如果刚刚关闭了 VMD,则重新打开,改变目录至 1-1-build。然后输入以下命令:source wat_sphere.tcl输入之后 VMD 将会调用脚本文件,之后 VMD 会反馈一系列信息(图) ,2、由所给的信息我们可以看出,VMD 生成了两个文件:ubq_ws.pdbubq_ws.pdb 文件和文件和ubq_ws.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- NAMD 入门 教学 教材
限制150内