2022年序列分析一般程序中的一个实例汇编 .pdf
《2022年序列分析一般程序中的一个实例汇编 .pdf》由会员分享,可在线阅读,更多相关《2022年序列分析一般程序中的一个实例汇编 .pdf(39页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、1 对一条新的基因序列进行生物信息学的分析前言对从真菌tabescens 中克隆出一个基因的全长cDNA 进行生物信息的分析,预测这个未知cDNA 的功能目前因特网上有许多生物学信息库,采用不同的算法,对生物学数据进行从序列水平到结构层次,进而到功能的多种分析。本章的分析主要利用这些数据库和相关软件完成。材料和仪器(1)生物技术实验室从一株产?-甘露聚糖酶的新菌种A.tabescens EJLY2098克隆出一个全长cDNA(命名为 man)(2)可以连接国际互联网的计算机核酸序列的基本分析运用 DNAMAN 软件分析核酸序列的分子质量、碱基组成和碱基分布。同时运用BioEdit(版本 7.0
2、.5.3)软件对 man做酶切谱分析。碱基同源性分析运用NCBI信息库的BLAST 程序对man 进行碱基同源性分析(Translated query vs.protien database(blastx)网站如下:http:/www.ncbi.nlm.nih.gov/BLAST/参数选择:TRANSLA TED query-PROTEIN database blastx;nr;stander1开放性阅读框(ORF)分析名师资料总结-精品资料欢迎下载-名师精心整理-第 1 页,共 39 页 -2 利用 NCBI 的 ORF Finder 程序对 man做开放性阅读框分析,网址如下:http:/
3、www.ncbi.nlm.nih.gov/projects/gorf/orfig.cgi参数选择:Genetic Codes:1 Standard 对蛋白质序列的结构功能域分析运用简单模块构架搜索工具(Simple Modular Architecture Research Tool,SMART)对 man ORF 出的蛋白质序列进行蛋白质结构功能域分析。该数据库由EMBL 建立,其中集成了大部分目前已知的蛋白质结构功能域的数据。12网址如下:http:/smart.embl-heidelberg.de/运用 NCBI 的 BLAST 程序再对此蛋白质序列进行rpsBlast分析参数选择:Se
4、arch Database:CDD v2.0711937PSSMs Expect:0.01 Filter:Low complexity Search mode:multiple hits 1 pass 同源物种分析用 DNAMAN软件将蛋白质序列与GHF5 的?-甘露聚糖酶序列和GHF6的?-甘露聚糖酶序列序列比对,根据结果绘出系统进化树,并进行分析。名师资料总结-精品资料欢迎下载-名师精心整理-第 2 页,共 39 页 -3 蛋白质一级序列的基本分析运用 BioEdit(版本 7.0.5.3)软件对 man ORF 翻译的蛋白的一些基本性质,对分子量、等电点、氨基酸组成等作出分析。二级结构和
5、功能分析信号肽预测利用丹麦科技大学(DTU)的CBS 服务器蛋白质序列的信号肽(signal peptide)预测,进入 Prediction Serves 页面。网址如下:http:/www.cbs.dtu.dk/services/SignalP/参数选择:Eukaryotes;Both;GIF(inline);Standard;疏水性分析利用瑞士生物信息学研究所(Swiss Institute of Bioinformatics,SIB)的 ExPASy服务器上的 ProtScale程序13对 ORF 翻译后的氨基酸序列做疏水性分析网址如下:http:/us.expasy.org/cgi-
6、bin/protscale.pl参数选择:蛋白质溶解能力和PROSITE motif search 的分析利用美国哥伦比亚大学(Columbia University)的 PredictProtein服务器(PHD)14对 ORF 翻译后的氨基酸序列通过发邮件的方式获得名师资料总结-精品资料欢迎下载-名师精心整理-第 3 页,共 39 页 -4 蛋白质溶解能力和PROSITE motif search 分析的结果。网址如下:http:/cubic.bioc.columbia.edu/pp/submit_def.html磷酸化位点分析磷酸化和去磷酸化是细胞内信号传导的重要方式,利用丹麦科技大学(
7、DTU)的 CBS 服务器上的 NetPhos2.0 Server程序15 做磷酸化位点分析。NetPhos2.0 Server 程序是基于神经网络算法,对蛋白序列中的Ser、Thr 和 Tys三种氨基酸残基可能成为的磷酸化位点作出预测,网址如下:http:/www.cbs.dtu.dk/services/NetPhos/跨膜区分析蛋白质序列含有跨膜区提示它可能作为膜受体起作用,也可能是定位于膜的锚定蛋白或者离子通道蛋白等,从而,含有跨膜区的蛋白质往往和细胞的功能状态密切相关。12利用丹麦科技大学(DTU)的 CBS服务器上的 TMHMM Server v.2.0 程序进行蛋白序列跨膜区分析。
8、网址如下:http:/www.cbs.dtu.dk/services/TMHMM/参数选择:Extensive with graphics 亚细胞定位名师资料总结-精品资料欢迎下载-名师精心整理-第 4 页,共 39 页 -5 通过 WoLF PSORT 工具基于其氨基酸序列预测蛋白质亚细胞定位点网址如下:http:/wolfpsort.seq.cbrc.jp/参数选择:Fungi;From Text Area 二硫键分析运用 SCRATCH Protein Predictor 对蛋白质的二硫键做出分析。网址如下:http:/www.ics.uci.edu/baldig/scratch/ind
9、ex.html参数选择:Dlpro(Disulfide Bonds)二级结构预测运用PBIL LYON-GERLAND 信息库对蛋白质序列进行二级结构预测(Secondary structure prediction),主要用Hopfield神经网络(HNN)预测。网址如下:http:/npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_hnn.html结果从一株产?-甘露聚糖酶的新菌种A.tabescens EJLY2098获得的全长名师资料总结-精品资料欢迎下载-名师精心整理-第 5 页,共 39 页 -6 cDNA序列如下:
10、ACGCGGGGGAAAGATGCATCTGCTCGCTTTTCTGTCTCTGAGTACATTCCTGTGCTCTGCGTTCGCTGCTGTTCCTGAGTGGGGCCAATGTGGCGGCATTGGATGGACAGGACAGACCACTTGCGTTAGTGGTACAGTATGCGCAGCTCTCAATGACTATTATTCTCAATGTGTGCCTGGAACGGCCACAACAACGGCCGCTCCCACGACTGCTACATCAACAACCATTTCTTCCACTTCTCGCACAACTGCTACGTCGACCACAGCTTCCGCACCATCTTCTACTGGCTTTGTAACTAC
11、CTCTGGCACAGAGTTCCGCCTCAACGGTGCCAAATTTACTATCTTCGGCGCCAACTCATACTGGGTCGGGTTGATGGGCTATAGCACTACAGATATGAATAAAGCCTTCGCAGACATCGCGGCTACAGGTGCCACCGTCGTCCGCACATGGGGCTTCAATGAGGTAACGAGTCCTAACGGGATTTATTACCAGAGTTGGTCCGGAAGTACACCAACTATCAACACAGGTTCTACGGGTCTTCAAAACTTTGATGCCGTCGTCGCTGCTGCTGCTGCACATGGCTTGAGGCTTATTGTTGC
12、CATAACGAACAACTGGTCCGACTATGGTGGAATGGATGTATACGTTAACCAAATTGTCGGGTCTGGCTCTGCGCACGATTTATTCTATACCGACTGTGAGGTTATATCTACTTACATGAACTACGTCAAGACCTTCGTCTCGCGCTATGTGAACGAACCTACTATTTTAGGTTGGGAGCTTGCAAATGAACCTAGATGCAAGGGGAGTACCGGGACGACCTCTGGATCATGCACTGCAACGACTATCACAAAATGGGCCGCGGCAATTTCAGCGTACATCAAGTCGATCGATCCCAACCA
13、TCTTGTCGGGATAGGAGATGAAGGGTTCTACAATGAACCTAGCGCACCAACATATCCATATCAAGGTAGCGAAGGTATCGATTTTGATGCAAATTTGGCCATTAGTAGCATTGATTTCGGTACATTCCATTCCTATCCTATCAGCTGGGGTCAAACCACTGATCCTCAGGGATGGGGTACGCAATGGATCGCTGATCATGCAACGTCAATGACAGCTGCGGGAAAGCCCGTAATCTTAGAGGAGTTTGGAGTCACCACTAATCAAGCAACTGTTTATGGCGCCTGGTATCAGGAAGTTGT
14、CTCTTCGGGTCTTACTGGTGCTCTTATTTGGCAAGCTGGTTCTTATTTATCATCCGGAGCTACTCCGGACGACGGATATGCAATTTATCCTGATGATCCTGTATATTCCCTGGAAACCTCCTATGCGGTTACATTGAAAGCGCGGGCGTAGGATAGGGTACAGAATAAATTTTGCTCCGATGTGGT名师资料总结-精品资料欢迎下载-名师精心整理-第 6 页,共 39 页 -7 ACTGTAGCCGAGCGGCTTGACTATGTGAATAAAAATAGCACTGTTGTCACGATCGATCAACACCTAAAAAAAAAA
15、AAAAAAAAAAAAAAAAAAAAAA 核酸序列的基本分析核酸序列的基本分析结果如下:SEQ New:1483 bp;Composition 388 A;358 C;351 G;386 T;0 OTHER Percentage:26.2%A;24.1%C;23.7%G;26.0%T;0.0%OTHER Molecular Weight(kDa):ssDNA:457.73 dsDNA:914.24 ORIGIN 1 ACGCGGGGGA AAGATGCATC TGCTCGCTTT TCTGTCTCTG AGTACATTCC TGTGCTCTGC 61 GTTCGCTGCT GTTCCTGA
16、GT GGGGCCAATG TGGCGGCATT GGATGGACAG GACAGACCAC 121 TTGCGTTAGT GGTACAGTAT GCGCAGCTCT CAATGACTAT TATTCTCAAT GTGTGCCTGG 181 AACGGCCACA ACAACGGCCG CTCCCACGAC TGCTACATCA ACAACCATTT CTTCCACTTC 241 TCGCACAACT GCTACGTCGA CCACAGCTTC CGCACCATCT TCTACTGGCT TTGTAACTAC 301 CTCTGGCACA GAGTTCCGCC TCAACGGTGC CAAATT
17、TACT ATCTTCGGCG CCAACTCATA 361 CTGGGTCGGG TTGATGGGCT ATAGCACTAC AGATATGAAT AAAGCCTTCG CAGACATCGC 421 GGCTACAGGT GCCACCGTCG TCCGCACATG GGGCTTCAAT GAGGTAACGA GTCCTAACGG 481 GATTTATTAC CAGAGTTGGT CCGGAAGTAC ACCAACTATC AACACAGGTT CTACGGGTCT 541 TCAAAACTTT GATGCCGTCG TCGCTGCTGC TGCTGCACAT GGCTTGAGGC TTAT
18、TGTTGC 601 CATAACGAAC AACTGGTCCG ACTATGGTGG AATGGATGTA TACGTTAACC AAATTGTCGG 661 GTCTGGCTCT GCGCACGATT TATTCTATAC CGACTGTGAG GTTATATCTA CTTACATGAA 721 CTACGTCAAG ACCTTCGTCT CGCGCTATGT GAACGAACCT ACTATTTTAG GTTGGGAGCT 781 TGCAAATGAA CCTAGATGCA AGGGGAGTAC CGGGACGACC TCTGGATCAT GCACTGCAAC 841 GACTATCAC
19、A AAATGGGCCG CGGCAATTTC AGCGTACATC AAGTCGATCG ATCCCAACCA 901 TCTTGTCGGG ATAGGAGATG AAGGGTTCTA CAATGAACCT AGCGCACCAA CATATCCATA 961 TCAAGGTAGC GAAGGTATCG ATTTTGATGC AAATTTGGCC ATTAGTAGCA TTGATTTCGG 1021 TACATTCCAT TCCTATCCTA TCAGCTGGGG TCAAACCACT GATCCTCAGG GATGGGGTAC 1081 GCAATGGATC GCTGATCATG CAACG
20、TCAAT GACAGCTGCG GGAAAGCCCG TAATCTTAGA 1141 GGAGTTTGGA GTCACCACTA ATCAAGCAAC TGTTTATGGC GCCTGGTATC AGGAAGTTGT 1201 CTCTTCGGGT CTTACTGGTG CTCTTATTTG GCAAGCTGGT TCTTATTTAT CATCCGGAGC 1261 TACTCCGGAC GACGGATATG CAATTTATCC TGATGATCCT GTATATTCCC TGGAAACCTC 1321 CTATGCGGTT ACATTGAAAG CGCGGGCGTA GGATAGGGTA
21、 CAGAATAAAT TTTGCTCCGA 1381 TGTGGTACTG TAGCCGAGCG GCTTGACTAT GTGAATAAAA ATAGCACTGT TGTCACGATC 1441 GATCAACACC TAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAA 对其所做对其所做的酶切谱分析结果如下:名师资料总结-精品资料欢迎下载-名师精心整理-第 7 页,共 39 页 -8 对 DQ286392 的酶切图(见附录1)单酶切统计,见下表:Restriction table:Enzyme Recognition frequency Positions_AccI GT
22、mk_AC 2 258,640 AloI GAACnnnnnnTCCnnnnnnn_nnnnn 1 632 AloI GGAnnnnnnGTTCnnnnnnn_nnnnn 1 600 AlwI GGATCnnnnn_ 5 833,885,1056,1095,1290ApoI rAATT_y 3 333,992,1368BanI GGyrC_C 4 327,348,429,1179 BbeI G_GCGCC 2 352,1183 BbsI GAAGACnnnnnn_ 1 531 BbvI GCAGCnnnnnnnnnnnn_ 7 53,156,551,554,557,560,1103BceAI
23、ACGGCnnnnnnnnnnnnnn_ 3 199,211,540BcgI CGAnnnnnnTGCnnnnnnnnnn_nn 3 1003,998,1294BcgI GCAnnnnnnTCGnnnnnnnnnn_nn 3 969,1032,1260BclI TGATC_A 1 1094 BfrBI ATGCAT 1 17 BglI GCCn_nnnnGGC 1 91 BmrI ACTGGGnnnn_n 1 371 BpuEI CTTGAGnnnnnnnnnnnnnn_nn 1 605 BsaHI GrCG_yC 2 349,1180 BsaJI CCnnG_G 2 859,1309 Bsa
24、WI wCCGG_w 3 501,1254,1265BsaXI ACnnnnnCTCCnnnnnnn_nnn 1 215 BsaXI GGAGnnnnnGTnnnnnnnnn_nnn 1 185 BseMII CTCAGnnnnnnnn_nn 3 30,67,1080BseRI GAGGAGnnnnnnnn_nn 1 1155 BseYI CCCAG_C 1 1045 BsgI GTGCAGnnnnnnnnnnnnnn_nn 1 559 BsiEI CG_ryCG 3 199,889,1440 BsiHKAI G_wGCwC 2 57,1223 BslI CCnn_nnnnnGG 4 81,4
25、49,963,1272BsmAI GTCTCnnnnn_ 3 40,743,1205BsmBI CGTCTCnnnnn_ 1 743 BsmFI GGGACnnnnnnnnnnnnnn_ 1 827 Bsp1286I G_dGChC 2 57,1223 BspCNI CTCAGnnnnnnn_nn 3 31,68,1079BspEI TCCGG_A 3 501,1254,1265 BsrI ACTG_Gn 4 290,366,618,1220名师资料总结-精品资料欢迎下载-名师精心整理-第 8 页,共 39 页 -9 BsrBI CCGCTC 2 201,1399 BsrDI GCAATG_n
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年序列分析一般程序中的一个实例汇编 2022 序列 分析 一般 程序 中的 一个 实例 汇编
限制150内