《16SrDNA测序结果分析.docx》由会员分享,可在线阅读,更多相关《16SrDNA测序结果分析.docx(4页珍藏版)》请在第一文库网上搜索。
1、16SrDNA测序结果分析2017-12-131测序结果文件一般公司DNA测序结果都提供两个文档,一个是序列文档(后缀为.seq),一个是测序峰图文档(后缀.ab1),为碱基的测序质量信息。(A) .seq-序列文件,TEXT的序列文档,可由记事本或BioEdit打(B) .ab1-峰图文件,可由BioEdit或ChrOmaS打开察看。A01.P20047_P250340a_7S1A_F-记事本ATCTTCTGTCTAGCTAGTGATTCCTGTGTTGTGTGCATTC(GgggcacgctgcagacgatcctggggggtgtgaacaaaATnTTCGCATTATGATCcTCGT
2、TGTGGcTGCAAAGGAGGGcagccaggctccaagaacgtgtgctacgatcactacttiTCGTGTCCACGCCAGCGCTCCTAGTGGCCATGCACGTGDNAsequencefrome.) 然后在BioEdit的Sequence-se1ectPc)SitiOnS,在弓单出窗口中输入56与950,点OK按钮后,就以背景黑的显示已选择的序列。 再选edit菜单-Copy(或直接按Ctr1-C键),复制序列到一个新的文本文件,保存为16S_rDNA.faso增加序列的注释行16SF”,代表正向测序序列。 同上步骤,根据峰图信息,再复制另一个反向测序结果的高质量序
3、列(56-950)到文本文件16S_rDNA.fas,并标记序列为16SR,代表反向测序序列。DNA测序通常需要两个方向进行,测序都是从DNA的5端到3端进行的,正向和反向测序是指对DNA的两条互补链分别测序。双向测序结果经校读后完全一致才能认为得到可靠DNA测序结果。3 .双向测序序列的合并通常PCR产物双向测序,需要合并双向序列,最终得到全长序列,这样得到DNA序列比较准确。.BiOedit打开前面保存的16S,DNA.fas由于第二条序列是反向测序得到的DNA反向互补序列,需要通过先得到DNA的反向互补序列:Sequece-Nu1eicAcid-ReverseComp1ement,再进行
4、比对。利用BioEdit的a1ignment功能找重叠区域:ACCeSSoryapp1ication-C1usta1Wmu1tip1ea1ignment,使用默认设置,比对结果显示,中间重叠部分的序列大部分相似。如果重叠区不是大部分相同碱基,请试着把一条序列反向互补,再比对。4 .碱基的校准在上一步的比对结果窗口,先利用BiOEdit得到两条件序列合并后的一致序列: A1ignment菜单-CreateConsensusSequenceo 如是中间重叠区有少部分碱基不一致,可根据对应的峰图文件ab1的质量信息,修改碱基。修改碱基前,需要先把bioedit的Mode设置为Edit与Insertw
5、,并选中按钮viewconservationp1ottingidentities.withadot”,以点显示相同的碱基,便于观察差异位点。 在BioEdit中打开正向和反向测序结果的AB1文件和上面比对结果放同一窗户(如图)。 定位到差异碱基的位置(下图黑色部分),一般可以在峰图文件中查找不一致碱基(正反链错配、缺失或误增碱基)及附近的几个序列(点击Edit菜单-find,或直接Ctr1-F),如查找GCAtACo注意反向测序峰图的搜索,需要输入序列的反向互补序列(GTtTGC),小写字母为不一致碱基。 查看该碱基及附近碱基正反测序峰图形状,判断该碱基正确的碱基序列。 然后在序列窗口中分别改
6、正正向16SF、反向16SR及Consensus序列中不一致的碱基。如有空格(gap)显示为-,需要把三条序列同一位置上的碱基与-都删除,才能保持后面的碱基比对结果正常(BaCkSPaCe可删除光标前一个碱基)。EtMSequmceAftgnmentytor-O在BioEdit中打开正向和反向测序结果的AB1文件和上面比对结果放同一窗户(如5 .保存序列保存校正后的consensus序列,即为最终测序结果的合并序列。 选择concensus序歹(-鼠标右键:COPysequences 点击fi1e菜单-新建A1igment 点击Edit菜单-pastesequence,并点击COnCenSUS
7、的标题改为16S,rDNAw 然后保存为16S_rDNA.fas(文件类型选择Fasta格式)W4fUGX心力短也|闻1Q0X小16SjDNA.GGGAGTGGGGGCATGCnACCATGCAAGTCGCACGAAGGECGGCCTTAGTGGCGGACGGGTGAGTAACGCGTAGGTATeTATCeATGGGTGGGGGATAACACTGGGAAACCGGTGCTAATACCGCATGACACCTGAGGGTCAAAGGCGCAAGTCGCCTGTGGAGGAGCCTGCGEGATTAGCTAGTGGTGGGGGGTAAAGACTATATGCGATGATCATAGGCTGGAGAGA
8、TGATCAGGCACACTGGACTGAGACACGTCCAGACTCTACGGGAGCAGCAGTGGGGGAATATGACAATGGGGGCACCTGATCCAGCAATGCCGCGTGTGTGAAGAAGGTCTTCGGATTGTAAAGCACECGACGGGGACGATGATGACGGTACCCGTAGAAGAAGCCCCGGCTAACTTCGTGCCAGCAGCCGCGGTAATACGAAGGGGGeTAGCGTTGCTeGGAATGACTGGGCGTAAAGGGCGTGTAGGcGG1TrGTAcAGTcAGATGTGAAATccccGGGcnAAcATGGGAGcTGcATGT
9、GATACGTGCAGACTAGAGTGTGAGAGAGGGnGTGGAAnccCAGTGTAGAGGTGAAAncGTAGATAnGGGAAGAAcAccGGTGGcGAAGGcGGcAAccTGGcTcAnACTGACGCTGAGGCGCGAAAGCGTGGGGAGCAAACAGGATTAGATAeCCTGGTAGTCCACGCTGTAAACGATGTGTGcrAGATGTTGGGTGAEAGTCATTCAGTGTCGCAGTTAACGCGTTAAGCACACCGCCTGGGGAGTACGGCCGCAAGGGAAACTCAAAGGAAGACGGGGGCCCGCACAAGCGGTGGAGCA
10、TGTGGTAACGAAGCAACGCGCAGAACCACCAGGGCGAATGTAGAGGCTGCAAGCAGAGATGTGTCCCGCAAGGGACCTCTAACACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGnGGGTTAAGTCCCGCAACGAGCGCAACCCCTATCEAGTTGCeATCAGGTTGGGCrGGGCACTCTAGAGAGAeTGCCGGTGACAAGCCGGAGGAAGGTGGGGATGACGTCAAGTCCTCATGGCCCATGTCCTGGGCTACACACGTGCTACAATGGCGGTGACAGTGGGAAGCTAGGTGGTGACACCATGCTGATCTCTAAAAGCCGTCTCAGTTCGGAGCACTCTGCAACTCGAGTGCATGAAGGTGGAATCGCTAGTAATCGCGGATCAGCA