在Sanger测序结果复核、克隆验证或者突变位点确认的时候,经常会碰到需要处理测序峰图的情况。关于MacVector怎么导入测序峰图,以及面对杂峰要怎么校正,处理的时候不能只看软件自动识别出来的那串碱基,还得回到原始的峰形、质量区间和参考序列上去判断。MacVector可以直接打开ABI的Trace文件,并且能像分析普通序列一样去处理它,在Align To Reference和Assembler界面里也能够显示实际的峰图数据。
一、MacVector怎么导入测序峰图
在导入峰图之前,先得把文件类型和样本编号搞清楚。测序公司通常返回来的文件可能有.ab1、.abi、.scf、.seq这几种,其中真正携带峰图信息的,主要是Trace文件,而单独的seq或者fasta文件一般只是碱基文本,靠它们是没法去直接检查峰高和杂峰的。
1、直接打开Trace文件
在MacVector里面,点开【File】菜单,选【Open】,然后找到那个.ab1或者其他格式的Trace文件并打开就行了,文件打开之后你就可以在编辑窗口当中同时看到序列和峰图了;官方的说明里面也提到了,ABI的Trace文件可以直接打开,并且能用在任何接受外部序列文件的功能里面。
2、导入到参考序列比对里面去看
如果你的目的是想确认突变位点、插入缺失,或者搞清楚测序的方向,那比较推荐的做法是进到【File】→【New】→【Align Sequences To A Reference】这个功能里,先把参考序列选好,再把Trace文件给添加进去,这样做的好处是能把峰图读段直接放到参考序列对应的位置上去观察,跟单独盯着一条峰图看相比,会更容易判断那些错配到底是不是真实存在的。
3、导入到Assembler项目当中去
要是手头同时有正反向的测序文件,或者同一个片段拿到了好几条读段,那你就可以把这些Trace文件放进一个Assembly Project里面;MacVector在杂合分析相关的说明里也提到了,这个工具是可以在Assembly Project Manager和Align to Reference editor里面去同时处理多条trace文件的。
二、MacVector测序峰图杂峰怎么校正
在看到峰图里出现双峰的时候,不能一上来就直接去改碱基。Sanger峰图里面常见的杂峰,有可能来自样品本身真的存在杂合情况,也有可能是质粒混进了别的样、模板本身纯度不够、引物的特异性不好、读段末端质量下降,或者仅仅只是局部的basecall出了错。
1、先去看一看峰图的质量区间
读段的两端往往是质量比较差的地方,通常峰形会比较宽,重叠的情况也多,背景噪声也高,如果杂峰主要是集中在开头那几十个碱基,或者读长最末端的那一段,那就要优先考虑它是不是属于低质量的区域,不要轻易地把它当成真实的突变来看待;MacVector在杂合分析的设置里面,也包含了忽略低质量区域、质量窗口还有平均质量阈值这些选项。
2、动手跑一下杂合位点的分析
先把Trace文件给打开,或者在Align to Reference、Assembly Project里面把Trace文件给选中,然后进到【Analyze】菜单下面的【Heterozygote Analysis】里,去查看那些可疑的杂合位点;MacVector在18.5版本里增加了heterozygote calling这个工具,它不但可以查看Sanger trace当中的杂合位点,还能用ambiguity的形式去改写basecalled sequence。
3、人工去复核一下峰形
对于那些被软件标出来的位点,需要把图放大,仔细去看四种颜色的峰是不是在同一个位置上发生了重叠,次峰的高度是不是比较稳定,还有前后碱基是不是连续的;如果说只有一个位置上孤零零地出现了一个小杂峰,而周围的峰形都很正常,那在多数情况下就不应该直接把它改成杂合码。
4、利用正反向的读段来做确认
在有正反向测序结果的条件下,可以把这两条Trace一起拿去比对到参考序列上,真正可靠的变异,一般都应该能在正反两个方向或者多条读段当中得到支持;要是某一个小峰只在单条质量不怎么好的读段里面才出现,那比较稳妥的办法是先把它标记成待确认,而不是直接就写进最终的序列里面去。
三、MacVector峰图校正后怎么复核
在把峰图校正完了之后,一定要把当初修改的依据给留下来,尤其是那些要用于出报告、确认质粒构建或者验证突变的序列。
1、把原始的Trace文件保留好
原来那个.ab1文件千万不要去覆盖它,校正之后的序列可以另外再存成一个新的文件,并且在文件名上面把样本信息、测序方向和日期都标注出来,这样后面再去追溯就会方便很多。
2、检查一下那些碱基被改动过的位置
对于所有手工修改过的位点,要一个一个地重新回去看一下峰图,还有它在参考序列比对当中的位置,确认一下自己刚才没有因为峰形太挤、读序的方向搞反了,或者序列本身对错了位置而造成了误改。
3、把记录的截图导出来
要是某些位点特别关键,就可以用打印或者导出的方式,把峰图的记录给保存下来;MacVector的说明里面也提到过,可以通过【File】→【Print】这个操作把它存成PDF,用来专门保留chromatogram的记录。
4、把最终的序列更新一下
在确认了杂峰的处理没有问题了之后,再把校正好了的序列给导出来,拿去做后续的比对、注释、引物设计,或者提交记录这些事情,千万不要把还没有经过复核的那种自动basecall序列直接当成最终的结果来用。
总结
想要在MacVector里面导入测序峰图,主要就是直接打开ABI的Trace文件,或者把Trace文件放到Align To Reference和Assembler项目里面去查看;至于测序峰图里面杂峰的校正,关键是要结合质量区间、Heterozygote Analysis的分析结果、峰形的具体细节,还有正反向读段的情况去做判断。校正杂峰并不是要把所有的小峰都给改掉,而是要分清楚哪些是真实的变异、哪些是低质量的信号、哪些只是测序过程中产生出来的噪声,等确认清楚了以后,再去更新最终的序列。