做测序结果核对时,最怕的不是有错,而是看到了差异却不知道该先改哪里、该不该直接裁掉两端低质量区域。MacVector这类工作通常不是在单个序列窗口里硬改,而是先把参考序列和测序读段放到同一个对齐环境里,再结合痕迹图、错配定位和质量值显示来判断。MacVector的Sequence Confirmation适合拿已知参考序列去核对克隆、接头区或点突变结果,而低质量碱基批量修剪则主要针对Sanger读段两端质量下降的情况。
一、MacVector序列校正怎么做
真正做校正时,先别急着手改碱基。MacVector的思路是先建立参考对齐,再用痕迹图和错配定位去判断是参考错了、读段错了,还是只是局部比对没摆正。这样做出来的修改更稳,也更容易回退。
1、先把参考序列放进【Align to Reference】
先打开你的参考序列文件,然后在序列窗口中点击【Analyze】→【Align to Reference】。MacVector会新建一个对齐窗口,顶部放的是参考序列,后面所有测序文件都会围绕这条参考去做核对。这个功能本来就是给序列确认用的,适合确认克隆片段、接头区以及定点突变结果。
2、再用【Add Seqs】把测序读段加进去
进入对齐窗口后,点击工具栏里的【Add Seqs】导入测序文件。MacVector支持ABI、SCF和ALF这类痕迹文件,导入后读段会显示在参考序列下方,如果文件里带trace数据,下方还会出现图形痕迹面板,方便你直接看峰形。
3、点【Align】并确认使用Sequence Confirmation
文件加完后,点击工具栏里的【Align】,并确保下拉类型选的是Sequence Confirmation。完成后,MacVector会把读段按参考序列重新排好。这个算法就是为近缘序列核对准备的,尤其适合有少量短插入、缺失或点差异的情况。
4、先开【Dots】再找第一处错配
对齐完成后,先点【Dots】把与参考一致的位置显示成点,这样真正不一致的碱基会更显眼。然后点【First Mismatch】和【Next Mismatch】逐个跳转到参考序列与共识序列不一致的位置。MacVector会把当前位置对应的痕迹图也一起带到视野中心,核对起来比手动拉滚动条快很多。
5、看痕迹图后再决定改参考还是改读段
在校正阶段,最重要的是先看峰形再下手。点击参考序列或共识序列时,MacVector会把相关trace对齐到当前位置;如果你确认某个位点参考写错了,可以直接编辑参考序列;如果是单条读段有问题,也可以改那条读段。需要注意的是,共识序列不能直接编辑,它是根据重叠读段动态计算出来的。
6、直接键入碱基即可修改,复杂情况再用高级编辑
在Align to Reference编辑器里,常规改碱基是覆盖模式,选中目标位点后直接输入新的A、T、C、G就可以替换。要插入碱基时按住【option】再输入,要按真正删除方式去掉一个残基时按住【option】再按【delete】;如果整条read位置有点偏,可以先选中左侧read名称,再按键盘【left】或【right】去微调整条读段的位置。MacVector还提供右键菜单和扩展菜单里的【Close Gaps by Deleting Residues】这类命令,用来清掉单条读段造成的局部插入空列。
二、MacVector低质量碱基如何批量修剪
低质量碱基修剪并不是把所有看着不顺眼的位置都删掉,而是主要处理Sanger读段两端质量明显下降的区域。MacVector的设计很直接,就是按可配置阈值把低于质量标准的两端残基裁掉,而且这个动作既能在Align to Reference里做,也能在Assembly Project里做。
1、先用质量显示判断要不要修剪
动手批量修剪前,建议先把质量值可视化。MacVector可以在Assembly和Align to Reference里按质量值给碱基着色,质量越低越容易一眼看出来。这样你能先确认问题主要集中在两端,还是中间也有明显低质量区域,避免一上来就盲目裁剪。
2、点击工具栏里的【Qual Trim】
确认确实需要批量处理后,直接在Align to Reference或Assembly Project窗口中点击工具栏上的【Qual Trim】。这是MacVector专门给Sanger reads做质量修剪的入口,会把低于设定阈值的两端残基裁掉。
3、在设置框里定好修剪阈值再执行
点击【Qual Trim】后会弹出设置对话框,你可以在这里决定按什么标准修剪。MacVector官方说明强调,这个阈值是可配置的,所以实际操作时不要一套参数到处套,样本峰形差异大时,建议先拿一批代表性样本试一次,再统一跑全批次。
4、修剪后先看灰色区,不要急着彻底删除
修剪完成后,被裁掉的残基通常会先以灰色显示,也就是clipped或trimmed状态。MacVector默认并不是马上把它们物理删除,而是先让你看见哪些区域被裁掉了,这样更适合复核。若你只想让视图更干净,可以再点【Trimmed】开关把这些区域隐藏。
5、确认没问题后再考虑彻底删除clipped区域
如果你已经确认修剪结果没问题,只是想让对齐界面更清爽,MacVector还提供【Delete Clipped Residues】来把这些灰色残基真正删掉。官方说明也提到,这些clipped残基本来就不会参与共识计算,只是有些用户更喜欢看起来整齐一些的对齐结果。
三、MacVector做校正和修剪时怎么少走弯路
序列校正和质量修剪最好不要混成一步做。先找错配、再看峰形、最后才决定改碱基还是裁读段,两步拆开以后,结果会清楚很多。尤其是点突变、接头确认这类任务,靠流程顺序往往比靠经验更重要。
1、先校正后修剪
如果一开始就先裁掉两端,可能会把你原本想确认的边界信息一起裁没。比较稳的顺序是先做对齐和错配核对,再看低质量区是否影响判断,最后才决定是否批量修剪。
2、能看trace就别只看字母
共识序列看起来整齐,但真正决定你该不该改的是下面的痕迹峰。MacVector把trace和对齐窗口绑在一起,本来就是为了让你别只凭字母结果下判断。
3、批量修剪只适合处理末端低质量
MacVector官方对Quality Trimming的描述很明确,它主要是从Sanger读段两端移除低于阈值的残基。要是问题出在中间局部错配、单条read偏移或者个别插入缺失,就该回到编辑和对齐工具处理,而不是指望一键修剪把所有问题都带过去。
总结
MacVector序列校正怎么做MacVector低质量碱基如何批量修剪,核心不是只记一个按钮,而是把顺序理顺。序列校正先走【Analyze】→【Align to Reference】,再用【Add Seqs】、【Align】、【Dots】和【First Mismatch】定位问题,结合痕迹图决定怎么改;低质量碱基批量修剪再走【Qual Trim】,先看质量着色,再设阈值,再检查灰色clipped区域,确认后再决定是否彻底删除。这样做下来,结果更稳,也不容易把本来还能判断的信息提前裁掉。