MacVector中文网站 > 最新资讯 > MacVector如何进行SNP检测 MacVector SNP检测报告怎么生成
教程中心分类
MacVector如何进行SNP检测 MacVector SNP检测报告怎么生成
发布时间:2026/01/30 09:55:03

  做SNP检测时,最怕的不是没跑出结果,而是结果看起来很多却缺少可追溯的证据链:参考序列版本不清、reads来源不明、阈值口径不统一,最后报告无法复核。MacVector把参考比对、变异列表与对齐证据放在同一套界面里,你只要按固定路径把工程保存好,再把SNP清单、VCF原文、覆盖度与关键截图一起导出,报告就能做到可解释、可回查、也方便交接。

  一、MacVector如何进行SNP检测

 

  如果你的数据是NGS短读段,建议直接用MacVector的Assembler做参考比对并自动生成SNP与VCF视图;如果是Sanger测序确认,也可以用Align to Reference把峰图证据一起放进同一个对齐窗口里。两条路径的核心都是先把参考序列固定,再把reads对齐到同一坐标系里,然后在SNP视图里按阈值筛出可信差异。

 

  1、先把参考序列与reads格式核对清楚

 

  准备一条参考序列文件,格式可以是GenBank、EMBL、FASTA或MacVector格式;reads建议优先用FASTQ,FASTA也能用,但后续质量与阈值解释会更吃力。

 

  2、新建Assembler工程并导入参考与reads

 

  在Assembler窗口依次点击【File】→【New】→【Assembly Project】,点击【Add Ref】选择参考序列,再点【Add Seqs】选择FASTQ或FASTA读段文件,把输入数据先落到同一个工程里。

 

  3、运行Bowtie参考比对生成Reference Contig

 

  在Project窗口同时选中参考与reads文件,点击工具栏【Bowtie】,先按默认参数跑通一次;如果机器多核,可以在Bowtie偏好里把线程数调高,并勾选【Generate Child Contigs】以便后续按子区域查看。

 

  4、在Contig编辑器里用差异定位SNP位点

 

  双击生成的Reference Contig进入编辑器,点击【Dots】让一致位点以点显示,再点【First Mismatch】定位首个差异位点,继续用【Next Mismatch】逐个跳转,把差异从“散点”变成“可逐条核对”。

 

  5、用SNP与VCF视图把差异转成可解释条目

 

  在Reference Contig Editor里打开【SNP】标签页查看参考与共识的差异,并在同一界面关联到密码子与氨基酸变化;需要原始记录时切到【VCF】标签页查看VCF文本,后续导出报告时这两块是主证据。

 

  二、MacVector SNP检测报告怎么生成

 

  一份能交付的SNP报告,至少要包含四类信息:样本与参考版本、变异清单、阈值口径、以及可复核的对齐证据。MacVector的工程包会把比对产生的关键文件一起打包保存,你只要把导出动作固定成标准流程,报告就不会“只剩一张表”。

 

  1、先把工程保存成可追溯的工程包

 

  在Assembler工程窗口点击【File】→【Save As】保存工程包,工程会以File Package形式存放内部文件,包含BAM及索引等关键产物,后续复核不需要重新跑一遍。

 

  2、把SNP清单按窗口视图导出为表格口径

 

  打开Reference Contig Editor的【SNP】标签页,按你的筛选口径只保留需要交付的条目,然后用复制到剪贴板的方式粘贴到表格工具里,保留列名与排序规则,确保同一批次报告结构一致。

 

  3、把VCF原文作为报告的原始附件保留

 

  切到【VCF】标签页获取VCF原始文本,保存为同名VCF文件并与报告同目录归档;当评审方质疑过滤阈值或等位频率时,你能直接回到原文复算。

 

  4、把覆盖度与比对统计一起放进报告附件

 

  在编辑器里补充【Coverage】与相关统计视图的关键截图或导出结果,把覆盖不足的区域单独标注出来;覆盖与差异要同框出现,否则读者无法判断SNP是“真实变异”还是“深度不足的偶然”。

  5、需要证据链复核时导出对齐文本与窗口证据

 

  如果是Sanger确认场景,在对齐窗口用【File】→【Save】保存对齐文件,再用【File】→【Export】导出为MacVector序列文件以保留注释与读段记录;同时切到【Text】标签页复制完整对齐文本,作为“可打印、可复核”的对齐证据。

 

  6、把输入文件移动风险纳入交付清单

 

  工程里FASTQ常以磁盘链接方式引用,若文件被挪动会导致后续打不开或定位失败;发现路径丢失时在工程窗口对reads条目使用【Locate】重新指向实际位置,并在交付说明里记录最终文件路径与校验方式。

 

  三、MacVector变异阈值怎么设

 

  同一份数据在不同阈值下会得出完全不同的SNP数量,所以第三段的重点不是再讲一遍导出,而是把“你凭什么相信这些SNP”说清楚。建议把阈值分成三层:覆盖深度、等位比例、质量证据,并在MacVector里用可见的工具把每一层都落实到可复核操作上。

 

  1、先定覆盖深度与等位比例的统一口径

 

  在参考比对结果里先看覆盖分布,再决定最小深度门槛与最小等位比例门槛,并把这两个数字写进报告首页;后续任何筛选都以同一口径执行,避免同一项目不同批次不可比。

 

  2、用差异跳转核对边界位点而不是只看列表

 

  在Contig编辑器里用【First Mismatch】与【Next Mismatch】把边界位点逐条跳转核对,重点看那些“刚好超过阈值”的位点是否集中在同一局部区域,必要时把该区域单独拉出来做二次确认。

 

  3、Sanger场景把峰图质量作为最终裁决证据

 

  在Align to Reference流程里先对读段做【Basecalls】以获得质量信息,再用着色或遮罩提示把低质量区域识别出来;MacVector在SNP视图里会把可能SNP按信号占比区分为更高与较低两档,你可以优先复核占比更高的条目。

 

  4、对报告中的高风险位点留出可复跑空间

 

  当位点位于低复杂区、覆盖起伏大或差异集中时,不要只交付一个结论;保留工程包与VCF原文,并在需要时回到【Bowtie】偏好调整参数后复跑,报告中把两次参数与差异对比表一并附上,评审效率会高很多。

  总结

 

  MacVector如何进行SNP检测,MacVector SNP检测报告怎么生成这件事,真正省时间的做法是把流程固定成两步:先用Assembler或Align to Reference把参考与reads锁在同一工程里,再把SNP清单、VCF原文、覆盖度与对齐证据按同一模板导出归档。这样你的报告不只是一张结果表,而是一套能复核、能解释、也能交接的证据包。

读者也访问过这里:
135 2431 0251