高通量测序快速入门(updating)


高通量测序技术主要内容:

  1. 主流测序技术及其原理
    • 一代:
      • Sanger测序,读段较短,准确性高,通量低
    • 二代:
      • Illumina,读段短,准确性高,通量高
      • 华大智造,读段短,准确性高,通量高
    • 三代
      • PacBio,读段长,单分子,通量高(通过HiFi技术提高准确率)
      • ONT,读段长,单分子,通量高(通过更新试剂和算法提高准确率)
  2. 预处理内容及代表性工具
    • 质控:FastQC、MultiQC
    • 预处理
      • 去除低质量碱基
      • 去除接头序列
      • 代表性工具:Trimmomatic、cutadapt、fastp
  3. 基因组测序及数据分析
    • 从头测序
      • 应用:全新物种或基因组变化较大的物种
      • 建库:三代长读段更有利于组装
      • 组装结果为contig,即一段连续的一致性序列(不含有gap)
      • 组装结果评价指标主要为N50,对contig大小从大到小排序后累加,直到达到contig总大小一半为止,最后添加的contig大小即为N50值
      • 组装算法:
        • OLC:需读段两两比对建图,找哈密顿通路,代表性工具有CA、canu
        • DBG:对读段进行k-mer子串分割建图,找欧拉通路,代表性工具有Velvet、SOAPdenovo、wtdbg2
    • 重测序
      • 应用:找突变
      • 建库:
        • WGS提取全基因组DNA即可进行二代/三代测序
        • 靶向重测序:基于杂交捕获(需更多起始DNA)或扩增子捕获(起始浓度低);CRISPR切割适用于三代测序;一般有全外显子和panel两种形式
      • 数据分析:
        • 读段比对:先快速索引,随后用动态规划延伸,定位最优比对位置
          • 基于哈希:速度慢,内存高,敏感性高,代表性工具MAQ
          • 基于BWT:速度快,内存低,敏感性低,代表性工具BWA、bowtie
          • 比对结果:SAM格式
        • 突变鉴定:
          • 标记PCR重复
          • SNV/indel:基于错配或gap
          • CNV/SV:基于读段对的比对距离和方向、读段断裂比对、读段覆盖深度不一致或组装结果
          • 突变结果:VCF格式
  4. 表观组测序及数据分析
    • 蛋白互作组(组蛋白修饰、TF结合)
      • ChIP-seq
        • 建库:甲醛交联固定,超声打碎DNA,目标蛋白抗体免疫共沉淀,测序;对照样本通常为input或IgG非特异性IP
        • 分析:读段比对,peak calling,peak注释;单末端测序在peak calling过程中需设置fragment长度,而双末端不需要;
      • CUT&RUN/CUT&Tag
        • 建库:抗体与核酸酶共孵育,可同时切割并共沉淀;所需起始材料少,测序深度低;低深度文库可用SEACR进行peak calling;
    • DNA甲基化组
      • 酶切处理
        • 利用限制性内切酶是否对甲基化敏感的特点
      • 亲和富集
        • MBD或5mC抗体
        • 数据分析同ChIP-seq
      • 重亚硫酸盐处理
        • 未甲基化的C会被转化成U
        • 比对需用特殊软件,基于CT或GA错配确定甲基化水平
        • 分辨率最高,可检测基因组上单碱基C的甲基化水平
      • 三代测序直接检测:PacBio或NanoPore
    • 染色质可及性
      • ATAC:
        • 建库:利用Tn5富集开放的DNA区域;通常需为双末端测序;
        • 分析:读段比对;peak calling(需注意Tn5切割位置偏移问题);peak注释;TF足迹分析;
  5. 转录组测序及数据分析
  6. 单细胞转录组测序
  7. 单细胞表观组测序
  8. 免疫组库
  9. 微生物组
    • 扩增子
    • 宏基因组

基因组测序思维导图:

表观组测序思维导图:


《 “高通量测序快速入门(updating)” 》 有 2 条评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注