高通量测序技术主要内容:
- 主流测序技术及其原理
- 一代:
- Sanger测序,读段较短,准确性高,通量低
- 二代:
- Illumina,读段短,准确性高,通量高
- 华大智造,读段短,准确性高,通量高
- 三代
- PacBio,读段长,单分子,通量高(通过HiFi技术提高准确率)
- ONT,读段长,单分子,通量高(通过更新试剂和算法提高准确率)
- 一代:
- 预处理内容及代表性工具
- 质控:FastQC、MultiQC
- 预处理
- 去除低质量碱基
- 去除接头序列
- 代表性工具:Trimmomatic、cutadapt、fastp
- 基因组测序及数据分析
- 从头测序
- 应用:全新物种或基因组变化较大的物种
- 建库:三代长读段更有利于组装
- 组装结果为contig,即一段连续的一致性序列(不含有gap)
- 组装结果评价指标主要为N50,对contig大小从大到小排序后累加,直到达到contig总大小一半为止,最后添加的contig大小即为N50值
- 组装算法:
- OLC:需读段两两比对建图,找哈密顿通路,代表性工具有CA、canu
- DBG:对读段进行k-mer子串分割建图,找欧拉通路,代表性工具有Velvet、SOAPdenovo、wtdbg2
- 重测序
- 应用:找突变
- 建库:
- WGS提取全基因组DNA即可进行二代/三代测序
- 靶向重测序:基于杂交捕获(需更多起始DNA)或扩增子捕获(起始浓度低);CRISPR切割适用于三代测序;一般有全外显子和panel两种形式
- 数据分析:
- 读段比对:先快速索引,随后用动态规划延伸,定位最优比对位置
- 基于哈希:速度慢,内存高,敏感性高,代表性工具MAQ
- 基于BWT:速度快,内存低,敏感性低,代表性工具BWA、bowtie
- 比对结果:SAM格式
- 突变鉴定:
- 标记PCR重复
- SNV/indel:基于错配或gap
- CNV/SV:基于读段对的比对距离和方向、读段断裂比对、读段覆盖深度不一致或组装结果
- 突变结果:VCF格式
- 读段比对:先快速索引,随后用动态规划延伸,定位最优比对位置
- 从头测序
- 表观组测序及数据分析
- 蛋白互作组(组蛋白修饰、TF结合)
- ChIP-seq
- 建库:甲醛交联固定,超声打碎DNA,目标蛋白抗体免疫共沉淀,测序;对照样本通常为input或IgG非特异性IP
- 分析:读段比对,peak calling,peak注释;单末端测序在peak calling过程中需设置fragment长度,而双末端不需要;
- CUT&RUN/CUT&Tag
- 建库:抗体与核酸酶共孵育,可同时切割并共沉淀;所需起始材料少,测序深度低;低深度文库可用SEACR进行peak calling;
- ChIP-seq
- DNA甲基化组
- 酶切处理
- 利用限制性内切酶是否对甲基化敏感的特点
- 亲和富集
- MBD或5mC抗体
- 数据分析同ChIP-seq
- 重亚硫酸盐处理
- 未甲基化的C会被转化成U
- 比对需用特殊软件,基于CT或GA错配确定甲基化水平
- 分辨率最高,可检测基因组上单碱基C的甲基化水平
- 三代测序直接检测:PacBio或NanoPore
- 酶切处理
- 染色质可及性
- ATAC:
- 建库:利用Tn5富集开放的DNA区域;通常需为双末端测序;
- 分析:读段比对;peak calling(需注意Tn5切割位置偏移问题);peak注释;TF足迹分析;
- ATAC:
- 蛋白互作组(组蛋白修饰、TF结合)
- 转录组测序及数据分析
- 单细胞转录组测序
- 单细胞表观组测序
- 免疫组库
- 微生物组
- 扩增子
- 宏基因组
基因组测序思维导图:
表观组测序思维导图:
《 “高通量测序快速入门(updating)” 》 有 2 条评论
考完打卡~加油加油٩(๑^o^๑)۶
学!