您当前的位置:首页 > 科研服务> 高通量测序结果分析 > 癌症样品测序数据分析
癌症样品测序数据分析

    癌症基因组测序是高通量测序在临床上的重要应用,能够从根本上挖掘疾病发生的机理。

  一 测序质量分析

  对测序的原始数据进行初步质量分析,绘制测序片段的质量分布图,并给出测序质量信任度报告。

  二 测序数据比对

  获得癌症测序的原始数据后,首先需要将所有测序读段通过序列映射(mapping)定位到参考基因组上。我们通过与UCSC提供的标准参考序列(reference sequences)进行比对,结合客户要求选择不同的比对软件和参考序列。统计比对结果,例如唯一比对率,高质量比对率等。

  三 测序深度和覆盖度分析

  对测序结果进行初步分析,计算测序片段在整个基因组(或者目标区域)的覆盖度情况,并统计测序片段在基因组的深度分布情况,给出测序深度分布图。


图1 测序深度图

  图1引用自Erin D et al.A small-cell lung cancer genome with complex signatures of tobacco exposure.Nature 463, 184-190 (14 January 2010) 。

  四 变异检测和注释

  可供选择的癌症常见变异种类检测:SV(结构变异),SNP(单核苷酸多态性),SNV(单核苷酸变异),INDEL(插入和缺失),CNV(拷贝数变异),LOH(杂合性丢失),Rearrangement(基因组重排)。各种变异检测结果都会有表格和图形的展示。


图2 癌症基因组变异circos图

  如上图,外圈代表癌症基因组染色体,依次到内圈,浅绿色方块是碱基插入,墨绿色方块是碱基缺失;浅橙色表示杂合子,暗橙色是纯合子;下一层颜色方块是氨基酸突变:灰色是沉默突变,紫色是错义突变,红色是无义突变,黑色是剪切位点;蓝色折线线条是碱基拷贝数;绿色曲线条是染色体内序列重排,紫色曲线条是染色体间序列重排。(参考文献:Erin D. Pleasance, Philip J. Stephens et al. A small-cell lung cancer genome with complex signatures of tobacco exposure. Nature, 2009)


图3 circos图局部细节1


图4 circos图局部细节2

  CIRCOS图是癌症文章中大都会用到的变异检测结果展示方法。如图3,引用自Erin D et al. A comprehensive catalogue of somatic mutations from a human cancer genome.Nature 463, 191-196 (14 January 2010)。

  五 变异图谱构建

  锐博生物可根据客户所做的变异检测,把变异检测的结果和染色体条带、测序结果联系起来,构建信息完整的变异图谱。


图5 癌症基因组结构变异


图6 染色体上基因融合

  基因融合在癌症患者体内普遍存在,是指两个基因或两个基因的各自一部分的序列融合成一个新的基因的过程。可以通过研究基因间是否发生基因融合,探究其与癌症之间的关系。(参考文献:Manabu Soda et al. Identification of the transforming EML4–ALK fusion gene in non-small-cell lung cancer. Nature, 2007)

  六 寻找癌症相关基因

  癌症的driver gene(癌症基因/启动基因) 和passenger gene 是癌症研究的重要方向。在检测出癌症变异后,寻找癌症变异所映射到的基因,根据变异的频率和程度,为寻找driver gene和passenger gene提供线索。

  七 癌症相关基因功能富集

  基于权威的GO数据库,对癌症变异相关基因进行功能分析,并得到可能的富集功能,绘制柱形图和表格。

  八 癌症相关基因通路分析(KEGG Pathway)

  结合KEGG pathway等数据库,将得到的癌症相关基因进行Pathway显著性分析。从而得知癌症变异相关基因所富集的生物通路。分析每个Pathway中所包含的差异基因个数,我们采取超几何分布检验等统计手段计算出反映Pathway中差异基因分布富集显著性的P-value,根据P-value大小判断差异基因在生物通路中富集程度,并最终得到显著富集的生物信号通路图,如图7所示。


图7 癌症变异相关基因所富集的生物通路

版权所有:广州市锐博生物科技有限公司 Copyright©2013 Guangzhou RiboBio Co., Ltd.  免费热线:400-686-0075
地址:广州开发区科学城科学大道182号创新大厦C3区13-14层   邮编:510663   粤ICP备05022931号   浏览器建议:IE8.0 1024X768分辨率
主营产品及服务:piRNA  寡核酸  siRNA  miRNA  microRNA   RNAi  shRNA  lncRNA  ncRNA  细胞增殖  生物芯片  高通量测序