您当前的位置:首页 > 科研服务> 个性化生物信息网络分析 > lncRNA-mRNA网络分析
lncRNA-mRNA网络分析

lncRNA一直被视做转录过程的“暗物质”。大型癌症lncRNA表达谱分析发现各种肿瘤类型之间表现出转录水平的差异,显示出lncRNA在疾病研究中巨大的挖掘潜力。构建lncRNA-mRNA网络,可对未知的lncRNA进行功能的预测,从而更好的确定其在生命活动中所行使的角色,为后续疾病机制、药物靶点、疾病诊断等方面提供重要依据。

1. lncRNAs差异表达分析

对于由lncRNA芯片或RNA-seq获得的表达数据,根据研究目的或实验设计,可对多组样本两两之间进行lncRNA差异表达分析,具体方法包括差异倍数分析、t检验等,获取差异lncRNA列表。

2. 预测lncRNA的共表达基因:以某一个lncRNA为例。

1) lncRNA探针注释

通过芯片探针重注释策略,对每个Affy探针进行基因组定位,并把lncRNA序列映射到基因组上,通过位置叠加的关系,找出lncRNA所对应的Affy探针。

 

图1. lncRNA探针注释 红色矩形表示基因组,紫色矩形表示lncRNA探针

2) lncRNA探针表达值获取

GEO(Gene expression Omnibus)数据库包括高通量实验数据的广泛分类,其中有许多来自以Affy双通道微阵列为基础的对mRNA丰度测定的数据。锐博生物通过联合所有在GEO数据库中提交了芯片结果的SCI文章,得到的所有Affymetrix芯片数据集,并提取每个数据集中得到的lncRNA对应的Affy探针表达值。

图2. 荟萃分析千套AFFY芯片数据集,并从中提取lncRNA对应Affy探针值

3) 相关性矩阵建立

保留表达值显著波动的lncRNA Affy探针所在的数据集,并计算lncRNA探针与数据集中其他探针的相关系数,从而得到相关性矩阵,如图3所示。最后利用Rank aggregation计算出lncRNA探针与其他探针的P-value,得到每个lncRNA探针所相关的其他探针的重要性排序,如表5所示。


图3. 每套数据集中计算lncRNA与任意基因探针的表达相关性(pearson相关)

4) 获得共表达基因列表

按p-value显著性阈值(p<0.05),提取lncRNA探针最重要相关性探针列表,并找出相应探针所对应的基因,即得到与lncRNA相关的共表达基因。

5) 构建lncRNA-mRNA网络,并对共表达基因进行GO/KEGG富集分析,预测lncRNA功能。

图4. lncRNA-mRNA网络 lncRNA-TK103090(绿色),与52基因共表达,其中12个属于晶状体蛋白家族(黄色),
GO分析显示这些基因很多都与视觉系统有关。推测TK103090可能在功能上与晶状体相关蛋白有关。

本图还可进行lncRNA的cis或trans的targets预测及lncRNAs上游的TFs预测。cis表示染色体邻近位置的靶点;trans表示不同染色体或染色体远端位置的靶点。只需明确lncRNA s共表达基因在染色体上的远近位置,即可找出cis或trans的靶点。另外对lncRNA 可以进行ChIP-seq信号检测,从而预测上游TFs信息。因此,对于lncRNAs,我们亦可类似构建TFs-lncRNAs-mRNAs的调控网络。


参考文献

1. Neerincx PB, Rauwerda H, Nie H, et al. OligoRAP- an Oligo Re- Annotation Pipeline to improve annotati on and estimate target specificity. BMC Proc. 2009; 3 Suppl 4:S4.

2. Barrett T, Edgar R, et al. Gene expression omnibus: microarray data storage, submission, retrieval, and analysis. Methods Enzymol.2006; 411:352- 69.

3. Alexandre K, Dan R, Kevin S, et al. An Unsupervised Learning Algorithm for Rank Aggregation. Machine Learning: ECML. 2007; 4701:616- 23

4. Kanehisa M, Goto S, et al. KEGG: Kyoto Encyclopedia of Genes and Genomes. Nucleic Acids Res. 2000; 28(1): 27- 30.

5. Ashburner M, Ball CA, Blake JA, et al. Gene ontology: Tool for the unification of biology. Nat Genet. 2000; 25(1): 25- 9.

6. Liao Q, Liu C, Yuan X, et al. Large- scale prediction of long non- coding RNA functions in a coding- non- coding gene co- expression network. Nucleic Acids Res. 2011; 39(9): 3864- 78.

版权所有:广州市锐博生物科技有限公司 Copyright©2013 Guangzhou RiboBio Co., Ltd.  免费热线:400-686-0075
地址:广州开发区科学城科学大道182号创新大厦C3区13-14层   邮编:510663   粤ICP备05022931号   浏览器建议:IE8.0 1024X768分辨率
主营产品及服务:piRNA  寡核酸  siRNA  miRNA  microRNA   RNAi  shRNA  lncRNA  ncRNA  细胞增殖  生物芯片  高通量测序