如何查询基因和通路的相关性,确定研究思路

 
 

最近有很多小伙伴私信喵学姐,说设计课题、设计实验的时候,找不到思路,有目标基因但是又无法确定相关的通路。

今天喵学姐就教大家怎么查找基因和通路的关系,减少试错成本。
 
 
 

查找现有的研究结果

 

 
对于之前研究结果的确定,首先我们打开genecards(www.genecards.org/)。genecards当中总结了这个基因参与哪些经典的通路。在genecards里面汇总了KEGG等多个通路数据库当中的信息。
这里我们就以TP53为例,输入想要检索的基因选择pathways进行快速定位可以查看与这个基因有关的通路
 
 
 
 
 
 

确定基因和通路内基因的关系

 

 
 

11

查询通路内的基因

 
有时候我们想研究的目标通路不在检索列表,那我们还可以进一步探究候选基因和目标通路内其他基因之间的关系。这里就可以用到PathCards(https://pathcards.genecards.org/)对目标通路进行检索,获取参与目标通路的所有基因列表
 
在这个数据库,我们以Cell Cycle例,输入检索就可以看到该通路所有相关的基因
 
这样我们就获得了目标通路的所有基因了。
 

02

蛋白相互作用分析

 
在我们获得基因之后,就可以看一下他们之间的互作关系,我们可以把获得的所有基因以及目标基因,统一放到STRINGhttps://string-db.org/)里面,就可以查看TP53和其他基因有没有关系了。
 
分析完成后在下方下载结果文件
在Excel中筛选与TP53互作的蛋白
 

03

共表达分析

 
如果还想探究候选基因和目标通路中的基因在某个疾病中的共表达关系,我们可以借助cBioPortal数据库(www.cbioportal.org/)。选择想要分析的疾病队列(这里以以甲状腺癌的TCGA队列为例),并输入候选基因后,点击Co-expression模块获取基因的共表达关系。
 
下载数据表格流程
我们把相关的结果全部下载下来之后,在excel中筛选一下,根据需求设定相关系数的阈值。在本示例中,我们以p<0.05和r>0.5为阈值,
这里可以看出只有FGD1的相关系数是大于0.5的。那如果我们后续要做一些富集分析,可以把相关系数阈值灵活调整,如设置为0.4,筛出8000多个基因,我们可以选取前100个基因进行后续的富集分析
 
通过这些方法,大家会发现要了解基因和通路的关系也并不复杂,除了看文献,花点时间在数据库查询,也能获得不少有价值的数据,更为后续的分析、实验设计做了基础
 
 

往期推荐

 
 

全网最全的医学公共数据库,不用做实验就能发论文!

通过4个步骤,入门生物信息学分析

通过5步,学会处理从GEO数据库下载的数据集,做出精美结果图

差异基因分析不会做?最简单的火山图做法,一秒学会

7.3分生信,胶质母细胞瘤+铜死亡热点+分型结合实验验证,构建铜死亡相关预后模型

 

 

 

 

线上教学

Online Teaching