最近有很多小伙伴私信喵学姐,说设计课题、设计实验的时候,找不到思路,有目标基因但是又无法确定相关的通路。
今天喵学姐就教大家怎么查找基因和通路的关系,减少试错成本。
对于之前研究结果的确定,首先我们打开genecards(www.genecards.org/)。genecards当中总结了这个基因参与哪些经典的通路。在genecards里面汇总了KEGG等多个通路数据库当中的信息。
这里我们就以TP53为例,输入想要检索的基因选择pathways进行快速定位可以查看与这个基因有关的通路
有时候我们想研究的目标通路不在检索列表,那我们还可以进一步探究候选基因和目标通路内其他基因之间的关系。这里就可以用到PathCards(https://pathcards.genecards.org/)对目标通路进行检索,获取参与目标通路的所有基因列表
在这个数据库,我们以Cell Cycle为例,输入检索就可以看到该通路所有相关的基因
在我们获得基因之后,就可以看一下他们之间的互作关系,我们可以把获得的所有基因以及目标基因,统一放到STRING(https://string-db.org/)里面,就可以查看TP53和其他基因有没有关系了。
如果还想探究候选基因和目标通路中的基因在某个疾病中的共表达关系,我们可以借助cBioPortal数据库(www.cbioportal.org/)。选择想要分析的疾病队列(这里以以甲状腺癌的TCGA队列为例),并输入候选基因后,点击Co-expression模块获取基因的共表达关系。
我们把相关的结果全部下载下来之后,在excel中筛选一下,根据需求设定相关系数的阈值。在本示例中,我们以p<0.05和r>0.5为阈值,
这里可以看出只有FGD1的相关系数是大于0.5的。那如果我们后续要做一些富集分析,可以把相关系数阈值灵活调整,如设置为0.4,筛出8000多个基因,我们可以选取前100个基因进行后续的富集分析
通过这些方法,大家会发现要了解基因和通路的关系也并不复杂,除了看文献,花点时间在数据库查询,也能获得不少有价值的数据,更为后续的分析、实验设计做了基础