seqkit根据基因id_检索感兴趣基因在已发表数据集中的表达
授人以鱼不如授人以渔经常有对生物信息学完全一无所知的朋友询问如何查找某一个基因在某种疾病中的表达变化。一般的方法可能就是查询文献搜索既往研究中的结果,但是实际上很多疾病或者对特定细胞的某种处理的相关标本都已经被测过序了。这些测序的数据集在文章发表时都必须提交于GEO数据库作为储存,而GEO数据库则是完全开放的。所以除了对既往的文献本身进行搜索外,还可以直接对提交的数据集本身进行检索。如下流程即针对
授人以鱼不如授人以渔
经常有对生物信息学完全一无所知的朋友询问如何查找某一个基因在某种疾病中的表达变化。一般的方法可能就是查询文献搜索既往研究中的结果,但是实际上很多疾病或者对特定细胞的某种处理的相关标本都已经被测过序了。这些测序的数据集在文章发表时都必须提交于GEO数据库作为储存,而GEO数据库则是完全开放的。
所以除了对既往的文献本身进行搜索外,还可以直接对提交的数据集本身进行检索。
如下流程即针对此特定的检索过程(限于对少量基因的检索操作):
1.
https://www.ncbi.nlm.nih.gov/gds
去这个网站,里面包含所有的基因测序数据集。

2.
以cardiac hypertrophy为例

3.
点击下载 Download data: TXT 有如下页面

4.
下载后用电脑自带的解压软件进行解压即可

解压后得到

点击进入,并选择用excel打开

5.
打开后

之后就是常规的excel表格了,直接用excel的查找功能搜索基因名称即可。

注意:上表需要弄清楚你感兴趣的基因的对应的ensembl基因ID编号
可以去
https://www.genecards.org/

把基因名称输入进去


用查到名称去excel表格检索即可。
把所在行的数据提取出来,然后根据分组自行进行t检验或者方差分析即可。
更新于
16/10/2020

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐
所有评论(0)