授人以鱼不如授人以渔

经常有对生物信息学完全一无所知的朋友询问如何查找某一个基因在某种疾病中的表达变化。一般的方法可能就是查询文献搜索既往研究中的结果,但是实际上很多疾病或者对特定细胞的某种处理的相关标本都已经被测过序了。这些测序的数据集在文章发表时都必须提交于GEO数据库作为储存,而GEO数据库则是完全开放的。

所以除了对既往的文献本身进行搜索外,还可以直接对提交的数据集本身进行检索。

如下流程即针对此特定的检索过程(限于对少量基因的检索操作):

1.

https://www.ncbi.nlm.nih.gov/gds

去这个网站,里面包含所有的基因测序数据集。

383a9fbba41522b12230674c3fe12f66.png

2.

以cardiac hypertrophy为例

71007c64c277a5fabde8ade5e718167d.png

3.

点击下载 Download data: TXT 有如下页面

82dae1d61991b8605c8f5f231147fa3e.png

4.

下载后用电脑自带的解压软件进行解压即可

2f8fa72b28a7e2554a261f9a29cbed5f.png

解压后得到

7e2e8ef69b2979c9939fd78883a20a47.png

点击进入,并选择用excel打开

a3898ac8690807bb624745c8cccb628a.png

5.

打开后

402cb551743aec9042b81fa0a51189b9.png

之后就是常规的excel表格了,直接用excel的查找功能搜索基因名称即可。

1e84ec2a48bf5d4c7f9279ebb8b2f90e.png

注意:上表需要弄清楚你感兴趣的基因的对应的ensembl基因ID编号

可以去

https://www.genecards.org/

2e93a6d44d2668415b96377c549aaf8f.png

把基因名称输入进去

91d818b83718789469a013d2bcb4178f.png

3f34b217739ca84f0a9dfa940af4695e.png

用查到名称去excel表格检索即可。

把所在行的数据提取出来,然后根据分组自行进行t检验或者方差分析即可。

更新于

16/10/2020

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐