今日之森

还有多远,一念之间。

Ncbi批量下载基因组信息和序列信息

2021-09-06


森言森语

学过的内容总是容易忘记,有时候想用的时候苦苦想不起来以前是怎么弄的。慢慢的,我发现今日之森已经变成一个备忘录,有些学过的内容,记下来,想用的时候我也会第一时间在这里搜索。

两个内容

操作就很容易了,主要是保存一下这两个网址。

用途:有时候需要批量下载不同物种的多个序列信息,而只有ID,这时候就需要用到批量下载。

NCBI提供了Batch EntreZ

https://www.ncbi.nlm.nih.gov/sites/batchentrez

进入网站后,upload自己准备好的基因ID列表,选择需要检索的数据库,点击检索,即可得到需要的序列信息。

基因ID列表的格式,一行一个ID,txt。

用途:有时候需要下载的基因组信息比较多,一个一个下那就累了;有时候一时间很难找到相对较全面的基因组信息,一个一个从文献中找或者google都不是易事,毕竟有很多物种都有很多不同的版本。所以就需要通过NCBI提供的Genome

https://www.ncbi.nlm.nih.gov/genome/browse#!/overview/ 


保存检索结果的ftp站点之后,保存为list文件。 然后通过如下方式下载

$wget -c -r -i list