使用BioNumerics软件批量下载基因序列
使用BioNumerics软件批量下载NCBI中基因序列
大家可能曾经都被如何批量下载NCBI中的数据所困扰,在NCBI的网站上苦苦搜寻,但是无从下手。本文将介绍如何通过BioNumerics软件实现基因序列的批量下载。
首先登陆NCBI的Nucleotide数据库https://www.ncbi.nlm.nih.gov/nuccore
输入要检索的基因名字,如mcr-1,点击“search”进行搜索(图 1)。
检索结果页面左侧可以设置过滤条件(图中红框标识区域,此处不做详细叙述,图 2),为方便演示,此处我们勾选检索结果的前4个进行后续操作(图 3)。勾选完成后,点击右上角的“Send to”,展开菜单项中的Choose destination中勾选File,Format选择Accession List,完成后点击Create file(图 4),浏览器会自动下载一个.seq格式的文本文件,即所勾选检索结果的Accession号,保存备用。
二、BioNumerics批量下载兴趣基因序列
1.新建数据库
首先打开BioNumerics软件 ,点击按钮创建新数据库(图 5),对数据库命名后按照默认选项依次点击“下一步”
直到弹出插件窗口后点击“Proceed”进入数据库主界面(图 6)
2.创建序列实验类型
实验类型面板中点击创建实验类型(图 7),在弹出的窗口中选择序列类型实验(图 8)
然后对序列类型实验进行命名,并点击“下一步”
图 9
弹出的窗口中根据实际情况选择核酸序列还是氨基酸序列,并点击“完成”(图 10)
3.文件的准备
打开从NCBI获取的Accession List文件,新建一个Excel文件将Accession复制到表格中,整理成类似图 11中所示
4.Excel文件导入
数据库主界面左上角点击进行Excel文件导入,数据导入窗口选择“条目信息数据”中的“导入字段(Excel文件)”(图 12)
弹出的窗口中点击“浏览”找到准备的Excel文件,选择对应的数据源,并点击“下一步”(图 13)
此时弹出导入模块窗口,点击“Key”并选择编辑目标,弹出的窗口中和Key进行关联(图 14)
然后选择“Accession”点击编辑目标后。选择条目信息字段中的“创建新”(图 15)
此时会弹出提示窗口,点击“是”
然后依次点击“下一步”和“完成”,然后对导入模板进行命名(图 17)
然后依次点击“下一步”和“完成“,即导入了Excel文件。
图 18
5.从互联网下载序列
勾选导入的条目,点击文件导入图标,在“序列类型数据”中选择“从互联网下载序列”(图 19)
弹出的窗口中选择“首选的下载网站”,并在下方下拉框中选择“Accession”并点击“抓取”,此时会在访问码中出现导入的Accession号,然后点击“下一步”(图 20)
等待一段时间后出现序列预览窗口,点击“下一步”,在导入模板选择窗口选择创建新的导入模板(图 21)
在导入规则中选中“命名”一行,点击“编辑目标”和条目信息字段中的“Accession”进行关联 (图 22)
关联完后点击“编辑解析”,在“数据解析字符串”中的[DATA]前加上* _ ,然后点击“是”,再点击“下一步”,在导入链接窗口中勾选“Accession”,然后点击完成,再对导入模板进行命名后选择该模板进行序列下载。
图 23
图 24
图 25
序列下载完即可在数据库主界面看到以绿点显示的序列数据(图 26),点击绿点即可看序列查看器中查看序列(图 27)
以上资料由BioNumerics中国区官方授权总经销商独家提供,如需转载请主动标明出处。
客服专线:010-53639817 53639871
市场专线:15712982811 13552183571
QQ客服:3545869936 3316774663