BioNumerics软件
BioNumerics 介绍
BioNumerics是全球唯一集电泳数据、色谱数据、光谱数据、表型特征数据、基因芯片、基因组序列、氨基酸序列等多种生物信息数据格式存储和处理分析的软件平台,包括数据存储、数据分析和数据分享三大功能。优化整合不同基因组与表型来源的数据,方便用户进行数据分析管理并进行回归分析。引进业界领先的数据库引擎Oracle® 和 Microsoft® SQL Server™,为大数据管理分析提供了前提。
一、BioNumerics各功能模块介绍
(一)指纹模块(Fingerprint type module)
支持任意格式的光密度数据如凝胶电泳、毛细管电泳、气象色谱、液相色谱、光密度曲线、MALDI、SELDI的分析处理。同时BN提供了一系列基于电泳功能的分析插件,方便用户对可变数目串联重复序列(VNTR)、 多位点串联重复序列分析(MLVA)、 基于CECE的异源双链分析(HAD)、金黄色葡萄球菌A蛋白分型(spa-typing)、AFLP标记辅助育种(AFLP-based breeding)等实验进行数据存储与分析。
(二)特征数据模块(Character Data module)
用户可以自定义各种类型(二进制或连续型)的特征数据,包括生化以及形态学特征数据、酶动力学测试数据、抗生素抗性分析、脂肪酸甲酯以及基因芯片中的各个基因表达量数据等。根据实验情况用户可以从一到成千上万个特征数据的自定义且特征数据容量的大小不受限制。同时特征数据模块也被用来存储其它实验分析过程中的数据结果,例如在MLVA分析中存储可变数目串联重复序列的个数;MLST中的等位基因数目;抗生素抗性以及HIV抗药性分析中的抗性数据等。
(三)序列数据模块(Sequence Data module)
用户可以导入核酸和氨基酸序列,分析经典的Sanger测序数据和第二代测序数据(NGS),另外该功能模块可以识别.embl, .gb, .fasta等格式的数据,可自动识别并储存序列文件中的物种来源等信息。可为用户提供多序列比对、进化树分析、染色体序列比对分析、序列信息注释、SNP分析、PCR引物设计、限制性内切酶酶切位点分析、开放阅读框自动查找等功能。另外用户能够根据自己的需求设定特定的分析参数,以达到不同的实验目的。
(四)趋势类型数据模块(Trend Data module)
包括酶动力学研究、Real time-PCR、生长曲线分析数据等都属于趋势类型数据,BioNumerics内置了大量的数据曲线拟合模型,用户可根据实际需求选取相关模型,并设置相关参数,软件读取实验结果,对数据进行聚类、鉴定和统计分析。
(五)全基因组图谱分析数据模块(Whole genome map data module)
全基因组图谱分析可以产生200-500个限制性酶切片段,且此技术不依赖于PCR以及序列信息,因此相较于PFGE产生的20个左右的条带可以提供细菌基因组结构上变化的信息,所以其可以识别同一爆发中相近亲缘关系非常近的菌株。
BioNumerics中的全基因组图谱分析模块提供了大量可配置的可视化选项可使用户快速定位插入缺失以及重复片段,且可以进行自定义标签设置。
同时BioNumerics内置的聚类分析算法可快速分辨出亲缘关系相近的分离株;通过内置的比对算法可以着重显示反转、缺失等突变信息,配合BioNumerics内置的分析工具用户可以进行PCA、矩阵数据挖掘等分析。另外,BioNumerics内置的多态性分析工具可快速的找出一组分离株内的特异性片段。
(六)树状分析和网络推理模块(Tree and Network Inference module)
聚类分析不同于鉴定识别,是一种非监督式学习分析,同时也是生物信息学分析中不可替代的一种分析工具。BioNumerics通过把关系数据库中的各种记录之间,各种实验之间,用多种有效的聚类算法实现多种聚类分析。
(七)分类鉴定模块(Classifiers and Identification module)
鉴定识别又叫监督式学习或分类是生物信息学中最重要的一种信息分析手段。BioNumerics在基于大量实验信息数据的基础上分析鉴定未知物种,提高了数据结果的可靠性与一致性,加入贝叶斯分类(Naive Bayesian Classifiers, NBC),支持向量机(Support Vector Machines, SVM)等算法。同时在聚类分析中,BN为用户提供了相同范围的相似性系数和距离系数。
(八)数据挖掘模块(Dimensioning and Matrix Mining module)
此模块为用户提供高维分析交互视图,用户可以直接在视图上选择,添加或删除条目,将其它数据库字段信息显示为颜色或标签,差异特征关联等。其它还包括方差分析、多维尺度分析(Multi-Dimensional Scaling, MDS)、主成分分析(Principal Components Analysis, PCA)等。
(九)基因组分析工具模块(Genome Analysis Tools module)
基因组分析工具模块提供基因组和染色体比对分析、基因注释、wgMLST、wgSNP分析等功能。
多位点序列分型(Multilocus sequence typing,MLST)是一种基于序列的微生物分子分型手段,其技术原理是通过测定7个管家基因的序列,并根据每个位点序列的不同为其分配等位基因号,七个管家基因的等位基因号共同组成了细菌的序列型(Sequence Type,ST)。传统的基于7个管家基因序列的多位点序列分型在过去的15年中已经证明其在细菌分型领域中不可或缺的作用,但是由于其分析的等位基因个数少而导致的分辨率不高的问题也一直存在。
随着二代测序技术的发展及其测序成本的降低,传统的MLST技术正在逐步向wgMLST转变。由于wgMLST包含更多的基因位点(1500-2000),因此相较于传统的基于7个基因位点的MLST分型手段有着更高的精度及分辨率。
随着等位基因位点的增多势必会导致数据分析量的增大。为了解决以上的问题,BioNumerics向广大用户提供了经过全新设计开发的可以自动分配等位基因号、自动命名序列型等功能的wgMLST分析管理插件。同时BioNumerics为用户提供强大的计算引擎,用户可根据实际需求进行基于序列拼接和基于原始测序数据读长的等位基因检索。此外基于wgMLST的分析框架,用户也可以自定义二级分析框架(如cMLST、rMLST等),同时用户还可以从wgMLST分析中获取基于7个管家基因的传统的MLST分析结果。全自动化的分析流程以及可自定义的分析框架可大大提高实验数据分析的准确度以及实验人员的工作效率。
由于wgMLST分析流程是基于全基因组数据,配合BioNumerics的表型分析插件,用户还同时可以获取分离菌的血清型、病毒性和耐药性等数据。
目前BioNumerics向用户提供以下菌种的全功能的wgMLST分析框架:
Brucella spp.
Campylobacter coli - C. jejuni
Clostridium difficile
Cronobacter spp.
Enterococcus raffinosus
Escherichia coli / Shigella
Klebsiella oxytoca
Klebsiella pneumoniae
Legionella pneumophila
Listeria monocytogenes
Mycobacterium tuberculosis
Neisseria gonorrhoeae
Salmonella enterica
Staphylococcus aureus
全基因组单核苷酸多态性(wgSNP)由于相较于wgMLST具有更多的位点,所以其在微生物分子分型上具有更高的分辨率。
- 公司简介
北京金云台信息技术有限公司(简称金云台)/北京中科助腾有限责任公司(简称中科助腾)是一家面向医院、疾控、高校等科研单位提供信息化解决方案与服务的公司,致力于为用户提供业界领先的IT系统构架、实验室信息管理系统、生物数据分析等领域的全面解决方案以及应用服务。
我公司作为比利时Applied-Maths公司及全球BioMerieux公司的合作战略伙伴,2019年获得官方授权的BioNumerics V7.X 软件中文版中国区总代理以及BioNumerics V8.X的经销商。金云台作为国内最早从事食品卫生、疾病预防等领域的公司之一,拥有一支具有丰富行业经验的技术团队,在海量数据的网络采集、传输、处理、上报和分析统计、垂直搜索引擎核心技术、数据挖掘与分析利用、数据远程比对、数据仓库建设、检验机构大型精密仪器数据自动采集等领域拥有国内领先的核心技术,并能够提供技术支持和数据分析为一体的完善服务体系。已经形成涵盖公共卫生、疫病预防、数据分析、食品安全等领域整体解决方案。
金云台本着“客户至上,追求卓越,诚信合作,共同发展”的价值观,以工匠精神不断打造优良的产品和优质的服务,赢得了医院、疾控、高校等科研单位的一致认可和高度评价。
三、中国区官方授权