全基因多位点序列分型(wgMLST)
全基因多位点序列分型(wgMLST)
过去的15年中,多位点序列分型(MLST)已被证明可用于细菌的分子分型。传统的MLST分析框架通常定义七个位点(管家基因),这些基因使用Sanger技术进行测序。为每个位点的唯一序列分配了等位基因编号,并根据它们的等位基因图谱(这是七个等位基因编号的组合)确定了细菌菌株。
随着二代测序技术提供了快速、经济高效的细菌基因组测序方法,并逐渐取代了Sanger测序技术,传统的MLST可以扩展到全基因组MLST(wgMLST)。由于在wgMLST中考虑了更多的位点(通常为1500 – 4000),因此可以获得更高的分型分辨率。
与全基因组SNP分析相反,wgMLST是基于等位基因变异的概念,这意味着重组、缺失或多个位置的插入被视为单个进化事件。与仅考虑点突变的方法相比,该方法在生物学上可能更相关。
该技术的主要缺点是需要等位基因调控。在缺乏合适的自动化工具的情况下,为数千个位点维持一致的等位基因分配将是一项艰巨的任务。为此,软件提供了自动管理工具。
Bionumerics中进行wgMLST分析
The wgMLST 管理员 and WGS tools 插件
wgMLST管理员插件提供了各种自动管理工具,可为任何选择的生物体建立和维护wgMLST分析框架。
l 自动命名等位基因
l 自动分配序列型别
l 根据wgMLST创建子框架如MLST,、eMLST,、rMLST
l 使用质控工具
尽管只有少数人可以访问特定于生物体的参考数据库,但大多数用户仅需要WGS tools插件。 该插件提供了一个全自动管道,来基于整个基因组序列数据来识别等位基因。
BioNumerics使用两种方法来识别等位基因:
l 基于从头拼接,然后进行BLAST搜索
l 使用不基于拼接的方法,即直接从序列的原始reads
计算引擎
在7.5和更高版本的BioNumerics中,可以在外部计算引擎上执行复杂的计算,例如从头拼接。 您可以在几乎免安装的按使用量付费的云解决方案(例如通过Amazon)或本地计算机集群部署(需要自定义服务)之间进行选择。
可以在BioNumerics内部将任务发布到计算引擎上,并检索这些计算的结果(包括用于质量控制的参数)。只有wgMLST等位基因图谱作为字符集存储在BioNumerics数据库中,从而形成了一个轻量级且响应迅速的菌株数据库。
不同水平的分析框架
基于wgMLST分析框架中包含的位点,可以在不同级别定义(例如, 核心基因组MLST(cMLST),核糖体MLST(rMLST)等。
BioNumerics 7.5及更高版本中的字符视图提供了一种灵活的工具,可以选择用于软件中存在的分型、聚类分析(例如最小生成树)或统计测试的位点。
使用Bionumerics进行wgMLST分析的原因
Bionumerics提供了:
l WgMLST的全自动流程
l 集成计算引擎:可以基于云或本地设置
l 轻量级的样品数据库
l 灵活选择位点
当前,功能齐全的wgMLST分析框架可用于以下生物:
l 鲍曼不动杆菌
l 蜡状芽孢杆菌
l 枯草芽孢杆菌
l 洋葱伯克霍尔德菌复合体
l 布鲁氏菌属
l 弯曲杆菌-空肠弯曲菌
l 柠檬杆菌属
l 艰难梭菌
l 克氏杆菌属。
l 阴沟肠杆菌
l 粪肠球菌
l 粪肠球菌
l 葡萄球菌
l 大肠杆菌/志贺氏菌
l 图拉弗朗西斯菌
l 产气克雷伯菌
l 产酸克雷伯菌
l 肺炎克雷伯菌
l 嗜肺军团菌
l 李斯特菌
l 微球菌属。
l 牛分枝杆菌
l 麻风分枝杆菌
l 结核分枝杆菌
l 淋球菌
l 铜绿假单胞菌
l 肠沙门氏菌
l 粘质沙雷氏菌
l 金黄色葡萄球菌
l 表皮葡萄球菌
l 假中间葡萄球菌
l 化脓性链球菌
目前正在开发以下wgMLST分析框架,并将很快提供:
l 百日咳博德特氏菌
l 肉毒梭菌
l 脓肿分枝杆菌
l 奈瑟菌属
l 嗜麦芽单胞菌
l 弧菌
l 耶尔森氏菌
以上资料由BioNumerics中国区官方授权总经销商独家提供,如需转载请主动标明出处。