![plosone的标志](/corehtml/pmc/pmcgifs/logo-plosone.png)
PolysacDB:微生物多糖抗原及其抗体数据库
Abhijit Aithal
1 Cell Biology and Immunology Division, Institute of Microbial Technology, Chandigarh, India
Arun Sharma
2 Bioinformatics Centre, Institute of Microbial Technology, Chandigarh, India
Shilpy Joshi
1 Cell Biology and Immunology Division, Institute of Microbial Technology, Chandigarh, India
Gajendra P. S. Raghava
2 Bioinformatics Centre, Institute of Microbial Technology, Chandigarh, India
Grish C. Varshney
1 Cell Biology and Immunology Division, Institute of Microbial Technology, Chandigarh, India
Conceived and designed the experiments: GCV GPSR SJ. Performed the experiments: AA AS SJ. Analyzed the data: AA AS GCV GPSR. Contributed reagents/materials/analysis tools: AA AS SJ. Wrote the paper: AA AS GCV GPSR.
抽象
长期以来,基于微生物细胞表面多糖的疫苗一直被认为是控制传染病的有吸引力的手段。为了实现这一目标,需要有关抗原多糖的详细系统信息。然而,只有少数几个数据库提供这方面的知识有限。本文介绍了PolysacDB,这是一个手动整理的抗原多糖数据库。我们从文献和网络资源中收集并汇编了有关微生物来源的抗原多糖的综合信息。该数据库的当前版本有来自347种不同微生物的149种不同抗原多糖的1,554个条目。每个条目都提供了有关抗原多糖的全面信息,即其来源、功能、与载体偶联的方案、产生的抗体、检测系统的详细信息、抗体的特异性、所涉及的拟议表位和抗体效用。为了方便用户,我们集成了用于搜索、高级搜索和浏览数据库数据的 Web 界面。该数据库将对研究基于多糖的疫苗的研究人员有用。它可从以下网址免费获得:http://crdd.osdd.net/raghava/polysacdb/。
介绍
多糖由单一糖或低聚糖部分的重复单元组成,也可能含有非碳水化合物成分,如脂质或蛋白质[1]–[3]。它们通常存在于病原微生物的细胞表面,在宿主-病原体相互作用中起着至关重要的作用。它们也是极好的免疫原,因为它们产生广谱免疫反应,可能导致保护宿主免受随后的感染[4]。因此,微生物多糖可用于设计预防传染病的疫苗。事实上,一种针对肺炎链球菌的多糖疫苗已被批准用于人类[5]。此外,随着抗生素耐药性发病率的增加,这可能会限制我们未来的治疗选择,基于多糖的疫苗可以提供一种有吸引力的替代品,因为它们不会被突变修饰。在这种情况下,迫切需要一个汇编所有抗原多糖的数据库,因为它不仅有助于设计针对微生物病原体的新型基于多糖的疫苗,而且还可以增强我们对宿主-病原体相互作用的理解。
过去,已经开发了许多用于设计基于肽/蛋白质的疫苗的数据库,例如IEDB [6]、MHCBN [7]、BCIPEP [8]、AntiJen [9]、PRRDB [10]、SYFPEITHI [11]等。一些数据库,如IMGT [12]和DIGIT [13],提供了关于免疫球蛋白序列的全面信息。之前,我们开发了一个数据库HaptenDB,它提供了关于半抗原的全面信息[14]。令人惊讶的是,在碳水化合物/多糖抗原领域创建的计算资源很少。免疫表位数据库 [IEDB] 提供有关在从人类到原核细菌等物种中发现的非肽表位(包括碳水化合物)的信息。但是,该数据库不提供有关抗原或抗体特征的任何信息。为了向参与开发基于碳水化合物或多糖的疫苗的科学界提供服务,我们进行了系统尝试,从文献和网络资源中收集有关微生物来源的抗原多糖的信息。此信息已编译在数据库 PolysacDB 中。
结果与讨论
该数据库的建立主要是为了创建一种资源,以便于检索分散在文献中的信息。这是第一次尝试建立一个关于微生物来源的抗原多糖的综合数据库。该数据库试图以简洁和统一的形式将实验数据公开。数据管理完全是手动的,这需要大量的精力和时间,因为这涉及深入研究论文并从实验数据中推断出结论。我们相信,这种手动管理提供了更高的可靠性和准确性。
数据收集和整合
数据收集是 PolysacDB 数据库的基线任务,从定义完整的数据库架构开始。数据是从三个主要来源收集的,即:PubMed、BCSDB(细菌碳水化合物结构数据库)和 IEDB。最初,使用适当的关键词下载相关论文,如“微生物”、“多糖”、“抗体”等。然后仔细审查了相关信息。只选择了那些揭示微生物细胞表面碳水化合物亚结构的免疫学数据的论文。特别强调那些使用或产生特异性抗体的人。删除了仅提供多糖结构信息的论文或仅提供非微生物物种多糖信息的论文。因此,在访问的600份同行评议出版物中,有400份用于将数据输入数据库。除了已发表的信息外,还从BCSDB数据库中得出了许多多糖的结构。由于每个条目都是基于从物理实验中获得的信息,因此我们将信息分为两个基本级别——一个级别描述使用的“实验参数”,另一个级别描述“获得的结果”。数据库中的每个条目都包括;i) 多糖的名称、性质和功能等一般信息;ii) 免疫方案,包括载体蛋白、偶联方案和测定,以及 iii) 抗体的名称和性质、它们的特异性和交叉反应性、拟议的相关表位和抗体效用。它致力于提供有关抗体交叉反应性谱和所涉及的表位的最大信息。为了提供全面的信息,数据库中的数据链接到各种数据库,如BCSDB和IEDB。
数据库架构、统计和更新
数据库统计:PolysacDB 架构包含 18 个唯一字段,数据库的整体架构在图1.产生抗体的主要抗原多糖主要分为“荚膜多糖”、“脂多糖”、“糖脂”和“糖蛋白”类。这种分类将有助于一般地查阅数据,并创建一个新的界面,用户可以通过该界面搜索数据库。图2显示这些类在 PolysacDB 中的相对流行程度。从中可以看出图2大多数抗原多糖属于长链多糖类别,例如“脂多糖”和“荚膜多糖”(74%),而一小部分属于“糖脂”和“糖蛋白”类别(26%)。这强调了多糖链长的重要性及其对其免疫原性的影响。由于 PolysacDB 中的数据纯粹基于实验结果,因此可以合理地假设将来的其他条目将继续改进数据库的范围。
数据更新工具
从长远来看,为了保持数据库的有用性,有必要创建一个有效的数据更新系统,以便世界各地的用户能够添加新条目以及更新现有条目。取而代之的是,我们准备了一个系统,通过两种不同的方式促进数据更新:第一种是通过“在线提交”网页,第二种是通过DrugPedia。“在线提交”网页提供了一个界面,可以在中间表中以已规定的字段格式添加数据。来自中间表的数据将由我们的团队每隔两到三个月进行验证,并通过PHP脚本存储在主数据存储表中。DrugPedia主要是为了促进对数据库中现有数据的修改。通过搜索或浏览获得的每条记录都提供了指向 DrugPedia 的链接,用户可以在其中通过添加或删除信息来修改现有数据。经过我们的专家团队的适当验证后,来自 DrugPedia 的信息将被存储到 PolysacDB 数据库的主数据存储表中。
用户界面
PolysacDB 提供了简单且用户友好的界面来“搜索”和“浏览”数据。“搜索选项”允许用户搜索任何字段的数据,如关键字、微生物、多糖名称等。 高级搜索选项结合了两种类型的查询,即多糖名称和微生物名称。例如,对“脂多糖”(polysaccharides)和“霍乱弧菌”(microbe)提取物的59个条目进行高级搜索,每个条目都描述了霍乱弧菌表面存在的脂多糖的免疫学特性。搜索选项提供了大量选项:i) “包含”和“精确”类型的搜索,ii) 用于选择要搜索的特定字段的选项,以及 iii) 用于选择要显示的特定字段的选项。浏览选项提供了一个强大的界面,无需输入关键字即可检索数据。总共可以直接浏览四个字段,即。多糖类别、微生物、载体名称和抗体。每个字段进一步指向相应的名称列表,可以浏览这些名称以获取特定条目。
数据库实用程序
PolysacDB的一个重要用途是,它可以作为一种资源,通过利用各自抗体的特异性和亲和力来研究涉及微生物多糖的抗原-抗体相互作用。例如,针对碳水化合物结构产生的抗体的交叉反应性谱可能表明在两个不同的物种中存在相似的结构,即共同的表位。例如,在大肠杆菌O18A字段中通过浏览选项观察到的条目中,可以发现,在用煮沸的大肠杆菌O18A细菌免疫小鼠上,获得了具有三种特异性的抗体。一种类型仅与同源大肠杆菌发生反应,第二种类型与其他大肠杆菌发生交叉反应。而第三种类型虽然对同源物种具有特异性,但也与粘质链球菌 08 LPS 发生交叉反应。后一种抗体的表位被发现是N-乙酰基-D-氨基葡萄糖。这可能意味着粘质链球菌表面存在类似于N-乙酰基-D-氨基葡萄糖的结构[15]。因此,该数据库可用于预测抗多糖抗体与特定微生物的交叉反应性,基于相似多糖表位的存在。换言之,该数据库将有助于预测不同微生物物种多糖骨架上的新表位
PolysacDB提供有关多糖的结构和功能的信息,这些多糖通常参与微生物内的基本管家和毒力相关功能。它提供了用于将多糖偶联到适当载体以用于免疫目的的方法的信息。此类方案通常决定了针对特定免疫原产生的抗体的性质。还值得注意的是,大多数抗多糖抗体都是使用整个细菌细胞作为免疫材料产生的。给出了描述用于表征抗体的测定系统的字段,例如 ELISA、蛋白质印迹、免疫荧光等。所涉及的表位已被列举,并在适用的情况下提供了与IEDB的链接。由于表面多糖在病原体的毒力中起着至关重要的作用,因此通常发现针对这些多糖的抗体具有保护作用,其中一些被用作可靠的治疗和检测试剂。该数据库在抗体实用程序字段中提供了有关这些方面的信息。PolysacDB还提供了一个平台,方便用户订购或请求从不同的组织/来源采购抗体。
局限性和未来前景
我们观察到,关于抗原多糖的信息相当丰富,但很分散。需要进一步的文献检索来扩展数据库并使其更加全面。此外,一些数据可能看起来是多余的,因为许多多糖都针对它产生了不止一种抗体,但是当我们看到单个条目的交叉反应性和表位字段时,很明显这些条目是完全不同的。从技术角度来看,保持数据质量非常困难,因为碳水化合物名称和结构中存在许多特殊符号,这些符号在MySQL中存储数据时会产生问题,尽管在数据存储过程中采取了足够的措施,但仍需要一些努力来正确存储和显示数据。在不久的将来,我们希望在定性和定量上扩展数据库,以涵盖更多信息。数据库将定期进一步手动更新。
结论
PolysacDB 提供在线 Web 工具,允许用户检索和分析数据。它包括工具:(1)使用具有许多选项的关键字搜索数据库,以及(2)浏览多糖名称和微生物的数据库。它还显示了有关多糖的结构和功能、载体偶联方案以及抗体的特性和效用等方面的具体细节。此外,它还提供内部超链接以显示详细信息和指向其他数据库的外部超链接。未来,PolysacDB将通过提供详细的多糖二维结构以及这些结构中表位的空间构象和位置来进一步改进。我们相信PolysacDB将促进多糖抗原的开源知识传播,并有助于更详细地了解其免疫原性和抗原性。
材料与方法
Web 界面和应用程序
整个数据库运行在LAMP(Linux-Apache-Mysql-PHP)服务器技术下,集成了四个开源软件。PHP、HTML 和 CSS 技术已被用于构建动态 Web 界面。MySQL是一个关系数据库管理系统(RDBMS),在后端工作,并提供命令来检索存储的抗原碳水化合物数据。PHP 是一种服务器端脚本语言,提供从数据库获取数据的接口和函数。整个软件系统在 Red Hat Enterprise Linux 5 环境下的 IBM SAS x3800 机器上使用 Apache httpd 服务器运行。PHP和MySQL的组合对于数据库管理来说非常高效和强大。
脚注
利益争夺: 作者声明不存在相互竞争的利益。
资金: 这项工作得到了印度科学与工业研究委员会(CSIR)和印度政府生物技术部的支持。资助者在研究设计、数据收集和分析、发表决定或手稿准备方面没有任何作用。
引用
12. Giudicelli V, Chaume D, Bodmer J, Müller W, Busin C, et al. IMGT,国际ImMunoGeneTics数据库。核酸研究 1997;25:206-211。[ PMC 免费文章][ 出版][ Google 学术搜索]