这是用户在 2024-3-19 9:47 为 https://app.immersivetranslate.com/pdf/?file=file%3A%2F%2F%2FD%3A%2F%25E6%2596%2587%25E7%258C%25AE%2... 保存的双语快照页面,由 沉浸式翻译 提供双语支持。了解如何保存?

人类皮肤双链DNA病毒组:地形和时间多样性、遗传富集以及与宿主微生物组的动态关联

杰弗里·汉尼根,杰奎琳·梅塞尔,阿曼达·泰尔兹利,郑琦,布伦丹·霍金森,亚当·桑米格尔,塞缪尔·迈诺特,弗雷德里克·布什曼,伊丽莎白·格里斯

美国宾夕法尼亚州费城宾夕法尼亚大学佩雷尔曼医学院皮肤科;美国宾夕法尼亚州费城宾夕法尼亚大学佩雷尔曼医学院微生物学系

摘要 病毒是人类微生物群的主要组成部分,但对皮肤知之甚少,皮肤是我们接触外部环境的主要屏障。病毒群落有可能调节皮肤健康和疾病状态。众所周知,噬菌体通过捕食和遗传交换影响微生物群落的结构和功能。人类病毒与皮肤癌和多种皮肤表现有关。尽管有这些重要作用,但对人类皮肤病毒组及其与宿主微生物组的相互作用知之甚少。在这里,我们通过对纯化的病毒样颗粒 (VLP) 的 DNA 进行宏基因组测序来评估人类皮肤双链 DNA 病毒组。同时,我们采用总皮肤微生物组的宏基因组测序来评估协变异并推断与病毒组的相互作用。在 1 个月内从 8 个身体部位的 16 名受试者那里收集了样本。除了已知可以划分细菌和真菌微生物群的微环境外,自然皮肤闭塞与皮肤病毒组群落组成密切相关。病毒重叠群富集了指示温带噬菌体复制方式的基因,并维持了编码潜在抗生素耐药性和毒力因子的基因。在细菌DNA序列中发现的CRISPR间隔区提供了噬菌体捕食的记录,并提出了一种解释皮肤噬菌体群落空间划分的机制。最后,我们对细菌和噬菌体群落的结构进行了建模,以揭示具有棒状杆菌中心的复杂微生物环境。这些结果揭示了人类皮肤病毒组特有的以前被低估的多样性、编码功能和病毒-微生物动力学。

重要性 迄今为止,大多数皮肤微生物组研究都集中在细菌和真菌群落上。尽管皮肤病毒群落有可能调节皮肤健康和疾病状态,但它们与宿主的关系仍然知之甚少。先前采用全宏基因组测序而不纯化病毒样颗粒 (VLP) 的研究已经为皮肤微生物组的病毒成分提供了一些见解,但尚未完全表征这些群落或分析与宿主微生物组的相互作用。在这里,我们提出了一种优化的病毒纯化技术和相应的分析工具,用于获得对皮肤病毒组的新见解,包括病毒“暗物质”及其与宿主微生物组的潜在相互作用。这里介绍的工作建立了健康人类皮肤病毒组的基线,是未来研究皮肤健康和疾病中病毒扰动的必要基础。

收稿日期:2015-09-17 接受日期:2015-09-23 发布时间:2015-10-20 引文 Hannigan GD, Meisel JS, Tyldsley AS, Zheng Q, Hodkinson BP, SanMiguel AJ, Minot S, Bushman FD, Grice EA. 2015.人类皮肤双链DNA病毒组:地形和时间多样性,遗传富集以及与宿主微生物组的动态关联。医学生物 6(5):e01578-15。doi:10.1128/mBio.01578-15.

编辑 Joseph Heitman,杜克大学 版权所有 © 2015 Hannigan et al.这是一篇开放获取文章,根据 Creative Commons Attribution-Noncommercial-ShareAlike 3.0 Unported 许可的条款分发,该许可允许在任何媒体上不受限制地非商业使用、分发和复制,前提是注明原作者和来源。

地址:Elizabeth A. Grice, egrice@upenn.edu。

人体皮肤是外部环境的屏障,也是多样化和独特微生物群落的家园。迄今为止,大多数皮肤微生物组研究都集中在细菌和真菌群落、它们对皮肤免疫应答的调节以及这些微生物与皮肤病的关联上 (1)。最近的宏基因组学研究证实了皮肤微环境和人际变异在塑造微生物组中的作用 (2)。皮肤病毒群落及其与宿主的关系仍然知之甚少,尽管它们有可能调节皮肤健康和疾病状态。噬菌体(噬菌体

感染细菌的病毒)可以通过捕食改变宿主细菌群落的组成来影响人类健康 (3, 4)。细菌簇状规则间隔短回文重复序列 (CRISPR) 元件(例如,参见参考文献 5)的获取和多样化提供了这种活力的证据,这些元件通过使用由 CRISPR 阵列中编码的序列引导的核酸酶靶向噬菌体基因组进行破坏。噬菌体也可能通过溶原作用对其宿主产生长期影响,其中噬菌体将其基因组整合到宿主中并处于静止状态。溶原携带的新基因可影响宿主代谢、毒力、抗生素耐药性和对其他噬菌体的敏感性 (6–9)。噬菌体还可以作为应激期间细菌适应的遗传库(即抗生素治疗)(10)。复制的病毒

研究论文

十字标志

2015年9月/10月 第6卷 第5期 e01578-15

®

mbio.asm.org 1

2024 年 3 月 17 日从 https://journals.asm.org/journal/mbio 下载 101.44.81.117。

人体细胞也存在于皮肤中,可影响人体健康,包括人瘤病毒 (HPV)、人多瘤病毒 (HPyVs) 和人疱疹病毒,并可导致皮肤癌和其他皮肤病。

先前采用全宏基因组测序而不纯化病毒样颗粒 (VLP) 的研究提供了对皮肤微生物组病毒成分的一些见解,但尚未完全表征这些群落或分析与宿主微生物组的相互作用 (2, 11, 12)。我们在这里介绍的研究采用了纯化病毒DNA的技术,从而减少了人类和细菌细胞的污染,这些细胞的基因组比病毒基因组长几个数量级。这允许进行更深入的病毒测序,并使用不依赖参考的分析来捕获未知或未表征的基因组(称为病毒暗物质)的影响 (13)。我们将鸟枪法宏基因组分析应用于纯化的VLP以及未纯化的全皮肤微生物群落,首次对健康人体皮肤病毒组和不同解剖位置的整个宏基因组进行了纵向综合分析。我们用这个新数据集解决的主要问题如下。与整个宏基因组的生物地理学和多样性相比,人类皮肤病毒组的生物地理学和多样性如何?皮肤病毒组编码哪些遗传功能,包括抗生素耐药性、毒力因子 (VF)

和辅助代谢基因(AMGs;噬菌体基因组中的宿主基因[14])?关于噬菌体与其细菌宿主之间的相互作用,我们可以推断出什么,包括CRISPR在维持病毒组群落结构中的作用?

结果

取样、测序和质量控制。从 16 名年龄在 23 至 53 岁之间没有已知皮肤状况的健康志愿者身上收集皮肤拭子(图 1A 和 B)。解剖皮肤部位双侧取样(病毒组样本在全宏基因组样本对侧的部位采集),由多种不同的微环境组成:皮脂腺(耳后皱褶 [Ra]、枕部 [Oc] 和前额 [Fh])、湿润(腋窝 [Ax]、脚趾蹼 [Tw] 和脐部 [Um])和间歇性湿润(肘前窝 [Ac] 和手掌 [Pa])(图 1A)。在间隔 4 周的两个时间点收集拭子样本,以评估社区的稳定性。

在擦拭每个受试者的皮肤后,我们使用对侧对的一个样本,通过使用为人类和环境病毒组建立的方案来纯化和提取 VLP DNA (15-17)。我们从对侧样本中提取DNA,以研究整个微生物群落,包括细菌、真菌和病毒成员。使用Illumina NexteraXT文库制备试剂盒制备样品,在Illumina MiSeq和HiSeq2500平台上进行鸟枪法测序,该试剂盒

FRONT

BACK

Retroauricular

crease (Ra)

Forehead (Fh)

Axilla (Ax)

Palm (Pa)

Umbilicus (Um)

Occiput (Oc)

Antecubital fossa (Ac)

Toe web space (Tw)

Sebaceous

Moist

Intermittently moist

Characteristics

Cohort (n=16)

Age

Mean, y

Median, y

Range, y

Female Num (%)

Initial Visit

Median

Range

Second Visit

Median

Range

27.9

26

23 - 53

50

2013年8月20日 2013年8月19日 - 2013年9月10日

2013年9月18日 2013年9月16日 - 2013年10月10日

病毒组全宏基因组

Swab Skin

Removal of Cellular

Contamination

VLP DNA Purification

& Isolation

Illumina MiSeq和HiSeq2500测序

Swab Skin

Whole DNA Isolation

Illumina MiSeq和HiSeq2500测序

Sequence Quality

Control

Sequence Quality

Control

Viral Taxonomic ID

微生物分类学 ID(细菌、真菌、病毒)

Viral Diversity

Microbial Diversity

Viral Replication Cycle

Analysis

病毒辅助代谢基因和功能

全微生物功能分析

Virus and Bacterial Co-occurance Networking

CRISPR Identification & Potential Targeting

DNA分离和测序

生物信息学分析

C

A

B

Occluded

Exposed

Intermittently occluded

图1 皮肤病毒和全宏基因组群落分析的研究设计。(A) 对 16 名受试者的 8 个皮肤部位进行抽样。彩色文字表示微环境分类,每个彩色球代表解剖部位的闭塞状态。(B) 抽样队列的特征。(C) 流程图,说明从皮肤拭子中分离DNA并进行测序以进行下游生物信息学分析的程序。

Hannigan等人。

2

®

mbio.asm.org

2015年9月/10月 第6卷 第5期 e01578-15

2024 年 3 月 17 日从 https://journals.asm.org/journal/mbio 下载 101.44.81.117。

专为双链 DNA (dsDNA) 设计。因此,我们的分析集中在dsDNA病毒和单链DNA(ssDNA)病毒的复制中间体上。样品采集、序列处理和生物信息学分析如图 1C 所示。

经过高质量过滤后,dsDNA病毒数据集共包含260,714,906个高质量序列读段,每个样本的中位数为650,506个序列读段。整个宏基因组数据集共包含 368,341,329 个高质量序列读段,每个样本的中位数为 981,031 个序列读段(参见图 S1A 至 D;序列计数统计见补充材料中的表 S1)。与之前关于类似人类 VLP 制备的报告一致 (16–19),对整个 NCBI 非冗余数据库的轻松搜索显示,94.8% 的 VLP reads 与已知基因组(BLASTn E 值,10)不显着匹配,这凸显了研究病毒暗物质的重要性。类似的分类将 42.6% 的全宏基因组读数确定为未知。在这项研究中,我们使用了多种与参考无关的方法来解决这一未分类暗物质的子集。将病毒和整个宏基因组数据集独立组装成重叠群,并选择长度为500 bp的重叠群进行进一步分析(见图S1E至H;见表S2了解重叠群覆盖率、数量和长度统计)。在这些噬菌体重叠群中,9.0% 在分类学上是可识别的,这突出了在分类学中使用重叠群而不是使用未对齐读段的效用 (20)。

在每次采样事件中,我们收集了从未与皮肤接触的空白阴性对照。从对照中提取DNA,并与实验样品平行测序。从实验样品中以计算机方式减去阴性对照中鉴定的序列(详见补充材料中的文本S1)。使用Bray-Curtis差异度量,我们发现对照样品与皮肤样品的显着分离(见补充材料中的图S2A),确认了对照样品和实验样品之间的最小同一性,并提供了存在的病毒不是环境或试剂污染的结果的信心。作为额外的对照,我们对一个偶数模拟社区样本进行了测序。在属水平上,观测到的群落组成与预期的群落组成显著相关(Spearman相关系rho 0.6;P 0.01),表明我们的文库制备和测序技术充分描述了微生物群落组成(见图S2B)。

使用前面概述的用于量化病毒组污染的方法 (21),我们通过显示与未纯化的整个宏基因组相比,纯化病毒组中归一化细菌 16S rRNA 基因水平显着降低来验证病毒组内细胞污染的减少(见图 S2C)。我们还通过使用先前描述的方法(16)来支持病毒组纯度,以将更多的序列从病毒组映射到整个宏基因组,而不是相反(见图S2D)。最后,我们证实病毒组中人类细胞的污染明显少于整个宏基因组(见图S2E)。这些分析表明,VLP 纯化后病毒读数的丰度更高,并增强了 VLP 纯化技术的实用性。

皮肤病毒组组成。检查皮肤病毒组的社区成员资格

我们使用病毒 UniProt TrEML 参考数据库来注释组装的病毒重叠群中预测的开放阅读框 (ORF)。然后,对带注释的 ORF 进行投票系统,该系统根据重叠群中最丰富的 ORF 注释分配分类,如前所述 (22)。一些重叠群在分类学投票中有联系,这些投票被标记为具有“多次命中”,因为它们不是未知的,但我们不能自信地分配一个已解决的病毒分类学。每个分类学鉴定的重叠群的丰度被量化为与重叠群对齐的未组装读段的数量。使用前面描述的方法对读取计数进行归一化,以解释整个样本的重叠长度、测序效率和相关运行变化的差异 (22)。

鉴定出的大多数 dsDNA 病毒重叠群属于 Caudovirales 目(尾噬菌体),表明皮肤 dsDNA 病毒群落中噬菌体的比例比先前建议的要大 (11)(参见补充材料中的图 S3A)。大多数病毒在家族水平上是无法分类的,但我们可以识别一些噬菌体家族,包括肌病毒科和西波病毒科(见图S3B)。有趣的是,状病毒科的成员在手掌上最为丰富,这是一个已知受皮肤疣困扰的区域。我们还观察到了痘病毒科的成员,在相关的皮肤宏基因组调查中观察到它们是主要的病毒分类群 (23)。需要注意的是,虽然许多病毒在科水平上无法识别,但它们通常在物种水平上是可识别的,就像许多孤儿葡萄球菌噬菌体一样(24)。

在物种水平上,我们观察到已知皮肤的噬菌体

噬菌体丙酸杆菌和葡萄球菌噬菌体等居民(图2A),它们的相对丰度在不同的皮肤微环境中存在显着差异(见图S3C和D;P 0.05,Kruskal-Wallis和多重比较事后检验)和闭塞状态(见图S3F和G;P 0.05,Kruskal-Wallis和多重比较事后检验)。每个病毒组的很大一部分都含有与多个噬菌体保持相同相似性的重叠群,这意味着它们不能分配给单个物种,因此被注释为“多重命中”(图2A)。这可能反映了噬菌体基因组的模块化性质,并强调了对更强大的参考数据库的需求,以更好地了解噬菌体基因组结构。环境噬菌体也有丰富的代表,包括假单胞菌和芽孢杆菌噬菌体。

公认的最丰富的后生动物病毒是HPV,它在某些个体中很突出,并且通常在皮脂腺和暴露部位的相对丰度明显更高(见图S3E和H;P 0.05,Kruskal-Wallis 和多重比较事后检验)。HPyVs的丰度非常低,其中只有6个样本包含与已知HPyV基因组的任何序列映射,并且没有样本具有100个假定的HPyV序列。

皮肤总微生物群落组成。除了

检查病毒组的分类组成,我们通过使用未经过VLP或微生物选择的相应样本集进一步表征了整个微生物皮肤群落的成员资格。使用 MetaPhlAn (25, 26) 从未组装的序列中对细菌群落进行分类,MetaPhlAn 根据参考基因组中的分支特异性标记对序列进行注释。此外,细菌、真菌和病毒物种的丰度通过使用最低的共同祖先算法从组装的重叠群中量化

人体皮肤病毒组的多样性和遗传学

2015年9月/10月 第6卷 第5期 e01578-15

®

mbio.asm.org 3

2024 年 3 月 17 日从 https://journals.asm.org/journal/mbio 下载 101.44.81.117。

Hannigan等人。

4

®

mbio.asm.org

2015年9月/10月 第6卷 第5期 e01578-15

2024 年 3 月 17 日从 https://journals.asm.org/journal/mbio 下载 101.44.81.117。

MEGAN5 (27).与先前对皮肤的全宏基因组分析一致(2,28),丙酸杆菌(包括痤疮丙酸杆菌)、葡萄球菌(包括表皮葡萄球菌和人链球菌)和棒状杆菌是优势细菌属(图2B;见图。 补充材料中的S4A和B),马拉色菌是最丰富的真菌属(见图S4A和C)。病毒的丰度较低(平均每个样本为0.4%),这可能是因为与原核生物和微真核生物相比,病毒的基因组大小相对较小,这进一步突出了测序前VLP分离的效用(见图S4A和D)。回收的病毒主要是“未分类”的噬菌体和葡萄球菌噬菌体(见图S4D)。

皮肤病毒组和总宏基因组的变异

解剖部位。如上所述,在先前的文献(16-19)中广泛证明,由于参考数据库信息不足,大多数病毒在分类学上无法识别。为了从已表征和未表征的基因组中捕获信息,我们采用了基于数据集中每个重叠群的相对丰度的不依赖参考的方法。为了评估解剖部位之间的β多样性(样本之间的多样性),我们计算了相同和不同解剖部位群落之间的Bray-Curtis差异。我们发现了基于微环境和闭塞状态的病毒组和全宏基因组群落结构的显着差异(图 2C 和 D;P 0.001,阿多尼斯检验)。这些发现与先前关于细菌和真菌皮肤微生物组的报道相似(29,30),并强调了闭塞/暴露参数在微生物群落结构和功能中的额外作用。

我们通过使用不依赖参考的方法来计算香农多样性指数,进一步估计和比较了病毒群落的α(样本内)多样性。在这里,我们通过使用PHACCS工具包(31)估计了病毒组多样性,包括病毒暗物质,该工具包计算重叠群组装的程度以生成“重叠群谱”,该谱与大小和多样性不同的模拟群落进行比较,直到找到合适的匹配。PHACCS预测病毒组的大小和多样性,就好像整个群落(已知和未知病毒)都被测序和注释一样。根据上述参考依赖的分类学相对丰度信息计算解剖部位细菌群落的香农多样性。我们发现皮脂腺位点的病毒组和细菌宏基因组不如潮湿或间歇性湿润位点的多样性(图2E至G;P 0.05,Kruskal-Wallis和多重比较事后检验)。虽然病毒组在间歇性闭塞位点(例如,Ac)最多样化

细菌宏基因组在闭塞位点(例如,Tw 和 Um;图2E至G;P 0.05,Kruskal-Wallis和多重比较事后检验),进一步突出了基于解剖部位的病毒和细菌群落多样性的差异。

为了评估不依赖参考的方法在确定病毒多样性(包括病毒暗物质)差异方面的效用,我们使用图2A中与参考相关的分类学相对丰度信息进行了上述α和β多样性分析。参考依赖性数据集的α多样性(见补充材料中的图S5A和B)明显低于PHACCS采用的参考无关方法预测的α多样性(图2F)。与基于PHACCS的分析相比,当使用参考相关数据时,微环境或遮挡类别之间没有显着差异。不同微环境和闭塞状态的位点之间的β多样性反映了与参考无关的发现(图2C;见图S5C和D)。因此,在一些社区分析中使用病毒暗物质具有附加价值,但一些指标可以通过基于参考的方法有效地执行。

皮肤病毒组和整个宏基因组的变异

时间。先前的研究表明,与人际变异性(30,32,33)相比,给定皮肤部位的细菌微生物组的时间变化很小,因此我们检查了1个月内病毒和整个微生物群落的变化。通过Bray-Curtis差异性测量,两个时间点在病毒组的共享多样性方面存在显着差异,但在整个宏基因组中没有显著差异(参见补充材料中的图S6A和B;P 0.001 和 P 0.978,分别为 Adonis 检验)。这些发现表明,随着时间的推移,整个宏基因组比病毒群落更稳定。

使用相同的指标,给定皮肤部位的病毒组时间变异性显着低于人际变异性(图2H;P 1.26 10, t 检验),类似于我们对整个宏基因组的观察结果(图 2I;P 3.50 10,t检验)。与人类粪便病毒组类似,皮肤病毒组变异的最大来源似乎是人际变异(16,17)。与肠道相比,肠道被认为随着时间的推移共享80%的人内病毒组(16,17),我们发现随着时间的推移,只有不到50%的人内皮肤病毒组被共享(见图S6C)。

温和复制风格的证据。噬菌体可以

以裂解性或温带噬菌体的形式存在。裂解噬菌体在感染后不久就裂解宿主,并且不以潜伏的溶原状态存在。相反,温带噬菌体能够将其基因组整合到细菌宿主基因组中并作为噬菌体存在,以及切除并经历裂解循环。为了检查驻留在皮肤上的噬菌体的复制策略,我们使用了已建立的

图2 皮肤病毒和细菌宏基因组群落的分类和多样性。(A 和 B)随时间推移,按地点划分的病毒 (A) 和细菌 (B) 群落的分类学相对丰度。病毒相对丰度图显示了根据病毒 TrEMBL 注释的重叠群的 10 个最丰富的分类群。根据 MetaPhlAn 分析,细菌群落显示了 10 个最丰富的分类群。每个条形代表来自受试者的单个样本,并且条形按时间点和解剖位置分隔,如顶部所示。(C 和 D)病毒组 (C) 和全宏基因组 (D) 样本之间 Bray-Curtis 差异的非度量多维标度 (NMDS) 排序图,显示闭塞状态和环境底物存在显着的聚类(P 0.001,Adonis 检验)。(E) 每个解剖部位的病毒组和细菌宏基因组的 Alpha 多样性(Shannon 多样性指标)。x轴代表细菌宏基因组的中位数多样性,y轴代表病毒组的中位数多样性。每个点是两个群落的中位数多样性,误差线表示中位数的总体缺口偏差。(F 和 G)病毒 (F) 和微生物 (G) Shannon 多样性由位点微环境和遮挡呈现,星号表示 Kruskal-Wallis 和多重比较事后检验的统计学意义 (P 0.05)。使用 ggplot2 R 包计算箱形图。(H 和 I)通过平均值(均值的标准误差)Bray-Curtis 差异度量计算的病毒组 (D) 和整个宏基因组 (E) 的时间方差相比,人内方差。值越高表示差异越大。星号表示统计学意义(P 1.0)。

人体皮肤病毒组的多样性和遗传学

2015年9月/10月 第6卷 第5期 e01578-15

®

mbio.asm.org 5

2024 年 3 月 17 日从 https://journals.asm.org/journal/mbio 下载 101.44.81.117。

在 VLP 重叠群中寻找温带噬菌体复制标记的方法 (17),包括 (i) 整合酶基因的存在(包括丝氨酸和酪氨酸整合酶家族的成员),(ii) 温带噬菌体基因的存在,包括 parABS 分配系统,以及 (iii) 表明整合的细菌基因组的核苷酸序列同一性。在 6

根据上述分类标准,有 661 个重叠群被注释为噬菌体,其中 5,363 个至少具有这三种温带噬菌体标记中的一种(图 3A)。更具体地说,592 个 (8.8%) 包含至少一个整合酶基因,如 UniProt TrEMBL 数据库所示;856 个 (12.9%) 与已知的细菌基因组一致,包括放线菌门、厚壁菌门和变形菌门;5,137 例 (77.1%) 含有与移动遗传 ACLAME 数据库中发现的注释前噬菌体基因相似的 ORF

图3 噬菌体在皮肤上的复制周期和功能富集。(A) 噬菌体重叠群(黄色)的欧拉图,这些重叠群还包含整合酶基因(绿色)、每 10 kb 至少一个噬菌体元件(蓝色)、与已知细菌基因组的同源性(红色)或这些标记的组合。(B) 箱形图,说明每个身体部位预测的温带噬菌体的相对丰度百分比。温带噬菌体重叠群被定义为至少每 10 kb 包含噬菌体基因和其他三个温带标记之一的重叠群。相对丰度计算为每百万个映射的未组装读段中每千碱基转录本的相对读长数,这些读长映射回组装的重叠群。星号表示 Kruskal-Wallis 和多重比较事后检验在 P 0.05 处具有统计学意义。(C) 与每个解剖部位相关的排他性 OPF 的分布。(D) 在整个病毒组中发现的 15 个核心 OPF 的分布和 UniProt 注释。(E) OPF相对丰度对病毒组样品的Bray-Curtis差异。

Adonis检验对环境基质和遮挡的聚类均有统计学意义(P 0.001)。

Hannigan等人。

6

®

mbio.asm.org

2015年9月/10月 第6卷 第5期 e01578-15

2024 年 3 月 17 日从 https://journals.asm.org/journal/mbio 下载 101.44.81.117。

元素 (34)。通过这些测量,每个解剖皮肤部位的温带噬菌体的中位数相对比例为85%,不同部位的相对丰度不同(图3B;P 0.05,KruskalWallis 和多重比较事后检验)。这一发现表明,皮肤上大多数可识别的 Caudovirales 噬菌体是温带的,这与人类肠道病毒组的研究一致 (16, 17)。

病毒组功能潜力和 AMG。虽然我们的数据

支持皮肤 dsDNA 噬菌体群体中宿主裂解的作用较小,它们可能通过噬菌体整合和遗传交换影响细菌群落。因此,我们研究了皮肤病毒群落与整个宏基因组相比的遗传功能潜力。通过与京都基因和基因组百科全书 (KEGG) 数据库 (KEGG) 数据库 (35) 进行比较来研究功能通路,并使用 HUMAnN 注释和定量程序 (36) 进行分析。总体而言,病毒组在信息处理和肽转运基因中富集,而整个宏基因组在代谢过程基因中富集(参见补充材料中的图S7A)。基因本体(GO)分析显示,病毒组中病毒成分和过程、DNA转录和RNA代谢过程的基因显著富集(见图S7B),而整个宏基因组则富集了细胞氮化合物和碳水化合物衍生物代谢过程的基因。值得注意的是,病毒组在GO术语“病毒潜伏期的建立”中显着富集(见图S7B),与观察到的温带噬菌体在皮肤上的优势一致。

已知一些噬菌体编码AMG(噬菌体基因组中的宿主基因),通过调节宿主代谢活性来促进病毒感染(见参考文献14)。我们评估了整个皮肤病毒组中是否存在保守的核心AMG,从而属于整体核心基因集。为了实现这一点,我们将预测的病毒组重叠群 ORF 聚类为具有代表性的操作分类单元样序列,称为操作蛋白家族 (OPF) (9, 37)。核心 OPF 被定义为存在于皮肤部位所有样本中的那些 OPF。核心OPF在皮肤部位分布不同,前额的OPF数量最多(图3C)。在所有病毒组样本中存在的 15 个核心 OPF 中,所有都是假设或已知的噬菌体基因,没有一个是 AMG 候选基因 (Fig. 3D),这表明核心皮肤病毒组 AMG 种群稀疏。如上所述,与宏基因组相比,病毒组富含与转运相关的KEGG通路基因(见图S7B),以及与RNA代谢过程调节相关的GO术语(GOEAST,P 0.05)。这表明潜在的AMG虽然不严格属于一组“核心”基因,但存在于整个皮肤病毒组中。我们还研究了OPFs在皮肤部位微环境和闭塞方面的分布,并发现了显着差异(Bray-Curtis差异性;P 0.001,Adonis检验),表明病毒组功能潜力的空间分布不同(图3E)。

抗生素耐药性和VF富集。因为噬菌体

可能通过赋予新的毒力和致病性功能来改变其宿主的表型,我们研究了皮肤病毒组中编码的抗生素耐药性和细菌毒力的潜力。使用先前基础人类病毒组研究中指定的爆炸算法参数 (17, 38)

我们通过将组装的病毒组重叠群的ORF与综合抗生素耐药性数据库(CARD)(39)(BLASTx E值,10)进行比较来评估抗生素耐药性潜力。为了进一步提高我们对过去研究之外的注释的信心,我们过滤了 BLASTx 命中,以仅保留具有 75% 身份的命中。病毒组包含 29 个独特的抗生素耐药基因 (ARG) 组,这些基因组与抗生素外排和对 β-内酰胺酶、利福平、四环素和艾法霉素的耐药性有关(图 4A)。四环素类药物通常用于治疗痤疮等皮肤病,而艾法霉素是天然存在的抗生素,对痤疮丙酸杆菌具有很强的活性(40)。为了确认鉴定的 ARG 与病毒组相关,而不是细胞污染或伪影,我们证明了 ~50% 的 ARG 与其他注释的噬菌体基因共定位在重叠群上,或者本身就是已知的噬菌体相关 ARG(图 4B)。ARGs主要与“多重命中”、芽孢杆菌和链球菌噬菌体有关(图4B)。我们还通过使用具有相同 BLASTx 参数的 VF 数据库 (VFDB) (41) 和过滤来识别与皮肤病毒组相关的潜在 VF,如上所述用于抗生素耐药性分析。我们鉴定了 122 个独特的 VF 基因,其中 1/3 的 VF 重叠群要么是已知的噬菌体相关基因,要么是与噬菌体基因共定位(图 4C)。这些发现共同表明,皮肤微生物组的噬菌体可能是与抗生素耐药性、毒力和致病性相关的可传播基因的重要来源。

噬菌体-细菌相互作用的推断:共现

网络分析。为了预测皮肤的噬菌体-细菌相互作用,我们从细菌和已知噬菌体的相对丰度构建了一个相关网络,如前所述 (42)(图 5A)。正相互作用表明细菌和噬菌体通常同时发生,而负相互作用表明细菌和噬菌体相对丰度之间存在相互排斥的关系。由此产生的显着噬菌体相互作用网络包含 21 个节点、7 个细菌和 14 个噬菌体。丙酸杆菌和葡萄球菌通常分别与其噬菌体对应物丙酸杆菌和葡萄球菌噬菌体共存(图5A)。整体共现结构表明,该网络是非随机的,表现出无标度特性,例如短平均路径长度(特征路径长度,2.781)和近似符合幂律的节点度分布(R 0.781)(43)。较短的平均路径长度表明,皮肤噬菌体-细菌群落网络能够对扰动做出快速响应 (44)。网络的异质性值(边缘分布不均匀的可能性)为0.819,表明枢纽较少,表明网络中存在潜在的“基石”分类群(45)。

可以通过识别高度的节点来区分集线器。在皮肤细菌-噬菌体网络中,度数为10的棒状杆菌的相互作用次数最多,而所有其他节点的度数均为5。棒状杆菌与八种噬菌体呈正相关,包括棒状杆菌和葡萄球菌噬菌体,与两种噬菌体呈负相关,包括丙酸杆菌噬菌体(图5A)。网络拓扑结构的这些特征表明,皮肤细菌-噬菌体网络能够对扰动做出快速反应,而棒状杆菌可能充当关键枢纽。

噬菌体-细菌相互作用的推断:CRISPR。

CRISPR是细菌对噬菌体捕食者的一种适应性免疫形式。间隔序列,通常为 26 至 72 个核苷酸

人体皮肤病毒组的多样性和遗传学

2015年9月/10月 第6卷 第5期 e01578-15

®

mbio.asm.org 7

2024 年 3 月 17 日从 https://journals.asm.org/journal/mbio 下载 101.44.81.117。

长度,从入侵的噬菌体中捕获并整合到细菌染色体中。这些间隔序列提供了细菌遇到的噬菌体捕食者的基因组记录。我们总共检测到 477 个独特的间隔序列,在整个宏基因组数据集中通过 68 个独特的 CRISPR 重复序列进行鉴定。只有 18 个间隔区与 VLP 重叠群对齐(图 5B)。这些间隔区在 21 个宏基因组重叠群中被发现,并映射到 40 个独特的 VLP 重叠群。在 Um 中发现的间隔区仅与 Um VLP 重叠群对齐。在 Ax 中检测到的两个葡萄球菌间隔区与 16 个不同的 VLP 重叠群对齐,这些重叠群在除 Pa 以外的每个身体部位都发现(图 5B)。在 Pa 和 Tw 中发现的丙酸杆菌间隔区与来自 Ax、Oc、Fh 和 Ra 的 8 个不同的 VLP 重叠群对齐(图 5B)。这些发现表明,噬菌体-宿主动力学可能不受解剖皮肤部位的限制,在一个皮肤部位发现的间隔物可能在从其他皮肤部位侵入期间限制噬菌体,这在一定程度上可以解释皮肤病毒组的空间划分

我们进一步表征了VLP重叠群中的基因组CRISPR靶标,发现编码区内的大多数靶标属于噬菌体门户蛋白,噬菌体门户蛋白是参与将DNA包装成噬菌体颗粒的基因(图5C)。目前尚不清楚这是CRISPR间隔区低采样(大约有12个间隔区被注释)的伪影还是生物学现象。需要进一步的工作才能在更大程度上理解这一点。有趣的是,大多数CRISPR靶标没有映射到预测的ORF,这表明基因组编码区域没有靶向偏好(图5C)。

讨论

总之,我们提出了人类皮肤病毒组(由纯化的VLP确定)和整个宏基因组的平行分析。VLP 的纯化为病毒组靶向分析提供了许多优势,包括对病毒进行更深入的测序,以及使用参考依赖性和独立性方法自信地评估病毒暗物质的能力。然而,由于皮肤内和皮肤上的微生物负担很小,这种技术以前在技术上无法应用于皮肤病毒。先进的文库制备技术利用

0

25

50

75

100

Ac

Ax

Fh

Pa

Ra

Oc

Tw

Um

相对丰度百分比

CARD抗生素耐药性基因分类

A

其他CARD基因

1

1

1

1

1

1

1

1

2

2

2

2

2

2

2

2

抗生素耐药基因变异或突变体

艾法霉素抗性基因

抗生素耐药性 DNA 拓扑异构酶亚基 GyrA

外排泵的亚基赋予抗生素耐药性

抗生素耐药性 DNA 拓扑异构酶亚基 ParE

抗生素耐药性 DNA 拓扑异构酶亚基 ParC

四环素阻力MFS外排泵

利福平灭活酶

OXA β-内酰胺酶

TEM β-内酰胺酶

B

Contigs with Both

CARD and Phage ORFS

Contigs with Only

CARD ORFs

Bacillus

Phage

Multiple

Taxa

Streptococcus

Phage

Contigs with Both

VF and Phage ORFS

Contigs with Only

VF ORFs

C

Multiple

Taxa

Bacillus

Phage

Streptococcus

Phage

Gp292

DNA 聚合酶 I 传感器组氨酸激酶

Subunit of Gene Modulating Antibiotic Efflux

尾长卷尺蛋白主要衣壳蛋白

推定的未表征蛋白噬菌体门户蛋白 ParB1 染色体分配蛋白

Gp21

Gp86

Gp83

ORF 003

Hydrolase

内溶素 gp23 末端酶 gp2 整合酶 gp31 未表征的蛋白头成熟蛋白酶

Subunit of Efflux Pump Conferring Antibiotic Resistance

Uncharacterized Protein

Gp254

Gp252

Gp252

Virulence Regulator (RNA Polymerase Sigma Factor)

Leptospira

Phage

Enterobacteria Phage

Cellulophaga

Phage

图4 皮肤病毒组中的抗生素耐药性和细菌毒力。(A) 根据 CARD 预测的 ARG 的相对丰度。每个条形代表一个主题,条形按时间点和解剖位置分隔,如顶部所示。(B) 与噬菌体重叠群相关的ARG的流程图。最左边的部分显示了与其他噬菌体基因共定位在重叠群上的ARG的比例,或者它们本身是已知的噬菌体相关基因。中间部分显示了包含预测 ARG 的噬菌体分类群的分布。最右边的部分显示了两个在噬菌体重叠群上共定位的 ARG 的注释示例,其中 CARD 预测的 ARG 以粗斜体显示。(C)与图B类似,是与噬菌体相关的VF的流程图。与图 B 一样,最左边的部分显示了与噬菌体相关的预测 VF 的分布,中间部分显示了这些噬菌体的分类分布,最右边的部分显示了一个带注释的示例。

Hannigan等人。

8

®

mbio.asm.org

2015年9月/10月 第6卷 第5期 e01578-15

2024 年 3 月 17 日从 https://journals.asm.org/journal/mbio 下载 101.44.81.117。

超少量 (1 ng) 的 DNA 促进了这项研究,以表征与整个宏基因组平行的人类皮肤 dsDNA 病毒组,以深入了解皮肤微生物组的多界相互作用。

我们的结果表明,皮肤病毒组具有高度的位点特异性,除了皮脂和水分外,还受到闭塞和暴露的调节。皮肤闭塞对病毒和整个微生物群落的这种显着影响尚未得到描述

Listeria phage

Unidentified Phage

Staphylococcus

p

g 噬地氮藘杆菌噬菌体

Enterococcus phage

Staphylococcus phage

Phage 21

Corynebacterium

Phage TP

Sphingomonas phage

Alteromonas phage

Acinetobacter phage

Tsukamurella phage

Micrococcus

Propionibacterium

Lactobacillus

Rothia

Corynebacterium phage

Propionibacterium phage

a

Streptococcus

Rhodococcus phage

细菌相对丰度高

噬菌体相对丰度高

相对丰度低

B

噬菌体重叠群

CRISPR间隔区

丙酸杆菌属

葡萄球菌

棒状杆菌

小球菌

塞尼利帕鲁斯

未分类

CRISPR 间隔宿主

样品类型

C

噬菌体

门静脉蛋白

ssDNA结合

蛋白

未表征

蛋白

与 TrEMBL 数据库匹配的 ORF

预测的垫片定位

编码区域

Ra

Oc

Ax

Tw

Um

Fh

Ac

Um

Tw

Ax

Oc

Ra

Pa

Ac

推定噬菌体

门静脉蛋白

A

图5模拟了噬菌体-宿主在皮肤病毒组内的共同发生关联和CRISPR靶标。(A)病毒组噬菌体与整个宏基因组细菌之间相关性的网络分析。噬菌体用黄色框表示,而细菌属用蓝色框表示。颜色强度表示分类单元的整体相对丰度。红线表示负相关,绿线表示正相关。(B) 径向表,显示靶向病毒噬菌体重叠群(黑色)的细菌 CRISPR 间隔物(灰色)。线条颜色代表 CRISPR 间隔细菌宿主。(C) 描述皮肤细菌CRISPR靶向的噬菌体基因组区域的流程图。最左边的部分显示了靶向噬菌体基因组中预测编码区 (ORF) 的间隔区的丰度。中间部分是与TrEMBL参考数据库中基因匹配的ORF的分布。最右边的部分是注释编码区CRISPR靶标的分布。

人体皮肤病毒组的多样性和遗传学

2015年9月/10月 第6卷 第5期 e01578-15

®

mbio.asm.org 9

2024 年 3 月 17 日从 https://journals.asm.org/journal/mbio 下载 101.44.81.117。

在以前的皮肤整体微生物分析中,并为这些群落在解剖部位的变化提供了新的见解。与个人内部时间变异相比,解剖学上的人际关系和人际变异在皮肤病毒群落组成中起着更大的作用,支持了持久的共生种群的作用,而不是从环境中新获得不同瞬时病毒的主导地位。

噬菌体种群在皮肤上的持续存在,尤其是dsDNA噬菌体,可能部分是由于其感染的温和性质。虽然主要是温带的皮肤噬菌体可能不会与宿主表现出捕食者-猎物的动态关系,但它们可能通过基因转移产生新的细菌菌株,包括在我们的样本中发现的抗生素耐药性和VF基因。群落内噬菌体捕食者-猎物关系的动态是复杂的,虽然我们的研究首次研究了皮肤中的这些群落动态,但需要进一步的研究来更全面地表征这些关系。

尽管我们注意到皮肤病毒组样本中的大多数可识别噬菌体是温带的,但我们只能预测可识别噬菌体的复制方式。这凸显了对强大的参考数据库和不依赖参考方法的实用性的需求。此外,我们无法检测到ssDNA病毒或包膜病毒。由于我们努力确认样品中细菌基因组DNA的减少,我们相信大多数序列实际上来自游离噬菌体,并为我们可识别的病毒组库提供了有价值的描述。

除了显示皮肤病毒群落内复杂的群落动态外,我们还通过使用共生网络建模和 CRISPR 鉴定技术提供了病毒组与其他微生物群落之间潜在相互作用的证据。我们的网络分析使我们能够推断出一个广泛的多王国生态系统结构。了解这些生态相互作用并通过实验验证它们对于进一步开发噬菌体疗法等靶向疗法至关重要。

CRISPR分析表明,不同位点的持续噬菌体感染程度不同,或者只是常驻细菌中CRISPR阵列的丰度不同。CRISPR不仅靶向在相同皮肤部位发现的噬菌体,还靶向其他皮肤部位的噬菌体,提供了成功击退现在在其他身体部位检测到的噬菌体攻击的记录。这些发现表明了皮肤病毒组在不同解剖位置之间分配的潜在机制,值得进一步研究。虽然我们专注于CRISPR的相互作用机制,但细菌-噬菌体相互作用的其他机制值得在未来的研究中进行研究,例如限制性修饰。

本研究和一般的病毒组研究需要注意的一个局限性是所使用的参考数据库中的偏倚。我们通过宿主细菌鉴定了噬菌体,但感染细菌的已知噬菌体数量在宿主之间差异很大,这些噬菌体内的基因组多样性也各不相同。例如,丙酸杆菌噬菌体表现出有限的基因组多样性 (46),因此,如果存在,则更有可能鉴定出与这些噬菌体之一的序列匹配。分枝杆菌和葡萄球菌噬菌体更加多样化,参考依赖性方法会遗漏与已知序列严重不同的噬菌体

我们试图通过使用参考依赖和参考无关的方法将这些变化对相对丰度和多样性计算的影响降至最低。

噬菌体基因组是高度镶嵌的,当使用从头重叠群组装方法时,不同噬菌体的两个(或多个)基因组片段可能会围绕一个短的共享区域组装,从而导致分类学错误识别。为了尽量减少这种偏差,我们采用了一种基于分类法的投票系统,该分类分配给重叠群内的所有基因,并要求重叠群每 10 kb 至少有一个已识别的基因,以确保存在足够的基因进行正确分类。从头重叠群组装也可能影响对观察到的特定基因共定位的解释(即图 4B 和 C)。抗生素基因可能与其他基因相邻,但由于与嵌合基因组相关的重叠群组装问题而被歪曲。需要更详细的分子分析才能得出有关基因组结构的结论。

与身体其他部位(即胃肠道)相比,皮肤微生物组是一个低生物量群落,必须注意控制试剂中的潜在污染。许多针对低生物量群落的鸟枪法宏基因组研究没有通过测序和分析适当的阴性对照来解决背景污染问题,从而得出错误的结论(47)。以往的病毒组研究曾试图通过合并样本来增加生物量,但这种设计不利于个体间变异性的识别。在本研究中,除了尽量减少文库制备过程中的污染外,还收集并分析了空白背景对照。在计算机净化中,从实验样品中去除了生物,这些生物也存在于背景对照中。我们将成功去除背景污染定义为背景对照和基于Bray-Curtis距离指标的实验样品之间的显着差异。这种方法需要注意的是,它与参考有关,并且不会检测到潜在的未表征污染物。此外,如果背景对照未测序至绝对饱和,则无法检测到一些低丰度污染物。虽然这可能会影响低稳定性污染物,但主要污染物不太可能残留在样品中。

总体而言,这里概述的研究结果为未来的研究奠定了基础:(i)病毒群落的获得,(ii)对抗生素治疗和卫生习惯等扰动的反应,(iii)影响温带与裂解复制周期的因素(即,DNA损伤紫外线辐射或抗生素),以及(iv)对人类健康和疾病的影响。从长远来看,这项工作还可能为基于噬菌体疗法的皮肤病的潜在治疗策略提供信息。

材料与方法

请参阅补充材料中的文本 S1,了解我们方法的详细说明,以及与我们所有实验相关的源代码和中间数据文件。

样品采集。我们根据宾夕法尼亚大学内部审查委员会批准的方案招募了 16 名健康个体(年龄从 23 岁到 53 岁不等)。在获得受试者的知情同意后进行样本采集。排除标准包括入组前 6 个月自我报告的抗生素治疗(口服或全身)、可观察到的皮肤病和严重的合并症,包括 HIV 感染和其他免疫功能低下状态。

样品测序和处理。全宏基因组 DNA 为

使用类似于以下技术从皮肤拭子样本制备

Hannigan等人。

10

®

mbio.asm.org

2015年9月/10月 第6卷 第5期 e01578-15

2024 年 3 月 17 日从 https://journals.asm.org/journal/mbio 下载 101.44.81.117。

先前描述的那些(33,48)。VLP DNA 提取方案是从前面描述的方法优化的 (15)。使用Illumina Nextera XT文库制备试剂盒的优化方案制备DNA进行测序。测序在Illumina MiSeq和HiSeq2500快速化学平台上进行。All community analyses were performed with custom Bash, R, and Perl scripts, building off of established concepts and utilizing existing algorithms and toolkits, including the BLAST (49) toolkit and bowtie2 (50).

进行质量控制以去除测序接头、低质量序列和与人类基因组相似的序列 (51)。还收集了模拟阴性对照样本以控制背景测序信号。我们对这些对照数据进行了后续分析,以确保高质量的序列集。重叠群是使用 Ray de novo 组装程序 (52) 中的高质量序列组装的。

分类和多样性。如前所述,病毒组分类是通过在UniProt参考数据库(53)的基础上注释ORF来分配的,并根据最常见的ORF分类相似性(22)分配重叠群分类法。通过使用PHACCS算法(54)和GAAS程序(55)包括已知和未知病毒来估计α多样性。β 多样性通过使用纯素 R 包 (CRAN) 中的 Bray-Curtis 差异度量来评估 (56),并基于每个重叠群的归一化序列计数(每百万个映射读段每千碱基转录本的读长数)(56)。贝塔多样性信息也被用于人际多样性的计算。使用 MetaPhlAn (25, 26) 和 MEGAN5 (27) 分配全宏基因组分类法。使用纯素 R 包计算全宏基因组多样性。为了进行比较,通过ggplot2 R包(57)中描述的箱形图缺口计算以及McGill等人(58)计算了来自病毒组和整个宏基因组的每个解剖位点的α多样性。

噬菌体复制周期分布的预测。病毒

通过量化温带标记基因的存在来计算复制周期分布,包括来自丝氨酸和酪氨酸家族的整合酶基因、ACLAME 数据库中的噬菌体元件 (34),包括 parABS 分配系统的组分,以及细菌参考基因组元件。将序列映射回温带和裂解重叠群,以评估归一化相对丰度。

功能注释和比较。序列功能是

通过将读取映射到简化的 KEGG 参考数据库 (35) 并使用 HUMAnN 程序对其进行注释 (36) 进行预测。GO富集分析在GOEAST(59)中进行,ORF使用Glimmer3工具包(60)预测,并对UniProt参考数据库进行BLAST搜索。OPF 和 AMG 分析的执行与先前的研究 (9, 37) 类似,并在 QIIME (62) 中使用了 UCLUST (61) 算法。CARD (39) 和 VFDB (63) 与预测的 ORF 一起使用,分别估计抗生素耐药性和毒力的可能性。ARG的可视化是在Geneious程序中进行的(64)。

推断噬菌体和细菌之间的相互作用。推断的交互

如前所述,在 Cytoscape (66) 中使用 CoNet (65) 计算噬菌体和细菌之间的差异 (42)。仅保留了测试的五个指标中的两个指标(Pearson 和 Spearman 相关指标、互信息相似度指标以及 Bray、Curtis 和 Kullback-Leibler 距离指标)支持的交互,以分析潜在的交互作用。通过Simes方法(67)合并多个指标的P值,并进行错误发现率校正(68)。使用 Cytoscape NetworkAnalyzer 插件 (69) 进行网络分析。

CRISPR鉴定和与病毒组的比较。CRISPR焦油-

使用 PilerCR 程序获取针对病毒的细菌宿主,以便在细菌基因组中进行 CRISPR 鉴定 (70)

将 CRISPR 间隔序列定位到来自不同位置的噬菌体重叠群,以评估 Circos 的潜在靶向 (71)。使用 UniProt TrEMBL 数据库和 BLASTx(E 值,10)鉴定间隔物靶向的噬菌体 ORF。

核苷酸序列登录号。确定的序列

在这项研究中,已存放在 NCBI 短读档案 (SRA) 的 BioProject PRJNA266117 和 SRA 登录号 SRP049645。测序的模拟群落已作为样本MG100410存放在 BioProject PRJNA295605 下。材料与方法和中间文件中描述的分析脚本已存档于英国伦敦的 Figshare Digital Science,可在 doi: 10.6084/m9.figshare.1281248 获得。

补充材料

本文的补充材料可在 http://mbio.asm.org/ lookup/suppl/doi:10.1128/mBio.01578-15/-/DCSupplemental 找到。

文本 S1,DOCX 文件,0.2 MB。

图 S1,PDF 文件,1.3 MB。图 S2,PDF 文件,0.2 MB。图 S3,PDF 文件,0.5 MB。图 S4,PDF 文件,0.4 MB。图 S5,PDF 文件,0.3 MB。图 S6,PDF 文件,0.5 MB。图 S7,PDF 文件,0.3 MB。

表 S1,XLSX 文件,0.05 MB。表 S2,XLSX 文件,0.03 MB。

确认

我们感谢志愿者参与这项研究,感谢宾夕法尼亚大学下一代测序核心的测序支持,感谢宾夕法尼亚大学医学学术计算服务公司的计算资源,感谢Brian Kim(华盛顿大学)的讨论,感谢Grice和Bushman实验室的成员做出的基本贡献。

这项工作得到了美国国立卫生研究院(NIH)的资助(AR060873到E.A.G.)。G.D.H. 和 A.J.S. 得到了国防部国防科学与工程研究生奖学金计划的支持,J.S.M. 得到了 NIH 计算基因组学培训资助 T32 HG000046 的支持,而 B.P.H. 得到了 NIH 皮肤病学研究培训资助 T32 AR007465 的支持。我们没有利益冲突需要声明。

G.D.H. 和 E.A.G. 构思并设计了这项研究。A.S.T.从受试者身上收集了皮肤拭子。G.D.H.、J.S.M.、A.J.S. 和 A.S.T. 制备了用于测序的样本。G.D.H.、J.S.M.、B.P.H. 和 Q.Z. 分析了序列数据。S.M.和F.D.B.提供了软件并帮助进行分析。

G.D.H.、J.S.M. 和 E.A.G. 起草了手稿。

引用

1.

Hannigan GD,Grice EA.,2013 年。宏基因组学和分子微生物学时代皮肤的微生物生态学。冷泉Harb Perspect Med 3:a015362。http://dx.doi.org/10.1101/cshperspect.a015362。

2.

Oh J、Byrd AL、Deming C、Conlan S、NCS 计划、Kong HH、Segre JA。2014. 生物地理学和个性塑造人类皮肤宏基因组的功能.自然 514:59 – 64。http://dx.doi.org/10.1038/ nature13786.

3.

Bohannan BJM,Lenski RE。1997. 资源富集对细菌和噬菌体化学恒温器群落的影响.生态学78:2303-2315。

http://dx.doi.org/10.1890/0012-9658(1997)078[2303:EOREOA]2.0.CO;2.

4.

罗德里格斯-布里托 B、李 L、韦格利 L、弗兰 M、安格利 F、布莱巴特 M、布坎南 J、德斯努埃斯 C、丁斯代尔 E、爱德华兹 R、费尔茨 B、海恩斯 M、刘 H、利普森 D、马哈菲 J、马丁-夸德拉多 AB、米拉 A、努尔顿 J、帕西奇 L、雷霍克 S、罗德里格斯-穆勒 J、罗德里格斯-瓦莱拉 F、萨拉蒙 P、斯里纳格什 S、Thingstad TF、特兰 T、瑟伯 RV、威尔纳 D、 Youle M, Rohwer F. 2010.四种水生环境中的病毒和微生物群落动态。ISME J 4:739 –751。http://dx.doi.org/10.1038/ ismej.2010.1.

5.

泰森 GW,班菲尔德 JF。2008. 快速进化的CRISPR与微生物对病毒的获得性抗性有关。环境微生物10:200-207。

6.

奥利弗 KM、德格南 PH、亨特 MS、莫兰 NA。2009. 噬菌体编码共生共生中保护所需的因子。科学 325:992-994。http://dx.doi.org/10.1126/science.1174463。

人体皮肤病毒组的多样性和遗传学

2015年9月/10月 第6卷 第5期 e01578-15

®

mbio.asm.org 11

2024 年 3 月 17 日从 https://journals.asm.org/journal/mbio 下载 101.44.81.117。

7. 泰勒 JS、贝里 K、雷诺兹 JL、阿尔特里 CJ、斯金纳 KG、弗里德曼 JH、伊顿 KA、弗里德曼 DI。2013. 噬菌体诱导增强和

在 EHEC 小鼠模型中需要肾脏疾病和致死性。PLoS 病理学 9:e1003236。http://dx.doi.org/10.1371/journal.ppat.1003236。

8.

布鲁索 H, 坎查亚 C, 哈特 W-.2004. 噬菌体和细菌病原体的进化:从基因组重排到溶原转化。微生物分子生物学修订版 68:560 – 602。http://dx.doi.org/10.1128/ MMBR.68.3.560-602.2004。

9.

赫维茨 BL、布鲁姆 JR、沙利文 MB。2015. “核心”和“柔性”太平洋病毒组的深度分层功能和分类生态位专业化。ISME J 9:472– 484 http://dx.doi.org/10.1038/ ismej.2014.143。

10.

莫迪 SR、李 HH、斯皮纳 CS、柯林斯 JJ. 2013 年。抗生素处理扩大了噬菌体宏基因组的耐药库和生态网络。自然 499:219 –222。http://dx.doi.org/10.1038/nature12212。

11.

Foulongne V, Sauvage V, Hebert C, Dereure O, Cheval J, Gouilh MA, Pariente K, Segondy M, Burguière A, Manuguerra J, Caro V, Eloit M. 2012.人类皮肤微生物群:通过高通量测序在人体皮肤上鉴定出高度多样性的DNA病毒。公共科学图书馆一号7:e38499。

http://dx.doi.org/10.1371/journal.pone.0038499.

12.

Wylie KM, Mihindukulasuriya KA, 周 Y, Sodergren E, Storch GA, Weinstock GM. 2014.健康成人双链DNA病毒的宏基因组分析。BMC 生物学 12:71。http://dx.doi.org/10.1186/ s12915-014-0071-7。

13.

Pedulla ML、福特 ME、Houtz JM、Karthikeyan T、Wadsworth C、Lewis JA、Jacobs-Sera D、Falbo J、Gross J、Pannunzio NR、Brucker W、Kumar V、Kandasamy J、Keenan L、Bardarov S、Kriakov J、Lawrence JG、Jacobs WR, Jr.、Hendrix RW、Hatfull GF。2003. 高度镶嵌分枝杆菌噬菌体基因组的起源.牢房113:171-182。http://dx.doi.org/10.1016/ S0092-8674(03)00233-2.

14.

布莱巴特,M.,2012 年。海洋病毒:真心话大冒险。Annu Rev Mar Sci 4:425-448。http://dx.doi.org/10.1146/annurev-marine-120709-142805。

15.

瑟伯 RV、海恩斯 M、布莱巴特 M、韦格利 L、罗维尔 F. 2009 年。产生病毒宏基因组的实验室程序。Nat Protoc 4:470 – 483。http://dx.doi.org/10.1038/nprot.2009.10。

16.

雷耶斯 A、海恩斯 M、汉森 N、Angly FE、希思 AC、罗维尔 F、戈登 JI。2010. 同卵双胞胎及其母亲粪便微生物群中的病毒.自然 466:334 –338。http://dx.doi.org/10.1038/ nature09199.

17.

迈诺特 S、辛哈 R、陈 J、李 H、Keilbaugh SA、吴 GD、刘易斯 JD、布什曼 FD。2011. 人类肠道病毒组:个体间变异和对饮食的动态反应。基因组研究 21:1616 –1625。http:// dx.doi.org/10.1101/gr.122705.111。

18.

Breitbart M、Haynes M、Kelley S、Angly F、Edwards RA、Felts B、Mahaffy JM、Mueller J、Nulton J、Rayhawk S、Rodriguez-Brito B、Salamon P、Rohwer F. 2008。婴儿肠道中的病毒多样性和动力学。R e s M i c r o b i o l 1 5 9 : 3 6 7 – 3 7 3 .H T T P : / / D X .d o i .o r g / 1 0 .1 0 1 6 / J.resmic.2008.04.006.

19.

Breitbart M、Hewson I、Felts B、Mahaffy JM、Nulton J、Salamon P、Rohwer F. 2003 年。从人类粪便中对未培养的病毒群落进行宏基因组分析。细菌学杂志 185:6220 – 6223。http://dx.doi.org/10.1128/ JB.185.20.6220-6223.2003。

20.

Wommack KE、Bhavsar J、Ravel J. 2008 年。宏基因组学:读取长度很重要。应用环境微生物学 74:1453–1463。http://dx.doi.org/ 10.1128/AEM.02181-07。

21.

Roux S、Krupovic M、Debroas D、Forterre P、Enault F. 2013 年。从病毒宏基因组评估病毒群落功能潜力可能会受到细胞序列污染的阻碍。打开生物学 3:130160。

http://dx.doi.org/10.1098/rsob.130160.

22.

迈诺特 S、布赖森 A、切胡德 C、吴 GD、刘易斯 JD、布什曼 FD。2013. 人类肠道病毒组的快速进化.美国国家科学院院刊 110:12450 –12455。http://dx.doi.org/10.1073/pnas.1300833110。

23.

Oh J、Byrd AL、Deming C、Conlan S、NCS 计划、Kong HH、Segre JA。2014. 生物地理学和个性塑造人类皮肤宏基因组的功能.自然 514:59 – 64。http://dx.doi.org/10.1038/ nature13786.

24.

古铁雷斯 D、阿德里安森斯 EM、马丁内斯 B、罗德里格斯 A、拉维涅 R、克罗宾斯基 AM、加西亚 P. 2014。葡萄球菌噬菌体的三个新噬菌体属:“3alikevirus”、“77likevirus”和“Phietalikevirus”。Arch Virol 159:389 –398。http://dx.doi.org/10.1007/s00705-013-1833-1。

25.

Segata N、Waldron L、Ballarini A、Narasimhan V、Jousson O、Huttenhower C. 2012 年。使用宏基因组微生物群落分析

独特的分支特异性标记基因。Nat 方法 9:811-814。http:// dx.doi.org/10.1038/nmeth.2066。

26.

Segata N、Boernigen D、Tickle TL、Morgan XC、Garrett WS、Huttenhower C. 2013。用于微生物群落研究的计算元组学。分子系统生物学 9:666。http://dx.doi.org/10.1038/msb.2013.22。

27.

Huson DH、Mitra S、Ruscheweyh H-、Weber N、Schuster SC. 2011。使用 MEGAN4 对环境序列进行综合分析。基因组研究 21:1552–1560。http://dx.doi.org/10.1101/gr.120618.111。

28.

人类微生物组项目联盟。2012. 健康人体微生物组的结构、功能和多样性.自然 486:207-214。http:// dx.doi.org/10.1038/nature11234。

29.

芬德利 K、Oh J、杨 J、康兰 S、戴明 C、迈耶 JA、勋菲尔德 D、诺米科斯 E、帕克 M、贝克尔 J、本杰明 B、布莱克斯利 R、布法德 G、布鲁克斯 S、科尔曼 H、德赫蒂亚尔 M、格雷戈里 M、关 X、古普塔 J、汉 J、哈格罗夫 A、何 SL、约翰逊 T、莱加斯皮 R、洛维特 S、马杜罗 Q、马西洛 C、马斯克里 B、 麦克道尔 J、蒙特马约尔 C、穆利金 J、帕克 M、里博 N、钱德勒 K、施密特 B、西森 C、斯坦特里波普 M、托马斯 J、托马斯 P、维穆拉帕利 M、杨 A、孔 HH、塞格雷 JA。2013. 人类皮肤真菌和细菌群落的地形多样性.自然 498:367-370 http://dx.doi.org/10.1038/nature12171。

30.

Grice EA、Kong HH、Conlan S、Deming CB、Davis J、Young AC、NISC 比较测序计划、Bouffard GG、Blakesley RW、Murray PR、Green ED、Turner ML、Segre JA。2009. 人体皮肤微生物组的地形和时间多样性.科学324:1190-1192。http://dx.doi.org/10.1126/science.1171700。

31.

Angly FE、Felts B、Breitbart M、Salamon P、Edwards RA、Carlson C、Chan AM、Haynes M、Kelley S、Liu H、Mahaffy JM、Mueller JE、Nulton J、Olson R、Parsons R、Rayhawk S、Suttle CA、Rohwer F. 2006。四个大洋区域的海洋病毒组。PLoS 生物学 4:e368。http:// dx.doi.org/10.1371/journal.pbio.0040368。

32.

Costello EK、Lauber CL、Hamady M、Fierer N、Gordon JI、Knight R. 2009。人体栖息地中细菌群落在空间和时间上的变异。科学 326:1694 –1697。http://dx.doi.org/10.1126/ 科学.1177486.

33.

Grice EA、Kong HH、Conlan S、Deming CB、Davis J、Young AC、Bouffard GG、Blakesley RW、Murray PR、Green ED、Turner ML、Segre JA。2009. 人体皮肤微生物组的地形和时间多样性.科学 324:1190 –1192。http://dx.doi.org/10.1126/ 科学.1171700。

34.

Leplae R、Hebrant A、Wodak SJ、Toussaint A. 2004 年。ACLAME:移动遗传元件的共轭亚油酸化。核酸研究 32:D45–D49。

http://dx.doi.org/10.1093/nar/gkh084.

35.

Kanehisa M, Goto S. 2000.KEGG:京都基因和基因组百科全书。核酸研究28:27-30。http://dx.doi.org/10.1093/nar/ 28.1.27.

36.

阿布巴克 S、塞加塔 N、戈尔 J、舒伯特 AM、伊扎德 J、坎塔雷尔 BL、罗德里格斯-穆勒 B、扎克 J、蒂亚加拉詹 M、亨利萨特 B、怀特 O、凯利 ST、梅塞 B、施洛斯 PD、格弗斯 D、米特雷瓦 M、赫滕豪威尔 C. 2012。宏基因组数据的代谢重建及其在人类微生物组中的应用。PLoS Comput Biol 8:e1002358。http:// dx.doi.org/10.1371/journal.pcbi.1002358。

37.

Schloss PD, Handelsman J. 2008.宏基因组学的统计工具箱:评估微生物群落的功能多样性。BMC 生物信息学 9:34。http://dx.doi.org/10.1186/1471-2105-9-34。

38.

普莱德 DT、萨尔茨曼 J、海恩斯 M、罗维尔 F、戴维斯-朗 C、怀特 RA III、卢默 P、阿米蒂奇 GC、雷尔曼 DA。2012. 通过分析人类唾液病毒组揭示了强大的常驻噬菌体种群的证据。ISME J 6:915-926。http://dx.doi.org/10.1038/ ismej.2011.169。

39.

McArthur AG、Waglechner N、Nizam F、Yan A、Azad MA、Baylay AJ、Bhullar K、Canova MJ、De Pascale G、Ejim L、Kalan L、King AM、Koteva K、Morar M、Mulvey MR、O'Brien JS、Pawlowski AC、Piddock LJV、Spanogiannopoulos P、Sutherland AD、Tang I、Taylor PL、Thaker M、Wang W、Yan M、Yu T、Wright GD. 2013。全面的抗生素耐药性数据库。抗菌剂 Chemother 57:3348 –3357。http:// dx.doi.org/10.1128/AAC.00419-13。

40.

Brötz E, Kulik A, Vikineswary S, Lim CT, Tan GY, Zinecker H, Imhoff JF, Paululat T, Fiedler HP. 2011.苯霉素 G 和 H,由白棘链霉菌 Acta 3619 生产的新型艾法霉素类抗生素。抗生素杂志 64:257-266。http://dx.doi.org/10.1038/ja.2010.170。

41.

陈玲, 杨军, 俞玲, 姚志, 孙玲, 沈彦, 金秦. 2005.VFDB:细菌毒力因子的参考数据库。核酸研究 33:D325–D328。http://dx.doi.org/10.1093/nar/gki008。

Hannigan等人。

12

®

mbio.asm.org

2015年9月/10月 第6卷 第5期 e01578-15

2024 年 3 月 17 日从 https://journals.asm.org/journal/mbio 下载 101.44.81.117。

42. Soffer N、Zaneveld J、Vega Thurber R. 2015 年。噬菌体-细菌网络分析及其对理解珊瑚病的启示.环境微生物学 17:1203–1218。http://dx.doi.org/10.1111/1462-2920.12553。

43.

Barabasi A, Albert R. 1999.随机网络中缩放的出现。

科学 286:509 –512。http://dx.doi.org/10.1126/science.286.5439.509。

44.

周 J, 邓, 罗飞, 何志, 涂清, 志旭. 2010.功能分子生态网络。医学生物 1:e00169。http://dx.doi.org/10.1128/ mBio.00169-10。

45.

斯蒂尔 JA、Countway PD、夏 L、Vigil PD、Beman JM、Kim DY、Chow CT、Sachdeva R、Jones AC、Schwalbach MS、Rose JM、Hewson I、Patel A、Sun F、Caron DA、Fuhrman JA。2011. 海洋细菌、古细菌和原生生物协会网络揭示了生态联系。ISME J 5:1414 –1425。http://dx.doi.org/10.1038/ismej.2011.24。

46.

马里内利 LJ、菲茨-吉本 S、海耶斯 C、鲍曼 C、英克勒斯 M、隆卡里克 A、罗素 DA、雅各布斯-塞拉 D、科库斯 S、佩莱格里尼 M、金 J、米勒 JF、哈特富尔 GF、莫德林 RL。2012. 痤疮丙酸杆菌噬菌体对细菌皮肤分离株表现出有限的遗传多样性和广泛的杀伤活性。免疫生物 3:e00279 –12。http://dx.doi.org/10.1128/mBio.00279 -12.

47.

Salter SJ、Cox MJ、Turek EM、Calus ST、Cookson WO、Moffatt MF、Turner P、Parkhill J、Loman NJ、Walker AW。2014. 试剂和实验室污染会严重影响基于序列的微生物组分析。BMC 生物学 12:87。http://dx.doi.org/10.1186/s12915-014-0087-z。

48.

Hannigan GD、Hodkinson BP、McGinnis K、Tyldsley AS、Anari JB、Horan AD、Grice EA、Mehta S. 2014。微生物群定植开放性骨折以及与从就诊到早期门诊随访的严重程度、机制、位置和并发症的相关性的培养独立性初步研究。J 骨科研究 32:597-605。http://dx.doi.org/10.1002/ jor.22578。

49.

卡马乔 C, 库鲁里斯 G, 阿瓦吉扬 V, 马 N, 帕帕佐普洛斯 J, 比尔 K, 马登 TL.2009. BLAST: architecture and applications.BMC 生物信息学 10:421。http://dx.doi.org/10.1186/1471-2105-10-421。

50.

Langmead B, Salzberg SL. 2012.使用领结 2 进行快速间隙读取对齐。纳特方法9:357-359。http://dx.doi.org/10.1038/nmeth.1923。

51.

Schmieder R, Edwards R. 2011.快速识别和去除基因组和宏基因组数据集中的序列污染。公共科学图书馆一号 6:e17288。http://dx.doi.org/10.1371/journal.pone.0017288。

52.

Boisvert S、Raymond F、Godzaridis É、Laviolette F、Corbeil J. 2012 年。Ray Meta:可扩展的从头宏基因组组装和分析。基因组生物学 13:R122。http://dx.doi.org/10.1186/gb-2012-13-12-r122。

53.

UniProt C. 2014 年。通用蛋白质资源 (UniProt) 的活动。核酸研究 42:D191–D198。http://dx.doi.org/10.1093/nar/ gkt1140.

54.

Angly F、Rodriguez-Brito B、Bangor D、McNairnie P、Breitbart M、Salamon P、Felts B、Nulton J、Mahaffy J、Rohwer F. 2005。PHACCS,一种使用宏基因组信息估计未培养病毒群落结构和多样性的在线工具。BMC 生物信息学 6:41。

http://dx.doi.org/10.1186/1471-2105-6-41.

55.

Angly FE, Willner D, Prieto-Davó A, Edwards RA, Schmieder R, VegaThurber R, Antonopoulos DA, Barott K, Cottrell MT, Desnues C, Dinsdale EA, Furlan M, Haynes M, Henn MR, 胡 Y, Kirchman DL, McDole T, McPherson JD, Meyer F, Miller RM, Mundt E, Naviaux RK, Rodriguez-Mueller B, Stevens R, Wegley L, Zhang L, Zhu B, Rohwer F. 2009.GAAS宏基因组工具及其对四个主要生物群落中病毒和微生物平均基因组大小的估计。PLOS Comput Biol 5:e1000593。http://dx.doi.org/10.1371/journal.pcbi.1000593。

56.

奥克萨宁 J、布兰切特 FG、金特 R、勒让德 P、敏钦公关、奥哈拉 RB、

辛普森 GL、索利莫斯 P、亨利 M、史蒂文斯 H、瓦格纳 H. 2014 年。素食主义者:社区生态包。R 包版本 2.2-0。http://CRAN.Rproject.org/packagevegan。

57.

威克姆 H. 2009 年。 ggplot2:用于数据分析的优雅图形。斯普林格,纽约,纽约。

58.

麦吉尔 R、Tukey JW、拉森 WA。1978. 箱形图的变化。统计书32:12-16。http://dx.doi.org/10.1080/00031305.1978.10479236。

59.

郑琦, 王旭-.2008. GOEAST:用于基因本体富集分析的基于 Web 的软件工具包。核酸研究 36:W358 –W363。http:// dx.doi.org/10.1093/nar/gkn276。

60.

Delcher AL、Bratke KA、Powers EC、Salzberg SL. 2007。用微光识别细菌基因和内共生体DNA。生物信息学 23:673– 679。http://dx.doi.org/10.1093/bioinformatics/btm009。

61.

埃德加RC。2010. 搜索和聚类速度比 BLAST 快几个数量级。生物信息学 26:2460 –2461。http://dx.doi.org/10.1093/ 生物信息学/btq461。

62.

Caporaso JG、Kuczynski J、Stombaugh J、Bittinger K、Bushman FD、Costello EK、Fierer N、Peña AG、Goodrich JK、Gordon JI、Huttley GA、Kelley ST、Knights D、Koenig JE、Ley RE、Lozupone CA、McDonald D、Muegge BD、Pirrung M、Reeder J、Sevinsky JR、Turnbaugh PJ、Walters WA、Widmann J、Yatsunenko T、Zaneveld J、Knight R. 2010。QIIME可以分析高通量社区测序数据。纳特方法7:335-336。http://dx.doi.org/10.1038/nmeth.f.303。

63.

陈玲, 熊志, 孙玲, 杨军, 金琦. 2012.VFDB 2012 更新:走向细菌毒力因子的遗传多样性和分子进化。核酸研究 40:D641–D645。http://dx.doi.org/10.1093/nar/ gkr989。

64.

Kearse M、Moir R、Wilson A、Stones-Havas S、Cheung M、Sturrock S、Buxton S、Cooper A、Markowitz S、Duran C、Thierer T、Ashton B、Meintjes P、Drummond A. 2012。Geneious basic:一个集成且可扩展的桌面软件平台,用于组织和分析序列数据。生物信息学 28:1647–1649。http://dx.doi.org/10.1093/ 生物信息学/BTS199。

65.

浮士德 K、Sathirapongsasuti JF、伊扎德 J、塞加塔 N、Gevers D、Raes J、Huttenhower C. 2012 年。人类微生物组中的微生物共生关系。PLoS 计算生物学 8:e1002606。http://dx.doi.org/ 10.1371/journal.pcbi.1002606。

66.

Shannon P, Markiel A, Ozier O, Baliga NS, Wang JT, Ramage D, Amin N, Schwikowski B, Ideker T. 2003.Cytoscape:用于生物分子相互作用网络集成模型的软件环境。基因组研究 13:2498 –2504。http://dx.doi.org/10.1101/gr.1239303。

67.

Sarkar SK, Chang C. 1997.具有正相关检验统计量的多假设检验的 Simes 方法。J Am Stat Assoc 92:1601-1608。http://dx.doi.org/10.1080/01621459.1997.10473682。

68.

Benjamini Y, Hochberg Y. 1995 年。控制错误发现率 - 一种实用且强大的多重测试方法。J R Stat Soc 系列 B 方法论 57:289 –300。

69.

Assenov Y, Ramirez F, Schelhorn S-, Lengauer T, Albrecht M. 2008.计算生物网络的拓扑参数。生物信息学 24:282-284。http://dx.doi.org/10.1093/bioinformatics/btm554。

70.

埃德加RC。2007. PILER-CR:快速准确地鉴定CRISPR重复序列。BMC 生物信息学 8:18。http://dx.doi.org/10.1186/1471-2105-8-18。

71.

Krzywinski M、Schein J、Birol I、Connors J、Gascoyne R、Horsman D、Jones SJ、Marra MA。2009. Circos:比较基因组学的信息美学。基因组研究 19:1639 –1645。http://dx.doi.org/10.1101/ gr.092759.109。

人体皮肤病毒组的多样性和遗传学

2015年9月/10月 第6卷 第5期 e01578-15

®

mbio.asm.org 13

2024 年 3 月 17 日从 https://journals.asm.org/journal/mbio 下载 101.44.81.117。

文件名:

-

文件大小:

-

标题:

-

作者:

-

主题:

-

关键词:

-

创建日期:

-

修改日期:

-

创建者:

-

PDF 生成器:

-

PDF 版本:

-

页数:

-

页面大小:

-

快速 Web 视图:

-

正在准备打印文档…
0%