Высокий
ДомДом > Новости > Высокий

Высокий

Jul 07, 2023

Природная биотехнология (2023 г.)Процитировать эту статью

24 тыс. доступов

5 цитат

172 Альтметрика

Подробности о метриках

Чистые бактериальные культуры по-прежнему необходимы для детальных экспериментальных и механистических исследований микробиома, а традиционные методы выделения отдельных бактерий из сложных микробных экосистем являются трудоемкими, трудно масштабируемыми и лишены интеграции фенотип-генотип. Здесь мы описываем высокопроизводительную роботизированную платформу для изоляции штаммов с открытым исходным кодом для быстрого создания изолятов по требованию. Мы разрабатываем подход машинного обучения, который использует морфологию колоний и геномные данные, чтобы максимизировать разнообразие изолированных микробов и обеспечить целенаправленный отбор конкретных родов. Применение этой платформы на образцах фекалий от 20 человек позволяет создать персонализированные биобанки микробиома кишечника, насчитывающие 26 997 изолятов, которые представляют > 80% всех распространенных таксонов. Пространственный анализ более 100 000 визуально захваченных колоний выявляет закономерности совместного роста между семействами Ruminococcaceae, Bacteroidaceae, Coriobacteriaceae и Bifidobacteriaceae, что указывает на важные микробные взаимодействия. Сравнительный анализ 1197 высококачественных геномов из этих биобанков показывает интересную внутри- и межличностную эволюцию штаммов, селекцию и горизонтальный перенос генов. Эта структура культуромики должна расширить возможности новых исследовательских усилий по систематизации сбора и количественного анализа фенотипов на основе изображений с данными геномики высокого разрешения для многих новых исследований микробиома.

Метагеномика дает возможность широко исследовать состав разнообразных микробных экосистем, начиная от почвенных сообществ и заканчивая кишечным микробиомом. Тем не менее, микробы необходимо изолировать и культивировать, чтобы механически проанализировать их функциональные роли в среде обитания и множество происходящих межвидовых процессов. Традиционные методы выращивания, основанные на случайном сборе колоний «грубой силой», утомительны и трудоемки1,2,3,4. Методы выделения на основе серийных разведений с использованием 96- или 384-луночных лунок являются ресурсоемкими и приводят к многократному выделению одних и тех же доминантных штаммов из популяции5. Микрофлюидные системы позволяют выращивать в нанолитровых реакторах, но клональные изоляты трудно извлечь6,7. Учитывая, что типичный микробиом может содержать от сотен до тысяч уникальных видов, демонстрирующих длиннохвостое распределение численности8 (то есть немногие доминируют, а большинство редки), создание полных коллекций штаммов посредством систематической культуромики остается важной и нерешенной задачей.

Микробы можно отличить по разнообразным фенотипам, будь то по их способности расти в определенных средах или по метаболитам, которые они производят9,10,11,12. Селекция, основанная на росте, может улучшить изоляцию редких видов, например, с помощью питательной среды, содержащей различные питательные вещества или антибиотики1,2,13. Спектры масс-спектрометрии можно использовать для различения видов14,15, но этот подход малопроизводителен и требует ручной обработки. Сортировка клеток, активируемая визуализацией, была разработана для выделения эукариотических клеток на основе многомерных изображений, но этот метод требует сложного оборудования и не был реализован для бактерий16. Благодаря недавним достижениям в области искусственного интеллекта (ИИ) и моделей глубокого обучения, обученных различать нюансы в многомерных изображениях и биологических данных17, машинное обучение (МО) комбинированных потоков фенотипических и геномных данных способно преобразовать микробную культуромику следующего поколения.

Здесь мы описываем роботизированную платформу для выделения и генотипирования штаммов под управлением машинного обучения, которая позволяет быстро и с высокой производительностью создавать культивированные биобанки по требованию. Эта система использует интеллектуальный алгоритм на основе изображений для увеличения таксономического разнообразия культуромики по сравнению с методом случайного выбора. Мы продемонстрировали полезность этой системы, создав в анаэробном порядке персонализированные биобанки изолятов для 20 участников-людей, получив в общей сложности 26 997 изолятов с 1197 высококачественными черновыми геномами, охватывающими 394 варианта последовательности 16S ампликона (ASV). Используя парную геномную и морфологическую информацию для каждого изолята, мы обучили модель ML, которая может прогнозировать таксономическую идентичность только на основе морфологии колонии. Применение этой модели МО привело к улучшению целенаправленной изоляции представляющих интерес микробов. Крупномасштабный анализ изображений всех колоний, выращенных на чашках с агаром, выявил интересные видоспецифичные модели роста и межвидовые взаимодействия. Полногеномный анализ из персонализированных биобанков выявил индивидуальные вариации уровня штаммов и признаки горизонтального переноса генов (HGT) в основных типах кишечника. Далее мы разработали веб-базу данных с открытым доступом (http://microbial-culturomics.com/), содержащую доступные для поиска генотипические, морфологические и фенотипические данные всех изолятов, полученных с помощью автоматизированной культуромики, в качестве уникального и расширяющегося общественного ресурса в области микробиома.

20 times higher capacity and faster than manual colony isolation by a person. To ensure that our genomic analysis capacity matches the robotic isolation throughput, we also developed a low-cost, high-throughput sequencing pipeline that leverages liquid handling automation to generate barcoded libraries for 16S rRNA sequencing or whole-genome sequencing (WGS; Methods). The cost per isolate in this pipeline is $0.45 for colony isolation and genomic DNA (gDNA) preparation, $0.46 for 16S rRNA sequencing and $6.37 for WGS at a coverage of >60× on an Illumina HiSeq platform, which is substantially cheaper than commercial services (Supplementary Table 2)./p> 0.1% are shown and the side bar on the left represents their family-level taxonomy. ASVs found in personalized biobanks are shown as black bars in the right heatmap and uncultured ASVs not found in any biobank are highlighted. f, Correlation of average relative abundance in original feces sample and number of isolates in entire collection for ASVs. Highly abundant ASVs that are difficult to culture, that is, with fewer isolates, are highlighted. g, Average relative abundance of top abundant ASVs but with no more than 2 isolates in the entire collection. Color of bars represents family-level taxonomy./p> 0.1%) are found in the biobank. Notably, a substantial fraction of the uncultured gut bacteria belonged to the Ruminococcaceae and Lachnospiraceae families (Fig. 2e and Supplementary Table 6), which has also been previously documented as ‘unculturable’24. For each ASV, we compared the number of isolates generated in our total isolate collection versus their average abundance in the bulk feces (Fig. 2f), which appeared to be positively correlated. Still, we identified a set of abundant yet difficult-to-culture bacteria, including Faecalibacterium ASV-58, Prevatella ASV-470 and ASV-324, Oscillibacter ASV-215 and Clostridium XlVa ASV-287 (Fig. 2g). Interestingly, Faecalibacterium ASV-58, from which we obtained one isolate and performed WGS, matched with >98% genome-wide average nucleotide identity (ANI) to the metagenome-assembled genome (MAG) of Candidatus cibiobacter qucibialis. This strain in our collection was previously reported as the most abundant uncultured species in human gut25 and is highly depleted in inflammatory bowel disease (IBD) patients, as are other Faecalibacterium strains26./p>3% relative abundance on average in the bulk fecal matter, which further expands the collection of culturable gut microbiomes. Together, these results highlight cultured isolates and the remaining missing diversity based on our current media and growth conditions, and offer directions to guide future culturomics efforts focused on these ‘dark matter’ gut microbiome (Supplementary Table 6)./p> Bacteroides > Dorea), reflecting differences in their growth characteristics. On the other hand, colonies of Faecalibacterium are smaller and fainter, in line with our earlier results of their poor culturability. Furthermore, colony morphologies are significantly clustered according to their phylogeny (P = 0.008 by PERMANOVA test in Fig. 3c). For instance, most genera of Clostridia are closer to each other by morphology-based ordination (Fig. 3c). Therefore, colony morphologies may embed a substantial amount of information that could be linked to taxonomic identities./p>2 kb in length (Methods). Consistent with recent reports38,39, we observed that HGT events were strongly linked to the phylogeny of the isolates, that is, most HGT events occurred within the same phyla but were also quite prevalent across different families and between distinct species (Fig. 5c and Supplementary Table 10). Interestingly, we observed that HGTs were predominantly enriched between isolates with the same Gram staining, with Gram-negative species showing more prevalent HGTs than Gram-positive species (P = 0.0005 by Pearson's chi-squared test). This result is consistent with recent finding39 and suggests that different cell wall structures may play an important role in HGTs. Notably, HGTs between Gram-positive and -negative species were also observed in our dataset, inspiring future studies to study the effect of cell wall structures on HGTs and engineer these HGT elements into a microbiome editing tool. Next, to examine whether these HGTs occurred recently, we calculated the mean HGT frequency between all species pairs (Methods). We hypothesized that if HGTs occurred recently between two species, they would be only associated with a small proportion of isolates, resulting in a low frequency between species, while if HGTs occurred earlier and provided growth benefits, they would be enriched and vertically inherited by later generation, resulting in a high frequency. Interestingly, we found most HGT elements were frequently present across isolates (71.5% HGTs with >50% frequency), especially for ones within Bacteroidaceae species (Fig. 5c), suggesting that they occurred in the distant past and were enriched under strong selection within the gut environment./p>80% of all microbiota by abundance present. This isolate collection covers a majority of microbial diversity in the healthy gut and is one of the most extensive personalized isolate biobanks described to date. Using this resource, we demonstrated that quantitative analysis of colony morphologies can predict taxonomy, enhance the isolation of targeted genera and reveal potential interactions between microbes. Systematic analysis of genomic differences between isolates within and across people revealed interesting patterns of population selection, adaptation and HGT./p>100 isolates across all 20 individuals) were subjected to model training and testing. Considering the potential impact of antibiotics perturbation and neighbor colonies, a multilabel random forest model was trained on 70% of isolates, which was randomly sampled using 14 colony morphological features, antibiotics condition and number of nearby colonies, and the performance (precision and recall) of the model was evaluated on the remaining 30% of isolates. The procedure of model training and evaluating was bootstrapped 20 times with different randomization settings to minimize bias, and the background performance of the model was calculated by null model (prediction based on the number of isolates). To perform targeted microbial isolation, a multilabel random forest model was trained on colonies of data-rich genus (>15 isolates from the same individual) from individuals H12, H13 and H14 separately as described above. The same fecal samples were then plated out and the model was applied to the new plates after bacterial growth to screen all colonies on plates and predict colonies of targeted genus-level taxonomy. All colonies of the plates were then isolated on CAMII and subjected to 16S V4 sequencing to identify their taxonomy and evaluate the performance of targeted isolation./p> 20×; N50 > 5,000 bp; completeness > 80%; contamination < 5%) and used for downstream genomic variation and HGT analysis. To identify strain-level genomic variation of gut microbiota isolates within and between individuals, draft assemblies with the highest completeness and N50 of each species were selected as the reference genomes for reads alignment, and processed Illumina reads of isolates were aligned to reference genomes of the same species by Bowtie2 v2.3.4 (ref. 55) in paired-end mode with ‘--very-sensitive’ setting. Resulting reads alignments were then processed by SAMtools v1.9 and BCFtools v1.9 (ref. 56) with ‘--ploidy 1’ setting to call genomic variation (SNPs and Indels). Resulting variations were then subjected to quality filtering to identify ‘reliable’ genotypes (covered by ≥5 reads; with ≥0.9 haploidy) and only SNP variations with more than 90% ‘reliable’ genotypes across all isolates were used for downstream analysis. To construct SNP-based phylogeny, base profiles of isolates at SNP sites were concatenated together and UPGMA tree was then calculated by MEGA v11.0.11 with the default setting./p>95% ANI were considered to be the same species./p>20 and query coverage >50. Secretion systems were also predicted on CDS of HGT elements by EffectiveDB62 with the default setting./p>