304 din oțel inoxidabil sudate tub spiralat/tub zhemical zomponent, potențialul biosintetic al microbiomului marin global

Vă mulțumim că ați vizitat Nature.com.Utilizați o versiune de browser cu suport limitat pentru CSS.Pentru cea mai bună experiență, vă recomandăm să utilizați un browser actualizat (sau să dezactivați Modul de compatibilitate în Internet Explorer).În plus, pentru a asigura suport continuu, arătăm site-ul fără stiluri și JavaScript.
Glisoare care arată trei articole pe diapozitiv.Utilizați butoanele înapoi și următorul pentru a vă deplasa prin diapozitive sau butoanele controlerului de diapozitive de la sfârșit pentru a vă deplasa prin fiecare diapozitiv.

Descriere detaliată a produsului

304 Tub/tub spiralat sudat din oțel inoxidabil
1. Caietul de sarcini: Tub / tub din oțel inoxidabil
2. Tip: sudat sau fără sudură
3. Standard: ASTM A269, ASTM A249
4. Tub bobină din oțel inoxidabil OD: 6 mm până la 25,4 mm
5. Lungime: 600-3500MM sau conform cerințelor clientului.
6. Grosimea peretelui: 0,2 mm până la 2,0 mm.

7. Toleranta: OD: +/-0.01mm;Grosime: +/-0,01%.

8. Dimensiunea găurii interioare a bobinei: 500MM-1500MM (poate fi ajustată în funcție de cerințele clientului)

9. Înălțimea bobinei: 200MM-400MM (poate fi ajustată în funcție de cerințele clientului)

10. Suprafață: strălucitoare sau recoaptă
11. Material: 304, 304L, 316L, 321, 301, 201, 202, 409, 430, 410, aliaj 625, 825, 2205, 2507 etc.
12. Ambalare: pungi țesute în carcasă de lemn, palet din lemn, arbore din lemn sau conform cerințelor clientului
13. Test: componenta chimica, limita de curgere, rezistenta la tractiune, masurarea duritatii
14. Garanție: inspecție terță parte (de exemplu: SGS TV) etc.
15. Aplicație: Decor, mobilier, transport ulei, schimbător de căldură, fabricarea balustradelor, fabricarea hârtiei, automobile, prelucrarea alimentelor, medical etc.

Toată compoziția chimică și proprietățile fizice pentru oțel inoxidabil, după cum urmează:

Material ASTM A269 Compoziție chimică % Max
C Mn P S Si Cr Ni Mo NB Nb Ti
TP304 0,08 2.00 0,045 0,030 1.00 18,0-20,0 8,0-11,0 ^ ^ ^ . ^
TP304L 0,035 2.00 0,045 0,030 1.00 18,0-20,0 8,0-12,0 ^ ^ ^ ^
TP316 0,08 2.00 0,045 0,030 1.00 16,0-18,0 10,0-14,0 2.00-3.00 ^ ^ ^
TP316L 0,035 D 2.00 0,045 0,030 1.00 16,0-18,0 10,0-15,0 2.00-3.00 ^ ^ ^
TP321 0,08 2.00 0,045 0,030 1.00 17.0-19.0 9,0-12,0 ^ ^ ^ 5C -0,70
TP347 0,08 2.00 0,045 0,030 1.00 17.0-19.0 9,0-12,0 10C -1,10 ^

 

Material Tratament termic Temperatura F (C) Min. Duritate
Brinell Rockwell
TP304 Soluţie 1900 (1040) 192HBW/200HV 90HRB
TP304L Soluţie 1900 (1040) 192HBW/200HV 90HRB
TP316 Soluţie 1900(1040) 192HBW/200HV 90HRB
TP316L Soluţie 1900(1040) 192HBW/200HV 90HRB
TP321 Soluţie 1900(1040) F 192HBW/200HV 90HRB
TP347 Soluţie 1900(1040) 192HBW/200HV 90HRB

 

OD, inch Toleranță OD inch (mm) Toleranță WT % Toleranta de lungime inch (mm)
+ -
≤ 1 / 2 ± 0,005 (0,13) ± 15 1/8 (3,2) 0
> 1 / 2 ~ 1 1 / 2 ± 0,005 (0,13) ± 10 1 / 8 (3,2) 0
> 1 1 / 2 ~< 3 1 / 2 ± 0,010 (0,25) ± 10 3 / 16 (4,8) 0
> 3 1 / 2 ~< 5 1 / 2 ± 0,015 (0,38) ± 10 3 / 16 (4,8) 0
> 5 1 / 2 ~< 8 ± 0,030 (0,76) ± 10 3 / 16 (4,8) 0
8~< 12 ± 0,040 (1,01) ± 10 3 / 16 (4,8) 0
12~< 14 ± 0,050 (1,26) ± 10 3 / 16 (4,8) 0

Comunitățile microbiene naturale sunt diverse din punct de vedere filogenetic și metabolic.În plus față de grupurile de organisme nestudiate1, această diversitate deține și un potențial bogat pentru descoperirea de enzime și compuși biochimici semnificativi din punct de vedere ecologic și biotehnologic2,3.Cu toate acestea, studierea acestei diversități pentru a determina căile genomice care sintetizează astfel de compuși și îi leagă de gazdele lor respective rămâne o provocare.Potențialul biosintetic al microorganismelor din oceanul deschis rămâne în mare parte necunoscut din cauza limitărilor în analiza datelor de rezoluție a întregului genom la scară globală.Aici, explorăm diversitatea și diversitatea grupurilor de gene biosintetice din ocean prin integrarea a aproximativ 10.000 de genomi microbieni din celulele cultivate și celulele individuale cu mai mult de 25.000 de genomi noi reconstruiți din peste 1.000 de mostre de apă de mare.Aceste eforturi au identificat aproximativ 40.000 de grupuri de gene biosintetice presupuse, dintre care unele au fost găsite în grupuri filogenetice nebănuite anterior.În aceste populații, am identificat o filiație îmbogățită în clustere de gene biosintetice („Candidatus Eudormicrobiaceae”) care aparținea unui filum bacterian necultivat și includea unele dintre cele mai diverse microorganisme biosintetice din acest mediu.Dintre acestea, am caracterizat căile fosfatază-peptidă și pitonamide, identificând cazuri de structură neobișnuită a compusului bioactiv și, respectiv, enzimologie.În concluzie, acest studiu demonstrează modul în care strategiile bazate pe microbiom pot permite explorarea enzimelor și alimentelor naturale nedescrise anterior într-o microbiotă și mediu prost înțeles.
Microbii conduc ciclurile biogeochimice globale, mențin rețele trofice și mențin plantele și animalele sănătoase5.Diversitatea lor filogenetică, metabolică și funcțională enormă reprezintă un potențial bogat pentru descoperirea de noi taxoni1, enzime și compuși biochimici, inclusiv produse naturale6.În comunitățile ecologice, aceste molecule oferă microorganismelor o varietate de funcții fiziologice și ecologice, de la comunicare la competiție 2, 7 .Pe lângă funcțiile lor originale, aceste produse naturale și căile lor de producție codificate genetic oferă exemple pentru aplicații biotehnologice și terapeutice2,3.Identificarea unor astfel de căi și conexiuni a fost mult facilitată de studiul microbilor cultivați.Cu toate acestea, studiile taxonomice ale mediilor naturale au arătat că marea majoritate a microorganismelor nu au fost cultivate8.Această părtinire culturală limitează capacitatea noastră de a exploata diversitatea funcțională codificată de mulți microbi4,9.
Pentru a depăși aceste limitări, progresele tehnologice din ultimul deceniu au permis cercetătorilor să secvențeze direct (adică, fără cultură prealabilă) fragmente de ADN microbian din comunități întregi (metagenomică) sau celule individuale.Capacitatea de a asambla aceste fragmente în fragmente de genom mai mari și de a reconstrui mai mulți genomi asamblați metagenomic (MAGs) sau, respectiv, genomi unici amplificați (SAG), deschide o oportunitate importantă pentru studii taxocentrice ale microbiomului (adică comunitățile microbiene și microbiomul).deschide noi drumuri.material genetic propriu într-un mediu dat) 10,11,12.Într-adevăr, studiile recente au extins foarte mult reprezentarea filogenetică a diversității microbiene pe Pământ1, 13 și au dezvăluit o mare parte din diversitatea funcțională în comunitățile microbiene individuale care nu erau acoperite anterior de secvențele genomului de referință (REF) ale microorganismelor cultivate14.Capacitatea de a plasa diversitatea funcțională nedescoperită în contextul genomului gazdă (adică rezoluția genomului) este critică pentru prezicerea liniilor microbiene încă necaracterizate care probabil codifică noi produse naturale15,16 sau pentru urmărirea acestor compuși înapoi la producătorul lor original17.De exemplu, o abordare combinată a analizei metagenomice și genomice unicelulare a condus la identificarea Candidatus Entotheonella, un grup de bacterii asociate bureților bogate din punct de vedere metabolic, ca producători ai unei varietăți de potențiale medicamentoase18.Cu toate acestea, în ciuda încercărilor recente de explorare genomică a diverselor comunități microbiene16,19, mai mult de două treimi din datele metagenomice globale pentru cel mai mare ocean de ecosisteme de pe Pământ16,20 încă lipsesc.Astfel, în general, potențialul de biosinteză al microbiomului marin și potențialul său ca depozit de noi produse enzimatice și naturale rămân în mare măsură puțin studiate.
Pentru a explora potențialul de biosinteză al microbiomilor marini la scară globală, am reunit mai întâi genomurile microbiene marine obținute folosind metode dependente de cultură și non-cultură pentru a crea o bază de date extinsă de filogenetică și funcția genelor.Examinarea acestei baze de date a relevat o mare varietate de clustere de gene biosintetice (BGC), dintre care majoritatea aparțin unor familii de clustere de gene (GCF) încă necaracterizate.În plus, am identificat o familie bacteriană necunoscută care prezintă cea mai mare diversitate cunoscută de BGC în oceanul deschis până în prezent.Am selectat două căi de sinteză ribozomală și peptide modificate post-translațional (RiPP) pentru validarea experimentală pe baza diferențelor lor genetice față de căile cunoscute în prezent.Caracterizarea funcțională a acestor căi a scos la iveală exemple neașteptate de enzimologie, precum și compuși neobișnuiți din punct de vedere structural cu activitate inhibitoare a proteazei.
La început, am urmărit să creăm o resursă globală de date pentru analiza genomului, concentrându-ne pe componentele sale bacteriene și arheale.În acest scop, am reunit date metagenomice și 1038 de probe de apă de mare din 215 locuri de prelevare distribuite la nivel global (interval de latitudine = 141,6 °) și mai multe straturi adânci (de la 1 la 5600 m adâncime, acoperind zonele pelagice, mezopelagice și abisale).Context21,22,23 (Fig. 1a, date extinse, Fig. 1a și Tabelul suplimentar 1).Pe lângă faptul că oferă o acoperire geografică largă, aceste probe filtrate selectiv ne-au permis să comparăm diferite componente ale microbiomului marin, inclusiv bogat în virus (<0,2 µm), bogat în procariote (0,2–3 µm), bogat în particule (0,8 µm). ).–20 µm) și colonii epuizate de virus (>0,2 µm).
a, Un total de 1038 de genomi disponibile public (metagenomică) ale comunităților microbiene marine colectate din 215 locații distribuite la nivel global (62°S până la 79°N și 179°V până la 179°E).Dale de hartă © Esri.Surse: GEBCO, NOAA, CHS, OSU, UNH, CSUMB, National Geographic, DeLorme, NAVTEQ și Esri.b, aceste metagenome au fost folosite pentru a reconstrui MAG-uri (metode și informații suplimentare), care diferă în cantitate și calitate (metode) în seturile de date (marcate în culoare).MAG-urile reconstruite au fost suplimentate cu genomi (externi) disponibile public, inclusiv MAG26, SAG27 și REF realizate manual.27 Compilați OMD.c, în comparație cu rapoartele anterioare bazate doar pe SAG (GORG)20 sau MAG (GEM)16, OMD îmbunătățește caracterizarea genomică a comunităților microbiene marine (rata de cartografiere a citirii metagenomice; metoda) de două până la trei ori cu o reprezentare mai consistentă în profunzime și latitudine..<0,2, n=151, 0,2-0,8, n=67, 0,2-3, n=180, 0,8-20, n=30, >0,2, n=610, <30°, n = 132, 30–60° , n = 73, >60°, n = 42, EPI, n = 174, MES, n = 45, BAT, n = 28. d, gruparea OMD în grupuri de specii (identitatea medie de nucleotide de 95%) identifică un total de aproximativ 8300 de specii, dintre care mai mult de jumătate nu au fost caracterizate anterior conform adnotărilor taxonomice folosind GTDB (versiunea 89) e, clasificarea speciilor după tipul de genom a arătat că MAG, SAG și REF se completează bine în reflectarea diversității filogenetice a microbiomul marin.În special, 55%, 26% și 11% dintre specii au fost specifice pentru MAG, SAG și respectiv REF.BATS, Bermuda Atlantic Time Series;GEM, genomul microbiomului Pământului;GORG, genomul de referință global al oceanului;Seria temporală HOT, Hawaiian Ocean.
Folosind acest set de date, am reconstruit un total de 26.293 de MAG, majoritatea bacteriene și arheale (Fig. 1b și date extinse, Fig. 1b).Am creat aceste MAG-uri din ansambluri din probe metagenomice separate, mai degrabă decât grupate, pentru a preveni prăbușirea variației secvenței naturale între probe din diferite locații sau puncte de timp (metode).În plus, am grupat fragmentele genomice pe baza corelațiilor lor de prevalență într-un număr mare de eșantioane (de la 58 la 610 de eșantioane, în funcție de anchetă; metodă).Am constatat că acesta este un pas consumator de timp, dar important24, care a fost omis în mai multe lucrări de reconstrucție MAG16, 19, 25 la scară largă și îmbunătățește semnificativ cantitatea (de 2,7 ori în medie) și calitatea (+20% în medie) genomului.reconstruit din metagenomul marin studiat aici (date extinse, Fig. 2a și informații suplimentare).În general, aceste eforturi au dus la o creștere de 4,5 ori a MAG-urilor microbiene marine (de 6 ori dacă sunt luate în considerare doar MAG-uri de înaltă calitate) în comparație cu cea mai cuprinzătoare resursă MAG disponibilă astăzi16 (Metode).Acest set MAG nou creat a fost apoi combinat cu 830 MAG26 alese manual, 5969 SAG27 și 1707 REF.Douăzeci și șapte de specii de bacterii marine și arhee au alcătuit o colecție combinatorie de 34.799 de genomi (Fig. 1b).
Apoi am evaluat resursa nou creată pentru a-și îmbunătăți capacitatea de a reprezenta comunitățile microbiene marine și pentru a evalua impactul integrării diferitelor tipuri de genom.În medie, am constatat că acoperă aproximativ 40-60% din datele metagenomice marine (Figura 1c), de două până la trei ori acoperirea rapoartelor anterioare doar MAG atât la adâncime, cât și la latitudine. Mai multe seriale 16 sau SAG20.În plus, pentru a măsura în mod sistematic diversitatea taxonomică în colecțiile stabilite, am adnotat toate genomurile utilizând setul de instrumente (metode) Genome Taxonomy Database (GTDB) și am folosit o identitate medie a nucleotidelor la nivelul genomului de 95%.28 pentru a identifica 8.304 grupuri de specii (specii).Două treimi dintre aceste specii (inclusiv noile clade) nu au apărut anterior în GTDB, dintre care 2790 au fost descoperite folosind MAG reconstruit în acest studiu (Fig. 1d).În plus, am constatat că diferitele tipuri de genomi sunt extrem de complementare: 55%, 26% și 11% dintre specii sunt compuse în întregime din MAG, SAG și, respectiv, REF (Fig. 1e).În plus, MAG a acoperit toate cele 49 de tipuri găsite în coloana de apă, în timp ce SAG și REF au reprezentat doar 18, respectiv 11 dintre ele.Cu toate acestea, SAG reprezintă mai bine diversitatea celor mai comune clade (date extinse, Fig. 3a), cum ar fi Pelagic Bacteriales (SAR11), cu SAG acoperind aproape 1300 de specii și MAG doar 390 de specii.În mod remarcabil, REF-urile s-au suprapus rareori cu MAG-uri sau SAG-uri la nivel de specie și au reprezentat > 95% din cei aproximativ 1000 de genomi care nu se găsesc în seturile metagenomice de ocean deschis studiate aici, în principal datorită interacțiunilor cu alte tipuri de specimene marine reprezentative izolate (de exemplu, sedimente) .sau gazdă-asociat).Pentru a o face pe scară largă comunității științifice, această resursă a genomului marin, care include și fragmente neclasificate (de exemplu, din fagi prezise, ​​insule genomice și fragmente de genom pentru care nu există date suficiente pentru reconstrucția MAG), poate fi comparată cu datele taxonomice. .Accesați adnotări împreună cu funcția genei și parametrii contextuali în Baza de date de microbiologie oceanică (OMD; https://microbiomics.io/ocean/).
Apoi, ne-am propus să explorăm bogăția și noutatea potențialului biosintetic în microbiomii oceanului deschis.În acest scop, am folosit mai întâi antiSMASH pentru toate MAG-urile, SAG-urile și REF-urile găsite în 1038 de metagenomuri (metode) marine pentru a prezice un total de 39.055 BGC.Apoi le-am grupat în 6907 GCF-uri neredundante și 151 populații de grup de gene (GCC; Tabelul suplimentar 2 și metode) pentru a ține cont de redundanța inerentă (adică același BGC poate fi codificat în mai multe genomi) și de date metagenomice Fragmentarea BGC-urilor concentrate.BGC incomplete nu au crescut semnificativ, dacă au existat (Informații suplimentare), numărul de GCF și, respectiv, GCC, care conțin cel puțin un membru BGC intact în 44% și 86% din cazuri.
La nivelul GCC, am găsit o mare varietate de RiPP-uri prezise și alte produse naturale (Fig. 2a).Printre acestea, de exemplu, arilpolienele, carotenoidele, ectoinele și sideroforele aparțin GCC-urilor cu o distribuție filogenetică largă și o abundență mare în metagenoame oceanice, ceea ce poate indica o adaptare largă a microorganismelor la mediul marin, inclusiv rezistența la speciile reactive de oxigen, stres oxidativ și osmotic..sau absorbția fierului (mai multe informații).Această diversitate funcțională contrastează cu o analiză recentă a aproximativ 1,2 milioane de BGC dintre aproximativ 190.000 de genomi stocați în baza de date NCBI RefSeq (BiG-FAM/RefSeq, denumită în continuare RefSeq)29, care a arătat că peptidele sintetază nonribozomale (NRPS) și poliketid sintaza (PKS) BGC (Informații suplimentare).De asemenea, am găsit 44 (29%) GCC-uri doar în relație cu orice RefSeq BGC (\(\bar{d}\)RefSeq > 0,4; Fig. 2a și metode) și 53 (35%) GCC-uri numai în MAG, evidențiind potențialul pentru a detecta substanțe chimice nedescrise anterior în OMD.Având în vedere că fiecare dintre aceste GCC-uri reprezintă probabil funcții biosintetice foarte diverse, am analizat în continuare datele la nivel GCF într-un efort de a oferi o grupare mai detaliată a BGC-urilor estimate să codifice pentru produse naturale similare29.Un total de 3861 (56%) GCF identificate nu s-au suprapus cu RefSeq și > 97% dintre GCF nu au fost prezente în MIBiG, una dintre cele mai mari baze de date de BGC validate experimental (Figura 2b).Deși nu este surprinzător să descoperim multe căi noi potențiale în setări care nu sunt bine reprezentate de genomul de referință, metoda noastră de dereplicare a BGC-urilor în GCF înainte de comparare diferă de rapoartele anterioare 16 și ne permite să oferim o evaluare imparțială a noutății.Cea mai mare parte din noua diversitate (3012 GCF sau 78%) corespunde terpenelor prezise, ​​RiPP sau altor produse naturale, iar cea mai mare parte (1815 GCF sau 47%) este codificată în tipuri necunoscute datorită potențialului lor biosintetic.Spre deosebire de clusterele PKS și NRPS, aceste BGC compacte sunt mai puțin probabil să fie fragmentate în timpul ansamblării metagenomice 31 și să permită caracterizarea funcțională a produselor lor, care necesită mai mult timp și resurse.
Un total de 39.055 BGC-uri au fost grupate în 6.907 GCF-uri și 151 GCC-uri.a, reprezentarea datelor (internă externă).Gruparea ierarhică a distanțelor BGC pe baza GCC, dintre care 53 sunt fixate numai de MAG.GCC conține BGC-uri de la diferiți taxoni (frecvența porții transformate în ln) și diferite clase BGC (dimensiunea cercului corespunde frecvenței sale).Pentru fiecare GCC, stratul exterior reprezintă numărul de BGC, prevalența (procentul de eșantioane) și distanța (distanța minimă cosinus BGC (min(dMIBiG))) de la BiG-FAM la BGC.GCC-urile cu BGC strâns legate de BGC verificate experimental (MIBiG) sunt evidențiate cu săgeți.b Comparând GCF cu BGC-uri prezise (BiG-FAM) și validate experimental (MIBiG), au fost găsite 3861 GCF-uri noi (d–>0,2).Majoritatea (78%) dintre acestea codifică RiPP, terpene și alte produse naturale presupuse.c, toate genomurile din OMD găsite în 1038 metagenomuri marine au fost plasate în arborele de bază GTDB pentru a arăta acoperirea filogenetică a OMD.Cladele fără genom din OMD sunt afișate cu gri.Numărul de BGC corespunde celui mai mare număr de BGC prezise per genom într-o clă dată.Pentru claritate, ultimele 15% dintre noduri sunt prăbușite.Săgețile indică clade bogate în BGC (>15 BGC), cu excepția Mycobacterium, Gordonia (a doua numai după Rhodococcus) și Crocosphaera (a doua numai după Synechococcus).d, necunoscut c.Eremiobacterota a prezentat cea mai mare diversitate biosintetică (indicele Shannon bazat pe tipul de produs natural).Fiecare bandă reprezintă genomul cu cele mai multe BGC din specie.T1PKS, PKS tip I, T2/3PKS, PKS tip II și tip III.
Pe lângă bogăție și noutate, explorăm structura biogeografică a potențialului biosintetic al microbiomului marin.Gruparea probelor în funcție de distribuția medie a numărului de copii metagenomice GCF (Metode) a arătat că comunitățile de latitudine joasă, de suprafață, bogate în procariote și sărace în viruși, mai ales din ape de suprafață sau mai adânci luminate de soare, erau bogate în terpene RiPP și BGC.În schimb, comunitățile polare, de adâncime, bogate în virusuri și particule au fost asociate cu abundențe mai mari de NRPS și PKS BGC (date extinse, Fig. 4 și informații suplimentare).În cele din urmă, am descoperit că comunitățile tropicale și pelagice bine studiate sunt cele mai promițătoare surse de noi terpene (Figura de date mărite).Cel mai mare potențial pentru PKS, RiPP și alte produse naturale (Figura 5a cu date extinse).
Pentru a completa studiul nostru asupra potențialului de biosinteză al microbiomilor marini, ne-am propus să mapam distribuția filogenetică a acestora și să identificăm noi clade îmbogățite cu BGC.În acest scop, am plasat genomul microbilor marini într-un arbore filogenetic bacterian și arheal normalizat GTDB13 și am suprapus căile biosintetice presupuse pe care le codifică (Fig. 2c).Am detectat cu ușurință mai multe clade îmbogățite cu BGC (reprezentate de peste 15 BGC) în probe de apă de mare (metode) cunoscute pentru potențialul lor de biosinteză, cum ar fi cianobacteriile (Synechococcus) și bacteriile Proteus, cum ar fi Tistrella32,33, sau recent au atras atenția pentru lor. produse naturale.precum Myxococcota (Sandaracinaceae), Rhodococcus și Planctomycetota34,35,36.Interesant, am găsit mai multe linii neexplorate anterior în aceste clade.De exemplu, acele specii cu cel mai bogat potențial de biosinteză din fila Planctomycetota și Myxococcota aparțineau unor ordine și, respectiv, genurilor candidate necaracterizate (Tabelul suplimentar 3).Luat împreună, acest lucru sugerează că OMD oferă acces la informații filogenetice necunoscute anterior, inclusiv microorganisme, care pot reprezenta noi ținte pentru descoperirea de enzime și produse naturale.
Apoi, am caracterizat clada îmbogățită cu BGC nu numai prin numărarea numărului maxim de BGC codificate de membrii săi, ci și prin evaluarea diversității acestor BGC, ceea ce explică frecvența diferitelor tipuri de produse naturale candidate (Fig. 2c și metode). )..Am descoperit că cele mai diverse specii biosintetice au fost reprezentate de MAG-uri bacteriene special concepute în acest studiu.Aceste bacterii aparțin filumului necultivat Candidatus Eremiobacterota, care rămâne în mare parte neexplorat în afară de câteva studii genomice37,38.Este de remarcat faptul că „ca.Genul Eremiobacterota a fost analizat doar într-un mediu terestru39 și nu se știe că include membri îmbogățiți în BGC.Aici am reconstituit opt ​​MAG-uri ale aceleiași specii (identitate nucleotidică > 99%) 23. Propunem așadar denumirea de specie „Candidatus Eudoremicrobium malaspinii”, denumită după nereida (nimfa de mare), un dar frumos în mitologia și expedițiile grecești.— Ka.Conform adnotării filogenetice 13, E. malaspinii nu are rude cunoscute anterior sub nivelul secvenței și aparține astfel unei noi familii bacteriene pe care o propunem „Ca.E. malaspinii” ca specie tip și „Ca.Eudormicrobiaceae” ca denumire oficială (Informații suplimentare).Scurtă reconstrucție metagenomică a lui 'Ca.Proiectul genomului E. malaspinii a fost validat prin intrare foarte scăzută, secvențiere metagenomică citită lung și asamblarea țintită a unei singure probe (Metode) ca un singur cromozom liniar de 9,63 Mb cu o duplicare de 75 kb.ca singura ambiguitate ramasa.
Pentru a stabili contextul filogenetic al acestei specii, am căutat 40 de specii strâns înrudite în probe metagenomice suplimentare îmbogățite cu eucariote din expediția Tara Ocean prin reconstrucția țintită a genomului.Pe scurt, am legat citirile metagenomice de fragmente genomice asociate cu „Ca.E. malaspinii” și a emis ipoteza că o rată de recrutare crescută în acest eșantion indică prezența altor rude (metode).Ca rezultat, am găsit 10 MAG, o combinație de 19 MAG reprezentând cinci specii din trei genuri într-o familie nou definită (adică „Ca. Eudormicrobiaceae”).După inspecția manuală și controlul calității (date extinse, Fig. 6 și informații suplimentare), am constatat că „Ca.Speciile Eudormicrobiaceae prezintă genomi mai mari (8 Mb) și un potențial biosintetic mai bogat (14 până la 22 BGC per specie) decât alți membri „Ca”.Clade Eremiobacterota (până la 7 BGC) (Fig. 3a–c).
a, Pozițiile filogenetice ale celor cinci 'Ca.Speciile de Eudormicrobiaceae au arătat bogăția BGC specifică liniilor marine identificate în acest studiu.Arborele filogenetic include toate 'Ca.MAG Eremiobacterota și membrii altor phyla (numerele genomului între paranteze) furnizați în GTDB (versiunea 89) au fost utilizați pentru contextul evolutiv (Metode).Straturile cele mai exterioare reprezintă clasificări la nivel de familie („Ca. Eudormicrobiaceae” și „Ca. Xenobiaceae”) și la nivel de clasă („Ca. Eremiobacteria”).Cele cinci specii descrise în acest studiu sunt reprezentate de coduri alfanumerice și denumiri binom propuse (Informații suplimentare).b, ok.Speciile Eudormicrobiaceae au șapte nuclee BGC comune.Absența BGC în clada A2 s-a datorat incompletității MAG reprezentativ (Tabelul suplimentar 3).BGC-urile sunt specifice „Ca.Amphitomicrobium” și „Ca.Amphitomicrobium” (cladele A și B) nu sunt prezentate.c, Toate BGC-urile codificate ca „Ca.S-a descoperit că Eudoremicrobium taraoceanii este exprimat în 623 de metatranscriptomi prelevați din oceanele din Tara.Cercurile solide indică transcrierea activă.Cercurile portocalii denotă modificări de ori transformate în log2 sub și deasupra ratei de expresie a genei de întreținere (metode).d, curbele de abundență relativă (metode) care arată „Ca.Speciile de Eudormicrobiaceae sunt răspândite în majoritatea bazinelor oceanice și în întreaga coloană de apă (de la suprafață până la o adâncime de cel puțin 4000 m).Pe baza acestor estimări, am constatat că 'Ca.E. malaspinii reprezintă până la 6% din celulele procariote din comunitățile asociate cerealelor pelagice de adâncime.Am considerat că o specie este prezentă la un sit dacă a fost găsită în orice fracțiune din dimensiunea unui strat de adâncime dat.IO – Oceanul Indian, NAO – Atlanticul de Nord, NPO – Pacificul de Nord, RS – Marea Roșie, SAO – Atlanticul de Sud, SO – Oceanul de Sud, SPO – Pacificul de Sud.
Studierea abundenței și distribuției Ca.Eudormicrobiaceae, care, după cum am constatat, predomină în majoritatea bazinelor oceanice, precum și în întreaga coloană de apă (Fig. 3d).La nivel local, ele reprezintă 6% din comunitatea microbiană marine, făcându-le o parte importantă a microbiomului marin global.În plus, am găsit conținutul relativ de Ca.Speciile Eudormicrobiaceae și nivelurile lor de expresie BGC au fost cele mai ridicate în fracția îmbogățită eucariotă (Fig. 3c și date extinse, Fig. 7), indicând o posibilă interacțiune cu particulele, inclusiv planctonul.Această observație are o oarecare asemănare cu 'Ca.BGC-urile Eudoremicrobium care produc produse naturale citotoxice prin căi cunoscute pot prezenta un comportament prădător (Informații suplimentare și date extinse, Figura 8), similar cu alți prădători care produc în mod specific metaboliți, cum ar fi Myxococcus41.Descoperirea lui Ca.Eudormicrobiaceae în probe mai puțin disponibile (ocean adânc) sau eucariote, mai degrabă decât procariote, pot explica de ce aceste bacterii și diversitatea lor neașteptată BGC rămân neclare în contextul cercetării alimentelor naturale.
În cele din urmă, am căutat să validăm experimental promisiunea muncii noastre bazate pe microbiom în descoperirea de noi căi, enzime și produse naturale.Printre diferitele clase de BGC, se știe că calea RiPP codifică o diversitate chimică și funcțională bogată datorită diferitelor modificări post-translaționale ale peptidei de bază de către enzimele mature42.Așa că am ales două 'Ca.BGC-urile RiPP Eudoremicrobium (Figurile 3b și 4a-e) se bazează pe același lucru ca orice BGC cunoscut (\(\bar{d}\)MIBiG și \(\bar{d}\)RefSeq peste 0,2) .
a–c, Expresia heterologă in vitro și teste enzimatice in vitro ale unui nou grup (\(\bar{d}\)RefSeq = 0,29) de biosinteză RiPP specifică speciilor de Ca de adâncime.E. malaspinii' a dus la producerea de produse difosforilate.c, modificări identificate folosind MS/MS de înaltă rezoluție (HR) (fragmentarea indicată de ionii b și y în structura chimică) și RMN (date extinse, Fig. 9).d, această peptidă fosforilată prezintă o inhibare micromolară scăzută a elastazei neutrofile de mamifere, care nu se găsește în peptida martor și în peptida de deshidratare (deshidratare indusă de îndepărtarea chimică).Experimentul a fost repetat de trei ori cu rezultate similare.De exemplu, expresia heterologă a unui al doilea nou grup \(\bar{d}\)RefSeq = 0,33) de biosinteză de proteine ​​elucidează funcția a patru enzime mature care modifică peptida de bază de 46 de aminoacizi.Reziduurile sunt colorate în funcție de locul de modificare prezis de HR-MS/MS, etichetarea izotopilor și analiza RMN (informații suplimentare).Colorarea punctată indică faptul că modificarea are loc la oricare dintre cele două reziduuri.Figura este o compilație de numeroase constructe heterologe pentru a arăta activitatea tuturor enzimelor mature pe același nucleu.h, Ilustrarea datelor RMN pentru N-metilarea amidei de bază.Rezultatele complete sunt prezentate în fig.10 cu date extinse.i, Poziția filogenetică a enzimei maturi ale grupului de proteine ​​FkbM printre toate domeniile FkbM găsite în baza de date MIBiG 2.0 dezvăluie o enzimă din această familie cu activitate N-metiltransferază (informații suplimentare).Sunt prezentate diagramele schematice ale BGC (a, e), structurile peptidice precursoare (b, f) și structurile chimice presupuse ale produselor naturale (c, g).
Prima cale RiPP (\(\bar{d}\)MIBiG = 0,41, \(\bar{d}\)RefSeq = 0,29) a fost găsită numai la speciile de adâncime „Ca.E. malaspinii” și codifică pentru Peptide- precursor (Fig. 4a, b).În această enzimă matură, am identificat un singur domeniu funcțional omolog domeniului de deshidratare al lantipeptidei sintetazei care catalizează în mod normal fosforilarea și îndepărtarea ulterioară a 43 (Informații suplimentare).Prin urmare, prezicem că modificarea peptidei precursoare implică o astfel de deshidratare în două etape.Cu toate acestea, folosind spectrometria de masă în tandem (MS/MS) și spectroscopia de rezonanță magnetică nucleară (RMN), am identificat o peptidă liniară polifosforilată (Fig. 4c).Deși neașteptat, am găsit câteva linii de dovezi care susțin că este produsul final: două gazde heterologe diferite și nicio deshidratare în testele in vitro, identificarea reziduurilor cheie mutate în locul de deshidratare catalitică al enzimei mature.toate reconstruite de „Ca”.Genomul E. malaspinii (date extinse, Fig. 9 și informații suplimentare) și, în final, activitatea biologică a produsului fosforilat, dar nu forma deshidratată sintetizată chimic (Fig. 4d).De fapt, am constatat că prezintă o activitate inhibitorie scăzută a proteazei micromolare împotriva elastazei neutrofile, comparabilă cu alte produse naturale înrudite în intervalul de concentrație (IC50 = 14,3 μM) 44 , în ciuda faptului că rolul ecologic rămâne de elucidat.Pe baza acestor rezultate, ne propunem să denumim calea „fosseptină”.
Al doilea caz este o cale complexă RiPP specifică lui 'Ca.S-a prezis că genul Eudoremicrobium (\(\bar{d}\)MIBiG = 0,46, \(\bar{d}\)RefSeq = 0,33) codifică produse proteice naturale (Fig. 4e).Aceste căi prezintă un interes biotehnologic deosebit din cauza densității așteptate și a varietății de modificări chimice neobișnuite stabilite de enzimele codificate de BGC-urile relativ scurte45.Am descoperit că această proteină diferă de proteinele caracterizate anterior prin faptul că îi lipsește atât motivul principal NX5N al policeramidelor, cât și bucla de lantionină a lantonamidelor 46 .Pentru a depăși limitările modelelor de expresie heterologe comune, le-am folosit împreună cu un sistem personalizat de aerodenitrificans Microvirgula pentru a caracteriza patru enzime mature ale căii (metode).Folosind o combinație de MS/MS, etichetare izotopică și RMN, am detectat aceste enzime mature în miezul de 46 de aminoacizi al peptidei (Fig. 4f, g, date extinse, Figurile 10-12 și informații suplimentare).Printre enzimele mature, am caracterizat prima apariție a unui membru al familiei FkbM O-metiltransferazei 47 în calea RiPP și am descoperit în mod neașteptat că această enzimă matură introduce N-metilarea coloanei vertebrale (Fig. 4h, i și informații suplimentare).Deși această modificare este cunoscută în produsele naturale NRP48, N-metilarea enzimatică a legăturilor amidice este o reacție complexă, dar semnificativă din punct de vedere biotehnologic49, care a fost până acum de interes pentru familia RiPP de borozine.Specificitatea 50,51.Identificarea acestei activități în alte familii de enzime și RiPP poate deschide noi aplicații și poate extinde diversitatea funcțională a proteinelor 52 și diversitatea lor chimică.Pe baza modificărilor identificate și a lungimii neobișnuite a structurii produsului propus, propunem un nume de cale „pythonamid”.
Descoperirea unei enzimologii neașteptate într-o familie de enzime caracterizată funcțional ilustrează promisiunea genomicii mediului pentru noi descoperiri și, de asemenea, ilustrează capacitatea limitată de inferență funcțională bazată numai pe omologia secvenței.Astfel, împreună cu rapoartele de RiPP-uri polifosforilate bioactive non-canonice, rezultatele noastre demonstrează o valoare intensivă în resurse, dar critică pentru eforturile biologiei sintetice de a descoperi pe deplin bogăția funcțională, diversitatea și structurile neobișnuite ale compușilor biochimici.
Aici demonstrăm gama potențialului biosintetic codificat de microbi și contextul lor genomic în microbiomul marin global, facilitând cercetările viitoare prin punerea la dispoziție a resursei rezultate pentru comunitatea științifică (https://microbiomics.io/ocean/).Am descoperit că o mare parte din noutatea sa filogenetică și funcțională poate fi obținută numai prin reconstruirea MAG și SAG, în special în comunitățile microbiene subutilizate care ar putea ghida viitoarele eforturi de bioprospecție.Deși ne vom concentra aici pe 'Ca.Eudormicrobiaceae” ca filiație în special „talentată” din punct de vedere biosintetic, multe dintre BGC-urile prezise în microbiota nedescoperită probabil codifică enzimologii nedescrise anterior care produc compuși cu acțiuni semnificative din punct de vedere ecologic și/sau biotehnologic.
Au fost incluse seturi de date metagenomice din studii oceanografice și de serii cronologice majore cu o adâncime de secvențiere suficientă pentru a maximiza acoperirea comunităților microbiene marine globale în bazinele oceanice, în straturile adânci și în timp.Aceste seturi de date (Tabelul suplimentar 1 și Figura 1) includ metagenomică din probe colectate în oceanele din Tara (îmbogățit viral, n=190; îmbogățit cu procariote, n=180)12,22 și expediția BioGEOTRACES (n=480).Seria temporală Hawaiian Oceanic (HOT, n = 68), Seria temporală Bermuda-Atlantică (BATS, n = 62)21 și Expediția Malaspina (n = 58)23.Citirile de secvențiere din toate fragmentele metagenomice au fost filtrate pentru calitate folosind BBMap (v.38.71) prin eliminarea adaptoarelor de secvențiere din citiri, eliminând citirile mapate la secvențele de control al calității (genoame PhiX) și folosind trimq=14, maq=20 elimină calitatea slabă a citirii, maxns = 0 și minlength = 45. Analizele ulterioare au fost executate sau îmbinate cu citiri QC dacă s-a specificat (bbmerge.sh minoverlap=16).Citirile QC au fost normalizate (ținta bbnorm.sh = 40, adâncimea minții = 0) înainte de a fi construite folosind metaSPAdes (v.3.11.1 sau v.3.12, dacă este necesar)53.Conturile de schele rezultate (denumite în continuare schele) au fost în cele din urmă filtrate după lungime (≥1 kb).
Cele 1038 de probe metagenomice au fost împărțite în grupuri, iar pentru fiecare grup de probe, citirile de control al calității metagenomice ale tuturor probelor au fost corelate cu parantezele fiecărei probe separat, rezultând următorul număr de citiri de grup între paranteze: Tara Marine Viruses – Îmbogățit (190×190), Procariote Îmbogățite (180×180), BioGEOTRACES, HOT și BATS (610×610) și Malaspina (58×58).Cartografierea a fost realizată folosind Burrows-Wheeler-Aligner (BWA) (v.0.7.17-r1188)54 care permite potrivirea citirilor cu site-urile secundare (folosind steag-a).Aliniamentele au fost filtrate pentru a avea o lungime de cel puțin 45 de baze, au o identitate ≥97% și se întinde ≥80% citiri.Fișierele BAM rezultate au fost procesate utilizând scriptul jgi_summarize_bam_contig_depths pentru MetaBAT2 (v.2.12.1)55 pentru a oferi acoperire intra și inter eșantion pentru fiecare grup.În cele din urmă, parantezele au fost grupate pentru a crește sensibilitatea prin rularea individuală a MetaBAT2 pe toate probele cu –minContig 2000 și –maxEdges 500. Folosim MetaBAT2 în loc de un boxer de ansamblu, deoarece s-a demonstrat în teste independente că este cel mai eficient boxer unic.și de 10 până la 50 de ori mai rapid decât alți boxeri folosiți în mod obișnuit57.Pentru a testa efectul corelațiilor de abundență, un subeșantion de metagenomică selectat aleatoriu (10 pentru fiecare dintre cele două seturi de date Tara Ocean, 10 pentru BioGEOTRACES, 5 pentru fiecare serie de timp și 5 pentru Malaspina) a folosit în plus numai mostre.Eșantioanele interne sunt grupate pentru a obține informații de acoperire.(Informații suplimentare).
Genomii (externi) suplimentari au fost incluși în analiza ulterioară, și anume 830 MAG selectate manual dintr-un subset al setului de date Tara Oceans26, 5287 SAG din setul de date GORG20 și date din baza de date MAR (MarDB v. 4) din 1707 REF-uri izolate și 682 SAG) 27. Pentru setul de date MarDB, genoamele sunt selectate pe baza metadatelor disponibile dacă tipul de eșantion se potrivește cu următoarea expresie regulată: „[S|s]ingle.?[C|c]ell|[C|c]ulture| [I|i] izolat'.
Calitatea fiecărui container metagenomic și a genomilor externi a fost evaluată folosind CheckM (v.1.0.13) și Anvi'o's Lineage Workflow (v.5.5.0)58,59.Dacă CheckM sau Anvi'o raportează ≥50% completitate/completitudine și ≤10% contaminare/redundanță, atunci salvați celulele metagenomice și genomii externi pentru analize ulterioare.Aceste scoruri au fost apoi combinate în completitudine medie (mcpl) și contaminare medie (mctn) pentru a clasifica calitatea genomului conform criteriilor comunitare60, după cum urmează: calitate înaltă: mcpl ≥ 90% și mctn ≤ 5%;calitate bună: mcpl ≥ 70%, mctn ≤ 10%, calitate medie: mcpl ≥ 50% și mctn ≤ 10%, calitate corectă: mcpl ≤ 90% sau mctn ≥ 10%.Genomii filtrati au fost apoi corelați cu scorurile de calitate (Q și Q') după cum urmează: Q = mcpl – 5 x mctn Q' = mcpl – 5 x mctn + mctn x (variabilitatea tulpinii)/100 + 0,5 x log[N50] .(implementat în dRep61).
Pentru a permite analiza comparativă între diferite surse de date și tipuri de genom (MAG, SAG și REF), 34.799 de genomi au fost dereferențiați pe baza identității medii a nucleotidelor la nivelul întregului genom (ANI) folosind dRep (v.2.5.4).Repetări)61 cu praguri ANI de 95%28,62 (-comp 0 -con 1000 -sa 0,95 -nc 0,2) și gene marker cu o singură copie folosind SpecI63 care asigură gruparea genomului la nivel de specie.A fost selectat un genom reprezentativ pentru fiecare cluster dRep în funcție de scorul de calitate maxim (Q') definit mai sus, care a fost considerat reprezentativ pentru specie.
Pentru a evalua viteza de cartografiere, BWA (v.0.7.17-r1188, -a) a fost utilizat pentru a mapa toate cele 1038 de seturi de citiri metagenomice cu 34.799 de genomi conținute în OMD.Citirile controlate de calitate au fost mapate în modul single-ended și aliniamentele rezultate au fost filtrate pentru a reține numai aliniamente ≥45 bp în lungime.și identitate ≥95%.Raportul de afișare pentru fiecare probă este procentul de citiri rămase după filtrare împărțit la numărul total de citiri de control al calității.Folosind aceeași abordare, fiecare dintre cei 1038 metagenomi a fost redus la 5 milioane de inserții (date extinse, Fig. 1c) și a fost potrivit cu GORG SAG în OMD și în toate GEM16.Cantitatea de MAG-uri recuperate din apa de mare în catalogul GEM16 a fost determinată de interogări de cuvinte cheie ale surselor metagenomice, selectând probe de apă de mare (de exemplu, spre deosebire de sedimentele marine).Mai exact, selectăm „acvatic” ca „categorie_ecosistem”, „marin” ca „tip_ecosistem” și filtrăm „habitat” ca „ocean adânc”, „marin”, „oceanic maritim”, „marin pelagic”, „apă marină” , „Ocean”, „Apă de mare”, „Apa de mare de suprafață”, „Apa de mare de suprafață”.Acest lucru a dus la 5903 MAG-uri (734 de înaltă calitate) distribuite peste 1823 OTU-uri (vizualizări aici).
Genomii procariote au fost adnotați taxonom utilizând GTDB-Tk (v.1.0.2)64 cu parametrii impliciti care vizează GTDB r89 versiunea 13. Anvi'o a fost utilizat pentru a identifica genomurile eucariote pe baza predicției și reamintirii domeniului ≥50% și redundanță ≤ 10%.Adnotarea taxonomică a unei specii este definită ca fiind unul dintre genomii ei reprezentativi.Cu excepția eucariotelor (148 MAG), fiecare genom a fost mai întâi adnotat funcțional folosind prokka (v.1.14.5)65, denumind gene complete, definind parametrii „arhee” sau „bacterii” după cum este necesar, ceea ce este raportat și pentru non- codificarea genelor.și regiunile CRISPR, printre alte caracteristici genomice.Adnotați genele prezise prin identificarea genelor marker universale cu o singură copie (uscMG) utilizând fetchMG (v.1.2)66, atribuiți grupuri ortolog și interogați folosind emapper (v.2.0.1)67 pe baza eggNOG (v.5.0)68.Baza de date KEGG (publicată la 10 februarie 2020) 69. Ultimul pas a fost efectuat prin potrivirea proteinelor cu baza de date KEGG utilizând DIAMOND (v.0.9.30)70 cu o interogare și o acoperire a subiectului ≥70%.Rezultatele au fost filtrate în continuare conform NCBI Prokaryotic Genome Annotation Pipeline71 pe baza ratei de biți ≥ 50% din rata de biți maximă așteptată (link în sine).Secvențele de gene au fost, de asemenea, folosite ca intrare pentru a identifica BGC în genom folosind antiSMASH (v.5.1.0)72 cu parametri impliciti și diferite explozii de cluster.Toate genomurile și adnotările au fost compilate în OMD împreună cu metadatele contextuale disponibile pe web (https://microbiomics.io/ocean/).
Similar cu metodele descrise anterior12,22, am folosit CD-HIT (v.4.8.1) pentru a grupa > 56,6 milioane de gene care codifică proteine ​​din genomi bacterieni și arheali din OMD în gene de identitate de 95% și mai scurte (acoperire de 90%)73 până la >17,7 milioane de grupuri de gene.Cea mai lungă secvență a fost aleasă ca genă reprezentativă pentru fiecare grup de gene.Cele 1038 de metagenomi au fost apoi potriviți cu > 17,7 milioane de membri ai clusterului BWA (-a), iar fișierele BAM rezultate au fost filtrate pentru a reține numai aliniamente cu identitate ≥95% procente și ≥45 aliniamente de bază.Abundența genelor normalizate în funcție de lungime a fost calculată prin numărarea mai întâi a inserțiilor din cea mai bună aliniere unică și apoi, pentru inserții cu hartă neclară, adăugând numărări fracționale la genele țintă corespunzătoare proporțional cu numărul lor de inserții unice.
Genomii din OMD extins (cu MAG-uri suplimentare de la „Ca. Eudormicrobiaceae”, vezi mai jos) au fost adăugați la baza de date a instrumentelor de analiză metagenomică mOTUs74 (v.2.5.1) pentru a crea o bază de date de referință extinsă mOTU.Din zece uscMG-uri au supraviețuit doar șase genomi cu o singură copie (23.528 genomi).Extinderea bazei de date a dus la 4.494 de grupuri suplimentare la nivel de specie.1038 metagenome au fost analizate folosind parametrii mOTU impliciti (v.2).Un total de 989 de genomi conținute în 644 clustere mOTU (95% REF, 5% SAG și 99,9% aparținând MarDB) nu au fost detectați de profilul mOTU.Aceasta reflectă diverse surse suplimentare de izolare marine a genomurilor MarDB (majoritatea genomilor nedetectați sunt asociate cu organisme izolate din sedimente, gazde marine etc.).Pentru a continua să ne concentrăm asupra mediului oceanic deschis în acest studiu, le-am exclus din analiza în aval, cu excepția cazului în care au fost detectate sau incluse în baza de date extinsă mOTU creată în acest studiu.
Toate BGC-urile de la MAG, SAG și REF în OMD (a se vedea mai sus) au fost combinate cu BGC-urile identificate în toate schelele metagenomice (antiSMASH v.5.0, parametri impliciti) și caracterizate folosind BiG-SLICE (v.1.1) (domeniul PFAM)75.Pe baza acestor caracteristici, am calculat toate distanțele cosinus dintre BGC și le-am grupat (legături medii) în GCF și GCC utilizând praguri de distanță de 0,2 și, respectiv, 0,8.Aceste praguri sunt o adaptare a pragurilor utilizate anterior folosind distanța euclidiană75 împreună cu distanța cosinus, ceea ce atenuează o parte din eroarea din strategia inițială de grupare BiG-SLICE (informații suplimentare).
BGC-urile au fost apoi filtrate pentru a reține doar ≥5 kb codificați pe schele pentru a reduce riscul de fragmentare așa cum s-a descris anterior16 și pentru a exclude REF-urile și SAG-urile MarDB care nu se găsesc în 1038 metagenomi (vezi mai sus).Acest lucru a dus la codificarea unui total de 39.055 BGC de către genomul OMD, cu alte 14.106 identificate pe fragmente metagenomice (adică necombinate în MAG).Aceste BGC „metagenomice” au fost folosite pentru a estima proporția potențialului de biosinteză a microbiomului marin care nu este capturat în baza de date (Informații suplimentare).Fiecare BGC a fost caracterizat funcțional în funcție de tipurile de produse predictive definite de categoriile de produse anti-SMASH sau mai grosiere definite în BiG-SCAPE76.Pentru a preveni prejudecățile de eșantionare în cuantificare (compoziția taxonomică și funcțională a GCC/GCF, distanța dintre GCF și GCC la bazele de date de referință și abundența metagenomică a GCF), prin păstrarea numai a celui mai lung BGC per GCF pentru fiecare specie, 39.055 BGC au fost deduplicate în continuare, rezultând un total de 17.689 BGC.
Noutatea GCC și GCF a fost evaluată pe baza distanței dintre baza de date calculată (baza de date RefSeq în BiG-FAM)29 și BGC verificat experimental (MIBIG 2.0)30.Pentru fiecare dintre cele 17.689 de BGC reprezentative, am ales cea mai mică distanță cosinus față de baza de date respectivă.Aceste distanțe minime sunt apoi mediate (medie) conform GCF sau GCC, după caz.Un GCF este considerat nou dacă distanța până la baza de date este mai mare de 0,2, ceea ce corespunde unei separări ideale între GCF (medie) și referință.Pentru GCC, alegem 0,4, care este de două ori pragul definit de GCF, pentru a bloca o relație pe termen lung cu legăturile.
Abundența metagenomică a BGC a fost estimată ca abundența medie a genelor sale biosintetice (după cum este determinată de anti-SMASH) disponibile din profilurile la nivel de genă.Abundența metagenomică a fiecărui GCF sau GCC a fost apoi calculată ca sumă a BGC-urilor reprezentative (din 17.689).Aceste hărți de abundență au fost ulterior normalizate pentru compoziția celulară folosind numărul mOTU per eșantion, care a reprezentat și eforturile de secvențiere (date extinse, Fig. 1d).Prevalența GCF sau GCC a fost calculată ca procent de probe cu o abundență > 0.
Distanța euclidiană dintre probe a fost calculată din profilul GCF normalizat.Aceste distanțe au fost reduse în dimensiune folosind UMAP77, iar înglobările rezultate au fost utilizate pentru clustering nesupravegheat bazat pe densitate folosind HDBSCAN78.Numărul minim optim de puncte pentru un cluster (și, prin urmare, numărul de clustere) utilizat de HDBSCAN este determinat prin maximizarea probabilității cumulate de apartenență la cluster.Clusterele identificate (și un subeșantion echilibrat aleatoriu al acestor clustere pentru a ține cont de părtinirea analizei permutaționale multivariate a varianței (PERMANOVA)) au fost testate pentru semnificație față de distanțe euclidiene nereduse utilizând PERMANOVA.Mărimea medie a genomului a probelor a fost calculată pe baza abundenței relative a mOTU și a mărimii estimate a genomului membrilor genomului.În special, dimensiunea medie a genomului a fiecărei mOTU a fost estimată ca media dimensiunilor genomului membrilor săi corectate pentru caracter complet (după filtrare) (de exemplu, un genom complet de 75% cu o lungime de 3 Mb are o dimensiune ajustată de 4 Mb).pentru genomi medii cu integritate ≥70%.Mărimea medie a genomului pentru fiecare probă a fost apoi calculată ca sumă a dimensiunilor genomului mOTU ponderate cu abundența relativă.
Un set filtrat de BGC codificate de genom în OMD este afișat în arbori GTDB bacterieni și arheali (în cadre ≥5 kb, excluzând REF și SAG MarDB, care nu se găsesc în 1038 metagenomuri, vezi mai sus) și categoriile lor de produse prezise pe baza filogeneticii. poziţia genomului (vezi mai sus).Mai întâi am redus datele în funcție de specie, utilizând ca reprezentativ genomul cu cele mai multe BGC din acea specie.Pentru vizualizare, reprezentanții au fost împărțiți în continuare în grupuri de arbori și, din nou, pentru fiecare cladă celulară, a fost selectat ca reprezentant genomul care conține cel mai mare număr de BGC.Speciile îmbogățite cu BGC (cel puțin un genom cu > 15 BGC) au fost analizate în continuare prin calcularea indicelui de diversitate Shannon pentru tipurile de produse codificate în acele BGC.Dacă toate tipurile de produse prezise sunt aceleași, hibrizii chimici și alte BGC complexe (așa cum sunt prezise de anti-SMAH) sunt considerate a aparține aceluiași tip de produs, indiferent de ordinea lor în grup (de exemplu fuziunea proteină-bacteriocină și bacteriocină-proteoproteină). corp).hibrid).
ADN rămas (estimat la 6 ng) din proba Malaspina MP1648, corespunzând probei biologice SAMN05421555 și potrivită cu setul de citire metagenomică Illumina SRR3962772 pentru citire scurtă, procesat conform protocolului de secvențiere PacBio cu intrare ultra-scăzută pentru a utiliza kit-ul PacBio SMRTbell gDNA amplificare kit (100-980-000) și kit de pregătire șablon SMRTbell Express 2.0 (100-938-900).Pe scurt, ADN-ul rămas a fost tăiat, reparat și purificat (mărgele ProNex) folosind Covaris (g-TUBE, 52104).ADN-ul purificat este apoi supus preparării bibliotecii, amplificării, purificării (mărgele ProNex) și selecției dimensiunii (>6 kb, Blue Pippin) înainte de o etapă finală de purificare (sferele ProNex) și secvențiere pe platforma Sequel II.
Reconstituirea primelor două ca.Pentru MAG Eremiobacterota, am identificat șase ANI suplimentare > 99% (acestea sunt incluse în Figura 3), care au fost inițial filtrate pe baza scorurilor de contaminare (identificate ulterior ca dublări ale genelor, vezi mai jos).Am găsit și o tavă cu eticheta „Ca”.Eremiobacterota” din diverse studii23 și le-a folosit împreună cu opt MAG-uri din studiul nostru ca referință pentru citirile metagenomice din 633 de eșantioane eucariote îmbogățite (>0,8 µm) folosind BWA (v.0.7.17) Ref -r1188, – un flag) pentru eșantionare redusă. cartografiere (5 milioane de citiri).Pe baza hărților specifice îmbogățirii (filtrate după identitate de aliniere de 95% și acoperire de citire de 80%), 10 metagenome (acoperire așteptată ≥5×) au fost selectate pentru asamblare și alte 49 metagenome (acoperire așteptată ≥1×) pentru corelarea conținutului.Folosind aceiași parametri ca mai sus, aceste eșantioane au fost colectate și au fost adăugate 10 „Ca” suplimentare.MAG Eremiobacterota a fost restaurat.Aceste 16 MAG-uri (fără a număra cele două deja în baza de date) aduc numărul total de genomi din OMD extins la 34.815.MAG-urilor li se atribuie ranguri taxonomice pe baza asemănării lor genomice și a poziției în GTDB.18 MAG au fost dereplicate folosind dRep în 5 specii (ANI intraspecific >99%) și 3 genuri (ANI intragenerică 85% până la 94%) în cadrul aceleiași familii79.Reprezentanții speciilor au fost selectați manual în funcție de integritate, contaminare și N50.Nomenclatura sugerată este furnizată în Informațiile suplimentare.
Evaluați integritatea și contaminarea 'Ca.MAG Eremiobacterota, am evaluat prezența uscMG, precum și seturile de gene marker cu o singură copie specifice liniei și domeniului utilizate de CheckM și Anvi'o.Identificarea a 2 duplicate din 40 de uscMG-uri a fost confirmată prin reconstrucție filogenetică (vezi mai jos) pentru a exclude orice potențială contaminare (aceasta corespunde la 5% pe baza acestor 40 de gene marker).Un studiu suplimentar asupra a cinci MAG-uri reprezentative 'Ca.Nivelul scăzut de contaminanți din acești genomi reconstruiți a fost confirmat pentru speciile de Eremiobacterota folosind interfața interactivă Anvi'o bazată pe corelațiile abundenței și compoziției secvenței (informații suplimentare)59.
Pentru analiza filogenomică, am selectat cinci MAG reprezentative „Ca”.Eudormicrobiaceae”, toate speciile „Ca.Genomul Eremiobacterota și membrii altor phyla (inclusiv UBP13, Armatimonadota, Patescibacteria, Dormibacterota, Chloroflexota, Cyanobacteria, Actinobacteria și Planctomycetota) este disponibil de la GTDB (r89)13.Toate aceste genomi au fost adnotate așa cum s-a descris anterior pentru extracția genei marker cu o singură copie și adnotarea BGC.Genomii GTDB au fost conservați conform criteriilor de integritate și contaminare de mai sus.Analiza filogenetică a fost efectuată folosind fluxul de lucru Anvi'o Phylogenetics59.Arborele a fost construit folosind IQTREE (v.2.0.3) (opțiuni implicite și -bb 1000)80 pe o aliniere a 39 de proteine ​​ribozomale tandem identificate de Anvi'o (MUSCLE, v.3.8.1551)81.Pozițiile lui au fost reduse.pentru a acoperi cel puțin 50% din genom82 și Planctomycecota a fost folosit ca un grup extern bazat pe topologia arborelui GTDB.Un arbore de 40 de uscMG-uri a fost construit folosind aceleași instrumente și parametri.
Am folosit Traitar (v.1.1.2) cu parametri impliciti (fenotip, din nucleotide)83 ​​pentru a prezice trăsăturile microbiene comune.Am explorat un potențial stil de viață prădător bazat pe un indice de prădător dezvoltat anterior84, care depinde de conținutul unei gene care codifică proteine ​​din genom.Mai exact, folosim DIAMOND pentru a compara proteinele din genom cu baza de date OrthoMCL (v.4)85 folosind opțiunile –mai-sensibil –id 25 –interogare-copertă 70 –subiect-copertă 70 –top 20 ȘI numărați genele corespunzătoare genele marker pentru prădători și neprădători.Indicele este diferența dintre numărul de marcaje prădătoare și neprădătoare.Ca control suplimentar, am analizat și genomul „Ca”.Factorul Entotheonella TSY118 se bazează pe asocierea sa cu Ca.Eudoremicrobium (dimensiune mare a genomului și potențial de biosinteză).Apoi, am testat legăturile potențiale dintre genele marker de prădători și non-prădători și potențialul biosintetic al Ca.Eudormicrobiaceae” și a constatat că nu mai mult de o genă (din orice tip de genă marker, adică gena prădătoare/non-prădătoare) se suprapune cu BGC, sugerând că BGC nu confundă semnalele de prădăre.Adnotarea genomică suplimentară a repliconilor amestecați a fost efectuată folosind TXSSCAN (v.1.0.2) pentru a examina în mod specific sistemul de secreție, pili și flageli86.
Cinci Ca reprezentative au fost cartografiate prin cartografierea a 623 de metatranscriptomi din fracțiile de îmbogățire procariote și eucariote ale oceanelor Tara22,40,87 (folosind BWA, v.0.7.17-r1188, -a flag).Genomul Eudormicrobiaceae.Fișierele BAM au fost procesate cu FeatureCounts (v.2.0.1)88 după 80% acoperire de citire și 95% filtrare de identitate (cu opțiuni featureCounts –primary -O –fraction -t CDS,tRNA -F GTF -g ID -p ) Contorizează numărul de inserții pe genă.Hărțile generate au fost normalizate pentru lungimea genei și abundența genei marker mOTU (numărul mediu de inserții normalizat pe lungime pentru gene cu număr de inserții > 0) și transformate în log la 22,74 pentru a obține expresia relativă per celulă a fiecărui nivel de genă, ceea ce explică, de asemenea, variabilitatea de la probă la probă în timpul secvențierii.Astfel de rapoarte permit o analiză comparativă, atenuând problemele de compoziție atunci când se utilizează date despre abundența relativă.Doar eșantioanele cu >5 din cele 10 gene marker mOTU au fost luate în considerare pentru analize ulterioare pentru a permite detectarea unei părți suficient de mare a genomului.
Profilul transcriptomului normalizat al lui 'Ca.E. taraoceanii a fost supus reducerii dimensionalității folosind UMAP și reprezentarea rezultată a fost utilizată pentru gruparea nesupravegheată folosind HDBSCAN (vezi mai sus) pentru a determina starea expresiei.PERMANOVA testează semnificația diferențelor dintre clusterele identificate în spațiul de distanță original (nu redus).Expresia diferențială între aceste condiții a fost testată în întregul genom (vezi mai sus) și au fost identificate 201 căi KEGG în 6 grupuri funcționale, și anume: BGC, sistemul de secreție și genele flagelare din TXSSCAN, enzime de degradare (protează și peptidaze) și prădătoare și non- genele prădătoare.markeri de indice prădător.Pentru fiecare probă, am calculat mediana expresiei normalizate pentru fiecare clasă (rețineți că expresia BGC în sine este calculată ca expresie mediană a genelor biosintetice pentru acel BGC) și am testat semnificația între state (testul Kruskal-Wallis ajustat pentru FDR).
Genele sintetice au fost achiziționate de la GenScript și primerii PCR au fost achiziționați de la Microsynth.Phusion polimeraza de la Thermo Fisher Scientific a fost folosită pentru amplificarea ADN-ului.Plasmidele NucleoSpin, gelul NucleoSpin și trusa de purificare PCR de la Macherey-Nagel au fost utilizate pentru purificarea ADN-ului.Enzimele de restricție și ADN ligaza T4 au fost achiziționate de la New England Biolabs.Alte substanțe chimice decât izopropil-p-d-1-tiogalactopiranozid (IPTG) (Biosynth) și 1,4-ditiotreitol (DTT, AppliChem) au fost achiziționate de la Sigma-Aldrich și utilizate fără purificare suplimentară.Antibioticele cloramfenicol (Cm), diclorhidrat de spectinomicină (Sm), ampicilină (Amp), gentamicina (Gt) și carbenicilină (Cbn) au fost achiziționate de la AppliChem.Componentele medii Bacto Tryptone și Bacto Yeast Extract au fost achiziționate de la BD Biosciences.Tripsina pentru secvențiere a fost achiziționată de la Promega.
Secvențele de gene au fost extrase din BGC 75.1 prezis anti-SMASH.E. malaspinii (Informații suplimentare).
The genes embA (locus, MALA_SAMN05422137_METAG-framework_127-gene_5), embM (locus, MALA_SAMN05422137_METAG-framework_127-gene_4), and embAM (including intergene regions) were sequenced as synthetic constructs in pUC57(AmpR) with and without codons optimized for expression in E când.Gena embA a fost subclonată în primul situs de donare multiplă (MCS1) al pACYCDuet-1(CmR) și pCDFDuet-1(SmR) cu situsuri de clivaj BamHI și HindIII.Genele embM și embMopt (optimizate cu codon) au fost subclonate în MCS1 pCDFDuet-1(SmR) cu BamHI și HindIII și plasate în al doilea loc de donare multiplă al pCDFDuet-1(SmR) și pRSFDuet-1(KanR) (MCS2) cu NdeI/ChoI.Caseta embAM a fost subclonată în pCDFDuet1(SmR) cu situsuri de clivaj BamHI și HindIII.Gena orf3/embI (locus, MALA_SAMN05422137_METAG-scaffold_127-gene_3) a fost construită prin PCR cu extensie de suprapunere utilizând primeri EmbI_OE_F_NdeI și EmbI_OE_R_XhoI, digerați cu NdeI/XhoI și ligați în aceleași endemi-mcd-mcD (p. 1CDF) (Suplimentar masa).6).Digestia și ligatura cu enzime de restricție au fost efectuate conform protocolului producătorului (New England Biolabs).

 


Ora postării: 14-mar-2023