banner
Heim / Blog / Multi
Blog

Multi

Jul 13, 2023Jul 13, 2023

Communications Biology Band 6, Artikelnummer: 820 (2023) Diesen Artikel zitieren

7566 Zugriffe

3 Altmetrisch

Details zu den Metriken

Chia (Salvia hispanica) ist eine aufstrebende Nutzpflanze, die als funktionelles Lebensmittel gilt und wichtige Substanzen mit vielfältigen Anwendungsmöglichkeiten enthält. Allerdings müssen die molekularen Grundlagen einiger relevanter Chia-Merkmale wie Samenschleim und Polyphenolgehalt noch entdeckt werden. Diese Studie generiert eine verbesserte Referenz des Chia-Genoms auf Chromosomenebene, löst einige stark repetitive Regionen auf, beschreibt Methylierungsmuster und verfeinert die Annotation des Genoms. Die transkriptomische Analyse zeigt, dass Samen im Vergleich zu anderen Organen und Geweben ein einzigartiges Expressionsmuster aufweisen. Daher wird ein metabolischer und proteomischer Ansatz implementiert, um die Samenzusammensetzung und die von den Samen produzierten Schleimstoffe zu untersuchen. Das Chia-Genom weist eine signifikante Erweiterung der Schleimsynthesegene auf (im Vergleich zu Arabidopsis), und die Analyse des Gennetzwerks zeigt potenzielle Regulatoren, die die Samenschleimproduktion steuern. Rosmarinsäure, eine Verbindung mit enormem therapeutischem Potenzial, wurde als das am häufigsten in Samen vorkommende Polyphenol eingestuft, und Kandidatengene für seinen komplexen Stoffwechselweg werden beschrieben. Insgesamt liefert diese Studie wichtige Einblicke in die molekulare Grundlage der einzigartigen Eigenschaften von Chiasamen.

Die Gattung Salvia ist mit etwa 900 Arten die größte Gattung innerhalb der Familie der Lippenblütler (Lamiaceae)1. Salvia stellt eine der vielfältigsten Blütenpflanzengattungen dar und umfasst mehrere Arten von wirtschaftlicher Bedeutung. Im Allgemeinen werden sie weltweit zu Zierzwecken, als Küchenkräuter oder als Aromastoffe angebaut2, und einige sind für ihre therapeutischen Eigenschaften als antitumorale, antiallergene, antioxidative oder antimikrobielle Wirkstoffe3 bekannt. Darüber hinaus hat der Verzehr von Samen einer Salvia-Art, die allgemein als Chia bekannt ist, Salvia hispanica, als funktionelles Lebensmittel oder „Superfood“ in den letzten Jahrzehnten an Popularität gewonnen4. Zusätzlich zu ihrem hohen Nährwert enthalten Chiasamen mehrere bioaktive Verbindungen mit gesundheitsfördernden Eigenschaften5. Chiasamen zeichnen sich durch einen hohen Anteil an essentiellen Fettsäuren, einen hohen Proteingehalt, antioxidative Verbindungen und einen hohen Ballaststoffgehalt aus4,6. Daher haben Samen dieser Art in der Lebensmittelindustrie ein großes Potenzial, den Nährwert verschiedener Produkte zu steigern. Darüber hinaus können ihre Derivate (Öl, Mehl, Extrakte, Gummi usw.) als Schaumstabilisatoren und Emulgatoren oder als Quelle natürlicher Antioxidantien zur Verringerung der Lipid- und Proteinoxidation in verarbeiteten Lebensmitteln verwendet werden7. Im aktuellen Szenario des Klimawandels wurde S. hispanica aufgrund seiner Fähigkeit, in trockenen und semiariden Umgebungen zu wachsen, auch als alternative Nutzpflanze vorgeschlagen8.

Salvia hispanica-Samen stellen auch eine Schleimquelle dar, eine gallertartige Hülle, die den Samen umhüllt, wenn er hydratisiert ist und der mehrere nutrazeutische Eigenschaften zugeschrieben werden. Samenschleim ist eine Matrix aus Polysacchariden, und Chiasamenschleim besteht hauptsächlich aus Xylose-, Glucose-, Arabinose-, Galactose-, Glucuronsäure- und Galacturonsäureresten9. Chia-Schleim wird in der Lebensmittelindustrie bereits als Zusatz in verschiedenen Zubereitungen verwendet10. Aufgrund seiner physikalischen und chemischen Eigenschaften sehen einige Studien ein hohes Potenzial von Chia-Schleim als Biopolymer in der Kosmetik- und Pharmaindustrie11. Darüber hinaus weisen Chiasamen eine hohe antioxidative Aktivität auf, die mit kommerziellen Antioxidantienprodukten vergleichbar ist12, was darauf hindeutet, dass Chiasamen eine wichtige Nahrungsquelle für Antioxidantien darstellen. Verschiedene Studien haben über das Vorhandensein von Verbindungen mit antioxidativer Wirkung in Chiasamen berichtet, darunter mehrere Flavonole und phenolische Verbindungen12,13,14. Unter den Antioxidantien wurde zuvor berichtet, dass Rosmarinsäure (RA) die am häufigsten vorkommende phenolische Verbindung in Chiasamen ist14, die bereits in der Lebensmittelindustrie als natürliches Antioxidans oder Konservierungsmittel verwendet wird. Daher wurden mehrere Anstrengungen unternommen, um die großtechnische Produktion von RA mithilfe von In-vitro-Pflanzenkulturen zu etablieren15.

Aufgrund der nutrazeutischen Eigenschaften und industriellen Anwendungen von Chiasamen besteht ein zunehmendes Interesse an der Untersuchung von S. hispanica, um die genetische Grundlage wirtschaftlich wichtiger Merkmale zu verstehen. Die genetische Grundlage samenbezogener Merkmale wie der Schleimproduktion oder des Polyphenolstoffwechsels (z. B. RA-Biosynthese) muss noch entdeckt werden. Daher ist die Entwicklung eines hochwertigen Referenzgenoms von entscheidender Bedeutung, um die molekularen Mechanismen hinter den funktionellen Eigenschaften von Chiasamen zu charakterisieren. Folglich haben wir in der vorliegenden Studie mithilfe der Oxford Nanopore- und Hi-C-Sequenzierung eine hochwertige S. hispanica-Genomassemblierung auf Chromosomenebene erstellt. Diese verbesserte Anordnung ermöglichte die Identifizierung der meisten zentromeren und einiger telomerer Regionen sowie die Verlagerung eines chromosomalen Fragments im Vergleich zu einer zuvor berichteten Anordnung des Chia-Genoms16. Unsere hochwertige Annotation des Genoms ergab eine Erhöhung der Kopienzahl der an der Samenschleimbiosynthese beteiligten Gene im Vergleich zu den Genen, über die zuvor in Arabidopsis thaliana berichtet wurde. Diese Studie identifizierte auch potenzielle Regulatoren, die die Schleimproduktion in Chiasamen steuern. Darüber hinaus führten wir metabolische und proteomische Analysen durch, um samenspezifische Komponenten zu beschreiben. Ein kombinierter Ansatz, der Stoffwechselwege und transkriptomische Daten integriert, ermöglichte die Identifizierung von Chia-Genen, die vermutlich an der RA-Synthese beteiligt sind, einem der am häufigsten verwendeten und wirtschaftlich wichtigsten Antioxidantien in der Lebensmittelindustrie.

Eine hochwertige Referenz des S. hispanica-Genoms wurde mithilfe einer Kombination aus ultralangen Reads (46,68 GB) von Oxford Nanopore Technologies (ONT), Paired-End-Reads von Illumina (54,87 GB) und Hi-C-Sequenzierung (25,13 GB) erhalten ) für eine Gesamtabdeckung von etwa 350× (Ergänzungstabelle S1). Die Genomgröße dieser mexikanischen Sorte S. hispanica (ergänzende Abbildung S1) wurde durch k-mer-Frequenzanalyse auf 358, 3 MB geschätzt (ergänzende Abbildung S2). Mehrere Assemblierungspipelines wurden evaluiert, um ein hochwertiges Referenz-Chia-Genom zu erstellen (Ergänzungstabelle S2). Unter ihnen erzeugte der NECAT-Assembler17 die zusammenhängendste (Contig N50 = 5,37 Mb) und vollständigste Genomassemblierung (BUSCO komplett 97,8 %), die für weitere Analysen ausgewählt wurde. Eine verbesserte Baugruppe wurde nach sechs Polierschritten unter Verwendung von Illumina-Lesevorgängen mit Pilon18 erhalten und anschließend mit Purge Haplotigs verarbeitet, um primäre Contigs zu identifizieren19. Schließlich wurden Hi-C-Daten verwendet, um mithilfe der Juicer20- und 3D-DNA21-Pipelines eine Zusammenstellung auf Chromosomenebene zu erreichen (ergänzende Abbildung S3). Diese Referenzgenomassemblierung bestand aus 269 Contigs, die in 154 Gerüste mit einer Gesamtlänge von 351, 98 MB und einer Gerüst-N50-Länge von 61, 89 MB integriert waren (Abb. 1a; Ergänzungstabelle S3), wobei 98, 5% des Embryophyta-Datensatzes von BUSCO22 als vollständig ermittelt wurden (Abb. 1b; Ergänzungstabelle S4). Der größte Teil der Anordnung war in sechs Pseudochromosomen verankert (345,52 von 351,98 MB; Ergänzungstabelle S5). Die Analyse des S. hispanica-Genoms mit Tandem Repeats Finder23 und nhmmer (hmmer.org) ermöglichte die Identifizierung von Zentromeren in fünf der sechs Chromosomen (Abb. 1a; Ergänzungstabelle S6). Die häufigste zentromere Wiederholung in den Chia-Chromosomen hat eine Länge von 171 bp, es wurden jedoch auch Varianten von 167 und 174 bp identifiziert (Ergänzungstabelle S7). Das typische pflanzliche Telomer-Repeat24 wurde an einem Ende von zwei Chromosomen identifiziert (TTTAGGG in chr1 und chr5; ergänzende Abbildung S4). Andere Telomervarianten wurden an einem Ende in zwei zusätzlichen Chromosomen platziert (CTAAACC in chr2 und AAACCCT in chr6; ergänzende Abbildung S4).

a Merkmale und Metriken der Chia-Genomassemblierung. Spur 1 zeigt die Anzahl der Chromosomen und ihre Länge (Mb), Spur 2 zeigt die Gendichte (grün) und repetitive Elemente (grau), Spur 3 Methylierungsmuster (5mC-Verteilung) pro 100-kb-Fenster. Ungefähre Positionen der Zentromere, angezeigt durch rote Dreiecke, und endgültige Genomreferenzmetriken (Mitte). b Hohe Vollständigkeit des Genoms, angezeigt durch konservierte Embryophyten-Orthologe. c Syntenie mit Linien, die homologe Gene für die Schleimproduktion zwischen A. thaliana (Ath) und S. hispanica (Shispa) darstellen. Blaue Linien verdeutlichen die Erweiterung der Schleimsynthesegene im Chia-Genom.

Der Abgleich unserer S. hispanica-Genomanordnung mit einem zuvor veröffentlichten Genom einer australischen Chia-Sorte16 zeigte eine hohe Kollinearität zwischen den Chromosomen der beiden Anordnungen. Der einzige signifikante Unterschied zwischen den beiden Chia-Genomanordnungen besteht darin, dass ein Ende des Chromosoms chr1 (ein Fragment von 4,6 MB) der mexikanischen Sorte dem Chromosom chr2 der australischen Sorte zugeordnet wurde (ergänzende Abbildung S5), was darauf hindeutet, dass dieses Fragment vorhanden war falsch zusammengebaut. Dieses Fragment wurde vom Chromosom getrennt und Analysen unter Verwendung zweier verschiedener Hi-C-Datensätze wurden durchgeführt, um die korrekte genomische Position dieser Region zu bestimmen. Diese Analysen zeigten signifikant höhere Hi-C-Paar-Alignments zwischen diesem Fragment und chr1 als Kontakte mit chr2, was darauf hinweist, dass dieses genomische Fragment tatsächlich zu chr1 gehört (ergänzende Abbildung S6). Kürzlich wurde eine Genomsequenz einer weiteren mexikanischen Sorte von S. hispanica (weiße Samen) veröffentlicht39. Dieses 4,6 MB große genomische Fragment wurde auch chr1 in diesem anderen S. hispanica-Genom zugeordnet, was das Ergebnis unserer Analysen bestätigt. Die Genomausrichtung unter Verwendung dieser anderen mexikanischen Sorte zeigte ebenfalls eine hohe Kollinearität zwischen den Baugruppen. Dennoch deuten die Ergebnisse dieser Analyse auf eine höhere Nukleotididentität zwischen der in dieser Studie erzeugten Anordnung mit der australischen Sorte als der anderen mexikanischen Sorte hin, die von Li et al.39 veröffentlicht wurde (ergänzende Abbildung S5).

Insgesamt wurden 179,88 MB als repetitive Sequenzen annotiert, die etwa 51,1 % des S. hispanica-Genoms ausmachen. Die meisten repetitiven Elemente wurden als lange terminale Wiederholungen (LTRs) klassifiziert und belegen etwa 58,82 MB des Genoms. Diese bestehen hauptsächlich aus Retroelementen der Gypsy- und Copia-Klassen (32,10 bzw. 26,44 MB). Repetitive Sequenzen im Genom von S. hispanica wurden vor der strukturellen Annotation maskiert. Genmodelle wurden mithilfe der MAKER-P-Pipeline25,26 vorhergesagt, einschließlich Ab-initio- und homologiebasierter Genvorhersagemethoden. Die Annotation führte zu 34.748 proteinkodierenden Genen im S. hispanica-Genom mit einer durchschnittlichen Genlänge von 2.828,35 bp und durchschnittlich 5,6 Exons pro Gen. Der Satz vorhergesagter Gene umfasst 97% des BUSCO22-Embryophyta-Kerns als vollständige Gene, was auf einen hohen Grad an Genomvollständigkeit hinweist (ergänzende Abbildung S7). Dieser Gensatz weist außerdem eine durchschnittliche Annotation Edit Distance (AED) von 0,15 auf, was auf eine hohe Übereinstimmung zwischen unterstützenden Beweisen und Annotation hinweist.

Um Einblicke in die Methylierungsmuster des Chia-Genoms zu gewinnen, haben wir die Cytosin-Methylierung an Kohlenstoffposition 5 (5-Methylcytosin, 5 mC) mithilfe von ONT bestimmt. Rohe ONT-Lesevorgänge wurden gemäß der DeepSignal27-Pipeline verarbeitet. Ungefähr 15 Millionen 5 mC wurden aus vier unabhängigen Nanopore-Sequenzierungsläufen erhalten, von denen 92 % als hochwertige 5 mC-Positionen gefiltert wurden. Der relative Anteil der 5mCs, die in jedem Sequenzkontext für diese hochwertigen Positionen identifiziert wurden, betrug CG = 45 %, CHG = 19,6 % und CHH = 35,4 %, wobei H eine der Basen A, T oder C ist (ergänzende Abb. S8). Die Gesamtgenomanalyse von 5mC zeigt hohe DNA-Methylierungsgrade in Genomregionen mit geringer Gendichte und hohem Gehalt an repetitiven Sequenzen, während sie in genreichen Regionen relativ niedrigere Methylierungsgrade zeigt (Abb. 1a). In den meisten Fällen wurden Zentromerpositionen nahe dem Maximalwert von 5 mC-Zählungen identifiziert (ergänzende Abbildung S9). Die DNA-Methylierungsgrade (%) für Chia-Gene wurden ausgewertet und zeigten, dass an den Grenzen der Genkörper in der Nähe der Translationsstart- und -stoppcodons in allen Sequenzkontexten niedrige Werte beobachtet wurden; diese Werte stiegen im Genkörper vorwiegend im CG-Kontext und bis an in geringerem Maße bei der CHG- und CHH-Methylierung. Im Gegensatz dazu zeigte die DNA-Methylierung repetitiver DNA-Sequenzen wie transponierbarer Elemente (TEs) in allen drei Methylierungskontexten höhere DNA-Methylierungsgrade (ergänzende Abbildung S8).

Die Genexpressionsanalyse zuvor veröffentlichter RNA-seq-Daten der wichtigsten vegetativen und reproduktiven Wachstumsstadien von S. hispanica28 zeigte ein deutlich unterschiedliches Expressionsmuster für Chiasamen (Abb. 2a); 20,75 % der Chia-Gene haben ihre maximale Expression in Samen (CPM-Werte Z-Score normalisiert) (Ergänzende Abbildung S10). Die Anreicherungsanalyse von in Samen stark exprimierten Genen umfasste eine Vielzahl biologischer Prozesse, einschließlich samenbezogener Kategorien wie Embryoentwicklung und abiotischer Stressbegriffe wie Reaktion auf Salzstress und Hitzeakklimatisierung (ergänzende Abbildung S11).

a Hauptkomponentenanalyse von Expressionsprofilen in verschiedenen Geweben und Stadien während des Lebenszyklus von S. hispanica. Die Expressionswerte wurden vor der Hauptkomponentenanalyse normalisiert und in den Z-Score umgewandelt. b Metabolomanalyse von trockenen Chiasamen, chemische Zusammensetzung verteilt auf die Hauptfunktionsgruppen. Keimblatt und Spross nach 3 Tagen (3D); Blattprimordien (LP) und Spross bei 12D; 1. und 2. Blatt (P1P2), 3. und 4. Blatt (P3P4), 5., 6. und 7. Blatt (P5P6P7) und Internodium bei 69D; obere oder untere Hälfte des Traubenblütenstandes bei 158D; Blumen bei 159D; Blumen bei 164D; trockene Samen. Detaillierte Beschreibung des Pflanzenmaterials in der Ergänzungstabelle S8.

Um die Transkriptionsprofile mit der Samenzusammensetzung in Verbindung zu bringen, führten wir metabolomische und proteomische Analysen reifer Samen durch. Die Lipidomanalyse von Samen identifizierte fast 1000 Lipidmoleküle, die in zehn Kategorien eingeteilt werden konnten (ergänzende Abbildung S12). Die am häufigsten vorkommende Lipidklasse umfasste Triacylglycerine, von denen die C18-Acylseitenketten mit null bis acht ungesättigten Bindungen am häufigsten vorkamen (ergänzende Abbildung S12). Die metabolische Analyse von S. hispanica-Samen identifizierte insgesamt 1.984 Merkmale, von denen die am häufigsten vorkommende Verbindung (R)-(+)-Rosmarinsäure war, gefolgt von Oleamid, α-Trehalose, 3-Hydroxycumarin, Threonsäure, Stachyose und Buchananin , L-α-Glycerylphosphorylcholin, α-Linolensäure, L-Phenylalanin und Palmitoleinsäure (Ergänzungstabelle S9). Die Metabolomergebnisse der Chiasamenanalyse sind in Abb. 2b nach der Hauptfunktionsgruppe jeder Verbindung zusammengefasst.

Polyphenole waren mit 15 % der chromatographischen Fläche die vierthäufigste chemische Gruppe reifer Samen. Unter den Polyphenolen war die Häufigkeit von RA deutlich höher als bei anderen Polyphenolen (Abb. 3). Die Datenbank MetaCyc wurde als Referenz verwendet, um den Stoffwechselweg und die an der RA-Biosynthese beteiligten Enzyme zu identifizieren. Da die Synthese von RA in Pflanzen ein komplexer Weg ist, an dem mehrere Enzyme, Substrate und Reaktionsprodukte29 beteiligt sind, haben wir eine vereinfachte Nomenklatur seiner Reaktionen implementiert, wie in Abb. 3 dargestellt. Kurz gesagt, sie beginnt mit L-Tyrosin (bezeichnet als Reaktionen A1). -2) oder aus L-Phenylalanin (Reaktionen B1-3) wird das Produkt dieser beiden Wege in 4-Cumaroyl-4'-hydroxyphenyllactat umgewandelt (Reaktion C1), und dieser Vorläufer wird an verschiedenen Positionen hydroxyliert, um RA zu bilden. Diese letzte Umwandlung wurde jedoch noch nicht vollständig beschrieben (Reaktionen D1-2 oder E1-2). Fast alle RA-Vorläufer und Zwischenprodukte (9 von 10) wurden in unserer metabolomischen Analyse nachgewiesen (Abb. 3). Annotierte Gene im Genom von S. hispanica wurden mithilfe der Ensemble Enzyme Prediction Pipeline (E2P2)-Software30 gescreent, um Gene mit enzymatischer Funktion zu identifizieren. Chia-Gene, die für Enzyme kodieren, die möglicherweise am RA-Signalweg beteiligt sind, wurden anhand ihrer EC-Nummernanmerkung identifiziert. Dieses Screening identifizierte 19 und 22 S. hispanica-Gene mit mutmaßlicher enzymatischer Aktivität für die Reaktionen A1-2 bzw. B1-3 (Abb. 4a; Ergänzungstabelle S10). Diese Analyse identifizierte jedoch keine spezifischen Gene für den C1-Schritt; Anschließend wurden Kandidatengene für diese Reaktion (EC 2.3.1.140) unter Verwendung zuvor beschriebener Rosmarinsäure-Synthase-Gene von Salvia miltiorrhiza und Melissa officinalis31,32 unter Verwendung von BLASTP durchsucht. Dieses Screening identifizierte 57 Kandidatengene für die Reaktion C1. Für die letzte Reaktion der RA-Synthese, die Reaktionen D1-2/E1-2, wurden 56 Kandidatengene identifiziert (Abb. 4a; Ergänzungstabelle S10). Um Kandidaten für die letzten beiden RA-Syntheseschritte besser zu definieren, wurde die Genexpression über verschiedene Gewebe und Entwicklungsstadien hinweg untersucht (in der Ergänzungstabelle S8 als „Lebenszyklus“-Proben angegeben). Diese Analyse zeigte, dass 7 dieser 113 Gene im Vergleich zu anderen Geweben ihr maximales Expressionsniveau im Samen aufwiesen (Abb. 4b). Daher ermöglichten diese Ergebnisse die Identifizierung von 48 Genen als primäre Kandidaten für die RA-Synthese in S. hispanica-Samen (19, 22, 5 und 2 Gene für die Reaktionen A1-2, B1-3, C1 und D1-2/E1-2). , bzw. Ergänzungstabelle S10), was darauf hindeutet, dass die RA-Signalwege von mehreren Multigenfamilien kodiert werden.

Die Metabolomanalyse ergab, dass Rosmarinsäure (RA) die am häufigsten vorkommende Verbindung in Chiasamen ist. RA wird im Vergleich zu anderen Polyphenolen auch in viel größerer Menge angereichert (Kreisdiagramm; Mitte). Dargestellt ist der Biosyntheseweg von RA mit Angabe der durch die Stoffwechselanalyse identifizierten Vorläufer und ihrer relativen Häufigkeit in Chiasamen. Die Nomenklatur zur Angabe von Signalwegreaktionen wird als blaue Kästchen dargestellt. Numerische Quelldaten für Polyphenole finden Sie in der Ergänzungstabelle S9.

a Vereinfachte Darstellung des Rosmarinsäure (RA)-Synthesewegs und der Anzahl der Gene in S. hispanica mit potenzieller enzymatischer Aktivität für jede Reaktion. b Ansatz zur Reduzierung der Anzahl der Kandidatengene für den letzten Teil des RA-Signalwegs durch Auswahl der in Chiasamen stark exprimierten Gene (gestricheltes Rechteck). Expressionsprofile (Z-Score normalisiert) von RA-Genen in verschiedenen Geweben während des Lebenszyklus von S. hispanica. Gestrichelte Ellipsen zeigten die Hauptkandidaten für die Reaktionen C1, D1/D2 und E1/E2 an. Probenbeschreibungen und Abkürzungen ähneln denen in Abb. 2.

Gene, die mutmaßlich an der Schleimproduktion und -freisetzung von S. hispanica-Samen beteiligt sind, wurden mithilfe einer Reihe schleimspezifischer Gene identifiziert, über die zuvor für Samen von Arabidopsis thaliana berichtet wurde33. Ein auf Homologie basierender BLASTP-Ansatz identifizierte 108 schleimbezogene Gene in S. hispanica (Ergänzungstabelle S11 und Abb. S13). Zu den Schleim-bezogenen Genen mit einer signifikanten Anzahl von Kopien im Chia-Genom gehören CSLA2 (6 Kopien), CESA2 (5 Kopien) sowie ADK1, COBL2, MUM4/RHM2 und RRT1 (alle mit vier Kopien) (Ergänzende Abb. S13). Diese Gene wurden nach ihrer vorgeschlagenen Funktion in a) Schleimsynthese, b) Schleimmodifikation, c) Schleimstabilisierung und d) Schleimsekretion klassifiziert oder sind an e) Zellwandsynthese und -modifikation, f) Hormonsynthese und -wahrnehmung und g beteiligt ) Transkriptionswege (Abb. 5a). Diese Analyse zeigte, dass Gene, die zur Kategorie der Schleimsynthese gehören, im Chia-Genom signifikant erweitert waren (28 Gene im Vergleich zu 12 in A. thaliana). Von diesen wurden nur zwei Genpaare als Tandem-Genduplikationen identifiziert, die Homologen der Arabidopsis-Schleimsynthesegene CSLA2 und GAUT11 (Ergänzungstabelle S11). Unter Verwendung verfügbarer RNA-seq-Daten wurde die Genexpression schleimbezogener Gene während der Samenentwicklung 3, 7, 14, 21 und 28 Tage nach der Blüte (DAF) untersucht34. Diese Analyse zeigte, dass 72 von 108 Schleim-bezogenen Genen eine maximale Expression bei 7 DAF aufweisen (Abb. 5b). Alle Schleimgenkategorien wurden im Chia-Genom hinsichtlich der Anzahl der Gene in Arabidopsis erweitert, mit Ausnahme der Gruppe der Transkriptionsfaktoren (TFs). Daher wurde eine Genregulationsnetzwerkanalyse durchgeführt, um TFs zu identifizieren, die die Schleimproduktion in Chiasamen regulieren könnten. Mithilfe der RegEnrich35-Pipeline wurde ein gewichtetes Genkorrelationsnetzwerk erstellt, das dann gefiltert wurde, um die oberen 5 % der höchsten TF-Genkorrelationen beizubehalten, die schleimbezogene Gene enthielten (Abb. 6). Das resultierende Netzwerk umfasst 16 potenzielle regulatorische Gene der Schleimproduktion von Chiasamen, darunter Mitglieder der Transkriptionsfaktorfamilien AP2, ARF, bHLH, bZIP, C3H, GRF, NAC, MIKC MADS, MYB und TALE. Bemerkenswerterweise identifizierte diese Analyse Homologe von fünf TFs, von denen zuvor berichtet wurde, dass sie den Schleimstoffwechsel in Arabidopsis-Samen regulieren (Abb. 6).

Eine Reihe von schleimbezogenen Genen in Arabidopsis thaliana (grün) und deren Homologen, die in S. hispanica (blau) identifiziert wurden. Gene wurden nach ihrer vorgeschlagenen Funktion oder ihrem Gentyp gruppiert. b Expressionsprofil schleimbezogener Gene während der Samenentwicklung in S. hispanica. Genexpression (Z-Score normalisiert) an verschiedenen Tagen nach der Blüte (DAF).

Die Analyse des Genregulationsnetzwerks ermöglichte die Identifizierung von Transkriptionsfaktoren (TFs) mit signifikanten Korrelationen mit schleimbezogenen Genen. Vorgeschlagene TFs, die als Regulatoren für die Schleimproduktion in S. hispanica fungieren, sind in roten Rauten angegeben. Die Tabelle gibt das Arabidopsis-Homolog jedes TF an, und von den fett gedruckten (*) wurde bereits früher berichtet, dass sie an der Samenschleimsynthese beteiligt sind. Die Netzwerkinferenz wurde mit dem RegEnrich-Paket durchgeführt. Gene werden als Kreise dargestellt (die Farbe zeigt ihre vorgeschlagene Funktion an), und die Kantengewichtung gibt die Signifikanz der Korrelation an (eine dicke Linie zeigt eine starke TF-Gen-Korrelation). Gene, die als MICK MADS angezeigt werden, werden in einigen Studien auch als SHP bezeichnet.

Mit Samenschleim assoziierte Proteine ​​sind wesentliche Bestandteile für dessen Struktur. Daher wurde eine Proteomanalyse durchgeführt, um Proteine ​​im Samenschleim von S. hispanica zu identifizieren. Schleim wurde aus aufgesaugten Chiasamen extrahiert, mit Trypsin verdaut und durch Flüssigkeitschromatographie gekoppelt mit Massenspektrometrie (LC-MS) analysiert. Die Analyse der mittels LC-MS identifizierten Peptide ermöglichte die Identifizierung von 95 Proteinen in der Chia-Schleimprobe. Diese Proteine ​​wurden mithilfe der Homologenbeschreibung von PANZER, InterPro und A. thaliana funktionell annotiert, um eine Klassifizierung nach ihrer Proteinfamilie und biologischen Aktivität zu erstellen (Supplementary Data S1). Wir haben auch 11 Glykoproteine ​​mithilfe der Byonic-Software identifiziert, die auch die an die Proteine ​​gebundenen Glykane bestimmte (Ergänzungstabelle S12). Im Chia-Schleim identifizierte Glykoproteine ​​sind an verschiedenen Funktionen beteiligt, darunter an mindestens drei der sogenannten Dirigent-Proteine ​​(DIR), die am Sekundärstoffwechsel beteiligt sind. Die Expressionsanalyse zeigt, dass Gene, die für Proteine ​​kodieren, die in den Kohlenhydrat- und Lipidstoffwechsel eingeteilt sind, hauptsächlich 7 DAF exprimiert werden, was mit der maximalen Expression der zuvor identifizierten schleimbezogenen Gene korreliert (ergänzende Abbildung S14), wohingegen Schleimproteine, die mit abiotischem Stress in Zusammenhang stehen, wie LEA werden hauptsächlich am Ende der Entwicklung der Chiasamen exprimiert. Um schließlich mögliche Verunreinigungen im Chia-Schleim-Proteom zu entfernen, wurden Proteine ​​mit einer relativen Häufigkeit von <0, 1% herausgefiltert (Ergänzungstabelle S13). Diese Analyse ergab einen hochsicheren Satz von 37 Proteinen im Chiasamenschleim, die hauptsächlich durch Samenspeicherproteine, Proteine ​​im Zusammenhang mit dem Lipidstoffwechsel, Proteine ​​in der späten Embryogenese reichlich vorhandener Proteine ​​(LEA) und einige im Zusammenhang mit dem Sekundärstoffwechsel repräsentiert werden (Tabelle 1).

In letzter Zeit besteht ein erhöhtes Interesse daran, Chia als Hauptpflanze für den menschlichen Verzehr und als Quelle bioaktiver Verbindungen zu entwickeln. Die weltweite Produktion von Chiasamen hat in den letzten Jahrzehnten zugenommen36 und einige Studien sagen voraus, dass der globale Chia-Markt in den folgenden Jahren weiter wachsen wird37. Allerdings müssen die Informationen und Ressourcen für die genetische Verbesserung noch verbessert werden. Diese Studie liefert wichtige genomische Ressourcen für das Verständnis der genetischen Basis relevanter samenbezogener Merkmale in S. hispanica. Mithilfe von ONT- und Illumina-Sequenzierung und Gerüstbau auf Chromosomenebene mit Hi-C-Daten wurde eine hochwertige S. hispanica-Genomreferenz erstellt. Die endgültige Genomreferenz zeigt eine hohe Kontiguität: Mehr als die Hälfte der Anordnung besteht aus nur drei Gerüsten (Pseudochromosomen) und einer N50-Metrik von 61, 89 Mb (Ergänzungstabelle S3). Im Vergleich zu zuvor berichteten S. hispanica-Genomen, die mit PacBio16 sequenziert wurden, weist die in dieser Studie erzeugte Anordnung eine signifikante Verbesserung bei der Erfassung wiederholter Regionen wie Zentromeren (Abb. 1a; ergänzende Abbildung S9) und der Identifizierung telomerer Wiederholungen auf einige Chromosomen (Ergänzende Abbildung S4). Stark repetitive Regionen sind schwer zu rekonstruieren, und die Genomassemblierung mithilfe der PacBio-Sequenzierung könnte in großen repetitiven Regionen fehlschlagen38. Die erfolgreiche Rekonstruktion und Identifizierung zentromerer Regionen in unserem Chia-Genom zeigt, dass wir mithilfe ultralanger ONT-Reads Genomregionen mit einem hohen Anteil an Wiederholungen abdecken konnten. Beispielsweise sind die über 600 Wiederholungen, die in der zentromeren Region von chr5 vorhanden sind, im selben Chromosom der zuvor berichteten Chia-PacBio-Anordnung nur schwach vertreten. Interessanterweise weist das Zentromer von chr5 eine große Tandemanordnung auf, bei der die meisten zentromeren Wiederholungen nebeneinander liegen und nur durch zwei Basen getrennt sind.

Eine verbesserte Annotation des S. hispanica-Genoms wurde in der vorliegenden Studie mit der Vorhersage von 34.748 proteinkodierenden Genen (im Vergleich zu 31.069 in der australischen Sorte gemeldeten Genen16) und einem fast vollständigen Satz konservierter Embryophytenorthologe (97 % vollständige BUSCOs im Vergleich) erhalten bis 93,2 % der PacBio-Baugruppe; ergänzende Abbildung S7). Ein Vergleich der Genome der mexikanischen Chia-Sorte mit dem der australischen Sorte16 ergab eine hohe Übereinstimmung bei einigen Merkmalen des S. hispanica-Genoms. In beiden Studien wurde ein GC-Gehalt von etwa 36,6 % ermittelt, ein ähnlicher Anteil repetitiver Sequenzen, wobei die LTR-Elemente Gypsy und Copia am häufigsten vorkommen. Allerdings war die geschätzte Genomgröße für die mexikanische Sorte (358,3 MB) etwas größer als für die australische (354,5 MB). Die Genomausrichtung zeigte eine hohe Kollinearität zwischen mexikanischen und australischen Chia-Genomen (ergänzende Abbildung S5); In diesen beiden Anordnungen befand sich jedoch ein 4, 6-MB-Fragment in unterschiedlichen Chromosomen (ergänzende Abbildung S5). Unsere Analysen zeigten, dass dieses Genomfragment Teil von chr1 ist (ergänzende Abbildung S6). Darüber hinaus ordnete ein kürzlich veröffentlichtes Chia-Genom, das sich ebenfalls auf Chromosomenebene befindet, dasselbe Genomfragment chr1 zu, was unsere Ergebnisse unterstützt39.

DNA-Methylierung ist eine epigenetische Modifikation der Cytosinbase, die für die Regulierung der Genexpression und Genomstabilität in Pflanzen wichtig ist und die Entwicklungsprozesse und Reaktionen von Pflanzen auf Umweltfaktoren beeinflusst40,41. Es wurde über Methylome mit Einzelbasenauflösung verschiedener Pflanzenarten berichtet42,43,44, die Informationen über die Dynamik der DNA-Methylierungswege42,44, die molekulare Funktion und die Genomverteilung40,45 liefern. Die Methylierungsmuster von Salvia hispanica zeigen globale DNA-Prozentanteile, wie sie zuvor für andere Pflanzenmethylome berichtet wurden (ergänzende Abbildung S8), für die CG der vorherrschende DNA-Methylierungskontext ist, gefolgt von CHH und CHG42, 43, 44. Die Analyse der DNA-Methylierungsverteilung entlang der Genkörper zeigte ein ähnliches Verhalten wie bei Angiospermen43,46, wo niedrige DNA-Methylierungsgrade um die Start-/Stopp-Translationsstellen herum festgestellt werden. Insbesondere zeigte die DNA-Methylierung einen signifikanten Anstieg der Methylierungsdichte in TEs, was mit der Rolle der DNA-Methylierung bei der Stummschaltung solcher repetitiver Elemente übereinstimmt47,48. Eine weitere Analyse der DNA-Methylierungsmuster könnte Erkenntnisse darüber liefern, wie die DNA-Methylierung Entwicklungsveränderungen, Genexpression und Reaktionen auf abiotischen und biotischen Stress bei Chia reguliert. Darüber hinaus können globale Methylierungsstudien von entscheidender Bedeutung sein, um den Sekundärstoffwechsel in Chia zu verstehen, wie bereits für S. miltiorrhiza berichtet, wo die chemische Hemmung der DNA-Methylierung mithilfe von 5-Azacytidin die Anreicherung von Phenolsäure durch Veränderung der DNA-Methylierungsmuster in Genpromotoren, einschließlich des Promotors, erheblich steigerte des RA-Synthase-Gens49.

Salvia hispanica ist vor allem aufgrund des Nährwerts und der gesundheitsfördernden Eigenschaften seiner Samen wertvoll50. In einer früheren Studie wurde das einzigartig ausgeprägte Samentranskriptom im Vergleich zu anderen Entwicklungsstadien von S. hispanica hervorgehoben28. Tatsächlich weisen Chiasamen im Vergleich zu anderen Geweben oder Wachstumsstadien ein einzigartiges Expressionsmuster auf (Abb. 2a). Die in der vorliegenden Studie analysierten Chia-Samen bestätigen, dass Fettsäuren (FA) der am häufigsten vorkommende Bestandteil sind (26 % der gesamten chromatographischen Fläche; Abb. 2b). Der Lipidgehalt in Chiasamen kann zwischen 20 % und 34 % liegen und sie sind besonders reich an mehrfach ungesättigten FA, hauptsächlich α-Linolensäure6. Unsere Lipidomanalyse zeigte, dass α-Linolensäure eine der am häufigsten vorkommenden Samenverbindungen ist, mindestens 3,5-mal höher als Linolsäure (Ergänzungstabelle S9). Andere Autoren berichteten über Konzentrationen von α-Linolensäure von 59,9 bis 63,2 % und von Linolsäure von 18,9 bis 20,1 % für Chiasamen, was auf ein Verhältnis von 3:1 (ω-3:ω-6)51 hinweist. Aufgrund seines hohen Gehalts an ω-3-Fettsäuren wurden mehrere Studien durchgeführt, um den genetischen Weg zu identifizieren und aufzuklären, der an der Lipidbiosynthese von Chia beteiligt ist16,34,39,52.

Arten der Gattung Salvia gelten als reichhaltige Polyphenolquellen mit vielfältigen therapeutischen Anwendungen53. Die Metabolomanalyse reifer Chiasamen ergab, dass 15 % der gesamten chromatographischen Fläche polyphenolischen Verbindungen entsprechen (Abb. 2b). Die am häufigsten in S. hispanica-Samen identifizierte Verbindung war Rosmarinsäure (RA), außerdem das am häufigsten vorkommende Kaffeesäuredimer in Salvia-Arten (Ergänzungstabelle S9). In einem früheren Bericht wurde festgestellt, dass RA in Chiasamen Konzentrationen von bis zu 0,92 mg/g aufweist14. Zu den Hauptaktivitäten von RA gehören antioxidative, entzündungshemmende, adstringierende, antimutagene, antibakterielle und antivirale Eigenschaften54. Der hohe Gehalt an RA in Chiasamen könnte auf eine Abwehrfunktion gegen Krankheitserreger hinweisen und aufgrund seiner antioxidativen Aktivität die Lipidperoxidation verhindern. Die Synthese von RA in Pflanzen ist komplex und umfasst einen nichtlinearen Weg, der mindestens acht verschiedene Reaktionen umfasst29. Eine detaillierte Stoffwechselanalyse identifizierte alle Vorläufer und Zwischenprodukte des RA-Signalwegs in Chiasamen mit Ausnahme von 4-Cumaroyl-CoA (Abb. 3). Außerdem haben wir eine umfassende Gensuche durchgeführt, um Kandidatengene für jede Reaktion dieses Signalwegs zu identifizieren (Ergänzungstabelle S10). Da der letzte Teil der RA-Synthese noch nicht vollständig aufgeklärt ist, wurden im Genom von S. hispanica viele Enzyme identifiziert, die möglicherweise die letzten Hydroxylierungsschritte durchführen. Daher wurden Gene mit mutmaßlicher enzymatischer Funktion für diese Reaktionen auf eine höhere Expression in Samen im Vergleich zu anderen Geweben untersucht. Insgesamt haben wir einen Satz von 48 Genen für die Synthese von RA in S. hispanica-Samen identifiziert und vorgeschlagen (Abb. 4). Das Wissen über die Gene, die am RA-Signalweg beteiligt sind, birgt ein wichtiges Potenzial für die zukünftige Biotechnik, um die Produktion von RA oder seinen Derivaten in aufstrebenden Nutzpflanzen wie Chia zu steigern.

Samenschleim ist ein weiterer wertvoller Bestandteil von S. hispanica mit vielen Anwendungsmöglichkeiten. Es wird in der Lebensmittelindustrie als Zutatenersatz in Back-, Milch- und Fleischprodukten verwendet55. Chia-Schleim weist außergewöhnliche physikalische Eigenschaften auf und kann für die Herstellung von Nanokompositen oder die kontrollierte Freisetzung von Arzneimitteln geeignet sein56. Zu den potenziellen Anwendungen gehört darüber hinaus auch die Herstellung essbarer Folien als Ersatz für Kunststoffverpackungen57. Trotz seiner industriellen Bedeutung und möglichen zukünftigen technologischen Anwendungen müssen die detaillierte Zusammensetzung und die genetischen Komponenten, die an der Synthese von Chia-Schleim beteiligt sind, jedoch noch beschrieben werden. Diese Studie identifizierte Gene, die vermutlich am Schleimstoffwechsel der Samen von S. hispanica beteiligt sind, und deren Expression während der Samenentwicklung. Aktuelle Erkenntnisse über Gene, die an der Synthese, Stabilisierung, Sekretion und Modifikation von Samenschleim beteiligt sind, und wie sie reguliert werden, wurden in der Modellpflanze Arabidopsis thaliana58,59 beschrieben. Die Ergebnisse der Homologieanalyse zeigten, dass schleimbezogene Gene im Genom von S. hispanica erweitert wurden, hauptsächlich in der Kategorie der Schleimsynthese (Abb. 5a). Diese Gengruppe war im Chia-Genom im Vergleich zu Arabidopsis deutlich erweitert (Abb. 1c). Schleimbezogene Gene mit einer signifikanten Anzahl von Kopien im Chia-Genom erfüllen verschiedene Funktionen, darunter die Aufrechterhaltung der korrekten Struktur der anhaftenden Schleimschicht (CSLA2), die Mitwirkung an der Schleimsynthese (CESA2) und die Teilnahme an der Zelluloseablagerung in sekundären Zellwandstrukturen ( COBL2) und Gene, die zur Synthese von Zellwand-Pektinpolysacchariden (MUM4 und RRT1) erforderlich sind60,61,62,63,64. Schleim wurde als spezialisierte sekundäre Zellwand beschrieben65. Aktuelle Erkenntnisse deuten darauf hin, dass sich Schleim in der äußersten Epidermisschicht der Samenschale ansammelt, den sogenannten Mucilage Secretory Cells (MSC)59. Bei Arabidopsis zeigen diese MSC eine signifikante Produktion von Zellwandmaterial sieben Tage nach der Anthese (Embryo-Torpedo-Stadium)66. Interessanterweise haben die meisten im S. hispanica-Genom identifizierten schleimbezogenen Gene ihre maximale Expression in der frühen Samenentwicklung, genau bei sieben DAF (Abb. 5b). Darüber hinaus zeigen einige der am häufigsten vorkommenden schleimassoziierten Proteine, die wesentliche Komponenten für die Schleimstruktur darstellen könnten, auch während der frühen Entwicklung eine maximale Expression (ergänzende Abbildung S14).

Da mehrere an der Samenschleimproduktion beteiligte Arabidopsis-TFs kein direktes Homolog im Genom von S. hispanica aufwiesen (ergänzende Abbildung S13), wurde eine regulatorische Netzwerkanalyse durchgeführt, um mögliche Transkriptionsregulatoren von Chiasamenschleim zu identifizieren. Diese Analyse identifizierte 16 TFs als wichtige regulatorische Knoten für schleimbezogene Gene in S. hispanica (Abb. 6). Die Arabidopsis-Homologen von fünf dieser 16 mutmaßlichen Regulatoren wurden zuvor als TFs beschrieben, die die Samenschleimproduktion regulieren (einschließlich der Typen AP2, SHP1, MYB61 und KNAT7)33,59. Zu den weiteren potenziellen Regulierungsbehörden gehören TFs der Familien ARF, bHLH, bZIP, C3H, GRF, NAC, MIKC MADS und MYB. Es wurde berichtet, dass Mitglieder dieser TFs-Familien wesentliche Bestandteile der Transkriptionswege sind, die die Differenzierung der Samenschale, die Schleimsynthese und die Modifikation steuern58. Die maximale Expression der meisten dieser Regulatoren liegt bei sieben DAF (ergänzende Abbildung S15), was mit der höchsten Expression schleimbezogener Gene in S. hispanica-Samen korreliert (Abb. 5b). Die Visualisierung der Genexpressionsdaten ihrer Arabidopsis-Homologen (https://bar.utoronto.ca/eplant/) zeigte, dass die meisten der vorgeschlagenen Regulatoren während der Embryonalentwicklung hauptsächlich zwischen dem frühen Herzstadium und dem Torpedostadium exprimiert werden. Eine vorläufige Charakterisierung der Embryonalentwicklung von S. hispanica zeigte eine hohe Korrelation zwischen den frühen Entwicklungsstadien von Chia und Arabidopsis (ergänzende Abbildung S16). Zusammengenommen stimmen alle diese Erkenntnisse mit dem aktuellen Wissen über die Samenschleimproduktion in der Modellpflanze Arabidopsis überein. Das Verständnis der genetischen Grundlagen für die Schleimproduktion in S. hispanica könnte dazu genutzt werden, Schleim mit verbesserten Eigenschaften für industrielle oder technologische Zwecke biotechnologisch herzustellen.

Obwohl Proteine ​​in einem viel geringeren Anteil als Polysaccharide im Schleim vorhanden sind, spielen Proteine ​​eine wesentliche Rolle für die Dynamik und Funktionalität von Zellwänden67. Die vorliegende Studie identifizierte 37 Proteine ​​im Samenschleim von S. hispanica (Tabelle 1; Ergänzungstabelle S13), 12, die als Samenspeicherproteine ​​klassifiziert wurden, machten 67 % der Proteinhäufigkeit aus. Frühere Berichte deuteten darauf hin, dass Globuline der in Chiasamen identifizierten Hauptproteinfraktion entsprechen68; In dieser Studie wurde festgestellt, dass sie auch im Samenschleim vorhanden sind und hauptsächlich durch 11 S-Globuline repräsentiert werden (Ergänzungsdaten S1). Die Art der im Chia-Schleim identifizierten Proteine ​​ähnelt Gruppen, über die zuvor im Samenschalenschleim von Arabidopsis berichtet wurde69. Im Vergleich zum Samenschleim von Arabidopsis weist Chiaschleim eine höhere Anzahl an Samenspeicher- und LEA-Proteinen sowie eine deutlich geringere Anzahl an Kohlenhydraten und antioxidativen Enzymen auf. Chia-Schleimproteine, die herausragende Aktivitäten zeigen, umfassen DIR-Proteine, die für die Modulation des Zellwandstoffwechsels während der Entwicklung und als Reaktion auf abiotische und biotische Stressbedingungen charakterisiert sind70,71. Insbesondere sind DIR-Proteine ​​an der Lignan- und Ligninbiosynthese beteiligt. Lignane spielen eine wesentliche Rolle bei der pflanzlichen Abwehrreaktion gegen Krankheitserreger72,73, wohingegen Lignin ein entscheidender Bestandteil pflanzlicher Gefäßsysteme und für die Aufrechterhaltung des Zellwandturgors und der Porosität ist74,75. Es wurde beschrieben, dass DIR-Proteine ​​bei Pflanzen eine Rolle bei der Samenschalen-schützenden Neolignan-Byosinthese71, abiotischen76,77 und biotischen Belastungen78,79 spielen. Es wurde berichtet, dass Samenschleim die Samenkeimung und die Keimlingsbildung beeinflusst80, und DIR-Proteine ​​könnten bei biotischen und biotischen Belastungen zu diesen von Schleim vorgeschlagenen Funktionen beitragen.

Derzeit wird S. hispanica hauptsächlich zur Samenproduktion angebaut, seine Blätter stellen jedoch eine zusätzliche Quelle verschiedener Metaboliten mit antioxidativen und antimikrobiellen Eigenschaften dar81. Es wurden einige Anstrengungen unternommen, relevante Sekundärstoffwechselwege in Chiablättern zu untersuchen, beispielsweise die Terpenoid-Biosynthese82. Zweifellos werden molekulare Informationen dazu beitragen, den einzigartigen Sekundärstoffwechsel von Chia zu untersuchen und dazu beitragen, diese Art weltweit als bedeutende Kulturpflanze zu etablieren. Das in dieser Arbeit beschriebene Genom, die Proteine, Gene und Signalwege könnten die Grundlage für die Verbesserung der Produktion und Qualität von Chia-Verbindungen und -Derivaten bilden.

Salvia hispanica-Pflanzen einer mexikanischen Sorte (ergänzende Abbildung S1) wurden in einer begehbaren Conviron-Kammer, die in den ersten drei Monaten für 16 Stunden Licht auf 26 °C eingestellt war, gezüchtet und dann auf 12 Stunden Licht umgestellt, um die Blüte zu induzieren. Kerne von S. hispanica wurden wie von Peterson (1997)83 beschrieben isoliert. Kurz gesagt, junge Blätter eines einzelnen S. hispanica-Individuums (ca. 2 Gramm) wurden gesammelt und in flüssigem Stickstoff gemahlen. Das geerdete Gewebe wurde dann in ein neues Falcon-Röhrchen in flüssigen Stickstoff überführt und bis zur Verwendung bei -80 °C gelagert. Die Kernisolierung erfolgte durch Zugabe von 40 ml Nuclei Isolation Buffer (NIB) und Inkubation für 10 Minuten bei 4 °C. Das Lysat wurde durch 3 Schichten Miracloth filtriert, in einem Röhrchen auf Eis gesammelt und 10 Minuten lang bei 1000 x g und 4 °C zentrifugiert, um Kerne auszufällen. Das ausgefällte Kernpellet wurde dann in Percoll 70 % in NIB resuspendiert und 10 Minuten bei 600 x g zentrifugiert. Das Kernpellet wurde mit NIB gewaschen und zweimal bei 600 x g zentrifugiert. Überschüssiges NIB wurde durch Pipettieren entfernt und das Kernpellet wurde entweder für die DNA-Isolierung mit hohem Molekulargewicht (HMW) verwendet oder mit flüssigem Stickstoff schockgefroren und bei -80 °C gelagert.

Gemäß den Anweisungen des Herstellers wurde ein Aliquot von 200 µl Kernpellet für die HMW-DNA-Isolierung unter Verwendung des Nanobind Plant Nuclei Big DNA-Kits (Circulomics, USA) verwendet. Die Integrität der genomischen DNA wurde mit dem Agilent 4200 TapeStation System (Agilent Genomics) bewertet. Die gereinigte HMW-DNA wurde für die ONT-Sequenzierung unter Verwendung des Ligationssequenzierungskits SQK-LSK109 gemäß den Anweisungen des Herstellers (ONT, Oxford, UK) vorbereitet. Bibliotheken wurden auf R9.4.1-Durchflusszellen geladen und mit einem MinION Mk1C-Instrument (ONT, Oxford, UK) sequenziert. Die Illumina-Short-Read-Sequenzierung wurde von Novogene (Peking, China) auf einem Illumina NovaSeq 6000 im PE150-Modus durchgeführt. Für die Hi-C-Proben wurden schockgefrorene Zellkernpellets (∼20 µl) auf Eis aufgetaut und gemäß dem Protokoll vernetzt, das im Abschnitt „Crosslinking – Low Input“ des Arima-HiC 2.0 Kit User Guide for Mammalian Cell Lines (Arima Genomics) beschrieben ist. . Die vernetzte Kernsuspension wurde dann in 130 µl Elutionspuffer eluiert und mit einem fokussierten Ultraschallgerät Covaris E220 auf eine durchschnittliche Fragmentgröße von 550–600 bp fragmentiert. Anschließend wurde die fragmentierte DNA mithilfe von Magnetkügelchen (Magbind Total Pure NGS, Omega BIO-TEK) auf eine Größenverteilung von >400 bp größenselektiert und als Input zur Herstellung proximal ligierter DNA gemäß den Anweisungen im Arima-HiC 2.0-Protokollhandbuch verwendet. Hi-C-Gerüstbibliotheken wurden mit dem Swift Accel NGS 2 S Plus Kit gemäß den Anweisungen des Herstellers erstellt.

Die Illumina-Lesewerte wurden mit TrimGalore (v0.6.6; https://github.com/FelixKrueger/TrimGalore) auf ihre Qualität getrimmt (für Adapter, minderwertige Basen). Jellyfish84 (v2.3.0) wurde für die k-mer (21-mer)-Häufigkeitsverteilung basierend auf den qualitätsgetrimmten Illumina-Messwerten verwendet. Das Ausgabehistogramm wurde verwendet, um die Genomgröße mit dem R-Paket findGSE85 (v1.94) abzuschätzen. Rohe ONT-Signale (Fast5-Dateien) wurden mit Guppy (v5.0.16) als Basis aufgerufen und Sequenzierungsadapter wurden mit Porechop (v0.2.4; https://github.com/rrwick/Porechop) abgeschnitten. Die verarbeiteten ONT-Lesevorgänge wurden mit der Software NECAT17 (v0.0.1) fehlerkorrigiert und zusammengestellt. Die Ausgabebaugruppe wurde mithilfe von sechs Iterationen von Pilon18 (v1.24) mit Illumina-Daten poliert. Primäre Contigs wurden mit Purge Haplotigs19 (v1.1.2) identifiziert. Die Contigs wurden mithilfe von Juicer20- und 3D-DNA21-Pipelines mit Hi-C-Daten erstellt. Die Gerüste wurden manuell kuratiert, um eine Genomanordnung mit Gerüsten in Chromosomenlänge zu erstellen. Bei jedem Schritt dieses Prozesses wurde die Qualität der Baugruppen mithilfe von BUSCO22 (v5.4.3) mit Embryophyten- und Eudicots-Datensätzen (odb10) und der Illumina-Datenausrichtungsrate mithilfe von Bowtie286 bewertet. Zentromere Tandemwiederholungen wurden mit Tandem Repeats Finder23 (v4.09.1) und nhmmer (v3.3.2; hmmer.org) identifiziert. Vor der Definition ihrer Standorte wurden mögliche zentromere Regionen manuell mit Methylierung (5mC-Zählungen), Gendichte und repetitivem DNA-Gehalt verglichen. Telomerwiederholungen wurden mithilfe des Telomere Identification ToolKit (v0.2.0; https://github.com/tolkit/telomeric-identifier) ​​identifiziert, indem die typische pflanzliche Telomersequenz („TTTAGGG“) durchsucht wurde.

Minimap287 (v2.24) wurde verwendet, um die in dieser Studie generierte Genomreferenz mit dem zuvor berichteten Chia-Genom abzugleichen16. Das Online-Tool D-Genies88 wurde verwendet, um Alignments des gesamten Genoms zu visualisieren. Als Hauptunterschied zwischen diesen Baugruppen wurde ein Fragment von etwa 4,6 MB identifiziert. Um den korrekten genomischen Standort dieser Region zu bestimmen, wurden detaillierte Analysen durchgeführt. Zunächst wurde diese Region aufgeteilt und als weiterer Contig betrachtet, um eine Hi-C-Datenanalyse unter Verwendung zweier unabhängiger Datensätze durchzuführen (Hi-C-Daten, die in dieser Studie generiert wurden, und eine verfügbare Daten-SRA-Zugangsnummer: DRX325318). Hi-C-Kontakt-Heatmaps wurden mit Juicebox20 (v1.11.08) generiert und visualisiert. Schließlich bestimmten die Kontakthäufigkeiten und die Anzahl der gepaarten Hi-C-Alignments die wahrscheinlichste genomische Position dieses Fragments.

Der Methylierungsaufruf unter Verwendung von ONT-Daten wurde mithilfe der DeepSignal-Pflanzenpipeline89 durchgeführt. ONT-Lesevorgänge wurden mit dem Befehl multi_to_single_fast5, der im Paket ont_fast5_api enthalten ist, in einzelne Fast5-Dateien konvertiert. Die Nanopore-Lesevorgänge und Fast5-Dateien wurden dann mit den Befehlen tombo preprocess und tombo resquiggle vorverarbeitet. Als nächstes wurde der Befehl deepsignal_plant call_mods verwendet, um den DNA-Methylierungsaufruf durchzuführen und das 5mC-Modell auszuführen, das mit Arabidopsis thaliana und Oryza sativa R9.4 1D-Reads trainiert wurde (model.dp2.CNN.arabnrice21_120m_R9.4plus_tem.bn13_sn16.both_bilstm.epoch6.ckpt). Nach der DeepSignal-Pflanzenpipeline wurden hochwertige 5mC-Positionen aus 4 verschiedenen Nanoporenläufen erhalten, und nur die 5mC-Positionen, die in mindestens 2 Replikaten vorhanden waren, wurden für die weitere Datenanalyse beibehalten.

Die Genomassemblierung wurde durch drei Runden von MAKER-P25,26 (v3.01.03) annotiert. In der ersten Runde wurden 1) als EST-Beweistranskripte verwendet, die durch Alignment von insgesamt 66 verfügbaren RNA-seq-Bibliotheken28,34,52,82 mit HISAT290 (v2.2.1) und Rekonstruktion der Transkripte aus der Alignmentdatei mit StringTie91 (v2.2.1) erhalten wurden; 2) als Proteinbeweis den OrthoDB obd10-Datensatz der Pflanze, der auf der Github-Webseite von ProtHint (https://github.com/gatech-genemark/ProtHint) verfügbar ist, gefiltert, um nur Arten zu behalten, die zur Ordnung der Lamiales gehören; 3) als Wiederholungsdatei die De-novo-Wiederholungssequenzen, die mit RepeatModeler (v2.0.3) mit RepeatMasker (http://www.repeatmasker.org; v4.1.2-p1), Dfam92 (v3.6) und einem LTR_retriever93 erhalten wurden ( v2.9.0) Lauf der Ergebnisse von LTR_Finder_parallel94,95 und ltr_harvest96. In der zweiten Runde wurden als Eingabe die Maker-gff3-Datei aus der ersten Runde, eine SNAP-hmm-Datei, die aus Genmodellen der ersten Runde erhalten wurde, und die Augustus97-Genmodelle aus einem BUSCO98-Lauf nach der Methode von Daren Card verwendet (https://darencard.net/blog/2017). -05-16-maker-genome-annotation/; Abschnitt Augustus) mit dem Datensatz eudicots_odb10. Die dritte Runde wurde als zweite Runde ausgeführt, wobei die Ausgabedateien der zweiten Runde als Eingaben verwendet wurden. Die gff3-Datei der Runde 3 wurde verwendet, um die CDS-Sequenzen mit einem benutzerdefinierten Perl-Skript neu zu erstellen, die mit dem transeq-Programm aus der EMBOSS-Suite (v6.6.0) in Proteinsequenzen übersetzt wurden. Die Vollständigkeit der Genomannotation wurde mithilfe von BUSCO22 mit Embryophyten- und Eudicots-Datensätzen (odb10) bewertet.

Anmerkungen zur Genontologie wurden mithilfe einer vereinfachten Version der MAIZE-Gamer-Pipeline99 zugewiesen. Kurz gesagt, Annotationen wurden als GO-Annotationen der reziproken BLASTP-Besthits im Vergleich zu Araport11- und UniProt-Swiss-Prot-Proteinen aus neun Pflanzenarten (Glycine max, Oryza sativa subsp. japonica, Populus trichocarpa, Solanum lycopersicum, Sorghum bicolor, Vitis vinifera, Brachypodium) zugewiesen distachyon, Physcomitrium patens und Chlamydomonas reinhardtii), die GO-Anmerkungen aus einer InterProScan100-Analyse (v5.57-90.0) und die GO-Anmerkungen vom funktionalen Annotations-Webserver PANNZER2101 mit einem PPV-Wert von mindestens 0,5. Alle diese GO-Anmerkungen wurden in einer nicht redundanten GAF-Datei zusammengeführt.

Chiasamen (1 g trockene Samen) wurden in flüssigem Stickstoff gemahlen und über Nacht gefriergetrocknet. Anschließend wurden 300 mg Chiasamenpulver mit 3 ml einer Methanol:Chloroform-Mischung (1:1 v/v) extrahiert, 5 Minuten lang beschallt und 10 Minuten lang bei 4000 U/min zentrifugiert. Sowohl die überstehende als auch die unlösliche Phase wurden zur weiteren Verarbeitung gesammelt. Ein Aliquot von 2 ml Überstand wurde im Schnellvakuum getrocknet und später in 200 µL 95 %igem Ethanol in HPLC-Qualität rekonstituiert. Die unlösliche Phase wurde über Nacht im Stickstoffstrom getrocknet und dann mit 1 ml Wasser:Methanol-Gemisch (60:40 Vol./Vol.) erneut extrahiert. Dieser polare Extrakt wurde mit 0,2 µm rekonstituierten Zellulosefiltern gefiltert und in das Vanquish Flex UHPLC-Chromatographiesystem injiziert, das an den Massenspektrometriedetektor Exploris 240 (Thermo Scientific) gekoppelt war.

Der Lipidextrakt von Chiasamen wurde mit einer 150 × 2,1 mm C18-Säule (Thermo Scientific) unter Verwendung einer Gradientenmethode aus Wasser 0,1 % Ameisensäure (Phase A) und Isopropylalkohol 2 mM Ammoniumformiat (Phase B) analysiert. Die chromatographischen Bedingungen waren wie folgt: Beginn mit 10 % B von 0 bis 3 Minuten, dann Erhöhung der B-Konzentration auf 50 % von 3 bis 7 Minuten und weiter 50–100 % B von 7 bis 20 Minuten. Die 100 % B wurden 6 Minuten lang gehalten und dann 26 bis 30 Minuten lang auf 10 % B äquilibriert. Die Säulentemperatur betrug 50 °C und der Fluss wurde konstant bei 200 µl/min gehalten. Die Detektion wurde sowohl im positiven als auch im negativen Ionisationsmodus bei 4500 V bzw. 1200 V erreicht. Für die intensivsten 20 Peaks in jedem vollständigen Scan wurde datenabhängiges MS/MS (DDA) erfasst, wobei für 10 aufeinanderfolgende Scans dynamischer Ausschluss angewendet wurde. Die Datenanalyse erfolgte mit der LipidSearch 5.0-Software (Thermo Scientific) mit der LipidMaps-Onlinedatenbank102.

Polarer Metabolitenextrakt wurde in eine Umkehrphasen-C18-Säule injiziert und mithilfe einer Gradientenmethode in Wasser, 0,1 % Ameisensäure (A) und Methanol, 0,1 % Ameisensäure (B) getrennt. Der anfängliche Fluss wurde auf 200 µl/min, 5 % B für 4 Minuten eingestellt und dann auf 100 % B in 13 Minuten erhöht. Dieser Zustand wurde 4 Minuten lang aufrechterhalten und dann auf 5 % B zurückgesetzt, um 4 Minuten lang wieder ins Gleichgewicht zu kommen. Für den positiven und negativen Nachweismodus mit MS/MS DDA wurden unabhängige Läufe verwendet. Rohdateien wurden in die Compound Discoverer 3.3-Software (Thermo Scientific) hochgeladen und mithilfe der Metabolomics-Pipeline analysiert. Ergebnistabellen für positive und negative Ionisationsmodi wurden zusammengeführt und weiter untersucht, um doppelte Identifizierungen zu entfernen. Die Metabolitenidentifizierung erfolgte mithilfe der Online-Datenbanken mzCloud, KEGG und BioCyc und wurde manuell weiter kuratiert.

Die Schleimextraktion erfolgte nach Tsai et al.69. Kurz gesagt, Samen (2 g trockene Samen; 3 Wiederholungen) wurden in Wasser 1:10 w/v eingeweicht und 1 Stunde lang in einen Orbitalschüttler gegeben. Anschließend in flüssigen Stickstoff überführen und 48 h gefriergetrocknet. Der Schleim wurde mit einem kleinen Sieb vom Samen getrennt und gesammelt, um seinen Proteingehalt zu quantifizieren. Für die Proteomanalyse wurden 300 mg getrockneter Chia-Schleim mit 30 ml 50 mM Ammoniumbicarbonat (ABC)-Puffer gemischt. Anschließend wurde ein Aliquot von 100 µl des resuspendierten Schleims in ein Filtermikroröhrchen mit einem Cut-off von 100 kDa gegeben und zur Proteindenaturierung 15 Minuten lang bei 90 °C in einem Wasserbad inkubiert. Der Proteinverdau wurde auf der Oberfläche des oben erwähnten Filters abgeschlossen. Zunächst wurde Dithiothreitol (DTT) zugesetzt, um die Proteindisulfidbindungen durch 45-minütige Inkubation bei 60 °C zu reduzieren. Anschließend wurden die Cysteinreste der denaturierten und reduzierten Proteine ​​60 Minuten lang mit Iodacetamid (IAA) bei 37 °C alkyliert. Die Probe wurde mit Trypsin-Enzym gemäß den Anweisungen des Herstellers in einem Verhältnis von 1:25 (Gew./Gew.) 18 Stunden lang bei 37 °C verdaut. Schließlich wurden die tryptischen Verdauungen durch 10-minütige Zentrifugation bei 10.000 U/min vom Schleim getrennt. Die gewonnenen tryptischen Aufschlüsse wurden in einer Zentrifuge getrocknet und mit C18 Top Tips entsalzt. Die Proben wurden in 20 µl mobiler Phase (98 % Wasser, 2 % Acetonitril, 0,1 % Ameisensäure) resuspendiert. Die Proben wurden dann in einem Ultimate 3000 nanoLC mit einer PepMap RSLC C18-Chromatographiesäule (3 µm, 100 Å, 75 µm x 15 cm) analysiert. Die verwendeten mobilen Phasen waren A: Wasser 0,1 % Ameisensäure (FA) und B: Acetonitril:Wasser (80:20 v/v) 0,1 % FA. Die Methode begann mit 2 % B für bis zu 5 Minuten und steigerte sich dann auf 25 % B in 105 Minuten, 25–40 % von 105 auf 125 Minuten, 40–95 % B von 125–126 Minuten und zurück auf 2 % B bei 128 Min. für 6 Min. Die Detektion erfolgte in einem Orbitrap Exploris 240 (Thermo Scientific, USA) im Positivmodus, eingestellt auf 120.000 in der Orbitrap-Auflösung. DDA MS/MS wurde auf einen Intensitätsschwellenwert von 5 × 103 und die Ladezustände 2–8 eingestellt. Rohdatendateien wurden hochgeladen und mit Proteome Discoverer 2.5 und Byonic-Software verarbeitet. Die Proteinidentifizierung erfolgte anhand der vorhergesagten Proteine ​​im S. hispanica-Genom, wobei als Filter FDR ≤ 0,01 und mindestens 3 eindeutige Peptide in der Sequenz verwendet wurden. Zur Bestätigung der Identität der Glykoproteine ​​nutzen wir die Byonic-Software. Byonische Suche nach Glykosylierungen entlang des Protein-Peptid-Rückgrats, was eine genaue Identifizierung der an die Proteine ​​gebundenen Glykane ermöglicht.

Öffentlich verfügbare RNA-seq-Daten während des Lebenszyklus von S. hispanica, einschließlich verschiedener Gewebe und Wachstumsstadien28, wurden aus dem EMBL-EBI ArrayExpress (Versuchsnummer E-MTAB-5515) und zusätzlicher RNA-seq-Datensatz von S. hispanica während der Samenentwicklung34 abgerufen wurde aus der NCBI SRA-Datenbank abgerufen (Zugangsnummer PRJNA196477). Zu den Proben während des Lebenszyklus gehörten: Keimblatt und Spross nach 3 Tagen (3D); Blattprimordien (LP) und Spross bei 12D; 1. und 2. Blatt (P1P2), 3. und 4. Blatt (P3P4), 5., 6. und 7. Blatt (P5P6P7) und Internodium bei 69D; obere oder untere Hälfte des Traubenblütenstandes bei 158D; Blumen bei 159D; Blumen bei 164D; und trockene Samen. Zu den Proben während der Samenentwicklung gehörten: sich entwickelnde Samen 3, 7, 14, 21 und 28 Tage nach der Blüte. Eine detaillierte Beschreibung aller in diesen Transkriptomen enthaltenen Gewebetypen und Wachstumsstadien finden Sie in der Ergänzungstabelle S8. RNA-seq-Rohsequenzen wurden mit TrimGalore (v0.6.6) auf ihre Qualität getrimmt (für Adapter, Basen geringer Qualität). Die Genexpressionsanalyse während des Chia-Lebenszyklus wurde mit Kallisto103 (v0.44), normalisiert (CPM), quantifiziert. Der durchschnittliche CPM-Wert zwischen Replikaten wurde vor der Hauptkomponentenanalyse in den Z-Score umgewandelt (plotMDS limma package104). Die Ensemble Enzyme Prediction Pipeline wurde verwendet, um mutmaßliche Enzyme zu identifizieren und sie entsprechend ihrer vorhergesagten katalytischen Funktionen zu klassifizieren105. Kandidatengene für die RA-Biosynthese wurden anhand zuvor gemeldeter Zahlen der Enzyme Commission für ihre Synthese in Pflanzen identifiziert (2.6.1.5, 1.1.1.237, 4.3.1.5, 1.14.13.11, 6.2.1.12, 2.3.1.140)29. Homologe der Rosmarinsäuresynthase von S. miltiorrhiza und M. officinalis (GenBank: FJ906696.1 bzw. FR670523.1) wurden für die EC 2.3.1.140-Reaktion31,32 verwendet. Die Informationen zur Umwandlung von 4-Cumaroyl-4'-hydroxyphenyllactat in (R)-Rosmarinat wurden MetaCyc (EC 1.14.14.-) entnommen. Die Expressionsniveaus der RA-Kandidatengene während des Lebenszyklus wurden mit Kallisto103 (v0.44) quantifiziert und mit DESeq2-Paket106 normalisiert. Der mittlere Ausdruck über die Replikate hinweg wurde mit dem Z-Score normalisiert und zur Analyse verschiedener Gewebe und Stadien während des Lebenszyklus verwendet. Zuvor beschriebene Gene für den Samenschleimstoffwechsel in A. thaliana33,59 wurden verwendet, um homologe Gene im S. hispanica-Genom zu identifizieren. Schleimbezogene Gene wurden mithilfe von BLASTP mit dem Satz von A. thaliana-Genen als Abfrage identifiziert. Um eine Fehlidentifizierung schleimbezogener Gene zu vermeiden, umfassten die Kriterien zur Auswahl von Homologen in S. hispanica: Bitscore ≥ 80, Ausrichtung der Gesamtlänge der Abfragesequenz ≥ 80 % und Identität zwischen Abfrage- und Subjektsequenzen ≥ 50 %. Kandidatengene wurden entsprechend der vorgeschlagenen Funktion in A. thaliana manuell nach ihrem besten Treffer klassifiziert. Die Expressionsniveaus schleimbezogener Gene wurden mit Kallisto103 (v0.44) quantifiziert und die log10(TPM)-Werte wurden mit dem Z-Score normalisiert, um die Expression während der Samenentwicklung zu analysieren. Der Webserver PlantTFDB (v5.0; http://planttfdb.gao-lab.org/) wurde verwendet, um TFs in S. hispanica-Genen zu identifizieren107. Das Paket RegEnrich35 (v1.4.0) wurde verwendet, um Genregulationsnetzwerke mit GRN (d. h. Random-Forest-Algorithmus) als Inferenzmethode und der Liste vorhergesagter TFs als potenzielle Regulatoren zu erstellen. Das Ausgabenetzwerkobjekt wurde nach Kantengewicht geordnet, um wichtige Regulierungsknoten auszuwählen, und gefiltert, um die obersten 5 % mit den höchsten Korrelationen beizubehalten. Das resultierende Netzwerk wurde manuell analysiert, um alle Geninteraktionen mit schleimbezogenen Genen zu identifizieren, und schließlich wurden Kandidatenregulatoren anhand des hohen Knotengrades bestimmt.

Blätter eines einzelnen S. hispanica-Individuums wurden gesammelt, um die Nanopore-, Illumina- und Hi-C-Sequenzierung durchzuführen. Für die metabolischen, lipidomischen und proteomischen Analysen der Samen wurden drei biologische Replikate verwendet. Die statistische Signifikanz wurde mithilfe softwareintegrierter Methoden berechnet. Ein p-Wert von <0,05 wurde für die Genontologie-Anreicherungsanalysen als statistisch signifikant angesehen.

Weitere Informationen zum Forschungsdesign finden Sie in der mit diesem Artikel verlinkten Nature Portfolio Reporting Summary.

Alle Daten, die die Ergebnisse dieser Studie stützen, sind im Manuskript und seinen ergänzenden Dateien enthalten. Die Daten zur Sequenzierung des gesamten Genoms und zur Genomassemblierung sind bei NCBI unter BioProject PRJNA978134 und bei CoGe mit der Genom-ID 66177 verfügbar. Die in dieser Studie generierten Genmodelle und Genomannotationen können unter www.depts.ttu.edu/igcast/Staff/ abgerufen werden. Daten_verfügbarkeit.php. Die proteomischen Daten des Samenschleims wurden bei MassIVE und ProteomeXchange unter den Kennungen MSV000092476 bzw. PXD043875 hinterlegt. Einzelheiten zum Zugriff auf die öffentlich verfügbaren RNA-seq-Daten, die in der Studie verwendet werden, finden Sie im Abschnitt „Methoden“. Alle weiteren relevanten Daten sind auf Anfrage bei den entsprechenden Autoren erhältlich.

Harley, RM et al. Schamlippen. in Blütenpflanzen · Dikotyledonen. The Families and Genera of Vascular Plants (Hrsg. Kadereit, JW) vol. 7 167–275 (2004).

Kokkini, S., Karousou, R. & Hanlidou, E. HERBS | Kräuter der Labiatae. Encyclopedia of Food Sciences and Nutrition 3082–3090 (2003).

Hao, DC, Gu, X.-J. & Xiao, PG Phytochemische und biologische Erforschung der medizinischen Ressourcen von Salvia. in Medicinal Plants 587–639 (Elsevier, 2015). https://doi.org/10.1016/b978-0-08-100085-4.00014-1.

Valdivia-López, M. Á. & Tecante, A. Chia (Salvia hispanica): Ein Überblick über einheimische mexikanische Samen und ihre ernährungsphysiologischen und funktionellen Eigenschaften. in Advances in Food and Nutrition Research vol. 75 53–75 (Academic Press Inc., 2015).

Kulczyński, B., Kobus-Cisowska, J., Taczanowski, M., Kmiecik, D. & Gramza-Michałowska, A. Die chemische Zusammensetzung und der Nährwert von Chia-Samen – aktueller Wissensstand. Nährstoffe 11, (2019).

Melo, D., Machado, TB & Oliveira, MBPP Chiasamen: Ein altes Getreide, das in der modernen menschlichen Ernährung im Trend liegt. Lebensmittelfunktion. 10, 3068–3089 (2019).

Artikel CAS PubMed Google Scholar

de Falco, B., Amato, M. & Lanzotti, V. Chia-Samenprodukte: ein Überblick. Phytochem. Rev. 16, 745–760 (2017).

Artikel Google Scholar

Peiretti, PG & Gai, F. Fettsäure und Nährstoffqualität von Chia-Samen (Salvia hispanica L.) und Pflanzen während des Wachstums. Anim. Feed Sci. Technol. 148, 267–275 (2009).

Artikel CAS Google Scholar

Timilsena, YP, Adhikari, R., Kasapis, S. & Adhikari, B. Molekulare und funktionelle Eigenschaften von gereinigtem Gummi aus australischen Chiasamen. Kohlenhydrat. Polym. 136, 128–136 (2016).

Artikel CAS PubMed Google Scholar

Kučka, M., Ražná, K., Harenčár, Ľ. & Kolarovičová, T. Pflanzensamenschleim – großes Potenzial für klebrige Materie. Nutraceuticals 2022 2, 253–269 (2022).

Google Scholar

da Silveira Ramos, IF et al. Neue Eigenschaften von Chiasamenschleim (Salvia hispanica L.) und mögliche Anwendung in kosmetischen und pharmazeutischen Produkten. Ind Crops Prod 171, (2021).

Reyes-Caudillo, E., Tecante, A. & Valdivia-López, MA Ballaststoffgehalt und antioxidative Aktivität phenolischer Verbindungen in mexikanischen Chiasamen (Salvia hispanica L.). Lebensmittelchem. 107, 656–663 (2008).

Artikel CAS Google Scholar

Oliveira-Alves, SC et al. Charakterisierung phenolischer Verbindungen in Chia-Samen (Salvia hispanica L.), Fasermehl und Öl. Lebensmittelchem. 232, 295–305 (2017).

Artikel CAS PubMed Google Scholar

Martínez-Cruz, O. & Paredes-López, O. Phytochemisches Profil und nutrazeutisches Potenzial von Chiasamen (Salvia hispanica L.) durch Ultrahochleistungsflüssigkeitschromatographie. J. Chromatogr. A 1346, 43–48 (2014).

Artikel PubMed Google Scholar

Marchev, AS et al. Rosmarinsäure – Von der Laborarbeit zu wertvollen Anwendungen in der Lebensmittelindustrie. Trends Lebensmittelwissenschaft. Technol. 117, 182–193 (2021).

Artikel CAS Google Scholar

Wang, L. et al. Eine Genomanordnung von Chia auf Chromosomenebene liefert Einblicke in den hohen Omega-3-Gehalt und die Variation der Fellfarbe seiner Samen. Pflanzenkommun. 3, 100326 (2022).

Artikel CAS PubMed PubMed Central Google Scholar

Chen, Y. et al. Effiziente Zusammenstellung von Nanoporen-Lesevorgängen durch hochpräzise und intakte Fehlerkorrektur. Nat. Komm. 12, 1–10 (2021).

Google Scholar

Walker, BJ et al. Pilon: Ein integriertes Tool zur umfassenden Erkennung mikrobieller Varianten und zur Verbesserung der Genomassemblierung. PLoS One 9, 112963 (2014).

Artikel Google Scholar

Roach, MJ, Schmidt, SA & Borneman, AR Purge Haplotigs: Allelische Contig-Neuzuordnung für diploide Genomassemblierungen der dritten Generation. BMC Bioinforma. 19, 1–10 (2018).

Artikel Google Scholar

Durand, NC et al. Juicer bietet ein Ein-Klick-System zur Analyse von Hi-C-Experimenten mit Schleifenauflösung. Zellsystem 3, 95 (2016).

Artikel CAS PubMed PubMed Central Google Scholar

Dudchenko, O. et al. Die De-novo-Assemblierung des Aedes aegypti-Genoms unter Verwendung von Hi-C ergibt Gerüste mit Chromosomenlänge. Science (1979) 356, 92–95 (2017).

CAS Google Scholar

Simão, FA, Waterhouse, RM, Ioannidis, P., Kriventseva, EV & Zdobnov, EM BUSCO: Bewertung der Genomassemblierung und Annotationsvollständigkeit mit Einzelkopie-Orthologen. Bioinformatik 31, 3210–3212 (2015).

Artikel PubMed Google Scholar

Benson, G. Tandem Repeats Finder: ein Programm zur Analyse von DNA-Sequenzen. Nukleinsäuren Res. 27, 573–580 (1999).

Artikel CAS PubMed PubMed Central Google Scholar

Peska, V. & Garcia, S. Ursprung, Diversität und Entwicklung von Telomersequenzen in Pflanzen. Vordere Pflanzenwissenschaft. 11, 117 (2020).

Artikel PubMed PubMed Central Google Scholar

Cantarel, BL et al. MAKER: Eine benutzerfreundliche Annotationspipeline für neu entstehende Modellorganismusgenome. Genomres. 18, 188–196 (2008).

Artikel CAS PubMed PubMed Central Google Scholar

Holt, C. & Yandell, M. MAKER2: Eine Annotationspipeline und ein Genomdatenbank-Verwaltungstool für Genomprojekte der zweiten Generation. BMC Bioinforma. 12, 1–14 (2011).

Artikel Google Scholar

Ni, P. et al. DeepSignal: Erkennung des DNA-Methylierungszustands aus Nanopore-Sequenzierungslesungen mithilfe von Deep Learning. Bioinformatik 35, 4586–4595 (2019).

Artikel CAS PubMed Google Scholar

Gupta, P. et al. Der Genexpressionsatlas von Chia (Salvia hispanica) erläutert dynamische räumlich-zeitliche Veränderungen im Zusammenhang mit Pflanzenwachstum und -entwicklung. Vordere Pflanzenwissenschaft. 0, 1347 (2021).

Google Scholar

Trócsányi, E., György, Z. & Zámboriné-Németh, É. Neue Erkenntnisse zur Rosmarinsäure-Biosynthese basierend auf molekularen Studien. Curr. Pflanzenbiol. 23, 100162 (2020).

Artikel Google Scholar

Schläpfer, P. et al. Genomweite Vorhersage von Stoffwechselenzymen, Signalwegen und Genclustern in Pflanzen. Pflanzenphysiologie. 173, 2041–2059 (2017).

Artikel PubMed PubMed Central Google Scholar

Di, P. et al. Der 13C-Tracer zeigt die Biosynthese von Phenolsäuren in Haarwurzelkulturen von Salvia miltiorrhiza. ACS Chem. Biol. 8, 1537–1548 (2013).

Artikel CAS PubMed Google Scholar

Weitzel, C. & Petersen, M. Klonierung und Charakterisierung der Rosmarinsäuresynthase aus Melissa officinalis L. Phytochemistry 72, 572–578 (2011).

Artikel CAS PubMed Google Scholar

Parra-Rojas, JP et al. Neue Schritte in der Schleimbiosynthese durch Analyse des Transkriptoms der UDP-Rhamnose/UDP-Galactose-Transporter-2-Mutante enthüllt. J. Exp. Bot. 70, 5071 (2019).

Artikel CAS PubMed PubMed Central Google Scholar

Sreedhar, RV, Priya, K., Sunny, DR, Ram, R. & Malathi, S. Erforschung des Triacylglycerin-Biosynthesewegs bei der Entwicklung von Chia-Samen (Salvia hispanica L.): Ein transkriptomischer Ansatz. PLoS One 10, e0123580 (2015).

Artikel Google Scholar

Tao, W., Radstake, TRDJ & Pandit, A. Die RegEnrich-Genregulator-Anreicherungsanalyse zeigt eine Schlüsselrolle der ETS-Transkriptionsfaktorfamilie bei der Interferonsignalisierung. Komm. Biol. 5, 1–12 (2022).

Artikel Google Scholar

Orona-Tamayo, D., Valverde, ME & Paredes-Lopez, O. Chia – Der neue goldene Samen für das 21. Jahrhundert: Nutrazeutische Eigenschaften und technologische Anwendungen. in Sustainable Protein Sources 265–281 (Elsevier Inc., 2017). https://doi.org/10.1016/B978-0-12-802778-3.00017-2

Terán-Yepez, E., Santos-Roldán, L., Palacios-Florencio, B. & Berbel-Pineda, JM Auswahlverfahren für ausländische Märkte als Instrument für die internationale Expansion: Eine Fallstudie für ecuadorianische Chiasamenexporte in die Europäische Union. Acad. BHs. Cienc. 92, e20190513 (2020).

Artikel Google Scholar

Lang, D. et al. Vergleich der beiden aktuellen Sequenzierungstechnologien für die Genomassemblierung: HiFi-Reads des Pacific Biosciences Sequel II-Systems und Ultralong-Reads von Oxford Nanopore. Gigascience 9, 1–7 (2020).

Artikel CAS Google Scholar

Li, L. et al. Eine nahezu vollständige Genomassemblierung von Chia hilft bei der Identifizierung wichtiger Fettsäuredesaturasen in sich entwickelnden Samen. Vorderseite. Pflanzenwissenschaft. 14, 984 (2023).

Google Scholar

Zhong, S. et al. Einzelbasenaufgelöste Methylome der Entwicklung von Tomatenfrüchten zeigen mit der Reifung verbundene Epigenommodifikationen. Nat. Biotechnologie. 31, 154–159 (2013).

Artikel CAS PubMed Google Scholar

Yong-Villalobos, L. et al. Die Methylomanalyse zeigt, dass epigenetische Veränderungen eine wichtige Rolle bei der Regulierung der Arabidopsis-Reaktion auf Phosphatmangel spielen. Proz. Natl Acad. Wissenschaft. 112, E7293–E7302 (2015).

Artikel CAS PubMed PubMed Central Google Scholar

Zhang, X. et al. Genomweite hochauflösende Kartierung und funktionelle Analyse der DNA-Methylierung in Arabidopsis. Zelle 126, 1189–1201 (2006).

Artikel CAS PubMed Google Scholar

Niederhuth, CE et al. Weit verbreitete natürliche Variation der DNA-Methylierung innerhalb von Angiospermen. Genombiol. 17, (2016).

Gent, JI et al. CHH-Inseln: De-novo-DNA-Methylierung bei der gennahen Chromatinregulation in Mais. Genomres. 23, 628 (2013).

Artikel CAS PubMed PubMed Central Google Scholar

Seymour, DK, Koenig, D., Hagmann, J., Becker, C. & Weigel, D. Die Entwicklung von DNA-Methylierungsmustern in den Brassicaceae wird durch Unterschiede in der Genomorganisation vorangetrieben. PLoS Genet 10, e1004785 (2014).

Artikel PubMed PubMed Central Google Scholar

Muyle, AM, Seymour, DK, Lv, Y., Huettel, B. & Gaut, BS Genkörpermethylierung in Pflanzen: Mechanismen, Funktionen und wichtige Implikationen für das Verständnis evolutionärer Prozesse. Genombiol. Entwicklung 14, (2022).

Hollister, JD & Gaut, BS Epigenetische Stummschaltung transponierbarer Elemente: ein Kompromiss zwischen reduzierter Transposition und schädlichen Auswirkungen auf die Expression benachbarter Gene. Genome Res 19, 1419–1428 (2009).

Artikel CAS PubMed PubMed Central Google Scholar

Wang, Z. & Baulcombe, DC Transposonalter und Nicht-CG-Methylierung. Nat Commun 11, (2020).

Yang, D. et al. DNA-Methylierung: Ein neuer Regulator der Phenolsäure-Biosynthese in Salvia miltiorrhiza. Ind. Nutzpflanzen Prod. 124, 402–411 (2018).

Artikel CAS Google Scholar

Prathyusha, P., Suneetha, J., Naga, M., Srujana, S. & Kumari, A. Chia-Samen für Ernährungssicherheit. J. Pharmakogn. Phytochem 8, 2702–2707 (2019).

CAS Google Scholar

Physikalische Eigenschaften, chemische Charakterisierung und Fettsäurezusammensetzung mexikanischer Chiasamen (Salvia hispanica L.). Int J. Lebensmittelwissenschaft. Technol. Rev. 49, 571–577 (2014).

Artikel CAS Google Scholar

Peláez, P. et al. Vergleichende Transkriptomanalyse von kultivierten und wilden Samen von Salvia hispanica (Chia). Wissenschaft. Rep. 9, 1–11 (2019).

Artikel Google Scholar

Lu, Y. & Foo, LY Polyphenole von Salvia – eine Rezension. Phytochemistry 59, 117–140 (2002).

Artikel CAS PubMed Google Scholar

Petersen, M. & Simmonds, MSJ Rosmarinsäure. Phytochemistry 62, 121–125 (2003).

Artikel CAS PubMed Google Scholar

Chiang, JH et al. Verwendung von Chia-Schleim (Salvia hispanica) als Zutatenersatz in Lebensmitteln. Trends Lebensmittelwissenschaft. Technol. 115, 105–116 (2021).

Artikel CAS Google Scholar

Bochicchio, R. et al. Innovative Pflanzenproduktion für gesunde Ernährung: Der Fall von Chia (Salvia hispanica L.). in The Sustainability of Agro-Food and Natural Resource Systems in the Mediterranean Basin 29–45 (Springer International Publishing, 2015). https://doi.org/10.1007/978-3-319-16357-4_3/FIGURES/2.

Hrnčič, MK, Ivanovski, M., Cör, D. & Knez, Ž. Chia-Samen (Salvia Hispanica L.): Ein Überblick – Phytochemisches Profil, Isolierungsmethoden und Anwendung. Molecules 25, 11 (2019).

Artikel Google Scholar

Liu, Y. et al. Samenschalenschleime: Strukturelle, funktionelle/bioaktive Eigenschaften und genetische Informationen. Kompr. Rev. Food Sci. Lebensmittelecht. 20, 2534–2559 (2021).

Artikel CAS PubMed Google Scholar

Francoz, E., Ranocha, P., Burlat, V. & Dunand, C. Arabidopsis-Samenschleim-Sekretionszellen: Regulation und Dynamik. Trends Pflanzenwissenschaft. 20, 515–524 (2015).

Artikel CAS PubMed Google Scholar

Western, TL et al. MUCILAGE-MODIFIED4 kodiert für ein mutmaßliches Pektin-Biosyntheseenzym, das in der Entwicklung durch APETALA2, TRANSPARENT TESTA GLABRA1 und GLABRA2 in der Samenschale der Arabidopsis reguliert wird. Pflanzenphysiologie. 134, 296 (2004).

Artikel CAS PubMed PubMed Central Google Scholar

Takenaka, Y. et al. Pektin-RG-I-Rhamnosyltransferasen stellen eine neuartige pflanzenspezifische Glycosyltransferase-Familie dar. Nat. Pflanzen 4, 669–676 (2018).

Artikel CAS PubMed Google Scholar

Yu, L. et al. Cellulose-Synthase-ähnliche A2, eine Glucomannan-Synthase, ist an der Aufrechterhaltung der anhaftenden Schleimstruktur in Arabidopsis-Samen beteiligt. Pflanzenphysiologie. 164, 1842–1856 (2014).

Artikel CAS PubMed PubMed Central Google Scholar

Mendu, V. et al. Die Subfunktionalisierung von Cellulosesyntasen in Samenschalen-Epidermiszellen vermittelt die sekundäre Radialwandsynthese und Schleimanlagerung. Pflanzenphysiologie. 157, 441–453 (2011).

Artikel CAS PubMed PubMed Central Google Scholar

Ben-Tov, D. et al. COBRA-LIKE2, ein Mitglied der Glycosylphosphatidylinositol-verankerten COBRA-LIKE-Familie, spielt eine Rolle bei der Zelluloseablagerung in sekretorischen Schleimzellen der Samenhülle von Arabidopsis. Pflanzenphysiologie. 167, 711 (2015).

Artikel CAS PubMed PubMed Central Google Scholar

Haughn, GW & Western, TL Arabidopsis-Samenschalenschleim ist eine spezielle Zellwand, die als Modell für die genetische Analyse der Struktur und Funktion pflanzlicher Zellwände verwendet werden kann. Vordere Pflanzenwissenschaft. 3, 64 (2012).

Artikel CAS PubMed PubMed Central Google Scholar

Golz, JF et al. Regulierungsebenen – Einblicke in die Rolle von Transkriptionsfaktoren, die die Schleimproduktion in der Samenschale von Arabidopsis steuern. Pflanzenwissenschaft. 272, 179–192 (2018).

Artikel CAS PubMed Google Scholar

Jamet, E. & Dunand, C. Pflanzenzellwandproteine ​​und Entwicklung. Int. J. Mol. Wissenschaft. 21, (2020).

Sandoval-Oliveros, MR & Paredes-López, O. Isolierung und Charakterisierung von Proteinen aus Chiasamen (Salvia hispanica L.). J. Agrarlebensmittelchemie. 61, 193–201 (2013).

Artikel CAS PubMed Google Scholar

Tsai, AYL et al. Identifizierung und Charakterisierung von Arabidopsis-Samenhüllenschleimproteinen. Pflanzenphysiologie. 173, 1059–1074 (2017).

Artikel CAS PubMed Google Scholar

Paniagua, C. et al. Dirigente Proteine ​​in Pflanzen: Modulation des Zellwandstoffwechsels bei abiotischer und biotischer Stressexposition. J. Exp. Bot. 68, 3287–3301 (2017).

Artikel CAS PubMed Google Scholar

Yonekura-Sakakibara, K. et al. Samenschalenschützende Neolignane werden in Arabidopsis durch das Dirigent-Protein AtDP1 und die Laccase AtLAC5 produziert. Pflanzenzelle 33, 129–152 (2021).

PubMed Google Scholar

Dalisay, DS et al. Dirigent Protein-vermittelte Lignan- und cyanogene Glucosidbildung in Leinsamen: Integrierte Omics- und MALDI-Massenspektrometrie-Bildgebung. J. Nat. Prod. 78, 1231–1242 (2015).

Artikel CAS PubMed Google Scholar

Davin, LB & Lewis, NG Lignin-Primärstrukturen und dirigente Standorte. Curr. Meinung. Biotechnologie. 16, 407–415 (2005).

Artikel CAS PubMed Google Scholar

Bonello, P., Storer, AJ, Gordon, TR, Wood, DL & Heller, W. Systemische Wirkungen von Heterobasidion annosum auf Ferulasäureglucosid und Lignin des präsymptomatischen Ponderosa-Kiefern-Phloems und mögliche Auswirkungen auf Borkenkäfer-assoziierte Pilze. J. Chem. Ökologisch. 29, 1167–1182 (2003).

Artikel CAS PubMed Google Scholar

Miedes, E., Vanholme, R., Boerjan, W. & Molina, A. Die Rolle der sekundären Zellwand bei der Pflanzenresistenz gegen Krankheitserreger. Vorderseite. Pflanzenwissenschaft. 5, (2014).

Thamil Arasan, SK et al. Charakterisierung und Expressionsanalyse dirigenter Familiengene im Zusammenhang mit Stress in Brassica. Pflanzenphysiologie. Biochem 67, 144–153 (2013).

Artikel CAS PubMed Google Scholar

Jin-long, G. et al. Ein neuartiges Dirigent-Protein-Gen mit hochstammspezifischer Expression aus Zuckerrohr, Reaktion auf Dürre, Salz und oxidativen Stress. Plant Cell Rep. 31, 1801–1812 (2012).

Artikel PubMed Google Scholar

Ponce De León, I. et al. Physcomitrella patens aktiviert bei einer Infektion mit Botrytis cinerea die Verstärkung der Zellwand, den programmierten Zelltod und die Akkumulation evolutionär konservierter Abwehrsignale wie Salicylsäure und 12-Oxo-Phytodiensäure, jedoch nicht Jasmonsäure. Mol. Pflanzenpathol. 13, 960–974 (2012).

Artikel PubMed PubMed Central Google Scholar

Reboledo, G. et al. Physcomitrella patens aktiviert Abwehrreaktionen gegen den Krankheitserreger Colletotrichum gloeosporioides. Int J. Mol. Wissen 16, 22280 (2015).

Artikel CAS PubMed PubMed Central Google Scholar

Tsai, AYL, McGee, R., Dean, GH, Haughn, GW & Sawa, S. Samenschleim: Biologische Funktionen und mögliche Anwendungen in der Biotechnologie. Pflanzenzellphysiologie. 62, 1847–1857 (2021).

Artikel CAS PubMed Google Scholar

Motyka, S. et al. Der aktuelle Wissensstand über Salvia hispanica und Salviae hispanicae Samen (Chia-Samen). Molecules 27, (2022).

Wimberley, J., Cahill, J. & Atamian, HS De-novo-Sequenzierung und Analyse des gewebespezifischen Transkriptoms von Salvia hispanica und Identifizierung von Genen, die an der Terpenoid-Biosynthese beteiligt sind. Pflanzen 2020 9, 405 (2020).

CAS Google Scholar

Peterson, DG, Boehm, KS & Stack, SM Isolierung von Milligrammmengen nuklearer DNA aus Tomaten (Lycopersicon esculentum), einer Pflanze, die einen hohen Anteil an Polyphenolverbindungen enthält. Pflanzenmol. Biol. Bericht. 15, 148–153 (1997).

Artikel CAS Google Scholar

Marçais, G. & Kingsford, C. Ein schneller, sperrenfreier Ansatz für die effiziente parallele Zählung des Vorkommens von k-meren. Bioinformatik 27, 764–770 (2011).

Artikel PubMed PubMed Central Google Scholar

Sun, H., DIng, J., Piednoël, M. & Schneeberger, K. findGSE: Schätzung der Genomgrößenvariation bei Menschen und Arabidopsis mithilfe von k-mer-Frequenzen. Bioinformatik 34, 550–557 (2018).

Artikel CAS PubMed Google Scholar

Langmead, B. & Salzberg, SL Schnelle Lücken-Lese-Ausrichtung mit Bowtie 2. Nat. Methoden 9, 357–359 (2012).

Artikel CAS PubMed PubMed Central Google Scholar

Li, H. Minimap2: Paarweise Ausrichtung für Nukleotidsequenzen. Bioinformatik 34, 3094–3100 (2018).

Artikel CAS PubMed PubMed Central Google Scholar

Cabanettes, F. & Klopp, C. D-GENIES: Punkt-Plot großer Genome auf interaktive, effiziente und einfache Weise. PeerJ 2018, e4958 (2018).

Artikel Google Scholar

Ni, P. et al. Genomweite Erkennung von Cytosin-Methylierungen in Pflanzen anhand von Nanopore-Daten mithilfe von Deep Learning. Nat. Komm. 12, (2021).

Kim, D., Paggi, JM, Park, C., Bennett, C. & Salzberg, SL Graphbasierte Genomausrichtung und Genotypisierung mit HISAT2 und HISAT-Genotyp. Nat. Biotechnologie. 37, 907 (2019).

Artikel CAS PubMed PubMed Central Google Scholar

Pertea, M. et al. StringTie ermöglicht eine verbesserte Rekonstruktion eines Transkriptoms aus RNA-seq-Reads. Nat. Biotechnologie. 33, 290–295 (2015).

Artikel CAS PubMed PubMed Central Google Scholar

Storer, J., Hubley, R., Rosen, J., Wheeler, TJ & Smit, AF Die Dfam-Community-Ressource für transponierbare Elementfamilien, Sequenzmodelle und Genomanmerkungen. Mob. DNA 12, 1–14 (2021).

Artikel Google Scholar

Ou, S. & Jiang, N. LTR_retriever: Ein hochpräzises und empfindliches Programm zur Identifizierung langer terminaler Wiederholungs-Retrotransposons. Pflanzenphysiologie. 176, 1410–1422 (2018).

Artikel CAS PubMed Google Scholar

Ou, S. & Jiang, N. LTR_FINDER_parallel: Parallelisierung von LTR_FINDER ermöglicht die schnelle Identifizierung langer terminaler Wiederholungs-Retrotransposons. Mob. DNA 10, 1–3 (2019).

Artikel Google Scholar

Xu, Z. & Wang, H. LTR-FINDER: Ein effizientes Werkzeug zur Vorhersage von LTR-Retrotransposons voller Länge. Nucleic Acids Res 35, 265–268 (2007).

Artikel Google Scholar

Ellinghaus, D., Kurtz, S. & Willhoeft, U. LTRharvest, eine effiziente und flexible Software zur De-novo-Erkennung von LTR-Retrotransposons. BMC Bioinforma. 9, 1–14 (2008).

Artikel Google Scholar

Stanke, M., Schöffmann, O., Morgenstern, B. & Waack, S. Genvorhersage in Eukaryoten mit einem verallgemeinerten Hidden-Markov-Modell, das Hinweise aus externen Quellen verwendet. BMC Bioinforma. 7, 1–11 (2006).

Artikel Google Scholar

Manni, M., Berkeley, MR, Seppey, M., Simão, FA & Zdobnov, EM BUSCO-Update: Neuartige und optimierte Arbeitsabläufe zusammen mit einer breiteren und tieferen phylogenetischen Abdeckung für die Bewertung eukaryotischer, prokaryotischer und viraler Genome. Mol. Biol. Entwicklung 38, 4647–4654 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Wimalanathan, K., Friedberg, I., Andorf, CM & Lawrence-Dill, CJ Maize GO Annotation – Methoden, Bewertung und Überprüfung (Mais-GAMER). Plant Direct 2, e00052 (2018).

Artikel PubMed PubMed Central Google Scholar

Blum, M. et al. Die InterPro-Datenbank für Proteinfamilien und -domänen: 20 Jahre später. Nukleinsäuren Res. 49, D344–D354 (2021).

Artikel CAS PubMed Google Scholar

Törönen, P., Medlar, A. & Holm, L. PANNZER2: ein schneller Webserver für funktionale Annotationen. Nukleinsäuren Res. 46, W84–W88 (2018).

Artikel PubMed PubMed Central Google Scholar

Sud, M. et al. LMSD: LIPID MAPS-Strukturdatenbank. Nukleinsäuren Res. 35, D527–D532 (2007).

Artikel CAS PubMed Google Scholar

Bray, NL, Pimentel, H., Melsted, P. & Pachter, L. Nahezu optimale probabilistische RNA-seq-Quantifizierung. Nat. Biotechnologie. 34, 525–527 (2016).

Artikel CAS PubMed Google Scholar

Ritchie, ME et al. Limma ermöglicht differenzielle Expressionsanalysen für RNA-Sequenzierung und Microarray-Studien. Nucleic Acids Res 43, e47 (2015).

Artikel PubMed PubMed Central Google Scholar

Chae, L., Kim, T., Nilo-Poyanco, R. & Rhee, SY Genomische Signaturen des spezialisierten Stoffwechsels in Pflanzen. Science (1979) 344, 510–513 (2014).

CAS Google Scholar

Love, MI, Huber, W. & Anders, S. Moderierte Schätzung der Faltungsänderung und Streuung für RNA-seq-Daten mit DESeq2. Genombiol. 15, 550 (2014).

Artikel PubMed PubMed Central Google Scholar

Jin, J. et al. PlantTFDB 4.0: Auf dem Weg zu einem zentralen Knotenpunkt für Transkriptionsfaktoren und regulatorische Interaktionen in Pflanzen. Nucleic Acids Res 45, D1040–D1045 (2017).

Artikel CAS PubMed Google Scholar

Referenzen herunterladen

Diese Arbeit wurde durch das Governor University Research Initiative-Programm (05-2018) des Bundesstaates Texas finanziert.

Die folgenden Autoren haben gleichermaßen beigetragen: Hector-Rogelio Nájera-González, Ricardo A. Chavez Montes.

Abteilung für Pflanzen- und Bodenwissenschaften, Institut für Genomik für abiotische Stresstoleranz bei Nutzpflanzen (IGCAST), Texas Tech University, Lubbock, TX, 79409, USA

Gerardo Alejo-Jacuinde, Héctor-Rogelio Nájera-González, Ricardo A. Chávez Montes, Alfonso Carlos Barragán-Rosillo, Benjamin Perez Sanchez, Damar López-Arredondo, Lenin Yong-Villalobos und Luis Herrera-Estrella

Abteilung für Chemie und Biochemie, Texas Tech University, Lubbock, TX, 79409, USA

Christian D. Gutierrez Kings & Need Mechref

Advanced Genomics Unit/Langebio, Zentrum für Forschung und fortgeschrittene Studien des National Polytechnic Institute, Irapuato, Gto., 36821, Mexiko

Luis Herrera-Estrella

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

GA-J., LY-V. und LH-E. konzipierte und gestaltete die Studie; GA-J. und LY-V. generiertes biologisches Material für die Genomsequenzierung; GA-J. führte die Genomassemblierung durch; LY-V. führte die Methylierungsanalyse durch; RACM führte die Annotation des Genoms durch; H.-RN-G., CDGR und YSM führten die Lipidom-, Stoffwechsel- und Proteomanalysen durch; GA-J. und RACM führte die Untersuchung der Rosmarinsäure- und Schleimbiosynthese durch; ACB-R. und BPS führte eine Charakterisierung der Entwicklung von Chiasamen durch; GA-J., LY-V., RACM, H.-RN-G., DL-A. und LH-E. analysierte Daten; GA-J., LY-V. und LH-E. hat das Manuskript geschrieben. Alle Autoren haben das endgültige Manuskript gelesen und genehmigt.

Korrespondenz mit Lenin Yong-Villalobos oder Luis Herrera-Estrella.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Communications Biology dankt Aizhong Liu und den anderen anonymen Gutachtern für ihren Beitrag zum Peer-Review dieser Arbeit. Hauptredakteure: David Favero und Manuel Breuer. Eine Peer-Review-Datei ist verfügbar.

Anmerkung des Herausgebers Springer Nature bleibt hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten neutral.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die Originalautor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht gesetzlich zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Alejo-Jacuinde, G., Nájera-González, HR., Chávez Montes, RA et al. Multi-Omic-Analysen offenbaren die einzigartigen Eigenschaften des Samenstoffwechsels von Chia (Salvia hispanica). Commun Biol 6, 820 (2023). https://doi.org/10.1038/s42003-023-05192-4

Zitat herunterladen

Eingegangen: 28. März 2023

Angenommen: 28. Juli 2023

Veröffentlicht: 07. August 2023

DOI: https://doi.org/10.1038/s42003-023-05192-4

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.