domenica 26 gennaio 2014

La sequenza del genoma del peperoncino fornisce intuizioni sull'evoluzione del piccante nella specie Capsicum

Nature Genetics
Genetica Natura
 
doi: 10.1038/ng.2877
Ricevut 
23 ottobre 2013
Accettato
  30 Dicembre 2013
Pubblicato online
  19 gennaio 2014
Hot pepper genome
Article by Seungill Kimet al. OPEN
Autori:
  • Seungill Kim ,
  • Minkyu Parco ,
  • Seon-In Yeom ,
  • Yong-Min Kim ,
  • Je Min Lee ,
  • Hyun-Ah Lee ,
  • Eunyoung Seo ,
  • Jaeyoung Choi ,
  • Kyeongchae Cheong ,
  • Ki-Tae Kim ,
  • Kyongyong Jung ,
  • Gir-Won Lee ,
  • Sang-Keun Oh ,
  • Chungyun Bae ,
  • SAET-Byul Kim ,
  • Hye-Young Lee ,
  • Shin-Young Kim ,
  • Myung-Shin Kim ,
  • Byoung-Cheorl Kang ,
  • Yeong Deuk Jo ,
  • Hee-Bum Yang ,
  • Hee-Jin Jeong ,
  • Won-Hee Kang ,
  • Jin-Kyung Kwon ,
  • Chanseok Shin,
  • Jae Yun Lim , 
  • Giugno Hyun Parco , 
  • Jin Hoe Huh , 
  • Giugno-Sik Kim , 
  • Byung-Dong Kim , 
  • Oded Cohen , 
  • Ilan Paran , 
  • Mi Chung Suh , 
  • SAET Buyl Lee , 
  • Yeon-Ki Kim , 
  • Younhee Shin , 
  • Seung-Jae Noh , 
  • Junhyung Parco , 
  • Young Sam Seo , 
  • Suk-Yoon Kwon , 
  • Un hyun Kim , 
  • Jeong Mee Parco , 
  • Hyun-Jin Kim ,
  • Sang-Bong Choi , 
  • Paul W Bosland , 
  • Gregory Reeves , 
  • Sung-Hwan Jo , 
  • Bong-Woo Lee ,
  • Hyung-Taeg Cho , 
  • Hee Choi Seung- , 
  • Min-Soo Lee , 
  • Yeisoo Yu , 
  • Yang Do Choi , 
  • Beom-Seok Parco , 
  • Allen van Deynze , 
  • Hamid Ashrafi , 
  • Theresa Hill , 
  • Woo Taek Kim , 
  • Hyun-Sook Pai ,
  • Hee Kyung Ahn , 
  • Inhwa Yeam , 
  • James J Giovannoni , 
  • Jocelyn KC Rosa , 
  • Iben Sørensen ,
  • Sang-Jik Lee , 
  • Ryan W Kim , 
  • Ik-Young Choi , 
  • Beom-Soon Choi , 
  • Jong-Sung Lim , 
  • Yong-Hwan Lee 
  • Doil Choi 
  • Sommario

    Il peperoncino ( Capsicum annuum ), una delle più antiche colture addomesticate nelle Americhe, è la coltura spezia più coltivata al mondo. Riportiamo sequenziamento dell'intero genoma e montaggio del peperoncino (varietà locale messicano di Capsicum annuum cv. CM334) a 186,6 × copertura.Segnaliamo anche resequencing di due peperoni coltivati ​​e de novo sequencing delle specie selvatiche Capsicum chinense . La dimensione del genoma del peperoncino era circa quattro volte maggiore di quello del suo parente stretto pomodoro, e il genoma ha mostrato un accumulo dizingari e Caulimoviridae elementi familiari. Integrativi analisi genomica e trascrittomica suggerito che il cambiamento nell'espressione genica e neofunctionalization di capsaicina sintasi sono a forma di biosintesi capsaicinoid. Abbiamo trovato i modelli molecolari differenziali di maturazione regolatori e la sintesi di etilene nel peperoncino e pomodoro. Il genoma di riferimento servirà come piattaforma per migliorare i valori nutrizionali e medicinali di Capsicum specie.

    A colpo d'occhio

    Cifre

    sinistra
    1. Paesaggio genomico di cromosomi pepe.
      Figura 1
    2. Analisi di espansione genoma pepe rispetto al genoma di pomodoro.
      Figura 2
    3. Evoluzione della via biosintetica capsaicinoid.
      Figura 3
    4. Divergenza trascrizionale e la conservazione dei geni maturazione correlati al peperoncino e pomodoro.
      Figura 4
    diritto

    Introduzione





    Il peperoncino è un membro della famiglia delle Solanacee. Si tratta di un diploide, facoltativo, colture di auto-impollinazione ed è strettamente correlata alla patata, pomodoro, melanzana, tabacco e petunia. Piante Solanacee appartengono al clade asterid di eudicots, che comprende più di 3000 specie diverse in tutto il mondo. Molti membri della famiglia Solanacee hanno lo stesso numero di cromosomi ( n = 12) tuttavia differiscono drasticamente dimensioni del genoma. Il peperoncino è una delle più antiche coltivazioni domestiche nell'emisfero occidentale 1 , è la spezia più coltivata al mondo ed è un ingrediente importante nella maggior parte delle cucine globali 2 .Peperoncino ha una grande varietà di usi, anche in prodotti farmaceutici, coloranti naturali e cosmetici, come pianta ornamentale e come ingrediente attivo nella maggior repellenti difesa. Il peperoncino offre molte essenziali vitamine, minerali e sostanze nutritive che hanno grande rilevanza per la salute umana 3 , 4 , 5 , 6 . Nel 2011, i primi 20 paesi pepe produzione è cresciuto 33,3 milioni di tonnellate di peperoncino piantate su 3,8 Mha (Food and Agriculture Organization delle Nazioni Unite (FAO) statistiche; vedi URL ). Negli ultimi dieci anni, la produzione mondiale di peperoncino è aumentato del 40%.
    Il piccante di peperoncino è dovuto all'accumulo di capsaicinoidi, un gruppo di alcaloidi che sono unici al Capsicum genere. La sensazione di calore generato da queste capsaicinoidi è una tale aspetto la definizione di questa coltura che il nome del genere Capsicum deriva dal greco kapto , che significa 'mordere'. Capsaicina, dihydrocapsaicin e nordihydrocapsaicin costituiscono i capsaicinoidi primarie, che sono prodotti esclusivamente nelle ghiandole sulla placenta del frutto.La sensazione organolettica del calore causato quando capsaicina si lega al recettore vanilloide potenziale transiente 1 (TRPV1) dei mammiferi in via di dolore 7 può sostenere di essere un sesto gusto con dolce, acido, amaro, salato e umami (saporito). Molti enzimi coinvolti nella biosintesi capsaicinoid non sono ben caratterizzati, e la regolazione della via non è pienamente compreso.Con più di 22 capsaicinoidi isolati dal peperoncino, questo genere fornisce un eccellente esempio per esplorare l'evoluzione di metaboliti secondari nelle piante 2 . Capsaicinoids sono stati trovati in natura ad avere proprietà antifungine e antibatteriche, per agire come deterrente per predazione animale quando ingerita e di avere proprietà intrinseche che gli aiuti in dispersione dei semi aviaria.Capsaicinoids hanno molti benefici per la salute per gli esseri umani: sono efficaci nell'inibire la crescita di varie forme di cancro 8 , 9 , 10 , sono un analgesico per l'artrite e altri dolori 11 , ridurre l'appetito e promuovere la perdita di peso 12 , 13 , 14 . E 'sorprendente che una comprensione completa del percorso capsaicinoid a livello molecolare manca, considerando l'importanza economica e culturale di capsaicinoidi.
    Qui riportiamo una sequenza del genoma di alta qualità per il peperoncino. C. annuum cv. CM334 (Criollo de Morelos 334), una varietà locale raccolto dallo stato messicano di Morelos, ha sempre mostrato un alto livello di resistenza ai diversi agenti patogeni, tra cui Phytophthora capsici , pepe virus mottle e nematodi galligeni. Questo Landrace è stato ampiamente utilizzato nella ricerca e cultivar pepe allevamento caldo. Forniamo anche i dati resequencing per due peperoni coltivati ​​e per specie selvatiche, C. chinense . Genomica comparativa dei membri della famiglia delle Solanacee, che comprende il peperoncino, fornisce una visione evolutiva in espansione genoma, l'origine del piccante, processo di maturazione distinto e resistenza alle malattie di peperoncino.Questo genoma di riferimento di alta qualità di peperoncino servirà come piattaforma per migliorare i valori orticole, nutrizionali e medicinali di Capsicum specie.

    Risultati





    Sequencing, il montaggio e la variazione genetica

    Abbiamo generato 650,2 Gb (186,6 × copertura del genoma) dell'intero genoma sequenza fucile daC. annuum cv. CM334 (di seguito, CM334) da Illumina sequenziamento di librerie genomiche con dimensioni inserti che vanno da 180 bp a 20 kb ( Fichi complementari. 1 , 2 , 3 , 4 , 5 , 6 , tabelle supplementari 1-5 e nota integrativa ). Sulla base delle analisi 19-mer, abbiamo stimato la dimensione del genoma sia 3,48 Gb ( Fig. complementare. 2 ). Per ciascuna libreria, abbiamo confermato che i dati grezzi sono stati imparziali misurando la distribuzione delle dimensioni inserto (Fig. complementare. 3 ). Dopo il filtraggio, abbiamo montato 3.06 Gb (87,9% del totale 3.48 Gb) in 37.989 ponteggi (N50 = 2.47 Mb) utilizzando SOAPdenovo 15 e SSPACE 16 , e il 90% del gruppo genoma era contenuto in 1.276 ponteggi ( Tabella 1 e supplementari Tabelle 3 e 4 ). Abbiamo convalidato l'assemblaggio del genoma utilizzando 27 sequenze BAC da CM334: 26 sequenze BAC sono stati interamente coperti da un unico o più impalcature e ha mostrato identità di superiore al 99,9% ( Fig. complementare 4. ed Tavola complementare 5 ). Per costruire pseudomolecules, abbiamo stabilito una mappa genetica ad alta densità con 6281 marcatori con 120 linee consanguinee ricombinanti derivate da C. annuum cv. Perenne e C. annuum cv. Dempsey (di seguito, perenni e Dempsey) ( Tabelle supplementari 6-9 e nota integrativa ). Abbiamo ancorato scaffold alla mappa genetica ad alta densità (4.562 marcatori) e alla mappa genetica precedentemente riportato 17 . Nel complesso, siamo ancorati 86.0% del gruppo (2,63 Gb, 1357 scaffolds) di 12 pseudomolecules cromosomiche e ordinato loro (75,6%; 1048 scaffolds) sulla base della distanza genetica ( Fig. complementare 7. ed Tavola complementare 8 ).



    Tabella 1: Statistiche di genoma peperoncino ed gene di annotazione
    Abbiamo eseguito resequencing di due cultivar pepe (perenni e Dempsey) e de novo sequencing delle specie selvatiche ( C. chinense PI159236, di seguito, C. chinense ) per fornire una panoramica completa della variazione genetica e le differenze nella struttura del genoma tra cultivar pepe (complementare Figg. 8 e 9 , Tavoli integrativa 2 e10-19 e nota integrativa ). La proporzione del genoma che era divergente tra CM334 e gli altri tre genomi pepe era 0,35, 0,39 e 1,85% (10,9, 11,9 e 56,6 milioni di SNPs per Perenne, Dempsey e C. chinense , rispettivamente) ( Tabella complementare 11 ). Sequenze divergenti erano ampiamente dispersi lungo i cromosomi pepe ( fig. 1 e tavole aggiuntive 12 e 13 ). Il numero di blocchi a bassa copertura (190 con finestre 500 kb) che erano divergenti tra C. annuum e C. chinense mostra la variazione genomica nelle due specie (fig. 1 e Tabella complementare 16 ).



    Figura 1: paesaggio genomica dei cromosomi pepe.
    Paesaggio genomico di cromosomi pepe.
    Da sinistra a destra: la densità dei blocchi abbinati, densità genica, la copertura di ripetizione e la densità SNP. Densità di blocchi abbinati è presentato per C. chinense , Dempsey e perenne (da sinistra a destra) per le finestre da 500 kb. Densità gene è presentato come il numero di geni entro intervalli di 1 Mb. La copertura ripetizioni rappresenta la proporzione di TE totali, zingari elementi e Copia elementi del LTR entro intervalli di 1 Mb. Densità SNP è presentato come il numero di SNPs per ogni intervallo di 1 Mb.
    Elementi trasponibili (TES) hanno più ruoli nel guidare l'evoluzione del genoma negli eucarioti 18 . In totale, abbiamo identificato 2,34 e 2,35 Gb (76,4 e 79,6%, rispettivamente) della sequenza nel CM334 montato e C. chinense genomi come TE ( Tabella 1 e Tabella integrativa 20 ). Il tipo predominante di TE era ripetizione terminale lunga (LTR) elementi, che rappresentano circa 1,7 Gb (oltre il 70%) del numero totale di TEs nei due genomi. La maggior parte delle LTR erano zingarielementi, che rappresentano il 67,0 e il 62,1% dei TEs in CM334 e C. chinense , rispettivamente.Un gran numero di elementi Caulimoviridae erano unici a uno pepe genoma ( Tabella complementare 20 ). TES erano ampiamente dispersi in tutto il genoma pepe e spesso ha portato alla conversione di euchromatin in eterocromatina. La distribuzione di TEs era inversamente correlata con densità gene ( Fig. 1 ).

    Previsione Gene, l'annotazione di geni e RNA sequenziamento

    Un totale di 34.903 geni codificanti proteine ​​sono stati previsti nella pipeline PGA (Pepper annotazione genomica v 1.5) ( figure complementari. 10 , 11 , 12 , tabelle supplementari 21-28 enota integrativa ). Questo numero gene è circa la stessa come per il pomodoro (International Pomodoro Annotazione Group (iTag) v2.3, 34.771 geni) 19 e la patata (Potato Genome Sequencing Consortium (PGSC) v3.4, 39.031 geni) 20 , che suggerisce un gene simile il numero di piante Solanacee ( figure complementari. 13 e 14 ). Abbiamo valutato i modelli di geni di consenso con il 19,8 Gb di Illumina sequenziamento di RNA (RNA-Seq) dei dati. Complessivamente, il 93,2% delle sequenze codificanti predette sono state supportate da dati Illumina, dimostrando l'elevata precisione della previsione gene da PGA. Per convalidare e migliorare i modelli di geni, abbiamo curato manualmente geni erroneamente annotati: 335 geni sono stati aggiunti manualmente, e 86 geni sono stati riclassificati come pseudogeni. Questa ispezione manuale e curation portato alla sostituzione di 1789 geni con migliori modelli del gene.
    Abbiamo eseguito l'analisi dell'intero genoma di piccoli RNA e microRNA identificato 177 corrispondenti a 37 famiglie microRNA ( tabella integrativa 26 ). La distribuzione di piccoli RNA si correlavano bene con densità gene nel genoma pepe caldo ( Fig. complementare. 11 ), simile al pomodoro 20 ma a differenza di quanto si osserva in Arabidopsis thaliana .
    In totale, abbiamo identificato 17.397 set di geni ortologhi rispetto delle pepe e pomodoro genomi.Per confrontare l'espressione genica nelle pepe e pomodoro genomi, abbiamo effettuato analisi di RNA-Seq della placenta e pericarpo in sette fasi cruciali dello sviluppo del frutto ed espressione genica rispetto in altri tessuti provenienti da queste due specie ( Fig. complementare. del 10 eTabella supplementare 22 ) . Questa analisi dei tessuti-by-tessuto ha dimostrato che un cambiamento significativo nel pattern di espressione genica di geni ortologhi (regolato P value <0.01) nello 8,8% dei set di geni ortologhi in tessuto fogliare e in 46,4% dei set di geni ortologhi in tessuto pericarpo a 35 d post-antesi (dpa) ( Fig. complementare. 15 ).

    Espansione Genome

    Il pepe genoma caldo condiviso blocchi sinteniche altamente conservati con il genoma di pomodoro, il suo più vicino parente all'interno della famiglia delle Solanacee ( Fig. 2a e Fig. complementare. 16). Tuttavia, il pepe genoma calda era circa quattro volte maggiore del genoma del pomodoro, causa un maggiore accumulo di sequenze ripetute in entrambe le regioni heterochromatic e eucromatiche ( Fig. 2b e Fig. complementare. 17 ). Le ripetizioni più comuni nel genoma pepe caldo erano retrotrasposoni LTR, come in molti altri impianti genomi 18 , 21 , 22 , 23 . Tuttavia, la composizione di retrotrasposoni LTR del genoma pepe calda era distinta da quella di altre piante. Abbiamo stimato il numero totale di retrotrasposoni LTR contando le trascrittasi inversa (RT) domini codificate dal peperoncino e genomi pomodoro ( Fig. 2c ). Dei domini RT codificate dal genoma pepe caldo, vi erano 12 volte più dallo Gypsy famiglia che dalla Copia famiglia, in contrasto con i relativi numeri osservati per altri genomi vegetali come il pomodoro, mais e orzo 19 , 21 , 22 . Pertanto, sostanziale proliferazione del Gypsy famiglia era la causa principale di espansione del genoma pepe caldo.



    Figura 2: Analisi del genoma pepe espansione rispetto al genoma di pomodoro.
    Analisi di espansione genoma pepe rispetto al genoma di pomodoro.
    a ) diagramma circolare che mostra collinearità genetica tra il peperoncino e pomodoro. Il peperoncino e pomodoro cromosomi corrispondenti sono rappresentate da barre rosse e blu, rispettivamente. Le linee collegano le posizioni dei set di geni ortologhi, con la linea di colore che rappresenta ogni set cromosoma.( b ) In alto, il confronto lineare del cromosoma 2 peperoncino piccante (barra superiore) e pomodoro (barra inferiore). Le posizioni dei set di geni ortologhi sono indicate da linee che collegano le due barre. Blocchi blu e bianche sulle barre indicano la ripetizione e le regioni geniche, rispettivamente. In basso, il confronto delle regioni eterocromatiche e eucromatiche ingranditi di peperoncino e pomodoro. Le posizioni del heterochromatic ingrandita ( α , α ') e euchromatic (β, β') regioni sono indicate sopra. ( c ) Confronto tra numero di copie per Gypsy , Copia e Caulimoviridae elementi. La frazione di ciascun elemento di ripetizione è indicato tra parentesi. ( d ) Distribuzione di elementi ripetuti sul cromosoma 10 in peperoncino e pomodoro. I grafici sopra e sotto ogni barra mostra ripetizione e densità genica, rispettivamente. I dati vengono visualizzati per tre sottogruppi di Gypsy elementi, Copia e Caulimoviridae di peperoncino piccante e per tutti i sottogruppi di pomodoro. ( e ) Istogramma di peperoncino e pomodoro LTR inserimenti retrotrasposoni. I modelli di inserimento degli zingari e Copia sono indicati gli elementi in ciascuna specie.La barra grigia verticale indica il tempo di speciazione (19.1 milioni di anni fa). ( f ) Confronto di Caulimoviridae composizione dell'elemento. Alberi filogenetici sono indicati per il peperoncino e pomodoro elementi Caulimoviridae. Elementi comuni e quelli esistenti in una sola specie sono rappresentate da triangoli pieni e vuoti, rispettivamente. Il sottogruppo nullo è rappresentato da linee.
    Dei Gypsy elementi familiari, 83,5% erano dalla Del sottogruppo, e questi elementi accumulato soprattutto nelle regioni eterocromatiche del genoma pepe caldo ( Fig. 2d e figure complementari. 18 e 19 ). Del elementi sono noti ad accumularsi selettivamente nelle regioni heterochromatic a causa della funzione del chromodomain codificato 24 . Tuttavia, spesso trovato queste Del elementi nelle regioni collineari del genoma pepe caldo che correlata con pomodoro euchromatin, con l'inserimento di tali elementi conseguente formazione di isole heterochromatic gene nel genoma pepe caldo ( Fig. 2b ). Il modello di inserimento Del elementi può indicare che il pepe genoma caldo ampliato aumentando la dimensione del eterocromatina esistente e convertire euchromatin in eterocromatina. Abbiamo anche osservato che la Tat sottogruppo della zingara famiglia aveva accumulato selettivamente nelle regioni eucromatiche ( Fig. 2d ). L'accumulo di Copia e Tatelementi ha portato l'espansione del peperoncino euchromatin.
    Abbiamo stimato i tempi di inserimento per zingari e Copia elementi utilizzando il metodo descritto da Sanmiguel et al. 25 ( Fig. 2e e Fig. complementare. 20 ). Il tempo di speciazione di pepe e pomodoro è stato segnalato come 19.100 mila anni fa, 26 . Tempo di speciazione può essere stimato dal valore di picco in analisi in frequenza del tasso sinonimo di sostituzione ( s ), del gene orthologous set 27 . Pertanto, abbiamo analizzato un istogramma di s valori da 17.397 set di geni ortologhi di peperoncino e pomodoro. Il valore di picco della s frequenza utilizzata per determinare il punto di tempo speciazione è stata osservata a 0,3 (19.1 milioni di anni fa) ( Fig. supplementari. 20 ). Gypsy elementi del genoma pepe caldo sono stati progressivamente accumulati prima di speciazione e ha raggiunto un picco di frequenza in un valore di sostituzione di 0,2 (12.7 milioni di anni fa) ( Fig. 2e ). COPIA elementi mostrato relativamente recente inserimento durante il periodo corrispondente a valori di sostituzione tra 0 e 0,2, che coincide con l'inserimento di zingari e Cópia elementi nel genoma di pomodoro ( Fig.. 2e ). Variazioni di eterocromatina possono creare barriere di specie 28 . Pertanto, l'accumulo disparità di zingari elementi in regioni eterocromatiche della specie progenitrici può aver avuto un ruolo nella speciazione di peperoncino.
    Tra i domini RT codificate dal genoma del pepe caldo, i domini RT di Caulimoviridae erano insolitamente abbondanti (4,9%) ( Fig. complementare. 21 ). Il numero di domini Caulimoviridae RT nel peperoncino piccante era 4.304, 9,2 volte superiore a quello osservato in pomodoro.Caulimoviridae è un pararetrovirus DNA di ~ unità di lunghezza di 8 kb che si è evoluto da unazingara elemento e replica tramite un RNA intermedio senza LTR sequenze 29 . Finora, elementi Caulimoviridae non sono state riportate nella classificazione ripetizione in altre sequenze del genoma della pianta, ad eccezione di un piccolo numero di copia nel genoma della banana 30 .Abbiamo identificato tre sottogruppi di Caulimoviridae tra cui Petuvirus, Caulimovirus e Cavemovirus nel genoma del pepe caldo, ma solo Cavemovirus è stato identificato nel genoma del pomodoro (fig. 2f ). Questa scoperta indica che la proliferazione di Petuvirus e Caulimovirus elementi ha portato alla grande abbondanza di Caulimoviridae nel pepe genoma calda con distribuzione casuale ( fig. 2d e Fig. complementare. 19 ). Pertanto, l'accumulo di questi elementi potrebbe anche avere un ruolo nella espansione del genoma pepe caldo in entrambe le regioni heterochromatic e eucromatiche.

    Evoluzione della via biosintetica capsaicina

    Capsaicinoids sono le determinanti di pepe piccante. Essi sono specializzati metaboliti secondari presenti solo in Capsicum specie. Capsaicinoids sono sintetizzate da capsaicina sintasi ( CS e Pun1), che vanillylamine condensa dal pathway dei flavonoidi con 8-metil-6-nonenoyl-CoA dalla catena ramificata acidi grassi percorso 31 , 32 ( Fig. 3a ). Anche se i geni biosintetici sono stati in parte chiariti 33 , 34 , 35 , le reazioni biochimiche, l'evoluzione e la regolazione della biosintesi capsaicinoid sono ancora in gran parte sconosciute.



    Figura 3: Evoluzione della via biosintetica capsaicinoid.
    Evoluzione della via biosintetica capsaicinoid.
    a ) percorso Capsaicinoid biosintetica. Enzimi denominati contrassegnati da frecce rosse corrispondono con i geni utilizzati nell'analisi. ( b ) Confronto di profili di trascrizione per i geni biosintetici capsaicinoid. Le mappe di calore spettacolo log 2 -scala letture per kilobase per milione letture (RPKM) per i geni biosintetici in CM334 (pepe piccante) e ECW (pepe non pungente) e per i loro ortologhi di pomodoro. I tessuti che sintetizzano capsaicinoid sono contraddistinte da un asterisco. PAL, fenilalanina ammoniaca liasi; C4H, cinnamato 4-idrossilasi, 4CL, 4 cumaril-CoA ligasi, HCT, transferasi hydroxycinnamoyl; C3H, p-cumaril shikimate / quinate 3-idrossilasi, COMT, caffeoyl-CoA 3-O-metiltransferasi ; HCHL, hydroxycinnamoyl-CoA liasi idratasi, AMT, aminotransferasi, BCAT, a catena ramificata di aminoacidi alanina, Kas, sintasi chetoacil-ACP; ACL, acile proteina carrier, Fata, acile-ACP tioesterasi, CS, la capsaicina sintasi. Tre repliche biologiche dai tessuti pool sono stati preparati per l'RNA-Seq. ( c ) analisi Microsynteny della sequenza di peperoncino contenente CS (codifica capsaicina sintasi; barra in alto) e la sua sequenza collinear pomodoro (barra inferiore). Le linee che collegano le due barre indicano regioni con> 70% di somiglianza. CS paraloghi e dei loro geni corrispondenti a pomodoro sono contrassegnati da frecce. I numeri sopra le frecce e le lettere sotto le frecce indicano paraloghi moltiplicati. Frecce nere e rosse indicano origini diverse le paraloghi. ( d , e ) modelli di molteplici duplicazioni geniche per CSparaloghi ( d ) e dei loro geni corrispondenti in salsa di pomodoro ( e ). Lunghezza del ramo in ogni albero filogenetico è proporzionale al tasso di sostituzione sinonimi. La barra grigia verticale su ogni albero indica l'ora di speciazione. α e β indicano i geni ancestrali dei paraloghi. β con numeri di serie indicare geni ancestrali duplicati. Eventi di duplicazione ricostruiti per i paraloghi sono mostrati a destra di ogni albero.Scatole nere e rosse indicano origini diverse le paraloghi. Le linee continue e tratteggiate indicano gli eventi di duplicazione e traslocazione, rispettivamente.
    Utilizzando omologia, microsynteny e precedenti relazioni 35 , abbiamo identificato tutti i geni ortologhi del percorso capsaicinoid nel genoma del pomodoro ( Fig. complementare. 22 ). In una analisi del trascrittoma comparativa, diversi geni del pathway mostrato chiaramente espressione differenziale in pepe e pomodoro frutti ( Fig. 3b , Fig. supplementare. 23 e tabelle supplementari 29-31 ). -Specifico espressione Frutto del CS , che codifica un omologo di acyltransferase, avvenne principalmente durante placenta pepe sviluppo (a 16 dpa, 25 DPA e verde maturo (MG)). Tutti gli altri geni nella via sono stati espressi in questa fase, e capsaicinoids stati sintetizzati nella placenta durante questo periodo 36 . Al contrario, i geni ortologhi nella via di pomodoro ( BCAT , Kas e CS ) raramente sono state espresse in questa fase, e abbiamo ottenuto un risultato simile per il genoma della patata ( Fig. complementare. 24 e tabelle integrative 32 e 33 ). Questi risultati potrebbero indicare che i cambiamenti nell'espressione genica di BCAT , Kas e CS abilitati sintesi capsaicinoid in calde frutti pepe.
    O locale Genome-wide duplicazione del gene è cruciale per l'origine di nuove funzioni geniche 37 .Analisi Microsynteny delle regioni genomiche circostanti CS nel peperoncino piccante (~ 436 kb) e pomodoro (~ 183 kb) individuati aciltransferasi cluster di geni in entrambe le specie ( fig. 3c ).L'analisi filogenetica della famiglia genica acyltransferase all'interno di queste regioni peperoncino (sette copie) e pomodoro (quattro copie) ha dimostrato che CS è apparso dopo speciazione attraverso molteplici duplicazioni geniche. I sette copie di CS in peperoncino sottoposti a cinque cicli di eventi di duplicazione tandem disuguali, mentre i quattro copie di CS in salsa di pomodoro sperimentato due turni di eventi di duplicazione dei geni ancestrali ( Fig. 3d, e ). CS probabile emersa solo dopo la finale giro di duplicazione genica nel genoma pepe caldo. Altri due geni ( KasCOMT ) nella via biosintetica capsaicinoid anche subito disuguali eventi di duplicazione genica simili a quelli per i geni ortologhi in salsa di pomodoro ( complementare Fig. 22. ). Le funzioni biochimiche delle aciltransferasi all'interno di entrambi i cluster non sono stati affrontati, tuttavia, sembra che neofunctionalization si è verificato per quanto riguarda sia l'espressione genica e la funzione delle proteine, conferendo un ruolo per CS in sintesi capsaicinoid dopo la recente duplicazione genica. Questi risultati forniscono sostanziali nuova visione l'origine del piccante in peperoncino.
    Abbiamo confrontato l'espressione dei geni biosintetici capsaicinoid nelle placente di peperoni piccanti e non pungenti. Peperoni non pungenti hanno una grande delezione in CS che attraversa la regione del promotore del primo esone 33 . Durante lo sviluppo placenta, CS era altamente espresso solo in pepe pungente ed era appena espresso in pepe non pungente ( Fig. 3b ). Tutti gli altri geni della via biosintetica capsaicinoid hanno mostrato un'espressione simile, tranne che perBCAT , COMT e FATA alle 6 dpa Questo risultato indica che le specie di pepe non pungente apparso a causa della perdita di CS espressione senza modifiche sostanziali l'espressione di altri geni della biosintesi percorso.

    Analisi famiglia Gene

    La distribuzione delle famiglie di geni ortologhi in peperoncino, pomodoro, patata, Arabidopsis , l'uva e il riso è stata definita usando OrthoMCL 38 . Abbiamo identificato 23.245 geni peperoncino in 16.345 famiglie, con 7826 famiglie condivise da tutte le 6 specie ( Fig. complementare. 25 ,Tavoli supplementari 34-37 e nota integrativa ). Un totale di 2.139 famiglie di geni erano unici per le piante Solanacee, e 756 famiglie di geni erano unici al peperoncino. Il pepe genoma caldo condivisa 27, 51 e 20 famiglie di geni di Arabidopsis , uva e riso, rispettivamente. Variazioni nella dimensione della famiglia sono stati trovati in molte famiglie geniche caldo pepe. Abbiamo scoperto che le famiglie di geni coinvolti nella resistenza alle malattie e funzioni cellulari, quali il citocromo P450 e il calore shock protein 70 geni, sono stati significativamente ampliati nel genoma peperoncino piccante ( figure complementari. 26-45 , tabelle supplementari 38-52 e nota integrativa).
    Abbiamo identificato 2.153 fattori di trascrizione (6.25% dei geni totali) e regolatori trascrizionali in 80 famiglie di geni. Alcuni fattori di trascrizione inclusi sottoclassi Solanacee-specifici, in particolare nelle famiglie ARF, AP2/ERF, WRKY e NAC. Questi fattori di trascrizione possono avere funzioni uniche a solanacee, quali risposte di difesa. Nove fattore di trascrizione famiglie avevano meno geni (compresa la famiglia AP2/ERF) rispetto ad altri genomi vegetali, e nessun fattore di trascrizione della famiglia DBP è stato trovato nel genoma peperoncino ( Tabella complementare 43 ).
    Un totale di 684 geni dal sito-ricco-leucina repeat (NBS-LRR) famiglia nucleotide-binding erano significativamente ampliato nel genoma pepe rispetto agli altri genomi vegetali ( Tabelle integrative 38 , 39 e 41 ). Proteine ​​NBS-LRR sono identificati principalmente come geni di malattia di resistenza39 . Il pepe genoma caldo conteneva 636 non-TIR (recettore Toll/interleukin-1) di tipo NBS-LRR, un numero significativamente superiore ai 525 non-TIR NBS-LRR di riso 40 . Il numero di proteine ​​TIR tipo nel genoma peperoncino (48) era simile a quello delle patate (47) ( Tabella complementare 39). Più della metà delle sottoclassi NBS-LRR in ogni genoma Solanaceae sono stati classificati in 37 sottoclassi ( tabella integrativa 41 ). In particolare, il Bs2 (batterica posto gene di resistenza) 41contenente sottoclasse (82 geni) espone espansione esplosiva nel genoma del pepe caldo rispetto al pomodoro (3 geni) e patate (1) del gene genomi. Questa espansione potrebbe essere una conseguenza di eventi evolutivi di duplicazione in tandem con conseguente raggruppamento preferenziale dei geni sul cromosoma 9 ( complementare fig. 26 e complementare Tabella 42 ).Ampliamento dei geni NBS-codificanti del genoma pepe caldo ha provocato la perdita di collinearità con pomodoro o la patata nelle regioni NBS-codificanti, mentre maggiore synteny è stato mantenuto tra le regioni NBS codificanti di pomodoro e patate ( Fig. complementare. 27 ). Confronti di peperoncino R geni tra piante Solanacee suggerito che l'espansione e la diversificazione delle Rgeni sono stati coinvolti in evoluzione parallela specifico lignaggio attraverso eventi gene-duplicazione disuguali, causando diversi repertori di geni anche in specie strettamente correlate.

    Comparative maturazione dei frutti

    Frutti carnosi sono fisiologicamente classificati in due gruppi: climaterici e non climaterici. Frutti climaterici come pomodoro e visualizzazione di banana aumento della frequenza respiratoria e sintesi di etilene durante la maturazione. Frutti non climaterici come il pepe e fragola mostra né un burst respiratorio né la produzione di etilene elevata durante la maturazione 42 . Così, pepe e pomodoro offrono modelli adatti per il confronto di processi di maturazione della frutta. Repertori di geni legati alla maturazione dei frutti di peperoncino e pomodoro sono ben conservati ( Tabella complementare 53 ), il che suggerisce che un meccanismo di regolazione genica probabile causa differenziazione maturazione dei frutti. Per identificare i meccanismi regolatori conservati e differenziali in peperoncino e pomodoro, abbiamo studiato geni regolatori ortologhi precedentemente identificati in pomodoro maturazione. Espressione di geni fattore di trascrizione (RIN 43 , TAGL1 (rif. 44 ) e NOR 45 ) e geni coinvolti in percorsi di segnalazione di etilene ( NR 46 ,ETR4 (rif. 47 ), EIN2 (rif. 48 ) e EIL famiglie 49 ) è stato conservato durante la maturazione dei frutti ( Fig. 4 ). Al contrario, il CNR 50 , Uniform ( Golden-simile 2 ) 51 e HB-1 (rif. 52 ) ha mostrato pattern di espressione distinti nel peperoncino e pomodoro ( Fig. 4 ). CNR è stata espressa a livelli molto bassi durante pepe maturazione, considerando che si è espressa ad alti livelli durante pomodoro maturazione. I principali geni biosintetici etilene per la maturazione di pomodoro, tra cuiACS2 , ACS4 e ACO1 (rif. 53 ), sono stati espressi a livelli molto bassi durante il peperoncino maturazione ( Fig. 4 ). Così, la conservazione e la divergenza della trascrizione di questi geni e le loro interazioni possono portare a differenze qualitative e quantitative dei fenomeni fisiologici sottostanti maturazione.



    Figura 4: trascrizionale divergenza e la conservazione dei geni maturazione correlati al peperoncino e pomodoro.
    Divergenza trascrizionale e la conservazione dei geni maturazione correlati al peperoncino e pomodoro.
    a ) la mappa di calore di dati di RNA-Seq normalizzati ottenuti da tre repliche biologiche per i geni coinvolti nella maturazione dei frutti. SPL-CNR, squamosa-promotore binding protein-like- incolore non maturazione ; GLK2, golden 2-simili; HB-1, HD-Zip proteine ​​homeobox, ACS, ACC sintasi, ACO, ACC ossidasi, CCS, capsantina, capsorubina sintasi ; CYC-B, specifico per chromoplast licopene β-ciclasi; MADS-RIN, MADS-box fattore di trascrizione, maturazione inibitore ; TAGL1, pomodoro AGAMOUS-like 1; NAC-NOR, NAC fattore di trascrizione- non-maturazione ; TDR4, pomodoro fruitfull omologo, NR, non matura ; ETR4, recettore etilene omologo 4; EIN2, etilene-insensitive, EIL, EIN-come; ERF6, etilene fattore reattivo 6; PSY1, fitoene sintasi 1. I, l'espressione genica divergente; II, espressione genica conservati. ( b) il modello di funzionamento del controllo della maturazione non-climaterica in pepe. Scatole blu e rosse rappresentano i geni che sono inibiti e sovraregolati in pepe, rispettivamente. Scatole arancioni rappresentano i geni che mostrano un'espressione simile al pepe e pomodoro. Linee doppie indicano una relazione tra orthologous pepe e pomodoro geni.
    I principali pigmenti presenti nella frutta pepe sono la capsantina e capsorubina, che sono i carotenoidi specifici di pepe sintetizzati dalle Capsantina-capsorubina sintasi (CCS) 54 . CCS mostra un'attività licopene β-ciclasi 54 e ha un rapporto orthologous con specifico chromoplast licopene β-ciclasi (CYC-B) 55 , che espone etilene-dipendente repressione 44 durante la maturazione del pomodoro. CCS espressione era estremamente alto durante pepe maturazione (Fig. 4 e tabella integrativa 22 ), il che suggerisce che la regolamentazione etilene-dipendente può essere conservato in entrambi i tipi di maturazione dei frutti e portare a risultati diversi. Pertanto, queste reti di regolazione dello sviluppo e ormonali potrebbero essere i componenti principali che distinguono diversi modelli di maturazione.
    Una delle caratteristiche distintive di maturazione pepe e pomodoro è frutto di addolcimento, in cui poligalatturonasi (PG) ha un ruolo centrale. Il peperoncino PG gene codifica una delezione parziale di ~ 90 aminoacidi nella regione C-terminale della proteina rispetto al pomodoro PG ( LePG2a , Solyc10g080210) ( Fig. complementare. 46 ). In analisi di sequenziamento comparativa dei PG(CA10g18920) da wild-type pepe e la carne morbida 56 mutante, abbiamo scoperto che una mutazione puntiforme nel sito splice accettore 3 'a introne VIII ha generato un codone di stop prematuro nel PG gene da wild-type pepe. L'SNP in PG geneticamente cosegregate con l'ammorbidimento fenotipo frutta e distinti frutti normali e soft-polpa tra germoplasmi pepe (complementare fig. 47 e complementare Tabella 54 ). I livelli di pectina idrosolubile nel frutto rosso dalla carne morbida mutante erano molto superiori nel frutto da wild-type pepe ( Fig. complementare. 48 ). I livelli differenziali di pectina idrosolubile probabile supportati PG-mediata degradazione e pectina risultante frutta rammollimento. Pertanto, l'alterata PG gene in peperoncino wild-type può avere un ruolo fondamentale nella non-ammorbidimento di frutta in coordinamento con regolazione trascrizionale di geni legati parete cellulare ( tabella integrativa 55 ).
    L'ascorbato (vitamina C) è un nutriente essenziale per gli esseri umani e agisce come un antiossidante 57 . Pepper frutto è una delle fonti più ricche di acido ascorbico. La concentrazione di ascorbato nel pepe è fino a dieci volte superiore a quello del pomodoro 58 . La maggior parte dei geni pepe nella L -galattosio percorso mostrato espressione simile o superiore in pomodoro (Tabella complementare 56 ). GGP1 , che catalizza la procedura impegnati per L -galattosio sintesi, è altamente espresso in tutte le fasi di pepe sviluppo del frutto rispetto ai tessuti vegetativi pepe.L'espressione di pepe GGP1 era triplice due a più alto durante le fasi verde di frutta (a 6, 16 e 25 DPA) rispetto al pomodoro ( complementare Fig. 49 ). Questi dati indicano che la L -galattosio percorso può essere la via biosintetica predominante per ascorbato in peperoncino. Il riciclaggio è un altro fattore che controlla il contenuto ascorbato 59 . Ossidasi ascorbato (APXS) generano deidroascorbato; ascorbato può essere rigenerato da reduttasi monodehydroascorbate (MDHAR) e reduttasi deidroascorbato (DHAR). APX2 espressione nei frutti interruttore di pomodoro è stato 20 volte superiore a quello del peperoncino. Al contrario, DHAR era altamente espresso durante il periodo caldo pepe maturazione, con l'espressione più alta osservata a 16 dpa per frutta pepe, ad un livello 5 volte superiore a quello del pomodoro. Questi geni differenzialmente espressi coinvolti nella biosintesi ascorbato e riciclaggio spiegare ulteriormente la maggiore accumulo di ascorbato di pepe frutta.

    Discussione





    Nel 2011, il valore della produzione di peperoncino mondiale era $ 14,4 miliardi, 40 volte superiore rispetto al 1980 (statistiche della FAO, vedi URL ). Consumo Pepe continua a crescere a causa di alto valore nutritivo di questo frutto. Le sequenze del genoma di pepe qui descritti possono servire come un'importante risorsa genomica per migliorare il valore nutrizionale e farmaceutico derivato da peperoncino e sostenere studi di genomica evolutiva e comparativa di Solanaceae, una delle famiglie di piante più diversificate del mondo. Capsicum è l'unico genere che evoluta la biosintesi di capsaicinoidi, che consistono in più di 20 alcaloidi correlati che causano pungenza in pepe frutta.La sequenza del genoma peperoncino offrirà l'opportunità di acquisire una comprensione completa del percorso capsaicinoid e rappresenta una risorsa eccellente per esplorare l'evoluzione dei metaboliti secondari nelle piante. Questo studio suggerisce fortemente che il pepe piccante origine attraverso l'evoluzione di nuovi geni da disparità duplicazione di geni esistenti, a causa di cambiamenti nell'espressione genica in frutti dopo la speciazione. Il pepe genoma caldo fornisce una solida base per ulteriori studi che utilizzano genomica comparativa, l'ingegneria metabolica e approcci transgenici per svelare il percorso completo della biosintesi capsaicinoid in Capsicumspecie. In combinazione con il pomodoro recentemente pubblicato 19 e patate 20 genomi, il peperoncino genoma caldo sarà chiarire l'evoluzione, la diversificazione e l'adattamento di oltre 3.000 specie di Solanacee, che sono adattato ad una vasta gamma di habitat geoecological che vanno dai deserti più aridi alle foreste pluviali tropicali . Resequencing di due cultivar e de novosequencing di C. chinense offre un paesaggio di diversità genomica tra Capsicum specie. Il pepe genoma calda permetterà il progresso delle nuove tecnologie di allevamento attraverso l'esplorazione delle associazioni genome-wide e studi di selezione genomica su tratti ortoculturalmente importanti come la pezzatura dei frutti, la resa, piccante, la tolleranza agli stress abiotici, contenuto nutrizionale e la resistenza alle malattie multiple.

    Metodi





    De novo e resequencing dei genomi di pepe.

    Un Landrace messicana, C. annuum cv. CM334, e di una specie selvatica, C. chinense PI159236, sono stati utilizzati per de novo sequenziamento del genoma, e C. annuum cv. Perenne e C.annuum cv. Dempsey sono stati resequenced. Librerie associati-end e compagno coppie per il sequenziamento sono stati preparati con i kit corrispondenti (Illumina) seguendo le istruzioni del produttore e sono stati validati con KAPA SYBR RAPIDA Master Mix Universale 2 × qPCR Master Mix (Kapa Biosystems). Biblioteche costruiti sono stati sequenziati su piattaforme Illumina (Genome Analyzer IIx e HiSeq 2000) utilizzando protocolli standard ( nota integrativa ).

    Assemblaggio del genoma.

    Prima del montaggio del genoma, brevi sequenze di lettura di ogni libreria sono stati pre-elaborati utilizzando in-house tubazioni pre-elaborazione per aumentare la precisione di assemblaggio del genoma ( nota integrativa ). Contaminazione da sequenze batteriche, ripetuto a breve legge e basi di bassa qualità in ogni breve lettura sequenza è stata rimossa. Breve pretrattato legge sono stati di errore corretto con Quake 60 . Sequenza rimanente è stato poi assemblato con SOAPdenovo 15con l'ottimale K -mer per ogni libreria ( nota integrativa ). La sequenza del genoma assemblato RCM334 è stato convalidato con 27 BAC con il formato inserto più grande di 70 kb provenienti da regioni eucromatiche o eterocromatiche ( nota integrativa ). La C. chinense assemblaggio del genoma è stata valutata utilizzando C. chinense EST e geni CM334 annotati ( nota integrativa ).

    La costruzione della mappa di linkage genetico e pseudomolecules.

    Una mappa genetica ad alta densità per il peperoncino è stato costruito con 120 linee consanguinee ricombinanti (RIL) derivate da una croce intraspecifica tra Dempsey e perenne utilizzando marcatori SNP ( nota integrativa ). Marcatori sono stati poi allineati ai ponteggi utilizzando BLASTN (identità ≥ 98% e la copertura ≥ 70%).

    Le analisi delle variazioni genomiche.

    Dati grezzi preprocessati per Perenne, Dempsey e C. chinense sono stati mappato il genoma di riferimento CM334 con Bowtie 2 (rif. 61 ) ( Nota Integrativa ). SAMtools 62 è stato usato per chiamare variazioni del DNA. Classificazione e annotazione di variazioni del DNA è stata eseguita utilizzando SnpEff 63 .

    Trascrittoma sequenziamento e l'analisi.

    Piante CM334 sono state coltivate in condizioni standard (cicli giorno / notte, 27/19 ° C, 16/8 h) in una serra. Radici, foglie e steli sono state raccolte da piante sei settimane dopo la semina. Pepe pericarpo e di tessuti della placenta da CM334, pepe placenta dalla ECW e pomodoro placenta daSolanum lycopersicum cv. Alisa Craig sono state raccolte in 6 dpa, 16 dpa, 25 dpa, MG, B, B5 e B10. Per confronto trascrittoma, precedentemente pubblicati i dati RNA-Seq per il pomodoro pericarpo è stato utilizzato 19 . Tre repliche biologiche dai tessuti pool sono stati preparati. RNA totale è stato isolato usando il reagente TRIzol (Invitrogen). Procedimento TruSeq modificato è stato usato per costruire una libreria di RNA-seq specifico filamento 64 con differenti primers indice, e biblioteche sono stati sequenziati sul sistema Illumina HiSeq 2000. Risultante legge sono stati allineati al pepe sequenze CM334 e pomodoro sequenze Heinz utilizzando cellulare CLC Assembly (CLC Bio). Conti per mappati legge sono stati normalizzati da RPKM. Geni differenzialmente espressi durante lo sviluppo del pericarpo sono stati identificati utilizzando DESeq 65 ( nota integrativa ).

    Annotazione del genoma.

    Annotazione del genoma è stata effettuata utilizzando la pipeline PGA ( nota integrativa ). Questo gasdotto utilizza una combinazione di previsione evidence-based gene (RNA-Seq e le proteine) eab initio previsione gene. Modelli di geni Consensus sono stati determinati da EVM 66 , e questi modelli sono stati poi aggiornati con allineamenti di montaggio PASA. Funzioni del gene sono stati assegnati in base alla migliore allineamento raggiunto utilizzando BLASTP al database UniProt (compresi SWISS-PROT e banche dati TrEMBL) e scansione Interpro.

    Analisi di espressione genica differenziale.

    Set di geni ortologhi sono stati trovati da BLAST reciproco con pepe e pomodoro sequenze codificanti ( nota integrativa ). Analisi di espressione genica differenziale è stata effettuata utilizzando DESeq 65 . Tassi di sostituzione sinonimo di set di geni ortologhi sono stati calcolati codeml in PAML 67 .

    Ripetere l'annotazione e l'analisi di espansione del genoma.

    Tutte le occorrenze TE-correlati sono stati caratterizzati utilizzando RepeatMasker con una libreria personalizzata per il pepe. Tassi di sostituzione sinonimo di LTR sono stati calcolati codeml nel pacchetto PAML 67 ( nota integrativa ). Visualizzazione di analisi comparativa sequenza pepe e pomodoro è stata eseguita con script Python in-house o il programma Circos 68 . Alberi filogenetici sono stati costruiti utilizzando il pacchetto MEGA5 69 .

    Analisi OrthoMCL.

    Cluster gene Orthologous sono stati assegnati da OrthoMCL 38, con i suoi parametri standard di sei specie per identificare famiglie di geni arricchito in pepe genoma caldo. Set di geni da peperoncino (PGAv1.0), pomodoro (v2.3), Arabidopsis (TAIR10), uva (VvGDB v2.0), riso (MSU RGAP 7) e patate (PGSC v3.4) sono stati usati per inferire putativo ortologhe famiglie geniche. Varianti di splicing e modelli di geni incompleti nei genomi sono stati rimossi, e un confronto all-by-tutto è stata poi eseguita utilizzando BLASTP con E valore di 1 × 10 -5 . Un totale di 161.775 sequenze proteiche sono stati raggruppati in 21.808 famiglie di geni ( nota integrativa ).

    URL.

    Food and Agriculture Organization delle Nazioni Unite (statistiche FAO), http://faostat.fao.org/ .

    Codici di accesso.

    Sequenze dell'intero genoma per il peperone sono stati depositati in GenBank sotto adesioneAYRZ00000000 (la versione descritta nel manoscritto è la prima versione, AYRZ01000000 ). Per ulteriori informazioni, tra cui il gruppo CM334 genoma, pseudomolecules, annotazioni e C. chinenseassemblaggio del genoma sono disponibili attraverso il nostro sito web all'indirizzohttp://peppergenome.snu.ac.kr .