研究背景
甘薯是許多發(fā)展中國(guó)家重要的作物之一,也是重要的能量來(lái)源。甘薯是同源六倍體植物,基因組大小約3-4G,目前還沒(méi)有高質(zhì)量的參考基因組。甘薯采用異花授粉的繁殖方式,自交不孕,導(dǎo)致基因組的雜合度高,目前還沒(méi)有關(guān)于甘薯正向遺傳學(xué)研究的報(bào)道。幾乎所有關(guān)于甘薯轉(zhuǎn)錄本的研究都是采用轉(zhuǎn)錄組測(cè)序的方法,沒(méi)有獲得大規(guī)模的全長(zhǎng)cDNA序列,因此阻礙了甘薯功能基因組學(xué)和分子育種研究的進(jìn)展。長(zhǎng)期以來(lái),人們一直認(rèn)為甘薯有可能由二倍體祖先野生甘薯(I. trifida)進(jìn)化而來(lái),但是沒(méi)有確鑿的證據(jù)。
研究目的
通過(guò)2+3聯(lián)合測(cè)序的方法獲得甘薯和野生甘薯的全長(zhǎng)轉(zhuǎn)錄本,揭示二者的進(jìn)化關(guān)系。
材料方法
實(shí)驗(yàn)材料
甘薯和野生甘薯,不同組織(幼葉、成熟葉、莖尖、莖稈、須根、起始?jí)K根、膨大塊根和成熟塊根)分別等重量混合,提取RNA用于三代測(cè)序;同樣的材料用于二代測(cè)序。
測(cè)序方法及數(shù)據(jù)量
百邁客Pacbio RSII:構(gòu)建1-2k、2-3k、>3k的3個(gè)文庫(kù),每個(gè)文庫(kù)分別測(cè)1個(gè)、2個(gè)、1個(gè)cell,共8個(gè)cell。
百邁客Illumina HiSeq 2500:甘薯和野生甘薯各測(cè)了17G和11G數(shù)據(jù)。
技術(shù)路線
研究結(jié)果
5.1 全長(zhǎng)轉(zhuǎn)錄本的統(tǒng)計(jì)及結(jié)構(gòu)注釋分析
統(tǒng)計(jì)三代的數(shù)據(jù)發(fā)現(xiàn):甘薯得到220,035 個(gè)ROI(reads of insert),其中全長(zhǎng)非嵌合轉(zhuǎn)錄本(Full-Length Non-Chimeric, FLNC)占49.9%,非全長(zhǎng)轉(zhuǎn)錄本(Non-Full-Length, NFL)占46.6%;野生甘薯得到195,188 個(gè)ROI,其中FLNC 和NFL 分別占52.1%和43.9%。對(duì)三代的數(shù)據(jù)進(jìn)行矯正(自我糾錯(cuò)+二代數(shù)據(jù)矯正),甘薯和野生甘薯分別獲得了53,861和51,184個(gè)非冗余轉(zhuǎn)錄本。此外,甘薯和野生甘薯分別預(yù)測(cè)到了104,540 和94,174 個(gè)ORF,全長(zhǎng)轉(zhuǎn)錄本(同時(shí)含有5’-UTR,CDS和3’-UTR)分別有34,963和33,637個(gè)。甘薯和野生甘薯分別鑒定到了 25,315和 27,090 個(gè)SSR,以及471 和531 個(gè)lncRNA。
Figure 1. 對(duì)三代測(cè)序的數(shù)據(jù)進(jìn)行分類(lèi)統(tǒng)計(jì)和結(jié)構(gòu)注釋
5.2 甘薯、野生甘薯與其它植物的CDS比較分析
為了評(píng)估甘薯、野生甘薯的轉(zhuǎn)錄本和其他植物基因的相似性,我們比較了甘薯、野生甘薯與其他植物的開(kāi)源CDS數(shù)據(jù)庫(kù),包括紅苔藤、野生甘薯、牽?;?、煙草、馬鈴薯、大豆、擬南芥和水稻。結(jié)果表明甘薯和野生甘薯大多數(shù)的轉(zhuǎn)錄本都是同源的,說(shuō)明這兩個(gè)物種擁有一個(gè)大致相同的基因庫(kù)。觀察高比例的轉(zhuǎn)錄本發(fā)現(xiàn),盡管這些物種中的大量基因在進(jìn)化過(guò)程中存在著巨大的差異,但仍然共有一些短的motif,說(shuō)明這些基因在進(jìn)化上顯示出高度的保守性。
Figure 2. 比較甘薯、野生甘薯和其他植物的轉(zhuǎn)錄本
5.3 全長(zhǎng)轉(zhuǎn)錄本的結(jié)構(gòu)分析
三代測(cè)序得到的全長(zhǎng)cDNA對(duì)于研究基因的結(jié)構(gòu)非常有用,例如分析外顯子-內(nèi)含子的結(jié)構(gòu)。我們隨機(jī)挑選了50個(gè)基因進(jìn)行比較,發(fā)現(xiàn)這些基因含有的外顯子數(shù)目在甘薯、野生甘薯和擬南芥三個(gè)植物中的分布是相似的。
Figure 3. 分析甘薯、野生甘薯和擬南芥的外顯子-內(nèi)含子結(jié)構(gòu)
5.4 甘薯和野生型甘薯的Ka/Ks分析
人們普遍認(rèn)為二倍體野生甘薯是六倍體作物甘薯的祖先,為了尋找參與甘薯進(jìn)化的候選基因,我們研究了甘薯和野生甘薯的基因選擇模式。首先比較了二者的完整轉(zhuǎn)錄本數(shù)據(jù)集,去除有多種同源性可能的那些轉(zhuǎn)錄本,確定了1269個(gè)假定的甘薯和野生甘薯之間的同源基因?qū)ΑkS后,計(jì)算了每個(gè)基因?qū)Φ腒a/Ks比值,大多數(shù)基因?qū)Φ腒a/Ks比值都小于1,只有56個(gè)基因?qū)Φ腒a/Ks比值大于1,表明在甘薯的進(jìn)化或馴化過(guò)程中,大多數(shù)基因都是受到純化選擇的。而受到正向選擇的這些基因?qū)⒆鳛楹罄m(xù)研究的重點(diǎn)。
Figure 4. 分析甘薯和野生甘薯同源基因?qū)Φ腒a/Ks比值
創(chuàng)新點(diǎn)
1,對(duì)于無(wú)參或者參考基因組不好的物種,全長(zhǎng)轉(zhuǎn)錄組可以獲得轉(zhuǎn)錄本全長(zhǎng)序列,完善基因組注釋的信息。
2,通過(guò)全長(zhǎng)比較轉(zhuǎn)錄組分析研究近源物種間的進(jìn)化關(guān)系。
參考文獻(xiàn):
Generation and comparative analysis of full-length transcriptomes in sweetpotato and its putative wild ancestor I. trifida(bioRxiv在線發(fā)表,2017)