PRODUCT CLASSIFICATION
產(chǎn)品分類短讀取的 RNA-seq 雖然可以計(jì)數(shù)已表達(dá)的轉(zhuǎn)錄本,但無法提供這些轉(zhuǎn)錄本的結(jié)構(gòu)信息。
現(xiàn)在,斯坦福大學(xué)研究人員在《自然-生物技術(shù)》(Nature Biotechnology)雜志上報(bào)告稱,他們開發(fā)出了一種能保留轉(zhuǎn)錄本結(jié)構(gòu)信息的新方法,他們通過環(huán)狀 cDNA 模板和長讀取測序,實(shí)現(xiàn)了對(duì)轉(zhuǎn)錄異構(gòu)體(transcript isoform)的定量和分析。
在這項(xiàng)研究中,科學(xué)家舍棄了傳統(tǒng)的短讀取 RNA 測序法,利用 PacBio 公司提供的長讀取技術(shù)來測序完整的轉(zhuǎn)錄本。他們?cè)?20 個(gè)人體組織的混合樣本中,鑒定得到了 476,000 個(gè)轉(zhuǎn)錄本序列,平均長度 1 kb。
絕大多數(shù)哺乳動(dòng)物的基因,不符合一基因一轉(zhuǎn)錄本的模式。這些基因往往存在多種剪切形式,擁有可變的轉(zhuǎn)錄起始/終止位點(diǎn)。短讀取的測序技術(shù)不能提供上述信息,舉例來說,短讀取可以檢測到發(fā)生選擇性剪切的外顯子,但無法判斷外顯子之間的結(jié)構(gòu)關(guān)系,是包含在同一個(gè)轉(zhuǎn)錄本中還是各自獨(dú)立出現(xiàn)。
理論上,長讀取測序技術(shù)可以克服這樣的限制。研究人員構(gòu)建了由環(huán)狀cDNA模板組成的SMRTbell文庫,并將其用于測序。由于測序平臺(tái)的讀取長度實(shí)際上比這些 cDNA 長,該系統(tǒng)可以對(duì)每個(gè)堿基讀取多次,沿著圓環(huán)不斷進(jìn)行,生成更為的“環(huán)化一致序列”(circular-consensus sequence CCS)。在這項(xiàng)研究中,平均讀取長度達(dá)到 7 kb,絕大多數(shù) cDNA 堿基被測序了 5-15 次。
研究人員鑒定得到的絕大多數(shù)是全長轉(zhuǎn)錄本,但也并不*。這是由于 PacBio 測序讀長和 cDNA 合成效率的限制,而這兩個(gè)因素都受序列長度的影響。
論文的主要作者 Michael Snyder 表示:““對(duì) 1.5 kb 以下的 cDNA 來說沒什么問題,對(duì)于大部分2-2.5 kb的cDNA來說,也可以鑒定到全長,”作者寫道。“更長的轉(zhuǎn)錄本需要參考,質(zhì)量較低但更長的讀取數(shù)據(jù)。”總的來說,研究人員獲得了 476,000 個(gè)CCS,代表著 476 million 堿基。
研究人員將這些轉(zhuǎn)錄本,與 GENCODE 項(xiàng)目鑒定的 mRNA 進(jìn)行比對(duì),確定了約 14,000 個(gè)全長的轉(zhuǎn)錄異構(gòu)體(包括編碼和非編碼的轉(zhuǎn)錄本),其中有10%是前所未見的。Snyder 表示:“這類研究就好比是盲人摸象,而我們看到了更完整的圖像。”
這項(xiàng)研究中的方法可以用于 RNA 的結(jié)構(gòu)分析和定量。不過,西班牙科學(xué)家 Roderic Guigo (未參與該研究)認(rèn)為,單純從實(shí)用性和經(jīng)濟(jì)性考慮,這一方法主要適用于前者,因?yàn)樵谡鎸?shí)樣本中為各轉(zhuǎn)錄異構(gòu)體計(jì)數(shù)是很昂貴的。
麻省理工學(xué)院的 Chris Burge 教授(未參與該研究)評(píng)價(jià)道:“該方法有望在轉(zhuǎn)錄異構(gòu)體水平全面注釋基因組,揭示轉(zhuǎn)錄本的詳細(xì)結(jié)構(gòu)信息。”
這項(xiàng)研究可以幫助人們解決一些轉(zhuǎn)錄本難題,例如判斷相距較遠(yuǎn)的選擇性外顯子剪切是否相互關(guān)聯(lián)。不過 Burge 也指出,許多人類轉(zhuǎn)錄本實(shí)際上超過 2 kb,這一技術(shù)還有待進(jìn)一步改進(jìn),以處理更長序列。
郵箱:1170233632@qq.com
傳真:021-51870610
地址:上海市顧戴路2988號(hào)B幢7樓