Irys單分子基因組結(jié)構(gòu)成像系統(tǒng)
讓我們組織,而不是堆砌數(shù)據(jù)
在過去的幾年里,二代測序的高通量***直主導(dǎo)著基因組研究的發(fā)展。
但是二代測序技術(shù)可以廉價的獲得大量的測序數(shù)據(jù),但是受制于較短的讀長,這使得科學(xué)***們無法簡單而直觀地看到整個基因組范圍的結(jié)構(gòu)變化。現(xiàn)在,針對更長片段的分析方法對于基因組結(jié)構(gòu)研究顯得越來越重要。另外,由于基因組的復(fù)雜性,諸如重復(fù)序列和結(jié)構(gòu)變異,限制了基因組的重構(gòu)和對功能元件的理解。Irys系統(tǒng)克服了這些困難,利用***種新的方法去獲取單分子,尤其是長鏈DNA分子的圖像。
長鏈DNA分子
Irys系統(tǒng)的核心是已經(jīng)獲得專利的芯片技術(shù)。這種芯片可以使盤繞的DNA長鏈隨機(jī)解開、拉直,進(jìn)入納米***通道。這些納米通道可以防止半卷曲的DNA分子重新纏繞,并且將大量長鏈DNA分子拉直,平行排列在***起直接拍照成像(圖1)。
IrysPrep 試劑盒可以通過限制性內(nèi)切酶在特異位點(diǎn)進(jìn)行剪切,然后連接上帶有熒光的堿基使長鏈DNA分子被標(biāo)記。軟件會將長鏈上的熒光點(diǎn)翻譯成相應(yīng)的序列信息,以幫助組裝基因組圖譜。成像后,DNA分子會從納米通道中排出,新***批的DNA分子會進(jìn)入。這種動態(tài)的,多循環(huán)的技術(shù)使Irys系統(tǒng)可以實(shí)現(xiàn)每小時內(nèi)完成幾個GB的DNA分子的線性化和成像。
圖1:長鏈DNA分子在納米通道中平等排列,生成高質(zhì)量的圖像
關(guān)聯(lián)的基因組
在單分子水平上對全基因組結(jié)構(gòu)的可視化,不但可以減少了由于DNA擴(kuò)增和打斷等引起的偏差,而且也為***個全基因組的物理圖譜提供了骨架,使測序結(jié)果更有效,更完整。在圖譜中,長序列的基因組結(jié)構(gòu)得以保存,這對發(fā)現(xiàn)生物學(xué)上特異的結(jié)構(gòu)變異是很有裨益的。Irys所測讀的超長片段,對于全基因組圖譜的構(gòu)建,連接功能單元,錨定contigs,確定gap的大小,衡量重復(fù)單元的大小,分辨拷貝數(shù)變化,插入片段以及異位都是非常必要的。
應(yīng)用
IrysPrep試劑盒和IrysView軟件分析系統(tǒng)支持結(jié)構(gòu)變異檢測,組裝驗(yàn)證,骨架和NGS數(shù)據(jù)以及客戶自定義的***些長片段單分子數(shù)據(jù)。
結(jié)構(gòu)變異分析
Irys是***款非常適合做結(jié)構(gòu)變異分析的儀器。NGS的短讀長不僅在de novo測序數(shù)據(jù)的拼裝上存在困難,也限制了其在CNVs方面的應(yīng)用。而其他的方法,比如array-CGH,缺少位置信息而且依賴于探針,因此只能應(yīng)用在已有參考序列的模式物種上。Irys通過長讀長,實(shí)現(xiàn)了基因組范圍內(nèi)的結(jié)構(gòu)變異檢測。長鏈基因組的自然狀態(tài),染色體平衡異位以及插入(重復(fù))具體位置信息都可以被直接觀察到。(圖2)另外,利用單分子檢測,而不是NGS和CGH數(shù)據(jù)的疊加,可以讓群體中的每個個體都能夠被直接檢測到。
圖2:直觀的變異位點(diǎn)分析。通過和果蠅的參考序列(綠色)比對,可以準(zhǔn)確的發(fā)現(xiàn)拷貝數(shù)的多態(tài)性(串聯(lián)重復(fù)),該果蠅只有單拷貝(藍(lán)色),并且通過高覆蓋度得到了驗(yàn)證。
NGS錨定
Irys在de novo應(yīng)用中可以拼裝出更加完整的數(shù)據(jù),和NGS相比,可以在更短時間內(nèi)提供更完整的基因圖譜。任何短讀長的測序方法都會造成重復(fù)序列很難被正確組裝,而Irys特有的超長片段讀長,完全可以跨越重復(fù)片段和***些包含復(fù)雜元件的序列,能夠使contig數(shù)量和gap數(shù)量大大減少(圖3)。
其他***些基于限制性內(nèi)切酶的長片段讀取方法會丟失***些小的片段(比如重復(fù)序列),但是Irys系統(tǒng)的剪切和加標(biāo)簽的化學(xué)方法完全不會破壞DNA長鏈結(jié)構(gòu)。(圖4)
圖3:NGS組裝。人類MHC區(qū)域通過NGS獲得5個contigs,通過Irys系統(tǒng),可以準(zhǔn)確地確定它們在基因組中的位置及gaps的大小。(Lam et al, Nature Biotech, 2012).
圖4:長鏈單分子DNA可通讀重復(fù)片段。酵母的著絲粒區(qū)含有很多重復(fù)片段,參考序列中并沒有完整地呈現(xiàn)它的拷貝數(shù),Irys系統(tǒng)可以通讀長鏈單分子DNA片段,使這***結(jié)果清晰呈現(xiàn)。
組裝驗(yàn)證
Irys系統(tǒng)得到的基因組圖譜可以與NGS數(shù)據(jù)拼裝出的基因組圖譜實(shí)現(xiàn)非常完美的交叉驗(yàn)證。在IrysView軟件中,可以在圖表瀏覽器中看到與已導(dǎo)入的NGS的組裝序列的差異,并且以表格的形式列出,這有助于研究人員進(jìn)行更深層的單分子成像的研究,同時,Irys還可以幫助科研人員快速地設(shè)計新的驗(yàn)證及測序?qū)嶒?yàn)。
在IrysPrep試劑的支持下,Irys系統(tǒng)可以作為***個開放的平臺為研究人員提供多種形式的遺傳分析。基于Irys系統(tǒng)的長鏈單分子熒光標(biāo)記方法,更多領(lǐng)域的應(yīng)用都在不斷的研發(fā)中。