文章轉載自“安捷倫診斷與基因組學”公眾號
全外顯子組測序的應用場景越來越多,根據不同應用場景打造更適配的檢測產品,使之成為一種高效、便捷的測序方案。
從 2009 年至今,基于 SureSelect 液相雜交捕獲技術,安捷倫持續推出更優秀的 WES 檢測產品。SureSelect WES V8 即最新上市的產品體系,機器學習驅動的探針鋪設方式帶來了更優異的數據表現和極高的設計占比。
區別于既往 V6/V7,V8 在核心版本之外,還包含 NCV/UTR/CNV Backbone/Mito 等版本,為什么需要這些不同的產品組合以及它們各自適應于什么樣的應用場景,則是本文的重點。
我們將從基因組結構與功能(上篇)、應用案例(下篇)兩個維度進行闡述。
圖 1:安捷倫最新 SureSelect WES V8 產品家族
WES+NCV
NCV: Non-coding Clinical Variants
存在即合理,BUT,存在即有用嗎?
事實上,每個基因中都有編碼區與非編碼區,非編碼區在對基因的表達調控中發揮重要作用,如啟動子,增強子,終止子等都位于該區域。所以,非編碼序列并非“垃圾 DNA”。
人類基因組中 98.5% 是非編碼序列,非編碼區雖然不編碼蛋白質,但對于遺傳信息表達是不可缺少的。
對遺傳病而言,近 90% 的易感變異位于基因組非編碼區,其下游調控機制未知,亟需解析其分子調控機制,才能將基因組學的發現最終轉化為臨床藥物靶標。
人類基因組非編碼區的注釋和變異致病性的預測,及變異機制的解析,是當前遺傳學領域的研究熱點和難點。
2022 年 7 月,Genome Medicine 雜志發表了一篇《對基因組非編碼區發現的變異的臨床注釋建議》的文章,為改善罕見病的診斷,以及評估其他非編碼變體的致病性提供了更明確的指導。
在腫瘤的研究當中,non-coding somatic mutations 也非常重要,例如肝癌等多種腫瘤中的 TERT 啟動子、T 細胞急性淋巴細胞白血病中 TAL1 基因的增強子,結直腸腫瘤中 CTCF/cohesin-binding sites 等等。
非編碼基因組具有高突變率和重復性的特點,這就導致了較高的背景突變以及潛在的 mapping errors;因而,對于功能性非編碼區域的識別與特征分析,相比于編碼區的驅動突變,有著獨特的挑戰。
圖 2:基因結構示意圖
相比于其他同類產品,安捷倫 SureSelect WES V8+NCV 產品,更好的覆蓋了 HGMD,ACMG,ClinVar 數據庫中的致病和可能致病的遺傳變異,為遺傳學家提供了更有力的研究復雜遺傳疾病的利器。
安捷倫 SureSelect WES V8+NCV 的覆蓋情況
WES+UTR
先來看看什么是 UTR?
UTR: 即 untranslated region,非翻譯區,是 mRNA 分子兩端的非編碼片段。
當從 DNA 轉錄為成熟 mRNA 后,會從第一個 AUG (起始密碼子)開始翻譯產生蛋白,這即是我們熟悉的中心法則。
但是請注意,翻譯起始位點并不是從第一個外顯子最前端開始的,而是 5’ 端第一個 AUG,那么,在起始密碼子之前的序列就是 5’UTR exon (untranslated region)(即圖 2 中第三個條的深藍色部分);相應的,在 3’ 端的終止密碼子之后,也有一部分不翻譯的外顯子被稱為 3’UTR exon (即圖 2 中第三個條的后端綠色區域)。
簡單一個小題目,快速記憶:哪個區域參與基因組翻譯過程?
A:3’UTR exons
B:5’UTR exons
C:CDS exons
點擊下方空白處查看答案
正確答案:C
5’UTR 與 3’UTR,其長度是多少呢?
真核生物 5′ 非翻譯區的中位數長度一般約為 150 核苷酸(nt),但有些可長達數千堿基。有些病毒和細胞的基因有著非常長和結構性的 5' 非翻譯區,這可能會影響基因表達。平均而言,3′ 非翻譯區往往是 5′ 非翻譯區的兩倍長。
舉一個例子:
CDK4 基因,在乳腺癌中是非常重要的藥物靶點。它的第一個外顯子加上第二個外顯子的前半部分,都是 5'UTR Exon,從 exon2 中間位置的 ATG 才開始翻譯(圖 3 中紅色方框)。
圖 3:CDK4 基因的部分結構示意圖
UTR 區域有許多調控元件, 例如,uORFs(upstream ORFs)、IRESs(Internal ribosome entry sites,內部核糖體進入位點)、poly(A) 信號、miRNA 結合位點等。
5’UTR 主要功能包括:調控 mRNA 出細胞核,核糖體招募,調節翻譯起始、調節 mRNA 穩定性等等;
3'UTR 主要功能包括:調節 mRNA 的穩定性,調控 mRNA 的定位表達,調控 mRNA 的翻譯,通過結合多個 RNA 綁定蛋白來行使調控功能等等。
圖 4. 5’ and 3’UTR elements and how they are co-opted in cancer.
引自:Trends Cancer. 2019 April ; 5(4): 245–262. doi:10.1016/j.trecan.2019.02.011.
關于這些調控元件的生物學作用,例如在學習與記憶、神經退行性疾病、惡性腫瘤等疾病中的作用,依然有很多待回答的科學問題。
對于真核 UTR 的結構和功能開展廣泛和深入的研究,去闡明各類基因翻譯背后的精密調控機制,為針對更精細翻譯水平的新診療策略研究鋪平道路,是當前研究的重要問題。
安捷倫 SureSelect WES V8+UTR 的覆蓋情況和測序表現
WES+CNV backbone
CNV(Copy number variation,拷貝數變異)是人類遺傳病的一大重要原因,由基因組發生重排而導致。
與 CNV 變異相關的疾病示例
隨著測序技術的快速發展,被鑒定發現的 CNV 數量越來越多,已有超過數萬個 CNV 位點被記錄在 DGV 數據庫(Database of Genomic Variants)中,這些 CNV(主要為微缺失和微重復)所覆蓋的染色體范圍約占人類全基因組的 20% 以上。
CNV 在全基因組范圍內都可能發生,如果僅針對外顯子區檢測會導致大量的疾病相關 CNV 的漏檢。為了更全面的檢出 CNV,需專門添加可提高 CNV 檢出準確度的高密度 SNP 骨架。這樣一方面有利于提高檢測分辨率,另一方面可以覆蓋沒有基因編碼區的致病性區域。
安捷倫 OneSeq 可在一次經濟有效的 NGS 分析中檢索所有的變異類型,快速發現疾病有關的新型變異,揭示疾病相關的生物學通路。安捷倫提供了兩套不同檢測分辨率的 SureSelect OneSeq CNV Backbones,分別可以實現 1 Mb CNV 檢測分辨率 和 300 kb CNV 檢測分辨率。
OneSeq CNV 骨架捕獲探針設計用于靶向具有最佳 GC 含量和可定位的基因組區域。這樣即可產生高度一致的測序深度分布,并最終獲得可靠的全基因組 CNV 檢測。
而且,OneSeq CNV 骨架捕獲探針可與任意 SureSelect 目錄外顯子組聯合使用,以進行 SNV、插入和缺失檢測。即使在 CNV 骨架捕獲探針存在的情況下,這些區域仍然具有極佳的覆蓋率,從而可確保檢測的準確性。
WES+Mito
線粒體是普遍存在于生物體細胞內提供能量的細胞器,而且線粒體中含有遺傳信息,是一個獨立的遺傳體系。
線粒體 DNA 示意圖
人類線粒體基因組(Mitochondria DNA,mtDNA)的全長 16.6kb, 是一種雙鏈環狀 DNA,不具有內含子 — 外顯子結構,僅含有 37 個基因。線粒體基因組具有獨特的特征,包括結構簡單、編碼區域高度保守、母系遺傳、重組率低、拷貝數高、異質性等。
部分線粒體疾病示例
每一個細胞中含有數百至數千個 mtNDA 拷貝。通常 mtDNA 具有異質性,即同時存在突變以及野生型的 mtDNA,并且每個細胞、組織中的 mtDNA 的突變比例及拷貝數并不一致。
線粒體 DNA(mtDNA)突變,會導致多種線粒體遺傳病和線粒體功能異常,如帕金森綜合征、阿爾茲海默癥、糖尿病、腫瘤等。捕獲完整的線粒體基因組有利于對線粒體基因病的檢測與研究。
以 SureSelect WES V8 為核心,安捷倫提供了以上優異的產品組合,并可實現個性化定制,滿足不同應用場景的基因組學研究項目。SureSelect WES 產品深度解析(下篇)將聚焦應用案例,展示 SureSelect 產品的廣泛應用。
以上內容僅限研究使用。不可用于診斷目的。
友情提醒 |
本信息真實性未經中國工程機械信息網證實,僅供您參考。未經許可,請勿轉載。已經本網授權使用的,應在授權范圍內使用,并注明“來源:中國工程機械信息網”。 |
特別注意 |
本網部分文章轉載自其它媒體,轉載目的在于傳遞更多行業信息,并不代表本網贊同其觀點和對其真實性負責。在本網論壇上發表言論者,文責自負,本網有權在網站內轉載或引用,論壇的言論不代表本網觀點。本網所提供的信息,如需使用,請與原作者聯系,版權歸原作者所有。如果涉及版權需要同本網聯系的,請在15日內進行。 |