Dubleks sıralama - Duplex sequencing - Wikipedia

Şekil 2) Çift yönlü sıralamaya genel bakış: Dizileme adaptörlerini içeren çift yönlü etiketli kitaplıklar büyütülür ve her biri tek bir DNA dizisinden kaynaklanan iki tür ürünle sonuçlanır. PCR ürünlerini sıraladıktan sonra, üretilen okumalar genomik pozisyon, dupleks etiketler ve komşu sıralama adaptörüne göre etiket ailelerine bölünür. Lütfen sekans etiketi α'nın sekans etiketi β'nin ters tamamlayıcısı olduğuna ve bunun tersine dikkat edin.

Dubleks sıralama bir kütüphane için hazırlık ve analiz yöntemi Yeni nesil sıralama Çift sarmallı rastgele etiketlemeyi kullanan (NGS) platformları DNA mutasyonları daha yüksek doğruluk ve daha düşük hata oranıyla tespit etmek. Bu yöntem kullanır dejenere moleküler etiketler dizileme adaptörlerine ek olarak, her bir DNA zincirinden kaynaklanan okumaları tanımak için. Oluşturulan dizileme okumaları daha sonra iki yöntem kullanılarak analiz edilecektir: tek sarmallı konsensüs dizileri (SSCS'ler) ve Dubleks konsensüs dizileri (DCS'ler) montajı. Dubleks sıralama teorik olarak 5 x 10 kadar düşük frekanslara sahip mutasyonları tespit edebilir−8 bu, geleneksel yeni nesil dizileme yöntemlerine kıyasla 10.000 kat daha yüksek doğruluktur.[1][2]

Standart yeni nesil sıralama platformlarının tahmini hata oranı 10'dur−2 - 10−3 baz arama başına. Bu hata oranı ile NGS tarafından üretilen milyarlarca baz çağrısı milyonlarca hatayla sonuçlanacaktır. Hatalar, örnek hazırlama ve sıralama sırasında ortaya çıkar. polimeraz zincirleme reaksiyonu, sıralama ve görüntü analizi hataları. NGS platformları hata oranı, algılama gibi bazı uygulamalar için kabul edilebilir olsa da klonal varyantlar, organizma içi algılama gibi düşük frekanslı değişkenlerin tespiti için daha yüksek doğruluk gerektiren uygulamalar için büyük bir sınırdır. mozaikçilik, alt klonal varyantlar genetik olarak heterojen kanserler veya dolaşımdaki tümör DNA'sı.[3][4][5]

Moleküler barkodlama ve dairesel konsensüs sıralama yöntemi gibi NGS platformlarının doğruluğunu artıran çeşitli kütüphane hazırlama stratejileri geliştirilmiştir.[6][7][8][9] Bu yöntemlerle üretilen veriler, NGS platformlarıyla aynı şekilde, tek DNA ipliğinden kaynaklanır ve bu nedenle, PCR amplifikasyonu, doku işleme, DNA ekstraksiyonu, hibridizasyon-yakalama (kullanıldığında) veya DNA dizilimi kendisi hala gerçek bir varyant olarak ayırt edilebilir. Dubleks dizileme yöntemi, iki DNA dizisinin tamamlayıcı doğasından yararlanarak ve yalnızca DNA'nın her iki sarmalında bulunan varyantları onaylayarak bu sorunu ele alır. Her iki sarmalda aynı tam olarak aynı konumda ortaya çıkan iki tamamlayıcı hatanın olasılığı son derece düşük olduğundan, dupleks sıralama, dizilemenin doğruluğunu önemli ölçüde artırır.[1][6][8][10]

Deneysel iş akışı

Dubleks sıralama etiketli adaptörler, NGS adaptörlerinin çoğu ile birlikte kullanılabilir. Bu makalenin şekiller ve iş akışı bölümünde Illumina sıralama adaptörleri, orijinal yayınlanan protokole uygun bir örnek olarak kullanılmıştır.[1][2]

Şekil 1) Dubleks dizileme kitaplığı hazırlama iş akışı: İki adaptör oligosu, 3'-dT çıkıntılı çift sarmallı benzersiz etiketler oluşturmak için birkaç adımdan (Tavlama, Sentez, dT-kuyruklama) geçer. Daha sonra dubleks etiket adaptörleri, çift sarmallı DNA şablonlarına bağlanır. Son olarak Illumina dizileme adaptörleri, etiketli DNA fragmanlarına yerleştirilir ve DS adaptörleri, Illumina sıralama adaptörleri ve şablon DNA içeren son kütüphaneleri oluşturur.

Adaptör tavlama

Bu adım için iki oligonükleotid kullanılır (Şekil 1: Adaptör oligos). Oligonükleotitlerden biri, 12 nükleotitlik tek sarmallı rasgele bir etiket sekansı ve ardından sabit bir 5 'nükleotit sekansı içerir (Şekil 1'deki Siyah sekans). Bu adımda oligonükleotidler vardır tavlanmış gerekli geçici koşullarda inkübasyon yoluyla tamamlayıcı bir bölgede.[1][2]

Adaptör sentezi

Adaptörler tavlanmış başarıyla genişletilir ve bir tarafından sentezlenir DNA polimeraz tamamlayıcı etiketler içeren çift sarmallı bir adaptörü tamamlamak için (Şekil 1).[1][2]

3’-dT kuyruğu

Genişletilmiş çift sarmallı adaptörler, HpyCH4III belirli bir kısıtlama sitesi etiket dizisinin 3 ’tarafında bulunur ve adaptördeki DNA kitaplıklarındaki 3’-dA çıkıntısına bağlanacak bir 3’-dT çıkıntısına neden olur ligasyon adım (Şekil 1).[1][2]

Kütüphane hazırlığı

Çift sarmallı DNA kesilmiş yöntemlerden birini kullanarak: Sonikasyon enzimatik sindirim veya nebulizasyon. Parçaların boyutu, Ampure XP boncukları kullanılarak seçilir. Jel DNA çift ipliklerinin erimesine ve sonuç olarak DNA hasarına neden olabileceğinden, bu yöntem için esaslı boyut seçimi önerilmez. UV maruziyeti. Boyut olarak seçilen DNA fragmanları, 3'-uç dA-kuyruğuna tabi tutulur.[1][2]

Adaptör ligasyonu

Bu adımda, etiketli iki adaptör, çift sarmallı DNA kitaplık fragmanlarının her iki tarafında 3'-dT-kuyruklarından 3’-dA-kuyruklarına bağlanır. Bu işlem, her iki tarafta birbirinin ters tamamlayıcısı olan iki rastgele etiket (α ve β) içeren çift sarmallı kitaplık parçaları ile sonuçlanır (Şekil 1 ve 2). "DNA: adaptör" oranı, ligasyonun başarısını belirlemede çok önemlidir.[1][2]

Etiketli kitaplıklara sıralama bağdaştırıcılarının eklenmesi

Dubleks dizileme kitaplığı hazırlamanın son adımında, Illumina dizileme adaptörleri, dizileme adaptörleri içeren primerler kullanılarak PCR amplifikasyonu ile etiketli çift sarmallı kitaplıklara eklenir. PCR amplifikasyonu sırasında her iki tamamlayıcı DNA zinciri amplifiye edilir ve iki tip PCR ürünü üretir. Ürün 1, Illumina adaptör 1'in yanında benzersiz bir etiket dizisine (şekil 2'de α olarak adlandırılır) ve illumina adaptörü 1'in yanında benzersiz bir etikete (şekil 2'de β olarak adlandırılır) sahip ürün 2'ye sahip iplik 1'den türetilmiştir. (Lütfen her iplikçikte α etiketinin etiketinin ters tamamlayıcısı olduğuna ve bunun tersi olduğuna dikkat edin. Çift yönlü etiketler ve Illumina adaptörleri içeren kitaplıklar Illumina TruSeq sistemi kullanılarak sıralanır. Her bir DNA ipliğinden kaynaklanan okumalar, aynı etiketi paylaşan bir okuma grubu (etiket aileleri) oluşturur. Tespit edilen okuma aileleri bir sonraki adımda dizileme verilerinin analizi için kullanılacaktır.[1][2]

Düşünceler

Adaptör ligasyonunun etkinliği

Başarılı bir dubleks dizilemede adaptör ligasyon verimliliği çok önemlidir. Fazladan kitaplık veya bağdaştırıcı miktarı DNA: bağdaştırıcı dengesini etkileyebilir ve bu nedenle sırasıyla verimsiz ligasyon ve fazla miktarda primer dimer ile sonuçlanır. Bu nedenle, DNA: adaptörün molar konsantrasyonunu 0,05 olan optimal oranda tutmak önemlidir.[2]

Etiket ailesi boyutu

Dubleks sıralamanın etkinliği, her ailedeki okuma sayısıyla (aile boyutu) doğrudan ilişkili olan nihai DCS sayısına bağlıdır. Aile boyutu çok küçükse, DCS birleştirilemez ve çok fazla okuma aynı etiketi paylaşıyorsa, veri verimi düşük olacaktır. Aile boyutu, PCR amplifikasyonu için DNA şablonu miktarı ve tahsisli dizileme hattı fraksiyonu ile belirlenir. En uygun etiket ailesi boyutu 6 ila 12 üyedir. Optimum aile boyutunu elde etmek için, DNA şablonu ve özel dizileme hattı fraksiyonu miktarının ayarlanması gerekir. Aşağıdaki formül, kapsama derinliğini (N = 40DG ÷ R) etkileyebilecek en önemli değişkenleri hesaba katar, burada "N" okuma sayısı, "D" istenen kapsam derinliğidir, "G", içindeki DNA hedefinin boyutu taban çifti ve "R" son okuma uzunluğudur.

Hesaplamalı iş akışı

Filtreleme ve kırpma

Her dubleks dizileme okuması, sabit bir 5-nükleotid dizisi içerir (şekillerde Siyah renkte gösterilmiştir) yukarı 12 nükleotid etiket dizisinin. Okumalar, beklenen 5 nükleotid sekansına sahip değillerse veya her etiket içinde dokuzdan fazla aynı veya belirsiz baza sahiplerse filtrelenir. Okumaların her bir ucundaki iki 12 nükleotid etiket birleştirilir ve okuma başlığına taşınır. DNA'nın iki zincirinden kaynaklanan iki okuma ailesi oluşur. Bir aile, iplik 1'den kaynaklanan αβ başlığına sahip okumaları içerir ve ikinci aile, iplik 2'den kaynaklanan α başlığına sahip okumaları içerir (Şekil 2). Daha sonra okumalar, ligasyon ve son onarım bölgelerinde bulunan sabit 5 bp sekans ve 4 hata eğilimli nükleotit kaldırılarak kırpılır.[1][2] Kalan okumalar, konsensüs dizileri tek iplikli konsensüs dizileri (SSCS'ler) montajı ve çift yönlü konsensüs dizileri (DCS'ler) montajı kullanarak.

SSCS montajı

Önceki adımdan kesilmiş diziler hizalı için referans genom kullanma Burrows-Wheeler hizalayıcı (BWA) ve eşlenmemiş okumalar kaldırılır. Aynı 24 bp etiket dizisine ve genomik bölgeye sahip hizalanmış okumalar saptanır ve birlikte gruplanır (Şekil 2'de Aile αβ ve βα). Her grup bir “etiket ailesini” temsil eder. Üçten daha az üyesi olan etiket aileleri analizden çıkarılır. PCR amplifikasyonu veya sekanslama sırasında ortaya çıkan hataları gidermek için, üyelerin% 70'inden daha azı tarafından desteklenen mutasyonlar (okumalar) analizden filtrelenir. Daha sonra, geri kalan okumaların her pozisyonunda özdeş sekanslar kullanılarak her aile için bir konsensüs sekansı üretilir. Konsensüs sekansına tek sarmallı konsensüs sekansı (SSCS) denir. SSCS yöntemi, NGS doğruluğunu yaklaşık 20 kat daha yükseğe çıkarır, ancak bu yöntem, DNA'nın tek sarmallarından gelen dizileme bilgilerine dayanır ve bu nedenle, ilk turda veya PCR amplifikasyonundan önce indüklenen hatalara duyarlıdır.[1][2]

DCS montajı

Son adımdaki okumalar referans genoma yeniden hizalanır. Bu yöntemde, tamamlayıcı etiketlere sahip SSCS aile çiftleri birlikte gruplanacaktır (Şekil 2'de Aile αβ ve βα). Bu okumalar iki tamamlayıcı DNA zincirinden kaynaklanmaktadır. Yüksek güvenilirlikli diziler, her ailenin mükemmel şekilde eşleşen baz çağrılarına göre seçilir. Son sıraya çift yönlü konsensüs dizisi (DCS) denir. Gerçek mutasyonlar, tamamlayıcı SSCS'ler arasında mükemmel bir şekilde eşleşenlerdir. Bu adım, PCR amplifikasyonunun ilk turu sırasında veya örnek hazırlama sırasında ortaya çıkan kalan hataları filtreler.[1][2]

Avantajlar

Sıralamanın hata oranını düşürmek

Örnek hazırlama veya sıralama sırasında ortaya çıkan standart NGS platformlarının yüksek hata oranı (0,01-0,001), hücrelerin küçük fraksiyonunda bulunan varyantların saptanması için önemli bir sınırlamadır. Dubleks etiketleme sistemi ve DNA'nın her iki zincirinde bilgi kullanımı nedeniyle, dubleks sekanslama, hem SSCS hem de DCS yöntemini kullanarak sekanslamanın hata oranını yaklaşık 10 milyon kat azaltmıştır.[1][2][10]

Varyant çağrılarının artan doğruluğu

Mutasyon oranı (10) olan standart NGS yöntemlerini kullanarak nadir varyantları doğru bir şekilde tanımlamak zordur.−2 - 10−3). Numune hazırlama sırasında erken ortaya çıkan hatalar, nadir görülen varyantlar olarak tespit edilebilir. Bu tür hatalara bir örnek C> A / G> T'dir. dönüştürme derin sıralama veya hedeflenmiş yakalama verileri kullanılarak düşük frekanslarda tespit edilen ve numune hazırlama sırasında DNA oksidasyonunun bir sonucu olarak ortaya çıkan.[11] Bu tür yanlış pozitif varyantlar, çift yönlü sekanslama yöntemiyle filtrelenir, çünkü mutasyonların gerçek mutasyonlar olarak doğrulanması için her iki DNA zincirinde de doğru şekilde eşleştirilmesi gerekir. Dubleks sıralama, teorik olarak 10'a kadar düşük frekanslara sahip mutasyonları tespit edebilir−8 10 ile karşılaştır−2 standart NGS yöntemlerinin oranı.[1][2][10]

NGS platformlarının çoğuna uygulanabilir

Dubleks dizilemenin bir başka avantajı da, standart protokollerde önemli değişiklikler yapılmadan NGS platformlarının çoğu ile birlikte kullanılabilmesidir.

Sınırlamalar

Maliyet

Dubleks sekanslama, önemli ölçüde daha yüksek bir sekanslama doğruluğu sağladığından ve DNA'nın her iki zincirindeki bilgileri kullandığından, bu yöntem çok daha yüksek bir sekanslama derinliğine ihtiyaç duyar ve bu nedenle maliyetli bir yaklaşımdır. Dubleks dizilemenin yüksek maliyeti, uygulamasını şu anda hedeflenen ve amplikon dizileme ile sınırlar ve tüm genom dizileme yaklaşımları için geçerli olmayacaktır. Bununla birlikte, NGS'nin maliyetinin düşmesiyle, daha büyük DNA hedefleri için çift yönlü dizileme uygulaması daha uygun olacaktır.

Pratik uygulama

Dubleks dizileme yeni bir yöntemdir ve etkinliği algılama gibi sınırlı uygulamalarda incelenmiştir. nokta mutasyonları hedefli yakalama sıralaması kullanarak.[12] Dubleks dizilemenin uygulamasını ve fizibilitesini çok sayıda mutasyon, indel ve indel içeren daha karmaşık örneklere genişletmek için daha fazla çalışma yapılması gerekir. numara varyasyonlarını kopyala.

Başvurular

Düşük frekanslı varyantların tespiti

Dupleks dizileme ve dizileme doğruluğundaki önemli artış, nadir insan genetik varyantlarının tespiti, genetik olarak heterojen kanserlerde tedaviye direnç mekanizmalarında yer alan subklonal mutasyonların tespiti, invazif olmayan bir şekilde dolaşımdaki tümör DNA'sındaki varyantların taranması gibi uygulamalar üzerinde önemli etkilere sahiptir. biyobelirteç ve doğum öncesi tarama fetüste genetik anormalliklerin tespiti için.

Numara algılamayı kopyala

Dubleks dizileme için önerilen bir başka uygulama, varyantların göreceli sıklığını tahmin ederek DNA / RNA kopya sayılarının saptanmasıdır. Yeni nesil dizileme uygulamasıyla PCR şablon moleküllerini saymak için bir yöntem.[1]

Analiz ve yazılım

SSCS ve DCS analizi için gerekli araçların ve paketlerin bir listesi şurada bulunabilir: yazılım paketi.

Ayrıca bakınız

Referanslar

  1. ^ a b c d e f g h ben j k l m n Ö M. W. Schmitt, S.R. Kennedy, J. J. Salk, vd. "Yeni nesil dizileme ile çok nadir mutasyonların tespiti". Proc. Natl. Acad. Sci., Cilt. 109 hayır. 36. 2012. PMID  22853953.
  2. ^ a b c d e f g h ben j k l m n S.R. Kennedy, M. W. Schmitt, E. J. Fox, B. F. Kohrn, vd. "Dubleks Sıralama ile ultra düşük frekanslı mutasyonların saptanması". Nature Protoc., Cilt. 9 hayır. 11, 2586-606. 2014. PMID  25299156.
  3. ^ T. E. Druley, F. L. M. Vallania, D. J. Wegner, vd. "Havuzlanmış genomik DNA'dan nadir alelik varyantların ölçümü" Nature Methods, cilt. 6, hayır. 4, sayfa 263–265, 2009. PMID  19252504.
  4. ^ N. McGranahan ve C. Swanton. "Kanser Evriminde Tümör İçi Heterojenliğin Biyolojik ve Terapötik Etkisi" Cancer Cell, cilt. 27, hayır. 1, s. 15–26, 2015. PMID  25584892.
  5. ^ C Bettegowda, M Sausen, RJ Leary, vd. "Erken ve Geç Evre İnsan Malignitelerinde Dolaşan Tümör DNA'sının Saptanması". Sci Transl Med, cilt. 6, hayır. 224, p. 224ra24, 2014. PMID  24553385.
  6. ^ a b B. E. Miner, R. J. Stöger, A. F. Burden, vd. "Moleküler barkodlar, firkete-bisülfit PCR'deki fazlalık ve kontaminasyonu tespit eder". Nucleic Acids Res, cilt. 32, hayır. 17, p. e135, 2004. PMID  15459281.
  7. ^ M. L. McCloskey, R. Stoger, R. S. Hansen, vd."Toplu damga ve barkodlarla PCR ürünlerini kodlama", Biochem. Genet., Cilt. 45, hayır. 11–12, s. 761–767, 2007. PMID  17955361.
  8. ^ a b D. I. Lou, J. A. Hussmann, R. M. Mcbee, vd. "Yüksek verimli DNA dizileme hataları, daire dizileme kullanılarak büyüklük sıralarına göre azaltılır". Proc Natl Acad Sci US A, cilt. 110 hayır. 49, 19872–19877, 2013. PMID  24243955.
  9. ^ A. Y. Maslov, W. Quispe-Tintaya, T. Gorbacheva, R.R. White ve J. Vijg, "Mutasyon tespitinde yüksek verimli sıralama: Yeni nesil genotoksisite testleri mi?", Mutat. Res., Cilt. 776, s. 136–43, 2015. PMID  25934519.
  10. ^ a b c E. J. Fox, K. S. Reid-Bayliss, M. J. Emond, vd. "Yeni Nesil Dizileme Platformlarının Doğruluğu". Yeni Nesil Seq Uygulaması, s. 1-9, 2015. PMID  25699289.
  11. ^ M. Costello, T. J. Pugh, T. J. Fennell, vd. "Örnek hazırlama sırasında oksidatif DNA hasarı nedeniyle derin kapsama hedefli yakalama sekanslama verilerinde yapay mutasyonların keşfi ve karakterizasyonu". Nucleic Acids Res., Cilt. 41, hayır. 6, s. 1–12, 2013. PMID  23303777.
  12. ^ M. W. Schmitt, E. J. Fox, M. J. Prindle, vd. "Küçük genomik hedefleri yüksek verimlilik ve son derece doğrulukla sıralamak". Nat Metodları, cilt. 12, hayır. 5, sayfa 423–425, 2015. PMID  2584963.