Metilasyon analizi için Bayes aracı - Bayesian tool for methylation analysis

Metilasyon analizi için Bayes aracı, Ayrıca şöyle bilinir YARASA ADAM, analiz etmek için istatistiksel bir araçtır metillenmiş DNA immünopresipitasyon (MeDIP) profilleri. Aşağıdakilerden biri kullanılarak oluşturulan büyük veri kümelerine uygulanabilir oligonükleotid diziler (MeDIP-çip) veya Yeni nesil sıralama (MeDIP-seq), mutlak bir kantitatif tahmin sağlar. metilasyon ilgilenilen bir bölgede eyalet.[1]

Batman iş akışı

Teori

MeDIP (metillenmiş DNA immünopresipitasyon) değerlendirmek için kullanılan deneysel bir tekniktir. DNA bir kullanarak metilasyon seviyeleri antikor metillenmiş DNA dizilerini izole etmek için. İzole edilmiş DNA fragmanları ya bir mikrodizi çipine hibridize edilir (MeDIP çipi) ya da yeni nesil sekanslama (MeDIP-seq) ile sekanslanır. Bu size sayfanın hangi alanları genetik şifre metillenmiştir, mutlak metilasyon seviyeleri vermez. İki farklı genomik bölge düşünün, Bir ve B. Bölge Bir altı CpG'ye sahiptir (memelilerde DNA metilasyonu somatik hücreler genellikle CpG'de görülür dinükleotidler[2]), üçü metillenmiştir. Bölge B hepsi metillenmiş üç CpG'ye sahiptir. Antikorun basitçe tanıdığı gibi metillenmiş DNA, her iki bölgeyi de eşit olarak bağlayacak ve bu nedenle sonraki adımlar bu iki bölge için eşit sinyaller gösterecektir. Bu, bu iki bölgedeki metilasyonun tam resmini vermez (bölgede Bir CpG'lerin sadece yarısı metillenmiştir, oysa bölgede B tüm CpG'ler metillenmiştir). Bu nedenle, belirli bir bölge için metilasyonun tam resmini elde etmek için, MeDIP deneyinden aldığınız sinyali bölgedeki CpG sayısına göre normalize etmeniz gerekir ve bu Batman algoritma yapar. Yukarıdaki örneğin MeDIP sinyalini analiz etmek Batman bölge için 0.5 puan verecektir. Bir (yani bölge% 50 metillenmiştir) ve bölge için 1 B (yani, bölge% 100 metillenmiştir). Bu şekilde Batman, MeDIP deneylerinden gelen sinyalleri mutlak metilasyon seviyelerine dönüştürür.

Batman'in gelişimi

Batman algoritmasının temel prensibi, CpG dinükleotidlerinin değişen yoğunluklarının etkilerini ve bunun DNA fragmanlarının MeDIP zenginleştirmesi üzerindeki etkisini modellemektir. Batman'in temel varsayımları:

  1. Neredeyse tüm DNA metilasyonu memeliler CpG dinükleotidlerinde olur.
  2. CpG açısından fakir bölgelerin çoğu yapısal olarak metillenirken, CpG bakımından zengin bölgelerin çoğu (CpG adaları) yapısal olarak metillenmemiştir.[3]
  3. MeDIP deneyinde fragman sapması yoktur (yaklaşık DNA fragman boyutları aralığı 400-700 bp'dir).
  4. Üzerindeki hatalar mikrodizi normalde hassas bir şekilde dağıtılır.
  5. Gözlenen sinyale yalnızca metillenmiş CpG'ler katkıda bulunur.
  6. CpG metilasyon durumu genellikle yüzlerce baz üzerinde oldukça ilişkilidir,[4] bu nedenle 50 veya 100 bp pencerelerde birlikte gruplanan CpG'ler aynı metilasyon durumuna sahip olacaktır.

Batman'da temel parametreler:

  1. Ccp: prob p ve CpG dinükleotidi arasındaki kuplaj faktörü c, DNA'nın fraksiyonu olarak tanımlanır moleküller araştırmak için melezleme p CpG içerenc.
  2. Ctot : toplam CpG etki parametresi, yerel CpG yoğunluğunun bir ölçüsünü sağlayan herhangi bir prob için birleştirme faktörlerinin toplamı olarak tanımlanır
  3. mc : pozisyondaki metilasyon durumu c, kesirini temsil eder kromozomlar metillenmiş olduğu örnekte. mc olarak kabul edilir sürekli değişken MeDIP çalışmalarında kullanılan örneklerin çoğu birden fazla hücre tipi içerdiğinden.

Bu varsayımlara dayanarak, MeDIP-çip veya MeDIP-seq deneyinin MeDIP kanalından gelen sinyal, bu probla üst üste binen DNA fragmanlarının zenginleşme derecesine bağlıdır ve bu da miktarına bağlıdır. antikor bağlama ve dolayısıyla bu fragmanlar üzerindeki metillenmiş CpG'lerin sayısı. Batman modelinde, bir MeDIP / yonga deneyinden (A) elde edilen eksiksiz veri seti, aşağıdaki şekilde bir istatistiksel modelle temsil edilebilir. olasılık dağılımı:

nerede (x|μσ2) bir Gauss olasılık yoğunluk fonksiyonu. Standart Bayes çıkarım için teknikler kullanılabilir f(m|Bir), yani bir veya daha fazla MeDIP-çip / MeDIP-sekans çıktı seti verilen olası metilasyon durumlarının dağılımı. Bu çıkarım sorununu çözmek için Batman, iç içe örnekleme (http://www.inference.phy.cam.ac.uk/bayesys/ ) 100 bağımsız örnek oluşturmak için f(m|Bir) genomun her bir parçalı bölgesi için, daha sonra bu örneklere beta dağılımları uydurarak en olası metilasyon durumunu 100 bp pencerelerde özetler. En olası modlar beta dağıtımları son metilasyon çağrıları olarak kullanıldı.

Sınırlamalar

Batman'i kullanmayı düşünürken aşağıdaki noktaları dikkate almak faydalı olabilir:

  1. Batman bir parçası değil yazılım; kullanılarak gerçekleştirilen bir algoritmadır Komut istemi. Bu nedenle özellikle kullanıcı dostu değildir ve hesaplama açısından oldukça teknik bir süreçtir.
  2. Ticari olmadığı için, Batman'i kılavuzda yazılanların ötesinde kullanırken çok az destek vardır.
  3. Oldukça zaman alıcıdır (bir kromozomu analiz etmek birkaç gün alabilir). (Not: Batman'ı 100 Agilent İnsan DNA Metilasyon Dizisi setinde (dizi başına yaklaşık 250.000 prob) çalıştıran bir devlet laboratuvarında, Agilent'in Genomic Workbench yazılımında tamamlanması bir saatten az sürdü. Bilgisayarımızda 2GHz işlemci, 24 GB RAM vardı , 64 bit Windows 7.)
  4. Numara varyasyonunu kopyala (CNV) hesaba katılmalıdır. Örneğin, bir bölgenin puanı CNV değeri 1,6 inç kanser (normale kıyasla 0,4'lük bir kayıp), kaybı telafi etmek için 1,25 (= 2 / 1,6) ile çarpılmalıdır.
  5. Batman'in temel varsayımlarından biri, tüm DNA metilasyonunun CpG dinükleotidlerinde gerçekleşmesidir. Genelde durum böyle olsa da omurgalı somatik hücreler, bitki hücrelerinde olduğu gibi yaygın CpG dışı metilasyonun olduğu durumlar vardır. embriyonik kök hücreleri.[5][6]

Referanslar

  1. ^ Aşağı, T.A. et al. İmmünopresipitasyon tabanlı DNA metilom analizi için bir Bayes ters evrişim stratejisi. Doğa Biyoteknolojisi 26, 779–85 (2008).
  2. ^ Lister, R. ve diğerleri. İnsan DNA'sı metilomlar temel çözünürlükte yaygın göster epigenomik farklılıklar. Doğa 462, 315–22 (2009).
  3. ^ Bird, A. DNA metilasyon kalıpları ve epigenetik hafıza. Genler ve Gelişim 16, 6–21 (2002).
  4. ^ Eckhardt, F. ve diğerleri. İnsan kromozomları 6, 20 ve 22'nin DNA metilasyon profili. Doğa Genetiği 38, 1378–85 (2006).
  5. ^ Dodge, J.E., Ramsahoye, B.H., Wo, Z.G., Okano, M. & Li, Embriyonik kök hücrelerde MMLV provirüsün E. De novo metilasyonu: CpG'ye karşı non-CpG metilasyonu. Gen 289, 41–8 (2002)
  6. ^ Vanyushin, Bitkilerde B.F. DNA metilasyonu. Mikrobiyoloji ve İmmünolojide Güncel Konular 301, 67–122 (2006)