Gen birlikte ifade ağı - Gene co-expression network

18 mide kanseri hastası için 7221 genin gen ekspresyon profillerini içeren bir mikrodizi veri setinden oluşturulan bir gen ortak ekspresyon ağı

Bir gen birlikte ifade ağı (GCN) bir yönsüz grafik, her düğüm bir gen ve önemli bir nokta varsa, bir çift düğüm bir kenara bağlanır. birlikte ifade aralarındaki ilişki.[1] Birkaç örnek veya deneysel koşullar için birkaç genin gen ekspresyon profillerine sahip olan bir gen birlikte ekspresyon ağı, iki birlikte eksprese edilen genin transkript seviyeleri olduğundan, örnekler arasında benzer bir ekspresyon modeli gösteren gen çiftleri aranarak oluşturulabilir. Örnekler arasında yükselir ve birlikte düşer. Birlikte eksprese edilen genler, aynı transkripsiyonel düzenleyici program tarafından kontrol edildiğinden, fonksiyonel olarak ilgili veya aynı yolun veya protein kompleksinin üyeleri tarafından kontrol edildiğinden, gen birlikte ekspresyon ağları biyolojik açıdan önemlidir.[2]

Birlikte ifade ilişkilerinin yönü ve türü, gen birlikte ifade ağlarında belirlenmez; oysa bir gen düzenleyici ağ (GRN) Yönlendirilmiş bir kenar, bir reaksiyon, dönüşüm, etkileşim, aktivasyon veya inhibisyon gibi bir biyokimyasal süreci temsil eden iki geni birbirine bağlar.[3] Bir GRN ile karşılaştırıldığında, bir GCN, genler arasındaki nedensellik ilişkilerini çıkarmaya çalışmaz ve bir GCN'de kenarlar, genler arasında yalnızca bir korelasyon veya bağımlılık ilişkisini temsil eder.[4] Gen birlikte ifade ağlarındaki modüller veya yüksek oranda bağlantılı alt grafikler, benzer bir işleve sahip olan veya kendi aralarında birçok etkileşime neden olan ortak bir biyolojik süreçte yer alan gen kümelerine karşılık gelir.[3]

Gen birlikte ifade ağlarında kenarların yönü göz ardı edilir. X, Y ve Z'nin birlikte ifade edildiği üç gen bulunurken, X'in Y'yi ve Y'nin Z'yi etkinleştirip etkinleştirmediği veya Y'nin X ve Z'yi veya başka bir genin bunların üçünü aktive edip etmediği belirlenememiştir.

Gen birlikte ifade ağları, genellikle yüksek verimli veri kümeleri kullanılarak oluşturulur. gen ifadesi profili gibi teknolojiler Mikroarray veya RNA Sırası.

Tarih

Gen birlikte ifade ağları kavramı ilk olarak 1999 yılında Butte ve Kohane tarafından alaka ağları.[5] Bir dizi hasta için tıbbi laboratuvar testlerinin (örneğin hemoglobin düzeyi) ölçüm verilerini topladılar ve her bir test çifti için sonuçlar ile belirli bir düzeyden yüksek korelasyon gösteren test çiftleri arasındaki Pearson korelasyonunu hesapladılar. ağ (örneğin kan şekeri ile insülin seviyesi). Butte ve Kohane bu yaklaşımı daha sonra ortak bilgi ile birlikte ifade ölçüsü olarak ve ilk gen birlikte ifade ağını oluşturmak için gen ifade verilerini kullanarak kullandılar.[6]

Gen birlikte ifade ağlarının oluşturulması

Gen birlikte ifade ağlarının oluşturulması için çok sayıda yöntem geliştirilmiştir. Prensip olarak, hepsi iki aşamalı bir yaklaşımı izler: birlikte ifade ölçüsünü hesaplama ve anlamlılık eşiğini seçme. İlk adımda, bir birlikte ifade ölçüsü seçilir ve bu ölçü kullanılarak her bir gen çifti için bir benzerlik puanı hesaplanır. Daha sonra, bir eşik belirlenir ve seçilen eşikten daha yüksek bir benzerlik puanına sahip olan gen çiftlerinin, anlamlı bir ortak ifade ilişkisine sahip olduğu ve ağdaki bir uç ile bağlandığı kabul edilir.

Bir gen ortak ifade ağı oluşturmak için iki genel adım: her gen çifti için ortak ifade puanının hesaplanması (örneğin, Pearson korelasyon katsayısının mutlak değeri) ve bir anlamlılık eşiğinin seçilmesi (örneğin, korelasyon> 0.8).

Bir gen birlikte ifade ağı oluşturmak için girdi verileri genellikle bir matris olarak temsil edilir. Gen ifade değerlerine sahipsek m için genler n örnekler (koşullar), girdi verileri bir m × n matris, ifade matrisi olarak adlandırılır. Örneğin, bir mikrodizi deneyinde, birkaç örnek için binlerce genin ifade değerleri ölçülür. İlk adımda, ifade matrisindeki her satır çifti arasında bir benzerlik puanı (birlikte ifade ölçüsü) hesaplanır. Ortaya çıkan matris bir m × m matris, benzerlik matrisi olarak adlandırılır. Bu matristeki her öğe, iki genin ifade seviyelerinin birlikte ne kadar benzer şekilde değiştiğini gösterir. İkinci adımda, benzerlik matrisindeki belirli bir eşiğin üzerinde olan (yani anlamlı ortak ifadeyi gösteren) elemanlar 1 ile değiştirilir ve kalan elemanlar 0 ile değiştirilir. Bitişik matris olarak adlandırılan ortaya çıkan matris, grafiği temsil eder. inşa edilen gen birlikte ifade ağının. Bu matriste, her bir eleman ağda iki genin (1 eleman) bağlı olup olmadığını (0 eleman) gösterir.

Birlikte ifade ölçüsü

Farklı örnekler için bir genin ifade değerleri bir vektör olarak temsil edilebilir, bu nedenle bir çift gen arasındaki ortak ifade ölçüsünün hesaplanması, iki sayı vektörü için seçilen ölçüyü hesaplamakla aynıdır.

Pearson korelasyon katsayısı, Karşılıklı bilgi, Spearman sıra korelasyon katsayısı ve Öklid mesafesi gen birlikte ifade ağları oluşturmak için en çok kullanılan dört ortak ifade ölçüsüdür. Öklid mesafesi, iki vektör arasındaki geometrik mesafeyi ölçer ve böylece gen ekspresyon değerlerinin vektörlerinin hem yönünü hem de büyüklüğünü dikkate alır. Karşılıklı bilgi, bir genin ifade düzeylerini bilmenin, diğerinin ifade düzeyleri hakkındaki belirsizliği ne kadar azalttığını ölçer. Pearson'ın korelasyon katsayısı, iki vektörün birlikte artma veya azalma eğilimini ölçer ve genel karşılıklarının bir ölçüsünü verir. Spearman sıra korelasyonu, bir gen ekspresyon vektöründeki gen ekspresyon değerlerinin sıralamaları için hesaplanan Pearson korelasyonudur.[2] Gibi diğer birkaç önlem kısmi korelasyon,[7] gerileme,[8] ve kısmi korelasyon ve karşılıklı bilgi kombinasyonu[9] ayrıca kullanılmıştır.

Bu önlemlerin her birinin kendi avantajları ve dezavantajları vardır. İşlevsel olarak ilişkili genlerin mutlak seviyeleri oldukça farklı olduğunda Öklid mesafesi uygun değildir. Dahası, iki gen sürekli olarak düşük ekspresyon seviyelerine sahipse ancak başka türlü rastgele ilişkilendirilmişse, Öklid uzayında yine de yakın görünebilirler.[2] Karşılıklı bilginin bir avantajı, doğrusal olmayan ilişkileri tespit edebilmesidir; ancak bu, biyolojik olarak anlamlı görünmeyen sofistike doğrusal olmayan ilişkilerin tespit edilmesi nedeniyle bir dezavantaja dönüşebilir. Ek olarak, karşılıklı bilginin hesaplanması için, iyi bir tahmin için çok sayıda örneğe ihtiyaç duyan verilerin dağılımı tahmin edilmelidir. Spearman’in sıra korelasyon katsayısı, aykırı değerlere karşı daha sağlamdır, ancak diğer yandan ifade değerlerine daha az duyarlıdır ve az sayıda örnek içeren veri kümelerinde birçok yanlış pozitif tespit edebilir.

Pearson'un korelasyon katsayısı, gen birlikte ifade ağlarının oluşturulmasında kullanılan en popüler ortak ifade ölçüsüdür. Pearson korelasyon katsayısı -1 ile 1 arasında bir değer alır ve burada 1'e yakın mutlak değerler güçlü korelasyon gösterir. Pozitif değerler, bir genin ekspresyonunun, birlikte eksprese edilen genin ekspresyonundaki artışla arttığı ve bunun tersinin de geçerli olduğu bir aktivasyon mekanizmasına karşılık gelir. Bir genin ekspresyon değeri, birlikte eksprese edilen geninin ekspresyonundaki artışla azaldığında, altta yatan bir süpresyon mekanizmasına karşılık gelir ve negatif bir korelasyona sahip olur.

Pearson korelasyon ölçümünün iki dezavantajı vardır: yalnızca doğrusal ilişkileri tespit edebilir ve aykırı değerlere karşı hassastır. Ayrıca, Pearson korelasyonu, gen ekspresyon verilerinin normal bir dağılım izlediğini varsayar. Song vd.[10] önerildi biweight orta korelasyon (bicor) Pearson'ın korelasyonu için iyi bir alternatif olarak. "Bicor, medyan tabanlı bir korelasyon ölçüsüdür ve Pearson korelasyonundan daha sağlamdır, ancak genellikle Spearman korelasyonundan daha güçlüdür". Dahası, "gen çiftlerinin çoğunun doğrusal veya monoton ilişkileri tatmin ettiği" gösterildi, bu da "karşılıklı bilgi ağlarının, sabit verilerdeki ortak ifade ilişkilerinin ölçülmesi söz konusu olduğunda, korelasyon ağlarıyla güvenli bir şekilde değiştirilebileceğini" gösterir.[10]".

Eşik seçimi

Gen birlikte ifade ağlarının yapılandırılmasında bir eşik seçmek için çeşitli yöntemler kullanılmıştır. Basit bir eşikleme yöntemi, bir birlikte ifade kesimi seçmek ve birlikte ifadelerinin bu sınırı aştığı ilişkileri seçmektir. Başka bir yaklaşım kullanmaktır Fisher’ın Z-dönüşümü hesaplayan z puanı her korelasyon için örnek sayısına göre. Bu z puanı daha sonra bir p değeri her korelasyon için ve p-değerinde bir kesme ayarlanır. Bazı yöntemler, verilere izin verir ve permütasyonlu veri kümesindeki genler arasında bulunan korelasyonların dağılımını kullanarak bir z-skorunu hesaplar.[2] Eşik seçimi gibi diğer bazı yaklaşımlar da kullanılmıştır. kümeleme katsayısı[11] veya rastgele matris teorisi.[12]

P-değerine dayalı yöntemlerle ilgili sorun, p-değerindeki son kesmenin biyolojik bir kavrayışa dayalı olarak değil, istatistiksel rutinlere (ör. 0.01 veya 0.05'lik bir p değeri önemli kabul edilir) dayalı olarak seçilmesidir.

WGCNA, oluşturmak ve analiz etmek için bir çerçevedir ağırlıklı gen birlikte ifade ağları.[13] WGCNA yöntemi, gen birlikte ifade ağlarının ölçeksiz topolojisine dayalı olarak ağı inşa etmek için eşiği seçer. Bu yöntem, ağı birkaç eşik için oluşturur ve bir ağa yol açan eşiği seçer. ölçeksiz topoloji. Ayrıca, WGCNA yöntemi, ağda tüm olası kenarların göründüğü, ancak her kenarın o kenara karşılık gelen birlikte ifade ilişkisinin ne kadar önemli olduğunu gösteren bir ağırlığa sahip olduğu anlamına gelen ağırlıklı bir ağ oluşturur. Eşik seçimi, ağları ölçeksiz bir topolojiye zorlamayı amaçlamaktadır. Bununla birlikte, biyolojik ağların ölçeksiz olduğunun altında yatan öncül tartışmalı.[14][15][16]

lmQCM, gen birlikte ifade ağları analizinde aynı hedefe ulaşan WGCNA için bir alternatiftir. lmQCM,[17] , ağdaki yerel olarak yoğun yapılardan yararlanmayı amaçlayan yerel maksimal Yarı-Klique Birleşmesi anlamına gelir, böylece modül üst üste binmesine izin vererek daha küçük ve yoğun şekilde birlikte ifade edilen modülleri çıkarabilir. lmQCM algoritmasının kendi R paketi ve python modülü (Biolearns içinde paketlenmiştir) vardır. Genel olarak daha küçük olan mayınlı modüller, daha anlamlı gen ontolojisi (GO) zenginleştirme sonuçları da üretebilir.

Başvurular

  • Tek hücre dizileme - Gen ekspresyon profillerini bağımsız olarak kullanarak, tek hücrede spesifik mutasyonların varlığının daha iyi tahminlerini elde etmek için, tek hücreli senaryolarda sinyal / gürültü oranını artırmak için toplu RNA-Seq verileri kullanılarak oluşturulan gen ortak ekspresyon ağları kullanılmıştır. değişkenler[18]
  • Gen Ağı Tersine Mühendislik - Gen düzenleyici ağları ortaya çıkarmak için yüzlerce yöntem mevcuttur ve birkaç düzinesi şu anda basit korelasyon, karşılıklı bilgi veya bayes yöntemlerine dayanan birlikte ifade analizine dayanmaktadır.[19]
  • Bitki Biyolojisi - Ortak ifade analizleri, belirli bitki yollarında yer alan yeni genleri araştırmak için yaygın olarak kullanılmıştır. Bir örnek, hücre duvarı sentezidir: Bu metabolik mekanizmada eksik bağların karakterizasyonu, ifade profilleri önceden bilinen yol üyeleri ile ilişkili olan yeni Selüloz Sentaz genlerinin (CESA'lar) bulunmasıyla mümkün olmuştur.[20]

Ayrıca bakınız

Referanslar

  1. ^ Stuart, Joshua M; Segal, Eran; Koller, Daphne; Kim Stuart K (2003). "Korunan genetik modüllerin küresel keşfi için bir gen-birlikte ifade ağı". Bilim. 302 (5643): 249–55. Bibcode:2003Sci ... 302..249S. CiteSeerX  10.1.1.119.6331. doi:10.1126 / science.1087447. PMID  12934013. S2CID  3131371.
  2. ^ a b c d Weirauch, Matthew T (2011). "DNA mikrodizi verilerinin analizi için gen birlikte ifade ağları". Ağ Biyolojisi için Uygulamalı İstatistikler: Sistem Biyolojisinde Yöntemler: 215–250. doi:10.1002 / 9783527638079.ch11. ISBN  9783527638079.
  3. ^ a b Roy, Swarup; Bhattacharyya, Dhruba K; Kalita, Jugal K (2014). "Yerel ifade kalıpları kullanılarak mikrodizi verilerinden gen birlikte ifade ağının yeniden yapılandırılması". BMC Biyoinformatik. 15: S10. doi:10.1186 / 1471-2105-15-s7-s10. PMC  4110735. PMID  25079873.
  4. ^ De Smet, Riet; Marchal, Kathleen (2010). "Mevcut ağ çıkarım yöntemlerinin avantajları ve sınırlamaları". Doğa İncelemeleri Mikrobiyoloji. 8 (10): 717–29. doi:10.1038 / nrmicro2419. PMID  20805835. S2CID  27629033.
  5. ^ Butte, Atul J; Kohane, Isaac S (1999). "Alaka düzeyi ağlarını kullanarak tıbbi veritabanlarında denetimsiz bilgi keşfi". AMIA Sempozyumu Bildirileri.
  6. ^ Butte, Atul J; Kohane, Isaac S (2000). "Karşılıklı bilgi alaka düzeyi ağları: ikili entropi ölçümleri kullanarak işlevsel genomik kümeleme". Pac Symp Biocomput. 5.
  7. ^ Villa-Vialaneix, Nathalie; Liaubet, Laurence; Laurent, Thibault; Cherel, Pierre; Gamot, Adrien; SanCristobal, Magali (2013). "Bir gen birlikte ifade ağının yapısı, eQTL'lerin altında yatan biyolojik işlevleri ortaya çıkarır". PLOS ONE. 8 (4): 60045. Bibcode:2013PLoSO ... 860045V. doi:10.1371 / journal.pone.0060045. PMC  3618335. PMID  23577081.
  8. ^ Persson, Staffan; Wei, Hairong; Milne, Jennifer; Sayfa, Grier P; Somerville, Christopher R (2005). "Genel mikrodizi veri setlerinin regresyon analizi ile selüloz sentezi için gerekli genlerin belirlenmesi". Amerika Birleşik Devletleri Ulusal Bilimler Akademisi Bildirileri. 102 (24): 8633–8. Bibcode:2005PNAS..102.8633P. doi:10.1073 / pnas.0503392102. PMC  1142401. PMID  15932943.
  9. ^ Reverter, Antonio; Chan, Eva KF (2008). "Kısmi korelasyon ve gen birlikte ifade ağlarının tersine çevrilmiş mühendisliğine bir bilgi teorisi yaklaşımını birleştirmek". Biyoinformatik. 24 (21): 2491–2497. doi:10.1093 / biyoinformatik / btn482. PMID  18784117.
  10. ^ a b Song, Lin; Langfelder, Peter; Horvath Steve (2012). "Birlikte ifade ölçülerinin karşılaştırılması: karşılıklı bilgi, korelasyon ve model tabanlı endeksler". BMC Biyoinformatik. 13 (1): 328. doi:10.1186/1471-2105-13-328. PMC  3586947. PMID  23217028.
  11. ^ Elo, Laura L; Järvenpää, Kına; Orešič, Matej; Lahesmaa, Riitta; Aittokallio, Tero (2007). "İnsan T yardımcı hücre farklılaşma sürecine uygulamalarla gen birlikte ifade ağlarının sistematik inşası". Biyoinformatik. 23 (16): 2096–2103. doi:10.1093 / biyoinformatik / btm309. PMID  17553854.
  12. ^ Luo, Feng; Yang, Yunfeng; Zhong, Jianxin; Gao, Haichun; Khan, Latifur; Thompson, Dorothea K; Zhou, Jizhong (2007). "Rastgele matris teorisi ile gen birlikte ifade ağlarının kurulması ve bilinmeyen genlerin işlevlerinin tahmin edilmesi". BMC Biyoinformatik. 8 (1): 299. doi:10.1186/1471-2105-8-299. PMC  2212665. PMID  17697349.
  13. ^ Zhang, Bin; Horvath Steve (2005). "Ağırlıklı gen birlikte ifade ağı analizi için genel bir çerçeve". Genetik ve Moleküler Biyolojide İstatistiksel Uygulamalar. 4 (1): Madde 17. CiteSeerX  10.1.1.471.9599. doi:10.2202/1544-6115.1128. PMID  16646834. S2CID  7756201.
  14. ^ Khanin, R .; Wit, E. (2006). "Biyolojik ağlar ne kadar ölçeksizdir". Journal of Computational Biology: A Journal of Computational Molecular Cell Biology. 13 (3): 810–8. doi:10.1089 / cmb.2006.13.810. PMID  16706727.
  15. ^ Broido, Anna D .; Clauset, Aaron (2019). "Ölçeksiz ağlar nadirdir". Doğa İletişimi. 10: 1017. arXiv:1801.03400. doi:10.1038 / s41467-019-08746-5. PMID  30833554. S2CID  24825063.
  16. ^ Clote, P. (2020). "RNA ağları ölçeksiz midir?". Matematiksel Biyoloji Dergisi. 80 (5): 1291–1321. doi:10.1007 / s00285-019-01463-z. PMC  7052049. PMID  31950258.
  17. ^ Zhang, Jie; Huang Kun (2014). "Normalize Edilmiş ImQCM: Kanserlerde Gen Eş-İfade Modülü Keşfindeki Uygulamalar ile Ağırlıklı Grafikte Zayıf Yarı-Kliklerin Tespiti İçin Bir Algoritma". Kanser Bilişimi. 13 (3): CIN.S14021. doi:10.4137 / CIN.S14021. PMID  27486298.
  18. ^ Mercatelli, Daniele; Ray, Orman; Giorgi, Federico M. (2019). "Gen İfadesi Yoluyla Genomik Değişikliklerin Pan-Kanseri ve Tek Hücreli Modellemesi". Genetikte Sınırlar. 10. doi:10.3389 / fgene.2019.00671. ISSN  1664-8021.
  19. ^ Mercatelli, Daniele; Scalambra, Laura; Triboli, Luca; Ray, Orman; Giorgi, Federico M. (2020). "Gen düzenleyici ağ çıkarım kaynakları: Pratik bir genel bakış". Biochimica et Biophysica Açta (BBA) - Gen Düzenleme Mekanizmaları. 1863 (6): 194430. doi:10.1016 / j.bbagrm.2019.194430. ISSN  1874-9399. PMID  31678629.
  20. ^ Usadel, Bjoern; Obayashi, Takeshi; Mutwil, Marek; Giorgi, Federico M .; Bassel, George W .; Tanimoto, Mimi; Chow, Amanda; Steinhauser, Dirk; Persson, Staffan; Provart, Nicholas J. (2009). "Bitki biyolojisi için birlikte ifade araçları: hipotez üretme fırsatları ve uyarılar". Bitki, Hücre ve Çevre. 32 (12): 1633–1651. doi:10.1111 / j.1365-3040.2009.02040.x. ISSN  0140-7791. PMID  19712066.