Fiocruz Genom Karşılaştırma Projesi - Fiocruz Genome Comparison Project

Fiocruz Genom Karşılaştırma Projesi içeren ortak bir çabadır Brezilya 's Oswaldo Cruz Enstitüsü ve IBM 's World Community Grid, üretmek için tasarlanmış veri tabanı karşılaştırmak genler birçoktan genomlar SSEARCH kullanarak birbirleriyle.[1] SSEARCH programı titiz bir Smith-Waterman uyumu arasında protein dizisi ve başka bir protein dizisi, bir protein veri tabanı, bir DNA veya bir DNA kütüphanesi.


Projedeki hesaplamanın doğası, projeden kolayca yararlanmasını sağlar. dağıtılmış hesaplama. Bu, araştırmanın muhtemel insani faydalarıyla birlikte, World Community Grid Fiocruz projesini çalıştırmak için (boş bilgisayar saat zamanını kullanan dağıtılmış bir bilgi işlem ızgarası) Tüm ürünler WCG ile sözleşmeli olarak kamu malıdır.

Açıklama

Sorun, protein veritabanı girişlerine çok büyük bir bilgi gövdesinin (yapısal, işlevsel, çapraz referanslar, vb.) Eklenmesidir. Bilgiler girildikten sonra nadiren güncellenir veya düzeltilir. Tahmin edilen protein fonksiyonunun bu açıklaması genellikle eksiktir, standart olmayan isimlendirme kullanır veya önceki bazen yanlış açıklamalı dizilerden çapraz referans alındığında yanlış olabilir. Ek olarak, çeşitli yapısal ve / veya fonksiyonel alanlardan oluşan birçok protein, otomatik sistemler tarafından gözden kaçırılır. Bugünkü karşılaştırmalı bilgiler, genomik biliminin ilk günleriyle karşılaştırıldığında çok büyük. Tek bir hata birleştirilir ve daha sonra karmaşık hale getirilir.

Genom Karşılaştırma Projesi, tüm tahmin edilenler arasında tam bir ikili karşılaştırma gerçekleştirir. protein diziler, kullanılan indeksleri elde etme (standartlaştırılmış Gen Ontolojisi ile birlikte[2]) açıklama topluluğu için bir referans deposu olarak. Proje, biyologlar için paha biçilmez veri kaynakları sağlıyor. Genom Karşılaştırma Projesinde kullanılan sekans benzerliği karşılaştırma programına SSEARCH adı verilir. Bu program matematiksel olarak sıra çiftleri arasındaki en iyi yerel hizalamayı bulur,[3] ve Smith – Waterman algoritmasının ücretsiz olarak kullanılabilen bir uygulamasıdır.[4]

SSEARCH'in kullanımı, kesin bir açıklama, tutarsızlık düzeltmesi ve bilinmeyen işlevlere sahip varsayımsal proteinlere olası işlev atamasını mümkün kılar. Dahası, birden çok etki alanına ve işlevsel öğelere sahip proteinler doğru bir şekilde tespit edilir. Uzak ilişkiler bile tespit edilir.

Ayrıca bakınız

Notlar

  1. ^ SSEARCH web sayfası.
  2. ^ Gene Ontology web sitesi
  3. ^ W.R. Pearson (1991) Genomik 11:635–650
  4. ^ T.F.Smith ve M.S. Waterman (1981) J. Mol. Biol, 147:195–197

Dış bağlantılar