Boru Hattı Pilotu - Pipeline Pilot

Boru Hattı Pilotu
Geliştirici (ler)Hızlanır
İlk sürüm1999 (1999)
Kararlı sürüm
18.1 / Mayıs 2018 (2018-05)
YazılmışC ++
İşletim sistemipencereler ve Linux
TürGörsel ve veri akışı Programlama dili
LisansTescilli
İnternet sitesihızlanır.com/Ürün:% s/ işbirlikçi-bilim/ biovia-pipeline-pilot/

Boru Hattı Pilotu Dassault Systèmes tarafından verileri işlemek ve analiz etmek için satılan bir masaüstü yazılım programıdır. Başlangıçta doğa bilimlerinde kullanılan, ürünün temel ETL'si (Ayıkla, dönüştür, yükle ) ve analitik yetenekleri genişletildi. Ürün artık veri bilimi, ETL, çeşitli sektörlerde raporlama, tahmin ve analiz. Ürünün ana özelliği, bir grafik kullanıcı arayüzü kullanarak veri iş akışlarını tasarlama yeteneğidir. Program bir örnektir görsel ve veri akışı programlama. Keminformatik ve QSAR gibi çeşitli ortamlarda kullanımı vardır,[1][2][3] Yeni nesil sıralama,[4] görüntü analizi,[5][6] ve metin analizi.[7]

Tarih

Ürün, SciTegic. BIOVIA daha sonra 2004 yılında SciTegic ve Pipeline Pilot'u satın aldı. BIOVIA'nın kendisi Dassault Systèmes Ürün, kimyaya odaklanmaktan başlayarak genel özütleme, dönüştürme ve yükleme (ETL) yeteneklerini içerecek şekilde genişletildi. Temel ürünün ötesinde, Dassault, rapor oluşturma, veri görselleştirme ve bir dizi bilimsel ve mühendislik sektörü için analitik ve veri işleme koleksiyonları ekledi. Şu anda ürün kimya, enerji, paketlenmiş tüketici malları, havacılık, otomotiv ve elektronik üretim endüstrilerinde ETL, analitik ve makine öğrenimi için kullanılmaktadır.

Genel Bakış

Pipeline Pilot, verileri işlemek ve analiz etmek için kullanıcı arabirimleri sağlayan bir yazılım ürünleri sınıfının parçasıdır. Pipeline Pilot ve benzeri ürünler, kodlama yeteneği sınırlı olan veya hiç olmayan kullanıcıların veri kümelerini dönüştürmesine ve değiştirmesine olanak tanır. Genellikle bu, verilerin analizinin yapılmasının bir öncüsüdür. Diğer grafiksel ETL ürünleri gibi, kullanıcıların CSV dosyaları, metin dosyaları ve veritabanları gibi farklı veri kaynaklarından veri çekmesine olanak tanır.

Bileşenler, ardışık düzenler, protokoller ve veri kayıtları

grafiksel kullanıcı arayüzü Pipeline Pilot Professional Client olarak adlandırılan, kullanıcıların "bileşenler" adı verilen ayrı veri işleme birimlerini sürükleyip bırakmalarına olanak tanır. Bileşenler verileri yükleyebilir, filtreleyebilir, birleştirebilir veya değiştirebilir. Bileşenler ayrıca regresyon modelleri oluşturmak, sinir ağlarını eğitmek veya veri kümelerini PDF raporlarına dönüştürmek gibi çok daha gelişmiş veri manipülasyonları gerçekleştirebilir.

Boru Hattı Pilotu bir Bileşenler paradigma. Bileşenler, bir iş akışında düğümler olarak temsil edilir. Matematiksel anlamda bileşenler, bir Yönlendirilmiş grafik: "borular" (grafik kenarları) bileşenleri bağlar ve verileri, veriler üzerinde işlemlerin gerçekleştirildiği düğümden düğüme taşır. Kullanıcılar, önceden tanımlanmış bileşenleri kullanma veya kendi bileşenlerini geliştirme seçeneğine sahiptir. Yeni Nesil Dizileme gibi sektöre özel uygulamalarda yardımcı olmak için (bkz. Yüksek verimli sıralama (HTS) yöntemleri ), BIOVIA, kullanıcıların sektöre özgü ortak görevleri yapmak için ihtiyaç duydukları süreyi büyük ölçüde azaltan bileşenler geliştirmiştir.

Kullanıcılar önceden yüklenmiş olarak gelen bileşenler arasından seçim yapabilir veya "protokoller" adı verilen iş akışlarında kendi bileşenlerini oluşturabilirler. Protokoller, bağlantılı bileşenlerden oluşan setlerdir. Protokoller kaydedilebilir, yeniden kullanılabilir ve paylaşılabilir. Kullanıcılar, BIOVIA yazılımıyla sağlanan bileşenleri kendi özel bileşenleriyle karıştırabilir ve eşleştirebilir. İki bileşen arasındaki bağlantılar "borular" olarak adlandırılır ve yazılımda bir boru ile bağlanan iki bileşen olarak görselleştirilir. Son kullanıcılar iş akışlarını / protokollerini tasarlar, ardından protokolü çalıştırarak bunları yürütür. Veriler, borular boyunca soldan sağa doğru akar.

Modern veri analizi ve işleme, çok sayıda manipülasyon ve dönüşüm içerebilir. Pipeline Pilot'un önemli bir özelliği, birçok bileşeni içeren uzun bir veri işleme serisini görsel olarak yoğunlaştırma yeteneğidir. Herhangi bir uzunluktaki bir iş akışı, yüksek seviyeli bir iş akışında kullanılan bir bileşene görsel olarak yoğunlaştırılabilir. Bu, bir protokolün kaydedilebileceği ve başka bir protokolde bir bileşen olarak kullanılabileceği anlamına gelir. Pipeline Pilot'ta kullanılan terminolojide, diğer protokollerde bileşen olarak kullanılan protokoller "alt protokoller" olarak adlandırılır. Bu, kullanıcıların veri işleme ve manipülasyon iş akışlarına karmaşıklık katmanları eklemelerine ve daha sonra iş akışını daha yüksek bir soyutlama düzeyinde tasarlayabilmeleri için bu karmaşıklığı gizlemelerine olanak tanır.

Bileşen koleksiyonları

Pipeline Pilot, "koleksiyonlar" adı verilen bir dizi eklenti içerir. Koleksiyonlar, ek bir lisans ücreti karşılığında son kullanıcılara sunulan, genetik bilgilerin işlenmesi veya polimerlerin analiz edilmesi gibi özel işlev gruplarıdır. Şu anda bu koleksiyonlardan birkaç tane var.[8]

GrupAlan adıBileşen koleksiyonu
Bilime özgüKimyaKimya
ADMET
Keminformatik
BiyolojiGen İfadesi
Sıra Analizi
Proteomik için Kütle Spektrometresi
Yeni nesil sıralama
Malzeme Modelleme ve SimülasyonMaterials Studio
Polimer Özellikleri (Synthia)
GenelRaporlama ve GörselleştirmeRaporlama
Veritabanı ve Uygulama EntegrasyonuEntegrasyon
GörüntülemeGörüntüleme
Analiz ve İstatistikVeri Modelleme
Gelişmiş Veri Modelleme
R İstatistikleri
Belge Arama ve AnalizKimyasal Metin Madenciliği
Metin Analizi
LaboratuvarPlaka Veri Analitiği
Analitik Enstrümantasyon

Şimdi BIOVIA tarafından sunulan farklı eklentilerin sayısı göz önüne alındığında, Pipeline Pilot'un kullanım durumları çok geniştir ve kısa ve öz bir şekilde özetlemek zordur. Ürünün kullanıldığı yerler:

PilotScript ve özel komut dosyaları

Diğer ETL ve analitik çözümlerinde olduğu gibi, Pipeline Pilot genellikle bir veya daha fazla büyük (1TB +) ve / veya karmaşık veri kümeleri işlendiğinde kullanılır. Bu durumlarda, son kullanıcılar yazdıkları programlama betiklerini kullanmak isteyebilir. Pipeline Pilot, geliştirilmesinin başlarında, son kullanıcıların bir Pipeline Pilot protokolüne dahil edilebilecek temel programlama komut dosyalarını kolayca yazmasına olanak tanıyan PilotScript adlı basitleştirilmiş, ayrıştırılmış bir komut dosyası dili yarattı. Daha sonraki sürümler, aşağıdakiler dahil çeşitli programlama dilleri için genişletilmiş destek Python, .AĞ, Matlab, Perl, SQL, Java, VBScript ve R.[9]

PilotScript sözdizimi şuna dayanmaktadır: PLSQL. Gibi bileşenlerde kullanılabilir. Özel Manipülatör (PilotScript) ya da Özel Filtre (PilotScript). Örnek olarak, aşağıdaki komut dosyası, Pipeline Pilot protokolünde özel bir komut dosyası oluşturma bileşeninden geçen her kayda "Merhaba" adlı bir özellik eklemek için kullanılabilir. Özelliğin değeri "Merhaba Dünya!" Dizesidir.

Merhaba := "Selam Dünya!";

Şu anda ürün, programın grafik kullanıcı arabirimi olmadan çalıştırılabilen farklı programlama dilleri için bir dizi API'yi desteklemektedir.

Referanslar

  1. ^ Hassan, Moises; Brown, Robert D .; Varma-O'Brien, Shikha; Rogers, David (2007). "Bir Veri Ardışık Düzeni Ortamında Cheminformatik Analizi ve Öğrenme". ChemInform. 38 (12). doi:10.1002 / chin.200712278. ISSN  0931-7597.
  2. ^ Hu, Ye; Lounkine, Eugen; Bajorath, Jürgen (2009). "Etkinlik Odaklı Özellik Filtreleme ve Bit Yoğunluğuna Bağlı Benzerlik İşlevinin Uygulanması Yoluyla Genişletilmiş Bağlantı Parmak İzlerinin Arama Performansını İyileştirme". ChemMedChem. 4 (4): 540–548. doi:10.1002 / cmdc.200800408. ISSN  1860-7179. PMID  19263458.
  3. ^ Warr, Wendy A. (2012). "Bilimsel iş akışı sistemleri: Pipeline Pilot ve KNIME". Bilgisayar Destekli Moleküler Tasarım Dergisi. 26 (7): 801–804. Bibcode:2012JCAMD..26..801W. doi:10.1007 / s10822-012-9577-7. ISSN  0920-654X. PMC  3414708. PMID  22644661.
  4. ^ "Accelrys, Boru Hattı Pilotu için NGS Koleksiyonu ile Yeni Nesil Dizileme Pazarına Giriyor". Business Wire. 2011-02-23. Alındı 15 Şubat 2013.
  5. ^ Rabal, Obdulia; Bağlantı, Wolfgang; G. Serelde, Beatriz; Bischoff, James R .; Oyarzabal, Julen (2010). "Kimyasal kitaplıkların görüntü tabanlı hücre taramasından ilgili tüm bilgileri ayıklamak, analiz etmek ve açıklama eklemek için entegre tek adımlı bir sistem". Moleküler Biyo Sistemler. 6 (4): 711–20. doi:10.1039 / b919830j. ISSN  1742-206X. PMID  20237649.
  6. ^ Paveley, Ross A .; Mansour, Nuha R .; Hallyburton, Irene; Bleicher, Leo S .; Benn, Alex E .; Mikic, Ivana; Guidi, Alessandra; Gilbert, Ian H .; Hopkins, Andrew L .; Bickle, Quentin D. (2012). "Parazitik Hastalıklar için Etiketsiz, Görüntü Tabanlı Bayes Sınıflamasına Göre Tüm Organizma Yüksek İçerik Taraması". PLoS İhmal Edilen Tropikal Hastalıklar. 6 (7): e1762. doi:10.1371 / journal.pntd.0001762. ISSN  1935-2735. PMC  3409125. PMID  22860151.
  7. ^ Vellay, SG; Latimer, NE; Paillard, G (2009). "Pipeline Pilot ile etkileşimli metin madenciliği: PubMed için bibliyografik web tabanlı bir araç". Bulaşıcı Bozukluklar İlaç Hedefleri. 9 (3): 366–74. doi:10.2174/1871526510909030366. PMID  19519489.
  8. ^ "Boru Hattı Pilot Bileşen Koleksiyonları". Hızlanır. Arşivlenen orijinal 15 Ocak 2013. Alındı 26 Ocak 2013.
  9. ^ "Pipeline Pilot Integration Component Collection Datasheet" (PDF). Hızlanır. Alındı 8 Şubat 2013.