Grafik veritabanı - Graph database

İçinde bilgi işlem, bir grafik veritabanı (GDB) bir veri tabanı o kullanır grafik yapıları için anlamsal sorgular ile düğümler, kenarlar ve verileri temsil eden ve depolayan özellikler.[1] Sistemin temel konseptlerinden biri, grafik (veya kenar veya ilişki). Grafik, mağazadaki veri öğelerini bir dizi düğüm ve kenarla ilişkilendirir, kenarlar düğümler arasındaki ilişkileri temsil eder. İlişkiler, depodaki verilerin doğrudan birbirine bağlanmasına ve çoğu durumda tek bir işlemle alınmasına izin verir. Grafik veritabanları, veriler arasındaki ilişkileri bir öncelik olarak tutar. İlişkileri sorgulamak hızlıdır çünkü bunlar sürekli olarak veritabanında depolanır. İlişkiler, grafik veritabanları kullanılarak sezgisel olarak görselleştirilebilir, bu da onları birbiriyle yoğun şekilde bağlantılı veriler için yararlı hale getirir.[2]

Grafik veritabanları bir tür NoSQL veritabanı, sınırlamalarını ele almak için oluşturulmuştur. ilişkisel veritabanları. Grafik modeli, veri düğümleri arasındaki bağımlılıkları açıkça ortaya koyarken, ilişkisel model ve diğer NoSQL veritabanı modelleri, verileri örtük bağlantılarla birbirine bağlar. Başka bir deyişle, ilişkiler bir birinci sınıf vatandaş bir grafik veritabanında bulunur ve etiketlenebilir, yönlendirilebilir ve özellikler verilebilir. Bu, bu ilişkilerin ima edildiği ve çalışma zamanında somutlaştırılması gereken ilişkisel yaklaşımlarla karşılaştırılır. Grafik veritabanları 1970'lere benzer ağ modeli her ikisi de genel grafikleri temsil eden veritabanları, ancak ağ modeli veritabanları daha düşük bir seviyede çalışır soyutlama[3] ve eksikliği kolay geçiş bir kenar zinciri üzerinden.[4]

Grafik veritabanlarının temelindeki depolama mekanizması değişebilir. Bazıları ilişkisel bir motora bağlıdır ve grafik verilerini bir masa (bir tablo mantıksal bir öğe olmasına rağmen, bu nedenle bu yaklaşım, grafik veritabanı, grafik veritabanı yönetim sistemi ve verilerin gerçekte depolandığı fiziksel cihazlar arasında başka bir soyutlama düzeyi uygular). Diğerleri bir anahtar-değer deposu veya belge odaklı veritabanı depolama için, onları doğal olarak NoSQL yapıları yapar.

Bir grafik veritabanından veri almak için bir sorgu dili ondan başka SQL, ilişkisel bir sistemde verilerin işlenmesi için tasarlanmış olan ve bu nedenle "zarif bir şekilde" işlenemeyen bir grafiğin üzerinden geçmek.[görüş ] 2017 itibariyle, ilişkisel veritabanları için SQL'de olduğu gibi evrensel grafik sorgu dili benimsenmemiştir ve çoğu zaman tek bir ürüne sıkı sıkıya bağlı olan çok çeşitli sistemler vardır. Bazı standardizasyon çabaları gerçekleşti ve bu, birden çok tedarikçiye sahip sorgu dillerine yol açtı. Gremlin, SPARQL, ve Cypher. Sorgu dili arayüzlerine sahip olmanın yanı sıra, bazı grafik veritabanlarına erişim sağlanabilir. uygulama programlama arayüzleri (API'ler).

Grafik veritabanları, grafik hesaplama motorlarından farklıdır. Grafik veritabanları, ilişkisel verilerin çevirileri olan teknolojilerdir. çevrimiçi işlem işleme (OLTP) veritabanları. Öte yandan, grafik hesaplama motorları çevrimiçi analitik işleme (OLAP) toplu analiz için. Grafik veritabanları, büyük teknoloji şirketlerinin tescilli grafik veritabanlarını kullanmadaki başarıları nedeniyle 2000'li yıllarda büyük ilgi gördü,[5] tanıtımı ile birlikte açık kaynak grafik veritabanları.

Tarih

1960'ların ortalarında, gezinme veritabanları gibi IBM 's IMS destekli ağaç benzeri yapılar hiyerarşik model ama katı ağaç yapısı sanal kayıtlarla aşılabilir.[6][7]

Grafik yapıları, 1960'ların sonlarından itibaren ağ modeli veritabanlarında gösterilebilir. KODASİL, tanımlanmış olan COBOL 1959'da Ağ Veritabanı Dilini 1969'da tanımladı.

Etiketli grafikler Mantıksal Veri Modeli gibi 1980'lerin ortalarından itibaren grafik veritabanlarında gösterilebilir.[3][8]

1990'ların başında web sayfalarını indeksleme çabalarıyla hızlanarak, grafik veritabanlarında çeşitli iyileştirmeler yapıldı.

2000'lerin ortalarında, ticari grafik veritabanları ile ASİT gibi garantiler Neo4j ve Oracle Uzamsal ve Grafik kullanılabilir hale geldi.

2010'larda, olabilecek ticari ACID grafik veritabanları yatay olarak ölçeklendi kullanılabilir hale geldi. Daha ileri, SAP HANA getirdi bellekte ve sütunlu veri tabanlarının grafiğini çizecek teknolojiler.[9] Ayrıca 2010'larda çok modelli veritabanları grafik modellerini (ve ilişkisel veritabanı veya diğer modeller gibi belge odaklı veritabanı ) gibi kullanılabilir hale geldi OrientDB, ArangoDB, ve MarkLogic (7.0 sürümünden itibaren). Bu süre zarfında, çeşitli türlerdeki grafik veritabanları özellikle aşağıdakiler arasında popüler hale geldi: sosyal ağ analizi sosyal medya şirketlerinin gelişiyle birlikte.

Arka fon

Grafik veritabanları düğümleri, özellikleri ve kenarları kullanır.

Grafik veritabanları, verileri kavramsal olarak görüntülendiği gibi tasvir eder. Bu, verilerin düğümlere ve ilişkilerinin kenarlara aktarılmasıyla gerçekleştirilir.

Grafik veritabanı, aşağıdakilere dayalı bir veritabanıdır: grafik teorisi. Bir düğüm veya kenar olabilen bir dizi nesneden oluşur.

  • Düğümler Kişiler, işletmeler, hesaplar veya izlenecek diğer herhangi bir öğe gibi varlıkları veya örnekleri temsil eder. İlişkisel bir veritabanındaki bir kaydın, ilişkinin veya satırın veya bir belge deposu veritabanındaki bir belgenin kabaca eşdeğeridirler.
  • Kenarlarolarak da adlandırılır grafikler veya ilişkiler, düğümleri diğer düğümlere bağlayan hatlardır; aralarındaki ilişkiyi temsil eder. Düğümlerin, özelliklerin ve kenarların bağlantılarını ve ara bağlantılarını incelerken anlamlı modeller ortaya çıkar. Kenarlar yönlendirilmiş veya yönlendirilmemiş olabilir. Yönlendirilmemiş bir grafikte, iki düğümü birbirine bağlayan bir kenarın tek bir anlamı vardır. Yönlendirilmiş bir grafikte, iki farklı düğümü birbirine bağlayan kenarların yönlerine bağlı olarak farklı anlamları vardır. Kenarlar, grafik veritabanlarında doğrudan uygulanmayan bir soyutlamayı temsil eden anahtar kavramdır. ilişkisel model veya a belge deposu modeli.
  • Özellikleri düğümlerle ilişkili bilgilerdir. Örneğin, eğer Wikipedia düğümlerden biriydi, gibi özelliklere bağlı olabilir İnternet sitesi, referans malzemesiveya w harfi ile başlayan kelimelerhangi yönlerine bağlı olarak Wikipedia belirli bir veritabanı ile ilgilidir.

Grafik modelleri

Etiketli özellik grafiği

Etiketli bir özellik grafik modeli, bir dizi düğüm, ilişki, özellik ve etiketle temsil edilir. Her iki veri düğümü ve ilişkileri adlandırılır ve temsil edilen özellikleri depolayabilir anahtar / değer çiftleri. Düğümler gruplanacak şekilde etiketlenebilir. İlişkileri temsil eden kenarların iki niteliği vardır: her zaman bir başlangıç ​​düğümü ve bir bitiş düğümü vardır ve yönlendirilir;[10] grafiği yapmak Yönlendirilmiş grafik. İlişkiler de özelliklere sahip olabilir. Bu, düğümlerin ilişkilerine ek meta veriler ve anlambilim sağlamada yararlıdır.[11] İlişkilerin doğrudan depolanması, sabit zamanlı geçiş.[12]

Kaynak Açıklama Çerçevesi (RDF)

Örnek bir RDF grafiği

Bir RDF grafik modeli, bilgi eklenmesi her biri ayrı bir düğüm ile temsil edilir. Örneğin, bir kullanıcının grafikte farklı bir düğüm olarak temsil edilen bir kişi için bir ad özelliği eklemesi gereken bir senaryo hayal edin. Etiketli özellikli bir grafik modelinde bu, kişinin düğümüne bir ad özelliği eklenerek yapılır. Ancak, bir RDF'de, kullanıcının adında ayrı bir düğüm eklemesi gerekir. hasName orijinal kişi düğümüne bağlanıyor. Özellikle, bir RDF grafik modeli düğümlerden ve yaylardan oluşur. Bir RDF grafik gösterimi veya bir ifade şunlarla temsil edilir: özne için bir düğüm, nesne için bir düğüm ve yüklem için bir yay. Bir düğüm boş bırakılabilir, bir gerçek ve / veya bir URI. Bir ark, bir URI ile de tanımlanabilir. Bir düğüm için hazır bilgi iki türde olabilir: düz (türsüz) ve türlenmiş. Düz bir değişmez, sözlü bir biçime ve isteğe bağlı olarak bir dil etiketine sahiptir. Yazılan değişmez bilgi, belirli bir veri türünü tanımlayan bir URI'ye sahip bir dizeden oluşur. Veriler bir veriye sahip olmadığında, verilerin durumunu doğru bir şekilde göstermek için boş bir düğüm kullanılabilir. URI.[13]

Kullanılır Facebook "herhangi bir web sayfasının Facebook'taki diğer herhangi bir nesne ile aynı işlevselliğe sahip olmasına izin veren" Open Graph protokolü[14] ve Anlamsal ağ.

Özellikleri

Grafik veritabanları, grafik benzeri sorgular için güçlü bir araçtır. Örneğin, grafikteki iki düğüm arasındaki en kısa yolu hesaplamak. Diğer grafik benzeri sorgular, bir grafik veritabanı üzerinden doğal bir şekilde gerçekleştirilebilir (örneğin grafiğin çap hesaplamaları veya topluluk tespiti).

Grafikler esnektir, yani kullanıcının uygulama işlevselliğini kaybetmeden mevcut grafiğe yeni veriler eklemesine izin verir. Veritabanının tasarımcısının, veritabanının gelecekteki kullanım durumlarının kapsamlı ayrıntılarını planlamasına gerek yoktur.

Depolama

Grafik veritabanlarının temelindeki depolama mekanizması değişebilir. Bazıları ilişkisel bir motora bağlıdır ve grafik verilerini bir masa (bir tablo mantıksal bir öğe olmasına rağmen, bu nedenle bu yaklaşım, grafik veritabanı, grafik veritabanı yönetim sistemi ve verilerin gerçekte depolandığı fiziksel cihazlar arasında başka bir soyutlama düzeyi uygular). Diğerleri bir anahtar-değer deposu veya belge odaklı veritabanı depolama için, onları doğal olarak yapmak NoSQL yapılar. Bir düğüm, başka herhangi bir belge deposu olarak temsil edilebilir, ancak iki farklı düğümü birbirine bağlayan kenarlar, belgesinin içinde özel niteliklere sahiptir; a _from ve _to öznitelikleri.

Endeks içermeyen bitişiklik

Veri arama performansı, belirli bir düğümden diğerine erişim hızına bağlıdır. Çünkü indeks -ücretsiz bitişiklik, düğümleri doğrudan fiziksel Veri deposu adresler ve fiziksel olarak diğer bitişik düğümlere işaret ederse, hızlı bir erişim sağlar. Dizinsiz bitişikliğe sahip yerel bir grafik sisteminin, düğümler arasındaki bağlantıları bulmak için başka herhangi bir veri yapısı türünden geçmesi gerekmez. Bir grafikteki doğrudan ilişkili düğümler, önbellek Düğümlerden biri alındığında, veri araması, kullanıcının bir düğümü ilk kez getirmesinden daha hızlı hale getirir. Ancak bu avantajın bir bedeli vardır. dizinsiz bitişiklik, kullanmayan sorguların verimliliğini feda eder grafik geçişleri. Yerel grafik veritabanları işlemek için indeks içermeyen bitişiklik kullanır REZİL saklanan veriler üzerindeki işlemler.

Grafik türleri

Kategorize edilebilecek birden çok grafik türü vardır. Gartner, beş geniş grafik kategorisini önerir:[15]

  • Sosyal grafik: bu insanlar arasındaki bağlantılarla ilgilidir; örnekler şunları içerir Facebook, Twitter ve fikri altı derece ayrılık
  • Niyet grafiği: Bu, akıl yürütme ve motivasyonla ilgilenir.
  • Tüketim grafiği: "Ödeme grafiği" olarak da bilinen tüketim grafiği, perakende sektöründe yoğun olarak kullanılmaktadır. Amazon, eBay ve Walmart gibi e-ticaret şirketleri, bireysel müşterilerin tüketimini izlemek için tüketim grafikleri kullanır.
  • İlgi grafiği: bu, bir kişinin ilgi alanlarını haritalandırır ve genellikle bir sosyal grafikle tamamlanır. Web sayfalarını indekslemek yerine ilgiye göre web'i haritalayarak önceki web organizasyon devrimini izleme potansiyeline sahiptir.
  • Mobil grafik: Bu, mobil verilerden oluşturulmuştur. Gelecekteki mobil veriler, web'den, uygulamalardan, dijital cüzdanlardan, GPS'den ve Nesnelerin interneti (IoT) cihazları.

İlişkisel veritabanları ile karşılaştırma

Dan beri Edgar F. Codd 1970 tarihli kağıt ilişkisel model,[16] ilişkisel veritabanları büyük ölçekli veri depolama sistemleri için fiili endüstri standardı olmuştur. Bununla birlikte, ilişkisel modeller katı bir şema gerektirir ve veri normalleştirme ilişkilerin nasıl sorgulanabileceğine dair sınırlamalar getirildi.

Geleneksel olarak veritabanları, verilerin normalleştirildiği ilişkisel modelle tasarlanmıştır. ACID işlemleri. Veri normalleştirme işlemi, veri tabanı içindeki tüm yinelenen verileri kaldırır. Veri normalleştirmenin amacı, korumaktır veri tutarlılığı. İlişkisel model, verileri birçok tabloya ayırarak ACID işlemlerini zorlar.

İlişkisel modeller, tutarlılığı garantilemek için yoğun veri normalleştirmesini zorlar. İlişkisel modelin tasarım motivasyonlarından biri, hızlı bir sıra sıra erişim sağlamaktı.[16] Depolanan veriler arasında karmaşık ilişkiler kurma ihtiyacı olduğunda sorunlar ortaya çıkar. İlişkiler ilişkisel modelle analiz edilebilmesine rağmen, birçok tablo üzerinde birçok farklı öznitelik üzerinde birçok birleştirme işlemi gerçekleştiren karmaşık sorgular gereklidir. İlişkisel modellerle çalışırken, yabancı anahtar İlişkiler alınırken ek yüke neden olan kısıtlamalar da dikkate alınmalıdır.

İle karşılaştırıldığında ilişkisel veritabanları grafik veritabanları, ilişkilendirilebilir veri kümeleri için genellikle daha hızlıdır[kaynak belirtilmeli ] ve yapısına daha doğrudan nesne odaklı uygulamalar. Daha doğal bir şekilde ölçeklenebilirler[kaynak belirtilmeli ] genellikle ihtiyaç duymadıklarından büyük veri kümelerine katılmak genellikle pahalı olabilen işlemler. Katı bir şemaya daha az bağımlı olduklarından, gelişen şemalarla geçici ve değişen verileri yönetmek için daha uygun olarak pazarlanırlar.

Tersine, ilişkisel veritabanı yönetim sistemleri, aynı işlemi çok sayıda veri öğesi üzerinde gerçekleştirmede tipik olarak daha hızlıdır ve verilerin doğal yapısında değiştirilmesine izin verir. Grafik veri tabanlarının ilişkisel veri tabanlarına göre avantajlarına ve son zamanlardaki popülerliğine rağmen, grafik modelinin kendisinin mevcut bir ilişkisel veri tabanını değiştirmek için tek neden olmaması gerektiği tavsiye edilmektedir. Bir grafik veritabanı, büyüklük ve daha düşük gecikme sürelerine göre performans iyileştirmesi için bir kanıt varsa alakalı hale gelebilir.[17]

Örnekler

İlişkisel model, verilerdeki bilgileri kullanarak verileri bir araya toplar. Örneğin, telefon numarası "311" alan kodunu içeren tüm "kullanıcılar" aranabilir. Bu, seçilen veri depoları arayarak yapılabilir veya tablolar, "311" dizesi için seçilen telefon numarası alanlarına bakıldığında. Bu, büyük tablolarda zaman alan bir süreç olabilir, bu nedenle ilişkisel veritabanları dizinler, verilerin yalnızca seçilen verileri içeren daha küçük bir alt tabloda depolanmasına izin veren ve Benzersiz anahtarı (veya birincil anahtar) kaydın. Telefon numaraları dizine alınmışsa, aynı arama daha küçük dizin tablosunda gerçekleşir, eşleşen kayıtların anahtarlarını toplar ve ardından bu anahtarlara sahip kayıtlar için ana veri tablosuna bakılır. Genellikle bir tablo, bir anahtarla aramanın çok hızlı olmasına izin verecek şekilde saklanır.[18]

İlişkisel veritabanları, doğası gereği kayıtlar arasındaki sabit ilişkiler fikrini içerir. Bunun yerine, ilgili veriler, bir kaydın benzersiz anahtarını başka bir kaydın verilerinde saklayarak birbirine bağlanır. Örneğin, kullanıcılar için e-posta adreslerini içeren bir tablo, userpk, ilişkili olduğu kullanıcı kaydının birincil anahtarını içerir. Kullanıcıları ve e-posta adreslerini bağlamak için, sistem önce seçilen kullanıcı kayıtları birincil anahtarlarını arar, bu anahtarları userpk e-posta tablosundaki sütunu (veya daha büyük olasılıkla bunların bir dizini), e-posta verilerini çıkarır ve ardından seçilen tüm verileri içeren bileşik kayıtlar yapmak için kullanıcı ve e-posta kayıtlarını birbirine bağlar. Bu operasyon, katılmak, hesaplama açısından pahalı olabilir. Sorgunun karmaşıklığına, birleştirme sayısına ve çeşitli anahtarların indekslenmesine bağlı olarak, sistemin birden çok tablo ve dizin arasında arama yapması ve ardından hepsini birbiriyle eşleşecek şekilde sıralaması gerekebilir.[18]

Buna karşılık, grafik veritabanları doğrudan kayıtlar arasındaki ilişkileri depolar. Bir e-posta adresinin, kullanıcının anahtarına bakarak bulunması yerine userpk sütununda, kullanıcı kaydı doğrudan e-posta adresi kaydına başvuran bir işaretçi içerir. Yani, bir kullanıcı seçildikten sonra, işaretçi doğrudan e-posta kayıtlarına kadar takip edilebilir, eşleşen kayıtları bulmak için e-posta tablosunda arama yapmaya gerek yoktur. Bu, maliyetli birleştirme işlemlerini ortadan kaldırabilir. Örneğin, bir kişi "311" alan kodundaki kullanıcılar için tüm e-posta adreslerini ararsa, motor önce "311" içindeki kullanıcıları bulmak için geleneksel bir arama gerçekleştirir, ancak daha sonra, içinde bulunan bağlantıları izleyerek e-posta adreslerini alır. bu kayıtlar. İlişkisel bir veritabanı önce "311" deki tüm kullanıcıları bulur, birincil anahtarların bir listesini çıkarır, bu birincil anahtarlarla e-posta tablosundaki herhangi bir kayıt için başka bir arama gerçekleştirir ve eşleşen kayıtları birbirine bağlar. Bu tür ortak işlemler için, grafik veritabanları teorik olarak daha hızlı olacaktır.[18]

Grafik yaklaşımının gerçek değeri, birden fazla düzey derinlikte aramalar yapıldığında ortaya çıkar. Örneğin, "311" alan kodunda "aboneleri" (kullanıcıları diğer kullanıcılara bağlayan bir tablo) olan kullanıcıları aramayı düşünün. Bu durumda, ilişkisel bir veri tabanı önce "311" de bir alan koduna sahip tüm kullanıcıları aramalı, ardından bu kullanıcılardan herhangi biri için aboneler tablosunda arama yapmalı ve son olarak eşleşen kullanıcıları almak için kullanıcılar tablosunu aramalıdır. Bunun aksine, bir grafik veritabanı "311" deki tüm kullanıcıları arar ve ardından geri bağlantılar abone kullanıcıları bulmak için abone ilişkisi üzerinden. Bu, birkaç arama, arama ve çıktıyı oluşturmak için gereken birden çok kayıttaki tüm geçici verilerin tutulmasında yer alan bellek kullanımını önler. Açısından büyük O notasyonu, bu sorgu zaman - yani, verilerin boyutunun logaritması ile orantılı. Buna karşılık, ilişkisel versiyon birden fazla olacaktır. aramalar, artı tüm veri kayıtlarını birleştirmek için gereken süre.[18]

Grafik almanın göreceli avantajı, bir sorgunun karmaşıklığı ile birlikte artar. Örneğin, o filmde başrolü oynayan diğer aktörle o filmde bulunan aktörle denizaltılarla ilgili o filmi bilmek isteyebilirsiniz. Rüzgar gibi Geçti gitti ". Bu önce sistemin oyuncuları bulmasını gerektirir. Rüzgar gibi Geçti gitti, içinde bulundukları tüm filmleri bulun, tüm bu filmlerdeki başrol olmayan tüm oyuncuları bulun Rüzgar gibi Geçti gittive sonra içinde bulundukları tüm filmleri bulun, sonunda bu listeyi "denizaltı" içeren açıklamaları olanlara göre filtreleyin. İlişkisel bir veritabanında, bu, filmler ve aktörler tablolarında birkaç ayrı arama yapmayı, denizaltı filmlerinde başka bir arama yapmayı, bu filmlerdeki tüm oyuncuları bulmayı ve ardından (büyük) toplanan sonuçları karşılaştırmayı gerektirir. Buna karşılık, grafik veri tabanı, Rüzgar gibi Geçti gitti -e Clark Gable, oynadığı filmlerin bağlantılarını toplayın, bu filmlerden diğer oyuncularla olan bağlantılarını toplayın ve ardından bu oyunculardan gelen bağlantıları film listesine geri getirin. Elde edilen film listesi daha sonra "denizaltı" için aranabilir. Tüm bunlar tek bir arama ile yapılabilir.[19]

Özellikleri başka bir katman ekle soyutlama birçok genel sorguyu da geliştiren bu yapıya. Özellikler, esasen herhangi bir kayda veya bazı durumlarda kenarlara da uygulanabilen etiketlerdir. Örneğin, Clark Gable "aktör" olarak etiketlenebilir, bu da sistemin yönetmen veya kamera operatörü yerine aktör olan tüm kayıtları hızlı bir şekilde bulmasına izin verir. Kenarlarda etiketlere izin veriliyorsa, bunlar arasındaki ilişki de etiketlenebilir. Rüzgar gibi Geçti gitti ve Clark Gable "başrol" olarak ve filmde "başrol" "aktör" olan kişiler üzerinde arama yaparak Rüzgar gibi Geçti gittiveritabanı üretecektir Vivien Leigh, Olivia de Havilland ve Clark Gable. Eşdeğer SQL sorgusu, kişi ve filmleri birbirine bağlayan tabloda eklenen verilere dayanmalı ve sorgu sözdizimine daha fazla karmaşıklık katmalıdır. Bu tür etiketler, belirli koşullar altında arama performansını iyileştirebilir, ancak genellikle son kullanıcılar için ek anlamsal veriler sağlamada daha kullanışlıdır.[19]

İlişkisel veritabanları, veriler arasındaki ilişkilerin bir veya iki düzey derin olduğu düz veri düzenlerine çok uygundur. Örneğin, bir muhasebe veritabanının, belirli bir müşterinin tüm faturaları için tüm münferit kalemlere bakması gerekebilir, üç birleştirme sorgusu. Grafik veritabanları, çok daha fazla bağlantı içeren veri kümelerine yöneliktir. Özellikle aşağıdakiler için uygundur: sosyal ağ "arkadaş" ilişkisinin esasen sınırsız olduğu sistemler. Bu özellikler, grafik veritabanlarını çevrimiçi sistemlerde giderek yaygınlaşan arama türlerine doğal olarak uygun hale getirir. Büyük veri ortamlar. Bu nedenle, grafik veritabanları gibi büyük çevrimiçi sistemler için çok popüler hale geliyor. Facebook, Google, Twitter ve kayıtlar arasında derin bağlantılara sahip benzer sistemler.

Daha fazla örneklemek için, iki tablo içeren bir ilişkisel model hayal edin: a insanlar tablo (bir person_id ve Kişi Adı sütun) ve bir arkadaş masa (ile friend_id ve person_idhangi bir yabancı anahtar -den insanlar tablo). Bu durumda, Jack'in tüm arkadaşlarını aramak aşağıdaki SQL sorgusuyla sonuçlanacaktır.

SEÇ s2.Kişi Adı FROM insanlar s1 KATILMAK arkadaş AÇIK (s1.person_id = arkadaş.person_id)KATILMAK insanlar s2 AÇIK (s2.person_id = arkadaş.friend_id)NEREDE s1.Kişi Adı = "Jack";

Aynı sorgu şu dile çevrilebilir -

  • Cypher bir grafik veritabanı sorgu dili
    EŞLEŞME(s1:kişi)-[:ARKADAŞ-İLE]-(s2:kişi)NEREDEs1.isim="Jack"DÖNÜŞs2.isim
  • SPARQL, bir RDF grafik veritabanı sorgu dili tarafından standartlaştırıldı W3C ve birden çok RDF'de kullanılır Üçlü ve Dörtlü mağazalar
    • Uzun form
      ÖNEK foaf: <http://xmlns.com/foaf/0.1/>SEÇ isimNEREDE { ? s a          foaf:Kişi .         ? s foaf:isim  "Jack" .         ? s foaf:bilir  .          foaf:isim  isim .       }
    • Kısa form
      ÖNEK foaf: <http://xmlns.com/foaf/0.1/>SEÇ isimNEREDE { ? s foaf:isim     "Jack" ;           foaf:bilir     .            foaf:isim  isim .      }
  • SPASQL, hibrit bir veritabanı sorgu dili, SQL ile SPARQL
    SEÇ insanlar.isimFROM (       SPARQL ÖNEK foaf: <http://xmlns.com/foaf/0.1/>              SEÇ isim              NEREDE { ? s foaf:isim  "Jack" ;                          foaf:bilir  .                       foaf:isim  isim .                    }    ) GİBİ insanlar ;

Yukarıdaki örnekler, temel bir ilişki sorgusunun basit bir örneğidir. Toplam veri miktarı ile artan ilişkisel modellerin sorgu karmaşıklığı fikrini yoğunlaştırırlar. Buna karşılık, bir grafik veritabanı sorgusu, sonuçları sunmak için ilişki grafiğini kolayca sıralayabilir.

Grafik veritabanlarının basit, yoğunlaştırılmış ve bildirimsel sorgularının ilişkisel veritabanlarına kıyasla mutlaka iyi performans sağlamadığını gösteren sonuçlar da vardır. Grafik veritabanları, verilerin sezgisel bir temsilini sunarken, ilişkisel veritabanları set işlemlerine ihtiyaç duyulduğunda daha iyi sonuçlar sunar.[12]

Grafik veri tabanlarının listesi

Aşağıdakiler listesidir dikkate değer grafik veritabanları:

İsimSürümLisansDilAçıklama
AllegroGraph7.0.0 (Nisan 2020)Tescilli, müşteriler: Eclipse Kamu Lisansı v1C #, C, Ortak Lisp, Java, PythonKaynak Açıklama Çerçevesi (RDF) ve grafik veritabanı
Amazon Neptün1.0.4.0 (Ekim 2020)[20]TescilliAçıklanmamışAmazon Neptune, tümüyle yönetilen bir grafik veritabanıdır. Amazon.com. Olarak kullanılır internet servisi ve bir parçası Amazon Web Hizmetleri. Popüler grafik modelleri özellik grafiğini destekler ve W3C 's RDF ve onların ilgili sorgu dilleri Apache TinkerPop Gremlin ve SPARQL.
AnzoGraph DB2.1 (Şub 2020)TescilliC, C ++AnzoGraph DB bir büyük ölçüde paralel desteklemek için oluşturulmuş yerel grafik GOLAP (Graph Online Analytics Processing) stili veritabanı SPARQL ve Cypher Sorgu Dili trilyonlarca ilişkiyi analiz etmek için. AnzoGraph DB, büyük setlerin interaktif analizi için tasarlanmıştır. anlamsal üçlü veriler, ancak aynı zamanda önerilen altında etiketlenmiş özellikleri destekler W3C standartları.[21][22][23][24]
ArangoDB3.7.2 / (21 Ağustos 2020)Bedava Apaçi 2, Tescilli,C ++, JavaScript, .AĞ, Java, Python, Node.js, PHP, Scala, Git, Yakut, İksirNoSQL ArangoDB Inc. tarafından geliştirilen yerel çok modelli veritabanı sistemi Veritabanı sistemi, bir veritabanı çekirdeği ve AQL (ArangoDB Sorgu Dili) adı verilen birleşik bir sorgu dili ile üç önemli veri modelini (anahtar / değer, belgeler, grafikler) destekler
DataStax Kurumsal Grafikv6.0.1 (Haziran 2018)TescilliJavaDağıtılmış, gerçek zamanlı, ölçeklenebilir veritabanı; Tinkerpop'u destekler ve entegre olur Cassandra[25]
Grakn Çekirdek1.8.4Bedava, GNU AGPLv3JavaGrakn bir açık kaynak, dağıtılmış bilgi odaklı sistemler için bilgi grafiği. Yüksek oranda birbirine bağlı veriler için ilişkisel veritabanının bir evrimidir ve bir kavram düzeyinde şema tam olarak uygulayan Varlık-İlişki (ER) modeli. Ancak Grakn’ın şeması bir tip sistemi prensiplerini uygulayan bilgi temsili ve muhakeme. Bu, Grakn'ın bildirim temelli sorgu dili, Graql (Grakn’ın akıl yürütme ve analitik sorgu dili), daha etkileyici bir modelleme dili ve performans gösterme yeteneği sağlamak için mantıksal akıl yürütme büyük miktarlarda karmaşık veri. Grakn etkili bir şekilde bilgi tabanı için yapay zeka ve bilişsel bilgi işlem sistemleri.
Sonsuz Grafik3.0 (Ocak 2013)Tescilli, ticariJavaDağıtılmış ve bulut özellikli
JanusGraph0.5.2 (3 Mayıs 2020)[26]Apaçi 2JavaAçık kaynak, ölçeklenebilir, çok makineli küme grafik veritabanına dağıtılmış Linux Vakfı; çeşitli depolama arka uçlarını destekler (Apache Cassandra, Apache HBase, Google Cloud Bigtable, Oracle BerkeleyDB );[27] küresel grafik veri analitiğini, raporlamayı ve ETL büyük veri platformlarıyla entegrasyon yoluyla (Apache Spark, Apache Giraph, Apache Hadoop ); harici dizin depoları aracılığıyla coğrafi, sayısal aralık ve tam metin aramayı destekler (Elasticsearch, Apache Solr, Apache Lucene ).[28]
MarkLogic8.0.4 (2015)Tescilli, ücretsiz yazılım geliştirici sürümüJavaÇok model NoSQL depolayan veritabanı belgeler (JSON ve XML) ve anlamsal grafik verileri (RDF üçlü); ayrıca yerleşik bir arama motoruna sahiptir
Microsoft SQL Sunucusu 2017RC1TescilliSQL / T-SQL, R, PythonÇoktan çoğa ilişkileri modellemek için grafik veritabanı yetenekleri sunar. Grafik ilişkileri Transact-SQL'e entegre edilmiştir ve temel veritabanı yönetim sistemi olarak SQL Server'ı kullanır.[29]
Nebula Grafiği2.0.0-alpha (Kasım 2020)Apache 2.0, Açık Kaynak, Ortak Madde 1.0C ++, Git, Java, PythonMilisaniyelik gecikme süresiyle milyarlarca köşeyi ve trilyonlarca kenarı depolamak ve işlemek için ölçeklenebilir bir açık kaynaklı dağıtılmış grafik veritabanı. Doğrusal ölçeklenebilirlik için paylaşılmayan dağıtılmış bir mimariye dayalı olarak tasarlanmıştır.[30]
Neo4j4.2.1 (Kasım 2020)[31]GPLv3 Topluluk Sürümü, ticari & AGPLv Kurumsal ve gelişmiş sürümler için 3 seçenekJava, .AĞ, JavaScript, Python, Git,

Yakut, PHP, R, Erlang /İksir, C /C ++, Clojure, Perl, Haskell

Açık kaynak, ACID'yi destekler, kurumsal dağıtımlar için yüksek kullanılabilirlikli kümelemeye sahiptir ve tam işlem desteği ve görsel düğüm bağlantısı grafik gezgini içeren web tabanlı bir yönetimle birlikte gelir; yerleşik kullanarak çoğu programlama dilinden erişilebilir DİNLENME web API arayüz ve resmi sürücülerle tescilli bir Bolt protokolü.
Linki açVirtüöz8.2 (Ekim 2018)Açık Kaynak Sürümü GPLv 2, Enterprise Edition tescilliC, C ++SQL tabloları ve / veya RDF Grafikleri olarak modellenen veriler üzerinde bildirime dayalı (Veri Tanımlama ve Veri İşleme) işlemler için hem SQL hem de SPARQL'i destekleyen çok modelli (Hibrit) ilişkisel veritabanı yönetim sistemi (RDBMS). Ayrıca RDF-Turtle, RDF-N-Triples, RDF-XML, JSON-LD'nin indekslenmesini ve CSV, XML ve JSON dahil olmak üzere çeşitli belge türlerinden ilişkilerin (SQL tabloları veya RDF grafikleri) eşlenmesini ve oluşturulmasını destekler. Yerel veya gömülü bir örnek olarak dağıtılabilir ( NEPOMUK Anlamsal Masaüstü), tek örnekli bir ağ sunucusu veya paylaşılan hiçbir şey içermeyen elastik küme çoklu örnek ağ bağlantılı bir sunucu[32]
Oracle Uzamsal ve Grafik; parçası Oracle Veritabanı12.1.0.2 (2014)TescilliJava, PL /SQLÇok modelli Oracle Veritabanındaki özellikler olarak Özellik Grafiği ve RDF Grafiği yetenekleri:
  1. Özellik Grafiği - bir dizi nesne veya tepe noktasından ve nesneleri birbirine bağlayan bir dizi ok veya kenardan oluşur. Tepe noktaları ve kenarlar, anahtar-değer çiftleri olarak temsil edilen birden çok özelliğe sahip olabilir. PGQL, SQL benzeri bir grafik sorgu dili ve 50'den fazla önceden oluşturulmuş paralel grafik algoritmasına sahip bir bellek içi analitik motor (PGX) içerir
  2. RDF Anlamsal Grafik: Oracle Veritabanında yerel muhakeme ve üç seviyeli etiket güvenliği ile kapsamlı W3C RDF grafik yönetimi.
OrientDB3.0.28 (Şub 2020)Topluluk Sürümü Apaçi 2, Enterprise Edition ticariJavaDokümanların tek bir üründe esnekliğine sahip ikinci nesil dağıtılmış grafik veritabanı (yani, hem grafik veritabanı hem de doküman NoSQL veritabanıdır); açık kaynak Apache 2 lisansı altında lisanslanmıştır; ve dolu ASİT destek; çoklu ana kopyası vardır ve parçalama; şemasız, tam ve karışık modları destekler; kullanıcı ve rollere dayalı güvenlik profiline sahiptir; SQL'e benzer bir sorgu dilini destekler. HTTP var DİNLENME ve JSON API.
RedisGraph2.0.20 (Eyl 2020)Redis Kaynağı Kullanılabilir LisansıCBellek içi, sorgulanabilir Özellik Grafiği veritabanı seyrek matrisler bitişik matrisini grafiklerde temsil etmek ve lineer Cebir grafiği sorgulamak için.[33]
SAP HANA2.0 SPS 05 (Haziran 2020)[34]TescilliC, C ++, Java, JavaScript & SQL benzeri dilBellek içi ACID işlem destekli özellik grafiği[35]
Sparksee5.2.0 (2015)Tescilli, ticari, ücretsiz yazılım değerlendirme, araştırma, geliştirme içinC ++Sparsity Technologies'den yüksek performanslı ölçeklenebilir veritabanı yönetim sistemi; ana özelliği, büyük ağları almak ve keşfetmek için sorgu performansıdır; için bağlamaları var Java, C ++, C #, Python, ve Amaç-C; sürüm 5 ilk grafiktir mobil veritabanı
Sqrrl Kurumsal2.0 (Şubat 2015)TescilliJavaHücre düzeyinde güvenlik ve toplu ölçeklenebilirlik sunan dağıtılmış, gerçek zamanlı grafik veritabanı[36]
Teradata Aster7 (2016)TescilliJava, SQL, Python, C ++, RMPP yerel SQL'i destekleyen patentli motorları içeren veritabanı, Harita indirgeme ve grafik veri depolama ve işleme; bir dizi analitik işlev kitaplığı ve veri görselleştirme sağlar[37]
TerminusDB4.0 (2020)Apaçi 2Prolog, Pas, paslanma, JSON-LDModel tabanlı grafik veritabanı bilgi grafiği temsil

Grafik sorgu programlama dilleri

  • AQL (ArangoDB Sorgu Dili): kullanılan SQL benzeri bir sorgu dili ArangoDB hem belgeler hem de grafikler için
  • Cypher Sorgu Dili (Cypher): bir grafik sorgusu bildirim dili için Neo4j Bu, grafiğe geçici ve programlı (SQL benzeri) erişim sağlar.[38]
  • GQL: önerilen ISO standart grafik sorgu dili
  • GraphQL: API'ler için açık kaynaklı bir veri sorgusu ve işleme dili
  • Gremlin: Apache TinkerPop açık kaynak projesinin bir parçası olan bir grafik programlama dili[39]
  • SPARQL: RDF biçiminde depolanan verileri alabilen ve değiştirebilen RDF veritabanları için bir sorgu dili

Ayrıca bakınız

Referanslar

  1. ^ Nikolaos G. Bourbakis (1998). Yapay Zeka ve Otomasyon. World Scientific. s. 381. ISBN  9789810226374. Alındı 2018-04-20.
  2. ^ Yoon, Byoung-Ha; Kim, Seon-Kyu; Kim, Seon-Young (Mart 2017). "Heterojen Biyolojik Verilerin Entegrasyonu için Grafik Veritabanının Kullanımı". Genomik ve Bilişim. 15 (1): 19–27. doi:10.5808 / GI.2017.15.1.19. ISSN  1598-866X. PMC  5389944. PMID  28416946.
  3. ^ a b Açılar, Renzo; Gutierrez, Claudio (1 Şub 2008). "Grafik veritabanı modellerinin incelenmesi" (PDF). ACM Hesaplama Anketleri. 40 (1): 1–39. CiteSeerX  10.1.1.110.1072. doi:10.1145/1322432.1322433. S2CID  207166126. Arşivlenen orijinal (PDF) 15 Ağustos 2017. Alındı 28 Mayıs 2016. ağ modelleri [...] iyi bir soyutlama seviyesinden yoksundur: db modelini gerçek uygulamadan ayırmak zordur
  4. ^ Silberschatz, Avi (28 Ocak 2010). Veritabanı Sistem Kavramları, Altıncı Baskı (PDF). McGraw-Hill. s. D-29. ISBN  978-0-07-352332-3.
  5. ^ "Grafik Veritabanları Yaygınlaşmaya Başladı". www.kdnuggets.com. Alındı 2018-10-23.
  6. ^ Silberschatz, Avi (28 Ocak 2010). Veritabanı Sistem Kavramları, Altıncı Baskı (PDF). McGraw-Hill. s. E-20. ISBN  978-0-07-352332-3.
  7. ^ Parker, Lorraine. "EYS Notları". vcu.edu. Alındı 31 Mayıs 2016.
  8. ^ Kuper, Gabriel M. (1985). Mantıksal Veri Modeli: Veritabanı Mantığına Yeni Bir Yaklaşım (PDF) (Doktora). Docket STAN-CS-85-1069. Alındı 31 Mayıs 2016.
  9. ^ "SAP, HANA ile Bulutta Yeni Yetenekleri Duyurdu". 2014-10-22. Alındı 2016-07-07.
  10. ^ Frisendal, Thomas (2017/09/22). "Mülk Grafikleri". graphdatamodeling.com. Alındı 2018-10-23.
  11. ^ Das, S; Srinivasan, J; Perry, Matthew; Chong, Eugene; Banerjee, Jay (2014-03-24). "İki Grafiğin Hikayesi: Oracle'da RDF Olarak Özellik Grafikleri". Alıntı dergisi gerektirir | günlük = (Yardım)
  12. ^ a b Var, Christian Theil; Jensen, Lars Juhl (2013-10-17). "Grafik veritabanları biyoinformatik için hazır mı?". Biyoinformatik. 29 (24): 3107–3108. doi:10.1093 / biyoinformatik / btt549. ISSN  1460-2059. PMC  3842757. PMID  24135261.
  13. ^ "Kaynak Açıklama Çerçevesi (RDF): Kavramlar ve Soyut Sözdizimi". www.w3.org. Alındı 2018-10-24.
  14. ^ "Açık Grafik protokolü". ogp.me. Alındı 2018-10-23.
  15. ^ "Tüketici Web'in Rekabet Dinamikleri: Beş Grafik Sürdürülebilir Bir Avantaj Sağlıyor". www.gartner.com. Alındı 2018-10-23.
  16. ^ a b Codd, E.F. (1970-06-01). "Büyük paylaşılan veri bankaları için ilişkisel bir veri modeli". ACM'nin iletişimi. 13 (6): 377–387. doi:10.1145/362384.362685. ISSN  0001-0782. S2CID  207549016.
  17. ^ "Grafik Veritabanları, 2. Baskı". O’Reilly | Safari. Alındı 2018-10-23.
  18. ^ a b c d "İlişkiselden Grafik Veritabanlarına". Neo4j.
  19. ^ a b "Grafik veritabanlarının parladığı örnekler: Neo4j sürümü", ZeroTurnaround
  20. ^ "Amazon Neptune Engine Sürüm 1.0.4.0 (2020-10-12)". AWS. Alındı 17 Kasım 2020.
  21. ^ "Analiz için Amaca Uygun Bellek İçi Büyük Ölçekte Paralel Dağıtılmış Grafik Veritabanı". www.Cambridgesemantics.com. Alındı 2018-02-20.
  22. ^ Rueter, John (15 Şubat 2018). "Cambridge Semantics, Amazon Neptune ve Graph Veritabanları için AnzoGraph Grafik Tabanlı Analytics Desteğini Duyurdu". Businesswire. Alındı 20 Şubat 2018.
  23. ^ Zane, Barry (2 Kasım 2016). "Anlamsal Grafik Veritabanları: İlişkisel veritabanlarının değerli bir halefi". www.dbta.com. Alındı 20 Şubat 2018.
  24. ^ "Cambridge Semantics, Amazon Neptune ve Grafik Veritabanları için AnzoGraph Desteğini Duyurdu". Veritabanı Trendleri ve Uygulamaları. 2018-02-15. Alındı 2018-03-08.
  25. ^ Woodie, Alex (21 Haziran 2016). "Titan'ın Ötesinde: DataStax'ın Yeni Grafik Veritabanının Evrimi". Datanami. Alındı 9 Mayıs 2017.
  26. ^ "JanusGraph sürüm 0.5.2". 3 Mayıs 2020 - Github aracılığıyla.
  27. ^ "JanusGraph depolama arka uçları". Arşivlenen orijinal 2018-10-02 tarihinde. Alındı 2018-10-01.
  28. ^ "JanusGraph dizin depoları". Arşivlenen orijinal 2018-10-02 tarihinde. Alındı 2018-10-01.
  29. ^ "SQL Server 2017'deki Yenilikler". Microsoft Docs. Nisan 19, 2017. Alındı 9 Mayıs 2017.
  30. ^ "Büyük Veri Analitiği Keşfi için Nebula Grafiği Başladı". Datanami. 29 Haziran 2020. Alındı 2 Aralık 2020.
  31. ^ "Sürüm Notları: Neo4j 4.2.1". Neo4j Grafik Veritabanı Platformu. Alındı 2020-11-26.
  32. ^ "Virtüöz için Kümeleme Dağıtım Mimarisi Diyagramları". Virtüöz Açık Kaynak Wiki. OpenLink Yazılımı. Alındı 9 Mayıs 2017.
  33. ^ Ewbank, Key. "RedisGraph Genel Kullanılabilirliğe Ulaşıyor". i-programmer.info.
  34. ^ "SAP HANA 2.0 SPS 05'teki Yenilikler". Ürün Bilgisi. Alındı 2020-06-26.
  35. ^ Rudolf, Michael; Paradies, Marcus; Bornhövd, Christof; Lehner, Wolfgang. SAP HANA Veritabanının Grafik Hikayesi (PDF). Bilişimde Ders Notları.
  36. ^ Vanian, Jonathan (18 Şubat 2015). "NSA bağlantılı Sqrrl siber güvenliğe bakıyor ve 7 milyon dolarlık finansman sağlıyor". Gigaom. Alındı 9 Mayıs 2017.
  37. ^ Woodie, Alex (23 Ekim 2015). "Analitik Sanatı veya Yeşil Saçlı İnsanların Bize Öğretebilecekleri". Datanami. Alındı 9 Mayıs 2017.
  38. ^ Svensson, Johan (5 Temmuz 2016). "Konuk Görünümü: İlişkisel ve grafik veritabanları: Hangisi ve ne zaman kullanılmalı?". San Diego Times. BZ Media. Alındı 30 Ağustos 2016.
  39. ^ TinkerPop, Apache. "Apache TinkerPop". Apache TinkerPop. Alındı 2016-11-02.