Veri tabanı - Database

Bir SQL select ifadesi ve sonucu.

Bir veri tabanı organize bir koleksiyondur veri, genellikle bir bilgisayar sisteminden elektronik olarak depolanır ve erişilir. Veritabanlarının daha karmaşık olduğu yerlerde, genellikle resmi yöntemlerle geliştirilirler. tasarım ve modelleme teknikleri.

veritabanı Yönetim sistemi (DBMS), yazılım ile etkileşime giren son kullanıcılar verileri yakalamak ve analiz etmek için uygulamalar ve veritabanının kendisi. DBMS yazılımı ayrıca veritabanını yönetmek için sağlanan temel özellikleri de kapsar. Veritabanının, DBMS'nin ve ilgili uygulamaların toplamı bir "veritabanı sistemi" olarak adlandırılabilir. Çoğunlukla "veritabanı" terimi, herhangi bir DBMS'ye, veritabanı sistemine veya veritabanıyla ilişkili bir uygulamaya gevşek bir şekilde atıfta bulunmak için de kullanılır.

Bilgisayar bilimcileri, veritabanı yönetim sistemlerini aşağıdaki özelliklere göre sınıflandırabilir: veritabanı modelleri desteklediklerini. İlişkisel veritabanları 1980'lerde egemen oldu. Bu model verileri satırlar ve sütunlar bir dizi tablolar ve büyük çoğunluğu SQL veri yazmak ve sorgulamak için. 2000'lerde, ilişkisel olmayan veritabanları popüler hale geldi. NoSQL çünkü farklı kullanıyorlar sorgu dilleri.

Terminoloji ve genel bakış

Resmi olarak, bir "veritabanı", bir dizi ilgili veriye ve bunların organize edilme şekline atıfta bulunur. Bu verilere erişim genellikle bir "veritabanı yönetim sistemi" (DBMS) tarafından sağlanır. kullanıcılar bir veya daha fazla veri tabanı ile etkileşim ve veri tabanında bulunan tüm verilere erişim sağlar (belirli verilere erişimi sınırlayan kısıtlamalar mevcut olabilir). DBMS, büyük miktarda bilginin girişine, depolanmasına ve alınmasına izin veren çeşitli işlevler sağlar ve bu bilgilerin nasıl organize edildiğini yönetmenin yollarını sağlar.

Aralarındaki yakın ilişki nedeniyle, "veritabanı" terimi genellikle hem bir veritabanına hem de onu işlemek için kullanılan DBMS'ye atıfta bulunmak için rasgele kullanılır.

Profesyonel dünyasının dışında Bilişim teknolojisi, dönem veri tabanı genellikle ilgili verilerin herhangi bir koleksiyonuna atıfta bulunmak için kullanılır (örneğin hesap tablosu veya bir kart dizini) boyut ve kullanım gereksinimleri tipik olarak bir veritabanı yönetim sisteminin kullanılmasını gerektirir.[1]

Mevcut DBMS'ler, bir veri tabanının ve verilerinin dört ana fonksiyonel gruba ayrılabilen yönetimine izin veren çeşitli işlevler sağlar:

  • Veri tanımı - Verilerin organizasyonunu tanımlayan tanımların oluşturulması, değiştirilmesi ve kaldırılması.
  • Güncelleme - Gerçek verilerin eklenmesi, değiştirilmesi ve silinmesi.[2]
  • Erişim - Bilgileri doğrudan kullanılabilir bir biçimde veya diğer uygulamalar tarafından daha fazla işlenmek üzere sağlamak. Geri alınan veriler, temelde veri tabanında depolananla aynı bir biçimde veya veri tabanından mevcut verilerin değiştirilmesi veya birleştirilmesiyle elde edilen yeni bir biçimde kullanılabilir hale getirilebilir.[3]
  • Yönetim - Kullanıcıların kaydedilmesi ve izlenmesi, veri güvenliğinin sağlanması, performansın izlenmesi, veri bütünlüğünün sürdürülmesi, eşzamanlılık kontrolünün ele alınması ve beklenmedik bir sistem arızası gibi bazı olaylarla bozulmuş bilgilerin kurtarılması.[4]

Hem bir veritabanı hem de DBMS, belirli bir veri tabanının ilkelerine uygundur. veritabanı modeli.[5] "Veritabanı sistemi" toplu olarak veritabanı modeli, veritabanı yönetim sistemi ve veritabanı anlamına gelir.[6]

Fiziksel olarak veritabanı sunucular gerçek veritabanlarını tutan ve yalnızca DBMS ve ilgili yazılımları çalıştıran özel bilgisayarlardır. Veritabanı sunucuları genellikle çok işlemcili cömert belleğe sahip bilgisayarlar ve RAID kararlı depolama için kullanılan disk dizileri. Yüksek hızlı bir kanal aracılığıyla bir veya daha fazla sunucuya bağlanan donanım veritabanı hızlandırıcıları da büyük hacimli işlem işleme ortamlarında kullanılır. DBMS'ler çoğunun kalbinde bulunur veritabanı uygulamaları. DBMS'ler özel bir çoklu görev çekirdek yerleşik ağ oluşturma destek, ancak modern DBMS'ler genellikle bir standart işletim sistemi bu işlevleri sağlamak için.[kaynak belirtilmeli ]

DBMS'ler önemli bir Market, bilgisayar ve depolama satıcıları genellikle kendi geliştirme planlarında DBMS gereksinimlerini dikkate alır.[7]

Veritabanları ve DBMS'ler, destekledikleri veritabanı modellerine (ilişkisel veya XML gibi), üzerinde çalıştıkları bilgisayarın türlerine (bir sunucu kümesinden bir cep telefonuna) göre kategorize edilebilir. sorgu dili veritabanına erişmek için kullanılan (SQL veya XQuery ) ve performansı etkileyen iç mühendisliği, ölçeklenebilirlik dayanıklılık ve güvenlik.

Tarih

Veritabanlarının boyutları, yetenekleri ve performansı ve ilgili DBMS'ler büyüklük sırasına göre artmıştır. Bu performans artışları, aşağıdaki alanlarda teknolojik ilerleme ile sağlanmıştır. işlemciler, bilgisayar hafızası, bilgisayar deposu, ve bilgisayar ağları. Veri tabanı kavramı, 1960'ların ortalarında yaygın olarak bulunan manyetik diskler gibi doğrudan erişimli depolama ortamlarının ortaya çıkmasıyla mümkün olmuştur; önceki sistemler, verilerin manyetik bantta sıralı olarak depolanmasına dayanıyordu. Veri tabanı teknolojisinin sonraki gelişimi, veri modeli veya yapısına göre üç döneme ayrılabilir: seyir,[8] SQL /ilişkisel ve ilişki sonrası.

İki ana erken navigasyon veri modeli, hiyerarşik model ve KODASİL model (ağ modeli ). Bunlar, bir kayıttan diğerine olan ilişkileri izlemek için işaretçilerin (genellikle fiziksel disk adresleri) kullanılmasıyla karakterize edildi.

ilişkisel model, ilk olarak 1970 yılında Edgar F. Codd, uygulamaların bağlantıları takip etmek yerine içeriğe göre veri araması gerektiğini söyleyerek bu gelenekten ayrıldı. İlişkisel model, her biri farklı bir varlık türü için kullanılan genel muhasebe tarzı tablo kümeleri kullanır. Yalnızca 1980'lerin ortalarında bilgi işlem donanımı, ilişkisel sistemlerin (DBMS'ler artı uygulamalar) geniş çapta konuşlandırılmasına izin verecek kadar güçlü hale geldi. Bununla birlikte, 1990'ların başlarında, ilişkisel sistemler tüm büyük ölçekli veri işleme uygulamalar ve 2018 itibariyle baskın kalırlar: IBM DB2, Oracle, MySQL, ve Microsoft SQL Sunucusu en çok arananlar DBMS.[9] İlişkisel model için standartlaştırılmış SQL olan baskın veritabanı dili, diğer veri modelleri için veritabanı dillerini etkilemiştir.[kaynak belirtilmeli ]

Nesne veritabanları 1980'lerde rahatsızlıkların üstesinden gelmek için geliştirilmiştir. nesne-ilişkisel empedans uyumsuzluğu "ilişkisel sonrası" teriminin ortaya çıkmasına ve ayrıca melez nesne ilişkisel veritabanları.

2000'lerin sonlarında yeni nesil post-ilişkisel veritabanları, NoSQL veritabanları, hızlı tanıtım anahtar-değer mağazaları ve belge odaklı veritabanları. Rakip bir "gelecek nesil" olarak bilinen NewSQL veritabanları, ticari olarak mevcut ilişkisel DBMS'lere kıyasla NoSQL'in yüksek performansını eşleştirmeyi hedeflerken ilişkisel / SQL modelini koruyan yeni uygulamalar denedi.

1960'lar, gezinme DBMS

Navigasyonun temel yapısı KODASİL veritabanı modeli

Terimin tanıtımı veri tabanı 1960'ların ortalarından itibaren doğrudan erişimli depolamanın (diskler ve tamburlar) mevcudiyetiyle aynı zamana denk geldi. Terim, geçmişin teyp tabanlı sistemleriyle bir karşıtlığı temsil ediyor ve günlük kullanımdan ziyade paylaşılan etkileşimli kullanıma izin veriyor toplu işlem. Oxford ingilizce sözlük "veri tabanı" terimini spesifik bir teknik anlamda ilk kullanan California System Development Corporation tarafından 1962 tarihli bir rapora atıfta bulunur.[10]

Bilgisayarların hızı ve kapasitesi arttıkça, bir dizi genel amaçlı veritabanı sistemi ortaya çıktı; 1960'ların ortalarında, bu tür bir dizi sistem ticari kullanıma girmişti. Bir standarda olan ilgi artmaya başladı ve Charles Bachman, böyle bir ürünün yazarı, Entegre Veri Deposu (IDS), bünyesinde Veritabanı Görev Grubunu kurdu. KODASİL oluşturulması ve standardizasyonundan sorumlu grup COBOL. 1971'de Veritabanı Görev Grubu, genel olarak bilinen hale gelen standartlarını sundu. CODASYL yaklaşımıve çok geçmeden bu yaklaşıma dayalı bir dizi ticari ürün pazara girdi.

CODASYL yaklaşımı, uygulamalara büyük bir ağda oluşturulmuş bağlantılı bir veri kümesi etrafında gezinme yeteneği sundu. Uygulamalar kayıtları aşağıdaki üç yöntemden biriyle bulabilir:

  1. Birincil anahtarın kullanımı (CALC anahtarı olarak bilinir, genellikle hashing )
  2. İlişkilerde gezinme (denir setleri) bir kayıttan diğerine
  3. Tüm kayıtları sıralı bir sırayla tarama

Daha sonra sistemler eklendi B ağaçları alternatif erişim yolları sağlamak için. Birçok CODASYL veritabanı, son kullanıcılar için bildirim temelli bir sorgu dili de ekledi (navigasyon API'sinden farklı olarak). Ancak CODASYL veritabanları karmaşıktı ve faydalı uygulamalar üretmek için önemli eğitim ve çaba gerektiriyordu.

IBM ayrıca 1966'da kendi DBMS'lerine sahipti. Bilgi Yönetim Sistemi (IMS). IMS, aşağıdakiler için yazılmış bir yazılım geliştirmesiydi: Apollo programı üzerinde Sistem / 360. IMS genel olarak konsept olarak CODASYL'e benziyordu, ancak CODASYL'in ağ modeli yerine veri gezinme modeli için katı bir hiyerarşi kullandı. Her iki kavram daha sonra verilere erişilme şekli nedeniyle navigasyon veritabanları olarak bilinmeye başladı: terim, Bachman'ın 1973'ü tarafından popüler hale getirildi. Turing Ödülü sunum Navigator olarak Programcı. IMS, IBM tarafından bir hiyerarşik veritabanı. IDMS ve Cincom Sistemleri ' TOPLAM veritabanı ağ veritabanları olarak sınıflandırılır. IMS, 2014 itibariyle kullanımda kalacaktır.[11]

1970'ler, ilişkisel DBMS

Edgar F. Codd IBM'de çalıştı San Jose, Kaliforniya, öncelikli olarak geliştirilmesinde yer alan yan ofislerinden birinde hard disk sistemleri. CODASYL yaklaşımının seyrüsefer modelinden, özellikle de bir "arama" tesisinin olmamasından memnun değildi. 1970 yılında, veritabanı inşasına yeni bir yaklaşımın ana hatlarını çizen ve sonunda çığır açan bir sonuçla sonuçlanan bir dizi makale yazdı. Büyük Paylaşılan Veri Bankaları için İlişkisel Veri Modeli.[12]

Bu yazıda, büyük veritabanlarını depolamak ve bunlarla çalışmak için yeni bir sistem tanımladı. Kayıtların bir tür bağlantılı liste CODASYL'de olduğu gibi serbest biçimli kayıtlar arasında, Codd'un fikri verileri bir dizi "tablolar ", her tablo farklı türde bir varlık için kullanılıyor. Her tablo, varlığın niteliklerini içeren sabit sayıda sütun içerir. Her tablonun bir veya daha fazla sütunu bir birincil anahtar tablonun satırlarının benzersiz bir şekilde tanımlanabilmesi için; Tablolar arasındaki çapraz referanslar her zaman disk adresleri yerine bu birincil anahtarları kullanırdı ve sorgular, bu anahtar ilişkilere dayalı olarak tabloları birleştirir, matematiksel sisteme dayalı bir işlem kümesi kullanır. ilişkisel hesap (modelin adını aldığı). Verileri bir dizi normalleştirilmiş tabloya (veya ilişkiler) her "olgunun" yalnızca bir kez kaydedilmesini sağlamayı amaçlayarak güncelleme işlemlerini basitleştirdi. Sanal tablolar denir Görüntüleme verileri farklı kullanıcılar için farklı şekillerde sunabilir, ancak görünümler doğrudan güncellenemez.

Codd, modeli tanımlamak için matematiksel terimler kullandı: tablolar, satırlar ve sütunlar yerine ilişkiler, demetler ve alanlar. Artık tanıdık olan terminoloji, erken uygulamalardan geldi. Codd daha sonra pratik uygulamaların modelin dayandığı matematiksel temellerden sapma eğilimini eleştirecekti.

İçinde ilişkisel model kayıtlar, veritabanında saklanmayan ancak kayıtlarda bulunan veriler arasında gerektiği gibi tanımlanan sanal anahtarlar kullanılarak "bağlanır".

Disk adreslerinden ziyade tablolar arası ilişkileri temsil etmek için birincil anahtarların (kullanıcı odaklı tanımlayıcılar) kullanımının iki temel amacı vardı. Mühendislik perspektifinden bakıldığında, pahalı veritabanı yeniden düzenlemesi olmadan tabloların yeniden konumlandırılmasını ve yeniden boyutlandırılmasını sağladı. Ancak Codd, anlambilimdeki farkla daha çok ilgilendi: açık tanımlayıcıların kullanılması, güncelleme işlemlerinin temiz matematiksel tanımlarla tanımlanmasını kolaylaştırdı ve ayrıca, sorgu işlemlerinin yerleşik birinci dereceden yüklem hesabı disiplini açısından tanımlanmasını sağladı; Bu işlemlerin temiz matematiksel özellikleri olduğundan, sorguları kanıtlanabilir şekilde doğru yollarla yeniden yazmak mümkün hale gelir, bu da sorgu optimizasyonunun temelini oluşturur. Tablolar arasındaki bağlantılar artık çok açık olmasa da, hiyerarşik veya ağ modelleriyle karşılaştırıldığında ifade gücü kaybı yoktur.

Hiyerarşik ve ağ modellerinde, kayıtların karmaşık bir iç yapıya sahip olmasına izin verildi. Örneğin, bir çalışanın maaş geçmişi, çalışan kaydı içinde bir "tekrar eden grup" olarak temsil edilebilir. İlişkisel modelde, normalleştirme süreci, bu tür iç yapıların, yalnızca mantıksal anahtarlarla birbirine bağlanan çoklu tablolarda tutulan verilerle değiştirilmesine yol açtı.

Örneğin, bir veritabanı sisteminin yaygın bir kullanımı, kullanıcılar hakkındaki bilgileri, adlarını, oturum açma bilgilerini, çeşitli adresleri ve telefon numaralarını izlemektir. Seyir yaklaşımında, tüm bu veriler tek bir değişken uzunluklu kayda yerleştirilecektir. İlişkisel yaklaşımda veriler, normalleştirilmiş bir kullanıcı tablosuna, bir adres tablosuna ve bir telefon numarası tablosuna (örneğin). Kayıtlar, bu isteğe bağlı tablolarda yalnızca adres veya telefon numaraları gerçekten sağlanmışsa oluşturulur.

Disk adresleri yerine mantıksal tanımlayıcılar kullanarak satırları / kayıtları tanımlamanın yanı sıra Codd, uygulamaların birden çok kayıttan veri toplama yöntemini değiştirdi. Uygulamaların bağlantılarda gezinerek her seferinde bir kayıt veri toplamasını zorunlu kılmak yerine, bulunması gereken erişim yolu yerine hangi verilerin gerekli olduğunu ifade eden bildirim temelli bir sorgu dili kullanırlar. Verilere verimli bir erişim yolu bulmak, uygulama programcısının değil veritabanı yönetim sisteminin sorumluluğu haline geldi. Sorgu optimizasyonu olarak adlandırılan bu süreç, sorguların matematiksel mantık açısından ifade edildiği gerçeğine bağlıydı.

Codd'un makalesi Berkeley'den Eugene Wong ve Michael Stonebraker. Olarak bilinen bir proje başlattılar İÇERİKLER Coğrafi veritabanı projesi ve öğrenci programcılarının kod üretmesi için zaten ayrılmış olan finansmanı kullanmak. 1973'ten başlayarak, INGRES, genel olarak 1979'da yaygın kullanıma hazır olan ilk test ürünlerini teslim etti. INGRES, Sistem R için bir "dil" kullanımı da dahil olmak üzere çeşitli şekillerde veri erişimi, olarak bilinir QUEL. Zamanla, INGRES yeni ortaya çıkan SQL standardına geçti.

IBM, ilişkisel modelin bir test uygulamasını gerçekleştirdi, PRTV ve bir üretim olanı, İş Sistemi 12, ikisi de artık üretilmiyor. Honeywell yazdı MRDS için Multics ve şimdi iki yeni uygulama var: Alphora Dataphor ve Rel. Diğer çoğu DBMS uygulaması genellikle ilişkisel aslında SQL DBMS'leridir.

1970 yılında, Michigan Üniversitesi, MICRO Bilgi Yönetim Sistemi[13] dayalı D.L. Childs Küme-Teorik Veri modeli.[14][15][16] MICRO, çok büyük veri setlerini yönetmek için kullanıldı. ABD Çalışma Bakanlığı, ABD Çevre Koruma Ajansı ve araştırmacılar Alberta Üniversitesi, Michigan üniversitesi, ve Wayne Eyalet Üniversitesi. IBM ana bilgisayar bilgisayarlarında, Michigan Terminal Sistemi.[17] Sistem 1998 yılına kadar üretimde kaldı.

Entegre bir yaklaşım

1970'lerde ve 1980'lerde, entegre donanım ve yazılım ile veritabanı sistemleri oluşturma girişimleri yapıldı. Temel felsefe, böyle bir entegrasyonun daha düşük bir maliyetle daha yüksek performans sağlayacağıydı. Örnekler IBM'di Sistem / 38 erken teklif Teradata, ve Britton Lee, Inc. veritabanı makinesi.

Veritabanı yönetimi için donanım desteğine yönelik başka bir yaklaşım, ICL 's CAFS hızlandırıcı, programlanabilir arama yeteneklerine sahip bir donanım disk denetleyicisi. Uzun vadede, bu çabalar genellikle başarısız oldu çünkü özel veritabanı makineleri, genel amaçlı bilgisayarların hızlı gelişimine ve ilerlemesine ayak uyduramadı. Bu nedenle, günümüzde çoğu veritabanı sistemi, genel amaçlı bilgisayar veri depolamasını kullanan, genel amaçlı donanım üzerinde çalışan yazılım sistemleridir. Bununla birlikte, bu fikir, bazı şirketler tarafından belirli uygulamalar için hala takip edilmektedir. Netezza ve Oracle (Exadata ).

1970'lerin sonunda, SQL DBMS

IBM, Codd'un şu kavramlara dayalı olarak gevşek bir şekilde bir prototip sistemi üzerinde çalışmaya başladı: Sistem R 1970'lerin başında. İlk sürüm 1974 / 5'te hazırdı ve daha sonra, verilerin bölünebileceği çok masalı sistemlerde çalışmaya başlandı, böylece bir kayıt için tüm verilerin (bazıları isteğe bağlı) bir kayıtta depolanması gerekmedi. tek büyük "yığın". Sonraki çok kullanıcılı sürümler, müşteriler tarafından 1978 ve 1979'da test edildi ve bu süre zarfında standartlaştırıldı sorgu dili - SQL[kaynak belirtilmeli ] - eklendi. Codd'un fikirleri, kendilerini hem uygulanabilir hem de CODASYL'den daha üstün olarak kuruyor ve IBM'i System R'nin gerçek bir üretim sürümünü geliştirmeye itiyordu. SQL / DS, ve sonra, Veritabanı 2 (DB2 ).

Larry Ellison Oracle Database (veya daha basitçe, Oracle ) IBM'in System R konusundaki makalelerine dayanarak farklı bir zincirden başladı. Oracle V1 uygulamaları 1978'de tamamlanmış olsa da, Ellison IBM'i 1979'da pazara sunarken Oracle Versiyon 2'ye kadar değildi.[18]

Stonebraker, şimdi olarak bilinen yeni bir veritabanı olan Postgres geliştirmek için INGRES'ten alınan dersleri uygulamaya devam etti. PostgreSQL. PostgreSQL genellikle küresel görev açısından kritik uygulamalar için kullanılır (.org ve .info alan adı kayıtları, bunu birincil Bilgi deposu birçok büyük şirket ve finans kuruluşu gibi).

İsveç'te Codd'un makalesi de okundu ve Mimer SQL 1970'lerin ortalarından itibaren geliştirildi Uppsala Üniversitesi. 1984 yılında bu proje bağımsız bir kuruluş olarak konsolide edildi.

Başka bir veri modeli, varlık-ilişki modeli, 1976'da ortaya çıktı ve popülerlik kazandı veri tabanı tasarımı daha önceki ilişkisel modelden daha tanıdık bir tanımlamayı vurguladığı için. Daha sonra, varlık-ilişki yapıları bir veri modelleme İlişkisel model için inşa edildiğinde ikisi arasındaki fark önemsiz hale geldi.[kaynak belirtilmeli ]

1980'ler, masaüstünde

1980'ler çağını başlattı masaüstü bilgi işlem. Yeni bilgisayarlar, kullanıcılarını aşağıdaki gibi elektronik tablolarla güçlendirdi Lotus 1-2-3 ve veritabanı yazılımı gibi dBASE. DBASE ürünü hafifti ve herhangi bir bilgisayar kullanıcısının kutudan çıktığı anda anlaması kolaydı. C. Wayne Ratliff, dBASE'nin yaratıcısı, "dBASE, BASIC, C, FORTRAN ve COBOL gibi programlardan farklıydı çünkü kirli işlerin çoğu zaten yapılmıştı. Veri işleme, kullanıcı tarafından değil dBASE tarafından yapılır, bu nedenle kullanıcı, dosyaları açma, okuma ve kapatma ve alan tahsisini yönetme gibi kirli ayrıntılarla uğraşmak yerine ne yaptığına konsantre olabilir. "[19] dBASE, 1980'lerde ve 1990'ların başında en çok satan yazılımlardan biriydi.

1990'lar, nesne yönelimli

1990'larda yükselişle birlikte nesne yönelimli programlama, çeşitli veritabanlarındaki verilerin işlenme biçiminde bir büyüme gördü. Programcılar ve tasarımcılar, veritabanlarındaki verileri şu şekilde ele almaya başladı nesneler. Diğer bir deyişle, bir kişinin verileri bir veritabanındaysa, o kişinin adresi, telefon numarası ve yaşı gibi özellikleri artık gereksiz veriler yerine o kişiye ait olarak kabul edildi. Bu, veriler arasındaki ilişkilerin nesnelerle ilişki olmasına ve bunların Öznitellikler ve tek tek alanlara değil.[20] Dönem "nesne-ilişkisel empedans uyumsuzluğu "programlanmış nesneler ve veritabanı tabloları arasında çeviri yapmanın rahatsızlığını anlattı. Nesne veritabanları ve nesne ilişkisel veritabanları programcıların tamamen ilişkisel SQL'e alternatif olarak kullanabilecekleri nesne yönelimli bir dil (bazen SQL'in uzantıları olarak) sağlayarak bu sorunu çözmeye çalışın. Programlama tarafında, kütüphaneler olarak bilinen nesne ilişkisel eşlemeler (ORM'ler) aynı sorunu çözmeye çalışır.

2000'ler, NoSQL ve NewSQL

XML veritabanları temel alan sorgulamaya izin veren yapılandırılmış belge odaklı bir veritabanı türüdür. XML belge nitelikleri. XML veritabanları çoğunlukla, verilerin çok esnek olandan oldukça katı olana kadar değişebilen bir yapıya sahip bir belge koleksiyonu olarak görüldüğü uygulamalarda kullanılır: Örnekler arasında bilimsel makaleler, patentler, vergi beyannameleri ve personel kayıtları yer alır.

NoSQL veritabanları genellikle çok hızlıdır, sabit tablo şemaları gerektirmez, depolayarak birleştirme işlemlerinden kaçının normal olmayan verilerdir ve yatay ölçek.

Son yıllarda, yüksek bölüm toleransına sahip kitlesel olarak dağıtılmış veritabanları için güçlü bir talep olmuştur, ancak CAP teoremi için imkansız dağıtımlı sistem aynı anda sağlamak tutarlılık, kullanılabilirlik ve bölüm toleransı garantileri. Dağıtılmış bir sistem, bu garantilerden herhangi ikisini aynı anda karşılayabilir, ancak üçünü birden karşılayamaz. Bu nedenle, birçok NoSQL veritabanı, nihai tutarlılık hem kullanılabilirlik hem de bölüm toleransı garantileri sağlamak için daha düşük düzeyde veri tutarlılığı sağlar.

NewSQL SQL kullanırken ve hala SQL kullanırken çevrimiçi işlem işleme (okuma-yazma) iş yükleri için aynı ölçeklenebilir NoSQL sistemlerinin performansını sağlamayı amaçlayan modern ilişkisel veritabanları sınıfıdır. ASİT geleneksel bir veritabanı sisteminin garantileri.

Kullanım durumları

Veritabanları, kuruluşların dahili işlemlerini desteklemek ve müşteriler ve tedarikçilerle çevrimiçi etkileşimlerin temelini oluşturmak için kullanılır (bkz. Kurumsal yazılım ).

Veritabanları, idari bilgileri ve mühendislik verileri veya ekonomik modeller gibi daha özel verileri tutmak için kullanılır. Örnekler arasında bilgisayarlı kütüphane sistemler uçuş rezervasyon sistemleri, bilgisayarlı parça envanter sistemleri ve birçok içerik yönetim sistemleri o mağaza web siteleri bir veritabanındaki web sayfalarının koleksiyonları olarak.

Sınıflandırma

Veritabanlarını sınıflandırmanın bir yolu, içeriklerinin türünü içerir, örneğin: bibliyografik, belge metni, istatistiksel veya multimedya nesneleri. Başka bir yol, uygulama alanlarına göre, örneğin: muhasebe, müzik besteleri, filmler, bankacılık, üretim veya sigorta. Üçüncü bir yol, veritabanı yapısı veya arayüz tipi gibi bazı teknik yönler gereğidir. Bu bölüm, farklı türden veritabanlarını karakterize etmek için kullanılan sıfatlardan birkaçını listeler.

  • Bir bellek içi veritabanı öncelikle içinde bulunan bir veritabanıdır ana hafıza, ancak genellikle geçici olmayan bilgisayar veri depolamasıyla yedeklenir. Ana bellek veritabanları disk veritabanlarından daha hızlıdır ve bu nedenle genellikle telekomünikasyon ağ ekipmanı gibi yanıt süresinin kritik olduğu yerlerde kullanılır.
  • Bir aktif veritabanı veritabanı içindeki ve dışındaki koşullara yanıt verebilen olay güdümlü bir mimari içerir. Olası kullanımlar güvenlik izleme, uyarı, istatistik toplama ve yetkilendirmeyi içerir. Birçok veritabanı, şu şekilde aktif veritabanı özellikleri sağlar: veritabanı tetikleyicileri.
  • Bir bulut veritabanı güveniyor bulut teknolojisi. Hem veritabanı hem de DBMS'lerinin çoğu uzaktan "bulutta" bulunurken, uygulamaları hem programcılar tarafından geliştirilir hem de daha sonra son kullanıcılar tarafından bir internet tarayıcısı ve Açık API'ler.
  • Veri depoları Operasyonel veritabanlarından ve genellikle pazar araştırma firmaları gibi dış kaynaklardan gelen verileri arşivleyin. Ambar, yöneticiler ve operasyonel verilere erişimi olmayan diğer son kullanıcılar tarafından kullanılmak üzere merkezi veri kaynağı haline gelir. Örneğin, satış verileri haftalık toplamlara toplanabilir ve dahili ürün kodlarından kullanılmak üzere dönüştürülebilir. UPC'ler böylece karşılaştırılabilirler ACNielsen veri. Veri ambarının bazı temel ve önemli bileşenleri arasında ayıklama, analiz etme ve madencilik veriler, verilerin dönüştürülmesi, yüklenmesi ve daha sonra kullanıma hazır hale getirilmesi için yönetilmesi.
  • Bir tümdengelimli veritabanı birleştirir mantık programlama ilişkisel bir veritabanı ile.
  • Bir dağıtılmış veritabanı hem verilerin hem de DBMS'nin birden çok bilgisayarı kapsadığı bir bilgisayardır.
  • Bir belge odaklı veritabanı belge odaklı veya yarı yapılandırılmış bilgileri depolamak, almak ve yönetmek için tasarlanmıştır. Belge odaklı veritabanları, NoSQL veritabanlarının ana kategorilerinden biridir.
  • Bir gömülü veritabanı sistem, DBMS'nin uygulamanın son kullanıcılarından gizleneceği ve çok az veya hiç sürekli bakım gerektirmeyecek şekilde depolanan verilere erişim gerektiren bir uygulama yazılımı ile sıkı bir şekilde entegre edilmiş bir DBMS'dir.[21]
  • Son kullanıcı veritabanları, bireysel son kullanıcılar tarafından geliştirilen verilerden oluşur. Bunlara örnek olarak belge koleksiyonları, elektronik tablolar, sunumlar, multimedya ve diğer dosyalar verilebilir. Bu tür veritabanlarını desteklemek için çeşitli ürünler mevcuttur. Bazıları, daha temel DBMS işlevselliğine sahip, tam teşekküllü DBMS'lerden çok daha basittir.
  • Bir birleşik veritabanı sistemi her biri kendi DBMS'sine sahip birkaç farklı veritabanı içerir. Muhtemelen farklı türlerdeki birden çok özerk DBMS'yi şeffaf bir şekilde bütünleştiren birleşik bir veritabanı yönetim sistemi (FDBMS) tarafından tek bir veritabanı olarak ele alınır (bu durumda aynı zamanda bir heterojen veritabanı sistemi ) ve onlara entegre bir kavramsal görünüm sağlar.
  • Bazen terim çoklu veritabanı tek bir uygulamada işbirliği yapan daha az entegre (örneğin, bir FDBMS ve yönetilen entegre şema olmadan) bir veritabanı grubuna atıfta bulunabilmesine rağmen, federe veritabanıyla eşanlamlı olarak kullanılır. Bu durumda, tipik olarak ara yazılım dağıtım için kullanılır, bu tipik olarak bir atomik tamamlama protokolü (ACP) içerir, örn. iki aşamalı tamamlama protokolü, izin vermek dağıtılmış (global) işlemler katılan veritabanları arasında.
  • Bir grafik veritabanı bir tür NoSQL veritabanıdır. grafik yapıları bilgileri temsil etmek ve depolamak için düğümler, kenarlar ve özellikler. Herhangi bir grafiği saklayabilen genel grafik veritabanları, aşağıdakiler gibi özelleştirilmiş grafik veritabanlarından farklıdır: Üçlü dükkanlar ve ağ veritabanları.
  • Bir dizi DBMS çok boyutlu (genellikle büyük) modelleme, depolama ve geri çağırmaya izin veren bir tür NoSQL DBMS diziler uydu görüntüleri ve iklim simülasyon çıktısı gibi.
  • İçinde köprü metni veya hiper medya veritabanı, bir nesneyi temsil eden herhangi bir kelime veya metin parçası, örneğin başka bir metin parçası, bir makale, bir resim veya bir film olabilir. köprülü o nesneye. Köprü metni veritabanları, büyük miktarlarda farklı bilgilerin düzenlenmesi için özellikle yararlıdır. Örneğin, organize etmek için kullanışlıdırlar çevrimiçi ansiklopediler, kullanıcıların metin içinde rahatça atlayabilecekleri yer. Dünya çapında Ağ bu nedenle büyük bir dağıtılmış hiper metin veritabanıdır.
  • Bir bilgi tabanı (kısaltılmış KB, kb veya Δ[22][23]) için özel bir veritabanı türüdür bilgi Yönetimi, bilgisayarlı toplama, organizasyon ve geri alma nın-nin bilgi. Ayrıca çözümleri ve ilgili deneyimleriyle ilgili sorunları temsil eden bir veri koleksiyonu.
  • Bir mobil veritabanı bir mobil bilgi işlem cihazında taşınabilir veya senkronize edilebilir.
  • Operasyonel veritabanları Bir organizasyonun operasyonları hakkında ayrıntılı verileri depolar. Genellikle görece yüksek hacimde güncellemeleri işlerler. işlemler. Örnekler şunları içerir: müşteri veritabanları Bir işletmenin müşterileri hakkında iletişim, kredi ve demografik bilgileri kaydeden, çalışanlarla ilgili maaş, yan haklar, beceri verileri gibi bilgileri tutan personel veritabanları, kurumsal kaynak planlaması Kuruluşun parasını, muhasebesini ve finansal işlemlerini takip eden ürün bileşenleri, parça envanteri ve finansal veritabanları hakkındaki ayrıntıları kaydeden sistemler.
  • Bir paralel veritabanı aracılığıyla performansı iyileştirmeye çalışır paralelleştirme veri yükleme, dizin oluşturma ve sorguları değerlendirme gibi görevler için.
Altta yatan nedenlerle oluşturulan ana paralel DBMS mimarileri donanım mimari:
  • Paylaşılan bellek mimarisi, birden çok işlemcinin ana bellek alanını ve diğer veri depolamasını paylaştığı yer.
  • Paylaşılan disk mimarisi, burada her işlem birimi (tipik olarak birden çok işlemciden oluşur) kendi ana belleğine sahiptir, ancak tüm birimler diğer depolamayı paylaşır.
  • Mimariyi paylaşmadı, her işlem biriminin kendi ana belleğine ve diğer depolamasına sahip olduğu yer.
  • Olasılıklı veritabanları kullanmak Bulanık mantık kesin olmayan verilerden çıkarımlar yapmak.
  • Gerçek zamanlı veritabanları İşlemleri sonucun hemen geri gelmesi ve hemen harekete geçmesi için yeterince hızlı işleyin.
  • Bir mekansal veritabanı verileri çok boyutlu özelliklerle depolayabilir. Bu tür veriler üzerindeki sorgular, "Bölgemdeki en yakın otel nerede?" Gibi konuma dayalı sorguları içerir.
  • Bir zamansal veritabanı yerleşik zaman yönlerine sahiptir, örneğin bir geçici veri modeli ve bir SQL geçici sürümü. Daha spesifik olarak, zamansal yönler genellikle geçerli zamanı ve işlem zamanını içerir.
  • Bir terminoloji odaklı veritabanı üzerine inşa edilir nesneye yönelik veritabanı, genellikle belirli bir alan için özelleştirilir.
  • Bir yapılandırılmamış veriler veritabanı, ortak veritabanlarına doğal ve uygun bir şekilde uymayan çeşitli nesneleri yönetilebilir ve korumalı bir şekilde depolamak için tasarlanmıştır. E-posta mesajlarını, belgeleri, günlükleri, multimedya nesnelerini vb. İçerebilir. Bazı nesneler oldukça yapılandırılmış olabileceğinden isim yanıltıcı olabilir. Ancak, olası nesne koleksiyonunun tamamı önceden tanımlanmış yapılandırılmış bir çerçeveye uymaz. Yerleşik DBMS'lerin çoğu artık yapılandırılmamış verileri çeşitli şekillerde destekliyor ve yeni özel DBMS'ler ortaya çıkıyor.

Veritabanı etkileşimi

Veritabanı Yönetim sistemi

Connolly ve Begg, veritabanı yönetim sistemini (DBMS) "kullanıcıların veritabanına erişimi tanımlamasını, oluşturmasını, sürdürmesini ve kontrol etmesini sağlayan bir yazılım sistemi" olarak tanımlar.[24] DBMS örnekleri şunları içerir: MySQL, PostgreSQL, MSSQL, Oracle Veritabanı, ve Microsoft Access.

DBMS kısaltması bazen temelini belirtmek için genişletilir veritabanı modeli RDBMS ile ilişkisel, İçin OODBMS nesne odaklı) ve ORDBMS için nesne ilişkisel model. Diğer uzantılar, dağıtılmış veritabanı yönetim sistemleri için DDBMS gibi bazı diğer özellikleri gösterebilir.

Bir DBMS tarafından sağlanan işlevsellik büyük ölçüde değişebilir. Temel işlev, verilerin depolanması, alınması ve güncellenmesidir. Codd tam teşekküllü genel amaçlı bir DBMS'nin sağlaması gereken aşağıdaki işlevleri ve hizmetleri önerdi:[25]

  • Veri depolama, erişim ve güncelleme
  • Meta verileri açıklayan, kullanıcı tarafından erişilebilen katalog veya veri sözlüğü
  • İşlemler ve eşzamanlılık desteği
  • Veritabanının hasar görmesi durumunda kurtarılmasına yönelik olanaklar
  • Verilere erişim ve güncelleme yetkisi desteği
  • Uzak konumlardan desteğe erişin
  • Veritabanındaki verilerin belirli kurallara uymasını sağlamak için kısıtlamalar uygulamak

Genel olarak DBMS'nin, veri tabanını etkili bir şekilde yönetmek için gerekli olabilecek, içe aktarma, dışa aktarma, izleme, birleştirme ve analiz yardımcı programları da dahil olmak üzere bir dizi yardımcı program sağlaması beklenir.[26] Veritabanı ile uygulama arayüzü arasında etkileşim kuran DBMS'nin temel parçası, bazen veritabanı motoru.

Çoğunlukla DBMS'ler, statik ve dinamik olarak ayarlanabilen yapılandırma parametrelerine sahip olacaktır, örneğin veritabanının kullanabileceği bir sunucudaki maksimum ana bellek miktarı. Eğilim, manuel yapılandırma miktarını en aza indirmektir ve aşağıdaki gibi durumlar için gömülü veritabanları Sıfır yönetimi hedefleme ihtiyacı çok önemlidir.

Büyük büyük kurumsal DBMS'lerin boyutu ve işlevselliği artma eğilimindeydi ve ömürleri boyunca binlerce insan yıllık geliştirme çabalarını kapsayabilirdi.[a]

Erken çok kullanıcılı DBMS genellikle yalnızca uygulamanın aynı bilgisayarda bulunmasına ve erişim yoluyla erişilmesine izin verilir terminaller veya terminal öykünme yazılımı. istemci-sunucu mimarisi uygulamanın bir istemci masaüstünde bulunduğu ve bir sunucu üzerindeki veritabanının işlemin dağıtılmasına izin verdiği bir gelişmedir. Bu bir çok katmanlı mimari birleştiren uygulama sunucuları ve web sunucuları son kullanıcı arayüzü ile bir internet tarayıcısı veritabanı yalnızca doğrudan bitişik katmana bağlıyken.[27]

Genel amaçlı bir DBMS halka açık uygulama programlama arayüzleri (API) ve isteğe bağlı olarak bir işlemci veritabanı dilleri gibi SQL uygulamaların veri tabanı ile etkileşime girmesi için yazılmasına izin vermek. Özel amaçlı bir DBMS, özel bir API kullanabilir ve özel olarak özelleştirilebilir ve tek bir uygulamaya bağlanabilir. Örneğin, bir e-posta sistem, mesaj ekleme, mesaj silme, ek işleme, engelleme listesi arama, mesajları bir e-posta adresiyle ilişkilendirme ve benzeri gibi genel amaçlı bir DBMS'nin birçok işlevini gerçekleştirir, ancak bu işlevler e-postayı işlemek için gerekenlerle sınırlıdır.

Uygulama

Veri tabanı ile harici etkileşim, DBMS ile arayüz oluşturan bir uygulama programı aracılığıyla olacaktır.[28] Bu, bir veritabanı aracı Bu, kullanıcıların bilgi depolamak ve aramak için bir veritabanı kullanan bir web sitesinde SQL sorgularını metin veya grafik olarak yürütmesine olanak tanır.

Uygulama programı arayüzü

Bir programcı niyet kodu veritabanıyla etkileşimler (bazen bir veri kaynağı ) aracılığıyla Uygulama programı arayüzü (API) veya bir veritabanı dili. Seçilen belirli API veya dilin, DBMS tarafından, olası bir ön işlemci veya bir köprüleme API'si. Bazı API'lerin amacı veri tabanından bağımsız olmaktır, ODBC yaygın olarak bilinen bir örnek. Diğer yaygın API'ler şunları içerir: JDBC ve ADO.NET.

Veritabanı dilleri

Veritabanı dilleri, aşağıdaki görevlerden birine veya daha fazlasına izin veren ve bazen şu şekilde ayırt edilen özel amaçlı dillerdir alt diller:

  • Veri kontrol dili (DCL) - verilere erişimi kontrol eder;
  • Veri tanımlama dili (DDL) - tablo oluşturma, değiştirme veya bırakma gibi veri türlerini ve bunlar arasındaki ilişkileri tanımlar;
  • Veri işleme dili (DML) - veri oluşumlarını ekleme, güncelleme veya silme gibi görevleri gerçekleştirir;
  • Veri sorgulama dili (DQL) - bilgi aramaya ve türetilmiş bilgilerin hesaplanmasına izin verir.

Veritabanı dilleri, belirli bir veri modeline özgüdür. Önemli örnekler şunları içerir:

A database language may also incorporate features like:

  • DBMS-specific configuration and storage engine management
  • Computations to modify query results, like counting, summing, averaging, sorting, grouping, and cross-referencing
  • Constraint enforcement (e.g. in an automotive database, only allowing one engine type per car)
  • Application programming interface version of the query language, for programmer convenience

Depolama

Database storage is the container of the physical materialization of a database. İçerir (fiziksel) seviye in the database architecture. It also contains all the information needed (e.g., meta veriler, "data about the data", and internal veri yapıları ) to reconstruct the conceptual level ve external level from the internal level when needed. Putting data into permanent storage is generally the responsibility of the veritabanı motoru a.k.a. "storage engine". Though typically accessed by a DBMS through the underlying operating system (and often using the operating systems' dosya sistemleri as intermediates for storage layout), storage properties and configuration setting are extremely important for the efficient operation of the DBMS, and thus are closely maintained by database administrators. A DBMS, while in operation, always has its database residing in several types of storage (e.g., memory and external storage). The database data and the additional needed information, possibly in very large amounts, are coded into bits. Data typically reside in the storage in structures that look completely different from the way the data look in the conceptual and external levels, but in ways that attempt to optimize (the best possible) these levels' reconstruction when needed by users and programs, as well as for computing additional types of needed information from the data (e.g., when querying the database).

Some DBMSs support specifying which karakter kodlaması was used to store data, so multiple encodings can be used in the same database.

Various low-level database storage structures are used by the storage engine to serialize the data model so it can be written to the medium of choice. Techniques such as indexing may be used to improve performance. Conventional storage is row-oriented, but there are also sütun odaklı ve correlation databases.

Gerçekleştirilmiş görünümler

Often storage redundancy is employed to increase performance. A common example is storing somut görünümler, which consist of frequently needed external views or query results. Storing such views saves the expensive computing of them each time they are needed. The downsides of materialized views are the overhead incurred when updating them to keep them synchronized with their original updated database data, and the cost of storage redundancy.

Çoğaltma

Occasionally a database employs storage redundancy by database objects replication (with one or more copies) to increase data availability (both to improve performance of simultaneous multiple end-user accesses to a same database object, and to provide resiliency in a case of partial failure of a distributed database). Updates of a replicated object need to be synchronized across the object copies. In many cases, the entire database is replicated.

Güvenlik

Veritabanı güvenliği deals with all various aspects of protecting the database content, its owners, and its users. It ranges from protection from intentional unauthorized database uses to unintentional database accesses by unauthorized entities (e.g., a person or a computer program).

Database access control deals with controlling who (a person or a certain computer program) is allowed to access what information in the database. The information may comprise specific database objects (e.g., record types, specific records, data structures), certain computations over certain objects (e.g., query types, or specific queries), or using specific access paths to the former (e.g., using specific indexes or other data structures to access information). Database access controls are set by special authorized (by the database owner) personnel that uses dedicated protected security DBMS interfaces.

This may be managed directly on an individual basis, or by the assignment of individuals and ayrıcalıklar to groups, or (in the most elaborate models) through the assignment of individuals and groups to roles which are then granted entitlements. Data security prevents unauthorized users from viewing or updating the database. Using passwords, users are allowed access to the entire database or subsets of it called "subschemas". For example, an employee database can contain all the data about an individual employee, but one group of users may be authorized to view only payroll data, while others are allowed access to only work history and medical data. If the DBMS provides a way to interactively enter and update the database, as well as interrogate it, this capability allows for managing personal databases.

Veri güvenliği in general deals with protecting specific chunks of data, both physically (i.e., from corruption, or destruction, or removal; e.g., see fiziksel güvenlik ), or the interpretation of them, or parts of them to meaningful information (e.g., by looking at the strings of bits that they comprise, concluding specific valid credit-card numbers; e.g., see data encryption ).

Change and access logging records who accessed which attributes, what was changed, and when it was changed. Logging services allow for a forensic veritabanı denetimi later by keeping a record of access occurrences and changes. Sometimes application-level code is used to record changes rather than leaving this to the database. Monitoring can be set up to attempt to detect security breaches.

Transactions and concurrency

Veritabanı işlemleri can be used to introduce some level of hata toleransı ve veri bütünlüğü after recovery from a çökmek. A database transaction is a unit of work, typically encapsulating a number of operations over a database (e.g., reading a database object, writing, acquiring kilit, etc.), an abstraction supported in database and also other systems. Her işlem, hangi program / kod yürütmelerinin o işleme dahil edildiği açısından iyi tanımlanmış sınırlara sahiptir (işlemin programcısı tarafından özel işlem komutları aracılığıyla belirlenir).

Kısaltma ASİT describes some ideal properties of a database transaction: atomicity, tutarlılık, izolasyon, ve dayanıklılık.

Göç

A database built with one DBMS is not portable to another DBMS (i.e., the other DBMS cannot run it). However, in some situations, it is desirable to migrate a database from one DBMS to another. The reasons are primarily economical (different DBMSs may have different total costs of ownership or TCOs), functional, and operational (different DBMSs may have different capabilities). The migration involves the database's transformation from one DBMS type to another. The transformation should maintain (if possible) the database related application (i.e., all related application programs) intact. Thus, the database's conceptual and external architectural levels should be maintained in the transformation. It may be desired that also some aspects of the architecture internal level are maintained. A complex or large database migration may be a complicated and costly (one-time) project by itself, which should be factored into the decision to migrate. This in spite of the fact that tools may exist to help migration between specific DBMSs. Typically, a DBMS vendor provides tools to help importing databases from other popular DBMSs.

Building, maintaining, and tuning

After designing a database for an application, the next stage is building the database. Typically, an appropriate general-purpose DBMS can be selected to be used for this purpose. A DBMS provides the needed Kullanıcı arayüzleri to be used by database administrators to define the needed application's data structures within the DBMS's respective data model. Other user interfaces are used to select needed DBMS parameters (like security related, storage allocation parameters, etc.).

When the database is ready (all its data structures and other needed components are defined), it is typically populated with initial application's data (database initialization, which is typically a distinct project; in many cases using specialized DBMS interfaces that support bulk insertion) before making it operational. In some cases, the database becomes operational while empty of application data, and data are accumulated during its operation.

After the database is created, initialised and populated it needs to be maintained. Various database parameters may need changing and the database may need to be tuned (ayarlama ) for better performance; application's data structures may be changed or added, new related application programs may be written to add to the application's functionality, etc.

Yedekle ve yeniden yükle

Sometimes it is desired to bring a database back to a previous state (for many reasons, e.g., cases when the database is found corrupted due to a software error, or if it has been updated with erroneous data). To achieve this, a backup operation is done occasionally or continuously, where each desired database state (i.e., the values of its data and their embedding in database's data structures) is kept within dedicated backup files (many techniques exist to do this effectively). When it is decided by a database administrator to bring the database back to this state (e.g., by specifying this state by a desired point in time when the database was in this state), these files are used to restore that state.

Statik analiz

Static analysis techniques for software verification can be applied also in the scenario of query languages. In particular, the *Soyut yorumlama framework has been extended to the field of query languages for relational databases as a way to support sound approximation techniques.[32] The semantics of query languages can be tuned according to suitable abstractions of the concrete domain of data. The abstraction of relational database system has many interesting applications, in particular, for security purposes, such as fine grained access control, watermarking, etc.

Miscellaneous features

Other DBMS features might include:

  • Database logs – This helps in keeping a history of the executed functions.
  • Graphics component for producing graphs and charts, especially in a data warehouse system.
  • Query optimizer – Performs query optimization on every query to choose an efficient sorgu planı (a partial order (tree) of operations) to be executed to compute the query result. May be specific to a particular storage engine.
  • Tools or hooks for database design, application programming, application program maintenance, database performance analysis and monitoring, database configuration monitoring, DBMS hardware configuration (a DBMS and related database may span computers, networks, and storage units) and related database mapping (especially for a distributed DBMS), storage allocation and database layout monitoring, storage migration, etc.

Increasingly, there are calls for a single system that incorporates all of these core functionalities into the same build, test, and deployment framework for database management and source control. Borrowing from other developments in the software industry, some market such offerings as "DevOps for database".[33]

Design and modeling

Veritabanı tasarım süreci v2.png

The first task of a database designer is to produce a kavramsal veri modeli that reflects the structure of the information to be held in the database. A common approach to this is to develop an varlık-ilişki modeli, often with the aid of drawing tools. Another popular approach is the Birleştirilmiş Modelleme Dili. A successful data model will accurately reflect the possible state of the external world being modeled: for example, if people can have more than one phone number, it will allow this information to be captured. Designing a good conceptual data model requires a good understanding of the application domain; it typically involves asking deep questions about the things of interest to an organization, like "can a customer also be a supplier?", or "if a product is sold with two different forms of packaging, are those the same product or different products?", or "if a plane flies from New York to Dubai via Frankfurt, is that one flight or two (or maybe even three)?". The answers to these questions establish definitions of the terminology used for entities (customers, products, flights, flight segments) and their relationships and attributes.

Producing the conceptual data model sometimes involves input from iş süreçleri, or the analysis of iş akışı organizasyonda. This can help to establish what information is needed in the database, and what can be left out. For example, it can help when deciding whether the database needs to hold historic data as well as current data.

Having produced a conceptual data model that users are happy with, the next stage is to translate this into a şema that implements the relevant data structures within the database. This process is often called logical database design, and the output is a logical data model expressed in the form of a schema. Whereas the conceptual data model is (in theory at least) independent of the choice of database technology, the logical data model will be expressed in terms of a particular database model supported by the chosen DBMS. (Şartlar veri örneği ve database model are often used interchangeably, but in this article we use veri örneği for the design of a specific database, and database model for the modeling notation used to express that design).

The most popular database model for general-purpose databases is the relational model, or more precisely, the relational model as represented by the SQL language. The process of creating a logical database design using this model uses a methodical approach known as normalleştirme. The goal of normalization is to ensure that each elementary "fact" is only recorded in one place, so that insertions, updates, and deletions automatically maintain consistency.

The final stage of database design is to make the decisions that affect performance, scalability, recovery, security, and the like, which depend on the particular DBMS. Buna genellikle physical database design, and the output is the fiziksel veri modeli. A key goal during this stage is data independence, meaning that the decisions made for performance optimization purposes should be invisible to end-users and applications. There are two types of data independence: Physical data independence and logical data independence. Physical design is driven mainly by performance requirements, and requires a good knowledge of the expected workload and access patterns, and a deep understanding of the features offered by the chosen DBMS.

Another aspect of physical database design is security. It involves both defining giriş kontrolu to database objects as well as defining security levels and methods for the data itself.

Modeller

Collage of five types of database models

A database model is a type of data model that determines the logical structure of a database and fundamentally determines in which manner veri can be stored, organized, and manipulated. The most popular example of a database model is the relational model (or the SQL approximation of relational), which uses a table-based format.

Common logical data models for databases include:

An object-relational database combines the two related structures.

Physical data models Dahil etmek:

Other models include:

Specialized models are optimized for particular types of data:

External, conceptual, and internal views

Traditional view of data[34]

A database management system provides three views of the database data:

  • external level defines how each group of end-users sees the organization of data in the database. A single database can have any number of views at the external level.
  • conceptual level unifies the various external views into a compatible global view.[35] It provides the synthesis of all the external views. It is out of the scope of the various database end-users, and is rather of interest to database application developers and database administrators.
  • internal level (veya physical level) is the internal organization of data inside a DBMS. It is concerned with cost, performance, scalability and other operational matters. It deals with storage layout of the data, using storage structures such as dizinler to enhance performance. Occasionally it stores data of individual views (somut görünümler ), computed from generic data, if performance justification exists for such redundancy. It balances all the external views' performance requirements, possibly conflicting, in an attempt to optimize overall performance across all activities.

While there is typically only one conceptual (or logical) and physical (or internal) view of the data, there can be any number of different external views. This allows users to see database information in a more business-related way rather than from a technical, processing viewpoint. For example, a financial department of a company needs the payment details of all employees as part of the company's expenses, but does not need details about employees that are the interest of the insan kaynakları Bölüm. Thus different departments need different Görüntüleme of the company's database.

The three-level database architecture relates to the concept of data independence which was one of the major initial driving forces of the relational model. The idea is that changes made at a certain level do not affect the view at a higher level. For example, changes in the internal level do not affect application programs written using conceptual level interfaces, which reduces the impact of making physical changes to improve performance.

The conceptual view provides a level of indirection between internal and external. On one hand it provides a common view of the database, independent of different external view structures, and on the other hand it abstracts away details of how the data are stored or managed (internal level). In principle every level, and even every external view, can be presented by a different data model. In practice usually a given DBMS uses the same data model for both the external and the conceptual levels (e.g., relational model). The internal level, which is hidden inside the DBMS and depends on its implementation, requires a different level of detail and uses its own types of data structure types.

Separating the dış, kavramsal ve levels was a major feature of the relational database model implementations that dominate 21st century databases.[35]

Araştırma

Database technology has been an active research topic since the 1960s, both in akademi and in the research and development groups of companies (for example IBM Araştırması ). Research activity includes teori ve gelişimi prototipler. Notable research topics have included modeller, the atomic transaction concept, and related eşzamanlılık kontrolü techniques, query languages and sorgu optimizasyonu yöntemler RAID, ve dahası.

The database research area has several dedicated Akademik dergiler (Örneğin, Veritabanı Sistemlerinde ACM İşlemleri -TODS, Veri ve Bilgi Mühendisliği -DKE) and annual konferanslar (Örneğin., ACM SIGMOD, ACM PODS, VLDB, IEEE ICDE).

Ayrıca bakınız

Notlar

  1. ^ This article quotes a development time of 5 years involving 750 people for DB2 release 9 alone.(Chong et al. 2007 )

Referanslar

  1. ^ Ullman & Widom 1997, s. 1.
  2. ^ "Update – Definition of update by Merriam-Webster". merriam-webster.com.
  3. ^ "Retrieval – Definition of retrieval by Merriam-Webster". merriam-webster.com.
  4. ^ "Administration – Definition of administration by Merriam-Webster". merriam-webster.com.
  5. ^ Tsitchizris & Lochovsky 1982.
  6. ^ Beynon-Davies 2003.
  7. ^ Nelson & Nelson 2001.
  8. ^ Bachman 1973.
  9. ^ "TOPDB Top Database index". pypl.github.io.
  10. ^ "database, n". OED Çevrimiçi. Oxford University Press. Haziran 2013. Alındı 12 Temmuz, 2013. (Abonelik gereklidir.)
  11. ^ IBM Corporation (October 2013). "IBM Information Management System (IMS) 13 Transaction and Database Servers delivers high performance and low total cost of ownership". Alındı 20 Şub 2014.
  12. ^ Codd 1970.
  13. ^ Hershey & Easthope 1972.
  14. ^ Kuzey 2010.
  15. ^ Childs 1968a.
  16. ^ Childs 1968b.
  17. ^ MICRO Information Management System (Sürüm 5.0) Referans Kılavuzu, M.A. Kahn, D.L. Rumelhart ve B.L. Bronson, Ekim 1977, Çalışma ve Endüstri İlişkileri Enstitüsü (ILIR), Michigan Üniversitesi ve Wayne Eyalet Üniversitesi
  18. ^ "Oracle 30th Anniversary Timeline" (PDF). Alındı 23 Ağustos 2017.
  19. ^ Interview with Wayne Ratliff. The FoxPro History. Erişim tarihi: 2013-07-12.
  20. ^ Development of an object-oriented DBMS; Portland, Oregon, United States; Pages: 472–482; 1986; ISBN  0-89791-204-7
  21. ^ Graves, Steve. "COTS Databases For Embedded Systems" Arşivlendi 2007-11-14 Wayback Makinesi, Gömülü Hesaplama Tasarımı magazine, January 2007. Retrieved on August 13, 2008.
  22. ^ Argumentation in Artificial Intelligence by Iyad Rahwan, Guillermo R. Simari
  23. ^ "OWL DL Semantics". Alındı 10 Aralık 2010.
  24. ^ Connolly & Begg 2014, s. 64.
  25. ^ Connolly & Begg 2014, s. 97–102.
  26. ^ Connolly & Begg 2014, s. 102.
  27. ^ Connolly & Begg 2014, s. 106–113.
  28. ^ Connolly & Begg 2014, s. 65.
  29. ^ Chapple 2005.
  30. ^ "Structured Query Language (SQL)". International Business Machines. 27 Ekim 2006. Alındı 2007-06-10.
  31. ^ Wagner 2010.
  32. ^ Halder & Cortesi 2011.
  33. ^ Ben Linders (January 28, 2016). "How Database Administration Fits into DevOps". Alındı 15 Nisan, 2017.
  34. ^ itl.nist.gov (1993) Integration Definition for Information Modeling (IDEFIX) Arşivlendi 2013-12-03 de Wayback Makinesi. 21 Aralık 1993.
  35. ^ a b Date 2003, s. 31–32.

Kaynaklar

daha fazla okuma

Dış bağlantılar