Diyalog sistemi - Dialogue system

Bir otomatik çevrimiçi asistan bir web sitesinde - diyalog sistemlerinin ana bileşenler olduğu bir örnek

Bir diyalog sistemiveya konuşma ajanı (CA), bir insanla sohbet etmeyi amaçlayan bir bilgisayar sistemidir. Diyalog sistemleri, hem giriş hem de çıkış kanalında iletişim için bir veya daha fazla metin, konuşma, grafik, dokunma, hareket ve diğer modları kullandı.

Bir diyalog sisteminin unsurları tanımlanmamıştır[kaynak belirtilmeli ]ancak farklıdırlar sohbet robotu.[1] Tipik GUI sihirbaz bir çeşit diyalog kurar, ancak çok az ortak diyalog sistemi bileşenini içerir ve diyalog durumu önemsizdir.

Arka fon

Altmışlı yılların başından itibaren sadece yazılı metin işlemeye dayalı diyalog sistemlerinden sonra,[2] ilk konuşuyorum diyalog sistemi tarafından yayınlandı DARPA 1977'de ABD'de proje.[3] Bu 5 yıllık projenin bitiminden sonra, bazı Avrupa projeleri birçok dili (ayrıca Fransızca, Almanca ve İtalyanca) konuşabilen ilk diyalog sistemini yayınladı.[4] Bu ilk sistemler, telekom endüstrisinde belirli alan adlarında telefona çeşitli hizmetler sağlamak için kullanıldı, örn. otomatik gündem ve tren masaları hizmeti.

Bileşenler

Bir diyalog sistemine hangi bileşen setlerinin dahil edildiği ve bu bileşenlerin sorumlulukları nasıl böldüğü sistemden sisteme farklılık gösterir. Herhangi bir diyalog sisteminin prensibi, diyalog yöneticisi diyalog durumunu ve diyalog stratejisini yöneten bir bileşen olan. Bir diyalog sistemindeki tipik bir aktivite döngüsü aşağıdaki aşamaları içerir:[5]

  1. Kullanıcı konuşur ve girdi, sistem tarafından düz metne dönüştürülür. giriş tanıyıcı / kod çözücüşunları içerebilir:
  2. Metin, bir Doğal dil anlayışı birimi (NLU), şunları içerebilir:
  3. Anlamsal bilgiler, diyalog yöneticisi, diyaloğun geçmişini ve durumunu tutan ve konuşmanın genel akışını yöneten.
  4. Genellikle iletişim yöneticisi bir veya daha fazla görev Yöneticisibelirli görev alanı hakkında bilgi sahibi olan.
  5. Diyalog yöneticisi, bir çıktı üretecişunları içerebilir:
  6. Son olarak, çıktı bir çıktı oluşturucuşunları içerebilir:

Yalnızca metin arayüzüne (örneğin metin tabanlı sohbet) dayalı diyalog sistemleri yalnızca 2-5 aşamalarını içerir.

Sistem türleri

Diyalog sistemleri, burada birkaç boyutta listelenen aşağıdaki kategorilere ayrılır. Kategorilerin çoğu örtüşüyor ve ayrımlar tam olarak belirlenmemiş olabilir.

Doğal diyalog sistemleri

"Doğal Diyalog Sistemi, insan davranışını taklit ederek kullanılabilirliği ve kullanıcı memnuniyetini artırmaya çalışan bir diyalog sistemidir" [6] (Berg, 2014). İnsandan insana diyaloğun özelliklerini (ör. Alt diyaloglar ve konu değişiklikleri) ele alır ve bunları insan-makine etkileşimi için diyalog sistemlerine entegre etmeyi amaçlar. Sıklıkla, (sözlü) diyalog sistemleri kullanıcının sisteme adapte olmasını gerektirir çünkü sistem yalnızca çok sınırlı bir kelime dağarcığını anlayabilir, konu değişikliklerine tepki veremez ve kullanıcının diyalog akışını etkilemesine izin vermez. Karma girişim, kullanıcının yalnızca diyalogda aktif bir rol oynamasını sağlamanın bir yoludur. soruları cevaplamak. Ancak, karma inisiyatifin varlığı, doğal diyalog sistemi olarak sınıflandırılmak için yeterli değildir. Diğer önemli hususlar şunları içerir:[6]

  • Sistemin uyarlanabilirliği
  • Örtülü onay desteği
  • Doğrulama sorularının kullanımı
  • Zaten verilmiş olan bilgileri düzeltme olanakları
  • Aşırı bilgilendirme (istenenden daha fazla bilgi verin)
  • Destek olumsuzlukları
  • Söylem ve anaforayı analiz ederek referansları anlayın
  • Monoton ve tekrarlayan istemleri önlemek için doğal dil üretimi
  • Uyarlanabilir ve duruma duyarlı formülasyon
  • Sosyal davranış (selamlar, kullanıcıyla aynı düzeyde formalite, nezaket)
  • Konuşma tanıma ve sentez kalitesi

Bu yönlerin çoğu birçok farklı araştırma projesinin sorunları olsa da, bu konuları ele alan diyalog sistemlerinin geliştirilmesini destekleyen araçların eksikliği vardır.[7] Dışında VoiceXML etkileşimli sesli yanıt sistemlerine odaklanan ve endüstrideki birçok sözlü diyalog sisteminin (müşteri destek uygulamaları) temelini oluşturan ve AIML bununla ünlü A.L.I.C.E. chatbot, bunların hiçbiri diyalog eylemleri veya dil oluşturma gibi dil özelliklerini entegre etmez. Bu nedenle, NADIA (bir araştırma prototipi) bu boşluğun nasıl doldurulacağına dair bir fikir verir ve doğal dil üretimi, uyarlanabilir formülasyon ve alt diyaloglar gibi yukarıda belirtilen bazı yönleri birleştirir.

Verim

Bazı yazarlar, cümle modelini karşılaştırarak diyalog sisteminin performansını cümle yüzdesi açısından tamamen doğru ölçmektedir (bu ölçü Kavram Cümle Doğruluğu[8] veya Cümle Anlama[4]).

Başvurular

Diyalog sistemleri ticari işletmelerde, eğitimde, devlette, sağlık hizmetlerinde ve eğlencede geniş bir uygulama yelpazesini destekleyebilir.[9] Örneğin:

  • Müşterilerin ürün ve hizmetler hakkındaki sorularını bir şirketin web sitesi aracılığıyla yanıtlamak veya intranet portalı
  • Müşteri hizmetleri temsilcisi bilgi tabanı: Temsilcilerin bir müşterinin sorusunu yazmasına ve bir yanıtla onlara rehberlik etmesine olanak tanır
  • Kılavuzlu satış: Özellikle acemi müşterilere satılan karmaşık ürünler için satış sürecinde cevaplar ve rehberlik sağlayarak işlemleri kolaylaştırmak
  • Yardım Masası: Dahili çalışan sorularını yanıtlamak, örneğin İK sorularına yanıt vermek
  • Web sitesinde gezinme: Müşterileri karmaşık web sitelerinin ilgili kısımlarına yönlendiren bir Web sitesi konsiyerji
  • Teknik destek: Bir ürün veya cihazla ilgili bir sorunu teşhis etme gibi teknik sorunlara yanıt verme
  • Kişiselleştirilmiş hizmet: Konuşma aracıları, örneğin hesap bakiyeleriyle ilgili soruları yanıtlama, portföy bilgileri sağlama, sık uçuş veya üyelik bilgileri sağlama gibi etkileşimleri kişiselleştirmek için dahili ve harici veritabanlarından yararlanabilir.
  • Eğitim veya öğretim: Kullanıcı öğrenirken problem çözme önerileri sunabilirler
  • Basit diyalog sistemleri, insan iş yükünü azaltmak için yaygın olarak kullanılmaktadır. çağrı merkezleri. Bu ve diğer endüstriyel telefon uygulamalarında, diyalog sistemlerinin sağladığı işlevsellik şu şekilde bilinir: etkileşimli sesli yanıt veya IVR.

Bazı durumlarda, konuşma aracıları yapay karakterler kullanarak kullanıcılarla etkileşime girebilir. Bu ajanlar daha sonra şu şekilde anılır: somutlaşmış ajanlar.

Araç kitleri ve mimariler

Diyalog sistemlerini tanımlamak için mevcut çerçeveler, diller ve teknolojiler üzerine bir araştırma.

İsim ve BağlantılarSistem tipiAçıklamaBağlı kuruluşlarOrtam [lar]Yorumlar
AIMLChatterbot dilDoğal dil yazılım aracıları oluşturmak için XML lehçesiRichard Wallace, Pandorabots, Inc.
ChatScriptChatterbot dilDoğal dil yazılım aracıları oluşturmak için Dil / MotorBruce Wilcox
CSLU Araç Seti
durum tabanlı konuşma arabirimi prototip oluşturma ortamıOGI Bilim ve Mühendislik Okulu
M. McTear
Ron Cole
yayınlar 1999'dan.
NLUI SunucusuEtki alanından bağımsız araç setibina için eksiksiz çok dilli çerçeve doğal dil kullanıcı arayüzü sistemleriLinguaSyskarışık girişim diyalogları için hazır destek
Olympussözlü diyalog sistemlerini uygulamak için eksiksiz çerçeveCarnegie Mellon Üniversitesi[1]
NextnovaMultimodal PlatformÇok modlu yazılım uygulamaları geliştirme platformu. Durum Tablosu XML'sine (SCXML) görePonvia Technology, Inc.
VXML
Sesli XML
Sözlü iletişimmultimodal dialog biçimlendirme dilibaşlangıçta tarafından geliştirildi AT&T daha sonra bir endüstri konsorsiyumu tarafından yönetilir ve son olarak W3C ŞartnameMisalöncelikle telefon için.
TUZbiçimlendirme dilimultimodal dialog biçimlendirme diliMicrosoft"standartlar sürecinde VoiceXML olgunluk düzeyine ulaşmadı".
Quack.com - QXMLGeliştirme Ortamışirket tarafından satın alındı AOL
OpenDialEtki alanından bağımsız araç setiJava'da uygulanan sözlü diyalog sistemleri için hibrit sembolik / istatistiksel çerçeveOslo Üniversitesi
NADIAdiyalog motoru ve diyalog modellemeDoğal diyaloglar / diyalog sistemleri oluşturmak. Diyalog eylemlerini, karma girişimleri, NLG'yi destekler. Java'da uygulanmıştır.Markus M. BergXML tabanlı iletişim dosyaları oluşturun, gramer belirtmeye gerek yok, yayınlar 2014'ten itibaren

Ayrıca bakınız

Referanslar

  1. ^ Klüwer, Tina. "Sohbet robotlarından iletişim sistemlerine." Konuşma aracıları ve doğal dil etkileşimi: Teknikler ve Etkili Uygulamalar. IGI Global, 2011. 1-22.
  2. ^ McTear, Michael, Zoraida Callejas ve David Griol, Konuşma arayüzü: Akıllı cihazlarla konuşma, Springer, 2016.
  3. ^ Giancarlo Pirani (ed), Konuşmayı anlamak için gelişmiş algoritmalar ve mimariler, Cilt. 1. Springer Science & Business Media, 2013.
  4. ^ a b Alberto Ciaramella, Bir prototip performans değerlendirme raporu, Sundial workpackage 8000 (1993).
  5. ^ Jurafsky & Martin (2009), Konuşma ve dil işleme. Pearson International Edition, ISBN  978-0-13-504196-3Bölüm 24
  6. ^ a b Berg, Markus M. (2014), Konuşma Temelli Bilgi ve Kontrol Sistemleri Bağlamında Doğal Diyalogların Modellenmesi, Akademische Verlagsgesellschaft AKA, ISBN  978-3-89838-508-4
  7. ^ Berg, Markus M. (2015), "NADIA: Doğal Diyalog Sistemlerinin Geliştirilmesine Yönelik Basitleştirilmiş Bir Yaklaşım", Doğal Dil İşleme ve Bilgi Sistemleri, Bilgisayar Bilimleri Ders Notları, 9103, s. 144–150, doi:10.1007/978-3-319-19581-0_12, ISBN  978-3-319-19580-3
  8. ^ Bangalore, Srinivas ve Michael Johnston. "Çok modlu arayüzlerde sağlam anlayış." Hesaplamalı Dilbilim 35.3 (2009): 345-397.
  9. ^ Lester, J .; Branting, K .; Mott, B. (2004), "Konuşma Temsilcileri" (PDF), İnternet Bilişiminin Pratik El Kitabı, Chapman & Hall

daha fazla okuma