Web arama sorgusu - Web search query

Bir web arama sorgusu belirli bir Arama terimi bir kullanıcının girdiği web arama motoru tatmin etmek için bilgi ihtiyaçları. Web araması sorguları, genellikle düz metin olmaları veya köprü metni isteğe bağlı arama yönergeleriyle ("ve" / "veya" hariç tutulacak "-" gibi). Standarttan çok farklıdırlar sorgu dilleri gibi katı sözdizimi kurallarına tabi olan komut dilleri anahtar kelime veya konumsal parametreleri.

Türler

Çoğu web arama sorgusunu kapsayan üç geniş kategori vardır: bilgi, gezinme ve işlemsel.[1] Bunlara "yap, bil, git" de denir.[2] Bu arama modeli teorik olarak türetilmemiş olmasına rağmen, sınıflandırma deneysel olarak gerçek arama motoru sorguları ile doğrulanmıştır.[3]

  • Bilgilendirici sorgular - Geniş bir konuyu kapsayan sorgular (ör. Colorado veya kamyonlar) için binlerce alakalı sonuç olabilir.
  • Gezinme sorguları - Tek bir varlığın tek bir web sitesini veya web sayfasını arayan sorgular (ör. Youtube veya Delta Havayolları).
  • İşlem sorguları - Bir araba satın almak veya ekran koruyucu indirmek gibi kullanıcının belirli bir işlemi gerçekleştirme niyetini yansıtan sorgular.

Arama motorları genellikle çok daha az sıklıkla kullanılan dördüncü bir sorgu türünü destekler:

  • Bağlantı sorguları - Dizine eklenenlerin bağlantısını bildiren sorgular web grafiği (ör. Hangi bağlantılar buna işaret ediyor URL ? ve Bundan kaç sayfa dizine alındı alan adı ?).[4]

Özellikler

Listesi arama önerileri bir arama sorgusu için

Ticari web arama motorlarının çoğu, arama günlüklerini ifşa etmez, bu nedenle kullanıcıların Web'de ne aradıklarıyla ilgili bilgilere ulaşmak zordur.[5] Bununla birlikte, araştırma çalışmaları 1998'de ortaya çıktı.[6][7] Daha sonra 2001'de bir çalışma[8] gelen sorguları analiz etti Heyecanlandırmak arama motoru, web aramasının bazı ilginç özelliklerini gösterdi:

  • Bir arama sorgusunun ortalama uzunluğu 2,4 terimdi.
  • Kullanıcıların yaklaşık yarısı tek bir sorgu girerken, kullanıcıların üçte birinden biraz daha azı üç veya daha fazla benzersiz sorgu girdi.
  • Kullanıcıların yarısına yakını, sonuçların yalnızca ilk bir veya iki sayfasını inceledi (sayfa başına 10 sonuç).
  • Kullanıcıların% 5'inden azı gelişmiş arama özelliklerini kullandı (ör. boole operatörleri AND, OR ve NOT gibi).
  • En sık kullanılan ilk dört terim şunlardı: (boş arama) ve, / ve seks.

Aynı Excite sorgu günlükleri üzerinde yapılan bir araştırma, sorguların% 19'unun coğrafi bir terim (ör. Yer adları, posta kodları, coğrafi özellikler vb.) İçerdiğini ortaya koydu.[9] Araştırmalar, kısa sorgulara (yani, az terimli sorgulara) ek olarak, kullanıcıların sorgularını nasıl değiştirdiklerine dair öngörülebilir modeller de olduğunu göstermektedir.[10]

Yahoo'nun sorgu günlükleri üzerinde 2005 yılında yapılan bir araştırma, aynı kullanıcıdan gelen sorguların% 33'ünün tekrarlanan sorgular olduğunu ve kullanıcının aynı sonucu tıklama zamanının% 87'sini ortaya çıkardı.[11] Bu, birçok kullanıcının bilgileri yeniden ziyaret etmek veya yeniden bulmak için tekrarlanan sorguları kullandığını göstermektedir. Bu analiz, sorguların yaklaşık% 30'unun gezinme sorguları olduğunu söyleyen bir Bing arama motoru blog gönderisiyle onaylanmıştır. [12]

Ek olarak, birçok araştırma, sorgu terimi frekans dağılımlarının, Güç yasası veya uzun kuyruk dağılım eğrileri. Yani, büyük bir sorgu günlüğünde (örneğin> 100 milyon sorgu) gözlemlenen terimlerin küçük bir kısmı en sık kullanılırken, geri kalan terimler daha az sıklıkla tek tek kullanılır.[13] Bu örnek Pareto prensibi (veya 80–20 kuralı) arama motorlarının kullanmasına izin verir optimizasyon teknikleri dizin veya gibi veritabanı bölümleme, Önbelleğe almak ve ön getirme. Ek olarak, bir web sorgusunun gezinme, bilgi veya işlemsel olup olmadığını anlayabilen dil odaklı öznitelikleri keşfetmeye yönelik çalışmalar yapılmıştır.[14]

Ancak 2011'de yakın zamanda yapılan bir çalışmada, ortalama sorgu uzunluğunun zaman içinde istikrarlı bir şekilde arttığı ve İngilizce dışındaki dillerdeki sorguların ortalama uzunluğunun İngilizce sorgulardan daha fazla arttığı bulundu.[15] Google, sinek kuşu Daha fazla arama konuşmaya dayalı olduğundan daha uzun arama sorgularını işlemek için Ağustos 2013'te güncelleme (yani "en yakın kahve dükkanı nerede?").[16] Daha uzun sorgular için, Doğal dil işleme yardımcı olur, çünkü sorgu ağaçlarının ayrıştırılması yanıtların ağaçlarıyla ve bunların parçacıklarıyla eşleştirilebilir.[17] Anahtar kelime istatistiklerinin ve Tf-idf çok yardımcı değil Çalılık teknik, karmaşık soruları ve cevapları yapısal olarak temsil etmek için devreye girer.[18]

Yapılandırılmış sorgular

Boole operatörlerini ve parantezleri destekleyen arama motorlarıyla, geleneksel olarak kütüphaneciler tarafından kullanılan bir teknik uygulanabilir. Birkaç konuyu kapsayan belgeler arayan bir kullanıcı veya yönler her birini bir ayrılma gibi karakteristik kelimelerin araçlar VEYA arabalar VEYA otomobiller. Bir yönlü sorgu bir bağlaç bu tür yönlerin; Örneğin. gibi bir sorgu (elektronik VEYA bilgisayarlı VEYA DRE) VE (oylama VEYA seçimler VEYA seçim VEYA oylama VEYA seçim) "elektronik" ve "oylama" sözcüklerinden birini veya hatta her ikisini birden atlasalar bile elektronik oylama ile ilgili belgeleri bulması muhtemeldir.[19]

Ayrıca bakınız

Referanslar

  1. ^ Broder, A. (2002). Web aramasının bir sınıflandırması. SİGİR Forumu, 36 (2), 3–10.
  2. ^ Gibbons, Kevin (2013-01-11). "Yap, Bil, Git: Satın Alma Döngüsünün Her Aşamasında Nasıl İçerik Oluşturulur?". Arama Motoru İzleme. Alındı 24 Mayıs 2014.
  3. ^ Jansen, B.J., Booth, D. ve Spink, A. (2008) Web sorgularının bilgi, gezinme ve işlem amacını belirleme, Bilgi İşleme ve Yönetimi. 44 (3), 1251-1266.
  4. ^ Moore, Ross. "Bağlantı sunucuları". Cambridge University Press. Alındı 24 Mayıs 2014.
  5. ^ Dawn Kawamoto ve Elinor Mills (2006), AOL, kullanıcı arama verilerinin yayınlanması için özür diler
  6. ^ Jansen, B. J., Spink, A., Bateman, J., ve Saracevic, T. 1998. Gerçek hayattan bilgi alma: Web üzerindeki kullanıcı sorgularının incelenmesi. SİGİR Forum, 32 (1), 5-17.
  7. ^ Silverstein, C., Henzinger, M., Marais, H. ve Moricz, M. (1999). Çok büyük bir Web arama motoru sorgu günlüğünün analizi. SİGİR Forumu, 33 (1), 6–12.
  8. ^ Amanda Spink; Dietmar Wolfram; Binbaşı B. J. Jansen; Tefko Saracevic (2001). "Web'de arama: Halk ve sorguları ". Amerikan Bilgi Bilimi ve Teknolojisi Derneği Dergisi. 52 (3): 226–234. CiteSeerX  10.1.1.23.9800. doi:10.1002 / 1097-4571 (2000) 9999: 9999 <:: AID-ASI1591> 3.3.CO; 2-I. İçindeki harici bağlantı | title = (Yardım)
  9. ^ Mark Sanderson ve Janet Kohler (2004). "Coğrafi sorguları analiz etme". Coğrafi Bilgi Çalıştayı Bildirileri (SİGİR '04).
  10. ^ Jansen, B.J., Booth, D.L. ve Spink, A. (2009). Web araması sırasında sorgu değiştirme kalıpları. Amerikan Bilgi Bilimi ve Teknolojisi Derneği Dergisi. 60 (3), 557-570. 60 (7), 1358-1371.
  11. ^ Jaime Teevan; Eytan Adar; Rosie Jones; Michael Potts (2005). "Geçmiş kendini tekrar eder: Yahoo'nun sorgu günlüklerinde Sorguları Tekrarla" (PDF). Bilgi Erişimde Araştırma ve Geliştirme üzerine 29. Yıllık ACM Konferansı Bildirileri (SIGIR '06). s. 703–704. doi:10.1145/1148170.1148326.[kalıcı ölü bağlantı ]
  12. ^ http://www.bing.com/community/site_blogs/b/search/archive/2011/02/10/making-search-yours.aspx
  13. ^ Ricardo Baeza-Yates (2005). "Web Sorgu Madenciliği Uygulamaları". Bilgi Erişimde Gelişmeler. Bilgisayar Bilimlerinde Ders Notları. 3408. Springer Berlin / Heidelberg. s. 7–22. doi:10.1007/978-3-540-31865-1_2. ISBN  978-3-540-25295-5.
  14. ^ Alejandro Figueroa (2015). "Web sorgularının ardındaki kullanıcı amacını tanımak için etkili özellikleri keşfetme". 68. Elsevier: 162–169. Alıntı dergisi gerektirir | günlük = (Yardım)
  15. ^ Mona Taghavi; Ahmed Patel; Nikita Schmidt; Christopher Wills; Yiqi Tew (2011). "Arama motorları için sorgu dağıtım modeli yaklaşımıyla web proxy günlüklerinin analizi". Bilgisayar Standartları ve Arayüzleri. 34 (1): 162–170. doi:10.1016 / j.csi.2011.07.001.
  16. ^ Sullivan, Danny (2013/09/26). "SSS: Yeni Google" Hummingbird "Algoritması" Hakkında Her Şey. Arama Motoru Arazisi. Alındı 24 Mayıs 2014.
  17. ^ Galitsky B. Metnin aranması ve sınıflandırılması için sözdizimsel ayrıştırma ağaçlarının makine öğrenimi. Yapay Zekanın Mühendislik Uygulamaları. 2013;26(3):153–172. doi:10.1016 / j.engappai.2012.09.017.
  18. ^ Galitsky B, Ilvovsky D, Kuznetsov SO, Strok F.Çok Cümle Arama için Maksimal Yaygın Alt Ayrıştırma Çalılıkları Bulma. Yapay Zeka Ders Notları. 2013;8323.
  19. ^ Vojkan Mihajlović; Djoerd Hiemstra; Henk Ernst Blok; Peter M.G. Apers (Ekim 2006). "Belge Erişim Etkinliğini Artırmak İçin Sorgu Yapısından ve Belge Yapısından Yararlanma" (PDF). Alıntı dergisi gerektirir | günlük = (Yardım)