Bradley-Terry modeli - Bradley–Terry model

Bradley-Terry modeli bir olasılık modeli eşleştirilmiş bir karşılaştırmanın sonucunu tahmin edebilir. Bir çift kişi verildiğinde ben ve j bazılarından çekilmiş nüfus, olasılığını tahmin eder Çift karşılaştırması ben > j doğru çıkıyor

nerede pben olumlu gerçek değerli bireye verilen puan ben. Mukayese ben > j "olarak okunabilirben tercih edilir j", "ben daha yüksek rütbeler j"veya"ben vuruş j", uygulamaya bağlı olarak.

Örneğin, pben bir spor turnuvasında bir takımın becerisini temsil edebilir, tahmin edilen sayılardan ben bir maç kazandı. daha sonra olasılığını temsil eder ben karşı bir maç kazanacak j.[1][2] Modelin amacını açıklamak için kullanılan bir başka örnek, belirli bir kategorideki ürünleri kaliteye göre puanlamaktır. Bir kişinin (birçok) şarap markasını doğrudan sıralaması zor olsa da, bir çift şarap örneğini karşılaştırmak ve her bir çift için hangisinin daha iyi olduğunu söylemek mümkün olabilir. Bradley-Terry modeli daha sonra tam bir sıralama elde etmek için kullanılabilir.[2]

Tarih ve uygulamalar

Model adını R.A. Bradley ve M.E. Terry'den almıştır.[3] 1952'de sunan[4] tarafından zaten çalışılmış olmasına rağmen Zermelo 1920'lerde.[1][5][6]

Modelin gerçek dünya uygulamaları aşağıdakilerin etkisinin tahminini içerir: istatistiksel dergiler veya belgeleri alaka düzeyine göre sıralayın makine öğrenimli arama motorları.[7]İkinci başvuruda, o belgeyi yansıtabilir ben kullanıcınınkiyle daha alakalı sorgu belgeden j, bu nedenle sonuçlar listesinde daha önce görüntülenmelidir. Bireysel pben daha sonra belgenin alaka düzeyini ifade edin ve bir sonuç listesi sunulduğunda kullanıcıların belirli "isabetleri" tıklama sıklığından tahmin edilebilir.[8]

Tanım

Bradley – Terry modeli çeşitli şekillerde parametrelendirilebilir. Bunu yapmanın bir yolu, her gözlem için tek bir parametre seçmektir. n parametreleri p1, ..., pn.[9]Başka bir varyant, aslında Bradley ve Terry tarafından düşünülen versiyon,[2] üstel puan işlevlerini kullanır Böylece

veya kullanarak logit (ve bağlara izin vermeme),[1]

modeli küçültmek lojistik regresyon çiftler üzerinde.

Parametrelerin tahmin edilmesi

Aşağıdaki algoritma parametreleri hesaplar pben modelin temel versiyonunun bir gözlem örneğinden. Resmi olarak, bir hesaplar maksimum olasılık tahmini yani maksimize eder olasılık gözlemlenen verilerin. Algoritma, Zermelo'nun çalışmasına dayanmaktadır.[1]

Gerekli gözlemler, önceki karşılaştırmaların sonuçlarıdır, örneğin çiftler (ben, j) nerede ben vuruş j. Bu sonuçları şu şekilde özetlemek: wij, kaç kez ben dövüldü j, elde ederiz günlük olabilirlik parametre vektörünün p = p1, ..., pn gibi[1]

Tarafından "kazanılan" karşılaştırmaların sayısını belirtin ben gibi Wben. Keyfi bir vektörden başlayarak p, algoritma güncellemeyi yinelemeli olarak gerçekleştirir

hepsi için ben. Tüm yeni parametreleri hesapladıktan sonra, yeniden normalleştirilmeleri gerekir,

Bu tahmin prosedürü, her yinelemede günlük olasılığını artırır ve sonunda benzersiz bir maksimuma yakınsar.

Ayrıca bakınız

Referanslar

  1. ^ a b c d e Avcı, David R. (2004). "Genelleştirilmiş Bradley – Terry modelleri için MM algoritmaları". İstatistik Yıllıkları. 32 (1): 384–406. CiteSeerX  10.1.1.110.7878. doi:10.1214 / aos / 1079120141. JSTOR  3448514.
  2. ^ a b c Agresti, Alan (2014). Kategorik Veri Analizi. John Wiley & Sons. sayfa 436–439.
  3. ^ E.E.M. van Berkum. "Bradley-Terry modeli". Matematik Ansiklopedisi. Alındı 18 Kasım 2014.
  4. ^ Bradley, Ralph Allan; Terry, Milton E. (1952). "Eksik Blok Tasarımlarının Sıra Analizi: I. Eşleştirilmiş Karşılaştırma Yöntemi". Biometrika. 39 (3/4): 324–345. doi:10.2307/2334029. JSTOR  2334029.
  5. ^ Zermelo Ernst (1929). "Die Berechnung der Turnier-Ergebnisse als ein Maximumproblem der Wahrscheinlichkeitsrechnung". Mathematische Zeitschrift. 29 (1): 436–460. doi:10.1007 / BF01180541.
  6. ^ Heinz-Dieter Ebbinghaus (2007), Ernst Zermelo: Yaşamına ve İşine Bir Yaklaşım, s. 268–269, ISBN  9783540495536
  7. ^ Szummer, Martin; Yılmaz, Emine (2011). Tercihlerin düzenlenmesi ile sıralamak için yarı denetimli öğrenme (PDF). CIKM.
  8. ^ Radlinski, Filip; Joachims, Thorsten (2007). Tıklama Verilerinden Öğrenme Sıralamaları için Aktif Keşif (PDF). KDD '07 Bilgi keşfi ve veri madenciliği üzerine 13. ACM SIGKDD uluslararası konferansının bildirileri. s. 570–579. doi:10.1145/1281192.1281254.
  9. ^ Fangzhao Wu; Jun Xu; Li'yi asın; Xin Jiang (2014). Kısıtlamalarla Sıralama Optimizasyonu. 23. ACM Uluslararası Bilgi ve Bilgi Yönetimi Konferansı CIKM '14 Bildirileri. s. 1049–1058. doi:10.1145/2661829.2661895.