Bradley-Terry modeli - Bradley–Terry model

Bradley-Terry modeli bir olasılık modeli eşleştirilmiş bir karşılaştırmanın sonucunu tahmin edebilir. Bir çift kişi verildiğinde $ben$ ve $j$ bazılarından çekilmiş nüfus, olasılığını tahmin eder Çift karşılaştırması $ben > j$ doğru çıkıyor

{ displaystyle P (i> j) = { frac {p_ {i}} {p_ {i} + p_ {j}}}}

nerede $p ben$ olumlu gerçek değerli bireye verilen puan $ben$ . Mukayese $ben > j$ "olarak okunabilir $ben$ tercih edilir $j$ ", " $ben$ daha yüksek rütbeler $j$ "veya" $ben$ vuruş $j$ ", uygulamaya bağlı olarak.

Örneğin, $p ben$ bir spor turnuvasında bir takımın becerisini temsil edebilir, tahmin edilen sayılardan $ben$ bir maç kazandı. ${ displaystyle P (i> j)}$ daha sonra olasılığını temsil eder $ben$ karşı bir maç kazanacak $j$ .^[1]^[2] Modelin amacını açıklamak için kullanılan bir başka örnek, belirli bir kategorideki ürünleri kaliteye göre puanlamaktır. Bir kişinin (birçok) şarap markasını doğrudan sıralaması zor olsa da, bir çift şarap örneğini karşılaştırmak ve her bir çift için hangisinin daha iyi olduğunu söylemek mümkün olabilir. Bradley-Terry modeli daha sonra tam bir sıralama elde etmek için kullanılabilir.^[2]

Tarih ve uygulamalar

Model adını R.A. Bradley ve M.E. Terry'den almıştır.^[3] 1952'de sunan^[4] tarafından zaten çalışılmış olmasına rağmen Zermelo 1920'lerde.^[1]^[5]^[6]

Modelin gerçek dünya uygulamaları aşağıdakilerin etkisinin tahminini içerir: istatistiksel dergiler veya belgeleri alaka düzeyine göre sıralayın makine öğrenimli arama motorları.^[7]İkinci başvuruda, ${ displaystyle P (i> j)}$ o belgeyi yansıtabilir $ben$ kullanıcınınkiyle daha alakalı sorgu belgeden $j$ , bu nedenle sonuçlar listesinde daha önce görüntülenmelidir. Bireysel $p ben$ daha sonra belgenin alaka düzeyini ifade edin ve bir sonuç listesi sunulduğunda kullanıcıların belirli "isabetleri" tıklama sıklığından tahmin edilebilir.^[8]

Tanım

Bradley – Terry modeli çeşitli şekillerde parametrelendirilebilir. Bunu yapmanın bir yolu, her gözlem için tek bir parametre seçmektir. $n$ parametreleri $p 1, ..., p n$ .^[9]Başka bir varyant, aslında Bradley ve Terry tarafından düşünülen versiyon,^[2] üstel puan işlevlerini kullanır ${ displaystyle p_ {i} = e ^ { beta _ {i}}}$ Böylece

{ displaystyle P (i> j) = { frac {e ^ { beta _ {i}}} {e ^ { beta _ {i}} + e ^ { beta _ {j}}}}}

veya kullanarak logit (ve bağlara izin vermeme),^[1]

{ displaystyle operatorname {logit} (P (i> j)) = log sol ({ frac {P (i> j)} {1-P (i> j)}} sağ) = log left ({ frac {P (i> j)} {P (j> i)}} sağ) = beta _ {i} - beta _ {j}}

modeli küçültmek lojistik regresyon çiftler üzerinde.

Parametrelerin tahmin edilmesi

Aşağıdaki algoritma parametreleri hesaplar $p ben$ modelin temel versiyonunun bir gözlem örneğinden. Resmi olarak, bir hesaplar maksimum olasılık tahmini yani maksimize eder olasılık gözlemlenen verilerin. Algoritma, Zermelo'nun çalışmasına dayanmaktadır.^[1]

Gerekli gözlemler, önceki karşılaştırmaların sonuçlarıdır, örneğin çiftler $(ben, j)$ nerede $ben$ vuruş $j$ . Bu sonuçları şu şekilde özetlemek: $w ij$ , kaç kez $ben$ dövüldü $j$ , elde ederiz günlük olabilirlik parametre vektörünün $p = p 1, ..., p n$ gibi^[1]

{ displaystyle L ( mathbf {p}) = toplamı _ {i} ^ {n} toplamı _ {j} ^ {n} w_ {ij} ln p_ {i} -w_ {ij} ln ( p_ {i} + p_ {j}).}

Tarafından "kazanılan" karşılaştırmaların sayısını belirtin $ben$ gibi $W ben$ . Keyfi bir vektörden başlayarak $p$ , algoritma güncellemeyi yinelemeli olarak gerçekleştirir

{ displaystyle p '_ {i} = W_ {i} left ( sum _ {j neq i} { frac {w_ {ij} + w_ {ji}} {p_ {i} + p_ {j} }} sağ) ^ {- 1}}

hepsi için $ben$ . Tüm yeni parametreleri hesapladıktan sonra, yeniden normalleştirilmeleri gerekir,

{ displaystyle p_ {i} leftarrow { frac {p '_ ​​{i}} { sum _ {j = 1} ^ {n} p' _ {j}}}.}

Bu tahmin prosedürü, her yinelemede günlük olasılığını artırır ve sonunda benzersiz bir maksimuma yakınsar.

Ayrıca bakınız

Referanslar

^ ^a ^b ^c ^d ^e Avcı, David R. (2004). "Genelleştirilmiş Bradley – Terry modelleri için MM algoritmaları". İstatistik Yıllıkları. 32 (1): 384–406. CiteSeerX 10.1.1.110.7878. doi:10.1214 / aos / 1079120141. JSTOR 3448514.
^ ^a ^b ^c Agresti, Alan (2014). Kategorik Veri Analizi. John Wiley & Sons. sayfa 436–439.
^ E.E.M. van Berkum. "Bradley-Terry modeli". Matematik Ansiklopedisi. Alındı 18 Kasım 2014.
^ Bradley, Ralph Allan; Terry, Milton E. (1952). "Eksik Blok Tasarımlarının Sıra Analizi: I. Eşleştirilmiş Karşılaştırma Yöntemi". Biometrika. 39 (3/4): 324–345. doi:10.2307/2334029. JSTOR 2334029.
^ Zermelo Ernst (1929). "Die Berechnung der Turnier-Ergebnisse als ein Maximumproblem der Wahrscheinlichkeitsrechnung". Mathematische Zeitschrift. 29 (1): 436–460. doi:10.1007 / BF01180541.
^ Heinz-Dieter Ebbinghaus (2007), Ernst Zermelo: Yaşamına ve İşine Bir Yaklaşım, s. 268–269, ISBN 9783540495536
^ Szummer, Martin; Yılmaz, Emine (2011). Tercihlerin düzenlenmesi ile sıralamak için yarı denetimli öğrenme (PDF). CIKM.
^ Radlinski, Filip; Joachims, Thorsten (2007). Tıklama Verilerinden Öğrenme Sıralamaları için Aktif Keşif (PDF). KDD '07 Bilgi keşfi ve veri madenciliği üzerine 13. ACM SIGKDD uluslararası konferansının bildirileri. s. 570–579. doi:10.1145/1281192.1281254.
^ Fangzhao Wu; Jun Xu; Li'yi asın; Xin Jiang (2014). Kısıtlamalarla Sıralama Optimizasyonu. 23. ACM Uluslararası Bilgi ve Bilgi Yönetimi Konferansı CIKM '14 Bildirileri. s. 1049–1058. doi:10.1145/2661829.2661895.

[hunter-1] Avcı, David R. (2004). "Genelleştirilmiş Bradley – Terry modelleri için MM algoritmaları". İstatistik Yıllıkları. 32 (1): 384–406. CiteSeerX 10.1.1.110.7878. doi:10.1214 / aos / 1079120141. JSTOR 3448514.

[agresti-2] Agresti, Alan (2014). Kategorik Veri Analizi. John Wiley & Sons. sayfa 436–439.

[3] E.E.M. van Berkum. "Bradley-Terry modeli". Matematik Ansiklopedisi. Alındı 18 Kasım 2014.

[4] Bradley, Ralph Allan; Terry, Milton E. (1952). "Eksik Blok Tasarımlarının Sıra Analizi: I. Eşleştirilmiş Karşılaştırma Yöntemi". Biometrika. 39 (3/4): 324–345. doi:10.2307/2334029. JSTOR 2334029.

[5] Zermelo Ernst (1929). "Die Berechnung der Turnier-Ergebnisse als ein Maximumproblem der Wahrscheinlichkeitsrechnung". Mathematische Zeitschrift. 29 (1): 436–460. doi:10.1007 / BF01180541.

[6] Heinz-Dieter Ebbinghaus (2007), Ernst Zermelo: Yaşamına ve İşine Bir Yaklaşım, s. 268–269, ISBN 9783540495536

[7] Szummer, Martin; Yılmaz, Emine (2011). Tercihlerin düzenlenmesi ile sıralamak için yarı denetimli öğrenme (PDF). CIKM.

[8] Radlinski, Filip; Joachims, Thorsten (2007). Tıklama Verilerinden Öğrenme Sıralamaları için Aktif Keşif (PDF). KDD '07 Bilgi keşfi ve veri madenciliği üzerine 13. ACM SIGKDD uluslararası konferansının bildirileri. s. 570–579. doi:10.1145/1281192.1281254.

[wu-9] Fangzhao Wu; Jun Xu; Li'yi asın; Xin Jiang (2014). Kısıtlamalarla Sıralama Optimizasyonu. 23. ACM Uluslararası Bilgi ve Bilgi Yönetimi Konferansı CIKM '14 Bildirileri. s. 1049–1058. doi:10.1145/2661829.2661895.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]