Koşullandırma (olasılık) - Conditioning (probability)

İnançlar mevcut bilgilere bağlıdır. Bu fikir, olasılık teorisi tarafından şartlandırma. Koşullu olasılıklar, koşullu beklentiler, ve koşullu olasılık dağılımları üç düzeyde işlenir: ayrık olasılıklar, olasılık yoğunluk fonksiyonları, ve teori ölçmek. Koşullandırma, koşul tamamen belirtilmişse rastgele olmayan bir sonuca yol açar; aksi takdirde, koşul rastgele bırakılırsa, koşullamanın sonucu da rastgele olur.

Ayrık düzeyde koşullandırma

Örnek: Adil bir jeton 10 kez atılır; rastgele değişken X bu 10 atıştaki kafa sayısı ve Y - ilk 3 atıştaki yazı sayısı. Gerçeğine rağmen Y daha önce ortaya çıkar X birisi biliyor olabilir X Ama değil Y.

Şartlı olasılık

Verilen X = 1, olayın koşullu olasılığı Y = 0

Daha genel olarak,

Koşullu olasılık bir rastgele değişken olarak da ele alınabilir - rastgele değişkenin bir fonksiyonu X, yani,

beklenti Bu rastgele değişkenin oranı (koşulsuz) olasılığa eşittir,

yani,

bu bir örneği toplam olasılık kanunu

Böylece, rastgele değişkenin değeri olarak kabul edilebilir karşılık gelen X = 1. Diğer taraftan, diğer olası değerlerinden bağımsız olarak iyi tanımlanmıştır X.

Koşullu beklenti

Verilen X = 1, rastgele değişkenin koşullu beklentisi Y dır-dir Daha genel olarak,

(Bu örnekte, doğrusal bir işlev gibi görünmektedir, ancak genel olarak doğrusal değildir.) Bir kişi, koşullu beklentiyi bir rasgele değişken olarak da ele alabilir - rasgele değişkenin bir işlevi X, yani,

Bu rastgele değişkenin beklentisi, (koşulsuz) beklentisine eşittir. Y,

yani,

ya da sadece

bu bir örneği toplam beklenti kanunu

Rastgele değişken en iyi tahmin aracıdır Y verilen X. Yani, ortalama kare hatasını en aza indirir formun tüm rastgele değişkenlerinin sınıfında f(X). Bu rastgele değişkenler sınıfı, eğer X diyelim ki 2 ile değiştirilirX. Böylece, Bu demek değil daha doğrusu, Özellikle, Daha genel olarak, her işlev için g bu, tüm olası değerler kümesinde bire bir X. Değerleri X alakasız; önemli olan bölümdür (bunu belirtin αX)

örnek uzayının Ω ayrık kümelere {X = xn}. (Buraya tüm olası değerler X.)'Nın keyfi bir bölümü α verildiğinde, rastgele değişken tanımlanabilir. E ( Y | α). Yine de E (E ( Y | α)) = E ( Y ).

Koşullu olasılık, koşullu beklentinin özel bir durumu olarak ele alınabilir. Yani, P ( Bir | X ) = E ( Y | X ) Eğer Y ... gösterge nın-nin Bir. Bu nedenle koşullu olasılık, α bölümüne de bağlıdır.X tarafından oluşturuldu X yerine X kendisi; P ( Bir | g(X)) = P (Bir | X) = P (Bir | α), α = αX = αg(X).

Öte yandan, bir olaya koşullandırma B iyi tanımlanmıştır, ancak içerebilecek herhangi bir bölümden bağımsız olarak B birkaç parçadan biri olarak.

Koşullu dağıtım

Verilen X = x, koşullu dağılımı Y dır-dir

için 0 ≤ y ≤ dk (3, x ). O hipergeometrik dağılım H ( x; 3, 7 ), Veya eşdeğer olarak, H (3; x, 10-x ). Karşılık gelen beklenti 0.3 x, genel formülden elde edilir

için H ( n; R, W ), koşullu beklentiden başka bir şey değil E (Y | X = x) = 0.3 x.

Tedavi H ( X; 3, 7 ) rastgele dağılım olarak ({0,1,2,3} üzerindeki tüm ölçümlerin dört boyutlu uzayında rastgele bir vektör), beklenti, koşulsuz dağılımını alarak alabilir Y, - Binom dağılımı Bölme (3, 0.5). Bu gerçek eşitlik anlamına gelir

için y = 0,1,2,3; bu bir örneği toplam olasılık kanunu.

Yoğunluk düzeyinde koşullandırma

Misal. Kürenin bir noktası x2 + y2 + z2 = 1, şuna göre rastgele seçilir n-küre # n-topun yüzeyinde nokta oluşturma[1] Rastgele değişkenler X, Y, Z rastgele noktanın koordinatlarıdır. Eklem yoğunluğu X, Y, Z yok (küre sıfır hacimde olduğundan), ancak eklem yoğunluğu fX,Y nın-nin X, Y var,

(Yoğunluk, arasındaki sabit olmayan açı nedeniyle sabit değildir. küre ve uçak.) Yoğunluğu X entegrasyon ile hesaplanabilir,

şaşırtıcı bir şekilde, sonuç şuna bağlı değildir x içinde (−1,1),

bunun anlamı X (−1,1) eşit olarak dağıtılmıştır. Aynısı için de geçerlidir Y ve Z (ve aslında aX + tarafından + cZ her ne zaman a2 + b2 + c2 = 1).

Misal. Marjinal dağılım fonksiyonunu hesaplamanın farklı bir ölçüsü aşağıda verilmiştir. [2][3]

Şartlı olasılık

Hesaplama

Verilen X = 0,5, olayın koşullu olasılığı Y ≤ 0.75, koşullu yoğunluğun integralidir,

Daha genel olarak,

hepsi için x ve y öyle ki −1 < x <1 (aksi takdirde payda fX(x) kaybolur) ve (aksi takdirde koşullu olasılık 0 veya 1'e düşer). Koşullu olasılık bir rastgele değişken olarak da ele alınabilir - rastgele değişkenin bir fonksiyonu X, yani,

Bu rastgele değişkenin beklentisi (koşulsuz) olasılığa eşittir,

bu bir örneği toplam olasılık kanunu E (P ( Bir | X )) = P ( Bir ).

Yorumlama

Koşullu olasılık P ( Y ≤ 0.75 | X = 0.5 ) olarak yorumlanamaz P ( Y ≤ 0.75, X = 0,5) / P ( X = 0.5 ), ikincisi 0/0 verdiğinden. Buna göre, P ( Y ≤ 0.75 | X = 0.5 ) kesin değer olduğundan, ampirik frekanslarla yorumlanamaz X = 0.5'in rastgele görünme şansı yoktur, sonsuz bağımsız denemeler dizisi sırasında bir kez bile.

Koşullu olasılık bir sınır olarak yorumlanabilir,

Koşullu beklenti

Koşullu beklenti E ( Y | X = 0.5 ) pek ilgi çekici değil; sadece simetri ile yok olur. Hesaplamak daha ilginç E (|Z| | X = 0.5 ) tedavi |Z| bir fonksiyonu olarak X, Y:

Daha genel olarak,

−1 x <1. Koşullu beklentiye rastgele bir değişken olarak da bakılabilir - rastgele değişkenin bir fonksiyonu X, yani,

Bu rastgele değişkenin beklentisi, (koşulsuz) beklentisine eşittir |Z|,

yani,

bu bir örneği toplam beklenti kanunu E (E ( Y | X )) = E ( Y ).

Rastgele değişken E (|Z| | X) en iyi tahmin aracıdır |Z| verilen X. Yani, ortalama kare hatasını en aza indirir E (|Z| - f(X) )2 formun tüm rastgele değişkenlerinin sınıfında f(X). Ayrık duruma benzer şekilde, E (|Z| | g(X)) = E (|Z| | X ) ölçülebilir her işlev için g yani (-1,1) üzerinde bire bir.

Koşullu dağıtım

Verilen X = x, koşullu dağılımı Yyoğunluk tarafından verilir fY|X=x(y), (yeniden ölçeklendirilmiş) arcsin dağılımıdır; kümülatif dağılım işlevi

hepsi için x ve y öyle ki x2 + y2 <1. İlgili beklenti h(x,Y) koşullu beklentiden başka bir şey değildir E ( h(X,Y) | X=x ). karışım bu koşullu dağılımların tümü için alınan x (dağılımına göre X) koşulsuz dağılımıdır Y. Bu gerçek eşitlikler anlamına geliyor

ikincisi, toplam olasılık yasasının örneğidir yukarıda bahsedilen.

Koşullandırma ne değildir

Ayrık seviyede koşullandırma, yalnızca koşul sıfır olmayan olasılıkta ise mümkündür (sıfıra bölünemez). Yoğunluk düzeyinde, şartlandırma X = x olsa bile mümkün P ( X = x ) = 0. Bu başarı, koşullamanın olduğu yanılsamasını yaratabilir. her zaman mümkün. Maalesef, aşağıda sunulan birkaç nedenden dolayı öyle değil.

Geometrik sezgi: dikkat

Sonuç P ( Y ≤ 0.75 | X = 0.5 ) = 5/6, yukarıda bahsedilen geometrik olarak aşağıdaki anlamda belirgindir. Puanlar (x,y,z) kürenin x2 + y2 + z2 = 1, koşulu sağlama x = 0,5, bir çemberdir y2 + z2 = 0.75 yarıçap uçakta x = 0.5. Eşitsizlik y ≤ 0,75 bir yay üzerinde tutar. Yayın uzunluğu, çemberin uzunluğunun 5 / 6'sıdır, bu nedenle koşullu olasılık 5 / 6'ya eşittir.

Bu başarılı geometrik açıklama, aşağıdaki sorunun önemsiz olduğu yanılsamasını yaratabilir.

Belirli bir kürenin bir noktası rastgele (tekdüze olarak) seçilir. Noktanın belirli bir düzlemde olduğu göz önüne alındığında, koşullu dağılımı nedir?

Koşullu dağılımın verilen daire üzerinde tekdüze olması gerektiği aşikar görünebilir (verilen küre ile verilen düzlemin kesişimi). Bazen gerçekten öyle, ama genel olarak değil. Özellikle, Z (-1, + 1) üzerine eşit olarak dağıtılır ve orandan bağımsızdır Y/X, Böylece, P ( Z ≤ 0.5 | Y/X ) = 0.75. Öte yandan eşitsizlik z ≤ 0,5 dairenin bir yayı üzerinde tutar x2 + y2 + z2 = 1, y = cx (herhangi bir verilen için c). Yay uzunluğu, çemberin uzunluğunun 2 / 3'üdür. Ancak koşullu olasılık 2/3 değil 3 / 4'tür. Bu, klasik Borel paradoksunun bir tezahürüdür.[4][5]

Simetriye yapılan itirazlar, değişmezlik argümanları olarak resmileştirilmezse yanıltıcı olabilir.

— Pollard[6]

Başka bir örnek. Bir rastgele rotasyon Üç boyutlu uzayın, rastgele bir eksen etrafında rastgele bir açıyla döndürülmesidir. Geometrik sezgi, açının eksenden bağımsız olduğunu ve düzgün dağıldığını ileri sürer. Ancak, ikincisi yanlıştır; açının küçük değerleri daha az olasıdır.

Sınırlayıcı prosedür

Bir olay verildiğinde B sıfır olasılık, formül işe yaramaz, ancak deneyebilir uygun olaylar dizisi için Bn sıfır olmayan olasılık öyle ki BnB (yani, ve ). Bir örnek verilmiştir yukarıda. İki örnek daha Brownian köprüsü ve Brownian gezisi.

Son iki örnekte, sadece tek bir olay (koşul) verildiği için toplam olasılık yasası ilgisizdir. Aksine, örnekte yukarıda toplam olasılık kanunu geçerlidir olaydan beri X = 0,5, bir olay ailesine dahil edilir X = x nerede x üzerinden geçer (−1,1) ve bu olaylar olasılık uzayının bir bölümüdür.

Paradokslardan kaçınmak için (örneğin Borel'in paradoksu ), aşağıdaki önemli ayrım dikkate alınmalıdır. Belirtilen bir olay sıfırdan farklı bir olasılığa sahipse, bu durumda koşullandırma iyi tanımlanmıştır (diğer olaylardan bağımsız olarak), belirtildiği gibi yukarıda. Aksine, eğer verilen olay sıfır olasılıklıysa, o zaman bazı ek girdi sağlanmadıkça koşullandırma yanlış tanımlanmıştır. Bu ek girdinin yanlış seçilmesi, yanlış koşullu olasılıklara (beklentiler, dağılımlar) yol açar. Bu manada, "olasılığı 0'a eşit olan izole edilmiş bir hipoteze ilişkin koşullu olasılık kavramı kabul edilemez." (Kolmogorov.[6]

Ek girdi (a) bir simetri (değişmezlik grubu); (b) bir dizi olay Bn öyle ki BnB, P ( Bn )> 0; (c) verilen olayı içeren bir bölüm. Ölçü-teorik şartlandırma (aşağıda) Durum (c) 'yi araştırır, genel olarak (b) ile ve uygulanabilir olduğunda (a) ile olan ilişkisini açıklar.

Sıfır olasılıklı bazı olaylar, şartlandırmanın ulaşamayacağı bir yerdedir. Bir örnek: let Xn (0,1) 'e eşit olarak dağıtılmış bağımsız rastgele değişkenler olabilir ve B olay "Xn → 0 gibi n → ∞"; ne dersin P ( Xn < 0.5 | B ) ? 1 eğilimi var mı değil mi? Başka bir örnek: let X (0,1) 'e eşit olarak dağıtılmış rastgele bir değişken olmak ve B olay "X rasyonel bir sayıdır "; peki ya P ( X = 1/n | B ) ? Tek cevap, bir kez daha

olasılığı 0'a eşit olan izole edilmiş bir hipoteze ilişkin koşullu olasılık kavramı kabul edilemez.

— Kolmogorov[6]

Ölçü teorisi düzeyinde koşullandırma

Misal. İzin Vermek Y (0,1) 'e eşit olarak dağıtılmış rastgele bir değişken olmak ve X = f(Y) nerede f belirli bir işlevdir. Aşağıda iki vaka ele alınmıştır: f = f1 ve f = f2, nerede f1 sürekli parçalı doğrusal fonksiyondur

ve f2 ... Weierstrass işlevi.

Geometrik sezgi: dikkat

Verilen X = 0.75, iki değer Y mümkündür, 0.25 ve 0.5. Her iki değerin de 0.5 koşullu olasılığa sahip olduğu aşikar görünebilir, çünkü bir nokta uyumlu başka bir noktaya. Ancak bu bir yanılsamadır; aşağıya bakınız.

Şartlı olasılık

Koşullu olasılık P ( Y ≤ 1/3 | X ) göstergenin en iyi öngörücüsü olarak tanımlanabilir

verilen X. Yani, ortalama kare hatasını en aza indirir E ( ben - g(X) )2 formun tüm rastgele değişkenlerinin sınıfında g (X).

Durumda f = f1 karşılık gelen işlev g = g1 açıkça hesaplanabilir,[ayrıntılar 1]

Alternatif olarak, sınırlama prosedürü kullanılabilir,

aynı sonucu veriyor.

Böylece, P ( Y ≤ 1/3 | X ) = g1 (X). Bu rastgele değişkenin beklentisi (koşulsuz) olasılığa eşittir, E (P ( Y ≤ 1/3 | X )) = P ( Y ≤ 1/3 ), yani,

bu bir örneği toplam olasılık kanunu E (P ( Bir | X )) = P ( Bir ).

Durumda f = f2 karşılık gelen işlev g = g2 muhtemelen açıkça hesaplanamaz. Yine de mevcuttur ve sayısal olarak hesaplanabilir. Nitekim Uzay L2 (Ω) kare integrallenebilir tüm rastgele değişkenlerin (Ω) bir Hilbert uzayı; gösterge ben bu uzayın bir vektörüdür; ve formun rastgele değişkenleri g (X) bir (kapalı, doğrusal) alt uzaydır. dikey projeksiyon Bu vektörün bu altuzay için iyi tanımlanmıştır. Kullanılarak sayısal olarak hesaplanabilir sonlu boyutlu yaklaşımlar sonsuz boyutlu Hilbert uzayına.

Bir kez daha, rastgele değişkenin beklentisi P ( Y ≤ 1/3 | X ) = g2 (X) (koşulsuz) olasılığa eşittir, E (P ( Y ≤ 1/3 | X )) = P ( Y ≤ 1/3 ), yani,

Bununla birlikte, Hilbert uzay yaklaşımı, g2 tek bir işlevden çok işlevlerin bir eşdeğerlik sınıfı olarak. Ölçülebilirliği g2 sağlanır, ancak süreklilik (veya hatta Riemann entegrasyonu ) değil. Değer g2 (0.5) benzersiz bir şekilde belirlenir, çünkü 0.5 noktası, dağılımın bir atomudur. X. Diğer değerler x atom değildir, dolayısıyla karşılık gelen değerler g2 (x) benzersiz olarak belirlenmez. Bir kere daha, "olasılığı 0'a eşit olan izole edilmiş bir hipoteze ilişkin koşullu olasılık kavramı kabul edilemez." (Kolmogorov.[6]

Alternatif olarak, aynı işlev g (öyle olsun g1 veya g2) olarak tanımlanabilir Radon-Nikodym türevi

μ, ν ölçüleri ile tanımlanır

tüm Borel setleri için Yani μ, (koşulsuz) dağılımıdır Xν, koşullu dağılımının üçte biri iken,

Her iki yaklaşım da (Hilbert uzayı ve Radon – Nikodym türevi aracılığıyla) g eşdeğerlik sınıfı olarak; iki işlev g ve g ′ eşdeğer olarak kabul edilir, eğer g (X) = g ′ (X) neredeyse kesin. Buna göre koşullu olasılık P ( Y ≤ 1/3 | X ) rastgele değişkenlerin bir eşdeğerlik sınıfı olarak ele alınır; her zamanki gibi, iki rastgele değişken neredeyse kesinlikle eşitlerse eşdeğer kabul edilir.

Koşullu beklenti

Koşullu beklenti en iyi öngörücü olarak tanımlanabilir Y verilen X. Yani, ortalama kare hatasını en aza indirir formun tüm rastgele değişkenlerinin sınıfında h(X).

Durumda f = f1 karşılık gelen işlev h = h1 açıkça hesaplanabilir,[ayrıntılar 2]

Alternatif olarak, sınırlama prosedürü kullanılabilir,

aynı sonucu veriyor.

Böylece, Bu rastgele değişkenin beklentisi (koşulsuz) beklentiye eşittir, yani,

bu bir örneği toplam beklenti kanunu

Durumda f = f2 karşılık gelen işlev h = h2 muhtemelen açıkça hesaplanamaz. Yine de mevcuttur ve aynı şekilde sayısal olarak hesaplanabilir g2 yukarıda - Hilbert uzayında ortogonal izdüşüm olarak. Toplam beklenti yasası geçerlidir, çünkü projeksiyon skaler ürünü altuzaya ait sabit 1 ile değiştiremez.

Alternatif olarak, aynı işlev h (öyle olsun h1 veya h2) olarak tanımlanabilir Radon-Nikodym türevi

μ, ν ölçüleri ile

tüm Borel setleri için Buraya koşullu beklenti ile karıştırılmaması gereken kısıtlı beklentidir

Koşullu dağıtım

Durumda f = f1 şartlı kümülatif dağılım fonksiyonu benzer şekilde açıkça hesaplanabilir g1. Sınırlama prosedürü şunları verir:

doğru olamaz, çünkü bir kümülatif dağılım işlevi sağ sürekli!

Bu paradoksal sonuç ölçü teorisi ile şu şekilde açıklanmaktadır. Verilen için y karşılık gelen fonksiyonların bir eşdeğerlik sınıfı olarak iyi tanımlanmıştır (Hilbert uzayı veya Radon-Nikodym türevi aracılığıyla) x). Bir işlevi olarak tedavi edildi y verilen için x bazı ek girdiler sağlanmadıkça yanlış tanımlanmıştır. Yani, bir fonksiyon x) her (veya en azından hemen hemen her) denklik sınıfında seçilmelidir. Yanlış seçim, yanlış koşullu kümülatif dağılım işlevlerine yol açar.

Aşağıdaki gibi doğru bir seçim yapılabilir. İlk, rasyonel sayılar için kabul edilir y sadece. (Diğer herhangi bir yoğun sayılabilir küme eşit derecede kullanılabilir.) Bu nedenle, yalnızca sayılabilir bir eşdeğerlik sınıfı kümesi kullanılır; Bu sınıflar içindeki tüm fonksiyon seçenekleri karşılıklı olarak eşdeğerdir ve ilgili fonksiyon rasyonel y iyi tanımlanmıştır (neredeyse her biri için x). İkincisi, fonksiyon, doğru süreklilik ile rasyonel sayılardan gerçek sayılara genişletilir.

Genel olarak şartlı dağılım hemen hemen tümü için tanımlanır x (dağılımına göre X), ancak bazen sonuç sürekli x, bu durumda bireysel değerler kabul edilebilir. Ele alınan örnekte durum budur; için doğru sonuç x = 0.75,

koşullu dağılımını gösterir Y verilen X = 0.75, sırasıyla 1/3 ve 2/3 olasılıklardan 0.25 ve 0.5 olan iki atomdan oluşur.

Benzer şekilde, koşullu dağılım tümü için hesaplanabilir x (0, 0.5) veya (0.5, 1).

Değer x = 0.5, dağılımının bir atomudur Xbu nedenle, karşılık gelen koşullu dağılım iyi tanımlanmıştır ve temel yöntemlerle hesaplanabilir (payda kaybolmaz); koşullu dağılımı Y verilen X = 0.5 (2/3, 1) üzerinde tek tiptir. Ölçüm teorisi aynı sonuca götürür.

Tüm koşullu dağılımların karışımı, (koşulsuz) dağılımıdır. Y.

Koşullu beklenti koşullu dağılıma ilişkin beklentiden başka bir şey değildir.

Durumda f = f2 karşılık gelen muhtemelen açıkça hesaplanamaz. Verilen için y fonksiyonların bir eşdeğerlik sınıfı olarak iyi tanımlanmıştır (Hilbert uzayı veya Radon – Nikodym türevi aracılığıyla) x). Bu denklik sınıfları içinde doğru fonksiyon seçimi yukarıdaki gibi yapılabilir; doğru koşullu kümülatif dağılım işlevlerine, dolayısıyla koşullu dağılımlara yol açar. Genel olarak, koşullu dağılımların atomik veya kesinlikle sürekli (ne de her iki türün karışımları). Muhtemelen, ele alınan örnekte bunlar tekil (gibi Kantor dağılımı ).

Bir kez daha, tüm koşullu dağılımların karışımı (koşulsuz) dağılımdır ve koşullu beklenti, koşullu dağılıma ilişkin beklentidir.

Teknik detaylar

  1. ^ Kanıt:
    not etmeye devam ediyor (1−a )2 + 2a2 asgari a = 1/3.
  2. ^ Kanıt:
    not etmeye devam ediyor
    asgari ve asgari

Ayrıca bakınız

Notlar

  1. ^ "Mathematica / Tekdüzen Küresel Dağıtım - Vikikitaplar, açık bir dünya için açık kitaplar". en.wikibooks.org. Alındı 2018-10-27.
  2. ^ Buchanan, K .; Huff, G.H. (Temmuz 2011). "Öklid uzayında geometrik olarak bağlı rasgele dizilerin karşılaştırması". 2011 IEEE Uluslararası Antenler ve Yayılma Sempozyumu (APSURSI): 2008–2011. doi:10.1109 / APS.2011.5996900. ISBN  978-1-4244-9563-4.
  3. ^ Buchanan, K .; Flores, C .; Wheeland, S .; Jensen, J .; Grayson, D .; Huff, G. (Mayıs 2017). "Dairesel olarak sivriltilmiş rasgele diziler kullanarak radar uygulamaları için hüzmelemeyi iletin". 2017 IEEE Radar Konferansı: 0112–0117. doi:10.1109 / RADAR.2017.7944181. ISBN  978-1-4673-8823-8.
  4. ^ Pollard 2002, Sect. 5.5, Örnek 17, sayfa 122.
  5. ^ Durrett 1996, Sect. 4.1 (a), Örnek 1.6 sayfa 224.
  6. ^ a b c d Pollard 2002, Sect. 5.5, sayfa 122.

Referanslar