Cayley-Hamilton teoremi - Cayley–Hamilton theorem

Arthur Cayley, F.R.S. (1821–1895), İngiltere'nin 19. yüzyılın önde gelen saf matematikçisi olarak kabul edilmektedir. Cayley 1848'de derslere katılmak için Dublin'e gitti kuaterniyonlar Hamilton, kaşifleri. Daha sonra Cayley, onlarla ilgili çalışmaları yayınlayan ikinci kişi olarak onu etkiledi.^[1] Cayley, iki boyutlu durum için kanıt yayınlayarak, boyut 3 ve daha küçük matrisler için teoremi kanıtladı.^[2]^[3] Gelince

n \times n

Cayley, matrisler, "... herhangi bir dereceden bir matrisin genel durumunda teoremin resmi bir ispatının işini üstlenmenin gerekli olduğunu düşünmemiştim" dedi.

William Rowan Hamilton (1805-1865), İrlandalı fizikçi, astronom ve matematikçi, Amerika'nın ilk yabancı üyesi Ulusal Bilimler Akademisi. Hamilton, geometrinin nasıl çalışılması gerektiği konusunda muhalif pozisyonu korurken, Cayley ile her zaman en iyi şartlarda kaldı.^[1]

Hamilton, doğrusal bir fonksiyon için kuaterniyonlar Doğrusal işleve bağlı olarak doğrusal işlevin kendisi tarafından karşılanan belirli bir denklem vardır.^[4]^[5]^[6]

İçinde lineer Cebir, Cayley-Hamilton teoremi (matematikçilerin adını almıştır Arthur Cayley ve William Rowan Hamilton ) her Kare matris üzerinde değişmeli halka (benzeri gerçek veya karmaşık alan ) kendini tatmin eder karakteristik denklem.

Eğer $Bir$ verilen $n \times n$ matris ve $ben n$ ... $n \times n$ kimlik matrisi, sonra karakteristik polinom nın-nin $Bir$ olarak tanımlanır^[7] ${ displaystyle p ( lambda) = det ( lambda I_ {n} -A)}$ , nerede $det$ ... belirleyici operasyon ve $λ$ bir değişken için skaler taban halkasının elemanı. Matrisin girişlerinden beri ${ displaystyle ( lambda I_ {n} -A)}$ polinomlar (doğrusal veya sabit) $λ$ belirleyici aynı zamanda bir $n$ -inci derece monik polinom içinde $λ$ ,

{ displaystyle p ( lambda) = lambda ^ {n} + c_ {n-1} lambda ^ {n-1} + cdots + c_ {1} lambda + c_ {0} ~.}

Analog bir polinom yaratılabilir

{ displaystyle p (A)}

matriste

Bir

skaler değişken yerine

λ

, olarak tanımlandı

{ displaystyle p (A) = A ^ {n} + c_ {n-1} A ^ {n-1} + cdots + c_ {1} A + c_ {0} I_ {n} ~.}

Cayley-Hamilton teoremi, bu polinomun, sıfır matris demek ki

{ displaystyle p (A) = mathbf {0}}

. Teorem izin verir

Bir

^$n$ alt matris güçlerinin doğrusal bir kombinasyonu olarak ifade edilecek

Bir

. Halka bir alan olduğunda, Cayley-Hamilton teoremi şu ifadeye eşdeğerdir: minimal polinom kare matrisin böler karakteristik polinomu. Teorem ilk olarak 1853'te kanıtlandı^[8] doğrusal fonksiyonların tersi açısından kuaterniyonlar, bir değişmez yüzük, Hamilton.^[4]^[5]^[6] Bu, belirli bir özel duruma karşılık gelir

4 \times 4

gerçek veya

2 \times 2

karmaşık matrisler. Teorem genel kuaterniyonik matrisler için geçerlidir.^[9]^{[nb 1]} Cayley, 1858'de şunu belirtti:

3 \times 3

ve daha küçük matrisler, ancak yalnızca

2 \times 2

durum.^[2] Genel durum ilk olarak Frobenius 1878'de.^[10]

Örnekler

$1\times1$ matrisler

Bir $1\times1$ matris $Bir = (a 1,1)$ karakteristik polinom şu şekilde verilir: $p (λ) = λ - a$ , ve bu yüzden $p (Bir) = (a) - a 1,1 = 0$ önemsizdir.

$2\times2$ matrisler

Somut bir örnek olarak,

{ displaystyle A = { begin {pmatrix} 1 ve 2 3 & 4 end {pmatrix}}.}

Karakteristik polinomu şu şekilde verilir:

{ displaystyle p ( lambda) = det ( lambda I_ {2} -A) = det { begin {pmatrix} lambda -1 ve -2 - 3 ve lambda -4 end {pmatrix}} = ( lambda -1) ( lambda -4) - (- 2) (- 3) = lambda ^ {2} -5 lambda -2.}

Cayley-Hamilton teoremi şunu iddia ediyor: tanımlamak

{ displaystyle p (X) = X ^ {2} -5X-2I_ {2},}

sonra

{ displaystyle p (A) = A ^ {2} -5A-2I_ {2} = { begin {pmatrix} 0 & 0 0 & 0 end {pmatrix}}.}

Bunu hesaplama yoluyla doğrulayabiliriz ki,

{ displaystyle A ^ {2} -5A-2I_ {2} = { begin {pmatrix} 7 & 10 15 & 22 end {pmatrix}} - { begin {pmatrix} 5 & 10 15 & 20 end { pmatrix}} - { begin {pmatrix} 2 & 0 0 & 2 end {pmatrix}} = { begin {pmatrix} 0 & 0 0 & 0 end {pmatrix}}.}

Jenerik için $2\times2$ matris,

{ displaystyle A = { begin {pmatrix} a & b c & d end {pmatrix}},}

karakteristik polinom şu şekilde verilir: $p (λ) = λ 2 - (a + d) λ + (reklam - M.Ö)$ , bu yüzden Cayley-Hamilton teoremi şunu belirtir:

{ displaystyle p (A) = A ^ {2} - (a + d) A + (ad-bc) I_ {2} = { begin {pmatrix} 0 & 0 0 & 0 end {pmatrix}};}

bu gerçekten de her zaman böyledir, $Bir$ ².

Başvurular

Belirleyici ve ters matris

Bir genel için $n \times n$ tersinir matris $Bir$ yani sıfırdan farklı bir belirleyiciye sahip olan, $Bir$ ⁻¹ böylece bir $(n - 1)$ -nci sipariş polinom ifadesi içinde $Bir$ : Belirtildiği gibi, Cayley-Hamilton teoremi özdeşlik

${ displaystyle p (A) = A ^ {n} + c_ {n-1} A ^ {n-1} + cdots + c_ {1} A + (- 1) ^ {n} det (A) I_ {n} = O.}$

Katsayılar $c ben$ tarafından verilir temel simetrik polinomlar özdeğerlerinin $Bir$ . Kullanma Newton kimlikleri temel simetrik polinomlar sırasıyla şu terimlerle ifade edilebilir: güç toplamı simetrik polinomları Özdeğerlerin:

{ displaystyle s_ {k} = toplam _ {i = 1} ^ {n} lambda _ {i} ^ {k} = operatöradı {tr} (A ^ {k}),}

nerede $tr (Bir k)$ ... iz matrisin $Bir k$ . Böylece ifade edebiliriz $c ben$ güçlerinin izi açısından $Bir$ .

Genel olarak katsayılar için formül $c ben$ tam üstel olarak verilir Bell polinomları gibi ^{[nb 2]}

{ displaystyle c_ {nk} = { frac {(-1) ^ {k}} {k!}} B_ {k} (s_ {1}, - 1! s_ {2}, 2! s_ {3} , ldots, (- 1) ^ {k-1} (k-1)! s_ {k}).}

Özellikle, determinantı $Bir$ eşittir $(-1) n c 0$ . Böylece determinant şu şekilde yazılabilir: iz kimliği:

{ displaystyle det (A) = { frac {1} {n!}} B_ {n} (s_ {1}, - 1! s_ {2}, 2! s_ {3}, ldots, (- 1) ^ {n-1} (n-1)! S_ {n}).}

Benzer şekilde, karakteristik polinom şu şekilde yazılabilir:

{ displaystyle - (- 1) ^ {n} det (A) I_ {n} = A (A ^ {n-1} + c_ {n-1} A ^ {n-2} + cdots + c_ {1} I_ {n}),}

ve her iki tarafı da ile çarparak $Bir -1$ (Not $-(-1) n = (-1) n -1$ ), biri tersi için bir ifadeye yönlendirilir $Bir$ iz kimlik olarak,

{ displaystyle { başlar {hizalı} A ^ {- 1} & = { frac {(-1) ^ {n-1}} { det A}} (A ^ {n-1} + c_ {n -1} A ^ {n-2} + cdots + c_ {1} I_ {n}), [5pt] & = { frac {1} { det A}} sum _ {k = 0 } ^ {n-1} (- 1) ^ {n + k-1} { frac {A ^ {nk-1}} {k!}} B_ {k} (s_ {1}, - 1! s_ {2}, 2! S_ {3}, ldots, (- 1) ^ {k-1} (k-1)! S_ {k}). End {hizalı}}}

Bu katsayıları elde etmek için başka bir yöntem $c k$ bir genel için $n \times n$ matris, kök sıfır olmaması koşuluyla, aşağıdaki alternatife dayanır determinant için ifade,

{ displaystyle p ( lambda) = det ( lambda I_ {n} -A) = lambda ^ {n} exp ( operatöradı {tr} ( log (I_ {n} -A / lambda) )).}

Bu nedenle, sayesinde Mercator serisi,

{ displaystyle p ( lambda) = lambda ^ {n} exp left (- operatorname {tr} toplam _ {m = 1} ^ { infty} {({A over lambda}) ^ {m} over m} sağ),}

üstel nerede sadece sipariş için genişletilmesi gerekiyor $λ - n$ , dan beri $p (λ)$ düzenlidir $n$ , net negatif güçleri $λ$ C – H teoremi tarafından otomatik olarak kaybolur. (Yine, bu, rasyonel sayıları içeren bir halka gerektirir.) Bu ifadenin, $λ$ genel için karakteristik polinomun katsayılarının ifade edilmesine izin verir $n$ belirleyicileri olarak $m \times m$ matrisler^{[nb 3]}

{ displaystyle c_ {nm} = { frac {(-1) ^ {m}} {m!}} { begin {vmatrix} operatorname {tr} A & m-1 & 0 & cdots operatorname {tr} A ^ {2} & operatorname {tr} A & m-2 & cdots vdots & vdots &&& vdots operatorname {tr} A ^ {m-1} & operatorname {tr} A ^ {m- 2} & cdots & cdots & 1 operatorname {tr} A ^ {m} & operatorname {tr} A ^ {m-1} & cdots & cdots & operatorname {tr} A end { vmatrix}} ~.}

Örnekler

Örneğin, ilk birkaç Bell polinomu $B 0$ = 1, $B 1 (x 1) = x 1$ , $B 2 (x 1, x 2) = x 21 + x 2$ , ve $B 3 (x 1, x 2, x 3) = x 31 + 3 x 1 x 2 + x 3$ .

Katsayıları belirlemek için bunları kullanma $c ben$ bir karakteristik polinomunun $2\times2$ matris verimleri

{ displaystyle { begin {align} c_ {2} = B_ {0} = 1, [4pt] c_ {1} = { frac {-1} {1!}} B_ {1} (s_ { 1}) = - s_ {1} = - operatöradı {tr} (A), [4pt] c_ {0} = { frac {1} {2!}} B_ {2} (s_ {1} , -1! S_ {2}) = { frac {1} {2}} (s_ {1} ^ {2} -s_ {2}) = { frac {1} {2}} (( operatöradı {tr} (A)) ^ {2} - operatöradı {tr} (A ^ {2})). end {hizalı}}}

Katsayı $c 0$ determinantını verir $2\times2$ matris, $c 1$ eksi izini, tersi ise

{ displaystyle A ^ {- 1} = { frac {-1} { det A}} (A + c_ {1} I_ {2}) = { frac {-2 (A- operatöradı {tr} (A) I_ {2})} {( operatöradı {tr} (A)) ^ {2} - operatöradı {tr} (A ^ {2})}}.}

Genel formülden anlaşılmaktadır. c_n-kBell polinomları cinsinden ifade edilen, ifadelerin

{ displaystyle - operatöradı {tr} (A) quad { text {ve}} quad { tfrac {1} {2}} ( operatöradı {tr} (A) ^ {2} - operatöradı { tr} (A ^ {2}))}

daima katsayıları ver $c n -1$ nın-nin $λ n -1$ ve $c n -2$ nın-nin $λ n -2$ herhangi bir karakteristik polinomda $n \times n$ sırasıyla matris. Yani, bir $3\times3$ matris $Bir$ Cayley-Hamilton teoreminin ifadesi şu şekilde de yazılabilir:

{ displaystyle A ^ {3} - ( operatöradı {tr} A) A ^ {2} + { frac {1} {2}} sol (( operatöradı {tr} A) ^ {2} - operatöradı {tr} (A ^ {2}) sağ) A- det (A) I_ {3} = O,}

sağ tarafın bir $3\times3$ tüm girişlerin sıfıra düşürüldüğü matris. Aynı şekilde, bu belirleyici $n = 3$ durum, şimdi

{ displaystyle { begin {align} det (A) & = { frac {1} {3!}} B_ {3} (s_ {1}, - 1! s_ {2}, 2! s_ {3 }) = { frac {1} {6}} (s_ {1} ^ {3} + 3s_ {1} (- s_ {2}) + 2s_ {3}) [5pt] & = { tfrac {1} {6}} left (( operatöradı {tr} A) ^ {3} -3 operatöradı {tr} (A ^ {2}) ( operatöradı {tr} A) +2 operatöradı {tr } (A ^ {3}) sağ). End {hizalı}}}

Bu ifade katsayının negatifini verir $c n -3$ nın-nin $λ n -3$ genel durumda, aşağıda görüldüğü gibi.

Benzer şekilde, bir kişi bir $4\times4$ matris $Bir$ ,

{ displaystyle A ^ {4} - ( operatöradı {tr} A) A ^ {3} + { tfrac {1} {2}} { bigl (} ( operatöradı {tr} A) ^ {2} - operatöradı {tr} (A ^ {2}) { bigr)} A ^ {2} - { tfrac {1} {6}} { bigl (} ( operatöradı {tr} A) ^ {3 } -3 operatöradı {tr} (A ^ {2}) ( operatöradı {tr} A) +2 operatöradı {tr} (A ^ {3}) { bigr)} A + det (A) I_ { 4} = O,}

belirleyici şimdi nerede $c n -4$ ,

{ displaystyle { tfrac {1} {24}} left (( operatöradı {tr} A) ^ {4} -6 operatöradı {tr} (A ^ {2}) ( operatöradı {tr} A) ^ {2} +3 ( operatöradı {tr} (A ^ {2})) ^ {2} +8 operatöradı {tr} (A ^ {3}) operatöradı {tr} (A) -6 operatöradı {tr} (A ^ {4}) sağ),}

ve daha büyük matrisler için böyle devam eder. Katsayılar için giderek karmaşıklaşan ifadeler $c k$ çıkarılabilir Newton'un kimlikleri ya da Faddeev – LeVerrier algoritması.

nmatrisin gücü

Cayley-Hamilton teoremi her zaman için güçler arasında bir ilişki sağlar $Bir$ (her zaman en basit olanı olmasa da), bu tür yetkileri içeren ifadeleri basitleştirmeye ve gücü hesaplamak zorunda kalmadan bunları değerlendirmeye izin verir. $Bir n$ veya daha yüksek yetkileri $Bir$ .

Örnek olarak ${ displaystyle A = { begin {pmatrix} 1 ve 2 3 ve 4 end {pmatrix}}}$ teorem verir

{ displaystyle A ^ {2} = 5A + 2I_ {2} ,.}

Sonra hesaplamak için $Bir 4$ , gözlemek

{ displaystyle A ^ {3} = (5A + 2I_ {2}) A = 5A ^ {2} + 2A = 5 (5A + 2I_ {2}) + 2A = 27A + 10I_ {2},}

{ displaystyle A ^ {4} = A ^ {3} A = (27A + 10I_ {2}) A = 27A ^ {2} + 10A = 27 (5A + 2I_ {2}) + 10A = 145A + 54I_ { 2} ,.}

Aynı şekilde,

{ displaystyle A ^ {- 1} = { frac {A-5I_ {2}} {2}} ~.}

Matris gücünü iki terimin toplamı olarak yazabildiğimize dikkat edin. Aslında, herhangi bir düzenin matris gücü $k$ en fazla derece matris polinomu olarak yazılabilir $n - 1$ , nerede $n$ kare matrisin boyutudur. Bu, Cayley-Hamilton teoreminin, aşağıda sistematik olarak tartışacağımız bir matris fonksiyonunu ifade etmek için kullanılabileceği bir durumdur.

Matris fonksiyonları

Analitik bir işlev verildiğinde

{ displaystyle f (x) = toplam _ {k = 0} ^ { infty} a_ {k} x ^ {k}}

ve karakteristik polinom $p (x)$ derece $n$ bir $n \times n$ matris $Bir$ fonksiyon uzun bölme kullanılarak ifade edilebilir.

{ displaystyle f (x) = q (x) p (x) + r (x),}

nerede $q (x)$ bazı bölüm polinomudur ve $r (x)$ kalan bir polinomdur öyle ki $0 derece r (x) < n$ .

Cayley-Hamilton teoremi ile değiştirilerek $x$ matrise göre $Bir$ verir $p (Bir) = 0$ Yani biri var

{ displaystyle f (A) = r (A).}

Böylece, matrisin analitik işlevi $Bir$ daha küçük bir derece matris polinomu olarak ifade edilebilir $n$ .

Kalan polinom olsun

{ displaystyle r (x) = c_ {0} + c_ {1} x + cdots + c_ {n-1} x ^ {n-1}.}

Dan beri $p (λ) = 0$ , işlevi değerlendirme $f (x)$ -de $n$ özdeğerleri $Bir$ , verim

{ displaystyle f ( lambda _ {i}) = r ( lambda _ {i}) = c_ {0} + c_ {1} lambda _ {i} + cdots + c_ {n-1} lambda _ {i} ^ {n-1}, qquad mathrm {for} qquad i = 1,2, ..., n.}

Bu bir sistem anlamına gelir $n$ katsayıları belirlemek için çözülebilen doğrusal denklemler $c ben$ . Böylece biri var

{ displaystyle f (A) = toplam _ {k = 0} ^ {n-1} c_ {k} A ^ {k}.}

Özdeğerler tekrarlandığında, yani $λ ben = λ j$ bazı $i \neq j$ iki veya daha fazla denklem aynıdır; ve bu nedenle doğrusal denklemler benzersiz bir şekilde çözülemez. Bu tür durumlar için, bir özdeğer için $λ$ çokluk ile $m$ , ilk $m - 1$ türevleri $p (x)$ özdeğerde kaybolur. Bu fazladan $m - 1$ doğrusal bağımsız çözümler

{ displaystyle { frac { mathrm {d} ^ {k} f (x)} { mathrm {d} x ^ {k}}} { Big |} _ {x = lambda} = { frac { mathrm {d} ^ {k} r (x)} { mathrm {d} x ^ {k}}} { Big |} _ {x = lambda} qquad { text {for}} qquad k = 1,2, ldots, m-1,}

diğerleriyle birleştirildiğinde gerekli olan $n$ çözülecek denklemler $c ben$ .

Noktalardan geçen bir polinom bulmak $(λ ben, f (λ ben))$ aslında bir enterpolasyon problemi ve kullanılarak çözülebilir Lagrange veya Newton enterpolasyonu teknikler Sylvester formülü.

Örneğin, görevin polinom temsilini bulmak olduğunu varsayalım.

{ displaystyle f (A) = e ^ {At} qquad mathrm {nerede} qquad A = { begin {pmatrix} 1 ve 2 0 & 3 end {pmatrix}}.}

Karakteristik polinom $p (x) = (x - 1)(x - 3) = x 2 - 4 x + 3$ ve özdeğerler $λ = 1, 3$ . İzin Vermek $r (x) = c 0 + c 1 x$ . Değerlendirme $f (λ) = r (λ)$ özdeğerlerde, iki doğrusal denklem elde edilir, $e t = c 0 + c 1$ ve $e 3 t = c 0 + 3 c 1$ .

Denklemlerin getirilerini çözme $c 0 = (3 e t - e 3 t)/2$ ve $c 1 = (e 3 t - e t)/2$ . Böylece, bunu takip eder

{ displaystyle e ^ {At} = c_ {0} I_ {2} + c_ {1} A = { begin {pmatrix} c_ {0} + c_ {1} & 2c_ {1} 0 & c_ {0} + 3c_ {1} end {pmatrix}} = { begin {pmatrix} e ^ {t} & e ^ {3t} -e ^ {t} 0 & e ^ {3t} end {pmatrix}}.}

Bunun yerine, işlev $f (Bir) = günah Şurada:$ , o zaman katsayılar olurdu $c 0 = (3 günah t - günah 3 t)/2$ ve $c 1 = (günah 3 t - günah t)/2$ ; dolayısıyla

{ displaystyle sin (At) = c_ {0} I_ {2} + c_ {1} A = { begin {pmatrix} sin t & sin 3t- sin t 0 ve sin 3t end {pmatrix }}.}

Başka bir örnek olarak,

{ displaystyle f (A) = e ^ {At} qquad mathrm {nerede} qquad A = { başlar {pmatrix} 0 ve 1 - 1 ve 0 end {pmatrix}},}

o zaman karakteristik polinom $p (x) = x 2 + 1$ ve özdeğerler $λ = \pm ben$ .

Daha önce olduğu gibi, fonksiyonu özdeğerlerde değerlendirmek bize doğrusal denklemleri verir $e o = c 0 + i c 1$ ve $e - o = c 0 - ic 1$ ; çözümü veren $c 0 = (e o + e - o) / 2 = çünkü t$ ve $c 1 = (e o - e - o)/2 ben = günah t$ . Böylece, bu durum için,

{ displaystyle e ^ {At} = ( cos t) I_ {2} + ( sin t) A = { başlar {pmatrix} cos t & sin t - sin t & cos t end { pmatrix}},}

hangisi bir rotasyon matrisi.

Bu tür kullanımların standart örnekleri, üstel harita -den Lie cebiri bir matris Lie grubu gruba. Tarafından verilir matris üstel,

{ displaystyle exp: { mathfrak {g}} rightarrow G; qquad tX mapsto e ^ {tX} = toplamı _ {n = 0} ^ { infty} { frac {t ^ {n} X ^ {n}} {n!}} = I + tX + { frac {t ^ {2} X ^ {2}} {2}} + cdots, t in mathbb {R}, X in { mathfrak {g}}.}

Bu tür ifadeler uzun zamandır bilinmektedir $SU (2)$ ,

{ displaystyle e ^ {ben ( theta / 2) ({ hat {n}} cdot sigma)} = I_ {2} cos theta / 2 + i ({ şapka {n}} cdot sigma) sin theta / 2,}

nerede $σ$ bunlar Pauli matrisleri ve için $SỐ 3)$ ,

{ displaystyle e ^ {i theta ({ hat {n}} cdot mathbf {J})} = I_ {3} + i ({ hat {n}} cdot mathbf {J}) sin theta + ({ hat {n}} cdot mathbf {J}) ^ {2} ( cos theta -1),}

hangisi Rodrigues'in rotasyon formülü. Gösterim için bkz. döndürme grubu SO (3) # Lie cebiri üzerine bir not.

Daha yakın zamanlarda, diğer gruplar için ifadeler ortaya çıktı. Lorentz grubu $SO (3; 1)$ ,^[11] $O (4; 2)$ ^[12] ve $SU (2; 2)$ ,^[13] Hem de $GL (n, R)$ .^[14] Grup $O (4; 2)$ ... konformal grup nın-nin boş zaman, $SU (2; 2)$ onun basitçe bağlı kapak (kesin olmak gerekirse, basitçe bağlanan kapak bağlı bileşen $YANİ + (4, 2)$ nın-nin $O (4; 2)$ ). Elde edilen ifadeler, bu grupların standart temsili için geçerlidir. Bilgi gerektirirler (bazıları) özdeğerler matrisin üssü. İçin $SU (2)$ (ve dolayısıyla $SỐ 3)$ ) için kapalı ifadeler alınmıştır herşey indirgenemez temsiller, yani herhangi bir dönüş.^[15]

Ferdinand Georg Frobenius (1849–1917), Alman matematikçi. Başlıca ilgi alanları eliptik fonksiyonlar, diferansiyel denklemler, ve sonra grup teorisi.
1878'de Cayley-Hamilton teoreminin ilk tam kanıtını verdi.^[10]

Cebirsel sayı teorisi

Cayley-Hamilton teoremi, cebirsel tamsayıların minimal polinomunu hesaplamak için etkili bir araçtır. Örneğin, sonlu bir uzantı verildiğinde ${ displaystyle mathbb {Q} [ alpha _ {1}, ldots, alpha _ {k}]}$ nın-nin ${ displaystyle mathbb {Q}}$ ve cebirsel bir tam sayı ${ displaystyle alpha in mathbb {Q} [ alpha _ {1}, ldots, alpha _ {k}]}$ sıfır olmayan doğrusal bir kombinasyon olan ${ displaystyle alpha _ {1} ^ {n_ {1}} cdots alpha _ {k} ^ {n_ {k}}}$ minimum polinomunu hesaplayabiliriz ${ displaystyle alpha}$ temsil eden bir matris bularak ${ displaystyle mathbb {Q}}$ -doğrusal dönüşüm

{ displaystyle cdot alpha: mathbb {Q} [ alpha _ {1}, ldots, alpha _ {k}] to mathbb {Q} [ alpha _ {1}, ldots, alfa _ {k}]}

Buna dönüşüm matrisi dersek ${ displaystyle A}$ , o zaman Cayley-Hamilton teoremini uygulayarak minimal polinomu bulabiliriz ${ displaystyle A}$ .^[16]

Kanıtlar

Cayley-Hamilton teoremi, varoluşunun acil bir sonucudur. Ürdün normal formu matrisler için cebirsel olarak kapalı alanlar. Bu bölümde doğrudan ispatlar sunulmaktadır.

Yukarıdaki örneklerin gösterdiği gibi, bir için Cayley-Hamilton teoreminin ifadesini elde etmek $n \times n$ matris

{ displaystyle A = (a_ {ij}) _ {i, j = 1} ^ {n}}

iki adım gerektirir: önce katsayılar $c ben$ karakteristik polinomun bir polinom olarak geliştirilmesi ile belirlenir. $t$ belirleyicinin

{ displaystyle { begin {align} p (t) & = det (tI_ {n} -A) = { begin {vmatrix} t-a_ {1,1} & - a_ {1,2} & cdots & -a_ {1, n} - a_ {2,1} & t-a_ {2,2} & cdots & -a_ {2, n} vdots & vdots & ddots & vdots - a_ {n, 1} & - a_ {n, 2} & cdots & t-a_ {n, n} end {vmatrix}} [5pt] & = t ^ {n} + c_ {n -1} t ^ {n-1} + cdots + c_ {1} t + c_ {0}, end {hizalı}}}

ve daha sonra bu katsayılar, güçlerin doğrusal bir kombinasyonunda kullanılır. $Bir$ bu eşittir $n \times n$ boş matris:

{ displaystyle A ^ {n} + c_ {n-1} A ^ {n-1} + cdots + c_ {1} A + c_ {0} I_ {n} = { begin {pmatrix} 0 & cdots & 0 vdots & ddots & vdots 0 & cdots & 0 end {pmatrix}}.}

Sol taraf, bir $n \times n$ girişleri giriş kümesindeki (muazzam) polinom ifadeler olan matris $a ben, j$ nın-nin $Bir$ , bu nedenle Cayley-Hamilton teoremi bunların her birinin $n 2$ ifadeler eşittir $0$ . Herhangi bir sabit değer için $n$ , bu kimlikler sıkıcı ama basit cebirsel manipülasyonlarla elde edilebilir. Bununla birlikte, bu hesaplamaların hiçbiri, Cayley-Hamilton teoreminin tüm olası boyutlardaki matrisler için neden geçerli olması gerektiğini gösteremez. $n$ yani herkes için tek tip bir kanıt $n$ gereklidir.

Ön bilgiler

Eğer bir vektör $v$ boyut $n$ bir özvektör nın-nin $Bir$ özdeğer ile $λ$ başka bir deyişle $Bir \cdot v = λv$ , sonra

{ displaystyle { begin {align} p (A) cdot v & = A ^ {n} cdot v + c_ {n-1} A ^ {n-1} cdot v + cdots + c_ {1} A cdot v + c_ {0} I_ {n} cdot v [6pt] & = lambda ^ {n} v + c_ {n-1} lambda ^ {n-1} v + cdots + c_ { 1} lambda v + c_ {0} v = p ( lambda) v, end {hizalı}}}

o zamandan beri boş vektör olan $p (λ) = 0$ (özdeğerleri $Bir$ tam olarak kökler nın-nin $p (t)$ ). Bu, tüm olası özdeğerler için geçerlidir $λ$ , bu nedenle teoremin eşitlediği iki matris, herhangi bir özvektöre uygulandığında kesinlikle aynı (boş) sonucu verir. Şimdi eğer $Bir$ itiraf ediyor temel özvektörler, başka bir deyişle $Bir$ dır-dir köşegenleştirilebilir, daha sonra Cayley-Hamilton teoremi geçerli olmalıdır $Bir$ çünkü bir tabanın her bir elemanına uygulandığında aynı değerleri veren iki matris eşit olmalıdır.

{ displaystyle A = XDX ^ {- 1}, quad D = operatöradı {diag} ( lambda _ {i}), quad i = 1,2, ..., n}

{ displaystyle p_ {A} ( lambda) = | lambda I-A | =}

özdeğerlerinin çarpımı

{ displaystyle lambda IA ​​= prod _ {i = 1} ^ {n} ( lambda - lambda _ {i}) eşdeğeri toplamı _ {k = 0} ^ {n} c_ {k} lambda ^ {k}}

{ displaystyle p_ {A} (A) = toplamı c_ {k} A ^ {k} = Xp_ {A} (D) X ^ {- 1} = XCX ^ {- 1}}

{ displaystyle C_ {ii} = toplam _ {k = 0} ^ {n} c_ {k} lambda _ {i} ^ {k} = prod _ {j = 1} ^ {n} ( lambda _ {i} - lambda _ {j}) = 0, qquad C_ {i, j neq i} = 0}

{ displaystyle dolayısıyla p_ {A} (A) = XCX ^ {- 1} = O.}

Şimdi işlevi düşünün ${ displaystyle e iki nokta M_ {n} - M_ {n}}$ hangi haritalar ${ displaystyle n kere n}$ matrisler ${ displaystyle n kere n}$ formülle verilen matrisler ${ displaystyle e (A) = p_ {A} (A)}$ , yani bir matris alan ${ displaystyle A}$ ve onu kendi karakteristik polinomuna yerleştirir. Tüm matrisler köşegenleştirilemez, ancak karmaşık katsayılara sahip matrisler için çoğu şu şekildedir: ${ displaystyle D}$ belirli bir büyüklükteki köşegenleştirilebilir karmaşık kare matrisler yoğun tüm bu kare matrisler kümesinde^[17] (bir matrisin köşegenleştirilebilir olması için, örneğin karakteristik polinomunun herhangi bir çoklu köke sahip olmaması yeterlidir). Şimdi bir işlev olarak görülüyor ${ displaystyle e iki nokta üst üste mathbb {C} ^ {n ^ {2}} - mathbb {C} ^ {n ^ {2}}}$ (matrisler ${ displaystyle n ^ {2}}$ girişler) bu işlevin sürekli. Bu doğrudur, çünkü bir matrisin görüntüsünün girdileri, matrisin girdilerindeki polinomlarla verilir. Dan beri

${ displaystyle e (D) = sol {{ begin {pmatrix} 0 & cdots & 0 vdots & ddots & vdots 0 & cdots & 0 end {pmatrix}} sağ }}$

ve setten beri ${ displaystyle D}$ yoğun, süreklilik nedeniyle bu işlevin tüm kümesini eşlemesi gerekir ${ displaystyle n kere n}$ sıfır matrisine matrisler. Bu nedenle, Cayley-Hamilton teoremi karmaşık sayılar için doğrudur ve bu nedenle de geçerli olmalıdır ${ displaystyle mathbb {Q}}$ - veya ${ displaystyle mathbb {R}}$ değerli matrisler.

Bu geçerli bir kanıt sunsa da, teoremin temsil ettiği kimlikler hiçbir şekilde matrisin doğasına (köşegenleştirilebilir veya değil) veya izin verilen girişlerin türüne (matrisler için) bağlı olmadığından, argüman pek tatmin edici değildir. köşegenleştirilebilir olan gerçek girdiler yoğun bir küme oluşturmazlar ve Cayley-Hamilton teoreminin onlar için geçerli olduğunu görmek için karmaşık matrisleri dikkate almak garip görünmektedir). Bu nedenle, şimdi yalnızca cebirsel manipülasyonları kullanan herhangi bir matris için teoremi doğrudan kanıtlayan argümanları ele alacağız; bunlar aynı zamanda herhangi bir girdide matrisler için çalışma avantajına sahiptir. değişmeli halka.

Cayley-Hamilton teoreminin çok çeşitli bu tür ispatları vardır ve bunlardan birkaçı burada verilecektir. İspatı anlamak için gereken soyut cebirsel kavramların miktarında farklılık gösterirler. En basit ispatlar, teoremi formüle etmek için gereken kavramları kullanır (matrisler, sayısal girişli polinomlar, determinantlar), ancak tam olarak doğru sonuca götürdükleri gerçeğini biraz gizemli kılan teknik hesaplamaları içerir. Bu tür ayrıntılardan kaçınmak mümkündür, ancak daha ince cebirsel kavramları dahil etme pahasına: değişmeli olmayan bir halkada katsayıları olan polinomlar veya alışılmadık türde girdilere sahip matrisler.

Bitişik matrisler

Aşağıdaki tüm kanıtlar, ek matris $adj (M)$ bir $n \times n$ matris $M$ , değiştirmek onun kofaktör matrisi.

Bu, katsayıları katsayılarında polinom ifadeleriyle verilen bir matristir. $M$ (aslında, kesin olarak $(n - 1)\times(n - 1)$ belirleyiciler), aşağıdaki temel ilişkilerin geçerli olacağı şekilde,

{ displaystyle operatorname {adj} (M) cdot M = det (M) I_ {n} = M cdot operatöradı {adj} (M) ~.}

Bu ilişkiler, belirleyicilerin temel özelliklerinin doğrudan bir sonucudur: $(ben, j)$ Soldaki matris ürününün girişi sütuna göre genişletmeyi verir $j$ elde edilen matrisin determinantının $M$ sütunu değiştirerek $ben$ sütunun bir kopyası ile $j$ , hangisi $det (M)$ Eğer $ben = j$ ve aksi takdirde sıfır; sağdaki matris çarpımı benzerdir, ancak satırlara göre genişletmeler içindir.

Sadece cebirsel ifade manipülasyonunun bir sonucu olan bu ilişkiler, herhangi bir değişmeli halkada girişleri olan matrisler için geçerlidir (belirleyicilerin ilk etapta tanımlanması için değişme varsayılmalıdır). Burada not etmek önemlidir, çünkü bu ilişkiler aşağıda polinomlar gibi sayısal olmayan girdilere sahip matrisler için uygulanacaktır.

Doğrudan cebirsel bir kanıt

Bu ispat, Cayley-Hamilton teoremini formüle etmek için gereken türden nesneleri kullanır: giriş olarak polinomlu matrisler. Matris $t ben n - Bir$ determinantının karakteristik polinomu olan $Bir$ böyle bir matristir ve polinomlar değişmeli bir halka oluşturduğundan, bir tamamlayıcı

{ displaystyle B = operatöradı {adj} (tI_ {n} -A).}

Öyleyse, tamamlayıcı maddenin sağ-el temel ilişkisine göre, birinin

{ displaystyle (tI_ {n} -A) B = det (tI_ {n} -A) I_ {n} = p (t) I_ {n} ~.}

Dan beri $B$ aynı zamanda polinomlu bir matristir $t$ giriş olarak, her biri için $ben$ katsayılarını toplayın $t ben$ bir matris oluşturmak için her girişte $B ben$ sayıların, öyle ki birinin

{ displaystyle B = toplam _ {i = 0} ^ {n-1} t ^ {i} B_ {i} ~.}

(Girişlerin yolu $B$ tanımlanmış, hiçbir gücün daha yüksek olmadığını $t n -1$ oluşur). Bu iken görünüyor Katsayı olarak matrisleri olan bir polinom gibi, böyle bir kavramı dikkate almayacağız; bu, polinom girdileriyle doğrusal bir kombinasyon olarak bir matris yazmanın bir yoludur. $n$ sabit matrisler ve katsayı $t ben$ bu bakış açısını vurgulamak için matrisin soluna yazılmıştır.

Şimdi, denklemimizdeki matris çarpımı iki doğrusallıkla genişletilebilir

{ displaystyle { başlar {hizalı} p (t) I_ {n} & = (tI_ {n} -A) B & = (tI_ {n} -A) toplamı _ {i = 0} ^ { n-1} t ^ {i} B_ {i} & = toplam _ {i = 0} ^ {n-1} tI_ {n} cdot t ^ {i} B_ {i} - toplam _ {i = 0} ^ {n-1} A cdot t ^ {i} B_ {i} & = sum _ {i = 0} ^ {n-1} t ^ {i + 1} B_ { i} - toplam _ {i = 0} ^ {n-1} t ^ {i} AB_ {i} & = t ^ {n} B_ {n-1} + toplam _ {i = 1} ^ {n-1} t ^ {i} (B_ {i-1} -AB_ {i}) - AB_ {0} ~. end {hizalı}}}

yazı

{ displaystyle p (t) I_ {n} = t ^ {n} I_ {n} + t ^ {n-1} c_ {n-1} I_ {n} + cdots + tc_ {1} I_ {n } + c_ {0} I_ {n} ~,}

Biri, polinom girdileri olan iki matrisin eşitliğini elde eder, sabit matrislerin doğrusal kombinasyonları olarak yazılır. $t$ katsayılar olarak.

Böyle bir eşitlik, ancak herhangi bir matris konumunda belirli bir kuvvetle çarpılan girdiyi tutabilir. $t ben$ her iki tarafta da aynıdır; katsayılı sabit matrislerin $t ben$ her iki ifadede de eşit olmalıdır. O zaman bu denklemleri yazmak $ben$ itibaren $n$ 0'a kadar, biri bulur

{ displaystyle B_ {n-1} = I_ {n}, qquad B_ {i-1} -AB_ {i} = c_ {i} I_ {n} quad { text {for}} 1 leq i leq n-1, qquad -AB_ {0} = c_ {0} I_ {n} ~.}

Son olarak, katsayılarının denklemini çarpın $t ben$ tarafından soldan $Bir ben$ ve özetleyin:

${ textstyle A ^ {n} B_ {n-1} + sum limits _ {i = 1} ^ {n-1} left (A ^ {i} B_ {i-1} -A ^ {i +1} B_ {i} sağ) -AB_ {0} = A ^ {n} + c_ {n-1} A ^ {n-1} + cdots + c_ {1} A + c_ {0} I_ {n} ~.}$

Sol taraflar bir teleskop toplamı ve tamamen iptal edin; sağ tarafın toplamı ${ displaystyle p (A)}$ :

{ displaystyle 0 = p (A) ~.}

Bu kanıtı tamamlar.

Matris katsayılı polinomların kullanıldığı bir kanıt

Bu ispat ilkine benzer, ancak bu ispatta geçen ifadelerin önerdiği matris katsayıları ile polinom kavramına anlam vermeye çalışır. Değişmeli olmayan bir halkada katsayıları olan polinomları dikkate almak biraz alışılmadık olduğundan ve değişmeli polinomlar için geçerli olan tüm muhakeme bu ortamda uygulanamayacağından, bu önemli bir özen gerektirir.

Özellikle, değişmeli bir halka üzerindeki polinomların aritmetiği, polinom fonksiyonları, bu, değişmeli olmayan bir halka için geçerli değildir (gerçekte, bu durumda çarpma altında kapanan açık bir polinom fonksiyonu kavramı yoktur). Yani polinomları göz önünde bulundururken $t$ matris katsayıları ile değişken $t$ "bilinmeyen" olarak düşünülmemeli, verilen kurallara göre manipüle edilecek resmi bir sembol olarak düşünülmelidir; özellikle sadece ayarlanamaz $t$ belirli bir değere.

{ displaystyle (f + g) (x) = toplamı _ {i} sol (f_ {i} + g_ {i} sağ) x ^ {i} = toplamı _ {i} {f_ {i} x ^ {i}} + toplam _ {i} {g_ {i} x ^ {i}} = f (x) + g (x).}

İzin Vermek ${ displaystyle M (n, R)}$ yüzüğü olmak ${ displaystyle n kere n}$ bazı halkalarda girişli matrisler R (gerçek veya karmaşık sayılar gibi) $Bir$ bir unsur olarak. Katsayıları polinomları olan matrisler $t$ , gibi ${ displaystyle tI_ {n} -A}$ veya onun eki B ilk kanıtta, ${ displaystyle M (n, R [t])}$ .

Gibi güçleri toplayarak $t$ , bu tür matrisler "polinomlar" olarak yazılabilir $t$ katsayı olarak sabit matrislerle; yazmak ${ displaystyle M (n, R) [t]}$ bu tür polinomlar kümesi için. Bu set, ${ displaystyle M (n, R [t])}$ buna karşılık gelen aritmetik işlemler tanımlanır, özellikle çarpma şu şekilde verilir:

{ displaystyle sol ( toplamı _ {i} M_ {i} t ^ {i} sağ) sol ( toplamı _ {j} N_ {j} t ^ {j} sağ) = toplamı _ { i, j} (M_ {i} N_ {j}) t ^ {i + j},}

iki işlenenden katsayı matrislerinin sırasına göre; Açıkça bu, değişmeli olmayan bir çarpma verir.

Böylece kimlik

{ displaystyle (tI_ {n} -A) B = p (t) I_ {n}.}

ilk kanıttan, öğelerin çarpımını içeren bir kanıt olarak görülebilir. ${ displaystyle M (n, R) [t]}$ .

Bu noktada, basitçe ayarlamak cazip geliyor $t$ matrise eşit $Bir$ , soldaki ilk çarpanı sıfır matrise eşit yapar ve sağ taraf da şuna eşittir: $p (Bir)$ ; ancak, katsayılar gidip gelmediğinde bu izin verilen bir işlem değildir. Bir "sağ değerlendirme haritası" tanımlamak mümkündür._$Bir$ : M[t] → Mher birinin yerini alan t^ben matris gücüyle $Bir$ ^ben nın-nin $Bir$ , burada gücün her zaman sağda karşılık gelen katsayı ile çarpılması şart koşulmaktadır.

Ancak bu harita halka bir homomorfizm değildir: bir ürünün doğru değerlendirmesi, genel olarak doğru değerlendirmelerin ürününden farklıdır. Bunun nedeni, polinomların matris katsayıları ile çarpılmasının bilinmeyenleri içeren ifadelerin çarpımını modellememesidir: bir ürün ${ displaystyle Mt ^ {i} Nt ^ {j} = (M cdot N) t ^ {i + j}}$ varsayımıyla tanımlanır $t$ ile gidip gelir $N$ , ancak bu başarısız olabilir $t$ matris ile değiştirilir $Bir$ .

Yukarıdaki sağ değerlendirme haritası, matrisin halka homomorfizmine dönüştüğü için, eldeki belirli durumda bu zorluğun üstesinden gelinebilir. $Bir$ içinde merkez katsayılar halkasının, polinomların tüm katsayıları ile değişmesi için (bunu kanıtlayan argüman, tam olarak $t$ katsayıları artık değerlendirmeden sonra doğrulanmıştır).

Şimdi, $Bir$ her zaman merkezinde değil Mama değiştirebiliriz M söz konusu polinomların tüm katsayılarını içermesi koşuluyla daha küçük bir halka ile: ${ displaystyle I_ {n}}$ , $Bir$ ve katsayılar ${ displaystyle B_ {i}}$ polinomun B. Böyle bir alt grup için bariz seçim, merkezleyici Z nın-nin $Bir$ ile değişen tüm matrislerin alt halkası $Bir$ ; tanım olarak $Bir$ merkezinde Z.

Bu merkezleyici açıkça şunları içerir: ${ displaystyle I_ {n}}$ , ve $Bir$ , ancak matrisleri içerdiğini göstermeli ${ displaystyle B_ {i}}$ . Bunu yapmak için, yardımcılar için iki temel ilişki birleştirilir ve ek B polinom olarak:

{ displaystyle { başla {hizalı} sol ( toplam _ {i = 0} ^ {m} B_ {i} t ^ {i} sağ) (tI_ {n} -A) & = (tI_ {n } -A) toplam _ {i = 0} ^ {m} B_ {i} t ^ {i} toplam _ {i = 0} ^ {m} B_ {i} t ^ {i + 1} - toplam _ {i = 0} ^ {m} B_ {i} At ^ {i} & = toplam _ {i = 0} ^ {m} B_ {i} t ^ {i + 1} - toplam _ {i = 0} ^ {m} AB_ {i} t ^ {i} toplam _ {i = 0} ^ {m} B_ {i} At ^ {i} & = toplam _ {i = 0} ^ {m} AB_ {i} t ^ {i}. End {hizalı}}}

Katsayıları eşitleme her biri için ben, sahibiz $Bir$ B_ben = B_ben $Bir$ istediğiniz gibi. Ev sahipliğinde uygun ayarı bulduktan sonra_$Bir$ gerçekten de halkaların homomorfizmidir, ispat yukarıda önerildiği gibi tamamlanabilir:

{ displaystyle { begin {align} operatorname {ev} _ {A} { bigl (} p (t) I_ {n} { bigr)} & = operatorname {ev} _ {A} ((tI_ {n} -A) B) [5pt] p (A) & = operatöradı {ev} _ {A} (tI_ {n} -A) cdot operatöradı {ev} _ {A} (B) [5pt] p (A) & = (AI_ {n} -A) cdot operatöradı {ev} _ {A} (B) = O cdot operatöradı {ev} _ {A} (B) = O. end {hizalı}}}

Bu kanıtı tamamlar.

İlk iki ispatın bir sentezi

İlk ispatta katsayıları belirleyebildi $B ben$ nın-nin $B$ sadece tamamlayıcı için sağ taraftaki temel ilişkiye dayanır. Aslında ilk $n$ türetilen denklemler bölümü belirlerken yorumlanabilir $B$ of Öklid bölümü polinomun $p (t) ben n$ solda monik polinom $ben n t - Bir$ son denklem ise kalanın sıfır olduğu gerçeğini ifade etmektedir. Bu bölme, matris katsayıları olan polinomlar halkasında gerçekleştirilir. Aslında, değişmeyen bir halka üzerinde bile, tekli bir polinom ile Öklid bölünmesi $P$ tanımlanır ve her zaman benzersiz bir bölüm üretir ve her zaman değişmeli durumda olduğu gibi aynı derece koşulda kalır, kişinin hangi tarafta istediği belirtilmişse $P$ bir faktör olmak (burada solda).

Bölümün ve kalanın benzersiz olduğunu görmek için (buradaki ifadenin önemli kısmı budur), yazmak yeterlidir ${ displaystyle PQ + r = PQ '+ r'}$ gibi ${ displaystyle P (Q-Q ') = r'-r}$ ve o zamandan beri gözlemle $P$ monik $P (Q - Q ')$ bundan daha düşük bir dereceye sahip olamaz $P$ , sürece $Q = Q '$ .

Ama temettü $p (t) ben n$ ve bölen $ben n t - Bir$ burada kullanılan her ikisi de alt ringde yatıyor $(R [Bir])[t]$ , nerede $R [Bir]$ matris halkasının alt halkasıdır $M (n, R)$ tarafından oluşturuldu $Bir$ : $R$ tüm güçlerinin doğrusal aralığı $Bir$ . Bu nedenle, Öklid bölünmesi aslında bunun içinde yapılabilir. değişmeli polinom halkası ve tabii ki o zaman aynı bölümü verir $B$ ve daha büyük halkadaki gibi kalan 0; özellikle bu gösteriyor ki $B$ aslında yatıyor $(R [Bir])[t]$ .

Ancak, bu değişmeli ayarda, $t$ -e $Bir$ denklemde

{ displaystyle p (t) I_ {n} = (tI_ {n} -A) B;}

başka bir deyişle, değerlendirme haritasını uygulamak

{ displaystyle operatorname {ev} _ {A} :( R [A]) [t] - R [A]}

bir halka homomorfizmi olan

{ displaystyle p (A) = 0 cdot operatöradı {ev} _ {A} (B) = 0}

tıpkı ikinci ispatta olduğu gibi, istenildiği gibi.

Teoremi kanıtlamaya ek olarak, yukarıdaki argüman bize katsayıların $B ben$ nın-nin $B$ polinomlar $Bir$ ikinci kanıttan sadece merkezileştiricide yattıklarını biliyorduk. $Z$ nın-nin $Bir$ ; Genel olarak $Z$ daha büyük bir alt zincirdir $R [Bir]$ ve mutlaka değişmeli değil. Özellikle sabit terim $B 0 = adj (- Bir)$ yatıyor $R [Bir]$ . Dan beri $Bir$ keyfi bir kare matristir, bu kanıtlıyor $adj (Bir)$ her zaman bir polinom olarak ifade edilebilir $Bir$ (bağlı katsayılarla $Bir)$ .

Aslında, ilk ispatta bulunan denklemler art arda ifade etmeye izin verir ${ displaystyle B_ {n-1}, ldots, B_ {1}, B_ {0}}$ polinomlar olarak $Bir$ kimliğe götüren

${ displaystyle operatorname {adj} (-A) = toplam _ {i = 1} ^ {n} c_ {i} A ^ {i-1},}$

herkes için geçerli $n \times n$ matrisler, nerede

{ displaystyle p (t) = t ^ {n} + c_ {n-1} t ^ {n-1} + cdots + c_ {1} t + c_ {0}}

karakteristik polinomudur $Bir$ .

Bu kimliğin aynı zamanda Cayley-Hamilton teoreminin ifadesini de ifade ettiğini unutmayın: biri hareket edebilir $adj (- Bir)$ sağ tarafta, elde edilen denklemi (solda veya sağda) ile çarpın $Bir$ ve şu gerçeği kullanın

{ displaystyle -A cdot operatöradı {adj} (-A) = operatöradı {adj} (-A) cdot (-A) = det (-A) I_ {n} = c_ {0} I_ { n}.}

Endomorfizm matrislerini kullanan bir kanıt

Yukarıda bahsedildiği gibi, matris p(Bir) teoremin ifadesinde, önce determinantın değerlendirilmesi ve ardından matrisin ikame edilmesi ile elde edilir. Bir için t; bu ikameyi matrise yapmak ${ displaystyle tI_ {n} -A}$ determinantı değerlendirmeden önce anlamlı değildir. Yine de nerede bir yorum yapmak mümkündür p(Bir) doğrudan belirli bir determinantın değeri olarak elde edilir, ancak bu daha karmaşık bir ayar gerektirir, bir halka üzerindeki matrislerden biri, her iki girişi de yorumlayabilir ${ displaystyle A_ {i, j}}$ nın-nin Birve tümü Bir kendisi. Bunun için yüzüğü alabilirsin M(n, R) nın-nin n×n matrisler bitti R, giriş nerede ${ displaystyle A_ {i, j}}$ olarak gerçekleştirildi ${ displaystyle A_ {i, j} I_ {n}}$ , ve Bir kendisi gibi. Ancak matrisler içeren matrisleri girişler olarak düşünmek, blok matrisler, which is not intended, as that gives the wrong notion of determinant (recall that the determinant of a matrix is defined as a sum of products of its entries, and in the case of a block matrix this is generally not the same as the corresponding sum of products of its blocks!). It is clearer to distinguish Bir from the endomorphism φ bir n-dimensional vector space V (or free R-module if R is not a field) defined by it in a basis ${displaystyle e_{1},ldots ,e_{n}}$ , and to take matrices over the ring End(V) of all such endomorphisms. Sonra φ ∈ Bitir (V) is a possible matrix entry, while Bir designates the element of M(n, End(V)) whose ben,j entry is endomorphism of scalar multiplication by ${displaystyle A_{i,j}}$ ; benzer şekilde ${ displaystyle I_ {n}}$ will be interpreted as element of M(n, End(V)). However, since End(V) is not a commutative ring, no determinant is defined on M(n, End(V)); this can only be done for matrices over a commutative subring of End(V). Now the entries of the matrix ${displaystyle varphi I_{n}-A}$ all lie in the subring R[φ] generated by the identity and φ, which is commutative. Then a determinant map M(n, R[φ]) → R[φ] is defined, and ${displaystyle det(varphi I_{n}-A)}$ evaluates to the value p(φ) of the characteristic polynomial of Bir -de φ (this holds independently of the relation between Bir ve φ); the Cayley–Hamilton theorem states that p(φ) is the null endomorphism.

In this form, the following proof can be obtained from that of (Atiyah & MacDonald 1969, Prop. 2.4) (which in fact is the more general statement related to the Nakayama lemma; one takes for the ideal in that proposition the whole ring R). Gerçeği Bir is the matrix of φ in the basis e₁, ..., e_n anlamına gelir

{displaystyle varphi (e_{i})=sum _{j=1}^{n}A_{j,i}e_{j}quad { ext{for }}i=1,ldots ,n.}

One can interpret these as n components of one equation in Vⁿ, whose members can be written using the matrix-vector product M(n, End(V)) × Vⁿ → Vⁿ that is defined as usual, but with individual entries ψ ∈ Bitir (V) ve v içinde V being "multiplied" by forming ${displaystyle psi (v)}$ ; this gives:

{displaystyle varphi I_{n}cdot E=A^{operatorname {tr} }cdot E,}

nerede ${displaystyle Ein V^{n}}$ is the element whose component ben dır-dir e_ben (in other words it is the basis e₁, ..., e_n nın-nin V written as a column of vectors). Writing this equation as

{displaystyle (varphi I_{n}-A^{operatorname {tr} })cdot E=0in V^{n}}

one recognizes the değiştirmek matrisin ${displaystyle varphi I_{n}-A}$ considered above, and its determinant (as element of M(n, R[φ])) is also p(φ). To derive from this equation that p(φ) = 0 ∈ End(V), one left-multiplies by the adjugate matrix nın-nin ${displaystyle varphi I_{n}-A^{operatorname {tr} }}$ , which is defined in the matrix ring M(n, R[φ]), giving

{displaystyle {egin{aligned}0&=operatorname {adj} (varphi I_{n}-A^{operatorname {tr} })cdot ((varphi I_{n}-A^{operatorname {tr} })cdot E)&=(operatorname {adj} (varphi I_{n}-A^{operatorname {tr} })cdot (varphi I_{n}-A^{operatorname {tr} }))cdot E&=(det(varphi I_{n}-A^{operatorname {tr} })I_{n})cdot E&=(p(varphi )I_{n})cdot E;end{aligned}}}

the associativity of matrix-matrix and matrix-vector multiplication used in the first step is a purely formal property of those operations, independent of the nature of the entries. Now component ben of this equation says that p(φ)(e_ben) = 0 ∈ V; Böylece p(φ) vanishes on all e_ben, and since these elements generate V onu takip eder p(φ) = 0 ∈ End(V), completing the proof.

One additional fact that follows from this proof is that the matrix Bir whose characteristic polynomial is taken need not be identical to the value φ substituted into that polynomial; it suffices that φ be an endomorphism of V satisfying the initial equations

{displaystyle varphi (e_{i})=sum _{j}A_{j,i}e_{j}}

için biraz sequence of elements e₁,...,e_n that generate V (which space might have smaller dimension than n, or in case the ring R is not a field it might not be a ücretsiz modül at all).

A bogus "proof": p(Bir) = det (AI_n − Bir) = det (Bir − Bir) = 0

One persistent elementary but yanlış tartışma^[18] for the theorem is to "simply" take the definition

{ displaystyle p ( lambda) = det ( lambda I_ {n} -A)}

ve ikame $Bir$ için $λ$ , elde etme

{displaystyle p(A)=det(AI_{n}-A)=det(A-A)=0~.}

There are many ways to see why this argument is wrong. First, in Cayley–Hamilton theorem, p(Bir) bir n×n matrix. However, the right hand side of the above equation is the value of a determinant, which is a skaler. So they cannot be equated unless n = 1 (i.e. Bir is just a scalar). Second, in the expression ${displaystyle det(lambda I_{n}-A)}$ , the variable λ actually occurs at the diagonal entries of the matrix ${displaystyle lambda I_{n}-A}$ . To illustrate, consider the characteristic polynomial in the previous example again:

{displaystyle det {egin{pmatrix}lambda -1&-2-3&lambda -4end{pmatrix}}.}

If one substitutes the entire matrix Bir için λ in those positions, one obtains

{displaystyle det {egin{pmatrix}{egin{pmatrix}1&23&4end{pmatrix}}-1&-2-3&{egin{pmatrix}1&23&4end{pmatrix}}-4end{pmatrix}},}

in which the "matrix" expression is simply not a valid one. Note, however, that if scalar multiples of identity matricesinstead of scalars are subtracted in the above, i.e. if the substitution is performed as

{displaystyle det {egin{pmatrix}{egin{pmatrix}1&23&4end{pmatrix}}-I_{2}&-2I_{2}-3I_{2}&{egin{pmatrix}1&23&4end{pmatrix}}-4I_{2}end{pmatrix}},}

then the determinant is indeed zero, but the expanded matrix in question does not evaluate to ${displaystyle AI_{n}-A}$ ; nor can its determinant (a scalar) be compared to p(Bir) (a matrix). So the argument that ${displaystyle p(A)=det(AI_{n}-A)=0}$ still does not apply.

Actually, if such an argument holds, it should also hold when other multilinear forms instead of determinant is used. For instance, if we consider the kalıcı function and define ${displaystyle q(lambda )=operatorname {perm} (lambda I_{n}-A)}$ , then by the same argument, we should be able to "prove" that q(Bir) = 0. But this statement is demonstrably wrong. In the 2-dimensional case, for instance, the permanent of a matrix is given by

{displaystyle operatorname {perm} {egin{pmatrix}a&bc&dend{pmatrix}}=ad+bc.}

So, for the matrix Bir in the previous example,

{displaystyle {egin{aligned}q(lambda )&=operatorname {perm} (lambda I_{2}-A)=operatorname {perm} {egin{pmatrix}lambda -1&-2-3&lambda -4end{pmatrix}}[6pt]&=(lambda -1)(lambda -4)+(-2)(-3)=lambda ^{2}-5lambda +10.end{aligned}}}

Yet one can verify that

{displaystyle q(A)=A^{2}-5A+10I_{2}=12I_{2} ot =0.}

One of the proofs for Cayley–Hamilton theorem above bears some similarity to the argument that ${displaystyle p(A)=det(AI_{n}-A)=0}$ . By introducing a matrix with non-numeric coefficients, one can actually let Bir live inside a matrix entry, but then ${displaystyle AI_{n}}$ eşit değildir Bir, and the conclusion is reached differently.

Proofs using methods of abstract algebra

Basic properties of Hasse–Schmidt derivations üzerinde dış cebir ${displaystyle A=igwedge M}$ bazı B-modül M (supposed to be free and of finite rank) have been used by Gatto & Salehyan (2016, §4) to prove the Cayley–Hamilton theorem. Ayrıca bakınız Gatto & Scherbak (2015).

Abstraction and generalizations

The above proofs show that the Cayley–Hamilton theorem holds for matrices with entries in any commutative ring R, ve şu p(φ) = 0 will hold whenever φ is an endomorphism of an R module generated by elements e₁,...,e_n bu tatmin edici

{displaystyle varphi (e_{j})=sum a_{ij}e_{i},qquad j=1,ldots ,n.}

This more general version of the theorem is the source of the celebrated Nakayama lemma in commutative algebra and algebraic geometry.

Ayrıca bakınız

Tamamlayıcı matris

Uyarılar

^ Due to the non-commutative nature of the multiplication operation for quaternions and related constructions, care needs to be taken with definitions, most notably in this context, for the determinant. The theorem holds as well for the slightly less well-behaved bölünmüş kuaterniyonlar, görmek Alagös, Oral & Yüce (2012). The rings of quaternions and split-quaternions can both be represented by certain $2 \times 2$ complex matrices. (When restricted to unit norm, these are the groups $SU (2)$ ve $SU(1, 1)$ respectively.) Therefore it is not surprising that the theorem holds.
There is no such matrix representation for the sekizlik, since the multiplication operation is not associative in this case. However, a modified Cayley–Hamilton theorem still holds for the octonions, see Tian (2000).
^ An explicit expression for these coefficients is
${displaystyle c_{i}=sum _{k_{1},k_{2},ldots ,k_{n}}prod _{l=1}^{n}{frac {(-1)^{k_{l}+1}}{l^{k_{l}}k_{l}!}}operatorname {tr} (A^{l})^{k_{l}},}$
where the sum is taken over the sets of all integer partitions $k l \geq 0$ denklemi tatmin etmek
${displaystyle sum _{l=1}^{n}lk_{l}=n-i.}$
^ See, e.g., p. 54 of Kahverengi 1994, which solves Jacobi formülü,
${displaystyle partial p(lambda )/partial lambda =p(lambda )sum _{m=0}^{infty }lambda ^{-(m+1)}operatorname {tr} A^{m}=p(lambda )~operatorname {tr} {frac {I}{lambda I-A}}equiv operatorname {tr} B~,}$
nerede $B$ is the adjugate matrix of the next section.There also exists an equivalent, related recursive algorithm introduced by Urbain Le Verrier ve Dmitry Konstantinovich Faddeev - Faddeev–LeVerrier algorithm, okur
${displaystyle {egin{aligned}M_{0}&equiv O&c_{n}&=1qquad &(k=0)[5pt]M_{k}&equiv AM_{k-1}-{frac {1}{k-1}}(operatorname {tr} (AM_{k-1}))Iqquad qquad &c_{n-k}&=-{frac {1}{k}}operatorname {tr} (AM_{k})qquad &k=1,ldots ,n~.end{aligned}}}$
(see, e.g., p 88 of Gantmacher 1960.) Observe $Bir -1 = - M n / c 0$ as the recursion terminates.See the algebraic proof in the following section, which relies on the modes of the adjugate, $B k \equiv M n - k$ . Özellikle, ${displaystyle (lambda I-A)B=Ip(lambda )}$ and the above derivative of $p$ when one traces it yields
${displaystyle lambda p'-np=operatorname {tr} (AB)~,}$ (Hou 1998 ), and the above recursions, in turn.

Notlar

^ ^a ^b Crilly 1998
^ ^a ^b Cayley 1858, pp. 17–37
^ Cayley 1889, pp. 475–496
^ ^a ^b Hamilton 1864a
^ ^a ^b Hamilton 1864b
^ ^a ^b Hamilton 1862
^ Atiyah ve MacDonald 1969
^ Hamilton 1853, s. 562
^ Zhang 1997
^ ^a ^b Frobenius 1878
^ Zeni & Rodrigues 1992
^ Barut, Zeni & Laufer 1994a
^ Barut, Zeni & Laufer 1994b
^ Laufer 1997
^ Curtright, Fairlie & Zachos 2014
^ Stein, William. Algebraic Number Theory, a Computational Approach (PDF). s. 29.
^ Bhatia 1997, s. 7
^ Garrett 2007, s. 381

Referanslar

Alagös, Y.; Oral, K.; Yüce, S. (2012). "Split Quaternion Matrices". Miskolc Mathematical Notes. 13 (2): 223–232. doi:10.18514/MMN.2012.364. ISSN 1787-2405CS1 bakimi: ref = harv (bağlantı) (open access)
Atiyah, M.F.; MacDonald, I. G. (1969), Değişmeli Cebire Giriş, Westview Press, ISBN 978-0-201-40751-8
Barut, A. O.; Zeni, J. R.; Laufer, A. (1994a). "The exponential map for the conformal group O(2,4)". J. Phys. C: Matematik. Gen. 27 (15): 5239–5250. arXiv:hep-th/9408105. Bibcode:1994JPhA...27.5239B. doi:10.1088/0305-4470/27/15/022.CS1 bakimi: ref = harv (bağlantı)
Barut, A. O.; Zeni, J. R.; Laufer, A. (1994b). "The exponential map for the unitary group SU(2,2)". J. Phys. C: Matematik. Gen. 27 (20): 6799–6806. arXiv:hep-th/9408145. Bibcode:1994JPhA...27.6799B. doi:10.1088/0305-4470/27/20/017.CS1 bakimi: ref = harv (bağlantı)
Bhatia, R. (1997). Matris Analizi. Matematikte lisansüstü metinler. 169. Springer. ISBN 978-0387948461.CS1 bakimi: ref = harv (bağlantı)
Brown, Lowell S. (1994). Quantum Field Theory. Cambridge University Press. ISBN 978-0-521-46946-3.CS1 bakimi: ref = harv (bağlantı)
Cayley, A. (1858). "A Memoir on the Theory of Matrices". Philos. Trans. 148.CS1 bakimi: ref = harv (bağlantı)
Cayley, A. (1889). The Collected Mathematical Papers of Arthur Cayley. (Classic Reprint). 2. Forgotten books. DE OLDUĞU GİBİ B008HUED9O.CS1 bakimi: ref = harv (bağlantı)
Crilly, T. (1998). "The young Arthur Cayley". Notlar Rec. R. Soc. Lond. 52 (2): 267–282. doi:10.1098/rsnr.1998.0050.CS1 bakimi: ref = harv (bağlantı)
Curtright, T L; Fairlie, D B; Zachos, C K (2014). "A compact formula for rotations as spin matrix polynomials". SIGMA. 10 (2014): 084. arXiv:1402.3541. Bibcode:2014SIGMA..10..084C. doi:10.3842/SIGMA.2014.084.CS1 bakimi: ref = harv (bağlantı)
Frobenius, G. (1878). "Ueber lineare Substutionen und bilineare Formen". J. Reine Angew. Matematik. 1878 (84): 1–63. doi:10.1515/crll.1878.84.1.CS1 bakimi: ref = harv (bağlantı)
Gantmacher, F.R. (1960). Matrisler Teorisi. NY: Chelsea Yayınları. ISBN 978-0-8218-1376-8.CS1 bakimi: ref = harv (bağlantı)
Gatto, Letterio; Salehyan, Parham (2016), Hasse–Schmidt derivations on Grassmann algebrasSpringer, doi:10.1007/978-3-319-31842-4, ISBN 978-3-319-31842-4, BAY 3524604
Gatto, Letterio; Scherbak, Inna (2015), Remarks on the Cayley-Hamilton Theorem, arXiv:1510.03022
Garrett, Paul B. (2007). Soyut Cebir. NY: Chapman and Hall/CRC. ISBN 978-1584886891.CS1 bakimi: ref = harv (bağlantı)
Hamilton, W. R. (1853). Lectures on Quaternions. Dublin.CS1 bakimi: ref = harv (bağlantı)
Hamilton, W. R. (1864a). "On a New and General Method of Inverting a Linear and Quaternion Function of a Quaternion". Proceedings of the Royal Irish Academy. viii: 182–183.CS1 bakimi: ref = harv (bağlantı) (communicated on June 9, 1862)
Hamilton, W. R. (1864b). "On the Existence of a Symbolic and Biquadratic Equation, which is satisfied by the Symbol of Linear Operation in Quaternions". Proceedings of the Royal Irish Academy. viii: 190–101.CS1 bakimi: ref = harv (bağlantı) (communicated on June 23, 1862)
Hou, S.H. (1998). "Classroom Note: A Simple Proof of the Leverrier--Faddeev Characteristic Polynomial Algorithm". SIAM İncelemesi. 40 (3): 706–709. Bibcode:1998SIAMR..40..706H. doi:10.1137 / S003614459732076X.CS1 bakimi: ref = harv (bağlantı) "Sınıf Notu: Kaldıracın Basit Bir Kanıtı - Faddeev Karakteristik Polinom Algoritması"
Hamilton, W.R. (1862). "Bir Kuaterniyonda Doğrusal veya Dağıtıcı İşlem Sembolüyle karşılanan Sembolik ve Çiftadratik Bir Denklemin Varlığı Üzerine". The London, Edinburgh ve Dublin Philosophical Magazine and Journal of Science. dizi iv. 24: 127–128. ISSN 1478-6435. Alındı 2015-02-14.CS1 bakimi: ref = harv (bağlantı)
Ev sahibi, Alston S. (2006). Sayısal Analizde Matris Teorisi. Dover Matematik Kitapları. ISBN 978-0486449722.CS1 bakimi: ref = harv (bağlantı)
Laufer, A. (1997). "GL (N) 'nin üstel haritası". J. Phys. C: Matematik. Gen. 30 (15): 5455–5470. arXiv:hep-th / 9604049. Bibcode:1997JPhA ... 30.5455L. doi:10.1088/0305-4470/30/15/029.CS1 bakimi: ref = harv (bağlantı)
Tian, Y. (2000). "Oktonyonların matris gösterimleri ve uygulamaları". Uygulamalı Clifford Cebirlerinde Gelişmeler. 10 (1): 61–90. arXiv:matematik / 0003166. CiteSeerX 10.1.1.237.2217. doi:10.1007 / BF03042010. ISSN 0188-7009.CS1 bakimi: ref = harv (bağlantı)
Zeni, J. R .; Rodrigues, WA (1992). "Clifford cebirleri tarafından Lorentz dönüşümleri üzerine düşünceli bir çalışma". Int. J. Mod. Phys. Bir. 7 (8): 1793 s. Bibcode:1992IJMPA ... 7.1793Z. doi:10.1142 / S0217751X92000776.CS1 bakimi: ref = harv (bağlantı)
Zhang, F. (1997). "Kuaterniyonlar ve kuaterniyon matrisleri". Doğrusal Cebir ve Uygulamaları. 251: 21–57. doi:10.1016/0024-3795(95)00543-9. ISSN 0024-3795CS1 bakimi: ref = harv (bağlantı) (açık Arşiv).

Dış bağlantılar

[10] Due to the non-commutative nature of the multiplication operation for quaternions and related constructions, care needs to be taken with definitions, most notably in this context, for the determinant. The theorem holds as well for the slightly less well-behaved bölünmüş kuaterniyonlar, görmek Alagös, Oral & Yüce (2012). The rings of quaternions and split-quaternions can both be represented by certain $2 \times 2$ complex matrices. (When restricted to unit norm, these are the groups $SU (2)$ ve $SU(1, 1)$ respectively.) Therefore it is not surprising that the theorem holds.
There is no such matrix representation for the sekizlik, since the multiplication operation is not associative in this case. However, a modified Cayley–Hamilton theorem still holds for the octonions, see Tian (2000).

[12] An explicit expression for these coefficients is
${displaystyle c_{i}=sum _{k_{1},k_{2},ldots ,k_{n}}prod _{l=1}^{n}{frac {(-1)^{k_{l}+1}}{l^{k_{l}}k_{l}!}}operatorname {tr} (A^{l})^{k_{l}},}$
where the sum is taken over the sets of all integer partitions $k l \geq 0$ denklemi tatmin etmek
${displaystyle sum _{l=1}^{n}lk_{l}=n-i.}$

[13] See, e.g., p. 54 of Kahverengi 1994, which solves Jacobi formülü,
${displaystyle partial p(lambda )/partial lambda =p(lambda )sum _{m=0}^{infty }lambda ^{-(m+1)}operatorname {tr} A^{m}=p(lambda )~operatorname {tr} {frac {I}{lambda I-A}}equiv operatorname {tr} B~,}$
nerede $B$ is the adjugate matrix of the next section.There also exists an equivalent, related recursive algorithm introduced by Urbain Le Verrier ve Dmitry Konstantinovich Faddeev - Faddeev–LeVerrier algorithm, okur
${displaystyle {egin{aligned}M_{0}&equiv O&c_{n}&=1qquad &(k=0)[5pt]M_{k}&equiv AM_{k-1}-{frac {1}{k-1}}(operatorname {tr} (AM_{k-1}))Iqquad qquad &c_{n-k}&=-{frac {1}{k}}operatorname {tr} (AM_{k})qquad &k=1,ldots ,n~.end{aligned}}}$
(see, e.g., p 88 of Gantmacher 1960.) Observe $Bir -1 = - M n / c 0$ as the recursion terminates.See the algebraic proof in the following section, which relies on the modes of the adjugate, $B k \equiv M n - k$ . Özellikle, ${displaystyle (lambda I-A)B=Ip(lambda )}$ and the above derivative of $p$ when one traces it yields
${displaystyle lambda p'-np=operatorname {tr} (AB)~,}$ (Hou 1998 ), and the above recursions, in turn.

[Crilly_1-1] Crilly 1998

[Cayley_1-2] Cayley 1858, pp. 17–37

[3] Cayley 1889, pp. 475–496

[Hamilton_1864a-4] Hamilton 1864a

[Hamilton_1864b-5] Hamilton 1864b

[Hamilton_1862-6] Hamilton 1862

[7] Atiyah ve MacDonald 1969

[Hamilton_1853-8] Hamilton 1853, s. 562

[9] Zhang 1997

[Frobenius_1878-11] Frobenius 1878

[14] Zeni & Rodrigues 1992

[15] Barut, Zeni & Laufer 1994a

[16] Barut, Zeni & Laufer 1994b

[17] Laufer 1997

[18] Curtright, Fairlie & Zachos 2014

[19] Stein, William. Algebraic Number Theory, a Computational Approach (PDF). s. 29.

[20] Bhatia 1997, s. 7

[21] Garrett 2007, s. 381

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[nb 1]

[10]

[nb 2]

[nb 3]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]