Cayley-Hamilton teoremi - Cayley–Hamilton theorem

Arthur Cayley, F.R.S. (1821–1895), İngiltere'nin 19. yüzyılın önde gelen saf matematikçisi olarak kabul edilmektedir. Cayley 1848'de derslere katılmak için Dublin'e gitti kuaterniyonlar Hamilton, kaşifleri. Daha sonra Cayley, onlarla ilgili çalışmaları yayınlayan ikinci kişi olarak onu etkiledi.[1] Cayley, iki boyutlu durum için kanıt yayınlayarak, boyut 3 ve daha küçük matrisler için teoremi kanıtladı.[2][3] Gelince n × n Cayley, matrisler, "... herhangi bir dereceden bir matrisin genel durumunda teoremin resmi bir ispatının işini üstlenmenin gerekli olduğunu düşünmemiştim" dedi.
William Rowan Hamilton (1805-1865), İrlandalı fizikçi, astronom ve matematikçi, Amerika'nın ilk yabancı üyesi Ulusal Bilimler Akademisi. Hamilton, geometrinin nasıl çalışılması gerektiği konusunda muhalif pozisyonu korurken, Cayley ile her zaman en iyi şartlarda kaldı.[1]

Hamilton, doğrusal bir fonksiyon için kuaterniyonlar Doğrusal işleve bağlı olarak doğrusal işlevin kendisi tarafından karşılanan belirli bir denklem vardır.[4][5][6]

İçinde lineer Cebir, Cayley-Hamilton teoremi (matematikçilerin adını almıştır Arthur Cayley ve William Rowan Hamilton ) her Kare matris üzerinde değişmeli halka (benzeri gerçek veya karmaşık alan ) kendini tatmin eder karakteristik denklem.

Eğer Bir verilen n×n matris ve benn  ... n×n kimlik matrisi, sonra karakteristik polinom nın-nin Bir olarak tanımlanır[7] , nerede det ... belirleyici operasyon ve λ bir değişken için skaler taban halkasının elemanı. Matrisin girişlerinden beri polinomlar (doğrusal veya sabit) λbelirleyici aynı zamanda bir n-inci derece monik polinom içinde λ,

Analog bir polinom yaratılabilir matriste Bir skaler değişken yerine λ, olarak tanımlandı
Cayley-Hamilton teoremi, bu polinomun, sıfır matris demek ki . Teorem izin verir Birn alt matris güçlerinin doğrusal bir kombinasyonu olarak ifade edilecek Bir. Halka bir alan olduğunda, Cayley-Hamilton teoremi şu ifadeye eşdeğerdir: minimal polinom kare matrisin böler karakteristik polinomu. Teorem ilk olarak 1853'te kanıtlandı[8] doğrusal fonksiyonların tersi açısından kuaterniyonlar, bir değişmez yüzük, Hamilton.[4][5][6] Bu, belirli bir özel duruma karşılık gelir 4 × 4 gerçek veya 2 × 2 karmaşık matrisler. Teorem genel kuaterniyonik matrisler için geçerlidir.[9][nb 1] Cayley, 1858'de şunu belirtti: 3 × 3 ve daha küçük matrisler, ancak yalnızca 2 × 2 durum.[2] Genel durum ilk olarak Frobenius 1878'de.[10]

Örnekler

1×1 matrisler

Bir 1×1 matris Bir = (a1,1)karakteristik polinom şu şekilde verilir: p(λ) =λ − a, ve bu yüzden p(Bir) = (a) − a1,1 = 0 önemsizdir.

2×2 matrisler

Somut bir örnek olarak,

Karakteristik polinomu şu şekilde verilir:

Cayley-Hamilton teoremi şunu iddia ediyor: tanımlamak

sonra

Bunu hesaplama yoluyla doğrulayabiliriz ki,

Jenerik için 2×2 matris,

karakteristik polinom şu şekilde verilir: p(λ) = λ2 − (a + d)λ + (reklam − M.Ö), bu yüzden Cayley-Hamilton teoremi şunu belirtir:

bu gerçekten de her zaman böyledir, Bir2.

Başvurular

Belirleyici ve ters matris

Bir genel için n×n tersinir matris Biryani sıfırdan farklı bir belirleyiciye sahip olan, Bir−1 böylece bir (n − 1)-nci sipariş polinom ifadesi içinde Bir: Belirtildiği gibi, Cayley-Hamilton teoremi özdeşlik

Katsayılar cben tarafından verilir temel simetrik polinomlar özdeğerlerinin Bir. Kullanma Newton kimlikleri temel simetrik polinomlar sırasıyla şu terimlerle ifade edilebilir: güç toplamı simetrik polinomları Özdeğerlerin:

nerede tr (Birk) ... iz matrisin Birk. Böylece ifade edebiliriz cben güçlerinin izi açısından Bir.

Genel olarak katsayılar için formül cben tam üstel olarak verilir Bell polinomları gibi [nb 2]

Özellikle, determinantı Bir eşittir (-1)nc0. Böylece determinant şu şekilde yazılabilir: iz kimliği:

Benzer şekilde, karakteristik polinom şu şekilde yazılabilir:

ve her iki tarafı da ile çarparak Bir−1 (Not −(−1)n = (−1)n−1), biri tersi için bir ifadeye yönlendirilir Bir iz kimlik olarak,

Bu katsayıları elde etmek için başka bir yöntem ck bir genel için n×n matris, kök sıfır olmaması koşuluyla, aşağıdaki alternatife dayanır determinant için ifade,

Bu nedenle, sayesinde Mercator serisi,

üstel nerede sadece sipariş için genişletilmesi gerekiyor λn, dan beri p(λ) düzenlidir n, net negatif güçleri λ C – H teoremi tarafından otomatik olarak kaybolur. (Yine, bu, rasyonel sayıları içeren bir halka gerektirir.) Bu ifadenin, λ genel için karakteristik polinomun katsayılarının ifade edilmesine izin verir n belirleyicileri olarak m×m matrisler[nb 3]

Örnekler

Örneğin, ilk birkaç Bell polinomu B0 = 1, B1(x1) = x1, B2(x1, x2) = x2
1
+ x2
, ve B3(x1, x2, x3) = x3
1
+ 3 x1x2 + x3
.

Katsayıları belirlemek için bunları kullanma cben bir karakteristik polinomunun 2×2 matris verimleri

Katsayı c0 determinantını verir 2×2 matris, c1 eksi izini, tersi ise

Genel formülden anlaşılmaktadır. cn-kBell polinomları cinsinden ifade edilen, ifadelerin

daima katsayıları ver cn−1 nın-nin λn−1 ve cn−2 nın-nin λn−2 herhangi bir karakteristik polinomda n×n sırasıyla matris. Yani, bir 3×3 matris BirCayley-Hamilton teoreminin ifadesi şu şekilde de yazılabilir:

sağ tarafın bir 3×3 tüm girişlerin sıfıra düşürüldüğü matris. Aynı şekilde, bu belirleyici n = 3 durum, şimdi

Bu ifade katsayının negatifini verir cn−3 nın-nin λn−3 genel durumda, aşağıda görüldüğü gibi.

Benzer şekilde, bir kişi bir 4×4 matris Bir,

belirleyici şimdi nerede cn−4,

ve daha büyük matrisler için böyle devam eder. Katsayılar için giderek karmaşıklaşan ifadeler ck çıkarılabilir Newton'un kimlikleri ya da Faddeev – LeVerrier algoritması.

nmatrisin gücü

Cayley-Hamilton teoremi her zaman için güçler arasında bir ilişki sağlar Bir (her zaman en basit olanı olmasa da), bu tür yetkileri içeren ifadeleri basitleştirmeye ve gücü hesaplamak zorunda kalmadan bunları değerlendirmeye izin verir. Birn veya daha yüksek yetkileri Bir.

Örnek olarak teorem verir

Sonra hesaplamak için Bir4, gözlemek

Aynı şekilde,

Matris gücünü iki terimin toplamı olarak yazabildiğimize dikkat edin. Aslında, herhangi bir düzenin matris gücü k en fazla derece matris polinomu olarak yazılabilir n - 1, nerede n kare matrisin boyutudur. Bu, Cayley-Hamilton teoreminin, aşağıda sistematik olarak tartışacağımız bir matris fonksiyonunu ifade etmek için kullanılabileceği bir durumdur.

Matris fonksiyonları

Analitik bir işlev verildiğinde

ve karakteristik polinom p(x) derece n bir n × n matris Birfonksiyon uzun bölme kullanılarak ifade edilebilir.

nerede q(x) bazı bölüm polinomudur ve r(x) kalan bir polinomdur öyle ki 0 derece r(x) < n.

Cayley-Hamilton teoremi ile değiştirilerek x matrise göre Bir verir p(Bir) = 0Yani biri var

Böylece, matrisin analitik işlevi Bir daha küçük bir derece matris polinomu olarak ifade edilebilir n.

Kalan polinom olsun

Dan beri p(λ) = 0, işlevi değerlendirme f(x) -de n özdeğerleri Bir, verim

Bu bir sistem anlamına gelir n katsayıları belirlemek için çözülebilen doğrusal denklemler cben. Böylece biri var

Özdeğerler tekrarlandığında, yani λben = λj bazı i ≠ jiki veya daha fazla denklem aynıdır; ve bu nedenle doğrusal denklemler benzersiz bir şekilde çözülemez. Bu tür durumlar için, bir özdeğer için λ çokluk ile m, ilk m – 1 türevleri p (x) özdeğerde kaybolur. Bu fazladan m – 1 doğrusal bağımsız çözümler

diğerleriyle birleştirildiğinde gerekli olan n çözülecek denklemler cben.

Noktalardan geçen bir polinom bulmak (λben, f (λben)) aslında bir enterpolasyon problemi ve kullanılarak çözülebilir Lagrange veya Newton enterpolasyonu teknikler Sylvester formülü.

Örneğin, görevin polinom temsilini bulmak olduğunu varsayalım.

Karakteristik polinom p(x) = (x − 1)(x − 3) = x2 − 4x + 3ve özdeğerler λ = 1, 3. İzin Vermek r(x) = c0 + c1x. Değerlendirme f(λ) = r(λ) özdeğerlerde, iki doğrusal denklem elde edilir, et = c0 + c1 ve e3t = c0 + 3c1.

Denklemlerin getirilerini çözme c0 = (3ete3t)/2 ve c1 = (e3tet)/2. Böylece, bunu takip eder

Bunun yerine, işlev f(Bir) = günah Şurada:, o zaman katsayılar olurdu c0 = (3 günah t - günah 3t)/2 ve c1 = (günah 3t - günah t)/2; dolayısıyla

Başka bir örnek olarak,

o zaman karakteristik polinom p(x) = x2 + 1ve özdeğerler λ = ±ben.

Daha önce olduğu gibi, fonksiyonu özdeğerlerde değerlendirmek bize doğrusal denklemleri verir eo = c0 + i c1 ve eo = c0ic1; çözümü veren c0 = (eo + eo) / 2 = çünkü t ve c1 = (eoeo)/2ben = günah t. Böylece, bu durum için,

hangisi bir rotasyon matrisi.

Bu tür kullanımların standart örnekleri, üstel harita -den Lie cebiri bir matris Lie grubu gruba. Tarafından verilir matris üstel,

Bu tür ifadeler uzun zamandır bilinmektedir SU (2),

nerede σ bunlar Pauli matrisleri ve için SỐ 3),

hangisi Rodrigues'in rotasyon formülü. Gösterim için bkz. döndürme grubu SO (3) # Lie cebiri üzerine bir not.

Daha yakın zamanlarda, diğer gruplar için ifadeler ortaya çıktı. Lorentz grubu SO (3; 1),[11] O (4; 2)[12] ve SU (2; 2),[13] Hem de GL (n, R).[14] Grup O (4; 2) ... konformal grup nın-nin boş zaman, SU (2; 2) onun basitçe bağlı kapak (kesin olmak gerekirse, basitçe bağlanan kapak bağlı bileşen YANİ+(4, 2) nın-nin O (4; 2)). Elde edilen ifadeler, bu grupların standart temsili için geçerlidir. Bilgi gerektirirler (bazıları) özdeğerler matrisin üssü. İçin SU (2) (ve dolayısıyla SỐ 3)) için kapalı ifadeler alınmıştır herşey indirgenemez temsiller, yani herhangi bir dönüş.[15]

Ferdinand Georg Frobenius (1849–1917), Alman matematikçi. Başlıca ilgi alanları eliptik fonksiyonlar, diferansiyel denklemler, ve sonra grup teorisi.
1878'de Cayley-Hamilton teoreminin ilk tam kanıtını verdi.[10]

Cebirsel sayı teorisi

Cayley-Hamilton teoremi, cebirsel tamsayıların minimal polinomunu hesaplamak için etkili bir araçtır. Örneğin, sonlu bir uzantı verildiğinde nın-nin ve cebirsel bir tam sayı sıfır olmayan doğrusal bir kombinasyon olan minimum polinomunu hesaplayabiliriz temsil eden bir matris bularak -doğrusal dönüşüm

Buna dönüşüm matrisi dersek , o zaman Cayley-Hamilton teoremini uygulayarak minimal polinomu bulabiliriz .[16]

Kanıtlar

Cayley-Hamilton teoremi, varoluşunun acil bir sonucudur. Ürdün normal formu matrisler için cebirsel olarak kapalı alanlar. Bu bölümde doğrudan ispatlar sunulmaktadır.

Yukarıdaki örneklerin gösterdiği gibi, bir için Cayley-Hamilton teoreminin ifadesini elde etmek n×n matris

iki adım gerektirir: önce katsayılar cben karakteristik polinomun bir polinom olarak geliştirilmesi ile belirlenir. t belirleyicinin

ve daha sonra bu katsayılar, güçlerin doğrusal bir kombinasyonunda kullanılır. Bir bu eşittir n×n boş matris:

Sol taraf, bir n×n girişleri giriş kümesindeki (muazzam) polinom ifadeler olan matris aben,j nın-nin Bir, bu nedenle Cayley-Hamilton teoremi bunların her birinin n2 ifadeler eşittir 0. Herhangi bir sabit değer için n, bu kimlikler sıkıcı ama basit cebirsel manipülasyonlarla elde edilebilir. Bununla birlikte, bu hesaplamaların hiçbiri, Cayley-Hamilton teoreminin tüm olası boyutlardaki matrisler için neden geçerli olması gerektiğini gösteremez. nyani herkes için tek tip bir kanıt n gereklidir.

Ön bilgiler

Eğer bir vektör v boyut n bir özvektör nın-nin Bir özdeğer ile λbaşka bir deyişle Birv = λv, sonra

o zamandan beri boş vektör olan p(λ) = 0 (özdeğerleri Bir tam olarak kökler nın-nin p(t)). Bu, tüm olası özdeğerler için geçerlidir λ, bu nedenle teoremin eşitlediği iki matris, herhangi bir özvektöre uygulandığında kesinlikle aynı (boş) sonucu verir. Şimdi eğer Bir itiraf ediyor temel özvektörler, başka bir deyişle Bir dır-dir köşegenleştirilebilir, daha sonra Cayley-Hamilton teoremi geçerli olmalıdır Birçünkü bir tabanın her bir elemanına uygulandığında aynı değerleri veren iki matris eşit olmalıdır.

özdeğerlerinin çarpımı

Şimdi işlevi düşünün hangi haritalar matrisler formülle verilen matrisler , yani bir matris alan ve onu kendi karakteristik polinomuna yerleştirir. Tüm matrisler köşegenleştirilemez, ancak karmaşık katsayılara sahip matrisler için çoğu şu şekildedir: belirli bir büyüklükteki köşegenleştirilebilir karmaşık kare matrisler yoğun tüm bu kare matrisler kümesinde[17] (bir matrisin köşegenleştirilebilir olması için, örneğin karakteristik polinomunun herhangi bir çoklu köke sahip olmaması yeterlidir). Şimdi bir işlev olarak görülüyor (matrisler girişler) bu işlevin sürekli. Bu doğrudur, çünkü bir matrisin görüntüsünün girdileri, matrisin girdilerindeki polinomlarla verilir. Dan beri

ve setten beri yoğun, süreklilik nedeniyle bu işlevin tüm kümesini eşlemesi gerekir sıfır matrisine matrisler. Bu nedenle, Cayley-Hamilton teoremi karmaşık sayılar için doğrudur ve bu nedenle de geçerli olmalıdır - veya değerli matrisler.

Bu geçerli bir kanıt sunsa da, teoremin temsil ettiği kimlikler hiçbir şekilde matrisin doğasına (köşegenleştirilebilir veya değil) veya izin verilen girişlerin türüne (matrisler için) bağlı olmadığından, argüman pek tatmin edici değildir. köşegenleştirilebilir olan gerçek girdiler yoğun bir küme oluşturmazlar ve Cayley-Hamilton teoreminin onlar için geçerli olduğunu görmek için karmaşık matrisleri dikkate almak garip görünmektedir). Bu nedenle, şimdi yalnızca cebirsel manipülasyonları kullanan herhangi bir matris için teoremi doğrudan kanıtlayan argümanları ele alacağız; bunlar aynı zamanda herhangi bir girdide matrisler için çalışma avantajına sahiptir. değişmeli halka.

Cayley-Hamilton teoreminin çok çeşitli bu tür ispatları vardır ve bunlardan birkaçı burada verilecektir. İspatı anlamak için gereken soyut cebirsel kavramların miktarında farklılık gösterirler. En basit ispatlar, teoremi formüle etmek için gereken kavramları kullanır (matrisler, sayısal girişli polinomlar, determinantlar), ancak tam olarak doğru sonuca götürdükleri gerçeğini biraz gizemli kılan teknik hesaplamaları içerir. Bu tür ayrıntılardan kaçınmak mümkündür, ancak daha ince cebirsel kavramları dahil etme pahasına: değişmeli olmayan bir halkada katsayıları olan polinomlar veya alışılmadık türde girdilere sahip matrisler.

Bitişik matrisler

Aşağıdaki tüm kanıtlar, ek matris adj (M) bir n×n matris M, değiştirmek onun kofaktör matrisi.

Bu, katsayıları katsayılarında polinom ifadeleriyle verilen bir matristir. M (aslında, kesin olarak (n − 1)×(n − 1) belirleyiciler), aşağıdaki temel ilişkilerin geçerli olacağı şekilde,

Bu ilişkiler, belirleyicilerin temel özelliklerinin doğrudan bir sonucudur: (ben,j) Soldaki matris ürününün girişi sütuna göre genişletmeyi verir j elde edilen matrisin determinantının M sütunu değiştirerek ben sütunun bir kopyası ile j, hangisi det (M) Eğer ben = j ve aksi takdirde sıfır; sağdaki matris çarpımı benzerdir, ancak satırlara göre genişletmeler içindir.

Sadece cebirsel ifade manipülasyonunun bir sonucu olan bu ilişkiler, herhangi bir değişmeli halkada girişleri olan matrisler için geçerlidir (belirleyicilerin ilk etapta tanımlanması için değişme varsayılmalıdır). Burada not etmek önemlidir, çünkü bu ilişkiler aşağıda polinomlar gibi sayısal olmayan girdilere sahip matrisler için uygulanacaktır.

Doğrudan cebirsel bir kanıt

Bu ispat, Cayley-Hamilton teoremini formüle etmek için gereken türden nesneleri kullanır: giriş olarak polinomlu matrisler. Matris t bennBir determinantının karakteristik polinomu olan Bir böyle bir matristir ve polinomlar değişmeli bir halka oluşturduğundan, bir tamamlayıcı

Öyleyse, tamamlayıcı maddenin sağ-el temel ilişkisine göre, birinin

Dan beri B aynı zamanda polinomlu bir matristir t giriş olarak, her biri için ben katsayılarını toplayın tben bir matris oluşturmak için her girişte B ben sayıların, öyle ki birinin

(Girişlerin yolu B tanımlanmış, hiçbir gücün daha yüksek olmadığını tn−1 oluşur). Bu iken görünüyor Katsayı olarak matrisleri olan bir polinom gibi, böyle bir kavramı dikkate almayacağız; bu, polinom girdileriyle doğrusal bir kombinasyon olarak bir matris yazmanın bir yoludur. n sabit matrisler ve katsayı t ben bu bakış açısını vurgulamak için matrisin soluna yazılmıştır.

Şimdi, denklemimizdeki matris çarpımı iki doğrusallıkla genişletilebilir

yazı

Biri, polinom girdileri olan iki matrisin eşitliğini elde eder, sabit matrislerin doğrusal kombinasyonları olarak yazılır. t katsayılar olarak.

Böyle bir eşitlik, ancak herhangi bir matris konumunda belirli bir kuvvetle çarpılan girdiyi tutabilir. tben her iki tarafta da aynıdır; katsayılı sabit matrislerin tben her iki ifadede de eşit olmalıdır. O zaman bu denklemleri yazmak ben itibaren n 0'a kadar, biri bulur

Son olarak, katsayılarının denklemini çarpın tben tarafından soldan Birbenve özetleyin:

Sol taraflar bir teleskop toplamı ve tamamen iptal edin; sağ tarafın toplamı :

Bu kanıtı tamamlar.

Matris katsayılı polinomların kullanıldığı bir kanıt

Bu ispat ilkine benzer, ancak bu ispatta geçen ifadelerin önerdiği matris katsayıları ile polinom kavramına anlam vermeye çalışır. Değişmeli olmayan bir halkada katsayıları olan polinomları dikkate almak biraz alışılmadık olduğundan ve değişmeli polinomlar için geçerli olan tüm muhakeme bu ortamda uygulanamayacağından, bu önemli bir özen gerektirir.

Özellikle, değişmeli bir halka üzerindeki polinomların aritmetiği, polinom fonksiyonları, bu, değişmeli olmayan bir halka için geçerli değildir (gerçekte, bu durumda çarpma altında kapanan açık bir polinom fonksiyonu kavramı yoktur). Yani polinomları göz önünde bulundururken t matris katsayıları ile değişken t "bilinmeyen" olarak düşünülmemeli, verilen kurallara göre manipüle edilecek resmi bir sembol olarak düşünülmelidir; özellikle sadece ayarlanamaz t belirli bir değere.

İzin Vermek yüzüğü olmak bazı halkalarda girişli matrisler R (gerçek veya karmaşık sayılar gibi) Bir bir unsur olarak. Katsayıları polinomları olan matrisler t, gibi veya onun eki B ilk kanıtta, .

Gibi güçleri toplayarak t, bu tür matrisler "polinomlar" olarak yazılabilir t katsayı olarak sabit matrislerle; yazmak bu tür polinomlar kümesi için. Bu set, buna karşılık gelen aritmetik işlemler tanımlanır, özellikle çarpma şu şekilde verilir:

iki işlenenden katsayı matrislerinin sırasına göre; Açıkça bu, değişmeli olmayan bir çarpma verir.

Böylece kimlik

ilk kanıttan, öğelerin çarpımını içeren bir kanıt olarak görülebilir. .

Bu noktada, basitçe ayarlamak cazip geliyor t matrise eşit Bir , soldaki ilk çarpanı sıfır matrise eşit yapar ve sağ taraf da şuna eşittir: p(Bir); ancak, katsayılar gidip gelmediğinde bu izin verilen bir işlem değildir. Bir "sağ değerlendirme haritası" tanımlamak mümkündür.Bir : M[t] → Mher birinin yerini alan tben matris gücüyle Birben nın-nin Bir , burada gücün her zaman sağda karşılık gelen katsayı ile çarpılması şart koşulmaktadır.

Ancak bu harita halka bir homomorfizm değildir: bir ürünün doğru değerlendirmesi, genel olarak doğru değerlendirmelerin ürününden farklıdır. Bunun nedeni, polinomların matris katsayıları ile çarpılmasının bilinmeyenleri içeren ifadelerin çarpımını modellememesidir: bir ürün varsayımıyla tanımlanır t ile gidip gelir N, ancak bu başarısız olabilir t matris ile değiştirilir Bir.

Yukarıdaki sağ değerlendirme haritası, matrisin halka homomorfizmine dönüştüğü için, eldeki belirli durumda bu zorluğun üstesinden gelinebilir. Bir içinde merkez katsayılar halkasının, polinomların tüm katsayıları ile değişmesi için (bunu kanıtlayan argüman, tam olarak t katsayıları artık değerlendirmeden sonra doğrulanmıştır).

Şimdi, Bir her zaman merkezinde değil Mama değiştirebiliriz M söz konusu polinomların tüm katsayılarını içermesi koşuluyla daha küçük bir halka ile: , Birve katsayılar polinomun B. Böyle bir alt grup için bariz seçim, merkezleyici Z nın-nin Birile değişen tüm matrislerin alt halkası Bir; tanım olarak Bir merkezinde Z.

Bu merkezleyici açıkça şunları içerir: , ve Bir, ancak matrisleri içerdiğini göstermeli . Bunu yapmak için, yardımcılar için iki temel ilişki birleştirilir ve ek B polinom olarak:

Katsayıları eşitleme her biri için ben, sahibiz Bir Bben = Bben Bir istediğiniz gibi. Ev sahipliğinde uygun ayarı bulduktan sonraBir gerçekten de halkaların homomorfizmidir, ispat yukarıda önerildiği gibi tamamlanabilir:

Bu kanıtı tamamlar.

İlk iki ispatın bir sentezi

İlk ispatta katsayıları belirleyebildi Bben nın-nin B sadece tamamlayıcı için sağ taraftaki temel ilişkiye dayanır. Aslında ilk n türetilen denklemler bölümü belirlerken yorumlanabilir B of Öklid bölümü polinomun p(t)benn solda monik polinom benntBirson denklem ise kalanın sıfır olduğu gerçeğini ifade etmektedir. Bu bölme, matris katsayıları olan polinomlar halkasında gerçekleştirilir. Aslında, değişmeyen bir halka üzerinde bile, tekli bir polinom ile Öklid bölünmesi P tanımlanır ve her zaman benzersiz bir bölüm üretir ve her zaman değişmeli durumda olduğu gibi aynı derece koşulda kalır, kişinin hangi tarafta istediği belirtilmişse P bir faktör olmak (burada solda).

Bölümün ve kalanın benzersiz olduğunu görmek için (buradaki ifadenin önemli kısmı budur), yazmak yeterlidir gibi ve o zamandan beri gözlemle P monik P (Q − Q ') bundan daha düşük bir dereceye sahip olamaz P, sürece Q=Q ' .

Ama temettü p(t)benn ve bölen benntBir burada kullanılan her ikisi de alt ringde yatıyor (R[Bir])[t], nerede R[Bir] matris halkasının alt halkasıdır M(n, R) tarafından oluşturuldu Bir: Rtüm güçlerinin doğrusal aralığı Bir. Bu nedenle, Öklid bölünmesi aslında bunun içinde yapılabilir. değişmeli polinom halkası ve tabii ki o zaman aynı bölümü verir B ve daha büyük halkadaki gibi kalan 0; özellikle bu gösteriyor ki B aslında yatıyor (R[Bir])[t].

Ancak, bu değişmeli ayarda, t -e Bir denklemde

başka bir deyişle, değerlendirme haritasını uygulamak

bir halka homomorfizmi olan

tıpkı ikinci ispatta olduğu gibi, istenildiği gibi.

Teoremi kanıtlamaya ek olarak, yukarıdaki argüman bize katsayıların Bben nın-nin B polinomlar Birikinci kanıttan sadece merkezileştiricide yattıklarını biliyorduk. Z nın-nin Bir; Genel olarak Z daha büyük bir alt zincirdir R[Bir]ve mutlaka değişmeli değil. Özellikle sabit terim B0= adj (-Bir) yatıyor R[Bir]. Dan beri Bir keyfi bir kare matristir, bu kanıtlıyor adj (Bir) her zaman bir polinom olarak ifade edilebilir Bir (bağlı katsayılarla Bir).

Aslında, ilk ispatta bulunan denklemler art arda ifade etmeye izin verir polinomlar olarak Birkimliğe götüren

herkes için geçerli n×n matrisler, nerede

karakteristik polinomudur Bir.

Bu kimliğin aynı zamanda Cayley-Hamilton teoreminin ifadesini de ifade ettiğini unutmayın: biri hareket edebilir adj (-Bir) sağ tarafta, elde edilen denklemi (solda veya sağda) ile çarpın Birve şu gerçeği kullanın

Endomorfizm matrislerini kullanan bir kanıt

Yukarıda bahsedildiği gibi, matris p(Bir) teoremin ifadesinde, önce determinantın değerlendirilmesi ve ardından matrisin ikame edilmesi ile elde edilir. Bir için t; bu ikameyi matrise yapmak determinantı değerlendirmeden önce anlamlı değildir. Yine de nerede bir yorum yapmak mümkündür p(Bir) doğrudan belirli bir determinantın değeri olarak elde edilir, ancak bu daha karmaşık bir ayar gerektirir, bir halka üzerindeki matrislerden biri, her iki girişi de yorumlayabilir nın-nin Birve tümü Bir kendisi. Bunun için yüzüğü alabilirsin M(n, R) nın-nin n×n matrisler bitti R, giriş nerede olarak gerçekleştirildi , ve Bir kendisi gibi. Ancak matrisler içeren matrisleri girişler olarak düşünmek, blok matrisler, which is not intended, as that gives the wrong notion of determinant (recall that the determinant of a matrix is defined as a sum of products of its entries, and in the case of a block matrix this is generally not the same as the corresponding sum of products of its blocks!). It is clearer to distinguish Bir from the endomorphism φ bir n-dimensional vector space V (or free R-module if R is not a field) defined by it in a basis , and to take matrices over the ring End(V) of all such endomorphisms. Sonra φ ∈ Bitir (V) is a possible matrix entry, while Bir designates the element of M(n, End(V)) whose ben,j entry is endomorphism of scalar multiplication by ; benzer şekilde will be interpreted as element of M(n, End(V)). However, since End(V) is not a commutative ring, no determinant is defined on M(n, End(V)); this can only be done for matrices over a commutative subring of End(V). Now the entries of the matrix all lie in the subring R[φ] generated by the identity and φ, which is commutative. Then a determinant map M(n, R[φ]) → R[φ] is defined, and evaluates to the value p(φ) of the characteristic polynomial of Bir -de φ (this holds independently of the relation between Bir ve φ); the Cayley–Hamilton theorem states that p(φ) is the null endomorphism.

In this form, the following proof can be obtained from that of (Atiyah & MacDonald 1969, Prop. 2.4) (which in fact is the more general statement related to the Nakayama lemma; one takes for the ideal in that proposition the whole ring R). Gerçeği Bir is the matrix of φ in the basis e1, ..., en anlamına gelir

One can interpret these as n components of one equation in Vn, whose members can be written using the matrix-vector product M(n, End(V)) × VnVn that is defined as usual, but with individual entries ψ ∈ Bitir (V) ve v içinde V being "multiplied" by forming ; this gives:

nerede is the element whose component ben dır-dir eben (in other words it is the basis e1, ..., en nın-nin V written as a column of vectors). Writing this equation as

one recognizes the değiştirmek matrisin considered above, and its determinant (as element of M(n, R[φ])) is also p(φ). To derive from this equation that p(φ) = 0 ∈ End(V), one left-multiplies by the adjugate matrix nın-nin , which is defined in the matrix ring M(n, R[φ]), giving

the associativity of matrix-matrix and matrix-vector multiplication used in the first step is a purely formal property of those operations, independent of the nature of the entries. Now component ben of this equation says that p(φ)(eben) = 0 ∈ V; Böylece p(φ) vanishes on all eben, and since these elements generate V onu takip eder p(φ) = 0 ∈ End(V), completing the proof.

One additional fact that follows from this proof is that the matrix Bir whose characteristic polynomial is taken need not be identical to the value φ substituted into that polynomial; it suffices that φ be an endomorphism of V satisfying the initial equations

için biraz sequence of elements e1,...,en that generate V (which space might have smaller dimension than n, or in case the ring R is not a field it might not be a ücretsiz modül at all).

A bogus "proof": p(Bir) = det (AIn − Bir) = det (Bir − Bir) = 0

One persistent elementary but yanlış tartışma[18] for the theorem is to "simply" take the definition

ve ikame Bir için λ, elde etme

There are many ways to see why this argument is wrong. First, in Cayley–Hamilton theorem, p(Bir) bir n×n matrix. However, the right hand side of the above equation is the value of a determinant, which is a skaler. So they cannot be equated unless n = 1 (i.e. Bir is just a scalar). Second, in the expression , the variable λ actually occurs at the diagonal entries of the matrix . To illustrate, consider the characteristic polynomial in the previous example again:

If one substitutes the entire matrix Bir için λ in those positions, one obtains

in which the "matrix" expression is simply not a valid one. Note, however, that if scalar multiples of identity matricesinstead of scalars are subtracted in the above, i.e. if the substitution is performed as

then the determinant is indeed zero, but the expanded matrix in question does not evaluate to ; nor can its determinant (a scalar) be compared to p(Bir) (a matrix). So the argument that still does not apply.

Actually, if such an argument holds, it should also hold when other multilinear forms instead of determinant is used. For instance, if we consider the kalıcı function and define , then by the same argument, we should be able to "prove" that q(Bir) = 0. But this statement is demonstrably wrong. In the 2-dimensional case, for instance, the permanent of a matrix is given by

So, for the matrix Bir in the previous example,

Yet one can verify that

One of the proofs for Cayley–Hamilton theorem above bears some similarity to the argument that . By introducing a matrix with non-numeric coefficients, one can actually let Bir live inside a matrix entry, but then eşit değildir Bir, and the conclusion is reached differently.

Proofs using methods of abstract algebra

Basic properties of Hasse–Schmidt derivations üzerinde dış cebir bazı B-modül M (supposed to be free and of finite rank) have been used by Gatto & Salehyan (2016, §4) to prove the Cayley–Hamilton theorem. Ayrıca bakınız Gatto & Scherbak (2015).

Abstraction and generalizations

The above proofs show that the Cayley–Hamilton theorem holds for matrices with entries in any commutative ring R, ve şu p(φ) = 0 will hold whenever φ is an endomorphism of an R module generated by elements e1,...,en bu tatmin edici

This more general version of the theorem is the source of the celebrated Nakayama lemma in commutative algebra and algebraic geometry.

Ayrıca bakınız

Uyarılar

  1. ^ Due to the non-commutative nature of the multiplication operation for quaternions and related constructions, care needs to be taken with definitions, most notably in this context, for the determinant. The theorem holds as well for the slightly less well-behaved bölünmüş kuaterniyonlar, görmek Alagös, Oral & Yüce (2012). The rings of quaternions and split-quaternions can both be represented by certain 2 × 2 complex matrices. (When restricted to unit norm, these are the groups SU (2) ve SU(1, 1) respectively.) Therefore it is not surprising that the theorem holds.
    There is no such matrix representation for the sekizlik, since the multiplication operation is not associative in this case. However, a modified Cayley–Hamilton theorem still holds for the octonions, see Tian (2000).
  2. ^ An explicit expression for these coefficients is
    where the sum is taken over the sets of all integer partitions kl ≥ 0 denklemi tatmin etmek
  3. ^ See, e.g., p. 54 of Kahverengi 1994, which solves Jacobi formülü,
    nerede B is the adjugate matrix of the next section.There also exists an equivalent, related recursive algorithm introduced by Urbain Le Verrier ve Dmitry Konstantinovich Faddeev - Faddeev–LeVerrier algorithm, okur
    (see, e.g., p 88 of Gantmacher 1960.) Observe Bir−1 = −Mn /c0 as the recursion terminates.See the algebraic proof in the following section, which relies on the modes of the adjugate, BkMnk . Özellikle, and the above derivative of p when one traces it yields
    (Hou 1998 ), and the above recursions, in turn.

Notlar

  1. ^ a b Crilly 1998
  2. ^ a b Cayley 1858, pp. 17–37
  3. ^ Cayley 1889, pp. 475–496
  4. ^ a b Hamilton 1864a
  5. ^ a b Hamilton 1864b
  6. ^ a b Hamilton 1862
  7. ^ Atiyah ve MacDonald 1969
  8. ^ Hamilton 1853, s. 562
  9. ^ Zhang 1997
  10. ^ a b Frobenius 1878
  11. ^ Zeni & Rodrigues 1992
  12. ^ Barut, Zeni & Laufer 1994a
  13. ^ Barut, Zeni & Laufer 1994b
  14. ^ Laufer 1997
  15. ^ Curtright, Fairlie & Zachos 2014
  16. ^ Stein, William. Algebraic Number Theory, a Computational Approach (PDF). s. 29.
  17. ^ Bhatia 1997, s. 7
  18. ^ Garrett 2007, s. 381

Referanslar

Dış bağlantılar