Tamsayı (bilgisayar bilimi) - Integer (computer science)

Bilgisayar biliminde bir tamsayı bir veri nın-nin integral veri türü, bir veri tipi bu bazılarını temsil ediyor Aralık matematiksel tamsayılar. İntegral veri türleri farklı boyutlarda olabilir ve negatif değerler içermelerine izin verilebilir veya verilmeyebilir. Tamsayılar genellikle bir bilgisayarda ikili rakamlar (bitler) grubu olarak temsil edilir. Gruplamanın boyutu, mevcut tam sayı boyutlarının farklı bilgisayar türleri arasında farklılık göstermesi için değişiklik gösterir. Bilgisayar donanımı Sanal makineler, neredeyse her zaman bir işlemciyi temsil etmenin bir yolunu sağlar Kayıt ol veya tamsayı olarak hafıza adresi.

Değer ve temsil

değer İntegral türü olan bir öğenin değeri, karşılık gelen matematiksel tam sayıdır. İntegral türleri olabilir imzasız (yalnızca negatif olmayan tam sayıları temsil edebilir) veya imzalı (negatif tam sayıları da temsil edebilir).[1]

Bir tamsayı değeri genellikle kaynak kodu bir programın, isteğe bağlı olarak + veya - ile başlayan bir rakam dizisi olarak. Bazı programlama dilleri, onaltılık (16 tabanı) veya sekizlik (8 tabanı) gibi diğer gösterimlere izin verir. Bazı programlama dilleri de izin verir basamak grubu ayırıcılar.[2]

iç temsil Bu verinin değeri, değerin bilgisayarın belleğinde saklanma şeklidir. Matematiksel tam sayılardan farklı olarak, bir bilgisayardaki tipik bir veri, bazı minimum ve maksimum olası değere sahiptir.

Pozitif bir tamsayının en yaygın temsili bir dizedir. bitler, kullanmak ikili sayı sistemi. Hafızanın sırası bayt bitlerin depolanması değişiklik gösterir; görmek endianness. Genişlik veya hassas Bir integral türünün, temsilindeki bit sayısıdır. Bir integral türü n bitler 2'yi kodlayabilirn sayılar; örneğin, işaretsiz bir tür tipik olarak 0 ile 2 arasındaki negatif olmayan değerleri temsil edern−1. Tam sayı değerlerinin bit desenlerine diğer kodlamaları bazen kullanılır, örneğin ikili kodlu ondalık veya Gri kod veya gibi basılı karakter kodları olarak ASCII.

Dört tane iyi bilinen var işaretli sayıları temsil etme yolları ikili bir hesaplama sisteminde. En yaygın olanı Ikisinin tamamlayıcısı işaretli bir integral tipine izin veren n −2'den sayıları temsil eden bitler(n−1) 2'ye kadar(n−1)−1. İkinin tümleyen aritmetiği uygundur çünkü mükemmel bir bire bir yazışma temsiller ve değerler arasında (özellikle, ayrı +0 ve −0 yok) ve çünkü ilave, çıkarma ve çarpma işlemi işaretli ve işaretsiz türler arasında ayrım yapmaya gerek yoktur. Diğer olasılıklar arasında ofset ikili, işaret büyüklüğü, ve birinin tamamlayıcısı.

Bazı bilgisayar dilleri tamsayı boyutlarını makineden bağımsız bir şekilde tanımlar; diğerleri temeldeki işlemci kelime boyutuna bağlı olarak değişen tanımlara sahiptir. Tüm dil uygulamaları, tüm tamsayı boyutlarının değişkenlerini tanımlamaz ve belirli bir uygulamada tanımlanmış boyutlar bile farklı olmayabilir. Bir tamsayı Programlama dili farklı bir dilde veya farklı bir işlemcide farklı bir boyut olabilir.

Yaygın integral veri türleri

Bit sayısıİsimAralık (varsayım Ikisinin tamamlayıcısı için imzalı )Ondalık basamakKullanımlarUygulamalar
C /C ++C #Pascal ve DelphiJavaSQL[a]FORTRAND
4
kemirmek, yarı oktetİmza: -8'den 7'ye, - (23) 2'ye3 − 1
1
İkili kodlu ondalık, tek ondalık basamak gösterimin / an / an / an / an / an / an / a
İmzasız: 0'dan 15'e, bu da 2'ye eşittir4 − 1
2
8
bayt, sekizli, i8, u8İmza: -128'den 127'ye, - (27) 2'ye7 − 1
3
ASCII karakterler kod birimleri içinde UTF-8 karakter kodlamasıint8_t, imzalı karakter[b]sbyteShortintbaytTinyinttam sayı (1)bayt
İmzasız: 0'dan 255'e, bu da 2'ye eşittir8 − 1
3
uint8_t, imzasız karakter[b]baytBaytn / aimzasız tinyintn / aubyte
16
yarım kelime kelime, kısa, i16, u16İmza: −32.768'den 32.767'ye, - (215) 2'ye15 − 1
5
UCS-2 karakterler kod birimleri içinde UTF-16 karakter kodlamasıint16_t, kısa[b], int[b]kısaSmallintkısaSmallinttam sayı (2)kısa
İmzasız: 0'dan 65.535'e, bu da 2'ye eşittir16 − 1
5
uint16_t, imzasız[b], imzasız int[b]ushortKelimekömür[c]imzasız smallintn / aushort
32
kelime uzun, çift kelime, uzun kelime, int, i32, u32İmza: Nereden 2.147.483.648 - 2.147.483.647, - (231) 2'ye31 − 1
10
UTF-32 karakterler doğru renk alfa ile FourCC, işaretçiler 32 bit bilgi işlemint32_t, int[b], uzun[b]intLongInt; Tamsayı[d]intinttam sayı (4)int
İmzasız: 0'dan 4.294.967.295'e eşittir 232 − 1
10
uint32_t, imzasız[b], imzasız int[b], imzasız uzun[b]uintLongWord; DWord; Kardinal[d]n / aimzasız intn / auint
64
kelime, çift kelime, uzun kelime, uzun uzun, dörtlü, dörtlü kelime, qword, int64, i64, u64İmza: 9,223,372,036,854,775,808 ile 9,223,372,036,854,775,807, - (263) 2'ye63 − 1
19
Zaman (milisaniye Unix dönemi ), işaretçiler 64 bit bilgi işlemint64_t, uzun[b], uzunca[b]uzunInt64uzunBiginttam sayı (8)uzun
İmzasız: 0 ile 18,446,744,073,709,551,615 arası, bu da 2'ye eşittir64 − 1
20
uint64_t, imzasız uzun uzun[b]ulongUInt64; QWordn / aimzasız bigintn / aulong
128
octaword, çift dörtlü kelime, i128, u128İmza: −170,141,183,460,469,231,731,687,303,715,884,105,728'den 170,141,183,460,469,231,731,687,303,715,884,105,727'ye, - (2127) 2'ye127 − 1
39
Karmaşık bilimsel hesaplamalar,

IPv6 adresler,GUID'ler

C: yalnızca standart olmayan derleyiciye özgü uzantı olarak kullanılabilirn / an / an / an / atam sayı (16)sent[e]
İmzasız: 0 ile 340,282,366,920,938,463,463,374,607,431,768,211,455 arası, bu da 2'ye eşittir128 − 1
39
n / ayükselen[e]
n
n-bit tamsayı
(Genel dava)
İmza: −(2n−1) 2'yen−1 − 1)⌈(n - 1) günlük10 2⌉Ada: aralık -2 ** (n-1) .. 2 ** (n-1) -1
İmzasız: 0 - (2n − 1)n günlük10 2⌉Ada: aralık 0..2 ** n-1, mod 2 ** n; standart kitaplıkların veya üçüncü taraf rasgele aritmetik kitaplıkların Python, C ++, vb. gibi birçok dilde BigDecimal veya Decimal sınıfları

Farklı CPU'lar farklı integral veri türlerini destekler. Tipik olarak, donanım hem işaretli hem de işaretsiz türleri destekler, ancak yalnızca küçük, sabit bir genişlik kümesini destekler.

Yukarıdaki tablo, donanımda ortak işlemciler tarafından desteklenen tümleşik tip genişlikleri listeler. Üst düzey programlama dilleri daha fazla olanak sağlar. Donanım destekli en büyük türe göre iki kat daha fazla bit içeren bir 'çift genişlikli' integral türüne sahip olmak yaygındır. Birçok dilde ayrıca bit alanı türleri (belirtilen sayıda bit, genellikle donanım tarafından desteklenen maksimum genişlikten daha az olacak şekilde sınırlandırılır) ve Aralık türler (yalnızca belirli bir aralıktaki tam sayıları temsil edebilir).

Gibi bazı diller Lisp, Smalltalk, REXX, Haskell, Python, ve Raku destek keyfi hassasiyet tamsayılar (aynı zamanda sonsuz hassas tamsayılar veya Bignums ). Üst düzey bir yapı olarak bu kavramı desteklemeyen diğer diller, Java'nınki gibi daha küçük değişken dizilerini kullanarak çok büyük sayıları temsil etmek için kitaplıklara sahip olabilir. BigInteger sınıf veya Perl 's "Bigint"paket.[5] Bunlar, sayıları depolamak için gerektiği kadar bilgisayarın belleğini kullanır; ancak, bir bilgisayarın yalnızca sınırlı miktarda depolama alanı vardır, bu nedenle bunlar da matematiksel tam sayıların yalnızca sınırlı bir alt kümesini temsil edebilir. Bu şemalar çok büyük sayıları destekler, örneğin bir kilobayt bellek 2466 ondalık basamağa kadar olan sayıları saklamak için kullanılabilir.

Bir Boole veya Bayrak tür, yalnızca iki değeri temsil edebilen bir türdür: 0 ve 1, genellikle ile tanımlanan yanlış ve doğru sırasıyla. Bu tür, tek bir bit kullanılarak bellekte saklanabilir, ancak genellikle adresleme kolaylığı ve erişim hızı için tam bir bayt verilir.

Dört bitlik bir miktar, kemirmek (yemek yerken, a'dan daha küçük ısırmak) veya nybble (kelimenin biçiminde bir kelime oyunu olmak bayt). Bir yarım bayt, bir basamağa karşılık gelir onaltılık ve ikili kodlu ondalık sayı biçiminde bir rakam veya bir işaret kodu tutar.

Baytlar ve sekizliler

Dönem bayt başlangıçta 'adreslenebilir en küçük bellek birimi' anlamına geliyordu. Geçmişte 5-, 6-, 7-, 8- ve 9-bit baytların tümü kullanılmıştır. Ayrı bitleri ('bit adresli makine') veya yalnızca 16 veya 32 bitlik miktarları ('sözcük adresli makine') adresleyebilen bilgisayarlar da olmuştur. Dönem bayt genellikle bit ve kelime adresli makinelerle bağlantılı olarak kullanılmazdı.

Dönem sekizli her zaman 8 bitlik bir miktarı ifade eder. Çoğunlukla alanında kullanılır bilgisayar ağı, farklı bayt genişliklerine sahip bilgisayarların iletişim kurması gerekebilir.

Modern kullanımda bayt neredeyse değişmez bir şekilde sekiz bit anlamına gelir, çünkü diğer tüm boyutlar kullanılmaz hale gelmiştir; Böylece bayt ile eşanlamlı hale geldi sekizli.

Kelimeler

'Kelime' terimi, belirli bir işlemci tarafından eşzamanlı olarak işlenen küçük bir bit grubu için kullanılır. mimari. Dolayısıyla bir kelimenin boyutu CPU'ya özgüdür. 6-, 8-, 12-, 16-, 18-, 24-, 32-, 36-, 39-, 40-, 48-, 60- ve 64-bit dahil olmak üzere birçok farklı kelime boyutu kullanılmıştır. Mimari olduğu için bir kelime genellikle daha sonraki uyumlu bir CPU'nun özelliklerinden ziyade bir ailedeki ilk CPU tarafından ayarlanır. Türetilen terimlerin anlamları kelime, gibi uzun kelime, çift ​​kelime, dört kelime, ve yarım kelimeayrıca CPU ve işletim sistemine göre değişir.[6]

Pratik olarak tüm yeni masaüstü işlemciler 64 bit sözcükleri kullanabilir. gömülü işlemciler 8- ve 16 bitlik kelime boyutu hala yaygındır. 36 bit kelime uzunluğu bilgisayarların ilk günlerinde yaygındı.

Yazılımın taşınabilir olmamasının önemli bir nedeni, tüm bilgisayarların programcı tarafından kullanılan bilgisayarla aynı kelime boyutuna sahip olduğu yönündeki yanlış varsayımdır. Örneğin, C dilini kullanan bir programcı yanlış bir şekilde int 2'den büyük değerleri saklamak için kullanılacak bir değişken15−1, program 16 bitlik tam sayıya sahip bilgisayarlarda başarısız olur. Bu değişken şu şekilde beyan edilmelidir: uzun, herhangi bir bilgisayarda en az 32 bit olan. Programcılar ayrıca yanlış bir şekilde bir işaretçinin bilgi kaybı olmadan bir tam sayıya dönüştürülebileceğini varsayabilir; bu (bazı) 32 bit bilgisayarlarda çalışabilir, ancak 64 bitlik işaretçiler ve 32 bit tam sayılara sahip 64 bit bilgisayarlarda başarısız olabilir. Bu sorun C99 ile çözüldü stdint.h şeklinde intptr_t.

Kısa tamsayı

Bir kısa tamsayı aynı makinedeki standart bir tam sayıya kıyasla daha küçük bir aralığa sahipken daha az depolama alan bir tam sayıyı temsil edebilir.

İçinde C ile gösterilir kısa. En az 16 bit olması gerekir ve genellikle standart bir tam sayıdan daha küçüktür, ancak bu gerekli değildir.[7][8] Uyumlu bir program, değerleri - (215−1)[9] ve 215−1,[10] ancak aralığın daha geniş olmadığı varsayılmayabilir. İçinde Java, bir kısa dır-dir her zaman 16 bitlik bir tam sayı. İçinde Windows API, veri türü KISA tüm makinelerde 16 bitlik işaretli tamsayı olarak tanımlanır.[6]

Yaygın kısa tam sayı boyutları
Programlama diliVeri türü adıİmzaBoyut baytEn az değerMaksimum değer
C ve C ++kısaimzalı2−32,767[f]+32,767
imzasız kısaimzasız2065,535
C #kısaimzalı2−32,768+32,767
ushortimzasız2065,535
Javakısaimzalı2−32,768+32,767

Uzun tam sayı

Bir uzun tam sayı bir bütünü temsil edebilir tamsayı kimin Aralık aynı makinedeki standart bir tam sayıdan büyük veya ona eşittir.

İçinde C ile gösterilir uzun. En az 32 bit olması gerekir ve standart bir tam sayıdan büyük olabilir veya olmayabilir. Uyumlu bir program, değerleri - (231−1)[9] ve 231−1,[10] ancak aralığın daha geniş olmadığı varsayılmayabilir.

Yaygın uzun tam sayı boyutları
Programlama diliOnay TürüPlatformlarVeri türü adıİçinde depolama baytİmzalandı Aralıkİmzasız Aralık
C ISO / ANSI C99Uluslararası StandartUnix, 16/32-bit sistemler[6]
pencereler, 16/32/64-bit sistemler[6]
uzun[g]4
(minimum gereksinim 4)
−2.147.483.647 ile +2.147.483.6470 - 4.294.967.295
(minimum gereksinim)
C ISO / ANSI C99Uluslararası StandartUnix,
64 bit sistemler[6][8]
uzun[g]8
(minimum gereksinim 4)
−9.223.372.036.854.775.807 ile +9.223.372.036.854.775.8070 ile 18,446,744,073,709,551,615
C ++ ISO / ANSIUluslararası StandartUnix, pencereler,
16/32-bit sistem
uzun[g]4 [12]
(minimum gereksinim 4)
−2.147.483.648 ile +2.147.483.647
0 ile 4.294.967.295
(minimum gereksinim)
C ++ / CLIUluslararası Standart
ECMA-372
Unix, pencereler,
16/32-bit sistemler
uzun[g]4 [13]
(minimum gereksinim 4)
−2.147.483.648 ile +2.147.483.647
0 ile 4.294.967.295
(minimum gereksinim)
VBŞirket StandardıpencerelerUzun4 [14]−2.147.483.648 ile +2.147.483.647Yok
VBAŞirket Standardıpencereler, Mac OS XUzun4 [15]−2.147.483.648 ile +2.147.483.647Yok
SQL ServerŞirket StandardıpencerelerBigInt8−9,223,372,036,854,775,808 ile +9,223,372,036,854,775,8070 ile 18,446,744,073,709,551,615
C # / VB.NETECMA Uluslararası StandardıMicrosoft .NETuzun veya Int648−9,223,372,036,854,775,808 ile +9,223,372,036,854,775,8070 ile 18,446,744,073,709,551,615
JavaUluslararası / Şirket StandardıJava platformuuzun8−9,223,372,036,854,775,808 ile +9,223,372,036,854,775,807Yok
Pascal?pencereler, UNIXint648−9,223,372,036,854,775,808 ile +9,223,372,036,854,775,8070 - 18,446,744,073,709,551,615 (Qword türü)

Uzunca

İçinde C99 versiyonu C programlama dili ve C ++ 11 versiyonu C ++, bir uzunca standardın minimum kapasitesini iki katına çıkaran tür desteklenir uzun. Bu tür, C kodunun önceki C ++ standardı olan C ++ 03 ile uyumlu olmasını gerektiren derleyiciler tarafından desteklenmez, çünkü uzunca type C ++ 03'te mevcut değildi. ANSI / ISO uyumlu bir derleyici için, belirtilen aralıklar için minimum gereksinimler, yani - (263−1)[9] 2'ye63−1 imzalı ve 0 ila 264İmzasızlar için −1,[10] yerine getirilmelidir; ancak bu aralığın genişletilmesine izin verilir.[16][17] Bu, platformlar arasında kod ve veri alışverişi yaparken veya doğrudan donanım erişimi yaparken bir sorun olabilir. Bu nedenle, platformdan bağımsız tam genişlik türleri sağlayan birkaç başlık seti vardır. C standart kitaplık sağlar stdint.h; bu, C99 ve C ++ 11'de tanıtıldı.

Ayrıca bakınız

Notlar

  1. ^ Tüm SQL lehçelerinin işaretsiz veri türleri yoktur.[3][4]
  2. ^ a b c d e f g h ben j k l m n Boyutları kömür, kısa, int, uzun ve uzunca C / C ++ 'da dilin uygulanmasına bağlıdır.
  3. ^ Java, aritmetiği doğrudan desteklemez kömür türleri. Sonuçlar geri alınmalıdır kömür bir int.
  4. ^ a b Delphi'nin boyutları Tamsayı ve Kardinal garanti edilmez, platformdan platforma değişir; genellikle şöyle tanımlanır LongInt ve LongWord sırasıyla.
  5. ^ a b Gelecekte kullanılmak üzere rezerve edilmiştir. Henüz uygulanmadı.
  6. ^ ISO C standardı, uygulamaların değeri işaret biti 1 ve diğer tüm bitler 0 (işaret-büyüklük ve ikinin tamamlayıcı gösterimi için) veya tüm bitler 1 (birlerin tamamlayıcısı için) ile bir "tuzak" değeri olarak kullanılmak üzere ayırmasına izin verir. (örneğin) bir taşmayı göstermek için.[9]
  7. ^ a b c d Şartlar uzun ve int eşdeğerdir[11]

Referanslar

  1. ^ Cheever, Eric. "Sayıların temsili". Swarthmore Koleji. Alındı 2011-09-11.
  2. ^ Madhusudhan Konda (2011-09-02). "Java 7'nin yeni özelliklerine bir bakış - O'Reilly Radar". Radar.oreilly.com. Alındı 2013-10-15.
  3. ^ "Sybase Adaptive Server Enterprise 15.5: Tam Sayısal Veri Tipleri".
  4. ^ "MySQL 5.6 Sayısal Veri Türleri".
  5. ^ "BigInteger (Java Platformu SE 6)". Oracle. Alındı 2011-09-11.
  6. ^ a b c d e Sis, Agner (2010-02-16). "Farklı C ++ derleyicileri ve işletim sistemleri için çağrı kuralları: Bölüm 3, Veri Gösterimi" (PDF). Alındı 2010-08-30.
  7. ^ Giguere, Eric (1987-12-18). "ANSI Standardı: C Programcısı için Bir Özet". Alındı 2010-09-04.
  8. ^ a b Meyers Randy (2000-12-01). "Yeni C: C99'daki Tam Sayılar, Bölüm 1". drdobbs.com. Alındı 2010-09-04.
  9. ^ a b c d "ISO / IEC 9899: 201x" (PDF). open-std.org. bölüm 6.2.6.2, paragraf 2. Alındı 2016-06-20.
  10. ^ a b c "ISO / IEC 9899: 201x" (PDF). open-std.org. bölüm 5.2.4.2.1. Alındı 2016-06-20.
  11. ^ "ISO / IEC 9899: 201x" (PDF). open-std.org. Alındı 2013-03-27.
  12. ^ "C ++ 'da temel türler". cppreference.com. Alındı 5 Aralık 2010.
  13. ^ "Bölüm 8.6.2, sayfa 12" (PDF). ecma-international.org.
  14. ^ VB 6.0 yardım dosyası
  15. ^ "Tamsayı, Uzun ve Bayt Veri Türleri (VBA)". microsoft.com. Alındı 2006-12-19.
  16. ^ Giguere Eric (18 Aralık 1987). "ANSI Standardı: C Programcısı için Bir Özet". Alındı 2010-09-04.
  17. ^ "Amerikan Ulusal Standart Programlama Dili C, C programlama dilinde yazılmış programların sözdizimini ve anlambilimini belirtir". Arşivlenen orijinal 2010-08-22 tarihinde. Alındı 2010-09-04.