Çıkarım türü - Type inference

Çıkarım türü otomatik tespitini ifade eder tip içindeki bir ifadenin resmi dil. Böyle içerir Programlama dilleri, matematiksel tip sistemler ama aynı zamanda doğal diller bazı dallarında bilgisayar Bilimi ve dilbilimsel.

Teknik olmayan açıklama

En genel görünümdeki türler, bu türden bir nesne için olası etkinlikleri öneren ve kısıtlayan belirlenmiş bir kullanımla ilişkilendirilebilir. Dildeki birçok isim bu tür kullanımları belirtir. Örneğin, kelime tasma kelimeden farklı bir kullanımı gösterir hat. Bir şeyi aramak masa onu çağırmaktan başka bir sıfatı gösterir yakacak odun ama maddi olarak aynı şey olabilir. Maddi özellikleri şeyleri bazı amaçlar için kullanılabilir hale getirirken, aynı zamanda belirli tanımlara da tabidirler. Bu, özellikle materyalin nihayet sadece bitler veya formüller olduğu soyut alanlarda, yani matematik ve bilgisayar bilimlerinde geçerlidir.

İstenmeyen, ancak maddi olarak olası kullanımları dışlamak için, türler kavramı birçok varyasyonda tanımlanır ve uygulanır. Matematikte, Russell paradoksu tip teorisinin ilk versiyonlarını ateşledi. Programlama dillerinde tipik örnekler "tür hataları" dır, ör. bir bilgisayara sayı olmayan değerleri toplamasını sipariş etmek. "Maddi olarak" mümkün olsa da, sonuç artık anlamlı olmayacak ve belki de tüm süreç için felaket olacaktır.

İçinde yazıyorbir ifade, bir türe zıttır. Örneğin, , , ve türüne sahip ayrı terimlerdir doğal sayılar için. Geleneksel olarak, ifadenin ardından iki nokta üst üste ve türü gelir; örneğin - bu, değerin tipte . Bu form aynı zamanda yeni isimleri bildirmek için de kullanılır, ör. tıpkı bir sahneye "dedektif Decker" kelimesiyle yeni bir karakter eklemek gibi.

Tanımlamaların yavaşça ortaya çıktığı bir hikayenin aksine, biçimsel dillerdeki nesnelerin genellikle en baştan türleriyle tanımlanması gerekir. Ek olarak, ifadeler belirsizse, amaçlanan kullanımı açık hale getirmek için türler gerekebilir. Örneğin, ifade bir türü olabilir ancak rasyonel veya gerçek bir sayı veya hatta düz bir metin olarak da okunabilir.

Sonuç olarak, programlar veya ispatlar türlerle öylesine yüklenebilir ki, onları bağlamdan çıkarmak arzu edilir. Bu, türlenmemiş ifadelerin (tanımsız adlar dahil) kullanımlarını toplayarak mümkün olabilir. Örneğin, henüz tanımlanmamış bir ad n bir ifadede kullanılır , şu sonuca varılabilir: n en az bir sayıdır. Türü bir ifadeden ve bağlamından çıkarma işlemi tür çıkarımı.

Genelde sadece nesneler değil, faaliyetlerin de türleri vardır ve bunlar sadece kullanımları ile tanıtılabilir. Bir star trek hikayesi için, böyle bilinmeyen bir aktivite "ışıldıyor" olabilir; bu, hikayenin akışı uğruna henüz yürütülür ve asla resmen tanıtılmaz. Yine de, ne olduğunu takiben türü (ulaşım) anlaşılabilir. Ek olarak, hem nesneler hem de faaliyetler kendi parçalarından inşa edilebilir. Böyle bir ortamda, tür çıkarımı yalnızca daha karmaşık hale gelmekle kalmaz, aynı zamanda, çakışan veya istenmeyen kullanımları tespit etmeye devam ederken, oluşturulmuş bir sahnedeki her şeyin tam bir açıklamasını toplamaya izin verdiği için daha yararlı hale gelir.

Tür denetimi ve tür çıkarımı

Bir tiplemede, E ifadesi, resmi olarak E: T olarak yazılan bir T tipine zıttır. Genellikle bir tipleme, burada atlanmış olan bazı bağlamlar içinde anlamlıdır.

Bu ortamda, aşağıdaki sorular özellikle ilgi çekicidir:

  1. E: T? Bu durumda, hem bir E ifadesi hem de bir T tipi verilir. Şimdi, E gerçekten T mi? Bu senaryo şu şekilde bilinir: tür denetimi.
  2. E: _? Burada sadece ifade bilinmektedir. E için bir tür türetmenin bir yolu varsa, o zaman başardık tür çıkarımı.
  3. _: T? Tam tersi. Yalnızca bir tür verildiğinde, bunun için herhangi bir ifade var mı veya türün değeri yok mu? Herhangi bir T örneği var mı?

İçin basit yazılan lambda hesabı üç soru da karar verilebilir. Daha etkileyici türlere izin verildiğinde durum o kadar rahat değildir.

Programlama dillerinde türler

Türler, bazılarında bulunan bir özelliktir. şiddetle statik olarak yazılmış Diller. Genellikle karakteristiktir fonksiyonel programlama dilleri Genel olarak. Tür çıkarımı içeren bazı diller şunları içerir: C ++ 11, C # (3.0 sürümünden başlayarak), Şapel, Temiz, Kristal, D, F #,[1] FreeBASIC, Git, Haskell, Java (sürüm 10'dan başlayarak), Julia,[2] Kotlin, ML, Nim, OCaml, Opa, RPython, Pas, paslanma, Scala, Swift,[3] TypeScript,[4] Vala, Dart oyunu,[5] ve Visual Basic (9.0 sürümünden itibaren). Çoğu, basit bir tür çıkarım biçimi kullanır; Hindley-Milner tipi sistem daha eksiksiz tür çıkarımı sağlayabilir. Türleri otomatik olarak çıkarma yeteneği, birçok programlama görevini daha kolay hale getirerek programcıyı atlamakta özgür bırakır ek açıklamalar yazın yine de tip kontrolüne izin verirken.

Bazı programlama dillerinde, tüm değerlerin bir veri tipi açıkça beyan edildi Derleme zamanı, belirli bir ifadenin alabileceği değerleri sınırlamak Çalışma süresi. Giderek, tam zamanında derleme çalışma süresi ile derleme süresi tartışması arasındaki farkı ortaya çıkarır. Bununla birlikte, tarihsel olarak, bir değerin türü yalnızca çalışma zamanında biliniyorsa, bu diller dinamik olarak yazılmış. Diğer dillerde, bir ifadenin türü yalnızca şu adresten bilinmektedir: Derleme zamanı; bu diller statik olarak yazılmış. Statik olarak yazılmış çoğu dilde, işlevlerin girdi ve çıktı türleri ve yerel değişkenler normalde tür ek açıklamaları tarafından açıkça sağlanmalıdır. Örneğin, C:

int add_one(int x) {    int sonuç; / * tamsayı sonucu bildir * /    sonuç = x + 1;    dönüş sonuç;}

imza bu fonksiyon tanımının int add_one (int x), beyan eder ki add_one bir bağımsız değişken alan bir işlevdir, tamsayı ve bir tamsayı döndürür. int sonuç; yerel değişkenin sonuç bir tamsayıdır. Tür çıkarımını destekleyen varsayımsal bir dilde, kod bunun yerine şu şekilde yazılabilir:

add_one(x) {    var sonuç;  / * çıkarılan türden değişken sonucu * /    var sonuç2; / * çıkarılan türden değişken sonuç # 2 * /    sonuç = x + 1;    sonuç2 = x + 1.0;  / * bu satır çalışmayacak (önerilen dilde) * /    dönüş sonuç;}

Bu, kodun dilde nasıl yazıldığıyla aynıdır Dart oyunu aşağıda açıklanan bazı ek kısıtlamalara tabi olması dışında. Mümkün olabilirdi anlam çıkarmak derleme zamanında tüm değişkenlerin türleri. Yukarıdaki örnekte, derleyici şunu çıkaracaktır: sonuç ve x sabitten beri tür tamsayı var 1 tür tamsayıdır ve dolayısıyla add_one bir işlev int -> int. Değişken sonuç2 yasal bir şekilde kullanılmadığı için bir türü olmayacak.

Son örneğin yazıldığı hayali dilde, derleyici, aksi yönde bilgi bulunmadığında, + iki tamsayı alır ve bir tamsayı döndürür. (Bu, örneğin, OCaml Bundan, tür çıkarıcısı, türünün x + 1 tam sayıdır, yani sonuç bir tamsayıdır ve dolayısıyla dönüş değeri add_one bir tamsayıdır. Benzer şekilde + her iki argümanının da aynı türde olmasını gerektirir, x bir tam sayı olmalıdır ve bu nedenle, add_one bağımsız değişken olarak bir tamsayıyı kabul eder.

Ancak sonraki satırda sonuç2 bir ondalık sayı eklenerek hesaplanır 1.0 kayan nokta aritmetiği ile, kullanımında bir çatışmaya neden olur x hem tamsayı hem de kayan nokta ifadeleri için. Böyle bir durum için doğru tür çıkarım algoritması bilinmektedir 1958'den beri ve 1982'den beri doğru olduğu bilinmektedir. Önceki çıkarımları yeniden gözden geçirir ve en başından beri en genel türü kullanır: bu durumda kayan nokta. Bununla birlikte, bunun zararlı etkileri olabilir, örneğin, başlangıçtan itibaren bir kayan nokta kullanmak, tamsayı türünde bulunmayan kesinlik sorunlarını ortaya çıkarabilir.

Bununla birlikte, çoğu kez, geri dönüş yapamayan ve bunun yerine böyle bir durumda bir hata mesajı üreten dejenere tip çıkarım algoritmaları kullanılır. Önceki kayan noktalı kesinlik sorunu ile gösterildiği gibi, tür çıkarımı algoritmik olarak her zaman nötr olmayabileceği için bu davranış tercih edilebilir.

Bir ara genellik algoritması örtük olarak bildirir sonuç2 bir kayan nokta değişkeni olarak ve ekleme örtük olarak dönüştürür x kayan bir noktaya. Çağıran bağlamlar hiçbir zaman bir kayan nokta argümanı sağlamazsa bu doğru olabilir. Böyle bir durum arasındaki farkı gösterir tür çıkarımıiçermeyen tür dönüşümü, ve örtük tür dönüştürme, verileri genellikle kısıtlama olmaksızın farklı bir veri türüne zorlar.

Son olarak, karmaşık tür çıkarım algoritmasının önemli bir dezavantajı, ortaya çıkan tür çıkarım çözümlemesinin insanlar için (özellikle geri izleme nedeniyle) açık olmamasıdır; bu, kodun öncelikle insanlar için anlaşılabilir olması amaçlandığından zararlı olabilir.

Son ortaya çıkışı tam zamanında derleme çeşitli çağrı bağlamı tarafından sağlanan argümanların türünün derleme zamanında bilindiği ve aynı işlevin çok sayıda derlenmiş versiyonunu üretebildiği hibrit yaklaşımlara izin verir. Her derlenen sürüm daha sonra farklı bir tür kümesi için optimize edilebilir. Örneğin, JIT derlemesi, en az iki derlenmiş sürümün olmasına izin verir. add_one:

Tam sayı girdisini kabul eden ve örtük tür dönüştürmeyi kullanan bir sürüm.
Bir kayan nokta sayısını girdi olarak kabul eden ve baştan sona kayan nokta talimatlarını kullanan bir sürüm.

Teknik Açıklama

Tür çıkarımı, derleme zamanında bir ifadenin türünü kısmen veya tamamen otomatik olarak çıkarma yeteneğidir. Derleyici genellikle bir değişkenin türünü veya tip imzası açık tür ek açıklamaları verilmeden bir işlevin. Çoğu durumda, tür çıkarım sistemi yeterince sağlamsa veya program veya dil yeterince basitse, bir programdan tür ek açıklamalarını tamamen çıkarmak mümkündür.

Bir ifadenin türünü anlamak için gerekli olan bilgileri elde etmek için, derleyici bu bilgileri ya alt ifadeleri için verilen tür ek açıklamalarının bir toplamı ve daha sonra azalması olarak veya çeşitli atomik değerlerin türünün örtük bir şekilde anlaşılması yoluyla toplar (örneğin, doğru: Bool; 42: Tamsayı; 3.14159: Gerçek; vb.). İfadelerin dolaylı olarak yazılan atomik değerlere indirgenmesinin tanınması yoluyla, bir tür çıkarım dili için derleyici, bir programı tür ek açıklamaları olmadan tamamen derleyebilir.

Karmaşık şekillerde üst düzey programlama ve çok biçimlilik, derleyicinin bu kadar çok sonuç çıkarması her zaman mümkün değildir ve belirsizliği gidermek için ara sıra tür ek açıklamaları gereklidir. Örneğin, çıkarım yazın polimorfik özyineleme karar verilemez olduğu bilinmektedir. Ayrıca, açık tür ek açıklamaları, derleyiciyi çıkardığından daha spesifik (daha hızlı / daha küçük) bir tür kullanmaya zorlayarak kodu optimize etmek için kullanılabilir.[6]

Tür çıkarımı için bazı yöntemler, kısıtlama memnuniyeti[7] veya tatmin edilebilirlik modülo teorileri.[8]

Misal

Örnek olarak, Haskell işlevi harita bir listenin her öğesine bir işlev uygular ve şu şekilde tanımlanabilir:

harita f [] = []harita f (ilk:dinlenme) = f ilk : harita f dinlenme

Çıkarımı yazın harita işlevi aşağıdaki şekilde ilerler. harita iki bağımsız değişkenin bir işlevidir, bu nedenle türü, formda olmak üzere sınırlandırılmıştır. a → b → c. Haskell'de desenler [] ve (ilk: dinlenme) her zaman listeleri eşleştirin, bu nedenle ikinci bağımsız değişken bir liste türü olmalıdır: b = [d] bir tür için d. İlk argümanı f dır-dir uygulamalı tartışmaya ilktürüne sahip olması gereken d, liste bağımsız değişkenindeki türe karşılık gelir, bu nedenle f :: d → e (:: bir tür için "türdür" anlamına gelir e. Dönüş değeri harita f, nihayet her neyse f üretir, yani [e].

Parçaları bir araya getirmek harita :: (d → e) → [d] → [e]. Tür değişkenleri hakkında hiçbir şey özel değildir, bu nedenle yeniden etiketlenebilir

harita :: (a  b)  [a]  [b]

Başka kısıtlamalar uygulanmadığı için, bunun aynı zamanda en genel tür olduğu ortaya çıktı. Çıkarsanan türü olarak harita dır-dir parametrik olarak polimorfik, argümanların türü ve sonuçları f çıkarılmaz, ancak tür değişkenleri olarak bırakılır ve bu nedenle harita Her çağrıda gerçek türler eşleştiği sürece çeşitli türlerdeki işlevlere ve listelere uygulanabilir.

Hindley – Milner tipi çıkarım algoritması

İlk olarak tür çıkarımını gerçekleştirmek için kullanılan algoritma artık gayri resmi olarak Hindley – Milner algoritması olarak adlandırılıyor, ancak algoritma uygun şekilde Damas ve Milner'a atfedilmelidir.[9]

Bu algoritmanın kökeni, aşağıdakiler için tür çıkarım algoritmasıdır. basit yazılan lambda hesabı tarafından tasarlandı Haskell Köri ve Robert Feys 1958'de. 1969'da J. Roger Hindley bu çalışmayı genişletti ve algoritmalarının her zaman en genel türü çıkardığını kanıtladı. 1978'de Robin Milner,[10] Hindley'in çalışmasından bağımsız olarak eşdeğer bir algoritma sağladı, Algoritma W 1982'de Luis Damas[9] nihayet Milner'ın algoritmasının tamamlandığını kanıtladı ve onu polimorfik referanslara sahip sistemleri desteklemek için genişletti.

En genel türü kullanmanın yan etkileri

Tasarım gereği, tür çıkarımı, özellikle doğru (geri izleme) tür çıkarımı, uygun olan en genel türün kullanımını getirecektir, ancak bu, daha genel türler her zaman algoritmik olarak nötr olmayabileceğinden, tipik durumlar şunlardır:

  • kayan nokta genel bir tamsayı türü olarak kabul edilirken, kayan nokta hassaslık sorunları ortaya çıkaracaktır
  • varyant / dinamik türler, farklı olabilecek çevrim kurallarını ve karşılaştırmayı ortaya çıkaracak diğer türlerin genel bir türü olarak kabul edilir; örneğin, bu tür türler hem sayısal eklemeler hem de dize birleştirmeleri için '+' operatörünü kullanır, ancak hangi işlem yapılır? statik olarak değil dinamik olarak belirlenir

Doğal diller için tür çıkarımı

Analiz etmek için tür çıkarım algoritmaları kullanılmıştır doğal diller yanı sıra programlama dilleri.[11][12][13] Tür çıkarım algoritmaları da bazılarında kullanılır. gramer indüksiyonu[14][15] ve kısıtlamaya dayalı dilbilgisi doğal diller için sistemler.[16]

Referanslar

  1. ^ cartermp. "Tür Çıkarımı - F #". docs.microsoft.com. Alındı 2020-11-21.
  2. ^ "Çıkarım · Julia Dili". docs.julialang.org. Alındı 2020-11-21.
  3. ^ "Tür Çıkarımı". Scala Belgeleri. Alındı 2020-11-21.
  4. ^ "Belgeler - Tür Çıkarımı". www.typescriptlang.org. Alındı 2020-11-21.
  5. ^ "Dart tipi sistem". dart.dev. Alındı 2020-11-21.
  6. ^ Bryan O'Sullivan; Don Stewart; John Goerzen (2008). "Bölüm 25. Profil oluşturma ve optimizasyon". Gerçek Dünya Haskell. O'Reilly.
  7. ^ Talpin, Jean-Pierre ve Pierre Jouvelot. "Polimorfik tip, bölge ve etki çıkarımı "Journal of fonksiyonel programlama 2.3 (1992): 245-271.
  8. ^ Hassan, Mostafa; Kentsel, Caterina; Eilers, Marco; Müller, Peter (2018). "Python 3 için MaxSMT Tabanlı Tür Çıkarımı". Bilgisayar Destekli Doğrulama. Bilgisayar Bilimlerinde Ders Notları. 10982. sayfa 12–19. doi:10.1007/978-3-319-96142-2_2. ISBN  978-3-319-96141-5.
  9. ^ a b Damas, Luis; Milner, Robin (1982), "Fonksiyonel programlar için temel tip şemaları", POPL '82: 9. ACM SIGPLAN-SIGACT sempozyumunun programlama dilleri ilkeleri üzerine bildirileri (PDF), ACM, s. 207–212
  10. ^ Milner, Robin (1978), "Programlamada Tip Polimorfizminin Bir Teorisi", Bilgisayar ve Sistem Bilimleri Dergisi, 17 (3): 348–375, doi:10.1016/0022-0000(78)90014-4
  11. ^ Center, Artificiał Intelligence. Doğal ve bilgisayar dilleri için ayrıştırma ve tür çıkarımı. Diss. Stanford Üniversitesi, 1989.
  12. ^ Emele, Martin C. ve Rémi Zajac. "Yazılı birleştirme gramerleri "Hesaplamalı dilbilim üzerine 13. Konferansı Bildiriler - Cilt 3. Hesaplamalı Dilbilim Derneği, 1990.
  13. ^ Pareschi, Remo. "Tip odaklı doğal dil analizi." (1988).
  14. ^ Fisher, Kathleen, vd. "Fisher, Kathleen ve diğerleri."Topraktan kepçelere: ad hoc verilerden tam otomatik takım oluşturma. "ACM SIGPLAN Bildirimleri. Cilt 43. No. 1. ACM, 2008." ACM SIGPLAN Bildirimleri. Cilt 43. No. 1. ACM, 2008.
  15. ^ Lappin, Şalom; Shieber, Stuart M. (2007). "Evrensel dilbilgisine ilişkin bir içgörü kaynağı olarak makine öğrenimi teorisi ve uygulaması" (PDF). Dilbilim Dergisi. 43 (2): 393–427. doi:10.1017 / s0022226707004628.
  16. ^ Stuart M. Shieber (1992). Kısıtlamaya Dayalı Dilbilgisi Biçimleri: Doğal ve Bilgisayar Dilleri için Ayrıştırma ve Tür Çıkarımı. MIT Basın. ISBN  978-0-262-19324-5.

Dış bağlantılar