Yarı tanımlayıcı - Quasi-identifier

Yarı tanımlayıcılar kendilerine ait olmayan bilgi parçalarıdır benzersiz tanımlayıcılar ancak, benzersiz bir tanımlayıcı oluşturmak için diğer yarı tanımlayıcılarla birleştirilebilecekleri bir varlık ile yeterince iyi ilişkilendirilmiştir.[1]

Yarı tanımlayıcılar bu nedenle birleştirildiğinde kişisel olarak tanımlayıcı bilgiler. Bu sürece denir yeniden tanımlama. Örnek olarak, Latanya Sweeney her ikisi de olmamasına rağmen Cinsiyet, doğum tarihleri ne de Posta kodları Bir bireyi benzersiz bir şekilde tanımlamak için, üçünün kombinasyonu Amerika Birleşik Devletleri'ndeki bireylerin% 87'sini tanımlamak için yeterlidir.[2]

Terim 1986 yılında Tore Dalenius tarafından tanıtıldı.[3] O zamandan beri, yarı tanımlayıcılar, serbest bırakılan verilere yönelik çeşitli saldırıların temeli olmuştur. Örneğin, Sweeney, benzersiz tanımlayıcı yarı tanımlayıcıları kullanarak o zamanki Massachusetts valisinin hastane kayıtlarını bulmak için sağlık kayıtlarını halka açık bilgilerle ilişkilendirdi.[4][5] ve Sweeney, Abu ve Winn Kişisel Genom Projesindeki katılımcıları yeniden belirlemek için halka açık seçmen kayıtlarını kullandı.[6] Ek olarak, Arvind Narayanan ve Vitaly Shmatikov, Netflix tarafından yayınlanan verilerin anonim hale getirilmesi için istatistiksel koşulları belirtmek için yarı tanımlayıcıları tartıştı.[7]

Motwani ve Ying, yarı tanımlayıcılar içeren büyük hacimli hükümet ve iş verilerinin yayınlanmasıyla olası gizlilik ihlallerinin mümkün olduğu konusunda uyarıyor.[8]

Ayrıca bakınız

Referanslar

  1. ^ "İstatistik Terimler Sözlüğü: Yarı-tanımlayıcı". OECD. 10 Kasım 2005. Alındı 29 Eylül 2013.
  2. ^ Sweeney, Latanya. Basit demografik bilgiler genellikle insanları benzersiz şekilde tanımlar. Carnegie Mellon Üniversitesi, 2000. http://dataprivacylab.org/projects/identifiability/paper1.pdf
  3. ^ Dalenius, Tore. Samanlıkta İğne Bulma veya Anonim Sayım Kayıtlarını Tanımlama. Journal of Official Statistics, Cilt 2, No. 3, 1986. s. 329–336. http://www.jos.nu/Articles/abstract.asp?article=23329 Arşivlendi 2017-08-08 at Wayback Makinesi
  4. ^ Anderson, Nate. Anonim veriler gerçekten değildir ve işte neden olmasın. Ars Technica, 2009. https://arstechnica.com/tech-policy/2009/09/your-secrets-live-online-in-databases-of-ruin/
  5. ^ Barth-Jones, Daniel C. Vali William Weld'in tıbbi bilgilerinin 'kimliği': o zaman ve şimdi sağlık verilerinin tanımlanması risklerinin ve gizlilik korumalarının kritik bir yeniden incelenmesi. Sonra ve Şimdi (4 Haziran 2012) (2012).
  6. ^ Sweeney, Latanya, Akua Abu ve Julia Winn. "Kişisel genom projesindeki katılımcıları isme göre tanımlama." SSRN 2257732 (2013) 'te mevcuttur.
  7. ^ Narayanan, Arvind ve Shmatikov, Vitaly. Büyük Seyrek Veri Kümelerinin Güçlü Anonim Hale Getirilmesi. Austin'deki Texas Üniversitesi, 2008. https://www.cs.utexas.edu/~shmat/shmat_oak08netflix.pdf
  8. ^ Rajeev Motwani ve Ying Xu (2008). Yarı Tanımlayıcıları Maskelemek ve Bulmak İçin Etkili Algoritmalar (PDF). SDM’08 Uluslararası Pratik Gizliliği Koruma Veri Madenciliği Çalıştayı Bildirileri.