Kimlik gizleme - De-identification

Bir kişi genellikle doğrudan çekilen bir fotoğraftan kolayca tanımlanabilirken, sınırlı bir temelde onları tanımlama görevi veri daha zordur, ancak bazen mümkündür.

Kimlik gizleme önlemek için kullanılan süreçtir kişisel kimlik ifşa edilmekten. Örneğin, veri sırasında üretildi insan konu araştırması korumak için kimliksizleştirilebilir araştırma katılımcılarının mahremiyeti. Hasta mahremiyet yasalarını tanımlayan ve şart koşan HIPAA düzenlemelerine uymak için biyolojik verilerin kimliği kaldırılabilir. [1]

Uygulandığında meta veriler veya tanımlama ile ilgili genel veriler, süreç aynı zamanda veri anonimleştirme. Yaygın stratejiler arasında silme veya maskeleme yer alır kişisel tanımlayıcılar, gibi kişisel isim ve bastırma veya genelleme yarı tanımlayıcılar, doğum tarihi gibi. Bireyleri tanımlamak için kimliksiz verileri kullanmanın tersi süreci şu şekilde bilinir: verileri yeniden tanımlama. Başarılı yeniden tanımlamalar[2][3][4][5] kimlik gizleme işleminin etkinliği konusunda şüphe uyandırmak. On dört farklı yeniden tanımlama saldırısının sistematik bir incelemesi, "mevcut standartlara göre kimlik tanımları kaldırılmayan verilerle ilgili küçük ölçekli çalışmaların hakim olduğu yüksek bir yeniden tanımlama oranını […] buldu.[6]

Kimlik gizliliği, verilere yönelik ana yaklaşımlardan biri olarak benimsenir Gizlilik koruması. Yaygın olarak iletişim, multimedya, biyometri alanlarında kullanılır. Büyük veri, Bulut bilişim, veri madenciliği, internet, sosyal ağlar ve ses-video gözetimi.[7]

Örnekler

Anket tasarlarken

Gibi bir anket yapılır sayım, bir grup insan hakkında bilgi toplamak için. Katılımı teşvik etmek ve ankete katılanların mahremiyetini korumak için, araştırmacılar anketi, insanlar bir ankete katıldıklarında herhangi bir katılımcının bireysel yanıtlarını yayınlanan verilerle eşleştirmenin mümkün olmayacağı şekilde tasarlamaya çalışırlar.

Bilgileri kullanmadan önce

Bir çevrimiçi alışveriş sitesi, kullanıcılarının tercihlerini ve alışveriş alışkanlıklarını bilmek istediğinde, müşterilerinin verilerini veritabanından almaya ve bunlar üzerinde analiz yapmaya karar verir. Kişisel veri bilgileri şunları içerir: kişisel tanımlayıcılar müşteriler hesaplarını oluşturduğunda doğrudan toplanır. Web sitesinin, müşterilerinin mahremiyetini ihlal etmekten kaçınmak için veri kayıtlarını analiz etmeden önce kimlik gizleme teknikleriyle verileri önceden işlemesi gerekir.

Anonimleştirme

Anonimleştirme Herhangi bir koşulda çalışmayı düzenleyenler tarafından bile, gelecekte herhangi bir yeniden tanımlamayı önlemek için bir veri setini veriye katkıda bulunan kişinin kimliğinden geri döndürülemez bir şekilde ayırmayı ifade eder.[8][9] Kimlik gizliliği, yalnızca belirli durumlarda güvenilen bir taraf tarafından yeniden bağlanabilen kimlik bilgilerinin korunmasını da içerebilir.[8][9][10] Teknoloji topluluğunda, güvenilen bir tarafça bile yeniden bağlanabilen verilerin kimliğinin gizlenmesi olarak kabul edilip edilmeyeceği konusunda bir tartışma var.

Teknikler

Kimlik gizlemeye yönelik yaygın stratejiler maskelemedir kişisel tanımlayıcılar ve genelleme yarı tanımlayıcılar. Takma isimlendirme maskelemek için kullanılan ana tekniktir kişisel tanımlayıcılar veri kayıtlarından ve k-anonimleştirme genellikle yarı tanımlayıcılar.

Takma isimlendirme

Takma isimlendirme, gerçek adların geçici bir kimlikle değiştirilmesiyle gerçekleştirilir. Kişileri tanımlamamak için kişisel tanımlayıcıları siler veya maskeler. Bu yöntem, kayıt güncellenecek olsa bile bireyin kaydını zaman içinde takip etmeyi mümkün kılar. Ancak, veri kaydındaki bazı özel nitelik kombinasyonlarının dolaylı olarak bireyi tanımlaması, bireyin kimliğinin tespit edilmesini engelleyemez. [11]

k-anonimleştirme

k-anonimleştirme dolaylı olarak bireyin kimliğine işaret eden nitelikleri şöyle tanımlar: yarı tanımlayıcılar (QI'ler) ve en azından k bireyler aynı QI değerleri kombinasyonuna sahiptir.[11] QI değerleri belirli standartlara göre ele alınır. Örneğin, k-anonimleştirme, kayıtlardaki bazı orijinal verileri yeni aralık değerleriyle değiştirir ve bazı değerleri değiştirmeden korur. Yeni QI değerleri kombinasyonu, bireyin tanımlanmasını engeller ve ayrıca veri kayıtlarının imha edilmesini önler.

Başvurular

Kimlik gizleme araştırması, çoğunlukla koruma amaçlıdır sağlık Bilgisi.[12] Bazı kütüphaneler, sağlık Endüstrisi okuyucularının gizliliğini korumak için.[12]

İçinde Büyük veri kimliksizleştirme, bireyler ve kuruluşlar tarafından yaygın olarak benimsenir.[7] Sosyal medyanın, e-ticaretin ve büyük verinin gelişmesiyle birlikte kimlik gizleme bazen gerekli olur ve sıklıkla veri gizliliği kullanıcıların kişisel verileri, bunları kendi kişisel kullanımları için analiz edecek şirketler veya üçüncü taraf kuruluşlar tarafından toplandığında.

İçinde akıllı Şehirler sakinlerin, işçilerin ve ziyaretçilerin mahremiyetini korumak için kimlik gizliliği gerekebilir. Sıkı bir düzenleme olmadan kimlik gizleme zor olabilir çünkü sensörler izin alınmadan bilgi toplayabilir.[13]

Limitler

Bir kişi ne zaman katılırsa genetik Araştırmada, biyolojik bir örneğin bağışı genellikle büyük miktarda kişiselleştirilmiş verinin oluşturulmasıyla sonuçlanır. Bu tür verilerin kimliklerinin açığa çıkarılması benzersiz bir şekilde zordur.[14]

Genotipik bilginin biyospesimenlerde çok fazla olması nedeniyle genetik verilerin anonimleştirilmesi özellikle zordur.[14] örneklerin genellikle tıbbi geçmişe sahip olduğu bağlar,[15] ve modern biyoinformatik araçlarının ortaya çıkışı veri madenciliği.[15] Genotipik veri setlerinin toplu koleksiyonlarındaki bireylere ait verilerin, örnek bağışçılarının kimliklerine bağlanabileceğine dair kanıtlar olmuştur.[16]

Bazı araştırmacılar, genetik araştırmalarında katılımcılara anonimliklerini koruyabileceklerine söz vermenin makul olmadığını, bunun yerine bu tür katılımcılara kimlik gizleme sürecinde kodlanmış tanımlayıcıları kullanmanın sınırlarının öğretilmesi gerektiğini öne sürdüler.[9]

Amerika Birleşik Devletleri'nde kimlik gizleme yasaları

Mayıs 2014'te Amerika Birleşik Devletleri Başkanının Bilim ve Teknoloji Danışmanları Konseyi kimliksizliğin "ek bir koruma olarak biraz yararlı" olduğunu ancak "politika için yararlı bir temel" olmadığını, çünkü "yakın vadeli gelecekteki yeniden tanımlama yöntemlerine karşı sağlam olmadığını" buldu.[17]

HIPAA Gizlilik Kuralı, sağlık verilerinin hasta rızasına gerek kalmadan sorumlu bir şekilde kullanılması ve ifşa edilmesi için mekanizmalar sağlar. Bu mekanizmalar, iki HIPAA kimlik gizleme standardına odaklanır - Güvenli Liman ve Uzman Belirleme Yöntemi. Güvenli liman Uzman Belirleme Yöntemi, bilgileri bireysel olarak tanımlanamaz hale getirmek için genel kabul görmüş istatistiksel ve bilimsel ilkeler ve yöntemlerle ilgili bilgi ve deneyim gerektirirken, belirli hasta tanımlayıcılarının (örn. isim, telefon numarası, e-posta adresi vb.) kaldırılmasına dayanır.[18]

Güvenli liman

güvenli liman yöntem kimliksizleştirme için bir liste yaklaşımı kullanır ve iki gereksinimi vardır:

  1. Verilerden 18 öğenin kaldırılması veya genelleştirilmesi.
  2. İlgili Tüzel Kişi veya İş Ortağının, verilerdeki artık bilgilerin bir bireyi tanımlamak için tek başına veya diğer bilgilerle birlikte kullanılabileceğine dair fiili bilgiye sahip olmadığı. Güvenli Liman, kimlik gizleme için oldukça kuralcı bir yaklaşımdır. Bu yönteme göre, tüm tarihler yıla genelleştirilmeli ve posta kodları üç haneye indirilmelidir. Bağlamdan bağımsız olarak verilerde aynı yaklaşım kullanılır. Bilgi, akut solunum vakalarında mevsimsel değişimler için verileri analiz etmek isteyen güvenilir bir araştırmacı ile paylaşılacak ve bu nedenle hastaneye kabul ayını gerektirecek olsa bile, bu bilgi sağlanamaz; sadece kabul yılı korunacaktır.

Uzman Belirleme

Uzman Belirleme, mevcut standartları ve araştırmalardaki en iyi uygulamaları belirleyerek kimlik tespitine yönelik risk temelli bir yaklaşım alır. olasılık bir kişinin kendi korumalarından tanımlanabileceğini sağlık Bilgisi. Bu yöntem, uygun olan bir kişinin bilgi Genel kabul görmüş istatistiksel ve bilimsel ilke ve yöntemlere ilişkin deneyim ve deneyimler, bilgileri bireysel olarak tanımlanamaz hale getirir. Gerektirir:

  1. Bilginin, bilginin konusu olan bir kişiyi tanımlamak için beklenen bir alıcı tarafından tek başına veya diğer makul olarak mevcut bilgilerle birlikte kullanılma riskinin çok küçük olduğu;
  2. Böyle bir tespiti haklı gösteren analiz yöntemlerini ve sonuçlarını belgeler.

Merhumlarla ilgili araştırma

Araştırma ile ilgili temel yasa elektronik sağlık kaydı veriler HIPAA Gizlilik Kuralı. Bu yasa, vefat etmiş deneklerin elektronik sağlık kayıtlarının araştırma için kullanılmasına izin vermektedir (HIPAA Gizlilik Kuralı (bölüm 164.512 (i) (1) (iii))).[19]

Ayrıca bakınız

Referanslar

  1. ^ Haklar (OCR), Office for Civil (2012-09-07). "PHI'nın Kimlik Gizliliğini Kaldırma Yöntemleri". HHS.gov. Alındı 2020-11-08.
  2. ^ Sweeney, L. (2000). "Basit Demografi Genelde İnsanları Benzersiz Şekilde Tanımlar". Veri Gizliliği Çalışma Belgesi. 3.
  3. ^ de Montjoye, Y.-A. (2013). "Kalabalıkta benzersiz: İnsan hareketliliğinin gizlilik sınırları". Bilimsel Raporlar. 3: 1376. Bibcode:2013NatSR ... 3E1376D. doi:10.1038 / srep01376. PMC  3607247. PMID  23524645.
  4. ^ de Montjoye, Y.-A .; Radaelli, L .; Singh, V. K .; Pentland, A. S. (29 Ocak 2015). "Alışveriş merkezinde benzersiz: Kredi kartı meta verilerinin yeniden tanımlanabilirliği hakkında". Bilim. 347 (6221): 536–539. Bibcode:2015 Sci ... 347..536D. doi:10.1126 / science.1256297. PMID  25635097.
  5. ^ Narayanan, A. (2006). "Netflix ödül veri setinin anonimliği nasıl kırılır". arXiv:cs / 0610105.
  6. ^ El Emam, Halid (2011). "Sağlık Verilerine Yönelik Yeniden Tanımlama Saldırılarının Sistematik Bir İncelemesi". PLOS ONE. 10 (4): e28071. Bibcode:2011PLoSO ... 628071E. doi:10.1371 / journal.pone.0028071. PMC  3229505. PMID  22164229.
  7. ^ a b Ribaric, Slobodan; Ariyaeeinia, Aladdin; Pavesic, Nikola (Eylül 2016). "Multimedya içeriğinde gizlilik koruması için kimlik gizliliği: Bir anket". Sinyal İşleme: Görüntü İletişimi. 47: 131–151. doi:10.1016 / j.image.2016.05.020.
  8. ^ a b Godard, B. A .; Schmidtke, J. R .; Cassiman, J. J .; Aymé, S.G.N. (2003). "Biyomedikal araştırma için veri depolama ve DNA bankacılığı: Bilgilendirilmiş onay, gizlilik, kalite sorunları, mülkiyet, faydaların iadesi. Profesyonel bir bakış açısı". Avrupa İnsan Genetiği Dergisi. 11: S88–122. doi:10.1038 / sj.ejhg.5201114. PMID  14718939.
  9. ^ a b c Fullerton, S. M .; Anderson, N. R .; Guzauskas, G .; Freeman, D .; Fritöz-Edwards, K. (2010). "Yeni Nesil Biyorepositoryal Araştırmanın Yönetişim Zorluklarını Karşılamak". Bilim Çeviri Tıbbı. 2 (15): 15cm3. doi:10.1126 / scitranslmed.3000361. PMC  3038212. PMID  20371468.
  10. ^ McMurry, AJ; Gilbert, CA; Reis, BY; Chueh, HC; Kohane, IS; Mandl, KD (2007). "Halk sağlığı, araştırma ve klinik bakım için kendi kendine ölçeklenen, dağıtılmış bir bilgi mimarisi". J Am Med Inform Assoc. 14 (4): 527–33. doi:10.1197 / jamia.M2371. PMC  2244902. PMID  17460129.
  11. ^ a b Ito, Koichi; Kogure, Haz; Shimoyama, Takeshi; Tsuda, Hiroshi (2016). "Kişisel Bilgileri Korumak İçin Kimlik Gizleme ve Şifreleme Teknolojileri" (PDF). Fujitsu Bilimsel ve Teknik Dergisi. 52 (3): 28–36.
  12. ^ a b Nicholson, S .; Smith, C.A. (2006). "Kütüphane kullanıcılarının mahremiyetini korumak için sağlık hizmetlerinden alınan derslerin kullanılması: HIPAA'ya dayalı kütüphane verilerinin kimliklerinin kaldırılması için yönergeler" (PDF). Amerikan Bilgi Bilimi ve Teknolojisi Topluluğunun Bildirileri. 42: yok. doi:10.1002 / meet.1450420106.
  13. ^ Coop, Alex. Eski danışmanı "Sidewalk Labs'ın gizlilikle ilgili zorlu kararları üçüncü şahıslara devretme kararının yanlış olduğunu söylüyor". IT World Canada. Alındı 27 Haziran 2019.
  14. ^ a b McGuire, A. L .; Gibbs, R.A. (2006). "GENETİK: Artık Kimliği Belirsiz Değil". Bilim. 312 (5772): 370–371. doi:10.1126 / science.1125339. PMID  16627725.
  15. ^ a b Thorisson, G. A .; Muilu, J .; Brookes, A.J. (2009). "Genotip-fenotip veritabanları: Genomik sonrası çağ için zorluklar ve çözümler". Doğa İncelemeleri Genetik. 10 (1): 9–18. doi:10.1038 / nrg2483. hdl:2381/4584. PMID  19065136.
  16. ^ Homer, N .; Szelinger, S .; Redman, M .; Duggan, D .; Tembe, W .; Muehling, J .; Pearson, J. V .; Stephan, D. A .; Nelson, S. F .; Craig, D.W. (2008). Visscher, Peter M. (ed.). "Yüksek Yoğunluklu SNP Genotipleme Mikrodizileri Kullanarak Eser DNA Miktarlarını Yüksek Karmaşık Karışımlara Katkıda Bulunan Bireylerin Çözümlenmesi". PLoS Genetiği. 4 (8): e1000167. doi:10.1371 / journal.pgen.1000167. PMC  2516199. PMID  18769715.
  17. ^ PCAST. "Başkana Rapor - Büyük Veri ve Gizlilik: Teknolojik bir bakış açısı" (PDF). Alındı 28 Mart 2016.
  18. ^ "Kimlik Gizleme 201". Gizlilik Analizi. 2015.
  19. ^ 45 C.F.R. 164.512)

Dış bağlantılar