|
Welcome,
Guest
|
|
İnsan zekâsının çalışması sonucu ortaya çıkan düşünce ürünü, malumat, vukuf. Bilgi kelimesinin sözlük tanımlarındandır [1]. Bilginin yaşadığımız çağa damgasını vuran bir varlık olduğu bir gerçektir. Bu açıdan bakıldığında, çağımızın altın değerindeki hammaddesi olan bilgiyi tanımlamak, kavramak ve bilgi ile ilgili hususları incelemek, insanlığın başlangıcından itibaren geçen süreçte ileriye yönelik gelişimimizi şekillendirmenin en önemli anahtarıdır. Günümüzde bilgi ön plana çıkmış gibi gözükse de, aslında bilgi; dünün ve bugünün anahtarları iken, geleceğin şekillenmesinde de her zaman anahtar rollere sahiptir [2].
Bilgi çağı olarak adlandırılan günümüzde teknolojide yaşanan oldukça hızlı gelişmeler, İnternetin yaygın kullanımı [3] ve kolay erişilebilir hale gelmesi bir endişeyi de beraberinde getirmiştir: Siber uzayda bu bilgiler ne kadar güvende? Bu durumu en iyi bir dönem ülkemizde Radikal gazetesinde de yayınlamış olan Cathy Classics [4] karikatürü anlatan aşağıdaki alıntı ifade etmektedir. Herkes anlaşılmak ister ama tanınmak/bilinmek istemez. Son dönemde yaşanan Wikileaks [6] gibi büyük çapta olayların yanı sıra Şekil-2 ve 3 te görüldüğü üzere özel/gizli olduğu varsayılan bilgiler kolayca ve gittikçe artan miktarlarda ortaya dökülebilmektedir. İnsanlar kişisel bilgilerinin, sağlık veya mali kayıtlarının ne kadar güvende olduğunu bilmer isterler. Her ne kadar Facebook [8] gibi sosyal medya araçlarında kolayca paylaşılıyor olsa da okudukları kitapların, gördükleri filmlerin veya siyasi görüşlerinin tamamen yabancılar tarafından bilinmesi ve hatta kullanılması istenen bir durum değildir. Gazetelerde okuduğumuz malum kimlik hırsızlığı vakaları ile ortaya çıkan yüksek miktarda kredi kullanılabiliyor olunması bu konuda haksız olmadıklarının göstermektedir. Konu ile ilgili kanun, yönetmelik ve yönergeler [9] : OECD Gizliliğin Korunması ve Kişisel Bilgilerin Sınırlar ötesi Transferine ilişkin Tavsiye Kararı, Avrupa Konseyi 108/81 Sayılı Kişisel Veriler Hakkında Antlaşma (gerçek kişiler), Avrupa Konseyi’nin sektörel tavsiye kararları: Tıbbi veri bankaları (1981), bilimsel araştırma ve istatistik (1983), doğrudan pazarlama (1985), sosyal güvenlik (1986), polis (suç) kayıtları (1987), istihdama ilişkin veriler (1989), elektronik ödeme ve ilgili işlemler (1990), verilerin kamu kuruluşlarınca üçüncü kişilere açıklanması (1991), kişisel verilerin telekomünikasyon alanında ve özellikle telefon servislerinde korunması (1995), tıbbi verilerin korunması (1997), istatistik amaçlı toplanan ve işlenen kişisel verilerin korunması (1997), internette özel hayatın gizliliğinin korunması (1999), sigorta sektöründe kişisel verilerin korunması (2002), İnsan Hakları Avrupa Sözleşmesi m. 8: Herkesin özel ve aile hayatına, meskenine ve haberleşmesine saygı gösterilmesini isteme hakkı, AB Temel Haklar Charter m. 7: Özel hayatın gizliliği, AB 95/46/EC Veri Koruma Yönergesi, Avrupa Siber Suçlar Konvansiyonu, AB 97/66/EC Telekomünikasyon Yönergesi, AB 2002/58/EC Elektronik iletişim Yönergesi, 5651 sayılı İnternet Ortamında Yapılan Yayınların Düzenlenmesi ve Bu Yayınlar Yoluyla İşlenen Suçlarla Mücadele Edilmesi Hakkında Kanun. Yukarıda listelenen kanunlar ve gizlilik politikası bildirimleri (örneğin Microsoft Çevrimiçi Gizlilik Bildirimi [10]) pek tatmin edici oldukları söylenemez. Günlük hayatımızda devasa miktarda değerlendirilebilir veri üretiriz. E-ticaret uygulamaları, kredi kartı ile yapılan alışverişler, Akbil, KGS, OGS vb. akıllı teknolojiler ile yapılan seyahatlar, üyelik kartları/sistemleri, Facebook, MSN, Tweeter vs. sosyal medya araçları ile paylaşılan bilgiler bunlara örnektir. Sweeney [11] tarafından yapılan bir deney sözde anonim ortak bir veritabanında sadece posta kodu ve doğum tarihi bilgilerini kullanarak bir kişiye ait bilgilerin %69 doğruluk oranında tespit edilebileceğini ve dahi cinsiyet bilindiğinde bu oranın %87'ye çıkarılabileceğini ispatlamıştır. ̈According to the Privacy Rights Center, up to 10 million Americans are victims of ID theft each year. They have a right to be notified when their most sensitive health data is stolen̈. (Luis Vicente Gutiérrez) [12] VERİ MADENCİLİĞİ Basit ve açık olmayan, önceden bilinmeyen ve yararlı olan desenlerin ya da bilginin çok büyük miktarlardaki veriden çıkarılması işlemidir [13]. Veriden bilgi keşfi (knowledge discovery in databases) olarak da adlandırılan ve aslında ̈bilgi madenciliği ̈ olan veri madenciliğinin son yıllarda bu kadar [14] ilgi görmesinin nedeni sayısal ortamlarda saklanan veri miktarının (the disk storge per person)[15] Moore yasası paralelinde hızla artması ve bu verinin bilginin veriye dönüştürülme ihtiyacının oluşmasıdır. Bankaların kredi sahteciliğini engellemek için kullandıkları müşteri analiz sistemleri [16] ve Google Adsense [17] gibi kullanıcı alışkanlıklarına göre sunulan reklamcılık hizmetleri ilk akla gelen örneklerdir. Veri madenciliği, çok büyük miktardaki veriden bilginin kazanılması için anlamlı bir teknoloji olarak ortaya çıkmıştır. Ancak, bu teknolojinin kişilerin mahremiyetini ihlal ettiğine dair endişeler vardır ve bu endişeler toplumsal bir tepkiye neden olmaktadır. Örneğin, Amerika savunma departmanı tarafından Amerika Senatosuna sunulan bir bildiriden sonra araştırma ve geliştirmeleri de kapsayan tüm veri madenciliği programları yasaklandı. [18] Ülkemizde yeni uygulamaya alınan MEDULA sağlık sistemi [19] nedeniyle tüm sağlık kuruluşları ve eczanelere bazı kişisel verilere İnternet üzerinden erişim yetkisi verilmiştir. Gazete manşetlerinde kimlik bilgilerinin bir şebeke tarafından toplu halde hukuk bürolarına pazarlandığı haberinin üzerinden de fazla bir zaman geçmedi [20]. GİZLİLİĞİ KORUYAN VERİ MADENCİLİĞİ Hayatımızı kolaylaştırması için tasarlandığı halde kısa zamanda büyük sorunlara yol açabilecek uygulamaların önüne geçilebilmesi için gizliliği koruyan veri madenciliği (privacy- preserving data mining)[21] alanındaki yöntemler : Gizliliği koruyan veri yayınlama (privacy-preserving data publishing) : Bu teknikler gizlilik ile ilgili farklı dönüşüm yöntemleri üzerinde çalışmalardan oluşurlar ve randomizasyon(randomization), k-anonimlik (k-anonimity) ve l-çeşitlilik (l-diversity) gibi metotları içerirler. Ayrıca bozulmuş verinin ilişkili kural madenciliği gibi (association rule mining) klasik veri madenciliği teknikleri ile kullanımı da bu alana girmektedir [22]. Veri madenciliği uygulamaları sonuçlarının gizliliği korumak için değiştirilmesi : Bir çok durumda ilişkili (association rule) veya sınıflandırmalı (classification) veri madenciliği uygulamaları verinin gizliliğini ihlal edebilmektedir. Bunun önlenebilmesi için ilişkili kurallardan bazılarının uygulanmamasının sağlanması ya da yeniden düzenlenmesi gerekebilir [23]. Sorgu denetimi(query auditing): Veri tabanlarında, gizli kalması gereken bilgilerin açığa çıkmasının engellenmesi için geçmiş işlemlerin ve yürürlükteki kuralların yardımı ile çağrılan sorguların tespit edilmesi ve önüne geçilmesidir [24]. İki şekilde uygulanabilmektedir. Sonuç verisine gürültü eklenerek koruma, Belirlenmiş alt sorguların reddedilerek işlem dışı bırakılması. Dağıtılmış gizlilik için şifreleme yöntemleri: Bazı durumlarda, veri farklı alan ve platformlarda dağıtılmış olabilir ve bu veriler kullanılarak ortak fonksiyonların yerine getirilmesi istenebilir. Bu halde, çeşitli kriptolama algortimaları kullanılarak hassas veriler açığa çıkmadan güvenli bir şekilde sonuç alınması sağlanmalıdır [25]. |
|
|
Please Log in or Create an account to join the conversation. |
