Şirkətlər və hökumətlər var ki, bəzi məlumatlar həssasdır.
Səhiyyə sığorta şirkətləri öz müştəriləri tərəfindən qəbul tibbi qayğı haqqında ətraflı məlumat var. Bu məlumat sağlamlığı haqqında mühüm tədqiqat üçün istifadə edilə bilər, lakin bu, ictimai oldu, əgər potensial emosional zərər (məsələn, xəcalət) və iqtisadi zərər (məşğulluq məsələn, zərər) gətirib çıxara bilər. Far fərqli, çox böyük data mənbələrdən həssas məlumatlar var. Bu məlumatların həssas xarakteri böyük məlumat mənbələri (yuxarıda təsvir) tez-tez əlçatmaz olduğunu səbəbi hissəsidir.
tədqiqatçılar bu vəziyyət ilə məşğul cəhd bir yolu həssas məlumatlar var de-müəyyən Kümeleri etməkdir. Amma Fəsil 6 (etik) ciddi geniş sosial elm və məlumat alimləri tərəfindən yüksək qiymətləndirilmişdir deyil yollarla məhdud bu yanaşma ətraflı göstərəcək kimi.
Sonda, bu gün (və sabah) böyük məlumat mənbələri ümumiyyətlə on xüsusiyyətləri var. yaxşı xassələri-böyük, həmişə-on, və bir çox digital yaş şirkətləri faktı nonreactive-gəlir və hökumətlər əvvəllər mümkün olmayan bir miqyasda məlumat toplamaq edə bilərlər. Və pis xassələri-natamam, əlçatmaz, qeyri-nümayəndəsinin çox Algorithmically, əlçatmaz çirkli və həssas-gəlmək data tədqiqatçılar üçün tədqiqatçılar tərəfindən toplanan deyil ki, bu şaşırmış üzən. Anlaşma bu xüsusiyyətləri böyük data öyrənmək üçün zəruri ilk addımdır. Və indi biz bu məlumatları istifadə edə bilərsiniz strategiyaları tədqiqat açın.