2.3.2.7 sensitip

Sababaraha informasi nu pausahaan jeung pamaréntah boga sensitip.

pausahaan asuransi kasehatan geus wincikan informasi ngeunaan miara médis ditarima ku konsumén maranéhanana. Inpo ieu bisa dipaké pikeun panalungtikan penting ngeunaan kaséhatan, tapi lamun jadi public eta berpotensi bisa ngakibatkeun ngarugikeun emosi (misalna isin) jeung ngarugikeun ékonomi (misalna leungitna pagawean). Jauh ti has, loba sumber data gedé boga informasi nu sensitip. Alam sensitip informasi ieu mangrupa bagian ti alesan anu sumber data gedé mindeng inaccessible (ditétélakeun di luhur).

Hiji cara nu panalungtik nyobian nungkulan kaayaan ieu téh de-ngaidentipikasi datasets nu geus informasi nu sensitip. Tapi, salaku mah bakal mintonkeun di jéntré dina Bab 6 (Etika) pendekatan ieu serius diwatesan ku cara anu henteu loba ngaapresiasi ku boh élmuwan sosial jeung élmuwan data.

Dina kacindekan, sumber data gedé tina ayeuna (jeung isukan) umumna geus sapuluh ciri. Loba sipat-gedé alus, sok-on, sarta nonreactive-asalna ti kanyataan di pausahaan umur digital jeung pamaréntah bisa ngumpulkeun data dina skala nu teu mungkin saméméhna. Jeung, loba bad sipat-lengkep, inaccessible, non-wakil, drifting, algorithmically ngabingungkeun, inaccessible, kotor, jeung sensitip-asalna ti kanyataan yén data teu dikumpulkeun ku panalungtik pikeun panalungtik. Ngarti ciri ieu heula lengkah perlu diajar ti data gedé. Jeung, ayeuna urang balikkeun panalungtikan strategi urang bisa make jeung data ieu.