2.3.2.7 Sensitive

Ang ilan sa mga impormasyon na mga kumpanya at mga pamahalaan ay may ay sensitibo.

kompanya ng health insurance ay may detalyadong impormasyon tungkol sa mga medikal na pangangalaga na natanggap sa pamamagitan ng kanilang mga customer. Ang impormasyon na ito ay maaaring gamitin para sa mahalagang pananaliksik tungkol sa kalusugan, ngunit kung ito ay naging pampublikong maaaring ito potensyal na humantong sa emosyonal na pinsala (eg, kahihiyan) at pang-ekonomiyang pinsala (eg, pagkawala ng trabaho). Malayong mula sa katangi-tangi, maraming mga malaki mga pinagkukunan ng data ay may impormasyon na sensitive. Ang sensitibong likas na katangian ng ang impormasyon na ito ay bahagi ng dahilan na malaki pinagkukunan ng data ay madalas na hindi mararating (inilarawan sa itaas).

Ang isang paraan na ang mga mananaliksik ay pagtatangka upang harapin ang sitwasyon na ito ay upang alisin sa makilala datasets na magkaroon ng sensitibong impormasyon. Subalit, tulad ng ako ay magpapakita sa mga detalye sa Kabanata 6 (Ethics) diskarte na ito sineseryoso limitado sa mga paraan na ay hindi malawak na pinapahalagahan sa pamamagitan ng parehong mga social siyentipiko at data siyentipiko.

Sa wakas, ang malaking data pinagkukunan ng araw na ito (at bukas) sa pangkalahatan ay may sampung mga katangian. Marami sa mga mahusay na mga katangian-big, laging-on, at reaktibong-come mula sa katotohanan sa mga digital na mga kompanya ng edad at mga pamahalaan ay magagawang upang mangolekta ng data sa isang scale na ay hindi posible dati. At, marami sa mga masamang katangian-hindi kumpleto, hindi maa-access, non-kinatawan, anod, algorithmically nangapahiya, hindi maa-access, marumi, at sensitibo-dumating mula sa ang katunayan na ang data ay hindi na nakolekta sa pamamagitan ng mga mananaliksik para sa mga mananaliksik. Pag-unawa sa mga katangian ay isang kinakailangang unang hakbang sa pag-aaral mula sa malaking data. At, ngayon i-namin sa pananaliksik estratehiya maaari naming gamitin sa data na ito.