Baadhi ya taarifa kwamba makampuni na serikali na ni nyeti.
makampuni ya bima ya afya tumezichambua taarifa kuhusu huduma ya matibabu na kupokelewa na wateja wao. Habari hii inaweza kutumika kwa ajili ya utafiti muhimu kuhusu afya, lakini kama ni hadharani inaweza uwezekano wa kusababisha madhara kihisia (kwa mfano, aibu) na madhara ya kiuchumi (kwa mfano, kupoteza kazi). Mbali na tofauti, wengi vyanzo big data na habari kwamba ni nyeti. Hali nyeti ya habari hii ni sehemu ya sababu kwamba vyanzo big data ni mara nyingi inaccessible (ilivyoelezwa hapo juu).
Njia moja ambayo watafiti kujaribu kukabiliana na hali hii ni kwa de-kubaini seti kwamba kuwa na habari nyeti. Lakini, kama mimi itaonyesha kwa undani katika Sura ya 6 (maadili) mbinu hii kwa umakini mdogo kwa njia ambazo si sana kukubaliwa na wanasayansi ya kijamii na wanasayansi data.
Kwa kumalizia, data big vyanzo vya leo (na kesho) kwa ujumla kuwa na sifa kumi. Wengi wa mali-big nzuri, daima-juu, na nonreactive-kuja kutokana na ukweli katika makampuni digital umri na serikali ni uwezo wa kukusanya takwimu katika kiasi ambacho hakikuwa kinawezekana awali. Na, wengi wa mbaya mali-pungufu, inaccessible, mashirika yasiyo ya mwakilishi, drifting, algorithmically kuhangaika, inaccessible, chafu, na nyeti-kuja kutokana na ukweli kwamba data si zilizokusanywa na watafiti kwa watafiti. Uelewa wa sifa hizi ni muhimu hatua ya kwanza ya kujifunza kutoka data kubwa. Na, sasa sisi kurejea kwa utafiti mikakati tunaweza kutumia kwa data hii.