Որոշ տեղեկությունների, որ ընկերությունները ու կառավարությունների զգայուն:
Առողջության ապահովագրման ընկերությունները մանրամասն տեղեկություններ բուժօգնության ստացված են իրենց հաճախորդներին: Այս տեղեկատվությունը կարող է օգտագործվել կարեւոր հետազոտությունների մասին առողջության, բայց եթե այն դարձավ հրապարակային, որ այն կարող է հանգեցնել հուզական վնասի (օրինակ, շփոթություն) եւ տնտեսական վնասի (օրինակ, աշխատանքի կորուստ): Հեռու տարբերակիչ, շատ մեծ տվյալների աղբյուրների տեղեկություններ ունենք, որը զգայուն: Զգայուն բնույթը այդ տեղեկատվության մի մասն է այն պատճառով, որ մեծ տվյալների աղբյուրները հաճախ անհասանելի է (նկարագրված է վերը):
Մեկ ճանապարհ է, որ հետազոտողները փորձել են զբաղվել այս իրավիճակում պետք է դե-բացահայտել հավաքածուների, որոնք ունեն զգայուն տեղեկատվություն. Բայց, քանի որ ես ցույց կտա մանրամասնորեն 6-րդ գլխում (էթիկայի) Այս մոտեցումը լրջորեն սահմանափակվում է այնպես, որ չեն լայնորեն գնահատել երկու սոցիալական գիտնականների եւ տվյալների գիտնականների:
Եզրափակելով, մեծ տվյալների աղբյուրները այսօր (եւ վաղը), ընդհանուր առմամբ, պետք է տասը հատկանիշներ: Շատերը լավ հատկությունների մեծ, մշտապես, եւ nonreactive գալիս այն փաստը, թվային դարաշրջանում ընկերությունների եւ կառավարությունները ի վիճակի են հավաքել տվյալներ սանդղակով, որը հնարավոր չէ նախկինում: Եվ, շատերը վատ հատկությունների, անավարտ, անհասանելի, ոչ ներկայացուցիչ, կուտակումներ, ալգորիթմիկ շփոթեցաւ, անհասանելի է, կեղտոտ, եւ զգայուն-գալիս այն փաստը, որ այդ տվյալները չի հավաքագրվել է հետազոտողների համար հետազոտողների. Հասկանալով այդ հատկանիշները, որոնք անհրաժեշտ առաջին քայլն է սովորելով մեծ տվյալների. Եվ, հիմա մենք դիմում ենք ուսումնասիրել ռազմավարություններ, մենք կարող ենք օգտագործել այս տվյալները: