Arcuni di li nfurmazzioni ca cumpagnii e cuverni hannu hè fattivu.
L'assicuranza di l'imprese sanitarie sò infurmazioni detallati nantu à a cura medica ricevutu da i so clienti Sta infurmazione puderia esse utilizata per una ricerca impurtante nantu à a salute, ma se fussi pública, puderia avè l'attachement à l'affittu emozionale (per esempiu, vrollà) o dannu ecunomicu (per esempiu, pèrdita di l'impiegatu). Parechje altri altri fonti di dati altri anu ancu una informazione chì hè sensible , chì hè parti di a raghjoni chì sò spessu inaccessibili.
Sfurtunatamente, resulta esse delittu di decisione chì infurmazione hè attualmente sensitiva (Ohm 2015) , com era illustratu da u Premiu Netflix. Cumu scrivu in u 5, in u 2006, Netflix alliberò 100 million movie ratings provduti da quasi 500 000 membru è avianu una calla aperta da quale a ghjente di tutte u mondu sottumite algoritmi chì puderanu a capacità di Netflix per rimpriverà filmati. Prima di liberà a dati, Netflix hà eliminatu alcune d'infurmazione identica prugettu, cum'è nomi. Ma, solu duie simani dopu chì a data hè stata liberata Arvind Narayanan è Vitaly Shmatikov (2008) amenu chì era pussibule inscegliu nantu à qualificazioni di film di una persunale specifica cù un trucu chì v'inclassi in u capitulu 6. Incluso un attaccu puderia scopre un i prugrammi di a movie, ùn anu mancu ùn pare micca esse sensibilati quì. Mentri chì puderia esse veru in generale, per almenu qualchì di i 500 000 parsone in u settore di u settore, i scuperti movie era sensitivatu. Infatti, in risposta à a liberazione è a reidentificazione di e dati, una donna lesbica cunquette hà intruditu à un suit di class action contra Netflix. Eccu cumu si u prublema era esprittu in questa pratica (Singel 2009) :
"[M] ovie è qualifiche qualchissia contene una infurmazione di una ... natura altamente persunale è sensibule. A ricerca di u membru di a movie demoniu un interessu persunale personali di u Netflix è / o pruteghja cù parechje persunale assai, cumu a sessualità, a malatia mentale, a recuperazione di l'alcoholismu è a vittimazione da incest, abusive fisicu, viulenza domestica, adulteriu è rapa ".
Stu esempiu palesa chì ùn pò esse infurmazioni chì alcuni persone cunzidietenu sensibilizà in quellu chì pò esse una basa di basa. In più, mostra chì una difesa principali chì i circunscrire impiegan à prutezzione di l'identità sensitivi-a identità pò fallu di modu sorprenenti. Eccu dui idee sò sviluppati in più dittu in u capu 6.
A fini chì ferma à mente nantu à i dati sensittivi hè chì a cugliera senza consente di u persone sustene a quistione etica, ancu s'ellu ùn hè causatu micca dannu speċifiku. Cumu piace à vede una persona chì pigliate una scatula senza u so cunsensu pò esse cunsideratu una violazione di a privacy di l'una persona, recupendu l'infurmazione sensitiva, è ricurdate quantu poti è decisu chì hè sensitivu-senza cunfortu crea una prublema di privacy privacy. Turnaraghju a dumanni nantu à a prutezzione in u capitulu 6.
In cunclusioni, e grande fonti di dati, cum'è guvernu è amministrativi, sò micca generalmente micca creati per u scopu di a ricerca sociale. I grandi e dati di u ghjornu di l'oghje, è probabilmente dumani, tendenu di 10 caractères. Parechje di e pruprietà chì sò in generale per esse bè per a ricerca-big, sempre-on e non-reattivi-vennu da u fattu in l'imprese di l'impresione digitale è i guverni sò capaci di recopilarie dati à una scala chì ùn era micca pussibile previamente. E assai di e pruprietà chì in generale hè cunsideratu per esse ghjucatu per a ricerca-incomplete, inaccessibile, nonrepresentative, drifting, algorithmically confused, inaccessible, bruttu è sensitivu-venenu da u fattu chì sti datu ùn sò micca riuniscendu per investigatore per i investigatori. Finu à l'altru, aghju parlatu di l'infurmazioni statunitichi è di l'affari, ma sò parechje differenzi trà e dui. In a mo spirimintale, i dati di u guvernu tende à esse menu pocu rappresentante, menu cunfuzionatu algorithmically, è menu di drifting. Unu di l'altra banda, i registri amministrativi amministrativi tendenu à esse più sempri. A capiscitura di e 10 caractères generale hè un primu travagliu uttinutu per capiscensione di e grande fonti di dati. È avemu da volta à stratezii di ricerca chì pudemu utilizà cun questa dati.