Isi ihe omimi bu ebe nile, ma iji ha eme ihe maka nyocha nke ndi mmadu nwere ike ibido. Na ahụmahụ m, enwere ihe dị ka ọchịchị "enweghị nri ehihie" maka data: ọ bụrụ na ị tinyeghị ọtụtụ ọrụ na-anakọta ya, mgbe ahụ, ị ga-etinye aka n'ọtụtụ ọrụ na-eche banyere ya. nyochaa ya.
Isi mmalite data nke taa - ma eleghị anya echi-ga-enwekarị àgwà iri. Atọ n'ime ndị a bụ n'ozuzu (ma ọ bụghị mgbe nile) na-enye aka maka nchọpụta: nnukwu, mgbe niile, ma ọ bụ nke na-adịghị emetụta. Asaa na - enwekarị nsogbu (ma ọ bụghị mgbe niile) nsogbu maka nchọpụta: ezughị ezu, enweghị mgbagwoju anya, onye na - adịghị akọwa ihe, drifting, algorithmically confounded, dirty, na chebaara. Ọtụtụ n'ime àgwà ndị a na-ebili n'ihi na e meghị nnukwu ihe ọmụma data maka nyocha nke mmadụ.
Dabere na echiche dị na isi nke a, echere m na e nwere ụzọ atọ dị mkpa na nnukwu data ga-aba uru maka nchọpụta ọha na eze. Nke mbụ, ha nwere ike ime ka ndị nchọpụta nwee ike ikpebi n'etiti amụma amụma. Ihe atụ nke ụdị ọrụ a gụnyere Farber (2015) (ndị na-anya ụgbọ ala New York) na King, Pan, and Roberts (2013) (nyocha na China). Nke abụọ, nnukwu ihe ọmụma data nwere ike ime ka mmetụ dị mma maka iwu site na ịwa ugbu a. Otu ihe omuma nke oru a bu Ginsberg et al. (2009) (Google Flu Trends). N'ikpeazụ, nnukwu ihe ọmụma data nwere ike inyere ndị nchọpụta aka ịmepụta atụmatụ na-ezighị ezi n'enweghị ihe ndị na-agba ọsọ. Ihe nlereanya nke ụdị ọrụ a bụ Mas and Moretti (2009) (mmetụta ndị ọgbọ na arụpụta ọrụ) na Einav et al. (2015) (utịp nke ịmalite ụgwọ na ere ahịa na eBay). Otú ọ dị, nke ọ bụla n'ime ụzọ ndị a, na-achọ ka ndị na-eme nchọpụta mee ka ha nweta data dị ukwuu, dị ka nkọwa nke oke dị mkpa iji chọpụta ma ọ bụ echiche abụọ nke na-ebu amụma ịsọ asọ. Ya mere, echere m na ụzọ kachasị mma isi eche banyere ihe nnukwu data nwere ike ime bụ na ha nwere ike inyere ndị nchọpụta nwere ike ịjụ ajụjụ ndị dị mma ma dị mkpa.
Tupu ekwubie, echere m na ọ bara uru ịtụle na nnukwu data nwere ike inwe mmetụta dị mkpa na mmekọrịta dị n'etiti data na tiori. Ka ọ dị ugbu a, isi nke a ejiriwo nyocha nke nrụpụta echiche na-eme ka a mata. Ma nnukwu ihe ọmụma data na-enyekwara ndị nchọpụta aka ịkwalite mmetụta ike . Nke ahụ bụ, site na ịkpachapụ anya nchịkọta nke eziokwu, ụkpụrụ, na mgbagwoju anya, ndị nchọpụta nwere ike ịmepụta echiche ọhụrụ. Nhọrọ ọzọ, data-first approach to theory is not new, na Barney Glaser na Anselm Strauss (1967) na-akpọsi ha ike na ha na-akpọ maka ntọala ala . Otú ọ dị, usoro data a-nke mbụ, ọ pụtaghị "njedebe nke nkwupụta," dị ka a na-ekwu na ụfọdụ akwụkwọ akụkọ na-eme nchọpụta na afọ dijitalụ (Anderson 2008) . Kama nke ahụ, dịka mgbanwe ọnọdụ data na-agbanwe, anyị kwesịrị ịtụ anya nbaghachị na mmekọrịta dị n'etiti data na ozizi. Na ụwa ebe nchịkọta data dị oke ọnụ, ọ bụ ihe ezi uche dị na nchịkọta naanị data nke echiche ndị ahụ ga-aba uru. Ma, n'ime ụwa ebe ọtụtụ data dịrịrị maka n'efu, ọ bụ ihe ezi uche dị na ịnwa usoro data-mbụ (Goldberg 2015) .
Dịka m gosipụtara na isi nke a, ndị nyocha nwere ike ịmụta ọtụtụ ihe site na ile ndị mmadụ anya. N'isiakwụkwọ atọ sochirinụ, m ga-akọwa otú anyị nwere ike isi mụta ihe na ihe dịgasị iche ma ọ bụrụ na anyị adụkọta nchịkọta data anyị ma soro ndị mmadụ mee ihe site na ịjụ ha ajụjụ (isi nke 3), ihe ndị na-agba ọsọ (isi nke 4), ọbụnakwa na-emetụta ha na nyocha usoro ozugbo (isi 5).