Perkara teu sabaraha badag data badag anjeun, eta meureun teu boga informasi rék.
Paling sumber data badag nu lengkep, dina rasa nu teu boga informasi nu bakal hoyong pikeun panalungtikan Anjeun. Ieu fitur umum data nya éta dijieun pikeun tujuan séjén ti panalungtikan. Loba élmuwan sosial geus kagungan pangalaman kaayaan incompleteness, kayaning hiji survéy aya nu teu nanya ka sual anu diperlukeun. Hanjakal, masalah incompleteness condong jadi leuwih ekstrim di data badag. Dina pangalaman kuring, data badag condong jadi leungit tilu rupa informasi mangpaat pikeun panalungtikan sosial: informasi demografi ngeunaan pamilon, kabiasaan dina platform séjénna, sarta data ka operationalize constructs teoritis.
Tina tilu rupa incompleteness, masalah data lengkep mun operationalize constructs teoritis teh hardest pikeun ngajawab. Sarta dina pangalaman abdi, mangka mindeng ngahaja overlooked. Kasarna, constructs teoritis nu pamendak abstrak nu diajar élmuwan sosial sarta operationalizing a nyusunna teoritis hartina proposing sababaraha cara pikeun moto nu nyusunna sareng data observasi. Hanjakal, prosés-sounding basajan ieu mindeng tétéla janten rada hésé. Contona, hayu urang ngabayangkeun nyoba émpiris nguji ngaku tétéla basajan nu urang anu leuwih calakan earn beuki duit. Dina raraga nguji ngaku ieu, anjeun bakal kudu ngukur "kecerdasan". Tapi naon anu kecerdasan? Gardner (2011) pamadegan yén aya sabenerna dalapan bentuk beda kecerdasan. Tur aya prosedur nu akurat bisa ngukur sagala bentuk ieu ngeunaan kecerdasan? Sanajan jumlahna loba pisan gawé ku psikolog, patarosan ieu masih teu boga jawaban unambiguous.
Ku kituna, sanajan nu kawilang basajan ngaku-jalma anu leuwih calakan earn leuwih duit-tiasa teuas ka assess émpiris sabab tiasa hésé operationalize constructs teoritis di data. Conto sejenna tina constructs teoritis nu penting tapi hésé operationalize kaasup "norma" "ibukota sosial," sarta "démokrasi". Élmuwan Sosial nelepon pertandingan antara constructs teoritis sarta validitas data nyusunna (Cronbach and Meehl 1955) . Salaku daptar pondok ieu constructs nunjukkeun, nyusunna validitas masalah para ilmuwan sosial geus Cut Nyak Dien kalawan keur waktu anu pohara lila. Tapi pangalaman abdi, masalah validitas nyusunna téh malah leuwih gede lamun gawé bareng data nu teu dijieun pikeun kaperluan panalungtikan (Lazer 2015) .
Sawaktos Anjeun keur assessing hasil panalungtikan, salah cara gancang jeung mangpaat ka assess validitas nyusunna téh nyandak hasil, nu biasana ditembongkeun dina watesan constructs, sarta deui nganyatakeun-eta tina segi data dipaké. Contona, anggap dua studi hypothetical nu ngaku pikeun mintonkeun yen jalma anu leuwih calakan earn beuki duit. Dina pangajaran kahiji, panalungtik manggihan yén jalma anu skor ogé dina Gagak kutang Matrices Test-test well-diulik tina kecerdasan analytic (Carpenter, Just, and Shell 1990) -have incomes dilaporkeun luhur dina mulih pajeg maranéhanana. Dina pangajaran kadua, panalungtik manggihan yén jalma dina Twitter anu dipaké kecap panjang leuwih gampang nyabit merek méwah. Dina duanana kasus, peneliti ieu bisa ngaku yen aranjeunna geus nembongkeun yen urang anu leuwih calakan earn beuki duit. Sanajan kitu, dina pangajaran kahiji constructs teoritis anu ogé operationalized ku data, sedengkeun di kadua aranjeunna henteu. Salajengna, sakumaha conto ieu illustrates, beuki data henteu otomatis ngajawab masalah sareng validitas nyusunna. Anjeun kedah ragu hasil ulikan kadua naha éta aub sajuta tweets, hiji miliar tweets, atawa triliun tweets. Pikeun peneliti teu wawuh jeung pamanggih validitas nyusunna, tabel 2.2 nyadiakeun sababaraha conto studi anu operationalized constructs teoritis maké renik data digital.
sumber data | nyusunna Téori | rujukan |
---|---|---|
Email log ti sahiji universitas (meta-data wungkul) | hubungan sosial | Kossinets and Watts (2006) , Kossinets and Watts (2009) , De Choudhury et al. (2010) |
tulisan média sosial di Weibo | Dursasana Civic | Zhang (2016) |
Email log ti sungut hiji (meta-data na téks lengkep) | Budaya pas dina hiji organisasi | Srivastava et al. (2017) |
Sanajan éta masalah data lengkep pikeun motret constructs teoritis anu geulis teuas pikeun ngajawab, aya solusi umum kana jenis umum sejenna incompleteness: informasi demografi lengkep jeung informasi lengkep dina kabiasaan dina platform lianna. Solusi kahiji nya éta sabenerna mah ngumpulkeun data nu peryogi; Kuring gé ngabejaan Anjeun tentang yén dina bab 3 lamun kuring ngabejaan Anjeun tentang survey. Solusi utama kadua pikeun ngalakukeun naon élmuwan data nelepon pamaké-atribut inferensi sarta élmuwan sosial nelepon imputation. Dina pendekatan ieu, peneliti nganggo inpormasi yen aranjeunna gaduh on sababaraha urang mun infer atribut ti jalma séjén. A mungkin solusi katilu nyaeta ngagabungkeun sababaraha sumber data. Proses ieu kadangkala disebut catetan beungkeut. Métafora favorit kuring keur prosés ieu ditulis ku Dunn (1946) dina paragraf pisan mimiti kertas pisan munggaran kantos ditulis dina catetan beungkeut:
"Saban jalma di dunya nyiptakeun Kitab Kahirupan. Kitab ieu dimimitian ku kalahiran sarta ditungtungan make maot. Kaca na anu diwangun ku rékaman tina acara poko dina kahirupan. Catetan beungkeut nyaéta ngaran anu dibikeun kana prosés assembling kaca tina buku kana volume hiji. "
Nalika Dunn wrote petikan yén anjeunna imagining yén Kitab Kahirupan bisa ngawengku acara hirup utama kawas lahir, nikah, cerai, sarta maot. Najan kitu, ayeuna nu jadi loba informasi ngeunaan jalma anu dirékam, Kitab Kahirupan bisa jadi hiji potret incredibly lengkep, upami jalma Kaca béda (ie, ngambah digital kami) bisa kabeungkeut babarengan. Kitab ieu Kahirupan bisa janten sumberdaya gede pikeun peneliti. Tapi, éta bisa ogé disebut database of uing (Ohm 2010) , anu bisa dipaké pikeun sakabéh rupa maksud unethical, sakumaha Abdi gé ngajelaskeun dina bab 6 (Etika).