2.3.2.1 pepak

Ora ketompo carane "data amba" "amba" Panjenengan mbokmenawa ora duwe informasi sing dipengini.

Paling sumber data amba sing pepak, ing pangertèn sing padha ora duwe informasi sing sampeyan pengin kanggo riset. Iki fitur umum data sing digawe kanggo tujuan liyane saka riset. Akeh ilmuwan sosial wis kagungan pengalaman saka dealing karo incompleteness, kayata survey ana sing durung takon sing arep. Sayange, ing masalah incompleteness kathah bakal luwih nemen ing data amba. Ing pengalaman, data amba cenderung bakal ilang telu jinis informasi migunani kanggo riset sosial: Demografi, prilaku ing platform liyane, lan data kanggo operationalize konstruksi teoritis.

Kabeh telu formulir iki incompleteness sing digambaraké ing sinau dening Gueorgi Kossinets lan Duncan Watts (2006) évolusi saka jaringan sosial ing univèrsitas. Kossinets lan Watts miwiti karo log email saka universitas, kang wis Alexa pas bab sing dikirim email kanggo kang ing wektu apa (peneliti durung duwe akses kanggo isi email). cathetan email iki muni kaya perlengkapan data sange, nanging, lagi-senadyan sing ukuran lan granularity-dhasar pepak. Contone, log email ora kalebu data bab karakteristik demografi saka mahasiswa, kayata gender lan umur. Salajengipun, ing log email ora kalebu informasi bab komunikasi liwat media liyane, kayata telpon, pesen teks, utawa obrolan pasuryan-kanggo-pasuryan. Akhire, log email ora langsung kalebu informasi bab sesambetan, ing konstruksi teoritis ing akeh teori sing wis ana. Mengko ing bab, nalika aku pirembagan bab strategi riset, sampeyan bakal weruh carane Kossinets lan Watts ditanggulangi masalah iki.

Saka telung jinis incompleteness, masalah data pepak kanggo operationalize konstruksi teoritis punika angel kanggo ngatasi, lan ing pengalaman, asring kaleresan diduga dening ilmuwan data. Kira-kira, konstruksi teoritis ana gagasan abstrak sing sinau ilmuwan sosial, nanging, sayangé, konstruksi iki bisa ora tansah bisa ambigu ditetepake lan diukur. Contone, ayo kang mbayangno nyoba kanggo empirically nyoba pratelan ketoke prasaja sing wong sing luwih pinter entuk dhuwit liyane. Supaya nyoba pratelan iki sampeyan bakal kudu ngukur "Intelligence." Nanging, apa Intelligence? Contone, Gardner (2011) ndhukung sing ana bener wolung macem Wangun Intelligence. Lan, ana tata cara sing kanthi bisa ngukur samubarang formulir iki Intelligence? Senadyan jumlah gedhe tenan saka karya dening psikolog, pitakonan iki isih ora duwe jawaban unambiguous. Mangkono, malah relatif prasaja pratelan-wong sing luwih pinter entuk dhuwit liyane-bisa hard kanggo netepke empirically amarga bisa hard kanggo operationalize konstruksi teoritis ing data. Conto liyane saka konstruksi teoritis sing penting nanging hard kanggo operationalize kalebu "aturan," "ibukutha sosial," lan "demokrasi." Ilmuwan sosial nelpon pertandingan konstruksi teoritis lan sah data nbangun (Cronbach and Meehl 1955) . Lan, minangka iki dhaptar konstruksi tabet, mbangun sah masalah sing ilmuwan sosial wis berjuang karo kanggo wektu sing dawa banget, malah nalika padha nggarap data sing dikumpulaké kanggo tujuan panaliten. Nalika nggarap data kanggo tujuan liyane saka riset, masalah sah nbangun sing malah luwih tantangan (Lazer 2015) .

Nalika maca research paper, salah siji cara cepet lan migunani kanggo netepke uneg-uneg babagan sah nbangun iku kanggo njupuk pratelan utama ing kertas, kang biasane ditulis ing syarat-syarat konstruksi, lan maneh nyebut ing syarat-syarat data sing digunakake. Contone, nimbang loro pasinaon hipotesis sing ngaku nuduhake yen wong luwih cerdas entuk dhuwit liyane:

  • Study 1: wong sing Skor uga ing Raven Progressive matriks Test-a test uga sinau saka Intelligence analisa (Carpenter, Just, and Shell 1990) -have asil kacarita luwih ing ngasilake tax sing
  • Study 2: wong ing Twitter sing digunakake tembung maneh sing liyane kamungkinan kanggo sebutno merek kemewahan

Ing kasus loro, peneliti bisa njaluk sing padha wis ditampilake sing wong luwih cerdas entuk dhuwit liyane. Nanging, ing sinau pisanan ing konstruksi teoritis sing uga operationalized dening data, lan ing liya padha ora ana. Luwih, minangka conto iki nggambaraké, luwih data ora otomatis ngatasi masalah karo kesahihan nbangun. Sampeyan kudu mangu asil saka Study 2 apa melu yuta tweets, milyar tweets, utawa triliun tweets. Kanggo panliti ora menowo karo idea saka sah nbangun, Tabel 2.2 menehi sawetara conto studi sing operationalized konstruksi teoritis nggunakake tilak data digital.

Tabel 2.2: Conto ngambah digital sing digunakake minangka ngukur saka konsep teori liyane abstrak. Ilmuwan sosial nyebat sah match nbangun lan iku dadi tantangan gedhé karo nggunakake sumber data amba kanggo riset sosial (Lazer 2015) .
tilak digital nbangun teori citation
email log saka universitas (meta-data mung) sesambetan Social Kossinets and Watts (2006) , Kossinets and Watts (2009) , De Choudhury et al. (2010)
kiriman media sosial ing Weibo engagement Civic Zhang (2016)
log email saka tenan (meta-data lan teks lengkap) Budaya Pas ing organisasi Goldberg et al. (2015)

Senajan masalah data pepak kanggo konstruksi teoritis operationalizing cantik hard kanggo ngatasi, ana telung solusi umum kanggo masalah informasi demografi pepak lan informasi pepak ing prilaku ing platform liyane. Kapisan iku bener ngumpulake data sing perlu; Aku pitutur marang kowe bab conto sing ing Bab 3 nalika aku pitutur marang kowe bab survey. Sayange, iki jenis data ora tansah bisa. Solusi utama kapindho iku kanggo apa ilmuwan data nelpon user-ngubungake kesimpulan lan apa ilmuwan sosial nelpon imputation. Ing pendekatan, peneliti nggunakake informasi sing padha duwe ing sawetara wong kanggo infer kawicaksanan saka wong liya. katelu bisa solusi-siji digunakake dening Kossinets lan Watts-ana kanggo nggabungaken sumber data. Proses iki kadhangkala disebut gabung utawa ngrekam ubungan. Kiasan favorit kanggo proses iki diusulaké ing paragraf banget pisanan kertas banget pisanan tau ditulis ing cathetan ubungan (Dunn 1946) :

"Saben wong ing donya sing nggawe kitab urip. Book iki diwiwiti karo lair lan ends karo matine. Kaca-kaca sing arupi cathetan ing acara ing salebeting gesang. Rekam ubungan iku jeneng sing diwènèhaké kanggo proses ngrakit kaca buku iki menyang volume a. "

wacana iki ditulis ing taun 1946, lan ing wektu sing, wong padha mikir sing Kitab urip bisa kalebu acara urip utama kaya lair, marriage, divorce, lan pati. Nanging, saiki sing dadi luwih informasi bab wong wis direkam, Kitab urip bisa dadi mujur luar biasa rinci, yen iku kaca beda (IE, ngambah digital kita), bisa kaiket bebarengan. Book iki urip bisa dadi sumber apik kanggo peneliti. Nanging, Kitab urip bisa uga disebut database saka kiamat (Ohm 2010) , kang bisa digunakake kanggo kabeh jinis tujuan UNETHICAL, minangka diterangake luwih ngisor nalika aku pirembagan bab alam sensitif informasi sing diklumpukake dening sumber data amba ngisor lan ing Bab 6 (Etika).