2.4.1 perkara Counting

Kiraan mudah boleh menjadi menarik jika anda menggabungkan satu soalan yang baik dengan data yang baik.

Walaupun ia diungkapkan di dalam bahasa yang berbunyi canggih, banyak penyelidikan sosial adalah benar-benar hanya mengira sesuatu. Dalam usia data yang besar, penyelidik boleh mengira lebih daripada biasa, tetapi itu tidak bermakna secara automatik penyelidikan yang perlu memberi tumpuan kepada mengira lebih banyak barangan. Sebaliknya, jika kita akan melakukan penyelidikan yang baik dengan data yang besar, kita perlu bertanya: apa yang perkara-perkara yang bernilai mengira? Ini mungkin kelihatan seperti perkara yang sama sekali subjektif, tetapi terdapat beberapa corak umum.

Selalunya pelajar mendorong penyelidikan kiraan mereka dengan mengatakan: saya akan mengira sesuatu yang tiada siapa pernah dikira sebelum ini. Sebagai contoh, seorang pelajar mungkin berkata, ramai orang telah dikaji pendatang dan ramai orang telah dikaji kembar, tetapi tiada siapa yang telah mengkaji kembar asing. Motivasi oleh ketiadaan biasanya tidak membawa kepada penyelidikan yang baik. Sudah tentu, mungkin ada sebab-sebab yang baik untuk mengkaji kembar asing, tetapi hakikat bahawa mereka telah tidak dikaji sebelum tidak bermakna bahawa mereka perlu belajar sekarang. Tiada siapa yang pernah dikira bilangan benang di atas permaidani di pejabat saya, tetapi itu tidak bermakna secara automatik bahawa ini akan menjadi satu projek penyelidikan yang baik. Motivasi oleh ketiadaan adalah jenis seperti mengatakan: melihat, ada lubang di sana, dan saya akan bekerja keras untuk mengisinya. Tetapi, tidak setiap lubang perlu diisi.

Daripada motivasi oleh ketiadaan, saya berfikir bahawa mengira membawa kepada penyelidikan yang baik dalam dua keadaan, apabila penyelidikan yang menarik atau penting (atau ideal kedua-duanya). Sebagai contoh, mengukur kadar pengangguran adalah penting kerana ia adalah dalam penunjuk ekonomi yang mendorong keputusan dasar. Secara umumnya, orang mempunyai rasa yang cukup baik daripada apa yang penting. Jadi, di seluruh bahagian ini, saya akan menyediakan tiga contoh di mana kiraan adalah menarik. Dalam setiap kes, penyelidik tidak mengira tidak berdisiplin, dan bukan mereka mengira dalam tetapan sangat tertentu yang mendedahkan wawasan yang penting untuk lebih banyak idea umum mengenai bagaimana kerja sosial sistem. Dalam erti kata lain, banyak daripada apa yang membuat senaman ini kiraan tertentu menarik bukan dalam data itu sendiri, ia datang dari idea-idea yang lebih umum.

Di bawah ini saya akan membentangkan tiga contoh pada: 1) tingkah laku kerja pemandu teksi di New York (Seksyen 2.4.1.1), 2) pembentukan persahabatan dengan pelajar (Seksyen 2.4.1.2) dan 3) media tingkah laku penapisan sosial kerajaan China (Seksyen 2.4.1.3). Apakah contoh-contoh ini berkongsi adalah bahawa mereka semua menunjukkan bahawa mengira data yang besar boleh digunakan untuk menguji ramalan teori. Dalam beberapa kes, sumber-sumber data yang besar membolehkan anda untuk melakukan kiraan ini agak langsung (seperti dalam kes di New York Teksi). Dalam kes lain, penyelidik perlu menangani dengan tidak lengkap dengan menggabungkan data bersama-sama dan peringkat operasinya membina teori (seperti dalam kes pembentukan persahabatan); dan dalam beberapa kes penyelidik akan perlu untuk mengumpul data pemerhatian mereka sendiri (seperti dalam kes penapisan media sosial). Seperti yang saya berharap contoh-contoh ini menunjukkan, bagi penyelidik yang mampu bertanya soalan yang menarik, data yang besar mempunyai potensi.