2.4.1 điều Đếm

Đếm đơn giản có thể là thú vị nếu bạn kết hợp một câu hỏi tốt với dữ liệu tốt.

Mặc dù nó được diễn đạt bằng ngôn ngữ âm tinh tế, rất nhiều nghiên cứu xã hội thực sự chỉ đếm mọi thứ. Trong thời đại của dữ liệu lớn, các nhà nghiên cứu có thể đếm nhiều hơn bao giờ hết, nhưng điều đó không có nghĩa là nghiên cứu mà nên tập trung vào tính cụ hơn và nhiều hơn nữa. Thay vào đó, nếu chúng ta để làm nghiên cứu tốt với dữ liệu lớn, chúng ta cần phải đặt câu hỏi: điều gì là đáng kể? Điều này có vẻ như một vấn đề hoàn toàn chủ quan, nhưng có một số mô hình chung.

Thường thì sinh viên thúc đẩy nghiên cứu đếm của họ bằng cách nói rằng: Tôi sẽ đếm cái gì đó mà không ai có thể tính trước. Ví dụ, một học sinh có thể nói, nhiều người đã nghiên cứu di cư và nhiều người đã nghiên cứu cặp song sinh, nhưng không ai đã nghiên cứu cặp song sinh di cư. Động lực của sự vắng mặt thường không dẫn đến nghiên cứu tốt. Tất nhiên, có thể có lý do tốt để nghiên cứu cặp song sinh nhập cư, nhưng thực tế là họ đã không được nghiên cứu trước đó không có nghĩa rằng họ cần được nghiên cứu bây giờ. Không ai có thể đếm số lượng các đề trên thảm trong văn phòng của tôi, nhưng điều đó không tự động ngụ ý rằng đây sẽ là một dự án nghiên cứu tốt. Động lực của sự vắng mặt là loại giống như nói: nhìn, có một lỗ ở đó, và tôi sẽ làm việc rất chăm chỉ để điền vào nó. Nhưng, không phải mọi lỗ cần được lấp đầy.

Thay vì động cơ thúc đẩy bởi sự vắng mặt, tôi nghĩ rằng, kể dẫn đến nghiên cứu tốt trong hai tình huống, khi nghiên cứu là thú vị hoặc quan (hoặc lý tưởng cả hai). Ví dụ, đo tỷ lệ thất nghiệp là rất quan trọng vì nó là chỉ số của nền kinh tế mà các ổ đĩa các quyết định chính sách. Nói chung, người ta có một cảm giác khá tốt về những gì là quan trọng. Vì vậy, trong phần còn lại của phần này, tôi sẽ cung cấp ba ví dụ mà đếm là thú vị. Trong mỗi trường hợp, các nhà nghiên cứu đã không tính tuỳ tiện, chứ không phải họ đã đếm trong cài đặt rất cụ thể mà tiết lộ những hiểu biết quan trọng vào những ý tưởng chung về cách xã hội làm việc hệ thống. Nói cách khác, rất nhiều những gì làm cho các bài tập đếm đặc biệt thú vị không có trong dữ liệu chính nó, nó xuất phát từ những ý tưởng tổng quát hơn.

Dưới đây chúng tôi sẽ trình bày ba ví dụ trên: 1) các hành vi làm việc của lái xe taxi ở New York (Phần 2.4.1.1), 2) hình thành tình bạn của sinh viên (Mục 2.4.1.2) và 3) phương tiện truyền thông xã hội hành vi kiểm duyệt của chính phủ Trung Quốc (mục 2.4.1.3). Điều mà những ví dụ chia sẻ là tất cả họ đều cho thấy, kể dữ liệu lớn có thể được sử dụng để kiểm tra dự đoán lý thuyết. Trong một số trường hợp, các nguồn dữ liệu lớn cho phép bạn làm điều này tương đối đếm trực tiếp (như trong trường hợp của New York Taxi). Trong trường hợp khác, các nhà nghiên cứu sẽ cần phải đối phó với bất toàn bằng cách kết hợp dữ liệu với nhau và việc vận hành cấu trúc lý thuyết (như trong trường hợp của sự hình thành tình bạn); và trong một số trường hợp các nhà nghiên cứu sẽ cần phải thu thập dữ liệu quan sát của riêng mình (như trong trường hợp của kiểm duyệt truyền thông xã hội). Như tôi hy vọng những ví dụ trên, các nhà nghiên cứu người có thể đặt câu hỏi thú vị, dữ liệu lớn hứa hẹn tuyệt vời.