Phù hợp tạo ra sự so sánh công bằng bằng cách cắt tỉa bỏ các trường hợp.
so sánh công bằng có thể đến từ một trong hai thí nghiệm ngẫu nhiên hoặc thí nghiệm tự nhiên. Tuy nhiên, có rất nhiều tình huống mà bạn không thể chạy thử nghiệm lý tưởng và thiên nhiên đã không được cung cấp một thử nghiệm tự nhiên. Ở những nơi này, cách tốt nhất để tạo ra một so sánh công bằng là phù hợp. Trong khớp, các nhà nghiên cứu sẽ thông qua dữ liệu phi thực nghiệm để tạo ra các cặp người tương tự, ngoại trừ một đã được điều trị và người ta không có. Trong quá trình phù hợp, các nhà nghiên cứu đang thực sự cũng cắt tỉa; đó là, loại bỏ trường hợp không có so sánh rõ ràng. Vì vậy, phương pháp này sẽ được nhiều hơn được gọi là chính xác phù hợp-và-cắt tỉa, nhưng tôi sẽ dính với các kỳ hạn truyền thống: phù hợp.
Một ví dụ đẹp về sức mạnh của phù hợp với chiến lược với các nguồn dữ liệu phi thực nghiệm lớn đến từ các nghiên cứu về hành vi tiêu dùng của Liran Einav và các cộng sự (2015) . Einav và các đồng nghiệp đã quan tâm đến các cuộc đấu giá diễn ra trên eBay, và trong mô tả công việc của họ, tôi sẽ tập trung vào một khía cạnh cụ thể: ảnh hưởng của đấu giá bắt đầu từ kết quả bán đấu giá, như giá bán hoặc giá xác suất của một bán.
Cách ngây thơ nhất để trả lời câu hỏi về tác động của giá khởi điểm trên giá bán sẽ là chỉ đơn giản là tính toán mức giá cuối cùng cho cuộc đấu giá với giá khởi điểm khác nhau. Cách tiếp cận này sẽ là tốt nếu bạn chỉ đơn giản muốn dự đoán giá bán của một mục nhất định đã được đặt trên eBay với giá khởi điểm cho trước. Nhưng, nếu câu hỏi của bạn là ảnh hưởng của giá khởi điểm vào kết quả thị trường tiếp cận này sẽ không làm việc vì nó không dựa trên sự so sánh công bằng là gì; bán đấu giá với giá khởi điểm thấp hơn có thể là khá khác nhau từ bán đấu giá với giá khởi điểm cao hơn (ví dụ, họ có thể là đối với các loại hàng hóa khác nhau hoặc bao gồm các loại khác nhau của người bán).
Nếu bạn đã quan tâm đến việc so sánh công bằng, bạn có thể bỏ qua cách tiếp cận ngây thơ và xem xét việc chạy một thí nghiệm lĩnh vực mà bạn sẽ bán một cụ thể mục-nói, một câu lạc bộ với sân một tập cố định bán đấu giá các thông số-nói, miễn phí vận chuyển, đấu giá mở trong hai tuần, vv, nhưng với thiết lập ngẫu nhiên giá khởi điểm. Bằng cách so sánh kết quả thị trường kết quả, thí nghiệm lĩnh vực này sẽ cung cấp một phép đo rất rõ ràng về tác động của giá khởi điểm trên giá bán. Nhưng, đo lường này sẽ chỉ áp dụng cho một sản phẩm cụ thể và thiết lập các thông số cuộc đấu giá. Các kết quả có thể khác nhau, ví dụ, với nhiều loại sản phẩm khác nhau. Nếu không có lý thuyết mạnh mẽ, rất khó để suy luận từ thí nghiệm này đơn đầy đủ những thí nghiệm có thể có thể đã được chạy. Hơn nữa, thí nghiệm là đủ đắt tiền mà nó sẽ là không khả thi để chạy đủ của họ lên để che không gian tham số toàn bộ các sản phẩm và các loại đấu giá.
Ngược lại với cách tiếp cận ngây thơ và các phương pháp thử nghiệm, Einav và các đồng nghiệp có một cách tiếp cận thứ ba: kết hợp. Bí quyết chính của chiến lược của họ là để khám phá những điều tương tự như thí nghiệm đó đã xảy ra trên eBay. Ví dụ, hình 2.6 cho thấy một số trong 31 danh sách cho chính xác cùng một câu lạc bộ golf Taylormade Burner một 09 Driver-đang được bán bởi chính xác Người bán- cùng "budgetgolfer". Tuy nhiên, các danh sách này có đặc điểm hơi khác nhau. Mười một trong số họ cung cấp trình điều khiển cho một mức giá cố định $ 124,99, trong khi 20 khác là đấu giá với ngày kết thúc khác nhau. Ngoài ra, danh sách có phí vận chuyển khác nhau, hoặc $ 7,99 hoặc $ 9,99. Nói cách khác, đó là, nếu "budgetgolfer" đang chạy thử nghiệm cho các nhà nghiên cứu.
Các danh sách của Taylormade Burner 09 điều khiển đang được bán bởi "budgetgolfer" là một ví dụ về một tập hợp các danh sách, nơi mà mục chính xác cùng đang được bán bởi cùng một người bán chính xác, nhưng mỗi lần có đặc điểm hơi khác nhau. Trong các bản ghi lớn của eBay có nghĩa là hàng trăm ngàn bộ phù hợp liên quan đến hàng triệu danh sách. Như vậy, thay vì so sánh giá cuối cùng cho tất cả các cuộc đấu giá trong vòng một mức giá khởi điểm cho trước, Einav và cộng sự so sánh trong bộ phù hợp. Để kết hợp các kết quả từ những so sánh trong những hàng trăm ngàn bộ phù hợp, Einav và các đồng nghiệp diễn tả lại giá khởi điểm và giá cuối cùng về giá trị tham khảo của từng hạng mục (ví dụ, giá bán trung bình của nó). Ví dụ, nếu Taylormade Burner 09 điều khiển có giá trị tham khảo của $ 100 (dựa trên doanh số của nó), sau đó giá khởi điểm là $ 10 sẽ được thể hiện như 0.1 và mức giá cuối cùng là $ 120 sẽ được thể hiện như 1.2.
Nhớ lại rằng Einav và các đồng nghiệp đã quan tâm đến ảnh hưởng của giá đầu vào kết quả đấu giá. Đầu tiên, sử dụng hồi quy tuyến tính họ ước tính rằng giá khởi điểm cao hơn làm giảm xác suất của một bán, và giá khởi điểm cao hơn tăng giá bán cuối cùng, có điều kiện trên bán xảy ra. Tự bản thân, những ước tính-được trung bình trên tất cả các sản phẩm và giả định một mối quan hệ tuyến tính giữa giá khởi điểm và cuối cùng kết quả, không phải là tất cả những gì thú vị. Nhưng, Einav và các đồng nghiệp cũng sử dụng kích thước lớn dữ liệu của họ để đánh giá một loạt các phát hiện tinh tế hơn. Đầu tiên, Einav và các cộng sự đã đưa ra những ước tính riêng cho các mặt hàng mức giá khác nhau và không sử dụng hồi quy tuyến tính. Họ phát hiện ra rằng trong khi các mối quan hệ giữa giá khởi đầu và xác suất của bán hàng là tuyến tính, các mối quan hệ giữa giá khởi điểm và giá bán rõ ràng là phi tuyến tính (hình 2.7). Đặc biệt, để bắt đầu giá giữa 0,05 và 0,85, mức giá khởi điểm có rất ít ảnh hưởng đến giá bán, một phát hiện được hoàn thành đã bỏ lỡ trong phân tích đã giả định một mối quan hệ tuyến tính.
Thứ hai, thay vì trung bình trên tất cả các mặt hàng, Einav và các đồng nghiệp cũng sử dụng quy mô lớn của dữ liệu của họ để đánh giá ảnh hưởng của giá khởi điểm cho 23 loại khác nhau của các mục (ví dụ, cho vật nuôi, thiết bị điện tử, và những kỷ vật thể thao) (hình 2.8). Các ước tính cho thấy đối với biệt nhiều mặt hàng, chẳng hạn như giá kỷ khởi động có ảnh hưởng nhỏ về xác suất của một bán và ảnh hưởng lớn hơn trên giá bán cuối cùng. Hơn nữa, đối biến thành hàng hoá nhiều mặt hàng, chẳng hạn như DVD và video giá bắt đầu gần như không có tác động đến giá cuối cùng. Nói cách khác, trung bình kết hợp kết quả từ 23 loại khác nhau của các giấu thông tin quan trọng về sự khác biệt giữa các mặt hàng này.
Thậm chí nếu bạn không phải là đặc biệt quan tâm đến việc bán đấu giá trên eBay, bạn phải ngưỡng mộ cách mà Hình 2.7 và Hình 2.8 đưa ra một sự hiểu biết phong phú hơn của eBay hơn ước lượng hồi quy tuyến tính đơn giản mà giả sử mối quan hệ tuyến tính và kết hợp nhiều thể loại khác nhau của các mặt hàng. Các ước tính tinh tế hơn minh họa sức mạnh của phù hợp với dữ liệu lớn; những ước tính này sẽ không thể không có một số lượng rất lớn các thí nghiệm hiện trường, mà sẽ là tốn kém.
Tất nhiên, chúng ta nên có ít sự tự tin trong các kết quả của bất kỳ nghiên cứu đối sánh cụ thể hơn, chúng tôi sẽ làm trong các kết quả của một thí nghiệm so sánh. Khi đánh giá các kết quả từ các nghiên cứu phù hợp, có hai mối quan tâm quan trọng. Đầu tiên, chúng ta phải nhớ rằng chúng tôi chỉ có thể đảm bảo sự so sánh công bằng vào những thứ đã được sử dụng cho phù hợp. Trong kết quả chính của họ, Einav và các đồng nghiệp đã chính xác phù hợp với trên bốn đặc điểm: số lượng bán ID, loại mục, tiêu đề mục, và phụ đề. Nếu mặt hàng là khác nhau theo những cách mà không được sử dụng cho phù hợp, có thể tạo ra một sự so sánh không công bằng. Ví dụ, nếu "budgetgolfer" hạ giá Taylormade Burner 09 Driver trong mùa đông (khi các câu lạc bộ golf là ít phổ biến hơn), sau đó nó có thể xuất hiện mà giá khởi điểm thấp hơn dẫn đến việc giảm giá cuối cùng, trong khi thực tế này sẽ là một tạo tác của mùa sự thay đổi trong nhu cầu. Nhìn chung, phương pháp tốt nhất cho vấn đề này dường như phải cố gắng rất nhiều loại khác nhau của khớp. Ví dụ, Einav và các đồng nghiệp lặp lại phân tích của họ, nơi tập hợp bao gồm các mặt hàng được bán trong vòng một năm, trong vòng một tháng, và contemporaneously. Làm cho cửa sổ thời gian chặt chẽ làm giảm số lượng các bộ phù hợp, nhưng làm giảm lo ngại về biến đổi theo mùa. May mắn thay, họ thấy kết quả không thay đổi bởi những thay đổi trong tiêu chí phù hợp. Trong các tài liệu phù hợp, loại này quan tâm là thường thể hiện bằng quan sát và unobservables, nhưng ý tưởng chính là thực sự mà các nhà nghiên cứu chỉ tạo sự so sánh công bằng về các tính năng được sử dụng trong khớp.
Các mối quan tâm lớn thứ hai khi diễn giải kết quả phù hợp là họ chỉ áp dụng cho các dữ liệu phù hợp; họ không áp dụng cho các trường hợp mà có thể không được xuất hiện. Ví dụ, bằng cách giới hạn nghiên cứu của họ để mặt hàng có nhiều danh sách Einav và các đồng nghiệp đang tập trung vào bán hàng chuyên nghiệp và bán chuyên nghiệp. Như vậy, khi giải thích những so sánh này chúng ta phải nhớ rằng họ chỉ áp dụng cho các tập hợp con của eBay.
Matching là một chiến lược mạnh mẽ cho việc tìm kiếm so sánh công bằng trong các tập dữ liệu lớn. Đối với nhiều nhà khoa học xã hội, phù hợp với cảm giác giống như thứ hai tốt nhất để thí nghiệm, nhưng đó là một niềm tin đó phải được sửa đổi, hơi. Kết hợp dữ liệu lớn có thể là tốt hơn so với một số lượng nhỏ các thí nghiệm khi: 1) không đồng nhất trong các hiệu ứng là quan trọng và 2) có thể quan sát tốt để kết hợp. Bảng 2.4 cung cấp một số ví dụ khác về cách thức phù hợp có thể được sử dụng với các nguồn dữ liệu lớn.
tập trung nội dung | nguồn dữ liệu lớn | Trích dẫn |
---|---|---|
Ảnh hưởng của vụ nổ súng vào cảnh sát bạo lực | Stop-and-đùa giởn hồ sơ | Legewie (2016) |
Ảnh hưởng của 11 tháng 9 năm 2001 về gia đình và hàng xóm | hồ sơ bầu cử và hồ sơ quyên góp | Hersh (2013) |
lây lan Xã hội | Truyền thông và thông qua sản phẩm dữ liệu | Aral, Muchnik, and Sundararajan (2009) |
Trong kết luận, phương pháp tiếp cận ngây thơ để ước lượng tác động nhân quả từ dữ liệu phi thực nghiệm là nguy hiểm. Tuy nhiên, chiến lược để lập dự toán nhân quả ven liên tục từ mạnh đến yếu nhất, và các nhà nghiên cứu có thể khám phá ra sự so sánh công bằng trong vòng dữ liệu phi thực nghiệm. Sự phát triển của always-on, hệ thống dữ liệu lớn làm tăng khả năng của chúng tôi để sử dụng có hiệu quả hai phương pháp hiện có: thí nghiệm tự nhiên và phù hợp.