ჩვენ შეგვიძლია მივუდგეთ ექსპერიმენტებს, რომლებსაც ჩვენ არ შეგვიძლია ან არ გავაკეთოთ. ორი მიდგომა, რომელიც განსაკუთრებით დიდი მონაცემთა წყაროებიდან სარგებლობს, ბუნებრივი ექსპერიმენტებია და შეესაბამება.
ზოგიერთი მნიშვნელოვანი სამეცნიერო და პოლიტიკის კითხვები გამომწვევია. მაგალითად, როგორია სამუშაო ტრენინგის პროგრამა ხელფასის შესახებ? მკვლევარი ამ კითხვაზე პასუხის გასაცემად შეიძლება შეადაროთ იმ ადამიანების შემოსავალს, რომლებმაც ხელი მოაწერეს ტრენინგზე იმ ადამიანებს, რომლებსაც არ უთმობდნენ. მაგრამ რამდენად განსხვავდება ამ ჯგუფებს შორის ხელფასები ამ ტრენინგზე და რამდენად არის იმის გამო, რომ განსხვავებაა იმ ხალხებს შორის, რომლებიც ხელს მოაწერენ ხელს და ის, რაც არ არის? ეს რთული კითხვაა და ის არის ის, რაც ავტომატურად ვერ მიდის უფრო მეტი მონაცემებით. სხვა სიტყვებით რომ ვთქვათ, შეშფოთება შესაძლო პრივილეგირებულ განსხვავებებზე წარმოიქმნება, რამდენი თანამშრომელია თქვენს მონაცემებში.
ბევრ სიტუაციაში, ძლიერი მკურნალობის მეთოდის შეფასებისას, როგორიცაა სამუშაოს მომზადება, არის რანდომიზებული კონტროლირებადი ექსპერიმენტი, სადაც მკვლევარი შემთხვევით აწვდის მკურნალობას ზოგიერთ ადამიანზე და არა სხვები. მე ყველაფერს 4 თავი ექსპერიმენტებისთვის დავუთმობ, ასე რომ, აქ ვაპირებ ორი სტრატეგიის ფოკუსირებას, რომელიც შეიძლება გამოყენებულ იქნას არა ექსპერიმენტულ მონაცემებთან. პირველი სტრატეგია დამოკიდებულია იმაზე, თუ რა ხდება მსოფლიოში, რომ შემთხვევით (ან თითქმის შემთხვევით) ანიჭებს მკურნალობას ზოგიერთ ადამიანზე და არა სხვები. მეორე სტრატეგია დამოკიდებულია სტატისტიკურად არასწორ ექსპერიმენტულ მონაცემებზე დაყრდნობით იმ პირთა შორის, რომელთა განხორციელებაც განსხვავდება მათ შორის, ვინც გააკეთა და მკურნალობა არ მიუღია.
სკეპტიკოსი შეიძლება ითქვას, რომ ორივე ეს სტრატეგია თავიდან უნდა იქნას აცილებული, რადგან მათ სჭირდებათ ძლიერი ვარაუდები, მოსაზრებები, რომლებიც ძნელია შეფასდეს და პრაქტიკულად ხშირად ირღვევა. მიუხედავად იმისა, რომ ამ საჩივრისადმი სასიამოვნო ვარ, ვფიქრობ, ცოტა შორს მიდის. რა თქმა უნდა, მართალია, ძნელია საიმედოდ შეფასდეს არა ექსპერიმენტული მონაცემები, მაგრამ მე არ მგონია, რომ ჩვენ არასდროს არ უნდა ვეცადოთ. კერძოდ, არასამთავრობო ექსპერიმენტული მიდგომები შეიძლება სასარგებლო იყოს, თუ ლოჯისტიკური შეზღუდვა ხელს უშლის ექსპერიმენტის ჩატარებას ან ეთიკური შეზღუდვების იმას ნიშნავს, რომ არ გსურთ ექსპერიმენტის ჩატარება. გარდა ამისა, არასამთავრობო ექსპერიმენტული მიდგომები შეიძლება სასარგებლო იყოს, თუ გსურთ გამოიყენოთ ის მონაცემები, რომლებიც უკვე არსებობს იმისათვის, რომ შეიქმნას რანდომიზებული კონტროლირებადი ექსპერიმენტი.
აქამდე უნდა აღინიშნოს, რომ მიზეზობრივი შეფასებების ჩატარება სოციალურ კვლევაში ერთ-ერთი ყველაზე რთული თემაა, რაც შეიძლება გამოიწვიოს ინტენსიური და ემოციური დებატები. რა მიყვებით, მე მივმართავ ყველა მიდგომის ოპტიმისტურ აღწერას იმის შესახებ, რომ ამის შესახებ ინტუიცია შემიძლია, მაშინ აღვწერო იმ რამდენიმე გამოწვევა, რომელიც წარმოიქმნება ამ მიდგომის გამოყენებისას. თითოეული თავის შესახებ დამატებითი დეტალები ხელმისაწვდომია ამ თავის ბოლოს. თუ თქვენ გეგმავთ გამოიყენოთ ეს მეთოდები თქვენს კვლევაში, მე მაღალ რეკომენდაციას ვურჩევ ერთ-ერთ ბევრ შესანიშნავი წიგნი მიზეზობრივი დასკვნის შესახებ (Imbens and Rubin 2015; Pearl 2009; Morgan and Winship 2014) .
ერთი მიდგომა, რათა გამოიწვიოს მიზეზობრივი შეფასებები არასამთავრობო ექსპერიმენტული მონაცემების მოსაძებნად ღონისძიება, რომელიც შემთხვევით ენიჭება მკურნალობის ზოგიერთი ადამიანი და არა სხვები. ამ სიტუაციებს ბუნებრივი ექსპერიმენტები ეწოდება. ბუნებრივი ექსპერიმენტის ერთ-ერთი ნათელი მაგალითია ჯოშუა ანგრისტის კვლევა (1990) გაზრდის სამხედრო სამსახურის შედეგებს შემოსავლებზე. ვიეტნამის ომში, შეერთებულმა შტატებმა შეიარაღებული ძალების ზომა გაზარდა პროექტით. იმისათვის, რომ გადაწყვიტოს, რომელი მოქალაქეები დაერქმევა სამსახურში, ამერიკის მთავრობამ ლატარიის ჩატარება გამართა. ყოველი დაბადების თარიღი დაიწერა ნაჭერი ქაღალდზე და, როგორც ეს ნაჩვენებია სურათზე 2.7, ამ ცალი ქაღალდი შეირჩა ერთდროულად იმისათვის, რომ დადგინდეს ბრძანება, რომლითაც ახალგაზრდები მოუწოდებენ ემსახურებოდნენ (ახალგაზრდა ქალები არ იყო საგანი პროექტი). შედეგებზე დაყრდნობით, 14 სექტემბერს დაბადებული მამაკაცები პირველად დაიბარეს, 24 აპრილს დაბადებული მამაკაცები მეორე და ასე შემდეგ. საბოლოო ჯამში, ამ ლატარიაში, შეიქმნა 195 სხვადასხვა დღის განმავლობაში დაბადებული მამაკაცი, ხოლო 171 დღის განმავლობაში დაბადებული მამაკაცი არ იყო.
მიუხედავად იმისა, რომ ეს შეიძლება არ იყოს მაშინვე აშკარად, ლატარიის კანონპროექტი რანდომიზებული კონტროლირებადი ექსპერიმენტის კრიტიკული მსგავსებაა: ორივე შემთხვევაში, მონაწილეები შემთხვევითად იღებენ მკურნალობას. ამ რანდომიზებული მკურნალობის ეფექტის შესწავლის მიზნით Angrist- მა ისარგებლა დიდი მონაცემთა სისტემაში: აშშ-ის სოციალური დაცვის ადმინისტრაცია, რომელიც აგროვებს ინფორმაციას ამერიკულმა შემოსავლებმა პრაქტიკულად. იმავდროულად, თუ ვინ იყო შემთხვევითი შერჩეული პროექტში ლატარიის პროექტში, რომელიც აგროვებდა სამთავრობო ადმინისტრაციულ ჩანაწერებში, Angrist- მა დაასკვნა, რომ ვეტერანების მოგება დაახლოებით 15% -ით ნაკლებია, ვიდრე შედარებით არასა ვეტერანთა მოგება.
როგორც ეს მაგალითი გვიჩვენებს, ზოგჯერ სოციალურ, პოლიტიკურ თუ ფიზიკურ ძალებს ანიჭებენ მკურნალობას, რომლებიც შეიძლება მკვლევარებმა შეძლონ, და ზოგჯერ ამ მკურნალობის ეფექტი ყოველთვის იკავებს დიდ მონაცემთა წყაროებს. კვლევის სტრატეგია შეიძლება შეჯამდეს შემდეგნაირად: \[\text{random (or as if random) variation} + \text{always-on data} = \text{natural experiment}\]
ციფრული ასაკის ამ სტრატეგიის წარმოსაჩენად, ალექსანდრე მასისა და ენრიკო მორეტის (2009) მიერ ჩატარებული კვლევის განხილვა, რომელიც შეეცადა პროდუქტიული მუშაობის ეფექტურობის შეფასების ეფექტურობის შეფასებას. შედეგების დამთავრებამდე უნდა აღინიშნოს, რომ არსებობს მოსალოდნელი მოლოდინი, რომლითაც შეიძლება. ერთის მხრივ, შეიძლება მოელოდე, რომ პროდუქტიულ კოლეგებთან მუშაობამ მუშაკი გამოიწვიოს, რათა გაიზარდოს მისი პროდუქტიულობა თანატოლების ზეწოლის გამო. ან, მეორეს მხრივ, შეიძლება ველოდოთ, რომ მწვავე თანამშრომლებმა შეიძლება გამოიწვიონ მუშაკი, რათა თავიდან აიცილონ მისი თანატოლები. პროდუქტიულობის ეფექტურობის შესწავლის ნათელი გზა იქნება რანდომიზებული კონტროლირებადი ექსპერიმენტი, სადაც მუშები შემთხვევითად გადადიან სხვადასხვა პროდუქტიულობის დონის მუშაკებს და შემდეგ პროდუქტიულობის გაზომვა ყველასთვისაა შეფასებული. მკვლევარებმა არ გააკონტროლონ მუშების გრაფიკი ნებისმიერი რეალურ ბიზნესში და ამიტომ მას და მორეტი შეეძლოთ დაეცვათ ბუნებრივი ექსპერიმენტი, რომელშიც ჩართული იყო სუპერმარკეტში მოლარე.
ამ კონკრეტულ სუპერმარკეტში, იმის გამო, რომ დაგეგმილი იყო დაგეგმილი და გადაადგილებული გზა, თითოეულმა მოლარემ სხვადასხვა თანამშრომლებს სხვადასხვა დროს დაუთმო. გარდა ამისა, ამ კონკრეტულ სუპერმარკეტში, მოლარეების დავალება არ იყო დაკავშირებული თანატოლების პროდუქტიულობისთვის ან რამდენად დაკავებული იყო მაღაზიაში. სხვა სიტყვებით რომ ვთქვათ, მიუხედავად იმისა, რომ მოლარეების დანიშვნა ლატარიაში არ იყო განისაზღვრა, თითქოს მუშები ზოგჯერ შემთხვევით მუშაობდნენ მაღალი (ან დაბალი) პროდუქტიულობის მქონე თანატოლებთან. საბედნიეროდ, ეს სუპერმარკეტი ასევე ჰქონდა ციფრული ასაკის შემოწმების სისტემა, რომელიც თვალს ადევნებდა იმ ყველაფერს, რომლითაც თითოეული მოლარე იყო სკანირება. ამ გადმონაშთების ჩანაწერის მონაცემებით, მასსა და მორეტიმ შეძლო წარმოედგინა ზუსტი, ინდივიდუალური და მუდმივად პროდუქტიულობის გაზომვა: ერთეულში ჩასმული ნივთების რაოდენობა. კომბინირებული ეს ორი რამ - ბუნებრივად წარმოქმნილი ვარიაცია თანატოლების პროდუქტიულობასა და პროდუქტიულობის ყოველთვის სავარაუდო ღონისძიებაზე - მასსა და მორეტი, რომლიდანაც მოლარე იყო მიენიჭებინა თანამშრომლები, რომლებიც საშუალოდ 10% -ით უფრო პროდუქტიული იყვნენ, მისი პროდუქტიულობა 1.5% -ით გაიზარდა . გარდა ამისა, მათ გამოიყენეს ზომის და სიმრავლე მათი მონაცემების შესასწავლად ორი მნიშვნელოვანი საკითხები: ჰეტეროგენეულობა ამ ეფექტი (რისთვისაც მუშები არის უფრო დიდი ეფექტი?) და ეფექტი უკან მექანიზმები (რატომ აქვს მაღალი პროდუქტიულობის თანატოლებს უმაღლესი პროდუქტიულობა?). ჩვენ დავუბრუნდებით ამ ორ მნიშვნელოვან საკითხს - მკურნალობის ეფექტურობისა და მექანიზმების ჰეტეროგენურობას, მე -4 თავში, როდესაც უფრო დეტალურად განვიხილავთ ექსპერიმენტებს.
ამ ორი კვლევის განზოგადება, ცხრილი 2.3 აჯამებს სხვა კვლევებს, რომლებსაც აქვთ იგივე სტრუქტურა: ყოველთვის იყენებენ მონაცემთა წყაროს, რათა შეამცირონ ზოგიერთი შემთხვევითი ვარიაციის ეფექტი. პრაქტიკაში, მკვლევარებმა გამოიყენეს ორი განსხვავებული სტრატეგია ბუნებრივი ექსპერიმენტების მოსაპოვებლად, რაც შეიძლება ნაყოფიერი იყოს. ზოგიერთი მკვლევარი იწყებს მონაცემების წყაროს ყოველთვის და იწყებს შემთხვევით მოვლენებს მსოფლიოში; სხვები დაიწყება შემთხვევითი მოვლენა მსოფლიოში და მოძებნეთ მონაცემთა წყაროები, რომლებიც აკონტროლებენ მის გავლენას.
არსებითი ფოკუსი | ბუნებრივი ექსპერიმენტის წყარო | ყოველთვის - მონაცემთა წყაროზე | მითითება |
---|---|---|---|
Peer ეფექტი პროდუქტიულობის | დაგეგმვის პროცესი | გადამოწმების მონაცემები | Mas and Moretti (2009) |
მეგობრობის ფორმირება | ქარიშხალი | Phan and Airoldi (2015) | |
ემოციების გავრცელება | Წვიმა | Lorenzo Coviello et al. (2014) | |
თანხმობა-თანხმობა ეკონომიკური ტრანსფერები | Მიწისძვრა | მობილური ფულის მონაცემები | Blumenstock, Fafchamps, and Eagle (2011) |
პირადი მოხმარების ქცევა | 2013 აშშ მთავრობა გამორთვა | პირადი ფინანსური მონაცემები | Baker and Yannelis (2015) |
რეკომენდებული სისტემების ეკონომიკური ზეგავლენა | სხვადასხვა | ბრაუზერის მონაცემები Amazon- ზე | Sharma, Hofman, and Watts (2015) |
სტრესი ეფუძნება unborn ჩვილი | 2006 ისრაელი-ჰეზბოლა ომი | დაბადების ჩანაწერები | Torche and Shwed (2015) |
კითხვის ქცევა ვიკიპედიაში | Snowden revelations | ვიკიპედია | Penney (2016) |
თანატოლების ეფექტურობა | ამინდი | ფიტნეს ტრეკერები | Aral and Nicolaides (2017) |
დისკუსიაში ჯერჯერობით ბუნებრივი ექსპერიმენტებით, მე გამოვდივარ მნიშვნელოვან პუნქტზე: რა ბუნება მიაწოდა რა გინდა, ზოგჯერ საკმაოდ სახიფათოა. დავუბრუნდეთ ვიეტნამის მაგალითს. ამ შემთხვევაში, ანგრისტი დაინტერესდა სამხედრო სამსახურის ეფექტიანობის შეფასებაზე. სამწუხაროდ, სამხედრო სამსახურში შემთხვევით არ იყო დანიშნული; უფრო სწორად იყო შემუშავებული, რომელიც შემთხვევით იყო დანიშნული. თუმცა, ყველას, ვინც შემუშავებული იყო (იყო სხვადასხვა შეღავათები), და ყველას, ვისაც ემსახურებოდა, შემუშავდა (ხალხს შეუძლია მოხალისეებად ემსახუროს). იმის გამო, რომ შემუშავებული იყო შემთხვევით დანიშნული, მკვლევარი შეიძლება შეაფასოს ეფექტი მიმდინარეობს შემუშავებული ყველა მამაკაცის პროექტი. მაგრამ ანგრისტმა არ უნდა იცოდეს ეფექტის შემუშავება; მას სურდა იცოდა სამხედრო სამსახურში მსახურების ეფექტი. ამ შეფასების შესაქმნელად საჭიროა დამატებითი ვარაუდები და გართულებები. პირველ რიგში, მკვლევარებმა უნდა იფიქრონ იმაზე, რომ ერთადერთი გზა, რომელიც შემუშავებულ შემოსავლებზეა დაფუძნებული, სამხედრო სამსახურშია, ვარაუდი გამონაკლისი შეზღუდულია . ეს ვარაუდი შეიძლება იყოს არასწორი თუ მაგალითად, შემუშავებული ადამიანები, რომლებსაც შემუშავებდნენ, აღარ ემსახურებოდნენ მსახურების თავიდან ასაცილებლად ან დამსაქმებლებს ნაკლებად იყენებდნენ ადამიანებს, რომლებიც შემუშავებულ იქნა. ზოგადად, გამონაკლისი შეზღუდვა კრიტიკული მოსაზრებაა და, როგორც წესი, ძნელია შემოწმება. მაშინაც კი, თუ გამონაკლისი შეზღუდვა სწორია, ჯერ კიდევ შეუძლებელია ყველა ადამიანისთვის მომსახურების ეფექტი შეაფასოს. ამის ნაცვლად, აღმოჩნდება, რომ მკვლევარებმა შეიძლება მხოლოდ შეაფასონ ეფექტი მამაკაცების კონკრეტულ ქვესადგურზე, რომელსაც უწოდებენ კომპეტენციებს (მამაკაცები, რომლებიც ემზადებდნენ შემუშავებას, მაგრამ არ ემსახურებოდნენ, როდესაც არ იყო შემუშავებული) (Angrist, Imbens, and Rubin 1996) . თუმცა, მომჩივნები არ იყვნენ ინტერესთა ორიგინალური მოსახლეობა. გაითვალისწინეთ, რომ ეს პრობლემები წარმოიქმნება ლატარიის პროექტების შედარებით სუფთა მდგომარეობაში. გართულებების კიდევ ერთი კომპლექტი წარმოიქმნება, როდესაც მკურნალობა არ არის გათვალისწინებული ფიზიკური ლატარია. მაგალითად, მასსა და მორეტის კვლევაში ნაღდი ფულის მიმოქცევისას დამატებითი კითხვები წარმოიქმნება იმის შესახებ, რომ თანატოლების დავალება არსებითად შემთხვევითია. თუ ეს დაშვება მკაცრად დაირღვა, ეს შეიძლება შეფასდეს მათი შეფასებით. დაასკვნას, რომ ბუნებრივი ექსპერიმენტები შეიძლება იყოს ძლიერი სტრატეგია, რომელიც წარმოადგენს არა ექსპერიმენტული მონაცემების მიზეზობრივ შეფასებებს და დიდი მონაცემთა წყაროები გაზრდის ჩვენს შესაძლებლობებს ბუნებრივი ექსპერიმენტებით, როდესაც მოხდება. თუმცა, სავარაუდოდ, საჭიროა დიდი ზრუნვა და ხანდახან ძლიერი ვარაუდები - რა ბუნება მიაწოდა იმის შეფასებას, რომ გინდა.
მეორე სტრატეგია მინდა მოგახსენოთ, რომ არა ექსპერიმენტული მონაცემების მიზეზობრივი შეფასების შესახებ დამოკიდებულია სტატისტიკურად არასწორ ექსპერიმენტულ მონაცემებზე დაყრდნობით, იმ მცდელობებს შორის, რომლებიც განსხვავებულად წარმოადგენენ მათ შორის, ვინც გააკეთა და მკურნალობა არ მიუღია. არსებობს ბევრი ასეთი კორექტირების მიდგომები, მაგრამ მე ფოკუსირება ერთი მოუწოდა შესატყვისი . შესატყვისი, მკვლევარი გამოიყურება არა ექსპერიმენტულ მონაცემებთან, რათა შექმნას წყვილი ადამიანები, რომლებიც მსგავსია, გარდა იმისა, რომ მკურნალობამ მიიღო და არა აქვს. დამუშავების პროცესში, მკვლევარები პრაქტიკულად ასევე აკოცევენ ; ანუ, გათიშული შემთხვევები, სადაც არ არის აშკარა მატჩი. ამგვარად, ეს მეთოდი უფრო სწორად მოიქცევა შესატყვისი და მეტყველებაზე, მაგრამ ტრადიციულ ტერმინთან გამყარებაში ვიქნები.
მასიური არასპეციალური მონაცემების წყაროს შესატყვისობის სტრატეგიის ერთ-ერთი მაგალითია Liran Einav- ისა და კოლეგების მიერ სამომხმარებლო ქცევის კვლევა (2015) . ისინი დაინტერესდნენ eBay- ზე ჩატარებულ აუქციონებზე და აღწერენ თავიანთ საქმიანობას, მე ფოკუსირება აუქციონის შედეგების აუქციონის შედეგზე, როგორიცაა გასაყიდი ფასი ან გაყიდვის ალბათობა.
ყველაზე გულუბრყვილო გზაა შეფასების ფასის საწყისი ფასის ეფექტის შეფასება, რომელიც მხოლოდ აუქციონების საბოლოო ფასს გამოთვლიან სხვადასხვა დაწყებული ფასებით. ეს მიდგომა იქნებოდა კარგად, თუ უნდოდა პროგნოზირება გასაყიდი ფასი მოცემული საწყისი ფასი. მაგრამ თუ თქვენი კითხვა ეხება ფასის გავლენას, ეს მიდგომა არ იმუშავებს, რადგან ის არ არის ეფუძნებული სამართლიანი შედარებებით; აუქციონები დაბალი საწყისი ფასებით შეიძლება საკმაოდ განსხვავებული იყოს იმით, რომ მაღალი ფასების მქონე პირები (მაგ., ისინი შეიძლება იყვნენ სხვადასხვა ტიპის საქონელი ან იყვნენ სხვადასხვა სახის გამყიდველები).
თუ თქვენ უკვე იცით, რომ პრობლემები შეიძლება წარმოიშვას არაობიექტური მონაცემების წარმოშობისას, შეიძლება გამოვრიცხოთ გულუბრყვილო მიდგომა და განიხილონ საველე ექსპერიმენტი, სადაც გაიყიდება კონკრეტული პუნქტი - გოლფ კლუბი - ფიქსირებული აუქციონის პარამეტრების კომპლექტი - ითქვა, რომ უფასო გადაზიდვა და აუქციონი ორ კვირაშია გახსნილი, მაგრამ შემთხვევითად დაწყებული ფასები. შედეგად მიღებული ბაზრის შედეგების შედარებით, ამ სფეროში ექსპერიმენტი შესთავაზებს ძალიან მკვეთრ გაზომვას ფასების საწყისი ფასიდან დაწყების ფასის ეფექტიანობას. მაგრამ ეს გაზომვა მხოლოდ ერთ კონკრეტულ პროდუქტსა და აუქციონის პარამეტრების გამოყენებას შეეხება. შედეგები შეიძლება იყოს განსხვავებული, მაგალითად, სხვადასხვა სახის პროდუქციისთვის. ძლიერი თეორიის გარეშე, ძნელია ექსპრედატირება ამ ერთი ექსპერიმენტისგან შესაძლო ექსპერიმენტების სრულ სპექტრამდე, რომლითაც შესაძლებელი იქნებოდა. უფრო მეტიც, საველე ექსპერიმენტი საკმარისად ძვირია, რომ ეს იქნებოდა შეუძლებელი, რომ აეწყოთ ყველა ვარიაცია, რომელიც შეიძლება დაგჭირდეთ.
გულუბრყვილო და ექსპერიმენტული მიდგომებისგან განსხვავებით, Einav- მა და კოლეგებმა მესამე მიდგომა მიიღეს: შესატყვისი. მთავარი სტრატეგია მათი სტრატეგიაა ისაა, რომ აღმოაჩინოს ისეთი რამე ექსპერიმენტები, რომლებიც უკვე მოხდა eBay- ზე. მაგალითად, ფიგურა 2.8 გვიჩვენებს ზოგიერთი 31 სიაში ზუსტად იგივე გოლფის კლუბი- Taylormade Burner 09 მძღოლის მიმდინარეობს გაიყიდა ზუსტად იგივე გამყიდველი - "ბიუჯეტი". თუმცა, ამ 31 განცხადების აქვს ოდნავ განსხვავებული მახასიათებლები, როგორიცაა სხვადასხვა დაწყებული ფასი, ბოლო ვადები და გადაზიდვის საფასური. სხვა სიტყვებით რომ ვთქვათ, მკვლევართა ექსპერიმენტებს "ბიუჯეტის პოტენციალი" ახორციელებს.
ტაილარამდის Burner 09 მძღოლის ამ განცხადების მიხედვით, "ბიუჯერგოლფერის" მიერ გაყიდული ერთ-ერთი მაგალითია ჩამონათვალი, სადაც ზუსტად იგივე საქონელი გაყიდულია ზუსტად იგივე გამყიდველით, მაგრამ ყოველ ჯერზე ოდნავ განსხვავებული მახასიათებლებით. EBay- ის მასიური მოთხრობისას მილიონობით განცხადების აწყობა ასობით ათასი თანხვედრაა. ამდენად, ვიდრე აუქციონების საბოლოო ფასის შედარება ამ საწყისი ფასით, Einav და კოლეგები შედარებით შეესაბამება თანხვედრას. ამ ასობით ათასი თანხვედრის ფარგლებში არსებული შედეგების კომბინირების მიზნით, Einav- მა და კოლეგებმა ხელახლა გამოხატათ დაწყების ფასი და საბოლოო ფასი თითოეული ნივთის (მაგ., მისი საშუალო გაყიდვის ფასი) თვალსაზრისით. მაგალითად, თუ Taylormade Burner 09 მძღოლს ჰქონდა 100 დოლარის მინიშნება ღირებულება (მისი გაყიდვების მიხედვით), მაშინ $ 10-ის საწყისი ფასი გამოითვლება 0.1 და საბოლოო ფასი 120 $ -ისთვის 1.2.
შეგახსენებთ, რომ Einav- ს და კოლეგებს აინტერესებდათ აუქციონის შედეგების საწყისი ფასი. პირველ რიგში, ისინი იყენებდნენ წრფივი რეგრესიას იმის შესახებ, რომ ფასების მაქსიმალურმა ფასმა შეამცირა გაყიდვების ალბათობა და უფრო მაღალი ფასები გაიზარდა საბოლოო გასაყიდი ფასი (იყიდება პირობითი იყიდება). თავისთავად, ეს შეფასებები, რომლებიც აღწერენ ხაზოვან ურთიერთობას და საშუალოდ ყველა პროდუქტზე - ეს არ არის საინტერესო. ამის შემდეგ, Einav და კოლეგებმა გამოიყენეს მასიური ზომის მათი მონაცემები, რათა შეიქმნას სხვადასხვა უფრო დახვეწილი შეფასებები. მაგალითად, ეფექტიანობის შეფასებისას, განსხვავებული ფასის განსხვავებული ვარიანტების ცალკეულობით, აღმოჩნდა, რომ დაწყებული ფასისა და გაყიდვის ფასს შორის ურთიერთობები არაწრფივია (ფიგურა 2.9). კერძოდ, საწყისი ფასების დაწყებამდე 0.05 და 0.85, საწყისი ფასი ძალიან მცირე გავლენას ახდენს გასაყიდად ფასიზე, რომელიც მთლიანად გაუფასურდა მათი პირველი ანალიზით. უფრო მეტიც, ვიდრე ყველა ელემენტიზე, Einav- ს და კოლეგებმა შეაფასეს 23 სხვადასხვა კატეგორიის ნივთების საწყისი ფასი (მაგ., პეტ მიწოდება, ელექტრონიკა და სპორტული შენიშვნები) (ფიგურა 2.10). ეს შეფასებები აჩვენებს, რომ უფრო გამორჩეული ნივთებისთვის, როგორიცაა memorabilia- ს საწყისი ფასი, უფრო მცირე გავლენას ახდენს გაყიდვის ალბათობაზე და უფრო დიდ გავლენას საბოლოო გაყიდვის ფასზე. გარდა ამისა, უფრო სასაქონლო საქონელზე - როგორიცაა DVD - დაწყებული ფასი თითქმის არ იმოქმედებს საბოლოო ფასი. სხვა სიტყვებით, საშუალოდ, რომელიც აერთიანებს 23 სხვადასხვა კატეგორიის ნივთებს, ამ ნივთებს შორის მნიშვნელოვანი განსხვავებები მალავს.
მაშინაც კი, თუ eBay- ზე აუქციონზე არ არის დაინტერესებული, თქვენ უნდა აღფრთოვანდეთ ისე, რომ ფიგურა 2.9 და ფიგურა 2.10 გთავაზობთ მდიდარ ურთიერთობას eBay- ზე, ვიდრე უბრალო შეფასებები, რომლებიც აღწერენ ხაზოვან ურთიერთობას და აერთიანებთ სხვადასხვა კატეგორიის ნივთებს. გარდა ამისა, მეცნიერულად შესაძლებელი იქნებოდა ამ უფრო დახვეწილი შეფასებების წარმოდგენა საველე ექსპერიმენტებთან ერთად, ეს ექსპერიმენტი არსებითად შეუძლებელი იქნებოდა.
ბუნებრივი ექსპერიმენტების მსგავსად, არსებობს მთელი რიგი გზები, რომელთა მიხედვითაც შეიძლება გამოიწვიოს ცუდი შეფასებები. მე ვფიქრობ, რომ ყველაზე დიდი შეშფოთება შესაფასებელი შეფასებით არის ის, რომ ისინი შეიძლება მიკერძოებული იყოს იმ საკითხებით, რომლებიც არ იყენებდნენ შესაბამისობას. მაგალითად, მათი ძირითადი შედეგები, Einav და კოლეგებმა ზუსტად შეესატყვისება ოთხ მახასიათებელს: გამყიდველი ID ნომერი, პუნქტის კატეგორია, პუნქტის სათაური და სუბტიტრი. იმ შემთხვევაში, თუ საქონელი სხვაგვარად იყო გამოყენებული, რომელიც არ იყო გამოყენებული შესატყვისი, მაშინ შეუძლებელი იქნებოდა შეუსაბამო შედარება. მაგალითად, თუ "ბიუჯეტის გათამაშება" ზამთარში Taylormade Burner 09 მძღოლისთვის ფასების შემცირებაა (როდესაც გოლფის კლუბები ნაკლებად პოპულარულია), მაშინ გამოჩნდება, რომ ქვედა სასტარტო ფასები გამოიწვევს საბოლოო ფასების შემცირებას, როდესაც სინამდვილეში ეს იქნება ხელოვნების ნიმუში სეზონური ვარიაცია მოთხოვნით. ამ მიდგომაზე მიმართვის ერთი მიდგომა ცდილობს სხვადასხვა სახის შესატყვისი. მაგალითად, Einav- მა და კოლეგებმა გაიმეორა მათი ანალიზი, როდესაც განსხვავდება დროისთვის განკუთვნილი დროის ფანჯარა (თანდართული კომპლექტი შედის ერთ თვეში, ერთ თვეში და ერთდროულად). საბედნიეროდ, მათ აღმოაჩინეს მსგავსი შედეგები ყველა დროის ფანჯარაში. შემდგომი შეშფოთება შეესაბამება ინტერპრეტაციას. შესატყვისი შეფასებები გამოიყენება მხოლოდ შესაბამისი მონაცემებით; ისინი არ ვრცელდება ისეთ შემთხვევებზე, რომლებიც ვერ დაერთო. მაგალითისთვის, მათი კვლევების შეზღუდვით, მრავალრიცხოვან განცხადებებით, Einav და კოლეგები ყურადღებას ამახვილებენ პროფესიულ და ნახევრად პროფესიონალ გამყიდველებზე. ამგვარად, ამ შედარებების ინტერპრეტაციისას უნდა გვახსოვდეს, რომ ისინი მხოლოდ eBay- ის ამ სუბსეტზე ვრცელდება.
შესატყვისი არის ძლიერი სტრატეგია სამართლიანი შედარებებისა არა ექსპერიმენტულ მონაცემებში. ბევრმა სოციოლოგმა შეესაბამება მეორე ექსპერიმენტებს, მაგრამ ეს არის რწმენა, რომელიც შეიძლება შესწორებული იყოს ოდნავ. მასიური მონაცემების შესატყვისი შეიძლება იყოს უკეთესი, ვიდრე მცირე რაოდენობის საველე ექსპერიმენტები, როდესაც (1) ჰეტეროგენეულობა ეფექტი მნიშვნელოვანია და (2) საჭიროა მნიშვნელოვანი ცვლადები შესატყვისი. ცხრილი 2.4 გვიჩვენებს სხვა მაგალითებს, თუ როგორ შეიძლება გამოყენებულ იქნას შესაბამისი მონაცემები დიდი მონაცემთა წყაროებით.
არსებითი ფოკუსი | დიდი მონაცემთა წყარო | მითითება |
---|---|---|
პოლიციის ძალადობაზე სროლის ეფექტი | შეჩერება და ფრიდრიხ ებერტის ჩანაწერები | Legewie (2016) |
2001 წლის 11 სექტემბრის ეფექტი ოჯახებისა და მეზობლების შესახებ | ხმის მიცემის ჩანაწერები და შემოწირულობის ჩანაწერები | Hersh (2013) |
სოციალური დაპირისპირება | კომუნიკაცია და პროდუქტის მიღების მონაცემები | Aral, Muchnik, and Sundararajan (2009) |
დასკვნის სახით, შეუძლებელია არა ექსპერიმენტული მონაცემების მიზეზობრივი შედეგების შეფასება, არამედ მიდგომები, როგორიცაა ბუნებრივი ექსპერიმენტები და სტატისტიკური კორექცია (მაგალითად, შესატყვისი). ზოგიერთ შემთხვევაში, ეს მიდგომა შეიძლება ცუდად არასწორად მივიდეს, მაგრამ ყურადღებით შეყვანისას ეს მიდგომები შეიძლება იყოს სასარგებლო შეავსოთ ექსპერიმენტული მიდგომა, რომელიც აღწერს მე -4 თავში. გარდა ამისა, ეს ორი მიდგომა განსაკუთრებით სავარაუდოა ისარგებლოს ყოველთვის, on დიდი მონაცემთა სისტემები.