2.4.3.2 Matching

საჭმელზე შექმნა სამართლიანი შედარება pruning მოშორებით შემთხვევაში.

სამართლიანი შედარება შეიძლება მოდის ან რანდომიზებული კონტროლირებადი ექსპერიმენტი და ბუნებრივი ექსპერიმენტი. მაგრამ, არსებობს უამრავი სიტუაციაში, სადაც შეგიძლიათ არ აწარმოებს იდეალური ექსპერიმენტი და ბუნება არ არის გათვალისწინებული ბუნებრივი ექსპერიმენტი. ამ პარამეტრების, საუკეთესო გზა, რათა შეიქმნას სამართლიანი შედარება შესატყვისი. შესაბამისი, მკვლევარი გამოიყურება მეშვეობით არასამთავრობო ექსპერიმენტული მონაცემები შექმნას წყვილი ადამიანები, რომლებიც მსგავსი გარდა იმისა, რომ ერთ-ერთი მიიღო მკურნალობა და ერთი არ აქვს. პროცესში შესაბამისი მკვლევარები რეალურად ასევე pruning; რომ არის, უგულვებელყოფით შემთხვევებში, როდესაც არსებობს აშკარა შედარებით. ამდენად, ეს მეთოდი იქნება უფრო ზუსტად მოუწოდა შესაბამისი და pruning, მაგრამ მე გამყარებაში ტრადიციული ვადა: შესაბამისი.

ლამაზი მაგალითია ძალა შესატყვისი სტრატეგიის მასიური არასამთავრობო ექსპერიმენტული მონაცემების წყაროები მოდის კვლევის სამომხმარებლო ქცევის Liran Einav და კოლეგები (2015) . Einav და კოლეგებს აინტერესებდათ აუქციონის მიმდინარე eBay, და აღწერს მათი მუშაობა, მე ფოკუსირება ერთი კონკრეტული ასპექტი: ეფექტი აუქციონის საწყისი ფასი აუქციონზე შედეგებს, როგორიცაა რეალიზაციის ფასის ან ალბათობა იყიდება.

ყველაზე გულუბრყვილო გზა უპასუხოს შეკითხვას, ეფექტი საწყისი ფასი გასაყიდი ფასი იქნება უბრალოდ გამოვთვალოთ საბოლოო ფასი აუქციონის სხვადასხვა დაწყებული ფასები. ეს მიდგომა იქნება ჯარიმა, თუ თქვენ უბრალოდ უნდა პროგნოზირება გასაყიდი ფასი მოცემული ელემენტის, რომელიც უკვე დააყენა eBay მოცემულ საწყისი ფასი. მაგრამ, თუ თქვენი კითხვა, რა არის ეფექტი საწყისი ფასი საბაზრო შედეგების ეს მიდგომა არ იმუშავებს, რადგან ეს არ არის ეფუძნება სამართლიანი შედარება; აუქციონის ქვედა ამოსავალი ფასები შესაძლოა იყოს საკმაოდ განსხვავდება აუქციონის უმაღლესი საწყისი ფასები (მაგალითად, ისინი შეიძლება იყოს სხვადასხვა სახის საქონლის ან მოიცავს სხვადასხვა სახის გამყიდველები).

თუ თქვენ უკვე შეშფოთებული სამართლიანი შედარება, თქვენ შეიძლება გამოტოვოთ გულუბრყვილო მიდგომა და განიხილავს გაშვებული სფეროში ექსპერიმენტი, სადაც თქვენ გაყიდოს კონკრეტული ელემენტის ამბობენ, გოლფის კლუბი ერთად ფიქსირებული კომპლექტი აუქციონზე პარამეტრების-ამბობენ, უფასო გადაზიდვის, აუქციონზე ღია ორი კვირის განმავლობაში, და ა.შ., მაგრამ შემთხვევით მითითებული დაწყებული ფასები. შედარებით შედეგად ბაზარზე შედეგების, ამ სფეროში ექსპერიმენტი შესთავაზებს ძალიან მკაფიო საზომი ეფექტი საწყისი ფასი გასაყიდი ფასი. თუმცა, ეს საზომი იქნებოდა ვრცელდება მხოლოდ ერთი კონკრეტული პროდუქტი და მითითებული აუქციონზე პარამეტრები. შედეგები შეიძლება იყოს სხვადასხვა, მაგალითად, სხვადასხვა სახის პროდუქცია. გარეშე ძლიერი თეორია, ძნელია განზოგადება ამ ერთ ექსპერიმენტი სრულ სპექტრს შესაძლო ექსპერიმენტი, რომელიც შეიძლება უკვე აწარმოებს. გარდა ამისა, საველე ექსპერიმენტებს საკმარისად ძვირი, რომ ეს იქნებოდა infeasible აწარმოებს საკმარისი მათ მთელ პარამეტრი სივრცეში პროდუქცია და აუქციონის ტიპის.

განსხვავებით გულუბრყვილო მიდგომის და ექსპერიმენტული მიდგომა, Einav და კოლეგებს მიიღოს მესამე მიდგომა: შესაბამისი. მთავარ შეასრულა მათი სტრატეგია არის აღმოჩენა რამ მსგავსი სფეროში ექსპერიმენტი, რომელიც უკვე მოხდა on eBay. მაგალითად, ფიგურა 2.6 აჩვენებს 31 განცხადების ზუსტად იგივე გოლფის კლუბი-a Taylormade Burner 09 Driver-გაყიდა ზუსტად იგივე seller- "budgetgolfer". თუმცა, ამ განცხადების ოდნავ განსხვავებული მახასიათებლები. თერთმეტი მათგანი გთავაზობთ მძღოლი ფიქსირებული ფასი $ 124,99, ხოლო მეორე 20 აუქციონის სხვადასხვა დასრულების თარიღებს. გარდა ამისა, განცხადების გვაქვს სხვადასხვა გადაზიდვის საფასური, ან $ 7.99 ან $ 9.99. სხვა სიტყვებით, ეს თითქოს "budgetgolfer" გაშვებული ექსპერიმენტი მკვლევარები.

განცხადების ერთი Taylormade Burner 09 Driver გაყიდა "budgetgolfer" არის ერთი მაგალითი შესაბამისი კომპლექტი განცხადების, სადაც ზუსტად იგივე ნივთი გაყიდა ზუსტად იგივე გამყიდველი, მაგრამ ყოველ ჯერზე ოდნავ განსხვავებული მახასიათებლები. ფარგლებში მასიური ჟურნალი eBay არსებობს ფაქტიურად ასობით ათასი შესაბამისი კომპლექტი, რომელშიც მილიონობით განცხადების. ამდენად, ვიდრე შედარებით საბოლოო ფასის ყველა აუქციონი მოცემულ საწყისი ფასი, Einav და კოლეგებს შედარება ფარგლებში შესაბამისი კომპლექტი. იმისათვის, რომ გაერთიანდება შედეგების შედარება ფარგლებში ამ ასიათასობით შესაბამისი კომპლექტი, Einav და კოლეგებს ხელახლა გამოხატოს საწყისი ფასი და საბოლოო ფასის თვალსაზრისით მინიშნება ღირებულება თითოეული პუნქტის (მაგალითად, მისი საშუალო გასაყიდი ფასი). მაგალითად, იმ შემთხვევაში, თუ Taylormade Burner 09 Driver აქვს მინიშნება ღირებულება $ 100 (საფუძველზე გაყიდვები), მაშინ საწყისი ფასი $ 10 იქნება გამოხატული, როგორც 0.1 და საბოლოო ფასი $ 120 იქნება გამოხატული 1.2.

Figure 2.6: მაგალითი შესაბამისი კომპლექტი. ეს არის ზუსტად იგივე გოლფის კლუბი (a Taylormade Burner 09 Driver) გაყიდა ზუსტი იგივე პირი (budgetgolfer), მაგრამ ზოგიერთი გაყიდვების შესრულდა სხვადასხვა პირობებში (მაგალითად, სხვადასხვა საწყისი ფასი). ფიგურა აღებული Einav et al. (2015).

Figure 2.6: მაგალითი შესაბამისი კომპლექტი. ეს არის ზუსტად იგივე გოლფის კლუბი (a Taylormade Burner 09 Driver) გაყიდა ზუსტი იგივე პირი ( "budgetgolfer"), მაგრამ ზოგიერთი გაყიდვების შესრულდა სხვადასხვა პირობებში (მაგალითად, სხვადასხვა საწყისი ფასი). ფიგურა აღებული Einav et al. (2015) .

შეგახსენებთ, რომ Einav და კოლეგებს აინტერესებდათ ეფექტი დაწყების ფასი აუქციონზე შედეგებს. პირველი გამოყენებით წრფივი რეგრესია ისინი დადგენილია, რომ უმაღლესი საწყისი ფასები შემცირდება ალბათობა იყიდება, და რომ უმაღლესი საწყისი ფასები გაიზრდება საბოლოო გასაყიდი ფასი, პირობითი იყიდება ხდება. თავად, ამ შეფასებით-, რომლებიც საშუალოდ პროდუქცია და ვივარაუდოთ, ხაზოვანი შორის ურთიერთობა საწყისი ფასი და საბოლოო შედეგების-არ არის ყველა, რომ საინტერესოა. მაგრამ, Einav და კოლეგებს ასევე გამოიყენოთ მასიური ზომა მათი მონაცემები, რათა დადგინდეს სხვადასხვა უფრო დახვეწილი დასკვნები. პირველი, Einav და კოლეგებს გააკეთა ამ შეფასებით ცალკე ნივთები სხვადასხვა ფასები და გამოყენების გარეშე წრფივი რეგრესია. მათ აღმოაჩინეს, რომ მიუხედავად იმისა, რომ ურთიერთობას დაწყების ფასი და ალბათობა იყიდება ხაზოვანი შორის ურთიერთობა საწყისი ფასი და გასაყიდი ფასი აშკარად არაწრფივი (ნახაზი 2.7). კერძოდ, დაწყებული ფასები შორის 0.05 და 0.85 საწყისი ფასი, ძალიან ცოტა აქვს გავლენა გასაყიდი ფასი, დასკვნა, რომ დასრულდა გაშვებული ანალიზი, რომ აიღო ხაზოვანი ურთიერთობა.

ნახაზი 2.7: ურთიერთობა აუქციონის დაწყება ფასი და ალბათობა იყიდება (მარცხენა პანელი) და გასაყიდი ფასი (მარჯვენა პანელი). არსებობს დაახლოებით წრფივი შორის ურთიერთობა დაწყების ფასი და ალბათობა იყიდება, მაგრამ იქ არის არაწრფივი შორის ურთიერთობის დაწყების ფასი და გასაყიდი ფასი; დაწყებული ფასები შორის 0.05 და 0.85 საწყისი ფასი, ძალიან ცოტა აქვს გავლენა გასაყიდი ფასი. ორივე შემთხვევაში, ურთიერთობები ძირითადად დამოუკიდებელი საქონლის ღირებულება. ეს გრაფიკის რეპროდუცირება Fig 4 ა და 4 ბ Einav et al. (2015).

ნახაზი 2.7: ურთიერთობა აუქციონის დაწყება ფასი და ალბათობა იყიდება (მარცხენა პანელი) და გასაყიდი ფასი (მარჯვენა პანელი). არსებობს დაახლოებით წრფივი შორის ურთიერთობა დაწყების ფასი და ალბათობა იყიდება, მაგრამ იქ არის არაწრფივი შორის ურთიერთობის დაწყების ფასი და გასაყიდი ფასი; დაწყებული ფასები შორის 0.05 და 0.85 საწყისი ფასი, ძალიან ცოტა აქვს გავლენა გასაყიდი ფასი. ორივე შემთხვევაში, ურთიერთობები ძირითადად დამოუკიდებელი საქონლის ღირებულება. ეს გრაფიკის რეპროდუცირება Fig 4 ა და 4 ბ Einav et al. (2015) .

მეორე, ვიდრე საშუალოდ მეტი ყველა ელემენტი, Einav და კოლეგებს ასევე გამოიყენოთ მასობრივ მათი მონაცემები, რათა დადგინდეს გავლენა საწყისი ფასი 23 სხვადასხვა კატეგორიის ნივთები (მაგალითად, საოჯახო მოწყობილობა, ელექტრონიკა და სპორტული memorabilia) (სურათი 2.8). ეს შეფასებები აჩვენებს, რომ უფრო გამორჩეული ნივთები, როგორიცაა სამახსოვრო დაწყების ფასი აქვს პატარა ეფექტი ალბათობა იყიდება და დიდი ეფექტი საბოლოო გასაყიდი ფასი. გარდა ამისა, უფრო commodified ელემენტი, როგორიცაა DVD და ვიდეო-დაწყების ფასი თითქმის არ გავლენა საბოლოო ფასი. სხვა სიტყვებით, საშუალოდ, რომელიც აერთიანებს შედეგები 23 სხვადასხვა კატეგორიის ნივთები მალავს მნიშვნელოვანი ინფორმაცია განსხვავებები ეს საკითხი.

ნახაზი 2.8: შედეგები აჩვენა შეფასებით თითოეულ კატეგორიაში ინდივიდუალურად; მყარი dot შეფასებით ყველა კატეგორიის ერთად იყრის თავს, ცხრილი 11 (Einav et al. 2015, ცხრილი 11). ეს შეფასებები აჩვენებს, რომ უფრო გამორჩეული ნივთები, როგორიცაა სამახსოვრო-დაწყების ფასი აქვს პატარა ეფექტი ალბათობა იყიდება (x ღერძი) და დიდი ეფექტი საბოლოო გასაყიდი ფასი (y ღერძი).

ნახაზი 2.8: შედეგები აჩვენა შეფასებით თითოეულ კატეგორიაში ინდივიდუალურად; მყარი dot შეფასებით ყველა კატეგორიის ერთად იყრის თავს (Einav et al. 2015, Table 11) . ეს შეფასებები აჩვენებს, რომ უფრო გამორჩეული ნივთები, როგორიცაა სამახსოვრო-დაწყების ფასი აქვს პატარა ეფექტი ალბათობა იყიდება (x ღერძი) და დიდი ეფექტი საბოლოო გასაყიდი ფასი (y ღერძი).

მაშინაც კი, თუ თქვენ არ ხართ განსაკუთრებით დაინტერესებული აუქციონი eBay, თქვენ უნდა აღფრთოვანებული ვარ ისე, რომ ნახაზი 2.7 და დიაგრამა 2.8 შეთავაზება მდიდარი გაგება eBay, ვიდრე მარტივი წრფივი რეგრესია შეფასებით, ვივარაუდოთ, წრფივი ურთიერთობები და აერთიანებს სხვადასხვა კატეგორიის საკითხი. ეს უფრო დახვეწილი შეფასებით ასახავს ძალა შესატყვისი მასიური მონაცემები; ეს შეფასებები შეუძლებელი იქნებოდა გარეშე უზარმაზარი რაოდენობის საველე ექსპერიმენტებს, რომელიც იქნებოდა უკიდურესად ძვირი.

რა თქმა უნდა, ჩვენ უნდა ჰქონდეს ნაკლები ნდობა შედეგების რაიმე კონკრეტული შესაბამისი სასწავლო, ვიდრე ჩვენ გვინდა შედეგებით შესადარებელი ექსპერიმენტი. შეფასებისას შედეგებს რაიმე შესაბამისი შესწავლა, არსებობს ორი მნიშვნელოვანი საკითხები. პირველ რიგში, ჩვენ უნდა გვახსოვდეს, რომ ჩვენ შეგვიძლია მხოლოდ უზრუნველყოს სამართლიანი შედარება რამ, რომ გამოიყენება. მათი ძირითადი შედეგები, Einav და კოლეგებს არ ზუსტი შესატყვისი ოთხი მახასიათებლები: გამყიდველი ID ნომერი, პუნქტის მიხედვით, საქონლის დასახელება, და subtitle. იმ შემთხვევაში, თუ საკითხი იყო სხვადასხვა გზები, რომლებიც არ გამოიყენება შესაბამისი, რომ შეიძლება შეიქმნას უსამართლო შედარებით. მაგალითად, თუ "budgetgolfer" შეამცირა ფასები Taylormade Burner 09 Driver ზამთარში (როდესაც გოლფის კლუბები ნაკლებად პოპულარულია), მაშინ ეს შეიძლება, როგორც ჩანს, რომ დაწყებული დაბალი ფასები გამოიწვიოს ქვედა საბოლოო ფასები, როდესაც, ფაქტობრივად, ეს იქნება artifact სეზონური ცვალებადობას მოთხოვნა. ზოგადად, საუკეთესო მიდგომა ამ პრობლემის, როგორც ჩანს, ცდილობდა, სხვადასხვა სახის შესაბამისი. მაგალითად, Einav და კოლეგებს გაიმეოროს მათი ანალიზი, სადაც შესაბამისი კომპლექტი შეიცავს იყიდება ერთი წლის განმავლობაში, ერთი თვის განმავლობაში, და მაშინვე. მიღების დროს window მჭიდრო მცირდება რაოდენობის შესაბამისი კომპლექტი, მაგრამ ამცირებს შეშფოთება სეზონური ცვლილებები. საბედნიეროდ, ისინი, რომ შედეგები უცვლელი ამ ცვლილებების შესატყვისი კრიტერიუმებს. შესატყვისი ლიტერატურა, ამ ტიპის შეშფოთება, როგორც წესი, გამოიხატება observables და unobservables, მაგრამ ძირითადი იდეა მართლაც რომ მკვლევარები მხოლოდ ქმნის სამართლიანი შედარება თვისებები გამოიყენება შესაბამისი.

მეორე ძირითადი საზრუნავი, როდესაც წერით შესატყვისი შედეგები არის ის, რომ ისინი მხოლოდ ვრცელდება შესაბამისი მონაცემები; ისინი არ ვრცელდება იმ შემთხვევებზე, რომ არ შეიძლება იყოს შესაბამისი. მაგალითად, მათი შეზღუდვის კვლევის ნივთები, მრავლობითი განცხადების Einav და კოლეგებს აქცენტი პროფესიული და ნახევრად პროფესიონალური გამყიდველები. ამდენად, როდესაც წერით ეს შედარებები უნდა გვახსოვდეს, რომ ისინი მხოლოდ ვრცელდება ამ ქვესიმრავლე eBay.

Matching არის ძლიერი სტრატეგია მოძიებაში სამართლიანი შედარება დიდი მონაცემების. ბევრი სოციალური მეცნიერები, შესაბამისი იგრძნობა მეორე საუკეთესო ექსპერიმენტი, მაგრამ ეს არის რწმენა, რომ უნდა გადაიხედოს, ოდნავ. Matching მასიური მონაცემები შეიძლება იყოს უკეთესი, ვიდრე მცირე რაოდენობის სფეროში ექსპერიმენტი, როდესაც: 1) არაერთგვაროვნება ეფექტი არის მნიშვნელოვანი და 2) არსებობს კარგი observables შესატყვისი. მაგიდის 2.4 უზრუნველყოფს სხვა მაგალითები, თუ როგორ შესატყვისი შეიძლება გამოყენებულ იქნას დიდი მონაცემები.

მაგიდის 2.4: მაგალითები კვლევების გამოყენება შესატყვისი მოვძებნოთ სამართლიანი შედარება ფარგლებში ციფრული კვალი.
არსებითი ყურადღება დიდი მონაცემთა წყარო Citation
ეფექტი სროლა პოლიციის ძალადობის შეაჩერე და ზედაპირული შემოწმების ჩანაწერები Legewie (2016)
ეფექტი 2001 წლის 11 სექტემბერს ოჯახი და მეზობლები კენჭისყრების და შემოწირულობის ჩანაწერები Hersh (2013)
სოციალური სენი ურთიერთობა და პროდუქტის მიღების მონაცემები Aral, Muchnik, and Sundararajan (2009)

დასასრულს, გულუბრყვილო მიდგომები შეფასებისას მიზეზობრივი ეფექტი არასამთავრობო ექსპერიმენტული მონაცემები სახიფათოა. თუმცა, სტრატეგიების მიღების მიზეზობრივი შეფასებით ცრუობს გასწვრივ კონტინუუმის ეხლა ძლიერი, რომ სუსტი და მკვლევარები შეგიძლიათ აღმოაჩინოთ სამართლიანი შედარება ფარგლებში არასამთავრობო ექსპერიმენტული მონაცემები. ზრდის მუდმივი, დიდი მონაცემები სისტემები ზრდის ჩვენი უნარი ეფექტურად გამოიყენოს არსებული ორი მეთოდები: ბუნებრივი ექსპერიმენტი და შესატყვისი.