Dopasowane stworzenie uczciwych porównań poprzez przycinanie dala przypadki.
Fair porównania mogą pochodzić zarówno randomizowanych, kontrolowanych eksperymentów lub naturalnych eksperymentów. Ale istnieje wiele sytuacji, w których nie można uruchomić idealny eksperyment i natura nie przewidziała naturalny eksperyment. W tych ustawieniach, najlepszym sposobem, aby stworzyć sprawiedliwe porównanie jest dopasowanie. W dopasowania, badacz przegląda danych nieeksperymentalnych tworzyć pary osób, które są podobne z tym że jeden otrzymał leczenie i nie ma. W procesie dopasowywania naukowcy faktycznie również przycinanie; czyli odrzucając przypadki, w których nie istnieją żadne oczywiste porównania. Tak więc, ta metoda będzie bardziej dokładnie nazywa dopasowanie i-przycinanie, ale będę trzymać się tradycyjnego wyrażenia: dopasowanie.
Piękny przykład potęgi dopasowania strategii z masywnych nieeksperymentalnych źródeł danych pochodzi z badań na temat zachowań konsumentów Liran Einav i współpracowników (2015) . Einav i jego współpracownicy byli zainteresowani aukcjach odbywających się w serwisie eBay, a opisując swoją pracę, będę skupiać się na jednym konkretnym aspekcie: Wpływ aukcji cenie wyjściowej na wyniki aukcji, takich jak ceny sprzedaży lub prawdopodobieństwo sprzedaży.
Najbardziej naiwny sposób, aby odpowiedzieć na pytanie o wpływ na ceny wywoławczej ceny sprzedaży byłoby po prostu obliczyć ostateczną cenę aukcji o różnych cenach wyjściowych. Takie podejście byłoby w porządku, jeśli chcesz po prostu przewidzieć ceny sprzedaży danej pozycji, które zostały wprowadzone na eBay z danej ceny wywoławczej. Ale, jeśli pytanie brzmi, co jest efektem cena wywoławcza na wyniki na rynku tego podejścia nie będzie działać, ponieważ nie opiera się na uczciwych porównań; Aukcje z niższymi cenami wyjściowymi może być zupełnie inny od aukcji z wyższych cen wyjściowych (np, mogą być dla różnych rodzajów towarów lub zawierać różne rodzaje sprzedawców).
Jeśli już jesteś zaniepokojony co sprawiedliwe porównanie, można pominąć naiwne podejście i rozważyć uruchomienie doświadczenia polowego, gdzie będzie można sprzedać specyficzna pozycja, powiedzmy, klub-z golfem ustalonym zestawem aukcyjnych parametrów powiedzmy, bezpłatna wysyłka, aukcja otwarte przez dwa tygodnie, itp, ale z losowo ustalania cen wyjściowych. Przez porównanie wyników rynku, to doświadczenie polowe dałoby bardzo jasną pomiar efektu cena wywoławcza na ceny sprzedaży. Ale, pomiar ten miałby zastosowanie tylko do jednego konkretnego produktu i zestaw parametrów aukcyjnych. Wyniki mogą być różne, na przykład, dla różnych rodzajów produktów. Bez silnego teorii, trudno jest przewidzieć tego pojedynczego eksperymentu pełnego zakresu możliwych eksperymentów, które można było uruchomić. Dalsze doświadczenia polowe są na tyle kosztowny, że byłoby to niemożliwe do uruchomienia dość ich do pokrycia całej przestrzeni parametrów produktów i typów aukcji.
W przeciwieństwie do naiwnego podejścia i metody eksperymentalnej Einav i współpracownicy wykonać trzecie podejście: dopasowanie. Głównym sztuczka ich strategii jest odkrywanie rzeczy podobnych do doświadczeń polowych, które już miały miejsce w serwisie eBay. Na przykład, Rysunek 2.6 pokazuje niektóre z 31 ofert na dokładnie tym samym klubie-golf Taylormade Burner 09 Sterownik sprzedawane przez dokładnie taki sam seller- "budgetgolfer". Jednak te ofert mają nieco inne właściwości. Jedenaście z nich oferują sterownik stałej cenie $ 124,99, natomiast pozostałe 20 są aukcje z różnymi datami końcowymi. Również ofert mają różne wysyłek opłaty, albo $ 7,99 lub $ 9,99. Innymi słowy, jest to tak jakby "budgetgolfer" działa doświadczenia dla badaczy.
Do ofert z Taylormade Burner 09 Sterownik sprzedawane przez "budgetgolfer" to jeden z przykładów dopasowane zestaw ofert, gdzie dokładnie ten sam przedmiot jest sprzedawany przez dokładnie tego samego sprzedawcy, ale za każdym razem z nieco innej charakterystyce. W obrębie masywnych kłód eBay istnieją setki tysięcy dobranych zestawów obejmujących miliony ofert. Tak więc, zamiast porównywania ostateczną cenę dla wszystkich aukcji w danej ceny wywoławczej, Einav i współpracownicy dokonywanie porównań w obrębie dobranych zestawów. W celu połączenia wyników z porównań w obrębie tych setek tysięcy dobranych zestawów, Einav i współpracownicy ponownie wyrazić cenę początkową i końcową cenę pod względem wartości referencyjnej każdego elementu (na przykład jego średnia cena sprzedaży). Na przykład, jeśli Taylormade Burner 09 Kierowca ma wartość referencyjną w wysokości 100 $ (w oparciu o jego sprzedaży), to cena wywoławcza 10 $ będzie wyrażona jako 0,1, a ostateczna cena 120 $ będzie wyrażona jako 1,2.
Przypomnijmy, że Einav i jego współpracownicy byli zainteresowani działaniem cenie startowej na wyniki aukcji. Po pierwsze, za pomocą regresji liniowej, że szacuje się, że wyższe ceny wyjściowe zmniejszyć prawdopodobieństwo sprzedaży, oraz że wyższe ceny wyjściowe zwiększa końcową cenę sprzedaży uzależnione od występujących sprzedaż. Same te szacunki, jeżeli są one uśrednione dla wszystkich produktów i zakładają liniową zależność między ceną wywoławczą i ostatecznych wyników, nie są tak interesujące. Ale Einav i współpracownicy używają również ogromny rozmiar swoich danych do oszacowania różnorodne bardziej subtelnych ustaleń. Po pierwsze, Einav i współpracownicy te szacunki dokonane oddzielnie dla przedmiotów o różnych cenach i bez stosowania regresji liniowej. Okazało się, że podczas gdy relacja pomiędzy ceną początkową i prawdopodobieństwo sprzedaży jest liniowa zależność pomiędzy ceną początkową a ceną sprzedaży jest wyraźnie nieliniowy (rysunek 2.7). W szczególności, zaczynając ceny od 0,05 do 0,85, cena wywoławcza ma bardzo niewielki wpływ na ceny sprzedaży, stwierdzenia, że została zakończona brakowało w analizie, że przybrał zależność liniowa.
Po drugie, zamiast średnio ponad wszystkie rzeczy, Einav i współpracownicy używają również masową skalę swoich danych w celu oszacowania wpływu Cena wywoławcza 23 różnych kategorii przedmiotów (np domowych dostaw, elektroniki i sportowych pamiątek) (Rysunek 2.8). Te szacunki wskazują, że dla bardziej charakterystycznych elementów, takich jak cena pamiątki start ma mniejszy wpływ na prawdopodobieństwo sprzedaży i większego wpływu na ostateczną cenę sprzedaży. Ponadto, więcej w towar przedmiotów, takich jak DVD i wideo cenie startowej nie ma prawie żadnego wpływu na cenę końcową. Innymi słowy, średnio, która łączy wyniki z 23 różnych rodzajów przesyłek ukrywa ważne informacje na temat różnic między tymi przedmiotów.
Nawet jeśli nie są szczególnie zainteresowani aukcji na eBay, trzeba podziwiać sposób, w jaki Rysunek 2.7 i Rysunek 2.8 oferują bogatszy zrozumienia eBay niż prostych regresji liniowej szacunki zakładają, że relacje liniowe i połączyć różne kategorie produktów. Te bardziej subtelne szacunki pokazują moc dopasowywania masowe danych; Szacunki te nie byłyby możliwe bez ogromnej liczby doświadczeń polowych, które byłyby zbyt kosztowne.
Oczywiście, powinniśmy mieć mniejsze zaufanie do wyników żadnego konkretnego badania dopasowania niż my by w wynikach porównywalnych eksperymentu. Przy ocenie wyników badań z dowolnego pasującego, istnieją dwie ważne kwestie. Po pierwsze, musimy pamiętać, że możemy zapewnić sprawiedliwe porównanie na rzeczy, które zostały użyte do dopasowania. W swoich głównych wyników, Einav i jego współpracownicy nie dokładne dopasowanie na cztery cechy: liczba sprzedawca ID kategorii pozycji, Nazwa przedmiotu oraz napisów. Jeśli elementy różniły się w sposób, który nie zostały wykorzystane do dopasowania, które mogłyby powodować nieuczciwej porównania. Na przykład, jeśli "budgetgolfer" obniżone ceny Taylormade Burner 09 Sterownik w zimie (kiedy kije golfowe są mniej popularne), to może pojawić się, że niższe ceny zaczynają prowadzić do obniżenia cen końcowych, podczas gdy w rzeczywistości będzie to artefaktem sezonowa zmienności zapotrzebowania. Ogólnie rzecz biorąc, najlepszym rozwiązaniem tego problemu wydaje się być trudny wiele różnych rodzajów dopasowywania. Na przykład, Einav i współpracownicy powtórzyć ich analizę, gdzie dopasowane zestawy zawierają pozycje w sprzedaży w ciągu jednego roku, w terminie jednego miesiąca, a równocześnie. Dokonywanie okno czasowe mocniej zmniejsza liczbę dobranych zestawów, ale zmniejsza obawy związane z sezonowością. Na szczęście, to okaże się, że wyniki są niezmienione przez te zmiany pasujących kryteriów. W literaturze dopasowania tego typu obaw jest zwykle wyrażona w wykrywalności i unobservables, ale kluczem Pomysł jest naprawdę, że naukowcy tworzą tylko uczciwych porównań na temat cech stosowanych w dopasowaniu.
Drugim istotnym problemem przy interpretacji pasujących wyników jest to, że mają one zastosowanie jedynie do dopasowanych danych; nie dotyczy to przypadków, które nie mogły być dopasowane. Na przykład, ograniczając swoje badania do elementów, które miały wiele ofert Einav i współpracownicy skupiają się na sprzedawców profesjonalnych i półprofesjonalnych. Tak więc, przy interpretacji tych porównań musimy pamiętać, że mają one zastosowanie tylko do tego podzbioru eBay.
Matching jest potężną strategią znajdowania sprawiedliwych porównań w dużych zbiorach danych. Dla wielu przedstawicieli nauk społecznych, dobieranie czuje się drugim najlepszym do eksperymentów, ale to przekonanie, że powinna zostać zmieniona, nieznacznie. Dopasowanie w dużych dane mogą być lepiej niż mała liczba eksperymentów polowych, gdy: 1) heterogeniczność efektów jest ważna i 2) istnieją obserwable do dopasowywania. Tabela 2.4 daje inne przykłady dopasowania może być używany z dużym źródeł.
merytoryczny ostrości | Big źródło danych | Cytat |
---|---|---|
Wpływ strzelaniny w sprawie przemocy policyjnej | Stop-and-Frisk rekordy | Legewie (2016) |
Wpływ 11 września 2001 roku w sprawie rodzin i sąsiadów | Zapisy głosowania i darowizny | Hersh (2013) |
zaraza Społecznej | Komunikacja i przyjęcie Produkt danych | Aral, Muchnik, and Sundararajan (2009) |
Podsumowując, naiwne podejście do szacowania skutków przyczynowych z danych nieeksperymentalnych są niebezpieczne. Jednak strategie dokonywania szacunków przyczynowych leżących wzdłuż kontinuum od najsilniejszy do najsłabszych i naukowcy mogą odkryć uczciwych porównań w obrębie danych nieeksperymentalnych. Wzrost always-on, dużych systemów danych zwiększa naszą zdolność do efektywnego korzystania z dwóch istniejących metod: naturalne eksperymenty i dopasowanie.