కేసులు దూరంగా కత్తిరింపు సరసమైన పోలికలు సృష్టించడానికి సరిపోలే.
ఫెయిర్ పోలికలు స్వైర నియంత్రిత ప్రయోగాలు లేదా సహజ ప్రయోగాలు గాని నుండి రావచ్చు. కానీ, మీరు ఆదర్శ ప్రయోగం అమలు కాదు పేరు మరియు స్వభావం ఒక సహజ ప్రయోగం అందించలేదు అనేక సందర్భాలలో ఉన్నాయి. ఈ అమరికలో, ఒక సరసమైన పోలిక సరిపోయే సృష్టించడానికి ఉత్తమ మార్గం. మ్యాచింగ్, పరిశోధకుడు తప్ప చికిత్స పొందింది పోలి ఉంటాయి వ్యక్తుల జంటల సృష్టించడానికి కాని ప్రయోగాత్మక డేటా ద్వారా కనిపిస్తోంది మరియు కాదు ఉంది. మ్యాచింగ్ విధానంలో, పరిశోధకులు నిజానికి కూడా కత్తిరింపు ఉంటాయి; ఎటువంటి స్పష్టమైన పోలిక ఉన్న సందర్భాలలో తొలగించటం, ఉంది. అందువలన, ఈ పద్ధతి మరింత ఖచ్చితంగా సరిపోలే-మరియు-కత్తిరింపు అని, కానీ నేను సంప్రదాయ పదంతో కర్ర చేస్తాము: మ్యాచింగ్.
భారీ కాని ప్రయోగాత్మక డేటా మూలాల వ్యూహాలు సరిపోలే శక్తి ఒక అందమైన ఉదాహరణకు Liran Einav మరియు సహచరులు వినియోగదారు ప్రవర్తన మీద పరిశోధనలు నుండి వచ్చి (2015) . Einav మరియు సహచరులు eBay న జరుగుతున్న వేలం ద్వారా ఆసక్తి చూపారు, మరియు వారి పని వివరిస్తూ, నేను ఒక నిర్దిష్ట అంశం చేస్తాము: అటువంటి అమ్మకానికి ధర లేదా అమ్మకానికి సంభావ్యత వేలంలో ఫలితాలను, వేలం ప్రారంభ ధర ప్రభావం.
అమ్మకానికి ధర ప్రారంభ ధర ప్రభావం గురించి ప్రశ్నకు సమాధానం చాలా అమాయక మార్గం కేవలం వివిధ ప్రారంభ ధరలు వేలాలు కోసం ఆఖరి ధరను నిర్ణయించాలని ఉంటుంది. మీరు కేవలం ఇచ్చిన ప్రారంభ ధర eBay న చాలు జరిగింది ఇచ్చిన అంశం అమ్మకానికి ధర అంచనా అనుకుంటే ఈ విధానం అర్ధవంతంగా ఉంటుంది. కానీ, మీ ప్రశ్న ఈ విధానం మార్కెట్లో తలెత్తే పరిణామాలను ప్రారంభమయ్యే ధర ఇది ఫెయిర్ సరిపోలిస్తే ఆధారంగా లేదు ఎందుకంటే పనిచేయదు ప్రభావం ఏమి ఉంది; తక్కువ ప్రారంభ ధరలు వేలాలు ఉన్నత ప్రారంభ ధరలు (ఉదా, వారు వస్తువులను వివిధ రకాల ఉంటుంది లేదా విక్రేతలు వివిధ రకాల ఉండవచ్చు) వేలాలు నుండి చాలా భిన్నంగా ఉండవచ్చు.
మీరు ఫెయిర్ పోలికలు నూతనముగా ఇప్పటికే ఆందోళన ఉంటే, మీరు సరళ విధానం దాటవేసి, మీరు వేలం ఒక నిర్ణీతమైన క్లబ్-ఒక గోల్ఫ్ ఒక నిర్దిష్ట అంశం-చెప్పే విక్రయించాలని పేరు ఒక రంగంలో ప్రయోగాన్ని రన్ పరిగణించబడతారు పారామితులు-చెప్పే, ఉచిత షిప్పింగ్, వేలం రెండు వారాల, ఓపెన్ మొదలైనవి కాని యాదృచ్చికంగా మొదలు ధరలను తో. ఫలితంగా మార్కెట్లో తలెత్తే పరిణామాలను పోల్చగా, ఈ రంగంలో ప్రయోగంలో అమ్మకానికి ధర ధర మొదలు ప్రభావం చాలా స్పష్టంగా కొలత అందివ్వటం. కానీ, ఈ కొలత మాత్రమే ఒక నిర్దిష్ట ఉత్పత్తి దరఖాస్తు మరియు వేలం పారామితులు సెట్ చేస్తుంది. ఫలితాలు వివిధ ఉత్పత్తులను వివిధ రకాల కోసం, ఉదాహరణకు, కావచ్చు. బలమైన సిద్ధాంతం లేకుండా, అది సాధ్యం ప్రయోగాలు పూర్తి స్థాయి అమలు ఎలాగంటే ఈ సింగిల్ ప్రయోగం నుండి అంచనా వేయడం కష్టం. మరింత ఫీల్డ్ ప్రయోగాలు ఉత్పత్తులను మరియు వేలం రకాల మొత్తం పారామితి స్పేస్ కవర్ అప్ వాటిలో తగినంత అమలు వేయడం అని తగినంత ఖరీదైనవి.
సరళ విధానం మరియు ప్రయోగాత్మక పద్ధతిని విరుద్ధంగా, Einav మరియు సహచరులు మూడవ పద్ధతిని: మ్యాచింగ్. వారి వ్యూహం యొక్క ప్రధాన ట్రిక్ ఇప్పటికే eBay న జరిగిన ఆ రంగంలో ప్రయోగాలు ఇలాంటి విషయాలు తెలుసుకుంటారు ఉంది. ఉదాహరణకు, మూర్తి 2.6 అదే గోల్ఫ్ క్లబ్-ఒక టాయిలోర్మేడ్ బర్నర్ 09 డ్రైవర్-అవుతోంది అదే seller- "budgetgolfer" అమ్మిన 31 జాబితాలు కొన్ని చూపిస్తుంది. అయితే, ఈ జాబితాలు కొద్దిగా విభిన్న లక్షణాలను కలిగి. అయితే మిగిలిన 20 మందిని వివిధ ముగింపు తేదీలు వేలాలు మిగిలిన పదకొండుమంది $ 124,99 ఒక స్థిర ధర కోసం డ్రైవర్ అందిస్తున్నాయి. అలాగే, జాబితాలు వివిధ షిప్పింగ్ ఫీజు గాని $ 7.99 లేదా $ 9.99. ఇతర మాటలలో, అది "budgetgolfer" పరిశోధకులకు ప్రయోగాలు నడుస్తుంటే గా ఉంది.
టాయిలోర్మేడ్ బర్నర్ 09 డ్రైవర్ జాబితాలు "budgetgolfer" ద్వారా అమ్ముడుపోయాయి ఖచ్చితమైన అంశం ఖచ్చితమైన విక్రేత అమ్ముడుపోయాయి జాబితాలు, ఒక సరిపోలిన సెట్ కానీ కొద్దిగా విభిన్న లక్షణాలను తో ప్రతి సమయం ఒక ఉదాహరణ మాత్రమే. ఈబే భారీ లాగ్లను లోపల వాచ్యంగా జాబితాలు లక్షలాది పాల్గొన్న సరిపోలిన సెట్లు వందల వేల ఉన్నాయి. అందువలన, బదులుగా ఇచ్చిన ప్రారంభ ధర పరిధిలో అన్ని వేలం కోసం ఆఖరి ధరలతో పోల్చి కంటే, Einav మరియు సహచరులు సరిపోలిన సెట్లు లోపల పోలిక. సరిపోలిన సెట్లు వేల ఈ వందల లోపల పోలికలు నుండి ఫలితాలు మిళితం చేయడానికి, Einav మరియు సహచరులు ప్రతి అంశం (ఉదాహరణకు, దాని సగటు అమ్మకానికి ధర) సూచన విలువ పరంగా ధరతో మరియు చివరి ధర తిరిగి వ్యక్తం. ఉదాహరణకు, (దాని అమ్మకాల ఆధారంగా) టాయిలోర్మేడ్ బర్నర్ 09 డ్రైవర్ $ 100 ఒక సూచన విలువ కలిగి ఉంటే, అప్పుడు $ 10 యొక్క ఒక ప్రారంభ ధర 0.1 గా వ్యక్తం అవుతుంది మరియు $ 120 చివరి ధర 1.2 గా వ్యక్తం అవుతుంది.
Einav మరియు సహచరులు వేలంలో ఫలితాలపై ప్రారంభ ధర ప్రభావం ఆసక్తి చూపారు గుర్తుచేసుకున్నారు. మొదటి, లీనియర్ రిగ్రెషన్ ఉపయోగించి వారు ఉన్నత ప్రారంభ ధరలు అమ్మకానికి సంభావ్యత తగ్గించడానికి, మరియు ఉన్నత ప్రారంభ ధరలు తుది అమ్మకానికి ధర, అమ్మకం జరగకుండా నియత పెంచే అంచనా వేసింది. స్వతంత్రంగా, ఈ అంచనాలు-ఇది అన్ని ఉత్పత్తులు పైగా సగటున ఉంటాయి ప్రారంభ ధర మరియు చివరి మధ్య సరళ సంబంధం అనుకోము అన్ని ఆసక్తికరమైన ఫలితాలను అనుకూలంగా ఉన్నాయి. కానీ, Einav మరియు సహచరులు కూడా చాలా సూక్ష్మమైన తీర్పులు వివిధ అంచనా వారి డేటా భారీ పరిమాణాన్ని ఉపయోగిస్తుంది. మొదటి, Einav మరియు సహచరులు విడిగా వివిధ ధరలు అంశాలను మరియు లీనియర్ రిగ్రెషన్ ఉపయోగించి లేకుండా ఈ అంచనాలు తయారు. వారు ఒక అమ్మకానికి ప్రారంభ ధర మరియు సంభావ్యతను మధ్య సంబంధం సరళంగా ఉంటుంది, అయితే, ప్రారంభ ధర మరియు అమ్మకానికి ధర మధ్య సంబంధం స్పష్టంగా కాని సరళ (మూర్తి 2.7) గుర్తించింది. ముఖ్యంగా, 0.05 మరియు 0.85 మధ్య ధరలు మొదలు కోసం, ప్రారంభ ధర అమ్మకానికి ధర, ఒక సరళ సంబంధం చేపట్టిన ఆ విశ్లేషణ తప్పిన పూర్తయింది దొరకడం చాలా తక్కువ ప్రభావం ఉంది.
రెండవది, కాకుండా అన్ని అంశాలను కన్నా ఎక్కువ కంటే, Einav మరియు సహచరులు కూడా వారి డేటా భారీ ఎత్తున అంశాలు (ఉదా, పెంపుడు జంతువుల వస్తువులు, ఎలక్ట్రానిక్స్, మరియు క్రీడలు జ్ఞాపకాల) (మూర్తి 2.8) యొక్క 23 వివిధ కేతగిరీలు ప్రారంభ ధర ప్రభావాన్ని అంచనా వేయడం ఉపయోగించండి. ఈ అంచనాలు మరింత విలక్షణమైన అంశాలను-వంటి జ్ఞాపకాల స్టార్ట్ ధర అమ్మకానికి సంభావ్యత మరియు చివరి అమ్మకానికి ధర ఒక పెద్ద ప్రభావంపై ఒక చిన్న ప్రభావాన్ని చూపుతున్నాయి. ఇంకా, మరింత commodified అంశాలను-వంటి DVD లు మరియు వీడియో ప్రారంభ ధర చివరి ధర దాదాపు ఎలాంటి ప్రభావం ఉంది. ఇతర మాటలలో, అంశాలు 23 వివిధ వర్గాల నుండి ఫలితాలు మిళితం చేసే ఒక సగటు ఈ అంశాలను మధ్య తేడాలు గురించి ముఖ్యమైన సమాచారాన్ని దాచి.
మీరు eBay వేలం ముఖ్యంగా ఆసక్తి కానప్పటికీ, మీరు 2.7 Figure మరియు 2.8 ఆఫర్ సరళ సంబంధాలు సంతరించుకుం అంశాలను అనేక వివిధ కేతగిరీలు మిళితం సాధారణ లీనియర్ రిగ్రెషన్ అంచనాల కంటే eBay యొక్క ఉత్తమ అవగాహన Figure ఆ విధంగా ఆరాధించడం ఉన్నాయి. ఇవి సూక్ష్మ అంచనాలు భారీ డేటా సరిపోలే శక్తి వర్ణించేందుకు; ఈ అంచనాలు భరించలేనంత ఖరీదుని ఉండేది క్షేత్రం ప్రయోగాలు అపారమైన సంఖ్య, లేకుండా అసాధ్యం ఉండేది.
కోర్సు యొక్క, మేము ఒక పోల్చదగిన ప్రయోగ ఫలితాలు లో దానికన్నా ఏదైనా నిర్దిష్ట సరిపోలే అధ్యయన ఫలితాలు తక్కువ విశ్వాసం కలిగి ఉండాలి. ఎలాంటి సరిపోలే అధ్యయనం నుండి ఫలితాలు నిర్ణయించేటప్పుడు, రెండు ముఖ్యమైన సూచనలు ఉన్నాయి. మొదటి, మేము మాత్రమే మ్యాచింగ్ కోసం ఉపయోగించారు విషయాలపై సరసమైన పోలికలు నిర్ధారించగలను గుర్తు పెట్టుకోవాలి. విక్రేత ID నంబర్ అంశం వర్గం, అంశం శీర్షిక, మరియు ఉపశీర్షిక: వారి ప్రధాన ఫలితాల్లో, Einav మరియు సహచరులు ఖచ్చితమైన నాలుగు లక్షణాలు న సరిపోలే చేయలేదు. అంశాలను యెంతో పోలిక సృష్టిస్తుంది సరిపోలే ఉపయోగిస్తారు లేని విధంగా విధాలుగా వ్యత్యాసంగా ఉంటే. ఉదాహరణకు, "budgetgolfer" కోసం టాయిలోర్మేడ్ బర్నర్ 09 డ్రైవర్ ధరలు శీతాకాలంలో తగ్గించినప్పుడు (గోల్ఫ్ క్లబ్బులు తక్కువ ప్రజాదరణ ఉన్నప్పుడు), అప్పుడు అది తక్కువ ప్రారంభ ధరలు తుది తక్కువ ధరలకు కారణమయ్యే నిజానికి ఈ సీజనల్ ఒక కల్పితంగా ఎప్పుడు కనిపిస్తాయి డిమాండ్ వైవిధ్యం. సాధారణంగా, ఈ సమస్య ఉత్తమ విధానం సరిపోలే అనేక రకాల ప్రయత్నిస్తూ ఉంది. ఉదాహరణకు, Einav మరియు సహచరులు సరిపోలిన సెట్లు నెలలోపే, ఒక సంవత్సరం లోపల అమ్మకానికి అంశాలు, మరియు contemporaneously చేర్చే వారి విశ్లేషణ పునరావృతం. సమయం విండో కఠినమైన మేకింగ్ సరిపోలిన సెట్లు సంఖ్య తగ్గుతుంది, కాలానుగత వైవిధ్యం గురించి ఆందోళనలు తగ్గిస్తుంది. అదృష్టవశాత్తూ, వారు ఫలితాలను సరిపోలే ప్రమాణం మార్పులు ద్వారా మారలేదు ఉన్నాయని తెలుసుకుంటారు. మ్యాచింగ్ సాహిత్యంలో, ఆందోళన ఈ రకమైన సాధారణంగా observables మరియు unobservables పరంగా వ్యక్తం చేసింది, కానీ ముఖ్య ఆలోచన పరిశోధకులు కేవలం మ్యాచింగ్ ఉపయోగించిన లక్షణాలు మీద ఫెయిర్ పోలికలు సృష్టిస్తున్నారు నిజంగా ఉంది.
సరిపోలే ఫలితాలను వ్యాఖ్యానించడానికి రెండవ ప్రధాన సమస్యగా వారు మాత్రమే సరిపోలిన డేటా వర్తిస్తాయి అని; వారు సరిపోలని అని సందర్భాలలో వర్తిస్తాయి లేదు. ఉదాహరణకు, Einav మరియు సహచరులు ప్రొఫెషనల్ మరియు పాక్షిక వృత్తిగత అమ్మకందారుల సారించడం బహుళ జాబితాలను కలిగి వస్తువుల తమ పరిశోధన పరిమితం చేయడం ద్వారా. అందుచేత, ఈ పోలికలు అన్వయించే మేము వారు మాత్రమే eBay ఈ ఉపసమితి వర్తించే గుర్తుంచుకోవాలి.
మ్యాచింగ్ పెద్ద డేటాసెట్ సరసమైన పోలికలు కనుగొనడానికి ఒక శక్తివంతమైన వ్యూహం. అనేక సామాజిక శాస్త్రవేత్తలకు, మ్యాచింగ్ ప్రయోగాలు రెండవ ఉత్తమ అనుకుని, కానీ కొద్దిగా సవరించిన చేయాలి అని ఒక నమ్మకం ఉంది. భారీ డేటా సరిపోలే రంగంలో ప్రయోగాల ఒక చిన్న సంఖ్య కంటే మంచి కావచ్చు ఉన్నప్పుడు: 1) ప్రభావాలు లో భిన్నత్వం ముఖ్యం మరియు 2) సరిపోలే మంచి observables ఉన్నాయి. టేబుల్ 2.4 సరిపోలే ఎంత పెద్ద డేటా మూలాల తో ఉపయోగించవచ్చు కొన్ని ఇతర ఉదాహరణలు అందిస్తుంది.
సబ్స్తాన్తీవ్ దృష్టి | బిగ్ డేటా మూలం | citation |
---|---|---|
పోలీసు హింస కాల్పుల ప్రభావం | ఆపు మరియు కుప్పిగంతులు వేయు రికార్డులు | Legewie (2016) |
సెప్టెంబర్ 11, 2001 ప్రభావం కుటుంబాలు మరియు ఇరుగుపొరుగు | ఓటింగ్ రికార్డులు మరియు విరాళం రికార్డులు | Hersh (2013) |
సామాజిక అంటువ్యాధి | కమ్యూనికేషన్ మరియు ఉత్పత్తి స్వీకరణ డేటా | Aral, Muchnik, and Sundararajan (2009) |
ముగింపు లో, కాని ప్రయోగాత్మక డేటా నుండి కారణ ప్రభావాలు అంచనా అమాయక విధానాలు ప్రమాదకరంగా ఉంటాయి. అయితే, బలమైన నుండి బలహీనమైన ఒక నిరంతర పాటు పడి కారణ అంచనాలు చేసినందుకు వ్యూహాలు మరియు పరిశోధకులు కాని ప్రయోగాత్మక డేటా లోపల ఫెయిర్ పోలికలు కనుగొనవచ్చు. సహజ ప్రయోగాలు మరియు సరిపోలే: ఎప్పుడూ, పెద్ద డేటా వ్యవస్థల వృద్ధి ఇద్దరు సమర్ధులైన ప్రస్తుతం పద్ధతులను ఉపయోగించడానికి మా సామర్థ్యాన్ని పెంచుతుంది.