Is urrainn dhuinn deuchainnean a thoirt seachad nach eil no nach urrainn dhuinn a dhèanamh. Tha dà dhòigh-obrach a tha gu h-àraidh a 'faighinn buannachd bho stòran dàta mòra mar dheuchainnean nàdarra agus co-ionannachd
Tha cuid de cheistean cudromach saidheansail agus poileasaidh adhbharach. Mar eisimpleir, dè a 'bhuaidh a bhios aig prògram trèanaidh obrach air tuarastail? Dh'fhaodadh neach-rannsachaidh a tha a 'feuchainn ris a' cheist seo a fhreagairt coimeas a dhèanamh eadar cosnaidhean dhaoine a chuir clàradh airson trèanadh dhaibhsan nach do rinn. Ach dè an ìre de dh 'eadar-dhealachadh sam bith anns na tuarastalan eadar na buidhnean sin air sgàth an trèanaidh agus dè a tha a dhìth air sgàth eadar-dhealachaidhean preexisting eadar na daoine a tha a' clàradh agus an fheadhainn nach eil? Is e ceist dhuilich a tha seo, agus is e seo aon nach eil a 'dol air falbh le barrachd dàta gu fèin-obrachail. Ann am faclan eile, tha an dragh mu dh 'eadar-dhealachaidhean a tha comasach air a bhith a' nochdadh a dh'aindeoin dè an àireamh de luchd-obrach anns an dàta agad.
Ann am mòran shuidheachaidhean, is e an dòigh as làidire airson tuairmse a thoirt air buaidh adhbharach cuid de dh 'leigheas, leithid trèanadh obrach, deuchainn deuchainn air a thionndadh air thuaiream far a bheil neach-rannsachaidh a' toirt seachad an leigheas air thuaiream do chuid de dhaoine agus chan e feadhainn eile. Cuiridh mi a h-uile caibideil 4 gu deuchainnean, agus mar sin an seo tha mi a 'dol a chuimseachadh air dà ro-innleachd a dh'fhaodar a chleachdadh le dàta neo-dheuchainneach. Tha a 'chiad ro-innleachd an crochadh air a bhith a' lorg rudeigin a tha a 'tachairt anns an t-saoghal a bhios a' sònrachadh an leigheis air cuid de dhaoine air thuaiream (no cha mhòr air thuaiream) agus chan e feadhainn eile. Tha an dàrna ro-innleachd an urra ri bhith ag atharrachadh dàta neo-dhearbhach ann an staitistig ann an oidhirp gus cunntas a thoirt airson eadar-dhealachaidhean preexisting eadar an fheadhainn a rinn agus nach d 'fhuair an leigheas.
Dh'fhaodadh neach-amhairc a bhith a 'tagradh gum bu chòir an dà ro-innleachd sin a sheachnadh oir tha feum aca air barailean làidir, barailean a tha doirbh a mheasadh agus gu tric, gu bheil iad tric air am briseadh. Ged a tha mi mothachail air an tagradh seo, tha mi a 'smaoineachadh gu bheil e a' dol beagan ro fhada. Tha e gu cinnteach fìor gu bheil e doirbh tuairmsean adhbharach a dhèanamh bho dàta neo-dheuchainneach, ach chan eil mi a 'smaoineachadh gu bheil sin a' ciallachadh nach bu chòir dhuinn feuchainn a-riamh. Gu h-àraidh, faodaidh modhan neo-dhearbhach a bhith cuideachail ma chuireas casg loidsigeach bacadh ort o bhith a 'dèanamh deuchainnean no ma tha cuingealachaidhean eiticeach a' ciallachadh nach eil thu airson deuchainnean a ruith. A bharrachd, faodaidh modhan neo-dhearbhach a bhith cuideachail ma tha thu airson brath a ghabhail air dàta a tha ann mar-thà gus deuchainnean a th 'air a stiùireadh fo thimcheall a dhealbh.
Mus tèid a dhol air adhart, is fhiach a bhith mothachail cuideachd gur e tuairmsean adhbharach aon de na cuspairean as iom-fhillte ann an rannsachadh sòisealta, agus aon a dh'fhaodas deasbad dian agus faireachail a thoirt gu buil. Mar a leanas, bheir mi cunntas dòigheil air gach dòigh-obrach gus togail air inntinn mu dheidhinn, an uairsin bheir mi cunntas air cuid de na dùbhlain a tha a 'nochdadh nuair a bhios iad a' cleachdadh an dòigh-obrach sin. Tha tuilleadh fiosrachaidh mu gach dòigh-obrach ri fhaighinn anns na stuthan aig deireadh a 'chaibideil seo. Ma tha thu am beachd aon de na dòighean-obrach sin a chleachdadh anns an rannsachadh agad fhèin, tha mi a 'moladh gu mòr a bhith a' leughadh aon de na leabhraichean as fheàrr air co-dhùnaidhean adhbharanach (Imbens and Rubin 2015; Pearl 2009; Morgan and Winship 2014) .
Is e aon dòigh-obrach airson tuairmsean adhbharach a dhèanamh bho dàta neo-dhearbhach tachartas a lorg a tha air leigheas a shònrachadh air thuaiream do chuid de dhaoine agus chan ann do dhaoine eile. Canar deuchainnean nàdarra ris na suidheachaidhean sin. Tha aon de na h-eisimpleirean as soilleire de dheuchainn nàdarra a 'tighinn bhon rannsachadh a rinn Joshua Angrist (1990) tomhas buaidh seirbheisean armailteach air tuarastalan. Rè a 'chogaidh ann am Bhietnam, chuir na Stàitean Aonaichte meudachd nam feachdan armaichte aca tro dhreach. Gus co-dhùnadh dè na saoranaich a chaidh a thoirt a-steach don t-seirbheis, chùm riaghaltas na SA crannchur. Chaidh a h-uile ceann-là breith a sgrìobhadh air pìos pàipear, agus, mar a chithear ann am figear 2.7, chaidh na pìosan pàipeir seo a thaghadh aon uair aig àm gus an òrdugh far am biodh daoine òga air an gairm gu seirbheis a choileanadh (cha robh boireannaich òga cuspair chun an dreach). Stèidhichte air na toraidhean, chaidh an fheadhainn a rugadh air an t-Sultain 14 a ghairm an toiseach, air an robh fir a rugadh air 24 Giblean air an ainmeachadh an dàrna fear, agus mar sin air adhart. Aig a 'cheann thall, anns an crannchur seo, chaidh fir a rugadh air 195 latha eadar-dhealaichte a dhealbhadh, ged nach robh fir a rugadh ann an 171 làithean.
Ged nach biodh e follaiseach sa bhad, tha dreach de dhualchas aig crannchur ri deuchainn air a stiùireadh fo thimcheall: ann an dà shuidheachadh, thèid com-pàirtichean a thoirt seachad air thuaiream airson leigheas fhaighinn. Gus sgrùdadh a dhèanamh air a 'bhuaidh a th' aig a 'chùrsa air thuaiream seo, thug Angrist buannachd do shiostam dàta mòr a bha ann an-còmhnaidh: Rianachd Tèarainteachd Sòisealta na SA, a bhios a' cruinneachadh fiosrachadh mu cha mhòr a h-uile h-aon de chosnadh Ameireaganach bho chosnadh. Le bhith a 'cur an fhiosrachaidh a-mach mu cò a chaidh a thaghadh air thuaiream san dreach crannchur leis an dàta cosnaidh a chaidh a chruinneachadh ann an clàran rianachd riaghaltais, choinnich Angrist gun robh tuarastal seann-sheirbhisich mu 15% nas lugha na cosnadh luchd-obrach nach robh coltach ri chèile.
Mar a tha an eisimpleir seo a 'sealltainn, uaireannan tha feachdan sòisealta, poilitigeach no nàdarra a' sònrachadh leigheasan ann an dòigh a dh'fhaodas luchd-rannsachaidh a ghiùlan, agus uaireannan bidh buaidh nan leigheasan sin air an glacadh ann an daonnan - air tobraichean dàta mòr. Faodar geàrr-chunntas a dhèanamh air an ro-innleachd rannsachaidh mar a leanas: \[\text{random (or as if random) variation} + \text{always-on data} = \text{natural experiment}\]
Gus an ro-innleachd seo a shoilleireachadh anns an aois dhidseatach, smaoinich sinn air sgrùdadh le Alexandre Mas agus Enrico Moretti (2009) a dh'fheuch ri tuairmse a dhèanamh air a 'bhuaidh a bhith ag obair le co-obraichean buannachdail air toradh neach-obrach. Mus fhaic thu na toraidhean, is fhiach a bhith a 'sealltainn gu bheil co-dhùnaidhean annasach a dh' fhaodadh a bhith agad. Air an aon làimh, is dòcha gum biodh dùil agad gum biodh e ag obair le co-obraichean buannachdail le neach-obrach a bhith ag àrdachadh a cinneasachd air sgàth cuideam co-aoisean. No, air an làimh eile, dh'fhaodadh tu a bhith an dùil gum faodadh co-aoisean a bhith ag obair cruaidh a thoirt air neach-obrach a bhith a 'falbh air sgàth' s gu bheil an obair air a dhèanamh le a co-aoisean co-dhiù. B 'e deuchainn smachd a th' ann an dòigh as fhasa airson a bhith a 'sgrùdadh cho-bhuaidhean air toradh, far an deach luchd-obrach a shònrachadh air thuaiream airson gluasad le luchd-obrach aig ìrean cinneasachd eadar-dhealaichte agus an uairsin thèid an toradh a thomhas airson a h-uile duine. Ach, chan eil luchd-sgrùdaidh a 'cumail smachd air clàr-obrach luchd-obrach ann an gnìomhachas sam bith, agus mar sin dh'fheumadh Mas and Moretti a bhith an eisimeil deuchainn nàdarra a' toirt a-steach airgeadadairean aig mòr-bhùth.
Anns a 'bhùth-bhùth seo, air sgàth an dòigh anns an deach clàradh a dhèanamh agus an dòigh a tha a' gluasad thairis, bha co-obraichean eadar-dhealaichte aig gach neach-ionmhais aig diofar amannan den latha. A bharrachd, anns a 'bhùth-bhùth shònraichte seo, cha robh obair cisteadairean ceangailte ri cinneasachd an co-aoisean no cho trang sa bha an stòras. Ann am faclan eile, ged nach robh clàradh cìsearan air a dhearbhadh le crannchur, bha e mar gum biodh luchd-obrach air am fastadh air thuaiream uaireannan ag obair le co-aoisean àrd (no ìseal). Gu fortanach, bha siostam dearbhaidh aois digiteach aig a 'mhòr-bhùth seo a bha a' cumail sùil air na nithean a bha gach neach-ionmhais a 'sganadh fad na h-ùine. Bho na clàran-taice clàraidh seo, bha Mas agus Moretti comasach air tomhas mionaideach, fa leth, agus daonnan de chinneasachd a chruthachadh: an àireamh de nithean a chaidh an sganadh gach dàrna fear. A 'ceangal an dà rud sin - an atharrachadh nàdarra ann an toradh co-aoisean agus an tomhas de thorachd a tha an-còmhnaidh air a thoirt seachad - mheas Mas agus Moretti nan deigheadh co-oibriche a thoirt do neach-ionmhais a bha 10% nas buannachdail na an àbhaist, gum biodh a cinneasachadh ag èirigh 1.5% S an Iar- A thuilleadh air an sin, chleachd iad meud agus beairteas an dàta airson dà chùis chudromach a rannsachadh: iomadachd a 'bhuaidh seo (airson dè an seòrsa de luchd-obrach a tha an èifeachd nas motha?) Agus na dòighean air cùl a' bhuaidh (Carson a tha co-aoisean àrd-toraidh a 'leantainn gu cinneasachd nas àirde?). Tillidh sinn chun an dà chùis chudromach seo - iomadachd buaidh agus modhan leigheis-ann an caibideil 4 nuair a bhios sinn a 'bruidhinn air deuchainnean nas mionaidiche.
Le bhith a 'co-èigneachadh bhon dà sgrùdadh seo, tha clàr 2.3 a' toirt geàrr-chunntas air sgrùdaidhean eile aig a bheil an aon structar seo: a 'cleachdadh tobar dàta air-loidhne gus buaidh cuid de dhiofar atharrachadh a thomhas. Ann an cleachdadh, bidh luchd-rannsachaidh a 'cleachdadh dà ro-innleachd eadar-dhealaichte airson deuchainnean nàdarra a lorg, agus faodaidh sin a bhith math. Bidh cuid de luchd-rannsachaidh a 'tòiseachadh le stòr dàta air-loidhne agus a' coimhead airson tachartasan air thuaiream san t-saoghal; bidh feadhainn eile a 'tòiseachadh air thuaiream air thuaiream san t-saoghal agus a' coimhead airson stòran dàta a tha a 'glacadh a bhuaidh.
Fòcas cuimseach | Stòr deuchainn deuchainn nàdarra | Daonnan-air stòr dàta | Iomradh |
---|---|---|---|
Buaidh cho-aoisean air toradh | Pròiseas Clàraidh | Dèan sgrùdadh air dàta | Mas and Moretti (2009) |
Cruthachadh càirdeas | Hurricanes | Phan and Airoldi (2015) | |
Leudachadh nam faireachdainnean | Uisge | Lorenzo Coviello et al. (2014) | |
Aistridhean eaconamach eadar luchd-fèise | Crith-thalmhainn | Dàta airgead siubhail | Blumenstock, Fafchamps, and Eagle (2011) |
Giùlan caitheamh pearsanta | 2013 dùnadh riaghaltas nan SA | Dàta ionmhas pearsanta | Baker and Yannelis (2015) |
Buaidh eaconamach siostaman recommender | Diofar | Dàta brabhsair aig Amazon | Sharma, Hofman, and Watts (2015) |
Buaidh cuideam air pàistean gun bhreith | 2006 cogadh Israel-Hezbollah | Clàran breith | Torche and Shwed (2015) |
Giùlan leughaidh air Wikipedia | Foillseachaidhean Snowden | Logaichean Uicipeid | Penney (2016) |
Buaidh cho-aoisean air eacarsaich | Aimsir | Luchd-rianachd fallaineachd | Aral and Nicolaides (2017) |
Anns an deasbad gu ruige seo mu dheuchainnean nàdarra, dh 'fhàg mi puing chudromach: faodaidh a bhith a' dol bho na nàdar a tha air a thoirt seachad do na tha thu ag iarraidh uaireannan a bhith gu math duilich. Leigamaid air ais gu eisimpleir dreach Bhietnam. Anns a 'chùis seo, bha ùidh aig Angrist ann a bhith a' toirt tuairmse air buaidh seirbheis armailteach air tuarastalan. Gu mì-fhortanach, cha deach seirbheis armailteach a thoirt seachad air thuaiream; an àite bha e ga dhreachadh agus chaidh a thoirt seachad air thuaiream. Ach, cha robh a h-uile duine a chaidh a dhreachadh (bha diofar shaorsa), agus cha robh a h-uile duine a bha an sàs ann an dreach (dh'fhaodadh daoine saor-thoileach seirbheis a dhèanamh). Leis gun deach an dreachd a thoirt seachad air thuaiream, faodaidh neach-rannsachaidh tuairmse a dhèanamh air a 'bhuaidh a bhios ga dhreachadh airson a h-uile duine san dreach. Ach cha robh Angrist ag iarraidh faighinn a-mach dè a 'bhuaidh a bha e air a dhreachadh; bha e airson faighinn a-mach dè a 'bhuaidh a bh' aig a bhith a 'frithealadh anns an arm. Gus an tuairmse seo a dhèanamh, ge-tà, feumar barailean agus duilgheadasan a bharrachd. An toiseach, feumaidh luchd-rannsachaidh a bhith den bheachd gur ann tro sheirbheis armailteach a tha an aon dhòigh air a bheilear a 'dreachdadh cosnadh buaidhichte, barail ris an canar cuingealachadh às - dùnadh . Dh'fhaodadh am barail seo a bhith ceàrr ma dh'fhàg fir, a chaidh an dreachadh, san sgoil na b 'fhaide gus nach biodh iad a' frithealadh no ma bha luchd-fastaidh cho buailteach daoine a bha air an dreachdadh fhastadh. San fharsaingeachd, tha an cuingealachadh às-dùnadh na bheachd riatanach, agus mar as trice tha e doirbh dearbhadh. Fiù ged a tha an cuingealachadh às-dùnadh ceart, tha e fhathast do-dhèanta tuairmse a dhèanamh air buaidh seirbheis air a h-uile duine. An àite sin, tha e a 'nochdadh nach urrainn do luchd-rannsachaidh ach am measadh a dhèanamh air fo-sheòrsa sònraichte de dhaoine ris an canar co-chòrdairean (fir a dhèanadh seirbheis nuair a chaidh an dreachadh, ach nach dèanadh iad seirbheis nuair nach deach an dreachadh) (Angrist, Imbens, and Rubin 1996) . Ach b 'e gearanan, ge-tà, a' chiad ùidh inntinneach a bh 'ann. Feuch gum bi na duilgheadasan sin ag èirigh eadhon ann an cùis an ìre mhath glan den dreach crannchuir. Thig seata eile de dhuilgheadasan nuair nach eil crannchur corporra a 'toirt seachad an leigheis. Mar eisimpleir, ann an sgrùdadh Mas and Moretti air luchd-giùlain, tha ceistean a bharrachd ag èirigh mun bheachd gu bheil tasgadh co-aoisean gu tur air thuaiream. Nam bhathar a 'briseadh gu làidir air a' bheachd seo, dh'fhaodadh e na tuairmsean aca a chlaonadh. Gu crìch, faodaidh deuchainnean nàdarra a bhith nan ro-innleachd chumhachdach airson tuairmsean adhbharach a dhèanamh bho dàta neo-dheuchainneach, agus tha tobraichean dàta mòr a 'meudachadh ar comas air buannachd fhaighinn air deuchainnean nàdarra nuair a bhios iad a' tachairt. Ach, ma dh'fhaoidte gu feumar cùram mòr - agus uaireannan deagh bheachd-sa - a dhol bho na nàdar a tha air a thoirt seachad don tuairmse gu bheil thu ag iarraidh.
Tha an dàrna ro-innleachd a bu toil leam innse dhut mu bhith a 'dèanamh tuairmsean adhbharach bho dàta neo-dheuchainneach an crochadh air atharrachadh staitistigeil dàta neo-dhearbhach ann an oidhirp gus cunntas a thoirt air eadar-dhealachaidhean preexisting eadar an fheadhainn a rinn agus nach d' fhuair an leigheas. Tha mòran mhodhan atharrachaidh mar sin, ach bidh mi a 'cuimseachadh air aon co-fhreagairt ris an canar. Ann a bhith a 'maidseadh, bidh an neach-rannsachaidh a' coimhead tro dàta neo-dhearbhach gus paidhrichean de dhaoine a tha coltach a dhèanamh ach a-mhàin gu bheil an neach air leigheas fhaighinn agus nach eil. Anns a 'phròiseas a bhith a' maidseadh, tha luchd-rannsachaidh cuideachd a ' slaodadh ; is e sin, a 'toirt às do chùisean far nach eil gèam follaiseach ann. Mar sin, bhiodh an dòigh seo air a dhèanamh nas mionaidiche air a bhith a 'maidseadh agus a' tilgeadh, ach cumaidh mi leis an abairt thraidiseanta: a 'maidseadh.
Tha aon eisimpleir de chumhachd ro-innleachdan co-ionnan le stòran dàta fìor-dheuchainneach a 'tighinn bho rannsachadh air giùlan luchd-cleachdaidh le Liran Einav agus co-obraichean (2015) . Bha ùidh aca ann an rocaidean a 'gabhail àite air eBay, agus ann a bhith a' toirt tuairisgeul air an obair, cuiridh mi cuideam air buaidh prìs a 'tòiseachadh ropa air builean rup, mar a' phrìs reic no coltas reic.
Is e an dòigh as grinne airson tuairmse a dhèanamh air buaidh prìs tòiseachaidh air prìs reic ach a bhith a 'cunntadh a' phrìs mu dheireadh airson rocaidean le diofar phrìsean tòiseachaidh. Bhiodh an dòigh-obrach seo math ma bha thu airson a 'phrìs reic a thoirt seachad a rèir a' phrìs tòiseachaidh. Ach ma tha do cheist mu bhuaidh a 'phrìs tòiseachaidh, cha obraich an dòigh-obrach seo seach nach eil e stèidhichte air coimeasan cothromach; dh'fhaodadh na rupan le prìsean tòiseachaidh nas ìsle a bhith gu math eadar-dhealaichte bhon fheadhainn le prìsean tòiseachaidh nas àirde (me, dh'fhaodadh gum bi iad airson diofar sheòrsaichean bathair no a bhith a 'gabhail a-steach diofar sheòrsaichean de luchd-reic).
Ma tha thu mar-thà mothachail air na duilgheadasan a dh 'fhaodadh èirigh nuair a bhios tu a' dèanamh tuairmsean adhbharach bho dàta neo-dheuchainneach, is dòcha gu bheil thu a 'sgioblachadh an dòigh-obrach maiseach agus beachdaich air a bhith a' ruith deuchainnean achaidhean far am biodh tu a 'reic rud sònraichte-can, club goilf seata de pharaimearan rup-can, saoran an-asgaidh agus rup fosgailte airson dà sheachdain - ach le prìsean tòiseachaidh air an sònrachadh. Le bhith a 'dèanamh coimeas eadar na builean mar thoradh air a' mhargaidh, bhiodh an deuchainn seo a 'tairgse tomhas fìor shoilleir de bhuaidh prìs tòiseachaidh air prìs reic. Ach cha bhiodh an tomhas seo a 'buntainn ri aon toradh sònraichte agus seata de pharaimearan rup. Faodaidh na toraidhean a bhith eadar-dhealaichte, mar eisimpleir, airson diofar sheòrsaichean de stuthan. Às aonais teòiridh làidir, tha e doirbh a thoirt às an aon dheuchainn seo gu raon iomlan de dheuchainnean a dh'fhaodadh a bhith air an ruith. A bharrachd, tha deuchainnean achaidhean gu math daor gum biodh e neo-chomasach a h-uile atharrachadh a dh 'fhaodadh tu fheuchainn.
An coimeas ris na modhan ceumnach agus deuchainneach, ghabh Einav agus co-oibrichean an treas dòigh-obrach: co-fhreagairt. Is e am prìomh chleas san ro-innleachd aca nithean a lorg coltach ri deuchainnean raoin a tha air tachairt mu thràth air eBay. Mar eisimpleir, tha figear 2.8 a 'sealltainn cuid de na 31 liostaichean airson an aon chluba goilf a tha dìreach - le dràibhear Taylormade Burner 09 a reic leis an aon neach-reic- "budgetgolfer." Ach, tha feartan beagan eadar-dhealaichte aig na 31 liosan seo, mar a bhith a' tòiseachadh eadar-dhealaichte prìs, cinn-latha crìochnachaidh agus cìsean luingeis. Ann am faclan eile, tha e mar gum biodh "budgetgolfer" a 'ruith dheuchainnean airson an luchd-rannsachaidh.
Tha na clàran seo de dhràibhear Burner Taylormade 09 a chaidh a reic le "budgetgolfer" mar aon eisimpleir de sheata chlàraichte, far a bheil an aon rud air a reic leis an aon neach-reic, ach gach uair le feartan beagan eadar-dhealaichte. Taobh a-staigh nan clàran mòra de eBay tha litearra na ceudan de mhìltean de sheataichean co-cheangailte ris a 'toirt a-steach milleanan de liostaichean. Mar sin, an àite a bhith a 'dèanamh coimeas eadar a' phrìs deireannach airson gach roinn le prìs tòiseachaidh sònraichte, bha Einav agus co-obraichean a 'dèanamh coimeas eadar seataichean matamataigeach. Gus toraidhean a thoirt còmhla bho na coimeasan taobh a-staigh nan ceudan de mhìltean de sheataichean co-ionann, chuir Einav agus co-obraichean air ais am prìs tòiseachaidh agus a 'phrìs deireannach a thaobh luach tagraidh gach nì (me, a' phrìs reic àbhaisteach aca). Mar eisimpleir, nam biodh luach-fiosrachaidh $ 100 (stèidhichte air a reic) aig an neach-giùlain aig Burner Taylormade Burner 09, bhiodh prìs tòiseachaidh de $ 10 air a chur an cèill mar 0.1 agus prìs deireannach de $ 120 mar 1.2.
Cuimhnich gu robh ùidh aig Einav agus co-obraichean ann a bhith a 'toirt buaidh air prìs tòiseachaidh air toraidhean rup. An toiseach, chleachd iad ath-thionndadh loidhneach gus tuairmse a dhèanamh gu bheil prìsean tòiseachaidh nas àirde a 'lùghdachadh coltasachd reic, agus gu bheil prìsean tòiseachaidh nas àirde a' meudachadh a 'phrìs reic mu dheireadh (a rèir a bhith a' reic reic). Leotha fhèin, tha na tuairmsean seo - a tha a 'toirt cunntas air dàimh loidhneil agus air an cuibheasachd thairis air a h-uile bathar - chan e sin a tha inntinneach. An uairsin, chleachd Einav agus co-obraichean meud mòr an dàta gus diofar tuairmsean nas sìmplidh a chruthachadh. Mar eisimpleir, le bhith a 'toirt tuairmse air a' bhuaidh a tha air leth airson caochladh phrìsean tòiseachaidh, lorg iad gu bheil an dàimh eadar prìs a 'phrìs agus a' phrìs reic neo-fhoirmeil (figear 2.9). Gu sònraichte, airson prìsean a thòiseachadh eadar 0.05 agus 0.85, chan eil mòran buaidh aig a 'phrìs tòiseachaidh air a' phrìs reic, lorg a chaidh a chall gu tur leis a 'chiad anailis aca. A bharrachd, seach a bhith a 'toirt seachad cuibheasachd thairis air a h-uile nì, thomhais Einav agus co-obraichean buaidh air prìs tòiseachaidh airson 23 diofar sheòrsachan de nithean (me, stuthan peataichean, stuth dealanach agus cuimhneachain spòrs) (figear 2.10). Tha na tuairmsean sin a 'sealltainn gu bheil buaidh nas lugha aig prìsean tòiseachaidh airson prìsean tòiseachaidh nas motha air mar a tha coltas reic agus buaidh nas motha air a' phrìs deireannach. A bharrachd, airson rudan nas iomlaideachadh-leithid DVDan-chan eil buaidh sam bith aig a 'phrìs tòiseachaidh air a' phrìs mu dheireadh. Ann am faclan eile, tha cuibheasachd a tha a 'tighinn còmhla ri toraidhean bho 23 diofar seòrsa de nithean a' falach eadar-dhealachaidhean cudromach eadar na rudan sin.
Fiù mura h-eil ùidh shònraichte agad ann an rocaidean air eBay, feumaidh tu a bhith mothachail air an dòigh anns a bheil àireamh 2.9 agus figear 2.10 a 'tairgse tuigse nas fheàrr air eBay na tuairmsean sìmplidh a tha a' toirt cunntas air dàimh shìnteil agus a 'cur còmhla diofar sheòrsachan de nithean. A bharrachd, ged a bhiodh e gu saidheansail comasach na tuairmsean nas sìmplidh seo a ghineadh le deuchainnean achaidh, bhiodh an cosgais a 'dèanamh deuchainnean mar sin deatamach.
Coltach ri deuchainnean nàdarra, tha grunn dhòighean ann gum faod maidseadh droch mheasaidhean a dhèanamh. Tha mi a 'smaoineachadh gur e an t-uallach as motha a thaobh tuairmsean co-ionnan gum faod iad a bhith air an cur an cèill le rudan nach deach an cleachdadh anns na co-fhreagairt. Mar eisimpleir, anns na prìomh thoraidhean aca, rinn Einav agus co-obraichean coimeas dìreach air ceithir comharran: àireamh ID an neach-reic, roinn cuspair, tiotal cuspair, agus fo-thiotalan. Nam biodh na nithean eadar-dhealaichte ann an dòighean nach robh air an cleachdadh airson maidseadh, dh'fhaodadh seo coimeas cothromach a chruthachadh. Mar eisimpleir, ma tha "budgetgolfer" prìsean ìosal airson dràibhear Taylormade Burner 09 sa gheamhradh (nuair nach eil clubaichean goilf cho measail), dh'fhaodadh e nochdadh gu bheil prìsean tòiseachaidh nas ìsle a 'leantainn gu prìsean deireannach nas ìsle, nuair a bhiodh seo na phàirt de atharrachadh ràitheil san iarrtas. Tha aon dòigh-obrach airson dèiligeadh ris a 'chùis seo a' feuchainn ri iomadh seòrsa maidsidh. Mar eisimpleir, dh'atharraich Einav agus co-obraichean air an anailis aca fhad 'sa bha an uinneag-ùine a bha air a chleachdadh airson co-fhreagairt (seataichean co-fhreagarrach a' gabhail a-steach nithean air an reic taobh a-staigh aon bhliadhna, taobh a-staigh aon mhìos, agus gu co-ionnan). Gu fortanach, lorg iad toraidhean co-ionann airson uinneagan fad na h-ùine. Tha dragh eile le co-fhreagairt a 'tighinn bho mhìneachadh. Tha tuairmsean bho mhaidseadh a-mhàin a 'buntainn ri dàta co-fhreagarrach; chan eil iad a 'buntainn ris na cùisean nach gabhadh a bhith air am maidseadh. Mar eisimpleir, le bhith a 'cuingealachadh an rannsachaidh gu nithean aig an robh iomadh liosta, tha Einav agus co-obraichean a' cur fòcas air luchd-reic proifeiseanta agus leth-proifeasanta. Mar sin, nuair a tha sinn a 'mìneachadh nan coimeasan sin feumaidh sinn cuimhneachadh nach eil iad a' buntainn ris an fho-sheòrsa seo de eBay.
Tha co-rèiteachadh na ro-innleachd chumhachdach airson coimeasan cothromach fhaighinn ann an dàta neo-dheuchainneach. Do mhòran de luchd-saidheans sòisealta, bidh co-fhreagairt a 'faireachdainn an dàrna rud as fheàrr air deuchainnean, ach tha sin na chreideas gum faod ath-sgrùdadh a dhèanamh, beagan. Dh'fhaodadh co-fhreagairt ann an dàta mòr a bhith nas fheàrr na àireamh bheag de dheuchainnean-raoin nuair a tha (1) iomadachd buaidhean cudromach agus (2) tha na caochlaidhean cudromach a dhìth airson co-ionnanachd air an tomhas. Tha Clàr 2.4 a 'toirt seachad eisimpleirean eile de mar as urrainnear maids a chleachdadh le stòran dàta mòra.
Fòcas cuimseach | Tobar dàta mòr | Iomradh |
---|---|---|
Buaidh nan oighreachdan-seilg air fòirneart nam poileas | Clàran stad-agus-frisk | Legewie (2016) |
Buaidh 11 Sultain, 2001 air teaghlaichean agus nàbaidhean | Clàran bhòtaidh agus clàran tabhartais | Hersh (2013) |
Tubaist shòisealta | Dàta conaltraidh agus uchd-mhacachd toraidh | Aral, Muchnik, and Sundararajan (2009) |
Ann an co-dhùnadh, tha e duilich a bhith a 'toirt tuairmse air buaidh adhbharan bho dàta neo-dhearbhaidh, ach faodar dòighean-obrach leithid deuchainnean nàdarra agus atharrachaidhean staitistigeil (me, maidseadh) a chleachdadh. Ann an cuid de shuidheachaidhean, faodaidh na dòighean-obrach sin a dhol gu math ceàrr, ach nuair a thèid an cleachdadh gu faiceallach, faodaidh na dòighean-obrach seo a bhith feumail a rèir an dòigh-obrach dheuchainneach a tha mi a 'toirt cunntas ann an caibideil 4. A bharrachd, tha an dà dhòigh-obrach seo gu h-àraidh buailteach buannachd fhaighinn bho fhàs an- air, siostaman dàta mòr.