Yek ji çavdêriya ku di vê beşê de ne nîografî ye. Ji bo bêtir etnografî di nav deverên dîjîtal de, Boellstorff et al. (2012) , û ji bo bêtir etnografiyê di cîhên dîjîtal û fîzîkî de hevbeş, Lane (2016) .
Li gorî danûstandinan de tenê "daneyên mezin," lê gelek têgezên xuya dike ku "3 Vs" li ser hûrgelan, cûda, cûda û velocity (nimûne, Japec et al. (2015) ) ye. See De Mauro et al. (2015) ji bo lêkolînek nirxandinan.
Dema tevlêbûna hikûmetên îdarî yên di kategoriyê de daneyên mezin ên Legewie (2015) e, her çend kesên din jî ev mijar kirine, including Legewie (2015) , Connelly et al. (2016) , û Einav and Levin (2014) . Ji bo bêtir nirxên daneyên îdarî yên îdarî yên lêkolînê, Card et al. (2010) , Adminstrative Data Taskforce (2012) , û Grusky, Smeeding, and Snipp (2015) .
Ji bo dîtina pergala îdarî di hundurê sîstema statîstîkê de, bi taybetî li Dewleta Giştî ya Dewleta Yekbûyî, li Jarmin and O'Hara (2016) . Ji bo tedawiya pirtûka pirtûka lêkolîna îdarî ya li Stenbolê, li Wallgren and Wallgren (2007) .
Di beşa de, min bi kurtahî lêkolînek kevneşopî wek mînak wekî Çavkanîya Civakî (GSS) bi çavkaniyên daneyên medyayê yên civakî yên wekî Twitter. Ji bo danûstendineke berbiçav û bala hişmendiya navnîşên medyayê û medyayê yên civakî yên sosyalîst, li Schober et al. (2016) .
Ev 10 taybetmendiyên daneyên mezin ên di gelek awayên cuda de ji hêla nivîskarên cuda cuda têne gotin. Daxuyaniya ku li ser van pirsan de bandora xwe bandora Lazer et al. (2009) , Groves (2011) , Howison, Wiggins, and Crowston (2011) , boyd and Crawford (2012) , SJ Taylor (2013) , Mayer-Schönberger and Cukier (2013) , Golder and Macy (2014) , Ruths and Pfeffer (2014) , Tufekci (2014) , Sampson and Small (2015) , K. Lewis (2015b) , Lazer (2015) , Horton and Tambe (2015) , Japec et al. (2015) û Goldstone and Lupyan (2016) .
Di vê beşê de, min travên dîjîtal ên ku ez difikire ku bêhtir neutral e. Wek demên din ên ji bo nîşanên dîjîtal ên dîplomatîk ên dîplomatîk (Golder and Macy 2014) , lê wekî Hal Abelson, Ken Ledeen, û Harry Lewis (2008) dibêjin, meriv mimkûnek bêtir dibe ku tilên dîjîtal e . Dema ku hûn pîşeyên xwe çêbikin, hûn dizanin ka çi tiştê çêbûye û pêsîrên we yên ku bi gelemperî bi we re bi xwe re nayê dîtin. Di heman demê de ji bo nîşanên dîjîtal e. Di rastiyê de, hûn hemî demên ku dizanin ku hûn zanebûnek kêmtir in. Û, tevî ev nîşanên ku hûn li ser navê te nîne, ew gelek caran dikarin ji we re ve girêdayî bibin. Bi awayekî din, ew bêtir mîna êşên nîşanî hene: nebaş û kesane nasnameyê.
Ji bo bêhtir çima datasetên tecrûbeyên tecrûbeyên zehmet ên danûstendinê yên nirxandin nîşan dide, M. Lin, Lucas, and Shmueli (2013) û McFarland and McFarland (2015) . Divê ev pirsgirêkan divê lêkolînerên ku ji hêla giringiya statîstîkan re girîngiya girîng a pratîkî pratîk dikin.
Ji bo bêtir li ser çawa çawa Raj Chetty û hevalên xwe digihêjin qeydên bacê, Mervis (2014) .
Datasetên mezin dikarin jî pirsgirêkên teknîkî yên ku bi gelemperî ji derveyî komputerên yekbûyî têne afirandin. Ji ber vê yekê, lêkolînvanan li ser datasetên mezin li ser gelek komputer, pêvajoyek carinan carinan hinek bernameyên parallel tê gotin belav kirin . Ji bo destpêkirina bernameya parallel, bi taybetî bi zimanê Hadoop dibêjin, Vo and Silvia (2016) .
Dema ku her dem di demjimêr de bisekinin, girîng e ku hûn bisekinin ku hûn di heman demê de heman hevdema hevsengî bikin an jî hûn çiqas hin guhertinên gelê mirovan digire; Wek mînak, Diaz et al. (2016) .
Pirtûka klîmîkî li ser gavên nerektîf e Webb et al. (1966) . Di vê pirtûka ku di vê pirtûkê de temenê dîjîtal dibe, lê ew hîn jî ronahî dikin. Ji bo nimûneyên mirovan ji ber ku ji ber çavdêriya komkujiyê veguherînin, Penney (2016) û Brayne (2014) .
Reactasyona nêzîk ve girêdayî ye ku çi lêkolînvanan bandora bandorên daxwaz dikin (Orne 1962; Zizzo 2010) û bandora Hawthorne (Adair 1984; Levitt and List 2011) .
Ji bo bêtir girêdana reklama, Fellegi and Sunter (1969) Dunn (1946) û Fellegi and Sunter (1969) (dîrokî) û Larsen and Winkler (2014) (modern). Di heman demê de rêbazên di zanistî de di navên zanistî de wekî navên datikasyon, nimûne nasnameya nasnameyê, navnîşê navnîş, dagirkirina dîktatoriyê, û qeydkirina qeydkirina dubare (Elmagarmid, Ipeirotis, and Verykios 2007) . Li ser pêwendiyên taybetmendiyê-rêyên parastinê hene ku ji bo pêwendiya reklamî ya ku ji bo agahdariya danûstendina kesane ya kesane (Schnell 2013) hewce ne. Facebook jî jî pêvajoya pêşveçûnek çêkiriye ku ji bo reklamên xwe yên dengdanê re girêdan bikin; ev hate kirin ku ezmûna ku hûn di çarçoveya 4 (Bond et al. 2012; Jones et al. 2013) ji we re dibêjim.
Ji bo bêtir li ser avakirina rastdariyê, beşa 3 ya Shadish, Cook, and Campbell (2001) .
Ji bo bêtir li ser lêgerîna AOL lêgerîn, Ohm (2010) . Ez şêwirdariyê ji bo ku ez ezmûnên şîrove bikim bi çarçoveya 4 û beşan de bi hevpeymanan re hevdîtinê pêşkêş dikin. Gelek nivîskaran li ser lêkolînan da ku daneyên dakêşkirî ne girêdayî ye, Huberman (2012) û boyd and Crawford (2012) .
One bi awayekî baş ji bo lêkolînerên zanîngehê bo bidestxistina access welat e ji bo xebatê li şîrketek wekî intern an serdana lêkolînerê. Li gel ne bitenê gihîştina welat, ev pêvajoya jî, lêkolînerekî hîn zêdetir li ser bê çawa welat, tên kirin ku ji bo analîzên girîng e ku alîkariyê bikin.
Di çarçoveya danûstandinên hikûmeta hikûmetê de, Mervis (2014) gotûbêj dike ka çiqas Raj Chett û hevalên xwe digel qeydên bacê yên di lêkolînê de li ser tevgerên civakî de têne bikaranîn.
Ji bo ku di dîrokê de " Kruskal and Mosteller (1979a) ", têgihîştin, wekî Kruskal and Mosteller (1979a) , Kruskal and Mosteller (1979b) , Kruskal and Mosteller (1979c) , û Kruskal and Mosteller (1980) .
Hevpeymanên Karê Karê Snow û karê Dîra û Çolê kurt bû. Ji bo bêtir li ser karê Snow, li Freedman (1991) . Ji bo bêtir li ser Doktorên Brîtanî Lêkolîn dibînin Doll et al. (2004) û Keating (2014) .
Gelek lêkolîner dê ji bo ku fêr bibin ku tevlihev dikin ku çiqas û Hîl ji doktorên jinan û ji doktorên 35 salî ve hatine danîn, wan bi zanebûn di vê yekê de di analîza yekem de bikar tînin. Wekî ku ew got: "Ji ber ku ji kansera lungê di nav jinan û mêran de 35 salî de kêm e, pir kesan kêrhatî ne ku di van çend salan de di van koman de bêne qebûl kirin. Di rapora destpêkê de em ji ber ku 35 salî û Rothman, Gallacher, and Hatch (2013) merivên jinên ku ji mirovan re ve girêdayî bûne. " Rothman, Gallacher, and Hatch (2013) , ku sernavê provokrasî heye" Çima nûneratiya berbiçav be avêtin " zanebûn daneyên daneyên neprespresative.
Nerastentativeness-ê ji bo lêkolînerên û hikûmetên ku dixwazin li ser xelkê tevahiya nifş bikin, pirsgirêkek mezin e. Ev kêmtir ji bo şîrketên kêm e, ku bi gelemperî li ser bikarhênerên wan balkêş e. Ji bo bêtir li ser çiqas Sîstema Holandeyê pirsgirêka nebatîbûnê ya karûbarên mezin ên karsaziyê dibîne, bibînin Buelens et al. (2014) .
Ji bo nimûneyên lêkolînerên ku li ser çavkaniyên K. Lewis (2015b) yên çavkaniya daneyên mezin ên mezin, dibînin boyd and Crawford (2012) , K. Lewis (2015b) , û Hargittai (2015) .
Ji bo armancên berfireh ên armancên civakî yên lêkolînan û lêkolînek epidemolojîkî, li Keiding and Louis (2016) .
Ji bo bêhtir hewldanên ku Twitter bikar bînin ku ji bo dengdêrên derveyî nermalavên ji bo dengdêr, bi taybetî di mijara 2009'an de Almanya de, ji bo Jungherr (2013) û Jungherr (2015) . Li pey karê Tumasjan et al. (2010) lêkolînerên li seranserê cîhanê bi rêbazên fikrên bikar anîn-wekî wekî bikaranîna analîzasyona hestiyariyê di navbera nîqaşên erênî û neyînî yên cuda de-da ku ji bo hêza daneyên Twitter-ê cûda cûreyên cûda yên hilbijartinên (Gayo-Avello 2013; Jungherr 2015, chap. 7.) . Li vir çawa Huberty (2015) encamên van hewldanên ku hilbijartinên pêşniyarkirî kurt kirin:
"Hemû rêbazên pêşniyazên ku li ser medyaya civakî yên sosyal ve têne nas kirin, dema ku daxwazên rastiya pêşniyazên hilbijartinê yên pêşerojî rasteqîn nekir. Ev têkçûnên ku ji ber taybetmendiyên sereke yên medyayê yên civakî, bêtir ji zehmolojîk an astorîtmîk têne dîtin. Di demeke kurt de, çapemeniya sosyalî ne, û dibe ku tu carî nabe, pêşveçûna bêdengî, nebaş, nûnerê ya hilbijêre; û pêdiviyên hêsan ên medyayê yên danûstendiyên civakî hene ku ji van pirsgirêkan re peyda bikin. "
Di beşa 3 de, ez ê binivîse û nimûne û dahatim di kitêbê pirfireh bikim. Heke hejmara danûstendinê ne, hinek rewşên ku di bin hinek rewşan de, ew dikarin ji bo texmînên baş çêbikin.
Pergala pergala gelekî dijwar e ku ji derveyê bibînin. Lêbelê, projeya MovieLens (di bêtir di beşa 4ê de) behsa 15 salan ji hêla komîteya lêkolînê ya akademîk ve tê veşartin. Ji ber vê yekê, ew bikaribin danûstendin û agahdariya rêvebirin ku pergala wextê xwe di dema we de û çawa dibe ku ev bandorek bandora (Harper and Konstan 2015) .
Gelek zanyar li Twitter-ê li ser pevçûnek berbiçav: Liu, Kliman-Silver, and Mislove (2014) û Tufekci (2014) .
Wê nêzîkek ku ji bo niştecîhkirina niştecîh e, ew e ku panelek bikarhêneran ava bikin, ku lêkolînvanan dide ku di heman demê de heman kesan bixwînin, Diaz et al. (2016) .
Min yekem peyva "algorîtmîkî tengahî" tête ku ji hêla Jon Kleinberg ve tê axaftin hatiye bikaranîn, lê mixabin ez di bîra min de neyê bîra min an ku tê de gotûbêjê hatibû bîra min. Yekem cara ku min dîtiye di dema nivîsê de Anderson et al. (2015) , ku nîqaşek balkêş e ku çiqas algorîtmên têne bikaranîn ji hêla malperên dostan ve dibe dibe ku dibe ku bi karanîna van malperên daneyên daneyên daneyên bikar bînin ji bo pêşbaziyên civakî bikin. Ev xemgîniya bersiva bersivên Anderson et al. (2014) K. Lewis (2015a) Anderson et al. (2014) .
Ji bilî Facebook-ê, Twitter jî ji bo bikarhênerên ku li ser fikra girtina sêyemîn a li gor rêbikin pêşnîyar dikin pêşniyar dike; Su, Sharma, and Goel (2016) . Lewra asta sêyemîn ya sêyemîn a sêyozîtmîk e ku ji bo girtina sêyemîn ya sêyemîn a sêwirdarî ye.
Ji bo bêtir çalakiyê-bi taybetî bi fikrên ku zanistên sosyal ên sosyalî "pîşesazî nîne" ne. (Ewan, ew tenê ji wan re şirove dinyayê), -Me Mackenzie (2008) .
Ajansên îstatîstîkî yên rêveberî welat paqijkirina editing daneyên îstatîstîkî re dibêjin. De Waal, Puts, and Daas (2014) teknolojiyên guhertina daneyên statîstîkî ji bo daneyên lêkolînê ve hatine pêşniyar kirin û dahatin ku heya ku ew li ser çavkaniyên daneyên mezin ên mezin têne kirin, û Puts, Daas, and Waal (2015) ji bo hin fikrên heman pêşniyarên gelemperî.
Ji bo blovên blovên civakî yên civakî, Ferrara et al. (2016) . Ji bo hin mînakên lêkolînên li ser li ser Twitter-ê sparkirin, li Clark et al. (2016) û Chu et al. (2012) . Di dawiyê de, Subrahmanian et al. (2016) encamên encamên DARPA-Twitter-Bot-a-a-a-a-a-a-hevkariya komkujî ya ku ji bo nêzî Twitter-ê li ser botanên peyda dikeve hevberî dike.
Ohm (2015) lêkolînek pêşî li ser fikrên agahdariyên hestiyar û pêşniyarên testê pir faktor dike. Her çar faktorên ku ew pêşniyaz dikin, heqê zirarê, hebe, zehfê, hebûna pêwendiya nepenî, û an jî rîsk xemgîniya pirfirehî nîşan dide.
Di lêkolîna Farqîn de li New York di taxa berê de ji aliyê Camerer et al. (1997) ku sê nimûneyên hêsanî yên çarçoveya rêwîteyên kaxezan tê bikaranîn. Ev lêkolînek pêşî dît ku rêbazên ku bi karanîna armancên hedef digerin: Wan li rojên ku derê bilind bûne wan kêmtir kirin.
Di xebata paşê de, King û hevalên xwe li Sensorshipê li Çîn (King, Pan, and Roberts 2014, [@king_how_2016] ) . Ji bo nêzîkbûna pêwendiyek peywendîdar li Çînê li Bamman, O'Connor, and Smith (2012) . Ji bo bêtir li ser rêbazên statîstîk ên mîna ku di King, Pan, and Roberts (2013) texmîn kirin ku hestek 11 mîlyonan texmîn dikin, bibîne Hopkins and King (2010) . Ji bo bêtir fêrbûna çavdêriya çavdêrî, James et al. (2013) (teknîkî kêmtir) û Hastie, Tibshirani, and Friedman (2009) (teknîkî bêtir).
Kapîtalîzmê pir beşek zanistiya zanistî ya pîşesazî (Mayer-Schönberger and Cukier 2013; Provost and Fawcett 2013) . Yek cûreyeke pêşniyazkirinê ku bi gelemperî lêkolînerên sosyalê têne pêşniyarkirin e ku pêşniyarên demografîk e; Wek mînak, Raftery et al. (2012) .
Google Flu Trends ne projeya yekemîn bû ku ji bo daneyên lêgerîna lêgerîn bikar bînin ku li ser belavkirina enfluensza nû dike. Bi rastî, lêkolînerên li Dewletên Yekgirtî (Polgreen et al. 2008; Ginsberg et al. 2009) û Swêd (Hulth, Rydevik, and Linde 2009) dît ku hin mercên lêgerînê (mînak, "flu") pêşniyazkirina tendurustiya giştî ya neteweyî ya pêşniyar dike Daneyên berî berdan hat berdan. Piştre gelek, gelek projeyên din hewl da ku daneyên daneyên dîplomatîk yên ji bo kontrolkirina nexweşî ya derman bikar bînin; Althouse et al. (2015) ji bo lêkolînek.
Ji bilî daneyên danûstandinên dîjîtal ku ji bo encamên tenduristiyê pêşniyaz dikin, hejmareke karûbarên Twitter-ê ji bo encamên hilbijartinê pêşveçûnek heye. ji bo lêkolînên Gayo-Avello (2011) , Gayo-Avello (2013) , Jungherr (2015) (beşa 7), û Huberty (2015) . Nîşanekirina aboriya ekonomîk, wekî ku hilberîna navmaliya navxweyî (GDP), di navendî de navendî de hevpar e, bibînin Bańbura et al. (2013) . Table di nav deverên çend lêkolînan de hene ku hin hûrgelên dîjîtal bikar bînin ku ji bo cîhanê hin cûda bûyerê dikin.
Tracek digital | Netîce | Gazîname |
---|---|---|
Daxistina kaxizê ya fîlmên li Amerîka | Asur and Huberman (2010) | |
Têketin lêgerîn | Sales of movies, music, books and video games in US | Goel et al. (2010) |
Dow Jones Navneteweyî ya Navdar (bazara bazarê ya amerîkî) | Bollen, Mao, and Zeng (2011) | |
Medya civakî û lêgerînên lêgerîn | Çavdêrên bazarê û bazarên firotanê yên li Dewletên Yekgirtî, Yekbûyî, Kanada, û Çînê li Amerîka | Mao et al. (2015) |
Têketin lêgerîn | Pirrjimara Dengue Fever li Singapore û Bangkok | Althouse, Ng, and Cummings (2011) |
Di dawiyê de, Jon Kleinberg û hevalbendan (2015) diyar kir ku pirsgirêkên pêşniyarkirin di du kategoriyan de, di nav deverên cûda de têne derxistin û zanistên civakî yên ku li ser bisekinin û hinek din bifikirin. Dibe ku polîtîkkerek yek ji bifikirînin, ez ê Anna, yê ku hişyariyek bikişîne û biryar e ku biryarê bikim ka kirina barê dansê bikin ku derfeta baranê zêde bike. Siyasetek din, ez ê ji Betty re dibêjim, ka biryarê bikim ka karûbar bikî ku li ser rêya riya germ bibin. Her du Anna û Betty dikare dema ku ew fêm dikin, biryar dikare çêtir dibe, lê ew hewce ne ku ew tişt tiştên cuda bizanibin. Anna hewce dike ku bizanibin ka dansê baran barê baranê dibe. Betty, ji aliyekî ve, hewce ne hewceyê ku tiştek der barê causatîfê fêm bikin; Ew tenê pêşniyazek rastîn hewce dike. Lêkolînerên Sosyalî pir caran li ser pirsgirêkên wekî Anna-ku ji Kleinberg û hevalên xwe re pirsgirêkên polîtîk-ên "baran-tarî-like" re dibêjin, pirsgirêkên lihevhatî hene. Pirsên mîna mîna Betty-kîjan Kleinberg û hevalkarên pirsgirêkên polîtîkayên "pembre-like" re dibêjin-pir girîng e, lê ji hêla lêkolînerên sosyalîst ve kêmtir qebûl kir.
Çapemeniya PS Siyasetmedar PS ya sempozyûmê li ser daneyên mezin, sedemên sedem, û helwesta fermî bû, û Clark and Golder (2015) her beşdarî kurt bikin. Çalakiyên rojnamegeriya Akademiya Niştimanî ya Dewletên Yekbûyî yên Amerîka li ser dagirkeriyê û daneyên mezin, û Shiffrin (2016) ku her beşdarî kurt dike. Ji bo rêbazên fêrbûna makîneyê ku hewce dike ku ezmûnên xwezayî yên xwezayî yên di çavkaniyên daneyên daneyên mezin de, lêgerîna Jensen et al. (2008) , Sharma, Hofman, and Watts (2015) û Sharma, Hofman, and Watts (2016) .
Di warên ezmûnên xwezayî de, Dunning (2012) bi gelek mînakan re tedawiya pirtûka pirtirkêmtir pêşkêş dike. Ji bo dîtina Rosenzweig and Wolpin (2000) xwezayî ya sirûştî, Rosenzweig and Wolpin (2000) (aborî) yan Sekhon and Titiunik (2012) (zanistiya siyasî) bibînin. Deaton (2010) û Heckman and Urzúa (2010) dibêjin ku tecrûbeyên xwezayî yên xwezayî yên li ser dravan dikarin pêşniyar dikin ku lêkolînerên ku li ser bandorên diyarkirî yên berbiçav nimûne nirxandin; Imbens (2010) van Imbens (2010) dide ku nêrînên xwezayî yên xwezayî yên hêja yên xwezayî.
Dema ku tête diyar kirin ku lêkolîner dikare ji hêla bandorkirina amadekirina bandorê ya xizmetê hebê, ez teknolojî hate gotin ku guherînên guherîner . Imbens and Rubin (2015) , di beşan 23 û 24-ê de, destnîşan bikin û destnîşankirina lazyeyê wekî mînakek. Bandora xizmeta leşkerî li ser sozdaran carinan carinan carî bandora tesîrê ya sedem (CAcE) û carinan carinan bandora navxweyî ya navxweyî ya navîn (LATE) tê gotin. Sovey and Green (2011) , Angrist and Krueger (2001) , û Bollen (2012) bo lêkolînên Sovey and Green (2011) ên di zanistî, aborî û civaknasî de, û Sovey and Green (2011) ji bo "xwendekarek xwendevan" lêkolînên lêkolînê bi karanîna guherînerên instrument.
Ew xuya kir ku lîteya pêşangeha sala 1970 ne bû, bi rastî jî bi awayekî nermalekirî; Ji devêtiyên piçûk ji neheqiya paqij bûn (Fienberg 1971) . Berinsky and Chatfield (2015) dibêje dibêjin ku vakslêdana biçûk pir girîng girîng e û girîngiya nîqaşkirina nirxandinên rastîn pêk tê.
Di çarçoveyên hevdîtinê de, See Stuart (2010) ji bo lêkolînek hêviya hêvîbûnê, û Sekhon (2009) ji bo lêkolîna pessimîst. Ji bo bêtir lihevhatinê wekî mûzek mûçik, Ho et al. (2007) See Ho et al. (2007) . Ji bo her kesek pir caran dijwar e ku mêrkek yekkemek yekgirtî ye, û ew çend hejmarek pisporan tête. Yekem, gava ku mûzeyên rastîn ne hene, lêkolîner divê hewce bikin ku çawa dûr heya du yekîneyên hedef bike û heke dûr dorînek nêzîkî xwe nêzîk e. Dema ku pisporek duyem dixwaze lêkolîner dixwazin ku her meseleyê ji bo her tiştî di koma dermankirinê de bikar bînin, ji ber ku ev dikare dibe texmînên bêtir rastîn. Her van pirsgirêkan û herweha din, di beşa 18ê Imbens and Rubin (2015) tête diyar kirin. Duyemîn II ( ??? ) .
Ji bo mînaka Dehejia and Wahba (1999) , ku rêbazên maqûl bi karanîna nimûneyên wan ji wan re ji wan re tecrûbeyên kontrolkirî yên bêkêmasî yên bêkêmasî. Lê, ji bo mînakên ku li ser rêbazên maqûl ve berbiçav a berbiçav re veguhestin Arceneaux, Gerber, and Green (2006) û Arceneaux, Gerber, and Green (2010) .
Rosenbaum (2015) û Hernán and Robins (2016) ji bo çavkaniya danûstandinên karanîna di çavkaniya daneyên mezin de pêşkêş dikin.