2.3.1.1 Big

Datasets tetele o se auala i se iuga; latou e le o se faaiuga ia i latou lava.

O le muamua o le uiga lelei e tolu o le faamatalaga tele ua sili ona talanoaina: o nei faamatalaga tele. O nei faamatalaga o punaoa e mafai ona tele i ni auala eseese se tolu: toatele o tagata, le tele o faamatalaga i le tagata, po o le tele o iloiloga i luga o taimi. O le a dataset tele e mafai ai nisi ituaiga patino o suesuega-fuaina heterogeneity, suesue mea na tutupu e le masani, le sailia o eseesega laiti, ma le faia o tala faatatau o tupe causal mai faamatalaga observational. E foi e foliga mai e oo atu ai i se ituaiga o sloppiness patino.

O le mea muamua lea e tele o aemaise aoga ua agai i tua atu o averesi e faia faatatauina o tupe mo subgroups patino. Mo se faataitaiga, Gary King, Jennifer Pan, ma Roberts Molly (2013) fuaina ai le avanoa o le a censored pou o faasalalauga faaagafesootai i Saina e le Malo. E ala lava lenei avanoa averesi o le aveesea o le fesoasoani tele mo le malamalama pe aisea censors le malo nisi pou ae le isi. Peitai, ona oo latou dataset aofia 11 miliona pou, fua mai foi le Tupu ma paaga faatatauina o tupe mo le avanoa o faʻasenesoga mo pou i 85 vaega eseese (eg, ponokalafi, Tibet, ma Tetele i Beijing). O le faatusatusaina o le avanoa o faʻasenesoga mo pou i vaega eseese, sa mafai ona latou malamalama atili e uiga i le auala ma le mafuaaga e le malo censors nisi ituaiga o pou. Faatasi ai ma le 11 afe pou (nai lo le 11 miliona pou), latou te le ua mafai ona maua nei vaega maoti o tala faatatau o tupe.

Lona lua, o aemaise aoga tele mo le ua le suesueina o mea na tutupu uiga ese. Mo se faataitaiga, Goel ma paaga (2015) manao o ia e suesue i auala eseese e tweets mafai ona alu viral. Ona cascades tele o le toe tweets e matua le masani-e uiga i se tasi i se 3,000-latou te manaomia e suesue sili atu nai lo a piliona tweets ina ia maua lava cascades tele mo a latou iloiloga.

Lona tolu, datasets tele e mafai ai ona suesue e iloa eseesega laiti. O le mea moni, o le tele o le taulai atu i le faamatalaga tele i alamanuia e uiga i nei eseesega laiti: faalagolago iloa ai le eseesega i le va o le 1% ma le 1.1% kiliki-e ala i fua faatatau o totogi i luga o se faasalalauga e mafai ona faaliliu i le miliona tala i tupe maua faaopoopo. I nisi o tulaga faasaienisi, e pei eseesega laiti atonu e faapitoa le taua (e tusa lava pe oi latou o ni fua i faamaumauga faafuainumera taua). Peitai, i nisi tulaga o faiga faavae, e pei eseesega laiti e mafai ona avea taua pe manatu i tuufaatasia. Mo se faataitaiga, pe afai e lua o aafiaga o le soifua maloloina o tagata lautele ma o se tasi ua teisi sili atu ona lelei nai lo le isi, ona fesuiaʻi i le fesoasoaniga sili atu ona lelei e mafai ona iu faaola le faitau afe o olaga faaopoopo.

Mulimuli ane, na matua faateleina tele seti faamatalaga lo tatou tomai e faia faatatau causal mai faamatalaga observational. E ui lava e le suia le mea moni datasets tele le faafitauli i le faia o faaiuga causal mai faamatalaga observational, tutusa ma suesuega-lua faalenatura auala e atiina ae suʻesuʻe mo le faia o talosaga causal mai observational faamatalaga-e le gata manuia tele mai datasets tele. O le a ou faamatala ma faailoa lenei talosaga auiliili sili mulimuli ane i lenei mataupu ina ua ou faamatala fuafuaga suesuega.

E ui lava bigness e masani o se meatotino e lelei pe a faaaogaina saʻo, ua ou matauina bigness masani ona taitai atu ai i se mea sese conceptual. Mo nisi mafuaaga, e foliga mai bigness e taitai suesue e le amanaiaina le auala na faatupulaia latou faamatalaga. A bigness e faaitiitia le manaomia o le popole e uiga i mea sese soo, e faateleina moni lava le manaomia o le popole e uiga i mea sese faiga, o le ituaiga o mea sese o le a ou faamatala i le sili atu o loo i lalo e tulai mai mai le faaituau i le auala ua foafoaina faamatalaga ma aoina. I se dataset laiti, e mafai ona taua uma e lua mea sese soo ma le mea sese faiga, ae i se mea sese soo dataset tele ua mafai ona e tusa ma ese ma le mea sese faiga dominates. Suesue oe na te le manatu e uiga i le a iu sese faiga e faaaoga ai lo latou datasets tele e maua ai se faatatauga tonu o le mea sese; o le a tonu lava le saʻo (McFarland and McFarland 2015) .