Andmetüübid statistikas - nominaal-, järjestus-, intervalli- ja suhteandmete tüübid, mida on selgitatud näidetega

Kui õpite statistikaeksamiks ja peate oma andmetüübid üle vaatama, annab see artikkel teile lühikese ülevaate koos lihtsate näidetega.

Sest olgem ausad: paljud inimesed ei uuri andmetüüpe naljalt või oma igapäevaelus.

Nii et sukeldume sisse.

Kvantitatiivsed vs kvalitatiivsed andmed - mis vahe on?

Lühidalt: kvantitatiivne tähendab, et saate selle üles lugeda ja see on arvuline (mõelge kogus - midagi, mida saate lugeda). Kvalitatiivne tähendab, et te ei saa, ja see pole arvuline (mõtle kvaliteedile - pigem kategoorilised andmed).

Boom! Lihtne, eks?

Enne tegelike andmetüüpide juurde liikumist peaksime veel ühe vahet tegema ja see on seotud kvantitatiivsete (arvude) andmetega: diskreetsed ja pidevad andmed.

Diskreetsed andmed hõlmavad täisarvusid (täisarvud - näiteks 1, 356 või 9), mida ei saa jagada nende olemuse põhjal.

Nagu inimeste arv klassis, sõrmede arv teie kätes või kellelgi on lapsi. Peres ei saa olla 1,9 last (hoolimata sellest, mida rahvaloendus võib öelda).

Pidevad andmed seevastu on vastupidised. Seda saab jagada nii palju kui soovite ja mõõta mitme kümnendkohani.

Nagu auto kaal (saab arvutada mitme kümnendkohani), temperatuur (32,543 kraadi jne) või lennuki kiirus.

Nüüd lõbusast kraamist.

Kvalitatiivsed andmetüübid

Nominaalsed andmed

Nominaalset teavet kasutatakse muutujate märgistamiseks ilma kvantitatiivse väärtuseta. Levinumate näidete hulka kuuluvad mees / naine (ehkki mõnevõrra vananenud), juuste värv, rahvused, inimeste nimed jne.

Selges inglise keeles: põhimõtteliselt on need sildid (ja nominaalne tuleneb nimest, mis aitab teil meelde jätta). Teil on pruunid juuksed (või pruunid silmad) . Sa oled ameeriklane . Teie nimi on Jane .

Näited:

Mis värvi juuksed teil on?

  • Pruun
  • Blond
  • Must
  • Vikerkaar ükssarvik

Mis su rahvus on?

  • Ameeriklane
  • Saksa keel
  • Keenialane
  • Jaapani keel

Pange tähele, et need muutujad ei kattu. Statistika mõttes ei saa nagunii olla nii pruuni kui vikerkaarega ükssarvikuvärvi juukseid. Ja need on tegelikult seotud ainult selle põhikategooria järgi, millesse nad kuuluvad.

Järjestusandmed

Järjestusandmetega võti on meeles pidada, et järjestus kõlab nagu järjekord - ja oluline on muutujate järjekord. Mitte niivõrd erinevused nende väärtuste vahel.

Tavalisi skaalasid kasutatakse sageli rahulolu, õnne jne mõõtmiseks. Kas olete kunagi osalenud sellises uuringus?

"Kui tõenäoliselt soovitate meie teenuseid oma sõpradele?"

  • Väga tõenäoline
  • Tõenäoliselt
  • Neutraalne
  • Ebatõenäoline
  • Väga ebatõenäoline

Vaadake, me ei tea tegelikult, mis vahe on väga ebatõenäolisel ja ebatõenäolisel - või kui see on sama suur tõenäosus (või ebatõenäolisus) kui tõenäoline ja väga tõenäoline. Aga see on ok. Me lihtsalt teame, et tõenäoline on rohkem kui neutraalne ja ebatõenäoline on rohkem kui väga ebatõenäoline. Kõik on järjekorras.

Kvantitatiivsed andmetüübid

Intervalliandmed

Intervalliandmed on lõbusad (ja kasulikud), kuna need puudutavad nii muutujate järjestust kui ka erinevust. See võimaldab mõõta standardhälvet ja tsentraalset kalduvust.

Kõigi lemmiknäide intervalliandmetest on temperatuurid Celsiuse kraadides. 20 kraadi C on soojem kui 10 ning vahe 20 ja 10 kraadi vahel on 10 kraadi. 10 ja 0 vahe on samuti 10 kraadi.

Kui vajate intervalliskaalade meenutamisel abi, mõelge lihtsalt intervalli tähendusele: nende vahelisele ruumile . Nii et hoolite mitte ainult muutujate järjekorrast, vaid ka nende vahelistest väärtustest.

Intervallidega on siiski väike probleem: pole "tõelist nulli". Tõelisel nullil pole väärtust - sellest pole midagi - kuid 0 kraadi C-l on kindlasti väärtus: see on üsna jahe. Teil võivad olla ka negatiivsed arvud.

Kui teil pole tõelist nulli, ei saa te suhtarvusid arvutada. See tähendab liitmis- ja lahutamistöid, kuid jagamine ja korrutamine mitte.

Suhte andmed

Jumal tänatud, et suheandmed on olemas. See lahendab kõik meie probleemid.

Suhteandmed räägivad meile muutujate järjekorrast, nendevahelistest erinevustest ja neil on see absoluutne null. Mis võimaldab teha ja teha kõikvõimalikke arvutusi ja järeldusi.

Suhteandmed on väga sarnased intervalliandmed, välja arvatud null tähendab, et neid pole. Suhteandmete puhul ei ole võimalik saada negatiivseid väärtusi.

Näiteks on kõrgus suheandmed. Negatiivne kõrgus pole võimalik. Kui objekti kõrgus on null, siis objekti pole. See erineb midagi sellist nagu temperatuur. Nii 0 kui ka -5 kraadi on täiesti kehtivad ja tähenduslikud temperatuurid.

Nüüd, kui teil on nende andmetüüpide põhikäepide, peaksite olema selle statistika eksami lahendamiseks veidi valmis.