Kuidas arvutada loendi keskmine - statistika ja Pythoni keskmine funktsioon on üksikasjalikult lahti seletatud

Matemaatika ja programmeerimine käivad käsikäes. Kui olete programmeerija, peate mingil hetkel kasutama matemaatikat.

Andmeteadus, masinõpe, tehisintellekt ja krüptorahad põhinevad kõik keerukatel matemaatilistel põhimõtetel.

Kuid matemaatikafunktsioonide kasutamine ei pea olema keeruline! Python abstraheerib kõik, nii et kui mõistetest aru saate, ei pea te rakenduse üksikasju mõistma.

Matemaatika ei pea olema hirmutav

Seal on palju matemaatilisi funktsioone, millega kokku puutute. Kui töötate andmete või analüütikaga, on oluline mõista mõnda matemaatilist põhimõtet ja funktsiooni.

Üks selline funktsioon, millest peate aru saama, on meanfunktsioon.

Ärge laske end sellest nimest heidutada - meanPythoni funktsioonis pole midagi õelat (sõnamäng mõeldud) .

See postitus on iseseisev, kuid eeldan, et teil on Pythoniga töötamise kogemus ja teate, mis on Pythoni loend. Kui ei, vaadake enne jätkamist seda artiklit.

Kui olete lõpetanud, tulge tagasi ja liituge minuga, et sukelduda meanfunktsioonisse.

Statistika

Nii et soovite meanfunktsiooni kohta lisateavet . See on suurepärane! Kuid enne selle funktsiooni vaatlemist on oluline vaadata distsipliini, millest see pärineb: statistika.

Ülaloleval pildil näeme graafikut. Graafik on piltlik esitus, mis näitab ühe muutuja suhet teise suhtes.

Graafikud on kasulikud, kuna need võimaldavad meil andmeid korrastada, et saaksime andmete suundumusi ja seoseid kiiresti näha. Graafik on vaid üks tööriist, mida saame kasutada andmete visualiseerimiseks ja analüüsimiseks.

Statistika on matemaatika haru, mis võimaldab meil süsteemset viisi andmete klassifitseerimiseks, analüüsimiseks ja tõlgendamiseks. See on oluline, sest statistikaga on meil kõigi nende asjade tegemiseks valmis tööriistade kogu.

Kujutage ette, kui teil oleks vaja saag uuesti leiutada iga kord, kui peate tükki puitu lõikama. Me kutsuksime paljusid inimesi, kes nimetaksid saed erineva nimega, kuigi nad teevad sama asja. Selle probleemi vältimiseks panime saele nime, mille järgi saavad kõik sellele viidata.

Sama juhtub statistikas - meil on kõigile teada-tuntud tööriistu. Üks selline tööriist on keskmine.

Režiim, mediaan ja keskmine

Kuigi keskmine on täiesti võimeline iseseisvalt seisma, õpetatakse seda tavaliselt trio osana, mis hõlmab režiimi, mediaani ja keskmist.

Vaatame arvude rühma, et saaksite aru, mis siin toimub. Kujutage ette, et teil on allpool olevad numbrid:

1, 2, 3, 3, 4, 6, 9

Oletame, et tahtsime väljendada, milline arv esineb kõige rohkem kordi. See oleks 3 ja selle omaduse nimi on režiim. Režiim on arv, mida uuritavas komplektis on kõige sagedamini.

Järjestatud hulga keskel olevat arvu nimetatakse mediaaniks. Numbrikomplekti mediaani leidmiseks korraldage numbrid väiksematest suurimateni ja vaadake siis keskel olevat arvu. Ülaltoodud numbrite hulk on paigutatud juba väiksematest suurimateni, seega on ka mediaanarv 3.

Lõpuks on keskmine veel üks võimalus viidata hulga keskmisele. Keskmise leidmiseks lisage lihtsalt kõik arvud kokku ja jagage see hulga elementide koguarvuga. Eespool toodud arvude korral, kui liidame need kõik kokku, saame 28. Komplekti kuuluvate üksuste koguarv on 7, seega on meie keskmine 4.

Miks me vajame keskmist?

Nii et siinkohal võib tekkida küsimus, miks peaksime ikkagi leidma arvu keskmise.

Asi on selles, et isegi statistika ise jaguneb mitmeks rühmaks. Nii nagu teil on tööriistu, mida kasutatakse puiduga töötlemiseks, ja teisi metalliga töötamiseks, on statistikas mõned tööriistad rühmitatud klassidesse, kuna neid kasutatakse sarnasel eesmärgil.

Ühte sellist statistikagruppi nimetatakse koondstatistikaks. Statistika üks asi on andmete kirjeldamine ja kokkuvõtlik statistika on selleks otstarbeks kasutatavate tööriistade kogum. Üks selle klassi tööriistadest on keskmine.

Keskmine on oluline tänu sellele, et see aitab meil analüüsida jaotust. Statistikas on jaotus meetod, mida kasutame muutuja vaatamiseks, mille kohta soovime teavet. Jaotust kasutades vaatame selle muutuja väärtusi ja selle esinemissagedust.

Andmete kogumisel on tavaline jaotustüüp normaalne jaotus, mis toimub kellakõvera kujul:

See tähendab, et muutujal on ühine väärtus, mille poole ta kaldub, samuti lähtepunkt ja lõpp-punkt.

What the mean does is that it allows us to take a distribution like this and look at the central tendency of the variable, which is the point at which the values of the variable tend to cluster.

Thus we can say the mean describes the central tendency of the distribution.

Calculating the Mean in Python

We can manually calculate the mean if we have a small numerical data set it we have a few values to work with. However, when we have hundreds or thousands of values in a data set it becomes impossible to calculate it by hand.

Since Python is a "batteries included" language, the way we can do this is to use the mean function of the statistics module within Python.

Let's use the mean function to calculate the mean of the numerical data set we had earlier in the post:

 # 1. import the statistics module import statistics # 2. list containing our numerical data set numerical_data_set = [1, 2, 3, 3, 4, 6, 9] # 3. calculate the mean calc_mean = statistics.mean(numerical_data_set) # 4. print our calculated mean print("Mean is: ", calc_mean) 

Our code consists of a 4 step sequence that we can use to calculate the mean:

  1. We import the statistics module that contains our mean function
  2. We create a Python list containing the numerical data set of which we would like to calculate the mean
  3. We calculate the mean and store the result in a variable, calc_mean
  4. We output our calculated mean so that we can get visual feedback

When we run the code, we will get the following output:

The program outputs the same value as our manual calculations. When we are working with large data sets, this function will be able to scale to handle whatever we can throw at it.

Wrapping Up

In this post we looked at the mean function in Python. We began by discussing statistics as a whole, then took a deep dive into mean.

Now that you have a solid understanding of statistics and the mean function in Python, you can use it in your own programs.

If you liked this article, then you may also be curious about learning about data structures and algorithms. If you want a simple, clear, step by step guide to learning about data structures and algorithms without having to write a single line of code, then you can check out the book Codeless Data Structures and Algorithms.

Read the book here:

Koodita andmestruktuurid ja algoritmid - õppige DSA-d ühtegi koodirida kirjutamata | Armstrong Subero | Apress See raamat toob teile uue vaatenurga algoritmidele ja andmestruktuuridele, mis on täiesti koodivaba. Lisateave andmestruktuuri algoritmide (DSA-de) kohta, ilma et peaksite kunagi oma koodiredaktorit avama, kompilaatorit kasutama või integreeritud arenduskeskkonda (IDE) vaatama. .... Armstrong Subero otsingumenüü ostukorv V Teie ostukorv on praegu tühi. Sisselogimiskonto