R Programmeerimiskeel on selgitatud

R on avatud lähtekoodiga programmeerimiskeel ja tarkvara keskkond statistiliseks arvutuseks ja graafikaks. See on üks peamisi keeli, mida kasutavad nii andmeteadlased kui ka statistikud. Seda toetab R Statistikaarvutuste Fond ja suur avatud lähtekoodiga arendajate kogukond. Kuna R kasutas käsurea liidest, võib mõnel inimesel, kes on harjunud kasutama GUI-le suunatud programme nagu SPSS ja SAS, olla järsk õppimiskõver, nii et R-i laiendused nagu RStudio võivad olla väga kasulikud. Kuna R on avatud lähtekoodiga programm ja vabalt kättesaadav, võib see olla suur atraktsioon akadeemikute jaoks, kelle juurdepääsu statistikaprogrammidele reguleeritakse nende ühenduse kaudu erinevatesse kolledžitesse või ülikoolidesse.

Paigaldamine

Esimene asi, mida peate R-ga alustama, on selle allalaadimine ametlikult saidilt vastavalt teie operatsioonisüsteemile.

Populaarsed R-tööriistad ja paketid

  • RStudio on R. jaoks integreeritud arenduskeskkond (IDE). See sisaldab konsooli, süntaksi esiletõstmise redaktorit, mis toetab koodi otsest täitmist, samuti tööriistu joonestamiseks, ajaloo loomiseks, silumiseks ja tööruumi haldamiseks.
  • Üldine R-arhiivivõrk (CRAN) on juhtiv R-tööriistade ja ressursside allikas.
  • Tidyverse on arvamuslik R-pakettide kogum, mis on loodud andmeteaduse jaoks nagu ggplot2, dplyr, readr, tidyr, purr, tibble.
  • data.table on data.frametäiustatud jõudlusele ja lühikesele, paindlikule süntaksile keskendunud baasi rakendus .
  • Läikiv raamistik armatuurlaua stiilis veebirakenduste loomiseks R-s

Andmetüübid R-s

Vektor

See on sama põhitüübi andmeelementide jada. Näiteks:

> o  p  q  o;p;q [1] 1.0 2.0 5.3 6.0 -2.0 4.0 [1] "one" "two" "three" "four" "five" "six" [1] TRUE TRUE FALSE TRUE FALSE

Maatriks

See on kahemõõtmeline ristkülikukujuline andmekogum. Samuti peavad maatriksi komponendid olema sama tüüpi nagu vektor. Näiteks:

> m = matrix( c('a','a','b','c','b','a'), nrow = 2, ncol = 3, byrow = TRUE) > m >[,1] [,2] [,3] [1,] "a" "a" "b" [2,] "c" "b" "a"

Andmeraam

See on üldisem kui maatriks, kuna erinevatel veergudel võivad olla erinevad põhiandmete tüübid. Näiteks:

> d  e  f  mydata  names(mydata)  mydata

Loendid

See on R-objekt, mis võib sisaldada selle sees palju erinevat tüüpi elemente, nagu vektorid, funktsioonid ja isegi veel üks loend selle sees. Näiteks:

> list1  list1 [[1]] [1] 2 5 3 [[2]] [1] 21.3 [[3]] function (x) .Primitive("sin")

Funktsioonid R-s

Funktsioon võimaldab teil määratleda korduvkasutatava koodiploki, mida saab teie programmis mitu korda käivitada.

Funktsioone saab korduvalt nimetada ja neile helistada või neid saab anonüümselt paigas käivitada (sarnaselt lambda funktsioonidele pythonis).

R-funktsioonide täieliku mõistmise arendamine nõuab keskkonnade mõistmist. Keskkonnad on lihtsalt viis objektide haldamiseks. Tegevuskeskkondade näide on see, et saate funktsiooni sees kasutada üleliigset muutuja nime, mida see ei mõjuta, kui suuremal käitamisajal on juba sama muutuja. Lisaks, kui funktsioon kutsub muutujat, mida pole funktsioonis määratletud, kontrollib see selle muutuja kõrgema taseme keskkonda.

Süntaks

R-s on funktsiooni määratlusel järgmised funktsioonid:

  1. Märksõna function
  2. funktsiooni nimi
  3. sisendparameetrid (valikuline)
  4. mingi koodiplokk, mida täita
  5. tagastusavaldus (valikuline)
# a function with no parameters or returned values sayHello() = function(){ "Hello!" } sayHello() # calls the function, 'Hello!' is printed to the console # a function with a parameter helloWithName = function(name){ paste0("Hello, ", name, "!") } helloWithName("Ada") # calls the function, 'Hello, Ada!' is printed to the console # a function with multiple parameters with a return statement multiply = function(val1, val2){ val1 * val2 } multiply(3, 5) # prints 15 to the console

Funktsioonid on koodiplokid, mida saab lihtsalt funktsiooni kutsudes uuesti kasutada. See võimaldab lihtsat ja elegantset koodi taaskasutust ilma koodiosade selgesõnalise kirjutamiseta. See muudab koodi nii loetavamaks, hõlbustab silumist kui ka piirab kirjutamisvigu.

Funktsioonid R-is luuakse functionmärksõna abil koos sulgudes oleva funktsiooni nime ja parameetritega.

return()Funktsiooni saab kasutada tagastab funktsioon väärtuse, ja seda kasutatakse tavaliselt sundida ennetähtaegse lõpetamisega funktsiooni tagastatud raha. Teise võimalusena tagastab funktsioon lõpliku prinditud väärtuse.

# return a value explicitly or simply by printing sum = function(a, b){ c = a + b return(c) } sum = function(a, b){ a + b } result = sum(1, 2) # result = 3

Samuti saate määratleda parameetrite vaikeväärtused, mida R kasutab juhul, kui muutuja pole funktsioonikõne ajal määratud.

sum = function(a, b = 3){ a + b } result = sum(a = 1) # result = 4

Samuti saate parameetrid edastada soovitud järjekorras, kasutades parameetri nime.

result = sum(b=2, a=2) # result = 4

R saab aktsepteerida ka täiendavaid valikulisi parameetreid tähisega „…”

sum = function(a, b, ...){ a + b + ... } sum(1, 2, 3) #returns 6

Funktsioone saab käivitada ka anonüümselt. Need on väga kasulikud koos funktsioonide rakendamise perekonnaga.

# loop through 1, 2, 3 - add 1 to each sapply(1:3, function(i){ i + 1 })

Märkused

Kui funktsiooni määratlus sisaldab argumente ilma vaikeväärtusteta, tuleb lisada nende väärtuste väärtused.

sum = function(a, b = 3){ a + b } sum(b = 2) # Error in sum(b = 2) : argument "a" is missing, with no default

Funktsioonis määratletud muutujad eksisteerivad ainult selle funktsiooni ulatuses, kuid kontrollivad suuremat keskkonda, kui muutuja pole täpsustatud

double = function(a){ a * 2 } double(x) # Error in double(x) : object 'x' not found double = function(){ a * 2 } a = 3 double() # 6

R-s sisseehitatud funktsioonid

  • R-l on palju funktsioone, mida saate kasutada keerukate ülesannete, näiteks juhusliku valimi tegemiseks.
  • Näiteks saate arvu ümardada numbriga round()või arvutada selle faktori klahviga factorial().
> round(4.147) [1] 4 > factorial(3) [1] 6 > round(mean(1:6)) [1] 4
  • Andmeid, mille edastate funktsiooni, nimetatakse funktsiooni argumendiks.
  • You can simulate a roll of the die with R’s sample()function. The sample() function takes two arguments:a vector named x and a number named size. For example:
> sample(x = 1:4, size = 2) [] 4 2 > sample(x = die, size = 1) [] 3 >dice dice [1] 2 4 >sum(dice) [1] 6
  • If you’re not sure which names to use with a function, you can look up the function’s arguments with args.
> args(round) [1] function(x, digits=0)

Objects in R

R allows to save the data by storing it inside an R object.

What’s an object?

It is just a name that you can use to call up stored data. For example, you can save data into an object like a or b.

> a  a [1] 5

How to create an Object in R?

  1. To create an R object, choose a name and then use the less-than symbol, <, followed by a minus sign, -, to save data into it. This combination looks like an arrow, <-. R will make an object, give it your name, and store in it whatever follows the arrow.
  2. Kui küsite R-lt, mis on a-s, ütleb see teile järgmisel real. Näiteks:
> die  die [1] 1 2 3 4 5 6
  1. R-s saate objekti nimetada peaaegu kõigeks, mida soovite, kuid on mõned reeglid. Esiteks ei saa nimi alata numbriga. Teiseks ei saa nimi kasutada mõnda erisümboli, näiteks ^, !, $, @, +, -, /, or *:
  2. R mõistab ka suurtähtede kasutamist (või on tõstutundlik), nii et nimi ja nimi viitavad erinevatele objektidele.
  3. Näete, milliseid objektinimesid olete funktsiooniga juba kasutanud ls().

Rohkem informatsiooni:

  • Selle statistilise programmeerimise tasuta kursusega saate R-programmeerimiskeele põhitõed õppida vaid 2 tunni jooksul
  • Sissejuhatus veebi kraapimisele R abil
  • R-i agregaatide sissejuhatus: võimas tööriist andmetega mängimiseks