R-programmeerimine - algajate juhend R-programmeerimiskeele kohta

See R-programmeerimise ajaveeb tutvustab teile R-i ja aitab teil näidete abil üksikasjalikult mõista R-programmeerimise erinevaid põhimõisteid.

R on üks populaarsemaid analüüsivahendeid. Kuid peale selle, et seda kasutatakse analüüsi jaoks, on R ka programmeerimiskeel.IT-tööstuse kasvuga on nõudlus kvalifitseeritud või mõistes R-d kui andmeanalüütika tööriista ja programmeerimiskeelt.Selles blogis aitan teil mõista erinevaid R-programmeerimise aluseid. Meie lk armas Ajaveeb ,oleme arutanud, miks me vajame Analyticsit, mis on ärianalüüs, miks ja kes kasutab R.



Selles blogis mõistame allpool olevaid R-programmeerimise põhimõisteid järgmises järjestuses:



  1. Muutujad
  2. Andmetüübid
  3. Andmeoperaatorid
  4. Tingimuslik avaldus
  5. Silmused
  6. Funktsioonid

Võite läbida R-programmeerimiskeele veebiseminari salvestuse, kus meie juhendaja on teemasid üksikasjalikult selgitanud näidetega, mis aitavad teil R-programmeerimist paremini mõista.

R programmeerimine algajatele | R programmeerimiskeele õpetus | Edureka



Nii et liigume edasi ja vaatame esimest R-programmeerimise kontseptsiooni - muutujaid.

R programmeerimine: muutujad

Muutujad pole muud kui nimi väärtust sisaldavas mälupesas. R-i muutuja saab salvestada arvväärtusi, kompleksväärtusi, sõnu, maatriksit ja isegi tabelit. Üllatav, eks?

Muutuja - R programmeerimine - Edureka

Joonis: Loominemuutujate arv



Ülaltoodud pilt näitab meile, kuidas muutujaid luuakse ja kuidas neid erinevatesse mäluplokidesse salvestatakse. R-s ei pea me muutujat enne selle kasutamist deklareerima, erinevalt teistest programmeerimiskeeltest nagu Java, C, C ++ jne.

Liigume edasi ja proovime mõista, mis on andmetüüp ja erinevad R-s toetatavad andmetüübid.

R programmeerimine: andmetüübid

R-s ei deklareerita muutujat ühtegi andmetüüpi, pigem saab see määratud R-objekti andmetüübi. Niisiis nimetatakse R-i dünaamiliselt sisestatud keeleks, mis tähendab, et me võime programmis kasutades sama muutuja andmetüüpi uuesti ja uuesti muuta.

Andmetüübid määravad, millist tüüpi muutuja on ja milliseid matemaatilisi, relatsioonilisi või loogilisi toiminguid saab sellele rakendada ilma viga põhjustamata. R-s on palju andmetüüpe, kuid allpool on kõige sagedamini kasutatavad:

Arutame nüüd kõiki neid andmetüüpe eraldi, alustades vektoritest.

Vektorid

Vektorid on kõige elementaarsemad R andmeobjektid ja aatomvektoreid on kuut tüüpi. Allpool on kuus aatomivektorit:

Loogiline : Seda kasutatakse loogilise väärtuse nagu. Salvestamiseks TÕSI või VÄÄR .

Numbriline : Seda kasutatakse nii positiivsete kui ka negatiivsete arvude, sealhulgas reaalarvude salvestamiseks.

Nt: 25, 7.1145, 96547

Täisarv : See sisaldab kõiki täisarvu väärtusi, st kõiki positiivseid ja negatiivseid täisarvusid.

Nt: 45.479, -856.479, 0

Kompleksne : Need on kujul x + yi, kus x ja y on numbrilised ning i tähistab -1 ruutjuurt.

Nt: 4 + 3i

Iseloom : Seda kasutatakse kas ühe märgi, tähemärkide (sõnade) rühma või sõnarühma koos hoidmiseks. Märgid võivad olla määratletud kas üksik- või topeltjutumärkides.

Nt: 'Edureka', 'R on lõbus õppida'.

Üldiselt määratletakse ja initsialiseeritakse vektor järgmiselt:

Vtr = c (2, 5, 11, 24) Või Vtr<- c(2, 5, 11 , 24)

Liigugem edasi ja mõistkem muid R-tüüpi andmetüüpe

Nimekiri

Loendid on vektoritega üsna sarnased, kuid loendid on R-objektid, mis võivad sisaldada erinevat tüüpi elemente nagu & miinus arvud, stringid, vektorid ja veel üks loend selle sees.

Näiteks:

Vtr<- c('Hello', 'Hi','How are you doing') mylist <- list(Vtr, 22.5, 14965, TRUE) mylist 

Väljund:

[[1]] [1] Tere, Tere, kuidas kas sa teed '[[2]] [1] 22.5 [[3]] [1] 14965 [[4]] [1] TÕENE

Maatriks

Maatriks on objekt R, milles elemendid on paigutatud kahemõõtmelise ristkülikukujulise paigutusega.

R maatriksi loomise põhisüntaks on & miinus

 maatriks (andmed, nrow, ncol, byrow, dimnames) 

Kus:

  • andmed on sisendvektor, mis muutub maatriksi andmeelementideks.
  • now on loodavate ridade arv.
  • ncol on loodavate veergude arv.
  • byrow on loogiline vihje. Kui TÕENE, siis sisendvektori elemendid on järjestatud rea järgi.
  • hämar nimi on ridadele ja veergudele määratud nimed.

Näide:

Mymatrix<- matrix(c(1:25), nrow = 5, ncol = 5, byrow = TRUE) Mymatrix 

Väljund:

[, 1] [, 2] [, 3] [, 4] [, 5] [1,] 1 2 3 4 5 [2,] 6 7 8 9 10 [3,] 11 12 13 14 15 [4, ] 16 17 18 19 20 [5,] 21 22 23 24 25

ARRAY

R-massiivid on andmeobjektid, mida saab kasutada andmete salvestamiseks rohkem kui kahes dimensioonis. See võtab vektoriteks sisendi ja kasutab väärtusi ei parameeter massiivi loomiseks.

R-massiivi loomise põhisüntaks on & miinus

 massiiv (data, dim, dimnames) 

Kus:

  • andmed on sisendvektor, mis muutub massiivi andmeelementideks.
  • ei on massiivi mõõde, kus edastate ridade arvu, veeru ja mainitud mõõtmete abil loodavate maatriksite arvu.
  • hämar nimi on ridadele ja veergudele määratud nimed.

Näide:

Myarray<- array( c(1:16), dim=(4,4,2)) Myarray 

Väljund:

,, üks [, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16 ,, 2 [, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16

Andmeraam

Andmeraam on tabel või kahemõõtmeline massiivitaoline struktuur, milles iga veerg sisaldab ühe muutuja väärtusi ja iga rida sisaldab ühte väärtuste komplektijaoksigas veerus. Allpool on toodud mõned andmeraami omadused, mida tuleb arvestada iga kord, kui nendega töötame.

  • Veergude nimed ei tohi olla tühjad.
  • Igas veerus peaks olema sama palju andmeüksusi.
  • Andmekaadrisse salvestatud andmed võivad olla nii numbrilised, tegurid kui ka tähemärgi tüübid.
  • Ridade nimed peaksid olema kordumatud.

Näide:

emp_id = c (100: 104) emp_name = c ('John', 'Henry', 'Adam', 'Ron', 'Gary') osakond = c ('Müük', 'Rahandus', 'Turundus', 'HR ',' R & D ') andmed<- data.frame(emp_id, emp_name, dept) emp.data 

Väljund:

emp_id emp_name osakond 1 100 John Sales 2 101 Henry rahandus 3 102 Adami turundus 4 103 Ron HR 5 104 Gary teadus- ja arendustegevus

Nüüd, kui oleme mõistnud R-i põhiandmetüüpe, on aeg süveneda R-i, mõistes andmeoperaatorite mõisteid.

R programmeerimine: andmeoperaatorid

R-is on peamiselt 4 andmeoperaatorit, need on järgmised:

Aritmeetikaoperaatorid : Need operaatorid aitavad meil teha põhilisi aritmeetilisi toiminguid nagu liitmine, lahutamine, korrutamine jne.

Vaatleme järgmist näidet:

num1 = 15 num2 = 20 num3 = 0 # lisanumber num3 = num1 + num2 num3 #substraktsioon num3 = num1 - num2 num3 #multiplication num3 = num1 * num2 num3 #division num3 = num1 / num2 num3 #modulus num3 = num1 %% num2 num3 #exponent num1 = 5 num2 = 3 num3 = num1 ^ num2 num3 #floorijaotus num3 = num1% /% num2 num3

Väljund:

[1] 35 [viisteist [1] 300 [1] 0,75 [1] 15 [1] 125 [üksteist

Suheteoperaatorid : Need operaatorid aitavad meil teha relatsioonitoiminguid, näiteks kontrollida, kas muutuja on suurem, väiksem või võrdne teise muutujaga. Relatsioonoperatsiooni väljund on alati loogiline väärtus.

Mõtle järgmistele näidetele:

num1 = 15 num2 = 20 # võrdub num3 = (num1 == num2) num3 # pole võrdne num3 = (num1! = num2) num3 #vähem kui num3 = (num1 num2) num3 #less kui võrdne num1 = 5 num2 = 20 num3 = (num1 = num2) num3

Väljund:

[1] VALE [1] TÕENE [1] TÕENE [1] VALE [1] TÕENE [1] VALE

Ülesandeoperaatorid: Neid operaatoreid kasutatakse väärtuste määramiseks muutujatele R-s. Määramise saab teha kas omistamise operaatori abil(<-) või võrdub operaatoriga (=). Muutuja väärtuse saab määrata kahel viisil: vasakule ja paremale.

LoogilineOperaatorid: Need operaatorid võrdlevad kahte olemit ja neid kasutatakse tavaliselt loogiliste (loogiliste) väärtustega nagu 'ja', 'või'ja'mitte'.

kuidas muuta topelt int


R programmeerimine: tingimuslikud avaldused

  1. Kui avaldus: If-lause aitab teil hinnata ühte avaldist voo osana. Selle hindamise läbiviimiseks peate lihtsalt kirjutama märksõna If, millele järgneb hinnatav avaldis. Allpool olev vooskeem annab aimu, kuidas lause If kontrollib koodi voogu: kaaluge järgmist näidet:
num1 = 10 num2 = 20 if (arv1<=num2){ print('Num1 is less or equal to Num2') 

Väljund:

[1] 'Num1 on väiksem või võrdne Num2'
  • Muu avaldus: Lause Else if aitab teil laiendada harusid kuni If-lause loodud vooga ja annab teile võimaluse hinnata mitu tingimust, luues uusi vooguharusid. Allpool olev voog annab teile aimu, kuidas muu, kui lause hargneb koodi voogu:

    Vaatleme järgmist näidet:

    Num1 = 5 Num2 = 20 if (Num1 Num2) {print ('Num2 on väiksem kui Num1')} muu kui ('Num1 == Num2) {print (' Num1 ja Num2 on võrdsed ')}

    Väljund:

    [1] 'Num1 on väiksem kui Num2'

  • Muu avaldus: Lauset else kasutatakse siis, kui kõik muud väljendid on kontrollitud ja leitud kehtetutena. See on viimane lause, mis käivitatakse filiaali If - Else if osana. Allpool olev voog annab teile parema ülevaate selle kohta, kuidas Else koodi voogu muudab:

Vaatleme järgmist näidet:

Num1 = 5 Num2 = 20 if (Num1 Num2) {print ('Num2 on väiksem kui Num1')} muul juhul print ('Num1 ja Num2 on võrdsed')}

Väljund:

[1] 'Num1 ja Num2 on võrdsed'

R Programmeerimine: aasad

Lingi lause võimaldab meil lause või lausete rühma mitu korda käivitada. R-s on peamiselt kolme tüüpi silmuseid:

  1. korda Loop : See kordab lauset või väidete rühma, kui antud tingimus on TÕSI. Korduv tsükkel on parim näide väljundiga kontrollitud silmusest, kus kood käivitatakse kõigepealt ja seejärel kontrollitakse tingimust, et teha kindlaks, kas juhtelement peaks olema silmus sees või sellest väljuma. Allpool on juhtimisvoo kordusringis:
    Vaatame allpool toodud näidet, et mõista, kuidas saaksime n-i numbri lisamiseks korrata silmust, kuni summa ületab 100:

    x = 2 korda {x = x ^ 2 print (x) if (x> 100) {break}

    Väljund:

    [1] 4 [1] 16 [1] 256
  2. samas Loop : Minat aitab korrata lauset või väidete rühma, kui antud tingimus on TÕSI. Kui tsükkel, võrreldes korduva tsükliga, on veidi erinev, on see näide sisenemisega kontrollitud tsüklist, kus tingimus kontrollitakse kõigepealt ja ainult juhul, kui tingimus leitakse olevat tõene, edastatakse kontroll tsükli sees koodi täitmiseks . Allpool on juhtimise voog teatud aja jooksul:
    Vaatame allpool toodud näidet, et lisada esimese 10 numbri ruutude summa ja mõista, kuidas while-silmus paremini töötab:

    num = 1 sumn = 0 samas (arv<=11){ sumn =(sumn+ (num^2) num = num+1 print(sumn) } 


    Väljund:

    [üksteist [viisteist [1] 14 [1] 30 [1] 55 [1] 91 [1] 140 [1] 204 [1] 285 [1] 385 [1] 506
  3. Loopi jaoks : Seda kasutatakse lause või rühma kordamiseks kindla arvu kordade jooksul. Erinevalt kordusest ja loop-st kasutatakse for-loopi olukordades, kus oleme teadlikud sellest, mitu korda koodi on vaja eelnevalt käivitada. See on sarnane while-tsüklile, kus kõigepealt kontrollitakse tingimust ja seejärel käivitatakse ainult sisestatud kood. Vaatame silmuse juhtimise voogu nüüd:

Vaatame nüüd näidet, kus me kasutame for for loop esimese 10 numbri printimiseks:

for (x in 1:10) {print (x)}

Väljund:

[üksteist [1] 2 [1] 3 [1] 4 [viisteist [1] 6 [1] 7 [1] 8 [1] 9 [1] 10

R Programmeerimine: funktsioonid

Funktsioon on organiseeritud korduvkasutatava koodi plokk, mida kasutatakse ühe seotud toimingu sooritamiseks. R-s on peamiselt kahte tüüpi funktsioone:

Eelmääratud funktsioonid : Need on sisseehitatud funktsioonid, mida kasutaja saab oma töö tegemiseks kasutada easyer. Nt: mean( x) , sum( x) , sqrt ( x ), pealmine( x ), jne.

Kasutaja määratud Funktsioonid: Need funktsioonid on kasutaja loodud kasutaja konkreetsete nõuete täitmiseks. Allpool on süntaks funktsiooni loomiseksR:

 func  tsiooni_nimi  <– funktsioon (arg_1, arg_2 ja hellip){ // Funktsiooni keha }

Mõelge järgmisele lihtsa funktsiooni näitele ruutude summa genereerimisekskohta2 numbrit:

ruudu summa<- function(x,y) { x^2 + y^2 } sum_of_sqares(3,4) 
Väljund: [1] 25

Loodetavasti on teile meeldinud seda R-i programmeerimisblogi lugeda. Oleme selles õpetuses käsitlenud kõiki R-i põhitõdesid, nii et võite hakata harjutama kohe. Pärast seda R-i programmeerimisblogi pakun ma veel Analyticsi jaoks R-i ajaveebe, nii et püsige kursis.

Nüüd, kui olete R-i põhitõdedest aru saanud, vaadake järgmist Edureka, usaldusväärne veebiõppeettevõte, mille võrgustik hõlmab üle 250 000 rahuloleva õppija, levinud üle kogu maailma. Edureka R-koolitusega andmeanalüüs aitab teil omandada teadmisi R-i programmeerimise, andmetöötluse, uuriva andmete analüüsi, andmete visualiseerimise, andmekaevanduse, regressiooni, meeleolude analüüsi ja RStudio kasutamise kohta jaekaubanduses, sotsiaalmeedias.

Kas teil on meile küsimus? Palun mainige seda selle R-programmeerimise ajaveebi kommentaaride jaotises ja võtame teiega ühendust niipea kui võimalik.