Modelleerimisvõtted ärianalüüsis koos R-ga

Blogi annab lühikese sissejuhatuse modelleerimisvõtetest ärianalüüsis koos R-ga.



Erinevad modelleerimisvõtted:

Saame jagada kõik probleemid väiksemateks protsessideks:



Klassifikatsioon - on koht, kus me andmed liigitame. Nt kõik haigused käituvad kindlalt ja me saame neid veelgi klassifitseerida.

Näiteks: immuunsust vähendavad haigused, peavalu tekitavad haigused jne.



Taandareng - hõlmab mitme muutuja vahelise seose väljaselgitamist.

Näiteks: kuidas inimese kaal on seotud tema pikkusega.

AnomoliMärkamine - on põhimõtteliselt kõikumine.



Näiteks: kõrgepinge või madalpinge korral.

Teine näide võib hõlmata reguleeritud käitumist, mis hõlmab sõitmist paremal või vasakul küljel vastavalt riigile. Anomool on siin keegi, kes sõidab vastupidiselt.

Teine näide võib olla võrgu sissetung. Siin logib autentitud kasutaja teie ettevõtte veebisaidile ja kui keegi autentimata sisse logib, on seeAn0moly.

erinevus nuku ja koka vahel

Atribuudi tähtsus - See annab põhimõtteliselt mitu atribuuti, nagu pikkus, kaal, temperatuur, südamelöögid. Pange tähele, et kõik need atribuudid on ülesande jaoks olulised.

Näiteks: keegi üritab ennustada, mis kellaajal inimene kontorisse jõuab. Igal atribuudil on oluline roll, kuid mitte kõik atribuudid on olulised.

Assotsiatsiooni reeglid - Lihtsamalt öeldes on see järgmise käitumise analüüsimine või ennustamine, kus see keerleb soovitusmootori ümber.

Näiteks: leiba ostev inimene võib osta ka piima. Kui analüüsime varasemat ostukäitumist, on kõigil korvis olevatel toodetel seos. Sel juhul võib olla tõenäosus, et leiba ostja ostab ka piima.

Klastrid - See on üks vanimaid tehnikaid statistikas. Tegelikult saab alati modelleerida mis tahes probleemi, olgu see siis klassifikatsioon või klasterdamine, mis tähendab sarnaste üksuste rühmitamist.

Näiteks:

1) Võtke korv õuntest ja apelsinidest, milles saame õunad apelsinidest eraldada.

2) Klastrite moodustamise oluline juhtum on tervishoid. Peaaegu kogu statistika ja analüüs algas tervishoiuteenuste kasutamise juhtumitest. Süvendamiseks on olemas rühmitus, mida nimetatakse kohordideks (sarnaste haigustega inimesed), et neid saaks uurida olemasolevatest klientidest eraldi. Näiteks kui 10 inimest põeb palavikku ja veel 10 inimest peavalu, siis leiame nende vahel ühise ja loome ravimit.

Funktsiooni eraldamine - Funktsioonide väljavõtte täpsus, kehtivus ja ebaõnnestumine on üsna asjakohased. Teisisõnu, funktsioonide väljavõtmist võib nimetada mustrituvastuseks.

Näiteks:

Kui kasutaja sisestab termini Google'i otsingus, jõuab see tulemusteni. Nüüd on oluline küsida, kuidas ta teadis, milline leht on termini jaoks asjakohane ja mitte-asjakohane? Sellele saab vastata funktsioonide eraldamise ja mustrituvastusega, kus see lisab silmapaistvaid funktsioone. Oletame, et foto on antud, teatud kaamerad tuvastavad näod, tõstavad näo esile kaunite piltide saamiseks, mis kasutab ka funktsioonide tuvastamist.

Juhendatud õppimine vs järelevalveta õppimine

kuni) Ennustuse kategooria - Tehnikad hõlmavad regressiooni, logistilisi, närvivõrke ja otsustuspuid. Mõned näited hõlmavad pettuste avastamist (kus arvuti õpib ja ennustab järgmist pettust varasema pettuse ajaloo põhjal). Järelevalveta õppimisel ei saa näidetega ennustada, kuna ajaloolisi andmeid pole.

b) Klassifikatsiooni kategooria - Kui tuua näide, olenemata sellest, kas tehing on petlik või mitte, siis liigitatakse see klassifikatsiooni kategooriasse. Siin võtame ajaloolised andmed ja klassifitseerime need otsustuspuudega või juhul, kui me ei võta üldse ajaloolisi andmeid, siis alustame otse andmetest ja proovime funktsioone iseseisvalt ära kasutada. Näiteks kui peame tundma töötajaid, kes tõenäoliselt lahkuvad organisatsioonist või jäävad tõenäoliselt sinna. Juhul, kui tegemist on uue organisatsiooniga, kus me ei saa ajaloolisi andmeid kasutada, võime andmete väljavõtmiseks alati kasutada klastreid.

c) Uurimiskategooria - See on sirgjooneline meetod, mida välja mõelda, mida suured andmed tähendavad. Järelevalveta õppimisel nimetatakse seda põhikomponentideks ja klastriteks.

d) Ühise huvikategooria - siin on tegemist mitme elemendiga, näiteks ristmüük / müük, turukorvi analüüs. Korvianalüüsis pole juhendatud õppimist, kuna pole ajaloolisi andmeid. Seega võtame andmeid otse ja leiame seoseid, järjestust ja tegurite analüüsi.

Kas teil on meile küsimus? Mainige neid kommentaaride jaotises ja võtame teiega ühendust.

Seonduvad postitused: