Põhiandmeteadlaste oskused

Selles ajaveebis kirjeldatakse peamisi andmeteadlaste oskusi koos kontrollnimekirjaga oskustest, mis on vajalikud suurepäraseks ja tõhusaks andmeteadlaseks saamiseks. Loe edasi >>>

Kaks LinkedIni analüütikut lõid 2008. aastal termini „andmeteadlane”. Nad üritasid lihtsalt kirjeldada, mida nad teevad, st saada äriväärtust nende veebisaidi genereeritud tohututest andmetest. Selle käigus nimetasid nad lõpuks ametinimetuse, mis näeks järgmistel aastatel uskumatut nõudlust ja mida isegi nimetataks ‘Seksikaim töö 21ststsajandil. ”



Nüüd otsivad organisatsioonid, mis peavad andmeid „väärtuslikuks varaks”, neid andmete eksperte või teadlasi, et neid tulevikus juhtida.



Mida on vaja selleks, et olla suur andmeteadlane? Erinevad oskuste komplektid!

Lühike ülevaade andmeteadlase põhioskustest.



Andmeteaduse protsess hõlmab 3 etappi.

kahe andmeallika segamine
  • Andmete hõivamine
  • Andmete analüüs
  • Esitlus

Vaatame lähemalt andmeteadlase rolli igas nimetatud etapis.

Andmete hõivamine



  • Programmeerimine ja andmebaasioskused

Andmekaevanduse esimene samm on õigete andmete hõivamine. Seega on andmeteadlaseks olemiseks väga oluline tunda tööriistu ja tehnoloogiaid, eriti avatud lähtekoodiga tehnoloogiaid nagu Hadoop, Java, Python, C ++ ja andmebaasitehnoloogiaid nagu SQL, NoSQL, HBase ja nii edasi.

alamstring SQL serveris koos näitega
  • Ettevõtte domeen ja ekspertiis

Andmed erinevad ettevõtte lõikes. Seetõttu vajab äriandmete mõistmine asjatundlikkust, mis tuleb ainult konkreetses andmevaldkonnas töötades.

Näiteks: meditsiinivaldkonnast kogutavad andmed erinevad täielikult jaemüügiriiete poe andmetest.

  • Andmete modelleerimine, ladustamine ja struktureerimata andmeoskused

Organisatsioonid koguvad erinevate ressursside kaudu tohutul hulgal andmeid. Sel viisil hõivatud andmed on struktureerimata ja need tuleb enne analüüsi korraldada. Seetõttu peab andmeteadlane oskama struktureerimata andmete modelleerimist.

Andmete analüüs

  • Statistiliste tööriistade oskused

Andmeteadlase peamine oskus on osata kasutada statistilisi tööriistu nagu R, Excel, SAS ja nii edasi. Need tööriistad on vajalikud hõivatud andmete lihvimiseks ja nende analüüsimiseks.

  • Matemaatikaoskused

Ainuüksi arvutiteadustest ei piisa andmeteadlaseks saamiseks. Andmeteadlase profiil eeldab kedagi, kes suudaks mõista suuremahulisi masinõppe algoritme ja programmeerimist, olles samas osav statistik. See vajab asjatundlikkust teistes teadus- ja matemaatika valdkondades peale arvutikeelte.

Esitlus

  • Visualiseerimise tööriista oskused

Võib-olla suudate kogutud andmeid kaevandada ja modelleerida, kuid kas saate neid visualiseerida?

Kui soovite olla edukas andmeteadlane, peaksite andmeanalüüside visuaalseks esitamiseks töötama mõne andmete visualiseerimise tööriistaga. Mõned neist hõlmavad R, Flare, HighCharts, AmCharts, D3.js, Processing ja Google Visualization API jne.

Kuid see pole veel lõpp! Kui soovite tõeliselt saada andmeteadlaseks, peaksid teil olema ka järgmised oskused:

  • Suhtlemisoskused: Statistika ja Excel on keerulised. Andmeteadlastel peaks olema võimalus esitada andmeid viisil, mis edastab tulemused ärikasutajatele.
  • Ärioskused : Andmeteadlastel peab olema mitu rolli. Neil oleks vaja suhelda organisatsiooni erinevate inimestega. Seetõttu on suureks abiks tugevate oskuste omamine, mis hõlmab suhtlemist, planeerimist, korraldamist ja juhtimist. See hõlmab äri- ja rakendusnõuete mõistmist ning teabe vastavat tõlgendamist. Samuti peaks tal olema üldine arusaam valdkonna peamistest väljakutsetest ja ta peaks olema teadlik parema otsuste tegemise finantssuhtest. Alumine rida: andmeteadlane mõtleb ka ‘äri’.
  • Probleemide lahendamise oskused: See näib ilmne, kuna andmeteadus on seotud probleemide lahendamisega. Tõhus andmeteadlane peab võtma aega ja probleemi põhjalikult uurima ning pakkuma kasutajale sobiva lahenduse.
  • Ennustamisoskused: Andmeteadlane peaks olema ka tõhus ennustaja. Tal peaks olema laialdased teadmised algoritmidest, et valida see, mis sobib andmemudeliga õigesti. See hõlmab teatavat loovust andmete targaks kasutamiseks ja esitamiseks.
  • Häkkimine: Ma tean, et see kõlab hirmutavalt, kuid erinevad häkkimisoskused, näiteks käsureal tekstifailidega manipuleerimine, vektoriseeritud toimingute mõistmine ja algoritmiline mõtlemine muudavad teid paremaks andmeteadlaseks.

Vaadates ülaltoodud oskuste kogumeid, on selge, et andmeteadlaseks olemine ei tähenda ainult andmete teadmist kõigest. See on tööprofiil, milles on ühendatud andmeoskus, matemaatikaoskus, ärioskus ja suhtlemisoskus. Kõigi nende oskuste koos olemasolul võib andmeteadlast õigustatult nimetada IT-valdkonna rokitäheks.

Kontrollnimekiri, et saada suurepäraseks ja tõhusaks andmeteadlaseks:

Käsitlesime oskusi, mida on vaja andmeteadlaseks saamiseks. Ainult andmeteadlaseks saamisel ning vinge ja tõhusaks teadlaseks saamisel on tohutu erinevus. Järgmised oskused koos ülalnimetatud oskustega eristavad teid tavalisest või isegi keskpärasest andmeteadlasest.

java skripti hüpikaken
  • Matemaatilised oskused - arvutused, maatriksoperatsioonid, numbriline optimeerimine, stohhastilised meetodid jne.
  • Statistilised oskused - regressioonimudelid, tress, klassifikatsioonid, diagnostika, rakendatav statistika jne.
  • Suhtlus - Visualiseerimine, esitlus ja kirjutamine.
  • Andmebaas - Lisaks CouchDB-le teadmised mittetraditsioonilistes andmebaasides nagu MongoDB ja Vertica.
  • Programmeerimiskeeled - siga, taru, Java, Python jne
  • Loomuliku keele töötlemine ja Andmete kaevandamine.

Edurekal on spetsiaalselt kureeritud mis aitab teil omandada teadmisi masinõppe algoritmidest, nagu K-Means Cluster, Otsustamispuud, Random Forest, Naive Bayes. Õpite ka statistika, aegridade, tekstikaevanduse mõisted ja sissejuhatuse süvendatud õppesse. Varsti algavad selle kursuse uued partiid !!