Iga üksik masinõppe kursus Internetis, reastatud teie arvustuste järgi

Poolteist aastat tagasi langesin Kanada ühest parimast arvutiteaduse programmist välja. Hakkasin veebiressursse kasutades looma oma andmeteaduse magistriprogrammi. Sain aru, et võin kõike vajalikku õppida hoopis edX-i, Coursera ja Udacity'i kaudu. Ja ma saaksin selle õppida kiiremini, tõhusamalt ja murdosa kuludest.

Olen nüüd peaaegu valmis. Olen läbinud palju andmeteadusega seotud kursusi ja auditeerinud osasid paljudest teistest. Ma tean sealseid võimalusi ja milliseid oskusi on vaja õppijatele, kes valmistuvad andmeanalüütiku või andmeteadlase rolliks.Niisiis hakkasin koostama ülevaatepõhist juhendit, mis soovitab andmeteaduse iga aine jaoks parimaid kursusi.

Sarja esimese juhendi jaoks soovitasin algajatele andmeteadlastele paar kodeerimisklassi. Siis oli see statistika ja tõenäosuseklassid. Seejärel sissejuhatus andmeteadusesse. Samuti andmete visualiseerimine.

Nüüd masinõppe juurde.

Selle juhendi jaoks veetsin tosin tundi, et tuvastada kõik alates 2017. aasta maist pakutavad veebipõhised masinõppe kursused, eraldada nende ainekavadest ja ülevaadetest põhiteavet ning koostada nende hinnangud. Minu lõppeesmärk oli selgitada välja kolm parimat saadaolevat kursust ja tutvustada neid teile allpool.

Selle ülesande jaoks pöördusin kellegi muu kui avatud lähtekoodiga Class Centrali kogukonna ja selle tuhandete loomulikult hinnangute ja arvustuste andmebaasi poole.

Alates 2011. aastast on Class Centrali asutaja Dhawal Shah veebikursustel hoolikamalt silma peal hoidnud kui väidetavalt keegi teine ​​maailmas. Dhawal aitas mul isiklikult selle ressursside loendi kokku panna.

Kuidas me valisime kursused, mida kaaluda

Iga kursus peab vastama kolmele kriteeriumile:

  1. Sellel peab olema märkimisväärne hulk masinõppesisu. Ideaalis on peamine teema masinõpe.Pange tähele, et ainult süvaõppega kursused on välistatud. Sellest lähemalt hiljem.
  2. Seda tuleb tellida või pakkuda iga paari kuu tagant.
  3. See peab olema interaktiivne veebikursus, nii et ei mingeid raamatuid ega kirjutuskaitstud õpetusi . Kuigi need on õppimisvõimalused, keskendub see juhend kursustele. Välja jäetakse ka kursused, mis on rangelt videod (st ilma viktoriinide, ülesannete jne).

Usume, et läbisime kõik märkimisväärsed kursused, mis vastavad ülaltoodud kriteeriumidele. Kuna Udemy kohta on näiliselt sadu kursusi, otsustasime arvestada ainult kõige ülevaatlikumate ja kõrgemalt hinnatud kursustega.

Alati on võimalus, et me siiski millestki ilma jäime. Nii et palun andke meile kommentaaride jaotises teada, kui jätsime hea kursuse välja.

Kuidas me kursusi hindasime

Koostasime keskmised hinnangud ja arvustuste arv Class Centralist ja teistelt arvustuste saitidelt, et arvutada iga kursuse kaalutud keskmine hinnang. Lugesime tekstiarvustusi ja kasutasime seda tagasisidet numbriliste hinnangute täiendamiseks.

Tegime subjektiivsete ainekavade hindamiskutseid kolme teguri põhjal:

  1. Masinõppimise töövoo selgitus. Kas kursusel on välja toodud eduka ML-projekti elluviimiseks vajalikud sammud? Vaadake järgmises jaotises, mida tüüpiline töövoog kaasa toob.
  2. Masinõppevõtete ja algoritmide kajastamine. Kas on hõlmatud mitmesugused tehnikad (nt regressioon, klassifitseerimine, klastrid jms) ja algoritmid (nt klassifikatsiooni piires: naiivsed Bayes, otsustuspuud, tugivektorimasinad jne) või ainult mõned valitud? Eelistatakse kursusi, mis hõlmavad rohkem ilma detailidega koonerdamata.
  3. Levinud andmeteaduse ja masinõppevahendite kasutamine. Kas kursusel õpetatakse populaarseid programmeerimiskeeli nagu Python, R ja / või Scala? Kuidas oleks nende keelte populaarsete raamatukogudega? Need pole vajalikud, kuid abiks, nii et neid kursusi eelistatakse veidi.

Mis on masinõpe? Mis on töövoog?

Populaarne määratlus pärineb Arthur Samuelilt 1959. aastal: masinõpe on arvutiteaduse alavaldkond, mis annab "arvutitele võimaluse õppida ilma selgesõnaliselt programmeerimata". Praktikas tähendab see arvutiprogrammide väljatöötamist, mis suudavad andmete põhjal ennustada. Nii nagu inimesed saavad kogemustest õppida, saavad ka arvutid, kus andmed = kogemused.

Masinõppe töövoog on masinõppeprojekti läbiviimiseks vajalik protsess. Kuigi üksikud projektid võivad erineda, on enamikul töövoogudel mitu tavalist ülesannet: probleemide hindamine, andmete uurimine, andmete eeltöötlus, mudeli koolitus / testimine / juurutamine jne. Allpool leiate nende põhisammude kasuliku visualiseerimise:

Ideaalne kursus tutvustab kogu protsessi ja pakub interaktiivseid näiteid, ülesandeid ja / või viktoriine, kus õpilased saavad iga ülesande ise täita.

Kas need kursused hõlmavad sügavat õppimist?

Kõigepealt määratleme sügav õppimine. Siin on lühike kirjeldus:

"Sügav õppimine on masinõppe alaväli, mis on seotud algoritmidega, mis on inspireeritud aju struktuurist ja funktsioonist, mida nimetatakse kunstlikeks närvivõrkudeks." - Jason Brownlee masinõppe meisterlikkusest

Nagu arvata võib, sisaldavad osad masinõppekursused sügavat õppesisu. Otsustasin siiski mitte lisada ainult õppimiseks mõeldud sügavaid kursusi. Kui olete huvitatud konkreetselt sügavast õppimisest, oleme teid käsitlenud järgmise artikliga:

Sukelduge süvaõppesse 12 tasuta veebikursusega

Iga päev toob uued pealkirjad selle kohta, kui sügav õppimine muudab meid ümbritsevat maailma. Mõned näited: medium.freecodecamp.com

Minu kolm parimat soovitust sellest loendist oleksid järgmised:

  • TensorFlow abil sügava õppimise loomingulised rakendusedautor Kadenze
  • Neurovõrgud Machine Learning Ülikooli Toronto (õpetatakse Geoffrey Hinton) kaudu Coursera
  • Sügav õppimine AZ ™: praktilised kunstlikud närvivõrgud

    Kirill Eremenko, Hadelin de Ponteves ja SuperDataScience Team Udemy kaudu

Soovitatavad eeldused

Mitmel allpool loetletud kursusel küsitakse õpilastelt eelnevat programmeerimist, arvutamist, lineaarset algebrat ja statistikat. Need eeldused on mõistetavad, arvestades, et masinõpe on arenenud distsipliin.

Mõni teema jääb puudu? Head uudised! Osa sellest kogemusest on võimalik omandada meie soovituste kaudu selle andmeteaduse karjäärijuhendi kahes esimeses artiklis (programmeerimine, statistika). Mitmed allpool kõige kõrgemal kohal olevad kursused pakuvad ka õrna arvutuse ja lineaarse algebra värskendust ning toovad masinõppe seisukohalt kõige olulisemad aspektid neile, kes on vähem tuttavad.

Parim masinõppekursus on meie valik…

  • Masinõpe (Stanfordi ülikool Coursera kaudu)

Stanfordi ülikooli masinõpe Courseras on praegune selge võitja nii reitingute, arvustuste kui ka õppekava sobivuse osas. Õpetas kuulus Andrew Ng, Google Brain'i asutaja ja endine Baidu juhtivteadlane, see oli kursus, mis pani aluse Coursera asutamisele. Sellel on 4,7 tärni kaalutud keskmine hinnang üle 422 arvustuse.

2011. aastal välja antud see hõlmab kõiki masinõppe töövoo aspekte. Ehkki sellel on väiksem ulatus kui algsel Stanfordi klassil, millel see põhineb, suudab see siiski hõlmata paljusid tehnikaid ja algoritme. Hinnanguline ajakava on üksteist nädalat, kaks nädalat on pühendatud närvivõrkudele ja sügavale õppimisele. Saadaval on tasuta ja tasulised võimalused.

Ng on dünaamiline, kuid samas õrn juhendaja, kellel on käegakatsutav kogemus. Ta äratab enesekindlust, eriti kui jagada praktilisi näpunäiteid ja hoiatusi levinud lõkse kohta. Pakutakse lineaarset algebra-värskendust ja Ng toob välja masinaõppe jaoks kõige olulisemad arvutuse aspektid.

Hindamine on automaatne ja seda tehakse valikvastustega viktoriinide abil, mis järgnevad igale õppetunnile ja ülesannete programmeerimisele. Ülesandeid (neid on kaheksa) saab täita MATLABis või Octave'is, mis on MATLABi avatud lähtekoodiga versioon. Ng selgitab oma keelevalikut:

Varem olen proovinud õpetada masinõpet paljude erinevate programmeerimiskeelte abil, sealhulgas C ++, Java, Python, NumPy ja ka Octave ... Ja mida olen näinud pärast masinõppe õpetamist juba peaaegu kümme aastat, on see, et õpid palju kiiremini, kui kasutad programmeerimiskeskkonnana Octavet.

Ehkki Python ja R on 2017. aastal nende keelte suurenenud populaarsuse tõttu tõenäoliselt veenvamad valikud, märgivad ülevaatajad, et see ei tohiks takistada teid kursusel osalemast.

Mõned silmapaistvad retsensendid märkisid järgmist:

Stanfordi masinõppe kursus on MOOC-i maailmas juba pikka aega tuntud kui selle teema lõplik sissejuhatus. Kursus hõlmab üldiselt masinaõppe kõiki peamisi valdkondi ... Prof Ng eelneb igale segmendile motiveeriva arutelu ja näidetega.

Andrew Ng on andekas õpetaja ja oskab keerukaid aineid väga intuitiivselt ja selgelt seletada, sealhulgas kõigi mõistete taga olevat matemaatikat. Väga soovitatav.

Ainus probleem, mida ma selle kursusega näen, kui see seab teiste kursuste ootuste riba väga kõrgeks.

Uus Ivy League'i tutvustus koos särava professoriga

  • Masinõpe (Columbia ülikool edX kaudu)

Columbia ülikooli masinõpe on suhteliselt uus pakkumine, mis on osa nende tehisintellekti MicroMastersist edX-is. Kuigi see on uuem ja sellel pole palju arvustusi, on need siiski erakordselt tugevad. Professor John Paisley on mainekas, selge ja nutikas. Sellel on 4,8 tärni kaalutud keskmine hinnang üle 10 arvustuse.

Kursus hõlmab ka kõiki masinõppe töövoo aspekte ja rohkem algoritme kui ülaltoodud Stanfordi pakkumine. Columbia on täpsem sissejuhatus, retsensendid märkisid, et õpilased peaksid olema rahul soovitatud eeldustega (arvutus, lineaaralgebra, statistika, tõenäosus ja kodeerimine).

Hindamisviisid on viktoriinid (11), programmeerimistööd (4) ja lõpueksam. Õpilased saavad ülesannete täitmiseks kasutada kas Pythoni, Octave'i või MATLAB-i. Kursuse kogu hinnanguline ajakava on kaheksa kuni kümme tundi nädalas kaheteistkümne nädala jooksul. See on tasuta koos ostetud kinnitatud sertifikaadiga.

Allpool on mõned ülalmainitud sädelevatest arvustustest:

Kõigi oma tudengiaastate jooksul olen kohanud professoreid, kes pole hiilgavad, professoreid, kes on hiilgavad, kuid nad ei oska kraami selgelt seletada, ja professoreid, kes on hiilgavad ja teavad, kuidas asju seletada selgelt. Dr Paisley kuulub kolmandasse rühma.

See on suurepärane kursus ... Juhendaja keel on täpne ja see on minu arvates üks kursuse tugevamaid külgi. Loengud on kvaliteetsed ja ka slaidid on suurepärased.

Dr Paisley ja tema juhendaja on masinõppe isa Michael Jordani õpilased. [Dr. Paisley] on Columbia parim ML-i professor, kuna ta oskab asju selgelt seletada. Sel semestril on tema kursuse valinud kuni 240 üliõpilast, mis on kõigi Columbia masinõpet õpetavate professorite seas kõige suurem.

Praktiline sissejuhatus Python & R'is tööstuse ekspertidelt

  • Masinõpe AZ ™: praktiline Python ja R andmeteaduses (Kirill Eremenko, Hadelin de Ponteves ja SuperDataScience'i meeskond Udemy kaudu)

Masinõppimine AZ ™ Udemys on muljetavaldavalt detailne pakkumine, mis annab juhiseid nii Pythonis kui ka R-s, mis on haruldane ja mida ei saa öelda ühegi teise tippkursuse kohta. Sellel on 4,5-tärni kaalutud keskmine hinnang üle 8119 arvustuse, mis muudab selle kõige vaadatumaks.

See katab kogu masinõppe töövoo ja peaaegu naeruväärse (heas mõttes) hulga algoritme 40,5-tunnise tellitava video kaudu. Kursusel on rakendatum lähenemisviis ja see on matemaatiliselt kergem kui ülaltoodud kursustel. Iga osa algab Eremenko "intuitsiooni" videoga, mis võtab kokku õpetatava kontseptsiooni aluseks oleva teooria. Seejärel tutvub de Ponteves teostusega eraldi videotega nii Pythoni kui ka R jaoks.

Boonusena sisaldab kursus Pythoni ja R koodimalle, mida õpilased saavad oma projektides alla laadida ja kasutada. On viktoriinid ja kodutööde väljakutsed, kuigi need pole kursuse tugevad küljed.

Eremenkot ja SuperDataScience'i meeskonda austatakse nende võime eest kompleksi lihtsaks muuta. Samuti on loetletud eeltingimusteks „vaid mõni keskkooli matemaatika”, nii et see kursus võib olla parem võimalus neile, keda Stanfordi ja Columbia pakkumised kardavad.

Mõned silmapaistvad retsensendid märkisid järgmist:

Kursus on professionaalselt toodetud, helikvaliteet on suurepärane ja selgitused on selged ja lühikesed ... See on uskumatu väärtus teie rahaliste ja ajainvesteeringute jaoks.

Oli tähelepanuväärne võimalus kursust samaaegselt jälgida kahes erinevas programmeerimiskeeles.

Kirill on Udemy (kui mitte Interneti) üks absoluutselt paremaid juhendajaid ja soovitan võtta ükskõik milline tema õpetatav tund. ... Sellel kursusel on tonni sisu, nagu tonni!

Võistlus

Meie valikul nr 1 oli kaalutud keskmine hinnang 4,7 tärni viiest tärnist üle 422 arvustuse. Vaatame teisi alternatiive järjestatuna langeva reitingu järgi. Meeldetuletus, et ainult süvaõppeks mõeldud kursused pole selles juhendis - neid leiate siit.

Analytics Edge (Massachusettsi Tehnoloogiainstituut / edX): keskendub rohkem analüüsile üldiselt, ehkki see hõlmab mitut masinõppe teemat. Kasutab R. Tugevat narratiivi, mis kasutab tuttavaid reaalmaailma näiteid. Väljakutseid pakkuv. Kümme kuni viisteist tundi nädalas kaheteistkümne nädala jooksul. Tasuta koos kontrollitud sertifikaadiga, mida saab osta. Sellel on 4,9 tärni kaalutud keskmine hinnang üle 214 arvustuse.

Python andmeteaduse ja masinõppe jaoks Bootcamp (Jose Portilla / Udemy): omab suuri tükke masinõppesisu, kuid hõlmab kogu andmeteaduse protsessi. Rohkem väga üksikasjalik sissejuhatus Pythoni. Hämmastav kursus, kuigi see pole selle juhendi jaoks ideaalne. 21,5 tundi tellitavat videot. Maksumus varieerub sõltuvalt Udemy allahindlustest, mis on sagedased. Sellel on 4,6 tärni kaalutud keskmine hinnang üle 3316 arvustuse.

Andmeteadus ja masinõppega Bootcamp koos R-ga (Jose Portilla / Udemy): Portilla ülaltoodud kursuse kommentaarid kehtivad ka siin, välja arvatud R. 17,5 tundi tellitavat videot. Maksumus varieerub sõltuvalt Udemy allahindlustest, mis on sagedased. Sellel on 4,6 tärni kaalutud keskmine hinnang üle 1317 arvustuse.

Masinõppesari (Lazy Programmer Inc./Udemy): muljetavaldava jätkamisega õpetab andmeteadlane / suurandmete insener / täispika tarkvarainsener ja Lazy Programmeril on praegu 16 masinõppele keskendunud kursust Udemy kohta. Kokku on kursustel 5000+ hinnangut ja peaaegu kõigil 4,6 tärni. Kasulik kursuste tellimine on toodud iga üksiku kursuse kirjelduses. Kasutab Pythoni. Maksumus varieerub sõltuvalt Udemy allahindlustest, mis on sagedased.

Masinõpe (Georgia Tech / Udacity): kolme eraldi kursuse kogum: juhendatud, järelevalveta ja tugevdav õppimine. Osa Udacity masinõppeinseneri nanodegree ja Georgia Techi veebipõhisest magistrikraadist (OMS). Hammustussuuruses videod, nagu ka Udacity stiil. Sõbralikud professorid. Hinnanguline ajakava on neli kuud. Tasuta. Sellel on kaalutud keskmine hinnang 4,56 tärni üle 9 arvustuse.

Prognoosiva analüüsi juurutamine Sparkiga Azure HDInsightis (Microsoft / edX): tutvustatakse masinõppe põhimõisteid ja mitmesuguseid algoritme. Kasutab mitut suurt andmesõbralikku tööriista, sealhulgas Apache Spark, Scala ja Hadoop. Kasutab nii Pythoni kui ka R. Neli tundi nädalas kuue nädala jooksul. Tasuta koos kontrollitud sertifikaadiga, mida saab osta. Sellel on 4,5 tärni kaalutud keskmine hinnang üle 6 arvustuse.

Andmeteadus ja masinõpe Pythoniga - käed külge! (Frank Kane / Udemy): kasutab Pythoni. Kane'il on üheksa-aastane kogemus Amazonis ja IMDb-s. Üheksa tundi tellitavat videot. Maksumus varieerub sõltuvalt Udemy allahindlustest, mis on sagedased. Sellel on 4,5 tärni kaalutud keskmine hinnang üle 4139 arvustuse.

Scala ja Spark suurandmete ja masinõppe jaoks (Jose Portilla / Udemy): „Big data“ keskendub eelkõige rakendamisele Scalas ja Sparkis. Kümme tundi tellitavat videot. Maksumus varieerub sõltuvalt Udemy allahindlustest, mis on sagedased. Sellel on 4,5 tärni kaalutud keskmine hinnang üle 607 arvustuse.

Masinaõppe insener Nanodegree (Udacity): Udacity'i juhtiv masinõppeprogramm, mis sisaldab oma klassi parimat projekti ülevaatuse süsteemi ja karjääritoetust. Programm koosneb mitmest individuaalsest Udacity kursusest, mis on tasuta. Kaasloodud Kaggle. Hinnanguline ajakava on kuus kuud. Praegu maksab 199 USD USD kuus, 50-protsendine õppemaksu tagasimakse neile, kes lõpetavad 12 kuu jooksul. Sellel on 4,5 tärni kaalutud keskmine hinnang üle 2 arvustuse.

Andmetest õppimine (sissejuhatav masinõpe) (California Tehnoloogiainstituut / edX): Registreerimine on praegu edX-is suletud, kuid on saadaval ka CalTechi sõltumatu platvormi kaudu (vt allpool). Sellel on 4,49 tärni kaalutud keskmine hinnang üle 42 arvustuse.

Andmetest õppimine (sissejuhatav masinõpe) (Yaser Abu-Mostafa / California Tehnoloogiainstituut): "Tõeline Caltechi kursus, mitte veetustatud versioon." Arvustustes märgitakse, et see sobib suurepäraselt masinõppe teooria mõistmiseks. Professor Yaser Abu-Mostafa on üliõpilaste seas populaarne ja kirjutas ka selle kursuse aluseks oleva õpiku. Videod on YouTube'i üles laaditud loengud (koos loenguslaididega pilt pildis). Kodused ülesanded on .pdf-failid. Interneti-üliõpilaste kursuste kogemus pole nii lihvitud kui esikolmiku soovitused. Sellel on 4, 43-tärni kaalutud keskmine hinnang üle 7 arvustuse.

Kaevandamine Massive Datasets (Stanfordi ülikool): masinõpe, keskendudes suurandmetele. Tutvustab kaasaegseid hajutatud failisüsteeme ja MapReduce. Kümme tundi nädalas seitsme nädala jooksul. Tasuta. Sellel on 4,4 tärni kaalutud keskmine hinnang üle 30 arvustuse.

AWS-i masinõpe: täielik juhend Pythoniga (Chandra Lingam / Udemy): ainulaadne keskendumine pilvepõhisele masinõppele ja konkreetselt Amazoni veebiteenustele. Kasutab Pythoni. Üheksa tundi tellitavat videot. Maksumus varieerub sõltuvalt Udemy allahindlustest, mis on sagedased. Sellel on 4,4 tärni kaalutud keskmine hinnang üle 62 arvustuse.

Sissejuhatus masinaõppesse ja näotuvastusse Pythonis (Holczer Balazs / Udemy): kasutab Pythoni. Kaheksa tundi tellitavat videot. Maksumus varieerub sõltuvalt Udemy allahindlustest, mis on sagedased. Sellel on 4,4 tärni kaalutud keskmine hinnang üle 162 arvustuse.

StatLearning: Statistiline õppimine (Stanfordi ülikool): põhineb suurepärasel õpikul “Sissejuhatus statistilisse õppesse, rakendused R-s” ja õpetas selle kirjutanud professorid. Retsensendid märgivad, et MOOC pole nii hea kui raamat, viidates õhukestele harjutustele ja keskpärastele videotele. Viis tundi nädalas üheksa nädala jooksul. Tasuta. Sellel on 4, 35-tärni kaalutud keskmine hinnang üle 84 arvustuse.

Masinõppe spetsialiseerumine (Washingtoni ülikool / Coursera): suurepärased kursused, kuid kaks viimast klassi (sh nurgakiviprojekt) jäeti ära. Retsensendid märgivad, et see sari on paremini seeditav (loe: tugeva tehnilise taustaga inimestele lihtsam) kui muud tippmasinaõppe kursused (nt Stanfordi või Caltechi kursused). Pange tähele, et sari on puudulik soovitajate süsteemide, sügava õppimise ja kokkuvõtte puudumise tõttu. Saadaval on tasuta ja tasulised võimalused. Sellel on 4,31 tärni kaalutud keskmine hinnang üle 80 arvustuse.

0-st 1-ni: masinõpe, NLP ja Python-Cut to Chase (Loony Corn / Udemy): "Maalähedane, häbelik, kuid enesekindel masinõppe tehnikate võtmine." Õpetab nelja inimese meeskond, kellel on aastakümnete pikkune tööstuskogemus. Kasutab Pythoni. Maksumus varieerub sõltuvalt Udemy allahindlustest, mis on sagedased. Sellel on 4,2 tärni kaalutud keskmine hinnang üle 494 arvustuse.

Masinõppe põhimõtted (Microsoft / edX): kasutab R, Pythoni ja Microsoft Azure'i masinõpet. Osa Microsofti andmeteaduse professionaalse programmi sertifikaadist. Kolm kuni neli tundi nädalas kuue nädala jooksul. Tasuta koos kontrollitud sertifikaadiga, mida saab osta. Sellel on 4,09-tärni kaalutud keskmine hinnang üle 11 arvustuse.

Suurandmed: statistiline järeldus ja masinõpe (Queenslandi tehnikaülikool / FutureLearn): kena, lühike uuriv masinõppe kursus, mis keskendub suurandmetele. Hõlmab mõnda tööriista nagu R, H2O Flow ja WEKA. Ainult kolm nädalat kestab soovitatav kaks tundi nädalas, kuid üks arvustaja märkis, et sobivam oleks kuus tundi nädalas. Saadaval on tasuta ja tasulised võimalused. Sellel on 4 tärni kaalutud keskmine hinnang üle 4 arvustuse.

Genoomiline andmeteadus ja klastrite loomine (Bioinformaatika V) (California ülikool, San Diego / Coursera): neile, kes on huvitatud arvutiteaduse ja bioloogia ristumiskohast ning sellest, kuidas see moodsas teaduses olulist piiri esindab. Keskendub klastrite moodustamisele ja mõõtmete vähendamisele. Osa UCSD bioinformaatika spetsialiseerumisest. Saadaval on tasuta ja tasulised võimalused. Sellel on 4 tärni kaalutud keskmine hinnang üle 3 arvustuse.

Sissejuhatus masinõppesse (Udacity): prioriteerib teema laiuse ja praktilised tööriistad (Pythonis) sügavuse ja teooria asemel. Juhendajad Sebastian Thrun ja Katie Malone teevad selle tunni nii lõbusaks. Koosneb näksimissuurustest videotest ja viktoriinidest, millele järgneb iga tunni jaoks miniprojekt. Praegu kuulub Udacity'i andmeanalüütik Nanodegree. Hinnanguline kümne nädala ajaskaala. Tasuta. Sellel on 3,95 tärni kaalutud keskmine hinnang üle 19 arvustuse.

Masinõpe andmete analüüsimiseks (Wesleyani ülikool / Coursera): Lühike masinõpe ja mõned valitud algoritmid. Hõlmab otsustuspuid, juhuslikke metsi, lasso taandarengut ja k-tähendab klastreid. Osa Wesleyani andmete analüüsi ja tõlgendamise spetsialiseerumisest. Hinnanguline nelja nädala ajakava. Saadaval on tasuta ja tasulised võimalused. Sellel on 3,6 tärni kaalutud keskmine hinnang üle 5 arvustuse.

Programmeerimine Python for Data Science'iga (Microsoft / edX): Microsofti koostöös Coding Dojo'ga. Kasutab Pythoni. Kaheksa tundi nädalas kuue nädala jooksul. Saadaval on tasuta ja tasulised võimalused. Sellel on 3,46 tärni kaalutud keskmine hinnang üle 37 arvustuse.

Masinõpe kauplemiseks (Georgia Tech / Udacity): keskendub tõenäosusliku masinõppe lähenemisviiside rakendamisele kauplemisotsuste tegemisel. Kasutab Pythoni. Osa Udacity masinõppeinseneri nanodegree ja Georgia Techi veebipõhisest magistrikraadist (OMS). Hinnanguline ajakava on neli kuud. Tasuta. Sellel on 3,29-tärni kaalutud keskmine hinnang üle 14 arvustuse.

Praktiline masinõpe (Johns Hopkinsi ülikool / Coursera): lühike, praktiline sissejuhatus paljudesse masinõppe algoritmidesse. Mitmed ühe- või kahetärniülevaated, mis väljendavad erinevaid probleeme Osa JHU andmeteaduse spetsialiseerumisest. Neli kuni üheksa tundi nädalas nelja nädala jooksul. Saadaval on tasuta ja tasulised võimalused. Sellel on 3,11 tärni kaalutud keskmine hinnang üle 37 arvustuse.

Masinõpe andmeteaduse ja analüüsi jaoks (Columbia ülikool / edX): tutvustatakse laias valikus masinõppe teemasid. Mõni kirglik negatiivne arvamus, mis sisaldab muret sisuvalikute, programmeerimisülesannete puudumise ja vaimustava esitluse üle. Seitse kuni kümme tundi nädalas viie nädala jooksul. Tasuta koos kontrollitud sertifikaadiga, mida saab osta. Sellel on 2,74 tärni kaalutud keskmine hinnang üle 36 arvustuse.

Soovitajate süsteemide spetsialiseerumine (Minnesota ülikool / Coursera): keskenduge tugevalt ühele konkreetsele masinõppe tüübile - soovitajate süsteemidele. Nelja kursuse spetsialiseerumine pluss juhtkiviprojekt, mis on juhtumianalüüs. Õpetatakse LensKiti (soovituslike süsteemide avatud lähtekoodiga tööriistakomplekt) abil. Saadaval on tasuta ja tasulised võimalused. Sellel on 2 tärni kaalutud keskmine hinnang üle 2 arvustuse.

Masinaõpe suurte andmetega (California ülikool, San Diego / Coursera): kohutavad ülevaated, mis toovad esile halva juhendamise ja hindamise. Mõned märkisid, et kogu kursuse läbimiseks kulus neil vaid tunde. Osa UCSD Big Data spetsialiseerumisest. Saadaval on tasuta ja tasulised võimalused. Sellel on üle 14 arvustuse kaalutud keskmine hinnang 1,86 tärni.

Praktiline ennustav analüüs: mudelid ja meetodid (Washingtoni ülikool / Coursera): lühike sissejuhatus masinaõppe põhikontseptsioonidesse. Üks retsensent märkis, et viktoriinid olid puudulikud ja ülesanded ei olnud keerulised. Osa UW andmeteadusest skaala spetsialiseerumisel. Kuue kuni kaheksa tundi nädalas nelja nädala jooksul. Saadaval on tasuta ja tasulised võimalused. Sellel on kaalutud keskmine hinnang 1,75 tärni üle 4 arvustuse.

Järgmistel kursustel oli 2017. aasta mai seisuga üks ülevaade või puudusid need.

Masinõpe muusikutele ja kunstnikele (Goldsmiths, Londoni ülikool / Kadenze): ainulaadne. Õpilased õpivad algoritme, tarkvaratööriistu ja masinõppe parimaid tavasid, et mõtestada inimese žesti, muusikalist heli ja muid reaalajas andmeid. Seitse seanssi pikk. Saadaval on auditi (tasuta) ja lisatasu (10 dollarit USD kuus) valikud. Sellel on üks viietärniline arvustus.

Rakenduslik masinõpe Pythonis (Michigani ülikool / Coursera): õpetatakse Pythoni ja scikit learn tööriistakomplekti abil. Osa Pythoni spetsialiseerumisega rakendatud andmeteadusest. Kavandatud algus 29. mai. Saadaval on tasuta ja tasulised võimalused.

Rakendatud masinõpe (Microsoft / edX): õpetatakse mitmesuguste tööriistade abil, sealhulgas Pythoni, R-i ja Microsoft Azure'i masinõpe (märkus: Microsoft toodab kursuse). Sisaldab praktilisi laboreid loengu sisu tugevdamiseks. Kolm kuni neli tundi nädalas kuue nädala jooksul. Tasuta koos kontrollitud sertifikaadiga, mida saab osta.

Masinõpe Pythoniga (Big Data University): õpetas Pythoni abil. Sihitud algajatele. Eeldatav valmimisaeg on neli tundi. Big Data University on seotud IBM-iga. Tasuta.

Masinõpe Apache SystemML-iga (Big Data University): õpetatakse Apache SystemML-i abil, mis on deklaratiivne stiilikeel, mis on mõeldud suuremahuliseks masinõppeks. Eeldatav valmimisaeg on kaheksa tundi. Big Data University on seotud IBM-iga. Tasuta.

Masinõpe andmeteaduse jaoks (California ülikool, San Diego / edX): käivitatakse alles 2018. aasta jaanuaris. Programmeerimisnäited ja ülesanded on Pythonis, kasutades Jupyteri märkmikke. Kaheksa tundi nädalas kümne nädala jooksul. Tasuta koos kontrollitud sertifikaadiga, mida saab osta.

Sissejuhatus Analyticsi modelleerimisse (Georgia Tech / edX): Kursusel reklaamitakse peamist programmeerimisvahendit R. Viis kuni kümme tundi nädalas kümne nädala jooksul. Tasuta koos kontrollitud sertifikaadiga, mida saab osta.

Ennustav analüüs: teadmiste saamine suurandmetest (Queenslandi tehnikaülikool / FutureLearn): lühike ülevaade vähestest algoritmidest. Kasutab rakendatud tööriistana Hewlett Packard Enterprise'i Vertica Analyticsi platvormi. Alguskuupäev teatatakse. Kaks tundi nädalas nelja nädala jooksul. Tasuta koos saavutustunnistusega, mida saab osta.

Tutvustus masinõppest (Universitas Telefónica / Miríada X): õpetatakse hispaania keeles. Sissejuhatus masinõppesse, mis hõlmab juhendatud ja järelevalveta õppimist. Kokku nelja nädala jooksul hinnanguliselt kakskümmend tundi.

Masinõppe raja samm (Dataquest): õpetatakse Pythonis, kasutades Dataquesti interaktiivset brauserisisest platvormi. Mitmed juhendatud projektid ja „pluss“ projekt, kus saate oma andmete abil luua oma masinõppesüsteemi. Vaja on tellimist.

DataCamp pakub järgmist kuut kursust. DataCampi hübriidne õpetamisstiil kasutab brauserisisese koodiredaktori abil video- ja tekstipõhiseid juhiseid koos paljude näidetega. Igale kursusele täielikuks juurdepääsuks on vajalik tellimus.

Sissejuhatus masinõppesse (DataCamp): hõlmab klassifitseerimis-, regressiooni- ja klastrialgoritme. Kasutab R. Viisteist videot ja 81 harjutust, mille hinnanguline ajaskaala on kuus tundi.

Juhendatud õppimine scikit-learn (DataCamp) abil: kasutab Pythoni ja scikit-learn. Hõlmab klassifikatsiooni ja regressiooni algoritme. Seitseteist videot ja 54 harjutust, mille hinnanguline ajaskaala on neli tundi.

Järelevalveta õppimine R-is (DataCamp): pakub põhitutvustust klastrite moodustamise ja mõõtmete vähendamise kohta R-s. Kuusteist videot ja 49 harjutust, mille hinnanguline ajaskaala on neli tundi.

Masinõppe tööriistakast (DataCamp): õpetab masinõppe "suuri ideid". Kasutab R. 24 videot ja 88 harjutust, mille hinnanguline ajaskaala on neli tundi.

Masinõpe ekspertidega: kooli eelarved (DataCamp): juhtumiuuring masinõppevõistluselt saidil DrivenData. Kaasab mudeli koostamise, et liigitada üksused automaatselt kooli eelarvesse. Eelduseks on DataCampi juhendatud õppimine koos scikit-learn'iga. Viisteist videot ja 51 harjutust, mille hinnanguline ajaskaala on neli tundi.

Järelevalveta õppimine Pythonis (DataCamp): hõlmab mitmesuguseid järelevalveta õppimisalgoritme, kasutades Pythoni, scikit-learn ja scipy. Kursus lõpeb sellega, et üliõpilased ehitavad soovitajate süsteemi, et soovitada populaarseid muusikakunstnikke. 13 videot ja 52 harjutust, mille hinnanguline ajaskaala on neli tundi.

Masinõpe (Tom Mitchell / Carnegie Melloni ülikool): Carnegie Melloni kraadiõppe sissejuhatav masinõppe kursus. Nende teise kraadiõppe kursuse „Statistiline masinõpe” eeldus. Teibitud ülikooli loengud, kus on praktikaprobleeme, koduseid ülesandeid ja veebipõhiseid postitusi (kõik koos lahendustega). Samuti on olemas kursuse 2011. aasta versioon. CMU on üks paremaid masinkoolituse õppimise kraadiõppekoole ja sellel on terve ML-ile pühendatud osakond. Tasuta.

Statistiline masinõpe (Larry Wasserman / Carnegie Melloni ülikool): tõenäoliselt selles juhendis kõige arenenum kursus. Jätk Carnegie Melloni masinõppe kursusele. Teibitud ülikooli loengud, kus on praktikaprobleeme, koduseid ülesandeid ja veebipõhiseid postitusi (kõik koos lahendustega). Tasuta.

Masinõppe bakalaureuseõpe (Nando de Freitas / Briti Columbia ülikool): masinaõppe kursus bakalaureuseõppes. Loengud filmitakse ja pannakse YouTube'i koos kursuse veebisaidile postitatud slaididega. Kursuse ülesanded on samuti postitatud (lahendusi pole). de Freitas on nüüd Oxfordi ülikooli põhikohaga professor ja saab erinevates foorumites kiitust oma õpetamisvõimete eest. Saadaval on kõrgkoolide versioon (vt allpool).

Masinõpe (Nando de Freitas / Briti Columbia ülikool): masinõppe lõpetanud kursus. De Freitase bakalaureuseõppe (ülal) kommentaarid kehtivad ka siin.

Selle kokku pakkimine

See on viies kuuest osast koosnevast seeriast, mis hõlmab parimaid veebikursusi enda alustamiseks andmeteaduste valdkonda. Käsitlesime programmeerimist esimeses artiklis, statistikat ja tõenäosust teises artiklis, sissejuhatusi andmeteaduses kolmandas ja andmete visualiseerimist neljandas.

Järjestasin iga andmeteaduse sissejuhatuse kursuse Internetis tuhandete andmepunktide põhjal

Aasta tagasi loobusin ühest Kanada parimast arvutiteaduse programmist. Alustasin oma andmete loomist ...

Viimane osa on kokkuvõte nendest artiklitest, lisaks parimad veebikursused muude võtmeteemade jaoks, nagu andmete rabelemine, andmebaasid ja isegi tarkvaratehnika.

Kui otsite andmeteaduse veebikursuste täielikku loendit, leiate need Class Centrali andmeteaduse ja suurandmete teema lehelt.

Kui teile meeldis seda lugeda, vaadake Class Centeri teisi tükke:

Siin on 250 Ivy League'i kursust, mida saate praegu veebis tasuta osaleda

250 MOOCi Brownist, Columbiast, Cornellist, Dartmouthist, Harvardist, Pennist, Princetonist ja Yale'ist.

Andmete järgi 50 parimat tasuta veebikõrgkooli kursust

Kui ma 2011. aasta novembris Class Centeri käivitasin, oli umbes 18 tasuta veebikursust ja peaaegu kõik…

Kui teil on ettepanekuid kursuste kohta, millest mul puudus, andke mulle vastustes teada!

Kui leiate, et see on kasulik, klõpsake nuppu? nii et rohkem inimesi näeb seda siin Mediumis.

See on kokkuvõtlik versioon minu algsest artiklist, mis avaldati Class Centralis, kuhu olen lisanud üksikasjalikud kursuste ainekavad.