Wil jy 'n data wetenskaplike word? Leer een van hierdie tale

Gaan voort in die data wetenskap deur een van hierdie winsgewende tale te leer

Almal wil hê hulle loopbaan moet in hoë aanvraag wees, omdat die vraag vertaal word na groot salaris en geen tekort aan werk nie. Deesdae is die groot data ruimte vol met so 'n soort werk, aangesien maatskappye van alle groottes inligting moet insamel en analiseer om besluite en voorspellings te maak (en resultate te kry).

Dit is presies wat data wetenskaplikes doen: ontdek inligting, maak verbindings, skep datavisualisasies, en help maatskappye om doeltreffend te werk.

En 'n deeglike begrip van die regte programmeringstale is noodsaaklik vir die interpretasie van statistieke en om met databasisse te werk.

Volgens KDnuggets gebruik 91% data wetenskaplikes die volgende vier tale.

Taal 1: R

R is 'n statistiek-georiënteerde taal gewild onder data-mynwerkers. Dit is 'n oop-bron, objekgeoriënteerde implementering van S, en is nie te moeilik om te leer nie.

As jy wil leer hoe om statistiese sagteware te ontwikkel, is R 'n goeie taal om te weet. Dit laat jou ook toe om data te manipuleer en grafies te vertoon.

As deel van hul datawetenskap spesialiseringsprogram bied Coursera 'n klas op R, wat nie net jou leer hoe om in die taal te program nie, maar gaan ook oor hoe om dit in die konteks van data wetenskap / analise toe te pas.

Taal 2: SAS

Soos R word SAS hoofsaaklik vir statistiese analise gebruik. Dit is 'n kragtige instrument om die data van databasisse en sigblaaie te omskep in leesbare formate (soos HTML- en PDF-dokumente) sowel as die meer visuele tabelle en grafieke.

Oorspronklik ontwikkel deur akademiese navorsers, is dit een van die gewildste analitiese gereedskap wêreldwyd vir maatskappye en organisasies van alle soorte. Dit is meer van 'n groot korporasie tipe sagteware en word nie tipies gebruik deur kleiner maatskappye of individue wat op hul eie werk nie.

Hulpbronne vir die leer van SAS word in hierdie dokument gelys .

Die taal is nie oopbron nie, so jy sal waarskynlik nie jouself gratis kan leer nie.

Taal 3: Python

Alhoewel R en SAS die algemeenste beskou word as "die groot twee" in die analitiese wêreld, het Python onlangs ook 'n aanspraakmaker geword. Een van sy belangrikste voordele is sy wye verskeidenheid biblioteke (bv. Pandas, NumPy, SciPi, ens.) En statistiese funksies.

Aangesien Python (soos R) 'n oop brontaal is, word opdaterings vinnig bygevoeg. (Met gekoopte programme soos SAS, moet jy wag vir die volgende weergawe.)

Nog 'n faktor om te oorweeg, is dat Python dalk die maklikste is om te leer, weens die eenvoud en wye beskikbaarheid van kursusse en hulpbronne daarop. Hierdie webwerf is 'n goeie plek om te begin.

U kan ook hier 'n volledige lys van Python-leermateriaal vind.

Taal 4: SQL

Tot dusver het ons gekyk na tale wat in dieselfde familie is en (min of meer) dieselfde funksies het. SQL, wat staan ​​vir "Gestruktureerde Query Language," is waar dit verander. Hierdie taal het niks te doen met statistiek nie; Dit fokus op die hantering van inligting in relasionele databasisse.

Dit is die mees gebruikte databasis taal en is oopbron, so aspirant data wetenskaplikes moet beslis nie slaan nie.

Leer SQL moet jou toerus om SQL databasisse te skep, die data binne hulle te bestuur en relevante funksies te gebruik. Udemy bied 'n opleiding wat al die basiese beginsels dek en kan redelik vinnig en pynloos voltooi word.

Afsluiting

Op 'n minimum moet jy waarskynlik SQL leer en kies ten minste een van die statistiese tale. Maar as jy die tyd het (en in die geval van SAS, geld) en wil regtig jou bemarkbaarheid bereik, is daar niks om te sê jy kan nie al vier leer nie!

Moenie haastig wees nie, kry baie oefening, vernuf jou vaardighede en geniet die werksekuriteit.