Data science: Att välja programmeringsspråk och utvecklingsmiljö

Jag har ingen (vettig) åsikt mellan varken de olika programmeringsspråken eller de olika utvecklingsmiljöerna för data science. Inom data science är det idag ofta ett val mellan språket R och Python. För dig som vill vara lite annorlunda finns visserligen alltid språket Julia. Julia har många likheter med Python men är långt mycket snabbare jämfört med Python.

Historielektion inom programmering

Dock har jag två vagt relaterade tankegångar eftersom jag haft nytta av programmering inom mitt yrkesutövande sedan drygt 20 år tillbaka. Då, på 1990-talet, fanns varken Google eller Stack Overflow. På den tiden hade jag istället lokala databaser, knowledgebase, för respektive grej jag höll på med. Inom Lotus Notes & Domino, som var den applikationsmiljö jag jobbade med då, fanns en utmärkt databas kring systemutveckling för respektive version av systemet. På den tiden var webben lite av en nymodighet och att folk som undertecknad begrep nyttan av stilmallar (CSS) hörde till ovanligheter. Under några år skulle jag säkert ha kunnat försörja mig på att kombinera dåvarande webbteknik och hur dåtidens system fejkade sig fram till att stödja webben.

Vilket nummer i kunskapsdatabasen hänvisar du till?

Då refererade vi till artiklar i den där databasen vi fått av systemleverantören. I mitt fall Lotus/IBM. Du hittar svaret i KB-nummer var ett vanligt svar när man konsulterade kollegor, på den tiden när jag jobbade på WM-data eSolutions som webbutvecklare på Domino-plattformen.

Min chef beskrev på kundmöten det jag gjorde som “i all väsentlighet som en Microsoft Access-databas” kanske jag återkommer till i mina memoarer någon gång i framtiden. Det underlättade i alla fall inte för mig under mina övningar som tekniskt säljstöd.

Ödsla inte energi på teknik (i onödan)

De flesta av oss som jobbar digitalt idag förväntas begripa enklare ting. En av dessa är att behärska verktyg för att jobba med datadrivna beslut. Exempelvis Notebooks hos Microsoft Azure Notebooks eller Google Colaboratory:

När det gäller miljöer och att du inte orkar göra en massa tekniskt på din egen dator finns ju både lösningarna från Microsoft och Google. Då använder du Jupyter Notebooks vilket funkar om du inte hanterar känsliga data. Dock behöver du kolla så de modulerna/paketen du behöver finns. I Jupyter skriver man help('modules') i en kodcell för att få reda på detta.

Välja språk efter hur du söker efter tips

En andra grej är att välja språk rent generellt, och jag har bytt språk alldeles för många gånger de senaste 20 åren. Det är ett helsike att googla efter tips och lösningar för vissa språk. Kan inte uttala mig om R, men då det är en ynka bokstav som skiljer det du söker från alla andra språk har jag ingen bra magkänsla. Vet dock att det är extremt hjälpsamt att hitta svar för Python. För Python var det lite sämre fram till för kanske två år sedan då det stora skiftet mellan version 2.7 och 3.x inte kommit så långt.

Tidigare "skitspråk" har varit att söka efter "Julia + fråga", ".NET + fråga", eller "C# + fråga" då man fick en massa annat dravel. Eller "formula + fråga" när jag jobbade med IBM Domino i forntiden.

Den frustrationen behöver du inte - tänk efter när du väljer språk :)

Mer om Python och R


Publicerad: 2020-07-28
Kategori: Digitalisering

‹ bloggen

Hör av dig