Jaki jest najpopularniejszy język programowania w branży machine learningu?

Z uczeniem maszynowym mamy do czynienia od lat, choć dopiero w ostatnim czasie to zagadnienie stało się bardzo popularne. Już w latach ‘50 przeprowadzano pierwsze testy związane z tą technologią, a dzisiaj machine learning staje się powoli normą, która wspiera pracę nie tylko programistów, ale także każdego z nas. Dziś pokażemy, jaki jest najlepszy język programowania, który musisz poznać, jeśli chcesz pracować w branży związanej z machine learningiem bądź analityką danych.
Jean-Francois Puget, technical leader w IBM, postanowił przyjrzeć się bliżej zagadnieniu i znaleźć odpowiedź na nurtujące go pytanie. Jak przystało na naukowca, Puget nie opierał się na własnych doświadczeniach, ale przejrzał masę danych, by dojść do jednego wniosku. O nim na końcu.
Czytając raport z badań zazwyczaj skupiamy się na wyniku, bo to on jest odpowiedzią na postawione pytanie. W tym przypadku warto jednak skupić się na drodze jaką przebył Jean-Francois Puget, a właściwie na tym, na podstawie jakich informacji wysunął wniosek, że najpopularniejszym językiem wykorzystywanym na stanowiskach związanych z uczeniem maszynowym i analityką danych jest: Python.
Badacz przejrzał portal z ofertami pracy Indeed, by dowiedzieć się jakich umiejętności oczekują pracodawcy od kandydatów. W ten sposób dowiedział się, jakie języki pojawiały się najczęściej w ofertach pracy. W wyszukiwarce job boardu określił swoje wymagania, by sprawdzić ile ofert jest dostępnych na rynku, a później je przeanalizował. Zobaczcie, czego dokładnie dowiedział się z wykresu popularności rozłożonego na lata.
W poniższym przypadku zapytanie dotyczy ofert machine learning + big data.
Ten wykres pokazuje popularność języków tylko w ofertach dot. machine learningu.
Wynik zaskoczył badacza, ponieważ pokazał, że to właśnie Python najczęściej pojawiał się w ofertach pracy na indeed.com. Spodziewał się też, że na drugim miejscu będzie język R — o którym pisaliśmy w tym artykule. Zaraz za Pythonem plasowały się Java, R, a później C++. W dodatku, wykres udowadnia rosnącą popularność Pythona.
Dzięki eksperymentowi Jean-Francois Puget dowiedział się też, że bardzo szybko rośnie zainteresowanie Scalą, którą wykorzystują pracownicy branż machine learningu i big data. W ciągu trzech ostatnich lat wskaźnik rósł, co tylko świadczy o zainteresowaniu się nim. Niewielką popularnością cieszy się za to Julia.
Puget w czasie testu postawił kolejne pytanie: który z języków programowania stanie się jeszcze bardziej popularny w ciągu najbliższych lat? Na potrzeby eksperymentu sprawdził, jak szybko urosło zainteresowania najpopularniejszymi językami.
Wszystko wskazuje na to, że niebawem R przegoni Pythona, choć nie jest to pewne.
Podsumowując, trzy najpopularniejsze języki w machine learningu to Python, Java i R. Badanie przyniosło także inne wnioski, np. w postaci braku zainteresowania językiem Lua, wykorzystywany przez największy framework deep learningu — Torch. Wynik dot. Julii też zaskoczył, bo okazało się, że mało kto szuka pracowników ze znajomością tego języka.
Podobne artykuły

Podejście do zmniejszania kosztów przetwarzania danych na przykładzie Azure Databricks

Data management, data governance i data modernization - jak okiełznać proces zarządzania danymi w organizacji

Big Data - klęska urodzaju czy złoty Graal? Praktyczne metody wykorzystania potencjału danych

Dane 1,3 mln użytkowników Clubhouse do pobrania? To nie wyciek, to data scraping

Text clustering, czyli jak wyciągnąć realną wartość biznesową z milionów wiadomości tekstowych

Migracja do chmury? Wypełnij ankietę i sprawdź, jak wygląda ten proces u innych!

Analiza infrastruktury i danych IoT. Wybór bazy
