Jaki jest najpopularniejszy język programowania w branży machine learningu?
Z uczeniem maszynowym mamy do czynienia od lat, choć dopiero w ostatnim czasie to zagadnienie stało się bardzo popularne. Już w latach ‘50 przeprowadzano pierwsze testy związane z tą technologią, a dzisiaj machine learning staje się powoli normą, która wspiera pracę nie tylko programistów, ale także każdego z nas. Dziś pokażemy, jaki jest najlepszy język programowania, który musisz poznać, jeśli chcesz pracować w branży związanej z machine learningiem bądź analityką danych.
Jean-Francois Puget, technical leader w IBM, postanowił przyjrzeć się bliżej zagadnieniu i znaleźć odpowiedź na nurtujące go pytanie. Jak przystało na naukowca, Puget nie opierał się na własnych doświadczeniach, ale przejrzał masę danych, by dojść do jednego wniosku. O nim na końcu.
Czytając raport z badań zazwyczaj skupiamy się na wyniku, bo to on jest odpowiedzią na postawione pytanie. W tym przypadku warto jednak skupić się na drodze jaką przebył Jean-Francois Puget, a właściwie na tym, na podstawie jakich informacji wysunął wniosek, że najpopularniejszym językiem wykorzystywanym na stanowiskach związanych z uczeniem maszynowym i analityką danych jest: Python.
Badacz przejrzał portal z ofertami pracy Indeed, by dowiedzieć się jakich umiejętności oczekują pracodawcy od kandydatów. W ten sposób dowiedział się, jakie języki pojawiały się najczęściej w ofertach pracy. W wyszukiwarce job boardu określił swoje wymagania, by sprawdzić ile ofert jest dostępnych na rynku, a później je przeanalizował. Zobaczcie, czego dokładnie dowiedział się z wykresu popularności rozłożonego na lata.
W poniższym przypadku zapytanie dotyczy ofert machine learning + big data.
Ten wykres pokazuje popularność języków tylko w ofertach dot. machine learningu.
Wynik zaskoczył badacza, ponieważ pokazał, że to właśnie Python najczęściej pojawiał się w ofertach pracy na indeed.com. Spodziewał się też, że na drugim miejscu będzie język R — o którym pisaliśmy w tym artykule. Zaraz za Pythonem plasowały się Java, R, a później C++. W dodatku, wykres udowadnia rosnącą popularność Pythona.
Dzięki eksperymentowi Jean-Francois Puget dowiedział się też, że bardzo szybko rośnie zainteresowanie Scalą, którą wykorzystują pracownicy branż machine learningu i big data. W ciągu trzech ostatnich lat wskaźnik rósł, co tylko świadczy o zainteresowaniu się nim. Niewielką popularnością cieszy się za to Julia.
Puget w czasie testu postawił kolejne pytanie: który z języków programowania stanie się jeszcze bardziej popularny w ciągu najbliższych lat? Na potrzeby eksperymentu sprawdził, jak szybko urosło zainteresowania najpopularniejszymi językami.
Wszystko wskazuje na to, że niebawem R przegoni Pythona, choć nie jest to pewne.
Podsumowując, trzy najpopularniejsze języki w machine learningu to Python, Java i R. Badanie przyniosło także inne wnioski, np. w postaci braku zainteresowania językiem Lua, wykorzystywany przez największy framework deep learningu — Torch. Wynik dot. Julii też zaskoczył, bo okazało się, że mało kto szuka pracowników ze znajomością tego języka.