Python i R to już nie konkurencja. Developerzy tych języków stworzyli Ursa Labs
Część developerów uważa, że Python i R to dwa konkurujące ze sobą języki, ale powinni zmienić zdanie. Wes McKinney, jeden z najważniejszych developerów języka Python, oraz Hadley Wickham, jeden z najważniejszych developerów języka R, postanowili połączyć siły. Na ten cel stworzyli Ursa Labs, wspólną inicjatywę zajmującą się tworzeniem narzędzi współpracujących z Pythonem i R.
McKinney i Wickham razem chcą ułatwić pracę data scientistom, którzy wcześniej korzystali albo z Pythona, albo z języka R. “Po co wybierać pomiędzy tymi językami? Przecież oba są świetne” — powiedział Hadley Wickham w rozmowie z portalem qz.com.
Developerzy pracujący nad dużymi zbiorami danych w pracy stawali przed ważnym wyborem: w którym języku pisać? Może w Pythonie? Za nim przemawiało to, że dobrze integruje się z bazami danych, działa z narzędziami takimi jak Spark i Hadoop, a co najważniejsze posiada świetne biblioteki do analizowania danych. I choć Python to język intepretowany, a nie kompilowany — nadal wielu data scientist developerów korzystało właśnie z niego w swojej pracy.
Ci co wybierali język R doceniali m.in. tidyverse — pakiet pakietów, dzięki któremu mogli zmieścić więcej operacji w pipelinie na pojedynczej tabeli. Za językiem R przemawiało także to, że — podobnie jak w Pythonie — ma zaangażowaną społeczność, która chętnie odpowiada na pytania zadane np. na StackOverflow. Wielu data scientistów mówi też, że nie ma lepszego języka do budowania wewnętrznych narzędzi analitycznych od języka R.
Problem data scientistów pojawiał jednak się, gdy developer, który pisał w Pythonie, ma zacząć współpracę z drugim, który dotychczas pracował w języku R. Wynik ich dotychczasowej pracy ma zostać połączony, ale problemy sprawiają różnice w tych językach. Temu chcą zaradzić wspomniani wcześniej Wes McKinney oraz Hadley Wickham, którzy ogłosili stworzenie Ursa Labs, określanego mianem “Innovation Lab for Data Science Tools”.
Czym jest Ursa Labs?
Wes McKinney, lider projektu, wyjaśnił, że celem Ursa Labs jest stworzenie innowacyjnych narzędzi dla data scientistów, które będzie można używać pracując w różnych językach. Wszystkie produkty, które wyjdą spod tego labu mają działać na zasadach open source’owych, co ma być jego przewagą na rynku. Takie projekty rozwija się teoretycznie szybciej, zgodnie ze wskazówkami użytkowników i przede wszystkim razem z nimi.
McKinney zaprosił do współpracy Hadleya Wickhama, który w Ursa Labs jest Advisorem, po to, by wspólnie z nim stworzyć nowe standardy języków Python i R, dzięki czemu data scientistom będzie łatwiej współpracować ze sobą. Jak tego dokonają? Już teraz obserwują jak developerzy pracujący albo z Pythonem, albo z R rozwiązują ten sam problem. Wyniki tych obserwacji pozwolą usprawnić oba języki tak, by były do siebie bardziej zbliżone.
Twórca Ursa Labs we wpisie na blogu o powstaniu projektu napisał też, że brak rozwijania tego typu narzędzi może spowolnić rozwój całej branży związanej z machine learningiem, czy sztuczną inteligencją. Wymienił też, że bez usprawnienia pracy analityków, mocno spadnie ich efektywność, a to za sprawą rosnących zbiorów danych, na które trzeba poświęcić jeszcze więcej czasu. Do kolejnych problemów zaliczył także rosnące koszty pracy data scientistów.
Wes McKinney chce skupić się na tworzeniu narzędzi, dlatego nawiązał współpracę z RStudio, które ma odpowiadać za administracyjne sprawy związane z tworzeniem, organizacją pracy czy zarabianiem na produktach spod szyldu Ursa Labs.
Bez wątpienia, powstanie Ursa Labs to dobra wiadomość dla analityków danych. W końcu tworzą go dwaj doświadczeni developerzy, których połączyła wspólna misja. Ursa Labs nie osiągnie jednak sukcesu bez pomocy użytkowników, ale i developerów, którzy poświęcą czas na rozwój tego projektu. Dlatego Wes McKinney zapowiedział, że niebawem opublikuje oferty pracy dla nich. Śledźcie więc na bieżąco stronę projektu.