Każdy jest odpowiedzialny za jeden problem analityczny. Jak wygląda praca w bioinformatycznym zespole R&D?
NaturalAntibody to spółka bioinformatyczna, która powstała na bazie badań naszego dzisiejszego rozmówcy – Konrada Krawczyka – realizowanych na Uniwersytecie Oksfordzkim. Jej produkty wykorzystują giganci rynku farmaceutycznego jak AstraZeneca, a inwestorzy oferują miliony na dalszy rozwój.
Konrad jest uznanym autorytetem w dziedzinie projektowania i analizy przeciwciał za pomocą narzędzi obliczeniowych. Pełnił funkcję konsultanta w obszarze bioinformatyki przeciwciał dla czołowych instytucji badawczych i firm farmaceutycznych. Rozmawiamy z nim o tym, jak wygląda praca w bioinformatycznym zespole R&D.
Spis treści
Czy zajmuje się NaturalAntibody?
NaturalAntibody wynajduje i optymalizuje przeciwciała, które mogą posłużyć w procesie wytwarzania nowych leków. Do tego celu używamy własnych algorytmów uczenia maszynowego oraz danych zgromadzonych w przeróżnych systemach przez naukowców na przestrzeni ostatnich kilku dekad, których potencjał nie był wcześniej wykorzystywany.
Jaką rolę pełni zespół badawczo-rozwojowy (R&D) w NaturalAntibody?
Zespół przede wszystkim zajmuje się opracowywaniem narzędzi do analizy właściwości przeciwciał w kontekście naturalnym i terapeutycznym. Przeciwciała są dziś jednymi z najważniejszych narzędzi nowoczesnej medycyny, są używane w terapii chorób infekcyjnych, nowotworowych, lub autoimmunologicznych. Dzięki rozwojowi biotechnologii, naukowcy mogą projektować przeciwciała o określonych właściwościach do celów klinicznych.
Nasz zespół na podstawie danych tworzy modele statystyczne, które identyfikują te właściwości i przewidują ich zachowania w kontakcie z antygenami. To oczywiście łączy się zadaniami takimi jak zbieranie i czyszczenie danych, które grają kluczową rolę w tym procesie.
Nasze narzędzia nie tylko dostarczają wyniki statystyczne, ale też wiedzę na temat ich interpretacji. Klient nie jest zostawiony sam z daną parametryzacją i dziwnym wynikiem liczbowym – zespół jest w stanie dostarczyć kontekst tego wyniku. W ten sposób wspieramy naszych klientów w interpretacji wyników analizy.
Jakie są największe wyzwania naukowe i analityczne w obszarze R&D, w którym działa NaturalAntibody?
Zacznijmy od wyzwań analitycznych. Nasze rozwiązania znajdują zastosowanie na etapie badań przedklinicznych, gdzie w warunkach laboratoryjnych naukowcy sprawdzają, czy dana molekuła (jeszcze nie lek) wywołuje pożądane działanie biologiczne. Naszym zadaniem jest przyłączenie przeciwciała do specyficznego miejsca na antygenie i zapewnienie, że ma ono dobre właściwości biofizyczne.
Dla tego rodzaju problemów nie ma jednego rozwiązania, więc zespół często dzieli jedną kwestię na kilka mniejszych problemów. Na przykład, na właściwość taką jak rozwijalność (developability) przeciwciał składa się wiele aspektów – asocjacja (self-association), rozpuszczalność (solubility), czy immunogenność (immunogenicity, zdolność substancji do wywołania przeciwko sobie odpowiedzi odpornościowej).
Kolejne wyzwanie jest związane z samym rozwiązaniem technologicznym. Nasze rozwiązania są skierowane do naukowców, którzy szukają przeciwciał z danymi właściwościami. Często są to np. bioinformatycy, którzy mogą nie znać danych bibliotek lub nie wiedzieć jak rozwiązanie działa.
Dlatego rolą naszego zespołu jest stworzenie takich narzędzi, które są wystarczająco proste w użyciu i interpretacji, żeby przynosiły wartość w opracowywaniu leków terapeutycznych niezależnie od poziomu technicznego zaawansowania.
Jak możesz opisać specyfikę pracy w dziale R&D? Jak wygląda codzienna praca w takiej rzeczywistości?
Zacznę od bardziej przyziemnego aspektu pracy w R&D. Znalezienie właściwych osób do naszego zespołu to duże wyzwanie. Dlatego pracujemy zdalnie i w tym momencie jesteśmy porozrzucani po różnych miastach i krajach.
Każdy członek zespołu jest odpowiedzialny za problem analityczny, który rozwiązuje. Może to być narzędzie, zbiór danych lub problem naukowy. Stawiamy na samodzielność, ale nikt nie jest pozostawiony bez wsparcia. Nasze projekty są na tyle zbieżne, że można jak najbardziej szukać pomocy u różnych członków zespołu, których mocną stroną jest wiedza matematyczna, biologiczna, lub IT.
Jak wygląda to w praktyce?
Jednym z pierwszych zadań jakie dostał nasz nowo zatrudniony członek zespołu była eksploracja sekwencji przeciwciał dostępnych w naszych bazach oraz wyciągnięcie z nich statystyk. Zadanie okazało się problematyczne z uwagi na spory wolumen danych (kilkadziesiąt terabajtów). Z pomocą przyszedł nasz VP of Engineering, Piotr Deszyński, który zasugerował użycie technologii Big Data uruchamiane w chmurze Amazona (Spark).
Sam proces trenowania modeli jest wyzwaniem, co jest spowodowane ilością danych, które mamy – mówimy tu o setkach milionów sekwencji przeciwciał. Uczenie modeli na takim wolumenie trwałoby bardzo długo, a istotną częścią naszej pracy jest eksperymentowanie, co wymaga szybkich wyników. Rozwiązujemy to wykorzystując wiedzę domenową naszego zespołu do stworzenia mniejszych (ale reprezentatywnych) zbiorów danych pozwalających na szybszą ewaluację architektur sieci, a największe zbiory wykorzystujemy do wytrenowania wybranych modeli.
Nasz zespół jest bardzo multidyscyplinarny – mamy na pokładzie fizyków, bioinformatyków i programistów. Połączenie wysokiego poziomu wiedzy z zakresu biologii i informatyki to bardzo rzadka kompetencja, takich specjalistów jest bardzo mało na rynku. Dlatego wymiana wiedzy i mentoring grają tak ogromną rolę w naszym zespole – każdy ma wiele okazji do zdobywania wiedzy z innej dziedziny niż ich pierwotna.
W jakich technologiach powstają projekty?
To zależy od specyfiki projektu – czy mamy do czynienia z infrastrukturą, pozyskiwaniem danych, analityką lub pracami badawczymi. Wspólnym mianownikiem tych wszystkich zadań jest język programowania Python. Data science i machine learning w dużej mierze dzieją się właśnie w tym języku, mamy tutaj biblioteki i dużo materiałów pomocniczych.
Do tworzenia modeli Deep Learningowych wykorzystujemy bibliotekę Keras/Tensorflow. Poza tym używamy standardowego stacka do data science – Numpy, Scipy, Pandas, Matplotlib, i Seaborn.
Jakie kompetencje trzeba posiadać, żeby pracować w takim zespole?
Przede wszystkim trzeba być gotowym na przyswojenie dużej ilości nowej wiedzy – od biologii do specyficznego zakresu machine learningu używanego w kontekście wytwarzania leków.
Sporym wyzwaniem na początku pracy w takiej dziedzinie jest ilość informacji biologicznych o przeciwciałach. Na to nie ma prostego rozwiązania, trzeba poświęcić sporo czasu na czytanie publikacji naukowych i książek.
Dlatego umiejętność szybkiego uczenia się jest tu bardzo przydatna – jak i przygotowanie na dużą dozę przekwalifikowania się. Nikt nie będzie specjalistą w tej domenie od razu, bo kompetencje, których szukamy – specjalistyczna wiedza na temat projektowania leków opartych na przeciwciałach i biegłość w zakresie statystyki/programowania – rzadko występują razem.
Co więcej, ta branża dopiero się tworzy – jeszcze nie tak dawno, nie było technologii, które pozwoliłyby na analizę tak wielkich zbiorów sekwencji przeciwciał i antygenów w sposób zautomatyzowany.
Filarem naszej firmy jest praca naukowa – ale w praktycznym rozumieniu. To dobre zajęcie dla ludzi, którzy są dociekliwi i łatwo się nie zrażają. Trzeba być przygotowanym na wiele porażek po drodze. „Be prepared to fail” to dobre motto dla każdego, kto dołącza do zespołu naukowego.
Czy jest w zespole miejsce na kreatywność? Czy zespół trzyma się ściśle schematów?
Kreatywność jest wymagana w naszej pracy. Nie jesteśmy taśmą produkcyjną – budujemy rozwiązania, które wytwarzają kompletnie nową wiedzę o przeciwciałach. Jesteśmy na granicy poznania. Dlatego trzeba być naprawdę kreatywnym na wielu poziomach: w tym jakie się zadaje pytania naukowe i jak używa się wyników z analiz do wytworzenia wartości dla klientów. Jednocześnie mamy opracowane procesy, o które nasz zespół się opiera w codziennej pracy.
Co daje Ci najwięcej satysfakcji w pracy z zespołem?
Największą satysfakcję sprawia mi to, że będąc jeszcze relatywnie małą firmą, jesteśmy w stanie przynosić wartość naszym klientom – koncernom farmaceutycznym, które funkcjonują globalnie i przodują w opracowywaniu nowych leków. Wtedy dostrzegam innowacyjność naszego podejścia i utrwalam się w przekonaniu, że to, co robimy będzie formowało przyszłość sektora farmaceutycznego, przyspieszając procesy wytwarzania nowych leków i dostarczając pacjentom terapie ratujące życie szybciej.
A co sprawia satysfakcję zespołowi?
Na pewno jest to potrzeba ciągłego rozwoju, co jest spowodowane dynamicznym rozwojem zarówno bioinformatyki/immunologii, jak również powstawaniem nowych modeli i architektur Deep Learningowych do przetwarzania danych sekwencyjnych
Wielu członków zespołu wskazuje też na poczucie, że robią coś ważnego, co może przyczynić się do szybszego powstania nowych leków, a w konsekwencji będzie miało pozytywny wpływ na społeczności na całym świecie.
Kolejną zaletą jest możliwość pracy przy bardzo ciekawej dziedzinie, która szybko się rozwija i dostęp do naszych baz danych, który pozwala wejść w świat przeciwciał na niespotykaną skalę.
Programiści, którzy do nas dołączają szukają wyzwań i okazji do rozwoju, których nie daje praca w projektach komercyjnych.
Naszych czytelników na pewno zaciekawi to, że poszerzacie zespół. Kogo szukacie?
W najbliższym czasie nasz zespół będzie się zajmował rozwijaniem ekosystemu narzędzi Machine Learning do charakterystyki przeciwciał. Obejmuje to pracę nad całym spektrum pola przeciwciał obliczeniowych – od dużych zestawów danych sekwencji, po analizę szczegółów poszczególnych sekwencji i struktur.
Dlatego szukamy osób, które mają doświadczenie w machine learning, data science i bioinformatyce. Jesteśmy też otwarci na współpracę z Python developerami, których interesuje ta tematyka i praca w zespole R&D. Szczegółowe informacje o otwartych stanowiskach znajdziecie na naszej stronie internetowej www.naturalantibody.com.