Samodiagnozowanie stanu zdrowia przy użyciu AI będzie możliwe już niedługo? Wywiad z Przemkiem Jaworskim z MX Labs
Choć zastosowanie sztucznej inteligencji w ulepszaniu jakości codziennego życia nadal budzi pewne kontrowersje, to AI towarzyszy nam już na wielu płaszczyznach, we wręcz niezauważalny sposób. Wciąż poznajemy też coraz to nowsze rozwiązania, które mogą zastąpić pracę wykonywaną do tej pory tylko przez człowieka. W rozmowie z Przemkiem Jaworskim z MX Labs poruszyliśmy kwestię deep learningu oraz widzenia maszynowego, dzięki którym możliwa będzie skuteczna diagnoza stanu zdrowia bez ingerencji lekarza.
Spis treści
Jak zainteresowałeś się widzeniem maszynowym oraz sztuczną inteligencją?
Moje pierwsze kontakty z widzeniem maszynowym to zajęcia z machine learningu na University College of London, podczas moich studiów podyplomowych ponad dziesięć lat temu. Studiowałem wtedy techniki algorytmiczne w designie i architekturze, których później używałem przez wiele lat w pracy zawodowej.
Od tamtego czasu nastąpił ogromny postęp, nie tylko w zakresie samej analizy obrazu, ale także w zakresie narzędzi do pracy ze sztuczną inteligencją. Niesamowite jest jak szybko te tematy się rozwijają. Cieszę się bardzo, że mogę teraz ich używać w kontekście diagnostyki zdrowia człowieka.
Jaka historia stoi za spółką MX Labs? Dlaczego powstała i jaka idea stoi za Waszymi przedsięwzięciami?
Pomysł na MX Labs zrodził się podczas moich spotkań z Remim Kościelnym (założycielem Vivid Games) ok. 2 lata temu. Jako że obaj mamy background w tzw. ‘demoscenie’, od lat mieliśmy do czynienia z różnymi technikami programowania. Któregoś razu opowiedziałem mu o moich przemyśleniach na temat produktu typu ‘smart mirror’, który mógłby za pomocą kilku kamer generować szczegółowy trójwymiarowy model twarzy człowieka i porównywać wykryte w niej zmiany każdego dnia. Stąd niedaleko już do diagnostyki medycznej, oczywiście popartej odpowiednią wiedzą naukową.
Remi zainteresował się pomysłem, był jednak sceptyczny co do tworzenia specjalistycznego hardware’u. Początkowo trudno mi było wyobrazić sobie inny sposób na budowę takiego systemu, chociażby ze względu na to, że użycie dwóch lub więcej kamer pozwala na łatwą fotogrametryczną rekonstrukcję widzianego obiektu w 3D. Po namyśle jednak stwierdziłem, że możliwość globalnego skalowania technologii w postaci np. apki mobilnej jest dużo atrakcyjniejsza, a jedna kamera także daje możliwość rekonstrukcji 3D, chociaż z pewnością jest to trudniejsze.
Pomimo tego, iż firma istnieje zaledwie półtora roku, pozyskaliśmy w szybkim tempie już drugą rundę finansowania w wysokości 2.0 mln $. Wśród naszych inwestorów znajdują się międzynarodowe fundusze inwestycyjne z Finlandii, Polski i Singapuru jak również uznani aniołowie biznesu.
Waszym głównym produktem jest Shen.AI. Co chcielibyście osiągnąć? Jaki stawiacie sobie cel?
Shen.AI jest technologią mającą na celu umożliwienie ludziom samo-diagnozowania stanu swojego zdrowia za pomocą smartphone’a, tableta lub komputera wyposażonego w kamerę. Ludzka twarz kryje w sobie olbrzymią ilość informacji, które są dla gołego oka niewidoczne, ale mogą być wydobyte przez techniki widzenia maszynowego i sztucznej inteligencji.
Na przykład, wykorzystując m.in. zdalną fotopletyzmografię, można w kilkadziesiąt sekund dowiedzieć się, jaki dana osoba ma puls, poziom stresu, liczbę oddechów na minutę, czy ciśnienie krwi. Za pomocą innych technik można też zbadać podstawowe ludzkie emocje, ocenić stan zdrowia skóry, poziom natlenienia krwi, czy też np. występowanie niedoborów mikroelementów.
Każda firma ma kulturę, która wynika z przyzwyczajeń czy dążeń zespołu do perfekcji. Czego szukacie wśród przyszłych pracowników? Jakie cechy sprawią, że wpasują się do Waszego zespołu?
Przy zakładaniu MX Labs szukaliśmy osób, które są kompatybilne z naszą wizją rozwoju firmy i produktu, a jednocześnie mają odwagę do podważania kierunku działań, które uznajemy za słuszne. Kultura naszej firmy oparta jest na wzajemnym zaufaniu, otwartości, odpowiedzialności i elastyczności pracy – m.in w zakresie nieograniczonego płatnego urlopu.
Dla nas wyjątkowy i efektywny zespół, to zespół różnorodny i otwarty na różne sposoby patrzenia na świat. Już na etapie rekrutacji staramy się wychwycić, co w kandydatach jest wyjątkowe, co stanowi ich niepowtarzalny sposób funkcjonowania, który w połączeniu z ich mocnymi stronami, umiejętnościami i doświadczeniem, daje niesamowitą motywację i siłę do działania.
Budujemy silny zespół nie tylko poprzez wspieranie różnic, równie ważną wartością jest dla nas zaufanie i autentyczność, która przejawia się w tworzeniu trwałych relacji. W mojej ocenie takie połączenie pozwala nam wznosić się na wyższy poziom współpracy i wzajemnie motywować do sięgania po to, co z pozoru niemożliwe.
W jakiej dziedzinie poszukujecie specjalistów?
Poszukujemy zdolnych inżynierów oprogramowania, aby nasze rozwiązania mogły działać ‘on device’ bez zarzutu. Szukamy też osób doświadczonych w widzeniu maszynowym oraz w analizie sygnałów (digital signal processing – DSP). Twarz każdego człowieka pulsuje niewidzialnymi zmianami koloru skóry, kiedy przepływa przez nią natleniona krew.
Każdy milimetr kwadratowy policzka, czoła czy nosa pulsuje trochę inaczej. Różne są amplitudy, kształty fali, czy inne parametry – to wszystko jest wielowymiarowym, skomplikowanym, ale też fascynującym zbiorem informacji. Dlatego tak istotne jest dla nas pozyskanie najlepszych specjalistów z takich dziedzin jak DSP, Computer Vision oraz Deep Learning.
W jaki sposób deep learning przydaje się w analizie sygnałów?
W przypadku danych w postaci złożonych sygnałów klasyczne metody ich analizy nie zawsze pozwalają na identyfikację i ekstrakcję odpowiednich cech sygnałów, które można byłoby następnie z sukcesem wykorzystać w modelach do estymacji lub predykcji różnych parametrów fizjologicznych. Dzięki deep learningowi jesteśmy w stanie wydobyć z danych dużo więcej informacji niż bazując na klasycznych metodach, własnych obserwacjach oraz wiedzy dostępnej w publikacjach naukowych.
Jednakże o ile sam dobór odpowiedniej sieci neuronowej i jej konfiguracja mogą być pewnym wyzwaniem, to dużo większym problemem jest często zgromadzenie i przygotowanie danych, na których taka sieć będzie się uczyć. Nie jest to zadanie trywialne, szczególnie w przypadku danych pozyskiwanych ze świata rzeczywistego a nie w warunkach laboratoryjnych. Do naszych celów pozyskaliśmy do tej pory kilkanaście tysięcy nagrań video twarzy osób z Azji, Afryki i Europy, wraz z odpowiednimi metadanymi, na których uczą się teraz nasze modele. W tym roku takich danych zbierzemy ponad trzydzieści tysięcy.
Co w Waszej firmie może być atrakcyjne dla inżynierów sztucznej inteligencji poszukujących nowych perspektyw rozwoju?
Pracując w dziedzinie sztucznej inteligencji można zetknąć się z problemem powtarzalności tematyki projektów. Wiele ze stosowanych technik nie wymaga kreatywnego wkładu inżynierów, tylko zastosowania standardowych podejść a nawet gotowych implementacji.
Wyzwanie, którym się zajmujemy jest unikatowe, ponieważ dostępność odpowiednich danych medycznych, które nadawałyby się do stosowania architektur sieci głębokich jest mocno ograniczona. Wymusza to na nas stosowanie nieszablonowych pomysłów i wykazywanie się kreatywnością. W przyszłości planujemy na przykład wykorzystać inne, dodatkowe typy danych, takie jak sygnały ruchu lub dźwięku.
O ile dziedziny typu NLP czy Computer Vision zostały już dawno zdominowane przez Deep Learning, to analiza sygnałów medycznych wciąż jest obszarem ze sporym potencjałem do eksploracji w tym zakresie. Dlatego właśnie szukamy ludzi otwartych i chcących stale się rozwijać. Osób, które lubią rozpracowywać technicznie trudne a zarazem ważne dla ludzkości problemy w zespole podobnych do siebie specjalistów, w kulturze zaufania i elastyczności.
Przemek Jaworski. Projektant, programista, przedsiębiorca z doświadczeniem w tworzeniu produktów i oprogramowania. Założyciel m.in. ZMorph S.A., znanego na całym świecie producenta multifunkcyjnych drukarek 3d. Z wykształcenia Inżynier Architekt, po ukończeniu studiów na Politechnice Wrocławskiej wyjechał do Londynu, gdzie pracował w renomowanych firmach architektonicznych. W międzyczasie ukończył drugie studia na University College of London, na kierunku Adaptive Architecture and Computation, gdzie badał techniki modelowania 3D wspomagane sztuczną inteligencją.