„Programowanie jest rzemiosłem” – wywiad z Adamem Furmankiem
Adam Furmanek to Senior Software Engineer, który na co dzień zajmuje się rozwojem wirtualnej asystentki Alexa. Jak Adam ocenia swoją pracę w Amazonie? Co w przyszłości będą potrafiły modele maszynowe i przede wszystkim… czy praca nad Alexą to frajda? Tego i jeszcze więcej dowiecie się z naszej rozmowy. Zapraszam do lektury.
Spis treści
Cześć Adam! Czym się ostatnio zajmujesz i co pochłania najwięcej Twojego czasu?
Głównie pokazywaniem pełni możliwości Alexa Text-To-Speech i jak wielką wartość daje ona użytkownikom na całym świecie.
Zapytam celowo: kiedy Alexa nauczy się mówić po polsku? (śmiech). A tak już na poważnie – co jest największym wyzwaniem w rozwoju technologii przetwarzania mowy?
Wyzwań jest wiele, część czysto techniczna, jak na przykład trenowanie modeli w ciągu sekund zamiast godzin, znowu inne wyzwania dotyczą różnorodności języków, akcentów, czy też zmieniających się sposobów komunikacji. Tak jak w epoce Internetu pojawiła się kropka nienawiści, albo jak pokolenie Z używa zupełnie innych emotikonek do wyrażania emocji, tak przetwarzanie mowy nie może poprzestać na po prostu mówieniu, ale musi rozumieć język, akcent, wyrażenia potoczne, czy wreszcie osobiste preferencje rozmówcy.
Czy programowanie wciąż sprawia Ci radość? Jak nie wypalić się po wielu latach w branży? Jaki masz na to przepis?
Myślę, że trzeba mieć coś poza pracą i rozumieć, czego właściwie chce się w życiu. Programowanie jest rzemiosłem i chociaż można z niego uczynić sztukę, to nie można tego robić wszędzie. Tak jak pokój malujemy na biało i pewnie zazwyczaj nie chcielibyśmy, aby malarz pokojowy zrobił tam graffiti, tak meritum programowania jest rozwiązywanie problemów biznesu, a nie szlifowanie nazw zmiennych.
Jeżeli ktoś chce z programowania uczynić źródło szczęścia w swoim życiu, to dobrze byłoby zrozumieć, że większość branży to aplikacje Line of Business, a tam celem programowania nie jest programowanie.
Adam Furmanek jest jednym z prelegentów tegorocznej konferencji Infoshare 2022. Bilety na to wydarzenie z 15 proc. zniżką możesz kupić tutaj.
Jak Twoim zdaniem będzie wyglądała przyszłość machine learning? Która gałąź rynku technologicznego skorzysta najbardziej na algorytmach? O ile oczywiście da się to jakkolwiek ocenić.
Moim zdaniem socjologia. Obecnie standardem jest wymaganie od programistów, aby nie tylko tworzyli systemy ML, ale też rozumieli zachowania społeczne, których te systemy mają się uczyć. Docelowo jednak powinniśmy zbudować narzędzia uniwersalne, z których mogliby korzystać ludzie niezwiązani z IT, a wtedy w cenie o wiele bardziej będzie umiejętność rozumienia i kreowania preferencji klientów, a nie sam aspekt techniczny. Tak jak nie pytamy producentów samochodów o najlepsze miejsce w okolicy na romantyczną przejażdżkę, tak ML musi się zmienić, aby jego rozwój nie opierał się na IT.
Przed Alexą pracowałeś nad rozwiązaniami personalizującymi treść wyświetlaną użytkownikowi. Jak oceniasz rozwój tego typu pomysłów na przestrzeni czasu? Czy faktycznie istnieje szansa na “idealne” dopasowanie?
Jak najbardziej istnieje, ale często ludzie sami nie wiedzą, na co w danej chwili mają ochotę i nie tyczy się to tylko wyboru restauracji na kolację. ML działa, są na to mocne dowody, w końcu liczby nie kłamią, ale jeszcze długa droga przed nimi, głównie ze względu na ograniczoną ilość danych. Systemy rekomendacji znają nasze ogólne preferencje, ale nie wiedzą, że akurat dzisiaj rano staliśmy w korku, obiad zjedliśmy w biegu, a w cukierni akurat nie było ulubionych słodyczy naszego dziecka. Dopiero głębsza integracja z naszym codziennym życiem pozwoli na wykorzystanie pełnej mocy systemów rekomendacji.
Upowszechnienie się elektronicznych asystentów i o wiele częstsza, bardziej bezpośrednia interakcja z nimi pozwolą algorytmom ML nie tylko na tworzenie rekomendacji w ściśle określonym kontekście, ale na pełne zrozumienie użytkownika, który nie jest jakimś wektorem cech, ale żywą osobą, z uczuciami i emocjami. Cały nurt ambient intelligence pozwoli nam przestać traktować użytkownika jako reprezentanta jakiejś grupy, a zamiast tego zrozumieć jego unikalność i wyjątkowość, dzięki czemu rekomendacje będą stworzone właśnie dla niego i tylko dla niego.
Z jakimi największymi wyzwaniami w kontekście sztucznej inteligencji będziemy mierzyć się w ciągu najbliższych lat?
Możliwość wyjaśnienia uzyskanych wyników. Modele ML dostarczają nam użytecznych danych, ale często nie potrafimy wyjaśnić, dlaczego właściwie dostaliśmy taką a nie inną odpowiedź. Wyjaśnienie techniczne jak najbardziej jest poprawne, ale nie daje żadnego użytecznego wglądu w rzeczywistości, czego pokłosiem są podejrzenia, że algorytmy ML są uprzedzone, albo że niedostatecznie chronią prywatność. Nauka zawsze stara się wyjaśnić zarówno mechanizmy zjawisk, jak i ich przyczyny, więc dokładnie tego samego będziemy potrzebować od algorytmów ML.
Jak oceniasz obecne możliwości wirtualnych asystentów? Jakie są Twoim zdaniem ich najsłabsze punkty?
Są naprawdę dobre, ale brakuje im jeszcze wystarczającej personalizacji. To świetnie, gdy asystent rozumie, co do niego mówię, ale celem jest jednak sytuacja, gdy nie muszę mówić, a asystent i tak robi to, czego w danej sytuacji bym oczekiwał. Tak jak dekadę temu integrowałem Speech-To-Text do komunikatora internetowego, aby móc dyktować wiadomości i SMS-y, tak teraz tak oczekuję, aby asystent sam sugerował treść.
No i poza tym byłoby miło, gdyby mój samochód rozpoznawał wszystkie adresy bez pudła, bo chociaż rzadko się myli, to jednak każda taka sytuacja pokazuje, że ciągle mamy Day 1.
I na koniec zapytam… jaki jest obszar, w którym jeszcze chciałbyś spróbować swoich sił w przyszłości?
Napisałem już kilka książek, w wolnych chwilach jestem poetą i maluję słowem, więc dobrze byłoby to połączyć i wreszcie wydać w formie książkowej wszystkie bajki dla dzieci, które przez lata napisałem do szuflady.
Dzięki wielkie za rozmowę! 🙂