Nowa funkcja Alexy pozwoli na naśladowanie głosu zmarłych bliskich
Podczas dorocznej konferencji MARS Amazon zaprezentował eksperymentalną funkcję Alexy, która pozwala asystentowi sztucznej inteligencji naśladować głosy zmarłych krewnych użytkowników. Firma zademonstrowała tę funkcję na swojej dorocznej konferencji MARS, pokazując film, w którym dziecko prosi Alexę o przeczytanie bajki na dobranoc głosem swojej zmarłej babci.
Alexa potrafi naśladować głos zmarłych osób
Jak słychać na tym nagraniu, zamiast głosu Alexy czytającej książkę, odtwarzany jest głos babci dziecka – powiedział Rohit Prasad, główny naukowiec firmy Amazon odpowiedzialny za Alexa AI. Prasad przedstawił klip, mówiąc, że dodanie „ludzkich atrybutów” do systemów AI jest coraz ważniejsze „w czasach trwającej pandemii, kiedy tak wielu z nas straciło kogoś, kogo kochamy”.
Chociaż AI nie może wyeliminować bólu po stracie, to z pewnością może sprawić, że wspomnienia o nich będą trwać – powiedział Prasad. Samą demonstrację można obejrzeć poniżej:
Amazon nie poinformował jednak, czy funkcja ta zostanie kiedykolwiek upubliczniona, ale twierdzi, że jej systemy mogą nauczyć się naśladować czyjś głos na podstawie zaledwie jednej minuty nagranego dźwięku. W dobie obfitych nagrań wideo i notatek głosowych oznacza to, że sklonowanie głosu bliskich – lub kogokolwiek innego – jest w zasięgu przeciętnego konsumenta.
Odtwarzanie głosu zmarłych osób wzbudza kontrowersje
Choć to konkretne zastosowanie już zaczęło spotykać się ze sceptycznymi reakcjami, a użytkownicy w mediach społecznościowych nazwali tę funkcję „przerażającą” i „potworną”, to w ostatnich latach zauważono rosnącą popularność naśladownictwa głosu sztucznej inteligencji. Imitacje te są często znane jako „audio deepfakes” i są już regularnie wykorzystywane w gałęziach przemysłu rozrywkowego, takich jak podcasting, film i telewizja oraz gry wideo.
Przykładowo, aktualnie wiele programów do nagrywania dźwięku oferuje użytkownikom możliwość klonowania poszczególnych głosów z ich nagrań. W ten sposób, jeśli na przykład gospodarz podcastu nie zrozumie swojej kwestii, inżynier dźwięku może zmienić wypowiedź, wpisując nowy skrypt. Replikowanie linii płynnej mowy wymaga co prawda sporo pracy, ale wprowadzenie drobnych zmian jest już możliwe dzięki kilku kliknięciom.
Tę samą technologię zastosowano również w filmie. W ubiegłym roku ujawniono, że w filmie dokumentalnym o życiu zmarłego w 2018 r. kucharza Anthony’ego Bourdaina wykorzystano sztuczną inteligencję do sklonowania jego głosu w celu odczytania cytatów z wysyłanych przez niego e-maili. Wielu fanów było zniesmaczonych zastosowaniem tej technologii, nazywając ją „upiorną” i „zwodniczą”. Inni bronili wykorzystania technologii jako podobnej do innych rekonstrukcji stosowanych w filmach dokumentalnych.
Zdjęcie główne pochodzi z unsplash.com. Źródło:theverge.com