Общ

Тази нова технология за синтез на реч може да фалшифицира гласа на всеки


С бързото развитие в изграждането на човекоподобни роботи, следващата предвидима стъпка в тази ера на изкуствен интелект е да ги съчетаем с гласове от реалния живот. И точно това направи базираната в Монреал стартираща компания, като представи първата в света технология за синтез на реч, която може да възпроизведе гласа на всеки. Внимавайте Siri и Alexa, скоро може да се окажете остарели!

[Източник на изображението: Pixabay]

Как работи?

Lyrebird, основана от трима доктори. студенти от университета в Монреал, разработи решение за синтез на реч, което е в състояние точно да копира нечий глас с дадена емоция.

Синтезът прави това, като анализира само няколко десетки секунди аудиозапис. Като записва една минута нечий глас, Lyrebird може да компресира аудио ДНК на този човек в уникален ключ. След това генераторът на AI реч може да произвежда всяка реч със съответния гласов диапазон. Ако не искате да фалшифицирате гласа на някой, когото познавате или използвате своя, можете да проектирате уникален глас за използване в приложението си. Също така има богат избор от хиляди предварително дефинирани гласове, от които можете да избирате. Разбира се, целият генератор на AI реч не би бил толкова специален, ако беше монотонен като сегашните цифрови гласове. Синтетичният вокален генератор на Lyrebird може да контролира емоцията на генерираните гласове, давайки им гняв, съчувствие, стрес и много повече човешки изражения. Но истинският акцент на този нов, цифров генератор на глас е способността му да произвежда 1000 изречения за по-малко от половин секунда! Това поставя технологията на Lyrebird в челните редици на синтеза на реч на ИИ.

Един от съоснователите на Lyrebird, Александър де Бребисън, говори за това как тяхната новоразработена технология не изисква толкова много информация, за да генерира гласове, подобни на подобни.

"Различните гласове споделят много информация. След като научихме гласовете на няколко говорители, изучаването на глас на цял нов говорител става много по-бързо. Ето защо не ни трябват толкова много данни, за да научим напълно нов глас. Повече данни все пак определено ще помогнат , все пак една минута е достатъчна, за да улови голяма част от гласовата ДНК ".

API, който се разработва, ще бъде надежден за учене дори от шумни записи. Текущата версия на технологията използва различни интонации от гласа на един човек, като това генерира вокални записи на Доналд Тръмп.

Етични въпроси

Много изследователски изследвания неизбежно се сблъскват с етични критици и често са разпитвани относно предназначението на техните открития. Синтезът на реч на Lyrebird се сблъсква с няколко етични проблема, като кражба на самоличност, тъй като е необходима само много кратка аудиозапис, за да се възпроизведе нечий глас. Особено, ако и когато генераторът на реч бъде пуснат за обществеността, ще бъде трудно да се контролира, след като милиони хора имат достъп до технологията. Освен това доказателствата за запис на глас по наказателни дела също могат да бъдат направени невалидни, тъй като може да се твърди, че аудиофайлът е фалшифициран или е подправен.

Това обаче не е предназначението на този синтез на речта. Основателите на Lyrebird се стремят да прилагат технологията по положителен начин като личен помощник, като например за четене на книги с известни гласове. Той е насочен и към хора с увреждания, които могат да използват синтеза на речта, за да им помогнат да говорят. Известен пример за това е компютърният глас, който използва Стивън Хокинг. Освен това технологията може да се използва широко в анимационни филми и студия за видео игри.

Технологията на Lyrebird все още се разработва, но заинтересованите лица могат да се абонират за началния уебсайт, за да станат бета-тестер или да бъдат информирани за старта.

ЧрезLyrebird

ВИЖТЕ СЪЩО: Това устройство с мозъчен компютър дава глас на онези, които не могат да говорят


Гледай видеото: Rupal Patel: Synthetic voices, as unique as fingerprints (Юни 2021).