Искусственный интеллект научили имитировать человеческий голос
Китайская компания Baidu научила свою нейросеть имитировать человеческий голос. Программе пришлось проанализировать аудиозапись длительностью более месяца, пишет Naked Science.
Технология имитации речи получила название Deep Voice. Обучение нейросети проходило с помощью аудиозаписи длительностью в 33 сутки, которая содержала более 2400 образцов человеческого голоса.
В результате программа научилась не просто подражать этим голосам, но и с точностью копировать их тембр и интонацию. Deep Voice также умеет менять голос с женского на мужской и придавать ему тот или иной иностранный акцент. Более того, она способна за минуту обойти системы распознавания голоса.
По мнению авторов разработки, она будет востребована в самых разных сферах жизнедеятельности человека.
Так, с помощью Deep Voice можно озвучивать книги и другие программы, переводить фильмы, и самое главное – существенно облегчит жизнь людям, потерявшим способность издавать звуки.