Искусственный интеллект научился воссоздавать лицо по голосу

27/05/2019 — 13:49

Фото: Алан Кациев (МТРК «Мир») "«Мир 24»":http://mir24.tv/, хакеры, компьютер, клавиатура, хакер, взлом

Фото: «Мир 24»/ Алан Кациев

Нейросеть, созданная американскими специалистами, научилась «рисовать» лицо человека по спектрограмме его речи.

Программа способна определять по голосу три основных параметра: пол, возраст и расу, сообщает arXiv.org.

Ученые из Массачусетского технологического университета использовали для обучения алгоритма базу из миллиона видеоотрывков, на которых были запечатлены около ста тысяч людей. Каждую запись разделили на видео- и аудиоматериалы.

Одна часть программы на основании видеокадров воссоздавала лицо человека в анфас, другая анализировала спектрограмму речи и создавала примерное изображение говорящего.

В результате, отметили ученые, нейросеть научилась хорошо определять пол, но гораздо менее точно указывала возраст (расхождение с реальностью составляло больше десяти лет). Лучше всего ей «удавались» люди с европеоидной и азиатской внешностью.

Авторы разработки отметили, что не планировали добиться точного портрета, а стремились выделить несколько точных параметров из звуковой дорожки. Этого хватит, чтобы, к примеру, создавать анимационные аватары.

Ранее сообщалось, что российские ученые при помощи нейросети «оживили» портреты исторических личностей: писателя Федора Достоевского, ученого Альберта Эйнштейна, художника Сальвадора Дали. Кроме того, в эксперименте задействовали картину: «Неизвестную» Крамского.

Искусственный интеллект научился воссоздавать лицо по голосу

Последние новости

ЧИТАЙТЕ ТАКЖЕ

Нейробиолог сделала из своего больного сына киборга

Нейросеть займется предсказанием даты смерти человека

Создана нейросеть для составления резюме по фото

Последние новости