Фотографії не потрібні: нейромережа генерує обличчя людини за її мовленням

Алгоритм за голосом розпізнає маркери, що вказують на стать, вік, етнічну приналежність.

Штучний інтелект може легко впізнати будь-яку людину, навіть лише послухавши кілька сказаних нею фраз. Аналізуючи особливості мовлення, нейромережа здатна створити фотографію автора сказаних слів.

Алгоритм під назвою Named Speech2Face імітує роботу людського мозку. Йому «згодували» 100 000 відео з інтернету, в яких люди розмовляють. З такої бази даних нейромережа змогла встановити зв’язок між обличчям людини та особливостями її голосу та мовлення.

Ефективність нейромережі поки не 100%, хоча й вражає. Алгоритм за голосом розпізнає маркери, які вказують на стать, вік, етнічну приналежність. Через це він не здатний створити з голосу фотографію конкретної людини, у нього швидше виходить якесь середнє обличчя. Усі фотографії, які створює Speech2Face, мають ракус анфас.

Днями інші дослідники створили нейромережу, яка здатна будь-якій людині на відео вкласти у вуста будь-які слова. Від користувача потрібно лише надрукувати текст, який має вимовити така «балакуча голова». Для тренування нейромережі на особливості міміки та рухів конкретної людини потрібно лише 40 хвилин відеоматеріалу.

Іншу нейромережу навчили симулювати відео з однієї фотографії. Створені таким чином рухи навіть можуть імітувати мову (ну або щось на неї схоже).

НАПИСАТИ ВІДПОВІДЬ

Коментуйте, будь-ласка!
Будь ласка введіть ваше ім'я