Дослідники підрозділу штучного інтелекту Facebook AI Research (FAIR) створили нейромережу, яка здатна трансформувати музику з одного стилю, жанру та наборів інструментів в інший. Розробники кажуть, що їхнє рішення працює на рівні або трохи гірше за професіонального музиканта.
Створений у FAIR штучний інтелект здатний, наприклад, отримати на вхід мелодію симфонічного оркестру, який грає Баха, та перетворити її на схожу мелодію, виконану на піаніно в стилі Бетховена. «Наші результати показують можливості, які до сьогодні були небаченими, – кажуть розробники. – У багатьох випадках слухачам складно відрізнити оригінальний файл від трансформованого».
Для досягнення високої якості перетворення музики штучний інтелект використовує автоматичне кодування аудіо. Трансформація відбувається на вищому рівні, ніж звичайна заміна звуків. Завдяки такому підходу рішення FAIR дозволяє виконувати перетворення навіть тих мелодій, з якими нейромережа раніше не стикалася.
Штучний інтелект також здатний легко підробити будь-чий голос: у 2016 році Adobe розробила відповідний сервіс. Він називається Project VoCo, і розробники говорять, що це «фотошоп» для аудіо. Ідея проекту в тому, щоб аудіоредактори могли робити те ж саме, що сьогодні можуть робити фоторедактори. А саме – додавати елементи, яких немає на зображенні. Project VoCo, дозволяє, наприклад, додати до аудіозапису чиєїсь промови слова, яких в оригіналі не було. Програма самостійно розумітиме особливості голосу та зможе його відтворювати. Головне, щоб їй для навчання вистачило матеріалу: потрібно не менше 20 хвилин аудіозапису. «З технологією Project VoCo можна просто надрукувати слово чи слова, які треба вставити в аудіозапис, – кажуть у Adobe. – Алгоритм зробить решту, і результат звучатиме так, ніби доповідач сам сказав ці слова».