Новий генератор AudioCraft від Meta (нова назва Facebook) створить звук із тексту. Описавши бажану мелодію кількома словами можна отримати готовий трек. При цьому не буде проблем із правовласниками. Це дозволяє вирішити проблему звукового фону для кафе, ресторанів, залів очікувань, конференцій та інших публічних місць. Адже вільно відтворювати музику в публічних місцях не можна – заборонено законом, і в Україні, наприклад, є низка організацій, які заробляють на тому, що шукають порушників режиму публічного відтворення контенту.
Публічне відтворення музики чи відео без дозволу однієї з організацій колективного управління авторськими та суміжними правами обійдеться в кругленьку суму. Наприклад, в 2020 році одна з таких організацій – ГС УЛАСП – виграла позов проти київський ресторану «TEQUILA HAUSE». Суд у справі № 910/17583/19 зобов’язав ресторан сплатити загалом 187 785 гривень – по 19 210 грн за кожний трек.
З музикою від штучного інтелекту AudioCraft власникам бізнесів чи організаторам публічних подій можна бути спокійними за авторське право. Адже, якщо зазвичай штучний інтелект тренують на знайденому в інтернеті контенті, що викликає питання у правовласників, генератор AudioCraft тренувався на ліцензійній музиці, дозволом на використання якої володіє Facebook.
Технологічний гігант також ділиться творчими результатами, які люди отримають, використовуючи його генератор. Ви вже можете почути сотні семплів, згенерованих інструментом штучного інтелекту, від диско 80-х до джазової інструментальної музики до, наприклад, розмови чоловіка з багатьма людьми, які аплодують на задньому плані.
AudioCraft складається з трьох моделей штучного інтелекту: MusicGen, AudioGen та EnCodec. MusicGen генерує музику з тексту, AudioGen – генерує звуки з тексту. EnCodec перетворює їхню роботу на фінальний звуковий файл.
Усі три моделі доступні публічно в форматі відкритого вихідного коду (https://github.com/facebookresearch/audiocraft). Тобто зацікавлена людина може натренувати їх на власному наборі даних, отримуючи унікальні мелодії та звуки.