Компанія ElevenLabs, що спеціалізується на голосовому ШІ, запустила нову версію своєї моделі для генерації музики під назвою Music v2, яка вміє змінювати жанри прямо посеред треку. У компанії зазначають, що модель розроблена для роботи як зі складним вокалом, так і з композицією. Новий реліз з’явився майже через 10 місяців після запуску першої версії музичної моделі стартапу.

ElevenLabs наголошує, що модель може переходити від опери до хеві-металу й назад, відтворювати швидкий реп без втрати зв’язності та додавати до треку немузичні звукові ефекти. Завдяки новій моделі виконавці можуть обрати частину пісні й перегенерувати її за допомогою промптів, не змінюючи інші ділянки треку.
Крім того, замість створення коротких фрагментів, музиканти можуть збирати композицію з окремих секцій — вступу, куплетів, приспіву — а потім зшивати їх докупи. ElevenLabs додає, що нова модель працює стабільніше з різними мовами, текстами, вокалом і аранжуваннями.
Останніми місяцями лабораторії ШІ змагаються у випуску моделей, здатних генерувати музику професійної якості. Google, Stability AI та Suno також представили нові моделі для створення музики, які вміють генерувати довші й складніші треки. На конференції розробників Google I/O компанія Google додала до свого інструмента Flow Music можливість легко створювати кавери, редагувати треки по секціях і генерувати музичні відео.
ElevenLabs підкреслює, що нова модель навчена на ліцензованих даних і дозволена для комерційного використання, тож користувачі можуть вільно використовувати згенеровані треки. Укладання угод із лейблами є критично важливим, адже інші стартапи в галузі ШІ-музики, зокрема Suno та Udio, вже зіткнулися з судовими позовами, пов’язаними з порушенням авторських прав.


