YouTube оголосив про низку оновлень функції автоматичного дублювання відео на основі штучного інтелекту, яка тепер доступна всім користувачам і підтримує 27 мов. Платформа обміну відео, що належить Google, вже певний час працює над додаванням багатомовної аудіопідтримки для відеоконтенту.
Функцію автоматичного дублювання із застосуванням штучного інтелекту YouTube вперше анонсував у 2024 році. Спочатку доступ до неї мала обмежена група авторів контенту, після чого у вересні минулого року функцію було розширено до мільйонів творців контенту по всьому світу.
Ця функція дозволяє переглядати відео мовами, відмінними від рідної мови користувача, а також допомагає авторам розширювати аудиторію. YouTube повідомляє авторам, що використання автоматичного дублювання на основі штучного інтелекту не погіршує показники алгоритмічного пошуку оригінального відео та потенційно може покращувати видимість контенту іншими мовами. Автори, які не бажають використовувати дублювання за допомогою штучного інтелекту, можуть завантажувати власні аудіодоріжки або повністю вимкнути цю функцію.
Під час перегляду відео наявність додаткових мов можна перевірити через значок налаштувань, обравши пункт Audio track у меню. Там відображаються доступні альтернативні мовні аудіодоріжки.
За даними YouTube, у грудні середня кількість користувачів, які щоденно переглядали щонайменше десять хвилин відео з автоматичним дублюванням на основі штучного інтелекту, перевищила шість мільйонів. Водночас використання автоматичного дублювання означає, що іноді система може неточно передавати інтонації автора, емоційне забарвлення мовлення або акустичні особливості середовища запису.
Для часткового вирішення таких нюансів функція Expressive Speech поступово впроваджується для всіх каналів YouTube. Вона підтримує вісім мов: англійську, гінді, французьку, німецьку, індонезійську, італійську, португальську та іспанську. Попередня демонстрація цієї функції відбулася у 2024 році на заході Made by YouTube.
Ця функція розглядається як подальший розвиток технології Expressive Captions, яка компенсує недостатню передачу нюансів мовлення і звукового контексту шляхом додавання акцентів, інтонаційних підказок і стилістичних характеристик у текст субтитрів.
YouTube використовує історію переглядів для визначення мови відтворення відео за замовчуванням. Нова опція Preferred Languages у налаштуваннях дозволяє обирати бажані мови для перегляду відео. У настільній версії потрібно натиснути значок профілю, перейти до Settings, потім до розділу Playback and performance і обрати пункт Add or edit languages у секції Language. Тут можна позначити потрібні мови.
Це налаштування доступне на Android, iOS та у вебверсії сервісу і застосовується до дубльованого аудіо, назв відео та описів. Якщо відео вже доступне однією з обраних мов, YouTube відтворюватиме оригінальну аудіодоріжку без використання автоматичного дублювання.
Платформа також тестує функцію Lip Sync, яка синхронізує рух губ мовця з перекладеним аудіо таким чином, щоб дубльоване відео виглядало максимально природно та близько до оригіналу.
Додатково для авторів впроваджується система Automatic Smart Filtering, яка допомагає визначити ситуації, коли дублювання може бути недоречним для збереження автентичності контенту. Як приклади наводяться музичні відео або відеоблоги без мовлення.
У контексті ширшого використання штучного інтелекту YouTube також нещодавно заявив про намір активніше протидіяти масовому низькоякісному контенту, створеному автоматичними системами, та оголосив про нові інструменти для авторів щодо виявлення і контролю deepfake-матеріалів.



