Поки в судах точаться суперечки щодо неправомірного використання текстів, зображень та музики для тренування штучного інтелекту, Google змінив власну політику. З новою редакцією пошуковий гігант дозволив собі використовувати будь-який доступний публічно в інтернеті контент для тренування своїх штучних інтелектів, таких як Bard і Cloud AI.
Google оновив свою політику конфіденційності, заявивши, що може використовувати загальнодоступні дані для навчання своїх моделей штучного інтелекту. Технологічний гігант змінив формулювання своєї політики на вихідних і замінив «моделі AI» на «мовні моделі». Він також заявив, що може використовувати загальнодоступну інформацію для створення не лише функцій, але й повноцінних продуктів, таких як «Перекладач Google, Bard і можливості Cloud AI». Оновлюючи свою політику, він повідомляє людям і дає зрозуміти, що все, що вони публічно публікують в інтернеті, може використовуватися для навчання Bard, його майбутніх версій і будь-якого іншого генеративного продукту штучного інтелекту, розробленого Google.
Критики висловлюють занепокоєння щодо використання компаніями інформації, розміщеної в інтернеті, для навчання своїх великих мовних моделей. Було подано груповий позов проти OpenAI, яка створила ChatGPT, звинувачуючи компанію у збиранні без попередньої згоди великих обсягів особистих даних з інтернету, включаючи викрадену особисту інформацію.
Власники веб-сайтів, які можна вважати публічними площами в епоху цифрових технологій, також вжили заходів, щоб або запобігти буму генеративного штучного інтелекту, або отримати з нього вигоду. Reddit почав стягувати плату за доступ до створеного користувачами цієї платформи контенту. Twitter встановив обмеження на кількість твітів, які користувач бачить на день, щоб подолати екстремальний рівень збирання даних та системних маніпуляцій.