П’ятниця, 22 Листопада, 2024

Штучний інтелект можна хакнути приколом – картинками з літер

У часи, коли комп’ютери були слабкими, а інтернет повільним, люди винайшли дивовижний спосіб передавання зображень, використовуючи замість пікселів букви та інші символи. Сьогодні ця техніка відома як ASCII-мистецтво і його часто використовують як прикол. Нещодавно виявилося, що штучний інтелект настільки буде приголомшений подібним мистецтвом, що у нього «злітають» всі обмеження. Тобто його можна хакнути картинкою із літер і отримати видачу, яку штучний інтелект відмовляється видавати.

Чат-боти, які використовують штучний інтелект (ШІ), все частіше цензуруються, щоб уникнути зловмисного використання. Розробники штучного інтелекту не хочуть, щоб їхні продукти видавали ненависть, насильство, незаконний чи шкідливий контент.

Отже, якби ви запитали одного з популярних чат-ботів сьогодні про те, як зробити щось зловмисне чи незаконне, ви, ймовірно, зіткнулися б із відмовою.

Ось чому ArtPrompt є досить вражаючою розробкою. За допомогою такого способу, названого ArtPrompt, дослідники обійшли заходи безпеки в популярних штучних інтелектах: ChatGPT, Gemini, Clause і Llama2.

Щоб найкраще зрозуміти ArtPrompt і його роботу, варто знати, що ця атака замінює «заборонене слово»     його художнім представленням у вигляді ASCII-картинки. Штучний інтелект розпізнає таку підказку, але не бачить проблеми у відповіді, оскільки підказка не активує жодних механізмів безпеки.

 

НАПИСАТИ ВІДПОВІДЬ

Коментуйте, будь-ласка!
Будь ласка введіть ваше ім'я

Євген
Євген
Євген пише для TechToday з 2012 року. Інженер за освітою. Захоплюється реставрацією старих автомобілів.

Vodafone

Залишайтеся з нами

10,052Фанитак
1,445Послідовникислідувати
105Абонентипідписуватися