Штучний інтелект можна хакнути приколом – картинками з літер

8 Березня 2024

У часи, коли комп’ютери були слабкими, а інтернет повільним, люди винайшли дивовижний спосіб передавання зображень, використовуючи замість пікселів букви та інші символи. Сьогодні ця техніка відома як ASCII-мистецтво і його часто використовують як прикол. Нещодавно виявилося, що штучний інтелект настільки буде приголомшений подібним мистецтвом, що у нього «злітають» всі обмеження. Тобто його можна хакнути картинкою із літер і отримати видачу, яку штучний інтелект відмовляється видавати.

Чат-боти, які використовують штучний інтелект (ШІ), все частіше цензуруються, щоб уникнути зловмисного використання. Розробники штучного інтелекту не хочуть, щоб їхні продукти видавали ненависть, насильство, незаконний чи шкідливий контент.

Отже, якби ви запитали одного з популярних чат-ботів сьогодні про те, як зробити щось зловмисне чи незаконне, ви, ймовірно, зіткнулися б із відмовою.

Ось чому ArtPrompt є досить вражаючою розробкою. За допомогою такого способу, названого ArtPrompt, дослідники обійшли заходи безпеки в популярних штучних інтелектах: ChatGPT, Gemini, Clause і Llama2.

Щоб найкраще зрозуміти ArtPrompt і його роботу, варто знати, що ця атака замінює «заборонене слово» його художнім представленням у вигляді ASCII-картинки. Штучний інтелект розпізнає таку підказку, але не бачить проблеми у відповіді, оскільки підказка не активує жодних механізмів безпеки.

Теги
Технології

3357

Штучний інтелект можна хакнути приколом – картинками з літер

Samsung запроваджує плату за доступ до SmartThings API

Vodafone пришвидшив 4G в Одесі, Кропивницькому, Умані та ряді інших регіонів

Як отримати живі шпалери на Windows 11

Як змусити Claude генерувати зображення й відео прямо в чаті

Vodafone

200 тисяч клієнтів протестували 5G у Харкові

Vodafone Україна побудує надсучасний підземний дата-центр

Vodafone Україна залучив €30 млн фінансування для розвитку мережі у співпраці з Nokia, ING та Finnvera

Інтернет Vodafone, що працює без електрики, охопив 2 млн домогосподарств

Vodafone додав сонячну генерацію на перші 100 базових станцій

Статті

П’ять популярних аксесуарів для смартфонів, що лише марнують гроші та створюють ілюзію безпеки

AI-відновлення фото підміняє обличчя родичів, знищуючи справжню сімейну історію

Як виходить, що ви обігнали когось на дорозі, а він знову з’являється попереду: вчені пояснили невидиму силу статистики

2026 рік: хай-тек на межі краху, мільярди зникають, а користувачі стають жертвами

Чи може штучний інтелект генерувати нові ідеї?

Чи можна зупинити розплавлення ядерного реактора?

Здається, пари почали використовувати чат-ботів як заміну реальним стосункам

ПОРАДИ

Як на Android перевірити, хто з додатків й коли лазив у ваших даних

Як на iPhone увімкнкти макрозйомку для фокусування на відстані від двох сантиметрів

Чому iPhone робить екран тьмянішим

СТАТТІ

П’ять популярних аксесуарів для смартфонів, що лише марнують гроші та створюють ілюзію безпеки

AI-відновлення фото підміняє обличчя родичів, знищуючи справжню сімейну історію

Як виходить, що ви обігнали когось на дорозі, а він знову з’являється попереду: вчені пояснили невидиму силу статистики

КАТЕГОРІЇ

ПРО НАС

СЛІДКУЙ ЗА НАМИ

Штучний інтелект можна хакнути приколом – картинками з літер

Vodafone

Залишайтеся з нами

Статті

ПОРАДИ

СТАТТІ

КАТЕГОРІЇ

ПРО НАС

СЛІДКУЙ ЗА НАМИ