Искусственный интеллект можно хакнуть приколом – картинками из букв

8 марта 2024

Во времена, когда компьютеры были слабыми, а интернет медленным, люди изобрели удивительный способ передачи изображений, используя вместо пикселей буквы и другие символы. Сегодня эта техника известна как ASCII-искусство и его часто используют как прикол. Недавно оказалось, что искусственный интеллект настолько будет ошеломлен подобным искусством, что у него «взлетают» все ограничения. То есть его можно хакнуть картинкой из букв и получить выдачу, которую искусственный интеллект отказывается выдавать.

Чат-боты, использующие искусственный интеллект (ИИ), все чаще цензурируются во избежание злонамеренного использования. Разработчики искусственного интеллекта не хотят, чтобы их продукты выдавали ненависть, насилие, незаконный или вредоносный контент.

Итак, если бы вы спросили одного из популярных чат-ботов сегодня о том, как совершить что-то злонамеренное или незаконное, вы, вероятно, столкнулись бы с отказом.

Вот почему ArtPrompt довольно впечатляющая разработка. С помощью такого способа, названного ArtPrompt, исследователи обошли меры безопасности в популярных искусственных интеллектах: ChatGPT, Gemini, Clause и Llama2.

Чтобы лучше понять ArtPrompt и его работу, следует знать, что эта атака заменяет «запретное слово» его художественным представлением в виде ASCII-картинки. Искусственный интеллект распознает такую ??подсказку, но не видит проблемы в ответе, поскольку подсказка не активирует никаких механизмов безопасности.

Теги
Технологии

802

Искусственный интеллект можно хакнуть приколом – картинками из букв

Как убрать громкий бип в конце звонка на Android

Intel не продала ни одного процессора Arrow Lake в крупнейшем розничном магазине Германии — продажи Core Ultra 200S стагнируют

На 25 кг легче: NASA показало, в чем люди будут ходить после возвращения на Луну

Ноутбуков Huawei уже не будет, неизвестно, навсегда ли

Vodafone

200 тысяч клиентов протестировали 5G в Харькове

Vodafone Ukraine построит современный подземный дата-центр

Vodafone Украина привлекла €30 млн финансирования для развития сети в сотрудничестве с Nokia, ING и Finnvera

Интернет Vodafone, работающий без электричества, охватил 2 млн домохозяйств

Vodafone добавил солнечную генерацию на первые 100 базовых станций

Статті

Этот научно-фантастический концепт Лунного кольца может отправить на Землю бесконечную чистую энергию

Конкуренция миллиардеров на орбите: кто первым высадит людей на Луну

Пять популярных аксессуаров для смартфонов, что лишь тратят деньги и создают иллюзию безопасности

AI-восстановление фото подменяет лица родственников, уничтожая настоящую семейную историю

Как выходит, что вы обогнали кого-то на дороге, а он снова появляется впереди: ученые объяснили невидимую силу статистики

2026 год: хай-тек на грани краха, миллиарды исчезают, а пользователи становятся жертвами

Может ли искусственный интеллект генерировать новые идеи?

ПОРАДИ

Как настроить двухфакторную аутентификацию и ограничить доступ сторонних программ к вашему Apple ID

Как запретить Google обучать ИИ на данных вашего поиска

Как на Android проверить, кто из приложений и когда лазил в ваших данных

СТАТТІ

Этот научно-фантастический концепт Лунного кольца может отправить на Землю бесконечную чистую энергию

Конкуренция миллиардеров на орбите: кто первым высадит людей на Луну

Пять популярных аксессуаров для смартфонов, что лишь тратят деньги и создают иллюзию безопасности

КАТЕГОРІЇ

ПРО НАС

СЛІДКУЙ ЗА НАМИ

Искусственный интеллект можно хакнуть приколом – картинками из букв

Vodafone

Залишайтеся з нами

Статті

ПОРАДИ

СТАТТІ

КАТЕГОРІЇ

ПРО НАС

СЛІДКУЙ ЗА НАМИ