Понедельник, 18 ноября, 2024

Искусственный интеллект можно хакнуть приколом – картинками из букв

Во времена, когда компьютеры были слабыми, а интернет медленным, люди изобрели удивительный способ передачи изображений, используя вместо пикселей буквы и другие символы. Сегодня эта техника известна как ASCII-искусство и его часто используют как прикол. Недавно оказалось, что искусственный интеллект настолько будет ошеломлен подобным искусством, что у него «взлетают» все ограничения. То есть его можно хакнуть картинкой из букв и получить выдачу, которую искусственный интеллект отказывается выдавать.

Чат-боты, использующие искусственный интеллект (ИИ), все чаще цензурируются во избежание злонамеренного использования. Разработчики искусственного интеллекта не хотят, чтобы их продукты выдавали ненависть, насилие, незаконный или вредоносный контент.

Итак, если бы вы спросили одного из популярных чат-ботов сегодня о том, как совершить что-то злонамеренное или незаконное, вы, вероятно, столкнулись бы с отказом.

Вот почему ArtPrompt довольно впечатляющая разработка. С помощью такого способа, названного ArtPrompt, исследователи обошли меры безопасности в популярных искусственных интеллектах: ChatGPT, Gemini, Clause и Llama2.

Чтобы лучше понять ArtPrompt и его работу, следует знать, что эта атака заменяет «запретное слово» его художественным представлением в виде ASCII-картинки. Искусственный интеллект распознает такую ??подсказку, но не видит проблемы в ответе, поскольку подсказка не активирует никаких механизмов безопасности.

 

НАПИСАТИ ВІДПОВІДЬ

Коментуйте, будь-ласка!
Будь ласка введіть ваше ім'я

Євген
Євген
Евгений пишет для TechToday с 2012 года. По образованию инженер,. Увлекается реставрацией старых автомобилей.

Vodafone

Залишайтеся з нами

10,052Фанитак
1,445Послідовникислідувати
105Абонентипідписуватися