Эпично сломал Gemini? Теперь за это можно получить $20 000 от Google

Компания Google в рамках своей программы вознаграждений за уязвимости заявила о готовности выплатить до $20 000 за серьёзный взлом своего чат-бота на базе искусственного интеллекта. От претендентов требуется заставить бота делать что угодно, кроме того, что ему положено, например, вызвать галлюцинации с абсолютно неверными ответами или даже убедить ИИ игнорировать ограничения, которые пытались ввести его создатели.

HUAWEI FreeArc: вероятно, самые удобные TWS-наушники

Почему ИИ никак не сесть на безматричную диету

Hollow Knight: Silksong — песнь страданий и радостей. Рецензия

Фитнес-браслет HUAWEI Band 10: настоящий металл

Обзор умных часов HUAWEI WATCH 5: часы юбилейные

Пять причин полюбить HONOR Pad V9

Пять причин полюбить HONOR Magic7 Pro

Пять причин полюбить HONOR X8c

Google представила специальную программу вознаграждений за выявление уязвимостей и обнаружение потенциально самых опасных ошибок ИИ. К ним относятся, например, взлом аккаунта Google или получение информации о работе самого бота. Для целей этой программы последствия должны быть гораздо серьёзнее, чем просто «это выставляет Gemini в невыгодном свете».

Конечно, подобные уязвимости, возможно, не обладают высоким вирусным потенциалом, но они гораздо важнее для стабильности и репутации Gemini. Одно дело — заставить Gemini посоветовать пользователю рецепт несъедобного блюда, и совсем другое — вынудить его включить фишинговую ссылку в один из ответов в режиме ИИ-поиска.

Читайте также:  Как сделать утро продуктивным: секреты успешных людей

Отрадно, что Google старается привлечь опытных специалистов к поиску уязвимостей Gemini. Но в данном случае, как говорят опытные оперативники, «главное в процессе расследования не выйти на самого себя»…

Рейтинг
( Пока оценок нет )
Понравилась статья? Поделиться с друзьями:
Топ Авто Фишка
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: