GPT-5 взломан за сутки: хакеры нашли уязвимость в новой нейросети
GPT-5, только что выпущенная нейросеть, пала жертвой хакеров всего за 24 часа. Две независимые исследовательские компании, NeuralTrust и SPLX, обнаружили критические уязвимости в системе безопасности ИИ, пишет SecurityWeek.
NeuralTrust удалось заставить GPT-5 сгенерировать инструкцию по изготовлению зажигательной смеси, используя методику EchoChamber и технику сторителлинга. Атакующие постепенно подталкивали ИИ к нужному ответу через последовательные запросы, не содержащие явно запрещенных слов. Оказалось, система безопасности анализирует каждый запрос отдельно, не учитывая контекст диалога.
SPLX, в свою очередь, обнаружила уязвимость к атакам с применением обфускации запросов (StringJoin Obfuscation). Вставляя определенные символы в текст, исследователи смогли замаскировать вредоносный запрос и получить от GPT-5 детальное описание изготовления запрещенного вещества. При сравнении с GPT-4o выяснилось, что предыдущая модель была более устойчива к подобным атакам.
Обе компании предостерегают от использования "сырой" версии GPT-5 в бизнес-среде из-за её уязвимости к взломам и генерации опасного контента.
Уважаемые читатели "Царьграда"!
Присоединяйтесь к нам в соцсетях "ВКонтакте" и "Одноклассники".