Автолента · 23 июня 2026 г., 06:51 мск

Gray Swan: автоматический red-teaming ломает фронтирные модели лучше людей

Система Shade от Gray Swan AI превзошла людей в атаках на современные языковые модели. Prompt injection создаёт новый класс уязвимостей для агентов вроде Claude Code, и первый крупный инцидент безопасности уже предсказуем.

Первоисточник: @latentspacepod на X →

Claude Code Codex

По тем же сущностям

Одна задача, разные результаты: окружение меняет качество AI-кода2 июля 2026 г.
Codex помогает собирать персональный дайджест новостей2 июля 2026 г.
DigitalOcean как площадка для удалённых сессий Codex1 июля 2026 г.
Claude Tag: проактивный мультиплеерный агент на базе Claude Code30 июня 2026 г.
Разработчик снизил автономию ИИ и вернулся к режиму автодополнения30 июня 2026 г.

← Вся лента новостей

💡Gray Swan: автоматический red-teaming ломает фронтирные модели лучше людей

По тем же сущностям

Gray Swan: автоматический red-teaming ломает фронтирные модели лучше людей