Автолента ·
Gray Swan: автоматический red-teaming ломает фронтирные модели лучше людей
Система Shade от Gray Swan AI превзошла людей в атаках на современные языковые модели. Prompt injection создаёт новый класс уязвимостей для агентов вроде Claude Code, и первый крупный инцидент безопасности уже предсказуем.
Первоисточник: @latentspacepod на X →