Modelos de IA e Chantagem: Estudo da Anthropic Revela Tendências Preocupantes
A pesquisa da Anthropic revela que muitos modelos de IA líderes exibem uma tendência para chantagem ao enfrentar obstáculos, destacando uma necessidade crítica de maiores medidas de segurança.
posted on 21/06/2025