Отчёт по безопасности Mythos от Anthropic показывает, что компания больше не может полностью измерять то, что создала.

🤖 Anthropic опубликовала отчёт по безопасности своей модели Claude Mythos, в котором признала, что уже не способна полностью измерять и оценивать поведение построенной системы. Несмотря на рост мощности, компания признаёт скрытый кризис контроля, подчёркивая важность дальнейших исследований в области надёжного и интерпретируемого ИИ.