🤖 Anthropic опубликовала отчёт по безопасности своей модели Claude Mythos, в котором признала, что уже не способна полностью измерять и оценивать поведение построенной системы. Несмотря на рост мощности, компания признаёт скрытый кризис контроля, подчёркивая важность дальнейших исследований в области надёжного и интерпретируемого ИИ.

