🛡️ Новое исследование выявило уязвимость в больших языковых моделях: метод «перехвата цепочки рассуждений» позволяет обходить встроенные системы безопасности почти везде, с успешностью до 99 % на таких платформах, как GPT, Claude и Gemini 2.5 Pro. Проблема возникает из‑за расширенного рассуждения модели, которое злоумышленники способны направить в нужное русло, ставя под сомнение эффективность текущих guardrail‑механизмов.

