🧠 Новый бенчмарк ARC‑AGI‑3, измеряющий истинную генерализацию в незнакомых средах, продемонстрировал огромный разрыв: Gemini набрал 0,37 %, GPT‑5.4 – 0,26 %, а люди – 100 %. Результаты показывают, что текущие модели ещё далеки от настоящего ИИ‑общего интеллекта, опровергая недавние заявления о его достижении.

