🧠 Google представил метод, позволяющий уменьшить объём памяти, необходимой для работы больших языковых моделей, сохранив их точность. Технология облегчает увеличение контекстных окон и упрощает масштабирование ИИ‑служб, что особенно ценно для компании с глобальной инфраструктурой, как Google.

