Когда ИИ-подписки рушатся: почему компаниям пора переходить на локальные модели

Dr. Maik Bunzel

17.06.2026 · 6 мин. чтения

Когда ИИ-подписки рушатся: почему компаниям пора переходить на локальные модели

Тихая бомба замедленного действия за KI-флатрейтами

Это была бизнес-модель, выглядевшая как гениальная находка: фиксированный ежемесячный платёж в обмен на неограниченное использование мощных KI-моделей. ChatGPT Pro за 200 долларов, Claude Max по той же цене — звучит справедливо, пока не заглянешь в машинное отделение. А там открывается расчёт, который становится всё труднее игнорировать.

Аналитическая компания SemiAnalysis провела вычисления: тот, кто действительно использует подписку ChatGPT Pro за 200 долларов в месяц по максимуму — то есть непрерывно запускает agentic Tasks, длительные задачи по написанию кода и сложные Reasoning-Chains, — генерирует затраты, которые по стандартным тарифам API составили бы около 14 000 долларов США. У Claude Max от Anthropic сопоставимая цифра достигает примерно 8 000 долларов. По этим данным, OpenAI начинает нести убытки по подписке ChatGPT Plus уже при загрузке около 11,4 процента. У топовых моделей достаточно всего 5,7 процента интенсивности использования, чтобы уйти в минус.

Это не периферийная техническая проблема. Это структурная трещина в фундаменте нынешней модели KI-бума — и она непосредственно затрагивает бизнес.

Почему agentic KI делает всё дороже

Ключевым фактором, порождающим этот разрыв, является изменение способа использования KI-систем. Классические промпты — один вопрос, один ответ — потребляют сравнительно немного токенов. Agentic Workflows, при которых KI-агент самостоятельно планирует задачи, вызывает Tools, оценивает промежуточные результаты и итерирует, могут, по данным SemiAnalysis, потреблять до 1 000 раз больше токенов, чем простой запрос.

Но именно в этом направлении движется использование KI на предприятиях: от изолированного чат-бота — к полностью автоматизированным Workflows, самостоятельно выполняющим процессы. Dr. Maik Bunzel, основатель и генеральный директор mabucon.eu, наблюдает эту тенденцию ежедневно в работе с корпоративными клиентами: «Переход от "KI как ассистента" к "KI как автономному исполнителю процессов" для многих компаний уже состоялся или вот-вот произойдёт. Именно здесь взрывообразно растёт потребление токенов — а вместе с ним и зависимость от ценовых решений крупных провайдеров».

О том, что это давление реально, свидетельствуют показательные случаи из практики: Microsoft, Meta и Amazon свернули внутренние инициативы, основанные на интенсивном использовании KI, после того как затраты вышли из-под контроля. Широко цитируемый пример: одна компания сожгла за месяц 500 миллионов долларов на Claude от Anthropic — просто потому, что для внутреннего доступа сотрудников не было установлено никаких лимитов.

Модель ценообразования стоит перед развилкой

Провайдеры оказались перед дилеммой, которую невозможно разрешить безболезненно. Флатрейт-модели обеспечили колоссальный рост аудитории — ChatGPT считается приложением, быстрее всех достигшим миллиарда ежемесячных пользователей. Подавить этот импульс повышением цен или введением ограничений рискованно на рынке, где функциональность по-прежнему остаётся ключевым фактором дифференциации.

В то же время в долгосрочной перспективе предлагать мощные Frontier-модели по фиксированной цене нерентабельно. SemiAnalysis прогнозирует, что модели среднего уровня производительности потенциально могут приносить прибыль при стоимости около 20 долларов США в месяц — тогда как абсолютные топ-модели, по всей видимости, будут всё больше доступны исключительно через API-тарифы, то есть с оплатой по факту использования.

«Возможность устанавливать значительную наценку за ИИ будет снижаться. Модели с открытым исходным кодом очень мощные.» — Vishal Misra, Columbia University

Для компаний, которые сегодня ориентируются на фиксированные тарифы и завтра могут столкнуться с резким переходом на оплату по использованию через API, это может обернуться серьёзным ударом — особенно в тех случаях, когда ИИ-агенты глубоко интегрированы в операционные процессы.

Локальные LLM: от нишевого эксперимента к стратегической необходимости

Ответ всё большего числа компаний однозначен: суверенитет через децентрализацию. Вместо того чтобы полностью полагаться на облачных провайдеров, локальные или самостоятельно размещённые Large Language Models интегрируются в собственную инфраструктуру. Преимущества многоуровневые:

Контроль затрат: никаких неожиданностей, связанных с оплатой по использованию, предсказуемые расходы на инфраструктуру.
Защита данных: чувствительные корпоративные данные не покидают собственную инфраструктуру — аспект, особенно критичный в регулируемых отраслях.
Независимость: изменения цен, ограничения использования или Modell-Deprecations со стороны сторонних поставщиков не затрагивают ключевые операции.
Специализация: модели, прошедшие Fine-Tuning на внутренних данных, могут превосходить универсальные Frontier-модели в решении доменно-специфических задач.

Стартап Lindy уже сделал этот шаг и перевёл весь свой трафик на DeepSeek V4, отказавшись от Claude компании Anthropic. Обоснование: сопоставимая производительность при значительно меньших затратах с экономией в миллионы долларов. Это уже не единичный случай, а растущая тенденция.

Одновременно формируется гибридная стратегия: сложные задачи, требующие подлинного Frontier-интеллекта, передаются дорогостоящим моделям через API. Рутинные задачи, извлечение данных, классификации или простые задачи генерации берут на себя более экономичные, локально развёрнутые модели. По имеющимся данным, благодаря такому Model-Routing совокупные затраты можно сократить до 95 процентов.

Что компаниям следует предпринять прямо сейчас

Dr. Maik Bunzel из mabucon.eu рекомендует компаниям, которые уже используют ИИ в рабочих процессах или планируют это сделать, провести систематическую инвентаризацию: «Ключевой вопрос звучит так: какие из моих процессов, поддерживаемых ИИ, критически зависят от конкретного поставщика — и что означал бы для моего бизнеса рост цены в 5 или 10 раз?» Тот, кто не может ответить на этот вопрос сегодня, несёт неоценённый риск.

Конкретно рекомендуется следующий подход:

Отслеживать потребление токенов: Многие компании не имеют чёткого представления о том, какие процессы и сколько токенов потребляют. Это первое слепое пятно.
Выявлять критические зависимости: Какие автоматизации и агенты немедленно зависнут при смене поставщика или изменении тарифов?
Оценивать локальные альтернативы: Модели с открытым исходным кодом — Llama, Mistral или DeepSeek — за последние месяцы существенно выросли в производительности. Proof-of-Concept для некритичных процессов зачастую реализуется быстрее, чем ожидалось.
Внедрять Model-Routing: Не каждая задача требует GPT-4o или Claude Opus. Стратегия многоуровневого распределения значительно снижает затраты без потери качества при выполнении стандартных задач.
Проверять условия договоров: Тем, кто использует API-контингенты, следует понимать, при каких условиях поставщики вправе менять тарифы, — и заблаговременно подготовить соответствующие резервные планы.

Прогноз: рынок перестраивается

Нынешняя ситуация симптоматична для отрасли, находящейся в переходном периоде. Фаза субсидированного привлечения пользователей через модели с фиксированной оплатой подходит к концу. Следующий этап — зрелость рынка: более дифференцированные ценовые структуры, более высокая зависимость стоимости от интенсивности использования топовых моделей и растущая экосистема производительных и экономичных Open-Source-альтернатив.

Для компаний это не угроза, а возможность — при условии, что они действуют уже сейчас. Тот, кто сегодня расширяет основу своей KI-инфраструктуры, интегрирует локальные модели и разрабатывает стратегии маршрутизации, завтра не будет застигнут врасплох повышением цен и не окажется операционно парализован решениями поставщиков. Dr. Maik Bunzel резюмирует это так: «KI-суверенитет — не вопрос идеологии, а вопрос операционной надёжности. Компании, которые это понимают, уже сегодня формируют устойчивость, которая завтра обеспечит им решающее конкурентное преимущество».

Математика, лежащая в основе фиксированных тарифов, никогда не была устойчивой. Вопрос лишь в том, кто первым превратит это понимание в надёжную стратегию.