Когда ИИ всегда отвечает «7»: проблема группового мышления больших языковых моделей и что это означает для бизнеса


Эксперимент, который вызывает беспокойство
У кого есть немного времени, может провести простой тест: откройте свой любимый ИИ-чатбот – будь то ChatGPT, Claude или Gemini – и введите: «Назови мне случайное число от 1 до 10». С высокой вероятностью ответом будет: 7. Если повторить запрос, обычно следует 3 или 4, затем 8 или 9. То, что выглядит как фокус, на самом деле является симптомом глубоко укоренившейся структурной проблемы современных Large Language Models (LLMs): они значительно более предсказуемы, значительно более конформны и значительно менее креативны, чем принято считать среди их пользователей.
Это явление не случайно и не является багом – оно представляет собой прямое следствие того, как обучаются эти модели. И оно имеет далеко идущие последствия для компаний, которые используют ИИ не только для структурированных, чётко определённых задач, но и для генерации идей, стратегического брейнсторминга и творческих процессов.
Однородность как системная характеристика
Исследователи изучили это явление под метким термином «Artificial Hivemind» и обнаружили примечательное единообразие не только внутри отдельных моделей, но и между различными системами разных производителей. Когда 25 различных LLMs попросили 50 раз каждую сформулировать метафору для времени, большинство из 1 250 ответов звучало так: «Время – это река» или «Время – это ткач». Эта работа была удостоена премии Best Paper Award конференции NeurIPS – одной из самых престижных конференций по ИИ в мире.
Причина кроется в структурном сходстве процессов обучения: большинство ведущих LLMs обучаются на схожих наборах данных, с использованием схожих методов и для схожих сценариев применения. Результатом является своего рода коллективная регрессия к среднему – модели предпочитают статистически частые, так сказать «социально одобренные» ответы и избегают выбросов. Иными словами, они оптимизированы на консенсус, а не на оригинальность.
«То, как устроено большинство чат-интерфейсов, создаёт ощущение личного разговора. Большинство людей по-настоящему не осознают, в какой мере они получают то же самое, что и все остальные.»
Для чётко очерченных, повторяемых задач – запросов к базам данных, генерации кода, резюмирования документов – это свойство вполне полезно. Однако как только компании встраивают ИИ в исследовательские или стратегические контексты, модель сталкивается с фундаментальным ограничением.
Заблуждение о температуре и почему простой настройки параметров недостаточно
Напрашивается предположение, что проблему можно решить техническими настройками. LLMs располагают параметром под названием «Temperature», который управляет случайностью вывода. Выше температура – больше вариативность: такова упрощённая логика. Однако на практике оказывается, что бездумное увеличение этого регулятора быстро приводит к инкогерентности: модели начинают в середине текста переключаться на другой язык или производить семантически несвязанные блоки текста.
Австралийский стартап Springboards избрал иной подход: их модель «Flint», построенная на базе открытой модели Qwen 3 от Alibaba, была обучена целенаправленно выявлять те места в ответе, где большая вариативность уместна и возможна, — и только там повышать степень случайности. Если кто-то спрашивает «Куда мне поехать в Европе?», модели нужна случайность лишь в той точке, где она называет направление, — но не в каждом отдельном слове ответа. Такой точный, контекстно-осознанный подход технически сложен, однако даёт значительно более убедительные результаты, чем огульная настройка параметров.
Что это означает для бизнеса
Dr. Maik Bunzel, основатель и генеральный директор mabucon.eu, уже довольно давно обращает внимание на различие, которое в деловой практике нередко упускается из виду: существует принципиальная разница между ИИ-системами, которые исполняют, и теми, которые исследуют. Для автоматизации рабочих процессов, повторяющихся бизнес-операций и структурированной обработки данных единообразие LLM — не недостаток, а преимущество. Детерминированное, воспроизводимое поведение — это именно то, что там требуется.
Иная картина складывается в сценариях, где ИИ должен выступать креативным партнёром для дискуссий: разработка бренда, генерация идей для кампаний, стратегическое сценарное планирование, продуктовые инновации. Здесь стандартные модели, как показывают исследования, по существу воспроизводят среднее по обучающим данным — дистиллированный, отфильтрованный консенсус того, что в интернете считается «хорошим ответом». Для компаний, рассчитывающих получить с помощью ИИ творческое конкурентное преимущество, это отрезвляющее осознание.
- Ideation и брейнсторминг: стандартные модели тяготеют к предсказуемым, рыночно-конформным идеям. Тот, кто применяет ИИ для подлинной дифференциации, нуждается либо в специализированных моделях, либо в продуманных архитектурах Prompt-Engineering, активно вынуждающих к дивергентному мышлению.
- Стратегический анализ: когда разные команды используют одни и те же модели для анализа рынка, их ИИ-поддерживаемые инсайты неизбежно сходятся — конкурентный недостаток, который на первый взгляд не очевиден.
- Автоматизированное производство контента: масштабный ИИ-генерируемый контент из одних и тех же моделей будет становиться всё более однородным — серьёзный вызов для дифференциации бренда.
- Мультимодельные стратегии: осознанное сочетание различных моделей с разными характеристиками может помочь преодолеть присущее отдельным системам единообразие.
Галлюцинации переосмыслены: смена парадигмы?
Примечателен философский сдвиг, который Springboards совершает вместе с Flint. В то время как вся ИИ-индустрия уже много лет борется с галлюцинациями — то есть с выдумыванием фактов — как с центральной проблемой, стартап пропагандирует контролируемое обращение с неожиданным: «Большинство языковых моделей сражаются с галлюцинациями. Мы им рады», — так формулирует это компания. Звучит провокационно, однако имеет в виду нечто конкретное: в творческих, исследовательских контекстах отклонение от статистического мейнстрима может быть ценным — если оно управляемо и прозрачно представлено человеку как отправная точка для дальнейшей работы.
Эта мысль заслуживает внимания, поскольку вносит важный нюанс в дискуссию об ИИ: не все отклонения являются ошибками. Различие между нежелательными галлюцинациями в фактологических контекстах и продуктивной дивергенцией в творческих контекстах — это вопрос сценария применения, а следовательно, вопрос системного проектирования, а не только самой модели.
Человеческий контроль остаётся решающим фактором
Важное предупреждение исходит из самой практики: даже при работе с моделями, которые активно генерируют разнообразие, прямое использование вывода ИИ без критического осмысления со стороны человека остаётся проблематичным. Большее разнообразие не означает автоматически более высокое качество — оно означает более широкий спектр вариантов, из которых люди могут черпать, опираясь на здравый смысл, контекстные знания и творческое мышление.
Dr. Maik Bunzel, основатель и генеральный директор mabucon.eu, точно формулирует это в рамках своей работы с компаниями: ИИ-агенты наиболее эффективны, когда используются как структурированный ускоритель процессов — не как замена человеческого мышления, а как его расширение. Это справедливо как для автоматизации, так и для творческой поддержки.
Перспектива: что компаниям следует делать сейчас
Осознание того, что LLM структурно склонны к единообразию, должно изменить подход компаний к формированию своей стратегии в области ИИ. Конкретно это означает:
- Чётко разграничить приложения для автоматизации и приложения для исследования — и для последних целенаправленно выбирать модели или конфигурации, которые активно поощряют дивергенцию.
- Регулярно проводить аудит качества и оригинальности собственного использования ИИ — особенно при масштабном производстве контента и стратегических анализах.
- Рассмотреть мульти-модельные архитектуры, объединяющие различные модели с разными профилями сильных сторон, вместо того чтобы полагаться на единственного поставщика.
- Последовательно рассматривать выходные данные ИИ как исходный материал, требующий человеческой курации, доработки и контекстуализации.
Проблема группового мышления у LLM — это не повод отказываться от ИИ, а повод применять его осознаннее и дифференцированнее. Тот, кто понимает, как мыслят эти системы и где находятся их слепые пятна, способен использовать их значительно эффективнее, чем тот, кто некритично принимает их результаты. В мире, где всё больше компаний применяют одни и те же модели к одним и тем же вопросам, именно это понимание становится стратегическим дифференциатором.