
Последние исследования в области искусственного интеллекта показывают, что система оплаты за токены скрывает реальные расходы от пользователей. Поставщики AI-сервисов могут незаметно увеличивать стоимость услуг, манипулируя подсчетом токенов или внедряя скрытые процессы. Некоторые системы запускают дополнительные операции, которые не влияют на конечный результат, но все равно попадают в счет. Хотя были предложены инструменты аудита, без реального контроля пользователи платят больше, чем осознают.
Скрытая механика токенов: что мы на самом деле оплачиваем
Почти во всех случаях мы как потребители платим за взаимодействие с AI-чатами, такими как ChatGPT-4o, в токенах — невидимых единицах текста, которые остаются незамеченными во время использования, но при этом точно подсчитываются для выставления счетов. Хотя каждый обмен сообщениями оценивается по количеству обработанных токенов, у пользователя нет прямого способа проверить это количество.
Несмотря на наше весьма несовершенное понимание того, что мы получаем за приобретенную единицу «токен», токеновая система оплаты стала стандартным подходом среди провайдеров, основываясь на том, что может оказаться ненадежным предположением о доверии.
Что такое токен в AI-системах?
Токен не совсем то же самое, что слово, хотя часто играет аналогичную роль. Большинство провайдеров используют термин «токен» для описания небольших единиц текста, таких как слова, знаки пунктуации или части слов. Например, слово «невероятный» может считаться одним токеном в одной системе, в то время как другая может разделить его на «не», «вероят» и «ный», и каждый фрагмент увеличивает стоимость.
Эта система применяется как к тексту, который вводит пользователь, так и к ответу модели, причем цена основывается на общем количестве этих единиц.
Проблема заключается в том, что пользователи не видят этот процесс. Большинство интерфейсов не показывают количество токенов во время разговора, а способ их расчета трудно воспроизвести. Даже если количество отображается после ответа, уже слишком поздно определить, было ли оно справедливым, создавая несоответствие между тем, что пользователь видит, и тем, за что платит.
Исследования выявляют проблемы токеновой системы
Недавние исследования указывают на более глубокие проблемы:
- Одно исследование показывает, как провайдеры могут завышать цены, просто увеличивая количество токенов невидимым для пользователя образом;
- Другое исследование раскрывает несоответствие между тем, что показывают интерфейсы, и тем, за что фактически выставляются счета;
- Третье исследование показывает, как модели регулярно генерируют внутренние этапы рассуждений, которые никогда не показываются пользователю, но все равно включаются в счет.
Эти результаты рисуют систему, которая кажется точной, с конкретными числами, подразумевающими ясность, но чья базовая логика остается скрытой. Независимо от того, является ли это умыслом или структурным недостатком, результат один: пользователи платят за больше, чем могут видеть, и часто больше, чем ожидают.
Первое исследование: переоценка токенов
В первой из этих работ, озаглавленной «Переоценивает ли вас ваша LLM? Токенизация, прозрачность и стимулы», четыре исследователя из Института программных систем Макса Планка утверждают, что риски токеновой оплаты выходят за рамки непрозрачности и указывают на встроенный стимул для провайдеров завышать количество токенов.
Авторы объясняют, что проблема заключается в том, что токенизация строки не уникальна. Например, пользователь отправляет запрос «Где пройдет следующая конференция NeurIPS?», провайдер передает его в LLM, и модель генерирует вывод «|Сан| Диего|», состоящий из двух токенов.
Поскольку пользователь не видит процесс генерации, недобросовестный провайдер может сообщить токенизацию вывода как «|С|а|н| |Д|и|е|г|о|» и взимать плату за девять токенов вместо двух!
Для решения проблемы исследователи предлагают оплату на основе количества символов, а не токенов. Они утверждают, что это единственный подход, который дает провайдерам причину честно сообщать об использовании. Если цель — справедливое ценообразование, то привязка стоимости к видимым символам, а не к скрытым процессам, является единственным вариантом, выдерживающим проверку.
Однако есть ряд дополнительных соображений. Во-первых, предложенная схема на основе символов вводит дополнительную бизнес-логику, которая может отдавать предпочтение поставщику, а не потребителю. Кроме того, компаниям, вероятно, потребуется законодательное регулирование для перехода от загадочной токеновой системы к более ясному методу оплаты на основе текста.
Второе исследование: невидимые токены, видимые счета
Вторая работа, озаглавленная «Невидимые токены, видимые счета: неотложная потребность в аудите скрытых операций в непрозрачных службах LLM», исследователей из Университета Мэриленда и Беркли, утверждает, что несогласованные стимулы в коммерческих API языковых моделей не ограничиваются разделением токенов, но распространяются на целые классы скрытых операций.
К ним относятся внутренние вызовы модели, умозрительные рассуждения, использование инструментов и взаимодействия нескольких агентов — и все это может быть включено в счет пользователя без видимости или возможности контроля. Если вы хотите глубже разобраться в создании и настройке AI агентов, то стоит обратить внимание на специализированные курсы по этой теме.
В отличие от обычного выставления счетов, где количество и качество услуг можно проверить, современные платформы LLM работают в условиях структурной непрозрачности: пользователям выставляются счета на основе сообщаемого использования токенов и API, но у них нет средств подтвердить, что эти метрики отражают реальную или необходимую работу.
Исследование выявляет две ключевые формы манипуляции:
- Инфляция количества — когда число токенов или вызовов увеличивается без пользы для пользователя;
- Понижение качества — когда вместо премиальных компонентов тихо используются менее производительные модели или инструменты.
Пути решения проблемы и предложения
Третье исследование, от десяти исследователей Университета Мэриленда, рассматривает проблему выставления счетов не как вопрос злоупотребления или искажения данных, а как структурную проблему. В работе, озаглавленной «CoIn: подсчет невидимых токенов рассуждений в коммерческих непрозрачных API LLM», отмечается, что большинство коммерческих LLM-сервисов сейчас скрывают промежуточные рассуждения, которые способствуют формированию окончательного ответа модели, но все равно взимают плату за эти токены.
Исследование утверждает, что это создает ненаблюдаемую поверхность для выставления счетов, где целые последовательности могут быть сфабрикованы, внедрены или раздуты без обнаружения. Например, одно высокоэффективное выполнение ARC-AGI моделью о3 от OpenAI потребляло 111 миллионов токенов, стоивших $66,772.3. В таком масштабе даже незначительные манипуляции могут привести к существенному финансовому воздействию.
Для противодействия этой асимметрии авторы предлагают CoIn — систему стороннего аудита, разработанную для проверки скрытых токенов без раскрытия их содержимого, которая использует хэшированные отпечатки и семантические проверки для обнаружения признаков инфляции.
Выводы и перспективы
Помимо преимущества получения предоплаты от пользователей, валютная система на основе скриптов (как система «buzz» в CivitAI) помогает абстрагировать пользователей от истинной стоимости валюты, которую они тратят, или товара, который покупают. Точно так же, предоставление поставщику возможности определять свои собственные единицы измерения еще больше оставляет потребителя в неведении относительно того, что они на самом деле тратят в плане реальных денег.
Как отсутствие часов в Лас-Вегасе, меры такого рода часто направлены на то, чтобы сделать потребителя беспечным или безразличным к затратам. Малопонятный токен, который может потребляться и определяться множеством способов, возможно, не является подходящей единицей измерения для потребления LLM — не в последнюю очередь потому, что может потребоваться гораздо больше токенов для получения худшего результата LLM на неанглийском языке по сравнению с сеансом на английском языке.
Однако оплата на основе символов, как предлагают исследователи из института Макса Планка, вероятно, отдаст предпочтение более лаконичным языкам и накажет естественно многословные языки. Поскольку визуальные индикации, такие как уменьшающийся счетчик токенов, вероятно, сделают нас немного более бережливыми в наших сеансах LLM, маловероятно, что такие полезные дополнения графического интерфейса появятся в ближайшее время — по крайней мере, без законодательных действий.
По мере того как AI агенты и крупные языковые модели становятся более интегрированными в нашу повседневную жизнь, вопрос о прозрачности ценообразования будет только усиливаться. Пользователям рекомендуется проявлять осмотрительность и, где возможно, выбирать поставщиков с более прозрачными политиками оплаты.