Методология Хокометра — как мы оцениваем выступления центральных банков

Механизм оценки, библиотека фраз и ограничения, о которых должны знать финансовые журналисты

Hawkometer

Методология Хокометра — как мы оцениваем выступления центральных банков

Механизм оценки, библиотека фраз и ограничения, о которых должны знать финансовые журналисты

May 7, 2026 · Central Bank Watch Research · 7 min read

Что измеряет Хокометр

Хокометр отвечает на один вопрос: исходя из того, что высшее должностное лицо центрального банка сказало в своих публичных выступлениях, где оно находится на ястребино-голубином спектре, и смещается ли эта позиция?

Это не показатель:

  • За какую ставку оно проголосует на следующем заседании (для этого предназначены наши инструменты вероятности и правила Тейлора).
  • Его долгосрочной функции реакции.
  • Его личных убеждений отдельно от опубликованных сигналов комитета.

Это показатель тональности публичной коммуникации, нормализованный по спикерам и агрегированный до уровня комитета.

Механизм оценки — редакционная проверка при поддержке Claude

По состоянию на июнь 2026 года каждое выступление оценивается в рамках редакционного процесса при поддержке Claude AI — большой языковой модели, разработанной Anthropic. Наша исследовательская команда передаёт полный текст каждого выступления, интервью, показаний в парламенте или пресс-конференции модели со структурированным запросом, который просит её:

  1. Оценить текст по шкале от -10 (максимально голубиная позиция) до +10 (максимально ястребиная позиция).
  2. Написать краткое обоснование оценки простым языком.
  3. Выделить ключевые ястребиные и голубиные фразы, которые больше всего повлияли на оценку.

Поскольку модель читает и анализирует полный текст, а не подсчитывает совпадения ключевых слов, она обрабатывает языковой контекст, который недоступен для чистого сопоставителя фраз. Отрицания обрабатываются корректно — фраза «аргументы в пользу дополнительного ужесточения существенно ослабли» теперь, как и задумано, получает голубиную оценку, а не срабатывает как ястребиная фраза из-за слов «дополнительное ужесточение». Условные высказывания («если инфляция вновь ускорится…») трактуются как гипотетические, а не как сигналы о будущей политике. Смягчающие формулировки («в некоторой степени», «постепенно», «терпеливо») взвешиваются пропорционально их роли в окружающей аргументации.

Подход на основе LLM также справляется с новыми формулировками. Когда должностное лицо вводит новый оборот речи, который рынки сразу же воспринимают как сигнал, модель способна его уловить без обновления библиотеки фраз. Кроме того, модель понимает, что слово «терпение» в контексте Банка Японии несёт иной вес, чем то же слово в выступлении ФРС — институциональный контекст имеет значение, и модель обучена на достаточном объёме коммуникаций центральных банков, чтобы отражать эти различия.

Каждая оценка сопровождается письменным обоснованием и списком фраз, которые повлияли на результат. Таким образом читатели видят не только то, что выступление получило оценку +3,5, но и почему — это сохраняет проверяемость, которой модель типа «чёрный ящик» была бы лишена.

Библиотека фраз — эталонная база по ключевым словам

Изначальная библиотека ключевых слов v1 сохраняется наряду с оценщиком на основе LLM как эталон для прозрачности. LLM может выделять те же фразы, что содержатся в библиотеке, другие фразы, либо сочетания и оттенки смысла, которые библиотека не охватывает. Там, где два подхода существенно расходятся по одному и тому же выступлению, мы рассматриваем это как сигнал, что библиотеку фраз нужно обновить — либо потому что появилась новая формулировка, либо потому что вес в библиотеке был откалиброван неверно.

Ястребиные фразы (выборка)

ФразаВес
inflation persistent+2.5
inflation remains elevated+2.2
further tightening+2.4
additional tightening+2.4
more work to do+2.0
premature to declare victory+2.0
not the time to cut+1.9
upside risks to inflation+1.8
inflation expectations rising+1.8
policy must remain restrictive+1.7
sticky inflation+1.6
overheating+1.6
restrictive stance is appropriate+1.5
vigilance / vigilant+1.4
hawkish hold+1.4

Голубиные фразы (выборка)

ФразаВес
appropriate to begin easing-2.4
scope to ease-2.2
disinflation is well advanced-2.0
conditions for easing-2.0
rate cuts on the table-2.0
dovish pivot-2.0
approaching neutral-1.8
close to neutral-1.6
policy is sufficiently restrictive-1.6
disinflation continues-1.5
labour market cooling-1.4
recession risk-1.4
downside risks-1.4
financial conditions have tightened-1.2
growth is slowing-1.2

Некоторые фразы намеренно неоднозначны — «data-dependent» («опора на данные») технически является формулировкой о процессе, но в текущем употреблении она умеренно склоняется к голубиной тональности, поэтому получает вес -0,7. Мы документируем каждое такое решение, а не скрываем его.

От выступлений к оценкам комитетов

После того как отдельные выступления оценены, мы агрегируем их в три уровня:

1. Скользящее 90-дневное среднее по спикеру

Для каждого должностного лица мы вычисляем простое среднее его оценок тональности за последние 90 дней. Мы также вычисляем среднее за 30 дней и среднее за предыдущие 60 дней, чтобы можно было сообщать индикатор сдвига (последние 30 дней относительно 60 дней до этого).

2. Оценка комитета банка, взвешенная по праву голоса

Оценка комитета — это взвешенное среднее 90-дневных оценок каждого спикера:

СтатусВес
Голосующий на следующем заседании1,0
Неголосующий (например, неголосующий президент регионального ФРБ, наблюдатель)0,55

Неголосующий член всё равно остаётся частью интеллектуального центра тяжести комитета, поэтому мы не исключаем его полностью — но голос голосующего члена учитывается в индексе примерно вдвое сильнее, что соответствует тому, как рынки оценивают этих должностных лиц.

3. Уклон по всем банкам

Оценки каждого банка переводятся в словесный уклон для удобства читателей:

Диапазон оценкиУклон
≥ +2,5ястребиный
+1,0 до +2,5склоняется к ястребиному
-1,0 до +1,0нейтральный
-2,5 до -1,0склоняется к голубиному
≤ -2,5голубиный

Это описательные метки, а не прогнозы относительно следующего решения.

Ограничения — прочитайте перед тем, как ссылаться на индекс

Хокометр — полезный первичный срез, но у него есть реальные ограничения. Любой, кто ссылается на него в исследованиях или репортажах, должен их понимать.

Согласованность LLM. Модель может оценить пограничное выступление немного по-разному от запуска к запуску из-за случайности сэмплирования. Мы смягчаем это, используя фиксированный шаблон запроса и кэшируя результаты — после того как выступление оценено, кэшированный результат используется при всех последующих сборках, а не пересчитывается заново.

Риск галлюцинаций. Как и любая большая языковая модель, Claude может неверно интерпретировать нетипичную структуру речи или придать фразе вес, который внимательный человек-читатель бы не придал. Публикуемый абзац с обоснованием существует именно для того, чтобы читатели могли выборочно проверить рассуждения модели и отметить случаи, где она ошиблась.

Гипотетические и условные высказывания. Даже при оценке с помощью LLM модель не всегда может корректно взвесить сильно условное высказывание («если инфляция вновь ускорится, дополнительное ужесточение было бы уместным»). Обоснование обычно на это указывает, но читателям не следует чрезмерно интерпретировать одно высокое значение по одному выступлению.

Эффекты перевода. Представители ЕЦБ, должностные лица Банка Японии и члены совета НБШ часто выступают на языках, отличных от английского. Наш оценщик в настоящее время работает только с английской версией этих высказываний. Когда официальная версия не на английском языке, оценка откладывается до публикации переведённой стенограммы; для пресс-конференций мы используем стенограмму синхронного перевода. Это вносит небольшую задержку и небольшое смещение, связанное с переводом.

Отсутствие причинно-следственных выводов. Индекс не утверждает, что ястребиная оценка что-либо вызывает. Это упорядоченная сводка того, что сказали должностные лица. Используйте его вместе с вероятностями, закладываемыми рынком, анализом правила Тейлора и инструментами траектории ставки.

Примерные данные. Пока продакшн-скраперы наращивают охват, некоторые записи на сайте могут представлять собой репрезентативные образцы, а не прямые стенограммы. Выступления, полученные из образцов, следует рассматривать как репрезентативные примеры, а не как прямые стенограммы.

Периодичность обновления

Новые выступления автоматически собираются скраперами в рамках ежедневного конвейера данных, но сама оценка с помощью LLM — это редакционный шаг, а не автоматизированная фоновая задача: примерно раз в две недели наша исследовательская команда просматривает вновь собранные стенограммы за предыдущие 14 дней и оценивает их через Claude, по одному выступлению за раз. Пока выступление не прошло через эту проверку, отображается его автоматически рассчитанная базовая оценка по ключевым словам с соответствующей пометкой. Библиотека фраз пересматривается в конце каждого квартала и в любой момент, когда крупный центральный банк существенно меняет стиль коммуникации.

Воспроизводимость

Каждая оценка сопровождается письменным обоснованием и ключевыми фразами, выявленными моделью. Публичный экспорт пока не предоставляется; используйте таблицы на странице и заметки по методологии. Если вы не согласны с каким-либо решением по оценке, обоснование даёт отправную точку, чтобы понять рассуждения модели и сообщить нам, где, по вашему мнению, она ошиблась.

По вопросам методологии или чтобы предложить добавить или переоценить фразу, см. страницу о нас.