Когда вы участвуете в AIT ваш валидаторная нода должна пройти проверку на жизнеспособность в течение 24 часов после того, как она была выбрана для участия в тестнете, и далее регулярно. Это необходимо для того, чтобы убедиться, что ваша валидаторная нода вносит свой вклад в работу всей сети и что вы имеете право на получение поощрительных вознаграждений за участие в тестнете.
В этом документе описано, как проверить состояние развернутой ноды валидатора в стимулируемой тестовой сети на соответствие критериям успеха.
Жизнеспособность вашей валидаторной ноды будет оцениваться с помощью данных как из сети, так и вне сети. Данные в сети будут получены непосредственно с вашей ноды валидатора, синхронизирующейся с сетью, а данные вне сети будут получены с вашей ноды валидатора посредством телеметрии. К таким данным относятся:
- Не менее одного предлагаемого блока в час. Эти данные будут использоваться для определения доступности вашей ноды с течением времени.
- Данные телеметрии, передаваемые вашей нодой-валидатором:
- Постоянно увеличивающаяся синхронизированная версия вашей ноды, наряду с разумной дельтой от наилучшего состояния блокчейна.
- Валидатор Aptos Labs входит в число ваших коллег.
Проверка работоспособности вашей ноды
Локально
Если вы являетесь оператором ноды, то вам доступны несколько инструментов (предоставленных командой Aptos и сообществом) для локальной проверки состояния вашей собственной ноды. Этот локальный статус будет служить хорошим косвенным показателем общего состояния ноды на уровне сети и по данным удаленной аналитической системы, управляемой Aptos Labs.
- Локально, лучший способ проверить состояние ноды - это взаимодействие с нодой. Вы можете наблюдать за локальной конечной точкой метрики, выполнив команду
curl
, и наблюдать за различными ключевыми метриками. Выполните шаги, подробно описанные в документе Проверка начальной синхронизации.
ПОДСКАЗКА
При регистрации ноды валидатора для стимулируемого тестнета вам будет предложено выполнить эту проверку.
- Чтобы сделать вашу ноду валидатора более наблюдаемой, установите инструменты мониторинга, которые сканируют локальную конечную точку метрик:
- Для развертываний на базе Kubernetes установите диаграмму мониторинга Helm (https://github.com/aptos-labs/aptos-core/tree/main/terraform/helm/monitoring).
- Локально вы можете напрямую запускать Prometheus и Grafana. Дашборды, использующие метрики, можно найти здесь: (https://github.com/aptos-labs/aptos-core/tree/main/dashboards).
Приведенные выше два метода мониторинга полагаются на метрики Prometheus, сообщаемые вашей нодой. Особенно важны следующие метрики, напрямую связанные с вышеуказанными критериями успеха:
aptos_consensus_proposals_count
aptos_state_sync_version{type="synced"}
aptos_connections
Удаленно
Удаленно команда Aptos может проверить состояние вашей ноды с помощью телеметрии. Когда вы включите телеметрию на своей ноде, двоичный файл ноды Aptos будет отправлять данные телеметрии в фоновом режиме команде Aptos, стимулируемой тестовой сетью.
Данные телеметрии с вашей ноды необходимы команде Aptos для оценки метрик живучести вне сети для проверки. Вы можете просмотреть точное содержание каждого вызова телеметрии, проверив журналы DEBUG
на вашем валидаторе. Если ваша нода использует конфигурацию по умолчанию без явного отключения телеметрии и имеет выходной доступ HTTPS в интернет, то она будет сообщать различные ключевые метрики в Aptos Labs, такие как текущая синхронизированная версия и пиры, подключенные к вашей ноде.
Aptos Labs также будет наблюдать за событиями на сети, такими как предложения в час на вашей ноде, как определено в критериях liveness.
Собственная аналитическая система Aptos Labs будет агрегировать все данные телеметрии вне сети и все события участия в сети, чтобы рассчитать состояние вашей ноды. Состояние ноды будет отображаться на сайте платформы сообщества, а также в отдельной таблице лидеров валидаторов для каждой тестовой сети.
Устранение неполадок
Если ваша нода валидатора сталкивается с постоянными проблемами, например, не может предложить или не синхронизируется, откройте тему на Github здесь (https://github.com/aptos-labs/aptos-ait2/issues) и укажите следующее:
- Ваша настройка ноды, т.е. если вы запускаете ее из исходного кода, Docker или Terraform. Укажите версию исходного кода, т.е. тег образа или ветку).
- Описание проблем, с которыми вы столкнулись, и как давно они возникли.
- Важно: журналы регистрации вашей ноды (как можно более ранние). Без подробных журналов команда Aptos вряд ли сможет отладить проблему.
- Мы также можем попросить вас включить отладочные журналы для ноды. Вы можете сделать это, обновив файл конфигурации ноды (например,
validator.yaml
), добавив:
logger:
level: DEBUG
- Не забудьте также указать любую другую информацию, которая, по вашему мнению, может быть полезной, и указать, помогает ли перезапуск валидатора.
Top comments (0)