Согласованность данных

Согласованность (consistency) — состояние, когда все пользователи и процессы видят одни и те же данные при чтении. Согласованность не равна целостности (integrity)
Целостность описывает корректность данных внутри системы (например, наличие внешних ключей, ограничения на значения).

Согласованное состояние: после завершения операции или транзакции все узлы системы переходят в один и тот же видимый результат. Иначе пользователи видят разные версии, что может привести к бизнес-ошибкам.

Виды согласованности

Строгая (strong consistency): после записи данные моментально видны всем. Пример — традиционные реляционные БД с синхронными транзакциями
В конечном счёте (eventual consistency): данные со временем сходятся, но на промежутке возможны расхождения. Пример — DynamoDB, Cassandra
Последовательная (sequential consistency): все операции видятся в одном порядке, но нет гарантии мгновенной видимости
Каузальная (causal consistency): операции, имеющие причинно-следственную связь, видятся в правильном порядке
Слабая (weak consistency): система не гарантирует моментальной или даже определённой очередности обновлений

Примеры выбора уровня согласованности

Всегда связано с анализом рисков и бизнес-требований:

Если данные критичны (банковские счета, заказы, бронирования), требуется strong consistency
Для аналитических или временных данных подойдут eventual consistency или quorum-based решения
Нужно учитывать нагрузку, ожидаемые задержки, требования к откатам и репликации
Часто используют матрицу рещений параметрами: задержка, SLA по доступности, бизнес-ущерб при ошибке

CAP-теорема и согласованность

CAP-теорема утверждает: распределённая система может одновременно гарантировать только две из трёх свойств:

Согласованность (Consistency): все клиенты видят одинаковые данные
Доступность (Availability): система отвечает на каждый запрос (даже если ответ может быть устаревшим)
Устойчивость к разделению (Partition tolerance): система продолжает работать при разделении сети

Так как устойчивость к разделению обязательна для любой распределённой системы, выбор обычно стоит между согласованностью и доступностью.

ACID vs BASE и согласованность

ACID (Atomicity, Consistency, Isolation, Durability) — свойства традиционных реляционных транзакций. Гарантируют строгую согласованность и корректность данных, но плохо масштабируются.

BASE (Basically Available, Soft state, Eventually consistent) — подход, характерный для NoSQL-систем:

Basically Available — система отвечает на запросы, пусть и с устаревшими данными
Soft state — состояние может изменяться без явных транзакций
Eventually consistency — данные в итоге сходятся

BASE-системы жертвуют частью согласованности ради масштабируемости и отказоустойчивости.

Согласованность записи и чтения

В распределённых системах согласованность записи (write consistency) и чтения (read consistency) настраиваются отдельно:

Write Consistency — сколько реплик должны подтвердить запись
Read Consistency — сколько реплик участвуют в чтении

Пример в Cassandra (формат: запись + чтение):

Обозначения: ONE — участие одного узла; QUORUM — большинство узлов (обычно ⌊N/2⌋ + 1); ALL — все доступные узлы

QUORUM + QUORUM ⇒ strong consistency — и запись, и чтение требуют подтверждения от большинства узлов. Это обеспечивает согласованность, даже если часть реплик недоступна
ALL + ONE ⇒ strong, но медленно — запись подтверждается всеми узлами, чтение — любым одним. Обеспечивает согласованность, но увеличивает задержки
ONE + ONE ⇒ fast, but eventual consistency — достаточно одного узла для записи и чтения, быстро, но возможны расхождения между репликами

Комбинации выбираются в зависимости от требований к задержкам и допустимому уровню согласованности.
Гибкая настройка позволяет балансировать между скоростью, надёжностью и рисками.

Изоляция транзакций

В реляционных системах уровни изоляции (Read Uncommitted, Read Committed, Repeatable Read, Serializable) управляют видимостью данных внутри транзакций.
Но в распределённых БД эти гарантии сложнее поддерживать из-за сетевых задержек и репликации.
Это увеличивает количество сценариев ошибок, необходимость компенсационных механизмов и дополнительные проверки корректности состояния.

Согласованность в распределённых БД

Реляционные системы

В распределённых реляционных системах (например, CockroachDB) часто используется глобальный протокол согласования.
CockroachDB использует алгоритмы распределённого согласования (например, Raft).

Для глобальных транзакций применяются двухфазный (2PC) и трёхфазный коммиты (3PC), которые обеспечивают атомарность и согласованность, но приводят к высокой латентности.

Распределённые транзакции

Реализация глобальных транзакций — сложная задача.
Системы часто используют протокол SAGA как альтернативу 2PC: большие транзакции разбиваются на локальные, а в случае отката вызываются компенсирующие действия.
Это снижает блокировки, но требует детальной проработки бизнес-логики.

Согласованность в NoSQL-системах

Большинство NoSQL-систем (Cassandra, DynamoDB, Riak) жертвуют строгой согласованностью ради доступности и масштабирования.

Вместо блокировок они применяют:

Eventual consistency: копии данных сходятся со временем
Анти-энтропийные механизмы: фоновое сравнение и синхронизация (например, Merkle-деревья)
Quorum-based подходы: чтение и запись требуют определённого числа подтверждений (quorum reads/writes)

Cassandra даёт возможность выбирать уровень согласованности per-запрос: от ONE (быстро, но менее надёжно) до ALL (гарантия согласованности, но высокая задержка)

Согласованность в микросервисной архитектуре

Микросервисы редко используют глобальные транзакции. Вместо этого — подходы к eventual consistency:

SAGA — координация серии локальных транзакций. В случае ошибки вызываются компенсирующие действия
Outbox Pattern — гарантированная доставка событий через отдельную очередь (Kafka, RabbitMQ)
Идемпотентность и дедупликация — обязательны для безопасности повторной доставки
Retry-паттерны и DLQ (Dead Letter Queue) — важны для обработки временных сбоев

Примеры ошибок из-за несогласованности

Двойное списание при race condition между двумя фронтендами
Разная информация о пользователе в CRM и биллинге
Выдан один и тот же промокод двум пользователям
Удаление сущности, на которую всё ещё есть ссылки — при eventual consistency между микросервисами

Временная согласованность

Иногда допустима временная несогласованность (например, данные кэшируются на 5 секунд).
В таких случаях важно:

Указывать TTL (time-to-live) для устаревших данных
Обрабатывать stale reads — например, читать устаревшие данные, которые уже не отражают текущее состояние, но могут быть допустимы в рамках TTL или в интерфейсах с мягкими требованиями к актуальности, показывать "нефинализированные" значения
Использовать версионирование или метки времени при отображении пользователю ("Обновлено 2 сек назад")

Методы обеспечения согласованности

Репликация

Синхронная: запись дожидается подтверждения всех реплик. Высокая надёжность, но медленнее
Асинхронная: запись подтверждается после обновления основной реплики, остальные догоняют позже. Быстрее, но риск рассинхронизации

Консенсус-протоколы

Консенсус-протоколы — алгоритмы, которые позволяют множеству узлов в распределённой системе согласовать единое состояние данных, даже если часть узлов или сеть работает нестабильно.

Paxos и Raft широко используются именно внутри распределённых БД и сервисов (например, в etcd, Consul, CockroachDB) для репликации и выбора лидера, чтобы все копии данных оставались согласованными.

Paxos: сложный в реализации, требует нескольких раундов сообщений для согласования
Raft: более понятный, описан как «Paxos для людей», активно используется (например, в etcd, Consul)

Конфликт-резолвинг

Конфликт-резолвинг (conflict resolution) — подходы к устранению расхождений между копиями данных при eventual consistency.

CRDT (Conflict-free Replicated Data Types)

Специальные структуры данных. Спроектированны так, чтобы изменения, сделанные независимо на разных узлах, могли быть объединены без конфликтов.
Это позволяет достичь согласованности без централизованного координирующего узла.

Пример: распределённый счётчик, который можно увеличивать на любом узле, а потом безопасно объединять — каждый инкремент учтётся, независимо от порядка доставки

Last-write-wins (LWW)

Стратегия разрешения конфликта. Сохраняется последнее по времени обновление.
Простая реализация, но возможна потеря промежуточных изменений.

Пример: в системе заметок, если два пользователя одновременно редактируют текст, то сохранится та версия, что была записана позже по времени, даже если другая содержала важные правки

Согласованность данных

Виды согласованности

Примеры выбора уровня согласованности

CAP-теорема и согласованность

ACID vs BASE и согласованность

Согласованность записи и чтения

Изоляция транзакций

Согласованность в распределённых БД

Реляционные системы

Распределённые транзакции

Согласованность в NoSQL-системах

Согласованность в микросервисной архитектуре

Примеры ошибок из-за несогласованности

Временная согласованность

Методы обеспечения согласованности

Репликация

Консенсус-протоколы

Конфликт-резолвинг

CRDT (Conflict-free Replicated Data Types)

Last-write-wins (LWW)

Материалы

Видео

Конференции

Виды согласованности​

Примеры выбора уровня согласованности​

CAP-теорема и согласованность​

ACID vs BASE и согласованность​

Согласованность записи и чтения​

Изоляция транзакций​

Согласованность в распределённых БД​

Реляционные системы​

Распределённые транзакции​

Согласованность в NoSQL-системах​

Согласованность в микросервисной архитектуре​

Примеры ошибок из-за несогласованности​

Временная согласованность​

Методы обеспечения согласованности​

Репликация​

Консенсус-протоколы​

Конфликт-резолвинг​

CRDT (Conflict-free Replicated Data Types)​

Last-write-wins (LWW)​

Материалы

Видео​

Конференции​

Виды согласованности

Примеры выбора уровня согласованности

CAP-теорема и согласованность

ACID vs BASE и согласованность

Согласованность записи и чтения

Изоляция транзакций

Согласованность в распределённых БД

Реляционные системы

Распределённые транзакции

Согласованность в NoSQL-системах

Согласованность в микросервисной архитектуре

Примеры ошибок из-за несогласованности

Временная согласованность

Методы обеспечения согласованности

Репликация

Консенсус-протоколы

Конфликт-резолвинг

CRDT (Conflict-free Replicated Data Types)

Last-write-wins (LWW)

Видео

Конференции