ну вроде.

ли техническая документация, описывающая, как работает репликация между двумя кушетками?

Каков основной обзор репликации CouchDB? Каковы некоторые примечательные характеристики об этом?

 J Chris A23 февр. 2012 г., 20:54
Я написал пост в блоге, посвященный возможностям обнаружения и управления конфликтами CouchDB, здесь:jchrisa.net/drl/_design/sofa/_list/post/...

Ответы на вопрос(5)

Apache CouchDB Conf 2013Бенджамин Янг представилreplication.io в егоРепликация, FTW! говорить, Это постоянная попытка определить и, в конечном счете, изменить спецификацию для репликации master-master на основе HTTP.

который работает над TouchDB и его репликацией для Couchbase, (неофициально) описалалгоритм репликации CouchDB Само по себе, если вам интересны технические детали того, как работает «стандартный» протокол репликации CouchDB.

Подводя итог описанным шагам:

Выясните, как далеко зашла любая предыдущая репликацияПолучить исходную базу данных_changes с этого моментаиспользованиеrevs_diff на пакет изменений, чтобы увидеть, какие необходимы на целиСкопируйте все отсутствующие метаданные ревизии и данные текущего документа + вложения из источника в цель, отправив сообщение вbulk_docs как для оптимизации, так и для хранения документов иначе, чем обычная высокоуровневая обработка MVCCPUT.

Я замутил здесь много деталей и рекомендую прочитать оригинальное объяснение.

Решение Вопроса

нет подробной документации, описывающей протокол репликации. В CouchDB встроена только эталонная реализация, и Филип Манана переписал ее, что, вероятно, станет новым воплощением в будущем.

Тем не менее, это общая идея:

Ключевые моменты

Если вы знаете Git, то знаете, как работает репликация Couch. Репликацияочень похоже на push или pull с распределенными менеджерами исходного кода, такими как Git.

Репликация CouchDB не имеет своего собственного протокола. Репликатор просто подключается к двум БД в качестве клиента, затем читает из одной и записывает в другую. Push-репликация читает локальные данные и обновляет удаленную БД; тянуть репликацию наоборот.

Интересный факт 1Репликатор на самом деле является независимым приложением Erlang в своем собственном процессе. Он подключается к обеим кушеткам, затем читает записи с одного и записывает их на другой.Интересный факт 2: CouchDB имеетнет способа узнать кто является обычным клиентом, а кто репликатором (не говоря уже о том, является ли репликация push или pull). Все выглядит как клиентские соединения. Некоторые из них читают записи. Некоторые из них пишут записи.Все вытекает из модели данных

Алгоритм репликации тривиален, неинтересен. Обученная обезьяна может спроектировать это. Это просто, потому что ум - это модель данных, которая имеет следующие полезные характеристики:

Каждая запись в CouchDB полностью независима от всех остальных. Это отстой, если вы хотите сделатьJOIN или транзакция, но это здорово, если вы хотите написать репликатор. Просто разберись, как тиражироватьодин запись, а затемповтори это за каждую запись.Как и в Git, записи имеют историю изменений в связанном списке. ID ревизии записи - это контрольная сумма ее собственных данных. Последующие идентификаторы ревизий представляют собой контрольные суммы: новых данных плюс идентификатор ревизии предыдущих.

В дополнение к данным приложения ({"name": "Jason", "awesome": true}), каждая запись хранит эволюционную временную шкалу всех предыдущих идентификаторов ревизий, ведущих к себе.

Упражнение: Уделите минутку спокойного размышления. Рассмотрим любые две разные записи, A и B. Если идентификатор редакции A появляется на временной шкале B, то B определенно эволюционировал из A. Теперь рассмотрим слияния в Git. Ты слышал это? Это звук вашего раздуваемого разума.

Git на самом деле не линейный список. У него есть вилки, когда у одного из родителей несколько детей. У CouchDB это тоже есть.

Упражнение: Сравните две разные записи, A и B. Идентификатор редакции A не отображается на временной шкале B; однако один идентификатор ревизии C находится вобе Хронология А и Б Таким образом, A не развился из B. B не развился из A. Но, скорее, A и B имеют общего предка C. В Git это «вилка». В CouchDB это «конфликт».

В Git, если оба ребенка продолжают самостоятельно разрабатывать временные рамки, это круто. Вилы полностью поддерживают это.

В CouchDB, если оба ребенка продолжают самостоятельно разрабатывать временные рамки, это тоже здорово. Конфликты полностью поддерживают это.Интересный факт 3: "Конфликты" в CouchDB не соответствуют "конфликтам" в Git. Конфликт Couch - это расходящаяся история ревизий, которую Git называет «форком». По этой причине сообщество CouchDB объявляет «конфликт» с молчаливымn: "щелкнуло".

Git также имеет слияния, когда у одного ребенка несколько родителей. CouchDBвроде, как бы, что-то вроде имеет это тоже.

В модели данных нет слияния. Клиент просто помечает одну временную шкалу как удаленную и продолжает работать с единственной существующей временной шкалой.В приложении это похоже на слияние. Как правило, клиент объединяетданные от каждой временной шкалы в зависимости от приложения. Потом пишет новоеданные в сроки. В Git это похоже на копирование и вставку изменений из ветви A в ветку B, затем фиксацию в ветке B и удаление ветки A.данные был объединен, но не былоgit merge.Это поведение отличается, потому что в Git важна сама временная шкала; но в CouchDB данные важны, а временная шкала является случайной - она ​​просто поддерживает репликацию. Это одна из причин, почему встроенная редакция CouchDB не подходит для хранения данных ревизий, таких как вики-страница.Финальные заметки

По крайней мере, одно предложение в этой рецензии (возможно, это) является полной BS.

 Octavian Damiean20 июл. 2012 г., 21:58
Эпический ответ эпичен! @JasonSmith, не могли бы вы добавить эту информацию в вики CouchDB?
 JasonSmith21 июл. 2012 г., 16:06
Спасибо! Да, не стесняйтесь добавлять его в вики, это было бы здорово.
 JasonSmith22 янв. 2011 г., 06:48
Примечание для разработчиков CouchDB. Чтобы сделать основы более понятными, этот ответ намеренно игнорирует некоторые детали. Однако я с радостью приветствую исправления или обновления материала.

документация для CouchDB v2.0.0 охватывает алгоритм репликации гораздо шире. У них есть диаграммы, примеры промежуточных ответов и примеры ошибок. Они используют язык "MUST", "SHALL" и т. Д. RFC IETF.

Специфика 2.0.0 (по состоянию на январь 2016 года все еще не выпущена) немного отличается от 1.x, но основы все ещекак описано @natevw.

Ваш ответ на вопрос