Самый быстрый способ удалить дубликаты документов в mongodb
У меня есть около 1,7 млн. Документов в mongodb (в будущем 10 млн. +). Некоторые из них представляют собой повторяющиеся записи, которые я не хочу. Структура документа примерно такая:
{
_id: 14124412,
nodes: [
12345,
54321
],
name: "Some beauty"
}
Документ является дубликатом, если он имеет нахотя бы один узел такой же как еще один документ сто же имя, Какой самый быстрый способ удалить дубликаты?