Jak zaimplementować self-join / cross-product z hadoop?

Question

Jun 16, 2012, 09:33 PM

Jak zaimplementować self-join / cross-product z hadoop?

Powszechnym zadaniem jest dokonanie oceny na parach elementów: Przykłady: de-duplikacja, filtrowanie grupowe, podobne elementy itp. Jest to w zasadzie samo-przyłączenie lub cross-product z tym samym źródłem danych.

questionAnswers(2)

Popularne pytania

0 odpowiedzi

Django - Jak uzyskać adres URL administratora z instancji modelu

0 odpowiedzi

Połącz dwie tablice jako kluczowe pary wartości w PHP

0 odpowiedzi

iOS Facebook SDK 3.1 Odzyskaj urodziny przyjaciela, zwracając wartość null

0 odpowiedzi

Pierwszeństwo C ++ Implicit Conversion Operators

0 odpowiedzi

wysyłanie żądania http z Ajax przy każdej zmianie pola wyboru

Jesteś bardzo aktywny! To świetnie!

Jak zaimplementować self-join / cross-product z hadoop?

questionAnswers(2)

yourAnswerToTheQuestion

Popularne pytania