Wyniki wyszukiwania dla "bigdata"

3 odpowiedź

Nie znaleziono pakietu Rf ffsave „zip”

2 odpowiedź

importuj złożone dane Json do gałęzi

Niezbędne jest trochę karmienia łyżeczką, jak zaimportować kompleks json do ula. Plik Json w formacie:

3 odpowiedź

usuwanie duplikatów jednostek z ramki danych

1 odpowiedź

przekonwertować dane.frame na ff

2 odpowiedź

Praca z dużymi danymi w python i numpy, niewystarczająca ilość pamięci RAM, jak zapisać częściowe wyniki na dysku?

Usiłuję zaimplementować algorytmy dla danych 1000-wymiarowych z 200k + punktami danych w Pythonie. Chcę używać bibliotek numpy, scipy, sklearn, networkx i in...

1 odpowiedź

Model danych Cassandry dla szeregów czasowych

Pracuję nad modelem danych Cassandra do przechowywania szeregów czasowych (jestem nowicjuszem Cassandry). Mam dwie aplikacje: dane giełdowe w ciągu dnia i da...

3 odpowiedź

Jak przyspieszyć szacowanie GLM?

Używam RStudio 0.97.320 (R 2.15.3) na Amazon EC2. Moja ramka danych ma 200k wierszy i 12 kolumn.Próbuję dopasować regresję logistyczną z około 1500 parametra...

2 odpowiedź

Jak uzyskać tablicę / worek elementów z grupy Hive według operatora?

Chcę pogrupować według danego pola i uzyskać dane wyjściowe z polami zgrupowanymi. Poniżej znajduje się przykład tego, co próbuję osiągnąć: -Wyobraź sobie ta...

2 odpowiedź

Jak utworzyć dużą ramkę danych pand z zapytania sql bez wyczerpania pamięci?

Mam problem z zapytaniem o tabelę> 5 milionów rekordów z mojej bazy danych MS SQL Server. Chcę mieć możliwość wyboru wszystkich rekordów, ale mój kod wyda...

12 odpowiedzi

Jak wyprowadzić wyniki zapytania HiveQL do CSV?

chcielibyśmy umieścić wyniki zapytania Hive w pliku CSV. Myślałem, że polecenie powinno wyglądać tak: