Результаты поиска по запросу "bigdata"

3 ответа

Загружать данные в Hive с помощью пользовательского разделителя

Я пытаюсь создать внутреннюю (управляемую) таблицу в кусте, которая может хранить мои дополнительные данные журнала. Таблица выглядит так:

1 ответ

Spark :: KMeans дважды вызывает takeSample ()?

У меня много данных, и я экспериментировал с разделами кардинальности [20k, 200k +].Я называю это так:

1 ответ

Скала неизменяемая Карта медленная

ТОП публикаций

1 ответ

Несбалансированный фактор KMeans?

2 ответа

KMeans Spark не в состоянии обрабатывать большие данные?

KMeans имеет несколько параметров для егоповышение квалификации, с режимом инициализации по умолчанию kmeans ||. Проблема в том, что он быстро (менее 10 мину...

1 ответ

Как удалить дублирующиеся строки с помощью панд в большой файл данных?

1 ответ

Подготовьте мои большие данные с помощью Spark через Python

2 ответа

Читать n строк большого текстового файла

Самый маленький файл, который у меня есть, имеет> 850 тыс. Строк, и каждая строка имеет неизвестную длину. Цель состоит в том, чтобы прочитать

1 ответ

Почему Spark OneHotEncoder по умолчанию отбрасывает последнюю категорию?

Я хотел бы понять, почему в OneHotEncoder от Spark по умолчанию отбрасывается последняя категория.Например:

2 ответа

Кафка тема на одного производителя

Допустим, у меня есть несколько устройств. Каждое устройство имеет разные типы датчиков. Теперь я хочу отправить данные с каждого устройства для каждого датч...