Результаты поиска по запросу "data-processing"

6 ответов

Как правильно сгладить кривую?

Предположим, у нас есть набор данных, который может быть дан примерно import numpy as np x = np.linspace(0,2*np.pi,100) y = np.sin(x) + np.random.random(100) * 0.2Поэтому у нас есть вариация 20% набора данных. Моя первая идея заключалась в том, ...

3 ответа

Обработка пропущенных / неполных данных в R - есть ли функция для маскировки, но не для удаления NA?

Как и следовало ожидать от DSL, предназначенного для анализа данных, R очень хорошо обрабатывает отсутствующие / неполные данные, например:Многие функции R и...

4 ответа

Как прочитать 4ГБ файл в 32-битной системе

В моем случае у меня есть разные файлы, давайте предположим, что у меня есть> 4 ГБ файл с данными. Я хочу читать этот файл построчно и обрабатывать каждую...

ТОП публикаций

7 ответов

Как правильно сгладить кривую?

Предположим, у нас есть набор данных, который может быть дан примерно

3 ответа

Причина использования 100-узловых кластеров hBase не в том, что HBase не масштабируется до больших размеров. Это объясняется тем, что проще обновлять программное обеспечение hBase / HDFS, не прерывая работу всего сервиса. Другая причина заключается в том, чтобы запретить использование одного NameNode как SPOF для всей службы. Кроме того, HBase используется для различных сервисов (не только для сообщений FB), и разумно использовать подход, основанный на использовании печенья, для настройки многочисленных кластеров HBase на основе подхода с 100 узлами. Число 100 является adhoc, мы не сосредоточились на том, является ли 100 оптимальным или нет.

ти приземлился в Кассандре после моего исследования решений для хранения больших объемов данных. Но обычно говорят, что Hbase - лучшее решение для крупномасштабной обработки и анализа данных. Хотя оба хранилища одинаковы по ключу / значению, и ...

1 ответ

Обработка данных с динамическим добавлением столбцов в Python Dataframe Pandas

У меня следующая проблема. Допустим, это мой CSV

1 ответ

Pandas Dataframe выбирает группы с минимальным количеством элементов

У меня есть проблема, когда мне нужно взять группы строк из фрейма данных, где количество элементов в группе превышает определенное количество (отсечение). Д...

2 ответа

Лексикон словарь для синонимов слов

Для обработки естественного языка доступно несколько словарей. Как положительные, отрицательные слова, словари и т. Д.Доступен ли какой-либо словарь, содержа...

4 ответа

Способы только для чтения выбрать столбцы из файла в R? (Счастливое среднее между `read.table` и` scan`?) [Duplicate]

На этот вопрос уже есть ответ здесь:Читать только ограниченное количество столбцов 3 ответаУ меня есть очень большие файлы данных с разделителями иЯ хочу обр...