нормализация квантилей на пандах

Проще говоря, как применить квантильную нормализацию к большому массиву данных Pandas (вероятно, 2 000 000 строк) в Python?

PS. Я знаю, что существует пакет с именем rpy2, который может запустить R в подпроцессе, используя квантиль нормализации в R. Но правда в том, что R не может вычислить правильный результат, когда я использую набор данных, как показано ниже:

5.690386092696389541e-05,2.051450375415418849e-05,1.963190184049079707e-05,1.258362869906251862e-04,1.503352476021528139e-04,6.881341586355676286e-06
8.535579139044583634e-05,5.128625938538547123e-06,1.635991820040899643e-05,6.291814349531259308e-05,3.006704952043056075e-05,6.881341586355676286e-06
5.690386092696389541e-05,2.051450375415418849e-05,1.963190184049079707e-05,1.258362869906251862e-04,1.503352476021528139e-04,6.881341586355676286e-06
2.845193046348194770e-05,1.538587781561563968e-05,2.944785276073619561e-05,4.194542899687506431e-05,6.013409904086112150e-05,1.032201237953351358e-05

Редактировать:

Что я хочу:

Учитывая данные, показанные выше, как применить квантильную нормализацию, следуя шагам вhttps://en.wikipedia.org/wiki/Quantile_normalization.

Я нашел кусок кода в Python, заявляющий, что он может вычислить квантиль нормализации:

import rpy2.robjects as robjects
import numpy as np
from rpy2.robjects.packages import importr
preprocessCore = importr('preprocessCore')


matrix = [ [1,2,3,4,5], [1,3,5,7,9], [2,4,6,8,10] ]
v = robjects.FloatVector([ element for col in matrix for element in col ])
m = robjects.r['matrix'](v, ncol = len(matrix), byrow=False)
Rnormalized_matrix = preprocessCore.normalize_quantiles(m)
normalized_matrix = np.array( Rnormalized_matrix)

Код прекрасно работает с примерами данных, использованными в коде, однако, когда я тестирую его с данными, приведенными выше, результат получается неверным.

Так как ryp2 предоставляет интерфейс для запуска R в подпроцессе python, я снова тестирую его непосредственно в R, и результат все равно был неверным. В результате я думаю, что причина в том, что метод в R неверен.

Ответы на вопрос(5)

Ваш ответ на вопрос