Например, если вы только что оснастили модель конвейера тремя этапами и хотите установить некоторые параметры на втором этапе, вы можете просто сделать что-то вроде:
исал собственный ML PipelineEstimator
а такжеTransformer
для моего собственного алгоритма Python, следуя показанной схемеВот.
Однако в этом примере все параметры, необходимые для_transform()
были удобно переданы в Модель / Трансформатор оценщиком_fit()
метод. Но у моего преобразователя есть несколько параметров, которые контролируют способ применения преобразования. Эти параметры специфичны для трансформатора, поэтому было бы странно заранее передать их в оценщик вместе со специфическими параметрами оценки, используемыми для подгонки модели.
Я могу обойти это, добавив дополнительныеParams
к трансформатору. Это прекрасно работает, когда я использую оценщик и преобразователь за пределами ML Pipeline. Но как я могу установить эти специфичные для трансформатора параметры после того, как мой объект оценки был добавлен в качестве этапа в конвейер? Например, вы можете позвонитьgetStages()
наpyspark.ml.pipeline.Pipeline
и, следовательно, может получить оценки, но нет соответствующихgetStages()
метод наPipelineModel
, Я не вижу никаких методов для установки параметров наPipelineModel
этапы либо.
Так как я могу установить параметры на моем трансформаторе, прежде чем я позвонюtransform()
на подогнанной модели трубопровода? Я на Spark 2.2.0.