Этот вопрос похож на this one. Я хотел бы напечатать лучшие параметры модели после выполнения TrainValidationSplit в pyspark. Я не могу найти кусок текста другой пользователь использует, чтобы ответить на этот вопрос, потому что я работаю над jupyter и бревенчатых пропадает из терминала ...Как распечатать лучшие параметры модели в трубопроводе pyspark
Часть кода:
pca = PCA(inputCol = 'features')
dt = DecisionTreeRegressor(featuresCol=pca.getOutputCol(),
labelCol="energy")
pipe = Pipeline(stages=[pca,dt])
paramgrid = ParamGridBuilder().addGrid(pca.k, range(1,50,2)).addGrid(dt.maxDepth, range(1,10,1)).build()
tvs = TrainValidationSplit(estimator = pipe, evaluator = RegressionEvaluator(
labelCol="energy", predictionCol="prediction", metricName="mae"), estimatorParamMaps = paramgrid, trainRatio = 0.66)
model = tvs.fit(wind_tr_va);
Спасибо заранее.