я использую эту функцию для оценки моей модели def stratified_cv(X, y, clf_class, shuffle=True, n_folds=10, **kwargs):
X = X.as_matrix().astype(np.float)
y = y.as_matrix().astype(np.int)
Я запускал случайную модель классификации лесов и первоначально делил данные на поезд (80%) и тест (20%). Однако в предсказании было слишком много False Positive, которое, по моему мнению, было связан
Я черчение матрицы путаницы в течение нескольких маркированы данных, где метки похожи: label1: 1, 0, 0, 0 LABEL2: 0, 1, 0, 0 Метка3: 0, 0, 1, 0 label4: 0, 0, 0, 1 Я могу успешно классифицировать, испо