Я работаю над подготовкой и тестированием данных с использованием SVM (scikit). Я тренирую СВМ и готовлю марихуану. Затем я использую этот маринован для проверки своей системы. Сначала я читаю данные обучения и данные тестирования в переменных train_data
и test_data
соответственно.Python-Scikit. Обучение и тестирование данных с использованием SVM
После этого код, я использую для обучения:
vectorizer = TfidfVectorizer(max_df = 0.8,
sublinear_tf=True,
use_idf=True)
train_vectors = vectorizer.fit_transform(train_data)
test_vectors = vectorizer.transform(test_data)
classifier_rbf = svm.SVC()
classifier_rbf.fit(train_vectors, train_labels)
from sklearn.externals import joblib
joblib.dump(classifier_rbf, 'pickl/train_rbf_SVM.pkl',1)
Снова во время тестирования, я читаю обучающие данные и данные тестирования в переменных train_data
и test_data
соответственно. Код, который я использую для тестирования:
vectorizer = TfidfVectorizer(max_df = 0.8,
sublinear_tf=True,
use_idf=True)
train_vectors = vectorizer.fit_transform(train_data)
test_vectors = vectorizer.transform(test_data)
from sklearn.externals import joblib
classifier_rbf = joblib.load('pickl/train_rbf_SVM.pkl')
prediction_rbf = classifier_rbf.predict(test_vectors)
Этот код работает нормально и дает правильный результат. Мой вопрос: обязательно ли читать учебные данные всякий раз, когда я хочу провести тестирование?
спасибо.
Я мариновал свой «train_vector», а также «train_labels». Даже тогда, если я удаляю строку с вызовом 'fit_transform', это дает мне ошибку, что словарный запас не установлен. – Himadri
Trainvector и trainlabels doest matter .. То, что вы должны рассолить, - это векторизатор и classifier_rbf –
Это то, что я сделал в коде, показанном в моем вопросе. Можете ли вы написать код в своем ответе за меня. Спасибо. – Himadri