Мне нравится использовать scikit's LOGO (оставить одну группу) в качестве метода перекрестной проверки в сочетании с кривыми обучения. В большинстве случаев это работает очень хорошо, но я могу (эффек
Я использую пример из книги О'Рейли «Введение в машинное обучение с помощью Python», используя Python 2.7 и sklearn 0.16. Код, я использую: pipe = make_pipeline(TfidfVectorizer(), LogisticRegression()
Вопрос в том, когда я вписываюсь в GridSearch, мне нужно что-то сделать для процесса перекрестного валидации? Вещь, что я знаю: 1.- можно установить функцию подсчета очков (но не очень понятно, как эт
Я запускаю несколько вложенных циклов, чтобы выполнить поиск сетки гиперпараметров. Каждый вложенный цикл проходит через список значений гиперпараметров и внутри самого внутреннего цикла, последовател
Я пытаюсь сделать анализ настроений по данным twitter, следуя главе 6 книги Building Machine Learning Systems в Python. Я использую набор данных: https://raw.githubusercontent.com/zfz/twitter_corpus/m