dictvectorizer

1зной

1ответ

Категориальные переменные в трубопроводе: измерение рассогласования

Я пытаюсь построить трубопровод с категориальными переменными import numpy as np import pandas as pd import sklearn from sklearn.base import BaseEstimator, TransformerMixin from sklearn import lin

2зной

4ответ

Как кодировать категориальные функции в sklearn?

У меня есть набор данных с 41 функциями [от 0 до 40 столбцов], из которых 7 являются категоричными. Это категорическое множество делится на два подмножества: Подмножество типа строки (столбец-функции

1зной

1ответ

ngram векторизация - если обнаружен новый токен, который не существует в корпусе, что мне делать с ним?

Я создаю пользовательский векторный указатель ngram для мешка словарной модели. Я доброжелателен - что делать, если во время векторизации короткого текста я нашел новый токен, который не существует в