Я пытаюсь построить трубопровод с категориальными переменными import numpy as np
import pandas as pd
import sklearn
from sklearn.base import BaseEstimator, TransformerMixin
from sklearn import lin
У меня есть набор данных с 41 функциями [от 0 до 40 столбцов], из которых 7 являются категоричными. Это категорическое множество делится на два подмножества: Подмножество типа строки (столбец-функции
Я создаю пользовательский векторный указатель ngram для мешка словарной модели. Я доброжелателен - что делать, если во время векторизации короткого текста я нашел новый токен, который не существует в