У меня есть dataframe data
, содержащий реальные значения и некоторые значения NaN. Я пытаюсь выполнить чувствительное к местоположению хэширование с использованием случайных прогнозов, чтобы уменьшить размер до 25 компонентов, в частности с классом sklearn.random_projection.GaussianRandomProjection
. Однако, когда я бегу:Случайная проекция в Python Pandas с использованием dataframe, содержащей значения NaN
tx = random_projection.GaussianRandomProjection(n_components = 25) data25 = tx.fit_transform(data)
я Input contains NaN, infinity or a value too large for dtype('float64')
. Есть ли обстановка? Я попытался изменить все значения NaN на значение, которое никогда не присутствует в моем наборе данных, например -1. Насколько действителен мой вывод в этом случае? Я не являюсь экспертом теории чувствительных к хэшированию/случайных прогнозов местности, поэтому любое понимание было бы полезно. Благодарю.