ответ

6

Нет, это невозможно. Любой метод уменьшения размерности вообще является операцией с потерями. Если вы отбросьте некоторые измерения, вы не сможете вернуть эту информацию. В целом, то есть для некоторых возможных наборов данных. Могут существовать некоторые наборы данных, в которых некоторая информация избыточна - если конкретный метод сокращения размерности сможет использовать именно это в совершенстве, тогда будет возможно идеальное обратное преобразование.

На рисунке ниже я привел простой пример. Вы можете проектировать множество различных конфигураций точек из трехмерного пространства в одну и ту же конфигурацию точки в 2D-пространстве. Поэтому, учитывая только 2D-пространство, невозможно угадать, из какой 3D-конфигурации эти точки исходили. Вы не знаете значения их z-координаты и существует бесконечное количество возможностей.

enter image description here

+0

Хороший рисунок! Я думаю, что это может быть не так плохо для KMeans, поскольку трансформация выводит расстояния, что делает реконструкцию лежащей на пересечении (компактных) сфер. Таким образом, расстояния несколько лучше кодируются (две точки с одинаковым расстоянием «R» до центроида не могут находиться бесконечно далеко друг от друга, максимальное расстояние - «2R») – eickenberg

+1

@eickenberg Да, определенно это не так уж плохо, как просто забыть некоторые координаты, но все же это потеря информации. И вы правы, что в некоторых случаях вы можете в какой-то степени изменить преобразование (я предполагаю, что по крайней мере: большое количество центроидов). – BartoszKP

+1

Возможно, но я не уверен. Я не уверен, каковы первоначальные намерения плаката, но некоторые из оценщиков «sklearn» оснащены методом «inverse_transform», который делает наиболее разумную аппроксимацию обратного преобразования, если вы понимаете потерю информации, вызванную методом , Кажется, он не существует для 'KMeans', но он может выводить, например. ближайший центр кластера для каждого образца. – eickenberg