«Прежде чем приступить к реализации любого алгоритма обучения, всегда полезно визуализировать данные, если это возможно».Как я могу визуализировать 6 измерений?
Эта цитата из Andrew Ng «Машиноведение».
Я хочу использовать логистическую регрессию для прогнозирования отсутствующих значений для Age (Titanic). Моя цель - не иметь лучший результат, но сделать это для удовольствия.
Но я не знаю, как я могу, как я могу представить себе 6 измерений: 1. Pclass 2. Пол 3. Возраст 4. SibSp 5. Парч 6. Плата за проезд
путь начиналЭндрю Ng рассказал о некоторых примерах с двумя измерениями. Легко визуализировать данные. Но как я могу визуализировать данные (чтобы найти отсутствующие значения для Age), если у меня есть 6 измерений?
Может быть, я могу использовать анализ главных компонент (PCA) для выполнения снижения размерности, но я надеюсь, что я могу найти более простой способ, чем PCA (Andrew Ng сказала, что PCA хорошо для уменьшения размерности)
вы не всегда визуализируете все размеры одновременно;) – malioboro
Это может быть не в тему, но обычно, когда визуально математический объект с большими размерами, легче смотреть на контуры. Это имеет особое значение в статистике - контурный график будет отображать зависимость двух переменных. Сделайте несколько из них. (Подумайте о топографической карте, визуализирующей 3D-ландшафт). – kabanus
Вы можете попробовать параллельные координаты. Это должно работать нормально для 6 измерений, если вы https://en.wikipedia.org/wiki/Parallel_coordinates – Vlad