2016-05-12 6 views
-1

У меня есть набор данных с такими функциями: Duration-connect, IP, Duration-LogIn.Корреляционная матрица дискретных непрерывных переменных R

Duration-connect и Duration-LogIn являются непрерывными переменными, но IP - это каретный вариант, который содержит IP-адрес компьютера.

Я хотел бы создать корреляционную матрицу для этих функций. Но я не уверен, что cor() будет работать с функцией IP как непрерывная переменная.

Любая идея для решения этой проблемы.

Спасибо

+0

Добро пожаловать в переполнение стека! Пожалуйста, прочитайте информацию о [как задать хороший вопрос] (http://stackoverflow.com/help/how-to-ask) и как дать [воспроизводимый пример] (http://stackoverflow.com/questions/ 5963269). Это облегчит вам помощь другим людям. – zx8754

ответ

0

Это не сработает; просто попробуйте

> cor(iris) 
Error in cor(iris) : 'x' must be numeric 

Вы можете превратить ваш IP-адрес для числовых данных (например, использовать числовые значения, связанные с уровнями фактора, как числовые значения), но проблема в том, что нет особого смысла в вычислениях (Pearsson) корреляции по IP-адресам. Например. каково среднее набора IP-адресов? (Т. Е. Это неупорядоченный набор без метрики расстояния.)

В зависимости от того, что вы хотите сделать, я бы либо закрыл IP-адреса из расчета корреляции (и, возможно, настроил иерархию наборов IP-адресов вдоль некоторых логики и сравнения для них) или кластер непрерывных переменных и посмотреть, что это влечет за собой IP-адреса. Опять же, это зависит от вашей цели, но я думаю, что это не просто проблема механики R.

 Смежные вопросы

  • Нет связанных вопросов^_^