2017-02-14 11 views
-3

Я просто изучаю R, и у меня возникают проблемы с репликацией использования отдельной функции().Отдельная функция, не ограничивающая правильность

У меня есть данные ниже, которые я хотел бы разграничить. Мой код выглядит следующим образом:

separate(DF, col ="PARAM_2",paste0("x",1:257),sep="|") 

Вот пример исходных данных:

        PARAM_2 TRANSACTION_ID REVENUE 

1        16522337|10086236  3812351327 449.97 
2        21106549|24390750  3851589288 67.98 
3          23475149  3804446998 54.99 
4          19397324  3866373678 224.97 
5        23317326|23825351  3820764147 109.99 
6     20433128|20433140|20433165  4962022906 369.94 
7          19506902  3835040778 10.50 
8 24095014|25029701|24244086|24244271|16803155  3910007218 142.97 
9          24036073  3887666318 22.49 
10     19972354|14519726|18168381  3757376277 98.89 

Я не совсем уверен, почему, но код размещения одного символа в строку вместо разграничения по | разделитель. Вот то, что выход, используя мой некорректный код выглядит следующим образом:

 x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 x13 x14 x15 x16 x17 
    <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> 
1   1  6  5  2  2  3  3  7  |  1  0  0  8  6  2  3 
+2

Параметр 'sep' принимает регулярное выражение, поэтому вам нужно выйти из канала, если вы имеете в виду его буквально:' sep = '\\ |' '. Или просто не уточняйте, и он все равно разделится на трубах. Кроме того, 'separate_rows' будет работать лучше, если у вас есть неравномерное количество разделов. – alistaire

+1

Спасибо alistaire, добавив \\ перед трубой! – Alan

ответ

0

Вместо указания имен столбцов вручную, когда количество разделителей различны для каждой строки, мы можем использовать cSplit, который делает это автоматически

library(splitstackshape) 
cSplit(DF, "PARAM_2", "|") 
+1

спасибо за это, посмотрим в splitstackshape в следующий раз. Просто пытаюсь понять основные функции R по одному за раз. – Alan