У меня есть набор данных в csv. К сожалению, каждая строка имеет разное количество запятых. Я заинтересован в импорте только первые 3 и последние 3 переменные из файла в R.Импорт первых трех и трех последних полей из CSV с переменным числом полей
в примере:
> line: "A","B","C","D",...,"X",Y","Z"
Я хочу, чтобы достичь следующего `
> line: "A","B","C","X","Y","Z"
Я попытался использовать grep, чтобы найти - с использованием регулятивных выражений - первых трех переменных:
new_data <- grep("([^,]+)(,[^,]+){2}", dataset, values=TRUE)
После этой операции он показывает мне все строки, в которых это выражение существует.
Как удалить следующие переменные в строке, используя grep, если это возможно, как удалить весь интервал (каждая переменная от < 3; n-3>).
Вы теперь другой способ решить эту проблему?
«К сожалению, каждая строка имеет различные количество запятых/полей ". Это можно назвать «оборванным» файлом или «переменным числом полей». – smci
Вы хотите решение внутри R или командной строки, как @VarunM дает? – smci
Внутри R-решения будет классно, я сейчас пытаюсь реализовать решение «awk», предоставляемое Varun. – Meyk