Итак, я пытаюсь превратить текстовый файл (каждая строка - журнал чата) в R, чтобы превратить его в фрейм данных и дополнительно упорядочить данные.Загрузка текстового файла в R для анализа журнала чата
Я использую read.Lines, поэтому я могу иметь каждый журнал как одну строку. Поскольку read.Lines читает их один длинный символ; Затем я конвертирую их в строки (мне нужно проанализировать журнал); согласно ниже
rawchat <- readLines("disc-W-App-avec-loy.txt")
rawchat <- c(lapply(rawchat, toString))
Моя проблема возникает, когда я хочу, чтобы превратить этот список в кадр данных:
rawchat <- as.data.frame(rawchat)
Это превращает список в кадр данных, 1 наблюдения 42000 переменных. Цель состояла в том, чтобы превратить его в 42 000 наблюдений за одной переменной.
Любая помощь пожалуйста?
Кстати, я довольно новое в уборке необработанных данных в R.
Итак, я столкнулся с другой блок:
Я загружен текстовый файл в качестве кадра данных в соответствии с ниже.
rawchat <- readLines("disc-W-App-avec-loy.txt")
rawchat <- as.data.frame(rawchat, stringsAsFactors=FALSE)
names(rawchat) <- "chat"
В настоящее время я пытаюсь определить любую строку (42000), который начинается с номером 16. Я не могу показаться, чтобы правильно применить startsWith()
функцию или dplyr
starts_with()
, даже grepl
с регулярными выражениями.
Может быть формат наблюдений кадра данных (chr
)?
Похоже 'rawchat' вектор, верно? Если да, возможно, 'rawchat <- data.frame (text = rawchat, stringsAsFactors = FALSE)'? – rosscova
Does 'data.frame (sapply (rawchat, toString))' дает правильный ответ сразу после использования 'readLines'? – gsun
Я не пробовал это. Я сделал: rawchat <- readLines ("disc-W-App-avec-loy.txt") ") rawchat <- as.data.frame (rawchat, stringsAsFactors = FALSE) –