Загрузка текстового файла в R для анализа журнала чата

Итак, я пытаюсь превратить текстовый файл (каждая строка - журнал чата) в R, чтобы превратить его в фрейм данных и дополнительно упорядочить данные.Загрузка текстового файла в R для анализа журнала чата

Я использую read.Lines, поэтому я могу иметь каждый журнал как одну строку. Поскольку read.Lines читает их один длинный символ; Затем я конвертирую их в строки (мне нужно проанализировать журнал); согласно ниже

rawchat <- readLines("disc-W-App-avec-loy.txt") 
rawchat <- c(lapply(rawchat, toString))

Моя проблема возникает, когда я хочу, чтобы превратить этот список в кадр данных:

rawchat <- as.data.frame(rawchat)

Это превращает список в кадр данных, 1 наблюдения 42000 переменных. Цель состояла в том, чтобы превратить его в 42 000 наблюдений за одной переменной.

Любая помощь пожалуйста?

Кстати, я довольно новое в уборке необработанных данных в R.

Итак, я столкнулся с другой блок:

Я загружен текстовый файл в качестве кадра данных в соответствии с ниже.

rawchat <- readLines("disc-W-App-avec-loy.txt") 
rawchat <- as.data.frame(rawchat, stringsAsFactors=FALSE) 
names(rawchat) <- "chat"

В настоящее время я пытаюсь определить любую строку (42000), который начинается с номером 16. Я не могу показаться, чтобы правильно применить startsWith() функцию или dplyrstarts_with(), даже grepl с регулярными выражениями.

Может быть формат наблюдений кадра данных (chr)?

источник

2017-02-10 Daniel Vargas

Похоже 'rawchat' вектор, верно? Если да, возможно, 'rawchat <- data.frame (text = rawchat, stringsAsFactors = FALSE)'? – rosscova

Does 'data.frame (sapply (rawchat, toString))' дает правильный ответ сразу после использования 'readLines'? – gsun

Я не пробовал это. Я сделал: rawchat <- readLines ("disc-W-App-avec-loy.txt") ") rawchat <- as.data.frame (rawchat, stringsAsFactors = FALSE) –

Проблема заключается ваш rawchat <- c(lapply(rawchat, toString)) Просто используйте

rawchat <- readLines("disc-W-App-avec-loy.txt")") 
rawchat <- as.data.frame(rawchat, stringsAsFactors=FALSE)

источник

2017-02-10 00:42:27 G5W

Ну, мне немного стыдно. было легко. Спасибо большое! –

Загрузка текстового файла в R для анализа журнала чата

ответ

Смежные вопросы