1
У меня есть следующие данные:как удалить HTML-теги из dataframe в г
То, что я хочу сделать, это удалить HTML-теги из колонки описания также, если есть какие-либо данные, такие как это «Ù ... ØØ ± Ø ±/Ù ... ØØ ± Ø ± Ø ©" может быть удалено.
это мой код после удаления null данные.
mydata <- read.csv("data science - sample date.csv", header = TRUE, na.strings=c("", "NA"), sep = ",")
mydata[mydata==""] <- NA
mydata <-na.omit(mydata)
Вы должны были бы разобрать разметку, чтобы сделать это правильно. Что вы хотите сохранить? – duffymo
К сожалению, это файл CSV, который я получил от своего клиента. Я хочу очистить данные и удалить HTML-код. – john
Изображение данных не является воспроизводимым примером. Я бы попытался проанализировать данные, используя библиотеку разбора HTML, поскольку регулярных выражений недостаточно для анализа HTML – cory