У меня есть фреймворк данных, который содержит части целых предложений, разбросанных по всем, в некоторых случаях, нескольким строкам данных.Сочетание фрагментированных предложений в R-кадре данных
Например, head(mydataframe)
возвращает
# 1 Do you have any idea what
# 2 they were arguing about?
# 3 Do--Do you speak
# 4 English?
# 5 yeah.
# 6 No, I'm sorry.
Предполагая, что предложение может быть прекращено любой из
"" или "?" или "!" или «...»
есть ли библиотека R функции, способные выводить следующее:
# 1 Do you have any idea what they were arguing about?
# 2 Do--Do you speak English?
# 3 yeah.
# 4 No, I'm sorry.
Какой функции вы использовали для чтения в данных? Как выглядит источник данных? – tchakravarty
Я написал функцию для синтаксического анализа файла .srt в dataframe. Все из srt было удалено, за исключением того, что вы видите выше. –