Фильтрация данных в формате Twitter только для текста на английском языке с использованием Python

Есть ли способ фильтровать уже обработанный набор данных только для текста на английском языке с использованием Python? Возможно, некоторые функции NLTK или что-то в этом роде. Данные были извлечены из Twitter, и это формат выглядит следующим образом:Фильтрация данных в формате Twitter только для текста на английском языке с использованием Python

<tweetid>, <username>, <userid> &8888 <tweet text>

фильтрации потока не подходит, так как у меня исходные данные только в формате показано выше. Любая помощь будет оценена, спасибо.

2016-07-20 mjackie

Что вам нужно, это модуль определения языка.

from textblob import TextBlob  
textBlob('your tweet').detect_language()

2016-07-20 18:59:28 Aaron

Спасибо, это очень полезно. – mjackie

ответ