У меня есть data.frame с двумя переменными, один из которых содержит только URL-адреса. Я хотел бы использовать эти URL-адреса, чтобы очистить их все и извлечь соответствующую текстовую информацию от каждого и каждого из них, и, сделав это, - добавить переменные в dataframe, чтобы получить текстовый анализ.Webcraping от переменной
FAO_CountryName FAO_CountryURL
Algeria http://www.fao.org/giews/countrybrief/country.jsp?code=DZA
Egypt http://www.fao.org/giews/countrybrief/country.jsp?code=EGY
Другими словами, я хотел бы найти способ, чтобы рассмотреть эти URL-адреса, как собственно HTML-страниц в моде, что я мог скоблить их с помощью команды read_html().
Идея заключается в том, чтобы иметь что-то вроде этого в конце процесса:
FAO_CountryName FAO_CountryURL FAOText
Algeria http://www.fao.org/giews/countrybrief/country.jsp?code=DZA Algeria is an interesting country
Egypt http://www.fao.org/giews/countrybrief/country.jsp?code=EGY Egypt is interesting as well but in a different way
Pls рассмотреть вопрос о принятии и upvoting ответа, если вы думаете, что может помочь другим людям – GGamba
Я новичок в стеке, поэтому я не получил репутацию достаточно пока, судя по всему. Я сделаю, как только> Я получу еще немного. – Ileeo
Привет, Большое спасибо за помощь. Хорошо для сценария, через который можно рассмотреть различные URL-адреса. В любом случае, я не понимаю, как формула должна применяться к каждой строке и - в любом случае - она, похоже, не работает с моим файловым фреймом FAO_data. Не могли бы вы прояснить ситуацию? Еще раз спасибо. – Ileeo