Я хотел бы объединить функцию dplyr через каталог csv-файлов. Я знаю, как реализовать команду для одного файла, но было бы полезно сделать это для всего каталога, чтобы ускорить процесс, а также создать выходной файл, содержащий сводные данные для каждого файла, к которому была применена функция ,Примените функцию dplyr ко многим файлам
По существу, каждый файл csv содержит информацию о видах, отобранных в сообществе, на нескольких заводах-хозяевах и годах. Я хотел бы обобщить количество уникальных таксонов, отобранных заводом-изготовителем и годом. Я могу сделать это с помощью:
taxa <- file %>% group_by(crop, year) %>% summarise(num_taxa=n_distinct(taxon))
Глядя на некоторые примеры здесь, я знаю, как читать в списке файлов и настройки функции приложения с помощью lapply. Тем не менее, у меня возникают трудности с внедрением рабочей функции и созданием выходного файла со сводными данными для всех файлов. Любые советы будут очень признательны.
Если вы не столкнулись с проблемами памяти: прочитайте их все в один файл, используя 'bind_rows (lapply (list.files (wherever), read.csv))'; используйте 'group_by (файл, урожай, год)%>% do_whatever'; затем пишите в один файл. – Frank
Или, добавив к рекомендации Фрэнка, используйте 'do' с функцией записи для записи отдельных файлов. – Gregor