У меня есть набор данных с двумя столбцами (символ) - текст, источник, я хочу создать набор данных таким образом, что если конкретное значение в текстовом столбце присутствует менее 5 раз. Я использую ниже код, но он дает только первое вхождение, вместо этого мне нужны все наблюдения, которые удовлетворяют этому условию. Например: «iphone» присутствует в тексте 4 раза, поэтому мне нужны все 4 наблюдения и их соответствующий источник, но для этого я получаю только одно наблюдение.Проблема с группой по выражению в sqldf
test = sqldf('select * , count(*) as count from base group by text having count < 5')
Я знаком с proc sql
в SAS и я недавно начал изучать Р. Ли sqldf
работает по-другому?
Спасибо большое! Может быть, sas sql ведет себя по-другому, сначала я должен изучить стандартные SQL-правила. Я получил вашу точку зрения, я буду предоставлять код, содержащийся в ящике, в следующий раз. –