2017-02-21 28 views
0

У меня есть папка, содержащая тысячи файлов .json с именем thigs, например 99.json (номера последовательны). Некоторые из них содержат действительные записи, но другие просто содержат null на одной строке. Я хочу отфильтровать файлы, содержащие только null, чтобы они не испортили мой следующий шаг обработки. Конечно, это легко, но я не могу сразу увидеть, как это сделать.Фильтровать .json файлы для удаления с нулевыми записями

Это поможет в качестве дополнительного шага объединить действительные файлы (те, у которых полные или частично завершенные записи) в один файл в виде списка. Но это менее важно.

Все предложения с благодарностью оценили. Большое спасибо.

+0

null как ряд из четырех символов, излагающих слово «null» – curlew77

+0

Всегда ли оно присутствует в первой строке? Кроме того, это нормально, чтобы добавить действительное содержимое файла один за другим, чтобы создать один большой файл – Inian

+0

Все недопустимые файлы, на которые я смотрел до сих пор, просто имеют слово «null» в первой строке без символа конца строки , – curlew77

ответ

0

Чтобы найти все файлы с нулевым-х и группировать их в виде списка, вы можете использовать

grep *.json -e "null" >> badfiles.txt 

Чтобы найти все файлы с действительными значениями и сгруппировать их в виде списка, вы можете использовать

grep -v *.json -e "null" >> goodfiles.txt 
+0

Спасибо. Это сработало, как только я изменил «null» на «null $», чтобы исключить файлы, которые имели «нуль» в другом месте как часть допустимой записи. – curlew77