Это своего рода странный вопрос, по крайней мере для меня, поскольку я не совсем понимаю, что в этом полностью задействовано. В основном, я делаю этот процесс, когда я сохраняю очищенный документ (например, веб-страницу) до файла .txt
. Затем я могу легко использовать Perl для чтения этого файла и поместить каждую строку в массив. Тем не менее, это не делается на основе каких-либо видимых вещей в документе (т. Е. Это не происходит путем разрывов строк HTML); он просто знает, где новая строка, на основе формата .txt
.Perl разделяет текстовую строку (с HTML-страницы, текстового документа и т. Д.) По строке в массив?
Однако, я хотел бы вырезать этот процесс и просто сделать то же самое изнутри переменной, поэтому вместо этого у меня было бы то, что было бы содержимым файла .txt
в строке, а затем я хочу проанализировать его , таким же образом, по строкам. Проблема для меня в том, что я мало знаю о том, как это будет работать, поскольку я действительно не понимаю, как Perl сможет определить, где находится новая строка (предполагая, что я не буду проходить через строки HTML, так как это часто это просто веб-файл .txt (который представляет мой скребок, www: mechanize, как веб-страница), я соскабливаю, чтобы не было HTML-кода). Я полагаю, что могу сделать это, используя другие параметры, такие как пробелы, но мне интересно узнать, есть ли способ сделать это по строке. Любая информация оценена.
Я бы хотел сократить фактическую сохранность файла, чтобы уменьшить проблемы, связанные с разрешениями на серверах, которые я использую, а также просто интересно, могу ли я сделать процесс более эффективным.
спасибо, это именно то, что я ищу .. Я попробую это – Rick