2016-04-20 8 views
0

есть эквивалент под окнами заповедал:Как вырезать ссылки с веб-сайта в текстовый файл в окнах партии

grep -Po '(?<=href=")[^"]*' file

Идея заключается в том, чтобы захватить все ссылки непосредственно с веб-сайта в текстовый файл , и эти ссылки имеют общий префикс http://download. и суффикс /file

С уважением.

+0

Я пробовал все комбинации с ** findstr/r **, но результатом является вся таблица строк , вопрос теперь будет: как получить только чистый URL§ –

+0

Я использовал ** xidel 2.txt -e '(// @ href, //@src)/resolve-uri(.)'**, но как фильтровать URL-адреса, начинающиеся с ** http: //download.** и заканчивающиеся на **/file * *? –

+0

Является ли использование пакета окон обязательным или просто для физических упражнений? Если позже, вы, вероятно, должны использовать другие параметры, доступные в любой новой установке Windows из коробки, такие как VB Script, Powershell и т. Д. –

ответ

0

У вас есть возможность установить cygwin или другую оболочку для Windows? В этом случае вы можете использовать grep и другие полезные инструменты.

Windows имеет findstr (запустите findstr /? Для справки) и найдите.

+0

Я пробовал ** findstr/R "(. * Скачать. * Файл)" c: \ users \ user \ desktop \ 2.txt **, но нет вывода, в то время как файл 2.txt содержит ссылки как шаблон –