2016-04-30 4 views
-1

Я хочу использовать этот скрипт для создания пользовательского Wordlist. Wordlist ScriptРедактирование этого скрипта для моих нужд

Этот скрипт будет создавать Wordlist только с нижестоящими символами. Но я хочу более низкие/верхние символы и цифры. Выход должен быть как в этом примере:

test 
123test 
test123 
Test 
123Test 
Test123 

Я не знаю, как изменить его. Я был бы очень рад, если бы вы могли помочь мне в этом. Я пробовал некоторые учебные пособия для grep и regex, но я ничего не понимаю.

+0

Вы пытаетесь преобразовать слова нижнего регистра в camelCase в основном? – sweaver2112

+0

Нет. Этот скрипт скрещивает веб-сайты для слов, отфильтрованных grep и regex. Текущая конфигурация преобразует символы верхнего регистра в нижний регистр, но я хочу, чтобы слова были «оригинальными», как на сайте. – JKaiser

+2

Пожалуйста, включите ваш скрипт прямо в свой вопрос. Он может стать недоступным или вы просто передадите новую версию, и ваш вопрос больше не будет иметь смысла. –

ответ

1

Заменить строку 18 сценария

page=`grep '' -R "./temp/" | sed -e :a -e 's/<[^>]*>//g;/</N;//ba' | tr " " "\n" | tr '[:upper:]' '[:lower:]' | sed -e '/[^a-zA-Z]/d' -e '/^.\{9,25\}$/!d' | sort -u`; 

С этим:

page=`grep '' -R "./temp/" | sed -e :a -e 's/<[^>]*>//g;/</N;//ba' | tr " " "\n" | sort -u`; 

Если вы посмотрите на него, вы можете увидеть, как это

  1. заменяет " " с "\n",
  2. изменение дел
  3. фильтры по длине
  4. сорта

Вы можете удалить биты из этой трубы цепи и посмотреть, как изменяется выходной

0

удалить этот бит из сценария:

tr '[:upper:]' '[:lower:]' | 

что будет оставить дело в одиночку.

есть также немного в wordlist.sh, что только выбирает слова из 9 до 25 символов, которые вы можете удалить или изменить, если вы предпочитаете другой диапазон:

`sed -e '/[^a-zA-Z]/d' -e '/^.\{9,25\}$/!d' |` 

или вы могли бы попробовать простую стратегию: скачать и установить w3m, веб-браузер из командной строки, и заменить сложную линию в wordlist.sh с этим:

page=`grep '' -R "./temp/" | w3m -dump wikipedia.org | grep -o '\w\+' | sort -u` 

grep есть (странно) способ получить весь текст из HTML-файлов, а затем w3m -dump избавляется от всех тегов html и других не-дисплеев, а grep -o '\w\+' соответствует любому слову.