2014-03-02 5 views
1

Я хотел бы, чтобы извлечь все только щебет ручку из следующих действий: http://twitaholic.com/top100/followers/Зачистка веб-страница и извлекая слова, которые начинаются с определенным символом

Всего щебета ручки начать с @

Так что-то например, wget twitaholic.com/top100/followers/ | grep -oh "@" для печати только ручек, но это не работает (только печатает @). Что не так?

ответ

1

Вы используете -o вариант grep и только с указанием одного символа, то есть @, также вам не нужен вариант -h.

Попробуйте это:

wget twitaholic.com/top100/followers/ | grep -o "@[^<]*" 

Что мы говорим grep здесь ищет @ символа и захватить все, пока вы не увидите < символ. Это происходит потому, что линия, которая несет в себе ручку выглядит следующим образом:

;@BarackObama<br 

Таким образом, вы фактически должны извлечь текст, начиная с @ в <.

Выход:

$ wget twitaholic.com/top100/followers/ | grep -o "@[^<]*" | head -10 
@katyperry 
@justinbieber 
@BarackObama 
@ladygaga 
@YouTube 
@taylorswift13 
@britneyspears 
@rihanna 
@jtimberlake 
@instagram 
+1

Ах вот почему спасибо. знак равно – Morki

 Смежные вопросы

  • Нет связанных вопросов^_^