2014-09-26 5 views
1

Я полностью новичок с BeautifulSoup и python dev, и я хочу, чтобы код был сценарием для автоматизации некоторых вещей для моего личного сайта.Выберите, введите и выполните синтаксис BeautifulSoup и Python?

Я делаю это:

#!/usr/bin/env python 

""" Test menu for Website 
""" 

import urllib2 
from bs4 import BeautifulSoup 

print (47 * '-') 
print (" C H O I C E L I S T") 
print (47 * '-') 
print ("1. Page One") 
print ("2. Page Two") 
print ("3. Page Three") 
print ("4. Page Four") 
print (47 * '-') 
print (47 * '-') 

############################# 
## Robust error handling ## 
## only accpet int  ## 
############################# 
## Wait for valid input in while...not ### 

is_valid=0 

while not is_valid : 
     try : 
       choice = int (raw_input('Enter your choice [1-8] : ')) 
       is_valid = 1 ## set it to 1 to validate input and to terminate the while..not loop 
     except ValueError, e : 
       print ("'%s' is not a valid choice." % e.args[0].split(": ")[1]) 


### Take action as per selected choice list option ### 

if choice == 1: 
     print ("www.mywebsite.com/page_one.html") 
elif choice == 2: 
     print ("www.mywebsite.com/page_two.html") 
elif choice == 3: 
     print ("www.mywebsite.com/page_three.html") 
elif choice == 4: 
     print ("www.mywebsite.com/page_four.html") 
else: 
     print ("Invalid choice. try again...") 

print (47 * '-') 
print (47 * '-') 


username = raw_input("Please, type your username\n") 


html_content = urllib2.urlopen("http://" + [choice] + "/" + username) 

soup = BeautifulSoup(html_content, "lxml") 

##################### 
## STRINGS REPLACE ## 
##################### 

start_msg = "Hey, you have " 
end_msg = "comments !" 
end_str = "read !" 


#################### 
## COMMENTS COUNT ## 
#################### 

count_comments = soup.find("span", "sidebar-comments") 
count_comments 
count_comments_final = count_comments.find_next("meta") 


################ 
## COUNT READ ## 
################ 

count_read = soup.find("span", "sidebar-read") 
count_read 
count_read_final = count_read.find_next("meta") 



################## 
## PRINT RESULT ## 
################## 

print start_msg + count_comments_final['content'].split(':')[1] + end_msg 
print start_msg + count_read_final['content'].split(':')[1] + end_str 

С помощью этого скрипта, я хочу:

1 - Выбор мой веб-страницу (список выбора - 4)

2 - Введите свое имя пользователя

3 - проанализируйте веб-страницу, которую я выбрал, и получаю счет для всех комментариев и всех прочитанных.

Моя проблема здесь html_content = urllib2.urlopen("http://" + [choice] + username), я не могу получить параметр, необходимый для хорошего URL!

Не могли бы вы помочь мне найти правильный синтаксис, пожалуйста!

Мой последний URL должен быть: http://www.mywebsite.com/page_one.html/username

ответ

2

Это странное URL, чтобы иметь, но единственное, что вам нужно, чтобы сохранить URL в переменной и повторного использования.

Кроме того, я хотел бы использовать словарь для сопоставления выбор Int и фактический URL:

mapping = { 
    1: 'www.mywebsite.com/page_one.html', 
    2: 'www.mywebsite.com/page_two.html', 
    3: 'www.mywebsite.com/page_three.html', 
    4: 'www.mywebsite.com/page_four.html' 
} 

try: 
    page = mapping[choice] 
except KeyError: 
    print ("Invalid choice. try again...") 
    # TODO: try again? :) 

username = raw_input("Please, type your username\n") 

url = "http://{page}/{username}".format(page=page, username=username) 
html_content = urllib2.urlopen(url) 
+0

Не могли бы вы дать мне полный код, я не уверен, чтобы заменить на хорошее место. Я получаю это: Traceback (самый последний вызов последнего): Файл «./testTwo.py», строка 46, в странице = отображение [выбор] NameError: название „выбор“ не определен – TwinyTwice

+0

Ой извините, я забудьте сказать Спасибо большое за вашу помощь ;-) Жаль, что вы новичок! – TwinyTwice

+0

Я пробую много разных вещей, которые я считал логичными для вашего нового кода, но у меня по-прежнему такая же ошибка: NameError: name 'choice' не определен, и я не понимаю! извините – TwinyTwice