2017-02-05 15 views
0

Я пытаюсь написать заголовок заголовка в CSV, используя python CSV-модуль, и кажется, что когда в заголовке есть Apostrophe, например, Что так здорово в Snapchat? », Тогда появится ошибка кодирования.Python Sqlite не умеет правильно писать, когда есть строка «0» в строке

ошибка, как показано ниже:

enter image description here

Код для этого:

enter image description here

Есть ли какие-либо мысли по поводу этой ошибки или какие-либо предложения?

+0

проблема не CSV, но терминал/консоль в вашей системе (возможно, Windows) потому что он не отображает 'UTF-8', и у него есть проблема с его преобразованием. [Изменить кодовую страницу по умолчанию консоли Windows на UTF-8] (http://superuser.com/questions/269818/change-default-code-page-of-windows-console-to-utf-8) – furas

+0

Спасибо за ответ Furas! Я понял, что из-за того, что модуль CSV Python не поддерживает Unicode ... Вот сообщение, которое полезно. [link] (http://stackoverflow.com/questions/3224268/python-unicode-encode-error) –

ответ

1

Python2.7 csv модуль не может обрабатывать unicode изначально. Но у docs есть пример того, как это сделать в классе UnicodeWriter. Вы также можете попробовать python3, потому что модуль csv будет обрабатывать unicode изначально.

Этот фрагмент был бесстыдно вырванные из Документов я связан

class UnicodeWriter: 
    """ 
    A CSV writer which will write rows to CSV file "f", 
    which is encoded in the given encoding. 
    """ 

    def __init__(self, f, dialect=csv.excel, encoding="utf-8", **kwds): 
     # Redirect output to a queue 
     self.queue = cStringIO.StringIO() 
     self.writer = csv.writer(self.queue, dialect=dialect, **kwds) 
     self.stream = f 
     self.encoder = codecs.getincrementalencoder(encoding)() 

    def writerow(self, row): 
     self.writer.writerow([s.encode("utf-8") for s in row]) 
     # Fetch UTF-8 output from the queue ... 
     data = self.queue.getvalue() 
     data = data.decode("utf-8") 
     # ... and reencode it into the target encoding 
     data = self.encoder.encode(data) 
     # write to the target stream 
     self.stream.write(data) 
     # empty queue 
     self.queue.truncate(0) 

    def writerows(self, rows): 
     for row in rows: 
      self.writerow(row) 

Тогда вы можете просто назвать это делает

writer = UnicodeWriter(open("foo", "w")) 
writer.writerow(['1', 'bar']) 
+0

Спасибо, что ответили Грегу! Вы совершенно правы. Я решил эту проблему, добавив этот заголовок 'title = content.text.encode ('ascii', 'ignore')', когда я захвачу название. –

+0

уверенный np. Upvote, если вам это нравится :) – Greg