2017-01-28 21 views
0

У меня есть другой вопрос относительно импорта, но я столкнулся с другой проблемой. Я пытаюсь импортировать данные из файла DBF, и в то время как большинство DBF файлы работа, я побежал в тот, который дает мне следующую ошибку,Ошибка DBF импорта Charmap Python

"C:\Program Files\Anaconda2\python.exe" D:/Projects/DBFImport/DBFImporter/extractdbf.py 
Traceback (most recent call last): 
    File "D:/Projects/DBFImport/DBFImporter/extractdbf.py", line 17, in <module> 
for record in table.records: 
    File "C:\Program Files\Anaconda2\lib\site-packages\dbfread\dbf.py", line 316, in _iter_records 
for field in self.fields] 
    File "C:\Program Files\Anaconda2\lib\site-packages\dbfread\field_parser.py", line 79, in parse 
return func(field, data) 
    File "C:\Program Files\Anaconda2\lib\site-packages\dbfread\field_parser.py", line 157, in parseM 
return self.decode_text(memo) 
    File "C:\Program Files\Anaconda2\lib\site-packages\dbfread\field_parser.py", line 45, in decode_text 
return decode_text(text, self.encoding, errors=self.char_decode_errors) 
    File "C:\Program Files\Anaconda2\lib\encodings\cp1252.py", line 15, in decode 
return codecs.charmap_decode(input,errors,decoding_table) 
UnicodeDecodeError: 'charmap' codec can't decode byte 0x9d in position 278: character maps to <undefined> 

Вот код, это очень просто для удобства анализа,

import pyodbc, os, string 
from dbfread import DBF 

# SQL Server Connection Test 
cnxn = pyodbc.connect('DRIVER={SQLServer};SERVER=***********;DATABASE=TEST_DBFIMPORT;UID=test;PWD=test') 
cursor = cnxn.cursor() 

table = DBF('E:\\Backups\\imp.dbf', lowernames=True) 
for record in table.records: 
    rec1 = record['id'] 
    cursor.execute ("insert into imp(ID) values(?)", rec1) 
cnxn.commit() 

Я пробовал все виды декодирования, но ничего не работает.

Update1:

<type 'tuple'>: (<type 'exceptions.UnicodeDecodeError'>, UnicodeDecodeError('charmap', 'Firearms as appraised on May 18, 2011. F.I.E (Firearms Import Export Co.) .26 automatic pistol S/N # AS21212 ----------------- $175.00 Walther (Smith & Wesson) P22, 22LR semi automatic pistol S/N # N052010 -------------- $325.00 Taurus .357 Magnum Model 608 revolver, blue,, 4\xe2\x80\x9d vent rib barrel S/N # LF632765 ------------ $375.00 Colt MKII Series 70 semi automatic pistol, 9mm, blue, pacmeyer grips, S/N # 70S49671 -------- $475.00 Ruger Model 10/22 semi-automatic carbine, 22LR, S/N # 126-90774 ----- $200.00', 278, 279, 'character maps to <undefined>'), None) 
+0

Вы пробовали 'latin1'? –

+0

Я попробую это, это просто странная проблема, которую я раньше не испытывал. – HMan06

+0

Есть ли определенный формат? или способ декодирования? Я попытался открыть его разными способами, но это не сработало, и даже просто чтение записей без вставки в таблицу дает мне ошибку. – HMan06

ответ

1

Вы получаете сообщение об ошибке, потому что несколько кодовых точек (три, я думаю), которые не имеют отображения юникода - они просто пустые.

Используя мою dbf библиотеку вы обычно открыть файл как:

table = dbf.Table('e:/Backups/imp.dbf') # forward slash and backslash both work 

Вы можете увидеть файл кодировки, указанной в самой таблице, распечатав таблицу:

print table 

Чтобы изменить кодировку указанной в самой таблице:

table = dbf.Table('e:/Backups/imp.dbf', codepage='...') 

Если ничего другого вы можете попробовать использовать 'utf8' для кодовой страницы - это не часть спецификации dbf, но может помочь (я добавил ее для собственного использования, поэтому ничего не гарантировано и не гарантировано и т. д.).

+0

Получил! Благодаря! – HMan06