Я знаю, что данные должны быть правильными. У меня нет контроля над данными, и мой босс просто собирается сказать мне, что мне нужно выяснить способ справиться с чужой ошибкой. Поэтому, пожалуйста, не говорите мне, что это не моя проблема, что данные плохие, потому что это так.Как я могу разобраться с анализом данных csv bad?
Anywho, это то, что я смотрю на:
"Words","[email protected]","","4253","57574","FirstName","","LastName, MD","","","576JFJD","","1971","","Words","Address","SUITE "A"","City","State","Zip","Phone","",""
Данные были вымыты из соображений конфиденциальности.
Как вы видите, данные содержат кавычки, а в некоторых из указанных полей есть запятые. Поэтому я не могу их удалить. Но «Сюита А» «» отбрасывает парсер. Слишком много кавычек. >. <
Я использую TextFieldParser в пространстве имен Microsoft.VisualBasic.FileIO с этими настройками:
parser.HasFieldsEnclosedInQuotes = true;
parser.SetDelimiters(",");
parser.TextFieldType = FieldType.Delimited;
Ошибка является
MalformedLineException: Line 9871 cannot be parsed using the current delimiters.
Я хотел бы, чтобы вычистить данные каким-то образом на счет для этого, но я не уверен, как это сделать. Или, может быть, есть способ просто пропустить эту строку? Хотя я подозреваю, что мои более высокие взлеты не одобряют меня, просто пропуская данные, которые нам могут понадобиться.
Вы пытались избежать проблемных цитат? – itsme86
@ itsme86 убегает от них каким образом? –
Пропустите неправильные строки, запишите их в файл, который периодически получает исправления вручную и повторно запускается.Надеюсь, не будет так много плохих строк, что это утомительно. – Kevin