im пытается конвертировать файл с таблицей HTML в формат CSV. Отрывок из этого файла следующим образом:Преобразование таблицы HTML в CSV-файл из оболочки
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" >
<head id="Head1"><link rel="shortcut icon" href="favicon.ico" /><title>
Untitled Page
</title></head>
<body>
<form name="form1" method="post" action="mypricelist.aspx" id="form1">
<input type="hidden" name="__VIEWSTATE" id="__VIEWSTATE" value="/somethingrandom" />
<div>
<table id="price_list" border="0">
<tr>
<td>ProdCode</td><td>Description</td><td>Your Price</td>
</tr><tr>
<td>ab101</td><td>loruem</td><td>1.1</td>
</tr><tr>
<td>ab102</td><td>ipsum</td><td>0.1</td>
</tr><tr>
я попытался с помощью
xls2csv -x -c\; evprice.xls > evprice.csv
, но это дает мне ошибку говоря
evprice.xls is not OLE file or Error
Я гугле. он сказал, что это потому, что файл был не соответствующим xls, а просто html.
Когда я пытаюсь
file evprice.xls
его говорит, что его HTML так нашел 'решение', с помощью LibreOffice.
libreoffice --headless -convert-to csv ./evprice.xls
ну это не дает ошибку, но выходной файл CSV все странен, как открытие файла ех в блокноте.
содержит много странных персонажей, как эти
—¬žþ9ü~ÆóXþK¢
Кто-нибудь знает, почему это происходит, и получил рабочее решение?
ли данные выборки вы работаете с общедоступными? Я не знаю, как кто-нибудь сможет предоставить что-то, что будет работать с файлом в неопределенном формате, содержимое которого мы никогда не видели. –
извините, его не публично. я могу поместить часть файла –
добавил файл xls. –