Мне нужно интерпретировать текст, скопированный из электронных писем. В настоящее время пользователи копируют текст письма и вставляют его в текстовую область HTML. У меня уже есть 90% -ное решение, но вот один случай, который меня толкает. Данные хранятся в таблице в электронном письме. Вот одна строка из этих данных, которые могли бы легко иметь 50 строк или больше, в подобном формате:Специальная паста с javascript
<tr>
<td valign=3D"top" style=3D"background:white;padding:0in 0in 0in 0in">
<p class=3D"MsoNormal"><span style=3D"color:black">WI</span><o:p></o:p></p>
</td>
<td valign=3D"top" style=3D"background:white;padding:0in 0in 0in 0in">
<p class=3D"MsoNormal"><span style=3D"color:black">BARABOO 53913</span><o:p></o:p></p>
</td>
<td valign=3D"top" style=3D"background:white;padding:0in 0in 0in 0in">
<p class=3D"MsoNormal"><span style=3D"color:black">8:00</span><o:p></o:p></p>
</td>
<td valign=3D"top" style=3D"background:white;padding:0in 0in 0in 0in">
<p class=3D"MsoNormal"><span style=3D"color:black">VAN</span><o:p></o:p></p>
</td>
<td valign=3D"top" style=3D"background:white;padding:0in 0in 0in 0in">
<p class=3D"MsoNormal"><span style=3D"color:black">WI</span><o:p></o:p></p>
</td>
<td valign=3D"top" style=3D"background:white;padding:0in 0in 0in 0in">
<p class=3D"MsoNormal"><span style=3D"color:black">8/29/2015</span><o:p></o:p></p>
</td>
</tr>
Это является примером рода вещей, которые я должен вместить, хотя я на самом деле хочу, чтобы разместить намного больше.
Когда пользователь вставляет этот ряд, он превращается в это:
WI
BARABOO 53913
8:00
VAN
WI
8/29/2015
Имейте в виду, что я получаю много строк, так что все они задавят вместе. Количество, порядок и формат столбцов полностью противоречивы, иногда даже внутри одного документа.
Если бы я мог получить это, я могу использовать уже существующий код для синтаксического анализа:
WI BARABOO 53913 8:00 VAN WI 8/29/2015
Но у меня довольно много ничего работать. Если бы у меня был необработанный HTML, я мог бы безопасно его проанализировать (он никогда не отображается), но я не могу его получить. Кто-нибудь знает, как я могу получить это как необработанный HTML или какой-либо другой согласованный формат? Я сомневаюсь, что это важно, но в большинстве случаев источником копии будет MS Outlook.
редактирование: вся цель состоит в том, чтобы сделать эту машину понятной. Мне не нужна помощь в разборе, у меня это покрыто. Мне просто нужно что-то полезное для разбора.
Вы можете использовать jquery ?? –
Да, я могу использовать jquery. – polson136