я узнал, как извлечь отдельные элементы из HTML-файла здесь How can I query a text file for distinct instances of a pattern?Как использовать OrderBy <> в моем LINQified Regex?
... и результаты хорошие. Я получаю (усеченный):
<span class="sam" title="This is Sam Clemens speaking">
<span class="others" title="This is 'The Sphynx' speaking">
<span class="others" title="This is the stagecoach driver speaking">
<span class="others" title="This is someone other than the main characters speaking">
<span class="others" title="The station-boss is speaking">
<span class="others" title="This is 'an elderly pilgrim' speaking">
<span class="others2" title="This is Jack speaking">
<span class="bemis" title="This is Bemis speaking">
Я хотел бы отсортировать эти, хотя, так что выше:
<span class="bemis" title="This is Bemis speaking">
<span class="sam" title="This is Sam Clemens speaking">
<span class="others" title="The station-boss is speaking">
<span class="others" title="This is 'an elderly pilgrim' speaking">
<span class="others" title="This is 'The Sphynx' speaking">
<span class="others" title="This is someone other than the main characters speaking">
<span class="others" title="This is the stagecoach driver speaking">
<span class="others2" title="This is Jack speaking">
Эта строка кода:
distinct_values = MyRegex.Matches(str).Cast<Match>().Select(p => p.Value).Distinct().ToList();
... сначала получает данные, как показано. Я полагаю, что мне нужно сделать что-то вроде этого:
distinct_values = MyRegex.Matches(str).Cast<Match>().Select(p => p.Value).Distinct().OrderBy<>
... но даже если я прав, я не знаю, что должно быть в угловых скобках OrderBy.