2016-10-30 5 views
0

Я знаю, что существует ряд способов: counting words in a LaTeX document, некоторые более точные, чем другие.Статистика слова LaTeX

Что мне нужно - это простой способ выполнить простую статистику по документу LaTeX. Это вместо того, чтобы просто группировать все слова и подсчитывать их длину, я хотел бы подсчитать количество экземпляров каждого слова отдельно.

Вывод будет выглядеть примерно так:

1. (15% - 456) that 
++++++++++++++++++++++++++++++++++++++++++++ 
2. (10% - 308) the 
++++++++++++++++++++++++++++++ 
3. (8% - 213) is 
+++++++++++++++++++++ 
4. (4% - 102) of 
+++++++++ 
5. (2% - 55) and 
++++ 

Есть ли какой-либо инструмент там, что жулик делать что-то подобное сделать это?

ответ

0

Я не смог найти какой-либо пакет/скрипт, чтобы делать то, что мне нужно, поэтому я закончил создание своего собственного.

Это небольшой (рудиментарный) скрипт Python, но он выполняет эту работу. Результат выглядит следующим образом:

Number of unique words: 1945 
Total number of words: 16660 

    0. 1210  (7.26%) - the 
    1. 461  (2.77%) - in 
    2. 431  (2.59%) - of 
    3. 317  (1.90%) - a 
    4. 313  (1.88%) - and 
    5. 304  (1.82%) - for 
    6. 304  (1.82%) - to 
    7. 241  (1.45%) - is 
    8. 176  (1.06%) - words 
    9. 165  (0.99%) - by 
Sum percentage: 23.5% 

Word lengths distribution: 
1 ++ (317) 
2 ++++++++++++++++++++ (2602) 
3 ++++++++++++++++++++++++++++++ (3947) 
4 ++++++++++++++++++ (2342) 
5 +++++++++++++ (1752) 
6 ++++++++++ (1348) 
7 +++++++++ (1154) 
8 ++++++++ (1071) 
9 ++++++ (787) 
10 ++++ (586) 
11 +++ (383) 
12 + (129) 
13 + (123) 
14 + (36) 
15 + (83) 

Он загружен в репозиторий Github: LaTexWordStats.

 Смежные вопросы

  • Нет связанных вопросов^_^