Я хотел бы получить некоторые часто встречающиеся фразы с Lucene. Я получаю некоторую информацию из файлов TXT, и я теряю много контекста, чтобы не иметь информации для фраз, например. «Информационный
У меня есть большая коллекция человеческого контента. Я хочу найти слова или фразы, которые происходят чаще всего. Каков эффективный способ сделать это?
Я ищу помощь при написании скрипта, чтобы проверить список фраз/слов и сравнить их друг с другом и посмотреть, какая из них является правильно напечатанной фразой/словом. $arr1 = array('fbook', 'yahoo