Есть ли исследовательская работа/книга, которую я могу прочитать, которая может рассказать мне о проблеме, какой алгоритм выбора функций будет работать лучше всего.Как выбрать алгоритм выбора функций? - advice
Я пытаюсь просто идентифицировать твиттер-сообщения как pos/neg (для начала). Я начал с выбора функции на основе частоты (начав с книги NLTK), но вскоре понял, что для подобной проблемы различные люди выбрали разные алгоритмы.
Хотя я могу попытаться использовать частотную основу, взаимную информацию, информацию и различные другие алгоритмы. список кажется бесконечным .. и задавался вопросом, есть ли эффективный путь, а затем проб и ошибок.
любые советы
В книге есть какой-либо сопроводительный код или теория тяжелая? –
Это довольно теория тяжелая и в основном фокусируется на математическом фоне методов, а не на их реализации. Я нашел его из книг Google, и вы можете просмотреть его. Я добавлю ссылку на мой оригинальный пост. –