Я ищу лучший PHP-способ сканирования множества текстовых записей (объявлений) и вытаскивания ключевых слов - каждый знает о части речи мечения? Есть ли способ PHP-ish сделать это?Как внедрить тег-признак Part of of Speech (POS)
Я сканирую много объявлений в Интернете, но не с категориями! Чтобы ускорить процесс категоризации, я хочу установить теггер Part of of Speech (http://en.wikipedia.org/wiki/Part-of-speech_tagging). В принципе, это классные алгоритмические пакеты для анализа текста, которые могут рассказать мне, какие слова являются существительными (например, «Квартира», «Автомобиль», «Собака» и т. Д.) И какие слова являются нежелательными, например, если, и, и т. Д. , BUT ...
В настоящее время онлайн-службы пометки - одно из Yahoo, которое, похоже, становится менее любящим в наши дни - другое - XEROX. Тем не менее, я действительно заинтересован в установке моей собственной библиотеки/программного обеспечения и подключении ее к моему веб-приложению.
Кто-нибудь знает, как установить POS-метку, которая работает с веб-приложением PHP? Я умираю, чтобы понять это, поэтому любая информация, совет или другая мудрость, которую вы имеете, действительно оценены!
Вот список МНОГО различного программного обеспечения POS: http://www-nlp.stanford.edu/links/statnlp.html#Taggers (Смотрите в разделе "POS Taggers")
Спасибо за чтение этого!
какой лучший POS-теггер? Есть идеи? –