Я новичок в обучении машинам, и я ищу технику для изучения строковых шаблонов на основе набора данных обучения. Моя проблема: У меня разные слова, относящиеся к разным категориям. Каждая категория име
Я создаю векторы TFIDF, используя Apache Mahout. Уточняю EnglishAnalyzer как часть документа tokenizing так: DocumentProcessor.tokenizeDocuments(documentsSequencePath, EnglishAnalyzer.class, tokenized
Попытка установить Mahout на Ubuntu16.04, у меня есть успешно установите maven 3.3.9 и subversion 1.9.3. Новое в Mahout и Maven, я не знаю, если я должен пропустить тест и просто использовать mvn -Dsk