У меня есть данные в формате
blah sentence one --> label1, label2
blah sentence two --> label2, label4
blah sentence three --> label3
Multilabel Классификация по NaiveBayes Классификатор в Спарк
Как я могу использовать OneVsRestClassifier с NaiveBayesClassifier в Спарк? (т. Е. Как должны быть структурированы мои данные?). Для классификации с несколькими классами с NaiveBayes класс LabeledPoint
содержит label
и Feature Vector
. Но для вышеупомянутого случая, как должны быть структурированы данные?