2016-09-26 12 views
-2

Я следующие наборы данных ... datasetNaiveBayes Классификация NLTK с помощью питона

У меня есть загрузить данные с помощью этого

import numpy as np 
import pandas as pd 
input_file = "C:/Users/User/Documents/R/exp.csv" 
df = pd.read_csv(input_file, header = 0) 

Теперь я пытаюсь это сделать ...

classifier = nltk.NaiveBayesClassifier.train(labeled_featuresets) 

Как я могу добраться туда?

+0

Почему вы читаете данные с помощью 'header = 0'? По-видимому, данные * do * имеют заголовок. – lenz

+0

Не знаю. Я нашел его в поиске и понятия не имел, почему он там использовался. – Hanson

+0

Для меня это звучит так, как будто вы должны работать над некоторыми учебниками на Python и, возможно, с Pandas. Сначала вам нужно понять код, который вы вставили, и попытаться построить мост между двумя фрагментами самостоятельно. Тогда вернитесь сюда, если у вас есть более конкретный вопрос. – lenz

ответ

0

Вы можете найти информацию о NLTK и ее работе с их online tutorial.

В частности, вы должны изучить особенности и классификаторы, которые могут быть найдены в Chapter 6.

Особенности - это просто функции, которые возвращают некоторое значение на основе ввода, поэтому вы можете создавать эти функции вокруг формата данных Pandas.