2013-02-14 3 views
2

Я новичок в weka, я должен извлекать статусы из социальной сети и анализировать их с помощью weka, как построить файл arff, содержащий эти статусы? У нас есть алгоритмы для создания, стоп-слов и n-граммов или я использую другие программные средства, чтобы исключить ненужные данные перед началом классификации? и какая утилита для weka для android и java, есть разница в использовании этого программного обеспечения ... у вас есть какая-либо идея, ребятакак построить файл arff для weka?

ответ

0

Вы не должны беспокоиться о ваших данных как arff файла, поскольку Weka поддерживает другие форматы ввод. Вы можете просто указать свои данные как файл csv и импортировать в Weka. Вы можете экспортировать его из Weka как arff, если хотите.

Существует порт для Weka для Android, который вы можете download here, я использовал его в своем проекте без проблем. Вы можете обучить свою модель на ПК и экспортировать ее, а затем использовать ее в android see my answer here, например, код.

Да, Weka поддерживает Stemmer algorithms

+0

вы можете помочь мне извлечь твиты из андроида в файл, подключить android и weka и определить несколько атрибутов, чтобы поместить их в файл csv, я не знаю, как начать ... у вас пример для этого или учебник, чтобы следовать ему –

+0

У вас есть опыт в создании приложений для Android? Как выглядит ваш учебный файл? какова задача, которую вы пытаетесь достичь? – iTech

+0

Я опишу процесс, пользователь должен подключиться к twitter через android, он выбирает друга и извлекает его статусы, я собираю несколько статусов и помещаю их в базу данных или непосредственно в файл arff или csv, я подключаю weka к андроид и анализ настроений по этим статусам проходят через различные алгоритмы (стоп-слова, стебли, n-граммы, родные байки и svm) через WEKA, чтобы идентифицировать либо его положительные, либо отрицательные чувства, как я могу начать. спасибо –

0

Я не знаю о книге лиц, но вы можете получить данные twitter, используя Файл arff here Что касается того, как их создать, есть сотни обучающих программ в Интернете: посмотрите на this one и посмотрите, поможет ли это вам.

Надеется, что это помогает

Рейчло

+0

Я предполагаю, что я буду получать данные от твиттера, если я буду использовать андроид, чтобы получить статусы, а затем поместить их в базе данных, после того, как я могу иметь дело с arff, как его получить? Могу ли я настроить weka с помощью android или просто построить файл arff после извлечения из данных bse? еще один вопрос :) pos и neg, написанные в конце каждого статуса в файле arff, которое может дать мне этот результат и какие алгоритмы я должен обрабатывать, прежде чем использовать weka (stemning, stopwords, features) m так запутался, и я должен закончить этот проект как можно скорее, спасибо за вашу помощь :) –

+0

перейдите по этому адресу, у него есть образец исходного кода для стеблирования, стоп-слов и т. д., пожалуйста, примите мой ответ http://massapi.com/ class/weka/core/stemmers/Stemmer.java.html –

+0

@ManelAyadi наведите указатель рядом с ответом, и вы увидите галочку. щелкните его. –