1

Попытка использовать возможности Google Prediction API для классификации моих данных. Каждый элемент в моей БД может иметь для него несколько категорий.API прогнозирования Google - синтаксис синтаксических данных для множественной классификации

Например: "My Nexus phone is rebooting constantly" может быть назначен как #Android и #troubleshooting теги.

Я хотел бы загрузить свои данные обучения в Google, но я не уверен, как применять оба тега к одному и тому же контенту. В следующем example Я нашел синтаксис, которые обеспечивают одну категорию для каждого контента, как так:

"Android", "My Nexus phone is rebooting constantly"

Что такое правильный синтаксис для обучающих данных мульти-классификации?

ответ

0

Из документов:

Каждая линия может иметь только one label assigned, но вы можете применить несколько ярлыков к одному примеру на repeating an example and applying different labels to each one. Например:

«взволнованный», «OMG! Просто был потрясающий день!»

«раздражающий», «OMG! Просто был потрясающий день!»

Если вы отправите чириканье этой модели, вы можете получить классификацию примерно так: «возбужденный»: 0,6, «раздражающий»: 0.2.

0

Если я не понимаю что-то из вашего вопроса, я думаю, что ответ на него находится в документах here.

А именно, раздел о текстовых строках объясняет, что при отправке текстовой строки система фактически разрезает ее на несколько строк, разделяя все, используя пробелы в качестве разделителя. Они указывают, что «Годзилла против Мотры» - «Годзилла», «против» и «Мотра». Поэтому в вашем случае вы можете просто использовать «Устранение неполадок с Android». Система отделит его в «Android» и «Устранение неполадок».

 Смежные вопросы

  • Нет связанных вопросов^_^