2016-02-24 2 views
1

Из того, что я вижу, нет способа загрузить несколько наборов обучения в новую инструментальную систему Watson NLC. Мне нужно управлять отдельными наборами обучения и связанными с ними классификаторами. Что мне здесь не хватает?Как управлять несколькими наборами тренировок с помощью инструментария Watson NLC Toolbox

enter image description here

ответ

2

Предпочтительный вариант: Предоставление НЖК экземпляра службы для каждого набора обучающих данных вы хотели бы работать и отдельно доступ к оснастки для каждого.

Обход: В настоящее время поток для управления несколькими комплектов подготовки в одном НЖК экземпляра службы выглядит следующим образом:

  1. (Необязательно, чтобы начать новый) Перейти на страницу данных обучения и нажмите на значок мусора для удаления всех данных обучения.
  2. Загрузите обучающий комплект на страницу данных обучения, используя значок загрузки.
  3. Манипулировать данными по мере необходимости. Добавить тексты и классы, тексты тегов с классами и т. Д.
  4. Создайте классификатор. Когда вы создаете классификатор, это, по сути, моментальный снимок ваших текущих данных обучения, так как вы можете получить его позже со страницы классификаторов.

Повторите шаги 1-4 по мере необходимости, пока вы не загрузите все свои наборы учебных данных и не создадите соответствующие классификаторы.

Если вы хотите продолжить работу над предыдущей обучающей:

  1. Очистить ваши данные обучения (шаг 1 сверху).
  2. Перейдите на страницу классификаторов.
  3. Нажмите на значок загрузки для классификатора, который содержит данные обучения, с которыми вы хотели бы работать.
  4. Вернуться на страницу данных обучения и загрузить файл, загруженный с шага 3.
+0

Не идеально, но мы можем сделать это пока.В идеале команда Watson NLC-инструментария отслеживает это как запрос функции, поскольку это бета-версия инструментария. – Biosopher

1

Лучшим способом для управления нескольких комплектов учебных заключается в использовании другого экземпляра НКА службы для каждого обучающего набора.

Текущая бета-технология NLC не предназначена для управления отдельными наборами обучения в одном экземпляре службы. Например, инструмент вносит предложения, когда вы добавляете тексты без классов - они основаны на самом последнем обученном классификаторе, который не имеет смысла, если это было основано на совершенно другом наборе тренировок.

Работа, предложенная @John Bufe, будет работать, если у вас есть жесткий предел количества услуг NLC, которые вы можете использовать по какой-либо причине, например. вы достигли своего предела услуг Bluemix. Стоимость здесь не является фактором, так как дополнительные экземпляры службы NLC не будут увеличивать общую цену, поскольку ежемесячная плата предназначена для обученных экземпляров классификатора. Например, если у вас есть четыре экземпляра службы с одним классификатором в каждом, вы увидите 3 заряженных и 1 бесплатно.

Если вы хотите использовать бета-инструменты NLC для управления вашими данными обучения, я бы рекомендовал использовать отдельные службы NLC для каждого требуемого набора тренировок.

+0

Учитывая возможность иметь 8 классификаторов/службу NLC, кажется, что отходы увеличивают количество сервисов по цене 20 долларов США в месяц только для использования инструментов NLC. Достаточно просто связать обучающие наборы с классификаторами со стороны инструментария (для поддержки автоматического предложения, когда вы указываете), поэтому эта однопоточная оснастка кажется скорее ограничением, чем функцией. Я понимаю, что это бета-версия инструментария, поэтому, надеюсь, команда Watson отслеживает этот запрос функции. Наряду с лучшей поддержкой для массового редактирования (например, переименование намерений). – Biosopher

+0

@ Джон и я оба работаем в команде Watson tooling, поэтому здорово получить обратную связь на бета-версии. Не забывайте, что классификаторы не могут переучиваться, поэтому вам, вероятно, понадобится несколько тренировочных наборов при подготовке, тестировании и улучшении классификаторов. Сказав это, хотя в инструменте есть ограничение на один набор тренировок, я должен признать, что я использую электронные таблицы для управления данными обучения и просто использую бета-инструментарий для загрузки данных и подготовки классификаторов. –

+0

@ Похоже, что обвинение в размере $ 20/месяц может быть за каждый обученный экземпляр классификатора, а не за сервис классификатора, который, надеюсь, сделает работу ненужной, т. Е. Просто использует службы для управления отдельными наборами обучения. Я смогу подтвердить свой ответ, если смогу это подтвердить. –