2016-05-14 6 views
0

Я планирую оценить эффективность съемки с помощью SVM. Каждый человек стреляет от 3 до 10 раз. Для каждого времени стрельбы я могу получить скорость ветра, стрельбу, расстояние, и я расскажу SVM, если этот человек имеет право на стрельбу. Я надеюсь, что все эти данные будут переданы в SVM, и после обучения пусть SVM сможет судить, обладает ли человек навыком стрельбы со своей стрельбой.Пример данных с различными размерами в SVM

Проблема заключается в том, что для каждого человека время съемки различно, от 3 до 10 раз, что означает, что для каждой строки выборочных данных в SVM разные измерения.

Теперь я планирую использовать размеры 10 * 3 для данных каждого человека (данные одной строки для одного человека), если его время съемки меньше 10, я заполню все пробелы -1.

Работает ли заполнение пустых измерений с помощью -1?

ответ

0

SVMs, похоже, не очень хороший подход. Проблема в том, что ваши показов зависят от скорости ветра и расстояния. Это означает, что эти значения являются входными значениями (и должны быть из-за того, что точность съемки сильно зависит от ветра, кому-то повезет с ветром и получить оценки выше среднего), с которым обучается ваш SVM. Но это также означает, что эти входы необходимы во время прогнозирования. Итак, как вы хотите оценить квалификацию по стрельбе. Вы могли оценить только квалификацию, связанную с стрельбой, зависящую от ветра и ко.

Конечно, вы можете прогнозировать со всеми наблюдаемыми значениями ветра и расстояния и смешать ваши результаты, но это может быть неэффективным, и вы также захотите получить вероятности из SMV, что является еще одной вещью, которая довольно сложна (поддерживается многими libs, но вероятности из SVM не так точны).

Если вы хотите, чтобы справиться с ней, как этот, то вы тренировались с образцами вида:

  • образец 0: [shooter_id, ветер, расстояние, 1] # 1 = хит
  • образец 1: [shooter_id, wind, distance, 0] # 0 = miss

Это означает, что каждый выстрел является одним образцом! SVM будет прогнозировать попадание/промах для заданных входных переменных или вероятностей, если вы включили их.

Теоретически, вся эта проблема заключается в моделировании ковариации, которая вводится переменными ветра & Расстояние, чтобы нормализовать точность стрельбы по экологическим факторам.

+0

Спасибо за ваш ответ, но вы меня неправильно поняли.Я хочу, чтобы SVM оценивал, является ли стрелок квалифицированным стрелком или нет, согласно его стрельбе. Моя проблема в том, что время стрельбы для каждого стрелка отличается, кто-то может стрелять 3 раза, другие могут стрелять больше, поэтому размер для учебного образца отличается. – user497032

+0

Нет, вы меня неправильно поняли. И кажется, что у вас мало опыта машинного обучения. – sascha

+0

Хорошо, позвольте мне более подробно описать мою проблему. Мне нужен только судья SVM. Если стрелок квалифицирован по его стрельбе. Сначала я передаю данные SVM следующим образом: sample 0: [score1, score2, score3] # 1 = квалифицированный шутер. образец 1: [оценка1, оценка2, оценка3, оценка4, оценка5] # 0 = неквалифицированный. образец 2: [оценка1, оценка2, оценка3, оценка4, оценка5, оценка6] # 1 = квалификация. – user497032

0

Хорошо, позвольте мне более подробно описать мою проблему. Мне нужен только судья SVM. Если стрелок квалифицирован по его стрельбе. Сначала я кормить данные SVM как это:

sample 0 :[score1, score2, score3] # 1 = qualified shooter. 
sample 1:[score1, score2, score3, score4, score5] # 0 = unqualified. 
sample 2: [score1, score2, score3, score4, score5, score6] # 1 = qualified. 

Со времен съемки отличается для каждого стрелка, так что размер каждого образца отличается. Могу ли я отформатировать все образцы до 10 размеров, как это ?:

sample 0 : [score1, score2, score3, -1, -1, -1, -1, -1, -1, -1] # 1 = qualified. 
sample 1 : [score1, score2, score3, score4, score5, -1, -1, -1, -1, -1] # 0 = unqualified 

На этот раз я игнорирую данные о скорости ветра и disctance потому, что не имеет ничего общего с моим вопросом, на мой вопрос о размерах. Все образцы имеют разные размеры (от 3 до 10). Могу ли я отформатировать все образцы до 10 измерений и заполнить пробелы -1?

+0

Есть много проблем: 1) единственное, что нужно узнать, это порог/соотношение/счет (потому что другой информации нет). Почему вы не просто рассчитываете и устанавливаете этот порог. Гораздо проще, чем SVM. 2) В то время как ваше наполнение возможно, я не думаю, что буду работать хорошо (может потребоваться большая настройка параметров). Интересно, что разные заказы могут давать разные результаты. 3) В целом это очень плохой пример использования SVM ... – sascha

+0

Я просто предложил более простой пример, чтобы сделать мою проблему понятной. Фактически, в каждом баллах есть по крайней мере 3 параметра, и я сужу, если каждый образец квалифицирован или нет с моим чувством. Надеюсь, SVM может сделать это для меня. Значит, вы не думаете, что это простая работа для SVM? – user497032