2015-08-25 9 views
-1

У нас есть набор последовательностей с положениями такси. Мы хотим сгруппировать данные, рассматривая последовательные шаблоны в линиях данных. Например: T1, T2, T3, T4 - это перемещения и a, b, c, d, e - множество мест. Данные, которые мы имеем, как,Использование входов данных переменной длины с кластером алгоритмов EM

  • Т1 б в б а д
  • T2 в
  • T3 A B A B A B C E D
  • Т4 B C D C B D C в

Но проблема заключается длина данных не изменяются. Как мы можем сгруппировать эти типы данных с помощью EM. Поскольку он не принимает данные переменной длины, мы можем его настроить. Thanks

ответ

1

EM - общий принцип. Вы можете использовать его с очень разными моделями.

Возможно, что наиболее популярной моделью для EM является Гауссовская смесь Моделирование, GMM.

Естественно, если вы используете ковариации, GMM требует фиксированной размерности.

Но если вы используете другие модели, нет причин, по которым он не может работать с векторами переменной длины. Например, существуют варианты EM, которые обрабатывают текстовые данные, а текст обычно имеет разную длину.

 Смежные вопросы

  • Нет связанных вопросов^_^