2012-04-30 5 views
1

Можно ли проектировать многомерные данные на двумерную карту с использованием LDA? Похоже, что данный инструмент Matlab не предоставляет таких функций ...Как использовать линейный дискриминантный анализ для проекции в MatLab?

Спасибо за ответ. Мои данные теперь имеют 6 классов, так значит ли это, что если у меня есть 6 классов, я могу только уменьшить его до 5 измерений? Или это можно сделать аналогичным образом с PCA, который берет верхние 2 собственных значения и использует эти 2 для проекции? PCA не работает для моей проблемы как неконтролируемый подход, поэтому мне интересно, поможет ли LDA.

ответ

3

LDA на самом деле не предназначен для уменьшения размерности строго говоря, особенно в тех случаях, когда все ваши данные принадлежат к одному классу. Он предназначен для создания единственной линейной проекции, которая является наиболее дискриминационной между двумя классами. Таким образом, нет естественного способа сделать это, используя LDA.

Если ваши данные принадлежат к одному и тому же классу, то вам может быть интересен более подробно в PCA (Principcal Component Analysis), который дает вам наиболее важные направления для данных, оцененных в порядке важности. Существуют и другие методы: like ISOMAP (как указано EMS в комментариях) или self-organizing maps.

В качестве побочного примечания LDA может помочь вам уменьшить размерность, если вы знаете, что у вас есть данные с несколькими классами. Это может помочь вам уменьшить размерность до размеров k-1, если у вас есть k -класс данных, но вы не отметили, что это так.

EDIT: Кредит отправляется на @EMS, чтобы помочь прояснить этот ответ.

+1

Как только вы вычисляете лучшую проекцию из некоторого набора данных обучения, вы можете применить эту проекцию к любым вновь собранным данным, чтобы уменьшить ее размерность. Я не знаю, какими будут обобщающие свойства этого, но это, безусловно, допустимая схема сокращения размерности (хотя, вероятно, и неточная). – ely

+0

Несомненно, этот единственный линейный компонент будет одним из таких измерений, но я не знаю об обобщении LDA, который содержит более одного (и я посмотрел), следовательно, мое первое предложение. –

+0

Это удивительно. В статье [Wikipedia] (http://en.wikipedia.org/wiki/Linear_discriminant_analysis) перечислены сокращения размерности среди первых приложений LDA, и в частности, LDA с несколькими классами [описано как] (http: // ru. wikipedia.org/wiki/Linear_discriminant_analysis#Multiclass_LDA) нахождение (k-1) -мерного подпространства через N-мерное пространство данных, которое наилучшим образом разделяет k разных классов. LDA просто упрощает поиск k-мерной плоскости через N-мерные данные, где k ely