Вы не говорите что вы пытаетесь сделать, и в целом это действительно зависит, если вы практик (специалист в другой области) или специалист по компьютерному обучению. Несмотря на это, там все виды вещей, которые вы можете посмотреть по адресу:
Одно измерение глубины или сложности:
- Основы: Обработка простых методических и программных ошибок. особенности между 0 и 1 (или -1 и 1), кроссом проверкой, чтобы получить хорошие значения параметров (гипер C и гамма в случае SVM) и многих других деталей: этот вопрос охватывает их хорошо: Supprt Vector Machine works in matlab, doesn't work in c++
- Промежуточных: Обработка более глубоких концептуальных ошибок. пересматривая качество и количество ваших данных, просматривая тип классификатора, который вы используете, например, линейный или нелинейный, генеративный или дискриминирующий, проверяя литературу по результатам, полученным другими, используя методы, аналогичные вашим, по тем же данным. Подумайте о том, что вы тренируетесь по некоторому типу тестирования данных для других типов данных (проблемы с большими объемами). Ключевые слова: адаптация домена, многозадачное обучение, регуляризация и т. Д.
- Advanced: Вы исчерпали все возможности, вам необходимо продвинуть состояние дел, чтобы решить вашу проблему. Вам нужны более быстрые алгоритмы. Вам нужны надежные результаты с меньшим количеством данных или вам нужно обрабатывать масштабный масштаб. Изучите современные решения и продвиньте их вперед. Кроме того, иногда прогресс не так эволюционная/инкрементный, иногда вам нужно сделать еще один маршрут, исключить предположения и т.д.
Эта классификация в основном ортогональны, но и полезно:
- Экспертные знания: иногда (как и в случае, когда вы связываете) проблемы, которые очень трудно обрабатывать (NLP, Vision), можно получить с помощью экспертных знаний. Например, при распознавании лиц люди используют некоторые области лица (вокруг глаз) на основе результатов в области нейробиологии, которые говорят, что для распознавания результатов индивидуумов это то, на что ориентируются люди. Большинство, если не все полезные методы представления, такие как SIFT, SURF, LBP, имеют некоторые основы для человеческого зрения. Кроме того, в примере, который вы связали, лингвисты предложили представления, используемые в подходах ML к НЛП: Feature Selection and Reduction for Text Classification.