1

У меня есть какая-то объектная модель, и мне нужно фильтровать и сортировать узлы для какого-то свойства. Какие существуют автоматизированные системы для генерации и выбора свойств объектной модели, которые коррелируют с тем, что я хочу? (Я намеренно являюсь абстрактным и неспецифичным)Как фильтровать/сортировать/оценивать узлы объектной модели?

Я думаю о системе, которая работает как спам-фильтры или контролируемые системы классификации, в соответствии с приведенными примерами данных он определяет правила, которые находят узлы, представляющие интерес. Однако я ищу более общую систему, так как она не должна требовать какой-либо информации о времени разработки объектной модели. Он должен хорошо работать как фильтр спама по электронной почте, искатель ошибок на базе кода, фильтр интересов в поисковой сети или поисковик ботов на сайте социальной сети. Пока он может исследовать объектную модель посредством отражения и получать набор «интересных» узлов, он должен иметь возможность находить правила, которые найдут больше таких узлов.

+1

BTW: Я не удивлюсь, если не будет никаких хороших решений. – BCS

ответ

1

Очень маловероятно, что существует единая автоматизированная система классификации, которая может делать все, что вы просите. Кроме того, я считаю, что приложение-искатель ошибок выходит за рамки такой системы, поскольку методы, которые успешно используются в этом домене, в значительной степени вращаются вокруг синтаксического анализа, анализа потока данных и других алгоритмических методов, очень адаптированных к проблемам, связанным с ошибками программного обеспечения. Несмотря на то, что здесь проводятся исследования машинного обучения, системы классификации в этой области в основном используются для увеличения, а не для замены аналитических методов (насколько я знаю).

Для большинства нетривиальных проблем классификации требуется тщательный выбор и уточнение представления проблемы, чтобы получить полезные и эффективные результаты с помощью машинного обучения. Простое использование существующей «исходной» модели данных данных без какого-либо индивидуального преобразования пространства состояний имеет тенденцию приводить либо к неполному охвату распределения входных данных, либо к плохому обобщению изученных классификаторов. Кроме того, для других параметров, специфичных для используемого метода машинного обучения, может потребоваться тщательная настройка проб и ошибок, чтобы получить достойные результаты для данной проблемы. Не все методы имеют такие параметры, но многие из них, например, нейронные сети, генетические алгоритмы, методы байесовских выводов и т. Д.

То, о чем вы просите, - это почти универсальный метод машинного обучения, который не существует в настоящее время. Наиболее жизнеспособными альтернативами, которые я могу видеть, было бы: (1) найти подмножество различных проблем, для которых это не было бы уровнем требуемой способности/сложности, или (2) создать систему, которая использует не только один метод классификации, имеет набор инструментов различных методов, которые он автоматически проверяет на данную проблему, а затем использует ту, которая генерирует лучшие результаты классификации в рамках контролирующего режима обучения. Последнее по-прежнему было бы довольно сложным, чтобы эффективно справиться с этим, и это не устраняет проблему того, как представлять/трансформировать пространство состояний для модели данных.

+0

Последняя половина последнего предложения «как представлять/преобразовывать пространство состояний для модели данных». на самом деле описывает именно ту проблему, о которой я думаю о решениях. – BCS

+0

Одной из возможностей для выпуска космической модели состояния является расширение концепции «инструментария» и множество различных представлений, которые автоматически проверяются. Это может включать (1) отсутствие преобразования [которое может работать нормально для некоторых типов дискретнозначных или текстовых данных], (2) концептуальных кластеров или онтологий для естественного языка, (3) грубокодирующих представлений для числовых данных и т. Д. Эти также будут генерическими схемами, которые обеспечивают достойный шанс делить пространство государства полезным способом для более легкого изучения моделей, но не обладают возможностями более адаптированных подходов. –