Проведено ли какое-либо исследование в области интеллектуального анализа данных, относящееся к классификации данных, имеющих отношение от одного к другому?Существуют ли какие-либо алгоритмы классификации, предназначенные для данных с отношением один к многим (1: n)?
Например, например, я пытаюсь предсказать, какие ученики откажутся от университета, основываясь на их классах и личной информации. Очевидно, что между личной информацией учащихся и оценками, которые они достигли в своих классах, существует одна-одна.
Очевидные подходы включают в себя:
Совокупные - Множественные записи могут быть объединены вместе каким-то образом свести задачу к основной задаче классификации. В случае классификации студентов среднее значение их оценок может сочетаться с их персональными данными. Хотя это решение прост, зачастую основная информация теряется. Например, что, если большинство студентов, которые берут органическую химию и попадают ниже C-конца, выпадают, даже если их средний показатель выше уровня B +.
Voting - Создайте несколько классификаторов (часто слабых) и попросите их подавать голоса, чтобы определить общий класс данных, о которых идет речь. Это было бы, если бы были построены два классификатора, один для данных курса учащегося и один для их персональных данных. Каждая запись курса будет передана в классификатор курсов и на основе оценки и названия курса, классификатор будет предсказать, будет ли ученик выпадать, используя только эту запись курса. Запись персональных данных будет классифицироваться с использованием классификатора персональных данных. Тогда все предсказания записи класса вместе с предсказанием записи личной информации будут проголосовать вместе. Это голосование можно было бы сделать по-разному, но, скорее всего, будет учитываться то, насколько точны классификаторы и насколько определен классификатор голосования. Очевидно, что эта схема позволяет использовать более сложные шаблоны классификации, чем агрегация, но при этом возникает большая сложность. Также, если голосование не выполняется хорошо, точность может легко пострадать.
Так что я ищу другие возможные решения для классификации данных с отношением один-к-многим.
Привет @Nixuz Я столкнулся с такой же ситуацией с моим проектом, какой вариант вы выбрали? –