2016-09-22 10 views
0

Я работаю над проектом, где у меня есть клики/отклонения на веб-страницах, и я хочу ранжировать веб-страницы соответственно. Сначала я сделал это, написав простое уравнение для вычисления оценки релевантности, но я слышу, что случайное дерево повышения может помочь в этом. Как именно я могу создать функцию «ранга» для страниц, используя случайное дерево повышения? У меня есть только небольшой опыт работы в области МЛ и его контролируемого обучения, где у вас есть определенный опыт в обучении.Gradient Boosting Tree для разработки функций? (Rank)

ответ

0

Это может быть проблема классификации. Создайте новый столбец для ваших данных под названием click; для экземпляров кликов дайте значение 1 еще 0. Теперь подгоните модель повышения (или любого другого машинного обучения). В задаче классификации вы получаете показатель вероятности [0,1] в качестве вывода. Наивный подход для преобразования этих оценок вероятности в фактический клик/увольнение - это просто округление. Таким образом, на самом деле 0-0,5 записей счетчика вероятности будут уволены, а 0,5-1 записи с вероятностью попадут в клик.

Сказав все это, самым трудным шагом всего этого будет на самом деле подгонка модели, которая будет обладать существенными знаниями по математике, математике, области и изобретательностью. Удачи.