Я пытаюсь построить прогностическую модель геопространственных функций, основанную на расстоянии от других объектов в смешанной городской пригородной среде, например, вероятность того, что офисный блок будет находиться на месте, основанном на расстояниях до ближайшая дорога, жилой комплекс и торговый район. У меня есть набор объектов, но блоки не разбросаны по всей территории в некоторых областях, они очень редкие, а другие очень плотные. Используя деревья принятия решений, чтобы предсказать присутствие или отсутствие школы в месте, мне нужен учебный набор, как положительных, так и отрицательных случаев. Как мне создать образец таких случаев?Опрос населения для изучения геопространственных машин
ответ
Вы должны были бы данные в следующем формате:
nearestRoad
, housingEstate
, shoppingDistrict
..., schoolPresent
nearestRoad
бы быть realNumber
, housingEstate
и shoppingDistrict
были бы бинарные переменные (я предполагаю,). Вы просматриваете карты Google? Предоставляют ли они вам API, который позволяет запрашивать конкретные (широтные, длинные) координаты? Если да, то вы можете сгенерировать набор данных следующим образом:
Предположим, школа существует в координатах (x,y)
. Затем сделайте gridsearch
с радиусом 5 миль, чтобы получить точное значение каждой функции. Так, например, вы можете найти торговый район с координатами (x+1, y+2)
, так что функция будет равна 1 для этого конкретного экземпляра.
Это может быть утомительным, но если такой API существует, это определенно кажется возможным.