В ответ на ответ @ j.jerrod.taylor позвольте мне перефразировать мой вопрос, чтобы устранить любое недоразумение.Плавные значения с использованием bin Границы: Где вы устанавливаете значение, которое находится справа между нижней и верхней границей?
Я новичок в Data Mining и изучаю, как обрабатывать шумные данные, сглаживая мои данные с помощью метода Equal-width/Distance Binning через «Bin Boundaries». Предположим, что набор данных 1,2,2,3,5,6,6,7,7,8,9. Я хочу, чтобы выполнить:
- расстояние биннинга 3 бункеров и
- Smooth значений БИН границ на основе значений Binned в # 1.
на основе определения в (Han, Камбер, пей, 2012, интеллектуальный анализ данных Основные понятия и методы, Раздел 3.2.2 зашумленных данных):
В сглаживающий БИН границ, минимального и максимальные значения в данном бункере идентифицируются как границы бункера. Каждое значение бункера затем заменяется ближайшим граничным значением.
- Интервал ширина = (макс-мин)/к = (9-1)/3 = 2,7
интервалы Bin = [1,3.7), [3.7,6.4), [6,4, 9.1]
оригинальный Bin1: 1,2,2,3 | Границы бинов: (1,3) | Гладкие значения по Bin Границы: 1,1,1,3
- original Bin2: 5,6,6 | Границы бина: (5,6) | Гладкие значения по Bin Границы: 5,6,6
- original Bin3: 7,7,8,9 | Границы бинов: (7,9) | Гладкие значения БИН границ: 7,7, , 9
Вопрос: - где же принадлежат в Bin3, когда Binned использованием метода Bin границ, так как это +1 от 7 и -1 от 9?
Вы поняли мой вопрос о «сглаживающих значениях по границам БИН» и «границы бункера ». Я перефразировал свой вопрос, чтобы включить все детали, которые приводят к моему вопросу. – user2771721
@ user2771721 Я ничего не понял. См. Мое редактирование. –