Мне интересно, как я могу утверждать, что правильно понимаю «шум» в своих данных?Как проверить, что такое шум, какие реальные данные?
Чтобы быть более точным, возьмите примерный компонентный анализ в качестве примера, мы знаем, что в PCA, после выполнения SVD, мы можем отбросить небольшие сингулярные значения и восстановить исходную матрицу с использованием приближения низкого ранга.
Могу ли я утверждать, что было проигнорировано, действительно ли это шум в данных? Есть ли какая-либо оценочная метрика для этого?
Единственный метод, который я могу придумать, - это просто вычесть исходные данные из восстановленных данных.
Затем попытайтесь установить гауссовский над ним, увидев, что фитнес хорош.
Это обычный метод в области, подобный DSP ??
Кстати, я думаю, что в типичных задачах машинного обучения измерение будет отслеживать эффективность классификации, но поскольку я делаю чисто генеративную модель, никаких ярлыков не прилагается.
Спасибо за ответ, но мой вопрос действительно связан только с вашим последним абзацем, что я хочу «поймать» шум. Я думаю, что это сложно определить, как сказал Бен. – Jing