Недавно разработанный метод Layer Normalization решает ту же проблему, что и Batch Normalization, но с более низкими вычислительными накладными расходами и не зависит от партии, поэтому ее можно применять последовательно во время обучения и тестирования.Нормализация уровня всегда лучше, чем нормализация партии для глубокого обучения
Мой вопрос: нормализация слоя всегда лучше, чем нормализация партии, или есть ли еще некоторые случаи, когда нормализация партии может быть полезной?