2013-04-20 10 views
9

Я рассмотрел, как DCT (дискретное косинусное преобразование) используется в стандартах сжатия изображений и видео.Почему преобразование DCT предпочтительнее других преобразований при сжатии видео/изображений

Но почему DCT предпочтительнее других преобразований, таких как dft или dst?

ответ

6

Поскольку cos(0) 1, первый (0-й) коэффициент DCT-II является средним для преобразованных значений. Это делает первый коэффициент для каждого блока 8x8, представляющим средний тон его составляющих пикселей, что, очевидно, является хорошим началом. Последующие коэффициенты добавляют возрастающие уровни детализации, начиная с широких градиентов и продолжая все более и более неудобные шаблоны, и бывает так, что первые несколько коэффициентов захватывают большую часть сигнала в фотографических изображениях.

Sin(0) равно 0, поэтому DST начинаются со смещения 0,5 или 1, а первый коэффициент - мягкий курган, а не плоская равнина. Это вряд ли подходит для обычных изображений, и в результате DST требуют больше коэффициентов, чем DCT для кодирования большинства блоков.

DCT просто подходит. Это действительно все, что нужно.

4

DCT макроблока изображения, в котором верхний и нижний и/или левый и правый края не совпадают, будет иметь меньше энергии в более высоких частотных коэффициентах, чем ДПФ. Таким образом, позволяя удалять большие возможности для этих высоких коэффициентов, более грубо квантовать или сжимать, не создавая более заметных артефактов границы макроблока.

5

При выполнении сжатия изображений наилучшим решением является выполнение преобразования KLT или Karhunen-Loève, поскольку оно дает наименьшую возможную среднюю квадратную ошибку между исходным и сжатым изображением. Однако KLT зависит от входного изображения, что делает процесс сжатия нецелесообразным.

DCT является ближайшим приближением к KL Transform. В основном нас интересуют низкочастотные сигналы, поэтому требуется только четный компонент, поэтому его вычислительно возможно вычислять только DCT.

Кроме того, использование косинусов, а не синусов, имеет решающее значение для сжатия, поскольку для приближения к типичному сигналу необходимы меньшее количество косинусных функций (см. ответ Douglas Bagnall's для дальнейшего объяснения).

Другим преимуществом использования косинусов является отсутствие разрывов. В ДПФ, поскольку сигнал представляется периодически, при усечении коэффициентов представления сигнал будет стремиться «потерять свою форму». Однако в DCT из-за непрерывной периодической структуры сигнал может выдерживать относительно большее усечение коэффициента, но при этом сохранять желаемую форму.

 Смежные вопросы

  • Нет связанных вопросов^_^