Обратно

Исследования, проблемы, суждения

Гласман К.Ф., Логунов А.Н.
Оценка заметности артефактов видеокомпрессии
(сокращенный вариант)

Подавляющее большинство алгоритмов оценки заметности артефактов видеокомпрессии требует наличия в точке тракта, где производится измерение, опорного изображения (оригинала) или карты его свойств, что не позволяет применять их для решения задачи автоматического текущего контроля качества в точке приема. Немногие алгоритмы, свободные от этого недостатка, не учитывают влияния на заметность артефактов изменений условий наблюдения изображения.
Методы, обеспечивающие точные и устойчивые результаты измерений качества, сложны, а измерительные приборы на их основе дороги, что снижает эффективность их применения. Кроме того, ни один из разработанных методов не сориентирован на высокую точность измерений в окрестности порога, то есть там, где наблюдается свойственное цифровым системам скачкообразное ухудшение качества. Поэтому разработка эффективного алгоритма, позволяющего оценить, насколько система близка к порогу допустимых ухудшений, является актуальной.

Алгоритм объективной оценки

В этой статье предлагается методика объективной оценки качества изображения, основанная на моделировании субъективной оценки, даваемой зрителями. Качество такой методики определяется адекватностью объективных оценок, получаемых с ее помощью, оценкам, полученным при субъективных измерениях.
Для разработки такой методики необходима шкала, обеспечивающая абсолютную оценку качества. Этому требованию отвечает шкала отношений, имеющая устойчивую точку нулевого качества.
D-изображение представляет собой предельно скомпрессированное, предельно искаженное в рамках данной системы компрессии изображение, составленное из блоков, содержащих только постоянные составляющие дискретного косинусного преобразования, применяемого в системах сжатия JPEG и MPEG-2 для устранения пространственной избыточности. Использование предельно компрессированного изображения в качестве опорного обуславливается тем, что D-изображение может быть получено на приемной стороне, а также тем, что
D-изображения, получаемые из одного сюжета, практически не отличаются друг от друга, потому что системы сжатия на основе ДКП точно (с большим числом бит на отсчет) передают постоянную составляющую блоков. Таким образом, D-изображение обладает необходимым для опорного изображения свойством устойчивости.
Алгоритм вычисления рейтинга заметности блочного артефакта, основанный на этой модели, представлен на рис. 1.

Рис. 1. Алгорритм вычисления рейтинга заметности блочного артефакта

Входное изображение поступает на блок вычисления D-изображения, где компрессируется с помощью отбрасывания всех коэффициентов ДКП, кроме постоянной составляющей.
Блок предварительной обработки делает расчет распределения яркости на изображении, вычисляет яркость адаптации и сегментацию изображения на текстуры, контура и гомогенные участки.
Блок вычисления пороговых значений DLп каждой точке изображения, лежащей на границе блока ДКП, ставит в соответствие яркостный дифференциальный порог обнаружения блочной структуры с учетом угловых размеров блока ДКП, времени предъявления, яркости адаптации и локальной яркости изображения в данной точке.
Блок вычисления приращений DL для тех же точек изображения вычисляет точечную межэлементную разность, соответствующую скачку яркости на границах блока ДКП.
Так как отклик зрительного анализатора носит стохастический характер, что учитывается при расчете порога DLп, то оценки на этой шкале имеют вероятностный смысл, а единица такой шкалы соответствует 75% вероятности обнаружения приращения контраста блока ДКП на фоне изображения.
Таким образом, рассчитанный рейтинг заметности показывает, сколько пороговых приращений контраста блочной структуры необходимо сделать, чтобы достигнуть контраста блочной структуры в D-изображении.

Субъективные испытания

Оценки, полученные с помощью предложенного алгоритма, сопоставлялись с оценками, полученными при субъективных измерениях.
В данном исследовании для получения субъективных оценок применялся метод парных сравнений, процедура проведения которого заключалась в следующем. Выбранный тестовый материал подвергался компрессии при разных значениях степени компрессии. Каждое из полученных таким образом изображений предъявлялось наблюдателю в паре с другими изображениями этой группы. Наблюдатель последовательно рассматривал два изображения на экране монитора и указывал, какое изображение является лучшим по качеству, совершая таким образом элементарное парное сравнение.
Условия наблюдения варьировались в следующих пределах: максимальная яркость экрана менялась в пределах 20–80 кд/м2, расстояние наблюдения — от 2 до 8 высот экрана. В эксперименте приняли участие студенты Санкт-Петербургского государственного университета кино и телевидения — 91 чел.
Шкала, на которой расположились оценки для изображений P0–P18, представляет собой шкалу интервалов. Пояснить смысл оценок на этой шкале можно следующим примером. Если оценка изображения A больше оценки изображения B на единицу шкалы, это означает, что А предпочтительнее В в 75% парных сравнений А и В. Шкала интервалов не имеет естественного нуля. В рамках предложенного подхода точкой нулевого качества принята точка, соответствующая D-изображению (изображение P0).
На рис. 2 приведены зависимости предсказанного качества (линии) и субъективного качества (точки) от пикового отношения сигнал/шум.
Рис. 3 иллюстрирует зависимость субъективного качества от предсказанного при фиксированном расстоянии наблюдения и яркости экрана для разных сюжетов. На рис. 4 представлена зависимость заметности артефактов компрессии от отношения сигнал/шум при разных расстояниях наблюдения.
На рис. 5 показаны зависимости предсказанного качества от отношения сигнал/шум для разных расстояний наблюдения. Немонотонная зависимость между расстоянием наблюдения и чувствительностью зрительного анализатора была обнаружена и в других тестовых сюжетах (рис. 6 и 7). Сравнение рис. 4 и 5 показывает, что предлагаемый алгоритм учитывает указанные особенности зрительного анализатора.
Рис. 8 демонстрирует зависимость субъективного качества от предсказанного для трех различных сюжетов при трех различных расстояниях наблюдения и фиксированной максимальной яркости экрана. Ошибка предсказания в этих условиях с помощью предложенного метода составляет 1,26 единицы шкалы интервалов, коэффициент корреляции Пирсона — 0,95, ранговый коэффициент корреляции Спирмена, характеризующий монотонность предсказания, составляет 0,95, а доля несовместных оценок — 6% .
Из рис. 9 видно, что изменение максимальной яркости экрана в сочетании с пропорциональным изменением яркости адаптации практически не влияет на чувствительность зрительного анализатора к искажениям компрессии.
Рис. 10 демонстрирует работу предложенного алгоритма при изменении яркости экрана. Ошибка предсказания в этих условиях с помощью предложенного метода составляет 1,96 единицы шкалы интервалов, коэффициент корреляции Пирсона — 0,92, ранговый

Рис. 2. Зависимость рейтинга качества
от отношения сигнал/шум для разных сюжетов

(4Н, 80 кд/м2, точки — субъективное качество, линии — модель)

Рис. 3. Связь субъективного и рассчитанного рейтингов качества при фиксированных условиях наблюдения
(4Н, 80 кд/м2)

Рис. 4. Зависимость субъективного качества
от отношения сигнал/шум (80 кд/м2)

Рис. 5. Зависимость рассчитанного рейтинга от отношения сигнал/шум (80 кд/м2)

Рис. 6. Зависимость субъективного качества
от отношения сигнал/шум (80 кд/м2)

Рис. 7. Зависимость субъективного качества
от отношения сигнал/шум (80 кд/м2)

Рис. 8. Связь субъективного и рассчитанного
рейтингов качества при изменении расстояния наблюдения (80 кд/м2)

Рис. 9. Зависимость субъективного качества
от отношения сигнал/шум (4Н кд/м2)

Рис. 10. Связь субъективного и рассчитанного
рейтингов качества при изменении яркости
экрана (4Н)

коэффициент корреляции Спирмена составляет 0,93, а доля несовместных оценок — 8% .
На рис. 11 приведена зависимость качества D-изображения от расстояния наблюдения при условии, что оценки для некомпрессированных изображений, независимо от расстояния наблюдения, принимаются равными.

Рис. 11. Зависимость качества D-изображения от расстояния наблюдения

Полный текст - в № 4 журнала "ТКТ" за 2003 г.

Обратно

Hosted by uCoz