Ал-Мустафа М.
Основные особенности стандартов MPEG
и АС-3
и области их применения
(сокращенный
вариант)
С начала 90-х годов в ряде стран, в первую очередь в США, Франции, Германии, ведутся исследования по использованию цифровых сигналов в радиовещательных системах и спутниковых каналах. Приблизительно в конце 1996 г. началось цифровое спутниковое радиовещание по разным цифровым стандартам. В Европе применяется цифровой стандарт MPEG, а в США — AC-3. Рассмотрим основные особенности этих стандартов.
Введение в MPEG
MPEG — рабочая группа в подкомиссии
ISO/IEC (Международной Организации
Стандартизации/Международной
электротехнической комиссии),
отвечающая за разработку
международных эталонов для сжатия,
декомпрессии, обработки, и
кодированного представления
движущихся изображений, звука и их
комбинации.
В частности, MPEG определяет
синтаксис низкоскоростной
передачи видео- и аудиоданных
синтетических и естественных
источников, описания их структуры и
содержания, а также операции
совместимого декодирования этих
цифровых потоков. Алгоритмы кодера
MPEG не определены из-за непрерывного
усовершенствования кодеров и их
адаптации к определенным
приложениям в пределах синтаксиса
цифрового потока. Наряду с видео- и
аудиокодированием, MPEG также
определяет средства
мультиплексирования нескольких
видео-, аудио- и информационных
потоков синхронно в единый
цифровой поток, описывает методы
проверки соответствия стандарту
цифровых потоков и декодеров, и
издает технические сообщения,
содержащие ПО, описывающее
операции декодирования и ПО,
описывающее примеры кодера.
MPEG Audio — подгруппа MPEG, работающая
над всеми аудиоаспектами
MPEG-стандартов.
Есть два вопроса, которые
необходимо различать. Во-первых, MPEG
разработан этапами. Эти этапы
обычно обозначаются арабскими
числами: MPEG-1, MPEG–2, MPEG-4, MPEG-7. Они не
относятся к различным версиям
одного стандарта, а обозначают
довольно существенно
различающиеся сосуществующие
стандарты. Поэтому более поздние
этапы не заменяют более ранние, а
дополняют их.
Второй вопрос касается понятия
уровней. В MPEG-1 и в MPEG-2 определены
три различных уровня. Они
представляют семейство алгоритмов
кодирования. Их обычно обозначают
римскими числами, то есть Уровень I,
Уровень II и Уровень III.
Понятие версий используется в
контексте MPEG-4. Версия 1 MPEG-4
обеспечивает набор
инструментальных средств для
кодирования звука. Чтобы
обеспечить дополнительные
функциональные возможности, в
версии 2 добавлены новые
инструментальные средства, в то
время как ни одно из существующих
инструментальных средств версии 1
не заменено. Версия 2 поэтому
полностью обратно совместима с
версией 1.
Возможности MPEG-1, MPEG-2, MPEG-4 и
MPEG-7 Аудио
MPEG-1 (ISO/IEC 11172-3) обеспечивает:
– кодирование одноканальных
(«моно») и двухканалных («стерео»
или «двойное моно») цифровых
звуковых сигналов с частотами
дискретизации 32; 44,1 и 48 кГц;
– предопределенные скорости
передачи выходных данных в
интервале от 32 до 448 кбит/с для
Уровня I, от 32 до 384 кбит/с для Уровня,
II, и от 32 до 320 кбит/с для Уровня III.
MPEG-2 BC (ISO/IEC 13818-3) обеспечивает:
– обратное совместимое
многоканальное расширение к MPEG-1; до
5 основных каналов плюс
«низкочастотное расширение» (LFE);
– диапазон скорости передачи
данных, расширенный приблизительно
до 1 Мбит/с;
– расширение MPEG-1 более низкими
частотами дискретизации 16; 22,05 и 24
кГц для скоростей передачи данных
от 32 до 256 кбит/с (Уровень I) и от 8 до
160 кбит/с (Уровень II и Уровень III).
MPEG-2 AAC (ISO/IEC 13818-7) обеспечивает:
– высококачественное кодирование
звука с числом каналов от 1 до 48 и
частотами дискретизации от 8 до 96
кГц, в том числе в многоканальном,
многоязычном режимах и с
возможностями
мультипрограммирования;
– AAC работает со скоростями
передачи данных от 8 кбит/с для
монофонического речевого сигнала
до более 160 кбит/с канала для
высококачественного кодирования;
– три конфигурации AAC обеспечивают
изменяющиеся уровни сложности и
универсальность.
MPEG-4 (ISO/IEC 14496-3) обеспечивает:
– кодирование естественных и
синтетических аудиообъектов;
– универсальность скорости
передачи аудиоданных цифрового
потока;
– универсальность кодера или
сложность декодера;
– структурный аудио: универсальный
язык для управляемого звукового
синтеза;
– TTSI: интерфейс систем
«текст-речь».
MPEG-7 (ISO/IEC 15938) обеспечивает:
– стандартизированные описания и
схемы описания аудиоструктур и
звукового содержимого;
– язык для определения таких
описаний и схемы описания.
MPEG-1 Аудио
Вот некоторые из наиболее важных
приложений:
запись в бытовых условиях (DCC);
дисковая память (CD-i, CD-Video);
цифровой видеодиск( DVD);
редактирование с использованием
диска, автоматизация радиовещания;
твердотельная запись звука;
кабельное и спутниковое
телевидение (например. DVB, USSB, DirecTV,
EchoStar);
кабельное радио;
цифровое радиовещание;
Интернет-радио;
мультимедиа на основе компьютера;
автономные электронные
информационные системы.
Эффективность MPEG-1 Audio относительно
каскадирования (многократного
кодирования) была проверена
Международным Союзом Связи (ITU-R). На
основе этих испытаний, ITU-R
рекомендует использовать MPEG-1 Audio
Уровня II для связи между
радиовещательными студиями, для
распределения программ (то есть для
связи между радиостудией и
передатчиком) и для передачи от
передатчика до домов
радиослушателя.
MPEG-2 Аудио
MPEG-1 имел дело с кодированием
монофонического или
двухканального стереофонического
звука при использовании частот
дискретизации, обычно используемых
для высококачественного звука: 48;
44,1 и 32 кГц.
Вторая стадия, MPEG-2, дополнена тремя
дополнительными возможностями:
1) пониженными частотами
дискретизации (16; 22,05 и
24 кГц), обеспечением лучшего
субъективного качества при
скоростях цифрового потока ниже
64 кбит/с для моноканала. Это
расширение легко добавить к
аудиодекодеру MPEG-1, достаточно лишь
включить несколько больше таблиц;
2) поддержкой до пяти
широкополосных каналов плюс одного
низкочастотного канала расширения
(такая совокупность каналов
называется «5.1»). Это
многоканальное расширение имеет и
прямую и обратную совместимости с
MPEG-1. Цифровой поток MPEG-2 BC точно
соответствует структуре цифрового
потока MPEG-1, так что аудиодекодер
MPEG-1 может читать и
интерпретировать поток MPEG-2 BC;
3) новой схемой кодирования,
названной «Расширенное
Аудиокодирование» (AAC). Цифровой
поток AAC не обладает обратной
совместимостью, то есть его не
может читать и интерпретировать
MPEG-1-аудиодекодер.
Главные области применения MPEG-2:
– Интернет-радио;
– звук для цифрового телевидения и
радио (АМ- и ЧМ-радиоприемники);
– переносные устройства
записи/воспроизведения.
MPEG-4 Audio
MPEG-4 Аудио предоставляет
инструментальные средства для
кодирования естественных и
синтетических аудиообъектов. Их
использование позволяет
представлять естественные звуки
(речь, музыка и т.д.) и синтезировать
звуки, основанные на структурных
описаниях. Представление для
синтезируемого звука может быть
получено из текстовых данных или
так называемых «инструментальных
описаний».
Методы параметрического
кодирования охватывают самый
низкий диапазон скоростей передачи
данных: от 2–4 кбит/с для речи с
частотой дискретизации 8 кГц до
4–16 кбит/с и для звука с частотой
дискретизации 8 или 16 кГц.
Кодирование речи при средних
скоростях цифрового потока,
приблизительно 6–24 кбит/с,
использует кодирование методом CELP
(code exited linear prediction — линейное
предсказание с кодовым
возбуждением). В этой области,
используются два значения частоты
дискретизации, 8 и 16 кГц, чтобы
поддержать и узкополосную и
широкополосную речь,
соответственно.
MPEG-7
MPEG-7 не является продолжением MPEG как
такового. Он стал разрабатываться
сравнительно недавно. MPEG-7 будет
поддерживать стандарт для описания
различных типов мультимедийной
информации (а не для ее
кодирования), чтобы создавать
возможности для эффективного и
быстрого ее поиска. MPEG-7 официально
называют «Multimedia Content Description Interface»
(Интерфейс описания мультимедийных
данных). Он содержит стандартный
набор дискриптеров для различных
типов мультимедиа-информации,
также стандартизует способ
определения своих дискриптеров и
их взаимосвязи (description schemes). Для
этой цели MPEG-7 вводит DDL (Description Definition
Language — язык определений описаний).
Основная цель применения MPEG-7 — это
поиск мультимедийной информации
(как сейчас мы
можем найти текст по какому-нибудь
предложению), например:
Музыка. Сыграв несколько нот на
клавиатуре, можно получить список
музыкальных произведений,
содержащих такую же
последовательность.
Графика. Нарисовав несколько линий
на экране, получим набор рисунков,
содержащих данный фрагмент.
Картины. Определив объект (задав
его форму и текстуру), получим
список картин, содержащих данный
объект.
Видео. Задав объект и движение,
получим набор видео или анимации.
Голос. Задав голос (фрагмент) певца,
получим набор песен и видеороликов,
где он поет.
AC-3
В настоящее время звук для кино
записывается по разработанному
компанией Dolby Laboratories стандарту AC-3
(или Dolby Digital). Dolby Digital — это
высококачественная цифровая
технология кодирования
аудиосигнала, которая впервые была
апробирована в кинотеатрах в июне
1992 г. и обеспечивает многоканальное
воспроизведение звука для
достижения эффекта объемного
звучания.
Что же представляет собой AC-3?
Полностью формат называется Dolby
Digital 5.1 и, как видно уже из названия,
он описывает распределение звука в
пространстве по шести каналам. При
этом все они закодированы в один
стереофайл, который
распаковывается с помощью
специального декодера и разводится
на шесть акустических систем. В
соответствии с форматом AC-3 звук
воспроизводится пятью
широкополосными
громкоговорителями: левым,
центральным, правым, левым тыловым,
правым тыловым и одним
узкополосным, используемым для
низкочастотных эффектов, которые в
кинотеатрах скорее чувствуются,
чем слышатся. Так что цифры «5.1» в
названии формата означают 5
основных каналов и 1
низкочастотный.
Полный текст - в № 7 журнала "ТКТ" за 2003 г.