Утвержден и введен в действие
Приказом Федерального агентства
по техническому регулированию
и метрологии
от 17 марта 2014 г. N 149-ст
НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ
ЗВУКОВОЕ ВЕЩАНИЕ ЦИФРОВОЕ
КОДИРОВАНИЕ СИГНАЛОВ ЗВУКОВОГО ВЕЩАНИЯ С СОКРАЩЕНИЕМ
ИЗБЫТОЧНОСТИ ДЛЯ ПЕРЕДАЧИ ПО ЦИФРОВЫМ КАНАЛАМ СВЯЗИ
ЧАСТЬ III (MPEG-4 AUDIO)
МАСШТАБИРУЕМОЕ КОДИРОВАНИЕ БЕЗ ПОТЕРЬ
Digital sound broadcasting. Coding of signals of sound
broadcasting with reduction of redundancy for transfer on
digital communication channels. Part III (MPEG-4 audio).
Scalable lossless coding
ISO/IEC 14496-3:2009
(NEQ)
ГОСТ Р 53556.12-2014
ОКС 33.170
Дата введения
1 января 2015 года
Предисловие
1 РАЗРАБОТАН Техническим комитетом по стандартизации ТК 480 "Связь"
2 ВНЕСЕН Техническим комитетом по стандартизации ТК 480 "Связь"
3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 17 марта 2014 г. N 149-ст
4 Настоящий стандарт разработан с учетом основных нормативных положений международного стандарта ИСО/МЭК 14496-3:2009 "Информационные технологии. Кодирование аудиовизуальных объектов. Часть 3. Аудио" (ISO/IEC 14496-3:2009 "Information technology - Coding of audio-visual objects - Part 3: Audio", NEQ) [1]
5 ВВЕДЕН ВПЕРВЫЕ
Правила применения настоящего стандарта установлены в ГОСТ Р 1.0-2012 (раздел 8). Информация об изменениях к настоящему стандарту публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе "Национальные стандарты", а официальный текст изменений и поправок - в ежемесячном информационном указателе "Национальные стандарты". В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ближайшем выпуске ежемесячного информационного указателя "Национальные стандарты". Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (gost.ru).
1 Область применения
Данный стандарт описывает алгоритм масштабируемого кодирования без потерь MPEG-4 для аудиосигналов.
2 Термины и определения
2.1 Термины
В этом стандарте используются следующие термины.
Core Layer Кодер MPEG-4 GA T/F, используемый в качестве первого уровня в SLS. Поддерживаются типы аудиообъектов LC AAC, AAC Scalable (без LTP), ER AAC LC, ER AAC Scalable и ER BSAC.
LLE Layer Уровень улучшения без потерь, используемый в SLS для улучшения качества базового уровня применительно к кодированию без потерь.
Bit Plane Позиция определенного бита в слове двоичных данных, начиная с 0 как позиции младшего значащего бита (LSB). Например, двоичные символы разрядной матрицы с позициями 0, 1, 2, и 3 из слова данных 0x0011 1101 (0x3d) будут 1, 0, 1, и 1, соответственно.
BPGC Код Golomb разрядной матрицы.
CBAC Арифметический код на базе контекста.
LEMC Код низкоэнергетического режима.
Implicit Band Полоса масштабного коэффициента, для которой представленные в потоке битов базового уровня квантованные спектральные данные будут использоваться в части определения необходимой дополнительной информации для уровня LLE.
Explicit Band Полоса масштабного коэффициента, для которой квантованные спектральные данные, представленные в потоке битов базового уровня, не будут использоваться в определении необходимой дополнительной информации для уровня LLE. Вся дополнительная информация будет явно кодирована в полезной нагрузке LLE.
Oversampling Factor (osf) Отношение между частотами дискретизации уровня LLE и базового уровня, возможные значения 1, 2 и 4.
Oversampling Range Диапазон высокой частоты, охваченный только уровнем LLE, включает значения частоты (osf-1) *1024 resp. (osf-1) *128 на окно.
Reserved Все поля маркированные как Reserved. Все поля Reserved должны быть обнулены.
2.2 Система обозначений
Чтобы сделать описание строгим, в этом документе используется След система обозначений:
матрицы (и векторы векторов) обозначаются прописными однобуквенными именами, например, M;
переменные обозначаются курсивом, например, variable;
функции обозначаются как func (x).
2.3 Определения
DIV (m, n) Целочисленное деление с усечением результата m/n до целочисленного значения по направлению к - .
Операция floor. Возвращает самое большое целое число, которое меньше или равно аргументу с вещественным значением.
3 Полезные нагрузки для аудиообъекта
Таблица 1
Синтаксис SLSSpecificConfig
Синтаксис Количество битов Мнемоника
SLSSpecificConfig(samplingFrequencyIndex, channelConfiguration, audioObjectType) {
pcmWordLength; 3 uimsbf
aac_core_present; 1 uimsbf
lle main stream; 1 uimsbf
reserved_bit; 1 uimsbf
frameLength; if (!channelConfiguration){ program_config_element( ); } } 3 uimsbf
Таблица 2
Полезная нагрузка верхнего уровня для потока lle
Синтаксис Количество битов Мнемоника
lle_element() { for (ch=0;ch<channel_number;) { if (is_channel_pair(ch)) { lie channel pair elementO; ch += 2; } else { lle_single channel_element(); ch++; } } }
Таблица 3
Синтаксис lle_single_channel_element
Синтаксис Количество битов Мнемоника
lie single channel elementO { lle_individual_channel_stream(1); }
Таблица 4
Синтаксис lle_individual_channel_stream
Синтаксис Количество битов Мнемоника
lie individual channel stream(is first channel) {
lle_ics_length_lsb; 8 uimsbf
lle_ics_length_msb; lie ics length = lie ics length isb || (lie ics length msb << 8); if (is_first_channel) { 8 uimsbf
element instance tag;
Для просмотра документа целиком скачайте его >>>